Datenbanken Compilerbau Software Engineering

Werbung
DHP-FAQ
Datenbanken
Compilerbau
Software Engineering
Objektorientierung
Rechnerarchitektur
Betriebssysteme
Rechnernetze
Rechnernetze II
Effiziente Algorithmen und Datenstrukturen
Automaten, Formale Sprachen, Berechenbarkeit
Logik
http://www.deissenboeck.de/faqs
DHP-FAQ
Wie auch bei den DVP-FAQs sind hier wieder alle, mir relevant erscheinenden, Fragen aus den Protokollen
zusammengefasst. Wieder gilt, dass die Antworten zum grossen Teil direkt aus der angegebenen Literatur
übernommen wurden und daher nicht auf meine geistige Leistung zurück gehen. Trotzdem kann es natürlich
gut sein, dass ein Haufen Fehler drin sind. Viel Spass damit.
Florian Deißenböck, 03.04.2003
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
2
Inhaltsverzeichnis
I
Praktische Informatik
5
1 Datenbanksysteme
1.1 Allgemeines . . . . . . . . . . . . . . . . . . . . . . .
1.2 Datenbankentwurf . . . . . . . . . . . . . . . . . . .
1.3 Das relationale Modell . . . . . . . . . . . . . . . . .
1.4 SQL . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.5 Datenintegrität . . . . . . . . . . . . . . . . . . . . .
1.6 Entwurfstheorie (Normalformen) . . . . . . . . . . .
1.7 Transaktionen . . . . . . . . . . . . . . . . . . . . . .
1.8 Objektrelationale und objektorientierte Datenbanken
1.9 Data Warehousing . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
7
7
8
10
12
13
13
15
16
17
2 Compilerbau
2.1 Allgemeines . . . . . . . . . . . . . . . .
2.2 Lexikalische Analyse . . . . . . . . . . .
2.3 Syntaktische Analyse . . . . . . . . . . .
2.4 Semantische Analyse . . . . . . . . . . .
2.5 Codegenerierung und Optimierung . . .
2.6 Übersetzung objektorientierter Sprachen
2.7 Top-Down Parser in Java . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
19
19
20
21
23
23
25
26
. . . . . . .
. . . . . . .
Elicitation)
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
29
29
30
31
31
32
33
33
35
36
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
3 Software Engineering
3.1 Allgemeines . . . . . . . . . . . . . . . . . . .
3.2 UML . . . . . . . . . . . . . . . . . . . . . . .
3.3 Ermittlung der Anforderungen (Requirements
3.4 Analyse . . . . . . . . . . . . . . . . . . . . .
3.5 Grobentwurf (System Design) . . . . . . . . .
3.6 Feinentwurf (Object Design) . . . . . . . . . .
3.7 Testen . . . . . . . . . . . . . . . . . . . . . .
3.8 Projektmanagement . . . . . . . . . . . . . .
3.9 Vorgehensmodelle . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
4 Objektorientierung
41
4.1 Allgemeines . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
4.2 Entwurfsmuster . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
Literaturverzeichnis
43
II
45
Technische Informatik
5 Rechnerarchitektur
5.1 Allgemeines . . . . . . . . . . . .
5.2 Zentralprozessoren . . . . . . . .
5.3 Hauptspeicher und Verkehrswege
5.4 Ein-/Ausgabewerk . . . . . . . .
.
.
.
.
.
.
.
.
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
47
47
52
57
59
3
Inhaltsverzeichnis
5.5
SPEC-Werte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
6 Betriebssysteme
6.1 Allgemeines . . . . . .
6.2 Prozesse und Threads
6.3 Deadlocks . . . . . . .
6.4 Speichermanagement .
6.5 I/O . . . . . . . . . . .
6.6 Betriebssystem-Design
6.7 Beispiele . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
63
63
63
69
71
74
74
76
7 Rechnernetze
7.1 Allgemeines . . . . . . . .
7.2 ISO–OSI–Referenzmodell
7.3 Schichtübergreifend. . . .
7.4 Schicht 1 . . . . . . . . . .
7.5 Schicht 2a . . . . . . . . .
7.6 Schicht 2b . . . . . . . . .
7.7 Schicht 3 . . . . . . . . . .
7.8 Schicht 4 . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
79
79
80
82
83
83
86
88
91
.
.
.
.
.
.
.
8 Rechnernetze II
95
8.1 Allgemeines . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
8.2 Hochleistungsnetze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
8.3 Dienstgüte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
Literaturverzeichnis
III
101
Theoretische Informatik
103
9 Effiziente Algorithmen und Datenstrukturen
9.1 Allgemeines . . . . . . . . . . . . . . . . . . .
9.2 Mathematische Grundlagen . . . . . . . . . .
9.3 Datenstrukturen . . . . . . . . . . . . . . . .
9.4 Selektieren und Sortieren . . . . . . . . . . .
9.5 Minimale Spannbäume . . . . . . . . . . . . .
9.6 Kürzeste Pfade . . . . . . . . . . . . . . . . .
9.7 Matchings . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
105
105
107
108
120
126
127
129
10 Automaten, Formale Sprachen
10.1 Allgemeines . . . . . . . . . .
10.2 Chomsky 3 . . . . . . . . . .
10.3 Chomsky 2 . . . . . . . . . .
10.4 Chomsky 1 . . . . . . . . . .
10.5 Berechenbarkeit . . . . . . . .
und
. . .
. . .
. . .
. . .
. . .
Berechenbarkeit
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
131
131
132
136
141
142
11 Logik
11.1 Allgemeines . .
11.2 Aussagenlogik .
11.3 Prädikatenlogik
11.4 Beweisideen . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
149
149
149
160
168
Literaturverzeichnis
4
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
171
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
Teil I
Praktische Informatik
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
5
Kapitel 1
Datenbanksysteme
1.1
Allgemeines
1.1.1
Was ist der Unterschied zwischen dem relationalem und anderen Modellen?
Im Gegensatz zu dem satzorientierten hierarchischen und dem ebenfalls satzorientierten Netzwerkmodell
ist das relationale Modell mengenorientiert.
1.1.2
Vergleichen Sie B-Bäume mit Hashing im Kontext von Datenbanken?
Beides wird bei Datenbanken eingesetzt. B-Bäume werden zur Speicherung der eigentlichen Daten
benutzt, da Sie gut mit Daten, die auf Hintergrundspeichern liegen, umgehen können. Hashing wird
bei Indizes gesetzt, da es annähernd O(1) Zugriff erlaubt.
1.1.3
Erklären sie die Begriffe
Datenbankschema/Ausprägung und
intensional/extensional .
Das Datenbankschema legt die Struktur der abgespeicherten Daten fest. Eine Ausprägung ist ein
momentan gültiger Zustand der Datenbasis. Man spricht auch von der intensionalen (Schema) und der
extensionalen (Ausprägung) Ebene einer Datenbank. Der Unterschied entspricht dem von Klasse und
Objekt in der Objektorientierung.
1.1.4
Was ist eine Datenbank?
Eine Datenbasis ist eine Menge von Daten. Angereichert um weitere Daten, die das DBMS zur Erfüllung
seiner Aufgabe benötigt, bilden sie eine Datenbank. Ein DBMS einschliesslich einer oder mehrerer
Datenbanken nennt man Datenbanksystem.
1.1.5
Wie sieht eine relationale Datenbank aus?
Eine relationale Datenbank speichert die Daten in Tabellen.
1.1.6
Welche Schichten gibt es bei einer Datenbank?
Mann kann drei Schichten unterscheiden.
1. Physische Schicht: Hier wird festgelegt, wie die Daten gespeichert werden.
2. Logische Schicht: Auf der logischen Schicht wird in einem Datenbankschema festgelegt, welche
Daten gespeichert werden.
3. Sichten: Durch Sichten werden Teilmengen der gespeicherten Daten bereitgestellt.
Das Schichtenmodell dient der Datenunabhängigkeit, es kann zwei Stufen der Datenunabhängigkeit
gewährleisten:
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
7
Kapitel 1. Datenbanksysteme
Physische Datenunabhängigkeit: Die Modifikation der physischen Speicherstruktur lässt die logische
Schicht unverändert.
Logische Datenunabhängigkeit: Kleinere Änderungen des Datenbankschemas (z. B. Umbenennung
von Attributen) können durch Sichten verborgen werden.
1.1.7
Unterscheiden Sie relationale Datenbanken von objektorientierten Datenbanken.
Die Unterschiede entsprechen ziemlich genau den Erweiterungen des objektrelationalen Modells die in
1.8 beschrieben sind.
1.1.8
Erklären Sie den Unterschied zwischen Entity und Klasse.
Entitäten haben keine Methoden, entsprechen also eher Pascal Records. Ausserdem sind alle Attribute
einer Entität atomar.
1.1.9
Wie kann man Objekte mit einer relationalen Datenbank realisieren?
Die Objekte müssen flach geklopft werden, so dass die Objekteigenschaften sich als atomare Attribute
speichern lassen. Dazu sind i. A. mehrere Relationen nötig. Methoden können nicht abgebildet werden.
1.1.10
Wo gibt es denn in der Mathematik Schlüssel?
Bei Funktionen.
1.1.11
Was ist ein Datenbankschema?
Das Datenbankschema legt die Struktur der abgespeicherten Daten fest.
1.1.12
Was ist ein Datenmodell?
Ein Datenmodell ist ein Satz von abgestimmten Konzepten zur Beschreibung der Repräsentation von
Informationen durch Daten.
1.2
Datenbankentwurf
1.2.1
Was gibt es für Modellierungsmöglichkeiten für Datenbanken?
ER-Modell
semantisches Modell
funktionales Modell
objektorientierte Entwurfsmodelle
1.2.2
Beschreiben Sie das ER-Modell.
Die grundlegenden Modellierungsstrukturen des Modells sind
Entities: Entitäten sind wohl unterscheidbare physisch oder gedanklich existierende Dinge der zu
modellierenden Welt. Im ER-Modell wird eigentlich mit Entitymengen gearbeitet.
Relationships: Beziehungen zwischen Entitäten. Diese Beziehung können Funktionalitäten habe,
z. B. 1:N . Sie können ausserdem durch die (min, max)-Notation noch genauer beschrieben werden.
Attribute: Attribute dienen dazu Entitäten zu charakterisieren.
Rollen: Rollen spezifizieren die Rolle einer Entität in einer Beziehung, dies ist z. B. bei rekursiven
Beziehung nötig.
8
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
1.2. Datenbankentwurf
Erweitert wird das ER-Modell durch:
schwache Entitäten: Schwache (existenzabhängige) Entitäten sind in ihrer Existenz von einer übergeordneten Entität abhängig. Oft sind sie nur in Kombination mit dem Schlüssel der übergeordneten
Entität eindeutig identifizierbar.
Generalisierung: Generalisierung bzw. Spezialisierung kann durch is-a-Beziehung modelliert werden.
Aggregation: Aggregation kann durch part-of -Beziehungen modelliert werden.
1.2.3
Was ist eine Entität?
Entitäten sind wohl unterscheidbare physisch oder gedanklich existierende Dinge der zu modellierenden
Welt.
1.2.4
Wie kann man ein ER-Modell in das relationale Modell überführen?
Alles was mit dem ER-Modell modelliert wurde, muss (so weit möglich) in Relationen überführt werden.
Entitäten: straight-forward!
Beziehungen: Zuerst werden alle Beziehungen in Relationen umgesetzt, dies wird später noch verfeinert. Die Relation erhält alle Schlüssel-Attribute der beteiligten Entitäten sowie alle Attribute
der Beziehung. Möglicherweise müssen Attributnamen umbenannt werde um Duplikate auszuschliessen oder die Übersichtlichkeit zu erhöhen. Die Wahl der Schlüssel hängt von der Funktionalität
der Beziehung ab
N :M : Die Menge aller Fremdschlüssel bildet den Schlüssel.
1:N : Als Schlüssel wird der Schlüssel der N Entität gewählt.
1:1: Hier kann man es sich aussuchen.
ternäre Beziehungen: Hier müssen die Schlüssel aller nicht-1-Entitäten aufgenommen werden.
Generalisierung: Das relationale Modell unterstützt Generalisierung nicht, deshalb gibt es nur
suboptimale Lösungen. Mann muss die Information auf die Ober- bzw. Untertypen aufteilen.
Dadurch ist aber keine Vererbung realisiert, um an die ganze Information zu gelangen, muss man
joinen.
Verfeinerung. Das wichtigste ist, dass nur Relationen mit gleichen Schlüsseln zusammengefasst werden
dürfen.
N :M : Diese Beziehungen bleiben als eigenständige Relation erhalten.
1:N : Diese Beziehungen können zusammengefasst werden, wobei die N -Entität um einen Fremdschlüssel erweitert werden muss.
1:1: Hier kann man sich aussuchen in welche Richtung man zusammenfassen möchte. Das ist
natürlich von den Entitäten abhängig, so sollte man z. B. so zusammenfassen, dass möglichst wenige
N U LL-Einträge entstehen.
1.2.5
Gibt es Vererbung im ER-Modell?
Es gibt Generalisierung, die durch is-a-Beziehung realisiert wird.
1.2.6
Was ist der Unterschied zwischen einem UML-Klassendiagramm und einem ER-Diagramm?
Entitäten haben keine Methoden
Attribute von Entitäten können nur atomar sein
Vererbung wird bei ER durch is-a-Beziehung realisiert
Aggregation wird bei ER durch part-of -Beziehung realisiert
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
9
Kapitel 1. Datenbanksysteme
1.2.7
Modellieren Sie eine 3-fach Beziehung.
Vorlesungen
M
Studenten
N
prüfen
1
Professoren
Durch diese Modellierung hat die Relation die Eigenschaften einer partiellen Funktion
prüfen : Studenten × Vorlesungen → Professoren
D. h. jedem Paar (Student, Vorlesung) ist genau ein Prüfer zugeordnet. Ein Student kann sich also
nicht in einer Vorlesung von zwei Professoren prüfen lassen.
1.2.8
Wo kommen im ER-Modell die Fremdschlüssel vor?
Die Fremdschlüssel kommen gar nicht vor. Sie existieren implizit durch Angabe der Relationships.
1.3
Das relationale Modell
1.3.1
Was ist ein Schlüssel?
Eine minimale Teilmenge von Attributen, deren Werte die zugeordnete Entity eindeutig identifizieren.
1.3.2
Was ist ein Primärschlüssel?
Kandidatenschlüssel sind minimale Schlüssel. Gibt es mehrere Kandidatenschlüssel, so wählt man einen
als Primärschlüssel
1.3.3
Was ist ein Fremdschlüssel?
Attribute einer Relation die dazu dienen Tupel einer anderen Relation zu identifizieren, heissen Fremdschlüssel.
1.3.4
Wie werden Beziehung im relationalen Modell dargestellt?
Beziehungen werden wie alles anderen im relationalen Modell durch Relationen (Tabellen) dargestellt.
1.3.5
Geben Sie ein Beispiel für eine Operation auf einer Relation.
Selektion (σ)
Projektion (Π)
Vereinigung (∪)
Differenz (−)
Kreuzprodukt (×)
Umbenennung (ρ)
diverse Joins (1)
Schnitt (∩)
Division(÷)
10
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
1.3. Das relationale Modell
1.3.6
Wie überführt man ternäre Relationships ins relationale Modell?
Die Relation erhält alle Schlüssel-Attribute der an der Beziehung beteiligten Entities und alle Attribute
der Beziehung. Schlüssel der Relation ist die Vereinigung aller Schlüssel von Entitäten, die eine N oder
M Funktionalität haben.
1.3.7
Welche verschiedenen Join-Arten gibt es?
Natürlicher Join: Es wird das Kreuzprodukt gebildet und aus diesem nur diejenigen Tupel interpretiert für die gleichnamige Attribute gleiche Werte haben. Durch eine folgende Projektion wird
jedes Ergebnis nur einmal aufgenommen. Seien R und S zwei Relationen. Wenn R die Attribute
A1 , . . . , Am , B1 , . . . , Bk und S die Attribute B1 , . . . , Bk , C1 , . . . , Cn hat, dann ist der Join wie folgt
definiert:
R 1 S = ΠA1 ,...Am ,R.B1 ,...,R.Bk ,C1 ,...,Ck (σR.B1 =S.B1 ∧...∧R.Bk =S.Bk (R × S))
Der Join-Operator ist assoziativ und kommutativ.
Allgemeiner Join: Beim natürlichen Join werden nur Tupel mit gleichnamigen und gleichwertige
Attributen aufgenommen. Beim allgemeinen Join (oder Theta-Join) kann ein beliebiges Prädikat
angegeben werden. Somit ist der allgemeine Join nichts anderes als ein Kreuzprodukt gefolgt von
einer Selektion:
R 1θ S = σθ (R × S)
Linker äusserer Join: Die Tupel der linken Argumentrelation bleiben in jedem Fall erhalten.
Rechter äusserer Join: Die Tupel der rechten Argumentrelation bleiben in jedem Fall erhalten.
Äusserer Join: Die Tupel beider Argumentrelationen bleiben in jedem Fall erhalten.
Semi-Join (n): Der Semi-Join von L und R ist definiert als
R n S = ΠL (L 1 R)
wobei R die Menge der Attribute von R ist. Das Ergebnis enthält also alle Tupel aus R in unveränderter Form die einen potentielle Joinpartner in S haben.
Semi-Join (o): analog definiert. Es gilt:
RoS =SnR
1.3.8
Erklären Sie Operatoren im Kontext der relationalen Algebra.
Im relationalen Modell werden alle Information in Relationen gespeichert. Relationen sind erst mal nur
Mengen von Tupeln, deswegen können auf ihnen sämtliche Mengenoperationen durchgeführt werden.
Diese Operationen bekommen im Kontext der Datenbankandwendung eine bestimmte Semantik.
1.3.9
Bei welchen Operatoren muss man Duplikate eliminieren?
Bei Projektion (Π) und Vereinigung (∪).
1.3.10
Was ist eine Relation?
Eine Relation ist eine Teilmenge des Kreuzprodukts mehrerer Mengen. Im relationalen Modell werden
Relationen meist als Tabellen dargestellt.
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
11
Kapitel 1. Datenbanksysteme
1.4
SQL
1.4.1
Wie würden Sie Vererbung mit Hilfe von SQL
nachbauen?
Generalisierung kann in SQL durch Sichten imitiert werden. Zum Beispiel möchte man die Spezialisierung von Angestellte auf Professoren und Assistenten darstellen. Dabei bestehen zwei Möglichkeiten:
Untertypen als Sicht: Hierbei werden die Untertypen ausschliesslich als Sichten angelegt. Die
Anfragen müssen über recht komplizierte Joins aufgelöst werden.
Obertypen als Sicht: Die Obertypen werden als Sichten angelegt, die ihre Ergebnisse durch Vereinigung von Anfragen an die Untertypen, berechnen.
Die folgenden Beispiele zeigen die Definition der Tabellen und Sichten mit SQL.
Untertypen als Sichten
Obertypen als Sichten
create table Angestellte
( PersNr . . .
Name . . . );
create table Professoren
( PersNr . . .
Name . . .
Rang . . .
Raum . . . );
create table ProfDaten
( PersNr . . .
Rang . . .
Raum . . . );
create table AssiDaten
( PersNr . . .
Boss . . . );
create view Professoren as
select ∗
from Angestellte a, ProfDaten d
where a.PersNr = d.PersNr;
create table Assistenten
( PersNr . . .
Name . . .
Boss . . . );
create view Angestellte as
( select PersNr, Name
from Professoren )
union
( select PersNr, Name
from Assistenten );
create view Assistenten as
select ∗
from Angestellte a, AssiDaten d
where a.PersNr = d.PersNr;
1.4.2
Geben Sie Beispiele für SQL-Anfrage.
select s.∗
from Studenten s
where s.GebDatum <
( select max(p.GebDatum)
from Professoren p );
1.4.3
Wie sieht die allgemeine Syntax einer SQL-Anfrage aus?
select A1 , . . . , An
from R1 , . . . , Rk
where P ;
1.4.4
Wie kann man Anfragen optimieren?
Anfrage können optimiert werden indem die entstehende Zwischenergebnisse möglichst klein gehalten
werden. D. h. man versucht das unvermeidliche Kreuzprodukt möglichst spät zu machen und es dadurch
möglichst klein zu halten.
12
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
1.5. Datenintegrität
1.5
Datenintegrität
1.5.1
Was sind Integritätsbedingungen?
Man unterscheidet zwischen statischen und dynamischen Integritätsbedingungen. Statische Bedingungen müssen von jedem Zustand der Datenbank erfüllt sein. Dynamische Bedingungen müssen an Zustandsübergänge sichergestellt werden. Integritätsbedingung sind:
Schlüsseldefinitionen, keine zwei Tupel mit gleichem Schlüssel dürfen existieren.
Kardinalitäten werden bei dem Übergang ins relationale Modell fest eingebaut.
Referentielle Integrität (keine
Dangling References)
1.6
Entwurfstheorie (Normalformen)
1.6.1
Geben Sie ein Beispiel für eine Relation, die in 2NF aber nicht in 3NF ist.
Ein Verlag speichert alle seine Bücher in der abgebildeten Relation. Diese Relation ist in 2NF da alle
nicht Schlüssel-Attribute voll funktional abhängig vom Schlüssel ArtNr sind. Sie ist aber nicht in 3NF
da die Nicht-Schlüssel-Attribute Titel und Autor abhängig vom Nicht-Schlüssel-Attribut ISBN sind.
ArtNr Titel
Autor
ISBN
Achtung! In der wirklichen Welt ist diese Relation allerdings schon in 3NF. Es gibt nicht für alle Bücher
eine ISBN, deshalb existiert die funktionale Abhängigkeit {ISBN} → {Titel, Autor} nicht.
1.6.2
Was ist
funktionale Abhängigkeit?
Zwei Attributteilmengen α und β von R sind funktional abhängig wenn gilt: Für alle Paare von Tupeln
r, t ∈ R mit r.α = t.α gilt auch r.β = t.β. Wenn also eine funktionale Abhängigkeit α → β besteht,
müssen für alle Tupel, die in allen Attributen von α gleich sind, auch alle Attribute in β gleich sein.
1.6.3
Was ist ’volle funktionale Abhängigkeit?
Die Definition der vollen funktionale Abhängigkeit benötigt man um Schlüssel von Superschlüsseln
abzugrenzen. β ist voll funktional abhängig von α wenn gilt:
1. α → β, d. h. β ist funktional abhängig von α und
2. α kann nicht mehr
verkleinert werden, d. h.
∀A ∈ α : α − {A} 6→ β
Man kann also kein Attribut aus α entfernen ohne die funktionale Abhängigkeit zu zerstören. Wenn
β voll funktional abhängig ist von α schreibt man
•
α → β.
1.6.4
Wann ist eine funktionale Abhängigkeit trivial?
Triviale funktionale Abhängigkeiten sind Abhängigkeiten die automatische erfüllt sind. Nur Abhängigkeiten
der Form
α→β
mit
β⊆α
sind trivial.
1.6.5
Was sind Normalformen?
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
13
Kapitel 1. Datenbanksysteme
Normalformen dienen dazu die Güte eines Relationenschemas zu bewerten. Es gibt folgende Normalformen:
1NF : Eine Relation ist in erster Normalform wenn alle Attribute atomare Wertebereiche haben.
2NF : Eine Relation ist in zweiter Normalform wenn alle Nicht-Schlüssel-Attribute voll funktional
abhängig von allen Kandidatenschlüssel sind.
3NF : Die dritte Normalform ist verletzt wenn eine Nicht-Schlüssel-Attribut von einem anderen
Nicht-Schlüssel-Attribut abhängig ist.
Eine Relation R ist in dritter Normalform, wenn für jede für R geltende funktionale Abhängigkeit
der Form α → B mit α ⊆ R und B ∈ R mindestens eine der drei Bedingungen gilt:
B ∈ α, d. h. die funktionale Abhängigkeit ist trivial
Das Attribut B ist in einem Kandidatenschlüssel von R enthalten – also B ist prim.
α ist Superschlüssel von R.
BCNF : Eine Relation R ist in Boyce-Codd Normalform wenn für jede für R geltende funktionale
Abhängigkeit α → β eine der folgenden Bedingung gilt:
β ⊆ α, d. h. die funktionale Abhängigkeit ist trivial.
α ist Superschlüssel von R.
4NF : Eine Relation R mit einer zugeordneten Menge D von funktionalen und mehrwertigen Abhängigkeiten ist in vierter Normalform, wenn für jede mehrwertige Abhängigkeit α →→ β ∈ D +
eine der folgenden Bedingungen gilt.
Die mehrwertige Abhängigkeit ist trivial.
α ist Superschlüssel von R.
1.6.6
Erläutern Sie den Algorithmus zur Zerlegung in 3NF und führen Sie ihn an einem Beispiel vor.
Der folgende Algorithmus zerlegt ein Relationenschema R mit funktionalen Abhängigkeiten F so in
Relationenschemata R1 , . . . , Rn , dass folgende Kriterien erfüllt sind.
R1 , . . . , Rn ist eine verlustlose Zerlegung von R.
Die Zerlegung ist abhängigkeitsbewahrend.
Alle Ri sind in dritter Normalform.
Algorithmus:
1. Bestimme die kanonische Überdeckung Fc zu F . Das geht so:
a)
b)
c)
d)
Linksreduktion der funktionalen Abhängigkeiten
Rechtsreduktion der funktionalen Abhängigkeiten
Entfernung funktionaler Abhängigkeiten der Form α → ∅
Zusammenfassung funktionaler Abhängigkeit mit gleichen linken Seiten
2. Für jede funktionale Abhängigkeit α → β ∈ Fc :
Kreiere eine Relationenschema Ra := α ∪ β
Ordne Ra die funktionalen Abhängigkeiten. Fα := {a0 → β 0 ∈ Fc | α0 ∪ β 0 ⊆ Ra } zu.
3. Falls eines der in Schritt 2 erzeugten Schemata Ra einen Kandidatenschlüssel von R bzgl Fc enthält,
sind wir fertig. Ansonsten wähle einen Kandidatenschlüssel κ ⊆ R aus und definiere folgendes
zusätzliche Schema:
Rκ := κ
Fκ := ∅
4. Eliminiere diejenigen Schemata Ra , die in einem anderen Relationenschema Ra0 enthalten sind,
d. h.
Ra ⊆ R a0
1.6.7
14
Warum bringt man Relationen in Normalformen?
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
1.7. Transaktionen
Bei schlechten Relationenschemata kann es zu folgenden Anomalien kommen
Updateanomalie Wenn Informationen redundant gespeichert werden, müssen sie bei einer Änderung
an alle Stellen geändert werden. Wenn dies nicht geschieht, treten Problem auf. Selbst wenn dies
sichergestellt wird, kostet es Speicherplatz und Performance.
Einfügeanomalie Wenn in einem Entwurf Informationen zweier Entitytypen vermischt werden, so
ergeben sich Problem wenn man nur eine der Entitäten anlegen will. Die anderen Werte müssen
dann mit NULL-Werten aufgefüllt werden.
Löschanomalie Wen Information bzgl. eines der beiden vermischten Entitytypen gelöscht werden
kommt es zum Verlust von Informationen bzgl. des anderen Typen.
Alle diese Anomalien sind darauf zurückzuführen, dass nicht zusammenpassende Information in einer
Relation gespeichert werden. Normalisierung soll das verhindern.
1.6.8
Ist die Zerteilung (3NF) verlustlos und abhängigkeitsbewahrend?
Ja. Die Relation R wurde in die Relationen R1 , . . . , Rn zerlegt. Mann kann aber alle Information die in
der Ausprägung R enthalten war aus den Ausprägungen R1 , . . . Rn rekonstruieren und für R geltenden
funktionalen Abhängigkeiten sind auf R1 , . . . , Rn übertragbar.
1.6.9
Was sind die
Armstrong-Axiome?
Die Armstrong-Axiome sind:
Reflexivität: Falls β eine Teilmenge von α ist, dann gilt immer α → β. Insbesondere gilt also immer
α → α.
Verstärkung: Falls α → β gilt, dann gilt auch α ∪ γ → β ∪ γ.
Transitivität: Falls α → β und β → γ gilt, dann gilt auch α → γ.
Mit den Armstrong-Axiomen kann die Hülle F + einer Menge F von funktionalen Abhängigkeiten bestimmt werden.
1.7
Transaktionen
1.7.1
Was ist eine Transaktion?
Aus der Sicht des Datenbankbenutzers ist eine Transaktion eine Arbeitseinheit, die eine bestimmte
Funktion erfüllt. Aus der Sicht des DBMS ist eine Transaktion eine Folge von Lese-und Schreiboperationen abgeschlossen durch ein abort oder commit.
1.7.2
Welche Eigenschaften müssen Transaktionen erfüllen?
siehe 1.7.3
1.7.3
Was bedeutet das Akronym ACID?
Das Akronym steht für die vier wichtigsten Forderungen an Transaktionen
Atomicity: Eine Transaktion muss atomar, also ununterbrechbar sein. Entweder werden keine oder
alle Änderungen in der Datenbasis festgeschrieben (alles-oder-nichts-Prinzip).
Consistency: Eine Transaktion muss bei Beendigung einen konsistenten Zustand hinterlassen, anderenfalls wird sie komplett zurückgenommen. Während der Ausführung der Transaktion können
teilweise Konsistenzbedingungen verletzt werden.
Isolation: Nebenläufige Transaktionen dürfen sich nicht gegenseitig beeinflussen. Für eine Transaktion muss es so aussehen, als sei sie die einzige auszuführende Transaktion.
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
15
Kapitel 1. Datenbanksysteme
Durability: Die Wirkung einer erfolgreich abgeschlossenen Transaktion muss dauerhaft in der Datenbasis festgeschrieben werden. Die bereits ausgeführten Teile einer abgebrochenen Transaktion
müssen vollständig rückgängig gemacht werden.
1.7.4
Welche Probleme gibt es bei der Ausführung von Transaktion und welche Lösungen gibt es?
Probleme beim Einbenutzerbetrieb:
Das DBMS kann abstürzen. Die Recovery muss dafür sorgen, den ursprünglichen Zustand wieder
herzustellen.
Am Ende einer Transaktion zeigt sich, dass Konsistenzbedingungen verletzt werden. Bisher durchgeführt Operationen müssen Rückgängig gemacht werden.
Probleme beim unkontrollierten Mehrbenutzerbetrieb:
Lost update: Durch ungeschickte Verzahnung mehrere Transaktionen können Änderungen verloren
gehen. Die Mehrbenutzersynchronisation muss das ausschliessen.
Dirty read : Durch ungeschickte Verzahnung mehrere Transaktionen liest eine Transaktion Daten,
die noch nicht freigegeben wurden. Die Mehrbenutzersynchronisation muss das ausschliessen.
Phantomproblem: Eine Transaktion liest während ihres Ablaufs bestimmte Daten zweimal. Zwischen dem ersten und zweiten Zugriff fügt eine andere Transaktion ein neues Datum ein, das mit
berücksichtigt werden muss. Dadurch unterscheiden sich der erste und der zweite Zugriff, da beim
zweiten Zugriff das neu eingefügte Phantom mit gelesen wurde. Die Mehrbenutzersynchronisation
muss das ausschliessen.
Probleme beim kontrollierten Mehrbenutzerbetrieb:
Verklemmungen: Mehrere Transaktionen können in einen Deadlock geraten.
1.7.5
Was ist
Serialisierbarkeit?
Beim Konzept der Serialisierbarkeit werden die Vorzüge der seriellen Ausführung (Isolation) mit den
Vorteilen des Mehrbenutzerbetriebs (bessere Auslastung) kombiniert. Eine serialisierbare Ausführung
mehrer Transaktionen entspricht einer kontrollierten Verzahnung und zwar so, dass das Ergebnis dem
des echten seriellen Ausführens entspricht.
1.7.6
Was ist das Serialisierbarkeitstheorem?
Das Serialisierbarkeitstheorem besagt, dass eine Historie H genau dann serialisierbar ist, wenn ihr
Serialsierbarkeitsgraph SG(H) azyklisch ist.
Eine Serialisierung entspricht einer topologischen Sortierung des Serialsierbarkeitsgraphen. Es gibt keine
topologische Sortierung, falls dieser Zyklen enthält.
1.8
Objektrelationale und objektorientierte Datenbanken
1.8.1
Was ist eine objektrelationale Datenbank?
Das objektrelationale Modell erweitert das relationale Modell wie folgt:
Mengenwertige Attribute: Attribute müssen nicht mehr Atomar sein, man erlaubt Mengen als
Attribute.
Typendeklaration: Das objektrelationale Modell erlaubt das erstellen eigener Datentypen.
Referenzen: Attribute können direkt Referenzen auf Objekte haben. Dadurch ist man nicht mehr
auf Fremdschlüssel angewiesen. Ausserdem können N :M -Beziehungen durch eine Menge von Referenzen aufgelöst werden.
Objektidentität: Voraussetzung für Referenzen ist die eindeutige Identifizierbarkeit von Objekten.
16
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
1.9. Data Warehousing
Pfadausdrücke: Wenn Referenzen erlaubt sind, muss die Anfragesprache auch Pfadausdrücke unterstützen.
Vererbung
Methode: Klassen (bzw. Objekten) können Methoden zugeordnet werden.
1.8.2
Was versteht man unter
Objektidentität?
Im Gegensatz zu relationalen Modell braucht man beim objektorientierten Modell keine Schlüssel zu
verwenden um ein Objekt anzusprechen. Jedes Objekt hat eine systemweit eindeutig Identität, die
automatisch generiert wird und sich während der Objektlebenszeit nicht ändert.
1.9
Data Warehousing
1.9.1
Was ist Data Warehousing?
Eine Data Warehouse ist eine Datenbank die historische Unternehmensdaten hält, es ist eine OLAPAnwendung (Online Analytical Processing). Der Datenbestand des Data Warehouses wird periodisch
mit Informationen aus den operationalen Datenbanken des Unternehmens aufgefrischt. Das Data Warehouse dient der Analyse langfristiger Entwicklungen und daher zur Entscheidungsunterstützung.
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
17
Kapitel 2
Compilerbau
2.1
Allgemeines
2.1.1
Geben Sie einen Überblick über die Struktur eines Compilers.
Quellprogramm
Lexikalische Analyse
Token
Frontend
Syntaxanalyse
Syntaxbaum
Semantische Analyse
Zwischencode
Optimierung
Zwischencode
Backend
Codeerzeugung
Code
lexikalische Analyse: Das Quellprogramm wird mit einem Scanner in eine Folge von Tokens zerlegt.
Syntaxanalyse: Aus diesen Token erzeugt der Parser einen Syntaxbaum entsprechende der Syntax
der Programmiersprache.
semantische Analyse: In der semantischen Analyse wird der Syntaxbaum hinsichtlich semantischer
Korrektheit (z. B. Typinformationen) geprüft.
Optimierung: In der Optimierungsphase wird der erzeugte Zwischencode optimiert.
Codeerzeugung: Aus dem optimierten Zwischencode wird in Maschinencode erzeugt. Der Zielcode
kann nochmal optimiert werden.
2.1.2
Welche Fehler werden an welchen Stellen erkannt?
lexikalische Fehler : Lexikalische Fehler, z. B. ungültige Zeichen oder ungültige Bezeichner werden
vom Lexer erkannt.
Syntaxfehler : Der Parser erkennt Syntaxfehler.
semantische Fehler : Semantische Fehler, z. B. Typfehler oder ungültige Methodenparameter werden
bei der semantischen Analyse erkannt.
2.1.3
In welchen Phasen finden Optimierungen statt?
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
19
Kapitel 2. Compilerbau
In der Optimierungsphase. Man unterscheidet zwischen der Optimierung von Zwischencode und der
Optimierung von Zielcode.
2.1.4
Was sind Attribute?
Attribute beschreiben Eigenschaften von Syntaxknoten.
2.1.5
Wie funktioniert die Informationsübergabe zwischen Scanner und Parser?
Über Tokens.
2.1.6
Was ist ein Token?
Ein Token ist eine Folge von Zeichen die bedeutungsmässig zusammengehören.
2.1.7
Welche Fehler kann das Laufzeitsystem erkennen?
Indexüberschreitungen bei Arrays
Cast-Exceptions (OO)
Null-Pointer-Exceptions
2.1.8
Welche Fehler werden nicht gefunden?
Logische Fehler.
2.1.9
Was ist Bootstrapping?
Beim Bootstrapping wird ein Compiler für eine neue Programmiersprache Schritt für Schritt entworfen.
Zuerst wird in Maschinensprache ein Compiler entworfen, der nur eine Teilmenge der Sprache beschert,
mit diesem wird dann ein Compiler geschrieben, der schon etwas mehr kann, usw.
2.2
Lexikalische Analyse
2.2.1
Was ist screenen?
Entfernung von Leerzeichen, Zeilenumbrüche, Tabstopps, . . .
2.2.2
Kann man auch Leerzeichen in den Identifaktoren haben?
Ja, z. B. bei Fortran.
2.2.3
Was verwendet man zur lexikalischen Analyse?
Einen endlichen Automaten.
2.2.4
Wie unterscheidet man Literale von Bezeichnern?
Durch Sonderzeichen wie Anführungsstriche.
2.2.5
Dürfen Schlüsselwörter auch Bezeichner sein?
Es gibt Sprachen, wo dies erlaubt ist, z. B. PL/1.
20
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
2.3. Syntaktische Analyse
2.3
Syntaktische Analyse
2.3.1
Entwerfen Sie einen Top-Down-Parser für folgende Grammatik:
→
E
E+T | T
→ T ∗F | F
→ (E) | id
T
F
wobei E das Startsymbol ist.
1. Elimination der Links-Rekursivität.
Diese Grammatik ist links-rekursiv, dass kann zu Endlosschleifen im Top-Down-Parser führen, daher
muss die Links-Rekursivität beseitigt werden:
E
E0
T
T0
F
→ T E0
→ +T E 0 | → FT0
→ ∗F T 0 | → (E) | id
2. Recursive Decent Parser in Java. Abschnitt 2.7 zeigt eine Java-Implementierung des Parsers. Für
jedes Nicht-Terminal existiert eine Methode. E 0 und T 0 heissen in der Java-Version E1 und E2.
Statt Bezeichner erkennt der Parser Ziffern.
2.3.2
Was für Sprachen verwendet man und wieso?
Man verwendet deterministisch kontextfreie Sprachen, da deren Mächtigkeit annähernd ausreichend ist
und das Wortproblem in linearer Zeit gelöst werden kann.
2.3.3
Was ist der Unterschied zwischen LL(k) und LR(k) und was ist mächtiger?
Ein LR-Parser erkennt, dass für die Ableitung eines Wortes die Produktion A → β angewandt wurde,
nachdem er alles gesehen hat, was aus den Symbolen von β abgeleitet wurde – denn zu jedem Symbol
aus β liegt der Ableitungsbaum bereits vor (auf dem Stack) – sowie die nächsten k Zeichen der Eingabe.
Ein LL-Parser muss die Entscheidung treffen nachdem er nur die ersten k Zeichen des aus β abgeleiteten
Wortes gesehen hat. Daher können LR-Grammatiken mehr Sprachen als LL-Grammatiken beschreiben,
es gilt L(LL) ⊂ L(LR).
2.3.4
Was ist eine attributierte Grammatik?
Attributierte Grammatiken sind formale Beschreibungen von Übersetzungsprozessen und werden zur
Spezifikation und zur Generierung von Übersetzern verwendet. Sie beschreiben, wie die Knoten des
erzeugten Syntaxbaums mit Attributen ’dekoriert’ werden, die schliesslich das Übersetzungsergebnis
darstellen. Zum Beispiel definiert die Produktion
VarDecl↑list = ’var’ NameList↓type↑list ’:’ Type↑type ’;’
folgende semantische Aktionen:
NameList.type := Type.type;
VarDecl.list := NameList.list;
2.3.5
Was ist eine LALR-Grammatik?
Eine LALR-Grammatik kann mit einem LALR-Parser erkannt werden. LALR steht für lookahead LR.
LALR stellt einen Kompromiss in Sachen Mächtigkeit und Aufwand zwischen SLR und kanonischer
LR da.
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
21
Kapitel 2. Compilerbau
2.3.6
Wie kann man Linksrekursionen beseitigen?
Um die Linksrekursivität von A zu beseitigen, geht man wie folgt vor:
1. Man teilt alle A-Produktionen in zwei Gruppen auf.
rekursiven, in die andere, die nicht-links-rekursiven:
A
A
→
→
In die eine Gruppe kommen die links-
Aα1 | Aα2 | . . . | Aαm
β 1 | β2 | . . . | β n
2. Dann ersetzt man die ursprüngliche A-Produktionen durch
A → β 1 A0 | β2 A0 | . . . | β n A0
wobei A0 eine neue Variable ist. Für A0 werden folgende Produktionen eingefügt.
A → α 1 A0 | α2 A0 | . . . | α m A0 | Wichtig ist die -Alternative.
Frage 2.3.1 zeigt ein einfaches Beispiel. Diese Vorgehensweise beseitigt nur direkte Links-Rekursionen.
2.3.7
Welche Fehler erkennt der Parser?
Syntaxfehler.
2.3.8
Ist LR(k) mächtiger als LR(1)?
Nein. Die Sprachklassen LR(1), LR(2), . . . sind alle gleich mächtig. Es sind die Sprachen, die von
einem deterministischen Kellerautomaten über Endzustände erkannt werden. LR(0)-Sprachen werden
von einem deterministischen Kellerautomaten über den leeren Keller erkannt.
2.3.9
Erzeugt eine kontextsensitive Grammatik auch einen Baum?
Nein. Typ 1 Grammatiken erzeugen Ableitungsgraphen.
2.3.10
Was bedeutet mehrdeutig und welche Probleme sind damit verbunden?
Eine Grammatik ist mehrdeutig wenn es für ein Wort mehrere, verschieden Ableitungsbäume gibt.
Programmiersprachen sollten nicht mehrdeutig sein, da mehrere Ableitungsbäume meistens auch verschiedenen Bedeutungen entsprechen.
2.3.11
Geben Sie eine Grammatik für arithmetische Ausrücke mit Klammerung, Addition und Multiplikation
an.
expr
expr
expr
op
op
2.3.12
→
→
→
→
→
expr op expr
( expr )
num
+
∗
Welche Fehlerbehandlungsstrategien gibt es?
panic mode: Nachdem der Parser einen Fehler gefunden hat, überspringt er folgende Tokens bis zu
einem ausgezeichneten Synchronisationstoken, z. B. das Semikolon.
phrase level : Der Parser ’behebt’ Fehler in dem er Fehlerhafte Token durch gültige ersetzt, also
z. B. eine Komma durch ein Semikolon ersetzt.
22
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
2.4. Semantische Analyse
error productions: Falls die Fehler gut bekannt sind, können eigene Produktion für Fehler definiert
werden.
2.3.13
Kann jeder Parser nach der Recursive-Decent-Methode implementiert werden?
Nein. Die Recursive-Decent-Methode funktioniert nur bei LL-Grammatiken, diese müssen ausserdem
frei von Linksrekursionen sein, sonst kann es zu Endlosschleifen kommen.
2.4
Semantische Analyse
2.4.1
Was passiert bei der semantischen Analyse?
Die semantische Analyse erfüllt zwei Aufgaben:
Überprüfung des Syntaxbaums auf Fehler.
Zusätzlich zur kontextfreien Grammatik unterliegen Programmiersprachen noch weiteren, kontextsensitiven Regeln, wie z. B.
Bezeichner müssen vor der ersten Verwendung deklariert werden
Zuweisungen müssen typkorrekt sein
Beim Methodenaufruf müssen Anzahl und Typ der Parameter stimmen
Diese Bedingungen müssen während der semantische Analyse überprüft werden, da der (auf kontextfreie Sprachen beschränkte) Parser dies nicht erledigen kann.
Vorbereitung der Codeerzeugung. In der semantischen Analyse kann die Codeerzeugung vorbereitet
werden, indem z. B. Adressen für Variablen (lokal) vergeben werden.
2.4.2
Was ist eine Symboltabelle?
Die Symboltabelle hält für jeden Bezeichner seine Deklarationsinformation. Beim ersten Vorkommen
eines Bezeichner wird ein Symboltabelleneintrag angelegt auf den bei späteren Typüberprüfungen zugegriffen werden kann. Symboltabellen werden häufig mit Hashing implementiert.
2.4.3
Welche Arten von Attributen gibt es?
Es gibt
erzeugte Attribute (synthesized): Attribute werden als erzeugt bezeichnet, wenn der Wert eines
Attributs an einem Parsebaum Knoten von Attributen der Kinder dieses Knotens abhängt. Erzeugte
Attribute können bei einem einzigen Bottom-Up Durchlauf berechnet werden.
vererbte Attribute (inherited): Der Wert von vererbten Attributen wird aus Attributen des Vaterknotens oder von Geschwisterknoten berechnet.
2.4.4
Geben Sie Beispiele für Attribute.
Typinformation
Code
Deklarationsinformation
Adressen bzw. Stackinformation
2.5
Codegenerierung und Optimierung
2.5.1
Welche Rolle spielen Attribute bei der Codegenerierung?
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
23
Kapitel 2. Compilerbau
Während der semantischen Analyse kann bereits Vorarbeit für die Codegenerierung geleistet worden
sein, so können bereits Adressen für die Variablen errechnet worden sein.
Ausserdem besteht die Möglichkeit, den Code nicht direkt auszugeben, sondern in Codeattributen des
Syntaxbaumes zu speichern. Der Wurzelknoten enthält dann den ganzen Code.
2.5.2
Welche Optimierungsmöglichkeit gibt es bei der Codegenerierung
Konstantenfaltung: Konstantenausdrücke können zur Compilezeit berechnet werden. Das ist vor
allem wichtig für Verbesserungen, die der Programmierer nicht beeinflussen kann. Beispiel Zugriff
auf das Arrayelement a[3]:
memory[base + offset(a) + 3 · elemSize]
⇒
memory[base + constant]
algebraische Vereinfachungen: Teure Operationen durch billige ersetzen, z. B. Division und Multiplikation durch Bit-Shifts.
Copy Propagation: Bei Zuweisungen der Form x := y kann in der Folge jedes Vorkommen von x
durch y ersetzt werden, solange der Wert von x sich nicht ändert.
3+5·z
x
:=
y
z
:= 3 · n
:= x
Hier kann die Variable x weg optimiert werden:
y
:=
z
:=
3·n
3+5·z
Entfernung von totem Code: Zum Beispiel Zuweisungen an Variablen, die nicht mehr benutzt
werden oder Code der in einem Ast eines If-Then-Statements liegt, das nicht erreicht werden
kann.
Auflösung von Schleifeninvarianten: Zuweisungen innerhalb einer Schleife, die nicht vom Schleifenzähler abhängen können aus der Schleife herausgezogen werden.
Befehlsanordnung: Befehle sollten nach Möglichkeit so angeordnet sein, dass sie das Pipelining
moderner Prozessoren unterstützen.
Registervergabe: Variablen sollte so auf Register und Hauptspeicher verteilt sein, dass möglichst
selten auf den Hauptspeicher zugegriffen wird.
2.5.3
Was ist ’Peephole’-Optimierung?
Bei der ’Peephole’-Optimierung wird immer nur ein kurzes Stück Code angeschaut und dort verschiedene
Optimierungen durchgeführt. Diese kurze Stück ist das ’Peephole’. Typische Anwendungsfelder für
’Peephole’-Optimierung sind:
Entfernung redundanter Anweisungen
Kontrollfluss-Optimierung
algebraische Vereinfachungen
2.5.4
Wie funktioniert die Registervergabe nach Aho-Johnson?
Der Registervergabealgorithmus nach Aho-Johnson arbeitet nach dem Prinzip des dynamischen Programmierens.
2.5.5
Was sind die Ausgangs- und Zieldatenstrukturen?
Sowohl Ein- wie Ausgabe der Optimierung ist eine Zwischensprache. Meist verwendet die Zwischensprache einen Drei-Adress-Code der in Tupel gespeichert wird. Diese Zwischensprache ähnelt einer
Assemblersprache.
24
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
2.6. Übersetzung objektorientierter Sprachen
2.6
Übersetzung objektorientierter Sprachen
2.6.1
Welchen Unterschiede gibt es zwischen Compilern für objektorientierte Sprachen und Compilern für
prozeduralen Sprachen?
Entsprechend der Phasen:
lexikalische Analyse: keine Unterschiede.
Syntaxanalyse: keine Unterschiede.
semantische Analyse: Die Typanalyse wird komplizierter, da die Klassenstruktur (Vererbung)
berücksichtigt werden muss. Der Compiler muss überprüfen ob Vererbung, Interface-Implementierung,
usw. korrekt programmiert ist.
Optimierung: siehe 2.6.2.
Codeerzeugung: Bei objektorientierten Programmiersprachen kommt es aufgrund der Polymorphie
viel öfter zu Fällen, in denen nicht während der Compilezeit gebunden werden kann (dynamische
Bindung).
2.6.2
Was für spezielle Methode zur Optimierung gibt es bei OO-Compilern?
Man versucht die Bindungen so gut es geht zur Compile-Zeit zu erledigen, dadurch erspart man sich
aufwendiges Methoden suchen. Im einfachsten Falle bindet man nur dynamisch, im kompliziertesten
macht man eine komplette Datenflussanalyse und versucht damit die Zahl der dynamischen Bindungen
klein zu halten. Dies ist aber zu aufwendig.
2.6.3
Erklären Sie an einem Beispiel nochmal genau den Unterschied zwischen dynamischer und statischer
Bindung. Wann bindet Java statisch und wann dynamisch?
Das Beispiel macht nochmal alles klar. Es gibt eine Klassenhierarchie mit zwei Klassen, Oberklasse ist
Shape, Unterklasse ist Circle. Ausserdem gibt es noch eine Klasse Test mit zwei Methoden die je
nach Parameter (Shape oder Circle) einen unterschiedlichen String zurückgeben.
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
25
Kapitel 2. Compilerbau
01
02
03
04
05
06
07
08
09
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
2.7
class Shape {
private String name;
public String toString(){
return "Shape";
}
}
class Circle extends Shape {
public String toString(){
return "Circle";
}
}
class Test {
public String print(Shape shape) {
return "Test: Shape";
}
public String print(Circle circle) {
return "Test: Circle";
}
In Zeile 29–31 wird eine Variable werden drei
Variablen deklariert. shape1 und shape2 haben den Typ Shape. circle hat den Typ
Circle. Die Variabel shape1 und circle sind
jeweils Objekten zugeordnet, die ihrem statischen Typ entsprechen. Der Variablen shape2
ist ein Kreis zugeordnet, somit eine Instanz einer Unterklasse. Wenn man dieses Programm
nun laufen lässt erhält man folgende Ausgabe:
Dynamische Bindung
Shape
Circle
Circle
Statische Bindung
Test: Shape
Test: Circle
Test: Shape
Erst mal zu den Ausgabe die die dynamische
Bindung betreffen. Die ersten beiden Ausgabe
}
sind klar, hier wird einfach die toString()Methode der Klassen Shape bzw. Circle aufpublic class DynBind {
gerufen. Die dritte Ausgabe ist nun interespublic static void main(String argv[]) {
sant. Obwohl die Variable vom statischen Typ
Shape ist, wurde offensichtlich die Methode
Test test = new Test();
der Klasse Circle aufgerufen. Die MethodenShape shape1 = new Shape();
bindung hängt also von der aktuellen Instanz
Circle circle = new Circle();
ab. Natürlich könnte in diesem einfach Fall
Shape shape2 = circle;
bereits Compiler die Zusammenhänge erkennen und die Methode statisch binden. Es gibt
System.out.println("Dynamische Bindung"); aber viel komplexere Situationen in denen das
System.out.println(shape1);
tatsächlich nur zur Laufzeit möglich ist oder
System.out.println(circle);
der Compiler müsste eine sehr aufwendige DaSystem.out.println(shape2);
tenflussanalyse machen (und selbst dann geht
System.out.println("Statische Bindung"); es nicht immer).
Java bindet also die Methoden dynamisch an
System.out.println(test.print(shape1));
die Objekte. Der zweite Teil der Ausgabe zeigt,
System.out.println(test.print(circle));
System.out.println(test.print(shape2));
dass dies bei den Methodenparametern nicht so
}
ist. Unabhängig von der Instanz, der die Va}
riable zugeordnet ist, wird immer die statische
Typdefinition verwendet.
Top-Down Parser in Java
Dieser Parser arbeitet nicht auf Tokens, die vom Scanner kommen, sondern direkt auf Zeichen. Da in der
beschreibenden Grammatik ausserdem -Produktion sind, kommt der Parser nicht mit unbekannten Zeichen
zurecht.
26
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
2.7. Top-Down Parser in Java
static void nextToken() {
lookahead++;
}
static boolean match(char token) {
public class TopDownParser {
static char[] input;
static int lookahead;
if (lookahead >= input.length) return false;
static void ntE() throws ParseException {
printLA();
System.out.println("E -> T E2");
ntT();
ntE2();
}
static void ntE2() throws ParseException {
printLA();
System.out.print("E2 ->");
if (match(’+’)) {
System.out.println(" + T E2");
ntT();
ntE2();
}
else {
System.out.println(" e");
}
if (token==input[lookahead]) {
nextToken();
return true;
}
else {
return false;
}
}
static boolean matchDigit() {
if (lookahead >= input.length) return false;
if (Character.isDigit(input[lookahead])) {
nextToken();
return true;
}
else {
return false;
}
}
static void ntT() throws ParseException {
printLA();
System.out.println("T -> F T2");
ntF();
ntT2();
}
static void ntT2() throws ParseException {
printLA();
System.out.print("T2 ->");
if (match(’*’)) {
System.out.println(" * F T2");
ntF();
ntT2();
}
else {
System.out.println(" e");
}
}
static void ntF() throws ParseException {
printLA();
System.out.print("F ->");
if (match(’(’)) {
System.out.println(" ( E )");
ntE();
match(’)’);
}
else if (matchDigit()) {
System.out.println(" digit");
}
else
throw new ParseException(lookahead);
}
static void printLA() {
System.out.print(lookahead);
if (lookahead < input.length)
System.out.print
("["+input[lookahead]+"] | ");
else
System.out.print ("[e] | ");
}
public static void main(String argv[]) {
input = argv[0].toCharArray();
lookahead=0;
try {
ntE();
System.out.println("k");
}
catch (ParseException ex) {
System.out.println
("\nParseException at position: "
+ ex.pos);
}
}
static class ParseException extends Exception {
public int pos;
public ParseException(int pos){
super("ParseException at position: " + pos);
this.pos=pos;
}
}
}
}
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
27
Kapitel 3
Software Engineering
3.1
Allgemeines
3.1.1
Was sind Komponenten und wie sind sie definiert?
Eine Komponente ist ein physischer und austauschbarer Teil eines Systems der durch eine Schnittstelle
spezifiziert ist. Beispiele sind Klassenbibliotheken, Frameworks und Binärprogramme.
3.1.2
Was ist in einer Schnittstelle definiert?
Eine Schnittstelle ist ein Übergang zwischen zwei Funktionseinheit mit vereinbarten Regeln für die
Übergabe von Daten oder Signalen.
3.1.3
Was wäre den in Java ein Modul und was eine Komponente?
Es gibt keine vernünftige Trennung von Modul und Komponente.
3.1.4
Was sind CASE-Tools?
CASE steht für Computer Aided Software Engineering. CASE-Tools sind Programm die den Entwickler
bei den verschieden Phasen des Engineerings unterstützen. Darüber hinaus unterstützen CASE-Tools
auch Bereiche wie Projektkommunikation, Dokumentation,. . . .
3.1.5
Um welche Aspekte geht es beim Software-Engineering?
Der Titel des Bruegge Buch sagt es:
3.1.6
Conquering Complex And Changing System .
Wie ist der Aufwand dabei verteilt?
Man rechnet Ungefähr 10% für Analyse, 20% für Entwurf, 20% für Implementierung und 50% für Testen
und Wartung.
3.1.7
Sie haben ein OO-Modell bis runter zu den Objekten, wie geht es dann weiter?
Jetzt folgt die Implementierungsphase mit anschliessendem Testen.
3.1.8
Was ist ein Modul?
Module sind physische Container in denen man Klassen und Objekte des logischen Designs definiert.
3.1.9
Wie kann man Daten modellieren?
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
29
Kapitel 3. Software Engineering
Zum Beispiel mit UML oder ER-Diagrammen.
3.1.10
In welche Phasen organisiert man ein Softwareprojekt?
Softwareentwicklung besteht normalerweise aus diesen fünf Aktivitäten:
Ermittlung der Anforderungen (Requirements Elicitation). Kunde und Entwickler definieren die
Aufgabe des Systems. Das Ergebnis kann eine Beschreibung des Systems in Form von Use Case
und Akteuren sein. Es werden funktionale so wie nicht-funktionale Anforderung herausgearbeitet.
Analyse (Analysis). Das Ziel der Analyse ist es ein Modell aufzustellen das das System komplett
beschreibt und alle Anforderung gerecht wird. Bei diesem Schritt befindet man sich noch komplett
in der Problemdomäne. Es gibt natürlich Ausnahmen wie Pseudo-Requirements. Wenn der Kunde
fordert, dass in Java implementiert wird, ist das eine Anforderung an die Lösungsdomäne.
Grobentwurf (System Design). Die Architektur des Systems wird festgelegt, d. h. Designziele
werden definiert und das System in kleinere Subsysteme aufgeteilt. Ausserdem wird die Zuordnung
von Software auf Hardware festgelegt.
Feinentwurf (Object Design). Aufgabe dieser Phase ist es die Kluft zwischen dem Grobentwurf und
der Implementierung zu schliessen. Ausserdem werden hier Entscheidung bzgl. dem Einsatz von
Fertigprodukten getroffen. Das Ergebnis ist ein detailliertes Objekt Modell mit präzisen Beschreibungen für alle Elemente.
Implementation. Jetzt wird das Objekt Modell in Code umgesetzt. Unit-Tests sollten hier stattfinden.
Test. Integration- und System Tests.
Operation und Wartung
3.1.11
Nochmal Subsystem, Paket, Komponente?
Bezüglich der genauen Definition von Subsystem, Paket, Komponente und Modul herrscht alles andere
als Einigkeit. UML definiert sie so:
Subsystem: Ein Subsystem ist ein Teil eines Gesamtsystems, das nach aussen durch eine Schnittstelle
definiert ist und die Struktur und die Zusammenarbeit seiner Einzelteile versteckt.
Paket: Ein Paket ist eine lose Ansammlung von Modellelementen, das nicht durch eine Schnittstelle
definiert sein muss und sein Inneres nicht kapseln muss.
Komponente: Ein Komponente ist eine ausführbare und austauschbare Softwareeinheit mit definierter Schnittstelle und eigener Identität.
UML definiert keine Module, aber das dürfte wohl am ehesten den Komponenten entsprechen.
3.2
UML
3.2.1
Wie definiert man Semantik mit der UML?
Mit der OCL können Constraints beschrieben werden.
3.2.2
Wenn man eine Software-Architektur mit UML beschreibt, welche Verbindungsrelationen sind da brauchbar?
So ziemlich alle Arten von Assoziationen inklusive Aggregation und Kompositionen.
3.2.3
Was ist UML?
Die UML ist eine Sprache und Notation zur Spezifikation, Konstruktion, Visualisierung und Dokumentation von Modellen für Softwaresysteme.
30
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
3.3. Ermittlung der Anforderungen (Requirements Elicitation)
3.2.4
Welche Diagrammarten gibt es in der UML?
Use Case Diagramme
Klassendiagramme
Sequenzdiagramme
Aktivitätsdiagramme
Kollaborationsdiagramme
Zustandsdiagramme
Verteilungsdiagramme
3.2.5
Vergleiche Sie UML-Klassendiagramme und ER-Diagramme.
Entitäten haben keine Methoden
Attribute von Entitäten können nur atomar sein
Vererbung wird bei ER durch is-a-Beziehung realisiert
Aggregation wird bei ER durch part-of -Beziehung realisiert
3.2.6
Gibt es bei Klassendiagrammen auch so etwas wie schwache Entitäten?
Schwache Entitäten werden in UML durch Komposition dargestellt. Komposition ist eine strenge Form
der Aggregation. Dargestellt wird sie durch eine Linie mit einer ausgefüllten Raute am Ende.
3.3
Ermittlung der Anforderungen (Requirements Elicitation)
3.3.1
Was sind Use Cases?
Ein Use Case (Anwendungsfall) beschreibt eine Menge von Aktivitäten eines Systems aus der Sicht seiner
Akteure, die für die Akteure zu einem wahrnehmbaren Ergebnis führen. Ein Anwendungsfall wird stets
durch einen Akteur initiiert. Ein Anwendungsfall ist eine komplette, unteilbare Beschreibung.
3.3.2
Was sind nicht-funktionale Anforderungen an die Software?
Nicht-funktionale Anforderungen beschreiben für den Benutzer wahrnehmbare Aspekte des Systems,
die nicht direkt mit dem funktionalen Verhalten des Systems zusammenhängen. Beispiele sind:
Performance
Reaktionszeit
3.4
Analyse
3.4.1
Wie identifiziere ich Use Cases mit Objekten?
Eine Möglichkeit Objekte zu identifizieren ist Natural Language Analysis. Man analysiert die natürlich
sprachliche Beschreibung der Use Cases. Dabei kann man nach der Heuristik von Abbott vorgehen. Sie
schlägt z. B. folgende Identifikationsregel vor
Eigenname → Objekt
Substantiv → Klasse
Verb → Operation
Auxialverb
...
sein → Vererbung
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
31
Kapitel 3. Software Engineering
3.5
Grobentwurf (System Design)
3.5.1
Was ist eine Software-Architektur?
Eine Software-Architektur ist die Aufteilung eines Softwaresystems in seine Subsysteme, deren Schnittstellen, die Prozesse und Abhängigkeiten zwischen ihnen, sowie den benötigten Ressourcen. Es ist
sozusagen ein Blick aus der Vogelperspektive auf das ganze System.
3.5.2
Wie kann man eine Software-Architektur beschreiben?
Eine Software-Architektur lässt sich z. B. mit dem 4+1 View Model von Kruchten beschreiben. Diese
Modell teilt die Beschreibung in 5 Sichten auf:
Logical View : Das Objekt-Modell der Architektur (Grobentwurf).
Development View : Diese Sicht bezieht sich auf die tatsächliche Zerlegung des Systems in einzelne
Softwaremodule, d. h. die konkrete(n) Zielmaschine(n) werden in diese Betrachtung mit aufgenommen.
Process View : Zeigt Nebenläufigkeits- und Synchronisationsaspekte des Systems.
Physical View : Beschreibt die Zuordnung von Software auf die Hardware. Deployment View wäre
vielleicht ein treffenderer Name.
Scenarios: Die Scenarios beziehen sich auf alle Sichten und beschreiben typische Anwendungsfälle
des Systems.
3.5.3
Wie kann man Systeme unterteilen?
In Subsysteme.
3.5.4
Was ist eine ACL?
Eine Access Control List ist mit einem Objekt verknüpft und enthält 2-Tupel (actor, operation) und
ordnet damit jedem Benutzer Zugriffsrechte zu. Bei jedem Zugriff wird überprüft, ob der Benutzer für
die Operation die entsprechenden Rechte hat. Anschaulich entspricht dies der Gästeliste für eine Party.
3.5.5
Was sind Capabilities?
Eine Capability verbindet einen Akteur mit einem 2-Tupel (class, operation). Die Zugriffsinformation
wird hier bei den Akteuren gespeichert. Anschaulich entspricht dies einer Party mit Einladungen.
3.5.6
Welche Phasen hat das System Design?
Teilaufgaben des System Designs sind:
Festlegung der Designziele
Zerlegung in Subsysteme
Zuordnung von Software auf Hardwarekomponenten
Datenmanagement
Zugriffskontrollmechanismen
Kontrollfluss. Welche Folgen von Operationen werden durchlaufen? Ist das System Event-Abhängig?
Boundary Conditions. Start- und Stopp des System, Fehlerbehandlung.
3.5.7
Neben der Trennung von Komponenten gibt es auch Trennung der Schichten, wozu?
Reduzierung der Komplexität und Austauschbarkeit.
32
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
3.6. Feinentwurf (Object Design)
3.6
Feinentwurf (Object Design)
3.6.1
Erklären Sie Specification und Implementation Inheritance.
Wenn Vererbung nur eingesetzt wird um Code mehrfach zu verwenden, so spricht man von Implementation Inheritance. Wenn Vererbung eingesetzt wird, um durch die Klassen-Subklassen-Hierarchie logisch
zu gliedern, spricht man von Specification Inheritance. Implementation Inheritance sollte möglichst
vermieden werden, sie kann in vielen Fällen besser durch Delegation ersetzt werden.
3.7
Testen
3.7.1
Was ist ein Regressionstest?
Bei jeder Änderung werden alle vorhergehenden Tests wiederholt.
3.7.2
Welche Testverfahren gibt es?
Testverfahren lassen sich wie folgt kategorisieren:
Unit Testing. Beim Unit Testing werden einzelne Komponenten des Systems getrennt getestet, man
unterscheidet zwischen
Blackbox Testing. Beim Blackbox Testen testet man Komponenten nur bzgl. ihrer Ein-/Ausgaben.
Die Implementierung der Komponenten wird nicht betrachtet. Vorgehensweisen sind:
Equivalence Testing. Alle möglichen Eingabe werden in Klassen aufgeteilt. Aus jeder Klasse
wird ein Repräsentant ausgewählt mit dem getestet wird. Man geht nun davon aus, dass sich
die Komponenten für alle Mitglieder einer Klasse gleich verhält. Für jede Äquivalenzklasse
sollten zwei Werte ausgewählt werden, eine typische Eingabe und eine ungültige damit das
Fehlerverhalten der Komponente getestet werden kann.
Boundary Testing. Boundary Testing is ein Spezialfall von Equivalence Testing. Hier wählt
man die Repräsentanten immer so, dass sie an der Grenze zwischen zwei Äquivalenzklassen
liegen. Die Idee dabei ist, dass Programmierer Spezialfälle oft stiefmütterlich behandeln.
Whitebox Testing. Beim Whitebox Testen schaut man sozusagen in die Komponenten hinein
und überprüft deren Implementierung. Eine Möglichkeit ist:
Path Testing. Das Path Testing erfordert genaue Kenntnis des Codes der Komponente.
Zuerst muss man einen Flussgraphen für die Komponente erstellen, dieser Graph beinhaltet
Codeblöcke und Entscheidungen. Dieser kann z. B. als UML Aktivitätsdiagramm dargestellt
werden. Jetzt wählt man die Testeingabe so, dass jede Transition des Diagramms mindestens
einmal schalten muss. Dies ist aber natürlich immer noch kein Beweis für die Korrektheit,
deckt aber normalerweise die meisten Fehler auf. Bei objektorientierten Sprachen wird PathTesting durch Polymorphie und die kürze der Methoden erschwert.
State-based Testing. State-based Testing ist eine zustandsorientierte Testmethode speziell für
objektorientierte Systeme.
Integration Testing. Nachdem die Komponenten einzeln getestet wurden, muss das Zusammenspiel
der Komponenten getestet werden. Dabei gibt es wieder verschiedene Ansätze:
Big-bang Testing. Alle Komponenten wurden zuvor getestet und werden jetzt auf einen Schlag
zusammen gesetzt. Der Vorteil ist, dass man keine zusätzlichen Testumgebungen braucht, der
Nachteil das die Fehlersuche sehr aufwendig ist.
Bottom-Up Testing. Bei einem schichtenorientierten System werden zuerst nur die Komponenten
der untersten Schicht zusammengesetzt und getestet, dann die der nächst höheren usw. Auch
hier braucht man keine Testumgebungen.
Top-Down Testing. Beim Top-Down Testen geht man genau anders herum vor. Der Nachteil
ist, dass man Testumgebungen braucht, die die unteren Schichten simulieren. Der Vorteil ist,
dass man mit dem Test des User Interfaces anfängt.
Sandwich Testing. Beim Sandwich Testing geht man gleichzeitig von oben und unten vor.
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
33
Kapitel 3. Software Engineering
System Testing. Mit Unit und Integration Testing sucht man Fehler in einzelnen Komponenten und
im Zusammenspiel der Komponenten. Nach der Integration testet man mit dem System Testing,
ob das System den funktionalen und nicht-funktionalen Anforderungen entspricht.
Functional Testing. Das Functional Testing dient der Überprüfung der funktionalen Anforderungen, die im RAD beschrieben sind. Man hält sich an die beschriebenen Use Cases und geht
ähnlich wie beim Equivalence oder Boundary Testing vor.
Performance Testing. Performance Testing testet das System auf nicht-funktionale Anforderungen, beschrieben in SDD und RAD. Man unterscheidet zwischen:
Stress Testing. Testet ob das System mit auf viele gleichzeitige Anfragen korrekt reagiert.
Volume Testing. Testest ob das System mit grossen Datenmengen zurecht kommt.
Security Testing. Testet die Sicherheit des Systems. Eingesetzt werden Tiger Teams die
Versuchen in das System einzubrechen.
Timing Testing. Test ob die Reaktionszeitanforderungen eingehalten werden.
Recovery Testing. Testet ob sich das System wie gewünscht von Fehlern erholt.
Pilot Testing. Beim Pilot oder Field Testing testen eine ausgewählte Gruppe von Benutzer das
System ohne dass ihnen bestimmte Testscenarios vorgegeben werden. Man unterscheidet:
Alpha Testing. Pilot Test in der Umgebung der Entwicklung.
Beta Testing. Pilot Test in der tatsächlichen Zielumgebung.
Acceptance Testing. Der Kunde testet ob das System den Anforderungen entspricht. Man
unterscheidet:
Benchmark Testing. Der Kunde wählt eine Testmenge mit der System getestet wird. Dies
kann entweder durch echte Benutzer oder spezielle Test Teams erfolgen.
Competitor Testing. Das System wird mit Konkurrenzsystem oder bei Reengineering Projekten mit dem alten System verglichen.
Shadow Testing. Das alte und das neue System laufen parallel und die Resultate werden
verglichen.
Installation Testing. Das System wird in der Zielumgebung installiert und nochmal getestet.
Dabei werden viele Test des Functional und Performance Testings wiederholt. Bestimmte Funktionalität die von anderen System des Kunden abhängig ist, kann erst jetzt wirklich getestet
werden.
3.7.3
Wie viel Aufwand entfällt für das Testen?
Ca. 40%–50%.
3.7.4
Was versteht man unter Black-Box-Testen?
siehe 3.7.2.
3.7.5
Was ist ein Review?
Unter einem Review versteht man die
Man unterscheidet:
händische Analyse des System ohne dieses laufen zu lassen.
Walkthrough. Der Entwickler stellt die API, den Code und die Dokumentation dem Review Team
vor. Das Team analysiert die Abbildung von der Analyse und des Object Design auf Code bzgl.
der Use Cases aus der Analyse Phase und macht entsprechende Vorschläge.
Inspection. Bei der Inspection stellt der Entwickler die API dem Review Team vor, er darf aber
weder Modelle, Code, Dokumentation, o. ä. vorstellen. Das Review Team prüft dann Code, Dokumentation und auch Kommentare im Code. Diese alles geschieht ohne den Entwickler, der nur bei
Unklarheiten herangezogen wird.
Code Reviews sind sehr effektiv, so dass in Experiment bis 60%–85% der Fehler gefunden wurden. Sie
sind aber auch sehr aufwendig.
34
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
3.8. Projektmanagement
3.7.6
Wie geht man bei Verifikation vor?
Verifikation ist der Beweis der Korrektheit eines Programms. Diese ist nur in bestimmten, kleine Fällen
möglich.
3.7.7
Testet man in der Analyse Phase?
Ja. Man kann Prototypen entwickeln und diese Testen.
3.7.8
Wann testet man?
In allen Phasen, aber hauptsächlich während der Implementierung.
3.7.9
Was ist ein Integrationstest?
siehe 3.7.2.
3.8
Projektmanagement
3.8.1
Wie kann man ein Projekt aufteilen?
Man kann ein Projekt in Aktivitäten aufteilen, die wiederum in Tasks aufgeteilt werden. Jeder Task
produziert eine Reihe von Work Products und benötigt eine bestimmte Menge an Ressourcen.
3.8.2
Was versteht man unter Aufwandsschätzung?
Man möchte am Beginn des Projektes den Aufwand den Projektes schätzen. Z. B. in Zeilen von Code
oder Anzahl der benötigten Entwickler.
3.8.3
Wie ist der Einfluss der Projektdauer auf die Kosten?
Bis zu einem gewissen Punkt (z. B. Deadline) ist der Einfluss der Dauer auf die Kosten proportional.
3.8.4
Beschreiben Sie das Cocomo-Modell.
In Abschätzung mit dem Cocomo-Modell läuft in etwa wie folgt ab.
1. Komplexität mit Hilfe des Function-Point-Modells bestimmen. Als Ergebnis erhält die man geschätzte
Anzahl Codezeilen in KLOC.
2. Einteilung des Systems in eine drei Klassen Organic (einfach), semi-detached (mittel) und embedded
(komplex).
3. Entsprechend der Komplexitätsklasse wird nun aufgrund der Anzahl der Codezeilen der Personalaufwand (Personal Effort) in MM (Man-Month) berechnet.
einfach:
mittel:
komplex:
PE = 2.4 · KLOC1.05
PE = 3.0 · KLOC1.12
PE = 3.6 · KLOC1.20
4. Anhand dieses Wertes kann nun die Entwicklungszeit in Monaten bestimmt werden:
einfach:
mittel:
komplex:
TDEV = 2.5 · PE0.38
TDEV = 2.5 · PE0.35
TDEV = 2.5 · PE0.32
5. Um die Anzahl der Entwickler N zu bestimmen:
N=
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
PE
TDEV
35
Kapitel 3. Software Engineering
Zum Beispiel gilt für ein Projekt mittlerer Komplexität mit geschätzten 30000 Zeilen Code.
PE
3.0 · 301.12
=
≈
135 MM
Damit
TDEV
=
≈
2.5 · 1350.35
14 M
Für die Anzahl der Entwickler ergibt sich.
N=
135
≈ 10
14
Man könnte das System also in 14 Monaten mit 10 Programmierern entwickeln.
3.9
Vorgehensmodelle
3.9.1
Was ist das V-Modell?
Das V-Modell ist eine Erweiterung des Wasserfallmodells. Es enthält direkte Verbindungen zwischen
Entwicklungs- und Verifikationsphasen.
36
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
3.9. Vorgehensmodelle
3.9.2
Was ist das Spiralmodell?
Auch die Weiterentwicklung des Wasserfallmodells durch das flexiblere Spiralmodell bietet benannte
und standardisierte Entwicklungsschritte. Diese werden jedoch in einem zyklischen Prozess mehrfach
durchlaufen. Das Spiralmodell trägt der Schwierigkeit Rechnung, Anforderungen vorweg zu ermitteln
und berücksichtigt den Lernprozess bei der Entwicklung. Ziel ist aber nach wie vor ein fertiges Produkt.
Versionen gibt es nur während der Entwicklung. Das wichtigste am Spiralmodell ist, dass es risk-driven
ist.
Festlegen der Ziele,
Lösungsvorschläge,
Nebenbedingungen
und Einschränkungen
Risikoanalye
Erarbeitung und Beurteilung
von Lösungsvorschlägen,
Erkennen und Beseitigen
von Risiken
Risikoanalye
Risikoanalye
fo
w urf
e
alys
ent
rd
ob
An
Entwickulungs- Validierung
plan der Analyse
Validierung
Integrations- und Verfikation
plan des Entwurfs
Acceptance
Test
Planung der
nächsten Phase
Feinentwurf
Gr
er
Anforderungsplan
Prototyp 2 Prototyp 3 Prototyp 4
An
un
gen
Prototyp 1
Code
Integration
& System
Test
Entwicklung und
Validierung des
Produkts der nächsten Stufe
Jede Runde beinhaltet folgende Aktivitäten.
Phase 1
Ziele und Bedingungen festlegen
Lösungen vorschlagen
Phase 2
Risiken erkennen
Risiken beheben
Phase 3
Produkt für nächste Runde entwickeln. . .
und testen
Phase 4
nächste Phase planen
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
37
Kapitel 3. Software Engineering
3.9.3
Gibt es bessere Vorgehensmodelle?
Es gibt die zyklische Modelle die immer neue Generationen der Software entwickeln, ein Beispiel ist
RUP:
Beim Rational Unified Process besteht die Entwicklung aus mehreren Zyklen, am Ende eines jeden
Zyklus wird dem Kunden ein Produkt geliefert. Jeder dieser Zyklen besteht aus vier Phasen, wobei
jede Phase wiederum in 9 Workflows zerlegt ist. Dadurch wird die Entwicklung sozusagen in zwei
Dimension aufgeteilt. Die Phasen:
Inception. Hier werden Use Case entdeckt und beschrieben, Risiken und Ressourcenverbrauch
abgeschätzt.
Elaboration. Die Ideen werden konkretisiert, ein Architekturprototyp aufgestellt und getestet. Dies
ist die wichtigste Phase.
Construction. In diese Phase finden die Entwicklungsprozesse statt.
Transition. In diese Phase fällt die Installation.
3.9.4
Was ist ein Vorgehensmodell und welche kennen Sie?
Vorgehensmodelle dienen zur Benennung und Ordnung von produktbezogenen Tätigkeiten bei der Softwareentwicklung. Beispiele sind:
Wasserfallmodell
V-Modell
Spiralmodell
RUP
Dvorak-Modell
3.9.5
Welche Kritik gibt es am Wasserfallmodell?
Im ürsprünglichen Wasserfallmodell werden die Phasen streng sequentiell durchlaufen. Dies entspricht
nicht der Realität bei einem Softwareprojekt. Das wird schon daran klar, dass der Wissenserwerb nicht
linear abläuft. Eine einzelne Information, auch sehr spät im Entwicklungsprozess, kann alles über den
Haufen werfen . Das Wasserfallmodell ist dokumentgesteuert.
Anforderungsermittlung
Analyse
Grobentwurf
Feinentwurf
Implementierung
Test
Einsatz und
Wartung
3.9.6
38
Vergleichen Sie das Wasserfallmodell mit dem Spiralmodell.
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
3.9. Vorgehensmodelle
Jede Runde des Spiralmodells entspricht einer Phase des Wasserfallmodells. Es ermöglicht es flexibler
auf Änderungen zu reagieren. Der wichtigste Unterschied zwischen den Modell ist, dass das Spiralmodell
risikogesteuert ist.
3.9.7
Steckt in jedem Spiralmodell ein V-Modell?
Ja.
3.9.8
Zeichen Sie ein V-Modell auf.
Client
Acceptance
Test
Anforderungsermittlung
System
Test
Analyse
Integration
Test
Grobentwurf
Unit
Test
Feinentwurf
Implementation
3.9.9
Erklären Sie das Dvorak-Modell.
Das Dvorak-Modell erhöht die Flexibilität in dem es in der Entwicklungsphase beliebige Zwischenschritte
zulässt.
Client
Acceptance
Test
...
...
...
System
Test
...
Integration
Test
Anforderungsermittlung
Analyse
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
Grobentwurf
Feinentwurf
Implementation
Unit
Test
39
Kapitel 4
Objektorientierung
4.1
Allgemeines
4.1.1
Erklären Sie die Merkmale und Konzepte der Objektorientierung.
OO Sprachen
Kapselung von Daten
Instantiierung von Klassen
Vererbung
Polymorphie
OO Systemmodellierung
Analyse und Design mit OO Beschreibungstechniken
Visualisierung einer Abstraktion des Systems
Statische und dynamische Sichten
4.1.2
Was ist Polymorphie?
Polymorphie ist die Eigenschaft einer Variable für Objekte verschiedener Klassen stehen zu können.
4.1.3
Was gibt es für Arten von Polymorphie?
Ad-hoc Polymorphie. Überladen von Operatoren.
Strukturelle Polymorphie. Ein Variable kann für Objekte verschiedener Klassen stehen, wenn sie
eine gemeinsame Oberklasse haben.
Parametrische Polymorphie. Wird zum Beispiel bei parametrischen Klassen verwendet.
4.1.4
Was sind Vorteile der Polymorphie?
Vereinfacht die Programmierung.
4.1.5
Was sind Nachteile der Polymorphie?
Polymorphie muss oft durch dynamisches Binden gelöst werden, das geht auf die Performance. Oft
wird schlechtere Lesbarkeit des Codes als Nachteil angegeben. Das ist Blödsinn. Wenn man statt
Polymorphie haufenweise verschachtelte Instance-Of-Abfragen verwendet, wird der Code sicher nicht
besser lesbar.
4.1.6
Was gibt es für Notationen?
Booch-Notation und UML.
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
41
Kapitel 4. Objektorientierung
4.2
Entwurfsmuster
4.2.1
Was sind Entwurfsmuster?
Softwareentwickler haben bei der Analyse grosser Softwaresysteme festgestellt, dass es für ähnliche Problemstellungen gleiche Konfigurationen von Entwurfskomponenten gefunden wurden, d. h. Klassen oder
Objekte die eine bestimmte Dienstleistung erbringen. Solche Lösungen lassen sich als Muster beschreiben und benennen und bilden damit die Grundlage für Sammlungen zugehöriger Musterbeschreibungen.
4.2.2
Erklären Sie das Decorator-Pattern.
Das Decorator-Pattern erlaubt es die Funktionalität von Objekten zur Laufzeit zu erweitern. Es bietet
oft eine flexible Alternative zur Vererbung.
4.2.3
Erklären Sie das Observer-Pattern.
Mit dem Observer-Pattern kann eine 1:N Beziehung zwischen Objekten realisiert werden, so dass die
N Objekte (Observer) geupdatet werden, wenn das eine Objekt (Subject) seinen Zustand ändert. Dies
wird z. B. bei MVC eingesetzt. Bei Java Swing heissen die Observer Listener.
4.2.4
Erklären Sie das Adapter Pattern.
Eine Adapterklasse kann man eine andere Klasse
Schnittstelle hat.
4.2.5
vorschalten, wenn diese nicht die gewünschte
Erklären Sie das Facade Pattern.
Mit dem Facade Pattern kann man den Zugriff aus ein ganzes Subsystem vereinfachen. Dem Subsystem
wird eine Facade-Klasse hinzugefügt, die die ganze Kommunikation mit anderen Subsystemen abwickelt.
4.2.6
Erklären Sie das Bridge Pattern.
Mit dem Bridge-Pattern kann die Implementierung und die Abstraktion einer Klasse in zwei unterschiedliche Klassenhierarchien aufgeteilt werden. Dadurch können die beiden unabhängig voneinander
geändert werden.
4.2.7
Erklären Sie das Strategy Pattern.
Mit dem Strategy Pattern lassen sich einzelne Algorithmen einer Klasse getrennt austauschen. So kann
man z. B. in eine Klasse die Graphen darstellt verschiedene Layoutalgorithmen einhängen.
4.2.8
Erklären Sie das Visitor Pattern.
Mit dem Visitor-Pattern können Operationen auf Klassen selbst wieder in Klassen gepackt werden.
Dadurch können Operationen für Klassen definiert werden ohne das die Klassen selbst geändert werden
müssen. Das ist speziell bei generierten Klassen interessant. Das Visitor-Pattern wird häufig bei der
semantischen Analysephase im Compilerbau eingesetzt.
4.2.9
Erklären Sie das Command Pattern.
Das Command Pattern ist ein objektorientierter Ersatz für Call-Back-Methode. Es erlaubt einzelne
Operationen dynamisch in Objekte einzuhängen. Das Actionkonzept von Java Swing ist eine Anwendung des Command Patterns.
42
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
Literaturverzeichnis
[Aho et al., 1986]
Aho, Alfred V. et al. Compilers: Principles, Techniques and Tools. AddisonWesley, 1986
[Duden Informatik, 1993]
Duden Informatik. 2. Aufl. Dudenverlag, 1993
[Bauer & Höllerer, 1998]
Bauer, Bernhard; Höllerer Riitta. Übersetzung objektorientierter Programmiersprachen. Springer-Verlag, 1998
[Bruegge & Dutoit, 2000]
Buegge, Bernd; Dutoit, Allen H. Object-Oriented Software Engineering: Conquering Complex and Changing Systems. Prentice Hall, 2000
[Gamma et al., 1994]
Gamma, Erich et al. Desgin Patterns: Elements of Reusable Object-Oriented
Software. Addison-Wesley, 1994
[Oestereich, 2001]
Oestereich, Bernd Die UML-Kurzreferenz für die Praxis. Oldenbourg, 2001
[Kemper & Eickler, 1999]
Kemper, Alfons; Eickler, André Datenbanksystem: Eine Einführung. Oldenbourg, 1999
[Rechenberg & Pomberger, 1999] Rechenberg, Peter; Pomberger, Gustav (hrsg.) Informatik-Handbuch. 2. Aufl.
Hanser, 1999
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
43
Teil II
Technische Informatik
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
45
Kapitel 5
Rechnerarchitektur
5.1
Allgemeines
5.1.1
Erläutern Sie das von-Neumann-Konzept.
Beim von-Neumann-Konzept gelten folgende Prinzipien:
1. Der Computer besteht aus
Speicher
Rechenwerk
Leitwerk
Ein-/Ausgabegeräten.
Heute:
Aufspaltung des Speichers in Speicherhierarchie
Leitwerk und Rechenwerk formen Zentraleinheit
gelegentliche mehrere Rechenwerke im Zentralprozessor
Ein-/Ausgabegeräte über Gerätesteuerungen indirekt angeschlossen
Verbindungsnetz ist kritischer Teil
2. Die Struktur des Rechners ist unabhängig vom bearbeiteten Problem.
Heute: gilt immer noch.
3. Programm und Daten stehen im selben Speicher und können beide durch die Maschine verändert
werden.
Heute: Manchmal liegt das Programm in einem Festspeicher, z. B. bei Taschenrechnern, aber in Normalfall wie von-Neumann, aber getrennt in unveränderliche Teile (pure segments) und veränderliche
Teile (impure segments). Die Möglichkeiten der Veränderung des Programms wurde durch Sprünge
und Adressmodifikation abgelöst. Das ist sicherer und erlaubt Programme als pure segments.
4. Der Speicher ist Zellen gleicher Grösse geteilt, die durch fortlaufende Nummern bezeichnet sind.
Heute: Gilt noch immer, aber die untypisierten, unstrukturierten Zellen sind Hauptangriffspunkt
von von-Neumann-Kritikern.
5. Das Programm besteht aus einer Folge von Befehlen, die sequentielle Aufträge beschreiben und in
der Aufzeichnungsreihenfolge auszuführen sind. Die Befehle enthalten i. A. nicht die Werte, mit
denen gerechnet werden soll, sondern die Adresse der Zellen, wo die Werte liegen.
Heute: Heutige Prozessoren bemühen sich mit allen möglichen Tricks (Pipelining, look-aheadMechanismen, mehrere Rechenwerke) die Sequentialität zu umgehen. Trotzdem muss das Ergebnis
dem der sequentiellen Verarbeitung entsprechen.
6. Von der Folge kann durch Sprungbefehle abgewichen werden. Die Ausführung eines Sprungs kann
von errechneten Werten abhängig gemacht werden. Heute: praktisch unverändert.
7. Die Maschine benutzt Binärcodes, Zahlen werden dual dargestellt. Heute: praktisch unverändert.
Abbildung zeigt original von-Neumann-Modell:
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
47
Kapitel 5. Rechnerarchitektur
Befehle (Programme)
Hauptspeicher
Rechenwerk
Daten
Programm
Daten
Leitwerk
BZ
IR
SR
AC
Adressen
Daten
E/A-Werk
5.1.2
Welche von-Neumann-Einheiten kommunizieren heutzutage miteinander und wie?
Der Prozessor ist über den Prozessor-Speicher-Bus mit dem Hauptspeicher verbunden. Auch mit den
Peripheriegeräten kommuniziert er über Busse. Die Abbildung zeigt eine typische Bushierarchie.
Prozessor
Secondary
Cache
Hauptspeicher
E/ASteuerung
für langsame
Geräte, z.B.
Bänder
Peripheriebus
Prozessor-Speicher-Bus
Bussteuerung
Busbrücke
für schnelle
Geräte, z.B.
LAN
E/ASchnittstelle
Systembus
5.1.3
Wie erweitern heutige Architekturen das von-Neumann-Konzept?
Adressmodifikation: die Programmadresse wird zuerst in eine Prozessadresse und dann in eine
Maschinenadresse umgesetzt.
Gleichzeitige Bearbeitung in mehreren weitgehend unabhängigen Werken: Zentralprozessoren, Rechenwerke, Kanäle, Peripheriegeräte,. . .
Automatisch verwaltete Speicherhierarchie.
Steuerung nicht durch ein Programm sondern eine Hierarchie von Steuervorgängen.
Programmunterbrechung durch interne und externe Signale.
5.1.4
Was für Klassifikationssyteme kennen Sie?
1. Klassifikationssystem von Flynn, klassifiziert nach:
SI vs MI : ein oder mehrere (durch die Rechnerhardware) gleichzeitige Progamminterpretationen
SD vs MD: ein oder mehrere (durch die Rechnerhardware) gleichzeitige Operationen auf Daten
Dadurch ergeben sich Kombinationen wie SISD (Standard), SIMD (Vektor-/Feldrechner), MIMD
(Multiprozessoren)
48
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
5.1. Allgemeines
2. Erlangen Classification System (ECS): Rechner werden durch Tripel von Paaren beschrieben
(k ∗ k 0 , d∗ d0 , w∗ w0 ).
Kollateralität der Programminterpretation:
k Zahl der Leitwerke bzw. Prozessoren
k 0 Zahl der (hardwareunterstützt) im Pipelining zusammen wirkenden Programminterpretationen
Kollateralität der Befehlsausführungen je Programminterpretation:
d Zahl der gleichen Rechenwerke je CPU
d0 Zahl der verschiedenen Rechenwerke je CPU
Kollateralität in Ausführung eines Befehls
w Operandenwortlänge
w0 Zahl der Pipelinestufen
Beispiele:
Intel 8085
Multirechner aus 128 Intel 80386
Cray.1 Vektorrechner
5.1.5
(1∗ 1, 1∗ 1, 8∗ 1)
(128∗ 1, 1∗ 1, 32∗ 1)
(1∗ 1, 1∗ 12, 64∗ 14)
Was ist SPEC?
Die Standard Performance Evaluation Corporation (SPEC) unterhält als Dachorganisation diverse Unterabteilungen, die sich mit Grafik (GPC) oder High Performance Computing (HPC) beschäftigen und
nicht zuletzt gibt es die Open System Group OSG, die für Komponenten und Systeme im Workstationund Multiuser-Serverbetrieb zuständig ist. Diese OSG hat diverse Benchmarks entwickelt beziehungsweise zusammengestellt, zum Beispiel für Web-Server (SPEC WEB99), Mail-Server (SPEC MAIL2001),
Java Virtual Maschines (SPEC JVM98), Java Business (SPEC JBB2000) – aber am bekanntesten ist
ihre CPU-Benchmark-Suite SPEC CPU2000.
Aber nicht nur in der multikulturellen Zusammensetzung des Benchmark-Komitees, sondern auch in
vielen anderen Punkten unterscheidet sich der CPU2000-Benchmark der SPEC von normalen Benchmarks. Insbesondere liegt die Suite als Source (C, C++, Fortran) vor, sodass man weiß, was der Benchmark so treibt und es der Tester durch die Wahl der Compiler und Optimierungsflags in der Hand hat,
ob der Benchmark mehr altbacken arbeiten oder das Potenzial der modernen Prozessoren mit all
ihren neuen Funktionseinheiten voll ausschöpfen soll.
Die Suite besteht aus zwei Teilen, dem Gleitkommabereich (SPECfp), der eine Fülle wissenschaftlicher Software umfasst und überwiegend in Fortran kodiert ist, und dem Integer-dominierten Bereich
(SPECint), kodiert in C/C++. SPECint enthält auch viele typische Desktop-Aufgaben, etwa Komprimierung (gzip und bzip2), Kompilation mit gcc, auch ein Schachspiel (crafty) oder Sprachanalyse
(parser). SPECint spiegelt damit wesentlich mehr die normale Desktop-Anforderung wider und eignet
sich daher eher für ein Speed rating von Desktop-Prozessoren. Das gleiche gilt für Server, für die
Gleitkommaleistung eher nebensächlich ist. Auch hier zählt vor allem der SPECint-Wert.
Zwei verschiedene Messverfahren erlaubt die SPEC in ihren restriktiven Runrules. Bei Base muss
jede der beiden Einzelsuites mit einem Compiler und einem gemeinsamen Satz von höchstens vier
Optimierungsflags verwendet werden, bei Peak darf man für jedes einzelne der insgesamt 26 Programme
unterschiedliche Compiler mit beliebigen Flags mischen.
Diese Zusammenfassung stammt aus der c’t 21/01.
Für jeden der einzelnen Test, 12 bei SPECint und 14 bei SPECfp, wird der sog. SPEC-Ratio berechnet.
Der SPEC-Ratio ist der Kehrwert der Laufzeit geteilt durch den Kehrwert einer Referenzlaufzeit. Aus
den SPEC-Ratio-Werte wird dann mit dem geometrischen Mittel ein Mittelwert bestimmt, der SPECMark.
5.1.6
Kennen Sie noch andere Rechner ausser Workstations?
Taschenrechner
PDAs
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
49
Kapitel 5. Rechnerarchitektur
Spielkonsolen
PCs und Laptops
Servers
Mainframes
Supercomputer
5.1.7
Welche Bedeutung haben Angaben wie SPEC-Werte, MIPS oder MFLOPS?
MIPS (Million Instructions per Second ) und FLOPS (Million Floating Point Operations per Second )
sind Durchsatzkenngrössen. SPEC-Werte sind die Ergebnisse der standardisierten SPEC-Benchmarks.
MIPS- und FLOPS-Werte werden häufig falsch interpretiert. Vergleiche zwischen Rechnern aufgrund
dieser Werte sind irreführend, wenn diese unterschiedliche Befehlssätze oder Hardwareunterstützung für
Gleitpunktoperationen haben. Eine RISC-System hat meist einen höheren MIPS-Wert als ein CISCWert, das sagt aber noch überhaupt nichts aus, da die Mächtigkeit der Befehle sehr unterschiedlich ist.
Ein weiteres Problem ist, dass die Werte insofern keine verlässlichen Aussagen machen, da sich moderne
Prozessoren sich in wirklichen Einsatz die meiste Zeit mit Pipelinekonflikten und dem Warten auf den
Speicher beschäftigen und nicht mit Gleitpunktberechnungen.
SPEC-Werte haben einen eine deutlich höhere Aussagekraft, da durch Standardisierung und Mittelung
das erste Problem beseitigt ist. Rechensysteme lassen sich damit tatsächlich vergleichen. Aber nur bzgl.
ihrer SPEC-Werte. Der SPEC-Benchmark ist synthetisch und es ist nicht gesagt, dass die erzielten
Werten etwas über die Leistungsfähigkeit eines Systems bei seiner realen Aufgabe aussagen.
5.1.8
Was kann man bei Rechnern bewerten und was für Methoden gibt es dafür?
Die bei Rechnern zu bewertenden Kenngrössen lassen sich in drei Bereich aufteilen.
Zeit. Die Verweilzeit ist die Zeit, die ein Auftrag insgesamt im System verbringt. Die Verweilzeit
setzt sich zusammen aus Wartezeit und Bedienzeit. Die Verweilzeit wird auch als Verzögerung,
Antwortzeit oder Latenz bezeichnet. Die Zeiten sind meist stochastische Grössen, im Allgemeinen
interessiert aber nur der Erwartungswert. Beispiele sind: Befehlsausführungszeit (CPI), Speicherzugriffszeit, Laufzeit eines Programmes, Verzögerung einer Nachricht in einem Netz.
Durchsatz. Der Durchsatz ist definiert als die Anzahl der pro Zeiteinheiten bedienten Aufträge.
Der maximale Durchsatz heisst Grenzdurchsatz. In den meisten Fällen sind die Antwortzeiten für
System, die in der Nähe des Grenzdurchsatzes operieren, sehr hoch. Deshalb interessiert meist der
maximal erzielbare Durchsatz, so dass eine obere Schranke für die Verweilzeit nicht überschritten
wird. Das nennt man Usable Capacity. Die Verlustrate ist die Anzahl von Aufträgen, die pro
Zeiteinheit verloren geht. Beispiele sind: MIPS und FLOPS eines Prozessors, Bit/s auf einem Bus
oder Netz, ausgeführte Jobs pro Stunde, Zellverlustrate bei ATM.
Auslastung. Unter der Auslastung eines System versteht man das Verhältnis von tatsächlich erreichtem Durchsatz zum Grenzdurchsatz, dies wird manchmal auch als Effizienz bezeichnet. Bei
einem zusammengesetzten System, stellt das System mit der höchsten Auslastung den Bottleneck
dar.
Zur Bewertung der obigen Kenngrössen bietet es sich an das System als einfaches Warteschlangensystem
zu modellieren. Deshalb gilt auch der Satz von Little:
U = λ · Tr
wobei U die mittlere Anzahl der Aufträge im System, λ die Ankunftsrate und Tr die mittlere Verweilzeit
bezeichnet.
Zur Bestimmung dieser Kenngrössen gibt es verschiedene Verfahren, die sich in drei Gruppen gliedern
lassen.
Analytische Modelle und Verfahren. In analytischen Modellen wird das zu bewertenden System
in Form von Gleichung beschrieben. Verwendet werden einfache Formeln, Warteschlangenmodelle,
Petri-Netze. Speziell bei den Warteschlangenmodellen stehen mächtige Methoden zur Bewertung
zu Verfügung. Generell gilt aber, dass der Entwurf von analytischen Modellen mit zunehmender
Komplexität der Systeme immer schwieriger bis praktisch unmöglich wird.
50
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
5.1. Allgemeines
Simulation. Bei der Simulation werden Struktur und Verhalten des Systems in einem geeigneten
Abstraktionsgrad mit in einem ausführbaren Rechnermodell nachgebildet. Man unterscheidet zwischen stochastischer und deterministischer Simulation. Bei der stochastischen Simulation werden
die Modelle mit zufälligen Daten gefüttert. Bei der deterministischen Simulation verwendet man
Daten die aus Experimenten mit realen System gewonnen wurden.
Messung. Eine weitere Methode ist, Messungen an existierenden System durchzuführen. Man unterscheidet zwischen Monitoring und Benchmarking. Monitoring dient dazu interessante Ereignisse,
Operationen und Zustände von Systemen aufzuzeichnen. Ziel ist es das Verhalten des Systems zu
verstehen und Engpässe zu identifizieren. Ausserdem können Werte gewonnen werden, die bei den
deterministischen Simulationen eingesetzt werden. Benchmarking wird in 5.1.9 genauer beschrieben.
Validierung. Wichtig ist eine fundierte Validierung der Modelle.
5.1.9
Was ist Benchmarking?
Benchmarks sind standardisierte Messprogramme zur Ermittlung der Rechnerleistung. Es wird nicht
nur die Leistung der Hardware, sondern des Gesamtsystems gemessen. D. h. Compiler und Betriebssystem werden mit bewertet. Es gibt Benchmarks die im Quellcode vorliegen und sog. Paper-and-Pencil Benchmarks. Bei diesen ist nur die Aufgabe spezifiziert, die Lösung muss selbst implementiert werden.
Man unterscheidet zwischen synthetischen und natürlichen Benchmarks.
Synthetische Benchmarks. Man benutzt Bausteine, die jeweils eine gewünschte Teilbelastung erzeugen und im Hinblick auf die Gesamtleistung zu einem Benchmark komponiert werden. Beispiele
sind Whetstone und SPEC (siehe 5.1.5).
Natürliche Benchmarks. Bei natürlichen Benchmarks benutzt man als repräsentativ angesehene
echte Programme zur Leistungsmessung. Beispiele sind Benchmarks die z. B. PCs mit Windows
und typischen Office-Anwendungen testen.
5.1.10
Definieren Sie die Begriffe Zuverlässigkeit und Verfügbarkeit.
Unter der Zuverlässigkeit R(t) versteht man die Wahrscheinlichkeit eine Systems das Zeitintervall [0, t]
zu überleben, unter der Voraussetzung, dass es zum Zeitpunkt t = 0 funktionsfähig war. Da das System
zu Beginn des Zeitintervalls funktionsfähig ist, gilt R(0) = 1. Ausserdem geht man davon aus, dass das
System irgendwann ausfällt.
lim R(t) = 0
t→∞
Die Ausfallrate wird mit λ(t) bezeichnet:
λ(t) = −
dR(t)
/R(t)
dt
Wenn man von einer konstanten Ausfallrate ausgeht, so gilt für die Zuverlässigkeit:
R(t) = e−λt
Die mittlere Zeit bis zu einem Fehler (MTF) berechnet sich dann so:
Z ∞
1
MTF =
R(t) dt =
λ
t=0
Die Annahme, dass λ konstant ist, gilt für technische Systeme im Normalbereich, d. h. Frühausfälle hat
es bereits hinter sich gelassen und Spätausfälle noch nicht erreicht.
Bei der Zuverlässigkeit unterscheidet man nur zwischen den Zuständen läuft (1) und läuft nicht (0).
Bei reparierbaren System interessiert weiterhin der Begriff der Verfügbarkeit. Die Verfügbarkeit A(t)
ist Wahrscheinlichkeit, dass das System zu einem Zeitpunkt t in einem funktionierenden Zustand angetroffen wird. Die stationäre Verfügbarkeit
A = lim A(t)
t→∞
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
51
Kapitel 5. Rechnerarchitektur
gibt den zu erwartenden Bruchteil der Zeit an, den das System zur Verfügung steht. Zum Reparieren des System braucht man eine durchschnittliche Zeit MTR, den Kehrwert davon bezeichnet man
als Reparaturrate und nennt ihn µ. Wenn ein System eine konstante Ausfallrate und eine konstante
Reparaturrate hat, dann gilt für die Verfügbarkeit:
A=
MTF
µ
=
λ+µ
MTR + MTF
5.2
Zentralprozessoren
5.2.1
Wie sieht der Maschinenbefehlszyklus aus?
1. Befehlsholphase (BH ). Nächsten Befehl ins Instruktionsregister laden.
2. Decodierungsphase (DE ). Interpretation des Maschinenbefehls.
3. Operandenholphase (OP ). Den ALUs die Operanden zur Verfügung stellen.
4. Ausführungsphase (AU ). Befehl ausführen.
5. Rückschreibephase (RS ). Ergebnis in Register oder Speicher ablegen.
6. Adressierungsphase (AD). Befehlszähler fort schalten, evtl. Springen.
Der klassische Maschinenbefehlszyklus von RISC-Maschinen sieht so aus:
1. Instruction Fetch. Nächsten Befehl holen und Befehlszähler fort schalten.
2. Instruction decode/register fetch. Befehl dekodieren und Register lesen. Bei Verzweigungsbefehle
kann bereits in dieser Phase das eventuelle Sprungziel bestimmt werden.
3. Execution/effective address. In Abhängigkeit vom Befehl führt die ALU eine der drei Funktionen
aus.
Memory reference. Die ALU berechnet Prozessadresse mit Basisregister und Offset.
Register-Register ALU Instruction. Die ALU führt die entsprechende Berechnung durch, verwendet werden die aus den Register geladenen Wert.
Register-Immediate ALU Instruction. Die ALU führt die entsprechende Berechnung durch.
4. Memory Access. Falls es sich um einen Load/Store-Befehle handelt, wird hier der Speicher geschrieben, bzw. gelesen.
5. Write Back. Ergebnisse der Berechnung oder des Loads werden in die Register zurückgeschrieben.
5.2.2
Was ist der Unterschied zwischen RISC und CISC?
CISC-Architekturen haben folgende Eigenschaften:
Umfangreiche Befehlssätze mit einigen hundert Befehle, die Teilweise komplizierte Aufgaben lösen
viele Adressierungsarten mit Register-, Speicher- und Keller-Zugriffsarten und Adressrechnung in
Maschinenbefehlen
Familienkonzept bei aufwärtskompatiblen Prozessoren mit grossen Leistungsunterschieden
Nutzung von Mikroprogrammierung für das Leitwerk
Trennung von Befehlssatz, Implementierung und Realisierung
Befehlssätze sind möglichst speichersparend entworfen, hauptsächlich durch uneinheitliches Befehlsformat
Im Gegensatz dazu zeichnen sich RISC-Architekturen durch folgende Eigenschaften aus.
elementare, kleine Befehlssätze, deren Operandenhol- und Ausführungsphase in je einem Takt
durchführbar ist
Verzicht auf Adressierungsarten und Adressrechnung in der Operandenholphase
Operanden ausschliesslich in Registern (Load-Store-Architektur ) und grosse, universelle Registersätze
52
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
5.2. Zentralprozessoren
Nutzung von Pipelining
fest verdrahtete Leitwerke (= keine Mikroprogrammierung)
einheitliches Befehlsformat
Kooperation von optimierenden Compiler und der Prozessorarchitektur zur Leistungssteigerung
5.2.3
Welche Arten von Interrupts gibt es?
Interrupts lassen sich nach vielen Kriterien klassifizieren, z. B. Software vs. Hardware, Maskable vs
Non-Maskable, Precise vs Imprecise.
5.2.4
Wer kann welche Interrupts auslösen?
Kommt auf den Interrupt an.
Arithmetische Interrupts werden vom Rechenwerk ausgelöst
Seitenfehler von der MMU
Hardwareinterrupts z. B. von der Tastatur
...
5.2.5
Was ist Pipelining?
Idee beim Pipelining ist es die Befehle wie am Fliessband abzuarbeiten. Parallelismus in der
Ausführung und damit Leistungssteigerung entsteht beim Pipelining dadurch, dass das erste Teilwerk
nach Bearbeitung des i-ten Befehls bereits mit dem Befehl i + 1 fortfahren kann. Bedingung ist, dass
für alle Phasen des Maschinenzyklusses ein eigenes Werk zur Verfügung steht.
Die Abbildung zeigt eine 6-Stufige Pipeline.
Befehl 1
2
3
4
BH DE OP AU
BH DE OP
BH DE
BH
RS
AU
OP
DE
AD
RS AD
AU RS AD
OP AU RS AD
t
Eine Pipeline kann nur effektiv Arbeiten wenn die einzelnen Phasen des Maschinenzyklus in etwa gleich
lang dauern. Bei modernen Prozessoren unterscheiden sich die Befehle speziell in der Ausführungsphase
oft recht stark, deshalb werden die einzelnen Phasen des Befehlszyklus hier nochmal in mehrere Phasen
zerlegt.
Um jede Phase des Befehlszyklus’ möglichst in einem Takt auszuführen, werden verschiedene Techniken
in den unterschiedlichen Phasen eingesetzt:
1. Befehlsholphase. Die Befehlsholphase kann durch den Einsatz von Caches und weiteren Befehlspuffer
die logisch zwischen Cache und dem Instruktionsregister liegen, beschleunigt werden.
2. Decodierungsphase. Die Beschleunigung der Decodierphase erfolgt hauptsächlich durch Vereinheitlichung und Vereinfachung des Befehlssatzes. Wesentliche Voraussetzung für das einheitliche
Befehlsformat ist die ausschliessliche Verwendung von Registeroperanden. Dadurch müssen bei der
Dekodierung keine aufwendigen Adressberechnungen vorgenommen werden.
3. Operandenholphase. Bei RISC-Architekuren ist die Operandenholphase sehr einfach, da nur Register als Operanden verwendet werden. Weiter Vereinfachung ergibt sich dadurch, dass keine Statusregister verwendet werden. Auch die Verwendung des Dreiadressprinzips hilft, da das überschreiben
von Operanden entfällt. Durch diese und andere Eigenschaften von RISC-Architekturen wird die
Operandenholphase so einfach, dass sie zusammen mit der Decodierphase ausgeführt werden kann.
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
53
Kapitel 5. Rechnerarchitektur
4. Ausführungsphase. Zu Beginn der 80er ging man davon aus, dass nur solche Befehle verwendet werden sollten, die in einem Takt auszuführen waren. Aus Leistungsgründen sind aktuelle Prozessoren
von diesem strengen RISC-Prinzip abgewichen. Die Rechenwerke moderner Prozessoren haben
meist mehrer ALUs für bestimmte Anwendungen. Die verschiedenen ALUs dürfen, gesteuert durch
das Leitwerk, mehrer Befehle gleichzeitig ausführen. Man spricht von superskalaren Rechenwerken.
Das Leitwerk muss dafür sorgen, dass die Programmsemantik erhalten bleibt.
5. Rückschreibephase. Auch die Rückschreibephase wird durch das Load/Store-Prinzip beschleunigt.
Es müssen lediglich die von der ALU kommenden Daten in die Register zurückgeschrieben werden.
Bei Store-Befehlen kann es passieren, dass auf den Speicher gewartet werden muss, dies kann durch
den Einsatz von Caches beschleunigt werden. Zusätzlichen können noch Schreibpapier verwendet
werden.
6. Adressierungsphase. In der Adressierungsphase müssen die Befehlszähler für die in den verschiedenen Pipelinestufen steckenden Befehle hochgezählt oder bei Sprungbefehlen entsprechend angepasst
werden.
5.2.6
Was bringt Pipelining?
Pipelining bewirkt eine dramatische Performanceverbesserung. Rein theoretisch gilt:
Zeit pro Befehl mit Pipelining =
Zeit pro Befehl ohne Pipelining
Anzahl der Pipelinestufen
Dies würde gelten, wenn die Stufen perfekt balanciert währen, alle Befehl von einander unabhängig
währen und es keine Sprünge gebe.
5.2.7
Wo wird Pipelining angewendet?
In allen modernen Prozessoren.
5.2.8
Was ist RISC?
siehe 5.2.2.
5.2.9
Warum arbeiten aktuelle Intel-Prozessoren intern wie RISC stellen aber nach aussen CISC-Befehle zur
Verfügung?
Für vernünftige Nutzung des Pipelining-Konzept eignen sich nur RISC-Befehle. Um die Kompatibilität
zu gewährleisten werden die nach aussen durch CISC-Befehle versteckt.
5.2.10
Was ist MMX?
MMX ist die Intel Multimedia Extension. Das sind zusätzliche Prozessorbefehle die der schnelle Verarbeitung von Multimediadaten dienen. Es handelt sich dabei um SIMD-Befehle, wobei ein Befehl einen
ganzen Satz von Daten verändern kann. Für MMX wurden keine neuen Register eingeführt, es werden
64 Bit der 80 Bit FPU-Register verwendet. Daher keine gleichzeitigen FP- und Multimediaberechnungen. Für den MMX-Nachfolger ISSE wurden neue 128 Bit Register eingeführt.
5.2.11
Welche Prozessorarchitekturen kennen Sie?
Vorsicht: Die folgenden Daten stammen aus vielen unterschiedlichen Quelle, die sich in einigen Punkten
auch klar widersprechen, sind also mit grosser Vorsicht zu behandeln.
54
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
5.2. Zentralprozessoren
Hersteller
Architektur
# Befehle
# Pipelines
# Pipelinestufen
1st level cache [kb]
2nd level cache [kb]
# Register
Registerlänge [Bit]
max Taktfrequenz [MHz]
# Transistoren
max SPECint2000
max SPECfp2000
5.2.12
MIPS 10k
Alpha 21164
Pentium II
Itanium
SGI
RISC
183
4?
5?
32D / 32I
?
?
?
250
6,8M
?
?
Compaq
RISC
≈ 200
4
7 / 10
8D / 8I
96
?
64
600
9,3M
928 (21264-C)
1482 (21364)
Intel
CISC
≈ 390
1
14
8D / 8I
offchip
8
32
2000
7,5M
1130 (Pentium 4)
1103 (Pentium 4)
Intel & HP
EPIC (RISC/CISC)
?
?
10
16D / 16I
96
> 256
64
1000
25M (ohne Cache)
674 (Itanium 2)
1431 (Itanium 2)
Wie viele Pipelinestufen haben moderne Prozessoren?
Die Intel P6 Architektur hat 14 Stufen.
5.2.13
Welche Probleme können beim Pipelining auftreten?
Die Probleme, die beim Pipelining auftreten können, nennt man Fliessbandhemmnisse, sie lassen sich
in drei Gruppen aufteilen.
Modifikation des Fliessbands durch explizite Ablaufbefehle. Sprungbefehle, Prozeduraufrufe, o. Ä.
stellen Fliessbandhemmnisse dar, da von der sequentielle Befehlsfolge abgewichen wird. Das für
die Befehlsholphase zuständige Teilwerk kann nicht einfach den nächsten Befehl holen, sondern
muss an eine bestimmte Stelle springen. Dies kann bei bedingten Sprüngen auch noch von einer
Berechnung abhängig sein. Die übliche Arbeitsweise des Teilwerks muss daher unterbunden werden.
Es können keinen neuen Befehle mehr in die Pipeline nachgefüllt werden, bis der neue Befehlszähler
zur Verfügung steht. Es gibt mehrere Techniken zur Optimierung.
Sprungzielspeicher. Der Sprungzielspeicher ist ein Puffer der die zuletzt angesprungenen Sprungziele speichert. Die Idee ist, dass ein einmal angesprungenes Ziel sehr wahrscheinlich nochmal
angesprungen wird, zum Beispiel bei Schleifen.
Verzögerter Sprung. Bei dieser Technik wird der auf den Verzweigungsbefehl folgende Befehl
vor der Verzweigung ausgeführt. Damit gibt man dem Leitwerk einen zusätzlichen Takt Zeit
auf den Sprungzielspeicher oder andere Quelle zuzugreifen. Verzweigungsbefehle die so vorgehen
heissen Delay Slot Befehle.
Spekulative Ausführung. Bei der spekulative Ausführung werden die Befehle auf einem der
beide Pfade der Verzweigung spekulativ ausgeführt. Die erzielten Ergebnisse werden dabei in
Schattenregistern gehalten und Notfalls wieder gelöscht.
Bedingte Ausführung. Die bedingte Ausführung kann bei Unterscheidungen, die sich nur in einem
Maschinenbefehl niederschlagen, angewandt werden. Der Befehl wird nur ausgeführt, wenn die
Bedingung war ist, sonst wird er übersprungen. Hierdurch realisiert man Fallunterscheidungen
ohne Verzweigungen.
Verzögerung in einzelnen Phasen des Fliessbands. Speicherzugriffe können durch Caches und
zusätzliche Puffer beschleunigt werden.
Datenabhängigkeiten. Fliessbandhemmnisse durch Datenabhängigkeiten können auftreten, wenn
der Befehl i + 1 Werte benötigt, die der Befehl i Berechnet. Es kann nur vorkommen, dass der
Befehl i seine Rückschreibephase noch nicht abgeschlossen hat und die Daten damit noch nicht
verfügbar sind. Dieses Probleme kann durch Bypasses gelöst werden. Die Ergebnisse, die die
ALU für den Befehl i berechnet hatte werden über Abkürzungen sofort zur Berechnung des
nächsten Befehls verwendet. Diese Bypasses reduzieren die Abkürzungen erheblich führen aber zu
sehr komplizierten Datenpfaden.
Generell gilt bei allen Problemen, dass die Compiler sehr viel zur Optimierung beitragen können (oder
müssen). So können sie z. B. durch geschickte Optimierung der Befehlsreihenfolge Datenabhängigkeit
vermeiden.
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
55
Kapitel 5. Rechnerarchitektur
5.2.14
Wie verhält sich eine Pipeline bei einer Unterbrechung?
Wenn eine Unterbrechung auftritt, führt eine moderne Pipeline folgende Schritt durch.
1. Ein Trap-Befehl wird bei der nächsten Befehlsholphase in die Pipeline eingeführt.
2. Für den Befehl, der die Unterbrechung ausgelöst hat und für alle darauf folgenden Befehle, wird
Schreibzugriff generell abgeschaltet. Dies gilt nicht für Befehle, die vor dem Unterbrechung auslösenden
Befehl liegen.
3. Nach die dem Unterbrechungbehandlungsroutine abgelaufen ist, wird der Befehlszähler wieder auf
den unterbrechende Befehl gesetzt.
Wenn dieses Vorgehen bei einer Pipeline möglich ist, so spricht man von einer Pipeline mit Precise
Interrupts. Für aufwendige Fliesspunktbefehle ist es schwer dieses Verhalten sicher zustellen. Deshalb
haben moderne Prozessoren zwei Pipelines (oder zwei Betriebsmodi), die eine ist schnell, hat dafür keine
Precise Interrupts, die andere ist langsamer und hat Precise Interrupts. Precise Interrupts sind in der
Integerpipeline relativ einfach zu realisieren und werden dort auch realisiert, weil die Integerpipeline
zur Implementierung von Virtual Memory nötig ist.
5.2.15
Warum verwendet man bei modernen Rechner mehrere Pipelines?
siehe 5.2.16 und 5.2.14.
5.2.16
Warum geht es spezielle Pipelines für Festpunkt- und Fliesspunktarithmetik?
Wichtig für das Pipelining-Konzept ist, dass die Befehle in etwa gleiche Zeit in den einzelnen Pipelinestufen verbringen. Da Fliesspunktoperation in der Regel deutlich mehr Zeit als Festpunktoperationen
benötigen, ergeben sich Probleme bei der Mischung von beiden Befehlen. Eine Möglichkeit ist, sie auf
verschiedene Pipelines aufzuteilen. Die Synchronisation zwischen mehreren Pipelines kostest natürlich.
Ein anderer Grund sind die Unterbrechungen, siehe 5.2.14.
5.2.17
Wie lang dauert ein RISC-Befehl in etwa?
Ursprünglich war es so gedacht, dass ein RISC-Befehl in der Ausführungsphase einen Takt benötigt.
Angenommen er braucht in allen Phasen des Maschinenzyklus” einen Takt, so benötigt er bei streng
sequentieller Ausführung 5 Takte. Wenn Pipelining perfekt wäre würde er bei einer 5-stufigen Pipeline
im Durchschnitt 1 Takt benötigen. Mit geschätztem Overhead sagt man, dass eine Operation ca. 1,2
Takte benötigt.
5.2.18
Was sind Delay-Slot-Befehle?
siehe 5.2.13.
5.2.19
Was ist ein Sprungziel-Keller?
siehe 5.2.13.
5.2.20
Welche Adressierungsarten gibt es?
Es gibt virtuelle und physische Adressierung, für die Umsetzung ist die MMU zuständig.
5.2.21
Kennen Sie Beispiele für unkonventionelle Rechner?
Feldrechner: ein gewöhnlicher Programmspeicher, ein gewöhnliches Leitwerk, aber k Rechenwerke
in regulärer Anordnung.
Vektorrechner: ein gewöhnlicher Programmspeicher, ein gewöhnliches Leitwerk, ein m-stufiges Rechenwerk nach Pipelineprinzip, in dem m Komponenten von Vektoren in verschiedenen Phasen der
gleichen Operation sind.
assoziativer Rechner: ein gewöhnlicher Programmspeicher, ein gewöhnliches Leitwerk, alle Daten
und Befehle in p Zellen eines assoziativen Speichers, d. h. Auswahl der Zellen nur durch inhaltliche
Kriterien, nicht durch Adressen
56
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
5.3. Hauptspeicher und Verkehrswege
5.3
Hauptspeicher und Verkehrswege
5.3.1
Page Faults werden woran erkannt und von wem behandelt?
Seitenfehler werden von der MMU erkannt, diese löst bei einem Seitenfehler eine Unterbrechung aus, die
von einer Unterbrechungsroutine des Betriebssystems behandelt wird. Seiten-Ein- und Auslagerungsstrategien stecken in dieser Routine.
5.3.2
5.3.3
Speicherhierarchie mit Zugriffszeiten aufzählen.
Speicher
Zugriffszeit
(Prozessortakt 2.5 ns)
Kapazität
Register
Primär-Cache
Sekundär-Cache
Hauptspeicher
Plattenspeicher
Archivspeicher
< 2.5 ns
2.5 - 10 ns
5 - 50 ns
50 - 500 ns
5 - 15 ms
> 50 ms
256 - 1024 Bytes
1 - 128 KB
265 KB - 4MB
≤ 4 GB
≤ 200 GB
mehrere TB
Was ist Caching?
Ein Cache ist ein schneller Pufferspeicher zwischen den Registern und dem Hauptspeicher. Darin sind
sowohl Programmteile wie Daten enthalten. Diese können entweder zusammen in einem Unified Cache
liegen oder es gibt zwei getrennte Caches (Split Cache). Bei jedem Speicherzugriff des Prozessors testet
die Cache Steuerlogik des Caches, ob das Speicherwort im Cache vorliegt (Cache Hit) oder nicht (Cache
Miss). Falls es vorliegt wird es direkt vom Cache in den Prozessor übertragen. Falls ein Cache Miss
auftritt, wird aus dem Hauptspeicher ein Block von Worten in den Cache übertragen. Hauptspeicher
und Cache sind in Blöcken organisiert.
Wegen der hohen Geschwindigkeit wird der Cache durch Hardware verwaltet, der Zugriff erfolgt transparent. Programmierer, Übersetzer und Betriebssysteme sollten den Cache aber insofern beachten, dass
sie Daten und Programm für das Caching optimieren. So wird eine Programmschleife sicherlich deutlich
schneller abgearbeitet, wenn sie komplett in den Cache passt.
Moderne Systeme haben meistens eine Cache-Hierarchie bestehend aus dem Primary Cache und dem
Secondary Cache die sich in Grössen und Geschwindigkeit unterscheiden.
Primary Cache. Der Primary Caches ist auf dem Prozessor-Chip integriert und meist als Split
Cache realisiert. Die Cache Blöcke sind meist nicht länger als 32 Bytes und damit in wenigen
Zyklen nachladbar.
Secondary Cache. Bis vor kurzem wurde der Secondary Cache ausserhalb des Prozessors realisiert,
Prozessoren wie der Pentium III haben ihn aber bereits On Die. Der Secondary Cache ist meist
ein Unfied Cache mit Blockgrössen um die 128 Byte.
5.3.4
Was für Adressierungsmöglichkeiten gibt es bei Caches?
Caches können entweder mit realen oder virtuellen Adressen adressiert werden, beides hat Vor- und
Nachteile.
Virtuelle Adressierung. Der Vorteil virtueller Caches ist, dass sie schneller sind, da Cache-Zugriff
und Adressübersetzung durch die MMU können parallel stattfinden. Im Mehrprozessbetrieb werden
virtuelle Caches aber einige Probleme auf.
Dieselbe virtuelle Adressen von verschiedenen Prozessen kann auf unterschiedliche physische
Adresse verweisen, deshalb muss beim Kontextwechsel der Cache gelöscht werden.
Unterschiedliche virtuelle Adressen können auf dieselbe physische Adresse verweisen, z. B. bei
gemeinsamen Variablen. Um Inkonsistenzen im Cache zu vermeiden sollten gemeinsame Daten
nicht gecachet werden.
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
57
Kapitel 5. Rechnerarchitektur
Wenn Hauptspeicherdaten durch DMA Zugriffe verändert werden, liegt eine Dateninkonsistenz
vor. Das Problem bei virtueller Adressierung ist das Rückermitteln der virtuellen Adressen aus
den physischen Adressen.
Virtuelle Caches werden deshalb hauptsächlich bei prozessorinternen Befehls-Caches eingesetzt.
Reale Adressierung. Caches mit physischer Adressierung sind langsamer, da die Adressübersetzung
abgewartet werden muss. Dafür sind sie für Inkonsistenzen nicht so anfällig. Zum Beispiel kann die
DMA-Einheit, die real adressiert, hier für die Konsistenz sorgen.
5.3.5
Was für Cache-Organisationsformen gibt es?
Die Organisationsform des Caches legt das Mapping von Hauptspeicher-Blöcken auf Cache-Blöcke und
wie ein gewünschter Block im Cache aufzufinden ist (Identifikationsproblem) fest. Die folgenden Organisationsformen sind gebräuchlich.
Direkte Abbildung. In einem Cache mit direkter Abbildung und N Blöcken, wird der Hauptspeicherblock B im Cache-Block B mod N gespeichert. Diese Abbildung ist die einfachste, da nur ein
Vergleicher benötigt wird. Das Problem ist, dass Cache-Einträge sehr schnell wieder verdrängt
werden.
Voll assoziative Abbildung. In einem voll assoziativen Cache kann ein Hauptspeicherblock in jedem
Cache-Block gespeichert werden. Voll assoziative Caches sind teuer, da man N Vergleicher benötigt.
Die Verdrängung ist hier zwar am geringsten, aber sie sind langsam.
n-fach assoziative Abbildung. Bei n-fach assoziative Caches wird der Cache in M = N/n Sätze
mit jeweils n Blöcken geteilt. Der Hauptspeicher Block B kann im einem Cache-Block des Satz B
mod M gespeichert werden. Wenn n = N ist, wird der Cache voll assoziativ, wenn n = 1 entspricht
er einem Cache mit direkter Abbildung. n-fach assoziative Caches bieten die Möglichkeit eine guten
Kompromiss zwischen Kosten, Geschwindigkeit und Wirksamkeit zu finden. In der Praxis werden
2,4 und 8-fach assoziative Caches eingesetzt.
Da jedem Cache-Block eine grosse Anzahl an Hauptspeicherblöcken zugeordnet ist, braucht man einen
Mechanismus um Hauptspeicherblöcke eindeutig zu identifizieren. Dazu wird pro Cache-Block neben
ein paar Verwaltungsbits auch noch eine Kennung gespeichert, die der Hautpspeicheradresse entspricht.
5.3.6
Welche Aktualisierungsstrategien gibt es bei Caches?
Wenn Daten im Cache verändert werden, stellt sich die Frage, wann diese Änderungen in den Speicher
zurückgeschrieben werden um die Konsistenz zu erhalten. Es gibt zwei Strategien
Durchschreiben (Write Through). Durchschreiben bedeutet, dass jede Änderung im Cache sofort
auch in den Hauptspeicher geschrieben wird. Dadurch wird die Datenkonsistenz gewährleistet, aber
der Prozessor-Speicherbus stark belastet. Primary Caches arbeiten meist nach diesem Prinzip.
Zurückschreiben (Write Back ). Bei Write Back wird der Hauptspeicher erst aktualisiert, wenn ein
veränderter Cache-Block verdrängt wird. Dazu muss ein Dirty-Bit verwaltet werden. Secondary
Caches arbeiten meist so.
5.3.7
Welche Ersetzungsstrategien werden bei Caches eingesetzt?
Bei Caches wird meist eine LRU-Strategie eingesetzt, wobei aber in den Cache-Blöcken eine Altersinformation gespeichert werden muss. Eine sehr einfach zu implementierende Strategie ist das zufällige
auswählen der zu ersetzenden Seite. Diese Strategie liefert überraschend gute Ergebnisse.
5.3.8
Was fällt Ihnen zum Thema Leistung von Caches ein?
Leistungsbetrachtung von Caches orientieren sich meist an der Formel für die mittlere Speicherzugriffszeit Te für eine zweistufige Speicherhierarchie.
Te = h · T h + m · T m
58
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
5.4. Ein-/Ausgabewerk
Wobei h und m = 1 − h die Treffer- bzw. Fehlerraten (Hit rate, miss rate) im Cache sind. T h ist
die Cache-Zugriffszeit (Hit time) und Tm die Cache-Ladezeit (miss time). Die Zugriffszeit Te kann
durch die folgende drei Massnahmen verbessert werden. Optimieren einer Grösse bewirkt meist die
Verschlechterung einer anderen Grössen, es gilt einen Kompromiss zu finden.
Reduktion der Fehlerrate m. Entweder kann der Cache vergrössert oder die Assoziativität erhöht
werden. Dadurch wird er teurer und die Cache-Zugriffszeit wird erhöht. Durch grössere Blöcke
können Lokalitätseigenschaften besser genutzt werden, dafür wird die Ladezeit grösser. Weitere
Möglichkeiten sind der Einsatz eines Victim Cache und Prefetching.
Reduktion der Cache-Zugriffszeit Th . Die Cache-Zugriffszeiten für den Primary Cache sind entscheidend für die Prozessortaktrate, Zugriffszeiten auf den Secondary Cache bestimmen die Wartezyklen
des Prozessors. Kurze Zugriffszeiten erhält man bei kleinen und einfach organisierten Caches, was
den obigen Optimierungen zuwiderläuft.
Reduktion der Cache-Ladezeit Tm . Cache-Ladezeiten können durch Einführung einer weiteren Ebene in der Speicherhierarchie verbessert werden. Eine andere Möglichkeit ist die Verwendung von
Non-Blocking Caches die Daten an den Prozessor liefern können während sie aus dem Hauptspeicher
Daten nachladen. Ausserdem ist Tm massgeblich durch die Geschwindigkeit des Prozessor-SpeicherBusses und die Hauptspeicherzugriffszeiten bestimmt.
5.3.9
Was beeinflusst den Zugriff auf den Hauptspeicher?
Hauptspeicherzugriffszeiten
Geschwindigkeiten des Prozessor-Speicher-Busses.
Anzahl und Effizienz der Caches
5.3.10
Wie kann man den Zugriff auf den Hauptspeicher beschleunigen?
Durch Caching, siehe 5.3.3
5.3.11
Wie verläuft die Kommunikation Prozessor-Hauptspeicher?
Über den Prozessor-Speicher-Bus. Zusätzlich werden meist ein oder mehrere Caches dazwischen geschaltet.
5.3.12
Wie funktioniert Busverwaltung?
Ein Busmaster muss das Recht erwerben auf dem Bus zu senden. Wenn es nur einen Busmaster gibt,
ist die Vergabe einfach. Bei mehreren Mastern muss irgendwie geregelt werden, wer das Recht erhält.
Es gibt Verfahren mit einer zentralen Steuereinheit und mit dezentralen Einheiten in den Busmastern.
Diese können prioritätengesteuert oder fair sein.
5.3.13
Was ist Daisy-Chaining?
Beim Daisy-Chaining wird der Bus sozusagen durch die Geräte hindurchgeführt. Die Daten gehen in
ein Geräte hinein, werden dort eventuell verarbeitet, und dann wieder raus zum nächsten Gerät.
5.4
Ein-/Ausgabewerk
5.4.1
Welche Varianten gibt es für E/A-Operationen?
Die Gerätekontrolle haben Register über die sie gesteuert und über die Daten ausgelesen werden können.
Es gibt zwei Möglichkeiten, wie diese Register angesprochen werden können:
I/O-Ports. Hier wird den Registern der Controller eine I/O-Port-Nummer zugeordnet, zusätzlich
gibt es spezielle IN/OUT Befehle. So kann z. B. mit IN RX, port der entsprechende Wert in ein
CPU-Register geladen werden.
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
59
Kapitel 5. Rechnerarchitektur
Memory-Mapped I/O. Bei Memory-Mapped-IO werden die Register der Controller in Hauptspeicher
eingeblendet. Nun kann auf die Register mit ganz normalen Move-Befehlen zugegriffen werden. Der
Vorteil ist, dass man keine speziellen I/O-Befehle benötigt. Ausserdem kann der Zugriff auf Geräte
durch die normalen Speicherschutzmechanismen realisiert werden. Auf Maschinenebene können
Befehle eingespart werden, da der Wert nicht zwangsweise in ein Register geladen werden muss.
Probleme ergeben sich durch das Caching, cachen von gemapten Adressen macht keinen Sinn, daher muss die Hardware dafür sorgen, dass das Caching für diese Adressen ausgeschaltet wird. Bei
Memory-Mapped I/O müssen alle Gerätekontroller bei jedem Speicherzugriff aufpassen, ob nicht
sie gemeint sind. Das ist kein Problem, solange I/O und Speicher am selben Bus hängen. Gibt
es aber einen dedizierten Prozessor-Speicher-Bus, so muss man irgendwie zwischen echten Speicherzugriffen und Zugriffen auf Geräte unterscheiden. Dafür gibt es wiederum verschieden Ansätze.
Bei Pentium gehen deshalb Speicherzugriffe durch die PCI-Bridge, die die Unterscheidung macht.
Es gibt auch Systeme, z. B. Pentium, die beide Verfahren nutzen.
5.4.2
Was ist DMA?
DMA steht für Direct Memory Access und wird benutzt um die CPU bei I/O-Zugriffen zu entlasten.
Wenn DM eingesetzt wird, gibt es einen DMA-Controller. Will die CPU Daten von einem Geräte lesen,
gibt sie dem DMA-Controller den entsprechenden Auftrag und wendet sich wieder ihrer Arbeit zu. Der
DMA-Controller kopiert jetzt eigenständig Daten von dem Gerät in den Hauptspeicher. Dabei können
Geräte nicht unterscheiden ob der Zugriff von der CPU oder dem DMA-Controller kommt. Wenn er
damit fertig ist, schickt er eine Unterbrechung an die CPU. Damit kann die CPU vom einem Grossteil
der I/O-Arbeit entlastet werden.
60
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
5.5. SPEC-Werte
5.5
SPEC-Werte
Die folgenden Werten stammen von der SPEC-Website (www.spec.org) vom 16.03.2003. Die ersten 5 zeigen bei
beiden Benchmarks die Top-5 von diesem Tag, die anderen sind beliebig ausgewählt.
CINT2000
Company
System
Peak
Base
Processor
Published
Dell
Precision WorkStation 350 (3.06
GHz P4)
Intel D850EMVR motherboard (3.06
GHz, Pentium 4 processor with HT
Technology)
Precision WorkStation 340 (3.06
GHz P4)
Precision WorkStation 350 (2.8 GHz
P4)
Intel D850EMVR motherboard (2.8
GHz, Pentium 4 processor)
1130
1085
Dec-2002
1107
1099
1074
1032
1061
1017
1040
1032
Intel Pentium 4 (533 MHz system
bus)
Intel Pentium 4 Processor with HT
Technology (3.06 GHz, 533 MHz
bus)
Intel Pentium 4 (533 MHz system
bus)
Intel Pentium 4 (533 MHz system
bus)
Pentium 4 processor (2.8 GHz, 533
MHz bus)
Precision WorkStation 340 (2.4 GHz
P4)
Intel D850MD motherboard (2.4
GHz, Pentium 4 processor)
Precision WorkStation 340 (2.2 GHz
P4)
Precision WorkStation 340 (2.0A
GHz P4)
Intel D850EMV2 motherboard (2.0A
GHz, Pentium 4 processor)
Gigabyte GA-7DX Motherboard,
AMD Athlon (TM) XP 1800+
PRIMEPOWER650 (810MHz)
905
865
Sep-2002
833
819
833
798
759
738
Intel Pentium 4 (533 MHz system
bus)
Pentium 4 processor (2.4 GHz, 400
MHz bus)
Intel Pentium 4 (400 MHz system
bus)
Intel Pentium 4
759
756
644
Intel
Dell
Dell
Intel
Dell
Intel
Dell
Dell
Intel
AMD
Fujitsu
Siemens
Dell
Compaq
HP
PowerEdge 1500SC (1.26 GHz PIII)
AlphaServer GS160 Model 16
68/1001
hp workstation j6700
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
Dec-2002
Dec-2002
Dec-2002
Oct-2002
Apr-2002
Sep-2002
Feb-2002
621
Pentium 4 processor (2.0A GHz, 400
MHz bus)
AMD Athlon (TM) XP 1800+
Sep-2002
Oct-2001
624
512
SPARC64 GP
Jul-2002
623
621
611
561
Intel Pentium III
Alpha 21264C
Feb-2002
Jul-2001
603
569
PA-8700
May-2001
61
Kapitel 5. Rechnerarchitektur
CFP2000
Company
System
Peak
Base
Processor
Published
HP
HP
AlphaServer GS1280 7/1150
hp server rx5670 (1000 MHz,
Itanium 2)
hp server rx2600 (1000 MHz,
Itanium 2)
hp workstation zx6000 (1000 MHz,
Itanium 2)
hp AlphaServer ES45 68/1250
1482
1431
1124
1431
Alpha 21364
Intel Itanium 2
Jan-2003
Dec-2002
1427
1427
Intel Itanium 2
Dec-2002
1422
1422
Intel Itanium 2
Dec-2002
1365
1019
Alpha 21264C
Nov-2002
1060
1048
Dec-2002
1048
1034
1036
1024
1024
1012
844
843
733
782
Intel Pentium 4 (533 MHz system
bus)
Pentium 4 processor (2.8 GHz, 533
MHz bus)
Intel Pentium 4 (533 MHz system
bus)
Pentium 4 processor (2.67 GHz, 533
MHz bus)
UltraSPARC III Cu
AMD Athlon (TM) XP 2800+
Mar-2003
Oct-2002
831
772
AMD Athlon (TM) XP 2700+
Oct-2002
628
618
Aug-2001
607
591
Pentium 4 processor (1.8 GHz, 400
MHz bus)
Intel Pentium 4
May-2001
604
561
AMD Athlon (TM) XP 1700+
Oct-2001
HP
HP
HP
Dell
Intel
Dell
Intel
Sun
AMD
AMD
Intel
Dell
AMD
62
Precision WorkStation 350 (2.8 GHz
P4)
Intel D850EMVR motherboard (2.8
GHz, Pentium 4 processor)
Precision WorkStation 350 (2.66
GHz P4)
Intel D850EMVR motherboard (2.67
GHz, Pentium 4 processor)
Sun Fire V1280 (900MHz)
ASUS A7N8X (REV 1.02)
Motherboard, AMD Athlon (TM)
XP 2800+
ASUS A7N8X (REV 1.02)
Motherboard, AMD Athlon (TM)
XP 2700+
Intel D850GB motherboard(1.8
GHz, Pentium 4 processor)
Precision WorkStation 330 (1.70
GHz P4)
Epox 8KHA+ Motherboard, AMD
Athlon (TM) XP 1700+
Oct-2002
Dec-2002
Oct-2002
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
Kapitel 6
Betriebssysteme
6.1
Allgemeines
6.1.1
Was für Arten von Betriebsmitteln gibt es?
Betriebsmittel können wie folgt klassifiziert werden.
einmalig benutzbar. Druckerpapier, Nachricht
wiederholt benutzbar.
parallel benutzbar. Datei mit lesendem Zugriff
exklusiv benutzbar, unterbrechbar. CPU
exklusiv benutzbar, nicht-unterbrechbar. Drucker
6.1.2
Was ist ein Betriebssystem?
Ein Stück Software, das die in 6.1.3 beschriebenen Aufgaben erfüllt.
6.1.3
Was sind die Aufgaben eine Betriebssystems?
Veredeln der Hardware (Virtualisierung)
Steuerung und Kontrolle der Programmausführung
Verwaltung der Betriebsmittel
Anbieten von Diensten in Form von Schnittstellen, so dass die Betriebsmittel genutzt werden
können.
Schutz mehrerer gleichzeitig aktiver Benutzer
6.2
Prozesse und Threads
6.2.1
Was ist ein Prozess?
Ein Prozess ist eine Abstraktion eines laufenden Programmes. Mit einem Prozess verbunden sind:
Thread of Control
Adressraum
globale Variablen
offene Dateien
Kindprozesse
Register
Befehlszähler
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
63
Kapitel 6. Betriebssysteme
Stack
Status
6.2.2
Was ist ein Thread?
Ein Thread könnte als leichtgewichtiger Prozess bezeichnet werden. Er hat
Thread of Control
Register
Befehlszähler
Stack
Status
Er hat aber keinen eigenen
Adressraum
globale Variablen
offene Dateien
Kindprozesse
6.2.3
Was bedeutet Mehrprogrammbetrieb?
Wenn mehrere Prozesse sich eine CPU teilen spricht man von Mehrprogrammbetrieb.
6.2.4
Wie kommunizieren Prozesse miteinander?
Prozesse können kommunizieren über:
gemeinsamen Speicher
gemeinsame Dateien
Nachrichten
Semaphoren
RPC
Pipes
Mailslots (Windows)
6.2.5
Was beinhaltet der Prozesskontext?
Prozessmanagement
Speichermanagement
Dateimanagement
Register
Zeiger auf Codesegment
Root-Verzeichnis
Befehlszähler
Zeiger auf Datensegment
Arbeitsverzeichnis
Prozess-Status-Wort
Zeiger auf Stacksegment
File Handles
Stackpointer
User ID
Prozessstatus
Gruppen ID
Priorität
PID
6.2.6
64
Welche Zeitscheibenverfahren gibt es?
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
6.2. Prozesse und Threads
Round-Robin
Round-Robin mit Prioritäten
6.2.7
Welche Möglichkeiten gibt es zur Prozesssynchronisation?
Unterbrechungssperre
Verdrängungssperre
Sperrvariablen
algorithmische Lösungen
Semaphore
Monitore
6.2.8
Was ist ein Scheduler?
Der Scheduler ist der Teil des Betriebssystems, der entscheidet, wann welcher Prozess Rechenzeit bekommt. Er folgt einem Scheduling Algorithmus.
6.2.9
Was ist ein Dispatcher?
In Multithreadinganwendung gibt es oft einen Dispatchthread. Dieser hat die Aufgabe die Arbeit an
andere Threads zu verteilen.
6.2.10
Erzählen Sie etwas zu Scheduling-Strategien.
Man muss unterscheiden zwischen Scheduling-Strategien für
Batch-Systeme. Für Batch-Systeme gibt es folgende Algorithmen
First-Come First-Served. Sehr einfach umzusetzen, wegen der Nicht-Unterbrechbarkeit aber
nicht praktikabel.
Shortest Job First. Beweisbar kürzeste Verweilzeit (siehe 6.2.11), aber nicht unterbrechbar und
die Job-Grösse muss im voraus bekannt sein.
Shortest Remaining Time Next. Hier wählt der Scheduler immer den Prozess mit der kleinsten
Restlaufzeit. Auch hier müssen Berechnungszeiten im voraus bekannt sein.
Interaktive Systeme.
Round-Robin. Jedem Prozess wird ein Zeitintervall, das Quantum, zugeordnet, in dem er laufen
kann, danach wird zu einem neuen Prozess gewechselt. Die Prozesse können in einer Liste
verwaltet werden. Wenn ein Prozess sein Quantum aufgebraucht hat (oder abgegeben hat)
wird an das an der Liste angehängt und der Prozess am Kopf der Liste gestartet. Die Wahl
der Länge des Quantums ist entscheidend. Ist das Quantum zu kurz, gibt es zu viele (teure)
Kontextwechsel, ist es zu lang, sind die Antwortzeiten schlecht. In der Praxis werden Quanta
der Länge 20–50 ms eingesetzt.
Prioritäten. Beim Prioritäten-Scheduling wird jedem Prozess eine Priorität zugeordnet. Der
Scheduler wählt immer den Prozess mit der höchsten Priorität. Damit dieser nicht für immer
Läuft, bricht man nach einem bestimmten Zeitquantum ab und nimmt den nächsten. Oder man
verringert die Priorität des Prozesses entsprechend seiner Laufzeit. Falls seine Priorität unter
dies eines anderen fällt, wird gewechselt.
Generell können die Prioritäten statisch oder dynamisch vergeben werden. Bei der dynamischen
Vergabe gibt es folgende Varianten. Viele Prozesse verbringen sehr viel Zeit mit I/O und belasten
die CPU nur wenig. Solchen Prozessen sollte man die CPU so prompt wie möglich zur Verfügung
stellen (wenn sie sie benötigen) damit sie sich weiter mit I/O befassen können und die CPU für
rechenintensive Prozesse frei bleibt. Eine einfache Möglichkeit, diesen Service anzubieten, ist,
den Prozessen die Priorität 1/f zuzuweisen. Wobei f der Bruchteil des Quantums ist, den
der Prozess beim letzten mal benutzt hat. Prozesse die ihr Quantum fast gar nicht nutzen,
bekommen eine hohe Priorität, Prozesse die ihr Quantum voll nutzen eine niedrige Priorität.
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
65
Kapitel 6. Betriebssysteme
Round-Robin + Prioritäten. In der Praxis wird oft eine Kombination der beiden Schedulingstrategien eingesetzt. Die Prozesse werden in mehrere Kategorien (nach Prioritäten) eingeteilt
und in innerhalb dieser Kategorien wird Round-Robin Scheduling gemacht. Das heisst der Scheduler macht solange Round-Robin in der wichtigsten Kategorien bis dort keine Prozesse mehr
vorhanden sind, dann nimmt er sich die nächste Kategorie vor. Auch hier sollten die Prioritäten
dynamisch angepasst werden, sonst besteht die Gefahr des Verhungerns.
Shortest Process Next. Shortest Process Next ist der Versuch die optimalen Verweilzeiten von
Shortest Job First in interaktive Systemen zu nutzen. Dazu geht man davon aus, dass interaktive Prozesse immer nach dem Muster Warten auf Befehl, Befehl ausführen, Warten auf
Befehl, Befehl ausführen ablaufen. Wenn man die Ausführung eines Befehls als Job betrachtet, kann man die Antwortzeiten minimieren in dem man die kürzesten Befehl zuerst bearbeitet. Um herauszufinden, welcher der kürzeste Befehl ist, wird eine Technik namens Aging
eingesetzt.
Garantiertes Scheduling. Bei diesem Verfahren werden den Benutzer Garantien wie bei N Benutzern bekommt jeder genau 1/N der Rechenleistung gegeben und diese Versucht einzuhalten.
Dies ist schwierig zu implementieren.
Lottery. Hier bekommt jeder Prozessor ein Los . Wenn eine Schedulingentscheidung getroffen
werden muss, wird eine Losnummer ausgelost. Der Prozess mit der gezogenen Nummer erhält
den Prozessor. Um Prioritäten zu realisieren kann bestimmten Prozessen mehr als ein Los
gegeben werden und damit ihre Gewinnchancen erhöht werden. Lottery Scheduling bietet einige
interessante Möglichkeiten, so können z. B. Prozesse ihre Lose an andere Prozesse verschenken.
Ein Client, der unbedingt eine Information von einem Server braucht, könnte seine Lose an den
Server verschenken, damit dieser möglichst schnell Rechenzeit bekommt.
Fair-Share. Beim Fair-Share Scheduling bezieht der Scheduler zusätzlich Informationen über
den Besitzer eines Prozesses in Betracht und achtet darauf, dass alle Benutzer ungefähr gleich
viel Rechenzeit erhalten.
Echtzeit-Systeme. Schedulingalgorithmen für Real-Time Systeme können entweder statisch oder
dynamisch sein. Statische Algorithmen weisen jedem Prozess eine feste Priorität und verwenden
dann Prioritätenscheduling. Bei dynamischen Algorithmen können sich die Prioritäten ändern.
Rate Monotonic. RMS ist ein statischer Algorithmus der jedem Prozess eine Priorität entsprechend der Frequenz des Ereignis, das diesen Prozess triggert, zuweist. Dazu müssen die
Ereignisse periodisch auftreten und die Abarbeitung eines Ereignisses muss immer gleich lang
dauern.
Earliest Deadline First. Ein typische dynamischer Algorithmus ist EDF. Wenn ein Prozess die
CPU benötigt meldet er sich an und gibt den Termin zu dem er fertig sein muss an. Die Prozesse
werden in einer Liste verwaltet und der Scheduler wählt immer den Prozess mit der knappsten
Deadline.
Eine weitere Möglichkeit bietet die Trennung von Mechanism und Policy. Wenn Programme aus mehreren Prozessen bestehen haben sie meisten eine sehr viel bessere Vorstellung davon wie diese geschedult
werden sollen als der Scheduler des Betriebssystems. Ein Möglichkeit diese Information zu nutzen ist
Betriebsystemfunktionen zur Verfügung zu stellen die es einem Prozess erlauben, die Prioritäten seiner
Kindprozesse zu verändern. Hier steckt der Mechanism im Kernel aber die Policy wird durch einen
Userprozess bestimmt.
6.2.11
Welche Strategie führt zu kürzesten Verweilzeiten?
Shortest Job First. Angenommen es gibt 4 Prozesse A, B, C, D, wobei deren Bearbeitungszeiten a, b, c, d
sind. Wenn die Prozesse in alphabetischer Reihenfolge ausgeführt werden, dann sind jeweiligen Verweilzeiten für die Prozesse
66
T (A)
=
a
T (B)
T (C)
= a+b
= a+b+c
T (D)
=
a+b+c+d
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
6.2. Prozesse und Threads
Das ergibt eine durchschnittliche Verweilzeit von
T (∅)
=
=
T (A) + T (B) + T (C) + T (D)
4
4a + 3b + 2c + d
4
Wie man sieht, hat die Laufzeit des ersten Prozesses den grössten Einfluss, daher führt SJF zu den
kürzesten Verweilzeiten.
6.2.12
Ist Shortest Job First unterbrechbar?
Nein. Ist gibt aber eine unterbrechbare Version, die sich Shortest Remaining Time Next nennt. Hier
wählt der Scheduler immer den Prozess mit der kleinsten Restlaufzeit. Auch hier müssen Berechnungszeiten im voraus bekannt sein.
6.2.13
Welche unterbrechbare Strategie liefert die kürzesten Verweilzeiten?
Shortest Remaining Time Next.
6.2.14
Arbeitet das Prioritätenscheduling mit statischen Prioritäten?
siehe 6.2.10.
6.2.15
Wie funktionieren dynamische Prioritäten?
siehe 6.2.10.
6.2.16
Wonach bewertet man Schedulingstrategien?
Je nach Art des Systems verfolgen die Strategien unterschiedliche Ziele. Für alle System gilt:
Fairness.
Policy Enforcement. Der Scheduler muss die System-Policy durchsetzen.
Balance. Alle Teile des Systems sollten ausgelastet sein.
Für interaktive Systeme gilt:
Response Time.
Proportionality. Das Scheduling sollten den Erwartungen des Users entsprechen. Zum Beispiel
macht es dem User in den meisten Fällen nichts aus, wenn das Versenden einer eMail 20s dauert,
es stört in aber wenn das Eingeben eines Buchstabens 20s dauert.
Für Batch-Systeme gilt:
Throughput. Anzahl der Jobs pro Stunde maximieren.
Turnaround Time. Verweilzeiten minimieren.
CPU Utilization. CPU-Auslastung maximieren.
6.2.17
Wie schützt das Betriebssystem den Speicherbereich eines Prozesses vor Zugriffen von anderen Prozesses?
Das muss die Hardware erledigen, die muss vom Betriebssystem richtig konfiguriert werden.
6.2.18
Wie läuft eine Unterbrechung genau ab?
1. Hardware speichert Befehlszähler, PSW usw. auf dem aktuellen Stack
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
67
Kapitel 6. Betriebssysteme
2. Hardware setzt Befehlszähler entsprechend des Interrupt Vectors
3. Assembler-Routine sichert die Register
4. Assembler-Routine legt neuen Stack an
5. C-Routine mit Unterbrechungscode wird gestartet
6. Scheduler wählt neuen Prozess
7. Rücksprung von der C-Routine zur Assembler-Routine
8. Zurückkopieren der Register, usw., Starten des (neuen) aktuellen Prozesses
6.2.19
Was für Arten von Unterbrechungen gibt es?
Interrupts lassen sich nach vielen Kriterien klassifizieren, z. B. Software vs. Hardware, Maskable vs
Non-Maskable, Precise vs Imprecise.
6.2.20
Was beinhaltet der Prozesskontrollblock?
Der Prozesskontrollblock ist eine Datenstruktur, die den Prozesskontext beschreibt. Siehe 6.2.5.
6.2.21
Was ist der Unterschied zwischen Ports und Sockets?
Ein Socket ist ein Kommunikationsendpunkt. Sockets sind für Kommunikation zwischen zwei Rechnern
gedacht. Ein Socket setzt sich zusammen aus Adresse und Port.
6.2.22
Wie realisiert man Semaphoren in der Praxis?
Falls ein TSL-Befehl zur Verfügung steht können Semaphoren wie in 6.2.23 realisiert werden. Ansonsten werden sie meist vom Betriebssystem durch kurzzeitiges Sperren der Interrupts realisiert. Das
Betriebssystem stellt den Userprozessen dann entsprechende Funktionen zur Verfügung.
6.2.23
Wie wird wechselseitiger Ausschluss umgesetzt?
Es gibt verschiedene Möglichkeiten wechselseitigen Ausschluss umzusetzen.
Interrupts sperren. Ein Prozess könnte, bevor er eine kritischen Bereich betritt einfach alle Interrupts sperren. Das hat mehrere Nachteile. Ersten sollte in Userprozess nicht das Recht haben
Interrupts zu sperren, zweitens funktioniert dies in Mehrprozessorsystemen nicht. Innerhalb des
Betriebssystems kann das Sperren von Interrupt manchmal eingesetzt werden, für Userprozesse
sollte es aber nicht in Frage kommen.
Test and Set Locks. TSL ist eine Befehl, der von der Hardware angeboten wird. Er liest ein Wort
aus dem Speicher und speichert es in einem Register. Anschliessend schreibt z. B. 1 an die Stelle
im Speicher. Die Hardware garantiert, dass dieser Befehl ununterbrechbar ist. Der folgende Code
zeigt wie mit diesem Befehl wechselseitiger Ausschluss realisiert werden kann:
enter:
TSL REG, lock
CMP REG, 0
JNE enter
RET
kopiere lock in das Register REG und setze lock auf 1
war lock = 0 ?
es war nicht 0, also war die Sperre bereits gesetzt ⇒ Schleife
zurück zum Aufrufer, kritischer Bereich wurde betreten
MOV lock, 0
RET
0 in lock speichern und dadurch Sperre frei geben
zurück zum Aufrufer, kritischer Bereich wurde verlassen
exit:
Natürlich müssen die beiden Prozeduren beim Betreten bzw. Verlassen des kritischen Bereichs
aufgerufen werden. Das Problem ist, dass diese Implementierung Busy-Waiting benutzt.
68
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
6.3. Deadlocks
Mutexes. Mutexes sind nicht anderes als binäre Semaphoren. Sie sind ideal um wechselseitigen
Ausschluss zu realisieren. Meist werden sie als Betriebssystemfunktionen implementiert, z. B. durch
Sperren von Interrupts. Falls ein TSL-Befehl zur Verfügung steht können sie aber auch sehr einfach
im Userspace implementiert werden.
mutex lock:
TSL REG, mutex
CMP REG, 0
JZE ok
CALL thread yield
JMP mutex lock
ok:
RET
mutex unlock:
MOV mutex, 0
RET
6.3
Deadlocks
6.3.1
Was sind Deadlocks?
kopiere mutex in das Register REG und setze mutex auf 1
war mutex = 0 ?
es war Null, also alles klar
es war nicht 0, also war die Sperre bereits gesetzt ⇒ schlafen gehen
Thread ist wieder aufgewacht, nochmal probieren
zurück zum Aufrufer, kritischer Bereich wurde betreten
0 in mutex speichern und dadurch Sperre frei geben
zurück zum Aufrufer, kritischer Bereich wurde verlassen
Eine Menge von Prozessen ist in einem Deadlock wenn jeder Prozess auf ein Ereignis wartet, das nur
von einem anderen Prozess ausgelöst werden kann.
6.3.2
Welche Verfahren gibt es mit Deadlocks umzugehen?
1. Vogel-Strauss-Algorithmus. Mann hofft darauf, dass keine Deadlocks auftreten. Dies ist das in der
Praxis am häufigsten verwendete Verfahren.
2. Deadlock-Erkennung. Man versucht zu erkennen, dass ein Deadlock aufgetreten ist und die Situation
dann zu bereinigen.
3. Deadlock-Vermeidung. Man versucht Deadlocks durch vorsichtige Vergabe der Betriebsmittel zu
vermeiden.
4. Deadlock-Verhinderung. Man versucht Deadlocks generell zu verhindern, in dem man eine der vier
Deadlock-Bedingung ausschliesst.
6.3.3
Wie funktioniert Deadlock-Erkennung?
Um einen Deadlock zu finden muss man einen Kreis im Betriebsmittelgraphen finden. Falls ein Deadlock
gefunden wurden, gibt es verschiedene Methoden damit umzugehen.
Recovery through Preemption. Wenn möglich entzieht man einem der Prozesse ein Betriebsmittel.
Selbst wenn dies theoretisch möglich ist, ist es schwer automatisch festzustellen welchem Prozess
welches Betriebsmittel zu entziehen ist.
Recovery through Rollback. Man kann Prozesse zwingen hin und wieder sog. checkpoints zu speichern. In diesen wird der komplette Status eines Prozesses festgehalten. Wenn nun ein Deadlock
entdeckt wird, rollt man einen der Prozessen der eines beteiligten Betriebsmittel anfordert zu seinem
letzten Checkpoint zurück.
Recovery through Killing. Die einfachste Methode ist es einen der am Deadlock beteiligten Prozesse
zu killen. Wenn der Deadlock dadurch nicht behoben wird, killt man weitere Prozesse. Alternativ
kann man auch nicht am Deadlock beteiligte Prozesse killen. In der Praxis geht das natürlich
schlecht, da dadurch Daten verloren gehen. Ein Beispiel wo es funktioniert sind Transaktionen in
Datenbanken.
6.3.4
Wie funktioniert Deadlock-Vermeidung?
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
69
Kapitel 6. Betriebssysteme
Bei der Deadlock-Vermeidung versucht man zu verhindern, dass ein Prozess in einen unsicheren Zustand
kommt. In der Praxis ist dies selten anzuwenden, da man dafür die zukünftigen Ressourcenbedarf der
Prozesse kennen muss. Ein Beispiel ist der Bankiersalgorithmus.
6.3.5
Wie funktioniert Deadlock-Verhinderung?
Man versucht eine der vier Deadlock-Bedingung generell auszuschliessen.
1. Mutual exclusion condition. Mann kann wie im Falle des Druckers einen Spooler einrichten. Dadurch hat nur noch ein einziger Prozess Zugriff auf ein Betriebsmittel. Das Problem ist, dass man
nicht alle Betriebsmittel spoolen kann, z. B. die Prozesstabelle. Ausserdem können sich dadurch
neue potentielle Deadlocks ergeben. Der Printspooler braucht Plattenspeicher, auch dieser kann
deadlocken.
2. Hold and wait condition. Man könnte Prozesse zwingen alle ihre Betriebsmittel auf einen Schlag
anzufordern, dies geht aber meist nicht, da die Prozesse zu Beginn noch nicht wissen, welche Betriebsmittel sie benötigen. In bestimmten Fällen funktioniert kann das sehr gut funktionieren.
Datenbanken setzen Two-Phase Locking ein, was im Prinzip diesem Ansatz entspricht.
3. No preemption condition. Das geht mit vielen Betriebsmittel einfach nicht anders.
4. Circular wait condition. Eine Möglichkeit ist den Betriebsmittel eindeutige Nummern zuzuordnen
und Prozessen das Anfordern von Betriebsmittel nur in numerischer Reihenfolge zu erlauben. Dadurch können keine Zyklen im Betriebsmittelgraphen und damit auch keine Deadlocks entstehen.
Das Problem ist, dass es in einem echten System fast unmöglich ist, eine vernünftige Nummerierung
aller Betriebsmittel zu finden.
6.3.6
Was sind die Bedingungen für einen Deadlock?
Damit ein Deadlock eintreten kann, müssen die folgende vier Bedingungen gelten.
1. Mutual exclusion condition. Jedes Betriebsmittel ist entweder genau einem Prozess zugeordnet oder
frei.
2. Hold and wait condition. Ein Prozess der bereits Betriebsmittel besitzt kann weitere anfordern.
3. No preemption condition. Betriebsmittel können Prozessen nicht weggenommen werden. Die Prozesse müssen die Betriebsmittel freiwillig abgeben.
4. Circular wait condition. Es gibt eine kreisförmige Kette mit zwei oder mehr Prozessen, die jeweils
auf ein Betriebsmittel warten, das vom nächsten Nachbarn der Kette belegt wird.
6.3.7
Was sind sichere Zustände?
Eine Zustand ist sicher, wenn er nicht in einem Deadlock ist und es eine Scheduling Reihenfolge gibt, so
dass alle Prozesse abgearbeitet werden können, selbst dann wenn alle Prozesse plötzlich die Maximale
Anzahl an Betriebsmittel fordern.
6.3.8
Was ist der Bankiersalgorithmus?
Der Bankiersalgorithmus verwendet das Prinzip der Verklemmungsvermeidung. Bei einer Anfrage eines
Kunden wird der Betrag probeweise zugeteilt und dann überprüft der Algorithmus, ob in der entstehenden Situation einen Verklemmung möglich ist, wenn ja, verweigert er die Geldausgabe. Dafür ist aber
nötig, dass der Algorithmus die zukünftigen Anforderungen der Prozesse (Kunden) abschätzen kann
(Kreditrahmen).
6.3.9
Was ist ein Betriebsmittelgraph?
Mit einem Betriebsmittelgraph lässt sich graphisch darstellen welche Prozesse welche Betriebsmittel
belegen und welche Prozesse welchen Betriebsmittel anfordern.
70
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
6.4. Speichermanagement
6.4
Speichermanagement
6.4.1
Was ist ein virtueller Speicher?
Virtueller Speicher ist Speicher der Programmen voll zur Verfügung steht, der aber grösser als der
tatsächlich vorhandene, physische Speicher ist.
6.4.2
Welche Verfahren zur Seitenersetzung kennen Sie?
Optimaler Algorithmus. Der optimale Algorithmus ist ein in der Praxis nicht umsetzbarer Algorithmus der aber zur Qualitätsbeurteilung von echten Algorithmen benutzt wird.
Algorithmus. Wenn eine Page Fault auftritt liegt eine bestimmte Anzahl von Seiten im Speicher.
Jeder dieser Seiten kann (theoretisch) eine Zahl zugeordnet werden, die der Anzahl der Instruktionen, die vergehen, bis diese Seite benutzt wird, entspricht. Der optimale Algorithmus entfernt die
Seite mit der höchsten Zahl, deren Benutzung also am weitesten in der Zukunft liegt.
Vor- und Nachteile. Es liegt auf der Hand, dass dieses Verhalten optimal aber nicht realisierbar ist.
NRU. Der Not Recently Used Algorithmus teilt Seiten entsprechende ihrer Reference- und ModifiedBits in Klassen ein und wählt eine möglichst lange nicht benutzte Seite.
Algorithmus. In den meisten Systemen gibt es Reference- und dein Modified-Bit. Falls dein Page
Fault auftritt, teilt der Algorithmus die Seiten in vier Gruppen ein
Class
Class
Class
Class
0:
1:
2:
3:
not referenced, not modified
not referenced, modified
referenced, not modified
referenced, modified
Nun entfernt der Algorithmus zufällig eine Seite aus der Klasse mit der niedrigsten Zahl. Vor- und
Nachteile. Es werden keine Seiten, die stark benutzt werden, entfernt und die Implementierung ist
einfach. Die Leistung des Algorithmus ist nicht wirklich optimal.
FIFO. Einfaches FIFO-Prinzip.
Algorithmus. Die Seiten werden in einer Queue verwaltet, falls ein Page Fault auftritt, wird die
älteste Seite entfernt und die Neue an das Ende der Queue angehängt.
Vor- und Nachteile. Die Implementierung ist sehr einfach aber das Problem ist, dass die älteste
Seite nicht unbedingt auch eine Seite ist, die selten genutzt wird.
Second Chance. Second Chance ist eine Erweiterung von FIFO die das Reference-Bit mit in die
Entscheidung einbezieht.
Algorithmus. Falls ein Page Fault auftritt geht der Algorithmus erst mal so vor wie FIFO und betrachtet den Kopf der Liste. Falls die das Reference-Bit der Seite am Kopf der Queue nicht gesetzt
wird, wird sie entfernt. Falls es gesetzt ist, bekommt sie eine zweite Chance und wird an das Ende
der Queue gehängt und der Algorithmus schaut sich die zweit-älteste Seite an.
Vor- und Nachteile. Ein Problem von Second Chance ist, dass es, wenn bei allen Seiten das
Reference-Bit gesetzt ist, zu FIFO degenerieren kann. Das andere Problem ist, dass das ständige
Umhängen von Seiten in der Queue aufwendig ist.
Clock. Clock ist nur eine bessere Implementierung von Second Chance.
Algorithmus. Bei Clock sind die Seiten in einer kreisförmigen Liste wie bei einer Uhr angeordnet.
Ein Zeiger zeigt auf die älteste Seite. Wenn nun ein Page Fault auftritt, prüft der Algorithmus ob
das Reference-Bit der ältesten Seite gesetzt ist. Wenn nicht, wird die Seite ersetzt. Falls es gesetzt
ist, wird es gelöscht und der Zeiger eine Position weiter gestellt.
Vor- und Nachteile. Dieser Algorithmus behebt die Implementierungsprobleme von Second Chance
und stellt einen realistischen Algorithmus dar.
LRU. Der Least Recently Used Algorithmus entfernt immer die Seite, die am längsten nicht benutzt
wurde.
Algorithmus. Man nimmt an, dass Seiten in letzter Zeit stark benutzt wurden, wohl auch in Zukunft noch benutzt werden, deshalb möchte man die am längsten nicht benutzte Seite entfernen.
Grundsätzlich könnte der Algorithmus mit einer Liste, die immer so organisiert wird, dass die am
längsten nicht genutzte Seite am Ende steht, realisiert werden. Dies ist aber sehr aufwendig. Mit
ein bisschen zusätzlicher Hardware geht es deutlich einfacher. Dazu benötigt man einen Counter
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
71
Kapitel 6. Betriebssysteme
der nach jeder Instruktion erhöht wird, ausserdem muss der Seitentabelleneintrag ein Feld haben
um einen Counterwert aufzunehmen. Bei jedem Speicherzugriff wird der aktuelle Counterwert in
dem entsprechenden Seitentabelleneintrag gespeichert. Falls ein Page Fault auftritt, wird die Seite
mit dem niedrigsten Counterwert entfernt. Eine andere Hardwareimplementierung verwendet eine
Matrix zur Speicherung derselben Information.
Vor- und Nachteile. Sehr guter Algorithmus, der aber Unterstützung der Hardware erfordert.
NFU. Not Frequently Used ist ein einfacher Versuch LRU mit Software zu simulieren.
Algorithmus. NFU verwendet einen Software-Counter für jede Seite der beim Einlagern der Seite
auf 0 gesetzt wird. Bei jedem Clocktick durchläuft das Betriebssystem alle Seiten und addiert den
Wert des Reference-Bits auf den Counter. Falls ein Page Fault auftritt, wird die Seite mit dem
niedrigsten Counterwert entfernt.
Vor- und Nachteile. Das Hauptproblem ist, dass NFU niemals etwas vergisst. Seiten die vergangener
Zeit extrem häufig benutzt wurden, haben einen hohen Counterwert und verlieren diesen nicht mehr,
auch wenn sie später gar nicht mehr benutzt werden.
Aging. Aging ist eine kleine Modifikation von NFU die den Algorithmus sehr nah an LRU bringt.
Algorithmus. Wieder hat jede Seite einen eigenen Counter. Diesmal wird der Counterwert bevor
das Reference-Bit addiert wird um ein Bit nach rechts verschoben. Ausserdem wird der Wert nicht
auf das Bit am weitesten rechts, sondern auf das Bit am weitesten links, addiert. Wenn ein Page
Fault auftritt wird die Seite mit dem kleinsten Counterwert entfernt. Eine Seite die lange nicht
benutzt wurde, hat viele führende Nullen und damit einen kleinen Wert.
Vor- und Nachteile. Dieser Algorithmus nähert LRU recht gut, verhält sich in zwei Punkten aber
doch unterschiedlich. Da pro Intervall von Clocktick zu Clocktick nur ein Bit gespeichert wird,
kann man nicht zwischen unterschiedlichen Zeitpunkten in einem Intervall speichern. Der andere
Unterschied ist auf die endliche Anzahl von Bits in den Countern zurückzuführen. Falls zwei Seiten
beide den Counter-Wert 0 haben, hat man keine Möglichkeit zu beurteilen, welche älter ist. In
der Praxis sind 8 Bits aber meist ausreichend da damit bei einem Clocktick-Intervall von 20ms ein
Zeitraum von 160ms überwacht werden kann.
Working Set. Alle bisher beschriebenen Algorithmen verwenden die Strategie des Demand Paging.
Ein Prozess wird zuerst ohne seine Seiten gestartet, die benötigten Seiten werden dann Stück für
Stück on demand eingelagert. Reale Programme haben meist bestimmte Lokalitätseigenschaften.
D. h. sie greifen während einer bestimmten Phase meist nur auf wenige ihrer Seite zu. Die Menge der
Seiten, die ein Prozess gerade benutzt, nennt man das Working Set. Bei den bisher aufgeführten
Ersetzungsstrategien, treten sehr viele Page Faults auf, bis das Working Set eines Prozesses im
Speicher ist. Beim Mehrprogrammbetrieb werden Prozesse oft komplett aus dem Speicher entfernt.
Die Idee ist nun dem Prozess, bevor er wieder gestartet wird, sein Working Set zur Verfügung
zu stellen. Diese Information muss vor dem Verdrängen des Prozesses gespeichert werden. Das
Einlagern der Seiten bevor der Prozess anläuft, wird als Prepaging bezeichnet.
Algorithmus. Wenn die Information über das Working Set eines Prozesses bekannt ist, kann man
daraus auch einen effizienten Seitenersetzungsalgorithmus ableiten. Falls ein Page Fault auftritt,
sollte eine Seite entfernt werde, die nicht Teil des Working Sets ist. Das Merken des Working Sets ist
sehr aufwendig, daher gibt es verschiedene Näherungslösungen. Eine besteht darin sich zu merken
welche Seiten der Prozess in den letzten τ Sekunden benutzt hat. Die CPU-Zeit die ein Prozess seit
seinem Start tatsächlich benutzt hat, nennt man current virtual time. Der Ersetzungsalgorithmus
arbeitet wie folgt. Wie immer ist in den Seitentabelleneinträgen das Reference-Bit gespeichert.
Zusätzlich hat jeder Eintrag noch ein Feld in dem die Zeit gespeichert wird, wann die Seite zuletzt
benutzt wurde. Bei jedem Clocktick wird das Reference-Bit gelöscht. Falls nun ein Page Fault
auftritt, wird die ganze Seitentabelle durchlaufen und wie folgt vorgegangen. Ist das Reference-Bit
gesetzt, wird die aktuelle Zeit im Eintrag gespeichert, dadurch wird gekennzeichnet, dass die Seite
benutzt wurde, als der Page Fault auftrat. Da diese Seite benutzt wurde, gehört sie zum Working
Set und sollte nicht entfernt werden. Falls das Reference-Bit 0 ist, wurde die Seite nicht benutzt
und stellt eine Kandidaten für die Auslagerung dar. Jetzt wird zuerst ihr Alter berechnet, (current
virtual time minus Zeit der letzten Benutzung). Falls das Alter grösser als τ ist, gehört die Seite
nicht mehr zum Working Set und wird ersetzt. Falls ihr Alter kleiner als τ ist, gehört die Seite
zum Working Set und wird verschont. Man merkt sich aber die Seite mit dem grössten Alter. Falls
sich beim Durchlauf rausstellt, dass alle Seiten zum mit gelöschten Reference-Bit zum Working Set
gehören, wird die mit dem höchsten Alter entfernt. Falls bei allen Seiten das Reference-Bit gesetzt
72
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
6.4. Speichermanagement
ist, wird eine Seit ausgelost (am besten eine saubere).
Vor- und Nachteile. Der Algorithmus ist sehr gut, aber aufwendig zu implementieren. Ausserdem
muss immer die komplette Seitentabelle durchlaufen werden.
WSClock. Dieser Algorithmus ist eine vereinfachte Implementierung des Working Set Algorithmus
der die Idee des Clock Algorithmus’ aufgreift.
Algorithmus. Wieder wird pro Seitentabelleneintrag das Reference-Bit, das Modified-Bit und die
Zeit des letzten Zugriffs gespeichert. Diesmal werden die Einträge in eine kreisförmigen Liste gespeichert und es gibt einen Zeiger der auf einen der Einträge zeigt. Zuerst wird wieder das Reference-Bit
getestet. Ist es gesetzt wurde diese Seite kürzlich benutzt und sollte nicht entfernt werden. Der
Algorithmus löscht das Reference-Bit und geht zur nächsten Seite. Wenn er dort eine Seite, deren
Reference-Bit nicht gesetzt ist, vorfindet, geht er wie folgt vor. Ist das Alter dieser Seite grösser als τ
gehört sie nicht zum Working Set. Falls sie dazu auch noch sauber ist, wird sie einfach ersetzt. Falls
sie nicht sauber ist, kann sie nicht einfach ersetzt werden. Um einen Prozesswechsel zu vermeiden,
wird sie nicht direkt auf die Platte geschrieben, sondern der Schreib-Auftrag wird geschedult und
der Zeiger auf die nächste Seite gesetzt. Es könnte ja sein, dass sich noch eine alte, saubere Seite
findet. Was passiert nun, wenn der Algorithmus einmal alle Seiten durchlaufen hat ohne eine alte,
saubere Seite zu finden. Jetzt müssen zwei Fälle unterschieden werden
1. mindestens ein Schreib-Auftrag wurde geschedult
2. kein Schreib-Auftrag wurde geschedult
Im ersten Fall macht der Algorithmus einfach weiter, früher oder später findet er eine alte, saubere Seite, da der Schreib-Auftrag irgendwann ausgeführt wird. Im zweiten Fall befinden sich alle
Seiten im Working Set, sonst währe ein Schreib-Auftrag abgegeben worden. Jetzt sucht sich der
Algorithmus einfach eine saubere Seite und ersetzt sie (die Position einer sauberen Seite kann er
sich während des Durchlaufs merken). Falls es keine saubere Seite gibt, dann hilft alles nichts, die
aktuelle Seite wird geschrieben und ausgetauscht.
Vor- und Nachteile. Wegen der recht einfachen Implementierung und der guten Performance, wird
WSClock in der Praxis häufig eingesetzt.
6.4.3
Was ist Fragmentierung?
Man unterscheidet zwischen interner und externer Fragmentierung.
Interne Fragmentierung. Im Zusammenhang mit Paging spricht man von interner Fragmentierung. Damit ist die Speichervergeudung gemeint, wenn Seiten nur halb belegt werden. Die interne
Fragmentierung spricht für eine kleine Seitengrösse, es gibt aber auch Argumente für grosse Seitengrössen.
Externe Fragmentierung. Im Zusammenhang mit Segmentierung spricht man von externer Fragmentierung. Hiermit ist das über die Dauer entstehende Muster aus belegtem Speicher und Löcher
gemeint, das beim Ein- und Auslagern von Segmenten entsteht. Mit Compaction kann man die
Löcher wieder zu einem einzigen grossen Loch zusammenfassen, was aber sehr aufwendig ist.
6.4.4
Was ist Paging?
Von Paging spricht man, wenn Prozess nicht unbedingt komplett, sondern auch teilweise im Speicher
gehalten werden können.
6.4.5
Was ist Swapping?
Von Swapping spricht man, wenn jeder Prozess immer komplett in den Speicher geladen wird. Beim
Prozesswechsel wird der Prozess (und alle zugehörigen) Daten auf die Platte ausgelagert und der neue
Prozess eingelagert.
6.4.6
Welche Programmierschnittstelle bietet die Speicherverwaltung an?
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
73
Kapitel 6. Betriebssysteme
Die meisten Betriebssysteme stellen den Userprozessen Systemaufrufe zum Anfordern und Freigeben
von Speicher zur Verfügung. Bei Unix heisst der Befehl zur Veränderung der Grösse des Datensegmentes
brk. Zusätzlich gibt es meist noch Befehle um Memory-Mapped Files einzurichten.
Die Verwaltung des virtuelle Speichers sollte für Prozesse und Programmierer transparent sein. Ein
Ausnahme ist der Einsatz von Shared Memory. Wollen sich zwei Prozesse zum schnellen Austausch von
Daten Speicher teilen, muss die Programmierschnittstelle der Speicherverwaltung Funktionen anbieten,
damit Prozesse solche gemeinsamen Speicherbereiche einrichten können, z. B. Memory-Mapped Files.
Windows bieten auch einige Funktionen an um das Paging zu kontrollieren, so kann man z. B. für eine
bestimmten Speicherbereich das Paging ganz ausschalten.
6.4.7
Wie erkennt man, dass auf eine Seite zugegriffen wurde?
Im Seitentabelleneintrag gibt es ein Reference-Bit. Diese wird gesetzt sobald auf die Seite zugegriffen
wird.
6.4.8
Ist die MMU ein Teil des Betriebssystems?
Nein. Sie ist heute meist Teil der CPU, kann bei älteren Systemen aber auch ausserhalb der CPU sein.
6.4.9
Welche Speicher-Einlagerungsstrategien kennen Sie?
On-Demand. Alle Seitenersetzungsstrategien ausser den auf Working Sets basierenden, verwenden
diese Strategie. Seiten werden dann eingelagert, wenn sie das erste Mal gebraucht werden.
Prepaging. Wenn die Working Set Information bekannt ist, kann das Working Set eines Prozesses
eingelagert werden, bevor er gestartet wird.
6.4.10
Was ist ein Working Set?
Die Menge der Seiten, die ein Prozess gerade benutzt, nennt man das Working Set.
6.4.11
Was ist das Buddy Verfahren?
Das Buddy-Verfahren wird von Linux zur Speicherverwaltung eingesetzt. Falls ein Stück Speicher
benötigt wird, wird die Grösse des Stücks zuerst auf eine Potenz von 2 aufgerundet und dann im
Speicher vorhandene Löcher solange halbiert bis es genau passt. Werden zwei nebeneinander liegende
Speicherbblöcke (Buddies) frei, werden sie wieder zusammengefasst.
6.5
I/O
6.5.1
Welche Schichten hat die E/A-Verwaltung?
User-level I/O Software
Device-independent OS software
Device drivers
Interrupt handler
Hardware
6.6
Betriebssystem-Design
6.6.1
Was ist ein Microkernel?
74
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
6.6. Betriebssystem-Design
Die Idee eines Microkernels ist es nur minimale Funktionalität in den Kernel einzubauen um die Effizienz und Zuverlässigkeit zu steigern. Zum Beispiel werden das Dateisystem und das Speichermanagement in Userprozesse ausgelagert. Durch die Modulare Struktur sind Microkernel-Systeme deutlich
übersichtlicher und daher besser wartbar. Die viele Funktionen in Userprozesse ausgelagert sind, sind
sie stabiler. Das abstürzen eine Userprozesses reisst den Kernel normalerweise nicht mit. Durch die
mit der Modularisierung verbundenen häufigen Wechsel zwischen User- und Kernelprozessen ist die
Performance von Microkernelsystemen etwas schwächer. Mach und Minix sind Microkernelsysteme.
6.6.2
Was bedeutet monolithisch?
Eine monolithische Struktur ist das genau Gegenteil eines Microkernels. Bei monolithischen Systemen
steckt alle betriebssystemrelevante Funktionalität im Kernel.
6.6.3
Welche Funktionen beinhaltet ein Microkernel?
Scheduling
6.6.4
Was gehört zum einem Betriebssystemkern?
Das kommt auf die Struktur des Systems an, Microkernel oder monolithisch. Was immer drin ist, ist
der Scheduler.
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
75
Kapitel 6. Betriebssysteme
6.7
Beispiele
6.7.1
Erklären Sie doch mal die Unterschiede zwischen Unix und Windows 2000.
Unix/Linux
Windows
Grösse (LOC)
Struktur
Linux 2.2: 1 M, Solaris 5.8: 2 M
Die Struktur hängt von der jeweiligen Unix-Version
ab. So hat MINIX z. B. eine Microkernel, Linux
dagegen ist monolithisch.
Schnittstelle
Unter Unix rufen Prozessen direkt die System Calls
auf. Diese werden über Bibliotheken zur Verfügung
gestellt.
Prozesse können bei Linux generell nur durch forken eines Prozesses erzeugt werden. Dadurch entsteht eine Prozesshierarchie. Die Unixprozesse entsprechen fast genau den Prozessbegriff wie er z. B.
im Tanenbaum verwendet wird. Ein Prozess hat
einen Thread of Control und ihm sind Ressourcen
aller Art zugeordnet.
29 M
Ab Version 4.0 ist NT absolut monolithisch, vorher
war es zwar auch kein Microkernel, aber es waren
doch einige Betriebssystemfunktionen in Userprozesse ausgelagert.
Windows versteckt die eigentlichen System Calls
hinter einer schwergewichtigen API mit enormen
Funktionsumfang.
Eine Prozesshierarchie gibt es Windows nicht.
Windows führt einige Begriffe ein. Ein Job ist
eine Sammlung von Prozessen, zu jedem Prozess
gehören einer oder mehr Threads. Prozesse stellen eher eine Verwaltungseinheit dar, ihnen fehlt
eigentlich der Thread of Control. Auf Userebene
kann ein Thread mehrere Fibers, leichtgewichtige
Threads enthalten.
Auch Windows verwendet Round-Robin Scheduling
mit dynamischen Prioritäten wobei Prozesse die
Prioritäten ihrer Threads beeinflussen können. Das
Windows Scheduling basiert auch nur auf Threads.
Fibers können nur von Prozessen selbst geschedult
werden.
Jedem Prozess stehen 4GB Speicher zur Verfügung
wobei in die oberen zwei GB bei jedem Prozesse das Betriebssystem eingeblendet ist, das aber
geschützt ist. Das liegt daran, dass bei Windows
bei einem Wechsel vom User- zum Kernelmodus
der selbe Prozess (Thread) weiter läuft. Ein Pagingdaemon versucht kontinuierlich den Speicher
möglichst frei zu halten. Der verwendete Ersetzungsalgorithmus basiert auf einem Working Set.
Windows verwendet aber kein Prepaging.
Windows bietet diverse Möglichkeiten zur Kommunikation, darunter Pipes, Named Pipes, Mailslots,
Sockets, RPC und Shared Files.
Prozesse
Scheduling
Unix und Linux verwenden Round-Robin Scheduling mit dynamischen Prioritäten. Das Linux Scheduling basiert auf Threads.
Speicher
Das Paging wird bei Unix von einem PagingDaemon durchgeführt der eine modifizierte Variante des Clock-Algorithmus’ einsetzt. Linux verwendet den Buddy-Algorithmus und ebenfalls einen
Clock-ähnlichen Ersetzungsalgorithmus. Es gibt
keine Working Set Verwaltung und kein Prepaging.
IPC
Prozesskommunikation läuft bei Unix vorwiegend
über Pipes, die eine Form des Nachrichtenaustausches darstellen. Zusätzlich können Prozesse über
Signale kommunizieren (siehe 6.7.3).
Unix ordnet jedem Benutzter eine UID dar und organisiert die Benutzter in Gruppen. Dateien werden die bekannten Rechte entsprechend der Userund Gruppen-ID zugeordnet. Durch das Everything is a File-Konzept lässt sich dieses Prinzip
z. B. auch auf Ein- und Ausgabe anwenden.
Unix folgt dem Everything is a File-Konzept.
Sicherheit
Misc
76
Windows wird jeder Benutzter und jede Gruppe
durch eine eindeutige Security ID (SID) identifiziert. Jeden Objekt kann eine ACL (siehe 3.5.4)
zugeordnet werden, die dem User entsprechende
Operation auf einem Objekt gestattet.
Bei Windows ist alles ein Objekt.
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
6.7. Beispiele
6.7.2
Hat Windows 2000 einen Microkernel?
In den ersten Versionen hatte NT zwar einen rechten schlanken Kernel, da er aber Speichermanagement,
Dateisystem u. Ä enthielt, konnte man nicht von einem Microkernel sprechen. Seit der Version 4.0 steckt
ein Grossteil der Funktionalität im Kernel, also erst recht kein Microkernel.
6.7.3
Was für Möglichkeiten bietet Unix zur Prozesskommunikation?
Pipes. Pipes stellen eine Form von Kommunikation über Nachrichten da. Zwischen zwei Prozessen kann ein Kanal angelegt werden. Jeder der Prozesse kann einen Datenstrom in diesen Kanal
schicken. Diese Kanäle heissen Pipes.
Software Interrupts. Prozesse können Signale an andere Prozesse verschicken. Die Prozesse können
dem System mitteilen wie es mit eingehenden Signalen umgehen soll. Dazu muss ein Prozess ein
Signalbehandlungsroutine angeben. Falls ein Signal eingeht, wird diese Routine sofort gestartet.
Signale können nur an Prozesse aus der eigenen Prozessgruppe (die Verwandten) geschickt werden.
Signal werden auch für andere Zwecke benutzt, so bekommt ein Prozess der durch 0 teilt ein SIGFPE
Signal geschickt.
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
77
Kapitel 7
Rechnernetze
7.1
Allgemeines
7.1.1
Wozu verwendet man Codierungen?
Codierung dient dazu, den Inhalt einer Nachricht in einer speicherbaren, verarbeitbaren und übermittelbaren Form darzustellen.
7.1.2
Welche Fehler treten in Netzwerken auf?
Daten können kaputt gehen
Daten können verloren gehen
Daten können in der falschen Reihenfolge ankommen
Leitungen können ganz zusammenbrechen
7.1.3
Wie kann man Fehler erkennen?
Das hängt von der Art der Fehler ab. Störungen innerhalb eines Frames können durch Prüfsummen erkannt werden. Verloren gegangene Frames können durch Bestätigungen erkannt werden. Flusskontrolle
stellt die richtige Reihenfolge sicher.
7.1.4
Unterschiede zwischen verbindungsorientierter und verbindungsloser Kommunikation?
Bei verbindungsorientierter Kommunikation muss der Sender zum Empfänger eine (virtuelle) Verbindung aufbauen, erst dann kann der Daten senden. Danach wird die Verbindung wieder abgebaut. Eine
Verbindung wird als eine sichere Kommunikation betrachtet. Normalerweise geht man davon aus, dass
die Daten bei Empfänger in der selben Reihenfolge ankommen, wie sie vom Sender verschickt wurden.
Dies ist bei verbindungsloser Kommunikation nicht sicher gestellt. Bei verbindungsloser Kommunikation
sendet der Sender einfach darauf los. Die Daten kommen beim Empfänger an oder auch nicht.
7.1.5
Was ist ein Multicast?
Bei einem Multicast kann eine Station an eine Gruppe von Empfänger eine Nachricht verschicken. Dies
muss unterschieden werden vom Broadcast, wo eine Station an alle anderen Stationen eine Nachricht
schickt.
7.1.6
Was sind LAN, MAN und WAN?
Name
Distanzen
Beispiel
Technologien
LAN
MAN
WAN
Local Area Network
< 1km
Büro
Ethernet, WLAN
Metropolitan Area Network
1 km – 10 km
Stadt
Cable, FDDI
Wide Area Network
> 10 km
Land
ATM
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
79
Kapitel 7. Rechnernetze
7.2
ISO–OSI–Referenzmodell
7.2.1
i Gegen Sie eine Kurzeinführung in das ISO–OSI–Schichtenmodell.
1. Physical Layer (Physische Schicht).
Die physische Schicht ist dafür zuständig rohe Bits über den Kommunikationskanal zu schicken.
Hier geht es um mechanische und elektrische Fragen, ausserdem spielt das Timing eine wichtige
Rolle. Die Implementierung ist meist stark von dem darunter liegenden Leiter abhängig.
Dienste. SendFrame und RecieveFrame
Protokolle.
Stichworte. Twisted Pair, Glasfaser, Funk, Satellit, Manchester-Codierung
2. Data Link Layer (Sicherungsschicht).
Die Sicherungsschicht berücksichtigt, dass die von der physischen Schicht gelieferten Bitströme mit
Fehler behaftet sein können. Sie ist für Fehlerkontrolle und Korrektur zuständig. Ausserdem teilt
die Sicherungsschicht die zu übertragenden Daten in sog. Frames auf. Desweiteren findet hier
die Flusssteuerung statt. Bei Netzen mit Vielfachzugriffsmedien gibt es noch eine Teilschicht, die
MAC-Layer, die für die Medienzugriffskontrolle sorgt.
Dienste. SendPacket, RecievePacket
Protokolle. HDLC, SLIP, PPP
Stichworte. Sliding Window, Bit-Stuffing
3. Network Layer (Netzwerkschicht).
Die Netzwerkschicht muss Pakete von der Quelle zum Ziel versenden können. Der Weg verläuft
normalerweise über mehrere Router, deshalb findet das Routing auf der Netzwerkschicht statt. Die
Netzwerkschicht stellt somit die erste Ende-zu-Ende Übertragungschicht dar, die Sicherungsschicht
überträgt die Daten nur von einem Ende des Leiters zum anderen. Ausserdem werden Stauprobleme
in Netzwerken in der Netzwerkschicht gelöst (und in der Transportschicht).
Dienste. SendTPDU, RecieveTPDU
Protokolle. IP, ARP, DHCP
Stichworte. Staukontrolle, Routing, IP
4. Transport Layer (Transportschicht).
Die Aufgabe der Transportschicht ist es einen zuverlässigen, kostengünstigen Transport von der
Quelle vom Ziel anzubieten. Dieser Transport muss unabhängig von der physischen Struktur der
Netzwerke die dazu dienen, sein. Manchmal werden die Schichten in zwei Teile zerlegt, die unteren
vier Schichten betrachtet man als den Transport Service Provider und die oberen Schichten als den
Transport Service User. Die Transportschicht stellt somit die Schnittstelle zwischen Anbieter und
Nutzer da, deshalb spielt sei eine besondere Rolle.
Dienste. Connect, SendData, RecieveData, Disconnect
Protokolle. TCP, UDP
Stichworte. Sliding Window, Three-Way Handshake
5. Session Layer (Sitzungsschicht).
Die Sitzungsschicht erlaubt es Benutzern an verschiedenen Maschinen Sitzungen zwischen ihnen
aufzubauen. Eine Sitzung ermöglicht gewöhnlichen Datentransport, wie die Transportschicht auch,
bietet aber zusätzliche Dienste, die für bestimmte Anwendungen wichtig sind.
Die Sitzungsschicht existiert im TCP/IP-Modell nicht und ist logisch schlecht von der Anwendungsschicht trennbar.
6. Presentation Layer (Darstellungsschicht).
Die Darstellungsschicht führt bestimmte Funktionen aus, deren häufige Verwendung eine allgemeine Lösung rechtfertigen. Die Darstellungsschicht kümmert sich auch um Syntax und Semantik der
übertragenen Information.
Die Darstellungsschicht existiert im TCP/IP-Modell nicht und ist logisch schlecht von der Anwendungsschicht trennbar.
Protokolle. MIME
7. Application Layer (Anwendungsschicht).
In der Anwendungsschicht sind viele bekannte Protokolle wie HTTP angesiedelt.
Protokolle. HTTP, FTP, SNMP, SMTP
80
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
7.2. ISO–OSI–Referenzmodell
Host A
7
Application
Application
Presentation protocol
6 Presentation
5
Host B
Application protocol
Presentation PPDU
Session protocol
Session
APDU
Session
SPDU
Transport
TPDU
Transport protocol
4
Transport
Router
Router
3
Network
Network
Network
Network
Paket
2
Data link
Data link
Data link
Data link
Frame
1
Physical
Physical
Physical
Physical
Medium
Medium
Bit
Medium
Die Darstellung zeigt das ISO-OSI-Schichtenmodell. Wichtig sind die folgenden Begriffe
Dienst (Service). Ein Dienst ist eine Menge von Operationen die eine Schicht der Schicht über ihr
anbietet. Es wird nichts über die Implementierung dieser Operationen ausgesagt.
Dienstprimitive. Die Dienstprimitive sind die Operation (Methoden), die eine Schicht der Schicht
über ihr anbietet. Es herrscht einige Verwirrung darüber welche Schicht nun welche Primitive
hat. Zum Beispiel wird manchmal behauptet, die Schicht 1 hätte die Primitiven SendBit und
RecieveBit. Das stimmt so nicht. Das sind nämlich genau die Primitiven des Leiters und nicht
der Schicht 1.
Protokoll. Protokolle definieren Regel für die Nachrichten die zwischen Instanzen der selben Schicht
ausgetauscht werden. Zwei Instanzen auf der selben Schicht können, wenn Sie wollen sich für ein
neues Protokoll entscheiden. Solange sie ihre Dienste nicht ändern, wird das Netz davon nicht
beeinflusst.
7.2.2
Was sind die Anforderungen an die einzelnen Schichten?
siehe 7.2.1.
7.2.3
Nennen Sie für jede Schicht ein Beispielprotokoll.
siehe 7.2.1.
7.2.4
Wer hat das OSI-Schichtenmodell entworfen?
Das OSI-Modell basiert auf einem Vorschlag der von der ISO ausgearbeitet wurde.
7.2.5
Warum vertikale und nicht horizontale Einteilung?
Mit vertikaler Einteilung wird ein Schichtenmodell impliziert, siehe 7.2.8. Horizontale Einteilung entspricht einer Partitionierung mit komplizierteren Abhängigkeiten.
7.2.6
Was bedeutet das Open ins OSI?
Unter Open Systems versteht man Systeme die für die Kommunikation mit anderen Systemen offen
sind.
7.2.7
Unterschied zwischen ISO–OSI–Referenzmodell und Schichtenmodell des Internet?
Das TCP/IP-Modell spezifiziert weder Schicht 1 noch Schicht 2. Ausserdem nimmt es oberhalb der
Schicht 4 keine Trennung mehr vor. Die Darstellung zeigt die beiden Modelle.
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
81
Kapitel 7. Rechnernetze
OSI
7 Application
6 Presentation
5
Session
4
Transport
3
Network
2
Data link
Physical
1
7.2.8
TCP/IP
Application
Transport
Network
Host-tonetwork
Was für einen Sinn hat das Schichtenmodell?
Reduzierung der Komplexität und Austauschbarkeit.
7.2.9
Was ist ein SAP?
Ein SAP ist ein Service Access Point oder ein Dienstzugriffspunkt. Dies ist der Punkt in dem die Schicht
n der Schicht n + 1 ihre Dienste zur Verfügung stellt.
7.3
Schichtübergreifend.
7.3.1
Auf welcher Schicht ist ein Hub angesiedelt?
Physische Schicht.
7.3.2
Auf welcher Schicht ist ein Switch angesiedelt?
Sicherungsschicht.
7.3.3
Auf welcher Schicht ist eine Bridge angesiedelt?
Sicherungsschicht.
7.3.4
Auf welcher Schicht ist ein Router angesiedelt?
Netzwerkschicht.
7.3.5
Beschreiben Sie Ethernet.
Ethernet ist eine LAN-Technologie, die durch IEEE 802.3 standardisiert ist und eine Übertragungsrate
von 10 MBit/s bietet. Ethernet kann mit Coax, Twisted-Pair und Glasfaser eingesetzt werden. Es
handelt sich um ein Broadcastnetz, dass CSMA/CD als Zugriffsverfahren einsetzt und die ManchesterCodierung verwendet. Als Adressen verwendet Ethernet die weltweit eindeutigen 48 Bit MAC Adressen.
Ethernet selbst bietet nur verbindungslose Kommunikation ohne Bestätigung. Es kann aber durch die
Logical Link Control (LLC)-Schicht erweitert werden, die auch verbindungsorientierte Kommunikation
erlaubt. Dann ist die Sicherungsschicht in zwei Schichten, die MAC-Schicht und die LLC-Schicht zerlegt.
Die Medium Access Control (MAC)-Schicht beinhaltet das Vielfachzugriffsverfahren. Die Logical Link
Control (LLC)-Schicht bietet die verbindungsorientierte Kommunikation, die LLC ist durch IEEE 802.2
definiert. Ethernet ist sehr einfach und günstig und daher sehr weit verbreitet. Dies gilt insbesondere,
da auch schnellere Varianten von Ethernet, Fast Ethernet und Gigabit Ethernet mit 100 bzw. 1000
MBit/s existieren.
7.3.6
Was wissen Sie über TCP/IP
siehe 7.7.12 und 7.8.3.
82
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
7.4. Schicht 1
7.4
Schicht 1
7.4.1
Was gibt es für Medien?
Kabel
Coax
Twisted Pair
Lichtwellenleiter
Multimode Fiber
Monomode Fiber
Drahtlos
Funk
Mikrowellenfunk
Infrarot
Laser
7.4.2
Wie funktionieren Lichtwellenleiter?
Ein Lichtwellenleiter besteht aus einer sehr dünnen Glasfaser, die von einer Glasshülle umschlossen wird.
Das ganze wird dann noch durch eine Kunsstoffhülle geschützt. Am einen Ende der Leitung sitzt eine
Lichtquelle, zum Beispiel eine Laserdiode, am anderen Ende sitzt ein Detektor. Vereinbarungsgemäss
steht Licht an für 1 und Licht aus für 0. Aufgrund der Brechungs- und Beugungsgesetze verlässt
das Licht den Leiter nicht, sondern ist praktisch in ihm gefangen und kann wegen der minimalen
Dämpfung über sehr weite Entfernungen übertragen werden.
7.4.3
Welche Arten von Lichtwellenleitern gibt es?
siehe 7.4.1.
7.5
Schicht 2a
7.5.1
Welche Medienzugriffsverfahren kennen Sie?
siehe 7.5.7.
7.5.2
Erklären Sie CSMA-CD.
In der 1-persistenten Variante läuft CMSA/CD so ab:
– sendewillige Station überwacht den Kanal (Carrier Sense)
– ist der Kanal frei, wird gesendet
– ist der Kanal belegt, wird er weiter überwacht bis er frei ist, dann wird sofort übertragen
– während der Übertragung wird der Kanal weiter abgehört
– bei Erkennung einer Kollision wird die Übertragung abgebrochen und ein JAM-Signal gesendet
– danach wird entsprechend des Binary-Backoff-Algorithmus’ gewartet
– jetzt geht es von Vorne wieder los
7.5.3
Wie funktioniert ALOHA?
ALOHA ist ein Vielfachzugriffsverfahren ohne Reservierung und ohne Carrier Sense. Es gibt zwei
verschiedene Arten von ALOHA.
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
83
Kapitel 7. Rechnernetze
pure ALOHA. Bei pure ALOHA kann jede Station senden, wann sie will, sie macht kein Carrier
Sensing. Während des Sendens hört die Station weiter mit und kann dadurch erkennen, ob ihre
Daten korrekt gesendet wurden oder nicht. Wenn es einen Fehler gab, sendet sie einfach nochmal.
Die maximale Ausnutzung der Bandbreite liegt bei 18%.
slotted ALOHA. Bei slotted ALOHA wird die Zeit in sog. Slots unterteilt. Um die Slots zu synchronisieren, kann z. B. eine Station als Taktgeber fungieren. Bei slotted ALOHA dürfen die Station
nicht zu jeder Senden, sondern immer nur zu Beginn eines Slots. Durch slotted ALOHA kann die
Leistung in etwa verdoppelt werden.
7.5.4
Was ist DQDB?
DQDB ist in der IEEE Norm 802.6 definiert und beschreibt ein MAN. DQDB wird in der 4. Auflage
des Tanenbaums nicht mal erwähnt, scheint also nicht mehr relevant zu sein.
7.5.5
Wie funktioniert FDDI?
Fiber Distributed Data Interface ist ein Lichtwellenleiter basiertes Token-Ring-LAN, das 100 Mbps über
Entfernungen von 200km unterstützt. FDDI wird in der 4. Auflage des Tanenbaums nur noch am Rande
erwähnt.
7.5.6
Wie funktioniert die Manchester-Codierung?
Codierungsverfahren, bei dem die binären Informationen durch Spannungswechsel innerhalb der Bitzeit
dargestellt werden. Dadurch können Sender und Empfänger wesentlich leichter synchronisiert werden,
denn der Übergang in der Mitte der Bitzeit gibt einen zuverlässigen Takt. Eine binäre 1 wird durch
ein High-Signal gefolgt von einem Low-Signal dargestellt, ein 0 genau umgekehrt. Die ManchesterCodierung ist self-clocking , d.h. es muss kein extra Taktsignal gesendet werden. Der Empfänger
kann den Takt selbst erkennen. Deshalb hat bei Ethernet jeder Frame eine 7 Byte lange, aus der Folge
10 bestehende, Präambel.
Nachteil der Manchester-Codierung ist, dass die doppelte Bandbreite
benötigt wird.
7.5.7
Geben Sie eine Einteilung der Vielfachzugriffsverfahren an.
Vielfachszugriffsverfahren
ohne Reservierung
ohne
Carrier Sense
pure
Aloha
7.5.8
slotted
Aloha
mit Reserverierung
mit
Carrier Sense
p-persistent
nonpersistent
statisch
TDM
dynamisch
FDM
Token
Wie funktioniert der Binary-Back-Off-Algorithm?
Nach i Kollision wird eine Zufallszahl zwischen 0 und 2i − 1 gewählt. Entsprechend dieser Zufallszahl
wird gewartet. Nach 10 Kollisionen wird die Wartezeit nicht mehr erhöht. Nach 16 Kollisionen meldet
der Controller einen Fehler.
7.5.9
Was ist der Konfliktparameter?
Eine Nachricht darf bei CSMA/CD nicht komplett in den Kanal passen, sonst kann eine Kollision
auftreten, ohne dass die sendende Station das bemerkt. Betrachten wir den Worst-Case.
84
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
7.5. Schicht 2a
Wir haben zwei Stationen A und B, die genau an den beiden Enden des Mediums liegen. Jetzt sendet
A einen Frame FA . Kurz bevor der Frame am anderen Ende des Kabels ist, sendet die dortige Station
einen Frame FB . B erkennt den Frame FA von A und sendet wegen der Kollision sofort ein JAM-Signal
J. Dieses muss jetzt aber wieder über das ganze Kabel bis zu A. Wichtig ist das A zu den Zeitpunkt,
in dem das JAM-Signal bei ihm eintrifft noch nicht mit dem Senden des Frames F A fertig ist, sonst
würde sie nichts von der Kollision mit bekommen.
Um das zu gewährleisten gibt man den Frames eine Mindestlänge, so dass eine sendende Station mindestens so lang mit senden beschäftigt ist, wie das Signal zum Ende des Leiters und das JAM-Signal
zurück benötigt. Die maximale Kabellänge muss natürlich auch spezifiziert sein.
Nehmen wir an die Signallaufzeit von einem Ende des Mediums zum anderen beträgt t Zeiteinheiten,
dann muss eine Station zum Senden eines Frames mindestens 2 · t Zeiteinheiten benötigen, damit nichts
schief geht. Der Konfliktparameter K beschreibt genau diesen Zusammenhang:
K=
2·t
∆t
Wobei ∆t die Nachrichtenübertragungszeit ist. Um das vorhergesagte zu formalisieren, fordern wir dass
K=
2·t
<1
∆t
immer gelten muss. Wenn wir für ∆t den Quotienten aus Framelänge l und Kanalübertragungsrate λ
einsetzen, können wir die minimale Framelänge lmin berechnen.
K
lmin
7.5.10
=
⇓
>
2·t
2tλ
=
<1
∆t
l
2tλ
Wie funktioniert Token Ring?
Token Ring verwendet ein dynamisches Vielfachzugriffsverfahren mit Reservierung. Ein Token kreist in
dem (physischen) Ring. Wenn eine Station senden will, muss sich den Token vom Ring nehmen. Nur
wer einen Token hat darf senden.
7.5.11
Vergleiche Sie CSMA/CD und Token Ring/Bus?
Da ein Token verloren oder kaputt gehen kann oder eine Station eine Token nicht mehr her geben kann,
ist das Tokenmanagement von Token Ring/Bus ist deutlich aufwendiger als CSMA/CD. Siehe dazu
auch 7.5.12.
7.5.12
Was passiert bei Token Ring, wenn eine Station ausfällt?
Ein wirkliches Problem ergibt sich beim Ring, wenn das Kabel reisst. Falls eine Station ausfällt (oder
abgeschaltet) wird entfällt auch die Verzögerung die sie normalerweise auf das Token hat, das Token
muss dann eventuell an anderer Stelle stärker verzögert werden. Ein anderes Problem ist, dass es bei
Token Ring immer eine Überwachungsstation gibt, die dafür u. a. dafür zuständig verloren gegangene
Tokens zu ersetzen. Fällt diese aus, muss eine andere einspringen, was oft zu Problemen führt.
7.5.13
Was ist der Vorteil von Switched Ethernet?
Die Kollisiondomänen sind kleiner, dadurch gibt es weniger Kollisionen. Die Sicherheit wird erhöht, da
nicht jede Station den ganzen Datenverkehr mit bekommt.
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
85
Kapitel 7. Rechnernetze
7.6
Schicht 2b
7.6.1
Was ist Sliding Window ?
Sliding Window beschreibt ein Verfahren zur Flusskontrolle das flexibler als Stop-And-Wait ist. Die
Idee ist folgende. Bei Stop-And-Wait muss der Sender immer auf die Bestätigung für einen Frame
warten, bevor er den nächsten senden darf. Bei langen Signallaufzeiten wird dadurch sehr viel Kapazität
verschwendet. Besser wäre es, wenn der Sender mehrere Frames verschicken kann und dann nach und
nach die Bestätigungen bekommt. Grundvoraussetzung für Sliding Window ist, dass jeder Frame eine
eindeutige Sequenznummer hat. Damit können Duplikate unterschieden werden. Sowohl der Sender wie
auch der Empfänger haben ein Fenster von Sequenznummern, die bei beiden unterschiedliche Funktionen
erfüllen. Diese Fenster heissen entsprechen Sendefenster und Empfangsfenster. Beide Fenster sind
jeweils durch eine unter und obere Grenze begrenzt. Diese Grenzen sind Sequenznummern.
Die Sequenznummer im Sendefenster sind die Frames die verschickt wurden oder verschickt werden
dürfen, für die aber noch keine Bestätigung eingegangen ist. Wenn ein Paket von der Netzwerkschicht
kommt wird ein Frame mit der nächsten höchsten Sequenznummer erstellt und die obere Grenze des
Sendefensters wird um eins erhöht. Dadurch verwaltet das Sendefenster immer eine List von noch
nicht bestätigten Frames. Da theoretisch all diese Frames verloren gehen könnten, muss der Sender von
jedem eine Kopie speichern. Dafür braucht er Speicherplatz und daher ist Grösse des Fensters begrenzt.
Falls die Grösse des Fensters erschöpft ist und die Netzwerkschicht weiterhin versucht neue Pakte zu
verschicken, muss die Sicherungsschicht der Netzwerkschicht signalisieren, sich zu gedulden und keine
neuen Pakete mehr anzuliefern, bis wieder Platz im Sendefenster entstanden ist. Der Sender muss
ausserdem aufhören zu Senden, wenn ihm die Sequenznummern ausgehen. Wenn z. B. 3 Bits für die
Sequenznummer verwendet werden, kann er 8 Frames verschicken ohne eine Bestätigung zu bekommen,
dann muss er auf eine Bestätigung warten.
Das Empfangsfenster entspricht den Frames die der Empfänger bereits ist anzunehmen. Alle ankommenden Frames, die ausserhalb des Fensters liegen, werden sofort verworfen. Wenn ein Frame ankommt, dessen Sequenznummer der unteren Grenze des Empfangsfensters entspricht, wird dieser an
die Netzwerkschicht weitergegeben, eine Bestätigung verschickt und das ganze Empfangsfensters (ober
und untere Grenze) um eins nach oben geschoben (rotiert). In der Bestätigung, die an den Sender
geschickt wird, steht die Sequenznummer des letzten korrekt erhaltenen Frames, so weiss der Sender,
ob alles klar gegangen ist und kann das nächsten Frame verschicken. Falls der Empfänger einen Frame
empfängt, der nicht die aktuell erwartete Sequenznummer hat, kann er nach zwei Strategien vorgehen.
Die einfachere wird go back n genannt. Der Empfänger akzeptiert die Frames einfach nicht und sendet
keine Bestätigungen (dieses Verfahren ergibt sich automatisch, wenn die Grösse des Empfangsfensters 1
ist). Die aufwendigere Methode nennt sich selective repeat. Wenn der Empfänger einen Fehler entdeckt,
schickt er dem Sender eine negative Bestätigung (NAK) und sagt ihm genau, welcher Frame fehlt, der
Sender kann diesen dann nochmal schicken. Erst wenn der Empfänger eine vollständige Sequenz von
Frames hat, gibt er diese an die Netzwerkschicht weiter.
Wichtig ist, dass die Reihenfolge der Frames beim Senden zwar durcheinander kommen kann, aber der
Netzwerkschicht die Pakete immer in der richtigen Reihenfolge übergeben werden.
7.6.2
Welche Verfahren zur Flusssteuerung kennen Sie?
Zur Flusskontrolle gibt es feedback-basierte Mechanismen und rate-basierte Mechanismen, in der Sicherungsschicht werden aber nur feedback-basierte Mechanismen eingesetzt. Zwei Protokolle sind StopAnd-Wait und Sliding Window. Sliding Window wird in 7.6.1 beschrieben. Stop-And-Wait ist sehr
einfach. Der Sender sendet einen Frame, dann wartet er solange, bis er eine Bestätigung vom Empfänger
bekommen hat. Erst dann sendet er den nächsten Frame.
7.6.3
Wie teilt der Empfänger bei dem Sender Sliding Window mit, dass er mit dem Senden aufhören soll?
Wenn der Empfänger überfordert ist, sendet er keine Bestätigungen mehr. Dadurch muss der Sender
früher oder später aufhören zu Senden, da sein Sendefenster erschöpft ist.
Bei HDLC (7.6.7) kann der Empfänger einen Supervisory-Frame vom Typ Recieve Not Ready an
den Sender schicken.
86
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
7.6. Schicht 2b
Bei TCP schickt der Empfänger dem Sender immer die Grösse seines Empfangsfensters mit, wenn er
überfordert ist, schickt er eine 0.
7.6.4
Wie funktioniert CRC?
Die Grundidee von CRC ist, dass man eine Folge von n Bits als ein Polynom vom Grad n − 1 dessen
Koeffizienten nur 0 oder 1 sind, betrachten kann. Polynomielle Arithmetik wird modulo 2 durchgeführt,
daher entspricht Addition und Subtraktion einem einfach XOR. Das Prüfsummenverfahren läuft nun
wie folgt ab. Sender und Empfänger einigen sich auf eine Generatorpolynom G(x), wobei das höchste
und das niedrigste Bit 1 sein muss. Um einen Frame mit m Bits, die dem Polynom M (x) entspricht
zu verschlüsseln, muss der Frame länger sein als das Generatorpolynom. Nun hängt man an den
eigentlichen Frame eine Checksumme an, so dass das gechecksummte Frame durch G(x) teilbar ist.
Wenn der Empfänger eine Frame erhält versucht er ihn durch G(x) zu teilen. Gibt es einen Rest, liegt ein
Übertragungsfehler vor. Dadurch ergibt sich folgender Algorithmus zur Berechnung der Checksumme:
1. r sei der Grad von G(x). An den Frame werden auf der niederwertigen Seiten r 0-Bits angehängt.
Er hat jetzt m + r Bits und entspricht dem Polynom xr M (x).
2. Diese Polynom xr M (x) wird nun entsprechen der Modulo-2-Division durch G(x) geteilt.
3. Dabei ergibt sich ein Rest von r oder weniger Bits. Dieser wird nun von Bitstring der x r M (x)
entspricht entsprechend der Modulo-2-Subtraktion abgezogen. Das ist nun der gechecksummte
Frame, der T (x) genannt wird.
Es stellt sich die Frage, warum T (x) durch G(x) teilbar ist. Das ist eine fundamentale Eigenschaft der
Division, es gilt immer:
Divisor | Dividend − Rest
Zum Beispiel gilt für 9/4 mit Rest 1: 4 | 9 − 1. Die Güte der Checksumme ist bei CRC abhängig vom
Grad des Generatorpolynoms. Allgemein gilt mit einem Generatorpolynom vom Grad k findet man
alle Bit-Fehler der Länge ≤ k. Wenn man das Polynom geschickt wählt kann man ausserdem noch alle
Bitfehler die eine ungerade Anzahl an Bits betreffen finden. Das liegt daran, dass kein Polynom mit
einer ungeraden Anzahl an Termen das Polynom x2 + 1 als Faktor hat. Wenn x2 + 1 ein Faktor des
Generatorpolynoms ist, dann findet man die ungeradlängigen Bitfehler. Es gibt einige international
standardisierte Polynome. Ethernet verwendet das folgende Polynom vom Grad 3
x32 + x26 + x23 + x22 + x16 + x12 + x11 + x10 + x8 + x7 + x5 + x4 + x2 + x1 + 1
Die Berechnung der CRC kann in Hardware sehr effizient gelöst werden.
7.6.5
Welche Fehler werden durch CRC erkannt?
siehe 7.6.4.
7.6.6
Wie sichert man Nachrichteninhalt?
Mit Checksummen, z. B. CRC (siehe 7.6.4).
7.6.7
Was ist HDLC?
High-Level Data Link Control ist ein älteres bitorientiertes Sicherungsprotokoll das vor allem in öffentlichen
Paketvermittlungsnetzen eingesetzt wird. Das Protokoll nutzt ein Flag und bit-stuffing um die Frames
voneinander zu trennen. Zur Flusskontrolle wird ein Sliding Window verfahren mit einer 3 Bit Sequenznummer verwendet. Es gibt drei verschiedene Arten von Frames: Information, Supervisory und
Unnumbered. Wobei Information-Frames für normale Datenübertragung, Supervisory-Frames für Signalisierung und die Unnumbered-Frames für verschieden Zwecke verwendet werden. Unnumbered-Frames
können für verbindungslose Kommunikation benutzt werden. Die Supervisory-Frames können verschiedene Typen haben. Wichtige Typen sind Recieve Ready für normale Bestätigung und Reject für
negative Bestätigung. Zusätzlich gibt es Recieve Not Ready um den Sender mitzuteilen, dass der
Empfänger nicht mehr mitkommt und Selective Reject um einen Fehler für einen bestimmten Frame
anzuzeigen.
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
87
Kapitel 7. Rechnernetze
7.7
Schicht 3
7.7.1
Erklären Sie, was Schicht 3 macht.
siehe 7.2.1.
7.7.2
Was sind statische und adaptive Routing-Verfahren?
Bei statischen Routing-Verfahren werden die Wegewahlentscheidungen im Vorhinein ohne bestimmt.
Adaptive Routing-Verfahren passen die Entscheidungen mit Messungen an die aktuellen Gegebenheiten
an.
7.7.3
Ist auf Schicht 3 eine zuverlässige Übertragung möglich?
Schicht 3 kann sowohl verbindungsorientiert als auch verbindungslos sein. IP ist eine Beispiel für eine
verbindungslose Technik, ATM für eine verbindungsorientiert.
7.7.4
Wie funktioniert Routing im Internet?
In autonomen Subnetzen (AS) wird heute hauptsächlich OSPF eingesetzt. Zwischen den AS meisten
BGP.
7.7.5
Erklären Sie Shortest-Path-First-Routing.
Beim Shortest-Path-Routing werden die kürzesten Pfade im Netzwerk mit einem typischen Algorithmus wie Dijkstra bestimmt. Das Kantengewicht kann auf verschiedene Arten gewählt werden. Es kann
einfach immer 1 betragen, den zählt man nur die Hops oder man wählt andere Faktoren wie die physische Distanz, Übertragungszeit oder die durchschnittlichen Queueingzeiten. Auch eine Kombination
der Faktoren ist möglich. Die Routingentscheidungen werden dann entsprechend der kürzesten Wege
bestimmt.
7.7.6
Erklären Sie Distance-Vector-Routing.
Distance-Vector-Routing ist ein dynamischer Algorithmus, der wie folgt funktioniert. Jeder Router
verwaltet einen Vektor mit den besten bekannten Entfernungen zu jedem Ziel und der entsprechenden Leitung. Diese Tabelle werden immer wieder geupdatet in dem mit den Nachbarn Informationen
ausgetauscht werden. Für jeden Zielrouter enthält der Vektor einen Eintrag mit der zu wählenden Ausgangsleitung und einen Eintrag für die geschätzte Entfernung zum Ziel. Mögliche Metriken hier sind
Hops, Übertragungszeit oder Queueingzeiten. Jeder Router kennt die Entfernung zu seinen Nachbarn,
falls die Metrik nicht Hops ist, kann der Router die Entfernung anhand einer Analyse seiner Queue
oder durch Messung von Signallaufzeiten bestimmen. In einem bestimmten Zeitintervall verschickt jeder Router die von ihm geschätzten Zeiten an seine Nachbarn. Mit den neu erhaltenen Tabellen der
Nachbarn kann jeder Router entscheiden, ob es bessere Wege zu manchen Zielen gibt, als in seinem
Vektor gespeichert ist.
Distance-Vector-Routing hat ein grosses Problem, es findet zwar eine gute Konfiguration, aber sehr
langsam. Das Problem ist vor allem, dass sich gute Nachrichten sehr schnell, schlechte aber sehr langsam
verbreiten. Das ist als Count-to-Infinity-Problem bekannt. Der Kern des Problems liegt daran, dass
wenn X Y mitteilt, dass er irgendwohin einen Pfad hat, Y nicht weiss, ob er selber auf dem Pfad liegt
oder nicht.
7.7.7
Erklären Sie Link-State-Routing.
Link-State-Routing ist adaptiver Routing-Algorithmus bei dem Informationen über die Netztopologie
und alle Verzögerungszeiten gesammelt und an jeden Router verteilt wird. Dann können mit dem
Dijkstra-Algorithmus die kürzesten Pfade bestimmt werden. Jeder einzelne Router geht nach folgenden
Schritten vor:
88
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
7.7. Schicht 3
1. Nachbarn entdecken und deren Adressen merken.
Als erstes Sendet der Router über jede seiner Leitungen ein Hello-Paket. Als Antwort erhält er
vom Router auf der anderen Seite dessen Adresse. Diese Adressen müssen eindeutig sein.
2. Die Verbindungskosten zu jedem Nachbarn messen.
Jetzt sendet er an jeden Nachbarn ein Echo-Paket um die Verzögerung zu messen. Er kann dies
mehrmals durchführen und einen Durchschnittswert wählen. Ob hierbei die Auslastung der Leitung
mit in die Kalkulation aufgenommen wird, ist ein Diskussionspunkt.
3. Ein Paket zusammenstellen, dass die gerade gelernten Informationen enthält. Jetzt baut der Router
ein Paket mit den gewonnen Informationen zusammen. Diese Paket enthält die Adresse des Router,
eine Sequenznummer, ein Alter und eine Liste der Nachbarn. Für jeden Nachbarn enthält es die
gemessene Verzögerungszeit. Die Frage ist nur, wann die Pakete verschickt werden. Dies kann
entweder periodisch erfolgen oder wenn ein besonderes Ereignis, zum Beispiel ein nicht erreichbarer
Router, auftritt.
4. Dieses Paket an alle anderen Router schicken.
Das verschicken des Pakets ist er komplizierteste Teil, das sich Inkonsistenzen ergeben können, wenn
manchen Router schon die neuen Information erhalten haben und andere nicht. Grundsätzlich
basiert das Verfahren bei der Verteilung auf Flooding. Um das Flooding kontrollieren zu können,
versieht der Router jedes Paket, das er versendet mit einer neuen Sequenznummer. Jeder Router
speichert eine List von Paaren (Router, Sequenznummer), die er gesehen hat. Wenn ein neuen Paket
ankommt, prüft er ob dieses neu ist, wenn ja verschickt er es an alle Router ausser dem Quellrouter.
Wenn es ein Duplikat ist, verwirft er es. Wenn er ein Paket mit einer niedrigeren Sequenznummer
als die höchste, die der Router bisher gesehen hat, ankommt, lehnt er das Paket ab, weil es alt ist.
Es ergeben sich ein Paar Probleme, die aber in den Griff zu bekommen sind. Als erstes müssen die
Sequenznummern am besten 32-bitig sein, damit sie nicht überlaufen. Wenn ein Router ausfällt
und seine Sequenznummer vergisst, daher wieder bei 0 anfängt, werden seine Pakte nirgendwo mehr
angenommen. Falls eine Paket kaputt geht und z. B. statt der Sequenznummer 4 eine 65.540 enthält,
was auf einen 1-Bitfehler zurückzuführen ist, werden alle Pakete zwischen Sequenznummer 5 und
65.540 nicht mehr angenommen. Alle Probleme können mit dem Age-Feld der Pakete behoben
werden. Das Alter eines bereits empfangenen Paketes wird jede Sekunde um 1 herunter gezählt.
Paket mit Alter 0 sterben. Das Alter wird am Anfang so gesetzt, das normalerweise immer ein
neues Paket vom entsprechenden Router ankommt, bevor es stirbt. Ausserdem wird beim Flooding
am Anfang das Alter bei jedem Hop herunter gezählt, damit Paket nicht verloren gehen können.
5. Kürzeste Pfade zu allen Router berechnen.
Wenn ein Router die komplette Menge an Link-State-Paketen bekommen hat, kann er daraus die
Topologie des kompletten Netzes erschliessen und mit Hilfe von Dijkstra die kürzesten Pfade berechnen.
Der Algorithmus funktioniert sehr gut und wird zum Beispiel bei OSPF eingesetzt. Defekte Hardoder Software kann den Algorithmus aber empfindlich stören. Wenn z. B. ein Router behauptet eine
bestimmte Verbindung zu haben, wird der Graph auf dem die Berechnung basiert, inkorrekt.
7.7.8
Erklären Sie OSPF.
OSPF ist ein Internet Routing Protokoll für autonome Subnetze, es wird ein Link-State-RoutingAlgorithmus verwendet, siehe dazu 7.7.7.
7.7.9
Nennen Sie ein nicht-adaptives, isoliertes Routing-Verfahren.
Ich denke, hier ist Broadcasting gemeint.
7.7.10
Was ist RIP?
RIP ist ein älteres Internet Routing Protocol, es verwendet Distance-Vector-Routing, siehe dazu 7.7.6.
7.7.11
Unterschied zwischen IPv4 und IPv6
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
89
Kapitel 7. Rechnernetze
Die wichtigsten Unterschiede zwischen IPv4 und IPv6 sind
IPv6 benutzt 16 Byte Adresse, das entspricht ca. 3, 4 · 1038 Adressen. Das Adressproblem ist damit
behoben.
Die Unterstützung für Optionen wurde verbessert. Zum einen dadurch, dass das Optionsfeld im
IP-Header grösser ist, zum anderen werden die Information jetzt so gespeichert, das Router über
Informationen, die nicht für sie bestimmt sind, einfach hinweg springen können.
IPv6 hat verbesserte Unterstützung für Quality of Service.
IPv6 hat Unterstützung für diverse Sicherheitsmechanismen wie Authentifizierung.
7.7.12
Erzählen Sie etwas zum IP-Protokoll.
Das IP-Protokoll ist ein verbindungsloses Schicht 3 Protokoll. Zur Adressierung werden die bekannten
IP-Adressen verwendet. Jedes IP-Paket besteht aus einem Header- und einem Datenteil. IP Pakete
können bis 65.535 Bytes lang sein, sind aber in der Praxis meist 1500 Byte lang.
7.7.13
Wozu braucht man das TTL-Feld im IP-Header?
Das Time to Live-Feld im IP-Header wird bei jedem Hop runtergezählt, damit z. B. zyklisch geroutete
Paket nicht ewig Kreisen (bei TTL=0 stirbt das Paket).
7.7.14
Was ist Flooding?
Flooding ist ein sehr einfaches statisches Routingverfahren bei dem jedes ankommende Pakete über
alle Leitung aus der Quellleitung weitergeleitet wird. Damit Flooding nicht ausartet, muss es irgendwie
eingedämmt werden, entweder durch Hopcounter oder es werden Sequenznummern vergeben, so dass ein
Router ein bereits einmal gefloodetes Paket nicht nochmal floodet. Flooding ist meist nicht praktikabel
findet aber doch seine Anwendung. Zum einem ist wahnsinnig robust, selbst wenn fast alle Netzknoten
ausfallen und nichts mehr funktioniert, tut Flooding noch seinen Dienst. Ausserdem ist Flooding der
Prüfstein für alle anderen Routingalgorithmen, da Flooding dadurch, dass es alle Wege wählt, immer
den kürzesten Weg wählt.
7.7.15
Was ist hot potatoe?
Beim Hot-Potatoe-Routing können Pakete nicht gespeichert werden, sondern werden wie eine heisse
Kartoffel weitergegeben. Kommt z. B. in Backbone-Netzen vor wenn ein Carrier Daten von anderen
Carriern möglichst schnell wieder los werden will. Wird auch bei optischem Routing verwendet, wo
Lichtsignale nicht zwischengespeichert werden können.
7.7.16
Was ist Staukontrolle?
Im Gegensatz zur Flusskontrolle die dafür da ist, das ein Sender einen Empfänger, die beide an einer
Punkt zu Punkt Verbindung hängen, nicht mit Daten überflutet, wird beim Thema Staukontrolle das
komplette Netz betrachtet. Ein Stau existiert immer dann, wenn die Belastung des Netzes grösser ist
als seine Ressourcen. Im Falle eines Staus können entweder die Ressourcen erhöht werden, oder, wenn
das nicht geht, die Belastung gedrosselt werden. Generell unterscheidet man bei Staukontrolle zwischen
Open Loop- und Closed Loop-Methoden.
Open Loop Methoden. Open Loop Methoden versuchen das Problem durch gutes Design zu lösen,
das heisst durch gute Planung im Vorhinein, während des Betriebs wird nicht mehr eingegriffen.
Möglichkeiten den Stau im voraus zu vermeiden bestehen an mehreren Stellen.
Data Link Layer. In der Sicherungsschicht sollte die Flusskontrolle unnötige Frames verhindern,
also z. B. selective repeat und piggybacking einsetzen.
Network Layer. In der Netzwerkschicht ist vor allem die Entscheidung zwischen verbindungsorientierten und verbindungslosen Diensten ausschlaggebend, da viele Staukontrolle-Algorithmen
nur mit Verbindungen arbeiten. Ausserdem ist Wahl eines Routing-Algorithmus’, der die Last
gut verteilt, wichtig.
90
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
7.8. Schicht 4
Transport Layer. Auch in der Transportschicht muss die Flusskontrolle unnötig versandte Daten
vermeiden.
Closed Loop Methoden. Closed Loop Methoden reagieren auf den aktuellen Zustand des Netzes,
dieser Ansatz besteht immer aus drei Teilen:
1. Überwachung des Netzes. Wo und wann treten Verstopfungen auf?
2. Verteilung der Stauinformation an relevante Stellen.
3. Behebung des Problems
Die folgenden Verfahren lassen sich nur bei verbindungsorientierter Kommunikation einsetzen.
Wenn ein Stau entdeckt wurde, werden keine neuen Verbindungen mehr aufgebaut (Admission
Control ).
Verbindungen können vorsichtig um heikle Stelle herumgeführt werden.
Es können bereits beim Verbindungsaufbau Verträge abgeschlossen werden. So fordert ein
Kunde zum Beispiel eine gewisse Bandbreite, die Verbindung wird nur aufgebaut, wenn diese
Bandbreite auch zur Verfügung steht.
Im verbindungslosen Netzen muss anders vorgegangen werden. Ein Router kann die Auslastung
seiner Ports messen, dieser Auslastung kann er eine Zahl zwischen 0 und 1 zuordnen. Jetzt wird eine
Auslastungsobergrenze festgelegt. Wann immer ein Router ein Paket auf einem Port rausschicken
soll, dessen Auslastung die Obergrenze übersteigt, muss er irgendwie reagieren. Dafür gibt es
mehrere Möglichkeiten:
Warning Bit. Der Router kann in ausgehenden Pakete ein Warning Bit auf 1 setzen, die Zielstation setzt dann ihrerseits ein Warning Bit in dem zu sendenden Bestätigunspaket, dass wieder
zum Sender zurück läuft. Dieser drosselt daraufhin das Senden. Das dauert zwar relativ lang, hat
aber den Vorteil, dass nicht in der schon bestehenden Stausituation noch extra Pakete versandt
werden müssen.
Choke Packets. Wenn der Router eine Überlastung feststellt sendet er ein Choke Packet an den
Sender, der daraufhin drosselt.
Hop-by-Hop Choke Packets. Es kann u. U. recht lange dauern, bis das Choke Packet beim Sender
angekommen ist. Mit einem Hop-by-Hop Choke Packet kann der Router den Router vor ihm
bitten, den Datenverkehr durch Pufferung zu drosseln. Dieser bittet wieder seinen Vorgänger
usw.
Load Shedding. Wenn die vorangegangen Methoden alle nichts Helfen, kann der Router zu
brutaleren Methoden greifen, er verwirft einfach einen Teil der Pakete. Wenn der Router eine
Ahnung von der Art der Daten hat (z. B. Multimedia) kann er erst einmal möglichst unwichtige
Pakete verwerfen.
Random Early Detection. Bei einigen Transportprotokollen (z. B. TCP) reagiert der Sender
bei verloren Pakete mit einer Drosselung der Sendegeschwindigkeit. Das liegt daran, dass in
kabelbasierten Netzen, für die z. B. TCP hauptsächlich entworfen wurde, fehlende Bestätigung
meist auf Pufferüberläufe zurückzuführen sind. Wenn dem so ist, kann der Router, wenn er
merkt, dass ein Stau kurz bevor steht manche Pakete der Quelle die die hohe Auslastung erzeugt,
einfach verwerfen. Die Quelle reagiert dann mit der Drosselung der Sendeleistung. Das verfahren
heisst early weil der Router das tut, bevor alles verstopft ist und random weil er aus der Queue
in der er die Überlastung feststellt, zufällig ein Paket wählt und dieses verwirft. Dadurch wählt
er den zu drosselnden Sender zufällig.
7.8
Schicht 4
7.8.1
Was ist das Transportsystem?
Unter dem versteht man die Schichten 1-4.
7.8.2
Ist Schicht 4 immer verbindungsorientiert?
Nein. UDP z. B. ist nicht verbindungsorientiert.
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
91
Kapitel 7. Rechnernetze
7.8.3
Erzählen sie etwas zu TCP.
TCP ist das verbindungsorientiert Schicht 4 Protokoll der Internetprotkollfamilie. Eine TCP-Verbindung
wird immer von einem Socket zu einem anderen aufgebaut. Ein Socket ist eine IP-Adresse plus Port.
Eine TCP-Verbindung ist Byte basiert, nicht Nachrichten basiert. Der Verbindungsaufbau läuft bei
TCP über den Three-Way Handshake (7.8.4). Zur Flusskontrolle verwendet TCP ein Sliding Window Verfahren. Bei dem von TCP verwendeten Verfahren teilt der Empfängen dem Sender immer die
Grösse seines Empfangsfensters mit. Wenn er es auf 0 setzt, kann er damit den Sender drosseln. Die
ursprüngliche Version unterstützt kein Selective Repeat sondern nur go back n. Interessant ist, dass
die TCP-Checksumme ausser dem Header und den Daten noch einen Pseudoheader mit ein berechnet.
Dieser Pseudoheader enthält Ziel- und Quelladresse. Diese Verwendung von IP-Adressen auf Schicht
4 verletzt die Protkollhierarchie. Bei der Trennung der Verbindung werden Timer benutzt um das
Two Army-Problem zu umgehen. Die Staukontrollemechanismen von TCP beruhen auf der Annahme
das Pakete hauptsächlich wegen Pufferüberläufen und nicht wegen schlechter Leitungsqualität verloren
gehen. Dies führt bei unsicheren Funkverbindungen zu Problemen. Zur Staukontrolle verwendet verwaltet der Sender neben dem Sendefenster zusätzlich ein Congestion Window. Dieses Fenster kann an
die aktuelle Belastung des Netzes angepasst werden.
7.8.4
Was ist der Three-Way Handshake?
Beim Aufbau einer TCP-Verbindung muss – bevor eine Verbindung zustande kommt – zunächst eine
Verständigung zwischen Sender und Empfänger stattfinden. Dazu verwendet TCP die Methode des
Three-Way Handshake. Das heißt es müssen zunächst drei TCP-Pakete gesendet werden bevor die Verbindung aufgebaut ist. Erst mit einem erfolgreichen letzten und drittem Segment erfolgt der Handschlag
und die Verbindung besteht.
Angenommen man hat Host A, der eine Verbindung mit Host B, aufnehmen möchte, passiert folgendes:
1. Im ersten Paket von A nach B:
ACK-Flag
SYN-Flag
Sequenznummernfeld
Acknowledgementfeld
=
=
=
=
0
1
initiale Sequenznummer
nicht benutzt
2. Möchte B die Verbindung aufnehmen schickt er ein Paket nach A
ACK-Flag
SYN-Flag
Sequenznummernfeld
Acknowledgementfeld
=
=
=
=
1
1
initiale Sequenznummer
Sequenznummer von A inkrementiert
3. Handschlag von A nach B
ACK-Flag
SYN-Flag
Sequenznummernfeld
Acknowledgementfeld
=
=
=
=
1
0
initiale Sequenznummer inkrementiert
Sequenznummer von B inkrementiert
Nach diesen drei Schritten ist die Verbindung aufgebaut. Möchte man den Aufbau einer TCP-Verbindung
unterbinden muss man das erste Paket heraus filtern. So wird der weitere Aufbau einer Verbindung
unmöglich. Das ACK-Flag spielt hier die entscheidende Rolle, da dieses Flag nur im ersten Paket nicht
gesetzt ist. So werden bestehende TCP-Verbindungen nicht beeinträchtigt, da hier in allen Paketen das
ACK-Flag gesetzt ist.
Die Abbildung zeigt den Three-Way Handshake in seiner üblichen Darstellung. A, S sind das ACK bzw. SYN -Flag, SEQ und ACK sind das Sequenznummernfeld und Acknowledgementfeld.
92
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
7.8. Schicht 4
Host 1
Host 2
ASS
0 1 EQ ACK
x
Time
CK
EQ A
A S S y x+1
11
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
ASS
1 0 x EQ ACK
+1 y
+1
93
Kapitel 8
Rechnernetze II
8.1
Allgemeines
8.2
Hochleistungsnetze
8.2.1
Gibt es bei ATM MAC-Adressen?
ATM verwendet sein eigenes Adressformat. Genauer gesagt gibt es drei verschiedene Adressformate,
die alle 20 Byte lang sind. Die Abbildung zeigt das DCC-Format.
1
AFI
2
3
4
5
6
7
8
DCC
9
10
HO-DSP
11
12
13
14
15
16
17
ESI
18
19
20
SEL
Im ersten Byte, dem Authority Format Identifier (AFI) wird das Adressformat angegeben, der Wert
39 steht für das DCC-Format. In den folgenden zwei Bytes steht der Data Country Code (DCC). Er
bestimmt das Land, 276F steht für die BRD. Byte 4 bis 13 werden vom High Order Domain Specific
Part (HO-DSP) belegt. Hier sind die Routing Domain und der Area Identifier abgelegt. Den Rest der
20 Byte teilen sich der End System Identifier (ESI) und das Selector Field (SEL). Wobei dem ESI die
Rolle einer MAC-Adresse bei einem Ethernet-Gerät zukommt. Das SEL spielt eine ähnliche Rolle wie
Ports bei IP. Wenn auf einer Maschine mehrere Dienste (z. B. BUS und LECS) laufen, so werden sie
durch das SEL unterschieden.
8.2.2
Wie funktioniert bei ATM die Vermittlung?
Ein Vermittler liest die VPI/VCI-Information der ankommende Zelle aus dem Header und routet die
Zelle anhand von Tabellen. In internen Vermittler (Vermittler, die keine Verbindung zum einem Host
haben) kann das Routing nur in Abhängigkeit von der VPI-Information gemacht werden. Das hat
mehrere Vorteile. Der Vermittler muss verhältnismässig kleine Tabellen speichern. Dass Routing ist
schneller und Routen lassen sich sehr schnell für viele VCs umleiten.
8.2.3
Geben Sie einen kurzen Überblick über ATM.
ATM (Asynchronous Transfer Mode) ist eine verbindungsorientierte Netzwerktechnologie, die Datenraten bis 622 MBit/s bietet. Die Verbindungen heissen Virtual Circuits (VC) und können entweder
permanent oder switched sein. Mehrere VCs können zu einem Virtual Path (VP) zusammengefasst
werden. Das bietet die Möglichkeit, eine ganze Sammlung von VCs zu routen. Ausserdem können
QoS-Parameter einem ganzen Pfad zugeordnet werden. ATM setzt statt Pakete Zellen von 53 Byte
Länge, die einen 5 Byte Header haben ein. Welche Vorteile der Einsatz von Zellen hat, beschreibt 8.2.6.
ATM-Verbindungen bieten keine garantierte Zellzustellung, aber alle Zellen werden in der richtigen
Reihenfolge zugestellt.
Das ATM-Modell lässt sich im Gegensatz zum OSI-Schichtenmodell besser dreidimensional darstellen.
Die Benutzerebene betrifft Datentransport, Flusssteuerung, Fehlerkorrektur und andere Benutzerfunktionen. Die Steuerebene beschäftigt sich mit dem Verbindungsmanagement. Ebenen- und Schichtenmanagement sind für Ressourcenmanagement und Schicht übergreifende Koordination zuständig.
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
95
Kapitel 8. Rechnernetze II
Ebenenmanagement
Schichtenmanagement
Steuerebene
Obere Schichten
CS
SAR
Benutzerebene
Obere Schichten
ATM-Anpassungsschicht
ATM-Schicht
TC
PMD
Physische Schicht
Die Physische Schicht und die Anpassungsschicht bestehen aus zwei Teilschichten, wobei jeweils die
untere die Arbeit tut und die oberen für die Schnittstelle nach oben zuständig ist.
Die ATM-Anpassungsschicht (ATM Adaption Layer, AAL) hat die Aufgabe die Datenströme der höheren
Schichten auf 48-Byte Lange Zellen zu segmentieren, bzw. aus den ATM-Zellen wieder die ursprünglichen
Datenpakete zu erstellen (Reassembly). Es gibt verschiedene Typen der ALL-Schichte, derzeit sind AAL
1–5 spezifiziert. Je nach Anwendung (z. B. Clip) wird eine andere Schicht gewählt.
Die Hauptaufgabe der ATM-Sicht besteht darin, die von der AAL-Schicht empfangenen Daten an ihren
Bestimmungsort zu transportieren. Die Informationseinheit der ATM-Schicht sind die 53-Byte Zellen.
Die ATM-Schicht ist vollkommen unabhängig von der unter ihr liegenden physischen Schicht.
Die physische Schicht ist für die Generierung der ATM-Zellen, Checksummen-Berechnung und das
tatsächliche Versenden zuständig.
Für eine genauer Beschreibung der Funktion der Schichten siehe auch 8.2.4.
8.2.4
Vergleichen Sie das ATM-Schichtenmodell mit dem ISO–OSI–Schichtenmodell.
Physische und AAL-Schicht (AAL = ATM Adaption Layer) sind jeweils zweigeteilt. Wobei die eigentliche Arbeit in der unteren Schicht stattfindet und die Konvergenzschicht darüber die Schnittstelle
nach oben bietet. Die Tabelle gibt einen Überblick über die Schichten des ATM-Modells und zeigt
auch die korrespondierenden Schichten im OSI-Modell. Der Versuch die Schichten von ATM in das
OSI-Schichtenmodell einzuordnen ist nicht unproblematisch.
OSI
ATM
Teilschicht
Funktionalität
3/4
AAL
CS (Convergence
Sublayer)
SAR (Segmentation and
Reassembly Sublayer)
2/3
ATM
2
Physisch
Bereitstellung der Standardschnittstelle
(Konvergenz)
Segmentierung und erneute Zusammensetzung
Flusssteuerung
Erzeugung/Extraktion des Zellheaders
Management des virtuellen Pfades
Multiplexen/Demultiplexen der Zellen
Entkoppelung der Zellrate
Erzeugung der Header-Prüfsummen
Erzeugung der Zellen
Ein-/Auspacken der Zellen
Erzeugung von Rahmen
Bitzeitgabe
Physischer Netzzugriff
1
8.2.5
96
TC (Transmission
Convergence Sublayer)
PM (Physical Medium
Dependent Sublayer)
i Wie sieht die Sicherungsschicht bei ATM aus?
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
8.3. Dienstgüte
Die Sicherungsschicht des OSI-Modells entspricht einer Mischung der Transmission Convergence Layer
und der ATM-Schicht. Siehe 8.2.4.
8.2.6
Bei ATM-Zellen hat man einen relativen hohen Protokoll-Overhead, warum macht man das?
Der wichtigste Grund ist, dass sich durch die kleine Zellengrösse die Zellen schneller (eventuell
parallel) verarbeiten lassen. Zellrouting wird in Hardware realisiert.
Da Pakete (im Verhältnis zu Zellen) sehr gross werden können, müssen neu ankommende Pakete,
die übertragen werden sollen, im Mittel sicherlich länger warten.
Bei Übertragungsfehlern muss immer ein ganzes Paket neu übertragen werden. Wenn nur an einer
Stelle eines Pakets ein Fehler aufgetreten ist, müssen u. U. 64k übertragen werden. Das ist ungefähr
1200 mal so viel wie bei einer ATM-Zelle.
Durch die feste Zellengrösse die lassen sich genauer Werte über z. B. die Belegungsdauer genauer
bestimmen und vorhersagen.
8.2.7
Würden Sie ATM lokal einsetzen?
Im Vergleich zu Ethernet kann ATM hauptsächlich noch durch QoS punkten. Wenn QoS tatsächlich
die zentrale Anforderung an das Netz ist (z. B. Video-Übertragung), dann könnte ATM eine Überlegung
wert sein. Zu Berücksichtigen ist, dass ATM sehr teuer und sehr aufwendig zu konfigurieren ist. Ausserdem lässt es sich sehr schlecht in eine IP-Umgebung einbauen, wenn man nicht auf QoS verzichten
will, oder man muss eine noch aufwendigere manuelle Konfiguration vor nehmen. Mit derzeitigen
LAN-Technologien bekommt man eventuell für das selbe Geld ein so dermassen überdimensioniertes
Gigabit-Ethernet, dass sich QoS von alleine erledigt.
8.3
Dienstgüte
8.3.1
Was ist QoS?
Dienstgüte (Quality of Service) bezeichnet quantifizierbare Eigenschaften eines Dienstes. Die einzelnen
Eigenschaften werden als Dienstgüteparameter oder Merkmale bezeichnet. Die wichtigsten Merkmalsklassen sind:
Bandbreite (Bandwidth). gemessen in Bit/s.
Verzögerung (Delay). gemessen in ms.
Jitter. Jitter ist die Standardabweichung der Verzögerung.
Zuverlässigkeit (Reliability). Hier interessiert sowohl die Zerstörung als auch der Verlust von Daten.
Unterschiedliche Anwendungen haben unterschiedliche Anforderungen an die Merkmalsklassen, die Tabelle gibt einen Überblick.
Anwendung
eMail
Dateitransfer
WWW
Remote Login
Audio niedrig
Video niedrig
Telephonie niedrig
Videokonferenz niedrig
8.3.2
Zuverlässigkeit
hoch
hoch
hoch
hoch
niedrig
niedrig
niedrig
niedrig
Verzögerung
niedrig
niedrig
mittel
mittel
niedrig
niedrig
hoch
hoch
Jitter
niedrig
niedrig
niedrig
mittel
hoch
hoch
hoch
hoch
Bandbreite
niedrig
mittel
mittel
niedrig
mittel
hoch
niedrig
hoch
Welche Strategien gibt es für QoS?
Overprovisioning. Man stellt einfach so viele Ressourcen zur Verfügung, dass alle QoS-Bedürfnis von
selbst erfüllt werden. Das Problem bei dieser Lösung ist der Kostenfaktor. Das normale Telefonnetz
ist ein Beispiel für diese Lösung.
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
97
Kapitel 8. Rechnernetze II
Buffering. Ein Datenstrom kann gepuffert werden. Diese beeinflusst Zuverlässigkeit und Bandbreite
nicht. Es erhöht die Verzögerung bietet aber die Möglichkeit Jitter zu vermindern.
Traffic Shaping. Traffic Shaping kann als rate basierte Flusskontrolle betrachtet werden. Bei Verfahren wie Sliding Window wird Menge an Daten die verschickt wird kontrolliert. Beim Traffic
Shaping kontrolliert man die Datenübertragungsrate. Die Idee beim Traffic Shaping ist, dass der
Sender beim Verbindungsaufbau einen Vertrag eingeht, der ihm eine gewisse Datenrate zusichert,
wenn er eine gewissen Senderate nicht überschreitet. Zur Realisierung von Traffic Shaping werden Leaky Bucket- oder Token-Bucket-Algorithmen eingesetzt. Wichtig ist, das beim Buffering auf
Empfängerseite gepuffert wird, beim Traffic Shaping auf Senderseite.
Resource Reservation. Das Abschliessen eines Traffic Contracts erlaubt es den an der Verbindungen
teilnehmenden Router entsprechend Ressourcen zu reservieren. Ressourcen sind Bandbreite, Puffer
und Rechenzeit.
Admission Control. Wenn ein Router erkennt, dass es die im Vertrag geforderten Anforderungen
nicht erfüllen kann, darf er die Verbindung nicht annehmen.
8.3.3
Wie garantiert man eine niedrige Auslastung?
Um eine niedrige Auslastung garantieren zu können, dürfen die Anforderung in den angenommenen
Traffic Contracts die Ressourcen nicht überschreiten.
8.3.4
Was ist Jitter?
Jitter ist die Standardabweichung der Verzögerung, also die durchschnittliche Abweichung von der
durchschnittlichen Verzögerung. Video und speziell Audio ist sehr anfällig für Audio. Da das menschliche Ohr Schwankungen sofort raus hört.
8.3.5
Was ist ein isochroner Dienst?
Bei isochronen Diensten sollten Sender und Empfänger möglichst gleich laufen (also kein Jitter).
8.3.6
Welche Dienstklassen bietet ATM?
Constant Bit Rate (CBR). Durch die konstante Bitrate eignet sich die CBR-Klasse um eine Kupferoder Glasfaserleitung zu emulieren. Damit kann z.B. ein Sprachkanal realisiert werden, der sich
wie ein herkömmlicher ISDN B-Kanal verhält. Ausserdem kann die CBR-Klasse zur EchtzeitÜbertragung unkomprimierter Video/Audio-Daten verwendet werden.
Realtime Variable Bit Rate (RT-VBR). Bei den meisten Komprimierungsverfahren für Audio und
Video (z.B. MPEG) entsteht eine Datenstrom mit unterschiedlichen Bitraten. Um Echzeitanwendungen zu ermöglichen wird in dieser Klasse garantiert, dass kein Jitter auftritt. Der gelegentliche
Bit- oder Zellverlust ist im Gegensatz zum Jitter zu verschmerzen.
Non Realtime Variable Bit Rate (nRT-VBR). Diese Klasse eignet sich ebenfalls für Anwendungen
mit variierender Bitrate, gibt aber keine Jitter-Garantie.
Unspecified Bit Rate (UBR). Die UBR-Klasse mach keinerlei Garantien über die Bitrate und warnt
auch nicht vor Überlastungen. Dieses Verfahren ähnelt dem von IP und eignet sich daher auch gut
für die Übertragung von IP-Paketen.
Available Bit Rate (ABR). Die ABR-Klasse bietet die Möglichkeit eine Verbindung zwischen A und
B zu beantragen, die immer mindestens 5 MBit/s leistet, aber nach Möglichkeit des Netzes auch
mehr zur Verfügung stellt. So kann man z.B. angeben, dass Spitzen von 10 MBit/s auftreten können.
Die 5 MBit/s sind dann garantiert und die 10 MBit/s werden nach Möglichkeit zur Verfügung
gestellt. Diese Klasse würde sich z.B. für Web-Surfen eignen.
8.3.7
Welche Möglichkeiten gibt es QoS über IP zu realisieren?
Für QoS in IP-Netzwerken gibt es zwei verschieden Ansätze
98
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
8.3. Dienstgüte
Integrated Services. Hier ist die Idee ähnlich wie bei ATM eine Verbindung mit zugesicherten Eigenschaften aufzubauen. Dazu müssen auf jedem einzelnen Router die Ressourcen reserviert werden.
Das dabei verwendete Protokoll heisst Resource Reservation Setup Protocol (RSVP). Das Problem
ist genau, dass jeder Router dieses Protokoll unterstützen muss. Ausserdem ist die Skalierbarkeit
eher begrenzt, weil für jede Verbindung ein RVSP-Tunnel aufgebaut werden muss.
Differentiated Services. Bei diesem Ansatz werden keine Verbindungen aufgebaut, sondern die
Pakete in verschiedene Prioritätsklassen eingeteilt und dann entsprechend ihrer Priorität geroutet.
Dies ist insofern einfach zu realisieren, da auch der IPv4 Header ein Type Of Service Feld enthält.
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
99
Literaturverzeichnis
[Duden Informatik, 1993]
Duden Informatik. 2. Aufl. Dudenverlag, 1993
[Hennesy & Patterson, 2003]
Hennesy, John L.; Patterson, David A. Computer Architecture: A Quantitative. Approach. 3. Aufl. Morgan Kaufman, 2003
[Jessen, 2001]
Jessen E. Skript zur Vorlesung Rechnerarchitektur WS 00/01.
[Rechenberg & Pomberger, 1999] Rechenberg, Peter; Pomberger, Gustav (hrsg.) Informatik-Handbuch. 2. Aufl.
Hanser, 1999
[Tanenbaum, 1997]
Tanenbaum, Andrew S. Computernetzwerke. 3. Aufl. Prentice Hall, 1997
[Tanenbaum, 2001]
Tanenbaum, Andrew S. Modern Operating Systems. 2. Aufl. Prentice Hall,
2001
[Tanenbaum, 2003]
Tanenbaum, Andrew S. Computer Networks. 4. Aufl. Prentice Hall, 2003
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
101
Teil III
Theoretische Informatik
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
103
Kapitel 9
Effiziente Algorithmen und
Datenstrukturen
9.1
Allgemeines
9.1.1
Was ist dynamisches Programmieren?
Wie Divide&Conquer wird beim dynamischen Programmieren ein Problem in Subproblem aufgeteilt,
diese gelöst und die Gesamtlösung aus den Teillösungen zusammengesetzt. Dynamisches Programmieren
verwendet man, wenn die Subproblem (im Gegensatz zu Divide&Conquer) nicht unabhängig sind.
Zwischenergebnisse werden in Tabellen gespeichert. Dynamisches Programmieren kommt meist bei
Optimierungsproblemen zum Einsatz.
9.1.2
Ein Beispiel für dynamische Programmierung?
Knapsack, Floyd-Warshall, CYK, LCS
9.1.3
Wie können Graphen repräsentiert werden?
Mit Adjazenzenlisten oder Adjazenzenmatrizen.
9.1.4
i Was versteht man unter amortisierter Kostenrechnung?
Mit der amortisierten Kostenrechnung gibt man die durchschnittlichen Kosten von Operationen in
Folgen an. Angegeben wird der Worst-Case aller Folgen.
Eine Möglichkeit die amortisierten Kosten zu bestimmen ist die Potentialmethode, die wie folgt funktioniert. Man startet mit einer Datenstruktur D0 , auf der n Operationen ausgeführt werden. Für jedes
i = 1, 2, . . . , n gibt ci die tatsächlichen Kosten der i-ten Operation an. Di ist die Datenstruktur, die
durch Anwendung der i-ten Operation auf die Datenstruktur Di−1 entsteht. Eine Potentialfunktion Φ
ordnet jeder Datenstruktur Di ein reelle Zahl Φ(Di ) zu. Diese Zahl ist das Potential der Datenstruktur
Di . Die amortisierten Kosten ĉi der i-ten Operation unter Berücksichtigung der Potentialfunktion Φ
ist definiert durch
ĉi = ci + Φ(Di ) − Φ(Di−1 ).
Die amortisierten Kosten einer Operation sind also die tatsächlichen Kosten plus die Potentialzunahme.
Wenn die Potentialzunahme bei Operation i positiv ist, wird sozusagen überbezahlt, das Potential der
Datenstruktur erhöht sich. Ist sie negativ, wird angespartes Potential aufgebraucht.
Für die amortisierten Kosten von n Operationen gilt somit (der zweite Schritt ergibt sich wegen der
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
105
Kapitel 9. Effiziente Algorithmen und Datenstrukturen
Teleskopsumme)
n
X
ĉi
=
i=1
=
n
X
i=1
n
X
i=1
(ci + Φ(Di ) − Φ(Di−1 ))
ci + Φ(Dn ) − Φ(D0 )
Wichtig ist, dass gelten muss Φ(Dn ) − Φ(D0 ) ≥ 0, sonst sind die amortisierten Kosten keine obere
Schranke der tatsächlichen Kosten. Da man in vielen Fällen die Anzahl n der Operationen zu Beginn
nicht weiss, muss man dafür sorgen, dass für alle i Φ(Di ) ≥ Φ(D0 ) gilt. Oft ist es praktisch, Φ(D0 ) = 0
zu setzen und für jedes i > 0 zu zeigen, dass Φ(Di ) ≥ 0 gilt.
9.1.5
Was ist Divide&Conquer?
Bei Divide&Conquer wird ein Problem in Subprobleme zerlegt, diese werden (rekursiv) gelöst und die
Gesamtlösung aus den Teillösungen zusammengesetzt.
9.1.6
Welche Aussagen können Sie über die Laufzeit von Divide&Conquer-Algorithmen machen?
Wenn man die Rekursionsgleichung für einen Divide&Conquer-Algorithmus kennt, kann in vielen Fällen
mit Hilfe des Master Theorems die Laufzeit bestimmt werden.
Master Theorem:
Seien α ≥ 1 und β ≥ 1 zwei Konstanten und sei f (n) eine nicht negative Funktion und sei T (n) definiert
durch die Rekursionsgleichung
n
+ f (n)
T (n) = αT
β
l m
j k
wobei nβ sowohl als nβ als auch als nβ gelesen werden kann, dann ist

Θ nlogβ α , wenn f (n) = O nlogβ α−
für ein konstantes > 0,



 Θ nlogβ α log n , wenn f (n) = Θ nlogβ α ,
logβ α+
T (n) =
Θ (f (n)) ,
wenn
für ein konstantes > 0 und

f(n) = Ω n



αf nβ ≤ cf (n) für ein konstantes 0 < c < 1.
Man erkennt das die Laufzeit von Divide&Conquer-Verfahren hauptsächlich von der Funktion f , die
für das Zusammensetzen der Gesamtlösung aus den Teillösungen zuständig ist, abhängt.
9.1.7
Erklären Sie den Unterschied zwischen Worst-Case-, Average-Case- und amortisierten Kosten.
Worst-Case-Kosten. Die Worst-Case-Kosten geben eine obere Schranke für die Laufzeit an, gelten
also unabhängig von der Art der Eingabedaten.
Average-Case-Kosten. Die Average-Case-Kosten geben die Kosten für einen durchschnittlichen Ablauf eines Algorithmus an. Dies macht aber noch eine Aussage über das Worst-CaseVerhalten. Ein Beispiel ist Quicksort, dass Average-Case-Kosten von O(n log n) hat, im schlechtesten Fall aber quadratische Kosten hat.
Amortisierte Kosten. Bei bestimmten Datenstrukturen wie Fibonacci-Heaps macht es keinen Sinn
alle Operationen getrennt zu betrachten, da die Operationen dort sehr unterschiedlich viel Arbeit
verrichten. Deshalb werden dort Folgen von Operationen auf eine Datenmenge betrachtet. Angegeben werden dann die durchschnittlichen Kosten pro Operation für den Worst-Case aller Folgen.
9.1.8
Was sind Graphen?
Ein Graph ist ein Tupel (V, E), wobei V eine endliche Menge von Knoten ist und E ⊆
von Kanten ist.
106
V
2
eine Menge
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
9.2. Mathematische Grundlagen
9.1.9
Was ist die transitive Hülle?
Die transitive Hülle eines gerichteten Graphen G = (V, E) ist der Graph G∗ = (V, E ∗ ) wobei
E ∗ = {(i, j) | es gibt einen Pfad von Knoten j nach i in G}
ist.
9.1.10
Was ist das uniforme und was das logarithmische Kostenmaß?
Beim uniformen Kostenmaß wird die Länge (in Bits) der einzelnen Operatoren nicht beachtet, beim
logarithmischen Kostenmaß schon. Das logarithmische Kostenmaßmuss verwendet werden, wenn die
Operator sehr gross sind (im Vergleich zur normalen Registergrösse).
Beispiel: Der Algorithmus,
der testet ob eine Zahl n eine Primzahl
√ ist hat im uniformen Kostenmaß
√
die Komplexität O( n), da er einfach für alle Zahlen {2, 3, . . . , n} testet ob sie die Zahl n teilen.
Nun das logarithmische Kostenmaß. Wenn die Zahl n binär√kodiert wird, beträgt die Eingabelänge
l = log2 n. Als Laufzeit erhält man für den Algorithmus O( 2l ) was aber leider O(2l/2 ) entspricht.
Dieser Algorithmus hat also exponentielle Laufzeit und ist daher für grosse n unbrauchbar.
9.1.11
Was ist das allgemeine Prinzip das im CYK-Algorithmus verwendet wird?
Dynamische Programmierung.
9.1.12
Welche algorithmische Prinzipien kennen Sie (mit Beispielen)?
Greedy: Kruskal, Prim
Divide&Conquer: Mergesort, Quicksort
Dynamische Programmierung: Knapsack, Floyd-Warshall, CYK, LCS
9.2
Mathematische Grundlagen
9.2.1
i Sie haben in der Vorlesung Rekursionsgleichungen kennen gelernt. Erzählen Sie etwas dazu.
Da die Laufzeit von vielen Algorithmen mit einer Rekursionsgleichung beschrieben werden kann, interessiert man sich für die geschlossene Form solcher Rekursionsgleichungen. Zur Bestimmung dieser Form
existieren verschiedene Verfahren.
Formeln. Für einfache Rekursionsgleichung, d. h. homogene und inhomogene Rekursionsgleichung
ersten Grades sowie homogene Rekursionsgleichung zweiten Grades existieren Lösungsformeln. Siehe dazu [DS-Faq, 2001].
Substitutionsmethode. Die Idee bei der Substitutionsmethode ist, eine obere Grenze für die Rekursionsgleichung zu raten und diese durch Nachrechnen zu beweisen. Dies wird z. B. beim der
Laufzeitanalyse von BFPRT gemacht (9.4.14).
Iterationsmethode. Die Idee bei der Iterationsmethode ist, die Rekursion immer wieder zu expandieren und somit eine Form zu erreichen, die nur von n und den Startbedingungen abhängt. Der
Vorteil ist, dass man keine obere Grenze erraten muss, dafür erfordert sie einiges an Rechenarbeit. Manchmal kann man ohne die Iterationsmethode zu Ende zu führen das Ergebnis erraten und
dann die Substitutionsmethode anwenden.
Master-Theorem. Die Laufzeit von Divide&Conquer-Algorithmen lässt sich oft mit dem MasterTheorem bestimmen, siehe dazu 9.1.6.
Erzeugendenfunktionen. Ein sehr mächtiges (aber auch recht komplexes) mittel zum Lösen von Rekursionsgleichungen sind Erzeugendenfunktionen, siehe dazu [DS-Faq, 2001] und [Graham et. al., 1989].
9.2.2
i Wie kann man eine Rekursionsgleichung mit Hilfe einer Erzeugendenfunktion lösen?
Das ist in [DS-Faq, 2001] und [Graham et. al., 1989] ausführlich beschrieben.
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
107
Kapitel 9. Effiziente Algorithmen und Datenstrukturen
9.3
Datenstrukturen
Hinweis: Wenn nicht anders angegeben gilt im Folgenden n = |V | und m = |E|.
9.3.1
Was sind Fibonacci-Heaps und wieso heissen sie so?
Der Fibonacci-Heap ist eine Heap-Implementierung bei der alle Operationen bis auf Extract-Min
in O(1) ablaufen, Extract-Min benötigt O(log n). Die Grundidee der Fibonacci-Heaps ist, jegliche
Neuordnung des Heaps solange wie möglich hinauszuzögern. Nur bei Extract-Min wird der Heap
neu geordnet. Genau wie der Binomial-Heap besteht der Fibonacci-Heap aus mehreren Bäumen, die an
den Wurzel verbunden sind. Ausserdem gibt es einen Zeiger min[H] der auf das kleinste Element der
Wurzelliste und somit auf das kleinste Element überhaupt zeigt.
Insert (O(1)): Es wird ein neuer Baum mit einem einzigen Knoten erzeugt, dieser wird an die
Wurzelliste angehängt. Fall nötig wird min[H] umgesetzt.
Minimum (O(1)): Der Zeiger min[H] zeigt immer auf das kleinste Element.
Merge (O(1)): Die Wurzellisten der beiden Heaps H1 und H2 werden konkateniert. der Zeiger
min[H] wird auf min(min[H1 ], min[H2 ]) gesetzt.
Extract-Min (O(log n)): Bei dieser Operation wird die Neuordnung des Heaps durchgeführt und
zwar so, dass danach alle Wurzel der Wurzelliste unterschiedlichen Grad haben (der Grad gibt die
Anzahl der Söhne eines Knotens an). Es lässt sich zeigen, dass die amortisierten Kosten für das
Löschen des Minimums O(D(n)) betragen, wobei D(n) der maximale Grad eines Knotens einem
Heap mit n Knoten ist. Es gilt folgendes Lemma (size(x) bezeichnet die Anzahl der Knoten im
Unterbaum von x, x mitgezählt):
Lemma Für jeden Knoten x vom Grad k eines Fibonacci-Heaps gilt size(x) ≥ Fk+2 (daher der
Name Fibonacci-Heaps).
Mit diesem Lemma lässt sich nun Zeigen, dass D(n) = O(log n): Sei x einen Knoten mit Grad k
in einem n-Knoten Fibonacci-Heap. Laut Lemma gilt n ≥
√ size(x) ≥ Fk+2 . Weiterhin gilt, dass
Fk+2 ≥ φk , wobei φ der goldene Schnitt ist, φ = (1 + 5)/2. Somit gilt n ≥ size(x) ≥ φk .
Logarithmieren ergibt k ≤ logφ n. Also ist D(n) = O(log n).
Trotz der guten Laufzeiten werden Fibonacci-Heaps wegen der aufwendigen Implementierung in der
Praxis nicht sehr häufig eingesetzt.
9.3.2
Was ist ein Binary Heap?
Ein Binary Heap ist ein Binärbaum in dem für jeden Knoten gilt, dass sein Schlüssel grösser ist als die
Schlüssel aller Kinder.
1
16
2
3
14
10
1
8
2
4
5
6
7
8
7
9
3
9
4
2
3
4
5
6
7
8
9
10
16 14 10 8 7 9 3 2 4 1
10
1
Wie die Abbildung zeigt, werden Binary Heaps eigentlich immer als Arrays implementiert. Damit kann
sehr einfach auf den Vater sowie die rechten und linken Kinder zugegriffen werden:
Parent(i)
Left(i)
Right(i)
108
: bi/2c
: 2i
:
2i + 1
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
9.3. Datenstrukturen
Mit Heaps kann sowohl der Heapsort Algorithmus als auch eine Priority Queue realisiert werden. Laufzeiten:
Insert
Extract-Max
Build-Heap
Heapify
Heapsort
9.3.3
O(log n)
O(log n)
O(n)
O(log n)
O(n log n)
stellt Heap-Bedingung wieder her
Was ist ein Binomial-Baum
Der Binomial-Baum Bk ist ein geordneter Baum, der rekursiv definiert ist.
der B0 hat nur einen einzigen Knoten.
der Bk besteht aus den beiden Binomial-Bäumen Bk−1 die wie folgt miteinander verbunden sind:
die Wurzel des einen Baumes ist das linkeste Kind der Wurzel des anderen Baumes
Der Baum Bk hat folgenden Eigenschaften:
1. es gibt 2k Knoten
2. die Höhe des Baumes ist k
3. auf der Tiefe i gibt es ki Knoten, daher der Name
4. die Wurzel hat Grad k, das ist der höchste vorkommende Grad im Baum
9.3.4
Was sind Binomial-Heaps und wieso heissen sie so?
Ein Binomial-Heap H ist eine Menge von Binomial-Bäumen die folgenden Bedingungen erfüllt.
1. jeder Binomial-Baum in H erfüllt die Heap-Bedingung so dass für jeden Knoten gilt, dass sein
Schlüssel mindestens so gross wie der seines Vater ist
2. jeder Bi kommt nur einmal in H vor
Diese Binomial-Bäume werden an den Wurzel durch eine Liste verbunden. Die zweite Bedingung besagt,
dass der Binomial-Heap H mit n Knoten höchstens blog nc + 1 viele Binomial-Bäume und damit auch
höchstens blog nc + 1 Wurzel in der Kette hat. Damit dauert die Suche nach dem kleinsten Element
O(log n).
Laufzeiten:
Make-Heap
Insert
Minimum
Extract-Min
Union
Decrease-Key
Delete
9.3.5
O(1)
O(log n)
O(log n)
O(log n)
O(log n)
O(log n)
O(log n)
Was sind Suchbäume?
Suchbäume sind Datenstrukturen, die folgende Operationen unterstützen:
Search
Minimum
Maximum
Predecessor
Successor
Insert
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
109
Kapitel 9. Effiziente Algorithmen und Datenstrukturen
Delete
Suchbäume können für Dictionaries und Priority Queues eingesetzt werden.
9.3.6
Was sind Rot-Schwarz-Bäume?
Rot-Schwarz-Bäume sind externe Binärbäume mit roten und schwarzen Kanten, sodass gilt
1. Alle Blätter hängen an schwarzen Kanten.
2. Alle Blätter haben die gleiche Schwarztiefe.
3. Kein Pfad von der Wurzel zu einem Blatt enthält aufeinander folgende rote Kanten.
Die Schwarztiefe eine Knotens ist die Anzahl der schwarzen Kanten auf dem Pfad von der Wurzel
zum Knoten. Ein Rot-Schwarz-Baum hat die Tiefe O(log n), das führt zu den folgende Laufzeiten der
Dictionary-Operationen.
Search. Die Suche funktioniert wie immer in einem Suchbaum. Laufzeit ist O(log n).
Insert. Wie bei den (a, b)-Bäumen wird zuerst Search durchgeführt um das Blatt w zu finden,
wo der einzufügende Schlüssel noch nicht hängt. Das Blatt w wird dann durch einen Knoten w 0 mit
Kinder w und v ersetzt. Wobei v den neuen Schlüssel hat. Wenn danach zwei aufeinander folgende
rote Kanten an w 0 liegen, wird durch Rotation oder Doppelrotation wieder die Ordnung hergestellt.
Laufzeit ist O(log n).
Delete. Beim Löschen eines Schlüssels muss der Vater des Blattes durch den Bruder des Blattes ersetzt werden um die Binärbaumstruktur aufrecht zu halten. Danach steht u. U. eine Reorganisation
des ganzen Baumes verändert werden. Trotzdem ist die Laufzeit O(log n).
Rot-Schwarz-Bäume können zur Implementierung von (2, 4)-Bäumen dienen.
9.3.7
Was ist eine Priority Queue?
Priority Queue ist eine Datenstruktur, die folgende Operationen unterstützt:
Insert
Minimum
Extract-Min
(Decrease-Key)
9.3.8
Wo werden PQs verwendet?
Bei den Algorithmen von Prim und Dijkstra. Kruskal kann auch mit PQs implementiert werden.
9.3.9
i Wie kann man PQs implementieren?
Es gibt verschiedene Möglichkeiten zur Implementierung von PQs, die sich in den Laufzeiten und des
Aufwands unterscheiden.
Binary-Heaps
Binomial-Heaps
Fibonacci-Heaps
1-Level und 2-Level Buckets
Radix Heaps
9.3.10
Was sind Union-Find-Strukturen?
Eine Union-Find-Struktur erlaubt es Mengenoperationen effizient zu implementieren, sie stellt folgende
Operationen zur Verfügung.
110
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
9.3. Datenstrukturen
Make-Set
Union
Find-Set
Die beste bekannte Implementierung von Union-Find-Strukturen funktioniert mit Bäumen, wobei die
Wurzel jeweils eines Baumes jeweils den Repräsentanten darstellt. Wenn noch die Heuristiken Union
by Rank und Path Compression angewandt werden, kann für m Operation auf n Element die Laufzeit
(mα(m, n)) erreichen. Wobei α die inverse Ackermannfunktion ist.
9.3.11
Erklären Sie die Union-Operation.
Wenn die Union-Find-Struktur als Wald implementiert ist, wird die Wurzel des kleineren Teilbaums an
die Wurzel des grösseren Teilbaums gehängt. Man nennt dieses Vorgehen Union by Rank und verwaltet
den Rang in einem Array rank [].
9.3.12
Was ist Pfadkompression?
Bei Find-Set werden alle Knoten direkt an die Wurzel gehängt, dadurch laufen folgende Find-SetOperationen schneller ab.
9.3.13
Welche Komplexität hat die Find -Operation bei Union-Find-Strukturen mit Path-Compression?
Wenn bereits vorher einmal nach einem Element der Menge gesucht wurde, ist die Komplexität O(1),
da alle Knoten direkt an der Wurzel hängen. Im schlimmsten Fall kann sie O(n) wobei n die Anzahl
der Knoten in diesem Teilbaum ist.
9.3.14
Was bedeutet log∗ n?
Dazu muss zuerst die Funktion log(i) n definiert werden.

wenn i = 0
 n
(i−1)
(i)
log(log
n) wenn i > 0 und log(i−1) n > 0
log n =

undefiniert
wenn i > 0 und log(i−1) n ≤ 0 oder log(i−1) n undefiniert
log∗ n ist dann wie folgt definiert.
log∗ n = min{i ≥ 0 | log(i) n ≤ 1}
Damit ist log∗ n genau die Umkehrfunktion zur wiederholten Potenzierung.
9.3.15
Was ist eine Rotation in einem Suchbaum?
Durch eine Rotation in einem Suchbaum kann ein Knoten um ein Niveau angehoben oder abgesenkt werden ohne das die Suchbaumeigenschaft verletzt wird. Der Begriff Rotation ist eigentlich irreführend.
Falls man sich wirklich eine Rotation vorstellen will, liegt das Rotationszentrum anschaulich eher auf
der Kante als am Knoten. Sonst würde ja nur der eine Knoten verändert. Die Abbildung zeigt Linksund Rechtsrotation.
RIGHT-ROTATE(y)
y
α
9.3.16
α
γ
x
β
x
LEFT-ROTATE(x)
y
β
γ
i Was sind Splay-Trees?
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
111
Kapitel 9. Effiziente Algorithmen und Datenstrukturen
Splay-Trees stellen eine selbst-organisierende Datenstruktur dar. Es handelt sich um binäre Suchbäume,
die aber im Gegensatz zu balancierten Bäumen keinen weiteren Bedingung unterliegen. Beim Zugriff
auf ein Element x wird eine Variante der Move-To-Root-Heuristik angewandt, die das Element an die
Wurzel des Baumes verschiebt und den Baum verbreitert. Die Länge aller Suchpfade zu Elementen
auf dem Suchpfad von x halbiert sich in etwa. Die Operation Splay(t, x) führt die Reorganisation für
Baum t und Element x durch. Die Wörterbuch-Operationen laufen wie folgt ab:
Search: Zuerst wird Splay(t, x) durchgeführt. Ist x enthalten steht es danach an der Wurzel,
ansonsten ist es nicht enthalten.
Insert: Um Element x in Baum t einzufügen, wird zuerst Splay(t, x) durchgeführt. Dadurch
können sich drei Fälle ergeben:
1. x steht an der Wurzel. In diesem Fall gibt es nichts zu tun, da das Element bereits vorhanden
ist.
2. x steht nicht an der Wurzel und x ist nicht kleiner als alle Elemente in t. In diesem Fall macht
man x zur Wurzel und hängt die Teilbäume der alten Wurzel entsprechend um.
3. x steht nicht an der Wurzel und x ist kleiner als alle Elemente in t. Auch in diesem Fall macht
man x zur Wurzel, allerdings ist danach der linke Unterbaum von x leer.
Delete: Um Element x aus t zu löschen wird zuerst Splay(t, x) durchgeführt. Falls x danach
nicht an der Wurzel steht, ist nichts zu tun, da x nicht im Baum enthalten ist. Andernfalls steht
x an der Wurzel und hatte den linken Unterbaum tl und den rechten Unterbaum tr . Jetzt wird x
gelöscht, danach führt man Splay(tl , ∞) aus, wobei ∞ eine Element ist, dass grösser ist als alle
Elemente in tl . Dadurch erhält man einem Baum t0l , der den grössten Schlüssel y von tl an der
Wurzel und eine leeren rechten Teilbaum hat. Diesen Teilbaum ersetzt man jetzt durch t r und hat
wieder eine gültigen Baum.
Mit einer amortisierten Kostenanalyse kann man Zeigen, dass m Splay-Tree-Operation auf n Elementen
O(m log n) Zeit brauchen, daher ergeben sich im Durchschnitt Kosten von O(log n) pro Operation.
9.3.17
Wie funktioniert die Splay-Operation?
Die Aufgabe der Splay(t, x)-Operation ist es, dass Element x an die Wurzel des Baumes zu verschieben
und den Baum breiter zu machen. Im Folgenden sei v der Knoten bei dem das Element gefunden wurde.
Falls x nicht gefunden wird, sei v der Vater des Blattes bei dem die Suche erfolglos endet. Der Vater
von v heisst p[v], der Grossvater von v ist g[v] = p[p[v]]. Die Splay(t, x)-Operation läuft nun in zwei
Schritten ab:
1. Zuerst wird der Knoten v gesucht.
2. Jetzt werden die Operationen Zig, Zig-Zig und Zig-Zag durchgeführt bis sie nicht mehr ausgeführt
werden können, weil v Wurzel des Baumes ist.
Die Operationen funktionieren so:
Zig: Diese Operation wird durchgeführt falls p[v] die Wurzel des Baumes ist. Es wird eine Rotation
nach links oder rechts durchgeführt, so dass v neue Wurzel des Baumes wird.
v
p[v]
γ
v
α
β
RR(p[v])
α
p[v]
β
γ
Zig-Zig: Diese Operation wird durchgeführt falls v einen Vater p[v] und einen Grossvater g[v]
hat und sowohl v als auch p[v] rechte (linke) Söhne ihres jeweiligen Vaters sind. Es werden zwei
aufeinander folgende Rotationen in die gleiche Richtung durchgeführt. Zuerst bei g[v] und dann
bei p[v], dadurch wird v um zwei Niveaus angehoben.
112
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
9.3. Datenstrukturen
v
g[v]
p[v]
δ
p[v]
RR(g[v])
γ
v
α
RR(p[v])
v
α
p[v]
g[v]
β
α
β
βγ
δ
g[v]
γ
δ
Zig-Zag: Diese Operation wird durchgeführt falls v einen Vater p[v] und einen Grossvater g[v] hat
und einer der beiden Knoten v und p[v] linker und der andere rechter Sohn seines jeweiligen Vater
ist (oder umgekehrt). Jetzt werden zwei Rotationen in gegengesetzter Richtung durchgeführt. Die
erste bei p[v], die zweite bei g[v], dadurch wird v um zwei Niveaus angehoben.
g[v]
g[v]
v
α
p[v]
v
δ
RR(p[v])
α
LR(g[v])
v
g[v]
β
γ
β
p[v]
p[v]
γ
α
βγ
δ
δ
Der einzige Unterschied zur normalen Move-to-Root-Heuristik liegt in der Operation Zig-Zig. Hier
wird nicht wie bei Move-To-Root streng von unten nach oben vorgegangen, die Rotation wird zuerst
für den Grossvater und dann für den Vater durchgeführt.
9.3.18
i Was ist Hashing?
Hashing ist eine Methode mit der man die Wörterbuchoperation Insert, Delete und Search in
einigen Fällen mit der durchschnittlichen Laufzeit O(1) realisieren kann. Es wird eine Hashfunktion
definiert, die jedem Element k des Universums U einen Slot h(k) zuweist. Im folgenden gilt folgendes:
U ist das Universum, N = |U |
K ⊂ U ist die Schlüsselmenge, n = |K|
Array T [0 . . . m − 1] ist die Hashtabelle
Hashfunktion h : U → [0 . . . m − 1]
ki sind Schlüssel
h(ki ) sind Slots
9.3.19
Welche Probleme gibt es beim Hashing und wie werden die gelöst?
Probleme die beim Hashing auftreten können sind Kollisionen. Es kann passieren, das zwei (oder mehrere) Elemente k1 und k2 auf den selben Slot h(k) gehasht werden. Zur Behandlung solcher Kollisionen
gibt es mehrere Methoden:
1. Chaining
Alle Elementen die auf den selben Slot h(k) gehasht werden, werden in eine verkettete Liste gehängt,
deren Kopf in h(k) liegt. Beim Chaining ergeben sich folgende Laufzeiten:
Insert: O(1)
Delete: O(1) wenn die Listen doppelt verkettet sind, wenn nicht entspricht sie der von Search
Search: die Worst-Case-Laufzeit ist O(n), wenn alle Elemente im selben Slot landen. Wenn
man annimmt, dass die Hasfunktion die Element auf alle Slots mit gleicher Wahrscheinlichkeit verteilt ist die Average-Case-Laufzeit von Search O(1 + α), wobei α der load factor, das
Verhältnis der Elemente in der Tabelle zur Anzahl der Slots, ist. Dies gilt für erfolgreiche und
erfolglose Suche. Wenn die Anzahl der Slots proportional zur Anzahl der Elemente ist, führt
das zur Laufzeit O(1).
2. Open addressing
Beim Hashing mit offener Adressierung werden alle Element in der Tabelle selbst abgelegt. Wird
beim Insert oder Search des Schlüssels k ein Element 6= k im Slot h(k) gefunden, so wird auf
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
113
Kapitel 9. Effiziente Algorithmen und Datenstrukturen
deterministische Weise eine alternative Adresse berechnet. Für jeden Schlüssel wird also eine Sondierungsfolge festgelegt. Das heisst die Hashfunktion bekommt einen zweiten Eingabeparameter
(die probe number ) der beim Insert inkrementiert wird, bis ein freier Slot gefunden wurde. Bei
Search wird ebenfalls inkrementiert bis der Schlüssel gefunden wurde oder ein leerer Slot entdeckt
wurde, dann endet die Suche erfolglos. Ein Problem ergibt sich beim Delete. Wenn man den
Schlüssel einfach löschen würde, zerbräche man die Sondierungsreihenfolge und könnte die dahinter liegenden Elemente nie mehr finden. Deshalb löscht man nicht, sonder markiert den Slot als
gelöscht . Dadurch sind die Laufzeiten aber nicht mehr von α abhängig. Aus diesem Grund
wird normalerweise Chaining verwendet, wenn auch gelöscht werden soll.
Für das Sondieren gibt es mehrere Vorgehensweisen. Generell gelten im folgenden diese Definitionen. h(k) ist ursprüngliche Hashfunktion, s(i, k) ist eine Sondierungsfunktion, die die Probe number
und einen Schlüssel nimmt und h(i, k) = (h(k) − s(i, k)) mod m. Man startet dann immer mit
h(k) und versucht, falls diese belegt ist, als nächstes h(1, k) = h(k) − s(1, k).
a) Linear Probing
Beim linearen Sondieren ist die Sondierungsfunktion wie folgt definiert:
s(i, k) = j
⇒
h(i, k) = (h(k) − j)
mod m
D. h. man probiert zuerst T [h(k)], dann T [h(k)−1], dann T [h(k)−2], usw. Lineares sondieren ist
sehr einfach zu implementieren hat aber das Problem des Primary Clustering. Um die Elemente
herum, die Kollisionen verursachen, bilden sich Häufungen. Für die durchschnittliche Anzahl
der Sondierungsschritte gilt:
  1 1+ 1
erfolgreich
2 1−α
E [# probes] =
1
1

erfolglos
2 1 + (1−α)2
b) Quadratic Probing
Beim quadratischen Sondieren ist die Sondierungsfunktion wie folgt definiert:
s(i, k) = (−1)j
2
j
2
D. h. man probiert T [h(k)], T [h(k) + 1], T [h(k) − 1], T [h(k) + 4], T [h(k) − 4], . . . Man muss hier
aufpassen, dass das auch tatsächlich eine Permutation über alle Slots ergibt. Es lässt sich zeigen,
dass dies für bestimmte prime m so ist. Das Clustering tritt hier viel weniger stark auf und
heisst Secondary Clustering. Für die durchschnittliche Anzahl der Sondierungsschritte gilt:

 1 + ln 1
erfolgreich
− α2
1−α E [# probes] =
1
1

erfolglos
1−α − α + ln 1−α
c) Double Hashing
Beim doppelten Hashing ist die Sondierungsfunktion wie folgt definiert:
s(i, k) = jh0 (k)
wobei h0 eine zweite Hashfunktion ist. Damit h(i, k) = (h(k) − s(i, k)) mod m eine Permutation
aller Hashadressen ergibt, muss h0 (k) für alle Schlüssel relativ prim zu m sein. Das kann man z. B.
erreichen indem man als m eine Zweierpotenz wählt und h0 so definiert, dass sie nur ungerade
Zahlen erzeugt.
Für die durchschnittliche Anzahl der Sondierungsschritte gilt:
E [# probes] =
9.3.20
114
1
1
α m 1−α
1
1−α
erfolgreich
erfolglos
i Was ist universelles Hashing?
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
9.3. Datenstrukturen
Beim normalen Hashing kann es immer passieren, dass die Hashfunktion alle Schlüssel einer bestimmten
Eingabe in den selben Slot hasht und damit Worst-Case-Laufzeit produziert. Dies kann vermieden
werden, in dem die Hashfunktion zufällig aus einer Menge von Hashfunktionen gewählt wird. Sei H eine
solche Menge von Hashfunktionen. Die Menge h heisst universell wenn für jedes Paar unterschiedlicher
Schlüssel x, y ∈ U , die Anzahl der Hashfunktionen für die h(x) = h(y) gilt, genau |H|/m ist. Das
bedeutet, wenn man eine Hashfunktion h zufällig aus H auswählt ist die Wahrscheinlichkeit einer
Kollision zwischen zwei Schlüsseln x, y gleich 1/m. Dies entspricht genau der Wahrscheinlichkeit eine
Kollision zu erzeugen, wenn man die beiden Slots vollkommen zufällig bestimmen würde, also den
Annahmen des uniformen Hashings.
9.3.21
i Was ist perfektes Hashing?
Das folgende gilt nur für das statische Dictionary-Problem, wobei nur Search-Operation zugelassen
ist.
Eine Hashfunktion ist perfekt, wenn Sie alle Schlüssel auf unterschiedliche Slots abbildet.
Eine minimale perfekt Hashfunktion braucht nur den Platz m = |K| = n.
Für m ≥ 3n kann man in Zeit O(nN ) eine perfekte Hashfunktion für K ⊂ U finden, die in O(1)
auszuwerten ist (durch ein Programm der Grösse O(n log N ) Bits).
9.3.22
Welche Bäume setzt man in einer Datenbank ein?
B-Bäume.
9.3.23
9.3.24
Geben Sie eine grobe Klassifizierung von Datenstrukturen an.
Klasse
Operationen
Implementierung
Dictionary
Priority Queue
Mergeable Heaps
Concatenable Queues
Search, Insert, Delete
Minimum, Insert, Extract-Min, (Search)
Minimum, Insert, Delete, Merge
Minimum, Insert, Delete, Merge
Hashtabelle, balancierte Bäume
Heaps
2-3-Bäume, Binomial-Wälder
2-3-Bäume
Was sind (a, b)-Bäume?
(a, b)-Bäume sind Suchbäume mit den folgenden Eigenschaften.
Alle Blätter haben die gleiche Tiefe.
Die Schlüssel sind nur in den Blättern gespeichert (externer Suchbaum).
Für alle Knoten v ausser der Wurzel gilt: a ≤ #Kinder ≤ b.
Für die Wurzel gilt: 2 ≤ #Kinder ≤ b.
Es gilt b ≥ 2a − 1
Für alle inneren Knoten v gilt: Hat v l Kindern, so sind in v l − 1 Werte k1 . . . kl−1 gespeichert und
es gilt:
ki−1 < key(w) ≤ ki für alle Knoten w im i-ten Unterbaum von v, wobei k0 = −∞, kl = +∞
Die Wörterbuchoperationen funktionieren wie folgt.
Search (k). Der Algorithmus zum finden eines Elementes startet an der Wurzel und läuft entsprechend der Informationen, die in den Knoten gespeichert sind, nach unten bis zu einem Blatt. Dort
findet er entweder den gesuchten Schlüssel oder nicht.
Search(k)
1 v ← Wurzel
2 while (v ist kein Blatt) {
3
i ← min{1 ≤ j ≤ #Kinder(v) | k ≤ kj }
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
115
Kapitel 9. Effiziente Algorithmen und Datenstrukturen
4
v ← i-tes Kind von v
5 }
6 if (k = key(v)) return True
7 else return False
Die Laufzeit ist O(Höhe(T )).
Insert (k). Beim Insert wird zuerst einmal wie beim Search ein Blatt gesucht, da an dessen
Vater der neue Schlüssel angehängt werden muss. Jetzt muss überprüft werden, ob der Knoten
dadurch nicht zu viele Kinder erhält. Wenn ja, muss er und eventuell seine Vorfahren aufgetrennt
werden. Im folgenden Algorithmus steht p(v) für den Vater von v.
Insert(k)
01 bestimme Blatt v wie in Search
02 w ← p(v)
03 füge k als zusätzliches Blatt von w ein
04 while (#Kinder(w) > b) {
05
if (w 6= Wurzel) y ← p(w)
06
else y ← neue Wurzel mit einzigem Kind w
07
zerteile w in zwei Knoten
w
1 und w2 ,
09
wobei w1 die b+1
kleinsten und
2
grössten
Kinder von w erhält.
10
w2 die b+1
2
11
füge den b+1
-ten
Schlüssel
von
w zu y
2
12
und zwar zwischen die Zeiger auf w1 und w2
13
w ← y //rekursiv weiter machen mit dem Vater
14 }
Die Abbildung zeigt einen 2, 3-Baum in der Schlüssel 22 eingefügt werden soll. Der Baum 0 ist
der Ausgangsbaum. Wenn nun 22 eingefügt wird, ergibt sich Baum 1 in dem das Blatt, an das
22 angehängt wurde, die Bedingung a ≤ #Kinder ≤ b verletzt. Deshalb wird dieser Knoten
aufgespalten (2). Dadurch hat die Wurzel ein Kind zu viel und es wird eine neue Wurzel eingefügt
(3). Der Knoten unter der Wurzel wird nun aufgespalten und alles ist in Ordnung.
0
1
4,13
1
1
7
4
7
17,21
13
17
21
4,13
1
24
1
2
7
4
7
1
7
4
7
13
21
17
1
22
21
22
24
22
24
1
7
4
7
17
13
17
22
21
22
24
13
4
21
1
116
17
4,13,21
17
4
1
13
3
4,13,21
1
17,21,22
7
4
7
17
13
17
22
21
22
24
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
9.3. Datenstrukturen
Die Laufzeit ist O(Höhe(T )).
Delete (k). Zuerst wird der Schlüssel gesucht, wenn er nicht gefunden wird, wird abgebrochen.
Wenn er gefunden wurde, wird das Blatt entfernt, das kann dazu führen, dass dem Vater zu wenige
Kinder übrig bleiben.
01
02
03
04
05
06
07
08
09
10
11
bestimme Blatt v wie in Search
if (key(v) 6= k) return //Schlüssel nicht gefunden
w ← p(v)
entferne v von w
while ((#Kinder(w) < a) ∧ (w 6= Wurzel)) {
y ← linker oder rechter Nachbar von w
if (#Kinder(y) = a) verschmelze w und y
else adoptiere rechtestes bzw. linkestes Kind von y
w ← p(w) //rekursiv weiter machen mit dem Vater
}
if ((w =Wurzel) ∧ (Wurzel hat nur ein Kind)) lösche Wurzel
Die Abbildung zeigt einen 2, 3-Baum aus dem das Blatt mit dem Schlüssel 7 gelöscht wird. Der
Baum 0 ist der Ausgangsbaum. In Baum 1 wurde das Blatt bereits entfernt, dadurch hat der
Knoten 7 ein Kind zu wenig. Jetzt gibt es zwei Möglichkeiten den Knoten y zu wählen. Wird
der linke Nachbar gewählt, kommt man zu dem Fall, dass dieser genau a Kinder hat, dann wird
verschmolzen (2a). Wird der rechte Nachbarn gewählt, gilt dies nicht, deshalb adoptiert man das
linkeste Kind (2b).
0
1
4,13
1
1
7
4
7
2a
17,21
13
17
21
4
1
24
1
4
17
21
24
17,21
13
17
21
24
4,17
1
17,21
13
13
2b
4,13
1,4
1
4,13
1
13
4
13
21
17
21
24
Die Laufzeit ist O(Höhe(T )).
Die Laufzeiten der Wörterbuchfunktionen sind von der Höhe des Baumes abhängig. Um die Höhe
eines (a − b)-Baumes in Abhängigkeit von n zu bestimmen, muss man sich erstmal überlegen wie viele
Schlüssel der Baum der Höhe h speichert. Dieser Wert wird maximal, wenn jeder Knoten genau b
Kinder hat. Dann speichert der Baum bh Schlüssel. Minimal wird er, wenn die Wurzel zwei Kinder und
alle anderen Knoten a Kinder haben, dann speichert er 2ah−1 Schlüssel. Also gilt:
2ah−1 ≤ n ≤ bh
Das nun nach h aufgelöst ergibt
n
2
Da die Wörterbuchoperationen alle von der Höhe des Baumes abhängen gilt also für alle die Laufzeit
O(log n). Die Wahl der Parameter hängt von dem Speicherort der Daten ab. Wenn die Daten im
Hauptspeicher liegen, sollte man a klein, also z. B. 2 oder 3 wählen. Liegen die Daten auf der Festplatte,
wählt man a gross, z. B. a = 100.
logb n ≤ h ≤ 1 + loga
9.3.25
Was sind AVL-Bäume?
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
117
Kapitel 9. Effiziente Algorithmen und Datenstrukturen
AVL-Bäume sind balancierte Binäre Suchbäume bei denen für jeden Knoten v gelten muss, dass die
Höhe seines linken Unterbaums von der des rechten höchstens um 1 unterscheidet. Für die Laufzeiten
der einzelnen Operation gilt:
Search
Insert
Delete
O(log n)
O(log n)
O(log n)
Die Komplexität für Search ergibt sich auf folgenden Lemma: AVL-Bäume mit der Höhe h haben
mindestens Fib(h + 2) Blätter, also Fib(h + 2) − 1 interne Knoten. Es gilt
√ !n
1± 5
1
Fib(n) ≈ √
2
5
Daher gilt, dass AVL-Bäume mit n Knoten die Höhe O(log n) haben, womit dies auch für Search
gilt. Bei Insert und Delete müssen u. U. bestimmte Rebalancierungen durchgeführt werden, deren
Worst-Case-Laufzeit aber immer O(log n) ist.
9.3.26
Wovon hängt die Zahl der speicherbaren Element im AVL-Baum ab?
Von seiner Höhe.
9.3.27
Vergleichen Sie die verschiedenen Heap-Implementierungen hinsichtlich der Laufzeiten.
Make-Heap
Insert
Minimum
Extract-Min
Merge
Decrease-Key
Delete
9.3.28
Binary Heap
O(1)
O(log n)
O(1)
O(log n)
O(n)
O(log n)
O(log n)
Binomial Heap
O(1)
O(log n)
O(log n)
O(log n)
O(log n)
O(log n)
O(log n)
Fibonacci Heap
O(1)
O(1)
O(1)
O(log n)
O(1)
O(1)
O(log n)
Was zeichnet eine sich selbst organisierende Liste aus?
Selbstorganisierende Listen verändern die Position der Element entsprechend ihrer Zugriffshäufigkeit um
die Zugriffszeiten für häufig benutzte Elemente zu verbessern. Es kommen zwei verschiedene Heuristiken
zum Einsatz:
1. Move-To-Front Rule (MFR): Bei jedem Zugriff auf ein Element wird dieses an den Anfang der Liste
verschoben. Für die MFR gilt, dass die amortisierten Kosten höchstens um den Faktor 2 schlechter
sind als ein optimaler Listenalgorithmus.
2. Transposition Rule (TR): Bei jedem Zugriff auf ein Element wird dieses um eine Position nach
vorne verschoben. Die TR kann verglichen mit der MFR oder einem optimalen Algorithmus beliebig
schlecht werden.
9.3.29
Was ist ein Leftist-Baum?
Ein Leftist-Baum ist ein binärer Suchbaum, so dass für jeden Knoten gilt, dass ein kürzester Weg zu
einem Blatt über ein rechtes Kind führt.
9.3.30
Nennen Sie ein Beispiel für sich selbst organisierende Datenstrukturen?
Selbst-Organisierende-Listen und Splay-Trees.
9.3.31
118
Ist ein Splay-Tree für eine Englischlexikon geeignet?
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
9.3. Datenstrukturen
Nur wenn man aus irgendwelchen Gründen andauernd die gleichen Wörter nach schaut.
9.3.32
Gibt es Datenstrukturen die Mengenoperationen effizient unterstützen?
Ja, Union-Find-Strukturen.
9.3.33
Wie funktionieren Radix-Heaps?
Radix-Heaps greifen die Idee von 1-Level Buckets auf, wieder muss die maximale Differenz der Schlüssel
C bekannt sein. Im Gegensatz zu den 1-Level Buckets werden bei Radix-Heaps keine festen Bucketgrössen sondern Bucket mit exponentiell zunehmender Grösse verwendet. Dadurch werden nur noch
O(log c) Buckets benötigt. Da auch bei den Radix-Heaps die Laufzeit für die teure Extract-Min
Operation
√ von der Anzahl der Buckets abhängt, verbessern sich die amortisierten Kosten von O(C)
bzw. O( C) auf O(log C).
9.3.34
Was sind balancierte Bäume?
Suchbäume ohne Balancierung können aus der Form geraten bzw. entarten wobei sich die Laufzeiten
für die Zugriffe drastisch verschlechtern können. Balancierte Bäume haben Mechanismen, die dafür
sorgen, dass die Bäume nicht oder nur wenig entarten.
9.3.35
Was sind 1-Level Buckets?
Buckets bieten eine Möglichkeit Priority Queues zu implementieren. Die Voraussetzung für die Bucket
basierten Implementierungen sind:
Die Schlüssel sind ganzzahlig.
Zu jedem Zeitpunkt gilt, dass die Differenz des grössten und kleinsten Schlüssels ≤ c ist.
Dies ist z. B. beim Algorithmus von Dijkstra erfüllt. c ist hier die maximale Kantenlänge.
1-Level Buckets bestehen aus
einem Array b[0 . . . C + 1] zur Aufnahme der Buckets. Jedes bi enthält einen Pointer auf die Liste
der Elemente im Bucket,
einer Zahl minvalue, die gleich dem kleinsten gespeicherten Schlüssel ist,
eine Zahl 0 ≤ minpos ≤ c, die den Index des Buckets mit dem kleinsten Schlüssel enthält und
einer Zahl n, die die Anzahl der gespeicherten Elemente hält.
Die Priority Queue Operationen sind dann wie folgt implementiert.
Insert (x). Das Element x wird in b[key(x) mod (C + 1)] eingefügt. Falls key(x) kleiner als
der bisher kleinste Wert ist, müssen minvalue und minpos angepasst werden. Ausserdem wird n
inkrementiert. Die Laufzeit für diese Operation ist O(1).
Extract-Min. n wird decrementiert. Falls noch Elemente übrig bleiben, muss das neue kleinste
Element gesucht werden und alle Variablen angepasst werden. Dazu müssen alle Buckets durchlaufen werden. Die Laufzeit ist O(C)
Decrease-Key. Zuerst wird der Schlüssel verkleinert. Ergibt sich dadurch ein neuer minvalue,
müssen die Variablen angepasst werden. Laufzeit ist O(1).
9.3.36
Was sind 2-Level Buckets?
Wenn der Wertebereich sehr gross im Verhältnis zu der Anzahl der abgelegten Werte ist, sind 1-Level
Bucket aus zwei Gründen ungünstig.
Das Array b belegt statischen Speicherplatz der Grösse O(C) obwohl nur ein kleiner Teil davon
gebraucht wird.
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
119
Kapitel 9. Effiziente Algorithmen und Datenstrukturen
Der Zeitbedarf für Extract-Min nähert sich der Worst-Case-Komplexität von O(C), da der
nächste nicht-leere Bucket ziemlich weit entfernt sein kann.
2-Level Buckets versuchen dieses Problem zu beheben,
in dem sie eine Bucket-Hierarchie einführen.
√
Es gibt ein Top-Bucket (btop) bestehend aus | C + 1|√Buckets und zu jedem Bucket in btop gibt es
ein weiteres Bottom-Bucket (bbot), das auch aus B = | C + 1| Buckets besteht. Das i-te bbot nimmt
Elemente auf deren Schlüssel im Intervall [iB, (i+1)B] liegen. Um ein Element in ein Bucket einzufügen
wird zuerst das passende Bucket in btop gesucht. Dann wird in dem dazugehörigen bbot das Element
eingefügt.
Um sowohl Zeit als auch Platz zu sparen, kann man durch leichte Modifikation
√ nur ein einziges BottomBucket einsetzen. Dann benötigt man nur zwei Arrays der Länge B = | C + 1| + 1. Dabei enthält
das Top-Bucket die meisten Elemente in grob vorsortierter Form, nur die Elemente mit den kleinsten
Schlüsseln werden im Bottom-Bucket gehalten. Mit√dieser Implementierung erreicht man Laufzeiten
von O(1) für Insert sowie Decrease-Key und O( C) für Extract-Min.
9.4
Selektieren und Sortieren
9.4.1
Stellen Sie sich vor, Sie haben ein Feld und wollen das 15. grösste finden. Wie können Sie effektiver als
mit Sortieren vorgehen.
Mit einem Selektionsalgorithmus.
9.4.2
Wie viele Vergleiche braucht man um von n-Element das Grösste zu finden?
Man braucht auf jeden Fall n − 1 Vergleiche. Beweis: Man Betrachte den Algorithmus als Folge von
Spielen, die immer das grössere Element gewinnt. Jeder Spieler ausser dem Gewinner muss mindestens
einmal verlieren, daher n − 1 Vergleiche.
9.4.3
Welche Komplexität hatte eine naive Bestimmung des Medians?
Man verwendet eine normalen Sortieralgorithmus und wählt das mittlere Element. Laufzeit: O(n log n)
9.4.4
i Nennen Sie einen Algorithmus zur effizienten Bestimmung des Median.
BFPRT.
9.4.5
Wie ist die untere Schranke für die Median-Bestimmung (mit Beweis)?
− 2 Vergleiche. Der Beweis läuft über das Gegenspielerargument.
Die untere Schranke is 3n
2
9.4.6
Erklären Sie Radix-Sort.
Die Idee bei Radix-Sort ist die Eingabewerte einzeln nach ihren Dezimalstellen zu sortieren und zwar
zuerst nach der niedrigsten. Das müssen natürlich nicht Dezimalstellen sein, es können auch Buchstaben
oder Binärzahlen verwendet werden. Das Beispiel zeigt wie 3-stellige Dezimalzahlen zuerst nach den
Einern , dann nach Zehnern und zuletzt nach den Hundertern sortiert werden.
329
720
720
329
457
355
329
355
657
436
436
436
839
457
839
457
⇒
⇒
⇒
436
657
355
657
720
329
457
720
355
839
657
839
↑
↑
↑
120
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
9.4. Selektieren und Sortieren
Die Laufzeit von Radix-Sort hängt natürlich von dem Algorithmus ab, der zum Sortieren nach den
einzelnen Stellen verwendet wird. Um n Zahlen nach einer Stelle zu sortieren benötigt man z. B. mit
Mergesort O(n log n) Zeit. Falls die Zahlen d Stellen haben, benötigt man insgesamt O(d · n log n), also
keine Vorteile zu normalen Sortieralgorithmen. Wenn allerdings ein nicht-vergleichsbasierter Algorithmus wie Counting Sort mit linearer Laufzeit verwendet wird, ergibt sich auch eine lineare Gesamtlaufzeit
von Radix-Sort.
9.4.7
Erklären Sie Bucket-Sort.
Wenn für alle zu sortierenden Zahlen x, gilt, dass 0 ≤ x < 1 und die Zahlen zufällig verteilt sind, kann
Bucket-Sort ein Array mit n Zahlen in Zeit O(n) sortieren. Benötigt werden n Buckets, die jeweils eine
Liste von Werte aufnehmen können. Der Algorithmus läuft dann wie folgt ab.
1. Initialisiere Buckets b0 , b1 , . . . , bn−1 .
2. Lege ai in Bucket dn · ai e.
3. Sortiere die Elemente innerhalb der Buckets.
4. Konkateniere die Buckets.
Bis auf den Schritt 3 ist alles in O(n) zu erledigen. In Schritt 3 kommt es darauf an, wie wie viele
Elemente durchschnittlich in einem Bucket sind. Falls in jedem Bucket nur 1 Elemente ist, ist es
einfach. Sei ni die Zufallsvariable die die Anzahl der Element in Bucket i beschreibt. Wenn man in
Schritt 3 einen Sortieralgorithmus mit quadratischer
Laufzeit verwendet, ist die erwartete Zeit, die
Element im Bucket i zu sortieren E O(n2i ) = O(E n2i ). Für alle Bucket ergibt sich daher die Summe:
!
n−1
n−1
X X
2 (9.1)
E n2i
O E ni = O
i=0
i=0
Die Wahrscheinlichkeit, dass ein Element x in Bucket i landet ist 1/n. Das Verteilen von n Elementen
auf n Buckets kann mit dem Bällen-Urnen-Modell erfasst werden und ist binomialverteilt. Das heisst
die Wahrscheinlichkeit, dass ni = k ist, folgt der Binomialverteilung b(k; n, p). Somit gilt für den
Erwartungswert und die Varianz
1
=1
n
E [ni ]
=
np = n ·
Var [ni ]
=
np(1 − p) = n ·
1
1
1
=1−
· 1−
n
n
n
Für jede Zufallsvariable gilt folgende Gleichung
2
E n2i = Var [ni ] + E [ni ]
Daraus ergibt sich
E n2i
1
+ 12
n
1
= 2−
n
= O(1)
= 1−
Wenn man dieses Ergebnis nun in (9.1) einsetzt ergibt sich
n−1
X
O E
i=0
n2i
=O
n−1
X
i=0
O(1)
!
und damit eine Gesamtlaufzeit von O(n).
9.4.8
Was versteht man unter Selektion?
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
121
Kapitel 9. Effiziente Algorithmen und Datenstrukturen
Das Suchen eines n kleinsten Elements in einer Menge.
9.4.9
Warum sortiert man nicht einfach?
Sortieren hat grösseren Aufwand als Selektieren.
9.4.10
Wie funktioniert Quicksort?
Quicksort ist ein Divide&Conquer Algorithmus mit einer durchschnittliche Laufzeit von O(n log n). Die
Worst-Case-Laufzeit ist allerdings O(n2 ). Der grundlegende Algorithmus ist sehr einfach und funktioniert wie folgt. Dieser Algorithmus sortiert das Array A[p . . . r].
Quicksort(A, p, r)
1 if p < r
2
then q ← Partition(A, p, r)
3
Quicksort(A, p, q)
4
Quicksort(A, q + 1, r)
Das Eingabearray wird in zwei Teile zerlegt und diese rekursiv mit Quicksort sortiert. Entscheidend ist
die Partitionierung des Arrays. Eine einfache Implementierung von Partition funktioniert so.
Partition(A, p, r)
1 x ← A[p]
2 i←p−1
3 j ←r+1
4 while (True) {
5
do j ← j − 1 until (A[j] ≤ x)
6
do i ← i + 1 until (A[i] ≥ x)
7
if (i < j) swap A[i] ↔ A[j]
8
else return j
9 }
Die Funktion Partition wählt eine Pivot-Element x und vertausche die Array-Elemente so, dass alle
Element links von x kleiner und alle rechts davon grösser sind als x. Dafür werden zwei Zeiger i und
j verwendet, die gegeneinander laufen. Der entscheidende Punkt ist die Wahl des Pivot-Elements. In
dieser Implementierung wird einfach das erste Element des Arrays gewählt. Diese Methode ist nicht
optimal. Wenn das Array z. B. bereits sortiert ist ergeben sich bei dieser Wahl immer 1:(n − 1)–
Partitionen. Deshalb konzentrieren sich die Verbesserungen von Quicksort darauf das Pivot-Element
möglichst geschickt zu wählen. Mann kann es zufällig wählen oder noch besser den Median von drei
Zufallswerten wählen. Zur Analyse von Quicksort, siehe 9.4.16.
9.4.11
i Wie funktioniert Mergesort?
Mergesort ist ein Divide&Conquer Algorithmus. Eine Feld wird sortiert in dem es in zwei (fast) gleich
grosse Teilfelder zerlegt wird, die dann wieder rekursiv mit Mergesort sortiert werden. Die Teilfelder
werden dann geMerget um die Gesamtlösung zusammen zu setzen.
Divide: Teile das n-elementige, zu sortierende Feld in zwei Teilfelder der Länge n/2.
Conquer: Sortiere die zwei Teilfelder rekursiv mit Mergesort.
Combine: Verschmelze die zwei sortierten Teilfelder zu einem.
Das Verschmelzen der Teilfelder erledigt die Funktion Merge. Anschaulich funktioniert sie wie ein der
Algorithmus, den ein Mensch benutzen würde um zwei sortierte Kartenstapel zu verschmelzen. Beide
Stapel liegen mit der kleinsten Karte oben auf dem Tisch. Man wählt nur immer die kleinste Karte die
oben aufliegt und legt sie nacheinander auf einen dritten Stapel. Der dritte Stapel ist dann eine korrekte
Verschmelzung der beiden Stapel. Dieser Algorithmus lässt sich in O(n) implementieren, wobei n die
Summe der Längen der beiden Teilfelder ist. Mit der Merge-Funktion sieht der Mergesort-Algorithmus
so aus:
122
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
9.4. Selektieren und Sortieren
Merge-Sort(A, p, r)
1 if p < r
2 then q ← b(p + r)/2c
3
Merge-Sort(A, p, q)
4
Merge-Sort(A, q + 1, r)
5
Merge(A, p, q, r)
Diese Funktion sortiert das Teilfeld A[p . . . r]. Falls p > r gibt es nicht mehr zu sortieren und die
Funktion bricht ab. Merge (A, p, q, r) verschmelzt die Felder A[p . . . q] und A[q + 1 . . . r].
9.4.12
i Komplexität von Mergesort herleiten.
Mergesort ist ein typischer Divide&Conquer-Algorithmus. Die Laufzeit T (n) von Divide&ConquerAlgorithmen kann rekursiv ausgedrückt werden:
O(1)
wenn n ≤ c ,
T (n) =
αT (n/β) + D(n) + C(n) sonst.
Wobei c eine konstante ist, für die die Berechnung trivial wird. Das Problem wird in α Teilproblem
geteilt und des Teilproblem hat die Grösse n/β, d. h. das die Teilprobleme sich auch überlappen können.
D(n) ist die Zeit, die man braucht um das Problem in Teilprobleme zu zerlegen, C(n) die Zeit um die
Lösung aus den Teillösungen zusammenzusetzen.
Die Rekursion für Mergesort ergibt sich wie folgt:
Divide: Dieser Schritt muss die Mitte des Subarrays finden, daher D(n) = O(1).
Conquer: Das Problem wird rekursiv in 2 Teilprobleme zerlegt, die beide die Grösse n/2 haben,
also 2T (n/2).
Combine: Merge benötigt für n Elemente O(n), also C(n) = O(n).
Daraus ergibt sich:
T (n) =
O(1)
2T (n/2) + O(n)
wenn n = 1 ,
sonst.
Der erste Fall ergibt sich, weil ein Feld der Länge 1 bereits sortiert ist. Das O(1) für Divide trägt
zur Summe nichts bei, also fällt es unter den Tisch. Für diese Rekursionsgleichung kann nun mit dem
Mastertheorem (9.1.6) die Laufzeit bestimmt werden. α = 2, β = 2 und f (n) = O(n), daher trifft der
zweite Fall des Mastertheorems zu und die Laufzeit von Mergesort ist
Θ nlogβ α log n = Θ(n log n) .
9.4.13
Wie funktioniert Heapsort?
Die n zu sortierenden Element werden nacheinander auf den Heap gelegt. Danach werden alle n Element
wieder mit Extract-Min herunter geholt. Dies kann auch in-situ geschehen. Laufzeit ergibt sich aus
den Laufzeiten der Heapoperationen und ist O(n log n).
9.4.14
Wie funktioniert BFPRT?
Der Algorithmus Select zur Bestimmung des i-kleinsten Elements einer Menge S, läuft in folgenden
Schritten ab.
1. Teile die n Elemente in bn/5c Gruppen zu je 5 Elementen plus eine Gruppe mit n mod 5 Elementen.
2. Jetzt wird der Median jeder der dn/5e Gruppen bestimmt in dem die Elemente der Gruppen per
Insertion Sort sortiert werde und der mittlere Wert gewählt wird. Falls die Gruppe ein ungerade
Anzahl an Elementen hat, wird der grössere der beiden Medianwerten gewählt.
3. Jetzt wird Select rekursiv aufgerufen um den Median der in Schritt 2 berechneten Median zu
bestimmen.
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
123
Kapitel 9. Effiziente Algorithmen und Datenstrukturen
4. Jetzt werden die Element des Eingabearrays bzgl. des Medians der Mediane s partitioniert. Dadurch
ergeben sich zwei Mengen S1 = {x ∈ S | x < s} und S2 = {x ∈ S | x > s}
5. Jetzt gibt es drei Fälle:
Falls i ≤ |S1 |, bestimme rekursiv das i-kleinste Element in S1
Falls i = |S1 | + 1, gib s als Lösung zurück.
Sonst, bestimme rekursiv das (i − |S1 | − 1)-kleinste Elemente in S2 .
9.4.15
Wie ist die Laufzeit von BFPRT?
Um die Laufzeit zu bestimmen, muss man zuerst eine untere Grenze für die Elemente, die grösser als
das Partitionierungselement s sind, bestimmen. Mindestens die Hälfte der Mediane, die in Schritt 2
gefunden werden, ist grösser oder gleich dem Median der Mediane s. Also sind aus der Hälfte der dn/5e
Gruppen jeweils drei Element grösser als s. Ausnahmen sind die Gruppe, die s enthält und die letzte
Gruppe, falls n nicht durch 5 teilbar ist. Wenn man diese beiden Gruppen weg lässt, ergibt sich für die
Anzahl der Elemente, die grösser als s ist
l m
3n
1 n
− 6.
−2 ≥
3
2 5
10
Ebenso gilt, dass die Anzahl der Elemente, die kleiner als s sind, mindestens 3n/10 − 6 ist. Daher
wird im Worst-Case Select 7n/10 + 6 mal rekursiv aufgerufen (Schritt 5). Die in der Abbildung grau
unterlegten Elemente sind die, die grösser als s sind.
s
Damit lässt sich nun eine Rekursionsgleichung erstellen. Schritt 1, 2 und 4 benötigen O(n). Schritt 3
benötigt T (dn/5e) und Schritt 5 benötigt höchstens T (7n/10 + 6). Für n > 20 gilt 7n/10 + 6 < n und
für n ≤ 80 ist die Laufzeit O(1). Daher ergibt sich die Rekursionsgleichung:
O(1),
wenn n ≤ 80,
T (n) ≤
T (dn/5e) + T (7n/10 + 6) + O(n) wenn n > 80.
Die lineare Laufzeit wird nun durch die Substitutionsmethode gezeigt. Man nimmt an, dass T (n) ≤ cn
ist und Substitute entsprechend.
T (n)
≤ cdn/5e + c(7n/10 + 6) + O(n)
≤ cn/5 + c + 7cn/10 + 6c + O(n)
≤ 9cn/10 + 7c + O(n)
≤
cn
Der letzte Schritt gilt, da man c so gross wählen kann, dass es grösser als O(n) für alle n > 80 ist.
9.4.16
Rekursionsformel für Quicksort?
Die Rekursionsformel hängt von der Güte der Partitionierung ab.
Im schlechtesten Fall teil Quicksort immer in eine Partition der Grösse 1 und eine Partition der
Grösse n − 1. Dann ergibt sich
T (n) = T (n − 1) + O(n)
und dafür gilt T (n) = O(n2 ).
124
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
9.4. Selektieren und Sortieren
Im besten Fall teil Quicksort immer in zwei Partitionen der Grösse n/2 auf, dann gilt
T (n) = 2T (n/2) + O(n)
was laut Master Theorem O(n log n) ist.
Falls Quicksort in jedem Schritt zwei Partitionen, deren Grössen konstant proportional zueinander
sind (z. B. immer 9:1), erzeugt, so ergibt sich die Rekursionsgleichung
T (n) = T (9n/10) + T (n/10) + O(n)
(für das Beispiel)
Egal wie diese Verhältnis aussieht, also z. B. auch 99:1, ergibt sich die Laufzeit O(log n), weil der
Rekursionsbaum immer Tiefe O(log n) hat und jede Ebene O(n) kostet. Daher ergibt sich auch
für die durchschnittliche Laufzeit von Quicksort O(n log n). Mann muss nur dafür sorgen, dass die
Partitionierung möglichst zufällig abläuft.
9.4.17
Gibt es Sortierverfahren mit einer besseren Laufzeit als O(n log n).
O(n log n) ist die untere Schranke für vergleichsbasiertes Sortieren. Wenn ohne Vergleiche sortiert wird,
können bessere Laufzeiten erreicht werden. Beispiele sind Radix- und Bucket-Sort die aber bestimmte
Annahmen über die Daten machen.
Die untere Schranke für vergleichsbasiertes Sortieren kann über den Entscheidungsbaum hergeleitet
werden. Wenn n Element sortiert werden müssen, gibt es n! verschieden Permutationen, also hat der
Entscheidungsbaum n! Blätter. Die Länge des längsten Pfades von der Wurzel zu einem Blatt entspricht
der Worst-Case-Laufzeit beim Sortieren. Deshalb muss man nur die Höhe h des Baumes bestimmen um
die untere Schranke für Sortieren zu finden. Da ein Binär (Entscheidungsbaum ist binär) nicht mehr
als 2h Blätter hat gilt
n! ≤ 2h .
Daraus ergibt sich durch Logarithmieren
h ≥ log n! .
Mit der Stirling-Approximation für die Fakultät kommt man zu
h
≥
=
=
=
9.4.18
log
n n
e
n log n − e log e
n log n − O(1)
O(n log n)
Braucht Quicksort zusätzlichen Speicher?
Ausser ein paar wenigen Zeigern, nein.
9.4.19
Wie kann man bei Quicksort die Worst-Case-Laufzeit vermeiden?
Mann muss dafür sorgen, dass die Partitionierung möglichst gut ist und nicht in zwei Partitionen teilt,
bei der eine Partition nur die Grösse 1 hat. Dazu kann man eine randomisierte Version benutzten, die
das Pivot-Element immer zufällig auswählt. Das kann noch weiterhin verbessert werden, wenn man 3
Element zufällig wählt und den Median dieser als Pivot-Element verwendet (Median-of-Three).
9.4.20
Warum verwendet man in der Praxis Mergesort häufiger?
Mergesort sortiert Elemente, die bereits richtig sind, nicht.
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
125
Kapitel 9. Effiziente Algorithmen und Datenstrukturen
9.5
Minimale Spannbäume
9.5.1
Wie funktioniert der Algorithmus von Kruskal?
Der Algorithmus von Kruskal ist ein Greedy-Algorithmus zur Bestimmung eines minimalen Spannbaumes. Der Algorithmus sortiert die Kanten nach ihrem Gewicht und fängt dann mit der kleinsten Kante
an diese in den Spannbaum einzufügen. Bei jedem Einfügen überprüft er, ob durch das Einfügen ein
Kreis entsteht, falls ja, wird die Kante ignoriert, falls nein, wird die Kante eingefügt.
Meist wird der Algorithmus nicht mit einer Kantenvorsortierung sondern einer Priority-Queue implementiert. Dies kann Vorteile haben, wenn die grössten Kanten des Graphen nicht Teil des minimalen
Spannbaums sind. Bei der Implementierung mit Priority-Queue kann der Algorithmus in diesem Fall
frühzeitig abbrechen.
Zur Kreisüberprüfung wird eine Union-Find-Struktur verwendet. Zu Beginn ist jeder Knoten in einer
eigenen Menge. Wenn eine Kante eingefügt werden soll, wird überprüft, ob die beiden Endknoten in
unterschiedlichen Menge liegen, wenn nicht, wird die Kante ignoriert. Falls dem so ist, wird die Kante
eingefügt und die beiden Mengen verschmolzen.
Implementierung mit PQ:
Kruskal
01 A ← ∅
02 Q ← E[G]
03 for each (vertex v ∈ V [G]) {
04
Make-Set(v)
05 }
06 while (Q 6= ∅) {
07
(u, v) ← Extract-Min(Q)
08
if (Find-Set(u) 6= Find-Set(v)) {
09
A ← A ∪ {(u, v)}
10
Union(u, v)
11
}
12 }
13 return A
Dieser Algorithmus hat gegenüber dem mit Kantenvorsortierung keinen Vorteil, da er nicht frühzeitig
abbricht. Theoretisch kann man abbrechen, wenn nur noch eine einzige Menge übrig ist, dann kann
sowieso keine weitere Kante mehr hinzugefügt werden. Für die Priority-Queue Operationen ergibt sich
die Laufzeit O(m log m), die Union-Find-Operationen haben eine sehr kleine (amortisierte) Komplexität
und tragen damit unerheblich zu der Gesamtlaufzeit bei, also hat der Algorithmus von Kruskal die
Laufzeit O(m log m).
9.5.2
Wie ist der Dijkstra-Algorithmus mit dem von Prim vergleichbar?
Es handelt sich praktisch um den gleichen Algorithmus. Bei Dijkstra müssen zusätzlich die Pfadlängen
von Startpunkt addiert werden.
9.5.3
Welche Algorithmen gibt es zur Berechnung minimaler Spannbäume?
Es gibt die Algorithmen von Kruskal und Prim.
9.5.4
Erklären Sie den Algorithmus von Prim.
Der Algorithmus von Prim zur Bestimmung es minimalen Spannbaums geht wie folgt vor. Alle Knoten
des Baumes werden in einer Priority Queue verwaltet. Zu Beginn erhalten alle Knoten den Wert ∞, nur
der Startknoten erhält 0. Nun nimmt man sich den Knoten u mit dem kleinsten Wert aus der Queue
(beim ersten mal der Startknoten) und durchläuft man alle Nachbarknoten v des Knotens u, die noch
in der Queue sind. Ist das Kantengewicht von (u, v) kleiner als der beim Knoten gespeicherte Wert
key[v], wird der Knotenwert aktualisiert.
126
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
9.6. Kürzeste Pfade
Prim (G, w, r)
01 Q ← V [G]
02 for each (u ∈ Q) {
03
key[u] ← ∞
04 }
05 key[r] ← 0
06 π[r] ←NIL
07 while (Q 6= ∅) {
08
u ← Extract-Min(Q)
09
for each (v ∈ Adj[u]) {
10
if (v ∈ Q ∧ w(u, v) < key[v]) {
11
π[v] ← u
12
key[v] ← w(u, v)
13
}
14
}
15 }
Der Algorithmus speichert zusätzlich für jeden Knoten seinen Vorgänger im Feld π[].
Laufzeit: Die Schleife in den Zeilen 7–15 wird n mal durchlaufen, darin wird jedes mal ein ExtractMin ausgeführt, also n log n. Die Schleife in den Zeilen 9–13 wird O(m) mal durchlaufen. Also ergibt
sich insgesamt O(m+n log n). Dies gilt nur, wenn die Priority Queue mit Fibonacci Heaps implementiert
wird, da bei diesen die Zuweisung in Zeile 12 in O(1) durchgeführt werden kann.
9.5.5
Was ist ein Spannbaum?
Für einen Graphen G(V, E) ist G0 (V, E 0 ) mit E 0 ⊆ E ein Spannbaum, wenn G0 ein Baum ist.
9.5.6
Was ist eine minimaler Spannbaum, was hat er für einen praktischen Nutzen?
Ein minimaler Spannbaum ist ein Spannbaum des Kantengewicht (Summe der Gewichte aller Baumkanten) minimal ist. In der Praxis kann man so z. B. die billigste Leitungskonfiguration zwischen Rechnern
finden, so dass diese gerade noch verbunden sind.
9.5.7
Was sind die
blaue und die
rote Regel?
Diese Regeln werden bei den Korrektheitsbeweisen für minimale Spannbaum Algorithmen benutzt.
9.6
Kürzeste Pfade
9.6.1
i Wie funktioniert Algorithmus von Dijkstra?
Dijkstras Algorithmus zur Bestimmung der kürzesten Pfade ähnelt dem von Prim zur Bestimmung
des minimalen Spannbaumes sehr stark. Wieder werden alle Knoten in einer Priority Queue verwaltet
und ihr Entfernungswert zu Beginn auf ∞ gesetzt. Der Startknoten erhält den Wert 0. Nun wird der
kleinsten Knoten u aus der Queue entnommen und alle seine Nachbarn v durchlaufen. Gibt es von u
nach v einen kürzeren Weg als in v gespeichert, wird der Wert bei v aktualisiert.
Dijkstra (G, w, s)
01 for each (v ∈ V [G]) {
02
d[v] ← ∞
03
π[v] ←NIL
04 }
05 d[s] ← 0
06 Q ← V [G]
07 while (Q 6= ∅) {
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
127
Kapitel 9. Effiziente Algorithmen und Datenstrukturen
08
09
10
11
12
13
14
15
}
u ← Extract-Min(Q)
for each (v ∈ Adj[u]) {
if (d[v] > d[u] + w(u, v)) {
d[v] ← d[u] + w(u, v)
π[v] ← u
}
}
Der Algorithmus speichert zusätzlich für jeden Knoten seinen Vorgänger im Feld π[].
Laufzeit: Auch hier zeigt sich die Verwandtschaft zum Algorithmus von Prim. Die Schleife in den
Zeilen 7–15 wird n mal durchlaufen, darin wird jedes mal ein Extract-Min ausgeführt, also n log n.
Die Schleife in den Zeilen 9–13 wird O(m) mal durchlaufen. Also ergibt sich insgesamt O(m + n log n).
Dies gilt nur, wenn die Priority Queue mit Fibonacci Heaps implementiert wird, da bei diesen die
Zuweisung in Zeile 11 in O(1) durchgeführt werden kann.
9.6.2
Was ist das Single-Source-Shortest-Path-Problem?
Man möchte die Entfernung von einem Startknoten zu allen anderen Knoten wissen.
9.6.3
Komplexität von Dijkstra?
Es werden n−1 Schritte gemacht in denen jeweils eine Extract-Min- und für alle Nachbarn des Knoten
evtl. eine Insert- oder Decrease-Key-Operation durchgeführt. Wenn die PQ mit Fibonacci-Heaps
implementiert ist, beträgt die Laufzeit O(n log n + m).
9.6.4
Welche Verfahren zur Bestimmung der transitiven Hülle kennen Sie?
Man kann alle Kantengewichte auf 1 setzen und den Floyd-Warshall-Algorithmus laufen lassen. Gibt
es einen Pfad zwischen zwei Knoten steht in der Matrix eine Zahl n ansonsten ∞.
9.6.5
Nennen Sie mir einen Algorithmus zur effizienten Matrizen-Multiplikation.
Der Strassen-Algorithmus.
9.6.6
Welche Algorithmen gibt es ausser Dijkstra für SSSP?
Bellman-Ford.
9.6.7
Welche Algorithmen gibt es für das All-Pairs-Shortest-Path-Problem?
Floyd-Warshall.
9.6.8
Wie kann man den Floyd-Warshall-Algorithmus so modifizieren, dass man auch die Pfade ablesen kann?
Man kann in einer Vorgängermatrix für jeden Knoten den Vorgänger speichern.
9.6.9
Welche Komplexität hat der Floyd-Warshall-Algorithmus?
Er Algorithmus besteht aus 3 ineinander geschachtelten For-Schleifen und daher Laufzeit O(n 3 ). Der
Algorithmus ist dem CYK-Algorithmus sehr ähnlich, der dieselbe Laufzeit hat.
9.6.10
Wie kann man Zyklen in Graphen bestimmen?
Ein Graph enthält genau dann Zyklen, wenn während der Tiefensuche Rüeckwärtskanten gefunden
werden.
128
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
9.7. Matchings
9.6.11
i Erklären Sie den Strassen-Algorithmus zur Matrizen-Multiplikation.
Normalerweise wird die Multiplikation zweier n × n Matrizen wie folgt berechnet.
b11 b12
a11 a12
c11 c12
·
=
b21 b22
a21 a22
c21 c22
a11 b11 + a12 b21 a11 b12 + a12 b22
=
a21 b11 + a22 b21 a21 b12 + a22 b22
Das Kostet 8 Multiplikation (O(n3 )) und 4 (O(n2 )) Additionen. Wenn man einen Divide&ConquerAlgorithmus angibt, der die n × n Matrizen immer wieder in n/2 × n/2 Matrizen zerlegt und dabei die
klassische Form der Berechnung anwendet, erhält man die Rekursionsformel
T (n) = 8T (n/2) + O(n2 )
Laut Mastertheorem gilt für T (n) = O(n3 ). Also wurde durch Divide&Conquer nichts gewonnen, im
Vergleich zur normalen Matrizen-Multiplikation. Bei Strassens Methode wird die Anzahl der Multiplikationen auf 7 gedrückt. Man geht wie folgt vor. Zuerst werden sieben Produkte gebildet.
m1
m2
m3
:=
:=
:=
m4
m5
:=
:=
m6
m7
:=
:=
c1
=
c2
c3
c4
=
=
=
(a12 − a22 )(b21 + b22 )
(a11 + a22 )(b11 + b22 )
(a12 − a21 )(b11 + b12 )
(a11 + a12 )b22
a11 (b12 − b22 )
a22 (b21 − b11 )
(a21 + a22 )b11
Mit diesen Produkten ergibt sich:
m 1 + m2 − m4 − m6
m 4 + m5
m 6 + m7
m 2 − m3
Wenn der Divide&Conquer-Algorithmus Strassens Methode verwendet, ergibt sich
T (n) = 7T (n/2) + O(n2 )
und für das gilt laut Mastertheorem T (n) = O(nlog 7 ) = O(n2,81 ). Der Algorithmus von Strassen ist
also tatsächlich schneller.
9.7
Matchings
9.7.1
Was ist ein Matching?
Eine Matching ist eine Kantenmenge, wobei kein Knoten Endpunkt von mehr als einer Kante ist.
9.7.2
Welche Matchings sind interessant?
Interessant sind Matchings mit maximaler Kardinalität. Gibt es mehrere solche Matchings interessiert
man sich für Matchings maximaler Kardinalität mit minimalen bzw. maximalen Gewicht.
9.7.3
Wie findet man Matchings?
Man sucht nach augmentierenden Pfaden. Solange es noch einen augmentierenden Pfad gibt, kann man
diesen Invertieren und erhöht damit die Kardinalität des Matchings. Wenn es keine augmentierenden
Pfade mehr gibt, ist die Kardinalität des Matchings maximal.
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
129
Kapitel 9. Effiziente Algorithmen und Datenstrukturen
9.7.4
Was ist ein augmentierender Pfad? Wie findet man ihn?
Ein augmentierender Pfad ist ein Pfad dessen Kanten abwechselnd gemacht und ungematcht sind. Die
erste und die letzte Kante müssen ungematcht sein.
Im bipartiten Graphen können augmentierende Pfade mit einer modifizierten Breitensuche gefunden
werden.
130
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
Kapitel 10
Automaten, Formale Sprachen und
Berechenbarkeit
10.1
10.1.1
Allgemeines
i Was ist die Chomsky-Hierarchie?
Eine hierarchische Einteilung formaler Sprachen.
10.1.2
Möglichkeiten Sprachen zu Erzeugen?
Grammatiken und Turing-Generator-Maschinen.
10.1.3
Was ist Abzählbarkeit?
Eine unendliche Menge M ist abzählbar wenn es eine bijektive Abbildung von N nach M gibt:
M = {f (1), f (2), f (3), . . .}
Diese Funktion muss nicht zwangsweise berechenbar sein.
10.1.4
Kann man aus einer Grammatik schliessen, was für ein Sprachtyp beschrieben wird?
Ja. Die Produktion der verschiedenen Sprachtypen unterliegen bestimmten Regeln.
10.1.5
Was ist der Homomorphismus bei formalen Sprachen?
Wie Schnitt, Vereinigung, usw. ist auch ein Homomorphismus eine Operation auf formalen Sprachen.
Sei h : Σ → ∆∗ eine Abbildung, also Zeichen → Zeichenkette. Man kann die Abbildung zu einem
Homomorphismus h : Σ∗ → ∆∗ erweitern, also Zeichenkette → Zeichenkette. Die folgenden Schritte
Zeigen die zeichenweise Anwendung der Abbildung.
h()
h(a)
h(aw)
= = h(a)
= h(a)h(w)
Für eine Sprache L ⊆ Σ∗ heisst h = {h(w) | w ∈ L} ⊆ ∆∗ homomorphes Bild von L. Entsprechend ist
(−1)
h
= {x ∈ Σ∗ | h(x) = w, w ∈ L} das Urbild einer Sprache L ⊆ ∆∗ . Man nennt h
Homomorphismus.
10.1.6
(−1)
den inversen
Was sind Äquivalenzklassen? Was haben Sie mit formalen Sprachen zu tun?
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
131
Kapitel 10. Automaten, Formale Sprachen und Berechenbarkeit
Jede Äquivalenzrelation R teilt eine Menge in mehrere disjunkte Mengen. Die Anzahl dieser Mengen
heisst der Index von R. Man kann jeder Sprache die Äquivalenz Relation RL auf Σ∗ zuweisen. Es gilt
xRL y genau dann, wenn für alle Wörter z ∈ Σ∗ gilt
xz ∈ L ⇔ yz ∈ L
Der Satz von Myhill, Nerode besagt, dass eine Sprache genau dann regulär ist, wenn der Index der
von RL endlich ist. Auf diesem Satz beruht auch die Existenz des Minimalautomaten, der ja auch
Äquivalenzklassenautomat heisst.
10.2
10.2.1
Chomsky 3
Beschreiben die regulären Ausdrücke (a∗ a∗ ) und (a∗ |a∗ )∗ die selbe Sprache?
Beide Ausrücke beschreiben die Sprache, die durch den Ausdruck a∗ beschrieben wird.
10.2.2
Geben Sie einen endlichen Automaten für (a∗ |a∗ )∗ an.
Der Automat, der a∗ akzeptiert, sieht so aus:
a
z0
Der Automat A = (Q, Σ, δ, I, F ) ist definiert mit
Q
=
{z0 }
Σ = {a}
I = {z0 }
δ
F
10.2.3
= {(z0 , a, z0 )}
= {z0 }
Was sind reguläre Ausdrücke?
Reguläre Ausdrücke sind Formeln zur Beschreibung regulärer Sprachen. Sind sind induktiv definiert:
∅ ist ein regulärer Ausdruck
ist ein regulärer Ausdruck
jedes a ∈ Σ ist ein regulärer Ausdruck
sind α und β reguläre Ausdrücke, so ist auch αβ ein regulärer Ausdruck
sind α und β reguläre Ausdrücke, so ist auch α|β ein regulärer Ausdruck
ist α ein regulärer Ausdruck, so ist auch α∗ ein regulärer Ausdruck
10.2.4
Wie zeigt man, dass der Schnitt zweier regulärer Sprachen wieder eine reguläre Sprache ist?
Mit Hilfe der folgenden zwei Aussagen und des Gesetzes von De Morgan lässt sich die Abgeschlossenheit
unter Schnitt beweisen.
1. Reguläre Sprachen sind unter der Vereinigung abgeschlossen. Dies gilt, weil die regulären Ausrücke
genau die regulären Sprachen beschreiben und die Vereinigung eine der Operation bei regulären
Ausdrücken ist.
2. Reguläre Sprachen sind unter Komplementbildung abgeschlossen. Dies kann durch einen komplementären Automaten gezeigt werden. Vertauscht man bei einem Automaten A Endzustände mit
Nicht-Endzuständen, so erhält man einen Automaten A0 , der die Komplementärsprache erkennt.
132
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
10.2. Chomsky 3
Mit dem Gesetz von De Morgan ergibt sich für zwei Sprachen L1 und L2 :
L1 ∪ L 2 = L 1 ∩ L 2
10.2.5
Zeigen Sie, dass das Komplement bei regulären Sprachen abgeschlossen ist.
siehe 10.2.4
10.2.6
Welchen Typ hat die Sprache a3j+2 bi+1 , j, i ≥ 0? Geben Sie einen Automaten dazu an.
Da i und j nicht voneinander abhängig sind, handelt es sich um eine reguläre Sprache, ein entsprechender
Automat für i = j = 0 sieht so aus:
z0
10.2.7
a
z1
a
z2
b
z3
Was für Varianten von endlichen Automaten gibt es?
Ein endlicher Automat A = (Q, Σ, δ, I, F ) heißt:
1. Automat mit einem Startzustand wenn gilt |I| = 1.
2. alphabetisch, wenn gilt δ ⊆ Q × (Σ ∪ {}) × Q, d. h. jeder Übergang ist mein genau einem Zeichen
oder markiert
3. buchstabierend, wenn gilt δ ⊆ Q×Σ×Q, d. h. jeder Übergang ist mit genau einem Zeichen markiert,
ist nicht erlaubt
4. deterministisch (DEA), wenn er buchstabierend ist, genau einen Startzustand hat und für alle
p, q, r ∈ Q und alle a ∈ Σ mit (p, a, q) ∈ δ und (p, a, r) ∈ δ gilt q = r, d. h. von jedem Zustand gibt
es jeweils nur einen Übergang mit der Markierung a.
5. vollständig, wenn für jedes p ∈ Q und jedes a ∈ Σ ein q ∈ Q mit (p, a, q) ∈ δ existiert, d. h. von
jedem Zustand gibt es für jeden Buchstaben des Alphabets einen Übergang.
10.2.8
Sind reguläre Sprachen unter Homomorphismen abgeschlossen?
Ja. Der Beweis ergibt sich aus dem Beweis für die Substitution. Dieser Beweis läuft induktiv über
reguläre Ausdrücke und Arbeitet auf der syntaktischen Repräsentation der Sprache.
10.2.9
i Wie wandelt man einen endlichen Automaten in einen regulären Ausdruck um?
Man verwandelt den Automaten schrittweise in einen verallgemeinerten Automaten an dessen Kanten
reguläre Ausrücke stehen. Das mach man solang bis nur noch zwei Zustände, ein Startzustand und
ein Endzustand übrig bleiben. Auf der einzigen verbleibenden Transition steht der gesuchte reguläre
Ausdruck. Beispiel, Elimination des Zustandes qi :
ac*d
a
b
c
qi
d
bc*d
ac*e
e
f
bc*e|f
10.2.10 Pumping-Lemma erklären und beweisen.
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
133
Kapitel 10. Automaten, Formale Sprachen und Berechenbarkeit
Sei L eine reguläre Sprache. Dann gibt es eine Zahl n, so dass sich alle Wörter x ∈ L mit |x| ≥ n
zerlegen lassen in x = uvw, so dass folgende Eigenschaften erfüllt sind:
1. |v| ≥ 1,
2. |uv| ≤ n,
3. für alle i = 0, 1, 2, . . . gilt: uv i w ∈ L
Mit Hilfe des Pumping Lemmas lässt sich zeigen, dass eine Sprache nicht regulär ist. Der Beweis läuft
über die Konstruktion eines Automaten:
Da L regulär ist, gibt es einen Automaten A, der L erkennt. Für die Zahl der Zustände Q wählt man
|Q| = n. Ein beliebiges Wort x hat die Länge ≥ n, daher durchläuft der Automat beim Abarbeiten
des Wortes |x| + 1 Zustände (wenn man den Startzustand mit zählt). Mit dem Schubfachprinzip kann
man schliessen, dass diese Zustände nicht alle verschieden sein können (|x| ≥ n), d. h. irgendwann muss
der Automat eine Schleife durchlaufen. Jetzt wählt man die Zerlegung x = uvw so, dass Zustand nach
dem Lesen von u und uv derselbe ist. Diese Zerlegung kann so gewählt werden, dass Bedingung 1 und
2 erfüllt werden. Da die Zustände die selben sind, erreicht der Automat beim Lesen des Wortes uw
denselben Endzustand wie beim Lesen von x = uvw. Das heisst uw = uv 0 w ∈ L. Dasselbe gilt für
uvvw = uv 2 w, uvvvw = uv 3 w, usw. Damit ist auch Bedingung 3 erfüllt.
10.2.11 Pumping-Lemma auf Sprache der Palindrome anwenden.
Man nimmt an, dass die Sprache der Palindrome regulär ist und führt das mit dem Pumping Lemma
zum Widerspruch. Man wählt ein Wort x wie folgt:
n
n
z }| { z }| {
x = aa . . . aa b aa . . . aa
Nun sei x = uvw die den Bedingungen 1 und 2 des Pumping Lemmas entspricht
. . aa} abaa
. . . aa}
x = aa
. . aa} |aa .{z
| {z
| .{z
u
Wegen |v| ≥ 1 müsste dann auch
v
w
≤n
n
z }| { z }| {
uw = aa . . . aa b aa . . . aa
ein Wort der Sprache sein. Dies ist jedoch kein Palindrom, da das Wort mehr a’s als b’s enthält. Also
kann die Sprache der Palindrome nicht regulär sein.
10.2.12 Pumping-Lemma auf ai bi anwenden.
Man nimmt an, dass L = {ai bi | i ≥ 0} regulär ist und führt das mit dem Pumping Lemma zum
Widerspruch. Nun wählt man das Pumping Lemma n und betrachtet genau das Wort an bn mit der
Länge 2n. Für die Zerlegung uvw ergibt sich:
1. v ist nicht leer (Bedingung 1)
2. uv und v können nur aus a’s bestehen (Bedingung 2)
3. wegen Bedingung 3 müsste dann aber auch das Wort uv 0 w = uw = an−|v| bn in der Sprache sein.
Diese widerspricht der Definition von L, daher ist L nicht regulär.
10.2.13 Was ist der Unterschied zwischen einem NEA und DEA?
siehe 10.2.7
10.2.14 Welche Form haben die Produktionen bei regulären Sprachen?
Für jede Produktion l → r muss gelten |l| ≤ |r|, l muss eine einzige Variable sein, r ist ein Terminal
oder ein Terminal gefolgt von einer Variablen.
134
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
10.2. Chomsky 3
10.2.15 Wie funktioniert die Umwandlung von einem nicht-deterministischen Automaten zu einem deterministischen Automaten?
Die Umwandlung von einem NFA zu einem DFA läuft in 4 Schritten ab
1. endlicher Automat −→ Automat mit einem Startzustand
Man fügt einen neuen Startzustand q0 hinzu. Von diesem Zustand gibt es einen -Übergang zu allen
alten Startzuständen.
2. Automat mit einem Startzustand −→ alphabetischer Automat mit einem Startzustand
Ein Übergang mit einem Wort w = a1 a2 . . . an wird in mehrere Übergänge, die jeweils nur mit
einem Zeichen markiert sind, aufgeteilt. Dazu müssen n − 1 Zwischenzustände eingeführt werden.
3. alphabetischer Automat mit einem Startzustand −→ buchstabierender Automat mit einem Startzustand (-Elimination)
Beim Entfernen der -Übergänge muss sicher gestellt werden, dass die akzeptierte Sprache sich nicht
ändert. Die -Elimination gliedert sich in drei Teilschritte.
a) Für jede Kette von -Übergängen von p nach r gefolgt von einem a-Übergang von r nach q fügt
man einen a-Übergang von p nach r hinzu.
b) Falls von p eine Kette von -Übergängen zu einem Endzustand führt, wird p auch zum Endzustand.
c) Jetzt kann man die -Übergängen löschen.
4. buchstabierender Automat mit einem Startzustand −→ deterministischer endlicher Automat (Potenzautomatenkonstruktion)
Die Idee ist, alle Wege im buchstabierenden Automaten gleichzeitig zu Verfolgen und sich die
Zustände zu merken, in denen sich der Automat befinden könnte. Dazu verwendet man die Potenzautomatenkonstruktion. Für einen buchstabierenden Automaten A = (Q, Σ, δ, q0 , F ) definiert
man einen Automaten A0 = (P(Q), Σ, δ 0 , {q0 }, F 0 ), wobei P(Q) die Potenzmenge von Q ist. Die
Übergangsrelation δ 0 definiert man so: (P, a, R) ∈ δ 0 gdw. R = {r ∈ Q | ∃p ∈ P : (p, a, r) ∈ δ}
wobei P und R Teilmengen von Q also Element von P(Q) bzw. Zustände des Potenzautomaten
sind. Die Menge der Endzustände ist definiert durch F 0 = {P ⊆ Q | P ∩ F 6= ∅}, d. h. diejenigen
Teilmengen von Q, die mindestens einen Endzustand enthalten.
Der entstandene Automat A0 ist meist nicht minimal, er kann aber mit dem Myhill-Verfahren minimalisiert werden (10.2.18).
10.2.16 Sind reguläre Sprachen gleich den linearen Sprachen?
Eine Grammatik heisst rechtslinear wenn alle Produktionen die Form
A → wB
oder
A→w
haben. Sie heisst linkslinear wenn alle Produktionen die Form
A → Bw
oder
A→w
haben.
Eine Sprache L ist genau dann regulär, wenn es eine rechtslineare oder linkslineare Grammatik G mit
L = L(G) gibt.
Um dies zu Beweisen, kann man zeigen, dass es für jede lineare Grammatik einen endlichen Automaten
gibt, der diese Sprache erkennt. In der anderen Richtung muss man zeigen, dass für jede reguläre
Sprache einen lineare Grammatik gibt.
10.2.17 Wie zeigen Sie die Äquivalenz zweier regulärer Sprachen?
Von beiden Sprachen den Minimalautomaten bauen. Diese beiden Automaten müssen bis auf Isomorphie gleich sein, wenn die Sprachen äquivalent sind.
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
135
Kapitel 10. Automaten, Formale Sprachen und Berechenbarkeit
10.2.18 Algorithmus zur Minimalisierung von DEAs.
Zuerst kann man Zustände, die vom Startzustand aus nicht erreichbar sind, streichen. Dann bestimmt
man Paare von äquivalenten Zuständen. Dazu bestimmt man iterativ alle nicht-äquivalenten Zustände,
in dem man die folgenden Regeln anwendet, bis sich keine Änderungen mehr ergeben.
Wenn von zwei Zuständen einer ein Endzustand ist und der andere nicht, so sind die Zustände nicht
äquivalent
p∈F ∧q ∈
/F
⇒
p 6≡ q
Wenn von zwei Zuständen ein a-Übergang zu zwei nicht-äquivalenten Zuständen existiert, dann
sind auch die beiden Zustände nicht äquivalent.
(p, a, r) ∈ δ ∧ (q, a, r 0 ) ∈ δ ∧ r 6≡ r 0
⇒
p 6≡ q
Etwas detaillierter lässt sich der Algorithmus so beschreiben:
1. Stelle eine Tabelle aller Zustandspaare {q, q 0 } mit q 6= q 0 von A auf.
2. Markiere alle Paare {q, q 0 } mit q ∈ F und q 0 ∈
/ F (oder umgekehrt).
3. Für jedes noch unmarkierte Paar {q, q 0 } und jedes a ∈ Σ teste, ob
{δ(q, a), δ(q 0 , a)}
bereits markiert ist. Falls ja, wird auch {q, q 0 } markiert.
4. Der letzte Schritt wird so lange wiederholt, bis sich keine Änderungen mehr ergeben.
5. Alle jetzt noch unmarkierten Paar sind äquivalent und können daher verschmolzen werden.
10.3
10.3.1
Chomsky 2
Welchen Typ hat die Sprache ai+1 b3i , i ≥ 0? Geben Sie einen Automaten dazu an.
Diese Sprache ist kontextfrei, da die Anzahl der b’s von der der a’s abhängt. Der Kellerautomat liest
erstmal ein a ohne den Keller zu verändern, dann pusht er für jedes gelesene a drei Zeichen. Beim Lesen
eines b’s wird jeweils eins dieser Zeichen vom Keller geholt. Akzeptanz durch leeren Keller.
10.3.2
Was ist eine kontextfreie Sprache?
Eine kontextfreie Sprache ist vom Chomsky Typ 2, wird von einem Kellerautomaten akzeptiert und
von einer kontextfreien Grammatik erzeugt.
10.3.3
Welche Automaten erkennen kontextfreie Sprachen?
Kellerautomaten.
10.3.4
Erkennt ein deterministischer Kellerautomat kontextfreie Sprachen?
Ein deterministischer Kellerautomat erkennt nur deterministisch-kontextfreie Sprachen.
10.3.5
Welche Normalformen für kontextfreie Sprachen gibt es und für was sind sie gut?
Es gibt die
Chomsky Normalform. Hier haben alle Produktionen die Form A → BC oder A → a. Die Chomsky
Normalform wird für die Anwendung des CYK-Algorithmus’ gebraucht.
Greibach Normalform. Alle Produktionen haben die Form A → aB1 B2 . . . Bn . Sie wird zur Konstruktion von Kellerautomaten benötigt.
136
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
10.3. Chomsky 2
10.3.6
Erklären und beweisen Sie das Pumping-Lemma für kontextfreie Sprachen.
Sei L eine kontextfreie Sprache. Dann gibt es eine Zahl n ∈ N, so dass sich alle Wörter z ∈ L mit
|z| ≥ n zerlegen lassen in z = uvwxy mit folgenden Eigenschaften:
1. |vx| ≥ 1
2. |vwx| ≤ n
3. für alle i ≥ 0 gilt: uv i wxi y ∈ L
Beweisidee: Wenn eine Grammatik eine Sprache L mit unendlich vielen Wörtern erzeugt, dann muss es
Wörter geben in deren Ableitungsbaum auf einem Pfad dieselbe Variable mehrfach vorkommt (Schubfachprinzip).
S
(1)
S
A
A
u
v
w
A
(1)
A
(2)
(2)
A
x
y
u
v
v
w
x
x
y
Die Abbildung zeigt einen solchen Ableitungsbaum für das Wort uvwxy und uvvwxxy. Man kann
den bei Knoten (1) beginnenden Teilbaum so wählen, dass auf keinem Pfad dieses Teilbaums zwei
gleiche Variablen vorkommen. Jetzt kann man das Teilstück des Baumes zwischen (1) und (2) beliebig
oft wiederholen und erhält damit Ableitungsbäume für die Wörter uv i wxi y. Da in jedem bei (1)
beginnenden Teilbaum auf keinem Pfad Variablen doppelt vorkommen gilt |vwx| ≤ n für ein geeignetes
n. Man kann davon ausgehen, dass es in der Grammatik keine -Produktionen gibt, daher gilt auch
|vx| ≥ 1.
10.3.7
Zeigen Sie, dass L = {am bm cm } nicht kontextfrei ist.
Man nimmt an, dass L kontextfrei ist und für das mit dem Pumping Lemma zum Widerspruch. Man
wählt das Wort z = an bn cn . Dann hat z die Länge 3n ≥ n. Wegen Bedingung 2 können v und x
entweder nur aus a’s und b’s oder aus b’s und c’s bestehen. vx muss wegen Bedingung 1 mindestens ein
Zeichen enthalten. Dann kann aber uv 2 wx2 y nicht in L sein, da es entweder mehr a’s als c’s oder mehr
c’s als a’s enthält.
10.3.8
Was sind kontextfreie Grammatiken?
Bei kontextfreie Grammatiken gilt für jede Produktion l → r, |l| ≤ |r und das l eine einzige Variable
sein muss.
10.3.9
In welcher Klasse liegt die Sprache der Palindrome?
Palindrom sind vom Chomsky-Typ 2. Sie sind nicht deterministisch-kontextfrei.
10.3.10 Wie funktioniert der Kellerautomat für Palindrome?
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
137
Kapitel 10. Automaten, Formale Sprachen und Berechenbarkeit
Der Kellerautomat für Palindrome muss die Mitte des Wortes erraten. Der Kellerautomat könnte so
aussehen.
Q = {q0 , q1 }
Γ = Σ ∪ {c}
Z0 = c
F =∅
δ = {((q0 , x, y), (q0 , xy)) | x ∈ Σ, y ∈ Γ} ∪
{((q0 , , y), (q1 , y) | y ∈ Γ} ∪
nächstes Eingabezeichen pushen (1)
Entscheidung Mitte (gerade länge) (2)
{((q0 , x, y), (q1 , y)) | x ∈ Σ, y ∈ Γ} ∪
{((q1 , x, x), (q1 , )) | x ∈ Σ} ∪
{((q1 , , c), (q1 , ))}
Entscheidung Mitte (ungerade länge) (3)
Keller mit Eingabe vergleichen (4)
Startsymbol vom Keller löschen (5)
Die Menge der Endzustände F ist leer, da der Automat durch den leeren Keller akzeptiert.
10.3.11 Was sind nutzlose Variablen?
Eine Variable heisst nützlich wenn sie in mindestens einer Ableitung eines Wortes vorkommt. Wenn
eine Variable nicht nützlich ist, ist sie nutzlos. Eine nützliche Variable ist produktiv und erreichbar
(aber nicht umgekehrt).
Eine Variable A heisst produktiv, wenn aus ihr mindestens ein Wort abgeleitet werden kann.
Eine Variable A heisst erreichbar, wenn sie in mindestens einer Satzform vorkommt.
10.3.12 Was ist eine nullierbare Variable?
Eine Variable A einer Grammatik G heisst nullierbar, wenn gilt A ⇒∗G .
10.3.13 Wie erstellt man eine Grammatik, die keine -Produktion, keine Kettenproduktion und keine nutzlosen
Variablen enthält?
1. Elimination von -Produktion
Wenn die Grammatik eine Produktion enthält mit der Form A → A1 . . . An bei der für ein i ∈
{1, . . . n} die Variable Ai nullierbar ist, dann wird die Produktion durch A → A1 . . . Ai−1 Ai+1
ersetzt (Ai bleibt also weg). Die wird solange angewandt, bis es keine solchen Produktionen mehr
gibt. Produktionen der Form A → werden gelöscht. Diese Grammatik kann keine Sprachen
erzeugen, die enthalten.
2. Elimination von Kettenproduktionen
Jede Sequenz von Kettenproduktionen A ⇒∗G B gefolgt von eine Nicht-Kettenproduktion B → α
wird ersetzt durch eine Produktion A → α.
3. Entfernen von nutzlosen Variablen (dieser Schritt ist bei manchen Definitionen der Chomsky Normalform nicht gefordert)
Bei den beiden folgenden Schritten kommt es auf die Reihenfolge an.
a) Alle nicht-produktiven Variablen und die Produktionen in denen sie vorkommen können entfernt
werden, ohne dass die Sprache sich ändert.
b) Alle nicht-erreichbaren Variablen und die Produktionen in denen sie vorkommen können entfernt
werden, ohne dass die Sprache sich ändert.
10.3.14 Erklären Sie die Chomsky-Normalform und wie man sie erstellt.
Eine Grammatik ist in Chomsky-Normalform, wenn alle Produktionen die Form
A → BC
oder
A→a
haben. Um eine Grammatik vom Typ 2, die keine -Produktion, keine Kettenproduktion und keine
nutzlosen Variablen enthält, in Chomsky-Normalform zu überführen sind folgende Schritte notwendig.
138
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
10.3. Chomsky 2
1. Für jedes Terminal a wir eine neue Variable Ba und eine Produktion Ba → a eingefügt. Ausserdem
ersetzt man in jeder Produktion der Form A → α mit |α| ≥ 2 jedes Zeichen a in α durch die
Variable Ba
2. Jetzt ersetzt man jede Produktion der Form A → A1 . . . An mit n > 2 durch diese n−1 Produktionen
A
→
A 1 C1
C1
→
A 2 C2
C2
→
A 3 C3
..
.
Cn−2
→
An−1 An
wobei C1 , . . . , Cn−2 neue Variablen sind. Bei einer Grammatik in Chomsky Normalform hat die
Ableitung eines Wortes der Länge n genau 2n − 1 Schritte.
10.3.15 Sind kontextfreie Sprachen unter Schnitt abgeschlossen?
Nein. Beweis durch Gegenbeispiel. Die Sprachen L1 = {ai bj cj | i, j ≥ 0} und L2 = {ai bi cj | i, j ≥ 0}
sind beide Kontextfrei. Der Schnitt der Sprachen
L = L1 ∪ L2 = {ai bi ci | i ≥ 0}
ist aber nicht kontextfrei.
10.3.16 Wenn ich Ihnen einen Automaten auf den Tisch stelle, können Sie dann sagen, welchen Typ von Sprachen
er erkennt?
Es muss sich um einen EA handeln, da der unendliche Keller des Kellerautomaten nicht auf den Tisch
passen würde.
10.3.17 Wie sind Kellerautomaten definiert?
Ein Kellerautomat über einem Alphabet Σ besteht aus
einer endlichen Menge von Zuständen Q
einem Startzustand z0 ∈ Q
einem Kelleralphabet Γ
einem Anfangssymbol Z0 ∈ Γ
einem Menge von Endzuständen F
einer Übergangsrelation δ ⊆ (Q × (Σ ∪ {}) × Γ) × (Q × Γ∗ )
10.3.18 Wie definiert man einen Zustandsübergang?
Zustandsübergang kann als Funktion oder Relation definiert werden. Definition mit Relation siehe
10.3.17.
10.3.19 Welchen Arten von Akzeptanz gibt es bei Kellerautomaten. Zeigen Sie die Äquivalenz dieser Arten.
Es gibt Akzeptanz über Endzustände und Akzeptanz mit leerem Keller.
Ein Automat A der durch leeren Keller akzeptiert, kann wie folgt in einen Automaten A 0 , der durch
Endzustand akzeptiert umgewandelt werden.
1. Hinzufügen eines neuen Kellersymbols X0 ∈
/Γ
2. Hinzufügen eines Endzustandes Qf ∈
/Q
3. Automaten so modifizieren, dass er im ersten Schritt das Kellersymbol Z 0 durch Z0 X0 ersetzt
4. Automat A0 simuliert dann den Automaten A
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
139
Kapitel 10. Automaten, Formale Sprachen und Berechenbarkeit
5. Wenn die Berechnung mit leerem eigentlich beendet wäre, liegt auf dem Keller noch das Symbol
X0 . Deshalb werden Übergänge hinzugefügt, so dass der Automat X0 aus dem Keller löscht und in
den Endzustand Qf übergeht.
Ein Automat A der durch Endzustände akzeptiert, kann wie folgt in einen Automaten A0 , der durch
leeren Keller akzeptiert umgewandelt werden.
1. Automat A0 simuliert Automat A
2. Wenn A0 einen Endzustand erreicht, kann er sich nicht-deterministisch dafür entscheiden, den Keller
komplett zu löschen und damit Akzeptanz über leeren Keller zu erreichen.
Problem: Wenn A0 den leeren Keller erreicht, A sich aber nicht in einem Endzustand befindet, wird A 0
das Wort akzeptieren, obwohl A es nicht tut.
Lösung: Im ersten Schritt erzeugt A0 aus dem Startsymbol Z0 den Kellerinhalt Z0 X0 mit einem Kellersymbol X0 ∈
/ Γ. Damit kann der Keller garantiert nie leer werden. Der Keller wird nur leer, wenn
sich der Automat in einem Endzustand nicht-deterministisch für das komplette löschen des Kellers
entscheidet.
10.3.20 Geben Sie die Grammatik für Palindrome an.
Für das Alphabet Σ = {0, 1}.
S
S
S
S
S
S
→
→
0S0
1S1
→
→
00
11
→
→
0
1
10.3.21 Was ist eine linksrekursive Grammatik?
Eine linksrekursive Grammatik enthält Produktionen bei denen die erste Variabel auf der rechten Seiten
gleich der Variablen auf der linken Seite ist. Zum Beispiel
A → AB
Linksrekursive Grammatiken sind ungeeignet für die Verarbeitung mit Top-Down-Parsern, da diese
dabei in Endlosschleifen geraten können. Für die Elimination von Linksrekursionen, siehe 2.3.6.
10.3.22 Was ist eine mehrdeutige Grammatik?
Bei einer mehrdeutigen Grammatik gibt es für mindestens ein Wort verschiedene Ableitungsbäume.
10.3.23 Erklären Sie die Begriffe LL(k) und LR(k).
siehe 2.3.3.
i Welche Komplexität hat das Wortproblem?
10.3.24 Das Wortproblem kann mit dem CYK-Algorithmus in O(n3 ) gelöst werden.
10.3.25 Wie kann man eine Grammatik -frei machen?
siehe 10.3.13
140
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
10.4. Chomsky 1
10.4
10.4.1
Chomsky 1
i Ist das Wortproblem für kontextsensitive Sprachen entscheidbar?
Ja, aber N P -hart.
10.4.2
i Geben Sie einen Algorithmus für das Wortproblem an.
Man startet mit dem Startsymbol und leitet so oft ab, bis man das Wort gefunden hat oder nicht mehr
ableiten kann.
n
wie folgt definiert.
Formell: Für m, n ∈ N werden die Mengen Tm
n
Tm
= {w ∈ (V ∪ Σ)∗ | |w| ≤ n und w lässt sich aus S in höchstens m Schritten ableiten}
n
Die Mengen Tm
, n ≥ 1 lassen sich induktiv über m definieren.
T0n
n
Tm+1
Abln (X)
=
{S}
n
= Abln (Tm
), wobei
= X ∪ {w ∈ (V ∪ Σ)∗ | |w| ≤ n und w 0 ⇒ w für ein w0 ∈ X}
Abln (X) bildet also aus einer Menge von Wörtern (Satzformen) eine neue Menge, in dem sie X um alle
Wörter, die in einem Schritt aus allen Wörter aus X herleitbar sind, erweitert. Aufgenommen werden
nur Wörter, deren Länge ≤ n ist.
Da es nur endlich viele Wörter der Länge n gibt, ist
[
n
Tm
m≥0
für jedes n eine endliche Menge. Deshalb kann man folgenden Algorithmus angeben, der das Wortproblem für Typ 3, 2 und 1 Sprachen löst, da diese die Wortlängenmonotonie erfüllen. Als Eingabe erhält
der Algorithmus ein Wort und eine Grammatik.
Wortproblem(G, x)
1 n ← |x|
2 T ← {S}
3 do{
4
T1 ← T
5
T ← Abln (T1 )
6 } until (x ∈ T ) or (T = T1 )
7 if (x ∈ T ) return Ja
8 else return Nein
Dieser Algorithmus terminiert immer, hat aber exponentielle Laufzeit.
10.4.3
i Welche Komplexität hat dieser Algorithmus?
Ist N P -hart und daher Komplexität O(2n )
10.4.4
Was ist Wortlängenmonotonie?
Auch bei kontextsensitiven Sprachen können Worte in jedem Ableitungsschritt nur länger werden oder
gleich lang bleiben. Das ist eine grundlegende Voraussetzung für die Entscheidbarkeit des Wortproblems.
10.4.5
Welche Automaten erkennen kontextsensitive Sprachen?
Linear beschränkte Turingmaschinen.
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
141
Kapitel 10. Automaten, Formale Sprachen und Berechenbarkeit
10.4.6
Was ist das für eine Sprache {ww|w ∈ {0, 1}∗ }?
Es handelt sich um eine kontextsensitive Sprache. Diese Sprache beschreibt das aus dem Compilerbau
bekannte Problem, das eine Variable zuerst deklariert werden muss, bevor sie benutzt wird.
10.4.7
Welchen Typ hat die Sprache ak bm ak bm , k ∈ N, m ≥ 0?
Die Sprache ist kontextsensitiv. Sie entspricht dem Problem bei der Übersetzung eines Programmes
festzustellen, ob die Anzahl der Parameter beim Methodenaufruf gleich der Anzahl der Parameter bei
der Methodendeklaration ist.
10.5
10.5.1
Berechenbarkeit
Warum ist die Ackermannfunktion nicht primitiv rekursiv?
Informell: Man kann zeigen, dass man zur Berechnung von a(n+1, n+1) n verschachtelte For-Schleifen
braucht. Da dies für beliebige n gilt, gibt es keine Obergrenze für die Anzahl der For-Schleifen.
10.5.2
i Was ist der Satz von Rice und was bedeutet er?
Jede nicht-triviale Eigenschaft P ist unentscheidbar, d. h. die Sprache
LP = {hM i | M ist eine Turing-Maschine mit P (L(M ))}
ist nicht entscheidbar. Eine Eigenschaft von Sprachen ist eine Teilmenge P von aufzählbaren Sprachen.
Man schreibt P (L) wenn L die Eigenschaft erfüllt, d.ḣ. L ∈ P . Man schreibt ¬P (L) wenn L sie nicht
erfüllt. Eine Eigenschaft heisst nicht-trivial wenn es wenigstens eine aufzählbare Sprache mit L mit
P (L) und wenigstens eine aufzählbare Sprache L0 mit ¬P (L0 ) gibt.
Beispiel : Es ist nicht entscheidbar, ob eine Turing-Maschine nur endlich viele Wörter akzeptiert (d. h.
ob die Sprache endlich ist).
Die Eigenschaft P ist definiert durch P (L) = {L | |L| < ω}. Die Eigenschaft ist nicht trivial, da ¬P (Σ ∗ )
und P (∅).
Es ist nicht entscheidbar, ob die akzeptierte Sprache regulär ist. P (L) = {L | L ist regulär}. Eigenschaft
ist nicht-trivial: ¬P (an bn ) und P (∅)
10.5.3
i Erklären Sie den Begriff Aufzählbarkeit.
Der Begriff Aufzählbarkeit ist mit dem der Abzählbarkeit eng verwandt: Eine unendliche Menge M ist
aufzählbar wenn es eine surjektive, berechenbare Abbildung von N nach M gibt:
M = {f (1), f (2), f (3), . . .}
Die Abbildung muss auf jeden Fall berechenbar sein, hier liegt der Unterschied zur Abzählbarkeit. Wenn
diese Abbildung berechenbar ist, so kann auch jedes Element der Menge M tatsächlich erzeugt werden.
10.5.4
Was heisst rekursiv aufzählbar ?
Die Begriffe aufzählbar und rekursiv aufzählbar bedeuten im deutschen dasselbe.
10.5.5
Zeigen sie, dass eine rekursive aufzählbare Sprache semi-entscheidbar ist.
Satz: Eine Sprache ist rekursiv aufzählbar genau dann, wenn sie semi-entscheidbar ist.
Beweis: Von links nach rechts: Wenn die Sprache L mit der Funktion f rekursiv aufzählbar ist, dann
muss man nur der Reihe nach i = 0, 1, 2 . . . in f einsetzen und testen ob f (n) = x ist.
142
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
10.5. Berechenbarkeit
Von rechts nach links: Die Annahme ist, das die Sprache L semi-entscheidbar ist. Man sucht nach einer
Funktion f deren Wertebereich L ist, die also alle Elemente von A aufzählt.
Wenn L semi-entscheidbar ist, dann gibt es auch einen Algorithmus M , der diese Semi-Entscheidung
berechnet. Der Algorithmus bekommt ein Wort x der Sprache L als Eingabe und antwortet nach einer
endlichen Anzahl an Schritt mit ja oder er antwortet gar nicht. Mit Hilfe dieses Algorithmus kann
der in der Abbildung dargestellte Automat die Sprache aufzählen, in dem er mit natürlichen Zahlen
gefüttert wird (Automat nicht im Sinne von endlicher Automat).
n
C1
(x',y')
M'
x'
C2
x
M
ja
x
y'
K
a
{...}
M ist der bereits beschriebene Semi-Entscheidungs-Algorithmus. Er ist der zentrale Bestandteil des
Automaten M 0 . M 0 erweitert M um eine Kontrolleinheit K, die M nach einer bestimmten Anzahl von
Schritten abbrechen kann. Des weiteren wählt man a als ein Wort, das in der Sprache L liegt. Jetzt
erhält der Automat ein 2-Tupel (x0 , y 0 ) wobei x0 ∈ N und y 0 ∈ N als Eingabe. y 0 wird der Kontrolleinheit
K zugeführt, diese kann M nach y 0 Schritten abbrechen.
Der andere Teil des Tupels x0 ist ebenfalls eine natürliche Zahl, die aber ein Wort codiert. Entscheidend
dabei ist, dass jedes Wort als natürliche Zahl codiert werden kann. Dieses codierte Wort x0 wird von
Codierer C2 in das Wort x übersetzt. Der Algorithmus wird nun auf das Wort x angesetzt und gibt,
falls x ein Wort der Sprache ist, ja aus. Falls M ja ausgibt, gibt M 0 das Wort x aus. Da nicht
entscheidbar ist, ob der Algorithmus jemals anhält, bricht ihn die Kontrolleinheit nach y 0 Schritten ab.
In diesem Falle gibt M 0 das Wort a aus.
Man sieht, dass M 0 auf jeden Fall stoppt und immer ein Wort der Sprache ausgibt. M 0 erzeugt alle
Wörter der Sprach, wenn die Eingabe-Tupel alle Wörter enthalten und für jedes Wort, die Anzahl
der Schritte y 0 gross genug ist. Um dies sicher zustellen muss man den Algorithmus einfach mit allen
Wörter, die es gibt füttern und für jedes Wort alle möglichen Anzahlen an Schritten zulassen. Da heisst,
M 0 erzeugt alle Wörter, wenn er als Eingabe alle Tupel (N × N) erhält.
Genau dafür ist der Codierer C1 zuständig. Dieser erhält als Eingabe eine natürliche Zahl und erzeugt
als Ausgabe ein 2-Tupel mit natürlichen Zahlen. Es gibt berechenbare Funktionen, die solche Tupel
erzeugen ([Schöning, 1997, S. 111]), da (N × N) aufzählbar ist.
Der ganze Automat erzeugt nun alle Wörter der Sprache L, wenn er alle natürlichen Zahlen als Eingabe
enthält. Er berechnet also eine Funktion mit Definitionsbereich N und Wertebereich L.
10.5.6
Erklären Sie den Begriff Berechenbarkeit.
Laut der Churchschen These stimmt die durch die formale Definition der Turing-Berechenbarkeit erfasste Klasse von Funktionen genau mit der Klasse der im intuitiven Sinne berechenbaren Funktionen
überein.
Informell: Berechenbar ist, was man z. B. in Java programmieren kann.
10.5.7
Wie sind die primitiv rekursiven Funktionen definiert?
Die primitiv rekursiven Funktionen sind induktiv definiert:
1. Alle konstanten Funktionen sind primitiv rekursiv.
2. Alle identischen Abbildungen (Projektionen) sind primitiv rekursiv.
3. Die Nachfolgerfunktion s(n) = n + 1 auf den natürlichen Zahlen ist primitiv rekursiv.
4. Jede Funktion die durch Einsetzung (Komposition) von primitiv rekursiven Funktionen entsteht,
ist selbst primitiv rekursiv.
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
143
Kapitel 10. Automaten, Formale Sprachen und Berechenbarkeit
5. Jede Funktion, die durch sog. primitive Rekursion aus primitiv rekursiven Funktionen entsteht, ist
primitiv rekursiv. Primitive Rekursion bedeutet, dass die Definition von f (n + 1, . . .) zurückgeführt
wird auf f (n, . . .). Formal muss f ein Gleichungssystem der folgenden Form erfüllen:
f (0, . . .) = g(. . .)
f (n + 1, . . .) = h(f (n, . . .), . . .)
wobei g, h selbst primitiv rekursive Funktionen sind.
10.5.8
Wie ist der µ-Operator definiert?
Durch Anwendung des µ-Operators wird aus einer n + 1-stelligen Funktion g eine n-stellige Funktion
µg.
min{k ∈ N | g(x, k) = 0 ∧ (g(x, j) ist definiert für alle j ≤ k)}
(µg)(x) =
undefiniert, falls min nicht existiert
µg(x) bezeichnet also den kleinsten Index k, für den g(x, k) = 0 gilt und für den für alle j ≤ k der Wert
g(x, j) definiert ist.
10.5.9
Wie unterscheiden sich die primitiv rekursiven von den µ-rekursiven Funktionen?
Die Berechbarkeitsmächtigkeit der primitiv rekursiven Funktion entspricht der Loop-Berechenbarkeit.
Die Berechbarkeitsmächtigkeit der µ-rekursiven Funktionen entspricht der While- bzw. Turing-Berechenbarkeit.
10.5.10 Wie geht die Umwandlung einer nicht-deterministischen Turingmaschine in eine Deterministische?
Dazu muss erstmal die Idee der beschränkten Simulation beschrieben werden. Ein beschränkter Simulator Sim(M ) einer TM M erweitert M um einen Zähler der mit n initialisiert wird. Sim(M ) erhält
als Eingabewort w#n wobei w das Eingabewort und n ein Wort aus n Strichen ist. Bei jedem Abarbeitungsschritt wird der Zähler um 1 decrementiert (ein Strich gelöscht). Ist der Zähler bei 0 bevor das
Wort w erkannt wurde, akzeptiert die Maschine nicht.
Diese Idee kann nun erweitert werden um eine DTM zu bauen. Gegeben sei folgende nicht-deterministische
Turing-Maschine M = (Q, Σ, Γ, δ, q0 , B, F ). Für einen Zustand q ∈ Q und ein gelesenes Zeichen a definiert man A(q,a) = {(p, b, m) | ((q, a), (p, b, m) ∈ δ} als die Menge der möglichen Übergänge nach q bei
gelesenem Eingabezeichen a. Man nennt A(q,a) die Menge der Alternative. Die maximale Anzahl k von
Alternativen der Turingmaschine ist k = max{|A(q,a) | | q ∈ Q, a ∈ Γ}
Nun kann man jeder Alternative aus A(q,a) eindeutig eine Nummer aus {1, 2, . . . , k} zuordnen. Jetzt sei
π = k1 k2 . . . kn mit ki = {1, 2, . . . , k}. Sei Sim(M ) eine Turingmaschine, die die Eingabe w#π erhält,
wobei w ∈ Σ∗ . Sim(M ) simuliert die Turingmaschine M auf der Eingabe w für |π| Schritte; ki gibt
in jedem Simulationsschritt an, welche Alternative der TM M die TM Sim(M ) wählen soll. Wenn die
Wahl einer alternative nicht möglich ist, wird die Simulation erfolglos abgebrochen.
Diese Maschine ist deterministisch, da jede Alternativenwahl vorgeben ist und stoppt nach |π| Schritten.
Nun kann man aus Sim(M ) eine Maschine M 0 bauen, die für die Eingabe w systematisch alle Paare
w#π erzeugt und dann Sim(M ) mit Eingabe w#π startet. Wenn Sim(M ) für ein π die Eingabe w#π
akzeptiert, dann akzeptiert M 0 die Eingabe w. Es gilt L(M ) = L(M 0 ). Denn es gilt w ∈ L(M 0 ) gdw.
ein π ∈ {1, 2, . . . , k}∗ mit w#π von Sim(M ) akzeptiert wird gdw w ∈ L(M ) gilt.
10.5.11 Zeigen Sie die Unentscheidbarkeit des Wortproblems?
Definition des Wortproblems:
LW = {hM i#hwi | M ist eine Turing-Maschine und w ∈ L(M )}
wobei hM i und hwi geeignete Repräsentationen der Turing-Maschine bzw. eines Wortes sind. Die Frage
ist nun, ist diese Sprache entscheidbar, das heisst, gibt es eine Turing-Maschine, die genau diese Sprache
erkennt, also für jede Kombination Turing-Maschine–Sprache mit ja oder nein antworten kann.
144
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
10.5. Berechenbarkeit
Die Unentscheidbarkeit wird durch einen Widerspruchsbeweis gezeigt. Man nimmt an, dass es eine
deterministische Turing-Maschine W mit L(W ) = LW gibt, die für alle Eingaben hält, also das Wortproblem löst.
Aus dieser angenommenen Turing-Maschine W wird jetzt eine Turing-Maschine M , wie in der Abbildung
gezeigt, konstruiert.
ja
M
x
D
x#x
W
ja
nein
nein
Ein Wort x, das in die Turing-Maschine M gegeben wird, wird zuerst vom Duplizierer D verdoppelt
zum dem Wort x#x. Diese Wort wird nun in die Turing-Maschine W gegeben, die auf jedem Wort
hält. Zum Schluss wird das Ergebnis noch negiert. Nun gibt man der Turing-Maschine ihre eigene
Repräsentation als Eingabe, also x = hM i. M verhält sich dann wie folgt.
Auf jeden Fall hält M , da der Duplizierer D immer hält und die Maschine W laut der Widerspruchsannahme auch immer hält.
Wenn M mit ja antwortet, dann muss W auf der Eingabe hM i#hM i mit nein gehalten haben.
Gemäss der Widerspruchsannahme gilt dann hM i#hM i ∈
/ LW . Die Turing-Maschine W löst ja das
Wortproblem, das sie mit nein Antwortet ist also hM i kein Wort der Sprache L(M ), die durch
die Turing-Maschine M erkannt wird. Es gilt also hM i ∈
/ L(M ). Das heisst aber wiederum, dass
die Maschine M auf der Eingabe hM i nicht mit der Antwort ja hält.
Dieser Widerspruch zeigt, dass die Turing-Maschine M für die Eingabe hM i nicht mit der Antwort
ja halten kann.
Wenn M auf der Eingabe hM i mit der Antwort nein hält, dann muss W auf der Eingabe
hM i#hM i mit ja halten. Dann gilt laut der Widerspruchsannahme, dass hM i#hM i ∈ LW .
Aufgrund der Definition von LW gilt dann aber auch hM i ∈ L(M ). Was aber bedeutet, dass M
mit der Antwort ja hält.
Dieser Widerspruch zeigt, dass die Turing-Maschine M für die Eingabe hM i nicht mit der Antwort
nein halten kann.
Die Turing-Maschine M hält also für die Eingabe hM i weder mit ja noch mit nein . Da die Maschine aber per Konstruktion immer hält, liegt ein Widerspruch vor. Die einzige Annahme die getroffen
wurde, war, dass es eine Maschine W gibt, die das Wortproblem löst. Aufgrund des Widerspruchs kann
W nicht existieren und somit ist das Wortproblem nicht entscheidbar.
10.5.12 Beweisen Sie die Unentscheidbarkeit des Halteproblems.
Definition des Halteproblems:
LH = {hM i#hwi | M ist eine Turing-Maschine und hält bei der Eingabe w}
wobei hM i und hwi geeignete Repräsentationen der Turing-Maschine bzw. eines Wortes sind. Die Frage
ist nun, ist diese Sprache entscheidbar, das heisst, gibt es eine Turing-Maschine, die genau diese Sprache
erkennt, also für jede Kombination Turing-Maschine–Sprache mit ja oder nein antworten kann.
Man zeigt die Unentscheidbarkeit des Halteproblems indem man das Wortproblem auf das Halteproblem
reduziert. Man zeigt, also, dass man aus einer Maschine die das Halteproblem entscheidet, eine Maschine
bauen könnte, die das Wortproblem entscheidet. Da das Wortproblem nicht entscheidbar ist, kann es
ein solche Maschine nicht geben.
Eine deterministische Turing-Maschine M kann man so umbauen, dass sei ein Wort genau dann akzepf bezeichnet.
tiert, wenn sie auf dem Wort hält. Die umgebaute Maschine wird mit M
Die folgende Maschine entscheidet das Wortproblem.
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
145
Kapitel 10. Automaten, Formale Sprachen und Berechenbarkeit
ja
〈M〉#〈w〉
〈M〉#〈w〉
U
ja
H
nein
nein
Sie wird mit einer Instanz des Wortproblems gefüttert. Die Umbauer-Maschine U baut die Maschine M
f um. Diese Maschine akzeptiert w wenn sie auf ihm hält. Jetzt wird eine Beschreiin eine Maschine M
bung der umgebauten Maschine und das Wort in die Maschine H eingeführt. H ist die hypothetische
f auf w hält und antwortet immer.
Maschine, die das Halteproblem löst. Sie testet nun ob, M
Wie man sieht, würde dies Maschine das Wortproblem lösen. Da das Wortproblem aber bewiesenermassen unentscheidbar ist, kann die Maschine H nicht existieren und somit das Halteproblem auch
nicht entscheidbar.
i Beweisen Sie die das Halteproblem. (2. Variante)
10.5.13 Der Beweis läuft in zwei Schritten, zuerst beweist man das spezielle Halteproblem und reduziert es dann
auf das Halteproblem.
Spezielles Halteproblem: Unter dem speziellen Halteproblem versteht man die Sprache
K = {w ∈ {0, 1}∗ | Mw angesetzt auf w hält}
Diese Sprache ist nicht entscheidbar.
Beweis: Man nimmt an, dass K entscheidbar ist und führt diese Annahme zum Widerspruch. Falls
K entscheidbar ist, dann lässt sich χK mit einer Turingmaschine M berechnen. Nun baut man diese
Turing-Maschine M um in eine Turingmaschine um in eine Turingmaschine M 0 , die wie folgt definiert
ist.
M'
start
M
=0?
nein
ja
stop
Die Maschine M 0 stoppt wenn M 0 ausgibt, ansonsten gerät M 0 in eine Endlosschleife. Jetzt betrachtet
man ein Codewort w 0 der Maschine M 0 und kommt zu folgenden Schlussfolgerungen:
M 0 angesetzt auf w 0 hält
M 0 angesetzt auf w 0 hält
⇔
⇔
⇔
⇔
⇔
M angesetzt auf w 0 gibt 0 aus
χK (w0 ) = 0
w0 ∈
/K
Mw0 angesetzt auf w 0 hält nicht
M 0 angesetzt auf w 0 hält nicht
Der Widerspruch zeigt, dass die Annahme falsch war, K ist nicht entscheidbar.
Allgemeines Halteproblem: Unter dem allgemeinen Halteproblem versteht man die Sprache
H = {w#x| Mw angesetzt auf x hält}
Diese Sprache ist nicht entscheidbar.
Beweis: Wir wissen bereits, dass das spezielle Halteproblem nicht entscheidbar ist, dieses reduzieren wir
jetzt auf das allgemeine Halteproblem. D. h. wir zeigen, dass das spezielle Halteproblem eine Spezialfall
des allgemeinen Halteproblems ist, dann kann das allgemeine Halteproblem nicht entscheidbar sein.
Formal: Man zeigt, das K ≤ H. Dazu wählt man als Reduzierungsfunktion f (w) = w#w. Dann gilt:
w ∈ K ⇔ f (w) ∈ H.
146
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
10.5. Berechenbarkeit
i Was ist die Kleen’sche Normalform?
10.5.14 Ein Programm, dass nur aus einer einzigen While-Schleife besteht, ist in Kleen’scher Normalform.
10.5.15 Gibt es Funktionen, die Turing aber nicht Loop-berechenbar sind?
Ja. Z. B. die Ackermannfunktion.
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
147
Kapitel 11
Logik
11.1
11.1.1
Allgemeines
Was bedeuteten Korrektheit und Vollständigkeit?
Die Aufgabe eines Kalküls ist es die Unerfüllbarkeit einer Formelmenge zu beweisen. Das Kalkül
muss vollständig und korrekt sein. Korrektheit bedeutet, dass keine erfüllbare Formel vermeintlich als
unerfüllbar erkannt wird. Vollständigkeit bedeutet, dass jede unerfüllbare Formel nachgewiesen werden
muss.
11.2
11.2.1
Aussagenlogik
Erklären Sie was gültige, erfüllbare und unerfüllbare Formeln sind.
Eine Formel F ist erfüllbar falls sie mindestens ein Modell A hat. Man schreibt A |= F . Eine Formel
F heisst gültig falls für jede zu F passende Belegung A gilt A |= F . Man nennt F eine Tautologie und
schreibt |= F . Eine Formel F heisst unerfüllbar falls es keine passende Belegung, die ein Modell ist,
gibt.
11.2.2
Wenn Sie einen Entscheidungsalgorithmus für die Erfüllbarkeit haben, wie können Sie zeigen, dass zwei
Formeln äquivalent sind?
Zeigen, dass A ↔ B eine Tautologie ist.
11.2.3
i Wie funktioniert die aussagenlogische Resolution?
Die Resolution ist ein aussagenlogisches Kalkül. Um Resolution anzuwenden muss die Formel in KNF
dargestellt werden. Vorteilhaft ist es dann die KNF-Formel als Mengen sog. Klauseln darzustellen.
Aus
F = (L1,1 ∨ . . . ∨ L1,n1 ) ∧ . . . ∧ (Lk,1 ∨ . . . ∨ Lk,nk )
wird
F = {{L1,1 , . . . , L1,n1 }, . . . , {Lk,1 , . . . , Lk,nk }}
wobei L Literale sind.
Wenn K1 , K2 und R Klauseln sind, dann heisst R Resolvent von K1 und K2 , falls ein Literal L gibt
mit L ∈ K1 und L ∈ K2 und R diese Form hat
R = (K1 − {L}) ∪ (L2 − {L})
Wenn F eine Klauselmenge ist, dann ist Res(F ) definiert als
Res(F ) = F ∪ {R | R ist Resolvent zweier Klauseln aus F }
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
149
Kapitel 11. Logik
Desweiteren ist
Res0 (F ) = F
und
Ausserdem ist
Res∗ (F ) =
Resn+1 (F ) = Res(Resn (F ))
[
Resn (F )
n≥0
Auf Unerfüllbarkeit wird mit dem Resolutionssatz getestet:
Resolutionssatz: Eine Klauselmenge F ist unerfüllbar genau dann, wenn 2 ∈ Res∗ (F ).
11.2.4
Was ist das Resolutionslemma?
Sei F eine Formel in KNF, dargestellt als Klauselmenge. Ferner sei R ein Resolvent zweier Klauseln
K1 und K2 . Dann sind F und F ∪ {R} äquivalent.
Beweis: Sei A eine zu F und damit auch zu F ∪ {R} passende Belegung. Wenn A |= F ∪ {R}, dann
gilt natürlich auch A |= F .
Umgekehrt wird angenommen, dass A |= F , dann gilt für alle Klauseln K ∈ F : A |= K. Der Resolvent
R hat die Form R = (K1 − {L}) ∪ (K2 − {L}) mit K1 , K2 ∈ F und L ∈ K1 , L ∈ K2 . Jetzt muss man
zwei Fälle unterscheiden.
1. Fall : A |= L
Da A |= L gilt sicherlich A 6|= L. Weiterhin gilt A |= K2 . Wenn A Modell für K2 ist, dann gilt auch
A |= (K2 −{L}, da das Literal, das aus der Klausel entfernt wird, ja eh nicht erfüllbar ist. Innerhalb
der Klausel sind alle Literale mit ∨ verbunden, deshalb ändert das entfernen einer 0 nichts. Der
Resolvent wird durch Vereinigung von (K1 − {L}) und (K2 − {L}) gebildet. Die einzelnen Literale
in R sind also wieder alle durch ∨ verbunden, da A |= K2 gilt, muss auch A |= R gelten.
2. Fall : A 6|= L
Da A |= k1 , gilt auch A |= (K1 − {L}) und somit A |= R.
Es gibt nur diesen beiden Fälle und für beide gilt, A |= R, also muss auch A |= F ∪ {R} gelten.
11.2.5
i Beweis für Korrektheit und Vollständigkeit der Resolution.
Resolutionssatz: Eine Klauselmenge F ist unerfüllbar genau dann, wenn 2 ∈ Res∗ (F ).
Korrektheit: Angenommen 2 ∈ Res∗ (F ). Die leere Klausel 2 kann nur durch Resolution zweier
Klauseln K1 und K2 mit K1 = {L} und K2 = {L} entstanden sein. Aus dem Resolutionslemma folgt:
F ≡ Res1 (F ) ≡ Res2 (F ) ≡ . . . ≡ Resn (F ) ≡ . . .
Da 2 in Res∗ (F ) enthalten ist (Annahme), ist für ein n ≥ 0, 2 ∈ Resn (F ), und damit auch K1 , K2 ∈
Resn (F ). Das es kein Modell gibt, das sowohl K1 als auch K2 erfüllt, ist Resn (F ) unerfüllbar. Da
Resn (F ) ≡ F , ist F unerfüllbar.
Vollständigkeit: Die Annahme ist nun, dass F unerfüllbar ist und man will zeigen, dass in diesem
Falle auch tatsächlich 2 ∈ Res∗ (F ) gilt. Der Beweis ist ein Induktionsbeweis über die Anzahl n der
atomaren Formeln in F . Aufgrund des Endlichkeitssatzes kann man sich auch wenn F eine unendliche
Formelmenge ist, auf eine endliche unerfüllbare Teilmenge von F beschränken.
Induktionsanfang: Falls n = 0, so kann F nur F = {2} sein und somit ist 2 ∈ Res ∗ (F ).
Induktionsschritt: Man wählt ein beliebiges aber festes n. Es wird angenommen, dass für jede unerfüllbare Klauselmenge G, die nur die atomaren Formeln A1 , A2 , . . . An enthält, gilt 2 ∈ Res∗ (F ).
Jetzt sei F eine Klauselmenge mit den atomaren Formeln A1 , A2 , . . . An+1 . Jetzt werden aus F zwei
neue Klauselmengen F1 und F0 wie folgt konstruiert.
F0 : Das Atom An+1 wird auf den Wert 0 fixiert. Dann entsteht F0 aus F indem jedes Vorkommen
von An+1 aus den Klausel gestrichen wird. Das geht da, A ∨ 0 = A. Ausserdem wird jede Klausel, die
¬An+1 enthält komplett gestrichen. Eine Klausel, die den Wert 1 enthält, hat insgesamt den Wert 1
und kann damit gestrichen werden.
150
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
11.2. Aussagenlogik
F1 : Das Atom An+1 wird auf den Wert 1 fixiert. Dann entsteht F1 aus F indem jedes Vorkommen von
¬An+1 aus den Klausel gestrichen wird. Das geht da, A ∨ 0 = A. Ausserdem wird jede Klausel, die
An+1 enthält komplett gestrichen. Eine Klausel, die den Wert 1 enthält, hat insgesamt den Wert 1 und
kann damit gestrichen werden.
Zu beachten ist, dass weder F0 noch F1 das Atom An+1 oder ¬An+1 enthalten. Im nächsten Schritt will
man zeigen, dass sowohl F0 wie F1 unerfüllbar sind. Dies wird mit einem Widerspruchsbeweis erreicht
(nur für F0 ausgeführt):
Angenommen es gibt eine Belegung A : {A1 , . . . , An } → {0, 1}, die F0 erfüllt, dann ist A0 ein Modell
für F , wobei A0 wie folgt definiert ist:
A(B) falls B ∈ {A1 , . . . , An }
0
A (B) =
0
falls B = An+1
Die Existenz des Modells A0 steht aber im Widerspruch zur angenommenen Unerfüllbarkeit von F .
Deshalb kann F0 nicht erfüllbar sein, aus dem selben Grund ist auch F1 unerfüllbar.
Man weiss nun, dass F0 und F1 unerfüllbar sind, daher kann auf sie die Induktionsvoraussetzung
angewandt werden und es gilt 2 ∈ Res∗ (F0 ) und 2 ∈ Res∗ (F1 ). Das heisst auch, dass es Klauseln
K1 , . . . , Km geben muss mit:
Km = 2 und für i = 1, . . . , m gilt: Ki ∈ F0 oder Ki ist Resolvent zweier Klauseln Ka , Kb mit a, b < i.
D. h. es gibt für F0 eine Folge von Klausel K1 , . . . , Km , die zur leeren Klausel führt. Für F1 gibt es
ebenfalls eine Folge K10 , . . . , Kt0 .
Einige der Klauseln Ki entstanden aus F wobei das Vorkommen des Literals An+1 gestrichen wurde.
Jetzt wird die ursprüngliche Klausel Ki ∪{An+1 } wieder hergestellt und An+1 bei den Resolutionsschritten mitgeführt. Es kann nur passieren, dass im Laufe der Resolutionsschritte die leere Klausel auftaucht,
dann ist alles gezeigt. Wenn dies nicht passiert, ist am Ende auf jeden Fall {A n+1 } ∈ Res∗ (F ).
Durch das Wiedereinfügen der von ¬An+1 in die Folge K10 , . . . , Kt0 , ergibt sich am Ende auf jeden Fall
{¬An+1 } ∈ Res∗ (F ).
Jetzt braucht nur noch ein Resolutionsschritt durchgeführte werden
{An+1 }
{¬An+1 }
2
und es gilt 2 ∈ Res∗ (F ).
11.2.6
i Woraus besteht die Aussagenlogik (Syntax/Semantik)?
Syntax. Eine atomare Formel hat die Form Ai , wobei i = 1, 2 . . .. Formeln werden induktiv definiert.
1. Alle atomaren Formeln sind Formeln.
2. Für alle Formeln F und G sind (F ∧ G) und (F ∨ G) Formeln.
3. Für jede Formel F ist ¬F eine Formel.
Semantik. Es gibt eine Funktion A, die die atomaren Formeln auf die Menge der Wahrheitswerte
{0, 1} abbildet. Desweiteren gibt es eine Funktion  die Menge der Formeln auf die Wahrheitswerte abbildet. Die Unterscheidung zwischen A und  hat formale Gründe, da  einen grösseren
Definitionsbereich als A hat. In einigen Bücher wird diese Unterscheidung nicht gemacht und in
allen wird sie früher oder später weggelassen. Die Semantik ist wie folgt definiert.
1. für jede atomare
2. Â((F ∧ G)) =
3. Â((F ∨ G)) =
Formel A ist Â(A) = A(A).
1, falls Â(F ) = 1 und Â(G) = 1
0, sonst
1,
0,
falls Â(F ) = 1 oder Â(G) = 1
sonst
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
151
Kapitel 11. Logik
4. Â((¬F )) =
11.2.7
1,
0,
falls Â(F ) = 0
sonst
Was sind die minimalen Junktoren?
Sowohl mit NAND als auch NOR können ∧, ∨, ¬ dargestellt werden.
11.2.8
Was ist eine Basis?
Eine Menge O von Operatoren ist eine Basis (vollständig) falls es zu jeder Funktion f : W n → W, n ≥ 1
eine Formel F gibt, sodass
F enthält nur Operatoren aus O und atomare Aussagen A1 , . . . An
für alle zu F passenden Belegungen A gilt f (A(A1 ), . . . , A(An )) = A(F ).
11.2.9
Erklären Sie die Konjunktive Normalform.
Eine Formel ist in konjunktiver Normalform, wenn sie folgende Form hat:
F = (L1,1 ∨ . . . ∨ L1,n1 ) ∧ . . . ∧ (Lk,1 ∨ . . . ∨ Lk,nk )
Beweis dafür, dass es für jede Formel eine konjunktive Normalform gibt, ist ein Induktionsbeweis über
den Formelaufbau.
Algorithmus zum Erzeugen der KNF:
1. Ersetze in F jedes Vorkommen einer Teilformel der Bauart
¬¬G durch G
¬(G ∧ H) durch (¬G ∨ ¬H)
¬(G ∨ H)
durch
(¬G ∧ ¬H)
bis keine derartige Teilformel mehr vorkommt.
2. Ersetze in F jedes Vorkommen einer Teilformel der Bauart
(F ∨ (G ∧ H))
((F ∧ G) ∨ H)
durch
durch
((F ∨ G) ∧ (F ∨ H))
((F ∨ h) ∧ (G ∨ H))
bis keine derartige Teilformel mehr vorkommt.
Die Formel ist nun in KNF. Es kann allerdings sein, dass noch überflüssige Disjunktion vorkommen.
Diese jedoch zulässig, da es sich um Tautologien handelt.
Beispiel:
(¬A → B) ∧ ((A ∧ ¬C) → B)
= (A ∨ B) ∧ (¬(A ∧ ¬C) ∨ B)
= (A ∨ B) ∧ ((¬A ∨ C) ∨ B)
= (A ∨ B) ∧ (¬A ∨ C ∨ B)
11.2.10 Erklären Sie die Disjunktive Normalform.
Eine Formel ist in disjunktiver Normalform, wenn sie folgende Form hat:
F = (L1,1 ∧ . . . ∧ L1,n1 ) ∨ . . . ∨ (Lk,1 ∧ . . . ∧ Lk,nk )
Beweis dafür, dass es für jede Formel eine disjunktive Normalform gibt, ist ein Induktionsbeweis über
den Formelaufbau.
152
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
11.2. Aussagenlogik
i Was ist der Endlichkeitssatz?
11.2.11 Eine Menge M von Formel ist erfüllbar genau dann, wenn jede der endlichen Teilmengen von M erfüllbar
ist.
i Beweis des Endlichkeitssatzes?
11.2.12 Die Richtung von links nach rechts ist einfach. Jedes Modell für M ist ein Modell für jede Teilmenge
von M und damit auch für jede endliche Teilmenge. In die andere Richtung wird es kompliziert, daher
zerlegt man den Beweis am Besten in mehrere Schritte.
1. Erst nochmal die Aufgabe verdeutlichen: Man nimmt an, jede endliche Teilmenge von M ist
erfüllbar, dass heisst sie hat ein Modell. Die Aufgabe ist nun aus diesen unendlich vielen Modellen ein Modell für M zu konstruieren. Wenn das gelingt, ist auch die Richtung von rechts nach
links bewiesen.
2. Für jedes n ≥ 1 sei Mn die Menge der Formel in M, die nur die atomaren Formeln A1 , . . . An
enthalten. Jede dieser Mengen Mn ist wieder unendlich, da es unendlich viele Möglichkeiten gibt n
n
atomare Formeln zu einer Formel zusammen zubauen. Aber es gibt höchstens k ≤ 22 verschiedene
Formeln in M, die nicht äquivalent zueinander sind.
n
Wieso? Für eine Formel mit n atomaren Formeln kann man höchstens 22 verschiedene Wahrheitstafeln aufstellen. Für jede atomare Formel zwei Möglichkeiten, daher 2n und dann noch pro
n
Belegung wahr oder ’falsch, macht 22 verschiedene Wahrheitstafeln.
Man nennt diese nicht äquivalenten Formeln in Mn jetzt F1 . . . Fk , da es ja nicht mehr als k gibt.
Jetzt kann man für jede Formel F aus Mn eine zu ihr äquivalente Formel Fi mit i ≤ k finden.
Formell: Für jedes F ∈ Mn gibt es ein i ≤ k mit Fi ≡ F .
Jedes Modell was Modell für die Formelmenge {F1 , . . . , Fk } ist, muss daher auch Modell für Mn
sein. Das ist schon mal nicht schlecht, das Modell für die endliche Formelmenge {F1 , . . . , Fk } ist
auch Modell für die unendliche Formelmenge Mn (damit ist leider noch nichts bewiesen). Das
Modell für die Formelmenge Mn heisst ab jetzt An . Dieses Modell hat eine wichtige Eigenschaft.
Da M1 ⊆ M2 ⊆ . . . ⊆ Mn , ist An nicht nur Modell für Mn , sondern auch für M1 , M2 , . . . , Mn−1 .
3. Eigentlich sucht man ja nach dem Modell A für die Menge M. Diese Modell muss nun aus den
Modellen Ai zusammengesetzt (konstruiert) werden.
Zur Schreibweise: Das gesuchte Modell A ist eine Funktion die von den atomaren Formeln A n auf
die Wahrheitswerte {0, 1} abbildet. Diese Funktion kann auch in Relationenschreibweise geschrieben
werden, wobei A(An ) = 1 durch (An , 1) und A(An ) = 0 durch (An , 0) ausgedrückt wird. Das hat
den Vorteil das man die Mengenoperation ∪ zum Erweitern des Definitionsbereichs verwenden kann.
Die Belegung B = {(A1 , 1)} ∪ {(A2 , 0)} z. B. weist dem Atom A1 1 und dem Atom A2 0 zu.
Man gibt nun einen Algorithmus an, der das gesuchte Modell A konstruiert. Im letzten Schritt
wird dann gezeigt, dass dieses Modell auch tatsächlich ein Modell für M ist.
4. Dieser Algorithmus baut das Modell A in mehreren Stufen auf. In der ersten Stufe wird A einfach
auf die leere Menge gesetzt, enthält also für kein einziges Atom eine Belegung. Zusätzlich gibt es
eine unendliche Indexmenge I, die zu Beginn auf I = {1, 2, . . .} gesetzt wird.
01
02
04
05
06
07
Stufe 0:
A←∅
I ← {1, 2, 3, . . .}
Stufe n > 0:
if (es gibt unendlich viele Indizes i ∈ I mit Ai (An ) = 1) {
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
153
Kapitel 11. Logik
08
09
10
11
12
13
A ← A ∪ {(An , 1)}
I ← I − {i | Ai (An ) 6= 1}
} else {
A ← A ∪ {(An , 0)}
I ← I − {i | Ai (An ) 6= 0}
}
Was macht der Algorithmus jetzt in der Stufe 1? Zuerst kommt die IF-Abfrage in Zeile 7. Diese
Abfrage ist so nicht programmierbar (auf jeden Fall nicht in endlicher Zeit), trotzdem wird jetzt
angenommen, das diese Anfrage immer ein Ergebnis liefert und sich der Algorithmus somit immer
für einen der beiden Zweige entscheidet. Man kann sich die Abfrage so vorstellen: Das Atom A n
(in der ersten Stufe A1 ) wird in alle Modelle Ai eingesetzt und überprüft, ob unendlich oft 1
herauskommt.
Zur Erinnerung: Die Ai sind die Modelle für die Formelmengen Mn , die in Schritt 2 definiert
wurden.
Auch wenn diese Abfrage nicht programmierbar ist, liefert sie immer eine Antwort, entweder es gibt
unendliche viele Modelle Ai für die A( A1 ) = 1 oder nicht. Angenommen es gibt unendlich viele,
was passiert dann? Das Modell A (das bis jetzt aus der leeren Menge besteht) wird um (A 1 , 1)
erweitert. Es weist also fortan dem Atom A1 den Wert 1 zu.
Was in Zeile 9 mit der Indexmenge I passiert, wird gleich erklärt. Jetzt erst mal zu dem ELSEZweig. Falls nicht unendlich viele Modelle Ai gibt, die A1 1 zuweisen, dann wird der ELSE-Zweig
ausgeführt. Dieser mach genau dasselbe nur erweitert er A um (A1 , 0). Das Modell weist A1 also
fortan den Wert 0 zu.
Also, was soll die Veränderung der Indexmenge I? Der Grund für die Veränderung der Indexmenge
liegt genau in dem Wort fortan im letzten Absatz. Wenn das Modell dem Atom A1 den Wert
1 zuweist, dann soll das im nächsten Schritt auch noch so bleiben. Im nächsten Schritt n = 2
sucht man nach unendlich vielen Modellen Ai für die Ai (A2 ) = 1 ist. Diese Modellen sollen aber
natürlich nicht dem widersprechen, was in Schritt 1 bereits fix gemacht wurde. Ein Modell der Form
Ai = {(A1 , 0), (A2 , 1), . . .} ist also unbrauchbar, da es A1 nicht den Wert 1 sondern 0 zuordnet.
Deswegen geht man brutal vor und verwirft im Schritt 1 gleich alle Modelle, die so aussehen. Das
wird erreicht, indem einfach die Indizes der untauglichen Modelle gestrichen werden. Genau das
passiert in Zeile 9. Interessant ist, dass dies einfach so geht, aber die unendliche Anzahl an Modellen
Ai macht’s möglich.
5. Das Modell A für die Formelmenge M wurde nun konstruiert. Es muss nur noch gezeigt werden,
dass es sich auch tatsächlich um ein Modell handelt.
Man nimmt sich eine beliebige Formel F aus M. In F können nur endlich viele atomare Formel
vorkommen, z. B. l Stück. Das heisst F setzt sich zusammen aus den atomaren Formeln A1 , . . . , Al .
Das heisst, F ist Element von Ml und damit auch von Ml+1 ⊆ Ml+2 ⊆ . . .. Daraus folgt, dass Al
und Al+1 , Al+2 , . . . Modelle für F sind. Wichtig ist nun, dass die Indexmenge I in jedem Schritt
zwar ausgedünnt wird, da I aber zu Beginn unendlich ist, bleibt sie immer unendlich. Das heisst
aber auch, das in der Stufe l des Algorithmus immer noch unendliche viele Indizes i ∈ I vorhanden
sind. Wenn es noch unendlich viele Indizes gibt, dann gibt es aber sicher auch eins mit i ≥ l. Für
diese i gilt: Ai (A1 ) = A(A1 ), . . . , Ai (Al ) = A(Al ) und deshalb ist A ein Modell für F . Da wir das
F vollkommenen beliebig aus M gewählt haben, gilt diese Schlussfolgerung für alle F und damit
ist A Modell für M.
i Obere Schranke für Komplexität der Resolution mit Beweis.
11.2.13 Sei F eine Klauselmenge mit den Atomformeln A1 , . . . , An . Jede der Atomformeln kann in einer Klausel
positive vorkommen, negativ vorkommen, positive und negativ vorkommen oder gar nicht vorkommen.
Diese vier Möglichkeiten führen zu höchstens 4n verschiedenen Klauseln in Res∗ (F ). In jedem Schritt
154
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
11.2. Aussagenlogik
von Resi (F ) nach Resi+1 (F ) kann nur eine Klausel hinzukommen. Daher ist 4n eine grobe obere
Schranke für die Komplexität.
11.2.14 Berechenbarkeit der Aussagenlogik im Vergleich zur Prädikatenlogik?
Die Aussagenlogik ist im Gegensatz zur Prädikatenlogik entscheidbar.
i Ist die Aussagenlogik entscheidbar?
11.2.15 Die Aussagenlogik ist entscheidbar, da mit Hilfe der Wahrheitstabelle jede Formel entscheidbar ist.
11.2.16 Was können sie über Aussagenkalküle sagen?
Hilbert-Kalkül.
technisch sehr einfach
direkt kaum benutzbar
Natürliches Schliessen.
technisch Aufwendiger, es gibt lokale Annahmen
korrespondiert zum
natürlichen/mathematischen Beweisen
direkt mit Hilbert-Kalkül verwandt
Problem: Beweissuche (→ E hat nicht die Teilformeleigenschaft)
aber jede Tautologie hat einen Beweis mit Teilformeleigenschaft
Sequenzen-Kalkül.
technisch aufwendiger
Ideal zur Beweissuche
liefert Gegenmodell
Für Genaueres siehe (11.2.3), (11.2.23), (11.2.24) und (11.2.25).
11.2.17 Wozu dient ein Kalkül?
Ein Kalkül ist eine Kollektion rein mechanisch anzuwendender syntaktischer Umformungsregeln.
Die Aufgabenstellung ist der Nachweis der Unerfüllbarkeit einer Formel. ein Kalkül muss korrekt und
vollständig sein.
11.2.18 Nennen Sie das Deduktionstheorem der Aussagenlogik.
Seien F und G aussagenlogische Formeln und M eine Menge von Formeln, dann gilt:
M ∪ {F } |= G
11.2.19 Bilden
nicht und
=⇒
M |= (F → G)
und eine Basis?
Ja. A ∨ B kann dargestellt werden durch ¬(¬A ∧ ¬B).
11.2.20 Gibt es eine Basis mit nur einem Operator?
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
155
Kapitel 11. Logik
Ja, NAND und NOR. Für NAND gilt:
¬F
F ∧G
F ∨G
= NAND(F, F )
= ¬(F ∧ F )
= ¬F
= NAND(NAND(F, G), NAND(F, G))
= NAND(¬(F ∧ G), ¬(F ∧ G))
= ¬((¬(F ∧ G)) ∧ (¬(F ∧ G)))
= ¬(¬(F ∧ G))
= F ∧G
= NAND(NAND(F, F ), NAND(G, G)
NAND(¬F, ¬G)
¬(¬F ∧ ¬G)
=
=
F ∨G
=
Für NOR gilt:
¬F
F ∧G
= NOR(F, F )
= ¬(F ∨ F )
= ¬F
= NOR(NOR(F, F ), NOR(G, G))
= NOR(¬F, ¬G)
=
=
F ∨F
¬(¬F ∨ ¬G)
F ∧G
= NOR(NOR(F, G), NOR(F, G))
= NOR(¬(F ∨ G), ¬(F ∨ G))
=
=
=
¬(¬(F ∨ G) ∨ ¬(F ∨ G))
¬(¬(F ∨ G))
F ∨G
11.2.21 Erfüllbarkeitstest für Hornformeln?
Eine Hornformel F kann mit folgendem Algorithmus auf Erfüllbarkeit getestet werden.
1. Für jede Teilformel der Form (1 → A), markiere A.
2. solange es in F eine Teilformel G der Form (A1 ∧ . . . ∧ An → B) oder (A1 ∧ . . . ∧ An → 0) wobei
alle A1 , . . . An bereits markiert sind, B jedoch nicht, tue folgendes:
Falls G die erste Form hat, markiere jedes Vorkommen von B, andernfalls unerfüllbar ausgeben
und anhalten.
3. Wenn der Algorithmus bis hier läuft, gibt erfüllbar aus und stoppe. Die erfüllende Belegung
wird durch die Markierung angezeigt. A(Ai ) = 1 falls Ai markiert ist.
Dieser Algorithmus ist korrekt und hat Laufzeit O(n), wobei n die Anzahl der Atome ist.
11.2.22 Was ist der Modus Ponens?
Eine Regel des natürlichen Schliessens:
φ
φ→ψ
(→−e)
ψ
i Erzählen Sie etwas zum natürlichen Schliessen.
11.2.23 156
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
11.2. Aussagenlogik
Im Gegensatz zum Hilbert-Kalkül erlaubt natürliches Schliessen das Schliessen unter lokalen Annahmen.
Beim natürlichen Schliessen werden Herleitungsbäume konstruiert. Diese werden mit ihrer Wurzel unten
und den Blätter oben geschrieben. Formeln an den Blättern heissen Annahmen, die Formeln an der
Wurzel heisst Konklusion. Annahmen können entweder gestrichen oder offen sein. Die Menge der
korrekten Herleitungsbäume ist induktiv definiert:
1. F ist ein Beweisbaum mit der offenen Annahme F .
2. Durch die Regeln können induktiv neue Beweisbäume gebildet werden.
Die Regeln.
Konjunktion. Eine Konjunktion kann eingeführt
A B
(∧−i)
A∧B
oder eliminiert werden
A∧B
A∧B
(∧−e)
(∧−e).
A
B
Implikation. Wenn B eine Herleitung von A ist, kann man A → B schreiben und die Annahme A
streichen.
[A]
..
.
B
(→−i)
A→B
Zur Elimination einer Implikation dient der Modus Ponens.
A→B
(→−e)
B
A
Disjunktion. Eine Disjunktion kann durch eine der beiden folgenden Regeln eingeführt werden.
A
(∨−i)
A∨B
B
(∨−i)
A∨B
Um aus einer Disjunktion A ∨ B etwas schliessen zu können, muss man es sowohl aus A wie aus B
schliessen können.
[A] [B]
..
..
.
.
A∨B
C
C
(∨−e)
C
Negation. Die Verneinung einer Annahme ist gerechtfertigt, wenn ihre Annahme zu einem Widerspruch geführt hat.
[A]
..
.
⊥
(¬−i)
¬A
Eine Aussage und ihre Verneinung können nicht gleichzeitig gelten.
A
¬A
(¬−e)
⊥
Verum. Die wahre Aussage darf immer behauptet werden.
A
(>−i)
>
Falsum. Aus der falschen Aussage darf alles gefolgert werden.
⊥
(⊥−e)
A
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
157
Kapitel 11. Logik
Reductio ad absurdum. Der Widerspruchsbeweis
[¬A]
..
.
⊥
A
(raa)
Beispiel. Die Folgerungsbeziehung ¬A |= A → B ist richtig, das Beispiel zeigt einen Herleitungsbaum.
¬A
[A]
⊥
B
A→B
(¬−e)
(⊥−e)
(→−i)
Hier wurde mit der Annahme ¬A begonnen und die temporäre Annahme A hinzugenommen. Daraus
kann ⊥ geschlossen werden. Aus ⊥ kann wiederum alles geschlossen werden, in diesem Falle B. Im
letzten Schritt wird → eingeführt, dafür darf die temporäre Annahme A gestrichen werden.
Korrektheit und Vollständigkeit. Natürliches Schliessen und der Hilbert-Kalkül sind äquivalent. Da der
Hilbert-Kalkül korrekt ist, ist auch natürliches Schliessen korrekt. Natürliches Schliessen ist vollständig,
da es die Resolution simulieren kann und die Resolution vollständig ist.
11.2.24 Erzählen Sie etwas zu Hilbert-Kalkülen.
Hilbert-Kalküle sind sehr einfach, eignen sich aber schlecht zur Beweissuche.
Ein Hilbert-Kalkül besteht aus einer Menge von Formeln (Axiomen) und einer Menge von Schlussregeln der Form
F1 . . . F n
Prämissen
=
.
F
Konklusion
Wenn n = 0 dann ist die Regel ein Axiom.
Eine Herleitung einer Formel F aus einer Formelmenge M ist eine Sequenz F1 , . . . , Fk mit Fk = F
und für i ≤ k gilt
Fi ist ein Axiom oder
n
es gibt eine Regel G1 ...G
so dass {G1 , . . . Gn } ⊆ {F1 , . . . Fi−1 }, d. h. Fi wurde auch aus F
G
hergeleitet.
Man schreibt M `H F . Die Herleitung ist ein Beweis von F .
Es gibt zwei Grundaxiome.
A1 F → (G → F ) für beliebige Formeln F, G
A2 (F → G → H) → (F → G) → F → H Kettenschluss
Eine Schlussregel, den Modus Ponens.
F →G
G
F
Beispiel. Die Herleitung von `H A → A.
1.
2.
3.
4.
5.
(A → (A → A) → A) → (A → (A → A)) → A → A
A → ((A → A) → A)
(A → A → A) → A → A
A→A→A
A→A
(A2)
(A1)
(MP 1,2)
(A1)
(MP 3,4)
Deduktionstheorem. In jedem Hilbert-Kalkül, das mindestens die Axiome A1 und A2 enthält und
nur den Modus Ponens als Regel besitzt gilt
M ∪ {F } `H G genau dann, wenn M `H F → G
158
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
11.2. Aussagenlogik
Vollständiges Axiomensystem.
A1
A2
A3
A4
A5
A6
A7
A8
A9
A10
A11
F → (G → F )
(F → G → H) → (F → G) → F → H
F ∧G→F
F ∧G→G
F →G→F ∧G
F →F ∨G
G→F ∨G
F ∨ G → (F → H) → (G → H) → H
(¬F → ⊥) → F
¬F → F → ⊥
(F → ⊥) → ¬F
Korrektheit. Es gilt
`H F
⇒
|= F
Der Beweis geht mit Induktion über die Länge der Herleitung `H F
1. Alle Axiome sind Tautologien.
2. Der Modus Ponens überführt Tautologien in Tautologien.
Vollständigkeit. Es gilt
|= F
⇒
`H F
Beweis.
1. Hilbert-Kalkül ist äquivalent zum Natürlichen Schliessen.
2. Natürliches Schliessen kann Resolution simulieren.
3. Resolution ist vollständig, siehe 11.2.5.
11.2.25 Erzählen Sie etwas zum Sequenzen-Kalkül.
Das Ziel des Sequenzen-Kalküls ist die Beweissuche. Es werden immer Sequenzen der Form Γ ⇒ ∆
bewiesen wobei Γ, ∆ Multimengen von Formel sind. Intuitiv gilt, F1 , . . . Fn ⇒ G1 , . . . , Gn ist herleitbar
falls
|= F1 ∧ . . . ∧ Fn → G1 ∨ . . . ∨ Gn
gilt. Dieser Zusammenhang wird wie folgt notiert:
|Γ ⇒ ∆| =
^
Γ→
_
∆
Es gibt für jeden Junktor eine rechte und eine linke Regel:
Konjunktion.
Γ, F, G ⇒ ∆
(∧−L)
Γ, F ∧ G ⇒ ∆
Γ ⇒ ∆, F Γ ⇒ ∆, G
(∧−R).
Γ ⇒ ∆, F ∧ G
Disjunktion.
Γ, F ⇒ ∆ Γ, G ⇒ ∆
(∨−L)
Γ, F ∨ G ⇒ ∆
Γ ⇒ ∆, F, G
(∨−R).
Γ ⇒ ∆, F ∨ G
Implikation.
Γ ⇒ F, ∆ Γ, G ⇒ ∆
(→−L)
Γ, F → G ⇒ ∆
Γ, F ⇒ ∆, G
(→−R).
Γ ⇒ ∆, F → G
Negation.
Γ ⇒ F, ∆
(¬−L)
Γ, ¬F ⇒ ∆
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
Γ, F ⇒ ∆
(¬−R).
Γ ⇒ ∆, ¬F
159
Kapitel 11. Logik
Da bei jeder Regel die Formeln der Konklusion auch in der Prämisse stehen, ist die Rückwärtsanwendung
einer deterministisch, Dies nennt man Teilformeleigenschaft.
Für jede Regel
S1
Sn
S
und jede passende Belegung A gilt
A |= |S| genau dann, wenn A |= |S1 | und . . . und A |= |Sn |
Die Korrektheit des Sequenzen-Kalküls, also dass `G S folgt, dass |= |S| gilt, wird mit einem Induktionsbeweis über die Grösse der Herleitung von S gezeigt.
Das Sequenzen-Kalküls hat eine weitere interessante Eigenschaft: Jeder fehlgeschlagene Beweisversuch
für S liefert ein Gegenmodell für |S|, das heisst ein Modell für ¬|S|. Dadurch ist auch gleich die
Vollständigkeit beweisen, da jeder Beweisversuch immer zu einem Modell für |S| oder ¬|S| führt.
Beispiel. Aufgabe ist es zu zeigen, dass ⇒ A ∨ ¬A gilt.
Axiom
A⇒A
(¬−R)
⇒ A, ¬A
(∨−R)
⇒ A ∨ ¬A
11.2.26 Was ist eine Wahrheitstafel?
Eine Wahrheitstafel zeigt alles passenden Belegungen einer Formel.
11.2.27 Ist die Formel ((A → B) → C) ↔ (A → (B → C)) eine Tautologie?
Nein, das würde bedeuten, dass das Assoziativgesetz für die Implikation gilt und das tut es nicht.
11.3
11.3.1
Prädikatenlogik
Wie gehen Sie vor, wenn Sie die Unerfüllbarkeit einer prädikatenlogischen Formel F zeigen möchten
Um die prädikatenlogische Resolution auf eine Formel F anzuwenden, müssen folgende Schritte durchlaufen werden.
1. Skolemnormalform. Um mit der Formel F überhaupt etwas Anfangen zu können muss zuerst die
Skolemform der Formel erstellt werden. Den Weg dorthin kann man wieder in mehrere Schritte
zerlegen und wird an der Formel
F = ¬∃x P (x, z) ∨ ∀yQ x, f (y) ∨ ∀yP g(z, y), z
vorgeführt.
a) Bereinigung. F wird durch gebundenes Umbenennen der Variablen in eine äquivalente , bereinigte Form F1 überführt. Eine Formel ist in bereinigter Form wenn es keine Variablen mehr gibt
die sowohl frei und gebunden vorkommen und hinter allen Quantoren verschiedene Variablen
stehen. Das y im zweiten Disjunktionsglied wird in w umbenannt und es ergibt sich:
F1 = ¬∃x P (x, z) ∨ ∀yQ x, f (y) ∨ ∀wP g(z, w), z
Diese Formel ist äquivalent zu F .
b) Freie Variablen beseitigen. Falls in der Formel F1 noch freie Variable y1 , . . . , yn vorkommen,
ersetzt man F1 durch F2 = ∃y1 . . . ∃yn F1 . F2 ist erfüllbarkeitsäquivalent zu F1 und F2 . Im
Beispiel ist z eine ungebundene Variable deshalb führt man ∃z ein:
F2 = ∃z ¬∃x P (x, z) ∨ ∀yQ x, f (y) ∨ ∀wP g(z, w), z
160
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
11.3. Prädikatenlogik
c) Pränexform. Jetzt wird eine zu F2 äquivalent und damit zu F erfüllbarkeitsäquivalente Formel
F3 in Pränexform hergestellt. Eine Formel ist in Pränexform, wenn alle ihre Quantoren am
Anfang der Formel stehen. Das ergibt
F3 = ∃z∀x∃y∀w ¬P (x, z) ∧ ¬Q x, f (y) ∨ P g(z, w), z
d) Skolemform. Jetzt werden die Existenzquantoren durch den Übergang zur Skolemform eliminiert. Die neue Formel F4 ist weiterhin erfüllbarkeitsäquivalent zu F . In diesem Falle wird der
z durch a und y durch h(x) substituiert.
F4 = ∀x∀w
¬P (x, a) ∧ ¬Q x, f (h(x))
∨ P g(a, w), a
e) KNF. Die Matrix von F4 wird in KNF umgeformt:
F5 = ∀x∀y((P (g(a, w), a) ∨ ¬P (x, a)) ∧ (P (g(a, w), a) ∨ ¬Q(x, f (h(x)))))
Als Klauselmenge dargestellt:
F5∗ = {{P (g(a, w), a), ¬P (x, a)}, {P (g(a, w), a), ¬Q(x, f (h(x)))}}
Bis jetzt ist noch nicht wirklich etwas passiert. Diese Schritte galten nur der Erstellung der Skolemform, die im weiteren Verlauf benötigt wird. Wichtig ist, dass die entstandene Formel F5 trotz
aller Umformungen erfüllbarkeitsäquivalent zu F ist.
→ Motivation der nächsten Schritte. Die nächsten Schritte hängen jetzt erst mal ein bisschen in
der Luft. Wichtig ist, nicht aus den Augen zu verlieren, das es im Endeffekt um das Zeigen der
Unerfüllbarkeit geht. Um die Unerfüllbarkeit zu zeigen benötigt man eine Menge E(F ) namens
Herbrand-Expansion. Die nächsten Schritte beschäftigen sich mit dem Finden dieser Menge. Das
kann man sich am besten vorstellen, wenn man vom Satz von Herbrand (11.3.17) zurück denkt.
Dieser Satz besagt, dass eine Aussage in Skolemform F genau dann unerfüllbar ist, wenn es eine
endliche Teilmenge von E(F ) (der Herbrand-Expansion) gibt, die im aussagenlogischen Sinne unerfüllbar ist. Der Beweis dieses Satzes hängt aber davon ab, ob eine erfüllbare Formel ein Modell
mit abzählbarer Grundmenge besitzt. Das dem so ist, besagt der Satz von Löwenheim-Skolem
(11.3.21). Er besagt, dass jede erfüllbare prädikatenlogische Formel ein Modell mit abzählbarer
Grundmenge besitzt und zwar ein Herbrand-Modell, das eine Herbrand-Struktur ist.
2. Herbrand-Struktur. Zum Beispiel ist die Herbrand-Struktur (11.3.10) für die Formel F
F = ∀x∀y∀zP (x, f (y), g(z, x))
wie folgt definiert.
UA = D(F ) = {a, f (a), g(a, a), f (g(a, a)), f (f (a)), g(a, f (a), g(f (a), a, . . .}
und es gilt:
f A (a)
A
f (f (a))
A
f (g(a, a))
=
f (a)
= f (f (a))
= f (g(a, a))
..
.
3. Herbrand-Expansion. Jetzt wird die Herbrand-Expansion bestimmt. Die Herbrand-Expansion entsteht in dem die Variablen in F ∗ in jeder möglichen weise durch die Terme in D(F ) substituiert
werden. Für die Formel
F = ∀x∀y∀zP (x, f (y), g(z, x))
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
161
Kapitel 11. Logik
ergeben sich
P (a, f (a), g(a, a))
P (f (a), f (a), g(a, f (a)))
P (a, f (f (a)), g(a, a))
durch [x/a][y/a][z/a]
durch [x/f (a)][y/a][x/a]
durch
..
.
[x/a][y/f (a)][x/a]
Nach dem Satz von Herbrand (11.3.17) ist eine Aussage F in Skolemform genau dann unerfüllbar,
wenn eine endliche Teilmenge von E(F ) im aussagenlogischen Sinne unerfüllbar ist. D. h. man
muss jetzt nur per Aussagenlogik zeigen, dass E(F ) unerfüllbar ist und ist fertig. Da kommt nun
die Resolution ins Spiel. Im Folgenden seien F1 , F2 . . . eine Aufzählung aller Formeln in E(F ).
4a. Grundresolution. Die Aufgabe ist nun zu zeigen, das E(F ) im aussagenlogischen Sinne unerfüllbar
ist. Dies kann sehr einfach mit dem Grundresolutionsalgorithmus durchgeführt werden (11.3.11).
Die Grundresolution arbeitet auf den Element von E(F ) und damit auf Grundinstanzen der Klausel
von F ∗ . Sie heissen Grundinstanzen, da alle Variablen durch variablenfreie Terme ersetzt wurden.
Beispiel. Gegeben ist die unerfüllbare Formel, ihre Matrix in Klauselform, D(F ) und E(F )
F
F∗
= ∀x(P (x) ∧ ¬P (f (x)))
= (P (x) ∧ ¬P (f (x)))
= {{P (x)}, {¬P (f (x))}}
D(F ) = {a, f (a), f (f (a)), . . .}
E(F ) = {(P (a) ∧ ¬P (f (a))), (P (f (a)) ∧ ¬P (f (a)))), . . .}
Schon die ersten beiden Substitutionen [x/a] und [x/f (a)] liefern eine unerfüllbare Klauselmenge.
{P (a)}
{¬P (f (a))}
{P (f (A))}
{¬P (f (f (a)))}
2
Die Grundresolution ist sehr ineffizient, da alle Grundsubstitutionen durch probiert werden müssen.
Eine Alternative bietet die prädikatenlogische Resolution.
4b. Prädikatenlogische Resolution. Wie gesagt ist die ausschliessliche Resolution von Grundinstanzen
sehr ineffizient, besser wäre es nur die Substitutionen durchzuführen, die auf dem Weg zum Ziel
liegen. Die Grundidee dabei ist, prädikatenlogische Resolventen aus prädikatenlogischen Klausel
zu erzeugen. Dabei ist mit jedem Resolutionsschritt ein Substitutionsschritt verbunden. Ziel ist es
wie bei der aussagenlogischen Resolution, bestimmte Literale in zwei Ausgangsklauseln zueinander
komplementär zu machen. Ziel hierbei ist es Substitutionen zu finden, die zwei Literale unifizieren.
Beispiel. Gegeben sind zwei prädikatenlogische Klauseln
K1
=
K2
=
{P (f (x)), ¬Q(z), P (z)}
{¬P (x), R(g(x), a)}
R ist ein prädikatenlogischer Resolvent von K1 , K2 wenn die drei Bedingungen von (11.3.16)
gelten. Ein prädikatenlogischer Resolvent von K1 , K2 ist
R = {¬Q(f (x)), R(g(f x)), a)}
R erfüllt die drei Bedingungen:
1. Es gibt zwei Substitutionen s1 und s2 , so dass K1 und K2 keine gemeinsamen Variablen
enthalten. Man wählt z. B. s1 = [ ] und s2 = [x/u]. Das ergibt
162
K1 s 1
=
K2 s 2
=
K1 [ ] = {P (f (x)), ¬Q(z), P (z)}
K2 [x/u] = {¬P (u), R(g(u), a)}
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
11.3. Prädikatenlogik
2. Jetzt muss sich eine Literalmenge aus K1 s1 , K2 s2 finden lassen, die unfizierbar ist. Eine Wahl
ist
L
{P (f (x)), P (z), ¬P (u) }
|
{z
} | {z }
aus K1 s1
aus K2 s2
= {¬P (f (x)), ¬P (z), ¬P (u)}
=
Mit dem Unifikationsalgorithmus kann nun der allgemeinste Unifikator sub bestimmt werden.
Dieser liefert in zwei Schritten sub = [z/f (x)][u/f (x)]
3. Wenn jetzt noch die dritte Bedingung gilt, handelt es sich bei R um einen Resolventen. Ein
Resolvent ist nur dann ein Resolvent, wenn er folgende Form hat.
R = ((K1 s1 − {L1 , . . . , Lm }) ∪ (K2 s2 − {L01 , . . . , L0n }))sub.
Einsetzen der obigen Klausel und Substitutionen ergibt
R
=
=
=
=
=
(({P (f (x)), ¬Q(z), P (z)} − {P (f (x)), P (z)})
∪ ({¬P (u), R(g(u), a)} − {¬P (u)}))[z/f (x)][u/f (x)]
({¬Q(z)} ∪ {R(g(u), a)})[z/f (x)][u/f (x)]
({¬Q(z), R(g(u), a)})[z/f (x)][u/f (x)]
({¬Q(f (x)), R(g(u), a)})[u/f (x)]
{¬Q(f (x)), R(g(f (x)), a)}
Die Abbildung zeigt den Resolutions-/Substitutionsschritt noch einmal graphisch.
{P (f (x)), ¬Q(z), P (x)}
{¬P (x), R(g(x), a)}
s1
s2
sub
= []
= [x/u]
= [z/f (x)][u/f (x)]
{¬Q(f (x)), R(g(f (x)), a)}
Auf diese Weise können nun nur die Substitutionsschritte durchgeführt werden, die zum Finden der
leeren Klausel benötigt werden.
11.3.2
Um was erweitert die Prädikatenlogik die Aussagenlogik?
Die Prädikatenlogik erweitert die Aussagenlogik um Quantoren, Funktions- und Prädikatensymbole.
11.3.3
Normalformen der Prädikatenlogik?
siehe 11.3.22, 11.3.23 und 11.3.26
11.3.4
i Ist die Herbrand-Expansion abzählbar?
Die Herbrand-Expansion entsteht in dem die Variablen in F ∗ in jeder möglichen weise durch die Terme
in D(F ) substituiert werden. Das D(F ) abzählbar ist, ist auch E(F ) abzählbar.
11.3.5
Ist die Prädikatenlogik entscheidbar?
Das Erfüllbarkeitsproblem der Prädikatenlogik ist nicht entscheidbar. Beweis durch Reduktion auf das
Postsche Korrespondenzproblem.
11.3.6
Nennen Sie mir ein Kalkül für die Prädikatenlogik?
Resolution.
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
163
Kapitel 11. Logik
11.3.7
Was ist eine Struktur?
Eine Struktur is ein Paar A = (UA , IA ) wobei UA eine beliebige aber nicht leere Menge ist. IA ist eine
Abbildung, die
jedem k-stelligen Prädikatensymbol P ein k-stelliges Prädikat über UA zuordnet,
jedem k-stelligen Funktionssymbol f eine k-stellige Funktion auf UA zuordnet,
jeder Variablen x eine Element der Grundmenge UA zuordnet.
11.3.8
Prädikatenlogische Resolution mit Unifikation am Beispiel ∃x(P (x) → ∀xP (x)).
Dieses Beispiel ist so einfach, dass man wirklich Schritt für Schritt vor gehen kann, da das HerbrandUniversum endlich ist, kann man ganz in Ruhe die Herbrand-Expansion bestimmen und dann erst
resolvieren.
1. Skolemform. Um mit der Formel F überhaupt etwas Anfangen zu können muss zuerst die Skolemform der Formel erstellt werden. Zur Übersicht wird erstmal die Implikation ersetzt.
F = ∃x(P (x) → ∀xP (x)) = ∃x(¬P (x) ∨ ∀xP (x))
a) Bereinigung. F wird durch gebundenes Umbenennen der Variablen in eine äquivalente , bereinigte Form F1 überführt. Hier wurde die Variable beim Allquantor in y umbenannt. Es ergibt
sich:
F1 = ∃x(¬P (x) ∨ ∀yP (y))
Diese Formel ist äquivalent zu F .
b) Freie Variablen beseitigen. Die Formel enthält keine freien Variablen, der Schritt entfällt daher
und es gilt:
F2 = F1 = ∃x(¬P (x) ∨ ∀yP (y))
c) Pränexform. Jetzt wird eine zu F2 äquivalente und damit zu F erfüllbarkeitsäquivalente Formel
F3 in Pränexform hergestellt. Eine Formel ist in Pränexform, wenn alle ihre Quantoren am
Anfang der Formel stehen. Das ergibt
F3 = ∃x∀y(¬P (x) ∨ P (y))
d) Skolemform. Jetzt werden die Existenzquantoren durch den Übergang zur Skolemform eliminiert. Die neue Formel F4 ist weiterhin erfüllbarkeitsäquivalent zu F . In diesem Falle wird der
einzige Existenzquantor gestrichen und durch das nullstellige Funktionssymbol a ersetzt.
F4 = ∀y(¬P (a) ∨ P (y))
e) KNF. Die Matrix von F4 wird in KNF umgeformt und als Klauselmenge dargestellt. Da die
Matrix von F4 bereits in KNF ist, ergibt sich
F5 = F4 = ∀y(¬P (a) ∨ P (y))
Als Klauselmenge dargestellt:
F5∗ = {{¬P (a), P (y)}}
2. Herbrand-Struktur. In diesem Fall ist es sehr einfach das Herbrand-Universum zu bestimmen, da F
keine Funktionssymbol mit einer Stelligkeit grösser 0 enthält. Es gibt eine Konstante a. Sie ist das
einzige Element des Herbrand-Universums und es gilt:
D(F5 ) = {a}
3. Herbrand-Expansion. Jetzt wird die Herbrand-Expansion E(F5 ) bestimmt. Dies ist beim Beispiel
sehr einfach da D(F5 ) nur das einzige Element a hat und F5 nur eine Variable nämlich y hat. Also
ersetzt man y durch a und erhält
E(F5 ) = {F5∗ [y/a]} = {{¬P (a), P (a)}}
164
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
11.3. Prädikatenlogik
4. Resolution. Hier gibt es leider nichts zu resolvieren. Unerfüllbarkeit kann nicht gezeigt werden.
Diese geht aber nur wegen dem endlichen Herbrand-Universum.
11.3.9
Was ist das Herbrand-Universum?
Das Herbrand-Universum D(F ) einer Formel F in Skolemform ist die Menge aller variablenfreien Terme,
die aus allen Bestandteilen von F gebildet werden können. Es ist induktiv definiert:
1. Alle in F vorkommenden Konstanten sind in D(F ). Falls F keine Konstante enthält, so ist a in
D(F ).
2. Für jedes in F vorkommende n-stellige Funktionssymbol f und Terme t1 , . . . tn in D(F ) ist der
Term f (t1 , . . . tn ) in D(F ).
Beispiel. Gegeben seien die Formeln
F
G
= ∀x∀y∀zP (x, f (y), g(z, x))
= ∀x∀yQ(c, f (x), h(y, b))
Bei F liegt der Spezial fall vor, da F keine Konstante enthält wird a in das Herbrand-Universum
aufgenommen:
D(F ) = {a, f (a), g(a, a), f (g(a, a)), f (f (a)), g(a, f (a), g(f (a), a, . . .}
Bei G sind Konstanten c und b vorhanden, daher:
D(G) = {c, b, f (c), f (b), h(c, c), h(c, b), h(b, c), h(b, b), f (f (c)), f (f (b)), . . .}
Man sieht, das Herbrand-Universum ist unendlich, sobald die Formel ein Funktionssymbol mit einer
Stelligkeit > 0 enthält. Man sieht auch, dass es rekursiv aufzählbar ist.
11.3.10 Was ist eine Herbrand-Struktur?
Wenn F eine Aussage in Skolemform ist, dann heisst jede zu F passende Struktur A = (U A , IA ) eine
Herbrand-Struktur, falls folgendes gilt:
1. UA = D(F ) (das Herbrand-Universum)
2. für jedes in F vorkommende n-stellige Funktionssymbol f und t1 , . . . tn ∈ D(F ) ist f A (t1 , . . . tn ) =
f (t1 , . . . tn ).
Beispiel. Für die Formel
F = ∀x∀y∀zP (x, f (y), g(z, x))
ist
UA = D(F ) = {a, f (a), g(a, a), f (g(a, a)), f (f (a)), g(a, f (a), g(f (a), a, . . .}
und es gilt:
f A (a)
A
f (f (a))
f A (g(a, a))
= f (a)
= f (f (a))
= f (g(a, a))
..
.
Die Wahl von P A bleibt an dieser Stelle noch offen. Wichtig ist, dass durch Punkt 2 der Definition
Syntax und Semantik gleichgeschaltet werden. Die Interpretation eines Terms liefert den Term, es gilt
also A(t) = t.
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
165
Kapitel 11. Logik
11.3.11 Geben Sie den Grundresolutionsalgorithmus an.
Der Grundresolutionsalgorithmus ist ein Resolutionsalgorithmus, der wie der Gilmore-Algorithmus funktioniert. Wenn F eine prädikatenlogische Formel ist, bezeichnen F1 , F2 . . . alle Formel ihrer HerbrandExpansion E(F ). Der Algorithmus erhält als Eingabe die Mengen Fi .
Grundresolution(Fi )
1 i←0
2 M ←∅
3 do {
4
i←i+1
5
M ← M ∪ Fi
6
M ← Res∗ (M )
7 } until (2 ∈ M )
8 return unerfüllbar
Wenn die Formel F unerfüllbar ist, hält der Algorithmus nach endlich vielen Schritten.
11.3.12 Was ist eine Grundsubstitution?
Bei einer Grundsubstitution werden alle freien Variablen durch variablenfreie Terme ersetzt. Die Substitutionen zur Definition der Herbrand-Expansion sind Grundsubstitutionen.
11.3.13 Was ist ein Unifikator und was ist ein allgemeinster Unifikator?
Eine Substitution sub ist ein Unifikator einer endlichen Menge von Literalen L = {L 1 , . . . Lk }, falls
L1 sub = L2 sub = . . . = Lk sub. D. h. durch Anwendung der Substitution sub auf jedes Literal in L
entsteht ein und dasselbe Literal.
Man schreibt für diesen Sachverhalt auch |Lsub| = 1 sagt L ist unifizierbar. Ein Unifikator sub einer
Literalmenge L heisst allgemeinster Unifikator von L, falls für jeden Unifikator sub0 von L gilt, dass es
eine Substitution s gibt mit sub0 = subs. Wobei subs die Hintereinanderausführung der Substitution
subs und s beschreibt.
11.3.14 Wie funktioniert der Unifikationsalgorithmus?
Der Unifikationsalgorithmus überprüft ob eine Literalmenge L unifizierbar ist und gibt in diesem Fall
den allgemeinsten Unifikator aus. Als Eingabe erhält er eine nicht-leere Literalmenge L. In jedem
Schritt versucht er einen Unifikator zu finden, falls dies nicht möglich ist, bricht er ab, ansonsten wird
der neue Unifikator an den im vorherigen Schritt bestimmten, angehängt.
Unifikation(L)
01 sub ← [ ] //die leere Substitution
02 while (|Lsub| > 1) {
03
durchsuche die Literale in Lsub paarweise von links nach rechts bis erste
04
Position gefunden, wo sich zwei Literale L1 und L2 unterscheiden.
05
if (keines der beiden Zeichen ist Variable)
06
return nicht unifizierbar
07
else {
09
sei x die Variable und t der im anderen Literal beginnenden Term
10
if (x kommt in t vor)
11
return nicht unifizierbar
12
else
13
sub ← sub[x/t] //Hintereinanderausführung von sub und [x/t]
14
}
15 }
16 return allgemeinster Unifikator: ∪ sub
166
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
11.3. Prädikatenlogik
11.3.15 Was ist der Gödelsche Unvollständigkeitssatz?
Jedes Beweissystem für die Menge der wahren arithmetischen Formeln ist notwendigerweise unvollständig, d. h. es bleiben immer wahre arithmetische Formeln übrig, die nicht beweisbar sind.
11.3.16 Wie ist die Resolution der Prädikatenlogik definiert?
Seien K1, K2 und R prädikatenlogische Klauseln. Dann ist R ein prädikatenlogischer Resolvent von K1
und K2 , falls folgendes gilt:
1. Es gibt Substitutionen s1 und s2 , die Variablenumbennungen sind, so dass K1 s1 und K2 s2 keine
gemeinsamen Variablen enthalten.
2. Es gibt eine Menge von Literalen L1 , . . . , Lm ∈ K1 s1 (m ≥ 1) und L01 , . . . , L0n ∈ K2 s2 (n ≥ 1), so
dass L = {L1 , . . . , Lm , L01 , . . . , L0n } unifizierbar ist. sub ist der allgemeinste Unifikator von L.
3. R hat die Form
R = ((K1 s1 − {L1 , . . . , Lm }) ∪ (K2 s2 − {L01 , . . . , L0n }))sub.
11.3.17 Wie lautet der Satz von Herbrand?
Eine Aussage F in Skolemform ist unerfüllbar genau dann, wenn es eine endliche Teilmenge von E(F )
gibt, die im aussagenlogischen Sinne unerfüllbar ist.
11.3.18 Was ist das Lifting-Lemma?
Seien K1 , K2 zwei prädikatenlogische Klauseln und K10 , K20 seien beliebige Grundinstanzen hiervon, die
im aussagenlogischen Sinne resolvierbar sind, so dass R 0 ein Resolvent von K10 und K20 ist. Dann gibt
es einen prädikatenlogischen Resolventen R von K1 und K2 , so dass R0 eine Grundinstanz von R ist.
Das Lifting-Lemma wird zum Beweis der Vollständigkeit der prädikatenlogischen Resolution benötigt.
11.3.19 Wie lautet der Resolutionssatz der Prädikatenlogik?
Sei F eine Aussage in Skolemform mit der Matrix F ∗ in KNF. Dann gilt: F ist unerfüllbar genau dann,
wenn 2 ∈ Res∗ (F ∗ ).
11.3.20 Was sind Terme?
Term sind induktive definiert:
1. Jede Variable ist ein Term.
2. Falls f eine k-stellige Funktion und t1 , . . . tk Terme sind so ist auch f (t1 , . . . , tk ) ein Term.
i Satz von Löwenheim/Skolem mit Beweis?
11.3.21 Jede erfüllbare prädikatenlogische Formel besitzt ein Modell mit abzählbarer Grundmenge.
Beweis. Jede prädikatenlogische Formel F kann in eine erfüllbarkeitsäquivalente Aussage G in Skolemform umgewandelt werden. Diese Umformungen sind so, dass jedes Modell für G auch Modell für F
ist. Falls F erfüllbar ist, dann ist auch G erfüllbar und besitzt ein Herbrand-Modell, dass auch Modell
für F ist. Das Herbrand-Modell besitzt die abzählbare Grundmenge D(F ).
11.3.22 Welche Eigenschaften hat eine bereinigte Formel?
Eine Formel heisst bereinigt, wenn es keine Variable gibt, die sowohl gebunden als auch ungebunden
vorkommt. Ausserdem müssen hinter allen Quantoren unterschiedliche Variablen stehen. Diese Form
erreicht man durch gebundenes Umbenennen (11.3.24).
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
167
Kapitel 11. Logik
11.3.23 Was ist die Pränexform?
Eine Formel F ist in Pränexform falls sie folgende Bauart hat
Q1 y1 Q2 y2 . . . Q n yn F
wobei Qi ∈ {∃, ∀}. In F darf kein Quantor mehr vorkommen.
11.3.24 Was versteht man unter gebundenen Umbenennen?
Sei F = QxG mit Qi ∈ {∃, ∀}. Wenn y eine Variable ist, die in G nicht vorkommt, dann gilt
F ≡ QyG[x/y]
11.3.25 Was ist eine Matrix?
Die Matrix einer Formel F in Skolemform ist diejenige Formel, die man erhält, wenn man alle Quantoren
in F samt der dahinter stehenden Variablen streicht. Sie wird mit F ∗ bezeichnet.
11.3.26 Was ist die Skolemform?
Eine Formel ist in Skolemform, wenn sie bereinigt ist, in Pränexform ist und nur Allquantoren enthält.
11.3.27 Was ist eine Theorie?
Eine Theorie ist eine Menge von Formel T, die gegenüber Folgerbarkeit abgeschlossen ist. D.h. T
ist eine Theorie wenn für alle F1 , F2 , . . . Fn ∈ T und alle Formeln G gilt: wenn G eine Folgerung von
{F1 , F2 , . . . , Fn } ist, dann ist auch G ∈ T. Die Formel, die Element einer Theorie sind, heissen auch
Sätze.
11.3.28 Was ist ein Axiom?
Theorien können auf zwei Arten definiert werden:
1. Bei der modelltheoretischen Methode gibt man eine Struktur A vor und nimmt als Theorie alle
Formel die unter A gelten:
T h(A) = {F | A |= F }
2. Bei der axiomatischen Methode gibt man ein Axiomensystem, also eine Menge von Formeln M vor.
Diese Theorie besteht dann aus allen Formel die aus den Formel der Menge M folgerbar sind. Die
Element der Menge M heissen Axiome. Es gilt:
Cons(M) = {G | G folgt aus {F1 , . . . Fn } ∈ M}
11.4
11.4.1
Beweisideen
Unentscheidbarkeit der Prädikatenlogik.
Der Beweis erfolgt per Reduktion. Wir suchen einen Algorithmus der jedes beliebige Postsche Korrespondenzproblem (PCP) K in eine prädikatenlogische Formel F = FK überführt, so das K eine Lösung
besitzt, genau dann wenn F gültig ist. Das heisst man führt das Gültigkeitsproblem der Prädikatenlogik
auf PCP zurück. Falls das Gültigkeitsproblem entscheidbar wäre, müsste auch das PCP entscheidbar
sein. Die widerspricht den Kenntnissen der Berechenbarkeitstheorie.
11.4.2
Erfüllbarkeitsäquivalenz der Skolemform.
Beweis zeigt, dass jeder Durchlauf der Konstruktions-While-Schleife eine erfüllbarkeitsäquivalente Formel erzeugt. Dazu wird das Überführungslemma verwendet.
168
http://www.deissenboeck.de/faqs | DHP-FAQ v1.0
11.4. Beweisideen
11.4.3
Äquivalenz der Pränexform.
Bei der Umwandlung einer Formel F in eine Formel G in Pränexform gilt F ≡ G.
Beweis. Der Beweis ist ein Induktionsbeweis über den Formelaufbau. Hier ist alles sehr vereinfacht
dargestellt.
Induktionsanfang. Wenn F eine atomare Formel ist, dann ist F = G bereits in Pränexform und es gilt
F ≡ G.
Induktionsschritt. Es gibt 3 Fälle.
1. F hat die Form ¬F1 und G1 = Q1 y1 . . . Qn yn G0 ist die laut Induktionsvoraussetzung existierende
zu F1 äquivalent Formel. Dann gilt
F ≡ Q1 y1 . . . Qn yn ¬G0
Diese Formel ist in Pränexform.
2. F hat die Form (F1 ◦ F2 ). Es gibt zu F1 und F2 äquivalente Formeln G1 und G2 in Pränexform.
Die Formel
Q1 y1 . . . Qk yk Q01 z1 . . . Q0l zl (G01 ◦ G02 )
ist äquivalent zu F und in Pränexform.
3. F hat die Form QxF1 . Die gesucht Formel hat die Form
QxQ1 y1 . . . Qn yn F10
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
169
Literaturverzeichnis
[Cormen et al., 2000]
Cormen, Thomas H. et al. Introduction to Algorithms. MIT-Press, 2000
[DS-Faq, 2001]
DS-Faq. http://www.deissenboeck.de/faqs
[Duden Mathematik, 2000]
Duden Rechnen und Mathematik. Dudenverlag, 2000
[Duden Informatik, 1993]
Duden Informatik. 2. Aufl. Dudenverlag, 1993
[Graham et. al., 1989]
Graham, R.L., D.E. Knuth; Patashnik O. Concrete Mathematics. Addison
Wesley, 1989
[Kindler & Manthey, 2001]
Kinderl Ekkart; Manthey Steffen Skript zur Vorlesung Automaten, Formale
Sprachen und Berechenbarkeit WS 01/02.
[Ottmann & Widmayer, 2002]
Ottman, Thomas; Widmayer, Peter. Algorithmen und Datenstrukturen. 4.
Aufl. Spektrum, Akad. Verl., 2002
[Rechenberg & Pomberger, 1999] Rechenberg, Peter; Pomberger, Gustav (hrsg.) Informatik-Handbuch. 2. Aufl.
Hanser, 1999
[Schöning, 1997]
Schöning, Uwe. Theoretische Informatik – kurzgefaßt. 3. Aufl. Spektrum,
Akad. Verl., 1997
[Schöning, 2000]
Schöning, Uwe. Logik für Informatiker. 5. Aufl. Spektrum, Akad. Verl., 2000
DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs
171
Zugehörige Unterlagen
Herunterladen
Explore flashcards