Wörterbücher Das Wörterbuch 1 / 74 Der abstrakte Datentyp „Wörterbuch“ Ein Wörterbuch für eine gegebene Menge S besteht aus den folgenden Operationen: Das Wörterbuch 2 / 74 Der abstrakte Datentyp „Wörterbuch“ Ein Wörterbuch für eine gegebene Menge S besteht aus den folgenden Operationen: insert(x): Füge x zu S hinzu, d.h. setze S = S ∪ {x}. remove(x): Entferne x aus S, d.h. setze S = S − {x}. lookup(x): Finde heraus, ob x in liegt, und wenn ja, greife gegebenfalls auf den Datensatz von x zu. Das Wörterbuch 2 / 74 Der abstrakte Datentyp „Wörterbuch“ Ein Wörterbuch für eine gegebene Menge S besteht aus den folgenden Operationen: insert(x): Füge x zu S hinzu, d.h. setze S = S ∪ {x}. remove(x): Entferne x aus S, d.h. setze S = S − {x}. lookup(x): Finde heraus, ob x in liegt, und wenn ja, greife gegebenfalls auf den Datensatz von x zu. In einer Firmendatenbank werden Kundendaten in der Form (Kundenummer, Info) abgespeichert. Das Wörterbuch 2 / 74 Der abstrakte Datentyp „Wörterbuch“ Ein Wörterbuch für eine gegebene Menge S besteht aus den folgenden Operationen: insert(x): Füge x zu S hinzu, d.h. setze S = S ∪ {x}. remove(x): Entferne x aus S, d.h. setze S = S − {x}. lookup(x): Finde heraus, ob x in liegt, und wenn ja, greife gegebenfalls auf den Datensatz von x zu. In einer Firmendatenbank werden Kundendaten in der Form (Kundenummer, Info) abgespeichert. Die Kundennummer stellt den Schlüssel x dar. Das Wörterbuch 2 / 74 Der abstrakte Datentyp „Wörterbuch“ Ein Wörterbuch für eine gegebene Menge S besteht aus den folgenden Operationen: insert(x): Füge x zu S hinzu, d.h. setze S = S ∪ {x}. remove(x): Entferne x aus S, d.h. setze S = S − {x}. lookup(x): Finde heraus, ob x in liegt, und wenn ja, greife gegebenfalls auf den Datensatz von x zu. In einer Firmendatenbank werden Kundendaten in der Form (Kundenummer, Info) abgespeichert. Die Kundennummer stellt den Schlüssel x dar. I insert(x): Füge den Datensatz eines neuen Kunden mit Kundenummer x ein. Das Wörterbuch 2 / 74 Der abstrakte Datentyp „Wörterbuch“ Ein Wörterbuch für eine gegebene Menge S besteht aus den folgenden Operationen: insert(x): Füge x zu S hinzu, d.h. setze S = S ∪ {x}. remove(x): Entferne x aus S, d.h. setze S = S − {x}. lookup(x): Finde heraus, ob x in liegt, und wenn ja, greife gegebenfalls auf den Datensatz von x zu. In einer Firmendatenbank werden Kundendaten in der Form (Kundenummer, Info) abgespeichert. Die Kundennummer stellt den Schlüssel x dar. I I insert(x): Füge den Datensatz eines neuen Kunden mit Kundenummer x ein. remove(x): Entferne den Datensatz des entsprechenden Kunden. Das Wörterbuch 2 / 74 Der abstrakte Datentyp „Wörterbuch“ Ein Wörterbuch für eine gegebene Menge S besteht aus den folgenden Operationen: insert(x): Füge x zu S hinzu, d.h. setze S = S ∪ {x}. remove(x): Entferne x aus S, d.h. setze S = S − {x}. lookup(x): Finde heraus, ob x in liegt, und wenn ja, greife gegebenfalls auf den Datensatz von x zu. In einer Firmendatenbank werden Kundendaten in der Form (Kundenummer, Info) abgespeichert. Die Kundennummer stellt den Schlüssel x dar. I I I insert(x): Füge den Datensatz eines neuen Kunden mit Kundenummer x ein. remove(x): Entferne den Datensatz des entsprechenden Kunden. lookup(x): Greife auf den Datensatz des Kunden mit Kundennummer x zu. Das Wörterbuch 2 / 74 Suchmaschinen Suchmaschinen müssen Stichworte und Webseiten verwalten und zu jedem Stichwort alle relevanten Webseiten auflisten. Das Wörterbuch 3 / 74 Suchmaschinen Suchmaschinen müssen Stichworte und Webseiten verwalten und zu jedem Stichwort alle relevanten Webseiten auflisten. Für jedes Stichwort s muss ein Wörterbuch der für s relevanten Webseiten aufgebaut werden. Das Wörterbuch 3 / 74 Suchmaschinen Suchmaschinen müssen Stichworte und Webseiten verwalten und zu jedem Stichwort alle relevanten Webseiten auflisten. Für jedes Stichwort s muss ein Wörterbuch der für s relevanten Webseiten aufgebaut werden. I I Neue Webseiten sind gegebenenfalls einzufügen und alte, verschwundene Webseiten sind zu entfernen. Das Wörterbuch 3 / 74 Suchmaschinen Suchmaschinen müssen Stichworte und Webseiten verwalten und zu jedem Stichwort alle relevanten Webseiten auflisten. Für jedes Stichwort s muss ein Wörterbuch der für s relevanten Webseiten aufgebaut werden. I I Neue Webseiten sind gegebenenfalls einzufügen und alte, verschwundene Webseiten sind zu entfernen. Für jede Webseite w müssen die Stichworte gesammelt werden, für die w relevant ist: I Sollte w entfernt werden, kann w schnell, für jedes seiner Stichworte entfernt werden. Das Wörterbuch 3 / 74 Suchmaschinen Suchmaschinen müssen Stichworte und Webseiten verwalten und zu jedem Stichwort alle relevanten Webseiten auflisten. Für jedes Stichwort s muss ein Wörterbuch der für s relevanten Webseiten aufgebaut werden. I I Neue Webseiten sind gegebenenfalls einzufügen und alte, verschwundene Webseiten sind zu entfernen. Für jede Webseite w müssen die Stichworte gesammelt werden, für die w relevant ist: I Sollte w entfernt werden, kann w schnell, für jedes seiner Stichworte entfernt werden. Es gibt mehrere Milliarden Webseiten. Welche Daten sollten im schnellen Speicher und welche Daten im langsamen Speicher gehalten werden? Das Wörterbuch 3 / 74 Datenstrukturen für Wörterbücher Wie sollten statische Wörterbücher, also Wörterbücher die nur lookup benutzen, implementiert werden? Das Wörterbuch 4 / 74 Datenstrukturen für Wörterbücher Wie sollten statische Wörterbücher, also Wörterbücher die nur lookup benutzen, implementiert werden? I Sortiere die gespeicherten Schlüssel und führe eine lookup-Operation mit Binärsuche in logarithmischer Zeit durch Das Wörterbuch 4 / 74 Datenstrukturen für Wörterbücher Wie sollten statische Wörterbücher, also Wörterbücher die nur lookup benutzen, implementiert werden? I Sortiere die gespeicherten Schlüssel und führe eine lookup-Operation mit Binärsuche in logarithmischer Zeit durch I Oder aber wir haben sogar eine schnell berechenbare Namensfunktion, um die Position eines jeden Schlüssels zu bestimmen. Das Wörterbuch 4 / 74 Datenstrukturen für Wörterbücher Wie sollten statische Wörterbücher, also Wörterbücher die nur lookup benutzen, implementiert werden? I Sortiere die gespeicherten Schlüssel und führe eine lookup-Operation mit Binärsuche in logarithmischer Zeit durch I Oder aber wir haben sogar eine schnell berechenbare Namensfunktion, um die Position eines jeden Schlüssels zu bestimmen. Leider sind die interessanten Wörterbücher dynamisch. Das Wörterbuch 4 / 74 Datenstrukturen für Wörterbücher Wie sollten statische Wörterbücher, also Wörterbücher die nur lookup benutzen, implementiert werden? I Sortiere die gespeicherten Schlüssel und führe eine lookup-Operation mit Binärsuche in logarithmischer Zeit durch I Oder aber wir haben sogar eine schnell berechenbare Namensfunktion, um die Position eines jeden Schlüssels zu bestimmen. Leider sind die interessanten Wörterbücher dynamisch. Können wir Heaps benutzen? I Das Einfügen Das Wörterbuch 4 / 74 Datenstrukturen für Wörterbücher Wie sollten statische Wörterbücher, also Wörterbücher die nur lookup benutzen, implementiert werden? I Sortiere die gespeicherten Schlüssel und führe eine lookup-Operation mit Binärsuche in logarithmischer Zeit durch I Oder aber wir haben sogar eine schnell berechenbare Namensfunktion, um die Position eines jeden Schlüssels zu bestimmen. Leider sind die interessanten Wörterbücher dynamisch. Können wir Heaps benutzen? I I Das Einfügen gelingt mühelos, das Suchen ist Das Wörterbuch 4 / 74 Datenstrukturen für Wörterbücher Wie sollten statische Wörterbücher, also Wörterbücher die nur lookup benutzen, implementiert werden? I Sortiere die gespeicherten Schlüssel und führe eine lookup-Operation mit Binärsuche in logarithmischer Zeit durch I Oder aber wir haben sogar eine schnell berechenbare Namensfunktion, um die Position eines jeden Schlüssels zu bestimmen. Leider sind die interessanten Wörterbücher dynamisch. Können wir Heaps benutzen? I I Das Einfügen gelingt mühelos, das Suchen ist aber extrem mühselig. (Warum?) Das Wörterbuch 4 / 74 Datenstrukturen für Wörterbücher Wie sollten statische Wörterbücher, also Wörterbücher die nur lookup benutzen, implementiert werden? I Sortiere die gespeicherten Schlüssel und führe eine lookup-Operation mit Binärsuche in logarithmischer Zeit durch I Oder aber wir haben sogar eine schnell berechenbare Namensfunktion, um die Position eines jeden Schlüssels zu bestimmen. Leider sind die interessanten Wörterbücher dynamisch. Können wir Heaps benutzen? I I Das Einfügen gelingt mühelos, das Suchen ist aber extrem mühselig. (Warum?) Im Gegensatz zu „starren“ Arrays benötigen wir Datenstrukturen, die schnell modifiziert werden können. Das Wörterbuch 4 / 74 Binäre Suchbäume Das Wörterbuch Binäre Suchbäume 5 / 74 Binäre Suchbäume T sei ein geordneter binärer Baum. Das Wörterbuch Binäre Suchbäume 6 / 74 Binäre Suchbäume T sei ein geordneter binärer Baum. Jeder Knoten v von T speichert ein Paar Daten(v ) = (Schlüssel(v ), Info(v )). Das Wörterbuch Binäre Suchbäume 6 / 74 Binäre Suchbäume T sei ein geordneter binärer Baum. Jeder Knoten v von T speichert ein Paar Daten(v ) = (Schlüssel(v ), Info(v )). T heißt binärer Suchbaum, wenn T die folgenden Eigenschaften hat: Das Wörterbuch Binäre Suchbäume 6 / 74 Binäre Suchbäume T sei ein geordneter binärer Baum. Jeder Knoten v von T speichert ein Paar Daten(v ) = (Schlüssel(v ), Info(v )). T heißt binärer Suchbaum, wenn T die folgenden Eigenschaften hat: (a) Für jeden Schlüsselwert x gibt es höchstens einen Knoten v mit Schlüssel (v ) = x. Das Wörterbuch Binäre Suchbäume 6 / 74 Binäre Suchbäume T sei ein geordneter binärer Baum. Jeder Knoten v von T speichert ein Paar Daten(v ) = (Schlüssel(v ), Info(v )). T heißt binärer Suchbaum, wenn T die folgenden Eigenschaften hat: (a) Für jeden Schlüsselwert x gibt es höchstens einen Knoten v mit Schlüssel (v ) = x. (b) Für jeden Knoten v, jeden Knoten vlinks im linken Teilbaum von v und jeden Knoten vrechts im rechten Teilbaum von v gilt Schlüssel(vlinks ) < Schlüssel(v) < Schlüssel(vrechts ). Das Wörterbuch Binäre Suchbäume 6 / 74 Binäre Suchbäume T sei ein geordneter binärer Baum. Jeder Knoten v von T speichert ein Paar Daten(v ) = (Schlüssel(v ), Info(v )). T heißt binärer Suchbaum, wenn T die folgenden Eigenschaften hat: (a) Für jeden Schlüsselwert x gibt es höchstens einen Knoten v mit Schlüssel (v ) = x. (b) Für jeden Knoten v, jeden Knoten vlinks im linken Teilbaum von v und jeden Knoten vrechts im rechten Teilbaum von v gilt Schlüssel(vlinks ) < Schlüssel(v) < Schlüssel(vrechts ). Binäre Suchbäume unterstützen die binäre Suche! Das Wörterbuch Binäre Suchbäume 6 / 74 Binäre Suchbäume: lookup(x) (1) Sei r die Wurzel des binären Suchbaums. Setze v = r . /* Wir beginnen die Suche an der Wurzel. Das Wörterbuch Binäre Suchbäume */ 7 / 74 Binäre Suchbäume: lookup(x) (1) Sei r die Wurzel des binären Suchbaums. Setze v = r . /* Wir beginnen die Suche an der Wurzel. */ (2) Wenn wir am Knoten v angelangt sind, vergleichen wir x und Schlüssel (v ): I x = Schlüssel(v): Das Wörterbuch Binäre Suchbäume 7 / 74 Binäre Suchbäume: lookup(x) (1) Sei r die Wurzel des binären Suchbaums. Setze v = r . /* Wir beginnen die Suche an der Wurzel. */ (2) Wenn wir am Knoten v angelangt sind, vergleichen wir x und Schlüssel (v ): I x = Schlüssel(v): Wir haben den Schlüssel gefunden. Das Wörterbuch Binäre Suchbäume 7 / 74 Binäre Suchbäume: lookup(x) (1) Sei r die Wurzel des binären Suchbaums. Setze v = r . /* Wir beginnen die Suche an der Wurzel. */ (2) Wenn wir am Knoten v angelangt sind, vergleichen wir x und Schlüssel (v ): I x = Schlüssel(v): Wir haben den Schlüssel gefunden. I x < Schlüssel (v ): Das Wörterbuch Binäre Suchbäume 7 / 74 Binäre Suchbäume: lookup(x) (1) Sei r die Wurzel des binären Suchbaums. Setze v = r . /* Wir beginnen die Suche an der Wurzel. */ (2) Wenn wir am Knoten v angelangt sind, vergleichen wir x und Schlüssel (v ): I x = Schlüssel(v): Wir haben den Schlüssel gefunden. I x < Schlüssel (v ): Wir suchen im linken Teilbaum weiter. Das Wörterbuch Binäre Suchbäume 7 / 74 Binäre Suchbäume: lookup(x) (1) Sei r die Wurzel des binären Suchbaums. Setze v = r . /* Wir beginnen die Suche an der Wurzel. */ (2) Wenn wir am Knoten v angelangt sind, vergleichen wir x und Schlüssel (v ): I x = Schlüssel(v): Wir haben den Schlüssel gefunden. I x < Schlüssel (v ): Wir suchen im linken Teilbaum weiter. I x > Schlüssel (v ): Wir suchen im rechten Teilbaum. Das Wörterbuch Binäre Suchbäume 7 / 74 Binäre Suchbäume: lookup(x) (1) Sei r die Wurzel des binären Suchbaums. Setze v = r . /* Wir beginnen die Suche an der Wurzel. */ (2) Wenn wir am Knoten v angelangt sind, vergleichen wir x und Schlüssel (v ): I x = Schlüssel(v): Wir haben den Schlüssel gefunden. I x < Schlüssel (v ): Wir suchen im linken Teilbaum weiter. I x > Schlüssel (v ): Wir suchen im rechten Teilbaum. Lookup benötigt Zeit Θ(t), wobei t die Tiefe des Knotens ist, der den Schlüssel x speichert. Das Wörterbuch Binäre Suchbäume 7 / 74 Die Struktur Knoten typedef struct Knoten Das Wörterbuch Binäre Suchbäume 8 / 74 Die Struktur Knoten typedef struct Knoten { schluesseltyp schluessel; infotyp info; //schluesseltyp und infotyp sind vorher spezifizierte Typen. Das Wörterbuch Binäre Suchbäume 8 / 74 Die Struktur Knoten typedef struct Knoten { schluesseltyp schluessel; infotyp info; //schluesseltyp und infotyp sind vorher spezifizierte Typen. Knoten *links, *rechts; Das Wörterbuch Binäre Suchbäume 8 / 74 Die Struktur Knoten typedef struct Knoten { schluesseltyp schluessel; infotyp info; //schluesseltyp und infotyp sind vorher spezifizierte Typen. Knoten *links, *rechts; Knoten (schluesseltyp s, infotyp i, Knoten *l, Knoten *r) { schluessel = s; info = i; links = l; rechts = r; } //Konstruktor. }; Das Wörterbuch Binäre Suchbäume 8 / 74 Die Klasse Binärbaum class bsbaum Das Wörterbuch Binäre Suchbäume 9 / 74 Die Klasse Binärbaum class bsbaum {private: Das Wörterbuch Binäre Suchbäume 9 / 74 Die Klasse Binärbaum class bsbaum {private: Knoten *Kopf; Das Wörterbuch Binäre Suchbäume 9 / 74 Die Klasse Binärbaum class bsbaum {private: Knoten *Kopf; public: Das Wörterbuch Binäre Suchbäume 9 / 74 Die Klasse Binärbaum class bsbaum {private: Knoten *Kopf; public: bsbaum ( ) { Kopf = new Knoten (0,0,0,0); } Das Wörterbuch Binäre Suchbäume 9 / 74 Die Klasse Binärbaum class bsbaum {private: Knoten *Kopf; public: bsbaum ( ) { Kopf = new Knoten (0,0,0,0); } // Konstruktor. // Kopf->rechts wird stets auf die Wurzel zeigen. Das Wörterbuch Binäre Suchbäume 9 / 74 Die Klasse Binärbaum class bsbaum {private: Knoten *Kopf; public: bsbaum ( ) { Kopf = new Knoten (0,0,0,0); } // Konstruktor. // Kopf->rechts wird stets auf die Wurzel zeigen. Knoten *lookup (schluesseltyp x); Das Wörterbuch Binäre Suchbäume 9 / 74 Die Klasse Binärbaum class bsbaum {private: Knoten *Kopf; public: bsbaum ( ) { Kopf = new Knoten (0,0,0,0); } // Konstruktor. // Kopf->rechts wird stets auf die Wurzel zeigen. Knoten *lookup (schluesseltyp x); void insert (schluesseltyp x, infotyp info); Das Wörterbuch Binäre Suchbäume 9 / 74 Die Klasse Binärbaum class bsbaum {private: Knoten *Kopf; public: bsbaum ( ) { Kopf = new Knoten (0,0,0,0); } // Konstruktor. // Kopf->rechts wird stets auf die Wurzel zeigen. Knoten *lookup (schluesseltyp x); void insert (schluesseltyp x, infotyp info); void remove (schluesseltyp x); Das Wörterbuch Binäre Suchbäume 9 / 74 Die Klasse Binärbaum class bsbaum {private: Knoten *Kopf; public: bsbaum ( ) { Kopf = new Knoten (0,0,0,0); } // Konstruktor. // Kopf->rechts wird stets auf die Wurzel zeigen. Knoten *lookup (schluesseltyp x); void insert (schluesseltyp x, infotyp info); void remove (schluesseltyp x); void inorder ( ); }; Das Wörterbuch Binäre Suchbäume 9 / 74 Die Funktion lookup Knoten *bsbaum::lookup (schluesseltyp x) Das Wörterbuch Binäre Suchbäume 10 / 74 Die Funktion lookup Knoten *bsbaum::lookup (schluesseltyp x) { Knoten *Zeiger = Kopf->rechts; Das Wörterbuch Binäre Suchbäume 10 / 74 Die Funktion lookup Knoten *bsbaum::lookup (schluesseltyp x) { Knoten *Zeiger = Kopf->rechts; while ((Zeiger != 0) && (x != Zeiger->schluessel)) Das Wörterbuch Binäre Suchbäume 10 / 74 Die Funktion lookup Knoten *bsbaum::lookup (schluesseltyp x) { Knoten *Zeiger = Kopf->rechts; while ((Zeiger != 0) && (x != Zeiger->schluessel)) Zeiger = (x < Zeiger->schluessel) ? Zeiger->links : Zeiger->rechts; Das Wörterbuch Binäre Suchbäume 10 / 74 Die Funktion lookup Knoten *bsbaum::lookup (schluesseltyp x) { Knoten *Zeiger = Kopf->rechts; while ((Zeiger != 0) && (x != Zeiger->schluessel)) Zeiger = (x < Zeiger->schluessel) ? Zeiger->links : Zeiger->rechts; return Zeiger; }; Das Wörterbuch Binäre Suchbäume 10 / 74 Binäre Suchbäume: Insert Zuerst suche nach x. Das Wörterbuch Binäre Suchbäume 11 / 74 Binäre Suchbäume: Insert Zuerst suche nach x. - Sollten wir x finden, überschreibe den alten Info-Teil, - sonst füge den Schlüssel dort ein, wo die Suche scheitert. Das Wörterbuch Binäre Suchbäume 11 / 74 Binäre Suchbäume: Insert Zuerst suche nach x. - Sollten wir x finden, überschreibe den alten Info-Teil, - sonst füge den Schlüssel dort ein, wo die Suche scheitert. void bsbaum::insert (schluesseltyp x, infotyp info) Das Wörterbuch Binäre Suchbäume 11 / 74 Binäre Suchbäume: Insert Zuerst suche nach x. - Sollten wir x finden, überschreibe den alten Info-Teil, - sonst füge den Schlüssel dort ein, wo die Suche scheitert. void bsbaum::insert (schluesseltyp x, infotyp info) {Knoten *Eltern, *Zeiger; Das Wörterbuch Binäre Suchbäume 11 / 74 Binäre Suchbäume: Insert Zuerst suche nach x. - Sollten wir x finden, überschreibe den alten Info-Teil, - sonst füge den Schlüssel dort ein, wo die Suche scheitert. void bsbaum::insert (schluesseltyp x, infotyp info) {Knoten *Eltern, *Zeiger; Eltern = Kopf; Zeiger = Kopf->rechts; Das Wörterbuch Binäre Suchbäume 11 / 74 Binäre Suchbäume: Insert Zuerst suche nach x. - Sollten wir x finden, überschreibe den alten Info-Teil, - sonst füge den Schlüssel dort ein, wo die Suche scheitert. void bsbaum::insert (schluesseltyp x, infotyp info) {Knoten *Eltern, *Zeiger; Eltern = Kopf; Zeiger = Kopf->rechts; while ((Zeiger != 0) && (x != Zeiger->schluessel)) Das Wörterbuch Binäre Suchbäume 11 / 74 Binäre Suchbäume: Insert Zuerst suche nach x. - Sollten wir x finden, überschreibe den alten Info-Teil, - sonst füge den Schlüssel dort ein, wo die Suche scheitert. void bsbaum::insert (schluesseltyp x, infotyp info) {Knoten *Eltern, *Zeiger; Eltern = Kopf; Zeiger = Kopf->rechts; while ((Zeiger != 0) && (x != Zeiger->schluessel)) {Eltern = Zeiger; Das Wörterbuch Binäre Suchbäume 11 / 74 Binäre Suchbäume: Insert Zuerst suche nach x. - Sollten wir x finden, überschreibe den alten Info-Teil, - sonst füge den Schlüssel dort ein, wo die Suche scheitert. void bsbaum::insert (schluesseltyp x, infotyp info) {Knoten *Eltern, *Zeiger; Eltern = Kopf; Zeiger = Kopf->rechts; while ((Zeiger != 0) && (x != Zeiger->schluessel)) {Eltern = Zeiger; Zeiger = (x < Zeiger->schluessel) ? Zeiger->links : Zeiger->rechts; } Das Wörterbuch Binäre Suchbäume 11 / 74 Binäre Suchbäume: Insert Zuerst suche nach x. - Sollten wir x finden, überschreibe den alten Info-Teil, - sonst füge den Schlüssel dort ein, wo die Suche scheitert. void bsbaum::insert (schluesseltyp x, infotyp info) {Knoten *Eltern, *Zeiger; Eltern = Kopf; Zeiger = Kopf->rechts; while ((Zeiger != 0) && (x != Zeiger->schluessel)) {Eltern = Zeiger; Zeiger = (x < Zeiger->schluessel) ? Zeiger->links : Zeiger->rechts; } if (Zeiger == 0) Das Wörterbuch Binäre Suchbäume 11 / 74 Binäre Suchbäume: Insert Zuerst suche nach x. - Sollten wir x finden, überschreibe den alten Info-Teil, - sonst füge den Schlüssel dort ein, wo die Suche scheitert. void bsbaum::insert (schluesseltyp x, infotyp info) {Knoten *Eltern, *Zeiger; Eltern = Kopf; Zeiger = Kopf->rechts; while ((Zeiger != 0) && (x != Zeiger->schluessel)) {Eltern = Zeiger; Zeiger = (x < Zeiger->schluessel) ? Zeiger->links : Zeiger->rechts; } if (Zeiger == 0) {Zeiger = new Knoten (x, info, 0, 0); Das Wörterbuch Binäre Suchbäume 11 / 74 Binäre Suchbäume: Insert Zuerst suche nach x. - Sollten wir x finden, überschreibe den alten Info-Teil, - sonst füge den Schlüssel dort ein, wo die Suche scheitert. void bsbaum::insert (schluesseltyp x, infotyp info) {Knoten *Eltern, *Zeiger; Eltern = Kopf; Zeiger = Kopf->rechts; while ((Zeiger != 0) && (x != Zeiger->schluessel)) {Eltern = Zeiger; Zeiger = (x < Zeiger->schluessel) ? Zeiger->links : Zeiger->rechts; } if (Zeiger == 0) {Zeiger = new Knoten (x, info, 0, 0); if (x < Eltern->schluessel) Eltern->links = Zeiger; else Eltern->rechts = Zeiger; } Das Wörterbuch Binäre Suchbäume 11 / 74 Binäre Suchbäume: Insert Zuerst suche nach x. - Sollten wir x finden, überschreibe den alten Info-Teil, - sonst füge den Schlüssel dort ein, wo die Suche scheitert. void bsbaum::insert (schluesseltyp x, infotyp info) {Knoten *Eltern, *Zeiger; Eltern = Kopf; Zeiger = Kopf->rechts; while ((Zeiger != 0) && (x != Zeiger->schluessel)) {Eltern = Zeiger; Zeiger = (x < Zeiger->schluessel) ? Zeiger->links : Zeiger->rechts; } if (Zeiger == 0) {Zeiger = new Knoten (x, info, 0, 0); if (x < Eltern->schluessel) Eltern->links = Zeiger; else Eltern->rechts = Zeiger; } else Zeiger->info = info; } Das Wörterbuch Binäre Suchbäume 11 / 74 Binäre Suchbäume: Remove Zuerst suche den Schlüssel x. Wenn die Suche im Knoten v endet und wenn v ein Blatt ist: Das Wörterbuch Binäre Suchbäume 12 / 74 Binäre Suchbäume: Remove Zuerst suche den Schlüssel x. Wenn die Suche im Knoten v endet und wenn v ein Blatt ist: Entferne v . Das Wörterbuch Binäre Suchbäume 12 / 74 Binäre Suchbäume: Remove Zuerst suche den Schlüssel x. Wenn die Suche im Knoten v endet und wenn v ein Blatt ist: Entferne v . Wenn v genau ein Kind w hat: Das Wörterbuch Binäre Suchbäume 12 / 74 Binäre Suchbäume: Remove Zuerst suche den Schlüssel x. Wenn die Suche im Knoten v endet und wenn v ein Blatt ist: Entferne v . Wenn v genau ein Kind w hat: Entferne v und mache den Elternknoten von v zum Elternknoten von w. Das Wörterbuch Binäre Suchbäume 12 / 74 Binäre Suchbäume: Remove Zuerst suche den Schlüssel x. Wenn die Suche im Knoten v endet und wenn v ein Blatt ist: Entferne v . Wenn v genau ein Kind w hat: Entferne v und mache den Elternknoten von v zum Elternknoten von w. Wenn v zwei Kinder hat: Das Wörterbuch Binäre Suchbäume 12 / 74 Binäre Suchbäume: Remove Zuerst suche den Schlüssel x. Wenn die Suche im Knoten v endet und wenn v ein Blatt ist: Entferne v . Wenn v genau ein Kind w hat: Entferne v und mache den Elternknoten von v zum Elternknoten von w. Wenn v zwei Kinder hat: Ersetze v durch den kleinsten Schlüssel s im Das Wörterbuch Binäre Suchbäume 12 / 74 Binäre Suchbäume: Remove Zuerst suche den Schlüssel x. Wenn die Suche im Knoten v endet und wenn v ein Blatt ist: Entferne v . Wenn v genau ein Kind w hat: Entferne v und mache den Elternknoten von v zum Elternknoten von w. Wenn v zwei Kinder hat: Ersetze v durch den kleinsten Schlüssel s im rechten Teilbaum von v . Das Wörterbuch Binäre Suchbäume 12 / 74 Binäre Suchbäume: Remove Zuerst suche den Schlüssel x. Wenn die Suche im Knoten v endet und wenn v ein Blatt ist: Entferne v . Wenn v genau ein Kind w hat: Entferne v und mache den Elternknoten von v zum Elternknoten von w. Wenn v zwei Kinder hat: Ersetze v durch den kleinsten Schlüssel s im rechten Teilbaum von v . I Der Knoten u speichere den Schlüssel s. Das Wörterbuch Binäre Suchbäume 12 / 74 Binäre Suchbäume: Remove Zuerst suche den Schlüssel x. Wenn die Suche im Knoten v endet und wenn v ein Blatt ist: Entferne v . Wenn v genau ein Kind w hat: Entferne v und mache den Elternknoten von v zum Elternknoten von w. Wenn v zwei Kinder hat: Ersetze v durch den kleinsten Schlüssel s im rechten Teilbaum von v . I I Der Knoten u speichere den Schlüssel s. u ist als linkester Knoten im rechten Teilbaum leicht zu finden. Das Wörterbuch Binäre Suchbäume 12 / 74 Binäre Suchbäume: Remove Zuerst suche den Schlüssel x. Wenn die Suche im Knoten v endet und wenn v ein Blatt ist: Entferne v . Wenn v genau ein Kind w hat: Entferne v und mache den Elternknoten von v zum Elternknoten von w. Wenn v zwei Kinder hat: Ersetze v durch den kleinsten Schlüssel s im rechten Teilbaum von v . I I I Der Knoten u speichere den Schlüssel s. u ist als linkester Knoten im rechten Teilbaum leicht zu finden. u hat kein linkes Kind und kann damit sofort entfernt werden. Das Wörterbuch Binäre Suchbäume 12 / 74 Binäre Suchbäume: Sortieren Wir können mit binären Suchbäumen auch sortieren: Das Wörterbuch Binäre Suchbäume 13 / 74 Binäre Suchbäume: Sortieren Wir können mit binären Suchbäumen auch sortieren: Zuerst füge alle Schlüssel in einen leeren Suchbaum ein. Danach bestimme die sortierte Reihenfolge durch einen Inorder-Durchlauf. Das Wörterbuch Binäre Suchbäume 13 / 74 Die Operationen eines binären Suchbaums Die Operationen insert und remove beginnen mit einer Suche nach dem Schlüssel. Das Wörterbuch Binäre Suchbäume 14 / 74 Die Operationen eines binären Suchbaums Die Operationen insert und remove beginnen mit einer Suche nach dem Schlüssel. remove setzt den Suchprozess mit einer Suche nach dem kleinsten Schlüssel im rechten Teilbaum fort. Das Wörterbuch Binäre Suchbäume 14 / 74 Die Operationen eines binären Suchbaums Die Operationen insert und remove beginnen mit einer Suche nach dem Schlüssel. remove setzt den Suchprozess mit einer Suche nach dem kleinsten Schlüssel im rechten Teilbaum fort. (a) lookup, insert und remove benötigen Zeit proportional zur Tiefe des Baums. Das Wörterbuch Binäre Suchbäume 14 / 74 Die Operationen eines binären Suchbaums Die Operationen insert und remove beginnen mit einer Suche nach dem Schlüssel. remove setzt den Suchprozess mit einer Suche nach dem kleinsten Schlüssel im rechten Teilbaum fort. (a) lookup, insert und remove benötigen Zeit proportional zur Tiefe des Baums. (b) Die Folge insert(1, info), Das Wörterbuch Binäre Suchbäume 14 / 74 Die Operationen eines binären Suchbaums Die Operationen insert und remove beginnen mit einer Suche nach dem Schlüssel. remove setzt den Suchprozess mit einer Suche nach dem kleinsten Schlüssel im rechten Teilbaum fort. (a) lookup, insert und remove benötigen Zeit proportional zur Tiefe des Baums. (b) Die Folge insert(1, info), insert(2, info), Das Wörterbuch Binäre Suchbäume 14 / 74 Die Operationen eines binären Suchbaums Die Operationen insert und remove beginnen mit einer Suche nach dem Schlüssel. remove setzt den Suchprozess mit einer Suche nach dem kleinsten Schlüssel im rechten Teilbaum fort. (a) lookup, insert und remove benötigen Zeit proportional zur Tiefe des Baums. (b) Die Folge insert(1, info), insert(2, info), ... insert(n, info) erzeugt einen Baum der (maximalen) Tiefe n − 1. Das Wörterbuch Binäre Suchbäume 14 / 74 Die Operationen eines binären Suchbaums Die Operationen insert und remove beginnen mit einer Suche nach dem Schlüssel. remove setzt den Suchprozess mit einer Suche nach dem kleinsten Schlüssel im rechten Teilbaum fort. (a) lookup, insert und remove benötigen Zeit proportional zur Tiefe des Baums. (b) Die Folge insert(1, info), insert(2, info), ... insert(n, info) erzeugt einen Baum der (maximalen) Tiefe n − 1. (c) Die minimale Tiefe ist blog2 nc, die maximale Tiefe n − 1. Wie groß ist die erwartete Tiefe? Das Wörterbuch Binäre Suchbäume 14 / 74 Im worst-case große Tiefe, trotzdem, .... Die erwartete Tiefe und damit die erwartete Zeit für eine erfolgreiche Suche ist logarithmisch. Also ist die erwartete Zeit für lookup, insert und remove logarithmisch. Das Wörterbuch Binäre Suchbäume 15 / 74 Im worst-case große Tiefe, trotzdem, .... Die erwartete Tiefe und damit die erwartete Zeit für eine erfolgreiche Suche ist logarithmisch. Also ist die erwartete Zeit für lookup, insert und remove logarithmisch. Trotzdem ist die worst-case Laufzeit intolerabel. Das Wörterbuch Binäre Suchbäume 15 / 74 Im worst-case große Tiefe, trotzdem, .... Die erwartete Tiefe und damit die erwartete Zeit für eine erfolgreiche Suche ist logarithmisch. Also ist die erwartete Zeit für lookup, insert und remove logarithmisch. Trotzdem ist die worst-case Laufzeit intolerabel. Und die Konsequenz? Wir arbeiten weiter mit binären Suchbäumen, garantieren aber durch zusätzliche Operationen, dass der Baum tiefen-balanciert bleibt. Das Wörterbuch Binäre Suchbäume 15 / 74 AVL-Bäume Das Wörterbuch AVL-Bäume 16 / 74 AVL-Bäume Ein binärer Suchbaum heißt AVL-Baum, wenn für jeden Knoten v mit linkem Teilbaum TL (v) und rechtem Teilbaum TR (v) | Tiefe(TL (v)) − Tiefe(TR (v)) |6 1 gilt. Das Wörterbuch AVL-Bäume 17 / 74 AVL-Bäume Ein binärer Suchbaum heißt AVL-Baum, wenn für jeden Knoten v mit linkem Teilbaum TL (v) und rechtem Teilbaum TR (v) | Tiefe(TL (v)) − Tiefe(TR (v)) |6 1 gilt. b(v) := Tiefe(TL (v )) − Tiefe(TR (v )) ist der Balance-Grad von v . Definiere die Tiefe des leeren Baums als -1. Das Wörterbuch AVL-Bäume 17 / 74 AVL-Bäume Ein binärer Suchbaum heißt AVL-Baum, wenn für jeden Knoten v mit linkem Teilbaum TL (v) und rechtem Teilbaum TR (v) | Tiefe(TL (v)) − Tiefe(TR (v)) |6 1 gilt. b(v) := Tiefe(TL (v )) − Tiefe(TR (v )) ist der Balance-Grad von v . Definiere die Tiefe des leeren Baums als -1. Für AVL-Bäume ist stets b(v ) ∈ {−1, 0, 1}. Das Wörterbuch AVL-Bäume 17 / 74 AVL-Bäume Ein binärer Suchbaum heißt AVL-Baum, wenn für jeden Knoten v mit linkem Teilbaum TL (v) und rechtem Teilbaum TR (v) | Tiefe(TL (v)) − Tiefe(TR (v)) |6 1 gilt. b(v) := Tiefe(TL (v )) − Tiefe(TR (v )) ist der Balance-Grad von v . Definiere die Tiefe des leeren Baums als -1. Für AVL-Bäume ist stets b(v ) ∈ {−1, 0, 1}. Die zentralen Fragen: Können wir stets Schlüssel so einfügen, dass der Absolutbetrag des Balance-Grads höchstens Eins ist? Das Wörterbuch AVL-Bäume 17 / 74 AVL-Bäume Ein binärer Suchbaum heißt AVL-Baum, wenn für jeden Knoten v mit linkem Teilbaum TL (v) und rechtem Teilbaum TR (v) | Tiefe(TL (v)) − Tiefe(TR (v)) |6 1 gilt. b(v) := Tiefe(TL (v )) − Tiefe(TR (v )) ist der Balance-Grad von v . Definiere die Tiefe des leeren Baums als -1. Für AVL-Bäume ist stets b(v ) ∈ {−1, 0, 1}. Die zentralen Fragen: Können wir stets Schlüssel so einfügen, dass der Absolutbetrag des Balance-Grads höchstens Eins ist? Wie tief kann ein AVL-Baum mit n Knoten werden? Das Wörterbuch AVL-Bäume 17 / 74 Beispiele und Gegenbeispiele für AVL-Bäume T0 ≡ n Das Wörterbuch AVL-Bäume 18 / 74 Beispiele und Gegenbeispiele für AVL-Bäume T0 ≡ n T1 ≡ Das Wörterbuch n n AVL-Bäume 18 / 74 Beispiele und Gegenbeispiele für AVL-Bäume T0 ≡ n T1 ≡ n n n T2 ≡ n @ @ n n Das Wörterbuch AVL-Bäume 18 / 74 Beispiele und Gegenbeispiele für AVL-Bäume T0 ≡ n T1 ≡ n n n T2 ≡ n @ @ n n n P PP P sind AVL-Bäume. n n und T3 ≡ n Das Wörterbuch @ @ n n AVL-Bäume 18 / 74 Beispiele und Gegenbeispiele für AVL-Bäume T0 ≡ n T1 ≡ n n n n n T2 ≡ n @ @ n n n P PP P sind AVL-Bäume. n n und T3 ≡ @ @ n n @ @ n n P PP P n a e h l n @ @ ist kein AVL-Baum. n n Das Wörterbuch AVL-Bäume 18 / 74 Die Tiefe von AVL-Bäumen min(t) sei die minimale Knotenzahl, die ein AVL-Baum der Tiefe t mindestens besitzen muss. Das Wörterbuch AVL-Bäume 19 / 74 Die Tiefe von AVL-Bäumen min(t) sei die minimale Knotenzahl, die ein AVL-Baum der Tiefe t mindestens besitzen muss. min(0) = Das Wörterbuch AVL-Bäume 19 / 74 Die Tiefe von AVL-Bäumen min(t) sei die minimale Knotenzahl, die ein AVL-Baum der Tiefe t mindestens besitzen muss. min(0) = 1 Das Wörterbuch AVL-Bäume 19 / 74 Die Tiefe von AVL-Bäumen min(t) sei die minimale Knotenzahl, die ein AVL-Baum der Tiefe t mindestens besitzen muss. min(0) = 1 und min(1) = Das Wörterbuch AVL-Bäume 19 / 74 Die Tiefe von AVL-Bäumen min(t) sei die minimale Knotenzahl, die ein AVL-Baum der Tiefe t mindestens besitzen muss. min(0) = 1 und min(1) = 2. Das Wörterbuch AVL-Bäume 19 / 74 Die Tiefe von AVL-Bäumen min(t) sei die minimale Knotenzahl, die ein AVL-Baum der Tiefe t mindestens besitzen muss. min(0) = 1 und min(1) = 2. Und es gilt die Rekursion min(t) = Das Wörterbuch AVL-Bäume 19 / 74 Die Tiefe von AVL-Bäumen min(t) sei die minimale Knotenzahl, die ein AVL-Baum der Tiefe t mindestens besitzen muss. min(0) = 1 und min(1) = 2. Und es gilt die Rekursion min(t) = min(t − 1) + Das Wörterbuch AVL-Bäume 19 / 74 Die Tiefe von AVL-Bäumen min(t) sei die minimale Knotenzahl, die ein AVL-Baum der Tiefe t mindestens besitzen muss. min(0) = 1 und min(1) = 2. Und es gilt die Rekursion min(t) = min(t − 1) + min(t − 2) Das Wörterbuch AVL-Bäume 19 / 74 Die Tiefe von AVL-Bäumen min(t) sei die minimale Knotenzahl, die ein AVL-Baum der Tiefe t mindestens besitzen muss. min(0) = 1 und min(1) = 2. Und es gilt die Rekursion min(t) = min(t − 1) + min(t − 2) + 1. Das Wörterbuch AVL-Bäume 19 / 74 Die Tiefe von AVL-Bäumen min(t) sei die minimale Knotenzahl, die ein AVL-Baum der Tiefe t mindestens besitzen muss. min(0) = 1 und min(1) = 2. Und es gilt die Rekursion min(t) = min(t − 1) + min(t − 2) + 1. I I Wenn ein AVL-Baum die Tiefe t besitzt, dann muss ein Teilbaum die Tiefe t − 1 besitzen und hat mindestens min(t − 1) Knoten. Der andere Teilbaum hat mindestens Tiefe t − 2 und besitzt deshalb mindestens min(t − 2) Knoten. Das Wörterbuch AVL-Bäume 19 / 74 Die Tiefe von AVL-Bäumen min(t) sei die minimale Knotenzahl, die ein AVL-Baum der Tiefe t mindestens besitzen muss. min(0) = 1 und min(1) = 2. Und es gilt die Rekursion min(t) = min(t − 1) + min(t − 2) + 1. I I Wenn ein AVL-Baum die Tiefe t besitzt, dann muss ein Teilbaum die Tiefe t − 1 besitzen und hat mindestens min(t − 1) Knoten. Der andere Teilbaum hat mindestens Tiefe t − 2 und besitzt deshalb mindestens min(t − 2) Knoten. Mit induktivem Argument folgt min(t) > 2t/2 . Das Wörterbuch AVL-Bäume 19 / 74 Die Tiefe von AVL-Bäumen min(t) sei die minimale Knotenzahl, die ein AVL-Baum der Tiefe t mindestens besitzen muss. min(0) = 1 und min(1) = 2. Und es gilt die Rekursion min(t) = min(t − 1) + min(t − 2) + 1. I I Wenn ein AVL-Baum die Tiefe t besitzt, dann muss ein Teilbaum die Tiefe t − 1 besitzen und hat mindestens min(t − 1) Knoten. Der andere Teilbaum hat mindestens Tiefe t − 2 und besitzt deshalb mindestens min(t − 2) Knoten. Mit induktivem Argument folgt min(t) > 2t/2 . Die Behauptung ist richtig für t = 0 und t = 1. Das Wörterbuch AVL-Bäume 19 / 74 Die Tiefe von AVL-Bäumen min(t) sei die minimale Knotenzahl, die ein AVL-Baum der Tiefe t mindestens besitzen muss. min(0) = 1 und min(1) = 2. Und es gilt die Rekursion min(t) = min(t − 1) + min(t − 2) + 1. I I Wenn ein AVL-Baum die Tiefe t besitzt, dann muss ein Teilbaum die Tiefe t − 1 besitzen und hat mindestens min(t − 1) Knoten. Der andere Teilbaum hat mindestens Tiefe t − 2 und besitzt deshalb mindestens min(t − 2) Knoten. Mit induktivem Argument folgt min(t) > 2t/2 . Die Behauptung ist richtig für t = 0 und t = 1. min(t + 1) = min(t) + min(t − 1) + 1 Das Wörterbuch AVL-Bäume 19 / 74 Die Tiefe von AVL-Bäumen min(t) sei die minimale Knotenzahl, die ein AVL-Baum der Tiefe t mindestens besitzen muss. min(0) = 1 und min(1) = 2. Und es gilt die Rekursion min(t) = min(t − 1) + min(t − 2) + 1. I I Wenn ein AVL-Baum die Tiefe t besitzt, dann muss ein Teilbaum die Tiefe t − 1 besitzen und hat mindestens min(t − 1) Knoten. Der andere Teilbaum hat mindestens Tiefe t − 2 und besitzt deshalb mindestens min(t − 2) Knoten. Mit induktivem Argument folgt min(t) > 2t/2 . Die Behauptung ist richtig für t = 0 und t = 1. min(t + 1) = min(t) + min(t − 1) + 1 > 2t/2 + 2(t−1)/2 + 1 Das Wörterbuch AVL-Bäume 19 / 74 Die Tiefe von AVL-Bäumen min(t) sei die minimale Knotenzahl, die ein AVL-Baum der Tiefe t mindestens besitzen muss. min(0) = 1 und min(1) = 2. Und es gilt die Rekursion min(t) = min(t − 1) + min(t − 2) + 1. I I Wenn ein AVL-Baum die Tiefe t besitzt, dann muss ein Teilbaum die Tiefe t − 1 besitzen und hat mindestens min(t − 1) Knoten. Der andere Teilbaum hat mindestens Tiefe t − 2 und besitzt deshalb mindestens min(t − 2) Knoten. Mit induktivem Argument folgt min(t) > 2t/2 . Die Behauptung ist richtig für t = 0 und t = 1. min(t + 1) = min(t) + min(t − 1) + 1 > 2t/2 + 2(t−1)/2 + 1 > 2 · 2(t−1)/2 Das Wörterbuch AVL-Bäume 19 / 74 Die Tiefe von AVL-Bäumen min(t) sei die minimale Knotenzahl, die ein AVL-Baum der Tiefe t mindestens besitzen muss. min(0) = 1 und min(1) = 2. Und es gilt die Rekursion min(t) = min(t − 1) + min(t − 2) + 1. I I Wenn ein AVL-Baum die Tiefe t besitzt, dann muss ein Teilbaum die Tiefe t − 1 besitzen und hat mindestens min(t − 1) Knoten. Der andere Teilbaum hat mindestens Tiefe t − 2 und besitzt deshalb mindestens min(t − 2) Knoten. Mit induktivem Argument folgt min(t) > 2t/2 . Die Behauptung ist richtig für t = 0 und t = 1. min(t + 1) = min(t) + min(t − 1) + 1 > 2t/2 + 2(t−1)/2 + 1 > 2 · 2(t−1)/2 = 2(t+1)/2 . Die Tiefe eines AVL-Baums mit n Knoten ist höchstens Das Wörterbuch AVL-Bäume 19 / 74 Die Tiefe von AVL-Bäumen min(t) sei die minimale Knotenzahl, die ein AVL-Baum der Tiefe t mindestens besitzen muss. min(0) = 1 und min(1) = 2. Und es gilt die Rekursion min(t) = min(t − 1) + min(t − 2) + 1. I I Wenn ein AVL-Baum die Tiefe t besitzt, dann muss ein Teilbaum die Tiefe t − 1 besitzen und hat mindestens min(t − 1) Knoten. Der andere Teilbaum hat mindestens Tiefe t − 2 und besitzt deshalb mindestens min(t − 2) Knoten. Mit induktivem Argument folgt min(t) > 2t/2 . Die Behauptung ist richtig für t = 0 und t = 1. min(t + 1) = min(t) + min(t − 1) + 1 > 2t/2 + 2(t−1)/2 + 1 > 2 · 2(t−1)/2 = 2(t+1)/2 . Die Tiefe eines AVL-Baums mit n Knoten ist höchstens 2 · log2 n. Das Wörterbuch AVL-Bäume 19 / 74 Lookup, Remove und Insert Da AVL-Bäume logarithmische Tiefe haben, ist die Laufzeit einer Lookup-Operation höchstens logarithmisch. Das Wörterbuch AVL-Bäume 20 / 74 Lookup, Remove und Insert Da AVL-Bäume logarithmische Tiefe haben, ist die Laufzeit einer Lookup-Operation höchstens logarithmisch. Wir drücken uns um die remove-Operation herum: Das Wörterbuch AVL-Bäume 20 / 74 Lookup, Remove und Insert Da AVL-Bäume logarithmische Tiefe haben, ist die Laufzeit einer Lookup-Operation höchstens logarithmisch. Wir drücken uns um die remove-Operation herum: I Wir führen nur eine lazy remove Operation aus: Markiere einen gelöschten Knoten als entfernt ohne ihn tatsächlich zu entfernen. Das Wörterbuch AVL-Bäume 20 / 74 Lookup, Remove und Insert Da AVL-Bäume logarithmische Tiefe haben, ist die Laufzeit einer Lookup-Operation höchstens logarithmisch. Wir drücken uns um die remove-Operation herum: I I Wir führen nur eine lazy remove Operation aus: Markiere einen gelöschten Knoten als entfernt ohne ihn tatsächlich zu entfernen. Wenn allerdings mehr als 50 % aller Knoten markiert sind, dann beginnt ein Großreinemachen: Das Wörterbuch AVL-Bäume 20 / 74 Lookup, Remove und Insert Da AVL-Bäume logarithmische Tiefe haben, ist die Laufzeit einer Lookup-Operation höchstens logarithmisch. Wir drücken uns um die remove-Operation herum: I I Wir führen nur eine lazy remove Operation aus: Markiere einen gelöschten Knoten als entfernt ohne ihn tatsächlich zu entfernen. Wenn allerdings mehr als 50 % aller Knoten markiert sind, dann beginnt ein Großreinemachen: F Ein neuer AVL-Baum wird aus den nicht markierten Knoten des alten Baumes durch Insert-Operationen aufgebaut. Das Wörterbuch AVL-Bäume 20 / 74 Lookup, Remove und Insert Da AVL-Bäume logarithmische Tiefe haben, ist die Laufzeit einer Lookup-Operation höchstens logarithmisch. Wir drücken uns um die remove-Operation herum: I I Wir führen nur eine lazy remove Operation aus: Markiere einen gelöschten Knoten als entfernt ohne ihn tatsächlich zu entfernen. Wenn allerdings mehr als 50 % aller Knoten markiert sind, dann beginnt ein Großreinemachen: F Ein neuer AVL-Baum wird aus den nicht markierten Knoten des alten Baumes durch Insert-Operationen aufgebaut. Die Laufzeit für den Neuaufbaus ist groß, aber gegen die vielen blitzschnellen remove-Operationen amortisiert. Das Wörterbuch AVL-Bäume 20 / 74 Lookup, Remove und Insert Da AVL-Bäume logarithmische Tiefe haben, ist die Laufzeit einer Lookup-Operation höchstens logarithmisch. Wir drücken uns um die remove-Operation herum: I I Wir führen nur eine lazy remove Operation aus: Markiere einen gelöschten Knoten als entfernt ohne ihn tatsächlich zu entfernen. Wenn allerdings mehr als 50 % aller Knoten markiert sind, dann beginnt ein Großreinemachen: F Ein neuer AVL-Baum wird aus den nicht markierten Knoten des alten Baumes durch Insert-Operationen aufgebaut. Die Laufzeit für den Neuaufbaus ist groß, aber gegen die vielen blitzschnellen remove-Operationen amortisiert. Kritisch ist die Implementierung der insert-Operation. Das Wörterbuch AVL-Bäume 20 / 74 Rotationen In einer Linksrotation ersetzt ein rechtes Kind den Elternknoten. Der Elternknoten wird zum linken Kind. Das Wörterbuch AVL-Bäume 21 / 74 Rotationen In einer Linksrotation ersetzt ein rechtes Kind den Elternknoten. Der Elternknoten wird zum linken Kind. vl HH wl =⇒ A T 1A @ @ A A T2A T3A Das Wörterbuch AVL-Bäume wl HH vl A T3A @ @ A A T1A T2A 21 / 74 Rotationen In einer Linksrotation ersetzt ein rechtes Kind den Elternknoten. Der Elternknoten wird zum linken Kind. vl HH wl =⇒ A T 1A @ @ A A T2A T3A wl HH vl A T3A @ @ A A T1A T2A Rechtsrotationen sind entsprechend definiert. Das Wörterbuch AVL-Bäume 21 / 74 Rotationen In einer Linksrotation ersetzt ein rechtes Kind den Elternknoten. Der Elternknoten wird zum linken Kind. vl HH wl =⇒ A T 1A @ @ A A T2A T3A wl HH vl A T3A @ @ A A T1A T2A Rechtsrotationen sind entsprechend definiert. vl HH wl A T3A @ @ A A T1A T2A Das Wörterbuch wl HH l v =⇒ A T1A @ @ A A T2A T3A AVL-Bäume 21 / 74 Die Insert-Operation Um den Schlüssel x einzufügen, suche zuerst nach x und füge x am Ende einer erfolglosen Suche ein. Das Wörterbuch AVL-Bäume 22 / 74 Die Insert-Operation Um den Schlüssel x einzufügen, suche zuerst nach x und füge x am Ende einer erfolglosen Suche ein. An welchen Knoten ist jetzt möglicherweise die AVL-Eigenschaft verletzt? Das Wörterbuch AVL-Bäume 22 / 74 Die Insert-Operation Um den Schlüssel x einzufügen, suche zuerst nach x und füge x am Ende einer erfolglosen Suche ein. An welchen Knoten ist jetzt möglicherweise die AVL-Eigenschaft verletzt? I Nur Knoten des Suchpfads, also des Pfads von der Wurzel zum frisch eingefügten Blatt, können betroffen sein! Das Wörterbuch AVL-Bäume 22 / 74 Die Insert-Operation Um den Schlüssel x einzufügen, suche zuerst nach x und füge x am Ende einer erfolglosen Suche ein. An welchen Knoten ist jetzt möglicherweise die AVL-Eigenschaft verletzt? I I Nur Knoten des Suchpfads, also des Pfads von der Wurzel zum frisch eingefügten Blatt, können betroffen sein! Wir laufen deshalb den Suchpfad möglicherweise ganz zurück, um die Balance-Eigenschaft zu reparieren. Das Wörterbuch AVL-Bäume 22 / 74 Die Insert-Operation Um den Schlüssel x einzufügen, suche zuerst nach x und füge x am Ende einer erfolglosen Suche ein. An welchen Knoten ist jetzt möglicherweise die AVL-Eigenschaft verletzt? I I Nur Knoten des Suchpfads, also des Pfads von der Wurzel zum frisch eingefügten Blatt, können betroffen sein! Wir laufen deshalb den Suchpfad möglicherweise ganz zurück, um die Balance-Eigenschaft zu reparieren. Die Situation: Wir sind bis zum Knoten u zurückgelaufen. Die AVL-Eigenschaft gilt für u und alle Nachfahren von u. Das Wörterbuch AVL-Bäume 22 / 74 Die Insert-Operation Um den Schlüssel x einzufügen, suche zuerst nach x und füge x am Ende einer erfolglosen Suche ein. An welchen Knoten ist jetzt möglicherweise die AVL-Eigenschaft verletzt? I I Nur Knoten des Suchpfads, also des Pfads von der Wurzel zum frisch eingefügten Blatt, können betroffen sein! Wir laufen deshalb den Suchpfad möglicherweise ganz zurück, um die Balance-Eigenschaft zu reparieren. Die Situation: Wir sind bis zum Knoten u zurückgelaufen. Die AVL-Eigenschaft gilt für u und alle Nachfahren von u. Wenn wir die Reparatur fortsetzen müssen, müssen wir uns als Nächstes um den Elternknoten v von u kümmern. Das Wörterbuch AVL-Bäume 22 / 74 Die Insert-Operation Um den Schlüssel x einzufügen, suche zuerst nach x und füge x am Ende einer erfolglosen Suche ein. An welchen Knoten ist jetzt möglicherweise die AVL-Eigenschaft verletzt? I I Nur Knoten des Suchpfads, also des Pfads von der Wurzel zum frisch eingefügten Blatt, können betroffen sein! Wir laufen deshalb den Suchpfad möglicherweise ganz zurück, um die Balance-Eigenschaft zu reparieren. Die Situation: Wir sind bis zum Knoten u zurückgelaufen. Die AVL-Eigenschaft gilt für u und alle Nachfahren von u. Wenn wir die Reparatur fortsetzen müssen, müssen wir uns als Nächstes um den Elternknoten v von u kümmern. w bezeichne den Großelternknoten von u. Das Wörterbuch AVL-Bäume 22 / 74 Der Zick-Zick Fall (1/2) wn vn HH H H H H un AA A @ @ A @ @ A A B AA C AA Fallannahme: Ein neues Blatt wurde im Teilbaum von u eingefügt und es gilt Tiefe(C) > Tiefe(B) nach Einfügung. AVL-Bäume Zick-Zick 23 / 74 Der Zick-Zick Fall (1/2) wn vn HH H H H H un AA A @ @ A @ @ A A B AA C AA Fallannahme: Ein neues Blatt wurde im Teilbaum von u eingefügt und es gilt Tiefe(C) > Tiefe(B) nach Einfügung. Die Tiefe des Teilbaums von u muss um 1 angewachsen sein, denn ansonsten können wir die Reparatur beenden. AVL-Bäume Zick-Zick 23 / 74 Der Zick-Zick Fall (1/2) wn vn HH H H H H un AA A @ @ A @ @ A A B AA C AA Fallannahme: Ein neues Blatt wurde im Teilbaum von u eingefügt und es gilt Tiefe(C) > Tiefe(B) nach Einfügung. Die Tiefe des Teilbaums von u muss um 1 angewachsen sein, denn ansonsten können wir die Reparatur beenden. Sei d die neue, um 1 größere Tiefe des Teilbaums von u. AVL-Bäume Zick-Zick 23 / 74 Der Zick-Zick Fall (2/2) Tiefe(A) > d + 1 ist unmöglich, da sonst b(v ) > 2 vor Einfügen des neuen Blatt gilt. AVL-Bäume Zick-Zick 24 / 74 Der Zick-Zick Fall (2/2) Tiefe(A) > d + 1 ist unmöglich, da sonst b(v ) > 2 vor Einfügen des neuen Blatt gilt. Wenn Tiefe(A) = d, dann brauchen wir nur den Balance-Grad b(v ) = 0 neu zu setzen. I Die Reparatur kann abgebrochen werden, da der Teilbaum mit Wurzel v seine Tiefe nicht verändert hat. AVL-Bäume Zick-Zick 24 / 74 Der Zick-Zick Fall (2/2) Tiefe(A) > d + 1 ist unmöglich, da sonst b(v ) > 2 vor Einfügen des neuen Blatt gilt. Wenn Tiefe(A) = d, dann brauchen wir nur den Balance-Grad b(v ) = 0 neu zu setzen. I Die Reparatur kann abgebrochen werden, da der Teilbaum mit Wurzel v seine Tiefe nicht verändert hat. Wenn Tiefe(A) = d − 1, dann setze b(v ) = −1. Diesmal müssen wir die Reparatur in w fortsetzen: Die Tiefe des Teilbaums mit Wurzel v ist um 1 angestiegen. AVL-Bäume Zick-Zick 24 / 74 Der Zick-Zick Fall (2/2) Tiefe(A) > d + 1 ist unmöglich, da sonst b(v ) > 2 vor Einfügen des neuen Blatt gilt. Wenn Tiefe(A) = d, dann brauchen wir nur den Balance-Grad b(v ) = 0 neu zu setzen. I Die Reparatur kann abgebrochen werden, da der Teilbaum mit Wurzel v seine Tiefe nicht verändert hat. Wenn Tiefe(A) = d − 1, dann setze b(v ) = −1. Diesmal müssen wir die Reparatur in w fortsetzen: Die Tiefe des Teilbaums mit Wurzel v ist um 1 angestiegen. Der Fall Tiefe(A) 6 d − 3 kann nicht auftreten, da sonst b(v ) 6 −2 vor Einfügen des neuen Blatts gilt. AVL-Bäume Zick-Zick 24 / 74 Der Zick-Zick Fall (2/2) Tiefe(A) > d + 1 ist unmöglich, da sonst b(v ) > 2 vor Einfügen des neuen Blatt gilt. Wenn Tiefe(A) = d, dann brauchen wir nur den Balance-Grad b(v ) = 0 neu zu setzen. I Die Reparatur kann abgebrochen werden, da der Teilbaum mit Wurzel v seine Tiefe nicht verändert hat. Wenn Tiefe(A) = d − 1, dann setze b(v ) = −1. Diesmal müssen wir die Reparatur in w fortsetzen: Die Tiefe des Teilbaums mit Wurzel v ist um 1 angestiegen. Der Fall Tiefe(A) 6 d − 3 kann nicht auftreten, da sonst b(v ) 6 −2 vor Einfügen des neuen Blatts gilt. Der Fall Tiefe(A) = d − 2 ist kritisch. AVL-Bäume Zick-Zick 24 / 74 Tiefe(A) = d − 2 Führe eine Linksrotation in v durch. AVL-Bäume Zick-Zick 25 / 74 Tiefe(A) = d − 2 Führe eine Linksrotation in v durch. wl vl H H l u A A A @ @ A A B A C A AVL-Bäume wl ul ⇒ HH l v A CA @ @ A A A A B A Zick-Zick 25 / 74 Tiefe(A) = d − 2 Führe eine Linksrotation in v durch. wl vl H H l u A A A @ @ A A B A C A wl ul ⇒ HH l v A CA @ @ A A A A B A Tiefe(B) 6 Tiefe(C) gilt nach Fallannahme: Tiefe(C) = d − 1 folgt. AVL-Bäume Zick-Zick 25 / 74 Tiefe(A) = d − 2 Führe eine Linksrotation in v durch. wl vl H H l u A A A @ @ A A B A C A wl ul ⇒ HH l v A CA @ @ A A A A B A Tiefe(B) 6 Tiefe(C) gilt nach Fallannahme: Tiefe(C) = d − 1 folgt. Da die AVL-Eigenschaft in u gilt, folgt d − 2 = Tiefe(C) − 1 6 Tiefe(B) 6 TiefeC) = d − 1. AVL-Bäume Zick-Zick 25 / 74 Tiefe(A) = d − 2 Führe eine Linksrotation in v durch. wl vl H H l u A A A @ @ A A B A C A wl ul ⇒ HH l v A CA @ @ A A A A B A Tiefe(B) 6 Tiefe(C) gilt nach Fallannahme: Tiefe(C) = d − 1 folgt. Da die AVL-Eigenschaft in u gilt, folgt d − 2 = Tiefe(C) − 1 6 Tiefe(B) 6 TiefeC) = d − 1. Die AVL-Eigenschaft gilt somit nach der Rotation für u und v . AVL-Bäume Zick-Zick 25 / 74 Tiefe(A) = d − 2 Führe eine Linksrotation in v durch. wl vl H H l u A A A @ @ A A B A C A wl ul ⇒ HH l v A CA @ @ A A A A B A Tiefe(B) 6 Tiefe(C) gilt nach Fallannahme: Tiefe(C) = d − 1 folgt. Da die AVL-Eigenschaft in u gilt, folgt d − 2 = Tiefe(C) − 1 6 Tiefe(B) 6 TiefeC) = d − 1. Die AVL-Eigenschaft gilt somit nach der Rotation für u und v . Setze b(u) und b(v ) entsprechend und fahre fort, wenn der neue Teilbaum von u tiefer ist als der alte Teilbaum von v . AVL-Bäume Zick-Zick 25 / 74 Der Zack-Zack Fall wn vn H HH n u AA @ C A @ A A A B A A AA AVL-Bäume Zack-Zack 26 / 74 Der Zack-Zack Fall wn vn H HH n u AA @ C A @ A A A B A A AA Fallannahme: Ein neues Blatt wurde im Teilbaumvon u eingefügt und Tiefe(A) > Tiefe(B) gilt nach Einfügung. AVL-Bäume Zack-Zack 26 / 74 Der Zack-Zack Fall wn vn H HH n u AA @ C A @ A A A B A A AA Fallannahme: Ein neues Blatt wurde im Teilbaumvon u eingefügt und Tiefe(A) > Tiefe(B) gilt nach Einfügung. Der Zack-Zack Fall wird wie der Zick-Zick Fall behandelt. AVL-Bäume Zack-Zack 26 / 74 Der Zick-Zack Fall wl vl H H H H ul A A @ A @ A A B A C A AVL-Bäume Zick-Zack 27 / 74 Der Zick-Zack Fall wl vl H H H H ul A A @ A @ A A B A C A Fallannahme: Ein neues Blatt wurde im Teilbaum mit Wurzel u eingefügt und Tiefe(B) > Tiefe(C) gilt nach Einfügung. AVL-Bäume Zick-Zack 27 / 74 Der Zick-Zack Fall wl vl H H H H ul A A @ A @ A A B A C A Fallannahme: Ein neues Blatt wurde im Teilbaum mit Wurzel u eingefügt und Tiefe(B) > Tiefe(C) gilt nach Einfügung. Die Reparatur muss nur dann fortgesetzt werden, wenn die Tiefe des Teilbaums von u um 1 angestiegen ist. AVL-Bäume Zick-Zack 27 / 74 Der Zick-Zack Fall wl vl H H H H ul A A @ A @ A A B A C A Fallannahme: Ein neues Blatt wurde im Teilbaum mit Wurzel u eingefügt und Tiefe(B) > Tiefe(C) gilt nach Einfügung. Die Reparatur muss nur dann fortgesetzt werden, wenn die Tiefe des Teilbaums von u um 1 angestiegen ist. Sei d die neue Tiefe des Teilbaums von u. Wie im Zick-Zick Fall ist nur der Fall Tiefe(A) = d − 2 kritisch. AVL-Bäume Zick-Zack 27 / 74 Tiefe(A) = d − 2 Da d − 1 =Tiefe(B) > Tiefe(C) AVL-Bäume Zick-Zack 28 / 74 Tiefe(A) = d − 2 Da d − 1 =Tiefe(B) > Tiefe(C) = d − 2, AVL-Bäume Zick-Zack 28 / 74 Tiefe(A) = d − 2 Da d − 1 =Tiefe(B) > Tiefe(C) = d − 2, folgt Tiefe(A) = Tiefe(C) = d − 2 AVL-Bäume Zick-Zack 28 / 74 Tiefe(A) = d − 2 Da d − 1 =Tiefe(B) > Tiefe(C) = d − 2, folgt Tiefe(A) = Tiefe(C) = d − 2 und Tiefe(B) = d − 1. AVL-Bäume Zick-Zack 28 / 74 Tiefe(A) = d − 2 Da d − 1 =Tiefe(B) > Tiefe(C) = d − 2, folgt Tiefe(A) = Tiefe(C) = d − 2 und Tiefe(B) = d − 1. Eine Linksrotation in v ist keine Reparatur: wl vl H H H H ul A A @ A @ A A B A C A AVL-Bäume Zick-Zack 28 / 74 Tiefe(A) = d − 2 Da d − 1 =Tiefe(B) > Tiefe(C) = d − 2, folgt Tiefe(A) = Tiefe(C) = d − 2 und Tiefe(B) = d − 1. Eine Linksrotation in v ist keine Reparatur: wl vl H H H H ul A A @ A @ A A B A C A B wandert vom rechten zum linken Teilbaum und die AVL-Eigenschaft bleibt verletzt, da Tiefe (A) = Tiefe(C). AVL-Bäume Zick-Zack 28 / 74 Tiefe(A) = d − 2 Zuerst eine Rechtsrotation in u wl vl H H A ul HH A A A | d − 1 A @ C AA A A B1AA B2AA AVL-Bäume Zick-Zack 29 / 74 Tiefe(A) = d − 2 Zuerst eine Rechtsrotation in u wl vl H H A ul HH A A A | d − 1 A @ C AA A A B1AA B2AA AVL-Bäume wl vl A A AA H H A B1AA Zick-Zack | H H ul @ A A B2AA C AA 29 / 74 Tiefe(A) = d − 2 Zuerst eine Rechtsrotation in u wl vl H H A ul HH A A A | d − 1 A @ C AA A A B1AA B2AA wl vl A A AA H H A B1AA | H H ul @ A A B2AA C AA und dann eine Linksrotation in v AVL-Bäume Zick-Zack 29 / 74 Tiefe(A) = d − 2 Zuerst eine Rechtsrotation in u wl vl H H A ul HH A A A | d − 1 A @ C AA A A B1AA B2AA wl vl A A AA H H A B1AA und dann | H H ul @ A A B2AA C AA wl | HH ul vl eine Linksrotation in v AVL-Bäume @ @ A A A A A AA B1AA B2AA C AA Zick-Zack 29 / 74 Nach der Doppelrotation wn ~ HH H un vn A A AA AVL-Bäume @ @ A B 1AA A B2AA Zick-Zack @ @ A C AA 30 / 74 Nach der Doppelrotation wn ~ HH H un vn A A AA @ @ A B 1AA A B2AA @ @ A C AA Die Tiefe ist um 1 gesunken, AVL-Bäume Zick-Zack 30 / 74 Nach der Doppelrotation wn ~ HH H un vn A A AA @ @ A B 1AA A B2AA @ @ A C AA Die Tiefe ist um 1 gesunken, denn Tiefe (A) = Tiefe(C) = d − 2 AVL-Bäume Zick-Zack 30 / 74 Nach der Doppelrotation wn ~ HH H un vn A A AA @ @ A B 1AA A B2AA @ @ A C AA Die Tiefe ist um 1 gesunken, denn Tiefe (A) = Tiefe(C) = d − 2 und d − 3 6 Tiefe(B1 ), Tiefe(B2 ) 6 d − 2. AVL-Bäume Zick-Zack 30 / 74 Nach der Doppelrotation wn ~ HH H un vn A A AA @ @ A B 1AA A B2AA @ @ A C AA Die Tiefe ist um 1 gesunken, denn Tiefe (A) = Tiefe(C) = d − 2 und d − 3 6 Tiefe(B1 ), Tiefe(B2 ) 6 d − 2. Die Tiefe des schwarzen Knotens stimmt jetzt mit der Tiefe d von v vor dem Einfügen des neuen Blatts überein. AVL-Bäume Zick-Zack 30 / 74 Nach der Doppelrotation wn ~ HH H un vn A A AA @ @ A B 1AA A B2AA @ @ A C AA Die Tiefe ist um 1 gesunken, denn Tiefe (A) = Tiefe(C) = d − 2 und d − 3 6 Tiefe(B1 ), Tiefe(B2 ) 6 d − 2. Die Tiefe des schwarzen Knotens stimmt jetzt mit der Tiefe d von v vor dem Einfügen des neuen Blatts überein. Nach Setzen der neuen Balance-Grade kann die Reparatur abgebrochen werden. AVL-Bäume Zick-Zack 30 / 74 Zusammenfassung Die Operationen lookup und insert haben worst-case Laufzeit O(log2 n) für AVL-Bäume mit n Knoten. AVL-Bäume Zack-Zick 31 / 74 Zusammenfassung Die Operationen lookup und insert haben worst-case Laufzeit O(log2 n) für AVL-Bäume mit n Knoten. Wir haben nur den Zack-Zick Fall ausgelassen, der analog zum Zick-Zack Fall zu behandeln ist. AVL-Bäume Zack-Zick 31 / 74 Zusammenfassung Die Operationen lookup und insert haben worst-case Laufzeit O(log2 n) für AVL-Bäume mit n Knoten. Wir haben nur den Zack-Zick Fall ausgelassen, der analog zum Zick-Zack Fall zu behandeln ist. Mit AVL-Bäumen können wir schnell sortieren: AVL-Bäume Zack-Zick 31 / 74 Zusammenfassung Die Operationen lookup und insert haben worst-case Laufzeit O(log2 n) für AVL-Bäume mit n Knoten. Wir haben nur den Zack-Zick Fall ausgelassen, der analog zum Zick-Zack Fall zu behandeln ist. Mit AVL-Bäumen können wir schnell sortieren: I I Füge n Schlüssel in Zeit O(n · log2 n) ein und führe dann einen Inorder-Traversal in linearer Zeit aus. AVL-Bäume Zack-Zick 31 / 74 (a, b)-Bäume: Wörterbücher für Externspeicher AVL-Bäume Zack-Zick 32 / 74 Die (a, b)-Eigenschaft Es gelte a > 2 und b > 2a − 1. Ein Baum T hat die (a, b)-Eigenschaft, falls alle Blätter von T die gleiche Tiefe haben, AVL-Bäume (a, b)-Bäume 33 / 74 Die (a, b)-Eigenschaft Es gelte a > 2 und b > 2a − 1. Ein Baum T hat die (a, b)-Eigenschaft, falls alle Blätter von T die gleiche Tiefe haben, alle Knoten höchstens b Kinder besitzen AVL-Bäume (a, b)-Bäume 33 / 74 Die (a, b)-Eigenschaft Es gelte a > 2 und b > 2a − 1. Ein Baum T hat die (a, b)-Eigenschaft, falls alle Blätter von T die gleiche Tiefe haben, alle Knoten höchstens b Kinder besitzen und die Wurzel mindestens zwei Kinder hat, während alle sonstigen Knoten mindestens a Kinder haben. AVL-Bäume (a, b)-Bäume 33 / 74 Die (a, b)-Eigenschaft Es gelte a > 2 und b > 2a − 1. Ein Baum T hat die (a, b)-Eigenschaft, falls alle Blätter von T die gleiche Tiefe haben, alle Knoten höchstens b Kinder besitzen und die Wurzel mindestens zwei Kinder hat, während alle sonstigen Knoten mindestens a Kinder haben. Interessant sind Bäume mit der (a, b)-Eigenschaft für große Werte von a und b, wenn Daten auf einem Externspeicher abgelegt sind: I I Die Tiefe wird dementsprechend klein sein und wenige der sehr langsamen Zugriffe auf den Externspeicher genügen. AVL-Bäume (a, b)-Bäume 33 / 74 Die Suchstruktur von (a, b)-Bäumen T ist ein (a, b)-Baum für die Schlüsselmenge S, bzw. ein B-Baum für b = 2a − 1, falls gilt: AVL-Bäume (a, b)-Bäume 34 / 74 Die Suchstruktur von (a, b)-Bäumen T ist ein (a, b)-Baum für die Schlüsselmenge S, bzw. ein B-Baum für b = 2a − 1, falls gilt: T hat die (a, b)-Eigenschaft. AVL-Bäume (a, b)-Bäume 34 / 74 Die Suchstruktur von (a, b)-Bäumen T ist ein (a, b)-Baum für die Schlüsselmenge S, bzw. ein B-Baum für b = 2a − 1, falls gilt: T hat die (a, b)-Eigenschaft. Jeder Schlüssel in S wird in genau einem Knoten von T gespeichert und jeder Knoten speichert die ihm zugewiesenen Schlüssel in aufsteigender Reihenfolge. AVL-Bäume (a, b)-Bäume 34 / 74 Die Suchstruktur von (a, b)-Bäumen T ist ein (a, b)-Baum für die Schlüsselmenge S, bzw. ein B-Baum für b = 2a − 1, falls gilt: T hat die (a, b)-Eigenschaft. Jeder Schlüssel in S wird in genau einem Knoten von T gespeichert und jeder Knoten speichert die ihm zugewiesenen Schlüssel in aufsteigender Reihenfolge. I Jeder Knoten mit k Kindern speichert genau k − 1 Schlüssel. AVL-Bäume (a, b)-Bäume 34 / 74 Die Suchstruktur von (a, b)-Bäumen T ist ein (a, b)-Baum für die Schlüsselmenge S, bzw. ein B-Baum für b = 2a − 1, falls gilt: T hat die (a, b)-Eigenschaft. Jeder Schlüssel in S wird in genau einem Knoten von T gespeichert und jeder Knoten speichert die ihm zugewiesenen Schlüssel in aufsteigender Reihenfolge. I I Jeder Knoten mit k Kindern speichert genau k − 1 Schlüssel. Ein Blatt speichert höchstens b − 1 Schlüssel und mindestens a − 1 Schlüssel. AVL-Bäume (a, b)-Bäume 34 / 74 Die Suchstruktur von (a, b)-Bäumen T ist ein (a, b)-Baum für die Schlüsselmenge S, bzw. ein B-Baum für b = 2a − 1, falls gilt: T hat die (a, b)-Eigenschaft. Jeder Schlüssel in S wird in genau einem Knoten von T gespeichert und jeder Knoten speichert die ihm zugewiesenen Schlüssel in aufsteigender Reihenfolge. I I Jeder Knoten mit k Kindern speichert genau k − 1 Schlüssel. Ein Blatt speichert höchstens b − 1 Schlüssel und mindestens a − 1 Schlüssel. Falls der innere Knoten v die Schlüssel x1 , ..., xc (mit x1 < x2 < · · · < xc und c 6 b − 1) speichert, AVL-Bäume (a, b)-Bäume 34 / 74 Die Suchstruktur von (a, b)-Bäumen T ist ein (a, b)-Baum für die Schlüsselmenge S, bzw. ein B-Baum für b = 2a − 1, falls gilt: T hat die (a, b)-Eigenschaft. Jeder Schlüssel in S wird in genau einem Knoten von T gespeichert und jeder Knoten speichert die ihm zugewiesenen Schlüssel in aufsteigender Reihenfolge. I I Jeder Knoten mit k Kindern speichert genau k − 1 Schlüssel. Ein Blatt speichert höchstens b − 1 Schlüssel und mindestens a − 1 Schlüssel. Falls der innere Knoten v die Schlüssel x1 , ..., xc (mit x1 < x2 < · · · < xc und c 6 b − 1) speichert, dann I speichert der linkeste (bzw. rechteste) Teilbaum nur Schlüssel aus dem Intervall (−∞, x1 ) (bzw. (xc , ∞)). AVL-Bäume (a, b)-Bäume 34 / 74 Die Suchstruktur von (a, b)-Bäumen T ist ein (a, b)-Baum für die Schlüsselmenge S, bzw. ein B-Baum für b = 2a − 1, falls gilt: T hat die (a, b)-Eigenschaft. Jeder Schlüssel in S wird in genau einem Knoten von T gespeichert und jeder Knoten speichert die ihm zugewiesenen Schlüssel in aufsteigender Reihenfolge. I I Jeder Knoten mit k Kindern speichert genau k − 1 Schlüssel. Ein Blatt speichert höchstens b − 1 Schlüssel und mindestens a − 1 Schlüssel. Falls der innere Knoten v die Schlüssel x1 , ..., xc (mit x1 < x2 < · · · < xc und c 6 b − 1) speichert, dann I I speichert der linkeste (bzw. rechteste) Teilbaum nur Schlüssel aus dem Intervall (−∞, x1 ) (bzw. (xc , ∞)). Der i.te Teilbaum (für 2 6 i 6 c) speichert nur Schlüssel aus dem Intervall (xi−1 , xi ). AVL-Bäume (a, b)-Bäume 34 / 74 Ein Beispiel Für a = 2 und b = 3 erhalten wir 2-3 Bäume: E PP PP P P H, M B @ @ A AVL-Bäume @ @ D F, G (a, b)-Bäume K,L P 35 / 74 Ein Beispiel Für a = 2 und b = 3 erhalten wir 2-3 Bäume: E PP PP P P H, M B @ @ A @ @ D F, G K,L P Die Schlüssel der inneren Knoten helfen in der Suche: AVL-Bäume (a, b)-Bäume 35 / 74 Ein Beispiel Für a = 2 und b = 3 erhalten wir 2-3 Bäume: E PP PP P P H, M B @ @ A @ @ D F, G K,L P Die Schlüssel der inneren Knoten helfen in der Suche: I Auf der Suche nach Schlüssel K suche im rechten Teilbaum weiter, denn E < K . AVL-Bäume (a, b)-Bäume 35 / 74 Ein Beispiel Für a = 2 und b = 3 erhalten wir 2-3 Bäume: E PP PP P P H, M B @ @ A @ @ D F, G K,L P Die Schlüssel der inneren Knoten helfen in der Suche: I I Auf der Suche nach Schlüssel K suche im rechten Teilbaum weiter, denn E < K . Da H < K < M muss das mittlere Blatt aufgesucht werden. AVL-Bäume (a, b)-Bäume 35 / 74 Die Tiefe von (a, b)-Bäumen T sei ein (a, b)-Baum mit n Knoten. Dann gilt für Tiefe(T ) > 2: logb (n) − 1 < Tiefe(T ) < loga ( AVL-Bäume (a, b)-Bäume n−1 ) + 1. 2 36 / 74 Die Tiefe von (a, b)-Bäumen T sei ein (a, b)-Baum mit n Knoten. Dann gilt für Tiefe(T ) > 2: logb (n) − 1 < Tiefe(T ) < loga ( n−1 ) + 1. 2 Die Tiefe ist minimal, wenn jeder Knoten genau b Kinder hat. AVL-Bäume (a, b)-Bäume 36 / 74 Die Tiefe von (a, b)-Bäumen T sei ein (a, b)-Baum mit n Knoten. Dann gilt für Tiefe(T ) > 2: logb (n) − 1 < Tiefe(T ) < loga ( n−1 ) + 1. 2 Die Tiefe ist minimal, wenn jeder Knoten genau b Kinder hat. I In Tiefe t können wir damit höchstens n 6 1 + b + ... + bt AVL-Bäume (a, b)-Bäume 36 / 74 Die Tiefe von (a, b)-Bäumen T sei ein (a, b)-Baum mit n Knoten. Dann gilt für Tiefe(T ) > 2: logb (n) − 1 < Tiefe(T ) < loga ( n−1 ) + 1. 2 Die Tiefe ist minimal, wenn jeder Knoten genau b Kinder hat. I In Tiefe t können wir damit höchstens t+1 −1 n 6 1 + b + ... + bt = b b−1 AVL-Bäume (a, b)-Bäume 36 / 74 Die Tiefe von (a, b)-Bäumen T sei ein (a, b)-Baum mit n Knoten. Dann gilt für Tiefe(T ) > 2: logb (n) − 1 < Tiefe(T ) < loga ( n−1 ) + 1. 2 Die Tiefe ist minimal, wenn jeder Knoten genau b Kinder hat. I In Tiefe t können wir damit höchstens t+1 −1 < bt+1 Knoten erreichen. n 6 1 + b + ... + bt = b b−1 AVL-Bäume (a, b)-Bäume 36 / 74 Die Tiefe von (a, b)-Bäumen T sei ein (a, b)-Baum mit n Knoten. Dann gilt für Tiefe(T ) > 2: logb (n) − 1 < Tiefe(T ) < loga ( n−1 ) + 1. 2 Die Tiefe ist minimal, wenn jeder Knoten genau b Kinder hat. I I In Tiefe t können wir damit höchstens t+1 −1 < bt+1 Knoten erreichen. n 6 1 + b + ... + bt = b b−1 Also folgt bt+1 > n und damit t > logb n − 1. AVL-Bäume (a, b)-Bäume 36 / 74 Die Tiefe von (a, b)-Bäumen T sei ein (a, b)-Baum mit n Knoten. Dann gilt für Tiefe(T ) > 2: logb (n) − 1 < Tiefe(T ) < loga ( n−1 ) + 1. 2 Die Tiefe ist minimal, wenn jeder Knoten genau b Kinder hat. I I In Tiefe t können wir damit höchstens t+1 −1 < bt+1 Knoten erreichen. n 6 1 + b + ... + bt = b b−1 Also folgt bt+1 > n und damit t > logb n − 1. Die Tiefe ist am größten, wenn die Wurzel zwei Kinder und jeder innere Knoten a Kinder besitzt. AVL-Bäume (a, b)-Bäume 36 / 74 Die Tiefe von (a, b)-Bäumen T sei ein (a, b)-Baum mit n Knoten. Dann gilt für Tiefe(T ) > 2: logb (n) − 1 < Tiefe(T ) < loga ( n−1 ) + 1. 2 Die Tiefe ist minimal, wenn jeder Knoten genau b Kinder hat. I I In Tiefe t können wir damit höchstens t+1 −1 < bt+1 Knoten erreichen. n 6 1 + b + ... + bt = b b−1 Also folgt bt+1 > n und damit t > logb n − 1. Die Tiefe ist am größten, wenn die Wurzel zwei Kinder und jeder innere Knoten a Kinder besitzt. I Wir erhalten also in Tiefe t mindestens n > 1 + 2(1 + ... + at−1 ) AVL-Bäume (a, b)-Bäume 36 / 74 Die Tiefe von (a, b)-Bäumen T sei ein (a, b)-Baum mit n Knoten. Dann gilt für Tiefe(T ) > 2: logb (n) − 1 < Tiefe(T ) < loga ( n−1 ) + 1. 2 Die Tiefe ist minimal, wenn jeder Knoten genau b Kinder hat. I I In Tiefe t können wir damit höchstens t+1 −1 < bt+1 Knoten erreichen. n 6 1 + b + ... + bt = b b−1 Also folgt bt+1 > n und damit t > logb n − 1. Die Tiefe ist am größten, wenn die Wurzel zwei Kinder und jeder innere Knoten a Kinder besitzt. I Wir erhalten also in Tiefe t mindestens t −1 n > 1 + 2(1 + ... + at−1 ) = 1 + 2 · aa−1 Knoten. AVL-Bäume (a, b)-Bäume 36 / 74 Die Tiefe von (a, b)-Bäumen T sei ein (a, b)-Baum mit n Knoten. Dann gilt für Tiefe(T ) > 2: logb (n) − 1 < Tiefe(T ) < loga ( n−1 ) + 1. 2 Die Tiefe ist minimal, wenn jeder Knoten genau b Kinder hat. I I In Tiefe t können wir damit höchstens t+1 −1 < bt+1 Knoten erreichen. n 6 1 + b + ... + bt = b b−1 Also folgt bt+1 > n und damit t > logb n − 1. Die Tiefe ist am größten, wenn die Wurzel zwei Kinder und jeder innere Knoten a Kinder besitzt. I Wir erhalten also in Tiefe t mindestens t −1 n > 1 + 2(1 + ... + at−1 ) = 1 + 2 · aa−1 Knoten. Also folgt n > 1 + 2 · AVL-Bäume at −1 a−1 , (a, b)-Bäume 36 / 74 Die Tiefe von (a, b)-Bäumen T sei ein (a, b)-Baum mit n Knoten. Dann gilt für Tiefe(T ) > 2: logb (n) − 1 < Tiefe(T ) < loga ( n−1 ) + 1. 2 Die Tiefe ist minimal, wenn jeder Knoten genau b Kinder hat. I I In Tiefe t können wir damit höchstens t+1 −1 < bt+1 Knoten erreichen. n 6 1 + b + ... + bt = b b−1 Also folgt bt+1 > n und damit t > logb n − 1. Die Tiefe ist am größten, wenn die Wurzel zwei Kinder und jeder innere Knoten a Kinder besitzt. I Wir erhalten also in Tiefe t mindestens t −1 n > 1 + 2(1 + ... + at−1 ) = 1 + 2 · aa−1 Knoten. Also folgt n > 1 + 2 · AVL-Bäume at −1 a−1 , beziehungsweise (a, b)-Bäume at −1 a−1 6 n−1 2 . 36 / 74 Die Tiefe von (a, b)-Bäumen T sei ein (a, b)-Baum mit n Knoten. Dann gilt für Tiefe(T ) > 2: logb (n) − 1 < Tiefe(T ) < loga ( n−1 ) + 1. 2 Die Tiefe ist minimal, wenn jeder Knoten genau b Kinder hat. I I In Tiefe t können wir damit höchstens t+1 −1 < bt+1 Knoten erreichen. n 6 1 + b + ... + bt = b b−1 Also folgt bt+1 > n und damit t > logb n − 1. Die Tiefe ist am größten, wenn die Wurzel zwei Kinder und jeder innere Knoten a Kinder besitzt. I Wir erhalten also in Tiefe t mindestens t −1 n > 1 + 2(1 + ... + at−1 ) = 1 + 2 · aa−1 Knoten. Also folgt n > 1 + 2 · Aber at−1 < AVL-Bäume at −1 a−1 at −1 a−1 , beziehungsweise at −1 a−1 6 n−1 2 . gilt für t > 2 (a, b)-Bäume 36 / 74 Die Tiefe von (a, b)-Bäumen T sei ein (a, b)-Baum mit n Knoten. Dann gilt für Tiefe(T ) > 2: logb (n) − 1 < Tiefe(T ) < loga ( n−1 ) + 1. 2 Die Tiefe ist minimal, wenn jeder Knoten genau b Kinder hat. I I In Tiefe t können wir damit höchstens t+1 −1 < bt+1 Knoten erreichen. n 6 1 + b + ... + bt = b b−1 Also folgt bt+1 > n und damit t > logb n − 1. Die Tiefe ist am größten, wenn die Wurzel zwei Kinder und jeder innere Knoten a Kinder besitzt. I Wir erhalten also in Tiefe t mindestens t −1 n > 1 + 2(1 + ... + at−1 ) = 1 + 2 · aa−1 Knoten. Also folgt n > 1 + 2 · Aber at−1 < AVL-Bäume at −1 a−1 at −1 a−1 , beziehungsweise at −1 a−1 gilt für t > 2 und deshalb t < (a, b)-Bäume n−1 2 . n−1 loga 2 6 + 1. 36 / 74 Lookup(x) Benutze die den inneren Knoten zugeordneten Schlüssel, um den Schlüssel x zu lokalisieren. (a, b)-Bäume Lookup 37 / 74 Lookup(x) Benutze die den inneren Knoten zugeordneten Schlüssel, um den Schlüssel x zu lokalisieren. Es genügen Tiefe(T ) + 1 < loga (a, b)-Bäume n−1 2 Lookup + 2 Speicherzugriffe. 37 / 74 Lookup(x) Benutze die den inneren Knoten zugeordneten Schlüssel, um den Schlüssel x zu lokalisieren. Es genügen Tiefe(T ) + 1 < loga I n−1 2 + 2 Speicherzugriffe. Zum Beispiel: Wähle a als ein Megabyte und n als ein Terabyte. Also a = 106 und n = 1012 . (a, b)-Bäume Lookup 37 / 74 Lookup(x) Benutze die den inneren Knoten zugeordneten Schlüssel, um den Schlüssel x zu lokalisieren. Es genügen Tiefe(T ) + 1 < loga I n−1 2 + 2 Speicherzugriffe. Zum Beispiel: Wähle a als ein Megabyte und n als ein Terabyte. Also a = 106 und n = 1012 . I Dann genügen weniger als log106 1012 + 2 Zugriffe und damit reichen (a, b)-Bäume Lookup 37 / 74 Lookup(x) Benutze die den inneren Knoten zugeordneten Schlüssel, um den Schlüssel x zu lokalisieren. Es genügen Tiefe(T ) + 1 < loga I n−1 2 + 2 Speicherzugriffe. Zum Beispiel: Wähle a als ein Megabyte und n als ein Terabyte. Also a = 106 und n = 1012 . I Dann genügen weniger als log106 1012 + 2 Zugriffe und damit reichen drei Speicherzugriffe. (a, b)-Bäume Lookup 37 / 74 Lookup(x) Benutze die den inneren Knoten zugeordneten Schlüssel, um den Schlüssel x zu lokalisieren. Es genügen Tiefe(T ) + 1 < loga I n−1 2 + 2 Speicherzugriffe. Zum Beispiel: Wähle a als ein Megabyte und n als ein Terabyte. Also a = 106 und n = 1012 . I I Dann genügen weniger als log106 1012 + 2 Zugriffe und damit reichen drei Speicherzugriffe. Wenn n ein Petabyte (n = 1015 ) ist, dann reichen (a, b)-Bäume Lookup 37 / 74 Lookup(x) Benutze die den inneren Knoten zugeordneten Schlüssel, um den Schlüssel x zu lokalisieren. Es genügen Tiefe(T ) + 1 < loga I n−1 2 + 2 Speicherzugriffe. Zum Beispiel: Wähle a als ein Megabyte und n als ein Terabyte. Also a = 106 und n = 1012 . I I Dann genügen weniger als log106 1012 + 2 Zugriffe und damit reichen drei Speicherzugriffe. Wenn n ein Petabyte (n = 1015 ) ist, dann reichen vier Zugriffe. (a, b)-Bäume Lookup 37 / 74 Lookup(x) Benutze die den inneren Knoten zugeordneten Schlüssel, um den Schlüssel x zu lokalisieren. Es genügen Tiefe(T ) + 1 < loga I n−1 2 + 2 Speicherzugriffe. Zum Beispiel: Wähle a als ein Megabyte und n als ein Terabyte. Also a = 106 und n = 1012 . I I Dann genügen weniger als log106 1012 + 2 Zugriffe und damit reichen drei Speicherzugriffe. Wenn n ein Petabyte (n = 1015 ) ist, dann reichen vier Zugriffe. Dasselbe gilt sogar für ein Exabyte (n = 1018 ). (a, b)-Bäume Lookup 37 / 74 Lookup(x) Benutze die den inneren Knoten zugeordneten Schlüssel, um den Schlüssel x zu lokalisieren. Es genügen Tiefe(T ) + 1 < loga I n−1 2 + 2 Speicherzugriffe. Zum Beispiel: Wähle a als ein Megabyte und n als ein Terabyte. Also a = 106 und n = 1012 . I I Dann genügen weniger als log106 1012 + 2 Zugriffe und damit reichen drei Speicherzugriffe. Wenn n ein Petabyte (n = 1015 ) ist, dann reichen vier Zugriffe. Dasselbe gilt sogar für ein Exabyte (n = 1018 ). Für die lookup Operation in einem (a, b)-Baum mit n Schlüsseln genügen weniger als loga n−1 2 + 2 Speicherzugriffe. (a, b)-Bäume Lookup 37 / 74 Insert(x) Zuerst suche nach x. 1 Wenn x gefunden wird, dann überschreibe den Info-Teil, ansonsten endet die Suche in einem Blatt v . (a, b)-Bäume Insert 38 / 74 Insert(x) Zuerst suche nach x. 1 Wenn x gefunden wird, dann überschreibe den Info-Teil, ansonsten endet die Suche in einem Blatt v . 2 Füge x in die sortierte Folge der Schlüssel von v ein. (a, b)-Bäume Insert 38 / 74 Insert(x) Zuerst suche nach x. 1 Wenn x gefunden wird, dann überschreibe den Info-Teil, ansonsten endet die Suche in einem Blatt v . 2 Füge x in die sortierte Folge der Schlüssel von v ein. Fall 1: v hat jetzt höchstens b − 1 Schlüssel. Wir sind fertig, da die (a, b)-Eigenschaft erfüllt ist. (a, b)-Bäume Insert 38 / 74 Insert(x) Zuerst suche nach x. 1 Wenn x gefunden wird, dann überschreibe den Info-Teil, ansonsten endet die Suche in einem Blatt v . 2 Füge x in die sortierte Folge der Schlüssel von v ein. Fall 1: v hat jetzt höchstens b − 1 Schlüssel. Wir sind fertig, da die (a, b)-Eigenschaft erfüllt ist. Fall 2: v hat jetzt b Schlüssel x1 < ... < xb : Die (a, b)-Eigenschaft ist verletzt. (a, b)-Bäume Insert 38 / 74 Insert(x) Zuerst suche nach x. 1 Wenn x gefunden wird, dann überschreibe den Info-Teil, ansonsten endet die Suche in einem Blatt v . 2 Füge x in die sortierte Folge der Schlüssel von v ein. Fall 1: v hat jetzt höchstens b − 1 Schlüssel. Wir sind fertig, da die (a, b)-Eigenschaft erfüllt ist. Fall 2: v hat jetzt b Schlüssel x1 < ... < xb : Die (a, b)-Eigenschaft ist verletzt. I Ersetze v durch zwei Knoten vlinks (mit den Schlüsseln x1 , . . . , xdb/2e−1 ) und vrechts (mit den Schlüsseln xdb/2e+1 , . . . , xb ). (a, b)-Bäume Insert 38 / 74 Insert(x) Zuerst suche nach x. 1 Wenn x gefunden wird, dann überschreibe den Info-Teil, ansonsten endet die Suche in einem Blatt v . 2 Füge x in die sortierte Folge der Schlüssel von v ein. Fall 1: v hat jetzt höchstens b − 1 Schlüssel. Wir sind fertig, da die (a, b)-Eigenschaft erfüllt ist. Fall 2: v hat jetzt b Schlüssel x1 < ... < xb : Die (a, b)-Eigenschaft ist verletzt. I Ersetze v durch zwei Knoten vlinks (mit den Schlüsseln x1 , . . . , xdb/2e−1 ) und vrechts (mit den Schlüsseln xdb/2e+1 , . . . , xb ). I Es ist 2a − 1 6 b. (a, b)-Bäume Insert 38 / 74 Insert(x) Zuerst suche nach x. 1 Wenn x gefunden wird, dann überschreibe den Info-Teil, ansonsten endet die Suche in einem Blatt v . 2 Füge x in die sortierte Folge der Schlüssel von v ein. Fall 1: v hat jetzt höchstens b − 1 Schlüssel. Wir sind fertig, da die (a, b)-Eigenschaft erfüllt ist. Fall 2: v hat jetzt b Schlüssel x1 < ... < xb : Die (a, b)-Eigenschaft ist verletzt. I I Ersetze v durch zwei Knoten vlinks (mit den Schlüsseln x1 , . . . , xdb/2e−1 ) und vrechts (mit den Schlüsseln xdb/2e+1 , . . . , xb ). Es ist 2a − 1 6 b. Also a − 1 6 b b+1 2 c−1 (a, b)-Bäume Insert 38 / 74 Insert(x) Zuerst suche nach x. 1 Wenn x gefunden wird, dann überschreibe den Info-Teil, ansonsten endet die Suche in einem Blatt v . 2 Füge x in die sortierte Folge der Schlüssel von v ein. Fall 1: v hat jetzt höchstens b − 1 Schlüssel. Wir sind fertig, da die (a, b)-Eigenschaft erfüllt ist. Fall 2: v hat jetzt b Schlüssel x1 < ... < xb : Die (a, b)-Eigenschaft ist verletzt. I I Ersetze v durch zwei Knoten vlinks (mit den Schlüsseln x1 , . . . , xdb/2e−1 ) und vrechts (mit den Schlüsseln xdb/2e+1 , . . . , xb ). b Es ist 2a − 1 6 b. Also a − 1 6 b b+1 2 c − 1 = d2e − 1 (a, b)-Bäume Insert 38 / 74 Insert(x) Zuerst suche nach x. 1 Wenn x gefunden wird, dann überschreibe den Info-Teil, ansonsten endet die Suche in einem Blatt v . 2 Füge x in die sortierte Folge der Schlüssel von v ein. Fall 1: v hat jetzt höchstens b − 1 Schlüssel. Wir sind fertig, da die (a, b)-Eigenschaft erfüllt ist. Fall 2: v hat jetzt b Schlüssel x1 < ... < xb : Die (a, b)-Eigenschaft ist verletzt. I I Ersetze v durch zwei Knoten vlinks (mit den Schlüsseln x1 , . . . , xdb/2e−1 ) und vrechts (mit den Schlüsseln xdb/2e+1 , . . . , xb ). b b Es ist 2a − 1 6 b. Also a − 1 6 b b+1 2 c − 1 = d 2 e − 1 6 b 2 c: (a, b)-Bäume Insert 38 / 74 Insert(x) Zuerst suche nach x. 1 Wenn x gefunden wird, dann überschreibe den Info-Teil, ansonsten endet die Suche in einem Blatt v . 2 Füge x in die sortierte Folge der Schlüssel von v ein. Fall 1: v hat jetzt höchstens b − 1 Schlüssel. Wir sind fertig, da die (a, b)-Eigenschaft erfüllt ist. Fall 2: v hat jetzt b Schlüssel x1 < ... < xb : Die (a, b)-Eigenschaft ist verletzt. I I Ersetze v durch zwei Knoten vlinks (mit den Schlüsseln x1 , . . . , xdb/2e−1 ) und vrechts (mit den Schlüsseln xdb/2e+1 , . . . , xb ). b b Es ist 2a − 1 6 b. Also a − 1 6 b b+1 2 c − 1 = d 2 e − 1 6 b 2 c: vlinks , vrechts besitzen die notwendige Mindestzahl von Schlüsseln. (a, b)-Bäume Insert 38 / 74 Insert(x) Zuerst suche nach x. 1 Wenn x gefunden wird, dann überschreibe den Info-Teil, ansonsten endet die Suche in einem Blatt v . 2 Füge x in die sortierte Folge der Schlüssel von v ein. Fall 1: v hat jetzt höchstens b − 1 Schlüssel. Wir sind fertig, da die (a, b)-Eigenschaft erfüllt ist. Fall 2: v hat jetzt b Schlüssel x1 < ... < xb : Die (a, b)-Eigenschaft ist verletzt. I I I Ersetze v durch zwei Knoten vlinks (mit den Schlüsseln x1 , . . . , xdb/2e−1 ) und vrechts (mit den Schlüsseln xdb/2e+1 , . . . , xb ). b b Es ist 2a − 1 6 b. Also a − 1 6 b b+1 2 c − 1 = d 2 e − 1 6 b 2 c: vlinks , vrechts besitzen die notwendige Mindestzahl von Schlüsseln. Der Schlüssel xdb/2e unterscheidet zwischen vlinks und vrechts . Füge xdb/2e rekursiv im Elternknoten von v ein. (a, b)-Bäume Insert 38 / 74 Wann erhöht sich die Tiefe des (a, b)-Baums? Wir fügen zuerst in einem Blatt ein, I I spalten dann ggf. die Schlüssel unter zwei neuen Knoten auf und fügen rekursiv einen trennenden Knoten beim Elternknoten ein. (a, b)-Bäume Insert 39 / 74 Wann erhöht sich die Tiefe des (a, b)-Baums? Wir fügen zuerst in einem Blatt ein, I I spalten dann ggf. die Schlüssel unter zwei neuen Knoten auf und fügen rekursiv einen trennenden Knoten beim Elternknoten ein. Wenn die Wurzel bereits b − 1 Schlüssel speichert und einen trennenden Schlüssel zusätzlich erhält, dann (a, b)-Bäume Insert 39 / 74 Wann erhöht sich die Tiefe des (a, b)-Baums? Wir fügen zuerst in einem Blatt ein, I I spalten dann ggf. die Schlüssel unter zwei neuen Knoten auf und fügen rekursiv einen trennenden Knoten beim Elternknoten ein. Wenn die Wurzel bereits b − 1 Schlüssel speichert und einen trennenden Schlüssel zusätzlich erhält, dann I I muss sie in zwei Knoten aufgespalten werden. Der trennende Schlüssel der beiden neuen Knoten wird zum einzigen Schlüssel der neuen Wurzel. (a, b)-Bäume Insert 39 / 74 Wann erhöht sich die Tiefe des (a, b)-Baums? Wir fügen zuerst in einem Blatt ein, I I spalten dann ggf. die Schlüssel unter zwei neuen Knoten auf und fügen rekursiv einen trennenden Knoten beim Elternknoten ein. Wenn die Wurzel bereits b − 1 Schlüssel speichert und einen trennenden Schlüssel zusätzlich erhält, dann I I muss sie in zwei Knoten aufgespalten werden. Der trennende Schlüssel der beiden neuen Knoten wird zum einzigen Schlüssel der neuen Wurzel. F Wir haben erlaubt, dass die Wurzel zwei oder mehr Kinder hat, um diesen Fall abzufangen. (a, b)-Bäume Insert 39 / 74 Wann erhöht sich die Tiefe des (a, b)-Baums? Wir fügen zuerst in einem Blatt ein, I I spalten dann ggf. die Schlüssel unter zwei neuen Knoten auf und fügen rekursiv einen trennenden Knoten beim Elternknoten ein. Wenn die Wurzel bereits b − 1 Schlüssel speichert und einen trennenden Schlüssel zusätzlich erhält, dann I I muss sie in zwei Knoten aufgespalten werden. Der trennende Schlüssel der beiden neuen Knoten wird zum einzigen Schlüssel der neuen Wurzel. F Wir haben erlaubt, dass die Wurzel zwei oder mehr Kinder hat, um diesen Fall abzufangen. Auch der Grund für die Bedingung 2 · a − 1 6 b ist klar: (a, b)-Bäume Insert 39 / 74 Wann erhöht sich die Tiefe des (a, b)-Baums? Wir fügen zuerst in einem Blatt ein, I I spalten dann ggf. die Schlüssel unter zwei neuen Knoten auf und fügen rekursiv einen trennenden Knoten beim Elternknoten ein. Wenn die Wurzel bereits b − 1 Schlüssel speichert und einen trennenden Schlüssel zusätzlich erhält, dann I I muss sie in zwei Knoten aufgespalten werden. Der trennende Schlüssel der beiden neuen Knoten wird zum einzigen Schlüssel der neuen Wurzel. F Wir haben erlaubt, dass die Wurzel zwei oder mehr Kinder hat, um diesen Fall abzufangen. Auch der Grund für die Bedingung 2 · a − 1 6 b ist klar: I Die Aufspaltung eines Knotens mit b Schlüsseln in zwei Knoten mit legaler Schlüsselzahl muss möglich sein. (a, b)-Bäume Insert 39 / 74 Remove(x) Zuerst müssen wir nach x suchen. Angenommen wir finden x in dem inneren Knoten v : (a, b)-Bäume Remove 40 / 74 Remove(x) Zuerst müssen wir nach x suchen. Angenommen wir finden x in dem inneren Knoten v : I I Wir suchen den kleinsten Schlüssel y mit x 6 y . y befindet sich (a, b)-Bäume Remove 40 / 74 Remove(x) Zuerst müssen wir nach x suchen. Angenommen wir finden x in dem inneren Knoten v : I I Wir suchen den kleinsten Schlüssel y mit x 6 y . y befindet sich im linkesten Blatt b des entsprechenden Teilbaums von v . Wir ersetzen den Schlüssel x in v durch y . (a, b)-Bäume Remove 40 / 74 Remove(x) Zuerst müssen wir nach x suchen. Angenommen wir finden x in dem inneren Knoten v : I I Wir suchen den kleinsten Schlüssel y mit x 6 y . y befindet sich im linkesten Blatt b des entsprechenden Teilbaums von v . Wir ersetzen den Schlüssel x in v durch y . Setze v = b und entferne x: Das Blatt v verliert einen Schlüssel. (a, b)-Bäume Remove 40 / 74 Remove(x) Zuerst müssen wir nach x suchen. Angenommen wir finden x in dem inneren Knoten v : I I Wir suchen den kleinsten Schlüssel y mit x 6 y . y befindet sich im linkesten Blatt b des entsprechenden Teilbaums von v . Wir ersetzen den Schlüssel x in v durch y . Setze v = b und entferne x: Das Blatt v verliert einen Schlüssel. Fall 1: v hat jetzt mindestens a − 1 Schlüssel. Wir sind fertig, da die (a, b)-Eigenschaft erfüllt ist. (a, b)-Bäume Remove 40 / 74 Remove(x) Zuerst müssen wir nach x suchen. Angenommen wir finden x in dem inneren Knoten v : I I Wir suchen den kleinsten Schlüssel y mit x 6 y . y befindet sich im linkesten Blatt b des entsprechenden Teilbaums von v . Wir ersetzen den Schlüssel x in v durch y . Setze v = b und entferne x: Das Blatt v verliert einen Schlüssel. Fall 1: v hat jetzt mindestens a − 1 Schlüssel. Wir sind fertig, da die (a, b)-Eigenschaft erfüllt ist. Fall 2: v hat jetzt a − 2 Schlüssel. (a, b)-Bäume Remove 40 / 74 Remove(x) Zuerst müssen wir nach x suchen. Angenommen wir finden x in dem inneren Knoten v : I I Wir suchen den kleinsten Schlüssel y mit x 6 y . y befindet sich im linkesten Blatt b des entsprechenden Teilbaums von v . Wir ersetzen den Schlüssel x in v durch y . Setze v = b und entferne x: Das Blatt v verliert einen Schlüssel. Fall 1: v hat jetzt mindestens a − 1 Schlüssel. Wir sind fertig, da die (a, b)-Eigenschaft erfüllt ist. Fall 2: v hat jetzt a − 2 Schlüssel. 1 Zuerst begibt sich Knoten v auf „Schlüsselklau“ und stiebitzt, wenn möglich, einen Schlüssel von seinem Elternknoten. (a, b)-Bäume Remove 40 / 74 Remove(x) Zuerst müssen wir nach x suchen. Angenommen wir finden x in dem inneren Knoten v : I I Wir suchen den kleinsten Schlüssel y mit x 6 y . y befindet sich im linkesten Blatt b des entsprechenden Teilbaums von v . Wir ersetzen den Schlüssel x in v durch y . Setze v = b und entferne x: Das Blatt v verliert einen Schlüssel. Fall 1: v hat jetzt mindestens a − 1 Schlüssel. Wir sind fertig, da die (a, b)-Eigenschaft erfüllt ist. Fall 2: v hat jetzt a − 2 Schlüssel. 1 2 Zuerst begibt sich Knoten v auf „Schlüsselklau“ und stiebitzt, wenn möglich, einen Schlüssel von seinem Elternknoten. Sollte dies nicht möglich sein, wird v mit einem Geschwisterknoten fusioniert. (a, b)-Bäume Remove 40 / 74 Schlüsselklau und Fusion Der Knoten v habe die Schlüssel x1 < · · · < xa−2 . (a, b)-Bäume Remove 41 / 74 Schlüsselklau und Fusion Der Knoten v habe die Schlüssel x1 < · · · < xa−2 . Fall 2.1: Der linke oder rechte Geschwisterknoten hat mindestens a Schlüssel. (a, b)-Bäume Remove 41 / 74 Schlüsselklau und Fusion Der Knoten v habe die Schlüssel x1 < · · · < xa−2 . Fall 2.1: Der linke oder rechte Geschwisterknoten hat mindestens a Schlüssel. I Der linke Geschwisterknoten v 0 habe z.B. die Schlüssel y1 < · · · < ya < · · · < yk 0 . (a, b)-Bäume Remove 41 / 74 Schlüsselklau und Fusion Der Knoten v habe die Schlüssel x1 < · · · < xa−2 . Fall 2.1: Der linke oder rechte Geschwisterknoten hat mindestens a Schlüssel. I I Der linke Geschwisterknoten v 0 habe z.B. die Schlüssel y1 < · · · < ya < · · · < yk 0 . Der Schlüssel z des Elternknotens trenne v 0 und v , also yk 0 < z < x1 . (a, b)-Bäume Remove 41 / 74 Schlüsselklau und Fusion Der Knoten v habe die Schlüssel x1 < · · · < xa−2 . Fall 2.1: Der linke oder rechte Geschwisterknoten hat mindestens a Schlüssel. I I Der linke Geschwisterknoten v 0 habe z.B. die Schlüssel y1 < · · · < ya < · · · < yk 0 . Der Schlüssel z des Elternknotens trenne v 0 und v , also yk 0 < z < x1 . 1 v klaut z und hat damit a − 1 Schlüssel. (a, b)-Bäume Remove 41 / 74 Schlüsselklau und Fusion Der Knoten v habe die Schlüssel x1 < · · · < xa−2 . Fall 2.1: Der linke oder rechte Geschwisterknoten hat mindestens a Schlüssel. I I Der linke Geschwisterknoten v 0 habe z.B. die Schlüssel y1 < · · · < ya < · · · < yk 0 . Der Schlüssel z des Elternknotens trenne v 0 und v , also yk 0 < z < x1 . 1 2 v klaut z und hat damit a − 1 Schlüssel. Schlüssel z wird durch Schlüssel yk 0 ersetzt. Fertig! (a, b)-Bäume Remove 41 / 74 Schlüsselklau und Fusion Der Knoten v habe die Schlüssel x1 < · · · < xa−2 . Fall 2.1: Der linke oder rechte Geschwisterknoten hat mindestens a Schlüssel. I I Der linke Geschwisterknoten v 0 habe z.B. die Schlüssel y1 < · · · < ya < · · · < yk 0 . Der Schlüssel z des Elternknotens trenne v 0 und v , also yk 0 < z < x1 . 1 2 v klaut z und hat damit a − 1 Schlüssel. Schlüssel z wird durch Schlüssel yk 0 ersetzt. Fertig! Fall 2.2: Beide Geschwisterknoten besitzen nur a − 1 Schlüssel. (a, b)-Bäume Remove 41 / 74 Schlüsselklau und Fusion Der Knoten v habe die Schlüssel x1 < · · · < xa−2 . Fall 2.1: Der linke oder rechte Geschwisterknoten hat mindestens a Schlüssel. I I Der linke Geschwisterknoten v 0 habe z.B. die Schlüssel y1 < · · · < ya < · · · < yk 0 . Der Schlüssel z des Elternknotens trenne v 0 und v , also yk 0 < z < x1 . 1 2 v klaut z und hat damit a − 1 Schlüssel. Schlüssel z wird durch Schlüssel yk 0 ersetzt. Fertig! Fall 2.2: Beide Geschwisterknoten besitzen nur a − 1 Schlüssel. I Der linke Geschwisterknoten v 0 hat die a − 1 Schlüssel y1 < · · · < ya−1 . (a, b)-Bäume Remove 41 / 74 Schlüsselklau und Fusion Der Knoten v habe die Schlüssel x1 < · · · < xa−2 . Fall 2.1: Der linke oder rechte Geschwisterknoten hat mindestens a Schlüssel. I I Der linke Geschwisterknoten v 0 habe z.B. die Schlüssel y1 < · · · < ya < · · · < yk 0 . Der Schlüssel z des Elternknotens trenne v 0 und v , also yk 0 < z < x1 . 1 2 v klaut z und hat damit a − 1 Schlüssel. Schlüssel z wird durch Schlüssel yk 0 ersetzt. Fertig! Fall 2.2: Beide Geschwisterknoten besitzen nur a − 1 Schlüssel. I Der linke Geschwisterknoten v 0 hat die a − 1 Schlüssel y1 < · · · < ya−1 . Verschmelze v 0 und v . (a, b)-Bäume Remove 41 / 74 Schlüsselklau und Fusion Der Knoten v habe die Schlüssel x1 < · · · < xa−2 . Fall 2.1: Der linke oder rechte Geschwisterknoten hat mindestens a Schlüssel. I I Der linke Geschwisterknoten v 0 habe z.B. die Schlüssel y1 < · · · < ya < · · · < yk 0 . Der Schlüssel z des Elternknotens trenne v 0 und v , also yk 0 < z < x1 . 1 2 v klaut z und hat damit a − 1 Schlüssel. Schlüssel z wird durch Schlüssel yk 0 ersetzt. Fertig! Fall 2.2: Beide Geschwisterknoten besitzen nur a − 1 Schlüssel. I I Der linke Geschwisterknoten v 0 hat die a − 1 Schlüssel y1 < · · · < ya−1 . Verschmelze v 0 und v . Der bisher trennende Schlüssel z des Elternknotens ist einzufügen (a, b)-Bäume Remove 41 / 74 Schlüsselklau und Fusion Der Knoten v habe die Schlüssel x1 < · · · < xa−2 . Fall 2.1: Der linke oder rechte Geschwisterknoten hat mindestens a Schlüssel. I I Der linke Geschwisterknoten v 0 habe z.B. die Schlüssel y1 < · · · < ya < · · · < yk 0 . Der Schlüssel z des Elternknotens trenne v 0 und v , also yk 0 < z < x1 . 1 2 v klaut z und hat damit a − 1 Schlüssel. Schlüssel z wird durch Schlüssel yk 0 ersetzt. Fertig! Fall 2.2: Beide Geschwisterknoten besitzen nur a − 1 Schlüssel. I I Der linke Geschwisterknoten v 0 hat die a − 1 Schlüssel y1 < · · · < ya−1 . Verschmelze v 0 und v . Der bisher trennende Schlüssel z des Elternknotens ist einzufügen 1 Der fusionierte Knoten hat a − 1 (a, b)-Bäume Remove 41 / 74 Schlüsselklau und Fusion Der Knoten v habe die Schlüssel x1 < · · · < xa−2 . Fall 2.1: Der linke oder rechte Geschwisterknoten hat mindestens a Schlüssel. I I Der linke Geschwisterknoten v 0 habe z.B. die Schlüssel y1 < · · · < ya < · · · < yk 0 . Der Schlüssel z des Elternknotens trenne v 0 und v , also yk 0 < z < x1 . 1 2 v klaut z und hat damit a − 1 Schlüssel. Schlüssel z wird durch Schlüssel yk 0 ersetzt. Fertig! Fall 2.2: Beide Geschwisterknoten besitzen nur a − 1 Schlüssel. I I Der linke Geschwisterknoten v 0 hat die a − 1 Schlüssel y1 < · · · < ya−1 . Verschmelze v 0 und v . Der bisher trennende Schlüssel z des Elternknotens ist einzufügen 1 Der fusionierte Knoten hat a − 1 + a − 2 (a, b)-Bäume Remove 41 / 74 Schlüsselklau und Fusion Der Knoten v habe die Schlüssel x1 < · · · < xa−2 . Fall 2.1: Der linke oder rechte Geschwisterknoten hat mindestens a Schlüssel. I I Der linke Geschwisterknoten v 0 habe z.B. die Schlüssel y1 < · · · < ya < · · · < yk 0 . Der Schlüssel z des Elternknotens trenne v 0 und v , also yk 0 < z < x1 . 1 2 v klaut z und hat damit a − 1 Schlüssel. Schlüssel z wird durch Schlüssel yk 0 ersetzt. Fertig! Fall 2.2: Beide Geschwisterknoten besitzen nur a − 1 Schlüssel. I I Der linke Geschwisterknoten v 0 hat die a − 1 Schlüssel y1 < · · · < ya−1 . Verschmelze v 0 und v . Der bisher trennende Schlüssel z des Elternknotens ist einzufügen 1 Der fusionierte Knoten hat a − 1 + a − 2 + 1 (a, b)-Bäume Remove 41 / 74 Schlüsselklau und Fusion Der Knoten v habe die Schlüssel x1 < · · · < xa−2 . Fall 2.1: Der linke oder rechte Geschwisterknoten hat mindestens a Schlüssel. I I Der linke Geschwisterknoten v 0 habe z.B. die Schlüssel y1 < · · · < ya < · · · < yk 0 . Der Schlüssel z des Elternknotens trenne v 0 und v , also yk 0 < z < x1 . 1 2 v klaut z und hat damit a − 1 Schlüssel. Schlüssel z wird durch Schlüssel yk 0 ersetzt. Fertig! Fall 2.2: Beide Geschwisterknoten besitzen nur a − 1 Schlüssel. I I Der linke Geschwisterknoten v 0 hat die a − 1 Schlüssel y1 < · · · < ya−1 . Verschmelze v 0 und v . Der bisher trennende Schlüssel z des Elternknotens ist einzufügen 1 Der fusionierte Knoten hat a − 1 + a − 2 + 1 = 2a − 2 (a, b)-Bäume Remove 41 / 74 Schlüsselklau und Fusion Der Knoten v habe die Schlüssel x1 < · · · < xa−2 . Fall 2.1: Der linke oder rechte Geschwisterknoten hat mindestens a Schlüssel. I I Der linke Geschwisterknoten v 0 habe z.B. die Schlüssel y1 < · · · < ya < · · · < yk 0 . Der Schlüssel z des Elternknotens trenne v 0 und v , also yk 0 < z < x1 . 1 2 v klaut z und hat damit a − 1 Schlüssel. Schlüssel z wird durch Schlüssel yk 0 ersetzt. Fertig! Fall 2.2: Beide Geschwisterknoten besitzen nur a − 1 Schlüssel. I I Der linke Geschwisterknoten v 0 hat die a − 1 Schlüssel y1 < · · · < ya−1 . Verschmelze v 0 und v . Der bisher trennende Schlüssel z des Elternknotens ist einzufügen 1 Der fusionierte Knoten hat a − 1 + a − 2 + 1 = 2a − 2 6 b − 1 Schlüssel und die Höchstanzahl wird nicht überschritten. (a, b)-Bäume Remove 41 / 74 Schlüsselklau und Fusion Der Knoten v habe die Schlüssel x1 < · · · < xa−2 . Fall 2.1: Der linke oder rechte Geschwisterknoten hat mindestens a Schlüssel. I I Der linke Geschwisterknoten v 0 habe z.B. die Schlüssel y1 < · · · < ya < · · · < yk 0 . Der Schlüssel z des Elternknotens trenne v 0 und v , also yk 0 < z < x1 . 1 2 v klaut z und hat damit a − 1 Schlüssel. Schlüssel z wird durch Schlüssel yk 0 ersetzt. Fertig! Fall 2.2: Beide Geschwisterknoten besitzen nur a − 1 Schlüssel. I I Der linke Geschwisterknoten v 0 hat die a − 1 Schlüssel y1 < · · · < ya−1 . Verschmelze v 0 und v . Der bisher trennende Schlüssel z des Elternknotens ist einzufügen 1 2 Der fusionierte Knoten hat a − 1 + a − 2 + 1 = 2a − 2 6 b − 1 Schlüssel und die Höchstanzahl wird nicht überschritten. Der Schlüssel z ist rekursiv aus dem Elternknoten zu entfernen. (a, b)-Bäume Remove 41 / 74 Schlüsselklau für innere Knoten Angenommen wir haben die Remove-Operation rekursiv ausgeführt und haben einen inneren Knoten v erreicht. (a, b)-Bäume Remove 42 / 74 Schlüsselklau für innere Knoten Angenommen wir haben die Remove-Operation rekursiv ausgeführt und haben einen inneren Knoten v erreicht. v habe einen Schlüssel durch Verschmelzung zweier Kinder verloren. (a, b)-Bäume Remove 42 / 74 Schlüsselklau für innere Knoten Angenommen wir haben die Remove-Operation rekursiv ausgeführt und haben einen inneren Knoten v erreicht. v habe einen Schlüssel durch Verschmelzung zweier Kinder verloren. Ein Geschwisterknoten von v speichere mindestens a Kinder. (a, b)-Bäume Remove 42 / 74 Schlüsselklau für innere Knoten Angenommen wir haben die Remove-Operation rekursiv ausgeführt und haben einen inneren Knoten v erreicht. v habe einen Schlüssel durch Verschmelzung zweier Kinder verloren. Ein Geschwisterknoten von v speichere mindestens a Kinder. Das Ergebnis des Schlüsselklaus für 2-3 Bäume: X v Y, Z A (a, b)-Bäume B C D Remove 42 / 74 Schlüsselklau für innere Knoten Angenommen wir haben die Remove-Operation rekursiv ausgeführt und haben einen inneren Knoten v erreicht. v habe einen Schlüssel durch Verschmelzung zweier Kinder verloren. Ein Geschwisterknoten von v speichere mindestens a Kinder. Das Ergebnis des Schlüsselklaus für 2-3 Bäume: Y X v v X Y, Z A (a, b)-Bäume B C A D Remove Z B C D 42 / 74 Zusammenfassung für (a, b)-Bäume Sei T ein (a, b)-Baum. Dann genügen (a, b)-Bäume Remove 43 / 74 Zusammenfassung für (a, b)-Bäume Sei T ein (a, b)-Baum. Dann genügen ∗ Tiefe(T ) + 1 Speicherzugriffe für eine lookup-Operation, (a, b)-Bäume Remove 43 / 74 Zusammenfassung für (a, b)-Bäume Sei T ein (a, b)-Baum. Dann genügen ∗ Tiefe(T ) + 1 Speicherzugriffe für eine lookup-Operation, ∗ 2· (Tiefe(T ) + 1) Speicherzugriffe für eine insert-Operation (a, b)-Bäume Remove 43 / 74 Zusammenfassung für (a, b)-Bäume Sei T ein (a, b)-Baum. Dann genügen ∗ Tiefe(T ) + 1 Speicherzugriffe für eine lookup-Operation, ∗ 2· (Tiefe(T ) + 1) Speicherzugriffe für eine insert-Operation ∗ und 4·(Tiefe(T ) + 1) Speicherzugriffe für eine remove-Operation. (a, b)-Bäume Remove 43 / 74 Zusammenfassung für (a, b)-Bäume Sei T ein (a, b)-Baum. Dann genügen ∗ Tiefe(T ) + 1 Speicherzugriffe für eine lookup-Operation, ∗ 2· (Tiefe(T ) + 1) Speicherzugriffe für eine insert-Operation ∗ und 4·(Tiefe(T ) + 1) Speicherzugriffe für eine remove-Operation. Beachte, dass Tiefe (T ) < loga ( n−1 2 ) + 1 für Bäume mit n Knoten gilt. (a, b)-Bäume Remove 43 / 74 Zusammenfassung für (a, b)-Bäume Sei T ein (a, b)-Baum. Dann genügen ∗ Tiefe(T ) + 1 Speicherzugriffe für eine lookup-Operation, ∗ 2· (Tiefe(T ) + 1) Speicherzugriffe für eine insert-Operation ∗ und 4·(Tiefe(T ) + 1) Speicherzugriffe für eine remove-Operation. Beachte, dass Tiefe (T ) < loga ( n−1 2 ) + 1 für Bäume mit n Knoten gilt. Lookup: (a, b)-Bäume Remove 43 / 74 Zusammenfassung für (a, b)-Bäume Sei T ein (a, b)-Baum. Dann genügen ∗ Tiefe(T ) + 1 Speicherzugriffe für eine lookup-Operation, ∗ 2· (Tiefe(T ) + 1) Speicherzugriffe für eine insert-Operation ∗ und 4·(Tiefe(T ) + 1) Speicherzugriffe für eine remove-Operation. Beachte, dass Tiefe (T ) < loga ( n−1 2 ) + 1 für Bäume mit n Knoten gilt. Lookup: Der Weg von der Wurzel zu einem Blatt besteht aus Tiefe(T ) + 1 Knoten. (a, b)-Bäume Remove 43 / 74 Zusammenfassung für (a, b)-Bäume Sei T ein (a, b)-Baum. Dann genügen ∗ Tiefe(T ) + 1 Speicherzugriffe für eine lookup-Operation, ∗ 2· (Tiefe(T ) + 1) Speicherzugriffe für eine insert-Operation ∗ und 4·(Tiefe(T ) + 1) Speicherzugriffe für eine remove-Operation. Beachte, dass Tiefe (T ) < loga ( n−1 2 ) + 1 für Bäume mit n Knoten gilt. Lookup: Der Weg von der Wurzel zu einem Blatt besteht aus Tiefe(T ) + 1 Knoten. Insert: (a, b)-Bäume Remove 43 / 74 Zusammenfassung für (a, b)-Bäume Sei T ein (a, b)-Baum. Dann genügen ∗ Tiefe(T ) + 1 Speicherzugriffe für eine lookup-Operation, ∗ 2· (Tiefe(T ) + 1) Speicherzugriffe für eine insert-Operation ∗ und 4·(Tiefe(T ) + 1) Speicherzugriffe für eine remove-Operation. Beachte, dass Tiefe (T ) < loga ( n−1 2 ) + 1 für Bäume mit n Knoten gilt. Lookup: Der Weg von der Wurzel zu einem Blatt besteht aus Tiefe(T ) + 1 Knoten. Insert: Die Knoten des Suchpfads werden zuerst gelesen und, wenn zu groß, aufgespalten. (a, b)-Bäume Remove 43 / 74 Zusammenfassung für (a, b)-Bäume Sei T ein (a, b)-Baum. Dann genügen ∗ Tiefe(T ) + 1 Speicherzugriffe für eine lookup-Operation, ∗ 2· (Tiefe(T ) + 1) Speicherzugriffe für eine insert-Operation ∗ und 4·(Tiefe(T ) + 1) Speicherzugriffe für eine remove-Operation. Beachte, dass Tiefe (T ) < loga ( n−1 2 ) + 1 für Bäume mit n Knoten gilt. Lookup: Der Weg von der Wurzel zu einem Blatt besteht aus Tiefe(T ) + 1 Knoten. Insert: Die Knoten des Suchpfads werden zuerst gelesen und, wenn zu groß, aufgespalten. Remove: (a, b)-Bäume Remove 43 / 74 Zusammenfassung für (a, b)-Bäume Sei T ein (a, b)-Baum. Dann genügen ∗ Tiefe(T ) + 1 Speicherzugriffe für eine lookup-Operation, ∗ 2· (Tiefe(T ) + 1) Speicherzugriffe für eine insert-Operation ∗ und 4·(Tiefe(T ) + 1) Speicherzugriffe für eine remove-Operation. Beachte, dass Tiefe (T ) < loga ( n−1 2 ) + 1 für Bäume mit n Knoten gilt. Lookup: Der Weg von der Wurzel zu einem Blatt besteht aus Tiefe(T ) + 1 Knoten. Insert: Die Knoten des Suchpfads werden zuerst gelesen und, wenn zu groß, aufgespalten. Remove: Tiefe(T ) + 1 Zugriffe genügen auf dem Weg nach unten (a, b)-Bäume Remove 43 / 74 Zusammenfassung für (a, b)-Bäume Sei T ein (a, b)-Baum. Dann genügen ∗ Tiefe(T ) + 1 Speicherzugriffe für eine lookup-Operation, ∗ 2· (Tiefe(T ) + 1) Speicherzugriffe für eine insert-Operation ∗ und 4·(Tiefe(T ) + 1) Speicherzugriffe für eine remove-Operation. Beachte, dass Tiefe (T ) < loga ( n−1 2 ) + 1 für Bäume mit n Knoten gilt. Lookup: Der Weg von der Wurzel zu einem Blatt besteht aus Tiefe(T ) + 1 Knoten. Insert: Die Knoten des Suchpfads werden zuerst gelesen und, wenn zu groß, aufgespalten. Remove: Tiefe(T ) + 1 Zugriffe genügen auf dem Weg nach unten und bis zu 3 Tiefe(T ) + 1 Zugriffe zurück auf dem Weg nach oben, (a, b)-Bäume Remove 43 / 74 Zusammenfassung für (a, b)-Bäume Sei T ein (a, b)-Baum. Dann genügen ∗ Tiefe(T ) + 1 Speicherzugriffe für eine lookup-Operation, ∗ 2· (Tiefe(T ) + 1) Speicherzugriffe für eine insert-Operation ∗ und 4·(Tiefe(T ) + 1) Speicherzugriffe für eine remove-Operation. Beachte, dass Tiefe (T ) < loga ( n−1 2 ) + 1 für Bäume mit n Knoten gilt. Lookup: Der Weg von der Wurzel zu einem Blatt besteht aus Tiefe(T ) + 1 Knoten. Insert: Die Knoten des Suchpfads werden zuerst gelesen und, wenn zu groß, aufgespalten. Remove: Tiefe(T ) + 1 Zugriffe genügen auf dem Weg nach unten und bis zu 3 Tiefe(T ) + 1 Zugriffe zurück auf dem Weg nach oben, I I nämlich das Schreiben des Knotens und das Lesen/Schreiben eines Geschwisterknotens. (a, b)-Bäume Remove 43 / 74 Hashing Hashing 44 / 74 Die Bitvektor-Datenstruktur Das Wörterbuchproblem wird einfacher, wenn die Menge U der möglicherweise einzufügenden Daten in den Hauptspeicher passt. Benutze die Bitvektor-Datenstruktur: Hashing 45 / 74 Die Bitvektor-Datenstruktur Das Wörterbuchproblem wird einfacher, wenn die Menge U der möglicherweise einzufügenden Daten in den Hauptspeicher passt. Benutze die Bitvektor-Datenstruktur: In einem booleschen Array wird für jedes Element u ∈ U in der Zelle f (u) vermerkt, ob u präsent ist. Bis auf die Berechnung von f (u) gelingt damit die Ausführung einer lookup-, insert- oder remove-Operation in konstanter Zeit! Hashing 45 / 74 Die Bitvektor-Datenstruktur Das Wörterbuchproblem wird einfacher, wenn die Menge U der möglicherweise einzufügenden Daten in den Hauptspeicher passt. Benutze die Bitvektor-Datenstruktur: In einem booleschen Array wird für jedes Element u ∈ U in der Zelle f (u) vermerkt, ob u präsent ist. Bis auf die Berechnung von f (u) gelingt damit die Ausführung einer lookup-, insert- oder remove-Operation in konstanter Zeit! Selbst bei einem kleinen Universum U ist aber die Bestimmung einer geeigneten Funktion f möglicherweise schwierig. Hashing 45 / 74 Die Bitvektor-Datenstruktur Das Wörterbuchproblem wird einfacher, wenn die Menge U der möglicherweise einzufügenden Daten in den Hauptspeicher passt. Benutze die Bitvektor-Datenstruktur: In einem booleschen Array wird für jedes Element u ∈ U in der Zelle f (u) vermerkt, ob u präsent ist. Bis auf die Berechnung von f (u) gelingt damit die Ausführung einer lookup-, insert- oder remove-Operation in konstanter Zeit! Selbst bei einem kleinen Universum U ist aber die Bestimmung einer geeigneten Funktion f möglicherweise schwierig. Zudem ist in praktischen Anwendungen im Allgemeinen das Universum der möglichen Schlüssel zu groß: Wenn Nachnamen als Schlüssel verwandt werden, und selbst wenn nur Nachnamen der Länge höchstens 10 auftreten, Hashing 45 / 74 Die Bitvektor-Datenstruktur Das Wörterbuchproblem wird einfacher, wenn die Menge U der möglicherweise einzufügenden Daten in den Hauptspeicher passt. Benutze die Bitvektor-Datenstruktur: In einem booleschen Array wird für jedes Element u ∈ U in der Zelle f (u) vermerkt, ob u präsent ist. Bis auf die Berechnung von f (u) gelingt damit die Ausführung einer lookup-, insert- oder remove-Operation in konstanter Zeit! Selbst bei einem kleinen Universum U ist aber die Bestimmung einer geeigneten Funktion f möglicherweise schwierig. Zudem ist in praktischen Anwendungen im Allgemeinen das Universum der möglichen Schlüssel zu groß: Wenn Nachnamen als Schlüssel verwandt werden, und selbst wenn nur Nachnamen der Länge höchstens 10 auftreten, gibt es 2610 Hashing 45 / 74 Die Bitvektor-Datenstruktur Das Wörterbuchproblem wird einfacher, wenn die Menge U der möglicherweise einzufügenden Daten in den Hauptspeicher passt. Benutze die Bitvektor-Datenstruktur: In einem booleschen Array wird für jedes Element u ∈ U in der Zelle f (u) vermerkt, ob u präsent ist. Bis auf die Berechnung von f (u) gelingt damit die Ausführung einer lookup-, insert- oder remove-Operation in konstanter Zeit! Selbst bei einem kleinen Universum U ist aber die Bestimmung einer geeigneten Funktion f möglicherweise schwierig. Zudem ist in praktischen Anwendungen im Allgemeinen das Universum der möglichen Schlüssel zu groß: Wenn Nachnamen als Schlüssel verwandt werden, und selbst wenn nur Nachnamen der Länge höchstens 10 auftreten, gibt es 2610 > 210 · 1010 Hashing 45 / 74 Die Bitvektor-Datenstruktur Das Wörterbuchproblem wird einfacher, wenn die Menge U der möglicherweise einzufügenden Daten in den Hauptspeicher passt. Benutze die Bitvektor-Datenstruktur: In einem booleschen Array wird für jedes Element u ∈ U in der Zelle f (u) vermerkt, ob u präsent ist. Bis auf die Berechnung von f (u) gelingt damit die Ausführung einer lookup-, insert- oder remove-Operation in konstanter Zeit! Selbst bei einem kleinen Universum U ist aber die Bestimmung einer geeigneten Funktion f möglicherweise schwierig. Zudem ist in praktischen Anwendungen im Allgemeinen das Universum der möglichen Schlüssel zu groß: Wenn Nachnamen als Schlüssel verwandt werden, und selbst wenn nur Nachnamen der Länge höchstens 10 auftreten, gibt es 2610 > 210 · 1010 > 103 · 1010 Hashing 45 / 74 Die Bitvektor-Datenstruktur Das Wörterbuchproblem wird einfacher, wenn die Menge U der möglicherweise einzufügenden Daten in den Hauptspeicher passt. Benutze die Bitvektor-Datenstruktur: In einem booleschen Array wird für jedes Element u ∈ U in der Zelle f (u) vermerkt, ob u präsent ist. Bis auf die Berechnung von f (u) gelingt damit die Ausführung einer lookup-, insert- oder remove-Operation in konstanter Zeit! Selbst bei einem kleinen Universum U ist aber die Bestimmung einer geeigneten Funktion f möglicherweise schwierig. Zudem ist in praktischen Anwendungen im Allgemeinen das Universum der möglichen Schlüssel zu groß: Wenn Nachnamen als Schlüssel verwandt werden, und selbst wenn nur Nachnamen der Länge höchstens 10 auftreten, gibt es 2610 > 210 · 1010 > 103 · 1010 = 1013 , also mehr als 10 Billionen mögliche Schlüssel! Hashing 45 / 74 Hashing Hashing gehört zu den Datenstrukturen mit der schnellsten erwarteten Laufzeit. Hashing 46 / 74 Hashing Hashing gehört zu den Datenstrukturen mit der schnellsten erwarteten Laufzeit. Sei U die Menge aller möglichen Schlüssel und sei m die Größe einer im Hauptspeicher abgespeichernten Hashtabelle. Hashing 46 / 74 Hashing Hashing gehört zu den Datenstrukturen mit der schnellsten erwarteten Laufzeit. Sei U die Menge aller möglichen Schlüssel und sei m die Größe einer im Hauptspeicher abgespeichernten Hashtabelle. Eine Funktion h : U → {0, 1, ..., m − 1} heißt eine Hashfunktion. Hashing 46 / 74 Hashing Hashing gehört zu den Datenstrukturen mit der schnellsten erwarteten Laufzeit. Sei U die Menge aller möglichen Schlüssel und sei m die Größe einer im Hauptspeicher abgespeichernten Hashtabelle. Eine Funktion h : U → {0, 1, ..., m − 1} heißt eine Hashfunktion. Zum Beispiel können wir insert (x, info) implementieren, indem wir I h(x) = i berechnen und Hashing 46 / 74 Hashing Hashing gehört zu den Datenstrukturen mit der schnellsten erwarteten Laufzeit. Sei U die Menge aller möglichen Schlüssel und sei m die Größe einer im Hauptspeicher abgespeichernten Hashtabelle. Eine Funktion h : U → {0, 1, ..., m − 1} heißt eine Hashfunktion. Zum Beispiel können wir insert (x, info) implementieren, indem wir I I h(x) = i berechnen und (x, info) in Zelle i der Tabelle eintragen. Hashing 46 / 74 Hashing Hashing gehört zu den Datenstrukturen mit der schnellsten erwarteten Laufzeit. Sei U die Menge aller möglichen Schlüssel und sei m die Größe einer im Hauptspeicher abgespeichernten Hashtabelle. Eine Funktion h : U → {0, 1, ..., m − 1} heißt eine Hashfunktion. Zum Beispiel können wir insert (x, info) implementieren, indem wir I I h(x) = i berechnen und (x, info) in Zelle i der Tabelle eintragen. Aber was passiert bei einer Kollision, wenn also Zelle i bereits besetzt ist? Hashing 46 / 74 Hashing Hashing gehört zu den Datenstrukturen mit der schnellsten erwarteten Laufzeit. Sei U die Menge aller möglichen Schlüssel und sei m die Größe einer im Hauptspeicher abgespeichernten Hashtabelle. Eine Funktion h : U → {0, 1, ..., m − 1} heißt eine Hashfunktion. Zum Beispiel können wir insert (x, info) implementieren, indem wir I I h(x) = i berechnen und (x, info) in Zelle i der Tabelle eintragen. Aber was passiert bei einer Kollision, wenn also Zelle i bereits besetzt ist? Wir beschreiben zwei Hashing-Verfahren, Hashing mit Verkettung und Hashing mit offener Adressierung. Hashing 46 / 74 Hashing mit Verkettung Hashing Hashing mit Verkettung 47 / 74 Hashing mit Verkettung Für jede Zelle i wird eine anfänglich leere Liste angelegt. Jede Liste wird sortiert gehalten. Hashing Hashing mit Verkettung 48 / 74 Hashing mit Verkettung Für jede Zelle i wird eine anfänglich leere Liste angelegt. Jede Liste wird sortiert gehalten. Für lookup(x): Hashing Hashing mit Verkettung 48 / 74 Hashing mit Verkettung Für jede Zelle i wird eine anfänglich leere Liste angelegt. Jede Liste wird sortiert gehalten. Für lookup(x): Durchlaufe die Liste von h(x). Hashing Hashing mit Verkettung 48 / 74 Hashing mit Verkettung Für jede Zelle i wird eine anfänglich leere Liste angelegt. Jede Liste wird sortiert gehalten. Für lookup(x): Durchlaufe die Liste von h(x). Für insert(x) und remove(x): Hashing Hashing mit Verkettung 48 / 74 Hashing mit Verkettung Für jede Zelle i wird eine anfänglich leere Liste angelegt. Jede Liste wird sortiert gehalten. Für lookup(x): Durchlaufe die Liste von h(x). Für insert(x) und remove(x): Führe die insert- und remove-Operation für einfach-verkettete Listen aus. Hashing Hashing mit Verkettung 48 / 74 Hashing mit Verkettung Für jede Zelle i wird eine anfänglich leere Liste angelegt. Jede Liste wird sortiert gehalten. Für lookup(x): Durchlaufe die Liste von h(x). Für insert(x) und remove(x): Führe die insert- und remove-Operation für einfach-verkettete Listen aus. Beispiel: Wähle h(x) = (x mod 11) als Hashfunktion. Die Operationen insert(59), insert(18) und insert(125) führen auf die Tabelle Hashing Hashing mit Verkettung 48 / 74 Hashing mit Verkettung Für jede Zelle i wird eine anfänglich leere Liste angelegt. Jede Liste wird sortiert gehalten. Für lookup(x): Durchlaufe die Liste von h(x). Für insert(x) und remove(x): Führe die insert- und remove-Operation für einfach-verkettete Listen aus. Beispiel: Wähle h(x) = (x mod 11) als Hashfunktion. Die Operationen insert(59), insert(18) und insert(125) führen auf die Tabelle 4 - 59 - 125 7 - 18 - Hashing - Hashing mit Verkettung 48 / 74 Hashing mit Verkettung Für jede Zelle i wird eine anfänglich leere Liste angelegt. Jede Liste wird sortiert gehalten. Für lookup(x): Durchlaufe die Liste von h(x). Für insert(x) und remove(x): Führe die insert- und remove-Operation für einfach-verkettete Listen aus. Beispiel: Wähle h(x) = (x mod 11) als Hashfunktion. Die Operationen insert(59), insert(18) und insert(125) führen auf die Tabelle 4 - 59 - 125 7 - 18 - - lookup (26) benötigt nur einen Suchschritt: Hashing Hashing mit Verkettung 48 / 74 Hashing mit Verkettung Für jede Zelle i wird eine anfänglich leere Liste angelegt. Jede Liste wird sortiert gehalten. Für lookup(x): Durchlaufe die Liste von h(x). Für insert(x) und remove(x): Führe die insert- und remove-Operation für einfach-verkettete Listen aus. Beispiel: Wähle h(x) = (x mod 11) als Hashfunktion. Die Operationen insert(59), insert(18) und insert(125) führen auf die Tabelle 4 - 59 - 125 7 - 18 - - lookup (26) benötigt nur einen Suchschritt: Schlüssel 59 wird gefunden und es wird geschlossen, dass 26 nicht präsent ist. Hashing Hashing mit Verkettung 48 / 74 Hashfunktionen Hashing Hashing mit Verkettung 49 / 74 Die Wahl der Hashfunktion Jeder Schlüssel x wird als Binärzahl dargestellt. Wir können also annehmen, dass x eine natürliche Zahl ist. Hashing Hashing mit Verkettung 50 / 74 Die Wahl der Hashfunktion Jeder Schlüssel x wird als Binärzahl dargestellt. Wir können also annehmen, dass x eine natürliche Zahl ist. Eine beliebte und gute Wahl ist h(x) = x mod m. Hashing Hashing mit Verkettung 50 / 74 Die Wahl der Hashfunktion Jeder Schlüssel x wird als Binärzahl dargestellt. Wir können also annehmen, dass x eine natürliche Zahl ist. Eine beliebte und gute Wahl ist h(x) = x mod m. I I h(x) kann schnell berechnet werden, aber die Wahl von m ist kritisch! Hashing Hashing mit Verkettung 50 / 74 Die Wahl der Hashfunktion Jeder Schlüssel x wird als Binärzahl dargestellt. Wir können also annehmen, dass x eine natürliche Zahl ist. Eine beliebte und gute Wahl ist h(x) = x mod m. I I h(x) kann schnell berechnet werden, aber die Wahl von m ist kritisch! Wenn m eine Zweierpotenz ist und wenn die Schlüssel Charakter-Strings sind, dann Hashing Hashing mit Verkettung 50 / 74 Die Wahl der Hashfunktion Jeder Schlüssel x wird als Binärzahl dargestellt. Wir können also annehmen, dass x eine natürliche Zahl ist. Eine beliebte und gute Wahl ist h(x) = x mod m. I I h(x) kann schnell berechnet werden, aber die Wahl von m ist kritisch! Wenn m eine Zweierpotenz ist und wenn die Schlüssel Charakter-Strings sind, dann werden alle Character-Strings mit gleicher Endung auf dieselbe Zelle gehasht. Hashing Hashing mit Verkettung 50 / 74 Die Wahl der Hashfunktion Jeder Schlüssel x wird als Binärzahl dargestellt. Wir können also annehmen, dass x eine natürliche Zahl ist. Eine beliebte und gute Wahl ist h(x) = x mod m. I I h(x) kann schnell berechnet werden, aber die Wahl von m ist kritisch! Wenn m eine Zweierpotenz ist und wenn die Schlüssel Charakter-Strings sind, dann werden alle Character-Strings mit gleicher Endung auf dieselbe Zelle gehasht. I I Häufig auftretende Endungen provozieren viele Kollisionen und damit lange Listen. Die Bearbeitungszeit der einzelnen Operationen wächst! Hashing Hashing mit Verkettung 50 / 74 Die Wahl der Hashfunktion Jeder Schlüssel x wird als Binärzahl dargestellt. Wir können also annehmen, dass x eine natürliche Zahl ist. Eine beliebte und gute Wahl ist h(x) = x mod m. I I h(x) kann schnell berechnet werden, aber die Wahl von m ist kritisch! Wenn m eine Zweierpotenz ist und wenn die Schlüssel Charakter-Strings sind, dann werden alle Character-Strings mit gleicher Endung auf dieselbe Zelle gehasht. I I Häufig auftretende Endungen provozieren viele Kollisionen und damit lange Listen. Die Bearbeitungszeit der einzelnen Operationen wächst! Wähle stattdessen Primzahlen mit großem Abstand zur nächsten Zweierpotenz. Hashing Hashing mit Verkettung 50 / 74 Hashing mit offener Adressierung, wir hashen direkt in die Hashtabelle Hashing Hashing mit offener Adressierung 51 / 74 Hashing mit offener Adressierung Wir arbeiten mit einer Folge h0 , ..., hm−1 : U → {0, ..., m − 1} von Hashfunktionen. Hashing Hashing mit offener Adressierung 52 / 74 Hashing mit offener Adressierung Wir arbeiten mit einer Folge h0 , ..., hm−1 : U → {0, ..., m − 1} von Hashfunktionen. Setze i = 0. (1) Wenn die Zelle hi (x) frei ist, dann füge x in Zelle hi (x) ein. Hashing Hashing mit offener Adressierung 52 / 74 Hashing mit offener Adressierung Wir arbeiten mit einer Folge h0 , ..., hm−1 : U → {0, ..., m − 1} von Hashfunktionen. Setze i = 0. (1) Wenn die Zelle hi (x) frei ist, dann füge x in Zelle hi (x) ein. (2) Ansonsten setze i = i + 1 und gehe zu Schritt (1). Hashing Hashing mit offener Adressierung 52 / 74 Hashing mit offener Adressierung Wir arbeiten mit einer Folge h0 , ..., hm−1 : U → {0, ..., m − 1} von Hashfunktionen. Setze i = 0. (1) Wenn die Zelle hi (x) frei ist, dann füge x in Zelle hi (x) ein. (2) Ansonsten setze i = i + 1 und gehe zu Schritt (1). Die Anzahl der Fehlversuche „sollte“ ansteigen, wenn λ zu groß wird. Was ist in einem solchen Fall zu tun? Hashing Hashing mit offener Adressierung 52 / 74 Hashing mit offener Adressierung Wir arbeiten mit einer Folge h0 , ..., hm−1 : U → {0, ..., m − 1} von Hashfunktionen. Setze i = 0. (1) Wenn die Zelle hi (x) frei ist, dann füge x in Zelle hi (x) ein. (2) Ansonsten setze i = i + 1 und gehe zu Schritt (1). Die Anzahl der Fehlversuche „sollte“ ansteigen, wenn λ zu groß wird. Was ist in einem solchen Fall zu tun? I Wenn der Auslastungsfaktor größer als 1/2 wird, dann lade die Tabelle in eine doppelt so große Tabelle. Hashing Hashing mit offener Adressierung 52 / 74 Hashing mit offener Adressierung Wir arbeiten mit einer Folge h0 , ..., hm−1 : U → {0, ..., m − 1} von Hashfunktionen. Setze i = 0. (1) Wenn die Zelle hi (x) frei ist, dann füge x in Zelle hi (x) ein. (2) Ansonsten setze i = i + 1 und gehe zu Schritt (1). Die Anzahl der Fehlversuche „sollte“ ansteigen, wenn λ zu groß wird. Was ist in einem solchen Fall zu tun? I I Wenn der Auslastungsfaktor größer als 1/2 wird, dann lade die Tabelle in eine doppelt so große Tabelle. Die Zeit für die Reorganisation wird durch die schnellere Bearbeitung der Operationen amortisiert. Hashing Hashing mit offener Adressierung 52 / 74 Hashing mit offener Adressierung Wir arbeiten mit einer Folge h0 , ..., hm−1 : U → {0, ..., m − 1} von Hashfunktionen. Setze i = 0. (1) Wenn die Zelle hi (x) frei ist, dann füge x in Zelle hi (x) ein. (2) Ansonsten setze i = i + 1 und gehe zu Schritt (1). Die Anzahl der Fehlversuche „sollte“ ansteigen, wenn λ zu groß wird. Was ist in einem solchen Fall zu tun? I I Wenn der Auslastungsfaktor größer als 1/2 wird, dann lade die Tabelle in eine doppelt so große Tabelle. Die Zeit für die Reorganisation wird durch die schnellere Bearbeitung der Operationen amortisiert. Wie sollen die einzelnen Operationen implementiert werden? Hashing Hashing mit offener Adressierung 52 / 74 Implementierung von Lookup, Insert und Remove lookup und insert lassen sich für jede Folge von Hashfunktionen leicht implementieren. Hashing Hashing mit offener Adressierung 53 / 74 Implementierung von Lookup, Insert und Remove lookup und insert lassen sich für jede Folge von Hashfunktionen leicht implementieren. Kopfzerbrechen bereitet remove: Hashing Hashing mit offener Adressierung 53 / 74 Implementierung von Lookup, Insert und Remove lookup und insert lassen sich für jede Folge von Hashfunktionen leicht implementieren. Kopfzerbrechen bereitet remove: Wird nach Einfügen des Schlüssels x in Zelle h1 (x) der Schlüssel in Zelle h0 (x) entfernt, dann hat die Operation lookup (x) ein Problem. I Ist x nicht da, weil Zelle h0 (x) leer ist oder ist weiterzusuchen? Hashing Hashing mit offener Adressierung 53 / 74 Implementierung von Lookup, Insert und Remove lookup und insert lassen sich für jede Folge von Hashfunktionen leicht implementieren. Kopfzerbrechen bereitet remove: Wird nach Einfügen des Schlüssels x in Zelle h1 (x) der Schlüssel in Zelle h0 (x) entfernt, dann hat die Operation lookup (x) ein Problem. I Ist x nicht da, weil Zelle h0 (x) leer ist oder ist weiterzusuchen? I Bringe eine „entfernt“ Markierung nach Löschen des Schlüssels in Zelle h0 (x) an. Hashing Hashing mit offener Adressierung 53 / 74 Implementierung von Lookup, Insert und Remove lookup und insert lassen sich für jede Folge von Hashfunktionen leicht implementieren. Kopfzerbrechen bereitet remove: Wird nach Einfügen des Schlüssels x in Zelle h1 (x) der Schlüssel in Zelle h0 (x) entfernt, dann hat die Operation lookup (x) ein Problem. I Ist x nicht da, weil Zelle h0 (x) leer ist oder ist weiterzusuchen? I Bringe eine „entfernt“ Markierung nach Löschen des Schlüssels in Zelle h0 (x) an. I Die erwartete Laufzeit einer erfolglosen Suche wird anwachsen. Hashing Hashing mit offener Adressierung 53 / 74 Implementierung von Lookup, Insert und Remove lookup und insert lassen sich für jede Folge von Hashfunktionen leicht implementieren. Kopfzerbrechen bereitet remove: Wird nach Einfügen des Schlüssels x in Zelle h1 (x) der Schlüssel in Zelle h0 (x) entfernt, dann hat die Operation lookup (x) ein Problem. I Ist x nicht da, weil Zelle h0 (x) leer ist oder ist weiterzusuchen? I Bringe eine „entfernt“ Markierung nach Löschen des Schlüssels in Zelle h0 (x) an. I Die erwartete Laufzeit einer erfolglosen Suche wird anwachsen. Vermeide Hashing mit offener Adressierung, wenn viele Daten entfernt werden. Hashing Hashing mit offener Adressierung 53 / 74 Hashing mit offener Adressierung: Welche Hashfunktionen? Hashing Hashing mit offener Adressierung 54 / 74 Lineares Austesten In der Methode des linearen Austestens wird die Folge hi (x) = (x + i) mod m benutzt: Also wird die jeweils nächste Zelle untersucht. Hashing Hashing mit offener Adressierung 55 / 74 Lineares Austesten In der Methode des linearen Austestens wird die Folge hi (x) = (x + i) mod m benutzt: Also wird die jeweils nächste Zelle untersucht. + Für jeden Schlüssel x wird jede Zelle in der Folge h0 (x), . . . , hm−1 (x) „getestet“. Hashing Hashing mit offener Adressierung 55 / 74 Lineares Austesten In der Methode des linearen Austestens wird die Folge hi (x) = (x + i) mod m benutzt: Also wird die jeweils nächste Zelle untersucht. + Für jeden Schlüssel x wird jede Zelle in der Folge h0 (x), . . . , hm−1 (x) „getestet“. - Lineares Austesten führt zur Klumpenbildung. Hashing Hashing mit offener Adressierung 55 / 74 Lineares Austesten In der Methode des linearen Austestens wird die Folge hi (x) = (x + i) mod m benutzt: Also wird die jeweils nächste Zelle untersucht. + Für jeden Schlüssel x wird jede Zelle in der Folge h0 (x), . . . , hm−1 (x) „getestet“. - Lineares Austesten führt zur Klumpenbildung. I Angenommen, die Daten besetzen ein Intervall {i, i + 1, . . . , j − 1, j} von Zellen. Hashing Hashing mit offener Adressierung 55 / 74 Lineares Austesten In der Methode des linearen Austestens wird die Folge hi (x) = (x + i) mod m benutzt: Also wird die jeweils nächste Zelle untersucht. + Für jeden Schlüssel x wird jede Zelle in der Folge h0 (x), . . . , hm−1 (x) „getestet“. - Lineares Austesten führt zur Klumpenbildung. I I Angenommen, die Daten besetzen ein Intervall {i, i + 1, . . . , j − 1, j} von Zellen. Wenn ein weiterer Schlüssel x mit h0 (x) ∈ {i, +1, . . . , j − 1, j} eingefügt wird, dann wird x am Ende des Intervalls eingefügt. Hashing Hashing mit offener Adressierung 55 / 74 Lineares Austesten In der Methode des linearen Austestens wird die Folge hi (x) = (x + i) mod m benutzt: Also wird die jeweils nächste Zelle untersucht. + Für jeden Schlüssel x wird jede Zelle in der Folge h0 (x), . . . , hm−1 (x) „getestet“. - Lineares Austesten führt zur Klumpenbildung. I I Angenommen, die Daten besetzen ein Intervall {i, i + 1, . . . , j − 1, j} von Zellen. Wenn ein weiterer Schlüssel x mit h0 (x) ∈ {i, +1, . . . , j − 1, j} eingefügt wird, dann wird x am Ende des Intervalls eingefügt. F Hashing Das Intervall wächst und dementsprechend steigt der Aufwand für die einzelnen Operationen. Hashing mit offener Adressierung 55 / 74 Doppeltes Hashing Wir benutzen zwei Hashfunktionen f und g und verwenden die Folge hi (x) = Hashing Hashing mit offener Adressierung 56 / 74 Doppeltes Hashing Wir benutzen zwei Hashfunktionen f und g und verwenden die Folge hi (x) = (f(x) Hashing Hashing mit offener Adressierung 56 / 74 Doppeltes Hashing Wir benutzen zwei Hashfunktionen f und g und verwenden die Folge hi (x) = (f(x) + i · g(x)) mod m. Hashing Hashing mit offener Adressierung 56 / 74 Doppeltes Hashing Wir benutzen zwei Hashfunktionen f und g und verwenden die Folge hi (x) = (f(x) + i · g(x)) mod m. Die Klumpenbildung wird vermieden. Hashing Hashing mit offener Adressierung 56 / 74 Doppeltes Hashing Wir benutzen zwei Hashfunktionen f und g und verwenden die Folge hi (x) = (f(x) + i · g(x)) mod m. Die Klumpenbildung wird vermieden. Man erhält gute Ergebnisse bereits für f(x) = x mod m und g(x) = m∗ − (x mod m∗ ). Hashing Hashing mit offener Adressierung 56 / 74 Doppeltes Hashing Wir benutzen zwei Hashfunktionen f und g und verwenden die Folge hi (x) = (f(x) + i · g(x)) mod m. Die Klumpenbildung wird vermieden. Man erhält gute Ergebnisse bereits für f(x) = x mod m und g(x) = m∗ − (x mod m∗ ). I Wähle m als Primzahl und fordere m∗ < m. Hashing Hashing mit offener Adressierung 56 / 74 Doppeltes Hashing Wir benutzen zwei Hashfunktionen f und g und verwenden die Folge hi (x) = (f(x) + i · g(x)) mod m. Die Klumpenbildung wird vermieden. Man erhält gute Ergebnisse bereits für f(x) = x mod m und g(x) = m∗ − (x mod m∗ ). I I Wähle m als Primzahl und fordere m∗ < m. g(x) ist stets von Null verschieden. Hashing Hashing mit offener Adressierung 56 / 74 Doppeltes Hashing Wir benutzen zwei Hashfunktionen f und g und verwenden die Folge hi (x) = (f(x) + i · g(x)) mod m. Die Klumpenbildung wird vermieden. Man erhält gute Ergebnisse bereits für f(x) = x mod m und g(x) = m∗ − (x mod m∗ ). I I Wähle m als Primzahl und fordere m∗ < m. g(x) ist stets von Null verschieden. Wenn hi (x) = f (x) + i · g(x) mod m = f (x) + j · g(x) mod m = hj (x), Hashing Hashing mit offener Adressierung 56 / 74 Doppeltes Hashing Wir benutzen zwei Hashfunktionen f und g und verwenden die Folge hi (x) = (f(x) + i · g(x)) mod m. Die Klumpenbildung wird vermieden. Man erhält gute Ergebnisse bereits für f(x) = x mod m und g(x) = m∗ − (x mod m∗ ). I I Wähle m als Primzahl und fordere m∗ < m. g(x) ist stets von Null verschieden. Wenn hi (x) = f (x) + i · g(x) mod m = f (x) + j · g(x) mod m = hj (x), dann (i − j) · g(x) = 0 mod m. Hashing Hashing mit offener Adressierung 56 / 74 Doppeltes Hashing Wir benutzen zwei Hashfunktionen f und g und verwenden die Folge hi (x) = (f(x) + i · g(x)) mod m. Die Klumpenbildung wird vermieden. Man erhält gute Ergebnisse bereits für f(x) = x mod m und g(x) = m∗ − (x mod m∗ ). I I Wähle m als Primzahl und fordere m∗ < m. g(x) ist stets von Null verschieden. Wenn hi (x) = f (x) + i · g(x) mod m = f (x) + j · g(x) mod m = hj (x), dann (i − j) · g(x) = 0 mod m. Also folgt i = j. Hashing Hashing mit offener Adressierung 56 / 74 Doppeltes Hashing Wir benutzen zwei Hashfunktionen f und g und verwenden die Folge hi (x) = (f(x) + i · g(x)) mod m. Die Klumpenbildung wird vermieden. Man erhält gute Ergebnisse bereits für f(x) = x mod m und g(x) = m∗ − (x mod m∗ ). I I Wähle m als Primzahl und fordere m∗ < m. g(x) ist stets von Null verschieden. Wenn hi (x) = f (x) + i · g(x) mod m = f (x) + j · g(x) mod m = hj (x), dann (i − j) · g(x) = 0 mod m. Also folgt i = j. Im doppelten Hashing werden alle Zellen getestet. Hashing Hashing mit offener Adressierung 56 / 74 Wie schnell ist Hashing mit Verkettung? Hashing Hashing mit Verkettung: Analyse 57 / 74 Wie schnell ist Hashing mit Verkettung? Annahme: Es befinden sich n Schlüssel in einer Tabelle mit m Schlüsseln. n Wir sagen, dass λ = m der Auslastungsfaktor der Tabelle ist. Hashing Hashing mit Verkettung: Analyse 58 / 74 Wie schnell ist Hashing mit Verkettung? Annahme: Es befinden sich n Schlüssel in einer Tabelle mit m Schlüsseln. n Wir sagen, dass λ = m der Auslastungsfaktor der Tabelle ist. Wie schnell wird eine insert(x), remove(x) oder lookup(x) Operation ausgeführt? Hashing Hashing mit Verkettung: Analyse 58 / 74 Wie schnell ist Hashing mit Verkettung? Annahme: Es befinden sich n Schlüssel in einer Tabelle mit m Schlüsseln. n Wir sagen, dass λ = m der Auslastungsfaktor der Tabelle ist. Wie schnell wird eine insert(x), remove(x) oder lookup(x) Operation ausgeführt? I Bestenfalls ist die Liste für h(x) = i leer und wir erreichen eine konstante Laufzeit. Hashing Hashing mit Verkettung: Analyse 58 / 74 Wie schnell ist Hashing mit Verkettung? Annahme: Es befinden sich n Schlüssel in einer Tabelle mit m Schlüsseln. n Wir sagen, dass λ = m der Auslastungsfaktor der Tabelle ist. Wie schnell wird eine insert(x), remove(x) oder lookup(x) Operation ausgeführt? I I Bestenfalls ist die Liste für h(x) = i leer und wir erreichen eine konstante Laufzeit. Schlimmstenfalls sind alle n Schlüssel auf die Liste von i verteilt und die worst-case Laufzeit Θ(n) folgt. Hashing Hashing mit Verkettung: Analyse 58 / 74 Wie schnell ist Hashing mit Verkettung? Annahme: Es befinden sich n Schlüssel in einer Tabelle mit m Schlüsseln. n Wir sagen, dass λ = m der Auslastungsfaktor der Tabelle ist. Wie schnell wird eine insert(x), remove(x) oder lookup(x) Operation ausgeführt? I I Bestenfalls ist die Liste für h(x) = i leer und wir erreichen eine konstante Laufzeit. Schlimmstenfalls sind alle n Schlüssel auf die Liste von i verteilt und die worst-case Laufzeit Θ(n) folgt. Weder best-case noch worst-case Laufzeit scheinen verlässliche Voraussagen der tatsächlichen Laufzeit zu sein. Betrachte die erwartete Laufzeit. Hashing Hashing mit Verkettung: Analyse 58 / 74 Die erwartete Laufzeit (1/2) Wir machen die folgenden Annahmen: jedes Element x ∈ U hat die Wahrscheinlichkeit Hashing Hashing mit Verkettung: Analyse 59 / 74 Die erwartete Laufzeit (1/2) Wir machen die folgenden Annahmen: jedes Element x ∈ U hat die Wahrscheinlichkeit als Operand in einer Operation aufzutreten. Hashing Hashing mit Verkettung: Analyse 1 |U| 59 / 74 Die erwartete Laufzeit (1/2) Wir machen die folgenden Annahmen: jedes Element x ∈ U hat die Wahrscheinlichkeit als Operand in einer Operation aufzutreten. 1 |U| Die Hashfunktion h streut die Schlüssel regelmäßig, d.h. |{x ∈ U | h(x) = i}| ∈ Hashing Hashing mit Verkettung: Analyse 59 / 74 Die erwartete Laufzeit (1/2) Wir machen die folgenden Annahmen: jedes Element x ∈ U hat die Wahrscheinlichkeit als Operand in einer Operation aufzutreten. 1 |U| Die Hashfunktion h streut dienSchlüssel regelmäßig, o |U| d.h. |{x ∈ U | h(x) = i}| ∈ c, d e b |U| gilt für jedes i. m m Hashing Hashing mit Verkettung: Analyse 59 / 74 Die erwartete Laufzeit (1/2) Wir machen die folgenden Annahmen: jedes Element x ∈ U hat die Wahrscheinlichkeit als Operand in einer Operation aufzutreten. 1 |U| Die Hashfunktion h streut dienSchlüssel regelmäßig, o |U| d.h. |{x ∈ U | h(x) = i}| ∈ c, d e b |U| gilt für jedes i. m m Die Hashfunktion h(x) = (x mod m) erfüllt die Streubedingung. Hashing Hashing mit Verkettung: Analyse 59 / 74 Die erwartete Laufzeit (1/2) Wir machen die folgenden Annahmen: jedes Element x ∈ U hat die Wahrscheinlichkeit als Operand in einer Operation aufzutreten. 1 |U| Die Hashfunktion h streut dienSchlüssel regelmäßig, o |U| d.h. |{x ∈ U | h(x) = i}| ∈ c, d e b |U| gilt für jedes i. m m Die Hashfunktion h(x) = (x mod m) erfüllt die Streubedingung. Die Wahrscheinlichkeit pi , dass ein zufällig gezogener Schlüssel auf die Zelle i gehasht wird, ist höchstens Hashing Hashing mit Verkettung: Analyse 59 / 74 Die erwartete Laufzeit (1/2) Wir machen die folgenden Annahmen: jedes Element x ∈ U hat die Wahrscheinlichkeit als Operand in einer Operation aufzutreten. 1 |U| Die Hashfunktion h streut dienSchlüssel regelmäßig, o |U| d.h. |{x ∈ U | h(x) = i}| ∈ c, d e b |U| gilt für jedes i. m m Die Hashfunktion h(x) = (x mod m) erfüllt die Streubedingung. Die Wahrscheinlichkeit pi , dass ein zufällig gezogener Schlüssel auf die Zelle i gehasht wird, ist höchstens pi 6 Hashing d |U| me |U| Hashing mit Verkettung: Analyse 59 / 74 Die erwartete Laufzeit (1/2) Wir machen die folgenden Annahmen: jedes Element x ∈ U hat die Wahrscheinlichkeit als Operand in einer Operation aufzutreten. 1 |U| Die Hashfunktion h streut dienSchlüssel regelmäßig, o |U| d.h. |{x ∈ U | h(x) = i}| ∈ c, d e b |U| gilt für jedes i. m m Die Hashfunktion h(x) = (x mod m) erfüllt die Streubedingung. Die Wahrscheinlichkeit pi , dass ein zufällig gezogener Schlüssel auf die Zelle i gehasht wird, ist höchstens pi 6 Hashing d |U| me 6 |U| |U| m +1 |U| Hashing mit Verkettung: Analyse 59 / 74 Die erwartete Laufzeit (1/2) Wir machen die folgenden Annahmen: jedes Element x ∈ U hat die Wahrscheinlichkeit als Operand in einer Operation aufzutreten. 1 |U| Die Hashfunktion h streut dienSchlüssel regelmäßig, o |U| d.h. |{x ∈ U | h(x) = i}| ∈ c, d e b |U| gilt für jedes i. m m Die Hashfunktion h(x) = (x mod m) erfüllt die Streubedingung. Die Wahrscheinlichkeit pi , dass ein zufällig gezogener Schlüssel auf die Zelle i gehasht wird, ist höchstens pi 6 Hashing d |U| me 6 |U| |U| m +1 1 1 6 + . |U| m |U| Hashing mit Verkettung: Analyse 59 / 74 Die erwartete Laufzeit (1/2) Wir machen die folgenden Annahmen: jedes Element x ∈ U hat die Wahrscheinlichkeit als Operand in einer Operation aufzutreten. 1 |U| Die Hashfunktion h streut dienSchlüssel regelmäßig, o |U| d.h. |{x ∈ U | h(x) = i}| ∈ c, d e b |U| gilt für jedes i. m m Die Hashfunktion h(x) = (x mod m) erfüllt die Streubedingung. Die Wahrscheinlichkeit pi , dass ein zufällig gezogener Schlüssel auf die Zelle i gehasht wird, ist höchstens pi 6 d |U| me 6 |U| |U| m +1 1 1 6 + . |U| m |U| Die erwartete Länge der Liste für Zelle i ist Hashing Hashing mit Verkettung: Analyse 59 / 74 Die erwartete Laufzeit (1/2) Wir machen die folgenden Annahmen: jedes Element x ∈ U hat die Wahrscheinlichkeit als Operand in einer Operation aufzutreten. 1 |U| Die Hashfunktion h streut dienSchlüssel regelmäßig, o |U| d.h. |{x ∈ U | h(x) = i}| ∈ c, d e b |U| gilt für jedes i. m m Die Hashfunktion h(x) = (x mod m) erfüllt die Streubedingung. Die Wahrscheinlichkeit pi , dass ein zufällig gezogener Schlüssel auf die Zelle i gehasht wird, ist höchstens pi 6 d |U| me 6 |U| |U| m +1 1 1 6 + . |U| m |U| Die erwartete Länge der Liste für Zelle i ist pi · n. Hashing Hashing mit Verkettung: Analyse 59 / 74 Die erwartete Laufzeit (2/2) Die erwartete Länge L einer beliebigen Liste ist L = m−1 X i=0 Hashing erwartete Länge der Liste von Zelle i m Hashing mit Verkettung: Analyse 60 / 74 Die erwartete Laufzeit (2/2) Die erwartete Länge L einer beliebigen Liste ist L = m−1 X i=0 = m−1 X i=0 Hashing erwartete Länge der Liste von Zelle i m pi · n = m Hashing mit Verkettung: Analyse 60 / 74 Die erwartete Laufzeit (2/2) Die erwartete Länge L einer beliebigen Liste ist L = m−1 X i=0 = m−1 X i=0 Hashing erwartete Länge der Liste von Zelle i m m−1 pi · n n X = · pi = m m i=0 Hashing mit Verkettung: Analyse 60 / 74 Die erwartete Laufzeit (2/2) Die erwartete Länge L einer beliebigen Liste ist L = m−1 X i=0 = m−1 X i=0 Hashing erwartete Länge der Liste von Zelle i m m−1 pi · n n X = · pi = n/m = λ. m m i=0 Hashing mit Verkettung: Analyse 60 / 74 Hashing mit Verkettung: Zusammenfassung Die erwartete Länge einer Liste für Hashing mit Verkettung stimmt mit dem Auslastungsfaktor λ überein. Hashing Hashing mit Verkettung: Analyse 61 / 74 Hashing mit Verkettung: Zusammenfassung Die erwartete Länge einer Liste für Hashing mit Verkettung stimmt mit dem Auslastungsfaktor λ überein. Die erwartete Laufzeit einer insert-, remove- oder lookup-Operation ist höchstens O(1) + λ Hashing Hashing mit Verkettung: Analyse 61 / 74 Hashing mit Verkettung: Zusammenfassung Die erwartete Länge einer Liste für Hashing mit Verkettung stimmt mit dem Auslastungsfaktor λ überein. Die erwartete Laufzeit einer insert-, remove- oder lookup-Operation ist höchstens O(1) + λ Werte die Hashfunktion aus und durchlaufe die Liste. Hashing Hashing mit Verkettung: Analyse 61 / 74 Hashing mit Verkettung: Zusammenfassung Die erwartete Länge einer Liste für Hashing mit Verkettung stimmt mit dem Auslastungsfaktor λ überein. Die erwartete Laufzeit einer insert-, remove- oder lookup-Operation ist höchstens O(1) + λ Werte die Hashfunktion aus und durchlaufe die Liste. + Hashing mit Verkettung ist ein hochgradig praxis-taugliches Verfahren. Hashing Hashing mit Verkettung: Analyse 61 / 74 Hashing mit Verkettung: Zusammenfassung Die erwartete Länge einer Liste für Hashing mit Verkettung stimmt mit dem Auslastungsfaktor λ überein. Die erwartete Laufzeit einer insert-, remove- oder lookup-Operation ist höchstens O(1) + λ Werte die Hashfunktion aus und durchlaufe die Liste. + Hashing mit Verkettung ist ein hochgradig praxis-taugliches Verfahren. - Aber, durch die Verwendung von Listen, und damit durch die Verwendung von Zeigern, ersteht zusätzlicher Speicherbedarf. Hashing Hashing mit Verkettung: Analyse 61 / 74 Wie schnell ist Hashing mit offener Adressierung? Hashing Offene Adressierung: Analyse 62 / 74 Die erwartete Laufzeit einer erfolglosen Suche (1/2) Die Annahmen: Jeder Schlüssel x ∈ U tritt mit Wahrscheinlichkeit einer Operation auf. Hashing Offene Adressierung: Analyse 1 |U| als Operand 63 / 74 Die erwartete Laufzeit einer erfolglosen Suche (1/2) Die Annahmen: Jeder Schlüssel x ∈ U tritt mit Wahrscheinlichkeit einer Operation auf. 1 |U| als Operand Für jedes x ∈ U ist die Folge (h0 (x), h1 (x), ..., hm−1 (x)) = πx eine Permutation von {0, 1, ..., m − 1} Hashing Offene Adressierung: Analyse 63 / 74 Die erwartete Laufzeit einer erfolglosen Suche (1/2) Die Annahmen: Jeder Schlüssel x ∈ U tritt mit Wahrscheinlichkeit einer Operation auf. 1 |U| als Operand Für jedes x ∈ U ist die Folge (h0 (x), h1 (x), ..., hm−1 (x)) = πx eine Permutation von {0, 1, ..., m − 1} und jede Permutation πx tritt für Hashing |U| m! Schlüssel x ∈ U auf. Offene Adressierung: Analyse 63 / 74 Die erwartete Laufzeit einer erfolglosen Suche (1/2) Die Annahmen: Jeder Schlüssel x ∈ U tritt mit Wahrscheinlichkeit einer Operation auf. 1 |U| als Operand Für jedes x ∈ U ist die Folge (h0 (x), h1 (x), ..., hm−1 (x)) = πx eine Permutation von {0, 1, ..., m − 1} und jede Permutation πx tritt für |U| m! Schlüssel x ∈ U auf. Wie lange müssen wir auf einen Erfolg, eine freie Zelle, warten? Hashing Offene Adressierung: Analyse 63 / 74 Die erwartete Laufzeit einer erfolglosen Suche (2/2) Man stelle sich vor, dass wir einen Schlüssel zufällig ziehen. Nach der Annahme ist jede Permutation getesteter Zellen gleichwahrscheinlich. Der Auslastungsfaktor ist λ. Hashing Offene Adressierung: Analyse 64 / 74 Die erwartete Laufzeit einer erfolglosen Suche (2/2) Man stelle sich vor, dass wir einen Schlüssel zufällig ziehen. Nach der Annahme ist jede Permutation getesteter Zellen gleichwahrscheinlich. Der Auslastungsfaktor ist λ. Die Wahrscheinlichkeit im 1. Versuch eine freie Zelle zu finden ist Hashing Offene Adressierung: Analyse 64 / 74 Die erwartete Laufzeit einer erfolglosen Suche (2/2) Man stelle sich vor, dass wir einen Schlüssel zufällig ziehen. Nach der Annahme ist jede Permutation getesteter Zellen gleichwahrscheinlich. Der Auslastungsfaktor ist λ. Die Wahrscheinlichkeit im 1. Versuch eine freie Zelle zu finden ist 1 − λ und steigt sogar in nachfolgenden Versuchen an, da bereits getestete aber besetzte Zellen nicht mehr getestet werden. Hashing Offene Adressierung: Analyse 64 / 74 Die erwartete Laufzeit einer erfolglosen Suche (2/2) Man stelle sich vor, dass wir einen Schlüssel zufällig ziehen. Nach der Annahme ist jede Permutation getesteter Zellen gleichwahrscheinlich. Der Auslastungsfaktor ist λ. Die Wahrscheinlichkeit im 1. Versuch eine freie Zelle zu finden ist 1 − λ und steigt sogar in nachfolgenden Versuchen an, da bereits getestete aber besetzte Zellen nicht mehr getestet werden. Wie lange müssen wir auf einen Erfolg warten, wenn die Erfolgswahrscheinlichkeit eines einzigen Versuchs mindestens p = 1 − λ ist? Hashing Offene Adressierung: Analyse 64 / 74 Die erwartete Laufzeit einer erfolglosen Suche (2/2) Man stelle sich vor, dass wir einen Schlüssel zufällig ziehen. Nach der Annahme ist jede Permutation getesteter Zellen gleichwahrscheinlich. Der Auslastungsfaktor ist λ. Die Wahrscheinlichkeit im 1. Versuch eine freie Zelle zu finden ist 1 − λ und steigt sogar in nachfolgenden Versuchen an, da bereits getestete aber besetzte Zellen nicht mehr getestet werden. Wie lange müssen wir auf einen Erfolg warten, wenn die Erfolgswahrscheinlichkeit eines einzigen Versuchs mindestens p = 1 − λ ist? I Mit Wahrscheinlichkeit höchstens (1 − p)k · p werden genau k + 1 Versuche benötigt. Hashing Offene Adressierung: Analyse 64 / 74 Die erwartete Laufzeit einer erfolglosen Suche (2/2) Man stelle sich vor, dass wir einen Schlüssel zufällig ziehen. Nach der Annahme ist jede Permutation getesteter Zellen gleichwahrscheinlich. Der Auslastungsfaktor ist λ. Die Wahrscheinlichkeit im 1. Versuch eine freie Zelle zu finden ist 1 − λ und steigt sogar in nachfolgenden Versuchen an, da bereits getestete aber besetzte Zellen nicht mehr getestet werden. Wie lange müssen wir auf einen Erfolg warten, wenn die Erfolgswahrscheinlichkeit eines einzigen Versuchs mindestens p = 1 − λ ist? I I Mit Wahrscheinlichkeit höchstens (1 − p)k · p werden genau k + 1 Versuche benötigt. Die erwartete Zeit bis zum ersten Erfolg beträgt höchstens Hashing Offene Adressierung: Analyse 64 / 74 Die erwartete Laufzeit einer erfolglosen Suche (2/2) Man stelle sich vor, dass wir einen Schlüssel zufällig ziehen. Nach der Annahme ist jede Permutation getesteter Zellen gleichwahrscheinlich. Der Auslastungsfaktor ist λ. Die Wahrscheinlichkeit im 1. Versuch eine freie Zelle zu finden ist 1 − λ und steigt sogar in nachfolgenden Versuchen an, da bereits getestete aber besetzte Zellen nicht mehr getestet werden. Wie lange müssen wir auf einen Erfolg warten, wenn die Erfolgswahrscheinlichkeit eines einzigen Versuchs mindestens p = 1 − λ ist? I I Mit Wahrscheinlichkeit höchstens (1 − p)k · p werden genau k + 1 Versuche benötigt. Die erwartete Zeit bis zum ersten Erfolg beträgt höchstens P∞ k k =0 (k + 1) · (1 − p) · p = Hashing Offene Adressierung: Analyse 64 / 74 Die erwartete Laufzeit einer erfolglosen Suche (2/2) Man stelle sich vor, dass wir einen Schlüssel zufällig ziehen. Nach der Annahme ist jede Permutation getesteter Zellen gleichwahrscheinlich. Der Auslastungsfaktor ist λ. Die Wahrscheinlichkeit im 1. Versuch eine freie Zelle zu finden ist 1 − λ und steigt sogar in nachfolgenden Versuchen an, da bereits getestete aber besetzte Zellen nicht mehr getestet werden. Wie lange müssen wir auf einen Erfolg warten, wenn die Erfolgswahrscheinlichkeit eines einzigen Versuchs mindestens p = 1 − λ ist? I I Mit Wahrscheinlichkeit höchstens (1 − p)k · p werden genau k + 1 Versuche benötigt. Die erwartete Zeit bis zum ersten Erfolg beträgt höchstens P∞ 1 k k =0 (k + 1) · (1 − p) · p = p . Hashing Offene Adressierung: Analyse 64 / 74 Die erwartete Laufzeit einer erfolglosen Suche (2/2) Man stelle sich vor, dass wir einen Schlüssel zufällig ziehen. Nach der Annahme ist jede Permutation getesteter Zellen gleichwahrscheinlich. Der Auslastungsfaktor ist λ. Die Wahrscheinlichkeit im 1. Versuch eine freie Zelle zu finden ist 1 − λ und steigt sogar in nachfolgenden Versuchen an, da bereits getestete aber besetzte Zellen nicht mehr getestet werden. Wie lange müssen wir auf einen Erfolg warten, wenn die Erfolgswahrscheinlichkeit eines einzigen Versuchs mindestens p = 1 − λ ist? I I Mit Wahrscheinlichkeit höchstens (1 − p)k · p werden genau k + 1 Versuche benötigt. Die erwartete Zeit bis zum ersten Erfolg beträgt höchstens P∞ 1 k k =0 (k + 1) · (1 − p) · p = p . p = 1 − λ ⇒ Die erwartete Anzahl getesteter Zellen ist Hashing Offene Adressierung: Analyse 64 / 74 Die erwartete Laufzeit einer erfolglosen Suche (2/2) Man stelle sich vor, dass wir einen Schlüssel zufällig ziehen. Nach der Annahme ist jede Permutation getesteter Zellen gleichwahrscheinlich. Der Auslastungsfaktor ist λ. Die Wahrscheinlichkeit im 1. Versuch eine freie Zelle zu finden ist 1 − λ und steigt sogar in nachfolgenden Versuchen an, da bereits getestete aber besetzte Zellen nicht mehr getestet werden. Wie lange müssen wir auf einen Erfolg warten, wenn die Erfolgswahrscheinlichkeit eines einzigen Versuchs mindestens p = 1 − λ ist? I I Mit Wahrscheinlichkeit höchstens (1 − p)k · p werden genau k + 1 Versuche benötigt. Die erwartete Zeit bis zum ersten Erfolg beträgt höchstens P∞ 1 k k =0 (k + 1) · (1 − p) · p = p . p = 1 − λ ⇒ Die erwartete Anzahl getesteter Zellen ist Hashing Offene Adressierung: Analyse 1 p = 1 1−λ . 64 / 74 Hashing mit offener Adressierung: Zusammenfassung Der Auslastungsfaktor sei λ. Zur Erinnerung: Hashing mit Verkettung besitzt für alle Operationen eine erwartete Laufzeit von höchstens O(1) + λ. Hashing Offene Adressierung: Analyse 65 / 74 Hashing mit offener Adressierung: Zusammenfassung Der Auslastungsfaktor sei λ. Zur Erinnerung: Hashing mit Verkettung besitzt für alle Operationen eine erwartete Laufzeit von höchstens O(1) + λ. Wegen der Klumpenbildung des linearen Austestens werden im 1 Durchschnitt 12 · (1 + (1−λ) 2 ) Zellen getestet. Allerdings ist lineares Austesten „cache-freundlich“. Hashing Offene Adressierung: Analyse 65 / 74 Hashing mit offener Adressierung: Zusammenfassung Der Auslastungsfaktor sei λ. Zur Erinnerung: Hashing mit Verkettung besitzt für alle Operationen eine erwartete Laufzeit von höchstens O(1) + λ. Wegen der Klumpenbildung des linearen Austestens werden im 1 Durchschnitt 12 · (1 + (1−λ) 2 ) Zellen getestet. Allerdings ist lineares Austesten „cache-freundlich“. Die erwartete Laufzeit einer erfolglosen Suche für doppeltes 1 Hashing ist höchstens 1−λ . I I Der Auslastungsfaktor für das lineare Austesten oder das doppelte Hashing sollte nicht zu groß werden: Lade in eine doppelt so große Tabelle um, wenn λ > 1/2. Hashing Offene Adressierung: Analyse 65 / 74 Universelles Hashing Hashing Universelles Hashing 66 / 74 Universelles Hashing Für jede Hashfunktion, ob für Hashing mit Verkettung oder Hashing mit offener Addressierung kann eine worst-case Laufzeit von Θ(n) erzwungen werden. Hashing Universelles Hashing 67 / 74 Universelles Hashing Für jede Hashfunktion, ob für Hashing mit Verkettung oder Hashing mit offener Addressierung kann eine worst-case Laufzeit von Θ(n) erzwungen werden. Wir müssen also „Glück“ haben, dass unsere Operationen kein worst-case Verhalten zeigen. Hashing Universelles Hashing 67 / 74 Universelles Hashing Für jede Hashfunktion, ob für Hashing mit Verkettung oder Hashing mit offener Addressierung kann eine worst-case Laufzeit von Θ(n) erzwungen werden. Wir müssen also „Glück“ haben, dass unsere Operationen kein worst-case Verhalten zeigen. Stattdessen arbeiten wir mit einer Klasse H von Hashfunktionen: Hashing Universelles Hashing 67 / 74 Universelles Hashing Für jede Hashfunktion, ob für Hashing mit Verkettung oder Hashing mit offener Addressierung kann eine worst-case Laufzeit von Θ(n) erzwungen werden. Wir müssen also „Glück“ haben, dass unsere Operationen kein worst-case Verhalten zeigen. Stattdessen arbeiten wir mit einer Klasse H von Hashfunktionen: I I Zu Beginn wählen wir zufällig eine Hashfunktion h ∈ H und führen Hashing mit Verkettung mit der Hashfunktion h durch. Hashing Universelles Hashing 67 / 74 Universelles Hashing Für jede Hashfunktion, ob für Hashing mit Verkettung oder Hashing mit offener Addressierung kann eine worst-case Laufzeit von Θ(n) erzwungen werden. Wir müssen also „Glück“ haben, dass unsere Operationen kein worst-case Verhalten zeigen. Stattdessen arbeiten wir mit einer Klasse H von Hashfunktionen: I I Zu Beginn wählen wir zufällig eine Hashfunktion h ∈ H und führen Hashing mit Verkettung mit der Hashfunktion h durch. Warum „sollte“ ein solches Verfahren funktionieren? Hashing Universelles Hashing 67 / 74 Universelles Hashing Für jede Hashfunktion, ob für Hashing mit Verkettung oder Hashing mit offener Addressierung kann eine worst-case Laufzeit von Θ(n) erzwungen werden. Wir müssen also „Glück“ haben, dass unsere Operationen kein worst-case Verhalten zeigen. Stattdessen arbeiten wir mit einer Klasse H von Hashfunktionen: I I Zu Beginn wählen wir zufällig eine Hashfunktion h ∈ H und führen Hashing mit Verkettung mit der Hashfunktion h durch. Warum „sollte“ ein solches Verfahren funktionieren? I I Eine einzelne Hashfunktion ist durch eine bösartig gewählte Operationenfolge zum Scheitern verurteilt, aber die meisten Hashfunktion werden diese Operationenfolge mit Bravour meistern. Was ist eine geeignete Klasse H? Hashing Universelles Hashing 67 / 74 c-universelle Klassen von Hashfunktionen Eine Menge H ⊆ {h | h : U → {0, ..., m − 1}} ist c-universell, Hashing Universelles Hashing 68 / 74 c-universelle Klassen von Hashfunktionen Eine Menge H ⊆ {h | h : U → {0, ..., m − 1}} ist c-universell, falls |{h ∈ H | h(x) = h(y )}| c 6 |H| m für alle x, y ∈ U mit x 6= y gilt. Hashing Universelles Hashing 68 / 74 c-universelle Klassen von Hashfunktionen Eine Menge H ⊆ {h | h : U → {0, ..., m − 1}} ist c-universell, falls |{h ∈ H | h(x) = h(y )}| c 6 |H| m für alle x, y ∈ U mit x 6= y gilt. Wenn H c-universell ist, dann gibt es keine zwei Schlüssel, die mit Wahrscheinlichkeit größer als mc auf die gleiche Zelle hashen. Hashing Universelles Hashing 68 / 74 c-universelle Klassen von Hashfunktionen Eine Menge H ⊆ {h | h : U → {0, ..., m − 1}} ist c-universell, falls |{h ∈ H | h(x) = h(y )}| c 6 |H| m für alle x, y ∈ U mit x 6= y gilt. Wenn H c-universell ist, dann gibt es keine zwei Schlüssel, die mit Wahrscheinlichkeit größer als mc auf die gleiche Zelle hashen. I I Gibt es c-universelle Klassen von Hashfunktionen für kleine Werte von c und können wir dann jede Folge von lookup-, insert- und remove-Operationen hochwahrscheinlich schnell ausführen? Hashing Universelles Hashing 68 / 74 Eine c-universelle Klasse Sei U = {0, 1, 2, ..., p − 1} für eine Primzahl p. (a) Dann ist H = {ha,b | 0 6 a, b < p, ha,b (x) = ((ax + b) mod p) Hashing Universelles Hashing 69 / 74 Eine c-universelle Klasse Sei U = {0, 1, 2, ..., p − 1} für eine Primzahl p. (a) Dann ist H = {ha,b | 0 6 a, b < p, ha,b (x) = ((ax + b) mod p) mod m } p c-universell mit c = (d m e/ Hashing p 2 m) . Universelles Hashing 69 / 74 Eine c-universelle Klasse Sei U = {0, 1, 2, ..., p − 1} für eine Primzahl p. (a) Dann ist H = {ha,b | 0 6 a, b < p, ha,b (x) = ((ax + b) mod p) mod m } p c-universell mit c = (d m e/ p 2 m) . (b) Jede Folge von n Operationen benötigt für eine c-universelle Klasse die erwartete Zeit höchstens c n n 1+ · . 2 m Hashing Universelles Hashing 69 / 74 Eine c-universelle Klasse Sei U = {0, 1, 2, ..., p − 1} für eine Primzahl p. (a) Dann ist H = {ha,b | 0 6 a, b < p, ha,b (x) = ((ax + b) mod p) mod m } p c-universell mit c = (d m e/ p 2 m) . (b) Jede Folge von n Operationen benötigt für eine c-universelle Klasse die erwartete Zeit höchstens c n n 1+ · . 2 m Unser Motto: „Erst durchschütteln“ (x 7→ y = (ax + b) mod p) Hashing Universelles Hashing 69 / 74 Eine c-universelle Klasse Sei U = {0, 1, 2, ..., p − 1} für eine Primzahl p. (a) Dann ist H = {ha,b | 0 6 a, b < p, ha,b (x) = ((ax + b) mod p) mod m } p c-universell mit c = (d m e/ p 2 m) . (b) Jede Folge von n Operationen benötigt für eine c-universelle Klasse die erwartete Zeit höchstens c n n 1+ · . 2 m Unser Motto: „Erst durchschütteln“ (x 7→ y = (ax + b) mod p) und dann „hashen“ (y 7→ y mod m). Hashing Universelles Hashing 69 / 74 Wörterbücher: Wann welche Datenstruktur? Hashing Universelles Hashing 70 / 74 Datenstrukturen für Wörterbücher 1 Listen: - Die Lookup-Operation dauert viel zu lange! Hashing Universelles Hashing 71 / 74 Datenstrukturen für Wörterbücher 1 Listen: - Die Lookup-Operation dauert viel zu lange! + Wichtige Einsatzgebiete sind z.B. „Adjazenzlisten für Graphen“. + Passen sich ideal der Größe der Datenmenge an wie etwa im Fall der „Darstellung dünnbesetzter Matrizen“. Hashing Universelles Hashing 71 / 74 Datenstrukturen für Wörterbücher 1 Listen: - Die Lookup-Operation dauert viel zu lange! + Wichtige Einsatzgebiete sind z.B. „Adjazenzlisten für Graphen“. + Passen sich ideal der Größe der Datenmenge an wie etwa im Fall der „Darstellung dünnbesetzter Matrizen“. 2 Binäre Suchbäume: + Gute erwartete Laufzeit. + Ermöglicht die Binärsuche und ist „Ausgangspunkt“ für AVL-Bäume. - Schlechte worst-case Laufzeit und relativ viel Speicherplatz. Hashing Universelles Hashing 71 / 74 Datenstrukturen für Wörterbücher 1 Listen: - Die Lookup-Operation dauert viel zu lange! + Wichtige Einsatzgebiete sind z.B. „Adjazenzlisten für Graphen“. + Passen sich ideal der Größe der Datenmenge an wie etwa im Fall der „Darstellung dünnbesetzter Matrizen“. 2 Binäre Suchbäume: + Gute erwartete Laufzeit. + Ermöglicht die Binärsuche und ist „Ausgangspunkt“ für AVL-Bäume. - Schlechte worst-case Laufzeit und relativ viel Speicherplatz. 3 AVL-Bäume: + Die worst-case Laufzeit ist logarithmisch. - Relativ viel Speicherplatz notwendig für Zeiger und Balance-Information. Hashing Universelles Hashing 71 / 74 Datenstrukturen für Wörterbücher: Die Champions 1 Hashing mit Verkettung: + hat die sehr schnelle erwartete Laufzeit O(1) + λ, - aber verlangt relativ viel Speicher. +/- Die worst-case Laufzeit ist schlecht, aber gutes Verhalten in praktischen Anwendungen. + Universelles Hashing: Schnelle erwartete Laufzeit für jede Folge von Operationen! Hashing Universelles Hashing 72 / 74 Datenstrukturen für Wörterbücher: Die Champions 1 Hashing mit Verkettung: + hat die sehr schnelle erwartete Laufzeit O(1) + λ, - aber verlangt relativ viel Speicher. +/- Die worst-case Laufzeit ist schlecht, aber gutes Verhalten in praktischen Anwendungen. + Universelles Hashing: Schnelle erwartete Laufzeit für jede Folge von Operationen! 2 Hashing mit offener Adressierung: + ist mit erwarteter Laufzeit O(1/(1 − λ) etwas langsamer als Hashing mit Verkettung, - aber der Auslastungsfaktor λ muss klein sein! +/- Sehr „speicherplatz-freundlich“, mit schlechter worst-case Laufzeit, aber guter Leistung für kleine λ. Hashing Universelles Hashing 72 / 74 Datenstrukturen für Wörterbücher: Die Champions 1 Hashing mit Verkettung: + hat die sehr schnelle erwartete Laufzeit O(1) + λ, - aber verlangt relativ viel Speicher. +/- Die worst-case Laufzeit ist schlecht, aber gutes Verhalten in praktischen Anwendungen. + Universelles Hashing: Schnelle erwartete Laufzeit für jede Folge von Operationen! 2 Hashing mit offener Adressierung: + ist mit erwarteter Laufzeit O(1/(1 − λ) etwas langsamer als Hashing mit Verkettung, - aber der Auslastungsfaktor λ muss klein sein! +/- Sehr „speicherplatz-freundlich“, mit schlechter worst-case Laufzeit, aber guter Leistung für kleine λ. 3 (a,b)-Bäume: + Unschlagbar in Anwendungen für langsame Speicher, - werden aber von Hashing und AVL-Bäumen „geschlagen“, wenn die Daten in einen schnellen Speicher passen. Hashing Universelles Hashing 72 / 74 Cuckoo Hashing (1/2) Arbeite mit Hashtabellen T1 und T2 sowie Hashfunktionen h1 undh2 . Hashing Cuckoo Hashing 73 / 74 Cuckoo Hashing (1/2) Arbeite mit Hashtabellen T1 und T2 sowie Hashfunktionen h1 undh2 . Insert(x): Wiederhole bis zu M mal, I Speichere x in Tabelle T1 und Zelle h1 (x) ab. Hashing Cuckoo Hashing 73 / 74 Cuckoo Hashing (1/2) Arbeite mit Hashtabellen T1 und T2 sowie Hashfunktionen h1 undh2 . Insert(x): Wiederhole bis zu M mal, I I Speichere x in Tabelle T1 und Zelle h1 (x) ab. Wenn die Zelle h1 (x) in Tabelle T1 durch einen Schlüssel y belegt war, dann füge y in Tabelle T2 und Zelle h2 (y ) ein. Hashing Cuckoo Hashing 73 / 74 Cuckoo Hashing (1/2) Arbeite mit Hashtabellen T1 und T2 sowie Hashfunktionen h1 undh2 . Insert(x): Wiederhole bis zu M mal, I I I Speichere x in Tabelle T1 und Zelle h1 (x) ab. Wenn die Zelle h1 (x) in Tabelle T1 durch einen Schlüssel y belegt war, dann füge y in Tabelle T2 und Zelle h2 (y ) ein. Wenn die Zelle h2 (y ) in Tabelle T2 durch einen Schlüssel z belegt war, dann setze x = z und beginne eine neue Iteration. Hashing Cuckoo Hashing 73 / 74 Cuckoo Hashing (1/2) Arbeite mit Hashtabellen T1 und T2 sowie Hashfunktionen h1 undh2 . Insert(x): Wiederhole bis zu M mal, I I I Speichere x in Tabelle T1 und Zelle h1 (x) ab. Wenn die Zelle h1 (x) in Tabelle T1 durch einen Schlüssel y belegt war, dann füge y in Tabelle T2 und Zelle h2 (y ) ein. Wenn die Zelle h2 (y ) in Tabelle T2 durch einen Schlüssel z belegt war, dann setze x = z und beginne eine neue Iteration. Lookup(x): Hashing Cuckoo Hashing 73 / 74 Cuckoo Hashing (1/2) Arbeite mit Hashtabellen T1 und T2 sowie Hashfunktionen h1 undh2 . Insert(x): Wiederhole bis zu M mal, I I I Speichere x in Tabelle T1 und Zelle h1 (x) ab. Wenn die Zelle h1 (x) in Tabelle T1 durch einen Schlüssel y belegt war, dann füge y in Tabelle T2 und Zelle h2 (y ) ein. Wenn die Zelle h2 (y ) in Tabelle T2 durch einen Schlüssel z belegt war, dann setze x = z und beginne eine neue Iteration. Lookup(x): Überprüfe Zelle h1 (x) in Hashtabelle T1 und gegebenenfalls Zelle h2 (x) in Hashtabelle T2 . Hashing Cuckoo Hashing 73 / 74 Cuckoo Hashing (1/2) Arbeite mit Hashtabellen T1 und T2 sowie Hashfunktionen h1 undh2 . Insert(x): Wiederhole bis zu M mal, I I I Speichere x in Tabelle T1 und Zelle h1 (x) ab. Wenn die Zelle h1 (x) in Tabelle T1 durch einen Schlüssel y belegt war, dann füge y in Tabelle T2 und Zelle h2 (y ) ein. Wenn die Zelle h2 (y ) in Tabelle T2 durch einen Schlüssel z belegt war, dann setze x = z und beginne eine neue Iteration. Lookup(x): Überprüfe Zelle h1 (x) in Hashtabelle T1 und gegebenenfalls Zelle h2 (x) in Hashtabelle T2 . Remove(x): Hashing Cuckoo Hashing 73 / 74 Cuckoo Hashing (1/2) Arbeite mit Hashtabellen T1 und T2 sowie Hashfunktionen h1 undh2 . Insert(x): Wiederhole bis zu M mal, I I I Speichere x in Tabelle T1 und Zelle h1 (x) ab. Wenn die Zelle h1 (x) in Tabelle T1 durch einen Schlüssel y belegt war, dann füge y in Tabelle T2 und Zelle h2 (y ) ein. Wenn die Zelle h2 (y ) in Tabelle T2 durch einen Schlüssel z belegt war, dann setze x = z und beginne eine neue Iteration. Lookup(x): Überprüfe Zelle h1 (x) in Hashtabelle T1 und gegebenenfalls Zelle h2 (x) in Hashtabelle T2 . Remove(x): Wenn x vorhanden ist, dann entferne x aus Zelle h1 (x) in Hashtabelle T1 oder aus Zelle h2 (x) in Hashtabelle T2 . Hashing Cuckoo Hashing 73 / 74 Cuckoo Hashing (1/2) Arbeite mit Hashtabellen T1 und T2 sowie Hashfunktionen h1 undh2 . Insert(x): Wiederhole bis zu M mal, I I I Speichere x in Tabelle T1 und Zelle h1 (x) ab. Wenn die Zelle h1 (x) in Tabelle T1 durch einen Schlüssel y belegt war, dann füge y in Tabelle T2 und Zelle h2 (y ) ein. Wenn die Zelle h2 (y ) in Tabelle T2 durch einen Schlüssel z belegt war, dann setze x = z und beginne eine neue Iteration. Lookup(x): Überprüfe Zelle h1 (x) in Hashtabelle T1 und gegebenenfalls Zelle h2 (x) in Hashtabelle T2 . Remove(x): Wenn x vorhanden ist, dann entferne x aus Zelle h1 (x) in Hashtabelle T1 oder aus Zelle h2 (x) in Hashtabelle T2 . Warum der Name Cuckoo Hashing? Eine Kuckuck Art wirft ein oder mehrere Eier aus einem fremden Nest und legt ein eigenes Ei hinzu. Hashing Cuckoo Hashing 73 / 74 Cuckoo Hashing (2/2) Cuckoo Hashing hasht direkt in die Tabellen. Die remove-Operation ist aber mit Leichtigkeit implementierbar. Hashing Cuckoo Hashing 74 / 74 Cuckoo Hashing (2/2) Cuckoo Hashing hasht direkt in die Tabellen. Die remove-Operation ist aber mit Leichtigkeit implementierbar. Eine worst-case Garantie für lookup und remove: Höchstens zwei Zellen werden inspiziert. Hashing Cuckoo Hashing 74 / 74 Cuckoo Hashing (2/2) Cuckoo Hashing hasht direkt in die Tabellen. Die remove-Operation ist aber mit Leichtigkeit implementierbar. Eine worst-case Garantie für lookup und remove: Höchstens zwei Zellen werden inspiziert. Nur die insert-Operation ist komplizierter: I I Der Auslastungsfaktor λ sollte kleiner als 12 sein. Es kann gezeigt werden, dass die erwartete Anzahl getesteter 1 ) beträgt. Zellen höchstens O(1 + 0.5−λ Hashing Cuckoo Hashing 74 / 74 Cuckoo Hashing (2/2) Cuckoo Hashing hasht direkt in die Tabellen. Die remove-Operation ist aber mit Leichtigkeit implementierbar. Eine worst-case Garantie für lookup und remove: Höchstens zwei Zellen werden inspiziert. Nur die insert-Operation ist komplizierter: I I I Der Auslastungsfaktor λ sollte kleiner als 12 sein. Es kann gezeigt werden, dass die erwartete Anzahl getesteter 1 ) beträgt. Zellen höchstens O(1 + 0.5−λ Wenn die insert Prozedur nach M Iterationen nicht erfolgreich ist, dann wird der zuletzt herausgeworfene Schlüssel in einer „Liste von Fehlversuchen“ abgelegt. Hashing Cuckoo Hashing 74 / 74 Cuckoo Hashing (2/2) Cuckoo Hashing hasht direkt in die Tabellen. Die remove-Operation ist aber mit Leichtigkeit implementierbar. Eine worst-case Garantie für lookup und remove: Höchstens zwei Zellen werden inspiziert. Nur die insert-Operation ist komplizierter: I I I Der Auslastungsfaktor λ sollte kleiner als 12 sein. Es kann gezeigt werden, dass die erwartete Anzahl getesteter 1 ) beträgt. Zellen höchstens O(1 + 0.5−λ Wenn die insert Prozedur nach M Iterationen nicht erfolgreich ist, dann wird der zuletzt herausgeworfene Schlüssel in einer „Liste von Fehlversuchen“ abgelegt. Welche Hashfunktionen? Hashing Cuckoo Hashing 74 / 74 Cuckoo Hashing (2/2) Cuckoo Hashing hasht direkt in die Tabellen. Die remove-Operation ist aber mit Leichtigkeit implementierbar. Eine worst-case Garantie für lookup und remove: Höchstens zwei Zellen werden inspiziert. Nur die insert-Operation ist komplizierter: I I I Der Auslastungsfaktor λ sollte kleiner als 12 sein. Es kann gezeigt werden, dass die erwartete Anzahl getesteter 1 ) beträgt. Zellen höchstens O(1 + 0.5−λ Wenn die insert Prozedur nach M Iterationen nicht erfolgreich ist, dann wird der zuletzt herausgeworfene Schlüssel in einer „Liste von Fehlversuchen“ abgelegt. Welche Hashfunktionen? Wähle 0 < a1 , a2 , a3 < m · 2w zufällig und setze h(x) = fa1 (x) ⊕ fa2 (x) ⊕ fa3 (x), wobei Hashing Cuckoo Hashing 74 / 74 Cuckoo Hashing (2/2) Cuckoo Hashing hasht direkt in die Tabellen. Die remove-Operation ist aber mit Leichtigkeit implementierbar. Eine worst-case Garantie für lookup und remove: Höchstens zwei Zellen werden inspiziert. Nur die insert-Operation ist komplizierter: I I I Der Auslastungsfaktor λ sollte kleiner als 12 sein. Es kann gezeigt werden, dass die erwartete Anzahl getesteter 1 ) beträgt. Zellen höchstens O(1 + 0.5−λ Wenn die insert Prozedur nach M Iterationen nicht erfolgreich ist, dann wird der zuletzt herausgeworfene Schlüssel in einer „Liste von Fehlversuchen“ abgelegt. Welche Hashfunktionen? Wähle 0 < a1 , a2 , a3 < m · 2w zufällig und setze h(x) = fa1 (x) ⊕ fa2 (x) ⊕ fa3 (x), wobei fa (x) = (a · x mod m · 2w ) div 2w . Hashing Cuckoo Hashing 74 / 74