Parallele Datenbanksysteme

Werbung
Distributed
Database Systems
Parallele Datenbanksysteme
von Stefan Schneider
Definition
Mehrere Computer über ein WAN oder
LAN verbunden
 Funktionsverteilung
 Billiger als Mainframesysteme

Datenbankserver
Verteiltes Datenbanksystem
Parallele Architektur


Problem des Flaschenhalses
Hohe Performance
 Parallelisierung
 Ladebalancierung


Hohe Verfügbarkeit
Erweiterbarkeit
 Rechenleistung
 Speicherkapazität
Subsysteme des parallelen
Datenbanksystems
Parallele Systemarchitektur
Effiziente Realisierung der Ziele
 Verbindung der einzelnen
Hardwarekomponenten
 Liegen zwischen zwei Extremen

 Shared
Memory
 Shared Nothing
Shared Memory
Vorteile
 Einfachheit
 Ladebalancierung
Nachteile
 begrenzte
Erweiterbarkeit
 hohe Kosten
NUMA Architektur



leicht erweiterbar
ist standardisiert
beste Wahl für
große Systeme
Data Placement
Query Parallelism
Intra-Operator Parallelisierung
 Inter-Operator Parallelisierung

 Pipeline-
Parallelisierung
 Independent- Parallelisierung
Kombination von Parallelisierungsarten
Parallel Query Optimization



Search Space
Cost Model
Search Strategy
Probleme bei der parallelen
Ausführung
Initialisierung
 Interferenz und Konvoieffekt

 Hardwareinterferenz
 Softwareinterferenz

Ladebalancierung
 Intra-Operator
Ladebalancierung
 Inter-Operator Ladebalancierung
Verteilte Objekte und Datenbank
Managementsysteme

unterstützt neue Applikationen
Computer Aided Design, Künstliche Intelligenz
unterstützen abstrakte Datentypen
 bewahrt die natürliche Struktur von
Objekten

Partitionierung
wegen komplexer Attribute
 wegen komplexer Methoden

Class Engine as Object
Attributes
No_cylinder : Integer
Cpacity : Real
Horsepower: Integer
Alternative Client/Server Architekturen
Objektmanagement

Object Identifier Management
 logische
Object Identifiers
 physikalische Object Identifiers


Pointer Swizzeling
Object Migration
 Quellcode
am Zielort neu kompilieren
 kompilierte Klasse wird übertragen
 nur Quellcode der Klasse übertragen
Distributed Object Storage

Object Clustering
 Decomposition
Storage Model (DSM)
 Normalized Storage Model (NSM)

Distributed Garbage Collection
 Reference
Counting
 Tracing Based
Zusammenfassung

Art der Datenbank
 relationale
 objektorientierte
Anzahl der User (Systemarchitektur)
 Art der Daten (Data Placement,
Organisation von objektorientierten
Datenbanken)

Herunterladen