6 Datenbank-Technologien zur Realisierung von technischen In

Werbung
6
Datenbank-Technologien zur Realisierung von technischen Informationssystemen
... Bedeutung von Datenbank-Technologien im Rahmen von technischen Informationssystemen verdeutlichen bzw. hervorheben
Umfang: 2 SWS
Zielstellung:
Titel der Folie:
Gliederung
Folie:

Ruckblick bzw. grober Uberblick
uber DB-Technologien geben
☞ Betonung liegt dabei auf den relationalen DBMS aufgrund ihrer Bedeutung in der
Praxis
verteilte Datenbanksysteme

☞ einen ersten Uberblick
bzw. Einleitung geben
foderierte Datenbanksysteme

☞ einen ersten Uberblick
bzw. Einleitung geben
verwendete Literatur ...
{
{
{
{
und A. Heuer: Datenbanken: Konzepte und Sprachen. MITP-Verlag
G. Saake und A. Heuer: Datenbanken: Implementierungstechniken. MITP
P. Dadam: Verteilte Datenbanken und Client/Server-Systeme: Grundlagen, Konzepte und Realisierungsformen. Springer-Verlag
S. Conrad: F
oderierte Datenbanksysteme: Konzepte der Datenintegration. SpringerVerlag
G. Saake
Erg
anzungen:
keine
Titel der Folie:
Ohne Datenbanken
Folie:
Individual-, Basis- oder Anwendungssoftwaresysteme verwalten ihre die Daten in ihren
eingenen (Datei-) Formaten
☞ vgl. Text-, Buchhaltungs- oder CAD-(Software-) Systeme
➥ Daten sind redundant: mehrfach gespeichert; Probleme: Verschwendung von Speicherplatz,

"Vergessen\ von Anderungen; keine zentrale, "genormte\ Datenhaltung
keine eÆziente Verarbeitung von groen Mengen von Daten moglich
mehrere Benutzer oder Anwendungen konnen nicht parallel auf den gleichen Daten "arbeiten\, ohne sich gegenseitig zu storen
Anwendungsprogrammierer / Benutzer konne Anwendungen nicht programmieren / benutzen, ohne
{
interne Darstellung der Daten
c M. Endig (23. Januar 2002)
6-1
{
Speichermedien oder Rechner (bei verteilten Systemen)
zu kennen (Datenunabhangigkeit) nicht gewahrleistet
Datenschutz und Datensicherheit sind nicht gewahrleistet
Erg
anzungen:
keine
Titel der Folie:
Mit Datenbanken
Folie:
gesamte Individual-, Basis- oder Anwendungssoftwaresysteme arbeiten auf denselben Daten (Datenbankentwurf, Datendenition)
auch andere Probleme (EÆzienz, Parallelitat, Datenschutz, Datensicherheit) werden gelost
{
{
{
{
DBS konnen groe Datenmengen eÆzient verwalten (Anfragesprachen, Optimierung)
Benutzer konnen parallel auf Datenbanken arbeiten (Transaktionskonzept)
Datenunabhangigkeit durch 3-Ebenen-Konzept
Datenschutz (kein unbefugter Zugri) und Datensicherheit (kein ungewollter Datenverlust) werden vom System gewahrleistet
☞ Grundprinzip moderner Datenbanksysteme
{
{
3-Ebenen-Architektur (physische Datenunabhangigkeit { konzeptionelle Sicht auf Daten ist unabhangig von ihrer Speicherung, logische Datenunabhangigkeit { koppelt die

DB von Anderungen
der Anwendungsschnittstelle ab)
Trennung zwischen Schema (Tabellenstruktur) und Instanz (Tabelleninhalt)
Erg
anzungen:
keine
Titel der Folie:
Datenbanken { Allgemein
Folie:
Grundprinzipien sind an die 9 Codd'sche Regeln angelehnt ☞ bekannt ;-)
Architektur eines Datenbanksystems (Systemarchitektur)
Externe Ebene
Konzeptuelle Ebene
Interne Ebene
3-Ebenen-Schema-Architektur
Anfragen
Optimierer
Auswertung
Plattenzugriff
Updates
Prozeß 1
Data Dictionary
DB-Operationen
Einbettung
Prozeß n
Masken
Sichtendefinition
Dateiorganisation
Datendefinition
c M. Endig (23. Januar 2002)
6-2
Erg
anzungen:
keine
Titel der Folie:
Wie werden aber nun Datenbank-Anwendungen realisiert?
Folie:
vom Standpunkt der Anwender folgende Forderungen an eine Speicherung von Daten
{
eÆziente Gewinnung von Daten aus der DB
{
Qualitat der Daten (heute und in der Zukunft) soll gewahrleistet werden
{
keine Redundanz von Daten
➥ die Entwurfsaufgabe bzw. Anforderungen an den Entwurfsproze bspw. hinsichtlich
{
Informationserhalt ... Erhaltung der ursprunglichen Modellierung der Daten
{
Konsistenzerhaltung ... Regeln und Einschrankung an die Daten
{
Redundanzfreiheit ... Daten nur einmal speichern
{
Vollstandigkeit bezuglich Anforderungsanalyse
{
Konsistenz des Beschreibungsdokuments
{
weitere Qualitatsmerkmale ... Unterstutzung von Erweiterbarkeit, Modularisierung,
Wiederverwendbarkeit usw.
☞ Einf
uhrung eines Phasenmodells zum Datenbank-Entwurf
{
analog zum allgemeinen Sw-Entwurf
Erg
anzungen:
keine
Titel der Folie:
Phasenmodell zum DB-Entwurf
c M. Endig (23. Januar 2002)

➠ Uberblick
6-3
Fachproblem
Anforderungsanalyse
Informationsanalyse
Funktionsanalyse
Entwurf der Funktionen
mit Methoden aus dem
Software Engineering
konzeptioneller (Schema-) Entwurf
Sichtenentwurf
Abgleichen der beiden
Entwurfsteile
Sichtenanalyse
Sichtenintegration
konzeptionelles Gesamtschema
Verteilungsentwurf
logischer Entwurf
Datendefinition
physischer Entwurf
Implementierung & Wartung
Folie:
Erg
anzungen:
keine
Titel der Folie:
Phasen des DB-Entwurfs & Realisierungsmodelle (1)
Folie:
Anforderungsanalyse ...
Vorgehensweise ... Sammlung von Informationsbedarfs in den Fachabteilungen (☞
nicht formalisiert, unvollstandig, widerspruchlich)
{ Ergebnis ... informale Beschreibung des Fachproblems und vor allem Trennung der
Informationen uber die Daten von den Informationen u ber die Funktionen
☞ Klassischer\ DB-Entwurf (nur Datenanalyse) vs. Funktionsentwurf (☞ Vorlesung {
"
Methode des Software Engineering)
{
Konzeptioneller Entwurf ...
c M. Endig (23. Januar 2002)
6-4
{
{
{
erste formale Beschreibung des Fachproblems
Sprachmittel ... semantisches Datenmodell wie ER-, EER-Modelle, aber auch objektorientierte Modelle (vgl. UML) ☞ Vorlesung
Vorgehensweise ... Modellierung von Sichten ) Analyse der vorliegenden Sichten
in Bezug auf Konikte (Namens-, Typ- oder Strukturkonikte) ) Integration der
➠
Sichten in ein Gesamtschema
Erg
anzungen:
keine
Titel der Folie:
Phasen des DB-Entwurfs & Realisierungsmodelle (2)
Folie:
Konzeptioneller Entwurf ... (weiter)
☞ Ergebnis ... konzeptionelles Gesamtschema, zum Beispiel in Form eines EER-Diagramms
Verteilungsentwurf ...
wenn die Daten auf mehreren Rechner verteilt vorliegen sollen, mu die Art und Weise
der verteilten Speicherung festgelegt werden
☞ Vorlesung { verteilte Datenbanksysteme
{
logischer Entwurf ...
{
{
Sprachmittel ... Datenmodell des ausgewahlten Realisierungs-\ DBMS, zum Beispiel
"
das Relationale Modell, Netzwerkmodell, hierarchische Modell oder objektorientierte
Modelle
Vorgehensweise ... (automatische) Transformation des konzeptionellen Schemas )
Verbesserung des relationalen Schemas anhand von Gultigkeitskriterien wie Norma➠
lisierung oder Minimierung
Erg
anzungen:
keine
Titel der Folie:
Phasen des DB-Entwurfs & Realisierungsmodelle (3)
Folie:
logischer Entwurf ... (weiter)
{
Datendenition ...
{
{
{
{
Ergebnis ... logisches Schema, zum Beispiel eine Sammlung von Relationenschemata
Umsetzung des logischen Schemas in ein konkretes Schema
Sprachmittel ... DDL und DML eines DBMS
Vorgehensweise ... DB-Deklaration in der DDL des DBMS ) Realisierung der Integritatssicherung ) Denition der Benutzersichten
Ergebnis ... konkretes DB-Schema fur implementiertes DBMS
Physischer Entwurf ...
{
Erganzung des physischen Entwurfs um Zugrisunterstutzung bzgl. EÆzienzverbesserung, zum Beispiel Denition von Indexen
c M. Endig (23. Januar 2002)
6-5
{
{
Sprachmittel ... Speicherstruktursprache SSL
Ergebnis ... physisches Schema der 3-Ebenen-Schemaarchitektur
➠
Erg
anzungen:
DDL ... Data Denition Language
DML ... Data Manipulation Language
Titel der Folie:
Phasen des DB-Entwurfs & Relationenmodell
Folie:
Implementierung und Wartung ...
{
Phasen ... Wartung, weitere Optimierung der physischen Ebene, Anpassung an neue
Anforderungen und Systemplattformen, Portierung auf neue DBMS, usw.
aufgrund seiner Bedeutung ☞ Relationenmodell
{
einfaches und exaktes Datenbankmodell fur die Realisierung
Relationenname
R
A1
...
...
Attribute (+ Wertebereiche)
An
...
Tupel
Erg
anzungen:
} Relationenschema
Relation
...
keine
Titel der Folie:
Relationenmodell
Folie:
☞ eine Relation ist eine Menge von Tupeln, d.h. es existieren keine zwei Tupel mit identischen
Werten fur alle Attribute eines Relationenschemas
um Konsistenz in Relationen sicherzustellen, ist eine identizierende Attributmenge fur
Relationenschema anzugeben
☞ eindeutige Identizierung von Tupeln moglich
wichtige Begrie ...
{
{
{
Schlussel ... ist minimal, identizierende Attributmenge
Primarschlussel ... ausgezeichneter Schlussel
Fremdschlussel ... Primarschlussel eines Relationenschema R1 in einem Relationenschema R2
Relationenmodell beinhaltet u.a. einen Satz von im Modell implizit enthaltenden Operationen, d.h. Semantik der Operationen nicht anwendungsspezisch
c M. Endig (23. Januar 2002)
6-6
☞ gehort zu den Konzepten des Relationenmodells
Erg
anzungen:
keine
Titel der Folie:
Relationenalgebra
Folie:
Operationen
{
{
{
{
{
Selektion
w
ahlt Tupel eine Relation aus
Projektion
w
ahlt bestimmte Spalten einer Tabelle aus; Auswahl von relevanten Attributen
durch Aufzahlung
Verbund (besser naturlicher Verbund)
Verkn
upfung zwei Relationen uber alle gemeinsamen Attribute; Tupel mit gemeinsamen Werten werden verbunden
TS
Mengenoperationen , , {
☞ Relation ist eine Menge von Tupeln
Umbenennung
bezieht sich auf die Umbenennung von Attributen; wichtig ... nur Schema
ande
rungen und keine Relationen-Anderung
Erg
anzungen:
keine
Titel der Folie:
Structured Query Language (SQL) - Sprache fur relationale DBS
Folie:
SQL ist ein Standard fur DB-Sprachen; genormt in ANSI & ISO
hat ganz unterschiedliche Aufgaben - SQL ist ...
{
{
{
{
{
{
DDL
bspw. [createjalterjdrop] table
Anfragesprache
bspw. select * from table
Sichtendenitionssprache
bspw. [createjdrop] view
Sprache zur Denition von Dateiorganisationsformen
Zugrispfade
Sprache zur Beschreibung von Datenmanipulationen
insert into table
mit dieser Sprache lassen sich relationale Datenbanken
{
{
{
erzeugen
"mit Daten fullen\
eÆzient unabhangig von einer konkreten Anwendung abfragen
☞ in der Praxis hat der Einsatz von relationalen DB und SQL groe Bedeutung erlangt
c M. Endig (23. Januar 2002)
6-7
Erg
anzungen:
keine
Titel der Folie:

Uberleitung
Folie:
bisher ... Entwurf und Realisierung von Datenbank-Anwendungen aus Datensicht
☞ zentrale Betrachtung der Datenbestande als eine Einheit
in der Praxis hat dies dazu gefuhrt, da eine Vielzahl von riesigen und autonomen Datenbestanden verwaltet werden
☞ dieses f
uhrt zunehmend zu Problemen
Grunde hierfur (Auswahl) ...
{
{
{
{
es werden an einem lokalen Standort Daten verwaltet, die da gar nicht benotigt
werden { Ist das sinnvoll (! EÆzienz)?
Unternehmen fusionieren { Was passiert mit den autonom vorhandenen Datenbestanden?
an einem lokalen Standort eines Unternehmens werden Daten benotigt, die an einem
anderen Standort verwaltet werden { Was ist nun?
aus dem Sw-Engineering ... verteilte Softwaresysteme vs. zentrale Datenhaltung
➥ Einf
uhrung von unterschiedlichen DBS-Architekturen
Erg
anzungen:
➠
keine
Titel der Folie:
Einleitung (1)
Folie:
zwei unterschiedliche Datenbanksystem-Architekturen moglich
{ Verteiltes Datenbanksystem (VDBS)
verteilte Realisierung eines (einheitlichen) DBS
{ F
oderiertes Datenbanksystem (FDBS)
Integration bestehender, oft heterogener DBSe zu einem System
Zugri auf logisch integrierten Datenbestand (im Gegensatz zu physisch integrierten, d.h. materialisierten Datenbestand z.B. in Data Warehouses)
☞ zentrale Gemeinsamkeit
verteilte Speicherung von Daten
{ generelles Ziel ...
☞ Integration von (autonomen) Datenbestanden zur Schaung eines einheitlichen
Zugris unabhangig von der Art der Speicherung
eigentlich auch die Motivation f
ur die Entwicklung von DBS
☞ eigentlich zwei widerspr
uliche Ziele zum einen
deren Integration
c M. Endig (23. Januar 2002)
Verteilung/Dezentralisierung und zum an-
➠
6-8
Erg
anzungen:
keine
Titel der Folie:
Einleitung (2)
Folie:
Verteilung / Dezentralisierung
insbesondere bei Neuentwicklungen gilt ... verteilte Realisierung von Sw-Systemen
auf Basis verteilter (DB-) Systeme
➥ verteilte, aber kontrollierte Datenspeicherung ermoglicht bspw. Lastenverteilung, Nutzung von Parallelitat zur Verkurzung von Antwortzeiten, Erhohung der Ausfallsicherheit, ...
{
Integration
bei bestehenden Systemen ... verteilt gespeicherte und unabhangig voneinander verwaltete, aber inhaltlich zusammengehorige Daten wieder logisch zusammenzubringen
➥ einheitlicher Zugri auf Gesamtdatenbestand
{
fur beide Ziele gilt
{
{
technische Voraussetzung gegeben durch Moglichkeiten der Vernetzung heterogener
Rechner
entfernter Zugri auf Daten in der Regel eÆzient moglich
Erg
anzungen:
keine
Titel der Folie:
Verteilte Datenbanksysteme - Einleitung
Knoten 1
LDB 1
Knoten 2
Kommunikationsnetzwerk
Knoten 3
LDB 3
Folie:
Erg
anzungen:
LDB 2
Knoten 4
LDB 4.1
LDB 4.2
keine
Titel der Folie:
Anforderungen an verteilte Datenhaltung (1)
Folie:
Verteilungstransparenz ... das VDBS verbirgt die Verteilung vor dem Benutzer { es stellt
sich wie ein integriertes, zentrales DBMS dar
c M. Endig (23. Januar 2002)
6-9
Lokale Autonomie ... die einzelnen Knotenrechner sollten ein Maximum an Kontrolle uber
Unabhangigkeit von zentralen Systemfunktionen ... zentrale Systemfunktionen und zentrale
Hohe Verfugbarkeit ... der Datenbetrieb sollte auch bei Rechnerausfallen und Rekongu-
Ortstransparenz ... der Ort der Speicherung bestimmter Daten sollte vor dem Benutzer
die auf ihnen gespeicherten Daten behalten { so sollte der Datenzugri nicht von anderen
Rechnern abhangen
Datenstrukturen sind ein Flaschenhals in verteilten Systemen { hohe Verfugbarkeit und
Knotenautonomie sind neben dem Leistungsengpa weitere Grunde, die gegen zentrale
Dienste sprechen
ration des Netzes ununterbrochen gewahrleistet sein
verborgen sein
Erg
anzungen:
➠
keine
Titel der Folie:
Anforderungen an verteilte Datenhaltung (2)
Folie:
Partitionierungs-/Fragmentierungstransparenz ... die interne Aufteilung von Datenbankob-
jekten (etwa die Partitionierung einer Relation ☞ Vorlesung) sollte vor dem Benutzer
verborgen bleiben
Replikationstransparenz ... die Replikation von Daten zur Leistungssteigerung und zur
Verteilte Anfragebearbeitung ... die Anfragebearbeitung sollte verteilt erfolgen { die Reali-
Verteilte Transaktionsverwaltung ... auch im verteilten Szenario mu eine korrekte Trans-
Hardware-Unabhangigkeit ... die Datenbankverarbeitung sollte auf unterschiedlicher Hard-
Erhohung der Ausfallsicherheit betrit die interne Realisierung und sollte daher im Sinne
der Datenunabhangigkeit ebenfalls unsichtbar bleiben
sierung der verteilten Bearbeitung sollte durch einen Optimierer festgelegt und nicht dem
Benutzer aufgeburdet werden
aktionsverarbeitung garantiert werden
ware moglich sein
Erg
anzungen:
keine
Titel der Folie:
Anforderungen an verteilte Datenhaltung (3)
Folie:
Betriebssystemunabhangigkeit ... die Datenbankverarbeitung soll auch auf unterschiedli-
Netzwerkunabhangigkeit ... die Datenbankverarbeitung soll auf unterschiedlicher Netzwerk-
Datenbanksystemunabhangigkeit ... die Datenbankverarbeitung soll unter Nutzung unter-
chen Betriebssystemen moglich sein
technologie moglich sein
schiedlicher DBMS als Knoten-DBMS moglich sein { diese Forderung ist in der Regel
heutzutage nur bei unterschiedlichen SQL-Dialekten relationaler DBMS praktikabel
c M. Endig (23. Januar 2002)
6-10
Erg
anzungen:
keine
Titel der Folie:
Schema-Architektur fur VDBS
Externes Schema
Externes Schema
Globales konzeptuelles Schema
Fragmentierungsschema
Allokationsschema
Tranformationsschema
Lokales
konzeptuelles Schema
Tranformationsschema
...
Lokales
konzeptuelles Schema
Internes Schema
Internes Schema
DB 1
DB n
Folie:
Erg
anzungen:
Komponenten-DBMS
Verteilung auf
die verschied.
Rechnerknoten
Globales Schema
Fragmentierung
der Relationen
keine
Titel der Folie:
Einwurf verteilter Datenbanken - Einfuhrung (1)
Folie:
Partitionierung (oft auch als Fragmentierung bezeichnet)
{
{
{
Aufteilung von Relationen auf n andere Relationen, bspw. mit dem Ziel der Erhohung
der EÆzienz des Zugries
keine redundante Datenhaltung
es sind bei u.a. die folgenden Formen denktbar
horizontale Partitionierung ... Aufteilung einer Relation in n Relationen, wobei
dies durch Denition von Selektionspradikaten erreicht wird, d.h. Auswahl spezieller Tupelmengen
vertikale Partitionierung ... Aufteilung einer Relation in n Relationen, wobei dies
durch Denition von Projektionen erreicht wird, d.h. Auswahl von Attributmengen
Mischformen ... Mischung aus horizontaler und vertikaler Partitionierung durch
beliebige Schachtelung von Selektionen und Projektionen
Allokation
c M. Endig (23. Januar 2002)
6-11
{
legt fest, auf welche Rechnerknoten, welche Partition gehalten werden soll
Erg
anzungen:
➠
keine
Titel der Folie:
Einwurf verteilter Datenbanken - Einfuhrung (2)
Folie:
Allokation ... (weiter)
{
{
Plazierungsaspekte dabei sind u.a.
EÆzienz ... wie Minimierung von Remote-Zugri-Kosten, Vermeidung von Engp
assen
(Kommunikationssystem, lokaler Rechner)
Datensicherheit ... wie Auswahl von Knoten hinsichtlich Verl
alichkeit, redundante Speicherung von Daten
➥ zwei einander entgegenwirkende Ziele!!
Unterscheidung in ...
nicht-redundante Allokation
redundante Allokation
moglich
Replikation
{
wird ein Fragment mittels der Allokation auf mehrere Rechnerknoten verteilt, dann
➠
wird von Replikation gesprochen
Erg
anzungen:
keine
Titel der Folie:
Einwurf verteilter Datenbanken - Einfuhrung (3)
Folie:
Replikation ... (weiter)
Ergebnis ... redundante, gewunschte Datenhaltung
➥ Zielkonikt bei Replikation
{
Erhohung der ZugriseÆzienz, Verfugbarkeit und Autonomie ... ➥ groe Anzahl
von Replikaten auf moglichst vielen Rechnerknoten
Erhaltung der Datenkonsistenz ... ➥ groe Anzahl von Replikaten { alle Replikate
moglichst synchron aktualisieren

Erh
ohung der EÆzienz bei Anderungsoperationen
auf Daten ... ➥ kleine Anzahl
von Replikaten wunschenswert { nur wenige Replikate (eventuell nur ein Replikat)
synchron aktualisiert
Replikationskontrolle { Wie kann Replikation durchgefuhrt werden?
es gibt verschiedenste Verfahren wie ...
Master-Slave-Verfahren, speziell das Primary-Copy-Verfahren, in dem immer ein
ausgezeichnetes Replikat, die Primarkopie aktualisiert wird
➠
{
Erg
anzungen:
keine
Titel der Folie:
Einwurf verteilter Datenbanken - Einfuhrung (4)
Folie:
c M. Endig (23. Januar 2002)
6-12
Replikation ... (weiter)
{
Replikationskontrolle ... (weiter)
Master-Slave-Verfahren ... (weiter)

Anderungen
zunachst auf der Primarkopie

andere Anderungen werden zu einem sp
ateren Zeitpunkt asynchron nachgeholt
☞ Anfrageoperationen d
urfen jedoch auf den (eventuell nicht ganz aktuellen)
Replikaten arbeiten, so da die Konsistenz der Daten innerhalb von Anfragen
nicht unbedingt gewahrleistet ist.
Abstimmungsverfahren, speziell das Majority-Consensus-Verfahren, in dem die
einzelnen Knoten an einer Abstimmung (voting) teilnehmen
Abstimmung, ob Zugri auf replizierte Daten aus einem der Knoten erlaubt
werden kann
wenn entscheidungsf
ahige Anzahl (das Quorum) zustimmt, Zugri ausfuhren
Unterscheidung zwischen Lesequorum f
ur lesende und Schreibquorum fur
schreibende Zugrie
Erg
anzungen:
keine
Titel der Folie:
Weitere Aspekte von VDBS (1)
Folie:
Verteilter Katalog (bzw. Data Dictionary) { verschiedene Realisierungsmoglichkeiten
{
{
{
{
zentralisierter Katalog ... auf genau einem Rechnerknoten zentral gehalten
vollredundanter Katalog ... vollstandig auf allen Knoten repliziert
Cluster-Katalog oder Mehrfachkatalog ... Kompromi zwischen den ersten beiden
Vorschlagen, falls das Netz in Teilnetze untergliedert ist
ausschlielich lokale Kataloge ... die mit Sichtenmechanismus zu einem virtuellen
globalen Katalog integriert werden
verteilte Anfragebearbeitung ...
{
Verteilung von Teilanfragen
Globale Anfrage mu auf die verschiedenen Teilsysteme aufgeteilt werden (der
Benutzer sieht die Verteilung nicht!)
jedes Teilsystem hat (i.d.R.) volle Funktionalit
at, um lokale Anfragen zu bearbeiten
Ergebnisse der Teilanfragen m
ussen dann zusammengesetzt und an den Benutzer
ubergeben werden
➠
Erg
anzungen:
keine
Titel der Folie:
Weitere Aspekte von VDBS (2)
Folie:
verteilte Anfragebearbeitung ... (weiter)
{
Berucksichtigung der Kommunikationskosten
c M. Endig (23. Januar 2002)
6-13
bei zentralem DBS fallen kaum gewichtige Kommunikationskosten an ... werden
bei der Optimierung daher nicht berucksichtigt
Optimierungsverfahren fur VDBS mussen Kommunikationskosten berucksichtigen
Optimierungsheuristiken zentraler DBS ("moglichst wenig Seitenzugrie\) mu
gegen Kommunikationsheuristiken ("moglichst wenige Daten von Rechner zu
Rechner transportieren\) abgewogen werden
verteilte Transaktionen
{
{
verteiltes Commit
Zwei-Phasen-Commit-Protokoll
Drei-Phasen-Commit-Protokoll
verteilte Synchronisation
verteilte Zeit-Marken-Verfahren
Erg
anzungen:
keine
Titel der Folie:
Weitere Aspekte von VDBS (3)
Folie:
verteilte Transaktionen ... (weiter)
{
{
verteilte Deadlock-Erkennung und -Behandlung
Erkennung u.a. durch
Time-Out-Mechanismus
Globalen Deadlock-Graph
Konservatives Sperren
☞ es gibt sicherlich noch vielmehr, was erwahnt werden m
ute
➠ Literatur
➠ abschlieend auf Foderierte Datenbanksysteme eingehen
Erg
anzungen:
keine
Titel der Folie:
Foderierte Datenbanksysteme { Einfuhrung (1)
Folie:
Was ist ein foderiertes Datenbanksystem?
{
{
{
Ursprung des Begris "Foderation\ ☞ Politik
Bezeichnung fur bestimmte politische Ordnung von Staaten und Staatenverbunden
Beispiel ... Bundesrepublik Deutschland
Bundesl
ander mit eigener Gesetzgebung und Rechtssprechung

f
oderaler Zusammenschlu mit Ubertragung
einiger Aufgaben und Kompetenzen
auf den Bund als ubergeordnete Institution
Anerkennung gemeinsamer Regeln (Grundgesetz, Bundesgesetze, usw.)
c M. Endig (23. Januar 2002)
6-14
☞ Bundeslander sind nur teilweise autonom
☞ Konikte durch konkurrierende Gesetzgebung
{
verschiedene politische Foderation, abhangig davon ...
welche Aufgaben und Kompetenzen auf die jeweilige f
oderale Institution ubertragen werden (☞ Grad der verbleibenden Autonomie)
wie heterogen die internen Strukturen der beteiligten (Teil-) Staaten sind (☞
Grad der Heterogenitat)
Erg
anzungen:
keine
Titel der Folie:
Foderierte Datenbanksysteme { Einfuhrung (2)
Folie:

zentrale resultierende Frage ☞ Ubertragbarkeit
auf Datenbanksysteme??
allgemeine Architektur foderierter Datenbanksysteme ➠
Globale
Anwendungen
Globale
Anwendungen
Föderierungsdienst
Lokale
Anwendungen
DBMS 1
...
DBMS n
DB 1
DB n
KomponentenDBS 1
KomponentenDBS n
Lokale
Anwendungen
Förderiertes Datenbanksystem
Erg
anzungen:
keine
Titel der Folie:
Foderierte Datenbanksysteme { Einfuhrung (3)
Folie:
erste Frage ... Welche Funktionalitat mu ein foderiertes System bieten?
{
{
Foderierte DBS als "Idealbild\ bieten volle Datenbankfunktionalitat, so da globale
Anwendungen den Eindruck haben, mit einem einzigen DBS zu arbeiten
dazu gehort (u.a.) ...
(globale) Transaktionsverwaltung
(globale) Anfragebearbeitung und -optimierung
(globale) Integrit
atskontrolle
Recovery usw.
auf globaler Ebene (im Foderierungssystem)
Aufwand beim Aufbau eines foderierten DBS?
☞ ideales Foderiertes DBS ... sehr hoher Aufwand
➥ pragmatischer Ansatz ... nur realisieren, was an Funktionalitat benotigt wird!
☞ hangt vom Anwendungsgebiet ab!
c M. Endig (23. Januar 2002)
6-15
Erg
anzungen:
keine
Titel der Folie:
Einsatzgebiete und Anwendungsszenarien (1)
Folie:
Betrachtung eines ausgewahlten Einsatzgebiets fur Datenbank-Foderation
☞ Integration bereits existierender Datenbestande
➠ es gibt noch mehr (Literatur)
typische Situation in Unternehmen und anderen Organisationen
{
{
unabhangig voneinander entstandene Datenbestande in Abteilungen, usw. mit teilweise redundanten Daten (☞ Inkonsistenzen moglich) und unterschiedlicher Strukturierung gleich(artig)er Daten
autonome Entscheidungen u ber die Anschaung von Hard- und Software fuhrt zu
Insellosungen mit keiner Moglichkeit zum einheitlichen Zugri auf alle Daten
➥ Ziel ... Integration lokaler Datenbestande in einem Unternehmen
Anforderungen an ein solches System, das integrierte globale Sicht verwaltet
Erg
anzungen:
➠
keine
Titel der Folie:
Einsatzgebiete und Anwendungsszenarien (2)
Folie:
keine Einschrankung der Autonomie lokaler Systeme
☞ Erhalt der lokalen Anwendungen ohne Veranderung
globale Integritatsuberwachung (in gewissen Umfang) ... beinhaltet Mechanismen zur Kon-
globale Transaktionsverwaltung ... fur globale Anwendungen, die auf gemeinsame Daten
Verteilungstransparenz ... globale Benutzer / Anwendungen sollen nicht u ber die verteilte

sistenzkontrolle redundanter Daten auf globaler Ebene und ggf. auch Uberwachung
existentieller oder anderer Abhangigkeiten zwischen Daten aus verschiedenen lokalen Systemen
zugreifen und diese manipulieren
Datenspeicherung Bescheid wissen mussen
Erg
anzungen:
keine
Titel der Folie:
FDBS - Begrie
Folie:
charakteristische Eigenschaften von FDBS
{
{
Verteilung
☞ Partitionierung, Redundanz und Replikation
Heterogenitat
heterogene DBS
c M. Endig (23. Januar 2002)
6-16
☞ Heterogenitat auf verschiedenen Systemebenen (Datenmodell, Datenmanipu-
lationssprache, Transaktionsmanagement, Integritatskontrolle, ...)
semantische Heterogenitat
☞ Unterschiede hinsichtlich der Bedeutung von Daten und ihrer Verwendung
durch Anwendungssysteme
{
Autonomie
Entwurfsautonomie ... Unabhangigkeit des Datenbankentwurfsprozesses & Schema
Kommunikationsautonomie ... bezogen auf vorhandene Komponentensysteme

Ausfuhrungsautonomie ... bezogen auf die auszufuhrenden Anfragen und Anderungen
Erg
anzungen:
keine
Titel der Folie:
FDBS - Architekturen
Folie:
☞ in der Literatur werden unterschiedliche Schema-Architekturen f
ur FDBS vorgeschlagen
(Ausgangspunkt 3-Ebenen-Schema-Architektur fur traditionelle, zentrale DBS)
{
Import-/Export-Schema-Architekturen
☞
privates Schema (lokale, konzeptionelle Schema) ! Exportschema (beschreibt die
Daten, die bereitgestellt werden) ! Importschema (beschreibt die von anderen
System importierten Daten)
{
Multidatenbank-Architektur
☞
physisches Schema (internes/physisches Schema eine DBS) ! internes logisches
Schema (lokales konzeptionelles Schema eines DBS) ! konzeptionelles Schema
(lokales externes Schema eines DBS) ! Externes Schema ( Sichtendenition\ die
"
ggf. auf mehrere konzeptionelle Schemata basiert)
➥
{
Abhangigkeitsschema (Beschreibung von Inter-Datenbank-Abhangigkeiten und
Denition zusatzlicher globaler Integritatsbedingungen)
5-Ebenen-Schema-Architektur
Erg
anzungen:
keine
Titel der Folie:
5-Ebenen-Schema-Architektur (Bild)
c M. Endig (23. Januar 2002)
➠
6-17
externes Schema
externes Schema
föderiertes Schema
Exportschema
Exportschema
Komponentenschema
Komponentenschema
lokales Schema
lokales Schema
Datenbank
Datenbank
Folie:
Erg
anzungen:
keine
Titel der Folie:
5-Ebenen-Schema-Architektur (Erlauterungen)
Folie:
lokales Schema ... lokales konzeptionelles Schema eines DBS; ausgedruckt im lokalen Da-
Komponentenschema ... Transformation des lokalen Schemas in ein globales Datenmodell;
Exportschema ... enthalt die Teile des Komponentenschemas, die an die Foderierungs-
foderiertes Schema ... integrierte Sicht auf alle gegebenen Exportschemata; beseitigt Red-
externes Schema ... Sicht auf foderiertes Schema fur bestimmte Anwendungen / Benutzer;
tenmodell des DBS
ist uberussig, wenn lokales Datenmodell gleichzeitig auch globales Datenmodell
schicht exportiert werden und auf die globale Anwendungen zugreifen durfen
undanzen in den Exportschemata; lost strukturelle Unterschiede und sonstige Konikte
zwischen den Exportschemata auf
wie externes Schema in der traditionellen 3-Ebenen-Schema-Architektur
Erg
anzungen:
keine
Titel der Folie:
Foderierter Datenbankentwurf - Weitere Aspekte (1)
Folie:
allgemeine Problemstellung
☞ Integration bestehender Schemata ... Heterogenitat aufgrund der Entwurfsautonomie
{
{
{
uberlappende Modellierungsbereiche
verschiedene Datenmodelle
verschiedene Modellierungskonstrukte
c M. Endig (23. Januar 2002)
6-18
{
{
verschiedene Modellierungsperspektiven, d.h. verschiedene Sichten der DB-Entwerfer
...
Einfuhrung verschiedener Integritatsstrategien wie top-down-Verfahren, bei dem ein Referenzschema als integriertes Schema vorgegeben wird
Integrationsproze grob in 2 Phasen
{

Vorintegrationsphase ... nden aller Ubereinstimmungen
und Unterschiede zwischen
den lokalen Schemata
{ Integrationsphase ... in der das integrierte Schema erzeugt wird
➥ Ergebnis der Integration ist nicht eindeutig bestimmt
Erg
anzungen:
keine
Titel der Folie:
Foderierter Datenbankentwurf - Weitere Aspekte (2)
Folie:
Klassikation von Integrationskonikten
{
{
{
{
Extensionale Konikte
☞ semantisch u
berlappende Weltausschnitte mit einander entsprechenden Klassen
... Problem oft nicht genau die gleiche Menge von Reale-Welt-Objekten reprasentiert
Beschreibungskonikte
☞ unterschiedliche Eigenschaften / Attribute derselben Objekte in den lokalen Schemata oder auch homonyme und synonyme Bezeichnungen
Heterogenitatskonikte
☞ unterschiedliche Datenmodelle der zu integrierenden Schemata
Strukturelle Konikte
☞ selbst bei Verwendung desselben Datenmodells oft unterschiedliche Modellierung
eines Sachverhaltes
Erg
anzungen:
keine
Titel der Folie:
Zusammenfassung
Folie:
Bedeutung der Datenbank-Technologie im Rahmen der Entwicklung von technischen Informationssystemen hervorheben
☞ Einsatz von relationalen Datenbanksystemen ist in der Praxis etabliert
moderne Anforderungen von Unternehmen haben zur Entwicklung weiterer DB-Technologien
gefuhrt
{
Verteilte DBS
Ziel ... Verteilung eine Datenbank-Schemas auf unterschiedliche Knoten innerhalb
eines Netzwerkes
horizontale und vertikale Partitionierung / Replikation
c M. Endig (23. Januar 2002)
6-19
{
Foderierte DBS
Ziel ... Integration von vorhandenen heterogenen Datenbest
anden
☞ f
ur die Prufung wichtig ...
{
{
Bedeutung von DBS im Rahmen der Entwicklung von TIS
Ziele und Prinzipien von verteilten und foderierten DBS
Erg
anzungen:
keine
c M. Endig (23. Januar 2002)
sollte man kennen
6-20
Herunterladen