6 Datenbank-Technologien zur Realisierung von technischen Informationssystemen ... Bedeutung von Datenbank-Technologien im Rahmen von technischen Informationssystemen verdeutlichen bzw. hervorheben Umfang: 2 SWS Zielstellung: Titel der Folie: Gliederung Folie: Ruckblick bzw. grober Uberblick uber DB-Technologien geben ☞ Betonung liegt dabei auf den relationalen DBMS aufgrund ihrer Bedeutung in der Praxis verteilte Datenbanksysteme ☞ einen ersten Uberblick bzw. Einleitung geben foderierte Datenbanksysteme ☞ einen ersten Uberblick bzw. Einleitung geben verwendete Literatur ... { { { { und A. Heuer: Datenbanken: Konzepte und Sprachen. MITP-Verlag G. Saake und A. Heuer: Datenbanken: Implementierungstechniken. MITP P. Dadam: Verteilte Datenbanken und Client/Server-Systeme: Grundlagen, Konzepte und Realisierungsformen. Springer-Verlag S. Conrad: F oderierte Datenbanksysteme: Konzepte der Datenintegration. SpringerVerlag G. Saake Erg anzungen: keine Titel der Folie: Ohne Datenbanken Folie: Individual-, Basis- oder Anwendungssoftwaresysteme verwalten ihre die Daten in ihren eingenen (Datei-) Formaten ☞ vgl. Text-, Buchhaltungs- oder CAD-(Software-) Systeme ➥ Daten sind redundant: mehrfach gespeichert; Probleme: Verschwendung von Speicherplatz, "Vergessen\ von Anderungen; keine zentrale, "genormte\ Datenhaltung keine eÆziente Verarbeitung von groen Mengen von Daten moglich mehrere Benutzer oder Anwendungen konnen nicht parallel auf den gleichen Daten "arbeiten\, ohne sich gegenseitig zu storen Anwendungsprogrammierer / Benutzer konne Anwendungen nicht programmieren / benutzen, ohne { interne Darstellung der Daten c M. Endig (23. Januar 2002) 6-1 { Speichermedien oder Rechner (bei verteilten Systemen) zu kennen (Datenunabhangigkeit) nicht gewahrleistet Datenschutz und Datensicherheit sind nicht gewahrleistet Erg anzungen: keine Titel der Folie: Mit Datenbanken Folie: gesamte Individual-, Basis- oder Anwendungssoftwaresysteme arbeiten auf denselben Daten (Datenbankentwurf, Datendenition) auch andere Probleme (EÆzienz, Parallelitat, Datenschutz, Datensicherheit) werden gelost { { { { DBS konnen groe Datenmengen eÆzient verwalten (Anfragesprachen, Optimierung) Benutzer konnen parallel auf Datenbanken arbeiten (Transaktionskonzept) Datenunabhangigkeit durch 3-Ebenen-Konzept Datenschutz (kein unbefugter Zugri) und Datensicherheit (kein ungewollter Datenverlust) werden vom System gewahrleistet ☞ Grundprinzip moderner Datenbanksysteme { { 3-Ebenen-Architektur (physische Datenunabhangigkeit { konzeptionelle Sicht auf Daten ist unabhangig von ihrer Speicherung, logische Datenunabhangigkeit { koppelt die DB von Anderungen der Anwendungsschnittstelle ab) Trennung zwischen Schema (Tabellenstruktur) und Instanz (Tabelleninhalt) Erg anzungen: keine Titel der Folie: Datenbanken { Allgemein Folie: Grundprinzipien sind an die 9 Codd'sche Regeln angelehnt ☞ bekannt ;-) Architektur eines Datenbanksystems (Systemarchitektur) Externe Ebene Konzeptuelle Ebene Interne Ebene 3-Ebenen-Schema-Architektur Anfragen Optimierer Auswertung Plattenzugriff Updates Prozeß 1 Data Dictionary DB-Operationen Einbettung Prozeß n Masken Sichtendefinition Dateiorganisation Datendefinition c M. Endig (23. Januar 2002) 6-2 Erg anzungen: keine Titel der Folie: Wie werden aber nun Datenbank-Anwendungen realisiert? Folie: vom Standpunkt der Anwender folgende Forderungen an eine Speicherung von Daten { eÆziente Gewinnung von Daten aus der DB { Qualitat der Daten (heute und in der Zukunft) soll gewahrleistet werden { keine Redundanz von Daten ➥ die Entwurfsaufgabe bzw. Anforderungen an den Entwurfsproze bspw. hinsichtlich { Informationserhalt ... Erhaltung der ursprunglichen Modellierung der Daten { Konsistenzerhaltung ... Regeln und Einschrankung an die Daten { Redundanzfreiheit ... Daten nur einmal speichern { Vollstandigkeit bezuglich Anforderungsanalyse { Konsistenz des Beschreibungsdokuments { weitere Qualitatsmerkmale ... Unterstutzung von Erweiterbarkeit, Modularisierung, Wiederverwendbarkeit usw. ☞ Einf uhrung eines Phasenmodells zum Datenbank-Entwurf { analog zum allgemeinen Sw-Entwurf Erg anzungen: keine Titel der Folie: Phasenmodell zum DB-Entwurf c M. Endig (23. Januar 2002) ➠ Uberblick 6-3 Fachproblem Anforderungsanalyse Informationsanalyse Funktionsanalyse Entwurf der Funktionen mit Methoden aus dem Software Engineering konzeptioneller (Schema-) Entwurf Sichtenentwurf Abgleichen der beiden Entwurfsteile Sichtenanalyse Sichtenintegration konzeptionelles Gesamtschema Verteilungsentwurf logischer Entwurf Datendefinition physischer Entwurf Implementierung & Wartung Folie: Erg anzungen: keine Titel der Folie: Phasen des DB-Entwurfs & Realisierungsmodelle (1) Folie: Anforderungsanalyse ... Vorgehensweise ... Sammlung von Informationsbedarfs in den Fachabteilungen (☞ nicht formalisiert, unvollstandig, widerspruchlich) { Ergebnis ... informale Beschreibung des Fachproblems und vor allem Trennung der Informationen uber die Daten von den Informationen u ber die Funktionen ☞ Klassischer\ DB-Entwurf (nur Datenanalyse) vs. Funktionsentwurf (☞ Vorlesung { " Methode des Software Engineering) { Konzeptioneller Entwurf ... c M. Endig (23. Januar 2002) 6-4 { { { erste formale Beschreibung des Fachproblems Sprachmittel ... semantisches Datenmodell wie ER-, EER-Modelle, aber auch objektorientierte Modelle (vgl. UML) ☞ Vorlesung Vorgehensweise ... Modellierung von Sichten ) Analyse der vorliegenden Sichten in Bezug auf Konikte (Namens-, Typ- oder Strukturkonikte) ) Integration der ➠ Sichten in ein Gesamtschema Erg anzungen: keine Titel der Folie: Phasen des DB-Entwurfs & Realisierungsmodelle (2) Folie: Konzeptioneller Entwurf ... (weiter) ☞ Ergebnis ... konzeptionelles Gesamtschema, zum Beispiel in Form eines EER-Diagramms Verteilungsentwurf ... wenn die Daten auf mehreren Rechner verteilt vorliegen sollen, mu die Art und Weise der verteilten Speicherung festgelegt werden ☞ Vorlesung { verteilte Datenbanksysteme { logischer Entwurf ... { { Sprachmittel ... Datenmodell des ausgewahlten Realisierungs-\ DBMS, zum Beispiel " das Relationale Modell, Netzwerkmodell, hierarchische Modell oder objektorientierte Modelle Vorgehensweise ... (automatische) Transformation des konzeptionellen Schemas ) Verbesserung des relationalen Schemas anhand von Gultigkeitskriterien wie Norma➠ lisierung oder Minimierung Erg anzungen: keine Titel der Folie: Phasen des DB-Entwurfs & Realisierungsmodelle (3) Folie: logischer Entwurf ... (weiter) { Datendenition ... { { { { Ergebnis ... logisches Schema, zum Beispiel eine Sammlung von Relationenschemata Umsetzung des logischen Schemas in ein konkretes Schema Sprachmittel ... DDL und DML eines DBMS Vorgehensweise ... DB-Deklaration in der DDL des DBMS ) Realisierung der Integritatssicherung ) Denition der Benutzersichten Ergebnis ... konkretes DB-Schema fur implementiertes DBMS Physischer Entwurf ... { Erganzung des physischen Entwurfs um Zugrisunterstutzung bzgl. EÆzienzverbesserung, zum Beispiel Denition von Indexen c M. Endig (23. Januar 2002) 6-5 { { Sprachmittel ... Speicherstruktursprache SSL Ergebnis ... physisches Schema der 3-Ebenen-Schemaarchitektur ➠ Erg anzungen: DDL ... Data Denition Language DML ... Data Manipulation Language Titel der Folie: Phasen des DB-Entwurfs & Relationenmodell Folie: Implementierung und Wartung ... { Phasen ... Wartung, weitere Optimierung der physischen Ebene, Anpassung an neue Anforderungen und Systemplattformen, Portierung auf neue DBMS, usw. aufgrund seiner Bedeutung ☞ Relationenmodell { einfaches und exaktes Datenbankmodell fur die Realisierung Relationenname R A1 ... ... Attribute (+ Wertebereiche) An ... Tupel Erg anzungen: } Relationenschema Relation ... keine Titel der Folie: Relationenmodell Folie: ☞ eine Relation ist eine Menge von Tupeln, d.h. es existieren keine zwei Tupel mit identischen Werten fur alle Attribute eines Relationenschemas um Konsistenz in Relationen sicherzustellen, ist eine identizierende Attributmenge fur Relationenschema anzugeben ☞ eindeutige Identizierung von Tupeln moglich wichtige Begrie ... { { { Schlussel ... ist minimal, identizierende Attributmenge Primarschlussel ... ausgezeichneter Schlussel Fremdschlussel ... Primarschlussel eines Relationenschema R1 in einem Relationenschema R2 Relationenmodell beinhaltet u.a. einen Satz von im Modell implizit enthaltenden Operationen, d.h. Semantik der Operationen nicht anwendungsspezisch c M. Endig (23. Januar 2002) 6-6 ☞ gehort zu den Konzepten des Relationenmodells Erg anzungen: keine Titel der Folie: Relationenalgebra Folie: Operationen { { { { { Selektion w ahlt Tupel eine Relation aus Projektion w ahlt bestimmte Spalten einer Tabelle aus; Auswahl von relevanten Attributen durch Aufzahlung Verbund (besser naturlicher Verbund) Verkn upfung zwei Relationen uber alle gemeinsamen Attribute; Tupel mit gemeinsamen Werten werden verbunden TS Mengenoperationen , , { ☞ Relation ist eine Menge von Tupeln Umbenennung bezieht sich auf die Umbenennung von Attributen; wichtig ... nur Schema ande rungen und keine Relationen-Anderung Erg anzungen: keine Titel der Folie: Structured Query Language (SQL) - Sprache fur relationale DBS Folie: SQL ist ein Standard fur DB-Sprachen; genormt in ANSI & ISO hat ganz unterschiedliche Aufgaben - SQL ist ... { { { { { { DDL bspw. [createjalterjdrop] table Anfragesprache bspw. select * from table Sichtendenitionssprache bspw. [createjdrop] view Sprache zur Denition von Dateiorganisationsformen Zugrispfade Sprache zur Beschreibung von Datenmanipulationen insert into table mit dieser Sprache lassen sich relationale Datenbanken { { { erzeugen "mit Daten fullen\ eÆzient unabhangig von einer konkreten Anwendung abfragen ☞ in der Praxis hat der Einsatz von relationalen DB und SQL groe Bedeutung erlangt c M. Endig (23. Januar 2002) 6-7 Erg anzungen: keine Titel der Folie: Uberleitung Folie: bisher ... Entwurf und Realisierung von Datenbank-Anwendungen aus Datensicht ☞ zentrale Betrachtung der Datenbestande als eine Einheit in der Praxis hat dies dazu gefuhrt, da eine Vielzahl von riesigen und autonomen Datenbestanden verwaltet werden ☞ dieses f uhrt zunehmend zu Problemen Grunde hierfur (Auswahl) ... { { { { es werden an einem lokalen Standort Daten verwaltet, die da gar nicht benotigt werden { Ist das sinnvoll (! EÆzienz)? Unternehmen fusionieren { Was passiert mit den autonom vorhandenen Datenbestanden? an einem lokalen Standort eines Unternehmens werden Daten benotigt, die an einem anderen Standort verwaltet werden { Was ist nun? aus dem Sw-Engineering ... verteilte Softwaresysteme vs. zentrale Datenhaltung ➥ Einf uhrung von unterschiedlichen DBS-Architekturen Erg anzungen: ➠ keine Titel der Folie: Einleitung (1) Folie: zwei unterschiedliche Datenbanksystem-Architekturen moglich { Verteiltes Datenbanksystem (VDBS) verteilte Realisierung eines (einheitlichen) DBS { F oderiertes Datenbanksystem (FDBS) Integration bestehender, oft heterogener DBSe zu einem System Zugri auf logisch integrierten Datenbestand (im Gegensatz zu physisch integrierten, d.h. materialisierten Datenbestand z.B. in Data Warehouses) ☞ zentrale Gemeinsamkeit verteilte Speicherung von Daten { generelles Ziel ... ☞ Integration von (autonomen) Datenbestanden zur Schaung eines einheitlichen Zugris unabhangig von der Art der Speicherung eigentlich auch die Motivation f ur die Entwicklung von DBS ☞ eigentlich zwei widerspr uliche Ziele zum einen deren Integration c M. Endig (23. Januar 2002) Verteilung/Dezentralisierung und zum an- ➠ 6-8 Erg anzungen: keine Titel der Folie: Einleitung (2) Folie: Verteilung / Dezentralisierung insbesondere bei Neuentwicklungen gilt ... verteilte Realisierung von Sw-Systemen auf Basis verteilter (DB-) Systeme ➥ verteilte, aber kontrollierte Datenspeicherung ermoglicht bspw. Lastenverteilung, Nutzung von Parallelitat zur Verkurzung von Antwortzeiten, Erhohung der Ausfallsicherheit, ... { Integration bei bestehenden Systemen ... verteilt gespeicherte und unabhangig voneinander verwaltete, aber inhaltlich zusammengehorige Daten wieder logisch zusammenzubringen ➥ einheitlicher Zugri auf Gesamtdatenbestand { fur beide Ziele gilt { { technische Voraussetzung gegeben durch Moglichkeiten der Vernetzung heterogener Rechner entfernter Zugri auf Daten in der Regel eÆzient moglich Erg anzungen: keine Titel der Folie: Verteilte Datenbanksysteme - Einleitung Knoten 1 LDB 1 Knoten 2 Kommunikationsnetzwerk Knoten 3 LDB 3 Folie: Erg anzungen: LDB 2 Knoten 4 LDB 4.1 LDB 4.2 keine Titel der Folie: Anforderungen an verteilte Datenhaltung (1) Folie: Verteilungstransparenz ... das VDBS verbirgt die Verteilung vor dem Benutzer { es stellt sich wie ein integriertes, zentrales DBMS dar c M. Endig (23. Januar 2002) 6-9 Lokale Autonomie ... die einzelnen Knotenrechner sollten ein Maximum an Kontrolle uber Unabhangigkeit von zentralen Systemfunktionen ... zentrale Systemfunktionen und zentrale Hohe Verfugbarkeit ... der Datenbetrieb sollte auch bei Rechnerausfallen und Rekongu- Ortstransparenz ... der Ort der Speicherung bestimmter Daten sollte vor dem Benutzer die auf ihnen gespeicherten Daten behalten { so sollte der Datenzugri nicht von anderen Rechnern abhangen Datenstrukturen sind ein Flaschenhals in verteilten Systemen { hohe Verfugbarkeit und Knotenautonomie sind neben dem Leistungsengpa weitere Grunde, die gegen zentrale Dienste sprechen ration des Netzes ununterbrochen gewahrleistet sein verborgen sein Erg anzungen: ➠ keine Titel der Folie: Anforderungen an verteilte Datenhaltung (2) Folie: Partitionierungs-/Fragmentierungstransparenz ... die interne Aufteilung von Datenbankob- jekten (etwa die Partitionierung einer Relation ☞ Vorlesung) sollte vor dem Benutzer verborgen bleiben Replikationstransparenz ... die Replikation von Daten zur Leistungssteigerung und zur Verteilte Anfragebearbeitung ... die Anfragebearbeitung sollte verteilt erfolgen { die Reali- Verteilte Transaktionsverwaltung ... auch im verteilten Szenario mu eine korrekte Trans- Hardware-Unabhangigkeit ... die Datenbankverarbeitung sollte auf unterschiedlicher Hard- Erhohung der Ausfallsicherheit betrit die interne Realisierung und sollte daher im Sinne der Datenunabhangigkeit ebenfalls unsichtbar bleiben sierung der verteilten Bearbeitung sollte durch einen Optimierer festgelegt und nicht dem Benutzer aufgeburdet werden aktionsverarbeitung garantiert werden ware moglich sein Erg anzungen: keine Titel der Folie: Anforderungen an verteilte Datenhaltung (3) Folie: Betriebssystemunabhangigkeit ... die Datenbankverarbeitung soll auch auf unterschiedli- Netzwerkunabhangigkeit ... die Datenbankverarbeitung soll auf unterschiedlicher Netzwerk- Datenbanksystemunabhangigkeit ... die Datenbankverarbeitung soll unter Nutzung unter- chen Betriebssystemen moglich sein technologie moglich sein schiedlicher DBMS als Knoten-DBMS moglich sein { diese Forderung ist in der Regel heutzutage nur bei unterschiedlichen SQL-Dialekten relationaler DBMS praktikabel c M. Endig (23. Januar 2002) 6-10 Erg anzungen: keine Titel der Folie: Schema-Architektur fur VDBS Externes Schema Externes Schema Globales konzeptuelles Schema Fragmentierungsschema Allokationsschema Tranformationsschema Lokales konzeptuelles Schema Tranformationsschema ... Lokales konzeptuelles Schema Internes Schema Internes Schema DB 1 DB n Folie: Erg anzungen: Komponenten-DBMS Verteilung auf die verschied. Rechnerknoten Globales Schema Fragmentierung der Relationen keine Titel der Folie: Einwurf verteilter Datenbanken - Einfuhrung (1) Folie: Partitionierung (oft auch als Fragmentierung bezeichnet) { { { Aufteilung von Relationen auf n andere Relationen, bspw. mit dem Ziel der Erhohung der EÆzienz des Zugries keine redundante Datenhaltung es sind bei u.a. die folgenden Formen denktbar horizontale Partitionierung ... Aufteilung einer Relation in n Relationen, wobei dies durch Denition von Selektionspradikaten erreicht wird, d.h. Auswahl spezieller Tupelmengen vertikale Partitionierung ... Aufteilung einer Relation in n Relationen, wobei dies durch Denition von Projektionen erreicht wird, d.h. Auswahl von Attributmengen Mischformen ... Mischung aus horizontaler und vertikaler Partitionierung durch beliebige Schachtelung von Selektionen und Projektionen Allokation c M. Endig (23. Januar 2002) 6-11 { legt fest, auf welche Rechnerknoten, welche Partition gehalten werden soll Erg anzungen: ➠ keine Titel der Folie: Einwurf verteilter Datenbanken - Einfuhrung (2) Folie: Allokation ... (weiter) { { Plazierungsaspekte dabei sind u.a. EÆzienz ... wie Minimierung von Remote-Zugri-Kosten, Vermeidung von Engp assen (Kommunikationssystem, lokaler Rechner) Datensicherheit ... wie Auswahl von Knoten hinsichtlich Verl alichkeit, redundante Speicherung von Daten ➥ zwei einander entgegenwirkende Ziele!! Unterscheidung in ... nicht-redundante Allokation redundante Allokation moglich Replikation { wird ein Fragment mittels der Allokation auf mehrere Rechnerknoten verteilt, dann ➠ wird von Replikation gesprochen Erg anzungen: keine Titel der Folie: Einwurf verteilter Datenbanken - Einfuhrung (3) Folie: Replikation ... (weiter) Ergebnis ... redundante, gewunschte Datenhaltung ➥ Zielkonikt bei Replikation { Erhohung der ZugriseÆzienz, Verfugbarkeit und Autonomie ... ➥ groe Anzahl von Replikaten auf moglichst vielen Rechnerknoten Erhaltung der Datenkonsistenz ... ➥ groe Anzahl von Replikaten { alle Replikate moglichst synchron aktualisieren Erh ohung der EÆzienz bei Anderungsoperationen auf Daten ... ➥ kleine Anzahl von Replikaten wunschenswert { nur wenige Replikate (eventuell nur ein Replikat) synchron aktualisiert Replikationskontrolle { Wie kann Replikation durchgefuhrt werden? es gibt verschiedenste Verfahren wie ... Master-Slave-Verfahren, speziell das Primary-Copy-Verfahren, in dem immer ein ausgezeichnetes Replikat, die Primarkopie aktualisiert wird ➠ { Erg anzungen: keine Titel der Folie: Einwurf verteilter Datenbanken - Einfuhrung (4) Folie: c M. Endig (23. Januar 2002) 6-12 Replikation ... (weiter) { Replikationskontrolle ... (weiter) Master-Slave-Verfahren ... (weiter) Anderungen zunachst auf der Primarkopie andere Anderungen werden zu einem sp ateren Zeitpunkt asynchron nachgeholt ☞ Anfrageoperationen d urfen jedoch auf den (eventuell nicht ganz aktuellen) Replikaten arbeiten, so da die Konsistenz der Daten innerhalb von Anfragen nicht unbedingt gewahrleistet ist. Abstimmungsverfahren, speziell das Majority-Consensus-Verfahren, in dem die einzelnen Knoten an einer Abstimmung (voting) teilnehmen Abstimmung, ob Zugri auf replizierte Daten aus einem der Knoten erlaubt werden kann wenn entscheidungsf ahige Anzahl (das Quorum) zustimmt, Zugri ausfuhren Unterscheidung zwischen Lesequorum f ur lesende und Schreibquorum fur schreibende Zugrie Erg anzungen: keine Titel der Folie: Weitere Aspekte von VDBS (1) Folie: Verteilter Katalog (bzw. Data Dictionary) { verschiedene Realisierungsmoglichkeiten { { { { zentralisierter Katalog ... auf genau einem Rechnerknoten zentral gehalten vollredundanter Katalog ... vollstandig auf allen Knoten repliziert Cluster-Katalog oder Mehrfachkatalog ... Kompromi zwischen den ersten beiden Vorschlagen, falls das Netz in Teilnetze untergliedert ist ausschlielich lokale Kataloge ... die mit Sichtenmechanismus zu einem virtuellen globalen Katalog integriert werden verteilte Anfragebearbeitung ... { Verteilung von Teilanfragen Globale Anfrage mu auf die verschiedenen Teilsysteme aufgeteilt werden (der Benutzer sieht die Verteilung nicht!) jedes Teilsystem hat (i.d.R.) volle Funktionalit at, um lokale Anfragen zu bearbeiten Ergebnisse der Teilanfragen m ussen dann zusammengesetzt und an den Benutzer ubergeben werden ➠ Erg anzungen: keine Titel der Folie: Weitere Aspekte von VDBS (2) Folie: verteilte Anfragebearbeitung ... (weiter) { Berucksichtigung der Kommunikationskosten c M. Endig (23. Januar 2002) 6-13 bei zentralem DBS fallen kaum gewichtige Kommunikationskosten an ... werden bei der Optimierung daher nicht berucksichtigt Optimierungsverfahren fur VDBS mussen Kommunikationskosten berucksichtigen Optimierungsheuristiken zentraler DBS ("moglichst wenig Seitenzugrie\) mu gegen Kommunikationsheuristiken ("moglichst wenige Daten von Rechner zu Rechner transportieren\) abgewogen werden verteilte Transaktionen { { verteiltes Commit Zwei-Phasen-Commit-Protokoll Drei-Phasen-Commit-Protokoll verteilte Synchronisation verteilte Zeit-Marken-Verfahren Erg anzungen: keine Titel der Folie: Weitere Aspekte von VDBS (3) Folie: verteilte Transaktionen ... (weiter) { { verteilte Deadlock-Erkennung und -Behandlung Erkennung u.a. durch Time-Out-Mechanismus Globalen Deadlock-Graph Konservatives Sperren ☞ es gibt sicherlich noch vielmehr, was erwahnt werden m ute ➠ Literatur ➠ abschlieend auf Foderierte Datenbanksysteme eingehen Erg anzungen: keine Titel der Folie: Foderierte Datenbanksysteme { Einfuhrung (1) Folie: Was ist ein foderiertes Datenbanksystem? { { { Ursprung des Begris "Foderation\ ☞ Politik Bezeichnung fur bestimmte politische Ordnung von Staaten und Staatenverbunden Beispiel ... Bundesrepublik Deutschland Bundesl ander mit eigener Gesetzgebung und Rechtssprechung f oderaler Zusammenschlu mit Ubertragung einiger Aufgaben und Kompetenzen auf den Bund als ubergeordnete Institution Anerkennung gemeinsamer Regeln (Grundgesetz, Bundesgesetze, usw.) c M. Endig (23. Januar 2002) 6-14 ☞ Bundeslander sind nur teilweise autonom ☞ Konikte durch konkurrierende Gesetzgebung { verschiedene politische Foderation, abhangig davon ... welche Aufgaben und Kompetenzen auf die jeweilige f oderale Institution ubertragen werden (☞ Grad der verbleibenden Autonomie) wie heterogen die internen Strukturen der beteiligten (Teil-) Staaten sind (☞ Grad der Heterogenitat) Erg anzungen: keine Titel der Folie: Foderierte Datenbanksysteme { Einfuhrung (2) Folie: zentrale resultierende Frage ☞ Ubertragbarkeit auf Datenbanksysteme?? allgemeine Architektur foderierter Datenbanksysteme ➠ Globale Anwendungen Globale Anwendungen Föderierungsdienst Lokale Anwendungen DBMS 1 ... DBMS n DB 1 DB n KomponentenDBS 1 KomponentenDBS n Lokale Anwendungen Förderiertes Datenbanksystem Erg anzungen: keine Titel der Folie: Foderierte Datenbanksysteme { Einfuhrung (3) Folie: erste Frage ... Welche Funktionalitat mu ein foderiertes System bieten? { { Foderierte DBS als "Idealbild\ bieten volle Datenbankfunktionalitat, so da globale Anwendungen den Eindruck haben, mit einem einzigen DBS zu arbeiten dazu gehort (u.a.) ... (globale) Transaktionsverwaltung (globale) Anfragebearbeitung und -optimierung (globale) Integrit atskontrolle Recovery usw. auf globaler Ebene (im Foderierungssystem) Aufwand beim Aufbau eines foderierten DBS? ☞ ideales Foderiertes DBS ... sehr hoher Aufwand ➥ pragmatischer Ansatz ... nur realisieren, was an Funktionalitat benotigt wird! ☞ hangt vom Anwendungsgebiet ab! c M. Endig (23. Januar 2002) 6-15 Erg anzungen: keine Titel der Folie: Einsatzgebiete und Anwendungsszenarien (1) Folie: Betrachtung eines ausgewahlten Einsatzgebiets fur Datenbank-Foderation ☞ Integration bereits existierender Datenbestande ➠ es gibt noch mehr (Literatur) typische Situation in Unternehmen und anderen Organisationen { { unabhangig voneinander entstandene Datenbestande in Abteilungen, usw. mit teilweise redundanten Daten (☞ Inkonsistenzen moglich) und unterschiedlicher Strukturierung gleich(artig)er Daten autonome Entscheidungen u ber die Anschaung von Hard- und Software fuhrt zu Insellosungen mit keiner Moglichkeit zum einheitlichen Zugri auf alle Daten ➥ Ziel ... Integration lokaler Datenbestande in einem Unternehmen Anforderungen an ein solches System, das integrierte globale Sicht verwaltet Erg anzungen: ➠ keine Titel der Folie: Einsatzgebiete und Anwendungsszenarien (2) Folie: keine Einschrankung der Autonomie lokaler Systeme ☞ Erhalt der lokalen Anwendungen ohne Veranderung globale Integritatsuberwachung (in gewissen Umfang) ... beinhaltet Mechanismen zur Kon- globale Transaktionsverwaltung ... fur globale Anwendungen, die auf gemeinsame Daten Verteilungstransparenz ... globale Benutzer / Anwendungen sollen nicht u ber die verteilte sistenzkontrolle redundanter Daten auf globaler Ebene und ggf. auch Uberwachung existentieller oder anderer Abhangigkeiten zwischen Daten aus verschiedenen lokalen Systemen zugreifen und diese manipulieren Datenspeicherung Bescheid wissen mussen Erg anzungen: keine Titel der Folie: FDBS - Begrie Folie: charakteristische Eigenschaften von FDBS { { Verteilung ☞ Partitionierung, Redundanz und Replikation Heterogenitat heterogene DBS c M. Endig (23. Januar 2002) 6-16 ☞ Heterogenitat auf verschiedenen Systemebenen (Datenmodell, Datenmanipu- lationssprache, Transaktionsmanagement, Integritatskontrolle, ...) semantische Heterogenitat ☞ Unterschiede hinsichtlich der Bedeutung von Daten und ihrer Verwendung durch Anwendungssysteme { Autonomie Entwurfsautonomie ... Unabhangigkeit des Datenbankentwurfsprozesses & Schema Kommunikationsautonomie ... bezogen auf vorhandene Komponentensysteme Ausfuhrungsautonomie ... bezogen auf die auszufuhrenden Anfragen und Anderungen Erg anzungen: keine Titel der Folie: FDBS - Architekturen Folie: ☞ in der Literatur werden unterschiedliche Schema-Architekturen f ur FDBS vorgeschlagen (Ausgangspunkt 3-Ebenen-Schema-Architektur fur traditionelle, zentrale DBS) { Import-/Export-Schema-Architekturen ☞ privates Schema (lokale, konzeptionelle Schema) ! Exportschema (beschreibt die Daten, die bereitgestellt werden) ! Importschema (beschreibt die von anderen System importierten Daten) { Multidatenbank-Architektur ☞ physisches Schema (internes/physisches Schema eine DBS) ! internes logisches Schema (lokales konzeptionelles Schema eines DBS) ! konzeptionelles Schema (lokales externes Schema eines DBS) ! Externes Schema ( Sichtendenition\ die " ggf. auf mehrere konzeptionelle Schemata basiert) ➥ { Abhangigkeitsschema (Beschreibung von Inter-Datenbank-Abhangigkeiten und Denition zusatzlicher globaler Integritatsbedingungen) 5-Ebenen-Schema-Architektur Erg anzungen: keine Titel der Folie: 5-Ebenen-Schema-Architektur (Bild) c M. Endig (23. Januar 2002) ➠ 6-17 externes Schema externes Schema föderiertes Schema Exportschema Exportschema Komponentenschema Komponentenschema lokales Schema lokales Schema Datenbank Datenbank Folie: Erg anzungen: keine Titel der Folie: 5-Ebenen-Schema-Architektur (Erlauterungen) Folie: lokales Schema ... lokales konzeptionelles Schema eines DBS; ausgedruckt im lokalen Da- Komponentenschema ... Transformation des lokalen Schemas in ein globales Datenmodell; Exportschema ... enthalt die Teile des Komponentenschemas, die an die Foderierungs- foderiertes Schema ... integrierte Sicht auf alle gegebenen Exportschemata; beseitigt Red- externes Schema ... Sicht auf foderiertes Schema fur bestimmte Anwendungen / Benutzer; tenmodell des DBS ist uberussig, wenn lokales Datenmodell gleichzeitig auch globales Datenmodell schicht exportiert werden und auf die globale Anwendungen zugreifen durfen undanzen in den Exportschemata; lost strukturelle Unterschiede und sonstige Konikte zwischen den Exportschemata auf wie externes Schema in der traditionellen 3-Ebenen-Schema-Architektur Erg anzungen: keine Titel der Folie: Foderierter Datenbankentwurf - Weitere Aspekte (1) Folie: allgemeine Problemstellung ☞ Integration bestehender Schemata ... Heterogenitat aufgrund der Entwurfsautonomie { { { uberlappende Modellierungsbereiche verschiedene Datenmodelle verschiedene Modellierungskonstrukte c M. Endig (23. Januar 2002) 6-18 { { verschiedene Modellierungsperspektiven, d.h. verschiedene Sichten der DB-Entwerfer ... Einfuhrung verschiedener Integritatsstrategien wie top-down-Verfahren, bei dem ein Referenzschema als integriertes Schema vorgegeben wird Integrationsproze grob in 2 Phasen { Vorintegrationsphase ... nden aller Ubereinstimmungen und Unterschiede zwischen den lokalen Schemata { Integrationsphase ... in der das integrierte Schema erzeugt wird ➥ Ergebnis der Integration ist nicht eindeutig bestimmt Erg anzungen: keine Titel der Folie: Foderierter Datenbankentwurf - Weitere Aspekte (2) Folie: Klassikation von Integrationskonikten { { { { Extensionale Konikte ☞ semantisch u berlappende Weltausschnitte mit einander entsprechenden Klassen ... Problem oft nicht genau die gleiche Menge von Reale-Welt-Objekten reprasentiert Beschreibungskonikte ☞ unterschiedliche Eigenschaften / Attribute derselben Objekte in den lokalen Schemata oder auch homonyme und synonyme Bezeichnungen Heterogenitatskonikte ☞ unterschiedliche Datenmodelle der zu integrierenden Schemata Strukturelle Konikte ☞ selbst bei Verwendung desselben Datenmodells oft unterschiedliche Modellierung eines Sachverhaltes Erg anzungen: keine Titel der Folie: Zusammenfassung Folie: Bedeutung der Datenbank-Technologie im Rahmen der Entwicklung von technischen Informationssystemen hervorheben ☞ Einsatz von relationalen Datenbanksystemen ist in der Praxis etabliert moderne Anforderungen von Unternehmen haben zur Entwicklung weiterer DB-Technologien gefuhrt { Verteilte DBS Ziel ... Verteilung eine Datenbank-Schemas auf unterschiedliche Knoten innerhalb eines Netzwerkes horizontale und vertikale Partitionierung / Replikation c M. Endig (23. Januar 2002) 6-19 { Foderierte DBS Ziel ... Integration von vorhandenen heterogenen Datenbest anden ☞ f ur die Prufung wichtig ... { { Bedeutung von DBS im Rahmen der Entwicklung von TIS Ziele und Prinzipien von verteilten und foderierten DBS Erg anzungen: keine c M. Endig (23. Januar 2002) sollte man kennen 6-20