Aufbau Integrierter Informationssysteme 1. Was ist Föderation Föderation: Bündnis von Staaten oder Teilstaaten EU-Staaten mit unterschiedlicher Struktur (Heterogen) Einsatz föderativer Datenbanksysteme Falk Ritschel, Stefan Springer, Falko Steponat BLJedes mit ähnlicher BL ist quasi Struktur eigener (Homogen) Staat Martin-Luther-Universität Halle-Wittenberg Teilautonomie unter übergeordneter Instanz Informatikseminar - Halle - 19.12.2001 1. 2. 3. 4. 5. Gliederung Föderative DBS 5 2. Eine Grobe Skizze 1. Einleitung Aufgaben der Zusatzschicht: 2. Konzeptionelle Architektur – globale Anfragen und Transaktionen bearbeiten 3. Wege zu integrierten Datenbanksystemen – Zerlegung in Teilanfragen (bei Leseoperationen) 4. Erhaltung von integrierten Datenbanksystemen – Zusammenfassen der Teilergebnisse 5. Zusammenfassung - Fazit - Ausblick – Transaktionsverwaltung Einsatz föderativer Datenbanksysteme 2 1. 2. 3. 4. 5. Gliederung Föderative DBS 6 2. Eine Grobe Skizze 1. Einleitung Was ist Föderation? Definitorische Abgrenzung Warum FDBS? 2. Konzeptionelle Architektur 3. Wege zu integrierten Datenbanksystemen 4. Erhaltung von integrierten Datenbanksystemen 5. Zusammenfassung - Fazit - Ausblick Einsatz föderativer Datenbanksysteme 3 1. 2. 3. 4. 5. Gliederung Föderative DBS 7 2. Eine Grobe Skizze 1. Einleitung Föderative DBS (FDBS): –Menge autonomer, möglicherweise heterogener DBS, –die in begrenztem Umfang kooperieren, –um externen Benutzern einen zentralen Zugriff auf Teile ihrer Daten zu gestatten. 1. Was ist Föderation? 2. Eine Grobe Skizze 3. Warum FDBS? 1. Anwendungsszenarien •Nebenanforderungen möglichst erfüllen: –Verteilungstransparenz –Verbergen der Heterogenität –DB-Operationen auf mehreren Datenbanken –Transaktionskonzept 4. Definitorische Abgrenzung 1. Zentrale DBS 2. Verteilte DBS 3. Multidatenbanksysteme 1. 2. 3. 4. 5. Föderative DBS 4 1. 2. 3. 4. 5. Föderative DBS 8 3. Warum FDBS 3. Warum FDBS Frage: Wozu FDBS? • Beispiel 2: Migration: Defizite bei programmierter Verteilung und Fernzugriff auf Datenbanken: Ablösung von Legacy-Systemen innerhalb einer Operation kann nicht auf mehrere Datenbanken zugegriffen werden keine Unterstützung bei der Behandlung semantischer Heterogenität Bestehende Daten und Anwendungen sollen übernommen werden Neuentwicklung der Anwendungen nicht wirtschaftlich geringer Grad an Verteilungstransparenz 1. 2. 3. 4. 5. Föderative DBS 9 1. 2. 3. Einfache Portierung der Anwendungen oft nicht möglich 4. 5. 3. Warum FDBS Föderative DBS 13 3. Warum FDBS • Beispiel 1: Risiko, dass in Übergangszeit neues System nicht stabil läuft – Heterogene Hard- & Softwarelandschaft im Unternehmen Æ Insellösungen Allmähliche Ablösung des Altsystems Redundanzen Beide Systeme laufen parallel Inkonsistenzen 1. 2. 3. 4. 5. Föderative DBS 10 1. 2. 3. 4. 5. 3. Warum FDBS Föderative DBS 14 3. Warum FDBS INKONSISTENZEN Datenhaltung wird redundant Beide Systeme laufen parallel 1. 2. 3. 4. 5. Föderative DBS 11 1. 2. 3. 4. 5. 3. Warum FDBS Anforderungen: -Autonomie der lokalen DB -Redundanzkontrolle -Globale Integritätsüberwachung -Transaktionsverwaltung -Transparenz 1. 2. 3. Föderative DBS 15 3. Warum FDBS AnwendungsAnwendungs Probleme: migration Effizienzeinbußen durch globale Schnittstelle von Neusystem aus •Rücktransformation durch interne Transformationen von globaler zur Legacy-Schnittstelle Föderation Zentraler Vorteil: (Anwendung wird noch auf Altsystem ausgeführt) • wenn Neusystem nach Migration allein arbeiten Geschäftsbetriebsoll,muss nicht eingestellt werden d.h. nicht in Föderation Daten • globaleDatenAnwendungen des Altsystems müssen zu lokalenmigration des Neusystems werden • Æoft Anwendungsportierung notwendig Altsystem (aufwendig) Neusystem 4. 5. Föderative DBS 12 1. 2. 3. 4. 5. Föderative DBS 16 4. Definitorische Abgrenzung Z-DBS V-DBS 4. Definitorische Abgrenzung MDBS 4-EbenenSchemaArchitektur Verteilte Datenbanksysteme Zum Verständnis der FDB-Architektur ist das Verstehen von Basisarchitekturen essentiell: Zentrale DBS 1. 2. Z-DBS Verteilte DBS 3. V-DBS 4. 5. Verteilungstransparenz ist sicherzustellen Multidatenbanksysteme Föderative DBS 17 4. Definitorische Abgrenzung MDBS enthält Implementierung für konkretes DBS (Speicherungsstrukturen: Listen, Bäume,Indexe) •Für jeden Benutzer eigenes Schema •Enthält Beschreibung der Daten die dieser benötigt Verteilte Daten sollen von einen DBS verwaltet werden •Beschreibt Daten in externe Sicht: • • Gesamtheit 3-Ebenenihrer Benutzer / Architektur Programme •abstrakt nach und systemunabhängig ANSI/SPARC 1. 2. Z-DBS V-DBS Z-DBS 3. V-DBS 4. 5. •Vereinigt alle (American • konzeptionelle Benutzersichten Sicht: ganzes National Unternehmen Standards Föderative DBS 18 4. Definitorische Abgrenzung MDBS 5. Föderative DBS ängigkeit zu 3-Ebenen-Schemadarstellung nötig um Datenunabhä Datenunabhängigkeit Datenunabh gewährleisten 4. Definitorische Abgrenzung MDBS 4-EbenenIntegration von: Schemaallen Architektur externen Schemata Darauf Aufsetzung der externen Schemata 1. 2. Z-DBS V-DBS 3. 4. 5. Föderative DBS Multidatenbanksysteme: Verbund von mehreren DBS •Aufteilung von komplexen DBS in Teildatenbestände: - effizienter Gründe: ÆWeitgehend andersrum ebenso - flexibler ÆFür bspw. effizienteren DB-Zugriff möglich internes Schema entsprechend zu ändern ohne Schnittstellen der Anwendungen zu berühren Z-DBS 2. 3. V-DBS 4. 5. Föderative DBS (mehrere DBMS) •Zu bestehenden DBen soll neue hinzugefügt werden Æ Ersparnis der Migration 19 4. Definitorische Abgrenzung MDBS 22 4. Definitorische Abgrenzung MDBS ÆKann externe Schemata ändern ohne interne verändern zu müssen 1. 21 Für jeden DBS Rechner eigenes internes •Analog zentralen Abhängig von Verteilungsstrategie UND eigenes konzeptionelles Schema aller lokaler Datenbeschreibung für einzelnen können Redundanzen auftreten konzeptioneller Benutzer Schemata Für Verteilungstransparenz (durch Verteilungstransparenz) Zusammenfassung lokaler Analog zentralen DBS konzeptioneller Schemata zu globalen konzeptionellen Schema Institute) 2. 4. 4-Ebenen-Schema-Architektur basiert auf Daten ANSI/SPARC Modell Beschreibung der des einzelnen Rechners • interne Sicht: System, Maschine 1. 3. 1. Z-DBS 2. V-DBS 3. 4. 5. Föderative DBS 23 4. Definitorische Abgrenzung MDBS 4-EbenenSchemaArchitektur Verteilte Datenbanksysteme Mit Rechnernetzen entstand Bedarf von verschiedenen Rechnern auf einen Datenbestand zuzugreifen Komponentensysteme vollständig auf übergeordneter Ebene verwaltet Vorteile: Rechenleistung mehrerer Rechner Komponentensysteme autonom Zugriffsengpässe zentraler DBS werden vermieden 1. 2. 3. 4. 5. Föderative DBS 20 1. 2. 3. 4. 5. Föderative DBS 24 Z-DBS V-DBS 4. Definitorische Abgrenzung MDBS 1. Verteilung, Heterogenität, Autonomie Verteilung verteilte homogene DBS verteilte föderierte DBS verteilte heterogene föderierte DBS verteilte heterogene DBS Benutzer Durchstellt Nebeneinander Es existiert nur Administrator Föderation ein mehrere einziges verwaltet selbst föderiertes föderierte (Kompromisse zusammen & Schemata Schema verwaltet notwendig) diese homogene föderierte DBS logisch integrierte und homogene DBS Autonomie heterogene integrierte DBS heterogene föderierte DBS Heterogenität 1. 2. Z-DBS V-DBS 3. 4. Föderative DBS 5. 25 1. 2. 3. 4. Föderative DBS 5. 4. Definitorische Abgrenzung MDBS 29 1. Verteilung Daten Schema • Daten können zentral, verteilt oder partitioniert Operationen gespeichert werden • Partitionierung soll Redundanz verhindern • man kann für Operationen das • Replikation möglich aber, muss vom die System Schema = auch Metadaten Datenbanksystem automatisch kontrolliertbereitstellt werden Verteilungsformen unterscheiden • Verteilung kann beabsichtigt • verhalten sich analog zu eingeführt den Daten werden tritt aber oft auch unkontrolliert auf • z.B.: wird die Operation auf jedem Rechner oder nur auf einem oder wenigen ausgeführt 1. 2. 3. 4. 5. Föderative DBS 26 1. 2. 3. 4. Föderative DBS 5. Gliederung 1. Einleitung 1. Heterogenität Heterogene Datenbanksysteme 5-EbenenSchemaArchitektur MultidatenbankenArchitektur 3. Wege zu integrierten Datenbanksystemen 4. Erhaltung von integrierten Datenbanksystemen 5. Zusammenfassung - Fazit - Ausblick Einsatz föderativer Datenbanksysteme Semantische Heterogenität = nicht übereinstimmendes Verständnis über die Bedeutung und Interpretation von gleichen oder zusammengehörigen Daten sowie die Verwendung dieser Daten verschiedene Systemebenen können Heterogenität unterschiedl. Datenmodelle aufweisen sind Punkt Maßezentraler der Modellierungskonstrukte bedingen bei selben verschiedene Datenmodell möglicherweise Integritätsbedingungen Heterogenitäten werden unterstützt verschiedene Anfragesprachen zu jedem Datenmodell Unterschiede in der Transaktionsverwaltung bei gleichem Datenmodell 2. Konzeptionelle Architektur Import/ExportSchemaArchitektur 27 1. 2. 3. 4. Attribut das den Preis angibt unterschiedliche Genauigkeit kann ohne zusätzliche numerischer Werte Information nicht eindeutig (besonders bei Überprüfung bestimmt werden (Währung?, auf Gleichheit) Mehrwertsteuer?) 5. Gliederung Kommunikationsautonomie • einzelne DB sind unabhängig voneinander Ausführungsautonomie entworfen worden • die einzelnen Systeme entscheiden selbst mit • beim Eintritt in die Föderation sollen die welchem anderen System sie kommunizieren • die DBS sind in der bleiben Lage selbst zu entscheiden lokalen Schemata erhalten • DBS entscheidet selbst ob und wann es in dieund welche Anwendungsprogramme, Anfragen • theoretisch müssten dann die KomponentenFöderation eintritt und wann sie diese wieder Änderungsoperationen ausführt und zu systeme jeder Zeit in der Lagees sein ihr lokales verlässt welchem Zeitpunkt Schema zu ändern • es kann über die Kommunikation mit sollteauch ein innerhalb eines geschlossenen • es ist•fraglich obSystem dieser Grad der Entwurfsanderen Komponentensystemen frei entschieden Verbandes von DBS von werden anderen Systemen direkt autonomie in FDBS unterstützt kann werden oder durch ein übergeordnetes System gezwungen werden bestimmte Aufgaben auszuführen so hat es seine Ausführungsautonomie verloren 2. Architekturen 1. Import / Export-Schema-Architektur 2. Multidatenbanken-Architektur 3. 5-Ebenen-Architektur 3. Vergleich der Architekturen 3. 4. 5. 31 Entwurfsautonomie 1. Verteilung, Heterogenität, Autonomie 2. Föderative DBS 1. Autonomie 2. Konzeptionelle Architektur 1. 30 Föderative DBS 28 1. 2. 3. 4. 5. Föderative DBS 32 1. Autonomie Einzelsysteme = Komponentensysteme Import / Export Multidatenbanken 5-Ebenen 2. Architekturen von FDBS Import / Export - Schema - Architektur ... ist Basis für lose gekoppelte föderierte Datenbanksysteme!!! Der Import von Schemabestandteilen legt für jedes System ein eigenes föderiertes Schema fest. Importschema Es existiert keine übergeordnete Instanz!!! • Aufgabenerfüllung wird aufgrund von Verhandlungen verteilt • jedes System kann dies, für sich, zu jedem Zeitpunkt ändern • dies betrifft sowohl einzelne Zugeständnisse als auch die Teilnahme an der Föderation Die Autonomie der Komponentensysteme bleibt in hohem Maße gewahrt. Datenbestände Bestehende Anwendungsprogramme werden für systemübergreifende können unverändert Anwendungen auf KS verfügbar laufen 1. 2. 3. 4. 5. Föderative DBS 33 1. Autonomie Es wird eine gewisse Autonomie der Komponentensystem gewährleistet. 1. Import / Export 2. 3. Multidatenbanken 5-Ebenen • eng und lose gekoppelte föderierte Systeme benötigen abweichende Funktionalität des Föderierungsdienstes Vielzahl spezifischer Investitionsschutz Anwendungsprogr. Deshalb: Unterscheidung mehrerer Architekturvarianten 2. 3. 4. 5. Föderative DBS 5. Föderative DBS 37 2. Architekturen von FDBS Multidatenbank - Architektur Ein Benutzer möchte auf verschiedene Datenbanken zugreifen, ohne das ein Zentrale Annahme: globales Schema vorhanden ist. • FDBS Abhilfe durch Föderierungsdienst die Risiken derschaffen Portierung Historischder entstandene Kommunikation mit den isolierten Systemen gewährleistet von Daten und Anw. Insellösungen • FDBS bieten durch diesen Dienst globale Datenbankfunktionalität für den Nutzer Wichtig weil ... 1. 4. 34 2. Architekturen für FDBS Er braucht: Probleme: 1. Import / Export • geeignete Anfrage- und Datenmanipulationssprache • in mehren DB redundant gespeicherte Daten • Sprache muss alle auftretenden Probleme im Sinne des • strukturelle Unterschiede zwischen den einzelnen DB Nutzers lösen können • Unterschiede in der Bezeichnungsweise 2. 3. Multidatenbanken 5-Ebenen 4. 5. Föderative DBS 38 2. Architekturen von FDBS Multidatenbank - Architektur Import/ExportSchemaArchitektur MultidatenbankenArchitektur 5-EbenenSchemaArchitektur Benutzer 1 Benutzer 2 ES 1 KS 1 KS 2 • Diese drei Schema-Architekturen zeigen uns die prinzipiellen Unterschiede und Gemeinsamkeiten von einerseits lose gekoppelten und andererseits eng gekoppelten föderierten Datenbanksystemen. 1. 2. Import / Export Multidatenbanken 3. 5-Ebenen 4. 5. Föderative DBS 35 2. Architekturen von FDBS Import / Export - Schema - Architektur Anwendung Importschema privates Schema Exportschema Datenbank 1. 2. 3. 4. PS 1 PS 2 Datenbank Datenbank 1. Import / Export 2. Multidatenbanken 3. 5-Ebenen ... ... ... ... ... - beschreibt die interne Struktur PS n der verwalteten Daten - internes Schema nachDatenbank ANSI/SPARC 4. 5. ES - externes Schema KS - konzeptionelles Schema AS - Abhängigkeitsschema ILS - internes logisches Schema PS - physisches Schema Föderative DBS 39 2. Architekturen von FDBS Multidatenbank - Architektur -hier ist der Anwendung Teil der Daten beschrieben - beschreibt die vom System verwalteten das Datenbanksystem in einer -den beschreibt die Daten die das System von Daten Föderation anderen zur Verfügung stellt anderen übernehmen möchte - Ausschnitt aus privaten Schema Importschema - lokales konzeptionelles Schema wird festgelegt welches - es werden Teile aus dem Exportschema Komponentensystem welche Form des anderer Systeme übernommen - unabhängig von der Teilnahme an der Zugriffs erhält (Lesen, Schreiben, usw.) Föderation - diese Übernahme muss verhandelt privates Schema Exportschema - es wird nur eine Zugriffskontrolle für die werden - beinhaltet kleinen Teil, der für an der Förderation beteiligten Informationen über die Teilnahme an Komponentensysteme realisiert (nicht für Föderation gedacht ist einzelne Nutzer) Datenbank ... 5. ILS 2 Benutzer 4 - es jeder kann Benutzer auch sinnvoll kann sich Benutzer 3 externes 5 eigenes sein direkt auf Benutzer Schema -realisiert eine spezielle zusammenstellen konzeptionelles Schema Sicht das interne ESzuzugreifen n1 aufauf ES n2 -Zugriff konzeptionelles externe Ebene logische Schema wenn nur Schema -z.B. einmalige nötig Anfrage werden -Ausschnitt wenn alle gezeigt verwalteten Gesamtheit der vom soll gezeigt Daten AS j KS 2 werden AS 1 System verwalteten Daten -externes Schema nach sollen (ILS kann entfallen) konzeptionelle Ebene -konzeptionelles Schema ANSI/SPARC -konzeptionelles Schema nachANSI/SPARC ANSI/SPARC nach ILS n Föderative DBS 36 Jeder Benutzer ist für die Erstellung seiner integrierten Sicht auf die von ihm benötigten Daten selbst verantwortlich. Explizite Integration 1. Schemata konzeptioneller Direktzugriff auf die versch. 2. Schemata konzeptionellen • typische Architektur für lose gekoppelte föderierte Systeme • auf übergeordneter Ebene gibt es eine eingeschränkte Funktionalität (Unterschied zu Import/Export-Schema) • wichtig ist eine Multidatenbanksprache für Zugriff Komponentensysteme 1. 2. 3. 4. 5. Föderative DBS 40 Import / Export Multidatenbanken 5-Ebenen 2. Architekturen von FDBS Import / Export 5 - Ebenen - Schema - Architektur externes Schema Exportschema Komponentenschema lokales Schema Datenbank 1. 2. Import / Export Multidatenbanken -auf einzelne Benutzer zugeschnittene Schnittstelle -möglicherweise anderes externes Schema Datenmodell als föderiertes Schema föderiertes Schema -gleiche Funktion wie externes Schema in zentralen DBS Exportschema -beschreibt den Ausschnitt aus -in ein anderes Datenmodell dem Komponentenschema -Gesamtheit derSchema durch die der transformiertes -konzeptionelles Komponentenschema Schema des der Föderation zur Verfügung Exportschemata einfließenden -beseitigt die Komponentendatenbankgestellt wird Daten Datenmodellheterogenität systems Datenmodell -globales -gleiches Datenmodell wie lokales Schema -implementierungsabhängige -potenzielle föderiertes Schema Beschreibung der Gesamtheit Integrationsprobleme von Daten Datenbank 3. 4. 5-Ebenen 5. Föderative DBS 41 Multidatenbanken Transformation 1. 2. Die Architektur ist somit prädestiniert in eng gekoppelten föderierten DBS zum Einsatz zu kommen. Das global verwaltete föderierte Schema erlaubt die Realisierung von Datenbankmanagement-Funktionalität auf globaler Ebene. Import / Export Multidatenbanken 3. 4. 5-Ebenen 5. Föderative DBS 42 3. externes Schema Exportschema Exportschema Komponentenschema (externes Schema) Komponentenschema (externes Schema) 1. 2. Import / Export Multidatenbanken 4. 5-Ebenen 5. 45 Import/Export - Multidatenbank - Architektur Architektur 5-EbenenSchema unterstütze unterstütze unterstütze Kopplungsform Kopplungsform Kopplungsform lose lose Kopplung Kopplung lose lose Kopplung Kopplung lose und und enge lose enge Kopplung Kopplung verantwortlich für verantwortlich für Integration Integration Integration Benutzer und und Benutzer lokaler Admin. lokaler Admin. Benutzer Benutzer globaler globaler Administrator Administrator Zugriff auf auf die die Zugriff Zugriff die Föderation Föderation Föderation vomlokalem lokalen von System System über globale globale über Schnittstelle Schnittstelle über dasdas globale über globale System System Unterstützung Unterstützung globaler DBMS globaler DBMS keine keine Teilweise Teilweise (MultiDB-Sprache) (MultiDB-Sprache) volle DBMSvolle DBMS Funktionalität Funktionalität 1. 2. 3. 5. Föderative DBS 46 3. Vergleich der Architekturen • es wird dazu eine spezielle lokale Zwischenschicht bereitgestellt • diese Schicht muss feststellen welche Anfrageteile lokal behandelt werden können und welche an andere Systeme weitergeleitet werden müssen lokales Schema (konzeptionelles Schema) Föderative DBS 4. Alle Anwendungen laufen lokal, auf einem der Grundgedanke Komponentensysteme ab. internes Schema 3. Föderative DBS • es soll gezeigt werden, das die drei vorgestellten Referenzarchitekturen nicht so grundverschieden sind • Mischform mit Aspekten aller drei Architekturen föderiertes Schema internes Schema 5. MischMisch-Architektur für globalen Zugriff lokaler Anwendungen externes Schema Komponenten DBS 4. Integrationsoperation 3. Vergleich der Architekturen 2. Architekturen von FDBS Überschneidung mit ANSI/SPARC (Variante 1) lokales Schema (konzeptionelles Schema) Filteroperation Tabellarischer Vergleich Die 5-Ebenen-Architektur schränkt die Autonomie der Komponentensystem stärker ein als die anderen Architekturen. 2. Komponentenschema (externes Schema) Zwischen „benachbarten“ Schemata ist immer nur genau eine der Motivation folgenden Transformationsoperationen notwendig: Es existiert ein globales Schema in dem alle der Föderation zur Verfügung gestellten Daten beschrieben sind. 1. Exportschema Warum unterscheidet man Exportschema und Komponentenschema? 2. Architekturen von FDBS 5 - Ebenen - Schema - Architektur 2. Architekturen von FDBS 5-Ebenen 43 2. Architekturen von FDBS 1. 2. 3. 4. 5. Föderative DBS Globales konzeptionelles Schema Mapping Mapping Mapping Mapping Mapping Mapping 47 Globale konzept. Komponente Überschneidung mit ANSI/SPARC (Variante 2) externes Schema ImpS externes Schema virtuelles konzeptionelles Schema föderiertes Schema Exportschema Exportschema Komponentenschema (externes Schema) Komponentenschema (externes Schema) lokales Schema (konzeptionelles Schema) Komponenten DBS internes Schema 1. 2. 3. lokales konzeptionelles Schema lokales Schema (konzeptionelles Schema) lokales internes Schema internes Schema 4. 5. Föderative DBS ExpS Datenbank 44 ImpS ExpS ImpS ExpS • es ergibt wirdsich festgelegt, durchSchema die welche Integration Teile des der werden einerseits zur Zuordnung der lokalen • konzeptionelles es wird festgelegt welcheder Bestandteile Exportschemata lokalen konzeptionellen der lokalen Schemas zu Bestandteile vonKomponente Exportschemata konzeptionellen des globalen konzeptionellen Schemas virtuellesKS zur virtuelles konzeptionellen anderen Komponenten Verfügung Bestandteilen des globalen gestellt von der lokalen konzeptionellen konzeptionelles konzeptionelles werden konzeptionellen Schemas verwendet • Vermittler für die lokal werden laufenden Komponente verwendet Schema alle Daten die die Schema • beschreibt KS über Anwendungen die Zugriff auf die ihre • beschreibt diese Exportschemata Teiledie werden in den das anderen globale andererseits zur Abbildung desin KS •Datenbestände Gesamtheit der anderer DB benötigen zur konzeptionelle Verfügung gestellt Schemahaben aufgenommen globalen konzeptionellen Schemas auf dem jeweiligen lokales lokales Importschemata Komponentensystem •die dazu wird speziellesverwalteten integriertes konzeptionelles konzeptionelles Schema angebotender dasjeweiligen das jeweilige Schema Schema •Daten interne Schemata • diesekonzept. Funktionen müssen diverse und lokale Schema vollständig, Komponentensysteme Integrationsprobleme lösen •zusätzlich imlokales jeweiligen TeileDatenmodell aus Schematalokales anderer beinhaltet die konkrete internes internes •KS beschreiben Schema Implementierung der lokalen Schema konzeptionellen Schemata Datenbank Datenbank Lokale konzept. Komponente Lokale DBMS Vergleich 48 3. Vergleich der Architekturen Zusammenfassung 1. Integrationsstrategien OneOne-ShotShot-Integrationsstrategie Föderierte Datenbanksysteme sind eine bestimmte Art von Multidatenbanksystemen! integriertes Schema IS • FDBS zeichnen sich durch weiterbestehende Autonomie der Komponentensysteme aus • Autonomie, Heterogenität und Verteilung sind Merkmale von FDBS Import / Export 1. 2. Multidatenbanken 3. 4. S1 5-Ebenen Föderative DBS 5. S2 S3 S4 S5 S6 ... Sn zu integrierende lokale Schemata 49 1. 2. 3. 4. Gliederung Föderative DBS 5. 53 1. Integrationsstrategien Balancierte binäre Integrationsstrategie 1. Einleitung integriertes Schema IS 2. Konzeptionelle Architekturen 3. Wege zu integrierten Datenbanksystemen Problemstellung Integrationskonflikte teilintegrierte Schemata als Zwischenergebnisse Lösungsansätze 4. Erhaltung von integrierten Datenbanksystemen zu integrierende lokale Schemata 5. Zusammenfassung - Fazit - Ausblick Einsatz föderativer Datenbanksysteme 50 1. 2. 3. 4. Gliederung Föderative DBS 5. 54 1. Integrationsstrategien Gewichtete binäre Integrationsstrategie 3. Wege zu integrierten Datenbanksystemen 1. Allgemeine Problemstellung integriertes Schema IS 1. Integrationsstrategien 2. Integrationsprozess 3. Kriterien für Integrationsmethoden 2. Klassifizierung von Integrationskonflikten 1. Einführung 2. Schemakonflikte - Datenkonflikte 3. Lösungsansatz zu integrierende lokale Schemata 1. 2. 3. 4. 5. Föderative DBS 51 1. 2. 3. 4. 1. Allg. Problemstellung 5. Föderative DBS 55 1. Integrationsstrategien n-äre Integrationsstrategien (A - one shot, shot, B - iterativ) Es liegen mehrere unabhängig voneinander entworfene, heterogene Ausgangssituation Datenbankschemata der Komponentensysteme vor. integriertes Schema IS Problem: Daten sind in KS redundant oder in Beziehungen miteinander LS1 globales Schema LS2 Ziel: Redundanzen vermeiden und Daten korrekt in Beziehung zueinander setzen LS3 1. 2. 3. 4. B A 5. Föderative DBS zu integrierende lokale Schemata 52 1. 2. 3. 4. 5. Föderative DBS 56 2. Integrationsprozess 2. Klassifizierung von Integrationskonflikten 1. Unterscheidungsmöglichkeit • Probleme die in der Vorintegrationsphase beim Vergleich der zu Vorintegrationsphase integrierenden Schemata entdeckt werden Integrationsphase • Aufgrund der Vielzahl von Konflikten ist eine Kategorisierung nötig (1) Bestimmung von Gemeinsamkeiten (1) Wird halbautomatisch durch Interund Unterschieden Schema-Korrespondenz sowie einige Integrationsregeln (2) Gefundene Übereinstimmungen durchgeführt werden als sogenannte InterSchema-Korrespondenzen (2) Interaktion mit Datenbankfestgehalten administrator immer noch notwendig • Vier Klassen von Konflikten – Semantische Konflikte – Beschreibungskonflikte – Heterogenitätskonflikte – Strukturelle Konflikte 1. 2. 3. 4. 5. Föderative DBS 57 1. 2. 3. 4. 5. Föderative DBS 61 2. Schemakonflikte - Datenkonflikte 2. Integrationsprozess 2. Unterscheidungsmöglichkeit 1. Vorintegration 2. Vergleich der Schemata • Auswahl der Integrationsstrategie • gegebenenfalls Vergabe Präferenzen • lokale Schemata werden so modifiziert das sie anschließend zusammengeführt werden können 2. 3. 4. Attribut – Attribut Konflikte Tabellen – Tabellen Konflikte 4. Zusammenführung und Restrukturierung 3. Anpassung der Schemata 1. Schemakonflikte • Entdecken der Korrespondenzen • Finden von möglichen Konflikten Datenkonflikte falsche Daten Tabellen Attribut Konflikte Unterschiedliche Repräsentationen • für jeden entdeckten Konflikt wird eine Anpassung vorgenommen • kann wegen Autonomie nicht auf den lokalen Schemata erfolgen 5. Föderative DBS 58 1. 2. 3. 4. 5. Föderative DBS 62 Schemakonflikte -- Tabellen – Tabellen - Konflikte 3. Kriterien für Integrationsmethoden Tabellennamen konflikte Vollständigkeit • das Ergebnis des Integrationsprozess muss alle Konzepte enthalten, die in irgendeinem lokalen Schema enthalten sind • es darf keine im Schema enthaltene Information verloren gehen • alle im integrierten Schema enthaltenen Informationen müssen in mindestens einem lokalen Schema semantisch äquivalent enthalten sein • Inter-Schema-Beziehungen dürfen die bestehenden Schemata nur konsistent ergänzen 1. 2. 3. 4. 5. verschiede Namen für gleiche Tabellen gleiche Namen für verschiedene Tabellen fehlende Attribute eine Tabelle vs. eine Tabelle Tabellenstruktur konflikte fehlende, aber implizite Attribute Korrektheit Integritätsbedingungskonflikte Föderative DBS 59 viele Tabellen vs. viele Tabellen Schemakonflikte -- Attribut - Attribut - Konflikte 3. Kriterien für Integrationsmethoden Attributsnamenkonflikte • ist ein real-world-Konzept in mehreren lokalen Schemata modelliert so darf es im integrierten Schema nur einmal repräsentiert sein Minimalität • das integrierte Schema sollte leicht verständlich sein • soll Benutzern und Datenbankadministrator die Arbeit erleichtern 1. 2. 3. 4. 5. ein Attribut vs. ein Attribut gleiche Namen für verschiedene Attribute Default – Wert Konflikte Datentypkonflikte Verständlichkeit Föderative DBS verschiede Namen für gleiche Attribute Integritätsbedingungs konflikte 60 viele Attribute vs. viele Attribute Bedingungskonflikte Datenkonflikte Gliederung nicht korrekte Einträge 1. Einleitung 2. Konzeptionelle Architekturen falsche Daten 3. Wege zu integrierten Datenbanksystemen veraltete Daten 4. Erhaltung von integrierten Datenbanksystemen Erhaltung struktureller Konsistenz verschiedene Ausdrücke Unterschiedliche Repräsentation Erhaltung operationaler Konsistenz verschiedene Einheiten 5. Zusammenfassung - Fazit - Ausblick unterschiedliche Genauigkeit Einsatz föderativer Datenbanksysteme 3. Lösungsansatz 69 Gliederung • Zusicherungsbasierte Integration 4. Erhaltung von integrierten Datenbanksystemen • Welche Bestandteile der zu integrierenden Schemata einander entsprechen oder in irgendeiner für die Integration relevanten Beziehung stehen. 1. Erhaltung struktureller Konsistenz 1. Einfügen oder Löschen von Objekten • unabhängig von einem konkreten Datenbankmodell 2. Updates • automatische Auflösung von strukturellen Konflikten 2. Erhaltung operationaler Konsistenz • ein Ansatz ist die Schemaintegration 1. Klassischer Transaktionsbegriff 2. Allgemeine Prinzipien erweiterter Transaktionsmodelle 1. 2. 3. 4. Föderative DBS 5. 1. 66 2. 3. Lösungsansatz 3. A •E:= Schemaelemente zu denen kein Gegenstück • • bei strukturellen Konflikten wird immer die wenigerexistiert integrate-join(E1, E2, attcor 2(A12, A22), ..., attcorj (A1j,A2j)) eingeschränkte Struktur verwendet Objekttypen mit zugehörigen Werteattributen = A2j • •A1jäquivalente • • wichtigste •A Elementare Linksintegrate-join zwischen äquivalenten Schemaelementen A Operation 1. 67 2. 3. Lösungsansatz KName KAdr Name Kunden BestMenge n:m WPreis Preis Menge WarenBez Waren produziert Hersteller Branche 2. 3. 4. 5. VBranche Föderative DBS 5. Föderative DBS 71 2. Erhaltung operationaler Konsistenz Transaktion Ablauf Zusammenfassung von aufeinanderfolgenden DB DB 68 EOT DML - Operationen PName Verband HName 4. DB betreut 1:n HAdr 3. BOT PAdr E konsistente Operationen, die eine DB von einem konsistenten konsistente Zustand DB DB möglicherweise inkonsistente Datenbank wieder in einen konsistenten Zustand überführt. versorgt n:m Ware Produzent 1:n 1. Adresse Abnehmer bestellt D Lokales Lokales Objektmenge zuOlokaler Objektklasse OK1 Objektmenge zu lokaler Objektklasse OK2 Objekt Objekt O2 1 Föderative DBS 5. C C B D C A B Objektmenge zu lokaler Objektklasse OK1 Objektmenge zu lokaler Objektklasse OK2 D E Objektmenge zu lokaler Objektklasse OK1 Objektmenge zu lokaler Objektklasse OK2 von Pfaden die sich aus mehreren Links • •A1jIntegration A2j zusammensetzen • A1j ≠ A2j • Wie ein Objekttyp und ein Wertattribut bzw. ein komplexes Attribut integriert werden 4. B Globales Objekt OG 2j 3. Objektmenge zu globaler Objektklasse OKG Objektmenge zu globaler Disjunkte, aber zusammengehörige Objektmengen Objektklasse OKG Objektmenge zu globaler Semantisch äquivalente lokale Objektklasse OKG • • Integrationsregeln immer nur zweiS1, integrierende Schemata 2 Schemata S2, 2 Elemente mit Wertattributen E1, E2 2. 70 1. Erhaltung struktureller Konsistenz • Integrate-join Integration mit Hilfe sogenannter Integrationsregeln 1. Föderative DBS 5. Semantisch äquivalente Extension Semantisch überlappende Extension Schemaintegration 1j 4. A Atomicity eine TA läuft vollständig oder überhaupt nicht C Consistency TA läuft unter Konsistenzbedingungen ab I Isolation alle TA laufen voneinander isoliert ab D Durability alle Ergebnisse einer erfolgreichen TA sind persistent zu machen 1. 2. 3. 4. 5. Föderative DBS 72 2. Klassische Transaktionsbegriff Fazit Transaktionsverwaltung Serialisierbarkeit/ Recovery Mechanismen • • Offene Fragen: Konsistenz und Isolation Serialisierbarkeit – Schemaintegration von z.B: Heterogene Transaktionsverwaltung •• • • • • • • •• • beim parallelen Ablauf mehrer TARecovery muss dieMechanismen DB konsistent Atomarität und Dauerhaftigkeit lokale Transaktionsverwaltung unterschiedlich bleiben und die TA müssen einen konsistenten Zustand sehen read/ write – Modell globale Transaktionsverwaltung kennt die jeweiligen lokalen äquivalent zu einem seriellen Ablaufplan lesen ri(x) schreiben wi(x), commit ci, abort ai Transaktionsverwaltungen wenn Ti beendet wird muss Tj schon beendet sein Transaktionsverwaltung bildet einen Abarbeitungsplan globale Transaktionsverwaltung weiß nichts über die Problem sind kaskadierende Abbrüche (Schedule) jeweiligen lokalen Transaktionsverwaltungen • Realisierung durch Sperr Protokolle oder Zeitstempelverfahren 1. 2. 3. 4. • Methoden aus objektorientierten DB • Prozeduren aus relationalen DB – Berücksichtigung von lokalen und globalen Integritätsbedingungen – Überwachung und Sicherstellung der Datenkonsistenz mit tragbaren Effizienzeinbußen Föderative DBS 5. 73 1. 2. 3. 4. Föderative DBS 5. 2. Erweiterter Transaktionsmodelle Geschachtelte Transaktion Darstellung geschachtelter Transaktionen • Transaktion ruft selbst wieder eine (Stufe Transaktion auf Top-level Transaktion Subtransaktion 1) Regeln Fazit • Offene Fragen: Ende der Präsentation – Schemaintegration von z.B: Subtransaktion (Stufe 2) • Methoden aus objektorientierten DB • Prozeduren aus relationalen DB Aufmerksamkeit Vielen Dank für Ihre • BEGIN WORK BEGIN WORK ist ein Baum von Transaktionen BEGIN WORK • Commit-Regel . . •. Wurzel heißt top-level-Transaktion, Knoten oder Blätter sind invoke subtransaction COMMIT WORK • Subtransaktionen Rollback-Regeln invoke subtransaction – Berücksichtigung von lokalen Integritätsbedingungen . Sichtbarkeitsregeln •.• Commit-Regeln, Rollback-Regeln, Sichtbarkeitsregeln COMMIT WORK invoke subtransaction . COMMIT WORK COMMIT WORK 1. 2. – Überwachung und Sicherstellung der Datenkonsistenz mit tragbaren Effizienzeinbußen BEGIN WORK . 3. 4. Wir wünschen der Seminargruppe ein frohes Fest und einen guten Rutsch ins neue Jahr !!! Föderative DBS 5. 74 Gliederung 1. 2. 3. 4. Föderative DBS 5. Globales konzeptionelles Schema Mapping Mapping Mapping Mapping ImpS 2. Konzeptionelle Architekturen virtuelles konzeptionelles Schema virtuelles konzeptionelles Schema virtuelles konzeptionelles Schema lokales konzeptionelles Schema lokales konzeptionelles Schema lokales konzeptionelles Schema lokales internes Schema lokales internes Schema lokales internes Schema Datenbank Datenbank Datenbank 3. Wege zu integrierten Datenbanksystemen 4. Erhaltung von integrierten Datenbanksystemen 5. Fazit Nachteile Offene Fragen Einsatz föderativer Datenbanksysteme • DB-Autonomie erhalten Import / Export ImpS Multidatenbanken Multidatenbanken Architekturen Import / Export - Schema -2. Architektur 5-Ebenen privates Schema • Datenaktualität: - lokale Redundanzen - Inkonsistenzen Datenbank Globale konzept. Komponente ExpS Lokale konzept. Komponente Lokale DBMS 5-Ebenen Misch79form von FDBS Importschema Importschema • rein wissenschaftlicher Ansatz 78 Anwendung Anwendung • Unterschiedliche Anfragesprachen in heterogenen Systemen • Migration am operativen System möglich ExpS Import / Export • Performanz • Multi-DB-Zugriff ImpS 75 Fazit • Überwindung der Heterogenität in DB ExpS Mapping Mapping 1. Einleitung Vorteile 77 Exportschema ... privates Schema Exportschema Datenbank „Integration on the Fly“ 1. 2. 3. 4. 5. Föderative DBS 76 1. 2. 3. 4. 5. Import / Export Multidaten5-Ebenen Föderative DBS banken Misch80form Import / Export Multidatenbanken 2. Multidatenbank - Architektur Benutzer 1 5-Ebenen Benutzer 4 Benutzer 3 Benutzer 5 Benutzer 2 ES 1 ES n1 KS 1 ... ... ... ... KS 2 ILS 2 PS 1 PS 2 Datenbank Datenbank 1. 2. Import / Export Architekturen von FDBS Multidatenbanken 3. 4. ES n2 KS 2 externe Ebene ... AS 1 AS j konzeptionelle Ebene ILS n ES - externes Schema KS - konzeptionelles Schema AS - Abhängigkeitsschema ILS - internes logisches Schema PS - physisches Schema PS n Datenbank 5. Import / Export Multidaten5-Ebenen Föderative DBS banken 2. Architekturen 5 - Ebenen - Schema - Architektur 5-Ebenen externes Schema Misch81form von FDBS externes Schema föderiertes Schema Exportschema Exportschema Komponentenschema Komponentenschema lokales Schema lokales Schema Datenbank 1. 2. Datenbank 3. 4. 5. Import / Export Multidaten5-Ebenen Föderative DBS banken Misch82form