Allgemeine Begriffsbildung • Bereits bekannte Begriffe: – – – – – DBMS (Datenbankverwaltungssystem, Datenbankmanagementsystem) D t b k Datenbank Datenbanksystem Informationssystem (intuitiv) Informationssystem (intuitiv) 3‐Schema‐Architektur • Weitere Grundbegriffe: – – – – Datenmodell (Datenbanksprache, nicht Schema!) D t d fi iti Datendefinitionssprache (DDL: Data Definition Language) h (DDL D t D fi iti L ) Datenmanipulationssprache (DML: Data Manipulation Language) Abfragesprache (QL: Query Language) Abfragesprache (QL: Query Language) Prof. Jasper: Datenbanksysteme, VL 2 1 Allgemeine Begriffsbildung • Ein Datenmodell Ei D d ll (DM) ist eine formale Sprache zur Beschreibung von Daten (Intension des DBS; (DM) i i f l S h B h ib D (I i d DBS in einem Schema): – – – • Konzepte zur Beschreibung der Struktur der Daten / der Datenbank (Schema) Operationen um die Struktur zu verändern (Schemamanipulation: Datendefinitionssprache, DDL) Constraints, die für alle Schemata gelten: Modellinhärente Konsistenzbedingungen Nutzer des Datenbanksystems können die Daten (Extension des DBS, passend zum Schema) – – Einfügen, Ändern und Löschen (Datenmanipulaitonssprache, DML) Abfragen (Abfragesprache, Query Language QL) • Die Datendefinitions‐, manipulations‐ und Abfragesprachen sind spezifisch für die Datenmodelle • Klassische Datenmodelle (ca. 1965 ‐ 1975): – – – • Neuere Datenmodelle – – • Hierarchisches DM Netzwerkdatenmodell Relationales DM Objektorientiertes DM (ab ca. 1985) ( ) XML‐basierte DM (seit ca. 1999) Weiterentwicklung: – Objektrelationale Datenmodelle Prof. Jasper: Datenbanksysteme, VL 2 2 Ein größeres Anwendungsbeispiel • „Die Notwendigkeit, im Rahmen einer vorsorgenden und auf die langfristige Sicherung der natürlichen Lebensgrundlagen ausge‐ richteten Umweltpolitik zu einer integrierenden Gesamtsicht aller richteten Umweltpolitik zu einer integrierenden Gesamtsicht aller wichtigen Daten und Informationen zu gelangen, ist seit längerem bekannt. Durch das 1985 neu geschaffene Ministerium für Umwelt, R Raumordnung und Landwirtschaft (MURL) mit seinen 138 nach‐ d d L d i t h ft (MURL) it i 138 h geordneten Behörden und Einrichtungen besteht in Nordrhein‐ Westfalen zum ersten Mal die Möglichkeit, fast alle Umwelt‐ g bereiche, die übergreifende und zunehmend ressourcenschutz‐ orientierte Landesplanung sowie die mit der natürlichen und technischen Umwelt in vielerlei Beziehung stehende Landwirtschaft technischen Umwelt in vielerlei Beziehung stehende Landwirtschaft in die Gesamtkonzeption eines Hauses für ein umweltbezogenes Informationssystem einzubinden. Zielsetzung ist es, ein Umweltmedien‐ und ‐sektorenübergreifendes computergestütztes Informationssystem zur Verbesserung der fachlichen und politischen Entscheidungsgrundlagen zu entwickeln. politischen Entscheidungsgrundlagen zu entwickeln.“ Prof. Jasper: Datenbanksysteme, VL 2 3 Ein größeres Anwendungsbeispiel • Erfassung, Aufbereitung und Integration von Datenbeständen Ef A fb i dI i D b ä d aus: – Landesbank im LDS mit Daten zur • • • • • Bevölkerung, Erwerbstätigkeit, b k Umweltschutzinvestitionen, Landwirtschaft, Wahlen etc Wahlen etc. – Datei der Zweckzuwendungen im LDS mit allen strukturwirksamen und investiven Mitteln – Dateien/Statistiken des LDS aus dem Agrar des LDS aus dem Agrar‐ und Ernährungsbereich, wie und Ernährungsbereich, wie • • • • Tierseuchenstatistik, Daten der Agrarberichterstattung und Landwirtschaftszählung, Außenhandelsstatistik Rohholzstatistik – Flächennutzungsdaten des Liegenschaftskatasters • der Vermessungsverwaltungen, die im LDS sowie im LIS aufbereitet werden. – Gewässergüteüberwachungssystem (GÜS) des LWA Ü • mit ca. 3.500 Basismessstellen zur Ermittlung der Gewässerbeschaffenheit in 3 Über‐ wachungsstufen mit bis zu 200 chemischen, physikalischen und biologischen Kenngrößen g Prof. Jasper: Datenbanksysteme, VL 2 4 Ein größeres Anwendungsbeispiel – Abwasserüberwachung Ab üb h • u.a. für mehr als 1.100 Kläranalgen – Landesgrundwasserdienst (LGD) mit über • 10.000 automatisierten Messstellen und mehr • als 200.000 Messwerten pro Jahr, – Grundwasserbeschaffenheitsüberwachung an • ca. 700 Messstellen im Landesgrundwasserdienst, – Talsperrenkataster T l k t t mit 72 Talsperren in NRW it 72 T l i NRW – Immissionsmessnetze der LIS: • TEMES mit 73 festen Messstationen in belasteten Regionen NRW's (SO2, Schwebstaub, NO2 NO), • MILIS für mobile Immissionsmessungen der LIS außerhalb der Belastungsgebiete mit den g gg Schadstoffparametern des TEMES‐Messnetzes • LIMES‐A (SO2, Staubniederschlag, Schwermetalle Blei und Cadmium im Staubniederschlag mit bisher ca. 3.500 Messpunkten in den Belastungsgebieten NRW's • LIMES‐B (Schwermetalle im Schwebstaub, polyzyklische aromatische Kohlenwasser‐stoffe (PAK) mit ca. 40 Messstationen in den Belastungsgebieten NRW's 40 i i d l bi N W' – Emissionskataster Luft der LIS mit rd. 3.800 Anlagen innerhalb der Belastungsgebiete NRW's – LINFOS der LÖLF mit den Teilkomponenten • • • • Biotopkataster (ca. 18.000 Biotope in NRW) (ca. 18.000 Biotope in NRW) NSG‐Verzeichnis mit z. Zt. ca. 1.000 Naturschutzgebieten in NRW Rote Liste und Florenliste von ca. 1.600 gefährdeten Pflanzenarten in NRW Waldschadenserhebungen von 1983 bis heute Prof. Jasper: Datenbanksysteme, VL 2 5 Vorgehen bei der DBS‐Entwicklung P Personen M i li Materialien Informationen Räume Energie 1. Ebene Relevanter Weltausschnitt, z.B.nicht formale Beschreibung eines Betriebes. 2. Ebene Manuell Design des Anwend dungssystems, t z.B. B Umfang und Funktionalität mittels teilw. formale Beschreibungen von Benutzersichten. Automatisierbar 3. Ebene statische Aspekte konzeptionelles Datenbankdesign dynamische Aspekte Formale Beschreibung des Informationssytems mittels Datenmodell und abstrakter Datentypen. Prozeß- und Dialogdesign Prof. Jasper: Datenbanksysteme, VL 2 6 Vorgehen bei der DBS‐Entwicklung 1. Schritt: Entwurf des p konzeptionellen Datenmodells Entwurf der wesentlichen Transaktionen Übersetzung (automatisch) Übersetzung (automatisch) Datendefinition D t d fi iti Schema (in DDL) wesentliche Transaktionen (in erw. DML) 2. Schritt: DDL-Compiler DDL Compiler Sprache-Compiler Sprache Compiler 3. Schritt: Anwendungsprogr. AP1 Daten Benutzer DBMS AP2 Prof. Jasper: Datenbanksysteme, VL 2 7 Vorgehen bei der DBS‐Entwicklung Ausschnitt der Realwelt der Realwelt Informelle Ebene Konzeptionelles p Schema Konzeptionelle Ebene Konzeptionelle Ebene Logisches (DB‐) Schema Logische Ebene Speicherstrukturen u. Zugriffspfade u. Zugriffspfade Physische Ebene Fakultät Math. u. Informatik Technische Ebene Prof. Jasper: Datenbanksysteme, VL 2 8 Übersicht Datenmodelle • Hierarchisches DM – Hierarchische Gliederung der Datenbestände – Strukturierung 1‐m (sprich "1 zu m") St kt i 1 ( i h "1 ") – Beispiel: Zu jeder Messstelle gehören mehrere (m) Messungen (Kind), zu jeder Messung genau eine (1) Messstelle gg ( ) ((Elter). ) Daten-Vorkommen: Struktur: Messstelle 1 Messstelle A Messstelle B (nur 1-m-Beziehungen) m Messung (Messwert Zeit) (Messwert, MA1 MA2 MB1 MB2 – Operationen: Navigation in der Hierarchie, Manipulation einzelner Knoten der Hi Hierarchie hi Prof. Jasper: Datenbanksysteme, VL 2 9 Übersicht Datenmodelle • Netzwerkmodell – Kann die in der Praxis wichtige Datenstruktur der m‐m‐Beziehung direkt darzustellen: Struktur: Daten-Vorkommen: Messstelle B Messstelle Z3 Zeit Z2 Messstelle A 1 1 m m Z1 Messung MA1 MA2 MA3 MB1 MB2 MB3 – Operationen: Navigation durch die geordneten Elemente von Mengen, Verfolgung der Beziehungen Prof. Jasper: Datenbanksysteme, VL 2 10 Übersicht Datenmodelle • Relationales Datenmodell – Die Benutzung der Tabelle als Datenstruktur – Struktur: Messung (Messwert, Messstelle, Zeit) St kt M (M t M t ll Z it) – Datenvorkommen: Messwert 24.5 24 7 24.7 24.6 19.3 19.7 19.1 Messstelle A A A B B B Zeit 14.18 14 20 14.20 14.22 14.18 14.20 14.22 Tupel Attribut – Operationen: Relationenalgebra und Kalküle Prof. Jasper: Datenbanksysteme, VL 2 11 Übersicht Datenmodelle • Objektorientiertes Modell – Struktur wie in der objektorientierten Programmierung – Daten = Objekte D t Obj kt – Operationen: Navigation • XML‐basierten Modelle: – Dokumententypen und Dokumente yp • Weitere Modelle: – Dokumentenverwaltung und Information Retrieval – Wissensverwaltung – ... • Objektrelationale Modelle: Die Zukunft, siehe SQL:2003 Objektrelationale Modelle: Die Zukunft siehe SQL:2003 Prof. Jasper: Datenbanksysteme, VL 2 12 Architekturen und Arten von DBMS DB‐Entwickler, DBA LLaufzeitsystem f it t DDL‐Engine DB‐Nutzer, Anwendungsprogramme LLaufzeitsystem f it t Querymanager Laufzeitsystem Storagemanager Metadaten Schema Systemkatalog Data Dictionary Data Dictionary Zugriffskontrolle Konsistenzprüfung DML‐Übersetzung Anfrageoptimierung und vieles mehr und vieles mehr Speicherverwaltung Concurrency Control Daten‐Input‐Output Backup/Recovery und vieles mehr Daten Prof. Jasper: Datenbanksysteme, VL 2 13 Architekturen und Arten von DBMS • Zentrale Datenbank Terminals / Arbeitsplatzrechner DB 1 DB 2 Zentraler Rechner Prof. Jasper: Datenbanksysteme, VL 2 14 Architekturen und Arten von DBMS • Heterogenes (verteiltes) DBMS A1 A2 A3 An Einheitliches Datenmodell Transaktionsverwalter Kommunikationssystem Übersetzer m Übersetzer 1 Übersetzer 2 Datenverwalter 1 Datenverwalter 2 Datenverwalter m Betriebssystem 1 Betriebssystem 2 Betriebssystem m Hardware 1 Hardware 2 Hardware m Daten 1 D Daten 2 Umsetzung Daten m Prof. Jasper: Datenbanksysteme, VL 2 15 Architekturen und Arten von DBMS • Weitere Begriffe: – Standard‐Datenbanksysteme (DBS): Implementationen klassischer Datenmodelle einschließlich ORDM – Nichtstandard‐Datenbanksysteme (NDBS): Verwaltung komplexer Zusammenhänge, insbesondere objektorientierte Datenbanksysteme, deduktive DBMS und XML deduktive DBMS und XML‐basierte basierte DBMS. DBMS. – Verteilte Datenbanken (Datenbanksysteme) (VDBS): Daten transparent in einem Netzwerk verteilt; hier auch Mehrrechner‐DBS und Client‐Server‐ Architekturen – Multi‐Media Datenbanksysteme (MMDBS): Audio und Video‐Streaming einschließlich Recherche – Wissensbasisverwaltungssysteme (WBVS): neben Daten auch Informationen Wi b i lt t (WBVS) b D t hI f ti über Zusammenhänge zwischen und Auswertungen von Daten; WBVS werden üblicherweise mit Inferenzkomponenten gekoppelt: Expertensysteme (XPS). – Information Retrieval I f i R i l Systeme (IRS): Verwaltung von Dokumenten, Zugriff S (IRS) V l D k Z iff über bibliographische und inhaltliche Deskriptoren – Data Warehouse: Integration verschiedener Datenquellen zur fachlichen Analyse und Vorhersage Prof. Jasper: Datenbanksysteme, VL 2 16