Allgemeine Begriffsbildung

Werbung
Allgemeine Begriffsbildung
• Bereits bekannte Begriffe:
–
–
–
–
–
DBMS (Datenbankverwaltungssystem, Datenbankmanagementsystem)
Datenbank
Datenbanksystem
Informationssystem (intuitiv)
3‐Schema‐Architektur
• Weitere Grundbegriffe:
–
–
–
–
Datenmodell (Datenbanksprache, nicht Schema!)
Datendefinitionssprache (DDL: Data Definition Language)
Datenmanipulationssprache (DML: Data Manipulation Language)
Abfragesprache (QL: Query Language)
Prof. Jasper: Datenbanksysteme, VL 2
1
Allgemeine Begriffsbildung
•
Ein Datenmodell (DM) ist eine formale Sprache zur Beschreibung von Daten (Intension des DBS; in einem Schema):
–
–
–
•
Konzepte zur Beschreibung der Struktur der Daten / der Datenbank (Schema)
Operationen um die Struktur zu verändern (Schemamanipulation: Datendefinitionssprache, DDL)
Constraints, die für alle Schemata gelten: Modellinhärente Konsistenzbedingungen
Nutzer des Datenbanksystems können die Daten (Extension des DBS, passend zum Schema)
–
–
Einfügen, Ändern und Löschen (Datenmanipulaitonssprache, DML)
Abfragen (Abfragesprache, Query Language QL)
•
Die Datendefinitions‐, manipulations‐ und Abfragesprachen sind spezifisch für die Datenmodelle
•
Klassische Datenmodelle (ca. 1965 ‐ 1975):
–
–
–
•
Neuere Datenmodelle
–
–
•
Hierarchisches DM
Netzwerkdatenmodell
Relationales DM
Objektorientiertes DM (ab ca. 1985)
XML‐basierte DM (seit ca. 1999)
Weiterentwicklung:
–
–
Objektrelationale Datenmodelle
NoSQL‐Systeme mit anwendungsspezifischen Eigenschaften
Prof. Jasper: Datenbanksysteme, VL 2
2
Ein größeres Anwendungsbeispiel
• „Die Notwendigkeit, im Rahmen einer vorsorgenden und auf die langfristige Sicherung der natürlichen Lebensgrundlagen ausge‐
richteten Umweltpolitik zu einer integrierenden Gesamtsicht aller wichtigen Daten und Informationen zu gelangen, ist seit längerem bekannt. Durch das 1985 neu geschaffene Ministerium für Umwelt, Raumordnung und Landwirtschaft (MURL) mit seinen 138 nach‐
geordneten Behörden und Einrichtungen besteht in Nordrhein‐
Westfalen zum ersten Mal die Möglichkeit, fast alle Umwelt‐
bereiche, die übergreifende und zunehmend ressourcenschutz‐
orientierte Landesplanung sowie die mit der natürlichen und technischen Umwelt in vielerlei Beziehung stehende Landwirtschaft in die Gesamtkonzeption eines Hauses für ein umweltbezogenes Informationssystem einzubinden. Zielsetzung ist es, ein Umweltmedien‐ und ‐sektorenübergreifendes computergestütztes Informationssystem zur Verbesserung der fachlichen und politischen Entscheidungsgrundlagen zu entwickeln.“
Prof. Jasper: Datenbanksysteme, VL 2
3
Ein größeres Anwendungsbeispiel
• Erfassung, Aufbereitung und Integration von Datenbeständen aus:
– Landesbank im LDS mit Daten zur
•
•
•
•
•
Bevölkerung,
Erwerbstätigkeit,
Umweltschutzinvestitionen,
Landwirtschaft,
Wahlen etc.
– Datei der Zweckzuwendungen im LDS mit allen strukturwirksamen und investiven Mitteln
– Dateien/Statistiken des LDS aus dem Agrar‐ und Ernährungsbereich, wie
•
•
•
•
Tierseuchenstatistik,
Daten der Agrarberichterstattung und Landwirtschaftszählung,
Außenhandelsstatistik
Rohholzstatistik
– Flächennutzungsdaten des Liegenschaftskatasters
• der Vermessungsverwaltungen, die im LDS sowie im LIS aufbereitet werden.
– Gewässergüteüberwachungssystem (GÜS) des LWA
• mit ca. 3.500 Basismessstellen zur Ermittlung der Gewässerbeschaffenheit in 3 Über‐
wachungsstufen mit bis zu 200 chemischen, physikalischen und biologischen Kenngrößen
Prof. Jasper: Datenbanksysteme, VL 2
4
Ein größeres Anwendungsbeispiel
– Abwasserüberwachung
• u.a. für mehr als 1.100 Kläranalgen
– Landesgrundwasserdienst (LGD) mit über
• 10.000 automatisierten Messstellen und mehr
• als 200.000 Messwerten pro Jahr,
– Grundwasserbeschaffenheitsüberwachung an
• ca. 700 Messstellen im Landesgrundwasserdienst,
– Talsperrenkataster mit 72 Talsperren in NRW
– Immissionsmessnetze der LIS:
• TEMES mit 73 festen Messstationen in belasteten Regionen NRW's (SO2, Schwebstaub, NO2 NO),
• MILIS für mobile Immissionsmessungen der LIS außerhalb der Belastungsgebiete mit den Schadstoffparametern des TEMES‐Messnetzes
• LIMES‐A (SO2, Staubniederschlag, Schwermetalle Blei und Cadmium im Staubniederschlag mit bisher ca. 3.500 Messpunkten in den Belastungsgebieten NRW's
• LIMES‐B (Schwermetalle im Schwebstaub, polyzyklische aromatische Kohlenwasserstoffe (PAK) mit ca. 40 Messstationen in den Belastungsgebieten NRW's
– Emissionskataster Luft der LIS mit rd. 3.800 Anlagen innerhalb der Belastungsgebiete NRW's
– LINFOS der LÖLF mit den Teilkomponenten
•
•
•
•
Biotopkataster (ca. 18.000 Biotope in NRW)
NSG‐Verzeichnis mit z. Zt. ca. 1.000 Naturschutzgebieten in NRW
Rote Liste und Florenliste von ca. 1.600 gefährdeten Pflanzenarten in NRW
Waldschadenserhebungen von 1983 bis heute
Prof. Jasper: Datenbanksysteme, VL 2
5
Vorgehen bei der DBS‐Entwicklung
Prof. Jasper: Datenbanksysteme, VL 2
6
Vorgehen bei der DBS‐Entwicklung
Prof. Jasper: Datenbanksysteme, VL 2
7
Vorgehen bei der DBS‐Entwicklung
Ausschnitt
der Realwelt
Informelle Ebene
Konzeptionelles
Schema
Konzeptionelle Ebene
Logisches (DB‐) Schema
Logische Ebene
Speicherstrukturen
u. Zugriffspfade
Physische Ebene
Fakultät Math. u.
Informatik
Technische Ebene
Prof. Jasper: Datenbanksysteme, VL 2
8
Übersicht Datenmodelle
• Hierarchisches DM
– Hierarchische Gliederung der Datenbestände
– Strukturierung 1‐m (sprich "1 zu m")
– Beispiel: Zu jeder Messstelle gehören mehrere (m) Messungen (Kind), zu jeder Messung genau eine (1) Messstelle (Elter). Daten-Vorkommen:
Struktur:
Messstelle
1
m
Messstelle A
Messstelle B
(nur 1-m-Beziehungen)
Messung
(Messwert, Zeit)
MA1
MA2
MB1
MB2
– Operationen: Navigation in der Hierarchie, Manipulation einzelner Knoten der Hierarchie
Prof. Jasper: Datenbanksysteme, VL 2
9
Übersicht Datenmodelle
• Netzwerkmodell
– Kann die in der Praxis wichtige Datenstruktur der m‐m‐Beziehung direkt darzustellen:
Struktur:
Daten-Vorkommen:
Messstelle B
Messstelle
Zeit
1
1
m
m
Z3
Z2
Messstelle A
Z1
Messung
MA1
MA2
MA3
MB1
MB2
MB3
– Operationen: Navigation durch die geordneten Elemente von Mengen, Verfolgung der Beziehungen
Prof. Jasper: Datenbanksysteme, VL 2
10
Übersicht Datenmodelle
• Relationales Datenmodell
– Die Benutzung der Tabelle als Datenstruktur
– Struktur: Messung (Messwert, Messstelle, Zeit)
– Datenvorkommen:
Messwert
24.5
24.7
24.6
19.3
19.7
19.1
Messstelle
A
A
A
B
B
B
Zeit
14.18
14.20
14.22
14.18
14.20
14.22
Tupel
Attribut
– Operationen: Relationenalgebra und Kalküle
Prof. Jasper: Datenbanksysteme, VL 2
11
Übersicht Datenmodelle
• Objektorientiertes Modell
– Struktur wie in der objektorientierten Programmierung
– Daten = Objekte
– Operationen: Navigation
• XML‐basierten Modelle:
– Dokumententypen und Dokumente
• Weitere Modelle:
– Dokumentenverwaltung und Information Retrieval
– Wissensverwaltung
• Objektrelationale Modelle: Die eine Zukunft, siehe SQL:20XX
• NoSQL‐System: Die andere Zukunft, siehe Produkte
Prof. Jasper: Datenbanksysteme, VL 2
12
Architekturen und Arten von DBMS
DB‐Entwickler, DBA
Laufzeitsystem
DDL‐Engine
DB‐Nutzer, Anwendungsprogramme
Laufzeitsystem
Querymanager
Laufzeitsystem
Storagemanager
Metadaten
Schema
Systemkatalog
Data Dictionary
Zugriffskontrolle
Konsistenzprüfung
DML‐Übersetzung
Anfrageoptimierung
und vieles mehr
Speicherverwaltung
Concurrency Control
Daten‐Input‐Output
Backup/Recovery
und vieles mehr
Daten
Prof. Jasper: Datenbanksysteme, VL 2
13
Architekturen und Arten von DBMS
• Zentrale Datenbank
Prof. Jasper: Datenbanksysteme, VL 2
14
Architekturen und Arten von DBMS
• Heterogenes (verteiltes) DBMS
Prof. Jasper: Datenbanksysteme, VL 2
15
Architekturen und Arten von DBMS
• Weitere Begriffe (hier ohne formale Definition):
– Standard‐Datenbanksysteme (DBS): Implementierungen klassischer Datenmodelle einschließlich ORDM
– Nichtstandard‐Datenbanksysteme (NDBS): Verwaltung komplexer Zusammenhänge, insbesondere objektorientierte Datenbanksysteme, deduktive DBMS und XML‐basierte DBMS.
– Verteilte Datenbanken (Datenbanksysteme) (VDBS): Daten transparent in einem Netzwerk verteilt; hier auch Mehrrechner‐DBS und Client‐Server‐Architekturen
– Multi‐Media Datenbanksysteme (MMDBS): Audio und Video‐Streaming einschließlich Recherche
– Wissensbasisverwaltungssysteme (WBVS): neben Daten auch Informationen über Zusammenhänge zwischen und Auswertungen von Daten; WBVS werden üblicherweise mit Inferenzkomponenten gekoppelt: Expertensysteme (XPS).
– Information Retrieval Systeme (IRS): Verwaltung von Dokumenten, Zugriff über bibliographische und inhaltliche Deskriptoren
– Data Warehouse: Integration verschiedener Datenquellen zur fachlichen Analyse und Vorhersage
– Big Data: Kontinuierliche Integration großer Datenbestände und deren Auswertung in „Echtzeit“ mit passenden Infrastrukturen
Prof. Jasper: Datenbanksysteme, VL 2
16
Herunterladen