Einführung in die Wirtschaftsinformatik Teil 4 - Von der Realwelt zum Datenmodell Wintersemester 2015/16 Lehrstuhl für Wirtschaftsinformatik und Electronic Government Universität Potsdam Chair of Business Information Systems and Electronic Government University of Potsdam Univ.-Prof. Dr.–Ing. habil. Norbert Gronau Lehrstuhlinhaber | Chairholder August-Bebel-Str. 89 | 14482 Potsdam | Germany Tel Fax +49 331 977 3322 +49 331 977 3406 E-Mail [email protected] Web lswi.de 1 Inhalt Modellierung - Abbildung des betrachteten Originals Vom Original zum Modell - Abbildungsschritte Datenmodelle und -strukturen Datenbanken und Datenbankmanagementsysteme Das physische Schema 2 Modellierung - Abbildung des betrachteten Originals Vom Original zum Modell - Abbildungsschritte Datenmodelle und -strukturen Datenbanken und Datenbankmanagementsysteme Das physische Schema 3 Gründe elektronischer Datenspeicherung Vorteile gegenüber analoger Archivierung und Informationsaufbereitung (z.B. Karteikästen, Mikrofilme) Schnellerer Zugriff auf und effizientere Verarbeitung von Daten - Arbeitserleichterung und Zeiteinsparung Kostensenkung - Technik übernimmt - Entbindung der Arbeitskräfte von monotonen Aufgaben Zentrale Vernetzung und Verfügbarkeit - Möglichkeit der Nutzung durch Dritte Verwaltung beliebig großer Datenmengen 4 Daten 1 Müller, Thomas, FC Bayern 2 Reus, Marco, Dortmund 3 Wiese, Tim, TSG Hoffenheim 4 ... Statisches Abbild der Anwendungswelt Personen - Fußballspieler, Politiker, Studierende Gegenstände - Bücher, Werkzeuge Künstliche Objekte - Bank- oder Versicherungskonten Indirekter Ausdruck der Dynamik Kontostand vor und nach einer Transaktion Umsatzvolumen vor und nach einer Lieferung Spieltabelle (Turniertabelle) vor und nach einem Spieltag Daten bilden die Basis für die Verknüpfung von Informationen. Im Ergebnis entsteht Wissen. 5 Prinzipien der Kategorisierung von Daten Lagerbestände, Kontostände, Aufträge Produkt- und Preisliste eines Anbieters Bruttopreis von Produkten über Mehrwertsteuer Kundendaten ... nach Inhalt Stamm- und deren Änderungsdaten --> Seltene Veränderungen Bestandsdaten und deren Änderung durch Bewegungsdaten --> Häufige Veränderungen ... nach Aufgabe Ordnungsdaten --> Identifikation (Personen, Dinge) oder Vergleiche (Preise, Gehälter) Rechendaten --> Berechnung oder Umrechnung von Werten 6 Aufgaben in der Datenhaltung Aufgaben in betriebswirtschaftlichen Informationssystemen Erfassung von Geschäftsvorfällen (Bewegungsdaten) Verarbeiten der Geschäftsvorfälle (Verarbeiten mit Stamm- oder Bestandsdaten) Pflege der Stammdaten (Aktualisierung der Stammdaten - Änderungsdienst) Informationsabfragen (Standard-/Ad-hoc-Abfragen) Auswählbare Grundoperationen für Datenbearbeitung Auffinden - wird mehrfach benötigt Einfügen Ändern Entfernen Verarbeitungsformen von Daten innerhalb von Dateisystemen Starr fortlaufend (sequentiell) Logisch fortlaufend (z.B. indexsequentiell) Wahlfrei (direct access) Die Operation Auffinden bestimmt häufig über das Antwortzeitverhalten des gesamten Informationssystems. 7 Logische Datenhaltung Logische Sicht Hierarchische Dateiverwaltung -> Verzeichnisse (directories) Datei -> auf Datenspeicher abgelegte Datenmenge mit Zugriff über Dateiname Dateiinhalt Datenobjekte Beschreibung durch ihre Eigenschaften Beispiele - Objekte Personen: Lieferanten, Kunden, Mitarbeiter Gegenstände: Maschinen, Werkzeuge, Materialien Abstrakte: Konten, Buchungen, Rechnungen Einsatz von Verfahren zur Strukturierung von Daten bzw. -beständen. Quelle: Stahlknecht 2002, S. 138ff. 8 Datenstrukturen (Dateneinheiten) Grundbegriffe Datenelement (item) - kleinste logische Dateneinheit (z.B. Wohnort, Produktnummer, Nachname, etc.) Datensatz (record) - Bildung durch Datenelemente desselben Objekts (z.B. Kunde = Kundennummer, Nachname, Vorname, etc.) Datei (file) - gleichartige und logisch zusammengehörige Datensätze (z.B. Kunden, Produkte, Zulieferer, etc.) Datenbank (data base) - kann aus mehreren Dateien bestehen (Hinweis: Zwischen den einzelnen Dateien bestehen dabei immer logische Abhängigkeiten) Datenstrukturen beschreiben, wie Daten miteinander assoziiert werden. 9 Modellierung - Abbildung des betrachteten Originals Vom Original zum Modell - Abbildungsschritte Datenmodelle und -strukturen Datenbanken und Datenbankmanagementsysteme Das physische Schema 10 Abbildung der realen Welt Anwendungsbeispiele: Betrachtung interessierender Ausschnitte der Realwelt Vorgänge, Veränderungen oder statische Momentaufnahmen Externes Schema - Beschreibung interessierender Teile der Anwendungswelt Datenschema - formale Beschreibung der Struktur von Daten Arbeitsgebiet des Einkäufers/Verkäufers Lager Buchhaltungsbereiche Produktionsprozesse Gegenstände Zusammenhänge Wirklichkeitsausschnitt Informationen Sachverhalte ("Miniwelt") Tatsachen Personen Vorgänge, Veränderunge n 11 Konzeptuelles Schema Gegenstände Personen Zusammenhänge Wirklichkeitsausschnitt Informationen Sachverhalte ("Miniwelt") Tatsachen Personen Vorgänge, Veränderungen Ansatz Konzeptueller Entwurf der Miniwelt Erzeugung einer umfassenden Strukturierung der gesamten Informationsanforderungen (Datenbankentwurf ) Ergebnis Konzeptuelles Schema Umfassende Beschreibung der gesamt interessierenden Anwendungswelt (z.B. Schema einer Import-/ Exportfirma) Darstellung Entity Relationship Modell Stellt zu betrachtende Daten anwendungs- und speicherneutral dar. 12 Logisches Schema PERS_NR NAME VORNAME LEITER ... Mitarbeiter PERS_NR arbeitet_in Projekt NAME VORNAME PERS_NR LEITER ... PROJ_NR PERS_NR PROJ_NR PROJ_NAME Attribut PROJ_NR PROJ_LEITER PROJ_NR Weiterführung Logischer Entwurf Abbildung der Zusammenhänge des konzeptionellen Schemas in Relationsschemata PROJ_NAME Relationales Datenmodell Relationstyp/Relationsformat PROJ_LEITER Ergebnis Logisches Schema Teil des zum Einsatz kommenden (relationalen) Datenbanksystems (DB-Realisierung) Relation Fremdschlüssel Tupel Attributwert Darstellung Hierarchisches Netzwerk Relationenmodell Beschreibt den gesamten Datenbestand anwendungsneutral und speicherunabhängig. 13 Physisches Schema Relationales Datenmodell Relationstyp/Relationsformat Attribut Relation Fremdschlüssel Tupel Attributwert Realisierung Physischer Entwurf Speicherung von Relationen auf Speichermedien Ergebnis Physische Ablage der Daten auf Speichermedium als Dateien, physi- sche Records unsortiert Zugriffsbeschleunigung durch Indizierung der Records Darstellung Interne Speicherorganisation einer Festplatte Zugriffe auf Hardware von Datenbank (Oracle u.a.) über Betriebssystem Eine DB besteht aus dem DB-Schema und dem DB-Zustand. 14 Abbildungsschritte von der Realität zur physischen Datenbank Beispiele Firmendaten, Telefonbuch, Bücherbestand Realitätsausschnitt modelliert in konzeptuelles Schema Entity-Relationship logische Datenunabhängigkeit überführt in logisches Schema Objektstrukturen, Relationen physische Datenunabhängigkeit DB2, Oracle, MySQL, MSSQL überführt in physisches Schema Schemata sind zentrale Ergebnisse der Datenmodellierung! 15 Modellierung - Abbildung des betrachteten Originals Vom Original zum Modell - Abbildungsschritte Datenmodelle und -strukturen Datenbanken und Datenbankmanagementsysteme Das physische Schema 16 Datenmodell - Beispiel Hierarchisches Modell Kunde Adresse Land Kunden_Nr Ort Art_Nr Vorname Strasse Bezeichnung Nachname Haus_Nr Preis Artikel Telefon Lieferant Lief_Nr Lagerort Lief_Name 17 Datenmodell - Beispiel Netzwerkmodell bestellt Kunde Adresse Artikel Kunden_Nr Land Ort Art_Nr Vorname Strasse Bezeichnung Nachname Haus_Nr Telefon Preis Lieferant Lagerort Lieferant liefert Lief_Nr Lief_Name Quelle: Gartner 2009 18 Datenmodell - Grundlagen Definition Datenmodell Festlegung der elementaren Datentypen und Datenstrukturen Vorgabe der Konstrukte, mit denen Modellierung eines Diskursbereichs (klar nach außen abgegrenzte Miniwelt) hinsichtlich seiner Struktur und Inhalte vorgenommen werden kann Beschreibung der statischen Aspekte eines Systems Ein Datenmodell beschreibt eine Ordnungsvorstellung zur Strukturierung der Daten in einer Datenbank. Gebräuchliche Datenmodelle Hierarchisches Modell (historisch) Netzwerk-Modell (historisch) Entity-Relationship-Modell (ERM, viele Erweiterungen) Relationales Modell Objektorientiertes Datenmodell Objekt-relationales Datenmodell (Kombination aus den beiden vorgenannten) ER-Modelle bilden oft den Ausgangspunkt für Implementationen ins Datenbankmodell des jeweiligen Datenbankverwaltungssystems. 19 Datenmodellierung für statische Systeme Gegenstände Zusammenhänge Wirklichkeitsausschnitt Informationen Sachverhalte ("Miniwelt") Tatsachen Personen Vorgänge, Veränderungen Ziel Modellierung einer Miniwelt Beschreibung der Struktur großer Datenmengen Beispiele: Kundendaten, Bibliotheksbestand, ... Beschrieben werden... ... beteiligte Objekte (Entitäten, Datensätze, ... ) und deren Eigenschaften (Attribute) ... statische Beziehungen zwischen den Objekten NICHT beschrieben werden ... ... Abläufe resp. zeitliches Verhalten etc. ... Datenflüsse oder Interaktionen 20 Modellierung - Abbildung des betrachteten Originals Vom Original zum Modell - Abbildungsschritte Datenmodelle und -strukturen Datenbanken und Datenbankmanagementsysteme Das physische Schema 21 Datenbanken Eine Datenbank enthält ... ... ein Datenbankschema und ... ... eine Menge von konkreten Daten Anwendungsprogramme Informationsmodell Datenbanken beschreiben genau einen Zustand der im Schema modellierten Anwendungswelt. 22 Datenorientierte Software Datenbankmanagementsystem (DBMS) Leistet technische Verwaltung einer oder mehrerer Datenbanken Bsp.: ORACLE, MySQL, DB2, Sybase System XII (DB)-Anwendung, Anwendungsprogramm Greift auf DBS zu - realisiert Funktionalitäten für Anwender Bsp.: Auftragserfassung der Import-/Export-Firma Datenbanksystem (DBS) DBMS sowie von ihm verwaltete Datenbanken Bsp.: MySQL mit Datenbank der Import-/ExportFirma Informationssystem (IS) Anwendungen und DBS sind zusammengefasst Bsp.: Gesamte, integrierte operative SW Import-/ Export-Firma Aufgabe und Ziel der Software besteht in der Strukturierung und Speicherung der Daten nach festgeschriebenen Ordnungskriterien. 23 Einsatz von Datenbanksystemen Schritte zum Einsatz eines DB-Systems Quelle: Elmasri 2002, S. 571ff. 24 Anforderungen an Datenbanken Anforderungen an die Hardware Große Speicherkapazität Effiziente Verarbeitung, kurze Antwortzeiten Niedrige Kosten Anforderungen an den Aufbau Datenunabhängigkeit Änderungen auf einer Ebene wirken sich nicht auf andere Ebenen aus (siehe auch Architekturmodell: 3-Schichtenkonzept) Anforderungen an die Software Datensicherheit und –schutz Vermeidung von Redundanz Konsistenz (Widerspruchsfreiheit) Persistenz (Robustheit gegenüber Hardwarefehlern) Anforderungen an die Bedienung Einhaltung von Standards Benutzerfreundlich, strukturierte Ablage (logisch, physisch) Mehrbenutzerbetrieb Datenunabhängigkeit ist die wesentlichste Anforderung. Sie beinhaltet die Trennung von Daten und Programmcode. Quelle: Elmasri 2002, S. 571ff. 25 Vorteile von Datenbanken Einheitliches Konzept Verringerung von Erstellungsund Verwaltungsaufwand Zusammenfassung mehrfach benötigter Funktionen Kollisionsfreier paralleler Datenzugriff Gleichzeitiger Zugriff auf Daten durch mehrere Anwender Datenformat unabhängig von Bezug nehmenden Programmen Möglichkeit spontaner Abfragen abweichend von Programmen Vermeidung von Datenredundanz Zu jedem in DB gespeicherten Objekt genau ein Satz von Daten Verminderung mangelnder Übereinstimmung (z.B. bei Änderungen) Zentrale Datensicherheit und -schutz Vertraulichkeit Integrität der Daten 26 Datensicherheit - Datenintegrität Grundlagen zuverlässiger Informationsverarbeitung Datensicherheit - Schutz vor Verlust von Datenbeständen durch technische Ausfälle Datenintegrität - Maßnahmen zur Gewährleistung unbeschädigter Daten in einem System während Verarbeitung Realisierung über Transaktion "Übergang der Datenbank von einem in einen anderen konsistenten Zustand" In sich abgeschlossener Verarbeitungsschritt innerhalb der Anwendungen der betreffenden Miniwelt Kann aus mehreren Teilschritten bzw. Vorgängen bestehen Quelle: Stahlknecht 2002, S.192f. 27 ACID-Prinzip Atomare Transaktionen ITY C I ATOM Änderung passiert ganz oder gar nicht Auch bei mehreren Schritten Konsistente Transaktionen STENCY NSI O C Datenbank wird in einem konsistenten Zustand gehalten War vor Ausführung der Änderung in einem solchen Isolierte Transaktionen N TIO A L ISO Unabhängig von eventuell parallel laufenden Prozessen Verarbeitung nur konsistenter Daten Dauerhafte Transaktionen ILITY RAB U D Permanente Erhaltung geänderter Daten in der Datenbank Auch: Pufferdaten Das Transaktionsprinzip realisiert die Sicherung vor Datenverlust. 28 Konzept der Datenunabhängigkeit Weitestgehende Unabhängigkeit von Daten mit Programmen/Nutzern Schutz des DBMS-Benutzers Bei Änderungen in der Systemumgebung (Datenbank- tuning, Erweiterung von Speicherstrukturen) - keine Auswirkung auf Funktionen in Anwendungs- programmen Beispiele: Transparenz der physischen Organisation der Daten für Dialoge und Programme Organisation von Datenstruktur und Zugriffspfaden ist nicht Programmaufgabe Firmendaten, Telefonbuch, Bücherbestand Realitätsmodelliert modelliert Entity konzeptuelles logische Objektstrukturen logisches physische DB2, Oracle, überführt überführt physisches Quelle: Elmasri 2002, S. 51f. 29 Datenunabhängigkeit Physische Datenunabhängigkeit Zweckeignung Verfügbarkeit im Wirkungsbereich des Wirtschaftsgutes Übertragbarkeit von einem Wirkungsbereich in einen anderen Logische Datenunabhängigkeit Interpretation von Datenbestand und inneren Zusammenhängen für verschiedene Anwendungen aus unterschiedlichen Perspektiven Änderungen des konzeptuellen Schemas ohne Auswirkungen auf externe Schemata bzw. Anwendungen Forderung: Erweiterung der DB durch Hinzufügung eines Datensatztyps oder Datenfeldes oder Reduzierung durch Löschung Auswirkung: Änderung der Definition von Sichten und Transformationen zwischen den Schichten Beispiel: Aufnahme eines Datensatztyps, der Verwaltung und Speicherung von Grafiken zulässt Quelle: Elmasri 2002, S. 51 30 Modellierung - Abbildung des betrachteten Originals Vom Original zum Modell - Abbildungsschritte Datenmodelle und -strukturen Datenbanken und Datenbankmanagementsysteme Das physische Schema 31 Anforderungen an das physische Schema Forderungen für Beschreibung eines interessierenden Bereiches durch konzeptuelles Schema Funktionale Trennung zu Anwendungsschichten Beschreibung konsistent, d.h widerspruchsfrei Integration der Sichtweisen aller Beteiligten Widerspruchsfreies Überblicken und "Verstehen" des modellierten Bereiches Inkonsistenz - mögliche Folge von Redundanz Redundanz = mehrfache Speicherung derselben Daten Resultat: Redundante Daten können unterschiedliche Werte beinhalten --> Inkonsistenz Forderung: Nur kontrollierte Mehrfachspeicherung von Daten Ein Datenbanksystem erzwingt innerhalb eines Informationssystems ein sogenanntes zentrales Konsistenzverständnis. 32 Datenzugriff im physischen Schema Probleme des Mehrbenutzerbetriebs Unkontrollierter Zugriff - erzeugt evtl. Widersprüche in Dateninhalten Beschränkte Zugriffsmöglichkeiten Zugriff auf Daten anderer Anwendungen nur schwer möglich Rechte-/Sichtenverwaltung sorgt für flexible Vergabe von Zugriffsrechten Verlust von Daten/Integritätsverletzung Wiederherstellung von Daten im Fehlerfall sehr schwierig Transaktionen dürfen nur vollzogen werden, wenn Datenbasis in konsistenten Zustand überführt ist Forderung: Durch einheitliches Datenmodell sind Daten problemlos miteinander verknüpfbar Bei unkontrolliertem Zugriff kann es bei Mehrbenutzerbetrieb leicht zu Anomalien kommen. 33 Kontrollfragen Wie geschieht der Übergang von der realen Welt zur Datenbank? Welche Aufgaben hat ein Datenbankmanagementsystem? Was ist eine Transaktion? Warum muss der normale Benutzer sich nicht um den Mehrbenutzerbetrieb kümmern? 34 Literatur Elmasri, R./Navathe, S. B.: Grundlagen von Datenbanksystemen; 3. Auflage, 2002, Addison-Wesley Stahlknecht, P./Hasenkamp, U.: Einführung in die Wirtschaftsinformatik; 11. Auflage, 2004, Springer Verlag Mertens P. et. al: Grundzüge der Wirtschaftsinformatik; 9. Auflage; 2005, Springer Verlag 35 Zum Nachlesen Kontakt Univ.-Prof. Dr.-Ing. Norbert Gronau Universität Potsdam August-Bebel-Str. 89 | 14482 Potsdam Germany Tel. +49 331 977 3322 E-Mail [email protected] Gronau, N., Gäbler, A.: Einführung in die Wirtschaftsinformatik, Band 1 5. überarbeitete Auflage, GITO Verlag Berlin 2014, ISBN 978-3-95545-096-0 36