Teil 4 - Von der Realwelt zum Datenmodell Wintersemester 2015/16

Werbung
Einführung in die Wirtschaftsinformatik
Teil 4 - Von der Realwelt zum Datenmodell
Wintersemester 2015/16
Lehrstuhl für Wirtschaftsinformatik
und Electronic Government
Universität Potsdam
Chair of Business Information Systems
and Electronic Government
University of Potsdam
Univ.-Prof. Dr.–Ing. habil. Norbert Gronau
Lehrstuhlinhaber | Chairholder
August-Bebel-Str. 89 | 14482 Potsdam | Germany
Tel
Fax
+49 331 977 3322
+49 331 977 3406
E-Mail [email protected]
Web
lswi.de
1
Inhalt
Modellierung - Abbildung des betrachteten Originals
Vom Original zum Modell - Abbildungsschritte
Datenmodelle und -strukturen
Datenbanken und Datenbankmanagementsysteme
Das physische Schema
2
Modellierung - Abbildung des betrachteten Originals
Vom Original zum Modell - Abbildungsschritte
Datenmodelle und -strukturen
Datenbanken und Datenbankmanagementsysteme
Das physische Schema
3
Gründe elektronischer Datenspeicherung
Vorteile gegenüber analoger Archivierung und Informationsaufbereitung (z.B. Karteikästen,
Mikrofilme)
Schnellerer Zugriff auf und effizientere Verarbeitung von Daten - Arbeitserleichterung und
Zeiteinsparung
Kostensenkung - Technik übernimmt - Entbindung der Arbeitskräfte von monotonen
Aufgaben
Zentrale Vernetzung und Verfügbarkeit - Möglichkeit der Nutzung durch Dritte
Verwaltung beliebig großer Datenmengen
4
Daten
1 Müller, Thomas, FC Bayern
2 Reus, Marco, Dortmund
3 Wiese, Tim, TSG Hoffenheim
4 ...
Statisches Abbild der Anwendungswelt
Personen - Fußballspieler, Politiker, Studierende
Gegenstände - Bücher, Werkzeuge
Künstliche Objekte - Bank- oder
Versicherungskonten
Indirekter Ausdruck der Dynamik
Kontostand vor und nach einer Transaktion
Umsatzvolumen vor und nach einer Lieferung
Spieltabelle (Turniertabelle) vor und nach einem
Spieltag
Daten bilden die Basis für die Verknüpfung von Informationen. Im Ergebnis entsteht Wissen.
5
Prinzipien der Kategorisierung von Daten
Lagerbestände,
Kontostände, Aufträge
Produkt- und Preisliste
eines Anbieters
Bruttopreis von
Produkten über
Mehrwertsteuer
Kundendaten
... nach Inhalt
Stamm- und deren Änderungsdaten --> Seltene
Veränderungen
Bestandsdaten und deren Änderung durch
Bewegungsdaten --> Häufige Veränderungen
... nach Aufgabe
Ordnungsdaten --> Identifikation (Personen, Dinge)
oder Vergleiche (Preise, Gehälter)
Rechendaten --> Berechnung oder Umrechnung
von Werten
6
Aufgaben in der Datenhaltung
Aufgaben in betriebswirtschaftlichen Informationssystemen
Erfassung von
Geschäftsvorfällen
(Bewegungsdaten)
Verarbeiten der
Geschäftsvorfälle (Verarbeiten
mit Stamm- oder
Bestandsdaten)
Pflege der Stammdaten
(Aktualisierung der Stammdaten
- Änderungsdienst)
Informationsabfragen
(Standard-/Ad-hoc-Abfragen)
Auswählbare Grundoperationen
für Datenbearbeitung
Auffinden - wird mehrfach
benötigt
Einfügen
Ändern
Entfernen
Verarbeitungsformen von Daten
innerhalb von Dateisystemen
Starr fortlaufend (sequentiell)
Logisch fortlaufend (z.B. indexsequentiell)
Wahlfrei (direct access)
Die Operation Auffinden bestimmt häufig über das Antwortzeitverhalten des gesamten
Informationssystems.
7
Logische Datenhaltung
Logische Sicht
Hierarchische Dateiverwaltung ->
Verzeichnisse (directories)
Datei -> auf Datenspeicher
abgelegte Datenmenge mit Zugriff
über Dateiname
Dateiinhalt
Datenobjekte
Beschreibung durch ihre
Eigenschaften
Beispiele - Objekte
Personen: Lieferanten, Kunden,
Mitarbeiter
Gegenstände: Maschinen,
Werkzeuge, Materialien
Abstrakte: Konten, Buchungen,
Rechnungen
Einsatz von Verfahren zur Strukturierung von Daten bzw. -beständen.
Quelle: Stahlknecht 2002, S. 138ff.
8
Datenstrukturen (Dateneinheiten)
Grundbegriffe
Datenelement (item) - kleinste logische
Dateneinheit (z.B. Wohnort,
Produktnummer, Nachname, etc.)
Datensatz (record) - Bildung durch
Datenelemente desselben Objekts (z.B.
Kunde = Kundennummer, Nachname,
Vorname, etc.)
Datei (file) - gleichartige und logisch
zusammengehörige Datensätze (z.B.
Kunden, Produkte, Zulieferer, etc.)
Datenbank (data base) - kann aus
mehreren Dateien bestehen (Hinweis:
Zwischen den einzelnen Dateien
bestehen dabei immer logische
Abhängigkeiten)
Datenstrukturen beschreiben, wie Daten miteinander assoziiert werden.
9
Modellierung - Abbildung des betrachteten Originals
Vom Original zum Modell - Abbildungsschritte
Datenmodelle und -strukturen
Datenbanken und Datenbankmanagementsysteme
Das physische Schema
10
Abbildung der realen Welt
Anwendungsbeispiele:
Betrachtung interessierender Ausschnitte der
Realwelt
Vorgänge, Veränderungen oder statische
Momentaufnahmen
Externes Schema - Beschreibung interessierender
Teile der Anwendungswelt
Datenschema - formale Beschreibung der Struktur
von Daten
Arbeitsgebiet des Einkäufers/Verkäufers
Lager
Buchhaltungsbereiche
Produktionsprozesse
Gegenstände Zusammenhänge
Wirklichkeitsausschnitt
Informationen
Sachverhalte
("Miniwelt")
Tatsachen
Personen
Vorgänge,
Veränderunge
n
11
Konzeptuelles Schema
Gegenstände
Personen
Zusammenhänge
Wirklichkeitsausschnitt
Informationen
Sachverhalte
("Miniwelt")
Tatsachen
Personen
Vorgänge,
Veränderungen
Ansatz
Konzeptueller Entwurf der Miniwelt
Erzeugung einer umfassenden
Strukturierung der gesamten
Informationsanforderungen
(Datenbankentwurf )
Ergebnis
Konzeptuelles Schema
Umfassende Beschreibung der
gesamt interessierenden Anwendungswelt (z.B. Schema einer
Import-/ Exportfirma)
Darstellung
Entity Relationship Modell
Stellt zu betrachtende Daten anwendungs- und speicherneutral dar.
12
Logisches Schema
PERS_NR
NAME
VORNAME
LEITER
...
Mitarbeiter
PERS_NR
arbeitet_in
Projekt
NAME
VORNAME
PERS_NR
LEITER
...
PROJ_NR
PERS_NR
PROJ_NR
PROJ_NAME
Attribut
PROJ_NR
PROJ_LEITER
PROJ_NR
Weiterführung
Logischer Entwurf
Abbildung der Zusammenhänge
des konzeptionellen Schemas in
Relationsschemata
PROJ_NAME
Relationales Datenmodell
Relationstyp/Relationsformat
PROJ_LEITER
Ergebnis
Logisches Schema
Teil des zum Einsatz kommenden
(relationalen) Datenbanksystems
(DB-Realisierung)
Relation
Fremdschlüssel
Tupel
Attributwert
Darstellung
Hierarchisches Netzwerk
Relationenmodell
Beschreibt den gesamten Datenbestand anwendungsneutral und speicherunabhängig.
13
Physisches Schema
Relationales Datenmodell
Relationstyp/Relationsformat
Attribut
Relation
Fremdschlüssel
Tupel
Attributwert
Realisierung
Physischer Entwurf
Speicherung von Relationen auf
Speichermedien
Ergebnis
Physische Ablage der Daten auf
Speichermedium als Dateien,
physi- sche Records unsortiert
Zugriffsbeschleunigung durch
Indizierung der Records
Darstellung
Interne Speicherorganisation einer
Festplatte
Zugriffe auf Hardware von
Datenbank (Oracle u.a.) über
Betriebssystem
Eine DB besteht aus dem DB-Schema und dem DB-Zustand.
14
Abbildungsschritte von der Realität zur physischen Datenbank
Beispiele
Firmendaten,
Telefonbuch,
Bücherbestand
Realitätsausschnitt
modelliert in
konzeptuelles
Schema
Entity-Relationship
logische
Datenunabhängigkeit
überführt in
logisches
Schema
Objektstrukturen,
Relationen
physische
Datenunabhängigkeit
DB2, Oracle,
MySQL, MSSQL
überführt in
physisches
Schema
Schemata sind zentrale Ergebnisse der Datenmodellierung!
15
Modellierung - Abbildung des betrachteten Originals
Vom Original zum Modell - Abbildungsschritte
Datenmodelle und -strukturen
Datenbanken und Datenbankmanagementsysteme
Das physische Schema
16
Datenmodell - Beispiel Hierarchisches Modell
Kunde
Adresse
Land
Kunden_Nr
Ort
Art_Nr
Vorname
Strasse
Bezeichnung
Nachname
Haus_Nr
Preis
Artikel
Telefon
Lieferant
Lief_Nr
Lagerort
Lief_Name
17
Datenmodell - Beispiel Netzwerkmodell
bestellt
Kunde
Adresse
Artikel
Kunden_Nr
Land
Ort
Art_Nr
Vorname
Strasse
Bezeichnung
Nachname
Haus_Nr
Telefon
Preis
Lieferant
Lagerort
Lieferant
liefert
Lief_Nr
Lief_Name
Quelle: Gartner 2009
18
Datenmodell - Grundlagen
Definition Datenmodell
Festlegung der elementaren Datentypen und
Datenstrukturen
Vorgabe der Konstrukte, mit denen Modellierung
eines Diskursbereichs (klar nach außen abgegrenzte
Miniwelt) hinsichtlich seiner Struktur und Inhalte
vorgenommen werden kann
Beschreibung der statischen Aspekte eines Systems
Ein Datenmodell beschreibt eine
Ordnungsvorstellung zur Strukturierung der Daten in
einer Datenbank.
Gebräuchliche Datenmodelle
Hierarchisches Modell (historisch)
Netzwerk-Modell (historisch)
Entity-Relationship-Modell (ERM, viele
Erweiterungen)
Relationales Modell
Objektorientiertes Datenmodell
Objekt-relationales Datenmodell (Kombination aus
den beiden vorgenannten)
ER-Modelle bilden oft den Ausgangspunkt für Implementationen ins Datenbankmodell des jeweiligen
Datenbankverwaltungssystems.
19
Datenmodellierung für statische Systeme
Gegenstände Zusammenhänge
Wirklichkeitsausschnitt
Informationen
Sachverhalte
("Miniwelt")
Tatsachen
Personen
Vorgänge,
Veränderungen
Ziel
Modellierung einer Miniwelt
Beschreibung der Struktur großer
Datenmengen
Beispiele: Kundendaten,
Bibliotheksbestand, ...
Beschrieben werden...
... beteiligte Objekte (Entitäten,
Datensätze, ... ) und deren
Eigenschaften (Attribute)
... statische Beziehungen zwischen
den Objekten
NICHT beschrieben werden ...
... Abläufe resp. zeitliches Verhalten
etc.
... Datenflüsse oder Interaktionen
20
Modellierung - Abbildung des betrachteten Originals
Vom Original zum Modell - Abbildungsschritte
Datenmodelle und -strukturen
Datenbanken und Datenbankmanagementsysteme
Das physische Schema
21
Datenbanken
Eine Datenbank enthält ...
... ein Datenbankschema und ...
... eine Menge von konkreten Daten
Anwendungsprogramme
Informationsmodell
Datenbanken beschreiben genau einen Zustand der im Schema modellierten Anwendungswelt.
22
Datenorientierte Software
Datenbankmanagementsystem (DBMS)
Leistet technische Verwaltung einer oder mehrerer
Datenbanken
Bsp.: ORACLE, MySQL, DB2, Sybase System XII
(DB)-Anwendung, Anwendungsprogramm
Greift auf DBS zu - realisiert Funktionalitäten für
Anwender
Bsp.: Auftragserfassung der Import-/Export-Firma
Datenbanksystem (DBS)
DBMS sowie von ihm verwaltete Datenbanken
Bsp.: MySQL mit Datenbank der Import-/ExportFirma
Informationssystem (IS)
Anwendungen und DBS sind zusammengefasst
Bsp.: Gesamte, integrierte operative SW Import-/
Export-Firma
Aufgabe und Ziel der Software besteht in der Strukturierung und Speicherung der Daten nach
festgeschriebenen Ordnungskriterien.
23
Einsatz von Datenbanksystemen
Schritte zum Einsatz eines DB-Systems
Quelle: Elmasri 2002, S. 571ff.
24
Anforderungen an Datenbanken
Anforderungen an die Hardware
Große Speicherkapazität
Effiziente Verarbeitung, kurze Antwortzeiten
Niedrige Kosten
Anforderungen an den Aufbau
Datenunabhängigkeit
Änderungen auf einer Ebene wirken sich nicht auf
andere Ebenen aus (siehe auch
Architekturmodell:
3-Schichtenkonzept)
Anforderungen an die Software
Datensicherheit und –schutz
Vermeidung von Redundanz
Konsistenz (Widerspruchsfreiheit)
Persistenz (Robustheit gegenüber Hardwarefehlern)
Anforderungen an die Bedienung
Einhaltung von Standards
Benutzerfreundlich, strukturierte Ablage (logisch,
physisch)
Mehrbenutzerbetrieb
Datenunabhängigkeit ist die wesentlichste Anforderung. Sie beinhaltet die Trennung von Daten und
Programmcode.
Quelle: Elmasri 2002, S. 571ff.
25
Vorteile von Datenbanken
Einheitliches Konzept
Verringerung von Erstellungsund Verwaltungsaufwand
Zusammenfassung mehrfach benötigter Funktionen
Kollisionsfreier paralleler Datenzugriff
Gleichzeitiger Zugriff auf Daten durch mehrere
Anwender
Datenformat unabhängig von Bezug nehmenden
Programmen
Möglichkeit spontaner Abfragen abweichend von
Programmen
Vermeidung von Datenredundanz
Zu jedem in DB gespeicherten
Objekt genau ein Satz von Daten
Verminderung mangelnder Übereinstimmung
(z.B. bei Änderungen)
Zentrale Datensicherheit und -schutz
Vertraulichkeit
Integrität der Daten
26
Datensicherheit - Datenintegrität
Grundlagen zuverlässiger
Informationsverarbeitung
Datensicherheit - Schutz vor Verlust von Datenbeständen durch technische Ausfälle
Datenintegrität - Maßnahmen zur Gewährleistung
unbeschädigter Daten in einem System während
Verarbeitung
Realisierung über Transaktion
"Übergang der Datenbank von einem in einen
anderen konsistenten Zustand"
In sich abgeschlossener Verarbeitungsschritt
innerhalb der Anwendungen der betreffenden
Miniwelt
Kann aus mehreren Teilschritten bzw. Vorgängen
bestehen
Quelle: Stahlknecht 2002, S.192f.
27
ACID-Prinzip
Atomare Transaktionen
ITY
C
I
ATOM
Änderung passiert ganz oder gar nicht
Auch bei mehreren Schritten
Konsistente Transaktionen STENCY
NSI
O
C
Datenbank wird in einem konsistenten Zustand
gehalten
War vor Ausführung der Änderung in einem solchen
Isolierte Transaktionen
N
TIO
A
L
ISO
Unabhängig von eventuell parallel laufenden
Prozessen
Verarbeitung nur konsistenter Daten
Dauerhafte Transaktionen ILITY
RAB
U
D
Permanente Erhaltung geänderter Daten in der
Datenbank
Auch: Pufferdaten
Das Transaktionsprinzip realisiert die Sicherung vor Datenverlust.
28
Konzept der Datenunabhängigkeit
Weitestgehende Unabhängigkeit von Daten mit
Programmen/Nutzern
Schutz des DBMS-Benutzers
Bei Änderungen in der Systemumgebung
(Datenbank- tuning, Erweiterung von
Speicherstrukturen) - keine Auswirkung auf
Funktionen in Anwendungs- programmen
Beispiele:
Transparenz der physischen Organisation der Daten
für Dialoge und Programme
Organisation von Datenstruktur und Zugriffspfaden
ist nicht Programmaufgabe
Firmendaten,
Telefonbuch,
Bücherbestand
Realitätsmodelliert
modelliert
Entity
konzeptuelles
logische
Objektstrukturen
logisches
physische
DB2, Oracle,
überführt
überführt
physisches
Quelle: Elmasri 2002, S. 51f.
29
Datenunabhängigkeit
Physische Datenunabhängigkeit
Zweckeignung
Verfügbarkeit im Wirkungsbereich des
Wirtschaftsgutes
Übertragbarkeit von einem Wirkungsbereich in einen
anderen
Logische Datenunabhängigkeit
Interpretation von Datenbestand und inneren
Zusammenhängen für verschiedene Anwendungen
aus unterschiedlichen Perspektiven
Änderungen des konzeptuellen Schemas ohne
Auswirkungen auf externe Schemata bzw.
Anwendungen
Forderung: Erweiterung der DB durch
Hinzufügung eines Datensatztyps oder
Datenfeldes oder Reduzierung durch Löschung
Auswirkung: Änderung der Definition von Sichten
und Transformationen zwischen den Schichten
Beispiel: Aufnahme eines Datensatztyps, der
Verwaltung und Speicherung von Grafiken zulässt
Quelle: Elmasri 2002, S. 51
30
Modellierung - Abbildung des betrachteten Originals
Vom Original zum Modell - Abbildungsschritte
Datenmodelle und -strukturen
Datenbanken und Datenbankmanagementsysteme
Das physische Schema
31
Anforderungen an das physische Schema
Forderungen für Beschreibung eines
interessierenden Bereiches durch konzeptuelles
Schema
Funktionale Trennung zu Anwendungsschichten
Beschreibung konsistent, d.h widerspruchsfrei
Integration der Sichtweisen aller Beteiligten
Widerspruchsfreies Überblicken und "Verstehen"
des modellierten Bereiches
Inkonsistenz - mögliche Folge von Redundanz
Redundanz = mehrfache Speicherung derselben
Daten
Resultat: Redundante Daten können unterschiedliche
Werte beinhalten --> Inkonsistenz
Forderung: Nur kontrollierte Mehrfachspeicherung von
Daten
Ein Datenbanksystem erzwingt innerhalb eines Informationssystems ein sogenanntes zentrales
Konsistenzverständnis.
32
Datenzugriff im physischen Schema
Probleme des Mehrbenutzerbetriebs
Unkontrollierter Zugriff - erzeugt
evtl. Widersprüche in
Dateninhalten
Beschränkte Zugriffsmöglichkeiten
Zugriff auf Daten anderer
Anwendungen nur schwer
möglich
Rechte-/Sichtenverwaltung
sorgt für flexible Vergabe von
Zugriffsrechten
Verlust von Daten/Integritätsverletzung
Wiederherstellung von Daten im
Fehlerfall sehr schwierig
Transaktionen dürfen nur
vollzogen werden, wenn
Datenbasis in konsistenten
Zustand überführt ist
Forderung:
Durch einheitliches Datenmodell
sind Daten problemlos miteinander
verknüpfbar
Bei unkontrolliertem Zugriff kann es bei Mehrbenutzerbetrieb leicht zu Anomalien kommen.
33
Kontrollfragen
Wie geschieht der Übergang von der realen Welt zur Datenbank?
Welche Aufgaben hat ein Datenbankmanagementsystem?
Was ist eine Transaktion?
Warum muss der normale Benutzer sich nicht um den Mehrbenutzerbetrieb kümmern?
34
Literatur
Elmasri, R./Navathe, S. B.: Grundlagen von Datenbanksystemen; 3. Auflage, 2002, Addison-Wesley
Stahlknecht, P./Hasenkamp, U.: Einführung in die Wirtschaftsinformatik; 11. Auflage, 2004, Springer Verlag
Mertens P. et. al: Grundzüge der Wirtschaftsinformatik; 9. Auflage; 2005, Springer Verlag
35
Zum Nachlesen
Kontakt
Univ.-Prof. Dr.-Ing. Norbert Gronau
Universität Potsdam
August-Bebel-Str. 89 | 14482 Potsdam
Germany
Tel. +49 331 977 3322
E-Mail [email protected]
Gronau, N., Gäbler, A.:
Einführung in die Wirtschaftsinformatik, Band 1
5. überarbeitete Auflage,
GITO Verlag Berlin 2014, ISBN 978-3-95545-096-0
36
Herunterladen