Gliederung Datenbanksysteme Datenintegrität

Werbung
Lehrstuhl für Wirtschaftsinformatik
Prof. Dr. Roland Gabriel
Gliederung Datenbanksysteme
5. Datenbanksprachen
1. Datendefinitionsbefehle
2. Datenmanipulationsbefehle
3. Grundlagen zu SQL
Teil
Teil II
II
6. Metadatenverwaltung
7. DB-Architekturen
1. 3-Schema-Modell
2. Verteilte und föderierte Datenbanksysteme
8. Datenintegrität
1. Datenkonsistenz
2. Datensicherheit
3. Datenschutz
9. Data Warehousing und
On-Line Analytical Processing (OLAP)
Ruhr-Universität Bochum
Folie 198
Lehrstuhl für Wirtschaftsinformatik
Prof. Dr. Roland Gabriel
Datenintegrität
Im Bereich der Datenintegrität (lat.: Makellosigkeit) werden Fragen
behandelt, die sich mit der Korrektheit der Daten befassen.
Architektur von DBS
Externes
Modell 1
Externes
Modell 2
Integritätsziele
Datenschutz
(Zugriff durch Befugte im Rahmen der definierten
Befugnis)
Datenkonsistenz
Konzeptionelles
Modell
Physisches
Modell
Folie 199
(Widerspruchsfreiheit der Daten zu sich selbst
und den Vereinbarungen des konzeptionellen/der
externen Datenmodelle)
Datensicherheit
(Daten zu jedem Zeitpunkt in korrekter Form
nutzbar)
Ruhr-Universität Bochum
Lehrstuhl für Wirtschaftsinformatik
Prof. Dr. Roland Gabriel
Datenkonsistenz
logisch
Datenbasis nach
konzeptionellem
Modell
Datenschutz
ethisch
Verwendung
Eingabe
Datenintegrität
Datensicherheit
physisch
Betrieb
Folie 200
Ruhr-Universität Bochum
Lehrstuhl für Wirtschaftsinformatik
Prof. Dr. Roland Gabriel
Datenintegrität: Zielkonflikte
hoch
Maßnahmen zur Datenintegrität gehen in der Regel
zu lasten der Performance des DB-Systems
Datenintegrität
gering
gering
hoch
Performance
hoch
Maßnahmen zur Datensicherheit gehen in der Regel
zu Lasten des Datenschutzes
Datenschutz
gering
gering
hoch
Datensicherheit
hoch
Maßnahmen zur Datensicherheit gehen in der Regel
zu Lasten des Datenkonsistenz
Datenkonsistenz
gering
gering
hoch
Datensicherheit
Folie 201
Ruhr-Universität Bochum
Lehrstuhl für Wirtschaftsinformatik
Prof. Dr. Roland Gabriel
Gliederung Datenbanksysteme
5. Datenbanksprachen
1. Datendefinitionsbefehle
2. Datenmanipulationsbefehle
3. Grundlagen zu SQL
Teil
Teil II
II
6. Metadatenverwaltung
7. DB-Architekturen
1. 3-Schema-Modell
2. Verteilte und föderierte Datenbanksysteme
8. Datenintegrität
1. Datenkonsistenz
2. Datensicherheit
3. Datenschutz
9. Data Warehousing und
On-Line Analytical Processing (OLAP)
Ruhr-Universität Bochum
Folie 202
Lehrstuhl für Wirtschaftsinformatik
Prof. Dr. Roland Gabriel
Datenkonsistenz
Konsistenz: Eine Datenbank ist konsistent, wenn ihr Inhalt mit der
Beschreibung übereinstimmt und die gespeicherten Daten
widerspruchsfrei sind.
Redundanz: Redundanz ist in einem Datenbestand genau dann
vorhanden, wenn ein Teil des Bestandes ohne
Informationsverlust weggelassen werden kann.
Ungewollte Redundanzen werden vermieden bei
a) sorgfältigem Aufbau und strikter Umsetzung
eines ISM
b) genauer Anwendung der Normalformenlehre
Folie 203
Ruhr-Universität Bochum
Lehrstuhl für Wirtschaftsinformatik
Prof. Dr. Roland Gabriel
Datenkonsistenz: Beispiel
Fachbereich
Fachbereich
1
n
Dozent
Dozent
Fachbereich (FB_Nr, FB_Name, FB_Leiter, Sem_Etat, Ges_Honorar, ...)
Dozent (Doz_Nr, Doz_Name, Doz_Vname, Doz_Tel_Nr, Doz_Honorar, FB_Nr, ...)
Konsistenzbedingungen bei der Dozenten-Neuaufnahme:
KB_Doz_1: Dozentennummer muß eingegeben werden
KB_Doz_2: Dozentennummer muß eindeutig sein
KB_Doz_3: Fachbereichsnummer FB_Nr hat Gültigkeit
KB_Doz_4: Telefonnummer ist numerisch
KB_Doz_5: Honorar mindestens 400,- €, wenn verheiratet mind. 480,- €
KB_Doz_6: Semesteretat des Fachbereichs wird nicht überschritten
Ruhr-Universität Bochum
Folie 204
Lehrstuhl für Wirtschaftsinformatik
Prof. Dr. Roland Gabriel
Klassifizierung von Konsistenzbedingungen
1) Klassifizierung nach Objektmengenumfang
Welche Objekte sind bei der Konsistenzprüfung zu beachten?
a) Vergleich der eingegebenen Werte mit dem Bildungsgesetz einer Merkmalsklasse
(KB_Doz_1 und KB_Doz_4)
b) Vergleich der eingegebenen Werte mit dem Bildungsgesetzen mehrerer
Merkmalsklassen (KB_Doz_5)
c) Logischer Vergleich der eingegebenen Werte mit mehreren Informationsobjekten/
Datensätzen (KB_Doz_2)
d) Einbeziehung von Merkmalswerten anderer Informationsobjektklassen/ Relationen
(KB_Doz_3 und KB_Doz_6)
2) Klassifizierung nach Zeitpunkt der Konsistenzprüfung
Wann muss der Datenbestand wieder konsistent sein?
a) Primäre Konsistenzbedingungen: Nach jeder elementaren Operation (lesen,
schreiben) ist der Datenbestand wieder konsistent
b) Sekundäre Konsistenzbedingungen: (Quasizeitgleiche) Änderungen bei mehreren
Datenobjekten bedingen temporäre Inkonsistenz (KB_Doz_6)
3) Klassifizierung nach der Reaktionsform
a) stark - Weiterverarbeitung nur nach Korrektur
b) schwach - Weiterarbeit wird zugelassen
Folie 205
Ruhr-Universität Bochum
Lehrstuhl für Wirtschaftsinformatik
Prof. Dr. Roland Gabriel
Realisierung von
Konsistenzbedingungen
1) Realisierung durch Anwenderprogramme
Anwenderprogramm Prüfung
DBMS
Datenbasis
Ruhr-Universität Bochum
Folie 206
Lehrstuhl für Wirtschaftsinformatik
Prof. Dr. Roland Gabriel
Realisierung von
Konsistenzbedingungen
2) Realisierung durch das
Datenbanksystem
Anwenderprogramm
DBMS
Prüfung
DD
Datenbasis
Folie 207
Ruhr-Universität Bochum
Lehrstuhl für Wirtschaftsinformatik
Prof. Dr. Roland Gabriel
Transaktionskonzept
Transaktion:
Folge von Operationen, die eine
Datenbank ununterbrechbar von einem
konsistenten Zustand in einen erneut
konsistenten Zustand überführt.
Attributswertänderungen in
unterschiedlichen Relationen können
logische Einheiten darstellen.
Ruhr-Universität Bochum
Folie 208
Lehrstuhl für Wirtschaftsinformatik
Prof. Dr. Roland Gabriel
Forderungen an die
Transaktionsverwaltung
Atomizität
Jede Transaktion gilt als atomare Einheit.
Somit sind Transaktionen vollständig
oder gar nicht auszuführen.
Konsistenz
Jede Transaktion erzeugt einen
konsistenten Zustand.
Isolation
Die von einer Transaktion benötigten
Datenobjekte sind vor
konsistenzgefährdender Nutzung durch
andere Transaktionen geschützt.
Dauerhaftigkeit Ergebnisse einer Transaktion bleiben
auch bei einem Systemausfall erhalten.
Folie 209
Ruhr-Universität Bochum
Lehrstuhl für Wirtschaftsinformatik
Prof. Dr. Roland Gabriel
Gliederung Datenbanksysteme
5. Datenbanksprachen
1. Datendefinitionsbefehle
2. Datenmanipulationsbefehle
3. Grundlagen zu SQL
Teil
Teil II
II
6. Metadatenverwaltung
7. DB-Architekturen
1. 3-Schema-Modell
2. Verteilte und föderierte Datenbanksysteme
8. Datenintegrität
1. Datenkonsistenz
2. Datensicherheit
3. Datenschutz
9. Data Warehousing und
On-Line Analytical Processing (OLAP)
Ruhr-Universität Bochum
Folie 210
Lehrstuhl für Wirtschaftsinformatik
Prof. Dr. Roland Gabriel
Datensicherheit
Gegenstand: Technische und organisatorische Maßnahmen, die dafür
sorgen, daß Verluste, Beschädigungen, Verfälschungen von
und unberechtigter Zugriff auf Daten vermieden wird.
Zweck:
Daten sollen zu jeder Zeit in korrekter Form verfügbar sein
Organisatorische Maßnahmen:
Zugangskontrollen zu Datenträgerarchiven etc.
Technische Maßnahmen:
Problem: Abwicklung von Mehrbenutzerbetrieb.
Verhinderung gegenseitiger Blockierung unterschiedlicher Prozesse
Î Systemverklemmung (Deadlock)
Folie 211
Ruhr-Universität Bochum
Lehrstuhl für Wirtschaftsinformatik
Prof. Dr. Roland Gabriel
Datensicherheit
Unkritische Fälle:
- Transaktionen lassen sich seriell abwickeln.
- Transaktionen betreffen ungleiche Datenbereiche.
- Transaktionen sind ausschließlich Leseoperationen.
Kritischer Fall:
- Mehrere Benutzer arbeiten gleichzeitig an einer Datenbasis, wobei
mindestens ein Benutzer auch Daten verändern will.
Ruhr-Universität Bochum
Folie 212
Lehrstuhl für Wirtschaftsinformatik
Prof. Dr. Roland Gabriel
Synchronisation von Zugriffen bei
Mehrbenutzerbetrieb: Beispiel
Lese aktuelle
Teilnehmeranzahl und die
Teilnehmerobergrenze
Arbeitsplatz 1 für Kurs 4711
Wenn aktuelle
Teilnehmeranzahl < Teilnehmerobergrenze
Teilnehmeranzahl =
Teilnehmeranzahl +1
Ersetze alte
Teilnehmeranzahl durch
neue Teilnehmeranzahl
Wenn aktuelle
Teilnehmeranzahl < Teilnehmerobergrenze
Teilnehmeranzahl =
Teilnehmeranzahl +1
Ersetze alte
Teilnehmeranzahl durch
neue Teilnehmeranzahl
Zeit
Lese aktuelle
Teilnehmeranzahl und die
Teilnehmerobergrenze
Arbeitsplatz 2 für Kurs 4711
Folie 213
Ruhr-Universität Bochum
Lehrstuhl für Wirtschaftsinformatik
Prof. Dr. Roland Gabriel
Synchronisation von Zugriffen bei
Mehrbenutzerbetrieb: Sperren
Lösung des Problems: Mit dem Lesen der aktuellen
Teilnehmeranzahl wird dieser Attributwert gegen alle Versuche
anderer Transaktionen geschützt, ihn zu lesen oder zu ändern, bis
der der neue Wert für die aktuelle Teilnehmeranzahl gespeichert
ist.
Î Sperrmechanismen (Locks)
Arten von Sperrmechanismen:
9 Schreib- und Lesesperre
9 Schreibsperre (Bsp.: Veränderung eines Attributwertes, etwa Doz_Tel)
Klassifizierung nach Umfang der betroffenen Daten:
9 Von der ganzen Datenbank...
9 ... bis zu einzelnen Attributwerten
Normalfälle:
9 Sperre einer Relation bzw. Datei (File Locking)
9 Sperre eines Datensatzes (Record Locking)
Ruhr-Universität Bochum
Folie 214
Lehrstuhl für Wirtschaftsinformatik
Prof. Dr. Roland Gabriel
Deadlocks bei parallelen
Transaktionen
Transaktion 1
Transaktion 2
Erfolgreiche
Anforderung
einer S-Sperre
für Datenobjekt A
Erfolgreiche
Anforderung
einer SL-Sperre
für Datenobjekt B
Erfolglose
Anforderung
einer S-Sperre
für Datenobjekt B
Erfolglose
Anforderung
einer SL-Sperre
für Datenobjekt A
Verfahren zur Auflösung von Deadlocks
Graphenverfahren (Auflösung von Zyklen)
Zeitlimit-Verfahren, Time Out (Am längsten bearbeitete Transaktion wird
abgebrochen)
Folie 215
Ruhr-Universität Bochum
Lehrstuhl für Wirtschaftsinformatik
Prof. Dr. Roland Gabriel
Rücksetzung auf definierte Zustände
Transaktionsprinzip: Jede nicht abgeschlossene Transaktion muß
wirkungslos bleiben (Rücksetzung=„Undo“)
Recovery:
Konzepte und Verfahren zur Sicherung des
Wiederanlaufs von DB-Systemen
Transaktion T1
Transaktion T2
Transaktion T3
Zeit
SystemRücksetzungs-Zustand
zusammenbruch
(z.B. Hardwarefehler)
Ruhr-Universität Bochum
Folie 216
Lehrstuhl für Wirtschaftsinformatik
Prof. Dr. Roland Gabriel
Gliederung Datenbanksysteme
5. Datenbanksprachen
1. Datendefinitionsbefehle
2. Datenmanipulationsbefehle
3. Grundlagen zu SQL
Teil
Teil II
II
6. Metadatenverwaltung
7. DB-Architekturen
1. 3-Schema-Modell
2. Verteilte und föderierte Datenbanksysteme
8. Datenintegrität
1. Datenkonsistenz
2. Datensicherheit
3. Datenschutz
9. Data Warehousing und
On-Line Analytical Processing (OLAP)
Folie 217
Ruhr-Universität Bochum
Lehrstuhl für Wirtschaftsinformatik
Prof. Dr. Roland Gabriel
Datenschutz
Datenschutz Schutz personenbezogener Daten vor
Missbrauch
[Bundesdatenschutzgesetz u.a. Gesetze]
Forderungen des Datenschutzgesetzes:
9 Ziel und Zweck jeder Speicherung klar erkennbar
9 Speicherbeschränkung kritischer Daten auf das Notwendigste
9 Sammlung personenbezogener Daten ist zu registrieren und
von den betroffenen Personen einsehbar
9 Falsche Daten sind zu berichtigen
9 Nicht benötigte Daten sind zu löschen
9 Datenweitergabe nur nach besonderen Vorkehrungen
Ruhr-Universität Bochum
Folie 218
Lehrstuhl für Wirtschaftsinformatik
Prof. Dr. Roland Gabriel
Ebenen des Datenschutzes
Organisatorische
Maßnahmen
Identitätskontrolle
Zugriffskontrolle
Verschlüsselung
Datenbasis
Folie 219
Ruhr-Universität Bochum
Lehrstuhl für Wirtschaftsinformatik
Prof. Dr. Roland Gabriel
Datenschutz: Maßnahmen zur
Verhinderung unbefugten Zugriffs
Organisatorische Maßnahmen
(Diebstahlsicherung, bauliche Maßnahmen, Überwachung
peripherer Geräte etc.)
Zwang zur Identifikation
9 Benutzererkennung
9 Passwortabfrage
Beschränkung der Zugriffsrechte
9 Zugriffsumfang: Beschränkung der Datenobjekte, mit denen Benutzer
oder Benutzergruppen arbeiten dürfen
9 Zugriffsart: lesend, schreibend, lesend/schreibend
9 Beschränkung über Berechtigungsmatrix, Schlüssel-Schloß-Methode,
Views (Datenbanksprache)
Verschlüsselung des Datenmaterials (Kryptographie)
Problem: Geschwindigkeitsverlust beim Entschlüsseln
Ruhr-Universität Bochum
Folie 220
Lehrstuhl für Wirtschaftsinformatik
Prof. Dr. Roland Gabriel
Beispiel: Berechtigungsmatrix
Folie 221
Objekte Vorlesungs- Kursplan- Teilnehmer Teilnehmer DozentenNutzer
verzeichnis
daten
Grunddaten Leistungsdaten honorare
_
Kursinteressent
lesen
_
_
_
_
_
Dozent
lesen
lesen
(schreiben)
_
schreiben
eigene Kurse
_
_
Anmeldebearbeiter
lesen
_
lesen
schreiben
_
_
_
Buchhalter
lesen
_
lesen
_
_
_
_
_
_
lesen
_
_
_
Ruhr-Universität Bochum
Lehrstuhl für Wirtschaftsinformatik
Prof. Dr. Roland Gabriel
Zusammenfassung: Anforderungen
an Datenbanksysteme I
Grundlegende Anforderungen
9 Speicherung und Verwaltung der Datenbestände
9 Mehrbenutzerbetrieb mit Zugriffsregelung
Notwendige Anforderungen
9 Redundanzarmut bzw. -freiheit
9 Daten-Programm-Unabhängigkeit
9 Datenintegritätssicherung
• Datenkonsistenz
• Datensicherheit
• Datenschutz
Ruhr-Universität Bochum
Folie 222
Lehrstuhl für Wirtschaftsinformatik
Prof. Dr. Roland Gabriel
Zusammenfassung: Anforderungen
an Datenbanksysteme II
Weitere Anforderungen
Allgemeingültige Anforderungen
9 Leistungsfähigkeit
9 Flexibilität
9 Benutzungsfreundlichkeit
Anwendungsbezogene Anforderungen
9
9
9
9
Modellkonstrukte
Unterstützte Benutzerzahl
Kosten und Wirtschaftlichkeit
...
Allgemeine Anforderungen an Software
Folie 223
Ruhr-Universität Bochum
Lehrstuhl für Wirtschaftsinformatik
Prof. Dr. Roland Gabriel
Gliederung Datenbanksysteme
5. Datenbanksprachen
1. Datendefinitionsbefehle
2. Datenmanipulationsbefehle
3. Grundlagen zu SQL
Teil
Teil II
II
6. Metadatenverwaltung
7. DB-Architekturen
1. 3-Schema-Modell
2. Verteilte und föderierte Datenbanksysteme
8. Datenintegrität
1. Datenkonsistenz
2. Datensicherheit
3. Datenschutz
9. Data Warehousing und
On-Line Analytical Processing (OLAP)
Ruhr-Universität Bochum
Folie 224
Lehrstuhl für Wirtschaftsinformatik
Prof. Dr. Roland Gabriel
On-Line Analytical Processing (OLAP)
Software-Technologie, die Managern schnelle, interaktive und vielfältige
Zugriffe auf relevante und konsistente Informationen ermöglicht
Interaktivität: „..the name given to the dynamic enterprise analysis
required to create, manipulate, animate and synthesize information from
´Enterprise Data Models´." [Codd, Codd, Salley, 1993]
zwölf Evaluationsregeln nach Codd/Codd/Salley
Mehr- / Multidimensionalität:
9 Anordnung betriebswirtschaftlicher Variablen
(z.B. Kennzahlen) entlang mehrerer, unterschiedlicher Dimensionen (z.B. Region, Artikel,
Produkte, Zeit, Kunden)
Folie 225
IT
ZE
PRODUKT
dynamische,
dynamische,multidimensionale
multidimensionale
Analysen
Analysenauf
aufkonsolidierten
konsolidierten
Unternehmensdatenbeständen
Unternehmensdatenbeständen
23
40
45
15
54
80
45
60
56
REGION
Ruhr-Universität Bochum
Lehrstuhl für Wirtschaftsinformatik
Prof. Dr. Roland Gabriel
Dimensionen von Tabellen
Eindimensionale Tabelle
Zweidimensionale Tabelle
9 Relationale DBS
9 On-Line Transaction
Processing (OLTP)
Nr.
Nr.
11
22
33
44
55
66
77
88
99
Produkte
Produkte Monate
Monate
Produkt
Jan
Produkt 11
Jan
Produkt
Mär
Produkt 22
Mär
Produkt
Mär
Produkt 11
Mär
Produkt
Jan
Produkt 33
Jan
Produkt
Feb
Produkt 22
Feb
Produkt
Feb
Produkt 33
Feb
Produkt
Feb
Produkt 22
Feb
Produkt
Feb
Produkt 11
Feb
Produkt
Mär
Produkt 33
Mär
9 Multidimensionale DBS
9 On-Line Analytical
Processing (OLAP)
Wert
Wert
100
100
300
300
140
140
900
900
350
350
1100
1100
950
950
120
120
1000
1000
Produkt
Produkt 11
Produkt
Produkt 22
Produkt
Produkt 33
Jan
Feb
Mär
Jan
Feb
Mär
100
120
140
100
120
140
00 1300
300
300
1300
900
900 1100
1100 1000
1000
Datenzelle
Datenzelle
Datensatz
Datensatz
Ruhr-Universität Bochum
Folie 226
Lehrstuhl für Wirtschaftsinformatik
Prof. Dr. Roland Gabriel
Mehrdimensionale Würfel (OLAP)
und Datenzellenprinzip
Mehrdimensionaler Würfel
Datenzelle
är
ƒM
ƒJ
ƒProdukt 3
ƒProdukt 2
ƒProdukt 1
100
ƒAbsatz
an
ƒF
eb
Produkte
ƒProdukt 1
Monate
120
140
ƒPreis
4,5
5
4
ƒUmsatz
450
600
560
100
ƒJan
ƒAbsatz
Einzelne
Einzelne Elemente
Elemente des
des DimensionsDimensionsvektors
vektors liefert
liefert konkrete
konkrete Datenzelle
Datenzelle
Konten
Folie 227
Ruhr-Universität Bochum
Lehrstuhl für Wirtschaftsinformatik
Prof. Dr. Roland Gabriel
Bausteine multidimensionaler
Datenmodelle
1. Betriebswirtschaftliche Variablen
(Messgrößen, Kennzahlen, Fakten)
2. Dimensionen
3. Dimensionshierarchien
4. Regeln
Ruhr-Universität Bochum
Folie 228
Lehrstuhl für Wirtschaftsinformatik
Prof. Dr. Roland Gabriel
Bausteine multidimensionaler
Datenmodelle
1. Betriebswirtschaftliche Variablen
(Messgrößen, Kennzahlen, Fakten)
2. Dimensionen
3. Dimensionshierarchien
4. Regeln
Folie 229
Ruhr-Universität Bochum
Lehrstuhl für Wirtschaftsinformatik
Prof. Dr. Roland Gabriel
Betriebswirtschaftliche Variablen
(Kennzahlen)
Kennzahlendefinition
9 Zahl, die betriebliche und außerbetriebliche Informationen in
aussagekräftiger, komprimierter Form wiedergibt
Abgrenzungsmerkmale
9 Gegenstand (Mengen / Werte, Zeitpunkt / Zeitraum)
9 Objektbereich (Gesamtwirtschaftlich, Konzern, Teilbetrieb)
Absolute Kennzahlen
Relative Kennzahlen
(z.B. Beschäftigte,
Umsatz, Bilanzsumme)
• Gliederungszahlen
(z.B. Varianz,
Teil-/Gesamtgröße
Arithmetisches Mittel)
(z.B. EK / GK)
• Beziehungszahlen
Ursache/Wirkung
(z.B. Gewinn / EK)
• Indexzahlen
zeitliche Entwicklung im Verhältnis zum Basiswert ≈ 100%
Statistische Kennzahlen
Ruhr-Universität Bochum
Folie 230
Lehrstuhl für Wirtschaftsinformatik
Prof. Dr. Roland Gabriel
Kennzahlensysteme
geordnete Anzahl von Kennzahlen, die in einer Beziehung
zueinander stehen und als Gesamtheit über einen Sachverhalt
vollständig informieren
Spitzenkennzahl liefert die betriebswirtschaftlich wichtigste
Aussage des Systems in komprimierter Form
9
9
9
9
DuPont-Kennzahlensystem
RL-Kennzahlensystem
ZVEI-Kennzahlensystem
Balanced Scorecard
•
•
•
•
Folie 231
Finanzen
Kunden
Geschäftsprozesse
Lernen/Wachstum
UmsatzUmsatzrendite
rendite
RoI
RoI
Gewinn
Gewinn
::
Umsatz
Umsatz
x
x
KapitalKapitalumschlag
umschlag
Umsatz
Umsatz
::
Kapital
Kapital
DeckungsDeckungsbeitrag
beitrag
./.
./.
Fixe
Fixe
Kosten
Kosten
UmlaufUmlaufvermögen
vermögen
++
AnlageAnlagevermögen
vermögen
Umsatz
Umsatz
./.
./.
Variable
Variable
Kosten
Kosten
liquide
liquide
Mittel
Mittel
++
ForForderungen
derungen
++
Vorräte
Vorräte
Ruhr-Universität Bochum
Lehrstuhl für Wirtschaftsinformatik
Prof. Dr. Roland Gabriel
Kennzahlen als Bestandteile
multidimensionaler Datenstrukturen
Betrachtung von
Einzelkennzahlen
Absatzmenge
Zeit
Region
Betrachtung
mehrerer Kennzahlen
100
120
140
135
5
4
450
600
560
Artikel
Zeit
100
Kennzahlendimension
Erlös
- Stückkosten 80
= DB1
20
200
140
120
40
80
100
Artikel
Folie 232
Ruhr-Universität Bochum
Lehrstuhl für Wirtschaftsinformatik
Prof. Dr. Roland Gabriel
Bausteine multidimensionaler
Datenmodelle
1. Betriebswirtschaftliche Variablen
(Messgrößen, Kennzahlen, Fakten)
2. Dimensionen
3. Dimensionshierarchien
4. Regeln
Folie 233
Ruhr-Universität Bochum
Lehrstuhl für Wirtschaftsinformatik
Prof. Dr. Roland Gabriel
Dimensionen in Analyseorientierten Informationssystemen
Kostenstellen
Filialen
OrganisationsWerke
Abteilung Struktur
Gesellschaften
Produktgruppe
Artikel
Sparte
LeistungsStruktur Sortiment
Dienstleistungsarten
Kundengruppe
Regionen
Markt- Zielmärkte
Struktur
Lieferanten
Wettbewerber
Ruhr-Universität Bochum
Folie 234
Lehrstuhl für Wirtschaftsinformatik
Prof. Dr. Roland Gabriel
Unternehmensspezifische
Informationsstrukturen
Dimensionen
Dimensionen
Produktstruktur
Produktstruktur
Elemente
Elemente
......Produktgruppen,
Produktgruppen,Division,
Division,Produkte,
Produkte,......
Organisationsstruktur
Kostenstellen,Geschäftsbereiche,
Geschäftsbereiche,Gesellschaften...
Gesellschaften...
Organisationsstruktur ......Kostenstellen,
Vertriebsstruktur
Vertriebsstruktur
......Märkte,
Märkte,Kundengruppen,
Kundengruppen,Regionen
Regionen......
Zeitstruktur
Zeitstruktur
......Wochen,
Wochen,Quartale,
Quartale,Jahre,
Jahre,Monate
Monate......
WertIst,Plan,
Plan,Forecast,
Forecast,Budget
Budget......
Wert-/Szenarioarten
/Szenarioarten ......Ist,
Kennzahlen
Kennzahlen
Währungsarten
Währungsarten
......
Folie 235
......Umsatz,
Umsatz,Deckungsbeitrag,
Deckungsbeitrag,Umsatzrentabilität
Umsatzrentabilität......
......Lokalwährung,
Lokalwährung,Konzernwährung
Konzernwährung......
......
Ruhr-Universität Bochum
Lehrstuhl für Wirtschaftsinformatik
Prof. Dr. Roland Gabriel
Bausteine multidimensionaler
Datenmodelle
1. Betriebswirtschaftliche Variablen
(Messgrößen, Kennzahlen, Fakten)
2. Dimensionen
3. Dimensionshierarchien
4. Regeln
Ruhr-Universität Bochum
Folie 236
Lehrstuhl für Wirtschaftsinformatik
Prof. Dr. Roland Gabriel
Verdichtungshierarchien
Produktstruktur
OrganisationsStruktur
Produkt 1
LeistungsStruktur
MarktStruktur
Top-Level
Top-Level
Element
Element
Eine Dimensionshierarchie wird als ein
endlicher Baum definiert, der durch die
einzelnen Elemente (Dimensionsausprägungen) gebildet wird.
9 Level eines Knotens: Anzahl der Kanten
auf dem Weg vom Knoten zum Blatt
9 Tiefe eines Knotens: Anzahl der Kanten
auf dem Weg vom Knoten zur Wurzel
9 Generation eines Knotens: Tiefe + 1
Folie 237
Produkt 2
ProduktGruppe 1
Produkt 3
Produkt 4
ProdukteGesamt
Produkt 5
ProduktGruppe 2
Produkt 6
Produkt 7
Knoten
Knoten mit
mit Level
Level 00
Knoten
Knoten mit
mit Tiefe
Tiefe 22
Knoten
Knoten der
der Generation
Generation 33
Ruhr-Universität Bochum
Lehrstuhl für Wirtschaftsinformatik
Prof. Dr. Roland Gabriel
Parallele Hierarchien
Mehrfache Verdichtungshierarchien: einzelne Elemente einer Dimension
werden auf verschiedene Arten verdichtet
Verdichtungshierarchie 1
Hierarchisierung
der Monate
9 nach
Quartalen
9 nach
Jahreszeiten
Verdichtungshierarchie 2
Unbalancierte
Unbalancierte
Hierarchie
Hierarchie
Einfache
Einfache
Hierarchien
Hierarchien
nicht
nicht alle
alle Elemente
Elemente haben
haben
die
die gleiche
gleiche Tiefe
Tiefe
Alle
Alle Elemente
Elemente haben
haben
die
die gleiche
gleiche Tiefe
Tiefe
Hierarchisierung
der Kunden
9 nach
sachlichen Kriterien
(A-, B-, C-Kunden)
9 nach
Branchen
= Verdichtungs-Elemente (C)
= Basis-Elemente (N)
Ruhr-Universität Bochum
Folie 238
Lehrstuhl für Wirtschaftsinformatik
Prof. Dr. Roland Gabriel
Informationsinhalte
Datenzellen nehmen betriebswirtschaftliche Variablen bzw. Kennzahlen auf
Schnitt im n-dimensionalen Würfel wird als 2-dimensionale Tabelle dargestellt
Datenarten
... Ist ... Plan ... Prognose ... Simulation ... Budget ...
Kennzahlen
... Umsatz ... Kosten ... Variable Kosten ... Deckungsbeitrag ...
Produkte
Jahre
... Alle Prod.-Gruppen ... Oberklasse ... Mittelklasse ... A-Klasse ... C-Klasse ...
... ´1993 ... 1994 ... 1995 ... 1996 ... 1997 ... 1998 ... 1999 ... 2000 ...
Monat
Regionen
Januar
Februar
März
1. Quartal
Niederlande
Belgien
Luxemburg
BENELUX
2500
1200
80
3780
2600
1400
30
4030
2500
1500
40
4040
7600
4100
150
11850
2340
1450
90
3880
BRD
Frankreich
...
EU-Staaten
10360
12340
-
-
...
80340
...
90340
13200
8400
...
97550
35900
8400
...
268230
12450
9230
...
100230
'Dünn-besetzte'
'Dünn-besetzte'
Matrizen
Matrizen
Folie 239
Basiselemente
Basiselemente
(N-Elemente)
(N-Elemente)
Konsolidierte
KonsolidierteElemente
Elemente(C-Elemente)
(C-Elemente)
"On
"Onthe
thefly"
fly"Berechnung
Berechnung
April
Ruhr-Universität Bochum
Lehrstuhl für Wirtschaftsinformatik
Beispiel: Abbildung eines Datenwürfels in einem
multidimensionalen Datenbanksystem (MIS ALEA)
Prof. Dr. Roland Gabriel
Dimensionen
Dimensionen
Werte
Ruhr-Universität Bochum
Folie 240
Lehrstuhl für Wirtschaftsinformatik
Prof. Dr. Roland Gabriel
Navigation in
multidimensionalen Datenstrukturen
Slice
Dice
IT
ZE
Roll-Up
PRODUKT
Drill-Down
23
40
45
15
54
80
45
60
56
REGION
Folie 241
Ruhr-Universität Bochum
Lehrstuhl für Wirtschaftsinformatik
Prof. Dr. Roland Gabriel
Slice
Produkt
Produkt
4alle Regionen
4gesamter Zeitraum
4ein Produkt (Filter)
Ze
i
t
Region
Ze
i
t
Region
Ze
i
t
Region
Herausschneiden einzelner Scheiben, Schichten oder kleiner
Würfel aus dem Datenraum
Produktsicht
Regionale Sicht
Ad-hoc-Sicht
z.B. Produktmanager
z.B. Gebietsleiter
z.B. Analyst
Produkt
4alle Produkte
4gesamter Zeitraum
4eine Region (Filter)
4ein Produkt (Filter)
4ein Monat (Filter)
4eine Region (Filter)
Ruhr-Universität Bochum
Folie 242
Lehrstuhl für Wirtschaftsinformatik
Prof. Dr. Roland Gabriel
Dice
Ze
i
t
Region
Rotation des Datenwürfels
durch Drehen oder Kippen, um
eine andere Perspektive auf die
Daten zu ermöglichen.
Zeit
Folie 243
R
eg
io
n
Produkt
Produkt
Ruhr-Universität Bochum
Lehrstuhl für Wirtschaftsinformatik
Prof. Dr. Roland Gabriel
Drill-Down:
Dimension Region
Deutschland
Europa
Untersuchen der
Daten in einem feineren
Detaillierungsgrad innerhalb
der Attributehierarchie einer Dimension.
„Untersuchen von Detaildaten“
Hessen
Ruhr-Universität Bochum
Folie 244
Lehrstuhl für Wirtschaftsinformatik
Prof. Dr. Roland Gabriel
Roll-Up:
Dimension Region
Deutschland
Beim Roll-Up
werden die Werte auf
der nächsthöheren
Hierarchieebene analysiert.
Folie 245
Europa
Hessen
Ruhr-Universität Bochum
Lehrstuhl für Wirtschaftsinformatik
Prof. Dr. Roland Gabriel
Darstellung multidimensionaler
Strukturen im Relationenmodell
Würfel
WürfelAbsatz
Absatz
Relation
RelationAbsatz
Absatz
de 03/98
io
r
02/98
Pe
40
20
4712
4713
50
Nord
30
15
70
80
95
Süd
4711
20
Ost
Artikel
01/98
Artikel
Region
Periode
Absatzmenge
4711
Nord
01/98
40
4712
Nord
01/98
20
4713
Nord
01/98
30
4711
Ost
01/98
20
...
...
...
...
Region
Ruhr-Universität Bochum
Folie 246
Lehrstuhl für Wirtschaftsinformatik
Prof. Dr. Roland Gabriel
Darstellung multidimensionaler
Strukturen im Relationenmodell
Star-Schema
Star-Schema
Artikel
Artikel-ID
Bezeichnung
Maßeinheit
Packung
Farbe
Faktentabelle
Faktentabelle
1
n
n
Region
Region-ID
Bezeichnung
Fläche in qkm
Bevölkerung
1
Vertrieb
Artikel-ID
Perioden-ID
Regionen-ID
Absatzmenge
n
Periode
1
Perioden-ID
Bezeichnung
Dimensionstabellen
Dimensionstabellen
Folie 247
Ruhr-Universität Bochum
Lehrstuhl für Wirtschaftsinformatik
Prof. Dr. Roland Gabriel
werkzeuge
Data
Mining
Datensammlung zur
Unterstützung von
Managemententscheidungen
[Inmon, 1996]
AbfrageAbfrage- und
Berichtssysteme
Executive
Information Systeme
Data Mart
OLAPOLAPFrontend
Data Mart
MetadatenMetadatenbanksystem
OLAP Server
Zentrale
Zentrale
Datenbasis
Datenbasis
ArchivierungsArchivierungssystem
Endbenutzer-Data Warehouse Endbenutzer
werkzeuge
Data Warehouse-Konzept
9
9
9
9
Themenorientierung
Vereinheitlichung
Zeitorientierung
Beständigkeit
ETLETL-System
Externe
Daten
Operative Vorsysteme
Ruhr-Universität Bochum
Folie 248
Lehrstuhl für Wirtschaftsinformatik
Prof. Dr. Roland Gabriel
Standardwerkzeug im
Controlling: MS Excel
Tabellenkalkulation
Tabellenkalkulation
**********
Präsentationsgrafik
Präsentationsgrafik
**********
Datenbank
Datenbank
Folie 249
AnwendungsAnwendungsprogrammierung
programmierung
mit
mitVBA
VBA
Ruhr-Universität Bochum
Lehrstuhl für Wirtschaftsinformatik
Prof. Dr. Roland Gabriel
Klassische Tabellenkalkulationen
Vorteile
Nachteile
9 breite Basis an Formeln &
Funktionen
9 einfaches Handling durch
Integration in Office-Suite
9 hohes Maß an Flexibilität bei
vielen
Gestaltungsmöglichkeiten
9 Existenz von einer Vielzahl von
betriebswirtschaftlichen Tools
9 Standard für
Controllinganwendungen
X
X
X
X
9 nicht integrierte Datenverwaltung
provoziert Fehler
9 Mehrbenutzereinsatz nur
eingeschränkt möglich
9 zentrale Administration nur
eingeschränkt möglich
9 sehr heterogener Kenntnisse bei
Anwendern
9 kein zentrales, integriertes
Konzept für Datenversorgung
führt zu redundanter und
inkonsistenter Datenhaltung
9 begrenzte Datenmenge
X
X
X X
Folie 250
X
Ruhr-Universität Bochum
Lehrstuhl für Wirtschaftsinformatik
Prof. Dr. Roland Gabriel
Klassische Datenbanksysteme
Vorteile
9 Große Datenmengen bei
performanter Verarbeitung
9 Client/Server Technologie
9 Professioneller
Mehrplatzeinsatz
9 Benutzerverwaltung
9 Konsistente Schnittstellen
9 Redundante Datenhaltung
9 Professionelle Verwaltung
der Datenintegrität
• Datenschutz
• Datenkonsistenz
• Datensicherheit
Nachteile
9 umfangreiches Know-how zum
Aufbau
9 Aufwendige
Strukturveränderungen
9 Administrationsaufwand
9 Aufwendige Erstellung von
Benutzerschnittstellen
9 kaum Möglichkeiten zur
individuellen Gestaltung
9 hohe Kosten
9 ...
9 ...
Folie 251
Ruhr-Universität Bochum
Lehrstuhl für Wirtschaftsinformatik
Prof. Dr. Roland Gabriel
Integration von OLAP-Datenbank
und Tabellenkalkulation
Vorteile Tabellenkalkulation
Vorteile Datenbanksysteme
9 breite Basis an Formeln &
Funktionen
9 einfaches Handling durch
Integration in Office-Suite
9 hohes Maß an Flexibilität bei
vielen Gestaltungsmöglichkeiten
9 Existenz von einer Vielzahl von
betriebswirtschaftlichen Tools
9 Standard für
Controllinganwendungen
9 Große Datenmengen bei
performanter Verarbeitung
9 Client/Server Technologie
9 Professioneller Mehrplatzeinsatz
9 Benutzerverwaltung
9 Konsistente Schnittstellen
9 Redundante Datenhaltung
9 Professionelle Verwaltung der
Datenintegrität
&
Multidimensionale Datenbank
Flexible Standard-Benutzeroberfläche
Folie 252
Ruhr-Universität Bochum
Herunterladen