Lehrstuhl für Wirtschaftsinformatik Prof. Dr. Roland Gabriel Gliederung Datenbanksysteme 5. Datenbanksprachen 1. Datendefinitionsbefehle 2. Datenmanipulationsbefehle 3. Grundlagen zu SQL Teil Teil II II 6. Metadatenverwaltung 7. DB-Architekturen 1. 3-Schema-Modell 2. Verteilte und föderierte Datenbanksysteme 8. Datenintegrität 1. Datenkonsistenz 2. Datensicherheit 3. Datenschutz 9. Data Warehousing und On-Line Analytical Processing (OLAP) Ruhr-Universität Bochum Folie 198 Lehrstuhl für Wirtschaftsinformatik Prof. Dr. Roland Gabriel Datenintegrität Im Bereich der Datenintegrität (lat.: Makellosigkeit) werden Fragen behandelt, die sich mit der Korrektheit der Daten befassen. Architektur von DBS Externes Modell 1 Externes Modell 2 Integritätsziele Datenschutz (Zugriff durch Befugte im Rahmen der definierten Befugnis) Datenkonsistenz Konzeptionelles Modell Physisches Modell Folie 199 (Widerspruchsfreiheit der Daten zu sich selbst und den Vereinbarungen des konzeptionellen/der externen Datenmodelle) Datensicherheit (Daten zu jedem Zeitpunkt in korrekter Form nutzbar) Ruhr-Universität Bochum Lehrstuhl für Wirtschaftsinformatik Prof. Dr. Roland Gabriel Datenkonsistenz logisch Datenbasis nach konzeptionellem Modell Datenschutz ethisch Verwendung Eingabe Datenintegrität Datensicherheit physisch Betrieb Folie 200 Ruhr-Universität Bochum Lehrstuhl für Wirtschaftsinformatik Prof. Dr. Roland Gabriel Datenintegrität: Zielkonflikte hoch Maßnahmen zur Datenintegrität gehen in der Regel zu lasten der Performance des DB-Systems Datenintegrität gering gering hoch Performance hoch Maßnahmen zur Datensicherheit gehen in der Regel zu Lasten des Datenschutzes Datenschutz gering gering hoch Datensicherheit hoch Maßnahmen zur Datensicherheit gehen in der Regel zu Lasten des Datenkonsistenz Datenkonsistenz gering gering hoch Datensicherheit Folie 201 Ruhr-Universität Bochum Lehrstuhl für Wirtschaftsinformatik Prof. Dr. Roland Gabriel Gliederung Datenbanksysteme 5. Datenbanksprachen 1. Datendefinitionsbefehle 2. Datenmanipulationsbefehle 3. Grundlagen zu SQL Teil Teil II II 6. Metadatenverwaltung 7. DB-Architekturen 1. 3-Schema-Modell 2. Verteilte und föderierte Datenbanksysteme 8. Datenintegrität 1. Datenkonsistenz 2. Datensicherheit 3. Datenschutz 9. Data Warehousing und On-Line Analytical Processing (OLAP) Ruhr-Universität Bochum Folie 202 Lehrstuhl für Wirtschaftsinformatik Prof. Dr. Roland Gabriel Datenkonsistenz Konsistenz: Eine Datenbank ist konsistent, wenn ihr Inhalt mit der Beschreibung übereinstimmt und die gespeicherten Daten widerspruchsfrei sind. Redundanz: Redundanz ist in einem Datenbestand genau dann vorhanden, wenn ein Teil des Bestandes ohne Informationsverlust weggelassen werden kann. Ungewollte Redundanzen werden vermieden bei a) sorgfältigem Aufbau und strikter Umsetzung eines ISM b) genauer Anwendung der Normalformenlehre Folie 203 Ruhr-Universität Bochum Lehrstuhl für Wirtschaftsinformatik Prof. Dr. Roland Gabriel Datenkonsistenz: Beispiel Fachbereich Fachbereich 1 n Dozent Dozent Fachbereich (FB_Nr, FB_Name, FB_Leiter, Sem_Etat, Ges_Honorar, ...) Dozent (Doz_Nr, Doz_Name, Doz_Vname, Doz_Tel_Nr, Doz_Honorar, FB_Nr, ...) Konsistenzbedingungen bei der Dozenten-Neuaufnahme: KB_Doz_1: Dozentennummer muß eingegeben werden KB_Doz_2: Dozentennummer muß eindeutig sein KB_Doz_3: Fachbereichsnummer FB_Nr hat Gültigkeit KB_Doz_4: Telefonnummer ist numerisch KB_Doz_5: Honorar mindestens 400,- €, wenn verheiratet mind. 480,- € KB_Doz_6: Semesteretat des Fachbereichs wird nicht überschritten Ruhr-Universität Bochum Folie 204 Lehrstuhl für Wirtschaftsinformatik Prof. Dr. Roland Gabriel Klassifizierung von Konsistenzbedingungen 1) Klassifizierung nach Objektmengenumfang Welche Objekte sind bei der Konsistenzprüfung zu beachten? a) Vergleich der eingegebenen Werte mit dem Bildungsgesetz einer Merkmalsklasse (KB_Doz_1 und KB_Doz_4) b) Vergleich der eingegebenen Werte mit dem Bildungsgesetzen mehrerer Merkmalsklassen (KB_Doz_5) c) Logischer Vergleich der eingegebenen Werte mit mehreren Informationsobjekten/ Datensätzen (KB_Doz_2) d) Einbeziehung von Merkmalswerten anderer Informationsobjektklassen/ Relationen (KB_Doz_3 und KB_Doz_6) 2) Klassifizierung nach Zeitpunkt der Konsistenzprüfung Wann muss der Datenbestand wieder konsistent sein? a) Primäre Konsistenzbedingungen: Nach jeder elementaren Operation (lesen, schreiben) ist der Datenbestand wieder konsistent b) Sekundäre Konsistenzbedingungen: (Quasizeitgleiche) Änderungen bei mehreren Datenobjekten bedingen temporäre Inkonsistenz (KB_Doz_6) 3) Klassifizierung nach der Reaktionsform a) stark - Weiterverarbeitung nur nach Korrektur b) schwach - Weiterarbeit wird zugelassen Folie 205 Ruhr-Universität Bochum Lehrstuhl für Wirtschaftsinformatik Prof. Dr. Roland Gabriel Realisierung von Konsistenzbedingungen 1) Realisierung durch Anwenderprogramme Anwenderprogramm Prüfung DBMS Datenbasis Ruhr-Universität Bochum Folie 206 Lehrstuhl für Wirtschaftsinformatik Prof. Dr. Roland Gabriel Realisierung von Konsistenzbedingungen 2) Realisierung durch das Datenbanksystem Anwenderprogramm DBMS Prüfung DD Datenbasis Folie 207 Ruhr-Universität Bochum Lehrstuhl für Wirtschaftsinformatik Prof. Dr. Roland Gabriel Transaktionskonzept Transaktion: Folge von Operationen, die eine Datenbank ununterbrechbar von einem konsistenten Zustand in einen erneut konsistenten Zustand überführt. Attributswertänderungen in unterschiedlichen Relationen können logische Einheiten darstellen. Ruhr-Universität Bochum Folie 208 Lehrstuhl für Wirtschaftsinformatik Prof. Dr. Roland Gabriel Forderungen an die Transaktionsverwaltung Atomizität Jede Transaktion gilt als atomare Einheit. Somit sind Transaktionen vollständig oder gar nicht auszuführen. Konsistenz Jede Transaktion erzeugt einen konsistenten Zustand. Isolation Die von einer Transaktion benötigten Datenobjekte sind vor konsistenzgefährdender Nutzung durch andere Transaktionen geschützt. Dauerhaftigkeit Ergebnisse einer Transaktion bleiben auch bei einem Systemausfall erhalten. Folie 209 Ruhr-Universität Bochum Lehrstuhl für Wirtschaftsinformatik Prof. Dr. Roland Gabriel Gliederung Datenbanksysteme 5. Datenbanksprachen 1. Datendefinitionsbefehle 2. Datenmanipulationsbefehle 3. Grundlagen zu SQL Teil Teil II II 6. Metadatenverwaltung 7. DB-Architekturen 1. 3-Schema-Modell 2. Verteilte und föderierte Datenbanksysteme 8. Datenintegrität 1. Datenkonsistenz 2. Datensicherheit 3. Datenschutz 9. Data Warehousing und On-Line Analytical Processing (OLAP) Ruhr-Universität Bochum Folie 210 Lehrstuhl für Wirtschaftsinformatik Prof. Dr. Roland Gabriel Datensicherheit Gegenstand: Technische und organisatorische Maßnahmen, die dafür sorgen, daß Verluste, Beschädigungen, Verfälschungen von und unberechtigter Zugriff auf Daten vermieden wird. Zweck: Daten sollen zu jeder Zeit in korrekter Form verfügbar sein Organisatorische Maßnahmen: Zugangskontrollen zu Datenträgerarchiven etc. Technische Maßnahmen: Problem: Abwicklung von Mehrbenutzerbetrieb. Verhinderung gegenseitiger Blockierung unterschiedlicher Prozesse Î Systemverklemmung (Deadlock) Folie 211 Ruhr-Universität Bochum Lehrstuhl für Wirtschaftsinformatik Prof. Dr. Roland Gabriel Datensicherheit Unkritische Fälle: - Transaktionen lassen sich seriell abwickeln. - Transaktionen betreffen ungleiche Datenbereiche. - Transaktionen sind ausschließlich Leseoperationen. Kritischer Fall: - Mehrere Benutzer arbeiten gleichzeitig an einer Datenbasis, wobei mindestens ein Benutzer auch Daten verändern will. Ruhr-Universität Bochum Folie 212 Lehrstuhl für Wirtschaftsinformatik Prof. Dr. Roland Gabriel Synchronisation von Zugriffen bei Mehrbenutzerbetrieb: Beispiel Lese aktuelle Teilnehmeranzahl und die Teilnehmerobergrenze Arbeitsplatz 1 für Kurs 4711 Wenn aktuelle Teilnehmeranzahl < Teilnehmerobergrenze Teilnehmeranzahl = Teilnehmeranzahl +1 Ersetze alte Teilnehmeranzahl durch neue Teilnehmeranzahl Wenn aktuelle Teilnehmeranzahl < Teilnehmerobergrenze Teilnehmeranzahl = Teilnehmeranzahl +1 Ersetze alte Teilnehmeranzahl durch neue Teilnehmeranzahl Zeit Lese aktuelle Teilnehmeranzahl und die Teilnehmerobergrenze Arbeitsplatz 2 für Kurs 4711 Folie 213 Ruhr-Universität Bochum Lehrstuhl für Wirtschaftsinformatik Prof. Dr. Roland Gabriel Synchronisation von Zugriffen bei Mehrbenutzerbetrieb: Sperren Lösung des Problems: Mit dem Lesen der aktuellen Teilnehmeranzahl wird dieser Attributwert gegen alle Versuche anderer Transaktionen geschützt, ihn zu lesen oder zu ändern, bis der der neue Wert für die aktuelle Teilnehmeranzahl gespeichert ist. Î Sperrmechanismen (Locks) Arten von Sperrmechanismen: 9 Schreib- und Lesesperre 9 Schreibsperre (Bsp.: Veränderung eines Attributwertes, etwa Doz_Tel) Klassifizierung nach Umfang der betroffenen Daten: 9 Von der ganzen Datenbank... 9 ... bis zu einzelnen Attributwerten Normalfälle: 9 Sperre einer Relation bzw. Datei (File Locking) 9 Sperre eines Datensatzes (Record Locking) Ruhr-Universität Bochum Folie 214 Lehrstuhl für Wirtschaftsinformatik Prof. Dr. Roland Gabriel Deadlocks bei parallelen Transaktionen Transaktion 1 Transaktion 2 Erfolgreiche Anforderung einer S-Sperre für Datenobjekt A Erfolgreiche Anforderung einer SL-Sperre für Datenobjekt B Erfolglose Anforderung einer S-Sperre für Datenobjekt B Erfolglose Anforderung einer SL-Sperre für Datenobjekt A Verfahren zur Auflösung von Deadlocks Graphenverfahren (Auflösung von Zyklen) Zeitlimit-Verfahren, Time Out (Am längsten bearbeitete Transaktion wird abgebrochen) Folie 215 Ruhr-Universität Bochum Lehrstuhl für Wirtschaftsinformatik Prof. Dr. Roland Gabriel Rücksetzung auf definierte Zustände Transaktionsprinzip: Jede nicht abgeschlossene Transaktion muß wirkungslos bleiben (Rücksetzung=„Undo“) Recovery: Konzepte und Verfahren zur Sicherung des Wiederanlaufs von DB-Systemen Transaktion T1 Transaktion T2 Transaktion T3 Zeit SystemRücksetzungs-Zustand zusammenbruch (z.B. Hardwarefehler) Ruhr-Universität Bochum Folie 216 Lehrstuhl für Wirtschaftsinformatik Prof. Dr. Roland Gabriel Gliederung Datenbanksysteme 5. Datenbanksprachen 1. Datendefinitionsbefehle 2. Datenmanipulationsbefehle 3. Grundlagen zu SQL Teil Teil II II 6. Metadatenverwaltung 7. DB-Architekturen 1. 3-Schema-Modell 2. Verteilte und föderierte Datenbanksysteme 8. Datenintegrität 1. Datenkonsistenz 2. Datensicherheit 3. Datenschutz 9. Data Warehousing und On-Line Analytical Processing (OLAP) Folie 217 Ruhr-Universität Bochum Lehrstuhl für Wirtschaftsinformatik Prof. Dr. Roland Gabriel Datenschutz Datenschutz Schutz personenbezogener Daten vor Missbrauch [Bundesdatenschutzgesetz u.a. Gesetze] Forderungen des Datenschutzgesetzes: 9 Ziel und Zweck jeder Speicherung klar erkennbar 9 Speicherbeschränkung kritischer Daten auf das Notwendigste 9 Sammlung personenbezogener Daten ist zu registrieren und von den betroffenen Personen einsehbar 9 Falsche Daten sind zu berichtigen 9 Nicht benötigte Daten sind zu löschen 9 Datenweitergabe nur nach besonderen Vorkehrungen Ruhr-Universität Bochum Folie 218 Lehrstuhl für Wirtschaftsinformatik Prof. Dr. Roland Gabriel Ebenen des Datenschutzes Organisatorische Maßnahmen Identitätskontrolle Zugriffskontrolle Verschlüsselung Datenbasis Folie 219 Ruhr-Universität Bochum Lehrstuhl für Wirtschaftsinformatik Prof. Dr. Roland Gabriel Datenschutz: Maßnahmen zur Verhinderung unbefugten Zugriffs Organisatorische Maßnahmen (Diebstahlsicherung, bauliche Maßnahmen, Überwachung peripherer Geräte etc.) Zwang zur Identifikation 9 Benutzererkennung 9 Passwortabfrage Beschränkung der Zugriffsrechte 9 Zugriffsumfang: Beschränkung der Datenobjekte, mit denen Benutzer oder Benutzergruppen arbeiten dürfen 9 Zugriffsart: lesend, schreibend, lesend/schreibend 9 Beschränkung über Berechtigungsmatrix, Schlüssel-Schloß-Methode, Views (Datenbanksprache) Verschlüsselung des Datenmaterials (Kryptographie) Problem: Geschwindigkeitsverlust beim Entschlüsseln Ruhr-Universität Bochum Folie 220 Lehrstuhl für Wirtschaftsinformatik Prof. Dr. Roland Gabriel Beispiel: Berechtigungsmatrix Folie 221 Objekte Vorlesungs- Kursplan- Teilnehmer Teilnehmer DozentenNutzer verzeichnis daten Grunddaten Leistungsdaten honorare _ Kursinteressent lesen _ _ _ _ _ Dozent lesen lesen (schreiben) _ schreiben eigene Kurse _ _ Anmeldebearbeiter lesen _ lesen schreiben _ _ _ Buchhalter lesen _ lesen _ _ _ _ _ _ lesen _ _ _ Ruhr-Universität Bochum Lehrstuhl für Wirtschaftsinformatik Prof. Dr. Roland Gabriel Zusammenfassung: Anforderungen an Datenbanksysteme I Grundlegende Anforderungen 9 Speicherung und Verwaltung der Datenbestände 9 Mehrbenutzerbetrieb mit Zugriffsregelung Notwendige Anforderungen 9 Redundanzarmut bzw. -freiheit 9 Daten-Programm-Unabhängigkeit 9 Datenintegritätssicherung • Datenkonsistenz • Datensicherheit • Datenschutz Ruhr-Universität Bochum Folie 222 Lehrstuhl für Wirtschaftsinformatik Prof. Dr. Roland Gabriel Zusammenfassung: Anforderungen an Datenbanksysteme II Weitere Anforderungen Allgemeingültige Anforderungen 9 Leistungsfähigkeit 9 Flexibilität 9 Benutzungsfreundlichkeit Anwendungsbezogene Anforderungen 9 9 9 9 Modellkonstrukte Unterstützte Benutzerzahl Kosten und Wirtschaftlichkeit ... Allgemeine Anforderungen an Software Folie 223 Ruhr-Universität Bochum Lehrstuhl für Wirtschaftsinformatik Prof. Dr. Roland Gabriel Gliederung Datenbanksysteme 5. Datenbanksprachen 1. Datendefinitionsbefehle 2. Datenmanipulationsbefehle 3. Grundlagen zu SQL Teil Teil II II 6. Metadatenverwaltung 7. DB-Architekturen 1. 3-Schema-Modell 2. Verteilte und föderierte Datenbanksysteme 8. Datenintegrität 1. Datenkonsistenz 2. Datensicherheit 3. Datenschutz 9. Data Warehousing und On-Line Analytical Processing (OLAP) Ruhr-Universität Bochum Folie 224 Lehrstuhl für Wirtschaftsinformatik Prof. Dr. Roland Gabriel On-Line Analytical Processing (OLAP) Software-Technologie, die Managern schnelle, interaktive und vielfältige Zugriffe auf relevante und konsistente Informationen ermöglicht Interaktivität: „..the name given to the dynamic enterprise analysis required to create, manipulate, animate and synthesize information from ´Enterprise Data Models´." [Codd, Codd, Salley, 1993] zwölf Evaluationsregeln nach Codd/Codd/Salley Mehr- / Multidimensionalität: 9 Anordnung betriebswirtschaftlicher Variablen (z.B. Kennzahlen) entlang mehrerer, unterschiedlicher Dimensionen (z.B. Region, Artikel, Produkte, Zeit, Kunden) Folie 225 IT ZE PRODUKT dynamische, dynamische,multidimensionale multidimensionale Analysen Analysenauf aufkonsolidierten konsolidierten Unternehmensdatenbeständen Unternehmensdatenbeständen 23 40 45 15 54 80 45 60 56 REGION Ruhr-Universität Bochum Lehrstuhl für Wirtschaftsinformatik Prof. Dr. Roland Gabriel Dimensionen von Tabellen Eindimensionale Tabelle Zweidimensionale Tabelle 9 Relationale DBS 9 On-Line Transaction Processing (OLTP) Nr. Nr. 11 22 33 44 55 66 77 88 99 Produkte Produkte Monate Monate Produkt Jan Produkt 11 Jan Produkt Mär Produkt 22 Mär Produkt Mär Produkt 11 Mär Produkt Jan Produkt 33 Jan Produkt Feb Produkt 22 Feb Produkt Feb Produkt 33 Feb Produkt Feb Produkt 22 Feb Produkt Feb Produkt 11 Feb Produkt Mär Produkt 33 Mär 9 Multidimensionale DBS 9 On-Line Analytical Processing (OLAP) Wert Wert 100 100 300 300 140 140 900 900 350 350 1100 1100 950 950 120 120 1000 1000 Produkt Produkt 11 Produkt Produkt 22 Produkt Produkt 33 Jan Feb Mär Jan Feb Mär 100 120 140 100 120 140 00 1300 300 300 1300 900 900 1100 1100 1000 1000 Datenzelle Datenzelle Datensatz Datensatz Ruhr-Universität Bochum Folie 226 Lehrstuhl für Wirtschaftsinformatik Prof. Dr. Roland Gabriel Mehrdimensionale Würfel (OLAP) und Datenzellenprinzip Mehrdimensionaler Würfel Datenzelle är M J Produkt 3 Produkt 2 Produkt 1 100 Absatz an F eb Produkte Produkt 1 Monate 120 140 Preis 4,5 5 4 Umsatz 450 600 560 100 Jan Absatz Einzelne Einzelne Elemente Elemente des des DimensionsDimensionsvektors vektors liefert liefert konkrete konkrete Datenzelle Datenzelle Konten Folie 227 Ruhr-Universität Bochum Lehrstuhl für Wirtschaftsinformatik Prof. Dr. Roland Gabriel Bausteine multidimensionaler Datenmodelle 1. Betriebswirtschaftliche Variablen (Messgrößen, Kennzahlen, Fakten) 2. Dimensionen 3. Dimensionshierarchien 4. Regeln Ruhr-Universität Bochum Folie 228 Lehrstuhl für Wirtschaftsinformatik Prof. Dr. Roland Gabriel Bausteine multidimensionaler Datenmodelle 1. Betriebswirtschaftliche Variablen (Messgrößen, Kennzahlen, Fakten) 2. Dimensionen 3. Dimensionshierarchien 4. Regeln Folie 229 Ruhr-Universität Bochum Lehrstuhl für Wirtschaftsinformatik Prof. Dr. Roland Gabriel Betriebswirtschaftliche Variablen (Kennzahlen) Kennzahlendefinition 9 Zahl, die betriebliche und außerbetriebliche Informationen in aussagekräftiger, komprimierter Form wiedergibt Abgrenzungsmerkmale 9 Gegenstand (Mengen / Werte, Zeitpunkt / Zeitraum) 9 Objektbereich (Gesamtwirtschaftlich, Konzern, Teilbetrieb) Absolute Kennzahlen Relative Kennzahlen (z.B. Beschäftigte, Umsatz, Bilanzsumme) • Gliederungszahlen (z.B. Varianz, Teil-/Gesamtgröße Arithmetisches Mittel) (z.B. EK / GK) • Beziehungszahlen Ursache/Wirkung (z.B. Gewinn / EK) • Indexzahlen zeitliche Entwicklung im Verhältnis zum Basiswert ≈ 100% Statistische Kennzahlen Ruhr-Universität Bochum Folie 230 Lehrstuhl für Wirtschaftsinformatik Prof. Dr. Roland Gabriel Kennzahlensysteme geordnete Anzahl von Kennzahlen, die in einer Beziehung zueinander stehen und als Gesamtheit über einen Sachverhalt vollständig informieren Spitzenkennzahl liefert die betriebswirtschaftlich wichtigste Aussage des Systems in komprimierter Form 9 9 9 9 DuPont-Kennzahlensystem RL-Kennzahlensystem ZVEI-Kennzahlensystem Balanced Scorecard • • • • Folie 231 Finanzen Kunden Geschäftsprozesse Lernen/Wachstum UmsatzUmsatzrendite rendite RoI RoI Gewinn Gewinn :: Umsatz Umsatz x x KapitalKapitalumschlag umschlag Umsatz Umsatz :: Kapital Kapital DeckungsDeckungsbeitrag beitrag ./. ./. Fixe Fixe Kosten Kosten UmlaufUmlaufvermögen vermögen ++ AnlageAnlagevermögen vermögen Umsatz Umsatz ./. ./. Variable Variable Kosten Kosten liquide liquide Mittel Mittel ++ ForForderungen derungen ++ Vorräte Vorräte Ruhr-Universität Bochum Lehrstuhl für Wirtschaftsinformatik Prof. Dr. Roland Gabriel Kennzahlen als Bestandteile multidimensionaler Datenstrukturen Betrachtung von Einzelkennzahlen Absatzmenge Zeit Region Betrachtung mehrerer Kennzahlen 100 120 140 135 5 4 450 600 560 Artikel Zeit 100 Kennzahlendimension Erlös - Stückkosten 80 = DB1 20 200 140 120 40 80 100 Artikel Folie 232 Ruhr-Universität Bochum Lehrstuhl für Wirtschaftsinformatik Prof. Dr. Roland Gabriel Bausteine multidimensionaler Datenmodelle 1. Betriebswirtschaftliche Variablen (Messgrößen, Kennzahlen, Fakten) 2. Dimensionen 3. Dimensionshierarchien 4. Regeln Folie 233 Ruhr-Universität Bochum Lehrstuhl für Wirtschaftsinformatik Prof. Dr. Roland Gabriel Dimensionen in Analyseorientierten Informationssystemen Kostenstellen Filialen OrganisationsWerke Abteilung Struktur Gesellschaften Produktgruppe Artikel Sparte LeistungsStruktur Sortiment Dienstleistungsarten Kundengruppe Regionen Markt- Zielmärkte Struktur Lieferanten Wettbewerber Ruhr-Universität Bochum Folie 234 Lehrstuhl für Wirtschaftsinformatik Prof. Dr. Roland Gabriel Unternehmensspezifische Informationsstrukturen Dimensionen Dimensionen Produktstruktur Produktstruktur Elemente Elemente ......Produktgruppen, Produktgruppen,Division, Division,Produkte, Produkte,...... Organisationsstruktur Kostenstellen,Geschäftsbereiche, Geschäftsbereiche,Gesellschaften... Gesellschaften... Organisationsstruktur ......Kostenstellen, Vertriebsstruktur Vertriebsstruktur ......Märkte, Märkte,Kundengruppen, Kundengruppen,Regionen Regionen...... Zeitstruktur Zeitstruktur ......Wochen, Wochen,Quartale, Quartale,Jahre, Jahre,Monate Monate...... WertIst,Plan, Plan,Forecast, Forecast,Budget Budget...... Wert-/Szenarioarten /Szenarioarten ......Ist, Kennzahlen Kennzahlen Währungsarten Währungsarten ...... Folie 235 ......Umsatz, Umsatz,Deckungsbeitrag, Deckungsbeitrag,Umsatzrentabilität Umsatzrentabilität...... ......Lokalwährung, Lokalwährung,Konzernwährung Konzernwährung...... ...... Ruhr-Universität Bochum Lehrstuhl für Wirtschaftsinformatik Prof. Dr. Roland Gabriel Bausteine multidimensionaler Datenmodelle 1. Betriebswirtschaftliche Variablen (Messgrößen, Kennzahlen, Fakten) 2. Dimensionen 3. Dimensionshierarchien 4. Regeln Ruhr-Universität Bochum Folie 236 Lehrstuhl für Wirtschaftsinformatik Prof. Dr. Roland Gabriel Verdichtungshierarchien Produktstruktur OrganisationsStruktur Produkt 1 LeistungsStruktur MarktStruktur Top-Level Top-Level Element Element Eine Dimensionshierarchie wird als ein endlicher Baum definiert, der durch die einzelnen Elemente (Dimensionsausprägungen) gebildet wird. 9 Level eines Knotens: Anzahl der Kanten auf dem Weg vom Knoten zum Blatt 9 Tiefe eines Knotens: Anzahl der Kanten auf dem Weg vom Knoten zur Wurzel 9 Generation eines Knotens: Tiefe + 1 Folie 237 Produkt 2 ProduktGruppe 1 Produkt 3 Produkt 4 ProdukteGesamt Produkt 5 ProduktGruppe 2 Produkt 6 Produkt 7 Knoten Knoten mit mit Level Level 00 Knoten Knoten mit mit Tiefe Tiefe 22 Knoten Knoten der der Generation Generation 33 Ruhr-Universität Bochum Lehrstuhl für Wirtschaftsinformatik Prof. Dr. Roland Gabriel Parallele Hierarchien Mehrfache Verdichtungshierarchien: einzelne Elemente einer Dimension werden auf verschiedene Arten verdichtet Verdichtungshierarchie 1 Hierarchisierung der Monate 9 nach Quartalen 9 nach Jahreszeiten Verdichtungshierarchie 2 Unbalancierte Unbalancierte Hierarchie Hierarchie Einfache Einfache Hierarchien Hierarchien nicht nicht alle alle Elemente Elemente haben haben die die gleiche gleiche Tiefe Tiefe Alle Alle Elemente Elemente haben haben die die gleiche gleiche Tiefe Tiefe Hierarchisierung der Kunden 9 nach sachlichen Kriterien (A-, B-, C-Kunden) 9 nach Branchen = Verdichtungs-Elemente (C) = Basis-Elemente (N) Ruhr-Universität Bochum Folie 238 Lehrstuhl für Wirtschaftsinformatik Prof. Dr. Roland Gabriel Informationsinhalte Datenzellen nehmen betriebswirtschaftliche Variablen bzw. Kennzahlen auf Schnitt im n-dimensionalen Würfel wird als 2-dimensionale Tabelle dargestellt Datenarten ... Ist ... Plan ... Prognose ... Simulation ... Budget ... Kennzahlen ... Umsatz ... Kosten ... Variable Kosten ... Deckungsbeitrag ... Produkte Jahre ... Alle Prod.-Gruppen ... Oberklasse ... Mittelklasse ... A-Klasse ... C-Klasse ... ... ´1993 ... 1994 ... 1995 ... 1996 ... 1997 ... 1998 ... 1999 ... 2000 ... Monat Regionen Januar Februar März 1. Quartal Niederlande Belgien Luxemburg BENELUX 2500 1200 80 3780 2600 1400 30 4030 2500 1500 40 4040 7600 4100 150 11850 2340 1450 90 3880 BRD Frankreich ... EU-Staaten 10360 12340 - - ... 80340 ... 90340 13200 8400 ... 97550 35900 8400 ... 268230 12450 9230 ... 100230 'Dünn-besetzte' 'Dünn-besetzte' Matrizen Matrizen Folie 239 Basiselemente Basiselemente (N-Elemente) (N-Elemente) Konsolidierte KonsolidierteElemente Elemente(C-Elemente) (C-Elemente) "On "Onthe thefly" fly"Berechnung Berechnung April Ruhr-Universität Bochum Lehrstuhl für Wirtschaftsinformatik Beispiel: Abbildung eines Datenwürfels in einem multidimensionalen Datenbanksystem (MIS ALEA) Prof. Dr. Roland Gabriel Dimensionen Dimensionen Werte Ruhr-Universität Bochum Folie 240 Lehrstuhl für Wirtschaftsinformatik Prof. Dr. Roland Gabriel Navigation in multidimensionalen Datenstrukturen Slice Dice IT ZE Roll-Up PRODUKT Drill-Down 23 40 45 15 54 80 45 60 56 REGION Folie 241 Ruhr-Universität Bochum Lehrstuhl für Wirtschaftsinformatik Prof. Dr. Roland Gabriel Slice Produkt Produkt 4alle Regionen 4gesamter Zeitraum 4ein Produkt (Filter) Ze i t Region Ze i t Region Ze i t Region Herausschneiden einzelner Scheiben, Schichten oder kleiner Würfel aus dem Datenraum Produktsicht Regionale Sicht Ad-hoc-Sicht z.B. Produktmanager z.B. Gebietsleiter z.B. Analyst Produkt 4alle Produkte 4gesamter Zeitraum 4eine Region (Filter) 4ein Produkt (Filter) 4ein Monat (Filter) 4eine Region (Filter) Ruhr-Universität Bochum Folie 242 Lehrstuhl für Wirtschaftsinformatik Prof. Dr. Roland Gabriel Dice Ze i t Region Rotation des Datenwürfels durch Drehen oder Kippen, um eine andere Perspektive auf die Daten zu ermöglichen. Zeit Folie 243 R eg io n Produkt Produkt Ruhr-Universität Bochum Lehrstuhl für Wirtschaftsinformatik Prof. Dr. Roland Gabriel Drill-Down: Dimension Region Deutschland Europa Untersuchen der Daten in einem feineren Detaillierungsgrad innerhalb der Attributehierarchie einer Dimension. „Untersuchen von Detaildaten“ Hessen Ruhr-Universität Bochum Folie 244 Lehrstuhl für Wirtschaftsinformatik Prof. Dr. Roland Gabriel Roll-Up: Dimension Region Deutschland Beim Roll-Up werden die Werte auf der nächsthöheren Hierarchieebene analysiert. Folie 245 Europa Hessen Ruhr-Universität Bochum Lehrstuhl für Wirtschaftsinformatik Prof. Dr. Roland Gabriel Darstellung multidimensionaler Strukturen im Relationenmodell Würfel WürfelAbsatz Absatz Relation RelationAbsatz Absatz de 03/98 io r 02/98 Pe 40 20 4712 4713 50 Nord 30 15 70 80 95 Süd 4711 20 Ost Artikel 01/98 Artikel Region Periode Absatzmenge 4711 Nord 01/98 40 4712 Nord 01/98 20 4713 Nord 01/98 30 4711 Ost 01/98 20 ... ... ... ... Region Ruhr-Universität Bochum Folie 246 Lehrstuhl für Wirtschaftsinformatik Prof. Dr. Roland Gabriel Darstellung multidimensionaler Strukturen im Relationenmodell Star-Schema Star-Schema Artikel Artikel-ID Bezeichnung Maßeinheit Packung Farbe Faktentabelle Faktentabelle 1 n n Region Region-ID Bezeichnung Fläche in qkm Bevölkerung 1 Vertrieb Artikel-ID Perioden-ID Regionen-ID Absatzmenge n Periode 1 Perioden-ID Bezeichnung Dimensionstabellen Dimensionstabellen Folie 247 Ruhr-Universität Bochum Lehrstuhl für Wirtschaftsinformatik Prof. Dr. Roland Gabriel werkzeuge Data Mining Datensammlung zur Unterstützung von Managemententscheidungen [Inmon, 1996] AbfrageAbfrage- und Berichtssysteme Executive Information Systeme Data Mart OLAPOLAPFrontend Data Mart MetadatenMetadatenbanksystem OLAP Server Zentrale Zentrale Datenbasis Datenbasis ArchivierungsArchivierungssystem Endbenutzer-Data Warehouse Endbenutzer werkzeuge Data Warehouse-Konzept 9 9 9 9 Themenorientierung Vereinheitlichung Zeitorientierung Beständigkeit ETLETL-System Externe Daten Operative Vorsysteme Ruhr-Universität Bochum Folie 248 Lehrstuhl für Wirtschaftsinformatik Prof. Dr. Roland Gabriel Standardwerkzeug im Controlling: MS Excel Tabellenkalkulation Tabellenkalkulation ********** Präsentationsgrafik Präsentationsgrafik ********** Datenbank Datenbank Folie 249 AnwendungsAnwendungsprogrammierung programmierung mit mitVBA VBA Ruhr-Universität Bochum Lehrstuhl für Wirtschaftsinformatik Prof. Dr. Roland Gabriel Klassische Tabellenkalkulationen Vorteile Nachteile 9 breite Basis an Formeln & Funktionen 9 einfaches Handling durch Integration in Office-Suite 9 hohes Maß an Flexibilität bei vielen Gestaltungsmöglichkeiten 9 Existenz von einer Vielzahl von betriebswirtschaftlichen Tools 9 Standard für Controllinganwendungen X X X X 9 nicht integrierte Datenverwaltung provoziert Fehler 9 Mehrbenutzereinsatz nur eingeschränkt möglich 9 zentrale Administration nur eingeschränkt möglich 9 sehr heterogener Kenntnisse bei Anwendern 9 kein zentrales, integriertes Konzept für Datenversorgung führt zu redundanter und inkonsistenter Datenhaltung 9 begrenzte Datenmenge X X X X Folie 250 X Ruhr-Universität Bochum Lehrstuhl für Wirtschaftsinformatik Prof. Dr. Roland Gabriel Klassische Datenbanksysteme Vorteile 9 Große Datenmengen bei performanter Verarbeitung 9 Client/Server Technologie 9 Professioneller Mehrplatzeinsatz 9 Benutzerverwaltung 9 Konsistente Schnittstellen 9 Redundante Datenhaltung 9 Professionelle Verwaltung der Datenintegrität • Datenschutz • Datenkonsistenz • Datensicherheit Nachteile 9 umfangreiches Know-how zum Aufbau 9 Aufwendige Strukturveränderungen 9 Administrationsaufwand 9 Aufwendige Erstellung von Benutzerschnittstellen 9 kaum Möglichkeiten zur individuellen Gestaltung 9 hohe Kosten 9 ... 9 ... Folie 251 Ruhr-Universität Bochum Lehrstuhl für Wirtschaftsinformatik Prof. Dr. Roland Gabriel Integration von OLAP-Datenbank und Tabellenkalkulation Vorteile Tabellenkalkulation Vorteile Datenbanksysteme 9 breite Basis an Formeln & Funktionen 9 einfaches Handling durch Integration in Office-Suite 9 hohes Maß an Flexibilität bei vielen Gestaltungsmöglichkeiten 9 Existenz von einer Vielzahl von betriebswirtschaftlichen Tools 9 Standard für Controllinganwendungen 9 Große Datenmengen bei performanter Verarbeitung 9 Client/Server Technologie 9 Professioneller Mehrplatzeinsatz 9 Benutzerverwaltung 9 Konsistente Schnittstellen 9 Redundante Datenhaltung 9 Professionelle Verwaltung der Datenintegrität & Multidimensionale Datenbank Flexible Standard-Benutzeroberfläche Folie 252 Ruhr-Universität Bochum