Institut für Programmstrukturen und Datenorganisation (IPD) Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm Data Warehousing (II): Multidimensionales Datenmodell, Cognos Praktikum: Data Warehousing und Mining Praktikum Data Warehousing und Mining, Sommersemester 2010 Institut für Programmstrukturen und Datenorganisation (IPD) Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm Vereinfachte Sicht auf die Referenzarchitektur Extraktion Transformation L d Laden Analyse Data Warehouse Operative Datenbanken OLAP Server Praktikum Data Warehousing und Mining, Sommersemester 2010 2 Institut für Programmstrukturen und Datenorganisation (IPD) Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm F k jetzt Fokus j iim P Praktikum k ik Unser Fokus jetzt Extraktion Transformation L d Laden Analyse Data Warehouse Operative Datenbanken OLAP Server Praktikum Data Warehousing und Mining, Sommersemester 2010 3 Institut für Programmstrukturen und Datenorganisation (IPD) Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm A Agenda d • Online Analytical Processing (OLAP) • • • • Multidimensionales Datenmodell Konzeptionelle Modellierung Relationale Umsetzung des multidim. Modells Multidimensionale Operatoren • Cognos • Hinweise zur Bearbeitung Praktikum Data Warehousing und Mining, Sommersemester 2010 4 Institut für Programmstrukturen und Datenorganisation (IPD) Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm A l Analysephase h • Unterschiedliche Ansätze: • Data Mining – Erster Block • Suche nach unbekannten Mustern im Datenbestand • „Welche Eigenschaften zeichnen Kunden aus, die wieder bei uns einkaufen i k f werden?“ d ?“ • Online Transactional Processing (OLTP) – Vorheriger Block • Zugriff auf vorhandenen Datenbestand • Nutzung N t von D Datenmanipulationssprachen t i l ti h ((z.B. B SQL) • „Wieviele Einheiten von Artikel X wurden vom Kunden Y im Zeitraum Z gekauft?“ • Online Analytical Processing (OLAP) – Jetzt • Anpassung des Datenbestands an die Analyse • Dynamischer, flexibler, interaktiver Zugriff auf eine Vielzahl von Werten • „In welchem Gebiet macht Warengruppe X den größten Umsatz?“ Praktikum Data Warehousing und Mining, Sommersemester 2010 5 Institut für Programmstrukturen und Datenorganisation (IPD) Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm D Data A Access • Tools: • Anfragesprachen (z.B. SQL) – Vorheriger Block • Lesen von Daten • Arithmetische Operationen auf Daten • Zunächst keine Präsentationsmöglichkeit • Reporting Tools (z.B. Cognos) – Jetzt • Lesen der Daten • Anreicherung der Daten durch arithmetische Operationen • Präsentation der Daten in Berichten • Unterstützung von Ampelfunktionalität Praktikum Data Warehousing und Mining, Sommersemester 2010 6 Institut für Programmstrukturen und Datenorganisation (IPD) Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm Anforderungen an Online Analytical Processing • Geschwindigkeit g • Anfragen sollten in 5 Sekunden beantwortet sein • Analysemöglichkeit • Ermöglichung E ö li h anwenderfreundlicher d f dli h und d iintuitiver t iti A Analyse l • Sicherheit • Sicherer Mehrbenutzerbetrieb • Stabile Sicherungsmechanismen • Multidimensionalität • Multidimensionale M ltidi i l Si Sicht ht auff di die D Daten t • Kapazität • Hohe Skalierbarkeit der verwalteten Daten FASMI: Fast Analysis of Shared Multidimensional Information (Pendse/Creeth (Pendse/Creeth, 1995) Praktikum Data Warehousing und Mining, Sommersemester 2010 7 Institut für Programmstrukturen und Datenorganisation (IPD) Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm A Agenda d • Online Analytical Processing (OLAP) • • • • Multidimensionales Datenmodell Konzeptionelle Modellierung Relationale Umsetzung des multidim. Modells Multidimensionale Operatoren • Cognos • Hinweise zur Bearbeitung Praktikum Data Warehousing und Mining, Sommersemester 2010 8 Institut für Programmstrukturen und Datenorganisation (IPD) Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm Multidimensionales Datenmodell - Begriffe • • Hilfsmittel zur Veranschaulichung von Daten verschiedene Aspekte auf gleiche Weise zugreifbar Einsatz bei OLAP-Anwendungen • Kennzahlen • • Elemente eines Würfels • Kennzahl Dimensionen • Beschreiben Daten • Ermöglichen Zugriff auf Kennzahlen • Können Kö zu Hierarchien Hi hi gehören hö Praktikum Data Warehousing und Mining, Sommersemester 2010 Dimension 9 Institut für Programmstrukturen und Datenorganisation (IPD) Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm Multidimensionales Datenmodell – Beispiel Jahr Produkt Quartal Monat Tag ... Umsatz Zeit Geographie Praktikum Data Warehousing und Mining, Sommersemester 2010 10 Institut für Programmstrukturen und Datenorganisation (IPD) Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm Di Dimensionen i • Einordnung • Bewertung der Analysedaten durch Kenngrößen (z.B. Umsatz, Kosten) • Untersuchung der Kenngrößen aus verschiedenen Perspektiven (z.B. Stadt, Bundesland, Zeitachse) • Betrachtungsperspektive B t ht kti heißt h ißt Dimension Di i • Eigenschaften Ei h ft • Mindestens 2 Dimensionselemente • Dimensionselemente Di i l t bild bilden Blätt Blätter eines i B Baums (sog. Klassifikationshierarchie) Praktikum Data Warehousing und Mining, Sommersemester 2010 11 Institut für Programmstrukturen und Datenorganisation (IPD) Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm Di Dimensionen i – Beispiel B i i l Zeit Z i Jahr Quartal Monat Tag ... Klassifikationshierarchie Dimensionselement Praktikum Data Warehousing und Mining, Sommersemester 2010 12 Institut für Programmstrukturen und Datenorganisation (IPD) Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm A Arten von Klassifikationshierarchien Kl ifik i hi hi • Einfache Hierarchien • Höhere Hierarchieebenen enthalten die aggregierten Werte der jeweils niedrigeren Ebenen • Oberster Knoten: Gesamtknoten • Verdichtung aller Werte einer Dimension • Parallele P ll l Hi Hierarchien hi • Entstehen bei unterschiedlicher Art der Gruppierung • Parallele Äste ohne Beziehung • Betrachtung eines Teilaspekts der Hierarchie pro Ast Praktikum Data Warehousing und Mining, Sommersemester 2010 13 Institut für Programmstrukturen und Datenorganisation (IPD) Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm Kl Klassifikationshierarchie ifik i hi hi - Beispiele B i i l TOP TOP L d Land J h Jahr Bundesland Quartal Stadt Monat Strasse Tag Einfache Hierarchie Woche Parallele Hierarchie Praktikum Data Warehousing und Mining, Sommersemester 2010 14 Institut für Programmstrukturen und Datenorganisation (IPD) Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm W i Weitere B Begriffe iff • Würfel • Kanten von Dimensionen aufgespannt • Kantenlänge entspricht Anzahl der Elemente in Dimension • Eine oder mehrere Kennzahlen pro Würfelzelle • Anzahl der Dimensionen heißt Dimensionalität • Konsolidierungspfad • Pfade Pf d iim Kl Klassifikationsschema ifik i h Praktikum Data Warehousing und Mining, Sommersemester 2010 15 Institut für Programmstrukturen und Datenorganisation (IPD) Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm A Agenda d • Online Analytical Processing (OLAP) • • • • Multidimensionales Datenmodell Konzeptionelle Modellierung Relationale Umsetzung des multidim. Modells Multidimensionale Operatoren • Cognos • Hinweise zur Bearbeitung Praktikum Data Warehousing und Mining, Sommersemester 2010 16 Institut für Programmstrukturen und Datenorganisation (IPD) Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm K Konzeptionelle i ll M Modellierung d lli • Einsatz von Entity/Relationship-Modell y p oder UML • Probleme: • Modellierung der Konsolidierungspfade nicht möglich • Entitäten besitzen keine Semantik • Wir wollen aber: Höheren Automatisierungsgrad durch Verzicht auf universelle Anwendbarkeit • Unterscheidung g zwischen Klassifikationsstufen,, beschreibenden Attributen und Kennzahlen nicht möglich • Daher eigene Modellierungsmodelle • • • • Multidimensionales Entity/Relationship Entity/Relationship-Modell Modell (ME/R) Multidimensionale Unified Modeling Language (mUML) Ansatz von Totok (objektorientiert, notiert in UML) … • Hier: ME/R Praktikum Data Warehousing und Mining, Sommersemester 2010 17 Institut für Programmstrukturen und Datenorganisation (IPD) Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm ME/R M d ll ME/R-Modell • Weiterentwicklung e te e t c u g des E/R-Modells / ode s • Anforderungen • Spezialisierung: All eingeführten Alle i füh t El Elemente t sind i dS Spezialfälle i lfäll von E/R E/RKonstrukten • Minimale Erweiterung: L i ht erlernbar Leicht l b fü für erfahrene f h E/R E/R-Modellierer M d lli • Darstellung der multidimensionalen Semantik: Klassifikationsschema, Würfelstruktur muss abbildbar sein • Eingeführte Konstrukte • Entitätenmenge „Dimension Level“ (Klassifikationsstufe) • n-äre Faktenbeziehung • Binäre Klassifikationsbeziehungsmenge Praktikum Data Warehousing und Mining, Sommersemester 2010 18 Institut für Programmstrukturen und Datenorganisation (IPD) Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm Vi Visualisierung li i d der ME/R - Konstrukte K k Klassifikationsbeziehung Klassifikationsstufe Fakt Kenngröße Quartal Monat Tag Einkauf Kosten Region Stadt Strasse Praktikum Data Warehousing und Mining, Sommersemester 2010 19 Institut für Programmstrukturen und Datenorganisation (IPD) Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm A Agenda d • Online Analytical Processing (OLAP) • • • • Multidimensionales Datenmodell Konzeptionelle Modellierung Relationale Umsetzung des multidim. Modells Multidimensionale Operatoren • Cognos • Hinweise zur Bearbeitung Praktikum Data Warehousing und Mining, Sommersemester 2010 20 Institut für Programmstrukturen und Datenorganisation (IPD) Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm Relationale Umsetzung des multidim. Modells • Anforderungen • Beibehaltung der Semantik • z.B. Hierarchien • Effiziente Umsetzung von Anfragen • Effiziente Verarbeitung von Anfragen • Einfache Wartung • z.B. beim Nachladen von Daten Relationales OLAP (ROLAP) Praktikum Data Warehousing und Mining, Sommersemester 2010 21 Institut für Programmstrukturen und Datenorganisation (IPD) Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm R l i Relationale l U Umsetzung: F Faktentabelle k b ll • • • • Beispiel zeigt einen typischen Datensatz Kennzahlen, Dimensionen Spalten Zellen Tupel Zusätzlich existieren Hierarchien • Z.B.: Artikel – Produktgruppe – Produktkategorie • Wie kann der atacube mitt Datacube Hierarchien in einem DBMS gespeichert werden? Faktentabelle ohne Hierarchien Praktikum Data Warehousing und Mining, Sommersemester 2010 22 Institut für Programmstrukturen und Datenorganisation (IPD) Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm R l i Relationale l U Umsetzung: S Star-Schema S h • • Eine Relation pro Dimension Nicht normalisiert • Redundanz • Gefahr von Anomalien • • Nur wenige Joins notwendig Nachteile werden in Warehouses oft in Kauf genommen Praktikum Data Warehousing und Mining, Sommersemester 2010 23 Institut für Programmstrukturen und Datenorganisation (IPD) Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm Relationale Umsetzung: Snowflake-Schema • Verfeinerung des Star-Schemas • Normalisiert,, keine Redundanz • Mehrere Dimension Tables pro Dimension • Relation R l ti pro Eb Ebene einer i Hi Hierarchie hi • Viele Joins: • 11 Tabellen bei Gruppierung pp g nach Kategorie, g , Land und Jahr Praktikum Data Warehousing und Mining, Sommersemester 2010 24 Institut für Programmstrukturen und Datenorganisation (IPD) Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm R l i Relationale l U Umsetzung: S Semantikverluste ik l • Verluste in… • Faktentabelle • Unterscheidung von Dimensionen und Kenngrößen nicht ersichtlich • Dimensionstabelle • Unterscheidung zwischen beschreibendem Attribut und Attribut der Klassifikationsebene nicht möglich • Aufbau der Dimensionen geht verloren • Lösung: Lö • Erweiterung des Systemkatalogs in relationalen DBMS • Multidimensionales OLAP (MOLAP) ( ) • Hybrides OLAP (HOLAP) Praktikum Data Warehousing und Mining, Sommersemester 2010 25 Institut für Programmstrukturen und Datenorganisation (IPD) Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm Üb bli k OLAP Überblick: OLAP-Techniken T h ik • Relationales OLAP (ROLAP): ( ) • Relationale Datenbank • Skalierbarkeit gegeben, aber oft langsam (viele Joins) • Multidimensionales M ltidi i l OLAP (MOLAP) (MOLAP): • Multidimensionale Datenbank • Persistente Speicherung aggregierter Kennzahlen • Oft schneller, aber „curse of dimensionality“ • Hybrides OLAP (HOLAP): • Mischform, Tradeoff: Geschwindigkeit vs. Flexibilität • Desktop OLAP (DOLAP): • Lokale multidimensionale Analysen zz.B. B für Mobile User • Memory-Based OLAP: • Datenhaltung g komplett p im RAM ((Beispiel: p QlikView)) Praktikum Data Warehousing und Mining, Sommersemester 2010 26 Institut für Programmstrukturen und Datenorganisation (IPD) Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm A Agenda d • Online Analytical Processing (OLAP) • • • • Multidimensionales Datenmodell Konzeptionelle Modellierung Relationale Umsetzung des multidim. Modells Multidimensionale Operatoren • Cognos • Hinweise zur Bearbeitung Praktikum Data Warehousing und Mining, Sommersemester 2010 27 Institut für Programmstrukturen und Datenorganisation (IPD) Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm Pi i Pivotieren Zeit Produkt Geographie Produkt Produkt Zeit Geographie Zeit Geographie Praktikum Data Warehousing und Mining, Sommersemester 2010 28 Institut für Programmstrukturen und Datenorganisation (IPD) Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm R ll Roll-up und dD Drill-down ill d Drill-down Produkt Produkt Januar 2 3 33 1 Quartal 1. 11 36 107 Februar 4 21 29 2. Quartal 18 25 58 März 5 12 45 3 Quartal 3. 15 51 22 Geographie Geographie Roll-up Praktikum Data Warehousing und Mining, Sommersemester 2010 29 Institut für Programmstrukturen und Datenorganisation (IPD) Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm Sli i und Slicing d Di Dicing i Produkt Produkt Zeit Zeit Geographie g p Geographie g p • Slicing: Einschränkung entlang einer Dimension • Dicing: Einschränkung entlang zweier oder mehr Dimensionen Praktikum Data Warehousing und Mining, Sommersemester 2010 30 Institut für Programmstrukturen und Datenorganisation (IPD) Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm Z Zusammenfassung: f multidim. l idi O Operatoren • Nutzen multidimensionale Struktur der Daten • Erlauben einfache Modifikation von Anfragen • …zu zu inhaltlich ähnlichen Anfragen • …zu strukturell ähnlichen Anfragen • Si Sind d auff die di F Fragestellungen t ll iim D Data t Warehouse zugeschnitten Praktikum Data Warehousing und Mining, Sommersemester 2010 31 Institut für Programmstrukturen und Datenorganisation (IPD) Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm Rü kbli k MDX (I) Rückblick: Praktikum Data Warehousing und Mining, Sommersemester 2010 32 Institut für Programmstrukturen und Datenorganisation (IPD) Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm Rü kbli k MDX (II) Rückblick: Praktikum Data Warehousing und Mining, Sommersemester 2010 33 Institut für Programmstrukturen und Datenorganisation (IPD) Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm A Agenda d • Online Analytical Processing (OLAP) • • • • Multidimensionales Datenmodell Konzeptionelle Modellierung Relationale Umsetzung des multidim. Modells Multidimensionale Operatoren • Cognos • C Cognos R Reportt St Studio di • Cognos Analysis Studio • Internals I l • Hinweise zur Bearbeitung Praktikum Data Warehousing und Mining, Sommersemester 2010 34 Institut für Programmstrukturen und Datenorganisation (IPD) Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm D B Der Business-Intelligence-Markt i I lli M k 2010 Magic Quadrant for Data Warehouse Database Management Systems, Gartner 2010 Magic Quadrant for Business Intelligence Platforms, Gartner 2010 Praktikum Data Warehousing und Mining, Sommersemester 2010 35 Institut für Programmstrukturen und Datenorganisation (IPD) Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm Cognos • Üb Übernahme h durch d h IBM 2008 („Cognos, (C an IBM C Company“) “) • Cognos BI ermöglicht Erstellen von • Ad Ad-hoc-Anfragen hoc Anfragen (Query Studio) • Berichten (Report Studio) • Multidimensionalen Anfragen (Analysis Studio) • Backend • Data Cube • Relationale Daten • Anmeldung • • • • Internet-Explorer p p g URL: http://i40virt01.ipd.kit.edu/cognos8 Benutzername: <Benutzername> Passwort: <Passwort> Praktikum Data Warehousing und Mining, Sommersemester 2010 36 Institut für Programmstrukturen und Datenorganisation (IPD) Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm C Cognos - Startbildschirm S bild hi Praktikum Data Warehousing und Mining, Sommersemester 2010 37 Institut für Programmstrukturen und Datenorganisation (IPD) Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm C Cognos-Komponenten K • Query Studio (für einfache Anfragen) • „In Echtzeit“ • Visuell • Report Studio (für komplexe Berichte) • • • • • Visuell E b i Ergebnisgenerierung i auff B Befehl f hl Bedingte Variablen Dynamische Berichte Layout individueller anpassbar • Analysis Studio (für (fü multidimensionale ltidi i l Si Sicht) ht) • „In Echtzeit“ • Visuell Praktikum Data Warehousing und Mining, Sommersemester 2010 38 Institut für Programmstrukturen und Datenorganisation (IPD) Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm A Agenda d • Online Analytical Processing (OLAP) • • • • Multidimensionales Datenmodell Konzeptionelle Modellierung Relationale Umsetzung des multidim. Modells Multidimensionale Operatoren • Cognos • C Cognos R Reportt St Studio di • Cognos Analysis Studio • Internals I l • Hinweise zur Bearbeitung Praktikum Data Warehousing und Mining, Sommersemester 2010 39 Institut für Programmstrukturen und Datenorganisation (IPD) Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm R Report S Studio di • Erstellen komplexer Berichte • Vielfältige Ausgabe Ausgabe- und Darstellungsoptionen • Parameterabfrage bei Anfrageaufruf Praktikum Data Warehousing und Mining, Sommersemester 2010 40 Institut für Programmstrukturen und Datenorganisation (IPD) Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm R Report S Studio di - Aufbau A fb Praktikum Data Warehousing und Mining, Sommersemester 2010 41 Institut für Programmstrukturen und Datenorganisation (IPD) Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm A Agenda d • Online Analytical Processing (OLAP) • • • • Multidimensionales Datenmodell Konzeptionelle Modellierung Relationale Umsetzung des multidim. Modells Multidimensionale Operatoren • Cognos • C Cognos R Reportt St Studio di • Cognos Analysis Studio • Internals I l • Hinweise zur Bearbeitung Praktikum Data Warehousing und Mining, Sommersemester 2010 42 Institut für Programmstrukturen und Datenorganisation (IPD) Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm A l i S Analysis Studio di – Aufbau A fb Praktikum Data Warehousing und Mining, Sommersemester 2010 43 Institut für Programmstrukturen und Datenorganisation (IPD) Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm Si h auff di Sicht die D Daten • Blättern in der Hierarchie möglich • Ähnlich MDX Tools in SQL Server S • Unterscheidung zwischen Fakten und Dimensionen Praktikum Data Warehousing und Mining, Sommersemester 2010 44 Institut für Programmstrukturen und Datenorganisation (IPD) Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm M l idi Multidimensionale i l O Operatoren • Rechtsklick auf SpaltenSpalten bzw. bzw Zeilennamen • Kontextmenü erlaubt • Drilldown und Drillup • Slicing und Dicing (über „Ausschließen“) • Pivotieren wie im Report Studio • Entsprechendes Icon im Menü anklicken Praktikum Data Warehousing und Mining, Sommersemester 2010 45 Institut für Programmstrukturen und Datenorganisation (IPD) Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm A Agenda d • Online Analytical Processing (OLAP) • • • • Multidimensionales Datenmodell Konzeptionelle Modellierung Relationale Umsetzung des multidim. Modells Multidimensionale Operatoren • Cognos • C Cognos R Reportt St Studio di • Cognos Analysis Studio • Internals I l • Hinweise zur Bearbeitung Praktikum Data Warehousing und Mining, Sommersemester 2010 46 Institut für Programmstrukturen und Datenorganisation (IPD) Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm C Cognos: A Anfragesprachen f h …MDX auch von Cognos unterstützt! Praktikum Data Warehousing und Mining, Sommersemester 2010 47 Institut für Programmstrukturen und Datenorganisation (IPD) Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm N i Natives SQL vs. C Cognos SQL • Natives SQL • Für einzelne Anfragen g an Datenbank • Cognos SQL • Generische Cognos-Erweiterung Cognos Erweiterung von SQL • Für mehrere Datenquellen • Natives SQL ist Untermenge Praktikum Data Warehousing und Mining, Sommersemester 2010 48 Institut für Programmstrukturen und Datenorganisation (IPD) Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm MDX U MDX-Unterstützung ü • In Abfrageexplorer: SQL oder MDX möglich Praktikum Data Warehousing und Mining, Sommersemester 2010 49 Institut für Programmstrukturen und Datenorganisation (IPD) Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm N i Natives MDX vs. Cognos C SQL Praktikum Data Warehousing und Mining, Sommersemester 2010 50 Institut für Programmstrukturen und Datenorganisation (IPD) Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm E Erstellung ll von B Berichten: i h V Vorgehensweisen h i • Intuitives Vorgehen: • • • • „Zusammenklicken“ im Hintergrund Formulierung in Cognos SQL Generierung von nativem SQL/MDX für DB-Anfrage Optimierung der DB DB-Anfragen Anfragen durch Benutzer möglich • Alternativ: • Einbindung existierender SQL-/MDX-Anfragen über Abfrageexplorer • Erst danach Berichterstellung Praktikum Data Warehousing und Mining, Sommersemester 2010 51 Institut für Programmstrukturen und Datenorganisation (IPD) Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm A Agenda d • Online Analytical Processing (OLAP) • • • • Multidimensionales Datenmodell Konzeptionelle Modellierung Relationale Umsetzung des multidim. Modells Multidimensionale Operatoren • Cognos • C Cognos R Reportt St Studio di • Cognos Analysis Studio • Internals I l • Hinweise zur Bearbeitung Praktikum Data Warehousing und Mining, Sommersemester 2010 52 Institut für Programmstrukturen und Datenorganisation (IPD) Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm Hi Hinweise i zur B Bearbeitung b i • Erreichen e c e de der Tools oo s • Internet Explorer • URL: http://i40virt01.ipd.kit.edu/cognos8 • Report Studio bevorzugt nutzen • Performance! • Daten des Data Cubes aus • Package: DWM Multidimensional • Ergebnis in „Eigenem Ordner“ speichern Praktikum Data Warehousing und Mining, Sommersemester 2010 53 Institut für Programmstrukturen und Datenorganisation (IPD) Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm Q ll Quellenangaben b A Bauer, A. Bauer H. H Günzel: „Data Data Warehouse Systeme – Architektur, Entwicklung, Anwendung“, dpunkt.verlag, Anwendung dpunkt verlag 2004 2004. J. Han, M. Kamber: „Data Mining – Concepts and Techniques“ Techniques , Morgan Kaufmann Kaufmann, 2006. 2006 Cognos Report Studio Professional Authoring U User G Guide, id 2007 2007. Praktikum Data Warehousing und Mining, Sommersemester 2010 54