Multidimensionales Datenmodell, Cognos - IPD Böhm

Werbung
Institut für Programmstrukturen und Datenorganisation (IPD)
Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm
Data Warehousing (II):
Multidimensionales Datenmodell, Cognos
Praktikum:
Data Warehousing und Mining
Praktikum Data Warehousing und Mining, Sommersemester 2010
Institut für Programmstrukturen und Datenorganisation (IPD)
Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm
Vereinfachte Sicht auf die Referenzarchitektur
Extraktion
Transformation
L d
Laden
Analyse
Data
Warehouse
Operative
Datenbanken
OLAP Server
Praktikum Data Warehousing und Mining, Sommersemester 2010
2
Institut für Programmstrukturen und Datenorganisation (IPD)
Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm
F k jetzt
Fokus
j
iim P
Praktikum
k ik
Unser Fokus jetzt
Extraktion
Transformation
L d
Laden
Analyse
Data
Warehouse
Operative
Datenbanken
OLAP Server
Praktikum Data Warehousing und Mining, Sommersemester 2010
3
Institut für Programmstrukturen und Datenorganisation (IPD)
Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm
A
Agenda
d
• Online Analytical Processing (OLAP)
•
•
•
•
Multidimensionales Datenmodell
Konzeptionelle Modellierung
Relationale Umsetzung des multidim. Modells
Multidimensionale Operatoren
• Cognos
• Hinweise zur Bearbeitung
Praktikum Data Warehousing und Mining, Sommersemester 2010
4
Institut für Programmstrukturen und Datenorganisation (IPD)
Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm
A l
Analysephase
h
• Unterschiedliche Ansätze:
• Data Mining – Erster Block
• Suche nach unbekannten Mustern im Datenbestand
• „Welche Eigenschaften zeichnen Kunden aus, die wieder bei
uns einkaufen
i k f werden?“
d ?“
• Online Transactional Processing (OLTP) – Vorheriger Block
• Zugriff auf vorhandenen Datenbestand
• Nutzung
N t
von D
Datenmanipulationssprachen
t
i l ti
h ((z.B.
B SQL)
• „Wieviele Einheiten von Artikel X wurden vom Kunden Y im
Zeitraum Z gekauft?“
• Online Analytical Processing (OLAP) – Jetzt
• Anpassung des Datenbestands an die Analyse
• Dynamischer, flexibler, interaktiver Zugriff auf eine Vielzahl von
Werten
• „In welchem Gebiet macht Warengruppe X den größten
Umsatz?“
Praktikum Data Warehousing und Mining, Sommersemester 2010
5
Institut für Programmstrukturen und Datenorganisation (IPD)
Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm
D
Data
A
Access
• Tools:
• Anfragesprachen (z.B. SQL) – Vorheriger Block
• Lesen von Daten
• Arithmetische Operationen auf Daten
• Zunächst keine Präsentationsmöglichkeit
• Reporting Tools (z.B. Cognos) – Jetzt
• Lesen der Daten
• Anreicherung der Daten durch arithmetische
Operationen
• Präsentation der Daten in Berichten
• Unterstützung von Ampelfunktionalität
Praktikum Data Warehousing und Mining, Sommersemester 2010
6
Institut für Programmstrukturen und Datenorganisation (IPD)
Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm
Anforderungen an Online Analytical Processing
•
Geschwindigkeit
g
• Anfragen sollten in 5 Sekunden beantwortet sein
•
Analysemöglichkeit
• Ermöglichung
E ö li h
anwenderfreundlicher
d f
dli h und
d iintuitiver
t iti
A
Analyse
l
•
Sicherheit
• Sicherer Mehrbenutzerbetrieb
• Stabile Sicherungsmechanismen
•
Multidimensionalität
• Multidimensionale
M ltidi
i
l Si
Sicht
ht auff di
die D
Daten
t
•
Kapazität
• Hohe Skalierbarkeit der verwalteten Daten
 FASMI: Fast Analysis of Shared Multidimensional
Information (Pendse/Creeth
(Pendse/Creeth, 1995)
Praktikum Data Warehousing und Mining, Sommersemester 2010
7
Institut für Programmstrukturen und Datenorganisation (IPD)
Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm
A
Agenda
d
• Online Analytical Processing (OLAP)
•
•
•
•
Multidimensionales Datenmodell
Konzeptionelle Modellierung
Relationale Umsetzung des multidim. Modells
Multidimensionale Operatoren
• Cognos
• Hinweise zur Bearbeitung
Praktikum Data Warehousing und Mining, Sommersemester 2010
8
Institut für Programmstrukturen und Datenorganisation (IPD)
Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm
Multidimensionales Datenmodell - Begriffe
•
•
Hilfsmittel zur Veranschaulichung
von Daten
verschiedene Aspekte auf gleiche
Weise zugreifbar
Einsatz bei OLAP-Anwendungen
•
Kennzahlen
•
• Elemente eines Würfels
•
Kennzahl
Dimensionen
• Beschreiben Daten
• Ermöglichen Zugriff auf Kennzahlen
• Können
Kö
zu Hierarchien
Hi
hi gehören
hö
Praktikum Data Warehousing und Mining, Sommersemester 2010
Dimension
9
Institut für Programmstrukturen und Datenorganisation (IPD)
Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm
Multidimensionales Datenmodell – Beispiel
Jahr
Produkt
Quartal
Monat
Tag
...
Umsatz
Zeit
Geographie
Praktikum Data Warehousing und Mining, Sommersemester 2010
10
Institut für Programmstrukturen und Datenorganisation (IPD)
Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm
Di
Dimensionen
i
• Einordnung
• Bewertung der Analysedaten durch Kenngrößen
(z.B. Umsatz, Kosten)
• Untersuchung der Kenngrößen aus verschiedenen
Perspektiven (z.B. Stadt, Bundesland, Zeitachse)
• Betrachtungsperspektive
B t ht
kti heißt
h ißt Dimension
Di
i
• Eigenschaften
Ei
h ft
• Mindestens 2 Dimensionselemente
• Dimensionselemente
Di
i
l
t bild
bilden Blätt
Blätter eines
i
B
Baums
(sog. Klassifikationshierarchie)
Praktikum Data Warehousing und Mining, Sommersemester 2010
11
Institut für Programmstrukturen und Datenorganisation (IPD)
Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm
Di
Dimensionen
i
– Beispiel
B i i l Zeit
Z i
Jahr
Quartal
Monat
Tag
...
Klassifikationshierarchie
Dimensionselement
Praktikum Data Warehousing und Mining, Sommersemester 2010
12
Institut für Programmstrukturen und Datenorganisation (IPD)
Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm
A
Arten
von Klassifikationshierarchien
Kl
ifik i
hi
hi
• Einfache Hierarchien
• Höhere Hierarchieebenen enthalten die
aggregierten Werte der jeweils niedrigeren Ebenen
• Oberster Knoten: Gesamtknoten
• Verdichtung aller Werte einer Dimension
• Parallele
P ll l Hi
Hierarchien
hi
• Entstehen bei unterschiedlicher Art der
Gruppierung
• Parallele Äste ohne Beziehung
• Betrachtung eines Teilaspekts der Hierarchie pro
Ast
Praktikum Data Warehousing und Mining, Sommersemester 2010
13
Institut für Programmstrukturen und Datenorganisation (IPD)
Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm
Kl
Klassifikationshierarchie
ifik i
hi
hi - Beispiele
B i i l
TOP
TOP
L d
Land
J h
Jahr
Bundesland
Quartal
Stadt
Monat
Strasse
Tag
Einfache Hierarchie
Woche
Parallele Hierarchie
Praktikum Data Warehousing und Mining, Sommersemester 2010
14
Institut für Programmstrukturen und Datenorganisation (IPD)
Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm
W i
Weitere
B
Begriffe
iff
• Würfel
• Kanten von Dimensionen aufgespannt
• Kantenlänge entspricht Anzahl der Elemente in
Dimension
• Eine oder mehrere Kennzahlen pro Würfelzelle
• Anzahl der Dimensionen heißt Dimensionalität
• Konsolidierungspfad
• Pfade
Pf d iim Kl
Klassifikationsschema
ifik i
h
Praktikum Data Warehousing und Mining, Sommersemester 2010
15
Institut für Programmstrukturen und Datenorganisation (IPD)
Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm
A
Agenda
d
• Online Analytical Processing (OLAP)
•
•
•
•
Multidimensionales Datenmodell
Konzeptionelle Modellierung
Relationale Umsetzung des multidim. Modells
Multidimensionale Operatoren
• Cognos
• Hinweise zur Bearbeitung
Praktikum Data Warehousing und Mining, Sommersemester 2010
16
Institut für Programmstrukturen und Datenorganisation (IPD)
Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm
K
Konzeptionelle
i
ll M
Modellierung
d lli
• Einsatz von Entity/Relationship-Modell
y
p
oder UML
• Probleme:
• Modellierung der Konsolidierungspfade nicht möglich
• Entitäten besitzen keine Semantik
• Wir wollen aber: Höheren Automatisierungsgrad durch Verzicht
auf universelle Anwendbarkeit
• Unterscheidung
g zwischen Klassifikationsstufen,,
beschreibenden Attributen und Kennzahlen nicht möglich
• Daher eigene Modellierungsmodelle
•
•
•
•
Multidimensionales Entity/Relationship
Entity/Relationship-Modell
Modell (ME/R)
Multidimensionale Unified Modeling Language (mUML)
Ansatz von Totok (objektorientiert, notiert in UML)
…
• Hier: ME/R
Praktikum Data Warehousing und Mining, Sommersemester 2010
17
Institut für Programmstrukturen und Datenorganisation (IPD)
Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm
ME/R M d ll
ME/R-Modell
• Weiterentwicklung
e te e t c u g des E/R-Modells
/
ode s
• Anforderungen
• Spezialisierung:
All eingeführten
Alle
i
füh t El
Elemente
t sind
i dS
Spezialfälle
i lfäll von E/R
E/RKonstrukten
• Minimale Erweiterung:
L i ht erlernbar
Leicht
l b fü
für erfahrene
f h
E/R
E/R-Modellierer
M d lli
• Darstellung der multidimensionalen Semantik:
Klassifikationsschema, Würfelstruktur muss abbildbar sein
• Eingeführte Konstrukte
• Entitätenmenge „Dimension Level“ (Klassifikationsstufe)
• n-äre Faktenbeziehung
• Binäre Klassifikationsbeziehungsmenge
Praktikum Data Warehousing und Mining, Sommersemester 2010
18
Institut für Programmstrukturen und Datenorganisation (IPD)
Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm
Vi
Visualisierung
li i
d
der ME/R - Konstrukte
K
k
Klassifikationsbeziehung
Klassifikationsstufe
Fakt
Kenngröße
Quartal
Monat
Tag
Einkauf
Kosten
Region
Stadt
Strasse
Praktikum Data Warehousing und Mining, Sommersemester 2010
19
Institut für Programmstrukturen und Datenorganisation (IPD)
Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm
A
Agenda
d
• Online Analytical Processing (OLAP)
•
•
•
•
Multidimensionales Datenmodell
Konzeptionelle Modellierung
Relationale Umsetzung des multidim. Modells
Multidimensionale Operatoren
• Cognos
• Hinweise zur Bearbeitung
Praktikum Data Warehousing und Mining, Sommersemester 2010
20
Institut für Programmstrukturen und Datenorganisation (IPD)
Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm
Relationale Umsetzung des multidim. Modells
• Anforderungen
• Beibehaltung der Semantik
• z.B. Hierarchien
• Effiziente Umsetzung von Anfragen
• Effiziente Verarbeitung von Anfragen
• Einfache Wartung
• z.B. beim Nachladen von Daten
 Relationales OLAP (ROLAP)
Praktikum Data Warehousing und Mining, Sommersemester 2010
21
Institut für Programmstrukturen und Datenorganisation (IPD)
Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm
R l i
Relationale
l U
Umsetzung: F
Faktentabelle
k
b ll
•
•
•
•
Beispiel zeigt einen
typischen Datensatz
Kennzahlen,
Dimensionen 
Spalten
Zellen  Tupel
Zusätzlich existieren
Hierarchien
• Z.B.: Artikel –
Produktgruppe –
Produktkategorie
•
Wie kann der
atacube mitt
Datacube
Hierarchien in einem
DBMS gespeichert
werden?
Faktentabelle ohne Hierarchien
Praktikum Data Warehousing und Mining, Sommersemester 2010
22
Institut für Programmstrukturen und Datenorganisation (IPD)
Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm
R l i
Relationale
l U
Umsetzung: S
Star-Schema
S h
•
•
Eine Relation pro Dimension
Nicht normalisiert
• Redundanz
• Gefahr von Anomalien
•
•
Nur wenige Joins notwendig
Nachteile werden in
Warehouses oft in Kauf
genommen
Praktikum Data Warehousing und Mining, Sommersemester 2010
23
Institut für Programmstrukturen und Datenorganisation (IPD)
Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm
Relationale Umsetzung: Snowflake-Schema
• Verfeinerung
des Star-Schemas
• Normalisiert,, keine Redundanz
• Mehrere Dimension Tables
pro Dimension
• Relation
R l ti pro Eb
Ebene einer
i
Hi
Hierarchie
hi
• Viele Joins:
• 11 Tabellen bei Gruppierung
pp
g nach Kategorie,
g
, Land und Jahr
Praktikum Data Warehousing und Mining, Sommersemester 2010
24
Institut für Programmstrukturen und Datenorganisation (IPD)
Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm
R l i
Relationale
l U
Umsetzung: S
Semantikverluste
ik l
• Verluste in…
• Faktentabelle
• Unterscheidung von Dimensionen und Kenngrößen nicht
ersichtlich
• Dimensionstabelle
• Unterscheidung zwischen beschreibendem Attribut und Attribut
der Klassifikationsebene nicht möglich
• Aufbau der Dimensionen geht verloren
• Lösung:
Lö
• Erweiterung des Systemkatalogs in relationalen DBMS
• Multidimensionales OLAP (MOLAP)
(
)
• Hybrides OLAP (HOLAP)
Praktikum Data Warehousing und Mining, Sommersemester 2010
25
Institut für Programmstrukturen und Datenorganisation (IPD)
Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm
Üb bli k OLAP
Überblick:
OLAP-Techniken
T h ik
• Relationales OLAP (ROLAP):
(
)
• Relationale Datenbank
• Skalierbarkeit gegeben, aber oft langsam (viele Joins)
• Multidimensionales
M ltidi
i
l OLAP (MOLAP)
(MOLAP):
• Multidimensionale Datenbank
• Persistente Speicherung aggregierter Kennzahlen
• Oft schneller, aber „curse of dimensionality“
• Hybrides OLAP (HOLAP):
• Mischform, Tradeoff: Geschwindigkeit vs. Flexibilität
• Desktop OLAP (DOLAP):
• Lokale multidimensionale Analysen zz.B.
B für Mobile User
• Memory-Based OLAP:
• Datenhaltung
g komplett
p
im RAM ((Beispiel:
p
QlikView))
Praktikum Data Warehousing und Mining, Sommersemester 2010
26
Institut für Programmstrukturen und Datenorganisation (IPD)
Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm
A
Agenda
d
• Online Analytical Processing (OLAP)
•
•
•
•
Multidimensionales Datenmodell
Konzeptionelle Modellierung
Relationale Umsetzung des multidim. Modells
Multidimensionale Operatoren
• Cognos
• Hinweise zur Bearbeitung
Praktikum Data Warehousing und Mining, Sommersemester 2010
27
Institut für Programmstrukturen und Datenorganisation (IPD)
Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm
Pi i
Pivotieren
Zeit
Produkt
Geographie
Produkt
Produkt
Zeit
Geographie
Zeit
Geographie
Praktikum Data Warehousing und Mining, Sommersemester 2010
28
Institut für Programmstrukturen und Datenorganisation (IPD)
Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm
R ll
Roll-up
und
dD
Drill-down
ill d
Drill-down
Produkt
Produkt
Januar
2
3
33
1 Quartal
1.
11
36 107
Februar
4
21
29
2. Quartal
18
25
58
März
5
12
45
3 Quartal
3.
15
51
22
Geographie
Geographie
Roll-up
Praktikum Data Warehousing und Mining, Sommersemester 2010
29
Institut für Programmstrukturen und Datenorganisation (IPD)
Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm
Sli i und
Slicing
d Di
Dicing
i
Produkt
Produkt
Zeit
Zeit
Geographie
g p
Geographie
g p
• Slicing: Einschränkung entlang einer Dimension
• Dicing: Einschränkung entlang zweier oder mehr
Dimensionen
Praktikum Data Warehousing und Mining, Sommersemester 2010
30
Institut für Programmstrukturen und Datenorganisation (IPD)
Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm
Z
Zusammenfassung:
f
multidim.
l idi O
Operatoren
• Nutzen multidimensionale Struktur der Daten
• Erlauben einfache Modifikation von Anfragen
• …zu
zu inhaltlich ähnlichen Anfragen
• …zu strukturell ähnlichen Anfragen
• Si
Sind
d auff die
di F
Fragestellungen
t ll
iim D
Data
t
Warehouse zugeschnitten
Praktikum Data Warehousing und Mining, Sommersemester 2010
31
Institut für Programmstrukturen und Datenorganisation (IPD)
Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm
Rü kbli k MDX (I)
Rückblick:
Praktikum Data Warehousing und Mining, Sommersemester 2010
32
Institut für Programmstrukturen und Datenorganisation (IPD)
Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm
Rü kbli k MDX (II)
Rückblick:
Praktikum Data Warehousing und Mining, Sommersemester 2010
33
Institut für Programmstrukturen und Datenorganisation (IPD)
Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm
A
Agenda
d
• Online Analytical Processing (OLAP)
•
•
•
•
Multidimensionales Datenmodell
Konzeptionelle Modellierung
Relationale Umsetzung des multidim. Modells
Multidimensionale Operatoren
• Cognos
• C
Cognos R
Reportt St
Studio
di
• Cognos Analysis Studio
• Internals
I
l
• Hinweise zur Bearbeitung
Praktikum Data Warehousing und Mining, Sommersemester 2010
34
Institut für Programmstrukturen und Datenorganisation (IPD)
Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm
D B
Der
Business-Intelligence-Markt
i
I lli
M k 2010
Magic Quadrant for Data Warehouse Database
Management Systems, Gartner 2010
Magic Quadrant for Business Intelligence
Platforms, Gartner 2010
Praktikum Data Warehousing und Mining, Sommersemester 2010
35
Institut für Programmstrukturen und Datenorganisation (IPD)
Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm
Cognos
•
Üb
Übernahme
h
durch
d h IBM 2008 („Cognos,
(C
an IBM C
Company“)
“)
•
Cognos BI ermöglicht Erstellen von
• Ad
Ad-hoc-Anfragen
hoc Anfragen (Query Studio)
• Berichten (Report Studio)
• Multidimensionalen Anfragen (Analysis Studio)
•
Backend
• Data Cube
• Relationale Daten
•
Anmeldung
•
•
•
•
Internet-Explorer
p
p
g
URL: http://i40virt01.ipd.kit.edu/cognos8
Benutzername: <Benutzername>
Passwort: <Passwort>
Praktikum Data Warehousing und Mining, Sommersemester 2010
36
Institut für Programmstrukturen und Datenorganisation (IPD)
Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm
C
Cognos
- Startbildschirm
S bild hi
Praktikum Data Warehousing und Mining, Sommersemester 2010
37
Institut für Programmstrukturen und Datenorganisation (IPD)
Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm
C
Cognos-Komponenten
K
• Query Studio (für einfache Anfragen)
• „In Echtzeit“
• Visuell
• Report Studio (für komplexe Berichte)
•
•
•
•
•
Visuell
E b i
Ergebnisgenerierung
i
auff B
Befehl
f hl
Bedingte Variablen
Dynamische Berichte
Layout individueller anpassbar
• Analysis Studio (für
(fü multidimensionale
ltidi
i
l Si
Sicht)
ht)
• „In Echtzeit“
• Visuell
Praktikum Data Warehousing und Mining, Sommersemester 2010
38
Institut für Programmstrukturen und Datenorganisation (IPD)
Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm
A
Agenda
d
• Online Analytical Processing (OLAP)
•
•
•
•
Multidimensionales Datenmodell
Konzeptionelle Modellierung
Relationale Umsetzung des multidim. Modells
Multidimensionale Operatoren
• Cognos
• C
Cognos R
Reportt St
Studio
di
• Cognos Analysis Studio
• Internals
I
l
• Hinweise zur Bearbeitung
Praktikum Data Warehousing und Mining, Sommersemester 2010
39
Institut für Programmstrukturen und Datenorganisation (IPD)
Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm
R
Report
S
Studio
di
• Erstellen komplexer Berichte
• Vielfältige Ausgabe
Ausgabe- und Darstellungsoptionen
• Parameterabfrage bei Anfrageaufruf
Praktikum Data Warehousing und Mining, Sommersemester 2010
40
Institut für Programmstrukturen und Datenorganisation (IPD)
Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm
R
Report
S
Studio
di - Aufbau
A fb
Praktikum Data Warehousing und Mining, Sommersemester 2010
41
Institut für Programmstrukturen und Datenorganisation (IPD)
Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm
A
Agenda
d
• Online Analytical Processing (OLAP)
•
•
•
•
Multidimensionales Datenmodell
Konzeptionelle Modellierung
Relationale Umsetzung des multidim. Modells
Multidimensionale Operatoren
• Cognos
• C
Cognos R
Reportt St
Studio
di
• Cognos Analysis Studio
• Internals
I
l
• Hinweise zur Bearbeitung
Praktikum Data Warehousing und Mining, Sommersemester 2010
42
Institut für Programmstrukturen und Datenorganisation (IPD)
Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm
A l i S
Analysis
Studio
di – Aufbau
A fb
Praktikum Data Warehousing und Mining, Sommersemester 2010
43
Institut für Programmstrukturen und Datenorganisation (IPD)
Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm
Si h auff di
Sicht
die D
Daten
• Blättern in der
Hierarchie möglich
• Ähnlich MDX Tools in
SQL Server
S
• Unterscheidung
zwischen Fakten und
Dimensionen
Praktikum Data Warehousing und Mining, Sommersemester 2010
44
Institut für Programmstrukturen und Datenorganisation (IPD)
Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm
M l idi
Multidimensionale
i
l O
Operatoren
• Rechtsklick auf SpaltenSpalten bzw.
bzw
Zeilennamen
• Kontextmenü erlaubt
• Drilldown und Drillup
• Slicing und Dicing
(über „Ausschließen“)
• Pivotieren wie im Report Studio
• Entsprechendes Icon im Menü
anklicken
Praktikum Data Warehousing und Mining, Sommersemester 2010
45
Institut für Programmstrukturen und Datenorganisation (IPD)
Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm
A
Agenda
d
• Online Analytical Processing (OLAP)
•
•
•
•
Multidimensionales Datenmodell
Konzeptionelle Modellierung
Relationale Umsetzung des multidim. Modells
Multidimensionale Operatoren
• Cognos
• C
Cognos R
Reportt St
Studio
di
• Cognos Analysis Studio
• Internals
I
l
• Hinweise zur Bearbeitung
Praktikum Data Warehousing und Mining, Sommersemester 2010
46
Institut für Programmstrukturen und Datenorganisation (IPD)
Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm
C
Cognos:
A
Anfragesprachen
f
h
…MDX auch von Cognos unterstützt!
Praktikum Data Warehousing und Mining, Sommersemester 2010
47
Institut für Programmstrukturen und Datenorganisation (IPD)
Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm
N i
Natives
SQL vs. C
Cognos SQL
• Natives SQL
• Für einzelne Anfragen
g an Datenbank
• Cognos SQL
• Generische Cognos-Erweiterung
Cognos Erweiterung von SQL
• Für mehrere Datenquellen
• Natives SQL ist Untermenge
Praktikum Data Warehousing und Mining, Sommersemester 2010
48
Institut für Programmstrukturen und Datenorganisation (IPD)
Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm
MDX U
MDX-Unterstützung
ü
• In Abfrageexplorer: SQL oder MDX möglich
Praktikum Data Warehousing und Mining, Sommersemester 2010
49
Institut für Programmstrukturen und Datenorganisation (IPD)
Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm
N i
Natives
MDX vs. Cognos
C
SQL
Praktikum Data Warehousing und Mining, Sommersemester 2010
50
Institut für Programmstrukturen und Datenorganisation (IPD)
Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm
E
Erstellung
ll
von B
Berichten:
i h
V
Vorgehensweisen
h
i
• Intuitives Vorgehen:
•
•
•
•
„Zusammenklicken“
im Hintergrund Formulierung in Cognos SQL
Generierung von nativem SQL/MDX für DB-Anfrage
Optimierung der DB
DB-Anfragen
Anfragen durch Benutzer
möglich
• Alternativ:
• Einbindung existierender SQL-/MDX-Anfragen über
Abfrageexplorer
• Erst danach Berichterstellung
Praktikum Data Warehousing und Mining, Sommersemester 2010
51
Institut für Programmstrukturen und Datenorganisation (IPD)
Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm
A
Agenda
d
• Online Analytical Processing (OLAP)
•
•
•
•
Multidimensionales Datenmodell
Konzeptionelle Modellierung
Relationale Umsetzung des multidim. Modells
Multidimensionale Operatoren
• Cognos
• C
Cognos R
Reportt St
Studio
di
• Cognos Analysis Studio
• Internals
I
l
• Hinweise zur Bearbeitung
Praktikum Data Warehousing und Mining, Sommersemester 2010
52
Institut für Programmstrukturen und Datenorganisation (IPD)
Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm
Hi
Hinweise
i zur B
Bearbeitung
b i
• Erreichen
e c e de
der Tools
oo s
• Internet Explorer
• URL: http://i40virt01.ipd.kit.edu/cognos8
• Report Studio bevorzugt nutzen
• Performance!
• Daten des Data Cubes aus
• Package: DWM Multidimensional
• Ergebnis in „Eigenem Ordner“ speichern
Praktikum Data Warehousing und Mining, Sommersemester 2010
53
Institut für Programmstrukturen und Datenorganisation (IPD)
Lehrstuhl für Systeme der Informationsverwaltung, Prof. Böhm
Q ll
Quellenangaben
b
A Bauer,
A.
Bauer H.
H Günzel: „Data
Data Warehouse
Systeme – Architektur, Entwicklung,
Anwendung“, dpunkt.verlag,
Anwendung
dpunkt verlag 2004
2004.
J. Han, M. Kamber: „Data Mining – Concepts
and Techniques“
Techniques , Morgan Kaufmann
Kaufmann, 2006.
2006
Cognos Report Studio Professional Authoring
U
User
G
Guide,
id 2007
2007.
Praktikum Data Warehousing und Mining, Sommersemester 2010
54
Herunterladen