Folien der Einführungsveranstaltung

Werbung
Business Intelligence
Seminar, WS 2007/08
Prof. Dr. Knut Hinkelmann
Fachhochschule Nordwestschweiz
[email protected]
Business Intelligence
Entscheidungsorientierte Sammlung,
Aufbereitung und Darstellung
geschäftsrelevanter Informationen.
Prof. Dr. Knut Hinkelmann
2
1
Business Intelligence
Datenquellen
Datenverwaltung
Operational
data
Zugriff & Analyse
Query &
Reporting
Data mart
Transformation
Cleaning
Data
Data mart
Warehouse
OLAP
Data mart
External
ExternalData
Data
Data
Mining
3
Prof. Dr. Knut Hinkelmann
Data Warehouse - ein mögliche Definition
Datenbanken
operativer
Systeme
Data
Warehouse
Ein Data Warehouse ist eine Datenbank,
die strategische Entscheidungen
unterstützt, indem sie ...
Š umfangreiche und
Š regelmässige Auszüge aus
Š operativen Datenbanken
Š periodenbezogen und
Š oft aggregiert1
Š Endbenutzern
Š auch zur ad hoc2-Analyse
bereitstellt
1)
zusammengefasst, konsolidiert (z.B. als Summe,
Durchschnitt, Kennzahl)
2) unvorbereitet (im Gegensatz zur
Standardauswertung)
Prof. Dr. Knut Hinkelmann
4
2
Inhalt eines Data Warehouse
„
Region
Haidhausen
47
11
8
Schwabing
53
9
14
Typisch für ein Data Warehouse ist die
Unterscheidung von
Š Fakten (Indikatoren)
y Betriebswirtschaftlicher
Erfolgsfaktor, z.B. Umsatz
Š
Dimensionen
y Kriterien der Beurteilung, z.B.
Region, Produkt, Zeit
Zeit
77
Zentrum
26
15
Racer Tria- Racer
Future Racer Junior
1)
Juli
Juni
Mai
„
Der Würfel1 veranschaulicht die
Dimensionen eines Indikators:
Š an den Schnittpunkten der drei
Dimensionen steht der Indikator
„
Aufgaben: Einen Indikator nach seinen
Dimensionen messen, z.B.
"Wie hoch ist der Umsatz nach Periode,
Produkt und Region?"
Produkt
Mehrdimensionale Würfel heissen "Hypercubes"
5
Prof. Dr. Knut Hinkelmann
OLAP (OnLine Analytical Processing)
„
OLAP1) ist eine Abfragemethode, die
Endbenutzern einen
Š mehrdimensionalen, schnellen
Zugriff und eine
Š benutzerfreundliche interaktive
Analyse grosser Datenmengen
ermöglicht
„
Funktionen
Š Roll-Up
Drill-Down
Š Dicing (würfeln)
Š Slicing (schneiden)
1) Eingeführt
Prof. Dr. Knut Hinkelmann
von E.F.Codd, 1993
6
3
Slicing (in Scheiben schneiden)
Auswahl eines kleineren Würfels oder Reduktion der Dimensionen in
einem mehrdimensionalen Würfel
7
Prof. Dr. Knut Hinkelmann
Slicing
Auswahl eines kleineren Würfels oder Reduktion der Dimensionen in
einem mehrdimensionalen Würfel
Zweidimensionale Darstellung
als Tabelle:
Branche
1995
Bank
47
11
8
Biotechnologie
53
9
14
Computer
77
26
15
Nord- Europa
amerika
Prof. Dr. Knut Hinkelmann
Asien
Bank
Biotechn.
Computer
Nordamerika
Europa
Asien
47
11
8
53
9
14
77
26
15
Zeit
1997
1996
1995
Region
Nord- Europa
amerika
1996
Bank
Biotechn.
Computer
Asien
43
15
8
54
13
17
71
45
28
8
4
Dicing (würfeln)
„
Rotation der Resultate um andere Sichten zu zeigen, z.B.
Š Anzeigen anderer Dimensionen
Š Austausch von Zeilen und Spalten (auch Pivoting)
Region
Branche
Bank
47
11
8
Biotechnologie
53
9
14
Computer
77
26
15
Nord- Europa
amerika
Asien
Zeit
1997
1996
1995
Nordamerika
47
53
Europa
11
9
26
8
14
15
Asien
Region
77
Bank Biotech- Computer
nologie
Zeit
1997
1996
1995
Branche
9
Prof. Dr. Knut Hinkelmann
Rolling Up and Drilling Down
Rolling
RollingUp
Up(zusammenfassend)
(zusammenfassend)
Drilling
Drilling Down
Down(detaillierend)
(detaillierend)
Beispiel: Umsatzzahlen für ...
ganz Europa
Mitteleuropa
Deutschland
Prof. Dr. Knut Hinkelmann
10
5
Visualisierung
11
Prof. Dr. Knut Hinkelmann
Data Mining: Entdecken von Wissen in
Datenbanken
Daten
Prof. Dr. Knut Hinkelmann
Wissen
„
Data Mining: Identifikation von
wettbewerbsrelevantem Wissen
aus grossen Datenbanken
„
Automatische Extraktion von
Informationen zur Vorhersage
von Trends und Verhalten
„
Automatische Erkennung vorher
unbekannter Muster
12
6
Beispiel aus der Automobilindustrie
„
Daten über 7 - 10 Jahre Historie für ca. 7.000.000 Fahrzeuge
Š
Fahrzeugdaten (Produktionsdaten; Daten über Motor, Getriebe, ...)
Š
Beanstandungen (Schadensteil, Schadensart, ...)
Š
Werkstattaufenthalte
„
Frage: Wie kann man das Auto zuverlässiger machen?
„
Mustererkennung: Suche in Datenbank nach möglichen Gründen
für Ausfälle
„
mögliche Umsetzung des Wissens:
Š
Änderung in Konstruktion
Š
Wechsel des Zulieferers
Š
Kundendienst: vorbeugende Wartung
Š
usw.
Prof. Dr. Knut Hinkelmann
13
Arten von Data Mining Problemen
„
Klassifikation
Š
Š
„
„
Clustering
Š
Š
„
Lernen der Beziehung einer Zielvariable von Ausgangsvariablen
Beispiel: Potentielle Käufergruppe für ein Produkt (in Abhängigkeit z.B. von Alter,
Bildung, Einkommen)
Assoziationen (Warenkorbanalyse)
Š
Š
Lernen von Abhängigkeiten zwischen Daten,
Beispiel: Freitags kaufen Kunden, die Windeln kaufen, oft auch Bier.
Abweichungs- und Änderungsentdeckung
Š
Š
„
Aufteilung einer Datenmenge in disjunkte Gruppen ähnlicher Objekte
Beispiel: Kundenprofile
Regression (Vorhersage)
Š
Š
„
Lernen einer Menge von Regeln, die Objekte aufgrund ihrer Attribute vorgegebenen
Klassen zuordnen
Beispiel: Klassifikation von Bankkunden ob Kreditwürdig oder nicht
Entdecken von Unterschieden zu früher aufgezeichneten Daten oder vorgegebenen
normativen Werten
Beispiel: Erkennung von Kreditkartenbetrug, Identifikation besonderer Kundengruppen.
Zeitreihenanalyse
Š
Š
Lernen von Regeln für typische Abläufe zur Prognose zeitlicher Veränderungen
Beispiele: Kontenentwicklungen, Aktienkurse, Vorhersage von Systemausfällen auf
Basis von Messdaten
Prof. Dr. Knut Hinkelmann
14
7
Wichtige Methoden des Data Mining
Entscheidungsbäume
Neuronale Netze
IF
IF ...
...
THEN
THEN ...
...
Regelinduktion
Nearest Neighbor
Genetische Algorithmen
15
Prof. Dr. Knut Hinkelmann
Data Mining ist eine Phase im Prozess der
Wissensentdeckung aus Datenbanken
Interpretation/
Evaluation
Wissen
Data Mining
Transformation
Vorverarbeitung
Auswahl
Muster
--- --- ----- --- ----- --- ---
Zieldaten
Transformierte
Daten
Vorverarbeitete
Daten
Daten
Prof. Dr. Knut Hinkelmann
16
8
Balanced Scorecard
Finanzen
e
n
hle en hm
z a a b na
le nn rg ass
Zie Ke Vo M
n
Wie sollen wir uns
unseren
Anteilseignern
präsentieren, um als
finanziell erfolgreich
zu gelten?
Kunden
e
n
hle en hm
z a b na
e enn orga ass
l
e
Zi K V M
Interne Prozesse
n
Strategie
Strategie
Wie sollen wir gegenüber unseren Kunden
auftreten, um unsere
Vision zu
verwirklichen?
e
n
hle en hm
z a b na
e enn orga ass
l
e
Zi K V M
n
In welchen Geschäftsprozessen müssen wir
herausragende
Leistungen bringen,
um Kunden und Shareholder zu befriedigen?
Lernen und Entwicklung
en
n
hle en hm
z a b na
le enn orga ass
e
i
K V M
Z
Wie müssen wir unsere
Veränderungs und
Verbesserungspotentiale
fördern, um unsere
Vision zu verwirklichen?
Prof. Dr. Knut Hinkelmann
17
Business Intelligence: Zusammenfassung
Ziel:
Aus Unternehmensdaten entscheidungsrelevantes
Wissen herleiten
Data Warehousing/OLAP
Š
Š
Š
Š
Integration von Daten (mehrerer) operativer Systeme
Benutzerfreundliche Analyse historischer Daten
mehrdimensionale Auswertungen mit OLAP-Werkzeugen
Reporting/OLAP sagt, was passiert ist
Data Mining
Š Ableitung von Modellen für Vorhersage künftiger Ereignisse
Š Data Mining sagt, warum Dinge passiert sind
Š Liefert handlungsrelevante Informationen
Balanced Scorecard
Š Strategisches Management
Š mehrdimensionales Kennzahlensystem
Prof. Dr. Knut Hinkelmann
18
9
Zielsetzung
„
Aufgabenstellung
Š
Š
„
mündliche Präsentation: ca. 35 Minuten
schriftliche Seminararbeit: ca. 20 Seiten
Hinweise:
Š
Š
„
Die Seminararbeit ist eine Einzelarbeit.
Die Sprache für die Seminararbeit und die Präsentation ist englisch
Wissenschaftliche Ausarbeitung:
Š
Das Seminar zielt auf das eigenständige und wissenschaftliche Arbeiten zu
einer bestimmten Fragestellung aus dem Bereich Business Intelligence.
Die Arbeiten sollen sowohl wissenschaftliche Erkenntnisse als auch
praktische Implikationen an Fallbeispielen oder Anwendungsszenarien
berücksichtigen.
Die Arbeit sollte in den grösseren Kontext des Business Intelligence
eingeordnet werden
Einstiegsliteratur zu einzelnen Themen wird im Laufe der ersten Woche
elektronisch zur Verfügung gestellt. Diese ist lediglich als Einstieg zu
betrachten. Es wird jedoch eine darüber hinaus gehende Beschäftigung mit
dem Thema erwartet.
Š
Š
Š
19
Prof. Dr. Knut Hinkelmann
Termine und Kommunikation
„
Termine:
Themenvergabe:
Exposee per Email:
Zwischenbesprechung:
Seminar:
„
2.10.07
15.11.07
20.11.07
24./25.1.08
Präsentationen
Abgabe Seminararbeiten
Kommunikation
Š
Š
Prof. Dr. Knut Hinkelmann
Kommunikation im Wesentlichen via Email
(bitte Email-Adressen angeben)
Die Arbeiten sind sowohl in Papierversion als auch elektronisch
abzugeben.
20
10
Herunterladen