Übersicht - Uni Konstanz, Informatik

Werbung
Introduction to Information Technology
and Business Intelligence
WS 06/07 Seminar „Business Intelligence: from Reporting to Analytics“,
University of Konstanz
Lehrstühle: Prof. Dr. Harald Reiterer
Prof. Dr. Marc. H. Scholl
Betreuung: Svetlana Mansmann
¾ Matthias Röger, Information Engineering
¾ [email protected]
Übersicht
™
™
™
™
Überblick Informationstechnologie
Business Intelligence (BI)
Architekturkonzept und Bausteine BI
BI-Komponente für die Datenbereitstellung
ETL-Prozess
Data Warehouse
BI-Komponente für die Datennutzung
OLAP
Data Mining
Visualisierung
Nutzen BI
™
™
™
™
™
™
™
2
1
Einführung
Datenflut
™
Informationsparadox:
™
™
Starkes Wachstum der Speicher- u.
Verarbeitungsmöglichkeit von EDV-Systemen
Æ Daten im Überfluss
Ohne Datenanalyse kein Nutzen
™
„Richtige“ Daten werden übersehen
™
Kein Informationsaustausch zwischen Abteilungen
3
Einführung
Informationstechnologie
™
Welt des Handels erlebt Anfang der 90er Jahre Transformation:
™
™
™
Starkes Wachstum der Anwendung von Informationstechnologie (IT)
Ziel: Steigerung Produktivität und Rentabilität
Nutzen IT:
™
™
Verbesserung Informationsfluss zu Entscheidern und Angestellten
Æ Ausarbeitung effizienterer Geschäftsstrategien durch Manager
Schnellere Analyse von Operationen quer durch alle Unternehmensbereiche
z.B. Produktion, Marketing, Absatz, Finanzen, Personal
•
4
2
Einführung
Informationstechnologie
™
™
Welle von Kapitalinvestitionen ab 1993 in IT
Enorme Steigerungsraten beim Erwerb von Computern und
Nachrichtentechnik
™
™
™
Signifikanter Durchbruch der Möglichkeiten von Computer-Prozessoren
™
™
Entwicklung mächtiger Software-Applikationen
Innovationen in der Telekommunikations-Technologie
™
™
™
Starker Preisverfall
Verstärkung des Effektes: Erhöhung der Produktivität durch IT
Verbesserung der Internet-Nutzung
Unterstützung der Ausbreitung von Informationen
Kombination dieser neuen Technologien ergab gewaltiges Informationsnetz:
Æ Informationspuls des Unternehmens
5
Einführung
Informationstechnologie
Entwicklung Verkauf von Personal-Computern von 1990 - 2001
Quelle:arstechnica
6
3
Entwicklungsgeschichte
Business Intelligence
™
Management-Informations-Systeme in den 60er Jahren
™
™
™
™
Versuch, Führungskräfte umfassend zu unterstützen
Konzepte wurden als Total System Approaches bezeichnet
Aufgrund überzogener Erwartungen / Technikgläubigkeit gescheitert
Führungsunterstützungs-Systeme in den 70er Jahren
™
™
™
Erste wirkungsvolle IT-Ansätze
Modellorientierte Decision Support Systems (DSS)
Berichtorientierte Management Information Systems (MIS)
auf spezielle Anwendungsbereiche ausgerichtet
•
7
Entwicklungsgeschichte
Business Intelligence
™
IT-basierte Entscheidungsunterstützung der 80er Jahre:
™
Zusammenfassung von EDV-Systemen: Management Support Systems (MSS)
Unterstützung von Führungskräften und Entscheidungsträgern
•
™
Verbesserung:
™
™
™
™
Komfortable Benutzerschnittstellen
Qualitativ hochwertige grafische Darstellung
Erweiterte Berichts- und Recherchefunktionalitäten
Kommunikation mit Hilfe von E-Mail- oder Audio-Video-Systemen
8
4
Entwicklungsgeschichte
Business Intelligence
™
Management Support Systeme
™
Enorme Entwicklung in den letzten 15 Jahren in
Dynamik
Komplexität
Funktionsvielfalt
•
•
•
™
Gründe dieser Entwicklung
™
™
™
™
Gravierende Veränderungen des IT-Marktes
Zunehmende IT-Unterstützung von Geschäftsprozessen
Weltweite, kommerzielle Nutzung der Internettechnologie
Um geänderten Rahmenbedingungen Rechnung zu tragen, entstand vor 15
Jahren der Begriff „Business Intelligence“
™
Wurde 1989 von Howard Dresner geprägt
Analyst des Gartner-Konzern
•
9
Entwicklungsgeschichte
Business Intelligence
BI Entwicklung aktuell
Markt Business Intelligence:
™
™
nicht gesättigt
Einschätzung in sämtlichen
seriösen Prognosen als
Wachstumsmarkt
Quelle: META GROUP
10
5
Business Intelligence
Begriff Business Intelligence (BI)
™
Keine allgemein akzeptierte Definition von Business Intelligence
™
Sehr umfassende Definition:
„Unter Business Intelligence wird ein integriertes IT-Gesamtkonzept verstanden, das
für die unterschiedlichen Ausprägungen der Anforderungen an geeignete Systeme zur
Entscheidungsunterstützung tragfähige und miteinander verknüpfte Lösungen
anbietet.“
™
Anwendungsorienterte Definition:
„Business Intelligence ist die entscheidungsorientierte Sammlung, Aufbereitung und
Darstellung geschäftsrelevanter Informationen.“
11
Business Intelligence
Systemkomponenten:
alle Komponenten zur entscheidungsrelevanten Daten™
™
™
™
™
™
Sammlung
Aufbereitung
Speicherung
Analyse
Darstellung
Funktionalität:
Abgrenzung von zwei grundlegenden Funktionsblöcken von BI-Systemen
™
™
™
™
Datenbereitstellung
Datennutzung
Bauen logisch und technisch aufeinander auf
12
6
Architekturkonzept und
Bausteine
Technische Sicht BI-Systemkomponenten
13
BI – Komponenten für die
Datenbereitstellung
Data Warehouse:
™
™
™
™
Als Speicherkomponenten werden Lösungen genutzt, welche auf separaten
Datenbanken mit ausgeprägter analytischer Ausrichtung aufbauen.
Diese werden als Data Warehouse (DWH) bezeichnet.
Die Datenspeicherung erfolgt anwendungs-/auswertungsorientiert und ist hinsichtlich
relevanter Themen organisiert.
Das Datenmaterial umfasst beliebige Verdichtungsstufen von Kennzahlen.
Data Marts:
Problem DWH:
Zentrales, organisationsweites DWH ist durch das große Volumen dort abgelegter Daten
zu wenig performant, um umfangreiche Datenbestände schnell und flexibel zu
analysieren.
Lösung:
Es erfolgt eine Extraktion und getrennte Speicherung von z.B. anwendungsspezifischer
Auszüge des zentralen DWH-Datenbestandes in den sogenannten Data Marts.
™
™
14
7
BI – Komponenten für die
Datennutzung
™
™
Zweiter Funktionsblock von BI-Systemen: Datennutzung
Systemseitig gehören hierzu alle Anwendungen, welche das verfügbare
Datenmaterial so aufbereiten und analysieren, dass der Nutzer es in geeigneter
Form erhält.
Abb.: Kern der einsetzbaren Tools zur Datennutzung
15
Online Analytical Processing
(OLAP)
Beschreibung OLAP
™
™
™
™
OLAP – Bezeichnung für die Analyse und Auswertung von großen
Datenbeständen, welche multidimensional aufbereitet wurden.
Durch Multidimensionalität können Daten aus verschiedenen Blickwinkeln
betrachtet und analysiert werden.
Berichte können einfach erstellt und interaktiv verändert werden.
Ziel ist die Gewinnung von Informationen zur Entscheidungsunterstützung
auf unterschiedlichen Hierarchieebenen.
16
8
Online Analytical Processing
(OLAP)
OLAP-Funktionalität
™
Pivotierung: Vertauschen der Dimensionen
™
Roll-Up: Aggregation über vorgegebene Dimensionen
™
™
™
™
Drill-Down: Navigation von aggregierten Daten zu
Detaildaten nach bestimmten Dimensionen
Slicing: Herausschneiden einer „Hyper-Scheibe“,
Verringerung der Dimensionalität
Dicing: Herausschneiden eines „Teilwürfels“,
Erhaltung der Dimensionalität
Visualisierung: Interaktive Darstellung der Daten
Abb.: Verschiedene Sichten OLAP-Würfel
17
BI – Komponenten für die
Datennutzung
Aufgabe Data Mining
™
Data Mining Systeme versuchen
™
™
™
™
™
unbekannte Zusammenhänge in
umfangreichen, strukturierten Datenbeständen zu erkennen und aufzuzeigen,
die gewonnenen Zusammenhänge für Zukunftsprognosen zu nutzen,
Analysen und Klassifizierungen automatisiert vorzunehmen
Text-Mining-Systeme konzentrieren sich auf
™
™
unstrukturierte, textuelle Inhalte
Vorkommen: Dokumente, E-Mails, Web-Seiten
18
9
Data Mining - Prozess
Data Mining Prozess
™
™
™
™
™
Datenauswahl
Datentransformation
Data Mining
Interpretation des Ergebnisses
Präsentation neuer Erkenntnisse
Data Mining Methoden
™
™
™
™
™
Clustering
Klassifikation
Neuronale Netze
Regressions-Analyse
Assoziations-Analyse
19
Data Mining - Clustering
Aufgabe Clusteranalyse
™
Gruppierung der Objekte entsprechend ihrer Ähnlichkeit
™
Objekte eines Clusters möglichst ähnlich
™
Cluster untereinander möglichst unähnlich
Einsatz Clusteranalyse
™
Identifikation von Gruppen mit ähnlichen Merkmalen
™
Beispiel Kundensegmentierung:
™
Abb.: Clustering nach 2 Merkmalen
Erkennen von Zielgruppen von Kunden mit ähnlichen Merkmalen
Æ Grundlage für Marketingaktionen
20
10
Data Mining - Klassifikation
Klassifikation (Prognose)
™
Zielsetzung der Klassifikation:
™
™
™
Einsatz
™
™
™
Vorhersage zukünftiger Klassenzuordnungen anhand verschiedener Merkmale
Erkennung von Abhängigkeiten in Datensätzen
Æ Anwendung: Klassifikation neuer Objekte
Welcher Kunde bezahlte Kredit nicht / welcher Kunde wird Kredit nicht bezahlen?
Wer kaufte Produkt / wer wird Produkt kaufen?
Verfahren
™
™
Entscheidungsbaumverfahren
K-nearest-neighbour
21
Data Mining - Klassifikation
Entscheidungsbaum
Abb.: Entscheidungsbaum für einen Autoversicherer
22
11
Data Mining – Neuronale Netze
Anwendung:
™
Künstliche Neuronale Netze lösen u.a. konkrete Anwendungsprobleme.
™
Eignung auch, wenn kein/nur geringes Wissen über das zu lösende Problem vorliegt.
™
Funktionsapproximation
™
(nichtlineare) Klassifikation (Kundensegmentierung, Bonitätsbewertung)
Beispiele Einsatzgebiet:
™
™
™
™
Kapazitätsplanung
Mustererkennung, Zielgruppenerkennung
Kreditrisikoerkennung
Entwicklung wirtschaftlicher Prozesse
23
Data Mining – Neuronale Netze
™
Bestandteile Neuronales Netz:
™
™
™
™
Verschiedene Knoten: Neuronen
Verbindungen zwischen Neuronen: unterschiedliche Gewichtungen
Lernen: Gewichtsänderungen zwischen Neuronen
Wissen: Verteilte Speicherung in einzelnen Gewichten (Verbindungen)
Abb.: einzelnes Neuron
Abb.: Feedforward Netz
24
12
Data Mining – Regression
Regressionsanalyse
™
™
™
Bsp.: Trendextrapolation
Regressionsanalyse basiert auf historischen
Daten.
Beschreibt Beziehung zwischen unabhängiger
und abhängiger Variablen, welche untersucht
werden soll.
Analysten nutzen die Regression typischerweise
um mengenmäßige Beziehungen zwischen
Variablen aufzudecken und um
Zukunftsprognosen erstellen zu können.
Typische Fragestellung:
™
™
Wie ist die Verkaufsprognose bei gegebenen
saisonalen Faktoren für das nächste halbe Jahr?
Welche Auswirkungen werden Werbeausgaben
auf den Marktanteil haben?
25
Data Mining
Assoziations-Analyse
Assoziations-Analyse:
™
Assoziationsregeln beschreiben Korrelationen zwischen gemeinsam
auftretenden Ausprägungen.
Aufgabe:
™
Ermittlung von Elementen (z.B einzelne Artikel eines Warenkorbes), die das Auftreten
anderen Elemente innerhalb einer Transaktion implizieren.
Darstellung als Regel der Form:
™
Aufgedeckte Beziehung zwischen zwei oder mehr Elementen:
™
™
Wenn Element(e) A, dann Element(e) B“
AÆB
26
13
Data Mining
Assoziations-Analyse
Beispiel Assoziations-Analyse:
27
Visualisierung
Nutzen Visualisierung
™
„Ein Bild sagt mehr als tausend Worte“.
™
Grafiken zeigen Beziehungsmuster auf, machen Zusammenhänge sichtbar
(Interaktive) Visualisierung
™
Ermöglicht Erkennen und Analysieren von Mustern und Beziehungen in den Daten
™
Vereinfacht Vielzahl Analysemöglichkeiten durch Überblickdarstellung
™
Einsatz: quer durch das BI-Spektrum (z.B. Data Mining, OLAP).
28
14
Visualisierung
Visualisierung
Graphische Repräsentationen brauchen eine gewisse Zeit, bis man sie
aufgenommen hat.
Typischer Vorgang beim Betrachten eines Diagramms:
1.
Muster fallen direkt auf.
2.
Man benötigt eine Minute um herauszufinden, was die Achsen repräsentieren.
3.
Man braucht einige Minuten um zu verstehen, was das Diagramm aussagt.
29
Visualisierung
Übersicht Basis-Diagramme:
™
Kreisdiagramme (Pie Chart)
™
™
™
™
zeigen Proportionen auf.
Ganze Einheit wird in ihre
Bestandteile gegliedert.
Gut geeignet zur Darstellung von
Größenverhältnissen und Anteilen.
Einfache Balkendiagramme (Bar
Chart)
™
vergleicht Kategorie-Werte.
z.B. Veranschaulichung von
Rangfolgen
30
15
Visualisierung
Übersicht Basis-Diagramme:
™
Säulendiagramme (Column Chart)
™
™
™
geeignet, um einen Fluss von
Mengen von links nach rechts
darzustellen, wenn Mengen eine
logische Sequenz darstellen
z.B. Zeitserie.
Liniendiagramme (Line Chart)
™
™
™
haben die gleiche Absicht wie
Säulendiagramme
Einsatz bei großer Anzahl von
Datensätzen
bzw. bei kontinuierlichem Verlauf
der Daten.
31
Visualisierung
Übersicht Basis-Diagramme:
™
Punktdiagramme (Scatter Chart)
können Korrelationen bei einer großen
Anzahl von Daten zwischen Variablen
sehr gut darstellen.
™
Farbschema
gut durchdachtes, logisches Farbschema
ist wesentlicher Bestandteil einer
effektiven Visualisierung.
Quelle: www.wetter.de
32
16
Visualisierung
Beispiel cartogram: Nicht maßstabsgetreue Darstellung
33
Quelle: Informationsvisualisierung, Robert Spence
Visualisierung
Bsp: Interaktive Visualisierung
Quelle: www.informationsbuilders.com
Bsp: 3- und 2-dimensionale Visualisierung
Quelle: „visual Scalability“, Eick, Farr
34
17
Nutzen von BI
Untersuchung der 479 umsatzstärksten Unternehmen (BRD, Österreich Schweiz, 2004)
Quelle: Forschungsprojekt „Lohnt sich Business Intelligence?“, FH Köln
35
Nutzen von BI
Untersuchung der 479 umsatzstärksten Unternehmen (BRD, Österreich Schweiz, 2004)
Quelle: Forschungsprojekt „Lohnt sich Business Intelligence?“, FH Köln
36
18
Fazit
™
™
™
Entscheidungsträger bekommen besseren Überblick über das gesamte
Geschäftsumfeld
Einsatz von BI nicht auf bestimmte Personen/Hierarchieebenen beschränkt
Nutzung von Modellen, um Strukturen zu entdecken, welche in den Daten
versteckt sind.
Æ Treffsichere Prognosen für die Zukunft möglich.
BI hilft dabei, Unklarheiten / Unbekanntes in der Geschäftsumgebung zu
minimieren.
ABER:
Erfolge stellen sich nicht von allein ein!
37
Fazit
Voraussetzungen um BI erfolgreich einzusetzen und somit Synergien
von den IT-Investitionen zu erhalten:
™
Notwendige Systeme
™
Manager-Fähigkeiten
™
Ausbildung/Training der Anwender
™
Einbindung der Mitarbeiter
™
Erkenntnisse aus BI-Analysen nutzen
38
19
Referenzen
Papers (Basis):
™
™
Richard Hoptroff, Stephan Kudyba: “Chapter I: An Introduction to Information
Technology and Business Intelligence”, in Data Mining and Business Intelligence: A
Guide to Productivity. 2001.
Peter Gluchowski, Hans-Georg Kemper: “Quo Vadis Business Intelligence?”, in BISPEKTRUM. vol. 1, no. 1, 2006.
Weitere Quellen:
™
™
Data Warehouse Systeme – Architektur, Entwicklung, Anwendung, dpunkt.verlag,
Bauer, Günzel. Kapitel 3.5 Analysephase
Neuronale Netze – Eine Einführung, Fabian Beck, Günter Daniel Rey,
http://www.neuronalesnetz.de/index.html
39
Referenzen
™
™
™
™
™
™
Ars Technica, LLC, „Total share: 30 years of personal computer market share figueres“, Jeremy
Reimer, http://arstechnica.com/articles/culture/total-share.ars/4
Marketing-Management – Märkte, Marktinformationen und Marktbearbeitung, Lucius & Lucius,
Matthias Sander, Kap 3.1.3: „Gewinnung von Marktinformationen“. 2004.
Business Intelligence – Mit Microsoft SQL Server 2005, Hanser-Verlag, Holger Schrödel. Kapitel 2.4
OLAP
Skript „Information Visualization“, Robert Spence, Imperial College London
Der Weg zum Data Warehouse, Addison-Wesley, J.-H. Wieken, Kapitel 2.5: Data Mining – neue
Zusammenhänge entdecken. 1999.
Skript „Data Mining im Marketing“, Prof. Dr. Wilde, Universität Eichstätt-Ingolstadt, Kapitel „Data
Warehouse und Olap“, SS 2006
40
20
Fragen ?
41
21
Herunterladen