Introduction to Information Technology and Business Intelligence WS 06/07 Seminar „Business Intelligence: from Reporting to Analytics“, University of Konstanz Lehrstühle: Prof. Dr. Harald Reiterer Prof. Dr. Marc. H. Scholl Betreuung: Svetlana Mansmann ¾ Matthias Röger, Information Engineering ¾ [email protected] Übersicht Überblick Informationstechnologie Business Intelligence (BI) Architekturkonzept und Bausteine BI BI-Komponente für die Datenbereitstellung ETL-Prozess Data Warehouse BI-Komponente für die Datennutzung OLAP Data Mining Visualisierung Nutzen BI 2 1 Einführung Datenflut Informationsparadox: Starkes Wachstum der Speicher- u. Verarbeitungsmöglichkeit von EDV-Systemen Æ Daten im Überfluss Ohne Datenanalyse kein Nutzen „Richtige“ Daten werden übersehen Kein Informationsaustausch zwischen Abteilungen 3 Einführung Informationstechnologie Welt des Handels erlebt Anfang der 90er Jahre Transformation: Starkes Wachstum der Anwendung von Informationstechnologie (IT) Ziel: Steigerung Produktivität und Rentabilität Nutzen IT: Verbesserung Informationsfluss zu Entscheidern und Angestellten Æ Ausarbeitung effizienterer Geschäftsstrategien durch Manager Schnellere Analyse von Operationen quer durch alle Unternehmensbereiche z.B. Produktion, Marketing, Absatz, Finanzen, Personal • 4 2 Einführung Informationstechnologie Welle von Kapitalinvestitionen ab 1993 in IT Enorme Steigerungsraten beim Erwerb von Computern und Nachrichtentechnik Signifikanter Durchbruch der Möglichkeiten von Computer-Prozessoren Entwicklung mächtiger Software-Applikationen Innovationen in der Telekommunikations-Technologie Starker Preisverfall Verstärkung des Effektes: Erhöhung der Produktivität durch IT Verbesserung der Internet-Nutzung Unterstützung der Ausbreitung von Informationen Kombination dieser neuen Technologien ergab gewaltiges Informationsnetz: Æ Informationspuls des Unternehmens 5 Einführung Informationstechnologie Entwicklung Verkauf von Personal-Computern von 1990 - 2001 Quelle:arstechnica 6 3 Entwicklungsgeschichte Business Intelligence Management-Informations-Systeme in den 60er Jahren Versuch, Führungskräfte umfassend zu unterstützen Konzepte wurden als Total System Approaches bezeichnet Aufgrund überzogener Erwartungen / Technikgläubigkeit gescheitert Führungsunterstützungs-Systeme in den 70er Jahren Erste wirkungsvolle IT-Ansätze Modellorientierte Decision Support Systems (DSS) Berichtorientierte Management Information Systems (MIS) auf spezielle Anwendungsbereiche ausgerichtet • 7 Entwicklungsgeschichte Business Intelligence IT-basierte Entscheidungsunterstützung der 80er Jahre: Zusammenfassung von EDV-Systemen: Management Support Systems (MSS) Unterstützung von Führungskräften und Entscheidungsträgern • Verbesserung: Komfortable Benutzerschnittstellen Qualitativ hochwertige grafische Darstellung Erweiterte Berichts- und Recherchefunktionalitäten Kommunikation mit Hilfe von E-Mail- oder Audio-Video-Systemen 8 4 Entwicklungsgeschichte Business Intelligence Management Support Systeme Enorme Entwicklung in den letzten 15 Jahren in Dynamik Komplexität Funktionsvielfalt • • • Gründe dieser Entwicklung Gravierende Veränderungen des IT-Marktes Zunehmende IT-Unterstützung von Geschäftsprozessen Weltweite, kommerzielle Nutzung der Internettechnologie Um geänderten Rahmenbedingungen Rechnung zu tragen, entstand vor 15 Jahren der Begriff „Business Intelligence“ Wurde 1989 von Howard Dresner geprägt Analyst des Gartner-Konzern • 9 Entwicklungsgeschichte Business Intelligence BI Entwicklung aktuell Markt Business Intelligence: nicht gesättigt Einschätzung in sämtlichen seriösen Prognosen als Wachstumsmarkt Quelle: META GROUP 10 5 Business Intelligence Begriff Business Intelligence (BI) Keine allgemein akzeptierte Definition von Business Intelligence Sehr umfassende Definition: „Unter Business Intelligence wird ein integriertes IT-Gesamtkonzept verstanden, das für die unterschiedlichen Ausprägungen der Anforderungen an geeignete Systeme zur Entscheidungsunterstützung tragfähige und miteinander verknüpfte Lösungen anbietet.“ Anwendungsorienterte Definition: „Business Intelligence ist die entscheidungsorientierte Sammlung, Aufbereitung und Darstellung geschäftsrelevanter Informationen.“ 11 Business Intelligence Systemkomponenten: alle Komponenten zur entscheidungsrelevanten Daten Sammlung Aufbereitung Speicherung Analyse Darstellung Funktionalität: Abgrenzung von zwei grundlegenden Funktionsblöcken von BI-Systemen Datenbereitstellung Datennutzung Bauen logisch und technisch aufeinander auf 12 6 Architekturkonzept und Bausteine Technische Sicht BI-Systemkomponenten 13 BI – Komponenten für die Datenbereitstellung Data Warehouse: Als Speicherkomponenten werden Lösungen genutzt, welche auf separaten Datenbanken mit ausgeprägter analytischer Ausrichtung aufbauen. Diese werden als Data Warehouse (DWH) bezeichnet. Die Datenspeicherung erfolgt anwendungs-/auswertungsorientiert und ist hinsichtlich relevanter Themen organisiert. Das Datenmaterial umfasst beliebige Verdichtungsstufen von Kennzahlen. Data Marts: Problem DWH: Zentrales, organisationsweites DWH ist durch das große Volumen dort abgelegter Daten zu wenig performant, um umfangreiche Datenbestände schnell und flexibel zu analysieren. Lösung: Es erfolgt eine Extraktion und getrennte Speicherung von z.B. anwendungsspezifischer Auszüge des zentralen DWH-Datenbestandes in den sogenannten Data Marts. 14 7 BI – Komponenten für die Datennutzung Zweiter Funktionsblock von BI-Systemen: Datennutzung Systemseitig gehören hierzu alle Anwendungen, welche das verfügbare Datenmaterial so aufbereiten und analysieren, dass der Nutzer es in geeigneter Form erhält. Abb.: Kern der einsetzbaren Tools zur Datennutzung 15 Online Analytical Processing (OLAP) Beschreibung OLAP OLAP – Bezeichnung für die Analyse und Auswertung von großen Datenbeständen, welche multidimensional aufbereitet wurden. Durch Multidimensionalität können Daten aus verschiedenen Blickwinkeln betrachtet und analysiert werden. Berichte können einfach erstellt und interaktiv verändert werden. Ziel ist die Gewinnung von Informationen zur Entscheidungsunterstützung auf unterschiedlichen Hierarchieebenen. 16 8 Online Analytical Processing (OLAP) OLAP-Funktionalität Pivotierung: Vertauschen der Dimensionen Roll-Up: Aggregation über vorgegebene Dimensionen Drill-Down: Navigation von aggregierten Daten zu Detaildaten nach bestimmten Dimensionen Slicing: Herausschneiden einer „Hyper-Scheibe“, Verringerung der Dimensionalität Dicing: Herausschneiden eines „Teilwürfels“, Erhaltung der Dimensionalität Visualisierung: Interaktive Darstellung der Daten Abb.: Verschiedene Sichten OLAP-Würfel 17 BI – Komponenten für die Datennutzung Aufgabe Data Mining Data Mining Systeme versuchen unbekannte Zusammenhänge in umfangreichen, strukturierten Datenbeständen zu erkennen und aufzuzeigen, die gewonnenen Zusammenhänge für Zukunftsprognosen zu nutzen, Analysen und Klassifizierungen automatisiert vorzunehmen Text-Mining-Systeme konzentrieren sich auf unstrukturierte, textuelle Inhalte Vorkommen: Dokumente, E-Mails, Web-Seiten 18 9 Data Mining - Prozess Data Mining Prozess Datenauswahl Datentransformation Data Mining Interpretation des Ergebnisses Präsentation neuer Erkenntnisse Data Mining Methoden Clustering Klassifikation Neuronale Netze Regressions-Analyse Assoziations-Analyse 19 Data Mining - Clustering Aufgabe Clusteranalyse Gruppierung der Objekte entsprechend ihrer Ähnlichkeit Objekte eines Clusters möglichst ähnlich Cluster untereinander möglichst unähnlich Einsatz Clusteranalyse Identifikation von Gruppen mit ähnlichen Merkmalen Beispiel Kundensegmentierung: Abb.: Clustering nach 2 Merkmalen Erkennen von Zielgruppen von Kunden mit ähnlichen Merkmalen Æ Grundlage für Marketingaktionen 20 10 Data Mining - Klassifikation Klassifikation (Prognose) Zielsetzung der Klassifikation: Einsatz Vorhersage zukünftiger Klassenzuordnungen anhand verschiedener Merkmale Erkennung von Abhängigkeiten in Datensätzen Æ Anwendung: Klassifikation neuer Objekte Welcher Kunde bezahlte Kredit nicht / welcher Kunde wird Kredit nicht bezahlen? Wer kaufte Produkt / wer wird Produkt kaufen? Verfahren Entscheidungsbaumverfahren K-nearest-neighbour 21 Data Mining - Klassifikation Entscheidungsbaum Abb.: Entscheidungsbaum für einen Autoversicherer 22 11 Data Mining – Neuronale Netze Anwendung: Künstliche Neuronale Netze lösen u.a. konkrete Anwendungsprobleme. Eignung auch, wenn kein/nur geringes Wissen über das zu lösende Problem vorliegt. Funktionsapproximation (nichtlineare) Klassifikation (Kundensegmentierung, Bonitätsbewertung) Beispiele Einsatzgebiet: Kapazitätsplanung Mustererkennung, Zielgruppenerkennung Kreditrisikoerkennung Entwicklung wirtschaftlicher Prozesse 23 Data Mining – Neuronale Netze Bestandteile Neuronales Netz: Verschiedene Knoten: Neuronen Verbindungen zwischen Neuronen: unterschiedliche Gewichtungen Lernen: Gewichtsänderungen zwischen Neuronen Wissen: Verteilte Speicherung in einzelnen Gewichten (Verbindungen) Abb.: einzelnes Neuron Abb.: Feedforward Netz 24 12 Data Mining – Regression Regressionsanalyse Bsp.: Trendextrapolation Regressionsanalyse basiert auf historischen Daten. Beschreibt Beziehung zwischen unabhängiger und abhängiger Variablen, welche untersucht werden soll. Analysten nutzen die Regression typischerweise um mengenmäßige Beziehungen zwischen Variablen aufzudecken und um Zukunftsprognosen erstellen zu können. Typische Fragestellung: Wie ist die Verkaufsprognose bei gegebenen saisonalen Faktoren für das nächste halbe Jahr? Welche Auswirkungen werden Werbeausgaben auf den Marktanteil haben? 25 Data Mining Assoziations-Analyse Assoziations-Analyse: Assoziationsregeln beschreiben Korrelationen zwischen gemeinsam auftretenden Ausprägungen. Aufgabe: Ermittlung von Elementen (z.B einzelne Artikel eines Warenkorbes), die das Auftreten anderen Elemente innerhalb einer Transaktion implizieren. Darstellung als Regel der Form: Aufgedeckte Beziehung zwischen zwei oder mehr Elementen: Wenn Element(e) A, dann Element(e) B“ AÆB 26 13 Data Mining Assoziations-Analyse Beispiel Assoziations-Analyse: 27 Visualisierung Nutzen Visualisierung „Ein Bild sagt mehr als tausend Worte“. Grafiken zeigen Beziehungsmuster auf, machen Zusammenhänge sichtbar (Interaktive) Visualisierung Ermöglicht Erkennen und Analysieren von Mustern und Beziehungen in den Daten Vereinfacht Vielzahl Analysemöglichkeiten durch Überblickdarstellung Einsatz: quer durch das BI-Spektrum (z.B. Data Mining, OLAP). 28 14 Visualisierung Visualisierung Graphische Repräsentationen brauchen eine gewisse Zeit, bis man sie aufgenommen hat. Typischer Vorgang beim Betrachten eines Diagramms: 1. Muster fallen direkt auf. 2. Man benötigt eine Minute um herauszufinden, was die Achsen repräsentieren. 3. Man braucht einige Minuten um zu verstehen, was das Diagramm aussagt. 29 Visualisierung Übersicht Basis-Diagramme: Kreisdiagramme (Pie Chart) zeigen Proportionen auf. Ganze Einheit wird in ihre Bestandteile gegliedert. Gut geeignet zur Darstellung von Größenverhältnissen und Anteilen. Einfache Balkendiagramme (Bar Chart) vergleicht Kategorie-Werte. z.B. Veranschaulichung von Rangfolgen 30 15 Visualisierung Übersicht Basis-Diagramme: Säulendiagramme (Column Chart) geeignet, um einen Fluss von Mengen von links nach rechts darzustellen, wenn Mengen eine logische Sequenz darstellen z.B. Zeitserie. Liniendiagramme (Line Chart) haben die gleiche Absicht wie Säulendiagramme Einsatz bei großer Anzahl von Datensätzen bzw. bei kontinuierlichem Verlauf der Daten. 31 Visualisierung Übersicht Basis-Diagramme: Punktdiagramme (Scatter Chart) können Korrelationen bei einer großen Anzahl von Daten zwischen Variablen sehr gut darstellen. Farbschema gut durchdachtes, logisches Farbschema ist wesentlicher Bestandteil einer effektiven Visualisierung. Quelle: www.wetter.de 32 16 Visualisierung Beispiel cartogram: Nicht maßstabsgetreue Darstellung 33 Quelle: Informationsvisualisierung, Robert Spence Visualisierung Bsp: Interaktive Visualisierung Quelle: www.informationsbuilders.com Bsp: 3- und 2-dimensionale Visualisierung Quelle: „visual Scalability“, Eick, Farr 34 17 Nutzen von BI Untersuchung der 479 umsatzstärksten Unternehmen (BRD, Österreich Schweiz, 2004) Quelle: Forschungsprojekt „Lohnt sich Business Intelligence?“, FH Köln 35 Nutzen von BI Untersuchung der 479 umsatzstärksten Unternehmen (BRD, Österreich Schweiz, 2004) Quelle: Forschungsprojekt „Lohnt sich Business Intelligence?“, FH Köln 36 18 Fazit Entscheidungsträger bekommen besseren Überblick über das gesamte Geschäftsumfeld Einsatz von BI nicht auf bestimmte Personen/Hierarchieebenen beschränkt Nutzung von Modellen, um Strukturen zu entdecken, welche in den Daten versteckt sind. Æ Treffsichere Prognosen für die Zukunft möglich. BI hilft dabei, Unklarheiten / Unbekanntes in der Geschäftsumgebung zu minimieren. ABER: Erfolge stellen sich nicht von allein ein! 37 Fazit Voraussetzungen um BI erfolgreich einzusetzen und somit Synergien von den IT-Investitionen zu erhalten: Notwendige Systeme Manager-Fähigkeiten Ausbildung/Training der Anwender Einbindung der Mitarbeiter Erkenntnisse aus BI-Analysen nutzen 38 19 Referenzen Papers (Basis): Richard Hoptroff, Stephan Kudyba: “Chapter I: An Introduction to Information Technology and Business Intelligence”, in Data Mining and Business Intelligence: A Guide to Productivity. 2001. Peter Gluchowski, Hans-Georg Kemper: “Quo Vadis Business Intelligence?”, in BISPEKTRUM. vol. 1, no. 1, 2006. Weitere Quellen: Data Warehouse Systeme – Architektur, Entwicklung, Anwendung, dpunkt.verlag, Bauer, Günzel. Kapitel 3.5 Analysephase Neuronale Netze – Eine Einführung, Fabian Beck, Günter Daniel Rey, http://www.neuronalesnetz.de/index.html 39 Referenzen Ars Technica, LLC, „Total share: 30 years of personal computer market share figueres“, Jeremy Reimer, http://arstechnica.com/articles/culture/total-share.ars/4 Marketing-Management – Märkte, Marktinformationen und Marktbearbeitung, Lucius & Lucius, Matthias Sander, Kap 3.1.3: „Gewinnung von Marktinformationen“. 2004. Business Intelligence – Mit Microsoft SQL Server 2005, Hanser-Verlag, Holger Schrödel. Kapitel 2.4 OLAP Skript „Information Visualization“, Robert Spence, Imperial College London Der Weg zum Data Warehouse, Addison-Wesley, J.-H. Wieken, Kapitel 2.5: Data Mining – neue Zusammenhänge entdecken. 1999. Skript „Data Mining im Marketing“, Prof. Dr. Wilde, Universität Eichstätt-Ingolstadt, Kapitel „Data Warehouse und Olap“, SS 2006 40 20 Fragen ? 41 21