Visual Business Analytics Effektiver Zugang zu Daten und Informationen Dr.-Ing. Jörn Kohlhammer Fraunhofer-Institut für Graphische Datenverarbeitung (IGD) Fraunhoferstraße 5 64283 Darmstadt Tel.: +49 6151 155 - 646 Fax: +49 6151 155 - 139 Email: [email protected] http://www.igd.fraunhofer.de/iva Nutzen der Visualisierung “Grafische Unterstützung macht uns klüger.” (Stuart Card) Zwei Ziele der grafischen Unterstützung Bessere Kommunikation vorhandener Ideen Entdeckung neuer Ideen Nutzung von visuellen Hilfsmitteln zum Denken und Entscheiden Allein Stift und Papier reduzieren die Rechenzeit um den Faktor 5 © 2014 Fraunhofer IGD 2 Beispiel (Statistik) Vier Datensätze mit identischem linearen Modell (Tufte, 1983) © 2014 Fraunhofer IGD 3 Beispiel (Statistik) Vier Datensätze mit identischem linearen Modell (Tufte, 1983) © 2014 Fraunhofer IGD 4 Beispiel (Reporting) © 2014 Fraunhofer IGD 5 Beispiel (Reporting) © 2014 Fraunhofer IGD 6 Erstes deutschsprachiges Buch zum Thema Visualisierung im BI-Bereich Anwendung der besten Visual Business Analytics-Techniken zur Verarbeitung massiver Datenmengen und für den Einblick in komplexe Strukturen Verwendung von Visual Business Analytics für ein effizientes und verständliches Informationsmanagement Erscheinungstermin: Ende Oktober © 2014 Fraunhofer IGD 7 Ausbaustufen von Visual Business Analytics Informationsdesign Gutes Verständnis und adäquate Verwendung von visuellen Elementen im Reporting Informationsvisualisierung Dynamische Informationen interaktiv und visuell zugänglich machen Visuelle Analyse (Visual Analytics) Neue Erkenntnisse durch das abgestimmte Zusammenspiel von Mensch und System © 2014 Fraunhofer IGD 8 Visual Business Analytics © 2014 Fraunhofer IGD 9 Informationsvisualisierung Wir benutzen auf natürliche Weise unsere Augen, um die Welt zu verstehen... (Stephen Few) Daten InformationsWissen visualisierung „Eine interaktive Grafik sagt mehr als 1000 Excel-Tabellen.“ © 2014 Fraunhofer IGD 10 Beispiel: Tree Maps Hier: Darstellung der Entwicklung von Börsenkursen (2001) Übersicht über aktuelle Börsentrends Branchenklassifikation Fokus auf relevante Informationen © 2014 Fraunhofer IGD 11 Informationsvisualisierung © 2014 Fraunhofer IGD 12 Informationsvisualisierung Beachtung der menschlichen Wahrnehmung Beispiel: Change Blindness Vorsicht bei: Animation und interaktiven Visualisierungen „Springen“ zwischen Darstellungen Mehrseitigen Darstellungen © 2014 Fraunhofer IGD 15 Menschliche Wahrnehmung „Hervorspringen“ von Informationen Ein „Hervorspringen“ erfolgt, wenn das Zielobjekt eine Eigenschaft besitzt, die kein anderes ablenkendes Objekt besitzt. (Suchen Sie das blaue “T”) © 2014 Fraunhofer IGD 16 Menschliche Wahrnehmung © 2014 Fraunhofer IGD 17 Menschliche Wahrnehmung (Suchen Sie das “/”) © 2014 Fraunhofer IGD 18 Menschliche Wahrnehmung © 2014 Fraunhofer IGD 19 Menschliche Wahrnehmung Ein „Hervorspringen“ erfolgt, wenn das Zielobjekt eine Eigenschaft besitzt, die kein anderes ablenkendes Objekt besitzt. © 2014 Fraunhofer IGD 20 Menschliche Wahrnehmung Eine serielle Suche ist nötig, wenn jede visuelle Eigenschaft des Zielobjekts auch unter den ablenkenden Objekten vorkommt. (Suchen Sie das grüne “T”) © 2014 Fraunhofer IGD 21 Menschliche Wahrnehmung © 2014 Fraunhofer IGD 22 Interaktive Visualisierung: Beispiel Gapminder © 2014 Fraunhofer IGD 23 Informationsvisualisierung © 2014 Fraunhofer IGD 24 Visual Business Analytics © 2014 Fraunhofer IGD 25 Big Data 100 Mio. FedEx Transaktionen pro Tag Über 1800 Gbps über DE-CIX peak traffic 7,2 Mrd. VISA Kreditkartentransaktionen pro Jahr © 2014 Fraunhofer IGD 26 Beispiel: Kreditkarten Geldautomaten Acquirer POS Real-Time Online Switch Host / Issuer © 2014 Fraunhofer IGD 27 Beispiel: Kreditkarten Datenbank Regeln und Abfragen Alerts! Visualisierung Reports © 2014 Fraunhofer IGD 28 Beispiel: Kreditkarten 50 und mehr Attribute Amount Merchant# Location Local Transaction Time Country Code POS PAN MCC Expiry Date … Card# Große Anzahl Transaktionen (z.B. 7,2 Mrd. VISA-Transaktionen in 2009) Problem: Fixe Regeln erkennen nur bekannte Betrugsschemata Wie erkennt man neue Fälle möglichst rasch und proaktiv? © 2014 Fraunhofer IGD 29 Histogramm für ein Attribut Beispiel: Zeit der Kreditkartentransaktion 1-dimensionales Histogramm 02:00-04:59 23:00-01:59 19:00-22:59 16:00-18:59 12:00-15:59 09:00-11:59 05:00-08:59 Time of Day © 2014 Fraunhofer IGD 30 Histogramme und Tabelle für zwei Attribute -$9 4 10 12 15 16 10 10 $10-$99 6 25 28 23 13 16 12 $100-$299 4 32 41 28 14 8 5 $300-$499 2 31 35 20 10 4 3 $500-$699 0 5 6 6 30 9 0 $700-$999 1 1 12 8 17 6 2 $1000- 0 2 6 5 5 3 0 Beispiel: Zeit der Transaktion abgebildet auf Zahlungsbetrag Zwei 1-dimensionale Verteilungen kombiniert in einer Tabelle (Zahlen stehen für die Größe der verschiedenen Gruppen) © 2014 Fraunhofer IGD 31 Mustererkennung Abbildung der Gruppengröße auf Helligkeit -$9 10 12 15 16 10 10 $10-$99 25 28 23 13 16 12 $100-$299 4 32 41 28 $300-$499 2 31 35 20 $500-$699 0 5 6 6 $700-$999 1 1 12 8 $1000- 0 2 6 5 Interessante Bereiche können „auf einen Blick“ erkannt werden. © 2014 Fraunhofer IGD 32 pos atm pos atm pos atm pos atm pos atm pos atm pos atm Herausforderung: Sehr viele Attribute -$9 Verwobene Darstellung von drei (und mehr) Attributen $10-$99 $100-$299 $300-$499 Hier zusätzliches Attribut: POS oder ATM $500-$699 $700-$999 $1000- © 2014 Fraunhofer IGD 33 Visualisierung mehrdimensionaler Beziehungen KVMap: 100.000 Datensätze in sechs Dimensionen © 2014 Fraunhofer IGD 34 KVMap-System Komplexe Muster von 10 und mehr Dimensionen als farbige Muster Erkennen von neuen Zusammenhängen ohne kognitiven Aufwand Automatische Methoden im Hintergrund Identifizierung interessanter Muster aus Datenbank oder DWH Mächtige Analysetechnik für das “Back Office” © 2014 Fraunhofer IGD 35 Weitere Einsatzmöglichkeiten Dynamische Daten Verkaufsdaten Transaktionsdaten Datenbasierte Betrugserkennung Schnelles Erkennen von Zusammenhängen Neuartige Verhaltensmuster Sich verändernde Transaktionsmuster Experten im Zentrum der Analyse © 2014 Fraunhofer IGD 36 Visual Analytics © 2014 Fraunhofer IGD 37 Heutige Graphiken für große Datenmengen? Portugal Spanien Frankreich Großbritannien Polen Slowakei Tschechien Slowenien USA Schweiz EU Italien Japan Österreich Irland Ungarn Rumnänien Deutschland Dänemark Kroatien Schweden Finnland 16 14 12 10 8 6 4 2 0 0 2 4 6 8 10 12 © 2014 Fraunhofer IGD 38 Warum Visual Analytics, warum heute? Große und wachsende Datensammlungen (Big Data) Notwendigkeit schneller und informierter Entscheidungsfindung auf Basis dieser Daten Reine Visualisierungsmethoden (Informationsvisualisierung) nicht adäquat für Milliarden von Datensätzen Vollautomatische Knowledge Discovery-Ansätze/Modelle nur für wohldefinierte und eindeutig spezifizierbare Probleme Beispiel: Abwehrsituationen: Betrug, Viren, SPAM, DOS-Angriffe, Wettbewerb, … © 2014 Fraunhofer IGD 39 Was ist das Neue an Visual Analytics? Was gibt es schon? Automatisches Knowledge Discovery & Data Mining Interaktive visuelle Daten-Exploration Was brauchen wir? Enge Integration visueller und automatischer Datenanalysemethoden mit Datenbanktechnologien für skalierbare interaktive Entscheidungsunterstützung Visuelle Daten-Exploration Visualisierung Daten Wissen Modelle Data Mining © 2014 Fraunhofer IGD Feedback Loop 40 Visual Analytics – ein neuer Ansatz Kombination aus Informationsvisualisierung, Statistik, Data Mining, Business Intelligence und anderen Gebieten Wahrnehmungstheorie Interaktivität Benutzerfreundlichkeit Informationsvisualisierung Data Mining Visual Analytics Wissensmanagement Statistik Datenbankmanagement © 2014 Fraunhofer IGD 41 Business Intelligence Visual Analytics Neue Möglichkeiten durch Integration mit automatischen Verfahren Stärkerer Einfluss der menschlichen Erfahrung und Ideen in den Gesamtprozess Effektiverer Umgang mit Big Data Erste Ansätze in heutigen Tools in Erweiterungen zur interaktiven Exploration, Prediction oder Simulation © 2014 Fraunhofer IGD 42 Weitere Einsatzgebiete von Visual Analytics CRM-Analysen Trendanalysen Sicherheit Medizin Analysen im Fertigungsumfeld Überall, wo massive Datenmengen anfallen © 2014 Fraunhofer IGD 43 Informationsvisualisierung und Visual Analytics Verkürzung des Weges von Daten zur Entscheidung Daten Interaktive Informationen und Erkenntnisse Entscheidung © 2014 Fraunhofer IGD Handlung 44 Fraunhofer IGD (Stand 2012) 215 Mitarbeiter (FTE) 16,2 Mio € Budget 4 Standorte Darmstadt, Rostock, Graz und Singapur 12 F&E-Abteilungen für angewandte Forschung in Visual Computing und die Nutzbarmachung von Forschungsergebnissen in der Wirtschaft Die weltweit führende Einrichtung für angewandtes Visual Computing © 2014 Fraunhofer IGD 45 Fraunhofer IGD – Geschäftsfelder Virtuelles Engineering Visuell Visuelle Entscheidungshilfe Digital Digitale Gesellschaft Virtuell © 2014 Fraunhofer IGD 46 Geschäftsfeld Visuelle Entscheidungshilfe Menschen wollen Zusammenhänge verstehen, Einsichten gewinnen und Entscheidungen herbeiführen. Wir machen über Visualisierungen komplexe Sachverhalte in abstrakten Daten, Modellen und Simulationen sichtbar. Wir unterstützen Industrie, Behörden und Privatpersonen mit Analysetechniken und Visualisierungsmethoden dabei, Entscheidungen einfacher, schneller und besser zu treffen. © 2014 Fraunhofer IGD 47 Fazit Fraunhofer IGD als Ansprechpartner für angewandte Forschung im Bereich Informationvisualisierung und Visual Analytics Informationsdesign Informationsvisualisierung Visual Analytics Angebot Auswahl an verfügbaren Visualisierungs- und Analysemethoden Beurteilung der Methoden mit den verfügbaren Daten Anpassung an den spezifischen Anwendungsfall © 2014 Fraunhofer IGD 48 Kontakt Dr. Jörn Kohlhammer Fraunhofer IGD Fraunhoferstraße 5 64283 Darmstadt Deutschland Tel.: +49 (6151) 155 – 646 Fax: +49 (6151) 155 – 139 Email: [email protected] http://www.igd.fraunhofer.de © 2014 Fraunhofer IGD 49