Die Kunst der Vorhersage: Prognose-Modelle für den öffentlichen Sektor Dipl.-Geol. Magnus Reimann Techn. Presales & Innovation Consultant - ORAYLIS Agenda Erstellung von Vorhersagemodellen – Predictive Analytics Einordnung in Business Intelligence-Lösungen AzureML – Vorhersagemodelle in der Cloud Anwendungsbeispiele im öffentlichen Sektor ORAYLIS Überblick Spezialist für Big-Data- und Business-Intelligence-Lösungen Gegründet 1999 70 Mitarbeiter Full-Service Business Intelligence Plan -> Build -> Run ORAYLIS ist Top BI Partner von Microsoft Outstanding HP and Microsoft Frontline Partner of the Year 2012 (Data Management) Black Belt Partner APS Premium Partner Shortlist Partner Microsoft Consulting Services (MCS) Hortonworks (Hadoop) System Integrator Partner Microsoft Business Intelligence und Best Practice / Vorgehensmodell 4 Copyright ORAYLIS GmbH Unsere Kunden 5 Agenda Erstellung von Vorhersagemodellen – Predictive Analytics Einordnung in Business Intelligence-Lösungen AzureML – Vorhersagemodelle in der Cloud Anwendungsbeispiele im öffentlichen Sektor Data Mining gibt es schon so lange – was ist neu an Predictive & Big Data GPS Proximity Sensor Ambient Light Sensor 3-Axis Accelerometer Magnetometer Gyroscopic Sensor Wifi Camera(s) UI (senses user interactions) iBeacon IT Innovation is a major driver for Business Innovation Disruptive Digital Transformation ahead… 8 Dream for decades… will it ever come true? Dream for decades… will it ever come true? Kevin Kelly, founder of Wired Magazine: Singularity is the point at which "all the change in the last million years will be superseded by the change in the next five minutes." „Every industry is now a software industry where they are building these systems of intelligence… provide SaaS services that go along with your products.“ - Nadella Big Data treibt Big Data Mining Use Cases No Big Data Problem 13 Predictive Analytics Ableitung von Trends und Verhaltensmuster Mit Hilfe verschiedener statistischer Methoden und Modellierungstechniken Erkennung von Mustern in aktuellen und historischen Daten Erstellung von Modellen für zukünftige Daten 14 Wichtigste Einflussfaktoren 15 Predictive Analytics Descriptive / Data Discovery (Beschreiben) Sammlung aller relevanten Daten, die zu einem bestimmten Verhalten führen können, um daraus ein Muster abzuleiten Diagnostic (Erklären) Entwicklung eines Modells, um die vergangenen Verhaltensmuster zu begründen Predictive (Vorhersagen) Entwicklung eines statistischen Modells, um darüber Vorhersagen für die Zukunft ableiten zu können Prescriptive (Empfehlen) Ausarbeitung von Empfehlungen, um bei einem bestimmten Trend das Ergebnis in eine gewünschte Richtung zu beeinflussen 16 Grundziele 1. Drive Smarter Decisions from Data: Government agencies overwhelmed with vast quantities of data transform this challenge to an asset, employing predictive analytics to discover relationships and patterns hidden to the human eye that serve as actionable insights to drive smarter decisions. 2. Reduce Fraud, Waste, and Abuse: Recover and prevent improper payments using predictive analytics to score potential payments, claims and benefits for errors, fraud, waste, and abuse. 3. Automate Manual Processes: Employ analytics of both structured and unstructured data (text analytics) in order to streamline approvals of claims and benefits, and find documents of interest (E-discovery). 4. Prioritize Resources and Maximize Productivity: Use predictive analytics to score cases where there are an overwhelming number to quickly process, search, or audit – including payments, hotline tips and complaints, applicants for benefits, cargo shipments, products pending approval or patents, and others – ranking them so that managers, investigators, and auditors are more productive and efficient, spending their time on the most valuable cases. Quelle: www.predictiveanalyticsworld.com/gov/about.php 17 Agenda Erstellung von Vorhersagemodellen – Predictive Analytics Einordnung in Business Intelligence-Lösungen AzureML – Vorhersagemodelle in der Cloud Anwendungsbeispiele im öffentlichen Sektor Einordnung in bestehende Business Intelligence-Lösungen Traditional BI (Batch) Past Monitoring BI (Realtime) Lambda Architecture Present Predictive BI (Machine Learning) Future 19 Microsoft Machine Learing History & AzureML 20 The Microsoft Data Platform Einordnung in bestehende Business Intelligence-Lösungen Quelle: Bitkom 22 „Früher“ hieß es DataMining – hier die Sicht auf das Excel Plugin für die DataMining Algorithmen des SQL Servers (ab 2005) Technologischer Key-Enabler for Big Data – HDInsight von Microsoft 24 HDInsight Eco-System HDInsight Ecosystem 25 HDInsight – „On Premise/Boxed“ or „As a Service“ – How big is your cluster? 27 28 Agenda Erstellung von Vorhersagemodellen – Predictive Analytics Einordnung in Business Intelligence-Lösungen AzureML – Vorhersagemodelle in der Cloud Anwendungsbeispiele im öffentlichen Sektor Datamining Prozess Validerung/ Backtesting Analyse Abfrage des Modells Modellierung Training des Modells AzureML Quelle: Microsoft 31 Beispiel: Decision Tree Wettbewerbsfähigkeit Produkt: Befriedigend u. schlechter Gesamter Datenbestand 70% 30% Anzahl Beschwerden ≥ 3 70% Anzahl Beschwerden < 3 25% 15% 85% 30% 75% Anzahl Verträge: > 4 Wettbewerbsfähigkeit Produkt: gut und sehr gut 45% 65% 10% 75% Anzahl Verträge: 2 oder 3 25% 75% Anzahl Verträge: 1 50% 50% 32 AzureML - Algorithmen Quelle: Microsoft 33 Vergleich unterschiedlicher Algorithmen 34 35 AzureML – Eigene Algorithmen mit R Quelle: Microsoft 36 Microsoft Power BI für Discovery und Visualisierung 37 Agenda Erstellung von Vorhersagemodellen – Predictive Analytics Einordnung in Business Intelligence-Lösungen AzureML – Vorhersagemodelle in der Cloud Anwendungsbeispiele im öffentlichen Sektor Precobs Mit Hilfe von Precobs (Pre Crime Observation System) kann die Polizei vorhersagen, wo zukünftig eingebrochen wird und so effektiv die Kriminalität nicht nur aufdecken, sondern verhindern. Entwickelt wurde die Software in Oberhausen und ist bereits in Zürich sowie testweise in München und Nürnberg im Einsatz. Bildrechte: imago stock&people http://www1.wdr.de/themen/politik/precobs100.html 39 Aufteilung der Fläche nach Quadranten, PLZ-Gebieten o.ä. 40 Mögliche Messungen pro Gebiet und Tag Einwohnerdichte / Kaufpreisindex / Verbraucherindex / Grundstückspreise / Anteil Einfamilienhäuser / Arbeitslosenquote / Grünflächen (Anteil) etc. Bevölkerungszusammensetzungen (Alter, Nationalität) Stadtfeste, Feiern, Schulferien, Feiertage (evtl. Häufigkeitsverteilung der Zieladressen von Taxifahrten) Nähe zur Autobahn Jahreszeit (z.B. Anzahl Nachtstunden), Wetter und Wettervorhersage Einbrüche in den letzten 3/6/12/48 Wochen Verkehrsaufkommen, Straßenbeleuchtung, Anzahl Hunde pro 100 Einwohner, Verteilung der Fahrzeugherkunft aus Verkehrsüberwachung Werte aus benachbarten Quadranten Seiteneffekte: Polizeipräsenz Messgrößen Einbrüche nach Kategorie (Häuser, Wohnungen), Versuchte Einbrüche 41 LKA Deutschland - Einbruchsbekämpfung 42 Mögliches Vorgehen Zukünftige Daten für die Vorhersage Analyse der Daten Datenquellen anbinden Data Mining Modell Abstimmung mit Ermittlungsexperten Verwendung der Vorhersage für Vermeidung von Einbrüchen Absicherung / Verbesserung 43 Betrugserkennung mit Big Data-Technologien 44 Kostenersparnis bei Gebäudeinstandhaltung und Strom durch AzureML 45 Innovation is a manageable process – Innovation Lab & Consulting 46 Approaching the Modern Data Architecture Think Big Start Small Discover Visual Scale Fast 47 Go try Microsoft Azure kostenlos testen: http://azure.microsoft.com/de-de/pricing/free-trial/ AzureML: http://azure.microsoft.com/en-us/services/machine-learning/ ORAYLIS Blog: Jens Kröhnert: Data Scientist & Predictive BI http://blog.oraylis.de/2014/11/innovation-lab-data-scientist-predictive-bi/ Download Power BI Designer (kostenlos): https://www.powerbi.com/dashboards/downloads/ ORAYLIS TV: Jens Kröhnert: Power BI Serie https://www.youtube.com/user/oraylisbi 48