<Bild einfügen> 2. Microsoft Innovationstag Nord Integrierte Lösungen in der Öffentlichen Verwaltung Reporting, Analyse und Data Mining André Henkel, initions AG 22. und 23. Oktober 2013 in Hamburg <Bild einfügen> Agenda wer ist initions … Einordnung Data Mining und Analyse Anwendungsbeispiel Data Mining (Vorhersage mit Excel) Anwendungsbeispiel Self Service BI (Analyse mit Excel) <Bild einfügen> Die initions AG Softwarehaus mit Sitz in Hamburg Gründung 2001 Entwicklung intelligenter und innovativer Softwarelösungen. Gründerpreis von Sparkasse, Stern und McKinsey. Microsoft Gold Partner 47 Mitarbeiter. <Bild einfügen> initions gliedert sich in zwei Unternehmensbereiche OPHEO OPHEO TRANSPORT Intelligentes Transportmanagementsystem OPHEO MOBILE Telematiksoftware OPHEO Individuallösungen Business Intelligence Data Warehouse Lösungen für Monitoring Analyse Reporting Planung Konzeption, Umsetzung, Integration, Schulung und Dokumentation <Bild einfügen> Business Intelligence <Bild einfügen> Business Intelligence All-in-one Dienstleister Konzeption für FI/CO-, Marketing-, Vertriebsanalysen, Verwaltung, Planung, Steuerung und Kennzahlenmodelle auf allen Ebenen technischer Tiefgang (Infrastruktur, Softwarearchitektur, Performanceoptimierung, MDX-Modellierung) Branchenkompetenz (Public, BOS, Finance, Logistics, Retail, Manufacturing) „Executive Briefings“ und „Architecture Design Sessions“ für Top 500 Unternehmen und öffentliche Verwaltung (D) Microsoft Business Intelligence – das Portfolio Microsoft SQL Server SQL Server relational, parallel – (Parallel) Data Warehousing, Integration Services – ETL, Master Data Management, Quality Services, Big Data (Hadoop) Integration Analysis Services – OLAP, InMemory, Repository, Data Mining, Azure Marketplace Reporting Service – Berichtswesen Office+SharePoint Excel – Analysewerkzeug Excel PowerPivot+PowerViewer – Self service BI Excel Service über SharePoint Quelle: Gartner Februar 2013 -9- Microsoft Business Intelligence – das Portfolio Datenpräsentation Analyse-Modelle Datenmanagement Datenintegration Interne und externe Datenquellen - 10 - Microsoft Business Intelligence – das Portfolio Nutzung der vertrauten Microsoft-Produkte Datenpräsentation Dashboards Collaboration Mobile BI & Scorecards & Workflows Analysis Services (OLAP, In-Memory, Data Mining ) Analyse-Modelle Datenmanagement Reports Data Quality Services Integration Services Parallel Data Data (ETL) Warehouse Warehouse Datenintegration Excel PowerPivot & Power View IBM DB2 - 11 - Reporting Master Data Services Services Hadoop/ HDInsight LOB Datenquellen Cloud BI Office365 Data Market Place Stream Insight Cloud BI SQL Azure „unstrukturierte“ Daten Odata Feeds Einführung in das Thema Data Mining • Data Mining beschreibt den Prozess der Herleitung neuen Wissens durch die Erkennung von Mustern und Zusammenhängen in vorhandenen Datenbeständen • Einsatz von Techniken und Verfahren der multivariaten Statistik und des maschinellen Lernens • Insbesondere gut geeignet bei sehr großen Datenbeständen, die sich durch einfachere Verfahren nicht mehr analysieren lassen © initions AG Data Mining als Teil des Knowledge Discovery in Databases(KDD)-Prozess Prozess des Knowledge Discovery in Databases nach Fayyad [1] © initions AG Arten von Data Mining-Problemstellungen • Klassifikation • Clustering • Regression • Assoziationsanalysen • Zeitreihenanalysen © initions AG Ausgewählte Typen von Prognosemodellen Neuronales Netz x0…xn = Eingangsvariablen (z.B. Bevölkerungszahl, Jahr, etc.) y0…yn = Zielvariablen (im Fallbeispiel Fälle/1000 Einw.) © initions AG Ausgewählte Typen von Prognosemodellen Neuronales Netz • Ähnelt im Aufbau den Nervenzellenvernetzungen im menschlichen Gehirn • Sind Schichtenweise über gewichtete nichtlineare Funktionen miteinander verbunden • Anpassung der Gewichte im Zuge des Lernprozesses • Kann sehr komplexe Zusammenhänge darstellen, ist aber oftmals anfällig auf • Hohe Anzahl nicht aussagefähiger Attribute • Ausreißer in den Trainingsdaten bei komplexen Netzen © initions AG Ausgewählte Typen von Prognosemodellen Entscheidungsbaum © initions AG Ausgewählte Typen von Prognosemodellen Entscheidungsbaum • Gerichteter Graph, in Form einer Baumstruktur • Integrierte Merkmalsselektion • Für jede Teilung des Baums wird erneut analysiert, welches Attribut den größten Einfluss auf die Zielvariable hat • Keine negative Beeinflussung durch Hinzunahme nicht aussagekräftiger Attribute • Anschauliche Darstellung möglich • Vielfalt der möglichen Ergebnisausprägungen hängt von Anzahl der Blattknoten ab © initions AG DEMO: DATA MINING ADD-INS FÜR EXCEL © initions AG SELF SERVICE BI MIT EXCEL POWERPIVOT © initions AG Excel Power Pivot und Power View Anwendungsfall „Import und Modellierung“ „Interaktives Reporting und Analyse“ Excel PowerPivot Excel PowerPivot Self-Service BI In-Memory-Datenbank (xVelocity) für Excel-Client Datenquellen: - Excel - MSSQL, Oracle, SAP - ODATA (Web, SAP, …) - Hadoop (ODBC for Hive) - OLAP - CSV, TXT - ODBC und OLEDB Konnektoren DEMO: SELF SERVICE BI MIT EXCEL POWERPIVOT © initions AG Excel Power Pivot und Power View Beispielanwendungsfälle Merkmale Nutzen und Vorteile Intuitive Datenanalyse im Browser oder in Excel Excel PowerPivot Excel PowerPivot Self-Service BI In-Memory-Datenbank (xVelocity) für Excel-Client Datenquellen: - Excel - MSSQL, Oracle, SAP - ODATA (Web, SAP, …) - Hadoop (ODBC for Hive) - OLAP - CSV, TXT - ODBC und OLEDB Konnektoren SQL Server In-Memory SQL Server Analysis Services (Tabular Mode) Zentrales Management In-Memory-Datenbank (xVelocity) für Server Datenquellen: - Excel - MSSQL, Oracle, SAP - ODATA (Web, SAP, …) - Hadoop (ODBC for Hive) - OLAP - CSV, TXT - ODBC und OLEDB Konnektoren <Bild einfügen> Vielen Dank für Ihre Aufmerksamkeit! André Paul Henkel initions AG, Hamburg [email protected] 040-4149600