Data Mining

Werbung
<Bild einfügen>
2. Microsoft Innovationstag Nord
Integrierte Lösungen in der Öffentlichen
Verwaltung
Reporting, Analyse und Data Mining
André Henkel, initions AG
22. und 23. Oktober 2013 in Hamburg
<Bild einfügen>
Agenda




wer ist initions …
Einordnung Data Mining und Analyse
Anwendungsbeispiel Data Mining (Vorhersage mit Excel)
Anwendungsbeispiel Self Service BI (Analyse mit Excel)
<Bild einfügen>
Die initions AG
 Softwarehaus mit Sitz in Hamburg
 Gründung 2001
 Entwicklung intelligenter und innovativer
Softwarelösungen.
 Gründerpreis von Sparkasse, Stern und McKinsey.
 Microsoft Gold Partner
 47 Mitarbeiter.
<Bild einfügen>
initions gliedert sich in zwei Unternehmensbereiche
OPHEO
 OPHEO TRANSPORT
Intelligentes
Transportmanagementsystem


OPHEO MOBILE
Telematiksoftware
OPHEO Individuallösungen
Business Intelligence
Data Warehouse Lösungen für

Monitoring

Analyse

Reporting

Planung
Konzeption, Umsetzung, Integration,
Schulung und Dokumentation
<Bild einfügen>
Business Intelligence
<Bild einfügen>
Business Intelligence
 All-in-one Dienstleister
 Konzeption für FI/CO-, Marketing-, Vertriebsanalysen,
Verwaltung, Planung, Steuerung und Kennzahlenmodelle auf
allen Ebenen
 technischer Tiefgang (Infrastruktur, Softwarearchitektur,
Performanceoptimierung, MDX-Modellierung)
 Branchenkompetenz (Public, BOS, Finance, Logistics, Retail,
Manufacturing)
 „Executive Briefings“ und „Architecture Design Sessions“ für
Top 500 Unternehmen und öffentliche Verwaltung (D)
Microsoft Business Intelligence – das Portfolio
Microsoft SQL Server
SQL Server relational, parallel – (Parallel) Data
Warehousing,
Integration Services – ETL,
Master Data Management, Quality Services,
Big Data (Hadoop) Integration
Analysis Services – OLAP, InMemory,
Repository,
Data Mining, Azure Marketplace
Reporting Service – Berichtswesen
Office+SharePoint
Excel – Analysewerkzeug
Excel PowerPivot+PowerViewer
– Self service BI
Excel Service über SharePoint
Quelle: Gartner Februar 2013
-9-
Microsoft Business Intelligence – das Portfolio
Datenpräsentation
Analyse-Modelle
Datenmanagement
Datenintegration
Interne und externe
Datenquellen
- 10 -
Microsoft Business Intelligence – das Portfolio
Nutzung der vertrauten Microsoft-Produkte
Datenpräsentation
Dashboards Collaboration Mobile BI
& Scorecards & Workflows
Analysis Services
(OLAP, In-Memory,
Data Mining )
Analyse-Modelle
Datenmanagement
Reports
Data Quality
Services
Integration
Services
Parallel Data
Data
(ETL) Warehouse Warehouse
Datenintegration
Excel
PowerPivot &
Power View
IBM DB2
- 11 -
Reporting
Master
Data
Services
Services
Hadoop/
HDInsight
LOB
Datenquellen
Cloud BI
Office365
Data Market Place
Stream
Insight
Cloud BI
SQL Azure
„unstrukturierte“
Daten
Odata Feeds
Einführung in das Thema Data Mining
• Data Mining beschreibt den Prozess der Herleitung
neuen Wissens durch die Erkennung von Mustern
und Zusammenhängen in vorhandenen
Datenbeständen
• Einsatz von Techniken und Verfahren der
multivariaten Statistik und des maschinellen Lernens
• Insbesondere gut geeignet bei sehr großen
Datenbeständen, die sich durch einfachere Verfahren
nicht mehr analysieren lassen
© initions AG
Data Mining als Teil des Knowledge Discovery in
Databases(KDD)-Prozess
Prozess des Knowledge Discovery in Databases nach Fayyad [1]
© initions AG
Arten von Data Mining-Problemstellungen
• Klassifikation
• Clustering
• Regression
• Assoziationsanalysen
• Zeitreihenanalysen
© initions AG
Ausgewählte Typen von Prognosemodellen
Neuronales Netz
x0…xn = Eingangsvariablen
(z.B. Bevölkerungszahl, Jahr, etc.)
y0…yn = Zielvariablen
(im Fallbeispiel Fälle/1000 Einw.)
© initions AG
Ausgewählte Typen von Prognosemodellen
Neuronales Netz
• Ähnelt im Aufbau den Nervenzellenvernetzungen im
menschlichen Gehirn
• Sind Schichtenweise über gewichtete nichtlineare
Funktionen miteinander verbunden
• Anpassung der Gewichte im Zuge des Lernprozesses
• Kann sehr komplexe Zusammenhänge darstellen, ist aber
oftmals anfällig auf
• Hohe Anzahl nicht aussagefähiger Attribute
• Ausreißer in den Trainingsdaten bei komplexen Netzen
© initions AG
Ausgewählte Typen von Prognosemodellen
Entscheidungsbaum
© initions AG
Ausgewählte Typen von Prognosemodellen
Entscheidungsbaum
• Gerichteter Graph, in Form einer Baumstruktur
• Integrierte Merkmalsselektion
• Für jede Teilung des Baums wird erneut analysiert,
welches Attribut den größten Einfluss auf die
Zielvariable hat
• Keine negative Beeinflussung durch Hinzunahme nicht
aussagekräftiger Attribute
• Anschauliche Darstellung möglich
• Vielfalt der möglichen Ergebnisausprägungen hängt von
Anzahl der Blattknoten ab
© initions AG
DEMO: DATA MINING ADD-INS FÜR EXCEL
© initions AG
SELF SERVICE BI MIT EXCEL POWERPIVOT
© initions AG
Excel Power Pivot und
Power View
Anwendungsfall
„Import und Modellierung“
„Interaktives Reporting und Analyse“
Excel PowerPivot
Excel PowerPivot
Self-Service BI
In-Memory-Datenbank (xVelocity)
für Excel-Client
Datenquellen:
- Excel
- MSSQL, Oracle, SAP
- ODATA (Web, SAP, …)
- Hadoop (ODBC for Hive)
- OLAP
- CSV, TXT
- ODBC und OLEDB Konnektoren
DEMO: SELF SERVICE BI MIT EXCEL POWERPIVOT
© initions AG
Excel Power Pivot und
Power View
Beispielanwendungsfälle
Merkmale
Nutzen und Vorteile
Intuitive Datenanalyse im
Browser oder in Excel
Excel PowerPivot
Excel PowerPivot
Self-Service BI
In-Memory-Datenbank (xVelocity)
für Excel-Client
Datenquellen:
- Excel
- MSSQL, Oracle, SAP
- ODATA (Web, SAP, …)
- Hadoop (ODBC for Hive)
- OLAP
- CSV, TXT
- ODBC und OLEDB Konnektoren
SQL Server In-Memory
SQL Server Analysis Services
(Tabular Mode)
Zentrales Management
In-Memory-Datenbank (xVelocity)
für Server
Datenquellen:
- Excel
- MSSQL, Oracle, SAP
- ODATA (Web, SAP, …)
- Hadoop (ODBC for Hive)
- OLAP
- CSV, TXT
- ODBC und OLEDB Konnektoren
<Bild einfügen>
Vielen Dank für Ihre Aufmerksamkeit!
André Paul Henkel
initions AG, Hamburg
[email protected]
040-4149600
Herunterladen