Oliver Bracht - Oracle Data Warehouse Community Seite

Werbung
Cross Selling Analytical CRM
Price optimization
Customer satisfaction Market potential Gap-Analysis MultivariateAnalysis Descriptive
Data Analysis
Statistics
DataMining
Data quality
Transformation
Marketing Mix
Operations Research
error values Missing value Ausreißer
Significant
forecasts Data cleanup
Evidence Pattern matching
Decision trees Cluster-Analyse
Implicitknowledge factors analysis
association analysis classification process Hypotheses Predictive
Analytics Diskriminanzanalysis Planning attribution weighting Six Sigma Analysis
regression analysis Support-Vector-Machine CRM Neural Networks
customer segmentation Affinity Analysis Customer relationships Empiricism
plausibility test Campaign Management market modeling Web Mining
Sensitivity analysis
Exploratory statistics valid relevant Optimization
reporting
Oliver Bracht
Chief Data Scientist
© 2010 – 2015 eoda
Über eoda
Über R
Data
Science
Statistik
Methoden
HackingSkills
Domain
Wissen
© 2010 – 2015 eoda
Über eoda
Über R
Data Scientists
Analytic
Anwender
Analytic
Konsumenten
© 2010 – 2015 eoda
Über eoda
Über R
Business Value
Überführung in
Geschäftsprozesse
Predictive
Modelling
Datamining
Daten aufbereiten
Anforderungen
definieren
Zeit
© 2010 – 2015 eoda
Über eoda
Über R
Fakten über R
R ist ein Softwareumgebung und eine Programmiersprache.
R besteht aus einem schlanken Kernsystem und optionalen Paketen.
Die Pakete enthalten Werkzeuge für spezielle Aufgaben im Analyseprozess.
Die Pakete werden von führenden Experten auf dem jeweiligen Gebiet entwickelt
R kann als eigenständige Software genutzt werden oder in andere Softwareumgebungen integriert
werden
R ist plattformunabhängig
© 2010 – 2015 eoda
Über eoda
Über R
Überblick über R-Softwarepakete
ggplot2
…
googlevis
twitter
RKern
RCurl
Record
Linkage
tm
xtable
RODBC
© 2010 – 2015 eoda
Über eoda
Über R
Die Entwicklung von R
Die Verbreitung von R steigt stetig
Zur Zeit gibt es etwa 2 Millionen aktive R-Nutzer
Traffic auf Email Listen
Traffic auf E-Mail List
Anzahl an verfügbaren R-Paketen
Anzahl an R-Paketen
Zeit
Jahr
© 2010 – 2013 eoda
Über eoda
Über R
Der Bekanntheitsgrad von R
Welche Analyse/ Big Data/ Data Mining/ Data Science
Software wurde von Ihnen im letzten Jahr benutzt?
Popularitäts-Index für Programmiersprachen
Stand Juni 2013
2012
2012
2013
Microsoft Excel
%
0
20
40
60
(Source: KDNuggets 2013 software poll results)
© 2010 – 2015 eoda
Über eoda
Über R
Abverkäufe Softwareliteratur
© 2010 – 2015 eoda
Über eoda
Über R
Vorteile von R
Proprietäre Analyse Software
Weltgrößte Community von Entwicklern
und Experten
Begrenzte Anzahl an angestellten
Entwicklern
Flexibilität
Es können unterschiedlichste
Datentypen verarbeitet werden
SAS und SPSS erfordern Datenhaltung in
rechteckigen Datenstrukturen
Aktualität
Up-to-Date Methoden sind schnell
verfügbar
Bis zu 5 Jahre, bis neue analytische
Methoden hinzugefügt werden
Deutlich geringerer Funktionsumfang
Funktionsumfang
R bietet mehr analytische Methoden als
andere Software Tools
Grafiken
Extrem flexibel und modifizierbar, hohe
Qualität, vielfältige Exportmöglichkeiten
Statndard Grafiken (begrenzt
modifizierbar)
Community
© 2010 – 2015 eoda
Über eoda
Über R
Visualisierung als Beispiel für die Fähigkeiten von R
Die Arterien der Welt, dargestellt inTweets – visualisiert mit 20 Zeilen R-Code vonMiquel Rios
Tokyo
Europa
New York
© 2010 – 2015 eoda
Über eoda
Über R
Facebook Freundschaften, visualisiert mit etwa 150 Zeilen R-code von Paul Butler
© 2010 – 2015 eoda
Über eoda
Über R
Transparency Layer
SQL
Oracle Database
Engine
ORE packages
R -packages
Transparency Layer
Results
User tables
> head(myDF, 100)
> head(myOF, 100)
© 2010 – 2015 eoda
Über eoda
Über R
Transparency Layer
SQL
Oracle Database
Engine
ORE packages
R -packages
Transparency Layer
Results
User tables
Vorteile
• R Objekte arbeiten direkt auf der Datenbank
• Nur minimale Änderung der R-Skripte notwendig
• Implizite Übersetzung von R nach SQL
© 2010 – 2015 eoda
Über eoda
Über R
ore.doEval and apply-Function family
SQL
Oracle Database
R
Engine
Engine
ORE packages
R -packages
Transparency Layer
Results
User tables
Results
ORE packages
R -packages
© 2010 – 2015 eoda
Universitätsplatz 12
34127 Kassel
+49 (0) 561/202724-40
http://www.eoda.de
http://blog.eoda.de
http://twitter.com/datennutzen
[email protected]
© 2010 – 2015 eoda
Herunterladen