Programmierer oder Statistiker?

Werbung
FACHARTIKEL
Anforderungen an Data Scientists und Data Analysts – Ergebnisse einer Studie
Programmierer oder Statistiker?
Mit der zunehmenden Bedeutung anspruchsvollerer, modellorientierter Analysen in der Unternehmenspraxis
sowie deren Einbettung in Big-Data- und Business-Intelligence-Umgebungen wachsen auch die Anforderungen
an die Benutzer. Als neue Bezeichnungen für die entsprechenden Rollen setzen sich zunehmend die Begriffe „Data
Analysts“ und „Data Scientists“ durch. Zunächst stellt sich die Frage, inwiefern hier tatsächlich neue Aufgabenprofile
definiert werden und inwiefern sich diese von den althergebrachten Rollen unterscheiden. Zum Zweiten ist unklar,
ob die beiden Begriffe synonym gesehen werden bzw. in welcher Hinsicht sie sich unterscheiden. Und drittens ist
zu prüfen, welche Werkzeugkenntnisse konkret benötigt werden und damit auch, wie die Werkzeugumgebung für
die beiden Rollen zu gestalten ist. Zur Beantwortung dieser Fragen wurden 240 Stellenanzeigen ausgewertet.
alisten einzusetzen, weshalb hierfür in Rollenkonzepten für
die BI auch „Statistiker“, „Mathematiker“ und/oder „DataMining-Experten“ vorgesehen waren (so zum Beispiel bei
[GTS10]). Diese wurden jedoch als optionale Sonderrollen
gesehen, auch weil entsprechende Anwendungen lange Zeit
ein Nischendasein fristeten und lediglich in ausgewählten
Branchen und Funktionsbereichen zum intensiven Einsatz
kamen.
Im Zuge der Big-Data-Diskussion hat die Praxis begonnen, dem Thema „Modellorientierte Systeme“ unter
der neuen Überschrift „Advanced and Predictive Analytics“
wieder verstärkt Aufmerksamkeit zu widmen [RUS11].
Dies erscheint auch angebracht angesichts neuartiger und
voluminöser Datenquellen etwa aus Sensornetzwerken oder
Social Media, einem verbesserten Set an Methoden für die
Datenanalyse sowie verbesserten Möglichkeiten, die entwickelten Modelle großflächig anzuwenden [Hal14]. Mit
solchen Einsätzen gehen jedoch auch gänzlich neue Anforderungen an die Benutzer einher. Insbesondere gewinnen
Systementwicklungs-, Datenbank- und Infrastrukturkenntnisse an Bedeutung, zum Beispiel um geeignete Daten aus
einem Data Lake zu extrahieren oder ein entwickeltes Modell in einer Big-Data- oder Data-Warehouse-(DWH-)Um-
Die Rollen des Data Scientist und
des Data Analyst in der BI
Die Erstellung, die Nutzung und die Pflege modellorientierter Systeme hatte seit jeher eine Sonderstellung im Kontext
integrierter Ansätze für die Management- und Entscheidungsunterstützung (Business Intelligence, BI) [HGK10].
Anders als bei den in der BI bis heute dominierenden Reporting- und OLAP-Anwendungen setzt eine korrekte und
effektive Anwendung modellorientierter Systeme umfangreiche methodenspezifische Vorkenntnisse voraus. Dies
betrifft hauptsächlich die genutzten algorithmischen oder
mathematisch-statistischen Simulations-, Optimierungsoder Data-Mining-Modelle. So erfordert ein erfolgreicher
Einsatz des Data Mining unter anderem, dass die zu untersuchende fachliche Fragestellung präzise auf eine geeignete
Methode abgebildet wird, dass aus den vorliegenden Daten
sinnvolle Stichproben zur Modellbildung (Trainingsdaten)
und zum Modelltest (Testdaten) gezogen und diese adäquat
vorverarbeitet werden (Bereinigung um Ausreißer, Normalisierung usw.) sowie dass das Modell in einem iterativen
Prozess erstellt und hinsichtlich seiner Güte evaluiert wird
[FPS96]. Es liegt nahe, für diese Aufgaben geschulte Spezi150
80
100
60
40
50
20
0
0
Jan
Feb
Mrz
Apr
Mai
Jun
Jul
Aug
Sep
Okt
-­‐5
0
5
10
15
80
60
40
20
0
Fachliche Kenntnisse
Problemanalyse,
Ergebnisaufbereitung
&
-kommunikation
Statistischmathematische
Kenntnisse /
Modellentwicklung
Data Scien*st & Data Analyst als neue Rollen in der BI IT-Kenntnisse
Modelloperationalisierung
Abb. 1: Anforderungen an Data Scientist und Data Analyst
Abbildun
g 1 ONLINE -THEMENSPECIAL PREDICTIVE & ADVANCED ANALYTICS
01
FACHARTIKEL
gebung zu „operationalisieren“,
Rang Aufgabentyp
Anzahl
in %
damit diese im Rahmen operativer
(N=240)
Prozesse oder im Reporting lau1
Datenanalyse
133
55,4%
fend auf neue Daten angewendet
2
Data-Mining-Projekte/Werkzeuge/Technologien
79
32,9%
werden können. Hinzu kommen
3
Reporting/(Standard-)Reports
69
28,8%
erweiterte Anforderungen an die
4
Big-Data-Projekte/Lösungen/Technologien
61
25,4%
Problemanalyse sowie an die Er5
Prozesse/Produkte/Systeme optimieren
59
24,6%
gebnisaufbereitung und -kom6
Business-Intelligence-Projekte/Lösungen/Technolo55
22,9%
munikation (insbesondere bei der
gien
Datenvisualisierung), was zu ei7
Kooperation mit Fachbereichen/Personen
54
22,5%
ner stärkeren Relevanz fachlicher
8
Entscheidungsgrundlagen/Handlungsempfehlungen
52
21,7%
Kenntnisse führt.
9
Algorithmen/Algorithmik
51
21,3%
All diese Anforderungen wer10 Machine-Learning-Verfahren/Techniken
50
20,8%
den in den Rollen „Data Scientist“
(DS) und „Data Analyst“ (DA) ge- Tab. 1: Die 10 am häufigsten genannten Aufgaben für DS/DA-Positionen
bündelt. Ein DS/DA wird dabei als
eine neue Kernrolle in einer BI-Organisation gesehen (zum
Einige Autoren (zum Beispiel [Dav14] oder [Vos15])
Beispiel bei [GaT15]). Abbildung 1 visualisiert das Span- nutzen die Begriffe DS/DA lediglich als unscharfe Klamnungsfeld aus statistisch-mathematischen, IT-orientierten mer um eine Gruppe sehr unterschiedlicher Rollen, von
und fachlichen Kenntnissen, dem ein DS/DA gerecht wer- denen die meisten aus der etablierten BI-Organisation beden soll.
kannt sind. Die Ergebnisse einer Umfrage der SAS InstiEine Klärung, ob es sich bei den DS/DA tatsächlich um tute GmbH unter selbstdeklarierten DS scheint dieses Vereine neue Rolle handelt, ob es sich um zwei oder gar um ständnis zu untermauern. Demnach umfasst der DS jede nur
mehr Rollen handelt und welche genauen Anforderungen denkbare datenorientierte Position vom Programmierer bis
an einen DS/DA gestellt werden, ist nicht nur von Interesse zum Projektleiter [SAS15]. Es stellt sich die Frage, ob ein
für die Aus- und Weiterbildung und das Recruiting, sondern so breit verstandener DS- oder auch DA-Begriff tatsächlich
auch für die organisatorische Einbettung entsprechender Po- sinnvoll ist.
sitionen in die BI-Organisation sowie für die Gestaltung von
Eine Gemeinsamkeit findet sich bei all den Unterderen Arbeits- und Werkzeugumgebung.
schieden und Unklarheiten dennoch in den diversen BeiDer Begriff „Data Scientist“ hat dabei ältere Wurzeln trägen: Die Notwendigkeit, eine Rolle DS/DA zu definieals der des „Data Analyst“: Bereits im Jahr 1974 definierte ren, resultiert aus dem Bedarf, bisher getrennte fachliche,
Naur „Data Science“ als: „The science of dealing with data, IT-orientierte und mathematisch-statistische Fähigkeiten
once they have been established, while the relation of the zusammenzubringen, um neuartige Advanced- und Predictidata to what they represent is delegated to other fields and ve-Analytics-Anwendungen zu gestalten.
sciences“ [Nau74]. Patil führte die Begriffe „Data Scientist“
Damit werden auch die Abgrenzungen von anderen verund „Data-Scientist-Team“ ein und grenzte dabei den DS wandten Rollenprofilen plausibel, etwa von dem auf die Davon anderen Rollen ab [Pat11] – wobei allerdings speziell tenbewirtschaftung fokussierten „Data Engineer“, dem von
die Unterscheidung zu einem DA nicht überzeugt. Tatsäch- der Anwendung her kommenden „Business Analyst“ oder
lich differieren die diversen publizierten Definitionen des den auf Data-Warehouse- oder BI-Gesamtsysteme ausgeDA bestenfalls in Nuancen von denen des DS.
richteten Data-Warehouse- oder BI-Analysten.
Branchen (N=240) Finanzsektor 7% SoGwareunternehmen 10% Handel 10% Dienstleistungen (ohne Finanzsektor) 33% Produzierendes Gewerbe 18% Beratung 22% Abb. 2: Branchen der Unternehmen, die nach einem DS/DA suchen
Auswertung von Stellenanzeigen
zur Begriffsschärfung
Um zu einer Klärung der Rollenbilder DS/DA zu kommen
und die an diese gerichteten Anforderungen zu präzisieren,
haben wir eine Analyse von Stellenanzeigen vorgenommen.
Wir haben diesen Ansatz gewählt, da wir uns von ihm versprechen, dass er tendenziell die derzeit real benötigten Anforderungsprofile widerspiegelt.
Insgesamt wurden hierfür aus fünf Jobportalen 1.867
Anzeigen extrahiert. Nach einer Filterung (unter anderem
auf Anzeigen aus Deutschland) sowie einer Bereinigung
von Dubletten verblieben 240 Anzeigen, davon 106 für einen DS, 120 für einen DA und 14, die DS/DA gemeinsam
adressierten. Die Anzeigen wurden hinsichtlich der geforderten Aufgaben, allgemeiner Grundkenntnisse und erwarteter EDV-Fähigkeiten analysiert. Die Resultate wurden
gruppiert und vercodet und sowohl summarisch zunächst in
Excel und im Anschluss mit dem Data-Mining-Werkzeug
02ONLINE-THEMENSPECIAL PREDICTIVE & ADVANCED ANALYTICS
FACHARTIKEL
erwarten wäre [Baa16]. Dies bestätigt sich übrigens auch bei den
Werkzeuganforderungen, denn
1
Datenanalyse
63
52,5%
auch hier finden sich zwar diverse
2
Data-Mining-Projekte/Werkzeuge/Technologien
57
47,5%
Data-Mining-Tools und statistik3
Machine-Learning-Verfahren/Techniken
47
39,2%
orientierte Programmiersprachen,
4
Big-Data-Projekte/Lösungen/Technologien
46
38,3%
jedoch keine Simulations- oder
5
Algorithmen/Algorithmik
42
35,0%
Optimierungswerkzeuge
(zum
6
Business-Intelligence-Projekte/Lösungen/Technolo33
27,5%
Beispiel
Solver)
–
hierzu
gibt
es
gien
keine
einzige
Nennung
in
den
7
Statistische/mathematische Modelle entwickeln
31
25,8%
240 Stellenanzeigen!
8
Prozesse/Produkte/Systeme optimieren
25
20,8%
Des Weiteren ist eine hohe
9
Entscheidungsgrundlagen/Handlungsempfehlungen
24
20,0%
Nähe zu den Fachbereichen zu
10 Datenvisualisierung
21
17,5%
konstatieren, worauf die häufigen
Tab. 2: Die 10 am häufigsten genannten Aufgaben für Data-Scientist-Positionen
Nennungen der Anforderungen
„Kooperation mit den FachbeRapid Miner mit K-Means-Clusteranalysen (als partitionie- reichen“ und „Entwicklung von Entscheidungsgrundlagen
rende Clusteranalyse) untersucht.
und Handlungsempfehlungen“ hindeuten. Der DS/DA wird
Abbildung 2 zeigt die Verteilung der Branchen, in denen offenbar überwiegend nicht als reiner Entwickler von Systedie Stellenanzeigen geschaltet wurden. Überraschenderwei- men und Modellen gesehen, sondern vielmehr auch als ein
se sind diese ziemlich breit gestreut. Die Finanzbranche und Experte, der die Anwendung und Interpretation seiner Anader Handel sind zwar prominent vertreten, machen aber an- lysen mitverantwortet.
gesichts ihrer früheren Dominanz in den Bereichen BI und
Die gleichzeitige Bedeutung des Infrastrukturbezugs
Data Mining nur einen verhältnismäßig kleinen Anteil von und der Datenhaltung zeigt sich an der Forderung zur Über7 bzw. 10 Prozent aus. Immerhin 18 Prozent der 240 An- nahme von Aufgaben im Umfeld von Big-Data- und Busizeigen stammen aus dem produzierenden Gewerbe und hier ness-Intelligence-Umgebungen. Interessanterweise ist auch
wiederum aus so unterschiedlichen Sektoren wie der Auto- der Bereich des (Standard-)Reportings auf einer der vordemobilindustrie, der Modebranche, der Elektronikindustrie, ren Positionen zu finden. Insgesamt deuten diese Zahlen
der Medizintechnik, der Heiz- und Kühlsystem- oder auch darauf hin, dass der DS/DA tatsächlich den wechselseitigen
der Befestigungs- und Montagetechnik. Ähnlich heterogen Spagat zwischen Infrastruktur, anspruchsvoller Analytik
ist auch der unter „Dienstleistungen“ subsummierte Block. und Fachlichkeit beherrschen sollte.
Hier finden sich unter anderem Fernbusunternehmen, WerDie Ergebnisse bei einer Differenzierung zwischen den
beagenturen, Marktforscher, Übertragungsnetzanbieter oder DS- und den DA-Anzeigen verdeutlichen die Tabellen 2
Tourismusdienstleister. Der Bedarf für DS/DA ist somit und 3. Hierbei zeigt sich, dass trotz einer grundlegend ähnkeineswegs auf einzelne Sektoren konzentriert, was unter- lichen Ausrichtung sehr wohl markant unterschiedliche
streicht, wie tief die Digitalisierung die Wirtschaft bereits Schwerpunktsetzungen identifiziert werden können. So
durchdrungen hat.
nehmen beim DS „Machine-Learning“, „Algorithmik“ und
die „Entwicklung statistischer Modelle“ vordere Plätze ein.
Diese Stichworte schaffen es bei den DA-Stellenanzeigen
Vergleich der Aufgabenprofile
nicht einmal in die Top 10 der häufigsten Nennungen –
Tabelle 1 zeigt, welche Aufgabenbereiche am häufigsten ebenso wie der Bereich Big Data. Dafür dominieren beim
in den 240 Stellenanzeigen genannt wurden. Platz 1 wird DA klassische BI-Aufgaben, etwa im Umfeld des Ad-hocvon der generischen „Datenanalyse“ besetzt, was bestätigt, Reporting, Data Warehouse und Reporting. Insgesamt erdass der DS/DA tatsächlich nicht in der Datenbewirtschaf- scheint der DA eher als erweiterte BI-Position verstanden
tung und im Systembetrieb verortet wird. Des Weiteren manifesRang Aufgabentyp
Anzahl
in %
tiert sich der hohe Stellenwert des
(N=134)
Advanced-Analytics-Bereichs
1
Datenanalyse
77
57,5%
mit den häufigen Nennungen von
2
Reporting/(Standard-)Reports
56
41,8%
Data-Mining-bezogenen Aufga3
Kooperation mit Fachbereichen/Personen
40
29,9%
ben, Algorithmik und Machine
4
Prozesse/Produkte/Systeme optimieren
37
27,6%
Learning.
Interessanterweise
5
Entscheidungsgrundlagen/ Handlungsempfehlungen
30
22,4%
finden sich allerdings in keiner
6
Data-Mining-Projekte/Werkzeuge/Technologien
29
21,6%
einzigen der 240 Stellenanzeigen
7
Ad-hoc-Analysen
28
20,9%
die Stichworte „Mathematische
8
Business-Intelligence-Projekte/Lösungen/Technolo24
17,9%
Optimierung“ oder „Simulation“,
gien
obwohl gerade Letzteres ange9
Data Warehouse
21
15,7%
sichts der intensiven Diskussi10 Datenbank
19
14,2%
on von prädikativen Analysen
(Predictive Analytics) anders zu Tab. 3: Die 10 am häufigsten genannten Aufgaben für Data-Analyst-Positionen
Rang Aufgabentyp
Anzahl
(N=120)
in %
ONLINE -THEMENSPECIAL PREDICTIVE & ADVANCED ANALYTICS
03
FACHARTIKEL
zu werden: der DA als BI-Fachmann mit einer zusätzlichen
Qualifikation im Umfeld des Data Mining.
Diese Unterschiede werden auch durch die K-MeansClusteranalyse bestätigt: Weist man diese an, zwei Cluster
zu bilden, so kommt man zu zwei Profilen mit den in Tabelle
4 dargestellten Top-10-Aufgaben. Die Nähe von Cluster A
zum DS und diejenige von Cluster B zum DA springt unmittelbar ins Auge. Die Unterteilung in DS und DA korrespondiert somit tatsächlich mit zwei Aufgabenprofilen, die
sich auch ohne Berücksichtigung der Bezeichnungen aus
den geforderten Anforderungen ergibt.
Eine Unterteilung in weitere Clusterzahlen deutete auf
mögliche Sub-Schwerpunkte hin, etwa auf Big-Data-Anwendungen, auf Data Mining, auf Projektdurchführung und
Kommunikation oder auf bestimmte Anwendungsgebiete. Diese treten allerdings nicht so deutlich hervor wie die
grundlegende Unterscheidung in DS und DA.
Werkzeugkenntnisse
Die geforderten Werkzeuge bestätigen das Bild (vgl. Tabelle 5). Ein DS/DA muss sowohl datenbankorientierte als
auch Data-Mining-Software beherrschen. Letzteres umfasst
sowohl Open-Source-Umgebungen wie R als auch kommerzielle Data-Mining-Werkzeuge von SAS und IBM/SPSS.
Des Weiteren finden sich Big-Data-Technologien (Apache
Hadoop und Spark) sowie Programmiersprachen (Python,
Java) in den Top 10 der geforderten Werkzeugkenntnisse.
Auch hier lohnt sich eine Unterscheidung zwischen DS
und DA (vgl. Tabellen 6 und 7). Diese vervollständigen das
Bild des DA als BI-Experten – der neben R-, SQL- und PyBerufsbild A
1
2
3
4
5
6
7
8
9
10
Datenanalyse
Data-Mining-Projekte/Werkzeuge/Technologien
Machine-Learning-Verfahren/Techniken
Algorithmen/Algorithmik
Big-Data-Projekte/Lösungen/Technologien
Business-Intelligence-Projekte/Lösungen/Technologien
Statistische/mathematische Modelle entwickeln
Datenvisualisierung
Datenaufbereitung
Entscheidungsgrundlagen/Handlungsempfehlungen
Berufsbild B
1
2
3
4
5
6
7
8
9
10
Geforderte Werkzeug­
kenntnisse
1
2
3
4
5
6
7
8
9
10
SQL
R
Python
Microsoft Excel
SAS
IBM SPSS
Apache Hadoop
Microsoft Office
Java
Apache Spark
Anzahl
(N=240)
in %
110
99
63
59
59
50
48
42
29
27
45,8%
41,3%
26,3%
24,6%
24,6%
20,8%
20,0%
17,5%
12,1%
11,3%
Tab. 5: Geforderte Werkzeugkenntnisse bei DS/DA-Positionen
thon- auch über Office-Kenntnisse und Erfahrungen mit
Frontend-orientierten BI-Werkzeugen wie Tableau verfügen
sollte.
Diese Ergebnisse legen auch erste Rückschlüsse auf
die Werkzeugumgebungen für DS/DA-Rollen nahe. Diese
sollten gleichermaßen Möglichkeiten zum flexiblen Zugriff
auf „klassische“ BI- und Big-Data-Umgebungen mit erhalten (unter anderem mit SQL) als auch auf Data-MiningWerkzeuge, seien es nun benutzerfreundliche kommerzielle Tools oder die mit dynamisch wachsenden Bibliotheken
versehenen Entwicklungsumgebungen wie R. Des Weiteren
sind die häufigen Nennungen der Programmiersprachen
und Big-Data-Technologien Indikatoren für die Relevanz
der Modelloperationalisierung. Speziell der DA erscheint
auch auf eine Einbettung in etablierte Data-Warehouse- und
Reporting-Strukturen angewiesen und verantwortet stärker auch die Aufbereitung der
Ergebnisse für InformationsAnzahl
in %
konsumenten, insbesondere mit
(N=106)
Office-Anwendungen.
59
55,7%
51
47
46
46
31
29
23
21
20
48,1%
44,3%
43,4%
43,4%
29,2%
27,4%
21,7%
19,8%
18,9%
Anzahl
(N=134)
in %
74
62
41
38
33
32
28
25
24
20
55,2%
46,3%
30,6%
28,4%
24,6%
23,9%
20,9%
18,7%
17,9%
14,9%
Datenanalyse
Reporting/(Standard-)Reports
Prozesse/Produkte/Systeme optimieren
Kooperation mit Fachbereichen/Personen
Ad-hoc-Analysen
Entscheidungsgrundlagen / Handlungsempfehlungen
Data-Mining-Projekte/Werkzeuge/Technologien
Data Warehouse
Business-Intelligence-Projekte/Lösungen/Technologien
Datenbank
Tab. 4: Ergebnisse der Clusteranalyse mit zwei Clustern
04ONLINE-THEMENSPECIAL PREDICTIVE & ADVANCED ANALYTICS
Diskussion
Die vorgestellten Ergebnisse
bestätigen, dass in deutschen
Unternehmen ein Bedarf für
zwei neue Rollen DS und DA
besteht, die sich weder der bekannten Position eines DataMining- und Statistikexperten
noch derjenigen eines IT-orientierten BI-Entwicklers oder der
eines BI-Power-Users zuordnen lassen. Sowohl dem DS als
auch dem DA werden neben den
modellorientierten gleichzeitig
sowohl BI- wie auch Big-Databezogene Aufgaben zugeordnet,
wenngleich in unterschiedlich
ausgeprägtem Maße.
Sowohl beim DS als auch
(stärker) beim DA finden sich
darüber hinaus in mehreren
Stellenanzeigen teilweise spezifische fachliche Anforderungen.
FACHARTIKEL
Geforderte Werkzeug­
kenntnisse: Data Scientist
1
2
3
4
5
6
7
8
9
10
R
Python
SQL
Apache Hadoop
SAS
IBM SPSS
Java
Apache Spark
MapReduce
NoSQL
Anzahl
(N=120)
in %
73
47
44
38
34
26
22
22
20
14
60,8%
39,2%
36,7%
31,7%
28,3%
21,7%
18,3%
18,3%
16,7%
11,7%
Geforderte Werkzeug­
kenntnisse: Data Analyst
1
2
3
4
5
6
7
8
9
10
SQL
Microsoft Excel
Microsoft Office
R
IBM SPSS
SAS
Python
Tableau
Microsoft PowerPoint
Apache Hadoop
Anzahl
(N=134)
in %
70
54
42
32
28
27
21
13
13
12
52,2%
40,3%
31,3%
23,9%
20,9%
20,1%
15,7%
9,7%
9,7%
9,0%
Tab. 6: Geforderte Werkzeugkenntnisse für Data-Scientist-Positionen
Tab. 7: Geforderte Werkzeugkenntnisse für Data-Analyst-Positionen
So werden unter anderem explizit Kenntnisse zu Tracking& Tracing-Anwendungen, über Portfolioanalysen, zum Internet der Dinge oder für das Kampagnenmanagement verlangt. Interessanterweise sind mathematische Optimierung,
Simulation oder Process Mining nicht im Anforderungskatalog enthalten – eine mögliche Bedarfsverschiebung in diese Richtungen sollte aber angesichts der stärkeren Betonung
zukunftsorientierter Analysen beobachtet werden.
Aus den Ergebnissen ergibt sich weiterhin die Frage,
wie mit den Unterschieden zwischen DS und DA umgegangen werden kann. Hierbei ist der DA als der einfachere
Fall anzusehen, da er auf die Einbettung in ein existierendes
BI-Team ausgelegt erscheint und im Zweifel ein kommunikationsstarker BI-Entwickler durch gezielte Weiterbildungsmaßnahmen zu einem vom Team unterstützten DA
aufgewertet werden kann.
Schwieriger ist es beim DS, der offenbar stärker als der
DA auf die Umsetzung anspruchsvoller und von der klassischen BI unabhängiger Advanced-Analytics-Lösungen
ausgerichtet ist. Ob DS-Positionen mit entsprechend breit
gestreuten fachlichen, mathematischen und IT-orientierten
Voraussetzungen tatsächlich zufriedenstellend besetzt werden können, ist eine relevante Anschlussfrage. Sofern dies
die Ressourcen zulassen, kann gegebenenfalls über den
Aufbau von DS-Teams nachgedacht werden, wie dies bereits Patil 2011 angeregt hat [Pat11]. Alternativ ist auch die
Inanspruchnahme von Dienstleistungen spezialisierter Beratungen vorstellbar. Dass entsprechende Angebote im Aufbau sind, zeigt sich bereits an der großen Nachfrage nach DS
in diesem Sektor.
sche und organisatorische Konsequenzen. In: Controlling,
28. Jg. 2016, Nr. 3, S. 174–180
[Dav14] Davenport, T. H.: Big Data at Work: Dispelling the
Myths, Uncovering the Opportunities. Harvard Business
Review Press 2014
[FPS96] Fayyad, U. / Piatetsky-Shapiro, G. / Smyth, P.: From
Data Mining to Knowledge Discovery in Databases. In: AI
magazine, 17. Jg., Nr. 3 (1996), S. 37–54
[GTS10] Gansor, T. / Totok, A. / Stock, S.: Von der Strategie
zum Business Intelligence Competency Center (BICC) –
Konzeption, Betrieb, Praxis. TDWI 2010
[GaT15] Gansor, T. / Totok, A.: Von der Strategie zum Business Intelligence Competency Center (BICC) – Konzeption,
Betrieb, Praxis. 2. überarb. und aktual. Aufl., TDWI, dpunkt.
verlag 2015
[Hal14] Halper, F.: Predictive Analytics for Business Advantage. TDWI Best Practice Report, TDWI Research, First
Quarter 2014
[KBM10] Kemper, H. G. / Baars, H. / Mehanna, W.: Business
Intelligence – Grundlagen und praktische Anwendungen.
Wiesbaden 2010
[Na74] Naur, P.: Concise Survey of Computer Methods.
Petrocelli 1974
[Pat11] Patil, D. J.: Building Data Science Teams. O’Reilly
2011
[RUS11] Russom, P.: Big data analytics, TDWI Best Practices Report, Fourth Quarter 2011
[SAS15] SAS Institute: Der Data Scientist: Typen, Talente,
Trends. http://www.sas.com/de_de/whitepapers/ba-st-datascientist-dach-2015-2355232.html, 2015, abgerufen am
15.10.2016
[Vos15] Voss, A.: Die 5 Typen von Data Scientists. CIO
Magazin, Meldung vom 20.5.2015, http://www.cio.de/a/
die-5-typen-von-data-scientists,3108517, abgerufen am
15.10.2016
[ Literatur ]
[Baa16] Baars, H.: Predictive Analytics in der IT-basierten
Entscheidungsunterstützung – methodische, architektoni-
Benjamin Schmid,
Dipl.-Kfm. techn., hat dieses Jahr sein Diplomstudium der technisch orientierten Betriebswirt-
schaftslehre an der Universität Stuttgart abgeschlossen. Aktuell ist er Assistent der Geschäftsleitung bei der AS Steuerberatungsgesellschaft mbH. E-Mail: [email protected]
Dr. Henning Baars ist Akademischer Oberrat am Lehrstuhl für ABWL und Wirtschaftsinformatik 1 der Universität Stuttgart und Sprecher der Fachgruppe „Business Intelligence“ der Gesellschaft für Informatik. Aktuelle Forschungsthemen
sind „Agile Business Intelligence“, „BI und Big Data“, „BI in the Cloud“ sowie „BI und Analytics im Internet of Things“.
E-Mail: [email protected]
ONLINE -THEMENSPECIAL PREDICTIVE & ADVANCED ANALYTICS
05
Herunterladen