FACHARTIKEL Anforderungen an Data Scientists und Data Analysts – Ergebnisse einer Studie Programmierer oder Statistiker? Mit der zunehmenden Bedeutung anspruchsvollerer, modellorientierter Analysen in der Unternehmenspraxis sowie deren Einbettung in Big-Data- und Business-Intelligence-Umgebungen wachsen auch die Anforderungen an die Benutzer. Als neue Bezeichnungen für die entsprechenden Rollen setzen sich zunehmend die Begriffe „Data Analysts“ und „Data Scientists“ durch. Zunächst stellt sich die Frage, inwiefern hier tatsächlich neue Aufgabenprofile definiert werden und inwiefern sich diese von den althergebrachten Rollen unterscheiden. Zum Zweiten ist unklar, ob die beiden Begriffe synonym gesehen werden bzw. in welcher Hinsicht sie sich unterscheiden. Und drittens ist zu prüfen, welche Werkzeugkenntnisse konkret benötigt werden und damit auch, wie die Werkzeugumgebung für die beiden Rollen zu gestalten ist. Zur Beantwortung dieser Fragen wurden 240 Stellenanzeigen ausgewertet. alisten einzusetzen, weshalb hierfür in Rollenkonzepten für die BI auch „Statistiker“, „Mathematiker“ und/oder „DataMining-Experten“ vorgesehen waren (so zum Beispiel bei [GTS10]). Diese wurden jedoch als optionale Sonderrollen gesehen, auch weil entsprechende Anwendungen lange Zeit ein Nischendasein fristeten und lediglich in ausgewählten Branchen und Funktionsbereichen zum intensiven Einsatz kamen. Im Zuge der Big-Data-Diskussion hat die Praxis begonnen, dem Thema „Modellorientierte Systeme“ unter der neuen Überschrift „Advanced and Predictive Analytics“ wieder verstärkt Aufmerksamkeit zu widmen [RUS11]. Dies erscheint auch angebracht angesichts neuartiger und voluminöser Datenquellen etwa aus Sensornetzwerken oder Social Media, einem verbesserten Set an Methoden für die Datenanalyse sowie verbesserten Möglichkeiten, die entwickelten Modelle großflächig anzuwenden [Hal14]. Mit solchen Einsätzen gehen jedoch auch gänzlich neue Anforderungen an die Benutzer einher. Insbesondere gewinnen Systementwicklungs-, Datenbank- und Infrastrukturkenntnisse an Bedeutung, zum Beispiel um geeignete Daten aus einem Data Lake zu extrahieren oder ein entwickeltes Modell in einer Big-Data- oder Data-Warehouse-(DWH-)Um- Die Rollen des Data Scientist und des Data Analyst in der BI Die Erstellung, die Nutzung und die Pflege modellorientierter Systeme hatte seit jeher eine Sonderstellung im Kontext integrierter Ansätze für die Management- und Entscheidungsunterstützung (Business Intelligence, BI) [HGK10]. Anders als bei den in der BI bis heute dominierenden Reporting- und OLAP-Anwendungen setzt eine korrekte und effektive Anwendung modellorientierter Systeme umfangreiche methodenspezifische Vorkenntnisse voraus. Dies betrifft hauptsächlich die genutzten algorithmischen oder mathematisch-statistischen Simulations-, Optimierungsoder Data-Mining-Modelle. So erfordert ein erfolgreicher Einsatz des Data Mining unter anderem, dass die zu untersuchende fachliche Fragestellung präzise auf eine geeignete Methode abgebildet wird, dass aus den vorliegenden Daten sinnvolle Stichproben zur Modellbildung (Trainingsdaten) und zum Modelltest (Testdaten) gezogen und diese adäquat vorverarbeitet werden (Bereinigung um Ausreißer, Normalisierung usw.) sowie dass das Modell in einem iterativen Prozess erstellt und hinsichtlich seiner Güte evaluiert wird [FPS96]. Es liegt nahe, für diese Aufgaben geschulte Spezi150 80 100 60 40 50 20 0 0 Jan Feb Mrz Apr Mai Jun Jul Aug Sep Okt -­‐5 0 5 10 15 80 60 40 20 0 Fachliche Kenntnisse Problemanalyse, Ergebnisaufbereitung & -kommunikation Statistischmathematische Kenntnisse / Modellentwicklung Data Scien*st & Data Analyst als neue Rollen in der BI IT-Kenntnisse Modelloperationalisierung Abb. 1: Anforderungen an Data Scientist und Data Analyst Abbildun g 1 ONLINE -THEMENSPECIAL PREDICTIVE & ADVANCED ANALYTICS 01 FACHARTIKEL gebung zu „operationalisieren“, Rang Aufgabentyp Anzahl in % damit diese im Rahmen operativer (N=240) Prozesse oder im Reporting lau1 Datenanalyse 133 55,4% fend auf neue Daten angewendet 2 Data-Mining-Projekte/Werkzeuge/Technologien 79 32,9% werden können. Hinzu kommen 3 Reporting/(Standard-)Reports 69 28,8% erweiterte Anforderungen an die 4 Big-Data-Projekte/Lösungen/Technologien 61 25,4% Problemanalyse sowie an die Er5 Prozesse/Produkte/Systeme optimieren 59 24,6% gebnisaufbereitung und -kom6 Business-Intelligence-Projekte/Lösungen/Technolo55 22,9% munikation (insbesondere bei der gien Datenvisualisierung), was zu ei7 Kooperation mit Fachbereichen/Personen 54 22,5% ner stärkeren Relevanz fachlicher 8 Entscheidungsgrundlagen/Handlungsempfehlungen 52 21,7% Kenntnisse führt. 9 Algorithmen/Algorithmik 51 21,3% All diese Anforderungen wer10 Machine-Learning-Verfahren/Techniken 50 20,8% den in den Rollen „Data Scientist“ (DS) und „Data Analyst“ (DA) ge- Tab. 1: Die 10 am häufigsten genannten Aufgaben für DS/DA-Positionen bündelt. Ein DS/DA wird dabei als eine neue Kernrolle in einer BI-Organisation gesehen (zum Einige Autoren (zum Beispiel [Dav14] oder [Vos15]) Beispiel bei [GaT15]). Abbildung 1 visualisiert das Span- nutzen die Begriffe DS/DA lediglich als unscharfe Klamnungsfeld aus statistisch-mathematischen, IT-orientierten mer um eine Gruppe sehr unterschiedlicher Rollen, von und fachlichen Kenntnissen, dem ein DS/DA gerecht wer- denen die meisten aus der etablierten BI-Organisation beden soll. kannt sind. Die Ergebnisse einer Umfrage der SAS InstiEine Klärung, ob es sich bei den DS/DA tatsächlich um tute GmbH unter selbstdeklarierten DS scheint dieses Vereine neue Rolle handelt, ob es sich um zwei oder gar um ständnis zu untermauern. Demnach umfasst der DS jede nur mehr Rollen handelt und welche genauen Anforderungen denkbare datenorientierte Position vom Programmierer bis an einen DS/DA gestellt werden, ist nicht nur von Interesse zum Projektleiter [SAS15]. Es stellt sich die Frage, ob ein für die Aus- und Weiterbildung und das Recruiting, sondern so breit verstandener DS- oder auch DA-Begriff tatsächlich auch für die organisatorische Einbettung entsprechender Po- sinnvoll ist. sitionen in die BI-Organisation sowie für die Gestaltung von Eine Gemeinsamkeit findet sich bei all den Unterderen Arbeits- und Werkzeugumgebung. schieden und Unklarheiten dennoch in den diversen BeiDer Begriff „Data Scientist“ hat dabei ältere Wurzeln trägen: Die Notwendigkeit, eine Rolle DS/DA zu definieals der des „Data Analyst“: Bereits im Jahr 1974 definierte ren, resultiert aus dem Bedarf, bisher getrennte fachliche, Naur „Data Science“ als: „The science of dealing with data, IT-orientierte und mathematisch-statistische Fähigkeiten once they have been established, while the relation of the zusammenzubringen, um neuartige Advanced- und Predictidata to what they represent is delegated to other fields and ve-Analytics-Anwendungen zu gestalten. sciences“ [Nau74]. Patil führte die Begriffe „Data Scientist“ Damit werden auch die Abgrenzungen von anderen verund „Data-Scientist-Team“ ein und grenzte dabei den DS wandten Rollenprofilen plausibel, etwa von dem auf die Davon anderen Rollen ab [Pat11] – wobei allerdings speziell tenbewirtschaftung fokussierten „Data Engineer“, dem von die Unterscheidung zu einem DA nicht überzeugt. Tatsäch- der Anwendung her kommenden „Business Analyst“ oder lich differieren die diversen publizierten Definitionen des den auf Data-Warehouse- oder BI-Gesamtsysteme ausgeDA bestenfalls in Nuancen von denen des DS. richteten Data-Warehouse- oder BI-Analysten. Branchen (N=240) Finanzsektor 7% SoGwareunternehmen 10% Handel 10% Dienstleistungen (ohne Finanzsektor) 33% Produzierendes Gewerbe 18% Beratung 22% Abb. 2: Branchen der Unternehmen, die nach einem DS/DA suchen Auswertung von Stellenanzeigen zur Begriffsschärfung Um zu einer Klärung der Rollenbilder DS/DA zu kommen und die an diese gerichteten Anforderungen zu präzisieren, haben wir eine Analyse von Stellenanzeigen vorgenommen. Wir haben diesen Ansatz gewählt, da wir uns von ihm versprechen, dass er tendenziell die derzeit real benötigten Anforderungsprofile widerspiegelt. Insgesamt wurden hierfür aus fünf Jobportalen 1.867 Anzeigen extrahiert. Nach einer Filterung (unter anderem auf Anzeigen aus Deutschland) sowie einer Bereinigung von Dubletten verblieben 240 Anzeigen, davon 106 für einen DS, 120 für einen DA und 14, die DS/DA gemeinsam adressierten. Die Anzeigen wurden hinsichtlich der geforderten Aufgaben, allgemeiner Grundkenntnisse und erwarteter EDV-Fähigkeiten analysiert. Die Resultate wurden gruppiert und vercodet und sowohl summarisch zunächst in Excel und im Anschluss mit dem Data-Mining-Werkzeug 02ONLINE-THEMENSPECIAL PREDICTIVE & ADVANCED ANALYTICS FACHARTIKEL erwarten wäre [Baa16]. Dies bestätigt sich übrigens auch bei den Werkzeuganforderungen, denn 1 Datenanalyse 63 52,5% auch hier finden sich zwar diverse 2 Data-Mining-Projekte/Werkzeuge/Technologien 57 47,5% Data-Mining-Tools und statistik3 Machine-Learning-Verfahren/Techniken 47 39,2% orientierte Programmiersprachen, 4 Big-Data-Projekte/Lösungen/Technologien 46 38,3% jedoch keine Simulations- oder 5 Algorithmen/Algorithmik 42 35,0% Optimierungswerkzeuge (zum 6 Business-Intelligence-Projekte/Lösungen/Technolo33 27,5% Beispiel Solver) – hierzu gibt es gien keine einzige Nennung in den 7 Statistische/mathematische Modelle entwickeln 31 25,8% 240 Stellenanzeigen! 8 Prozesse/Produkte/Systeme optimieren 25 20,8% Des Weiteren ist eine hohe 9 Entscheidungsgrundlagen/Handlungsempfehlungen 24 20,0% Nähe zu den Fachbereichen zu 10 Datenvisualisierung 21 17,5% konstatieren, worauf die häufigen Tab. 2: Die 10 am häufigsten genannten Aufgaben für Data-Scientist-Positionen Nennungen der Anforderungen „Kooperation mit den FachbeRapid Miner mit K-Means-Clusteranalysen (als partitionie- reichen“ und „Entwicklung von Entscheidungsgrundlagen rende Clusteranalyse) untersucht. und Handlungsempfehlungen“ hindeuten. Der DS/DA wird Abbildung 2 zeigt die Verteilung der Branchen, in denen offenbar überwiegend nicht als reiner Entwickler von Systedie Stellenanzeigen geschaltet wurden. Überraschenderwei- men und Modellen gesehen, sondern vielmehr auch als ein se sind diese ziemlich breit gestreut. Die Finanzbranche und Experte, der die Anwendung und Interpretation seiner Anader Handel sind zwar prominent vertreten, machen aber an- lysen mitverantwortet. gesichts ihrer früheren Dominanz in den Bereichen BI und Die gleichzeitige Bedeutung des Infrastrukturbezugs Data Mining nur einen verhältnismäßig kleinen Anteil von und der Datenhaltung zeigt sich an der Forderung zur Über7 bzw. 10 Prozent aus. Immerhin 18 Prozent der 240 An- nahme von Aufgaben im Umfeld von Big-Data- und Busizeigen stammen aus dem produzierenden Gewerbe und hier ness-Intelligence-Umgebungen. Interessanterweise ist auch wiederum aus so unterschiedlichen Sektoren wie der Auto- der Bereich des (Standard-)Reportings auf einer der vordemobilindustrie, der Modebranche, der Elektronikindustrie, ren Positionen zu finden. Insgesamt deuten diese Zahlen der Medizintechnik, der Heiz- und Kühlsystem- oder auch darauf hin, dass der DS/DA tatsächlich den wechselseitigen der Befestigungs- und Montagetechnik. Ähnlich heterogen Spagat zwischen Infrastruktur, anspruchsvoller Analytik ist auch der unter „Dienstleistungen“ subsummierte Block. und Fachlichkeit beherrschen sollte. Hier finden sich unter anderem Fernbusunternehmen, WerDie Ergebnisse bei einer Differenzierung zwischen den beagenturen, Marktforscher, Übertragungsnetzanbieter oder DS- und den DA-Anzeigen verdeutlichen die Tabellen 2 Tourismusdienstleister. Der Bedarf für DS/DA ist somit und 3. Hierbei zeigt sich, dass trotz einer grundlegend ähnkeineswegs auf einzelne Sektoren konzentriert, was unter- lichen Ausrichtung sehr wohl markant unterschiedliche streicht, wie tief die Digitalisierung die Wirtschaft bereits Schwerpunktsetzungen identifiziert werden können. So durchdrungen hat. nehmen beim DS „Machine-Learning“, „Algorithmik“ und die „Entwicklung statistischer Modelle“ vordere Plätze ein. Diese Stichworte schaffen es bei den DA-Stellenanzeigen Vergleich der Aufgabenprofile nicht einmal in die Top 10 der häufigsten Nennungen – Tabelle 1 zeigt, welche Aufgabenbereiche am häufigsten ebenso wie der Bereich Big Data. Dafür dominieren beim in den 240 Stellenanzeigen genannt wurden. Platz 1 wird DA klassische BI-Aufgaben, etwa im Umfeld des Ad-hocvon der generischen „Datenanalyse“ besetzt, was bestätigt, Reporting, Data Warehouse und Reporting. Insgesamt erdass der DS/DA tatsächlich nicht in der Datenbewirtschaf- scheint der DA eher als erweiterte BI-Position verstanden tung und im Systembetrieb verortet wird. Des Weiteren manifesRang Aufgabentyp Anzahl in % tiert sich der hohe Stellenwert des (N=134) Advanced-Analytics-Bereichs 1 Datenanalyse 77 57,5% mit den häufigen Nennungen von 2 Reporting/(Standard-)Reports 56 41,8% Data-Mining-bezogenen Aufga3 Kooperation mit Fachbereichen/Personen 40 29,9% ben, Algorithmik und Machine 4 Prozesse/Produkte/Systeme optimieren 37 27,6% Learning. Interessanterweise 5 Entscheidungsgrundlagen/ Handlungsempfehlungen 30 22,4% finden sich allerdings in keiner 6 Data-Mining-Projekte/Werkzeuge/Technologien 29 21,6% einzigen der 240 Stellenanzeigen 7 Ad-hoc-Analysen 28 20,9% die Stichworte „Mathematische 8 Business-Intelligence-Projekte/Lösungen/Technolo24 17,9% Optimierung“ oder „Simulation“, gien obwohl gerade Letzteres ange9 Data Warehouse 21 15,7% sichts der intensiven Diskussi10 Datenbank 19 14,2% on von prädikativen Analysen (Predictive Analytics) anders zu Tab. 3: Die 10 am häufigsten genannten Aufgaben für Data-Analyst-Positionen Rang Aufgabentyp Anzahl (N=120) in % ONLINE -THEMENSPECIAL PREDICTIVE & ADVANCED ANALYTICS 03 FACHARTIKEL zu werden: der DA als BI-Fachmann mit einer zusätzlichen Qualifikation im Umfeld des Data Mining. Diese Unterschiede werden auch durch die K-MeansClusteranalyse bestätigt: Weist man diese an, zwei Cluster zu bilden, so kommt man zu zwei Profilen mit den in Tabelle 4 dargestellten Top-10-Aufgaben. Die Nähe von Cluster A zum DS und diejenige von Cluster B zum DA springt unmittelbar ins Auge. Die Unterteilung in DS und DA korrespondiert somit tatsächlich mit zwei Aufgabenprofilen, die sich auch ohne Berücksichtigung der Bezeichnungen aus den geforderten Anforderungen ergibt. Eine Unterteilung in weitere Clusterzahlen deutete auf mögliche Sub-Schwerpunkte hin, etwa auf Big-Data-Anwendungen, auf Data Mining, auf Projektdurchführung und Kommunikation oder auf bestimmte Anwendungsgebiete. Diese treten allerdings nicht so deutlich hervor wie die grundlegende Unterscheidung in DS und DA. Werkzeugkenntnisse Die geforderten Werkzeuge bestätigen das Bild (vgl. Tabelle 5). Ein DS/DA muss sowohl datenbankorientierte als auch Data-Mining-Software beherrschen. Letzteres umfasst sowohl Open-Source-Umgebungen wie R als auch kommerzielle Data-Mining-Werkzeuge von SAS und IBM/SPSS. Des Weiteren finden sich Big-Data-Technologien (Apache Hadoop und Spark) sowie Programmiersprachen (Python, Java) in den Top 10 der geforderten Werkzeugkenntnisse. Auch hier lohnt sich eine Unterscheidung zwischen DS und DA (vgl. Tabellen 6 und 7). Diese vervollständigen das Bild des DA als BI-Experten – der neben R-, SQL- und PyBerufsbild A 1 2 3 4 5 6 7 8 9 10 Datenanalyse Data-Mining-Projekte/Werkzeuge/Technologien Machine-Learning-Verfahren/Techniken Algorithmen/Algorithmik Big-Data-Projekte/Lösungen/Technologien Business-Intelligence-Projekte/Lösungen/Technologien Statistische/mathematische Modelle entwickeln Datenvisualisierung Datenaufbereitung Entscheidungsgrundlagen/Handlungsempfehlungen Berufsbild B 1 2 3 4 5 6 7 8 9 10 Geforderte Werkzeug­ kenntnisse 1 2 3 4 5 6 7 8 9 10 SQL R Python Microsoft Excel SAS IBM SPSS Apache Hadoop Microsoft Office Java Apache Spark Anzahl (N=240) in % 110 99 63 59 59 50 48 42 29 27 45,8% 41,3% 26,3% 24,6% 24,6% 20,8% 20,0% 17,5% 12,1% 11,3% Tab. 5: Geforderte Werkzeugkenntnisse bei DS/DA-Positionen thon- auch über Office-Kenntnisse und Erfahrungen mit Frontend-orientierten BI-Werkzeugen wie Tableau verfügen sollte. Diese Ergebnisse legen auch erste Rückschlüsse auf die Werkzeugumgebungen für DS/DA-Rollen nahe. Diese sollten gleichermaßen Möglichkeiten zum flexiblen Zugriff auf „klassische“ BI- und Big-Data-Umgebungen mit erhalten (unter anderem mit SQL) als auch auf Data-MiningWerkzeuge, seien es nun benutzerfreundliche kommerzielle Tools oder die mit dynamisch wachsenden Bibliotheken versehenen Entwicklungsumgebungen wie R. Des Weiteren sind die häufigen Nennungen der Programmiersprachen und Big-Data-Technologien Indikatoren für die Relevanz der Modelloperationalisierung. Speziell der DA erscheint auch auf eine Einbettung in etablierte Data-Warehouse- und Reporting-Strukturen angewiesen und verantwortet stärker auch die Aufbereitung der Ergebnisse für InformationsAnzahl in % konsumenten, insbesondere mit (N=106) Office-Anwendungen. 59 55,7% 51 47 46 46 31 29 23 21 20 48,1% 44,3% 43,4% 43,4% 29,2% 27,4% 21,7% 19,8% 18,9% Anzahl (N=134) in % 74 62 41 38 33 32 28 25 24 20 55,2% 46,3% 30,6% 28,4% 24,6% 23,9% 20,9% 18,7% 17,9% 14,9% Datenanalyse Reporting/(Standard-)Reports Prozesse/Produkte/Systeme optimieren Kooperation mit Fachbereichen/Personen Ad-hoc-Analysen Entscheidungsgrundlagen / Handlungsempfehlungen Data-Mining-Projekte/Werkzeuge/Technologien Data Warehouse Business-Intelligence-Projekte/Lösungen/Technologien Datenbank Tab. 4: Ergebnisse der Clusteranalyse mit zwei Clustern 04ONLINE-THEMENSPECIAL PREDICTIVE & ADVANCED ANALYTICS Diskussion Die vorgestellten Ergebnisse bestätigen, dass in deutschen Unternehmen ein Bedarf für zwei neue Rollen DS und DA besteht, die sich weder der bekannten Position eines DataMining- und Statistikexperten noch derjenigen eines IT-orientierten BI-Entwicklers oder der eines BI-Power-Users zuordnen lassen. Sowohl dem DS als auch dem DA werden neben den modellorientierten gleichzeitig sowohl BI- wie auch Big-Databezogene Aufgaben zugeordnet, wenngleich in unterschiedlich ausgeprägtem Maße. Sowohl beim DS als auch (stärker) beim DA finden sich darüber hinaus in mehreren Stellenanzeigen teilweise spezifische fachliche Anforderungen. FACHARTIKEL Geforderte Werkzeug­ kenntnisse: Data Scientist 1 2 3 4 5 6 7 8 9 10 R Python SQL Apache Hadoop SAS IBM SPSS Java Apache Spark MapReduce NoSQL Anzahl (N=120) in % 73 47 44 38 34 26 22 22 20 14 60,8% 39,2% 36,7% 31,7% 28,3% 21,7% 18,3% 18,3% 16,7% 11,7% Geforderte Werkzeug­ kenntnisse: Data Analyst 1 2 3 4 5 6 7 8 9 10 SQL Microsoft Excel Microsoft Office R IBM SPSS SAS Python Tableau Microsoft PowerPoint Apache Hadoop Anzahl (N=134) in % 70 54 42 32 28 27 21 13 13 12 52,2% 40,3% 31,3% 23,9% 20,9% 20,1% 15,7% 9,7% 9,7% 9,0% Tab. 6: Geforderte Werkzeugkenntnisse für Data-Scientist-Positionen Tab. 7: Geforderte Werkzeugkenntnisse für Data-Analyst-Positionen So werden unter anderem explizit Kenntnisse zu Tracking& Tracing-Anwendungen, über Portfolioanalysen, zum Internet der Dinge oder für das Kampagnenmanagement verlangt. Interessanterweise sind mathematische Optimierung, Simulation oder Process Mining nicht im Anforderungskatalog enthalten – eine mögliche Bedarfsverschiebung in diese Richtungen sollte aber angesichts der stärkeren Betonung zukunftsorientierter Analysen beobachtet werden. Aus den Ergebnissen ergibt sich weiterhin die Frage, wie mit den Unterschieden zwischen DS und DA umgegangen werden kann. Hierbei ist der DA als der einfachere Fall anzusehen, da er auf die Einbettung in ein existierendes BI-Team ausgelegt erscheint und im Zweifel ein kommunikationsstarker BI-Entwickler durch gezielte Weiterbildungsmaßnahmen zu einem vom Team unterstützten DA aufgewertet werden kann. Schwieriger ist es beim DS, der offenbar stärker als der DA auf die Umsetzung anspruchsvoller und von der klassischen BI unabhängiger Advanced-Analytics-Lösungen ausgerichtet ist. Ob DS-Positionen mit entsprechend breit gestreuten fachlichen, mathematischen und IT-orientierten Voraussetzungen tatsächlich zufriedenstellend besetzt werden können, ist eine relevante Anschlussfrage. Sofern dies die Ressourcen zulassen, kann gegebenenfalls über den Aufbau von DS-Teams nachgedacht werden, wie dies bereits Patil 2011 angeregt hat [Pat11]. Alternativ ist auch die Inanspruchnahme von Dienstleistungen spezialisierter Beratungen vorstellbar. Dass entsprechende Angebote im Aufbau sind, zeigt sich bereits an der großen Nachfrage nach DS in diesem Sektor. sche und organisatorische Konsequenzen. In: Controlling, 28. Jg. 2016, Nr. 3, S. 174–180 [Dav14] Davenport, T. H.: Big Data at Work: Dispelling the Myths, Uncovering the Opportunities. Harvard Business Review Press 2014 [FPS96] Fayyad, U. / Piatetsky-Shapiro, G. / Smyth, P.: From Data Mining to Knowledge Discovery in Databases. In: AI magazine, 17. Jg., Nr. 3 (1996), S. 37–54 [GTS10] Gansor, T. / Totok, A. / Stock, S.: Von der Strategie zum Business Intelligence Competency Center (BICC) – Konzeption, Betrieb, Praxis. TDWI 2010 [GaT15] Gansor, T. / Totok, A.: Von der Strategie zum Business Intelligence Competency Center (BICC) – Konzeption, Betrieb, Praxis. 2. überarb. und aktual. Aufl., TDWI, dpunkt. verlag 2015 [Hal14] Halper, F.: Predictive Analytics for Business Advantage. TDWI Best Practice Report, TDWI Research, First Quarter 2014 [KBM10] Kemper, H. G. / Baars, H. / Mehanna, W.: Business Intelligence – Grundlagen und praktische Anwendungen. Wiesbaden 2010 [Na74] Naur, P.: Concise Survey of Computer Methods. Petrocelli 1974 [Pat11] Patil, D. J.: Building Data Science Teams. O’Reilly 2011 [RUS11] Russom, P.: Big data analytics, TDWI Best Practices Report, Fourth Quarter 2011 [SAS15] SAS Institute: Der Data Scientist: Typen, Talente, Trends. http://www.sas.com/de_de/whitepapers/ba-st-datascientist-dach-2015-2355232.html, 2015, abgerufen am 15.10.2016 [Vos15] Voss, A.: Die 5 Typen von Data Scientists. CIO Magazin, Meldung vom 20.5.2015, http://www.cio.de/a/ die-5-typen-von-data-scientists,3108517, abgerufen am 15.10.2016 [ Literatur ] [Baa16] Baars, H.: Predictive Analytics in der IT-basierten Entscheidungsunterstützung – methodische, architektoni- Benjamin Schmid, Dipl.-Kfm. techn., hat dieses Jahr sein Diplomstudium der technisch orientierten Betriebswirt- schaftslehre an der Universität Stuttgart abgeschlossen. Aktuell ist er Assistent der Geschäftsleitung bei der AS Steuerberatungsgesellschaft mbH. E-Mail: [email protected] Dr. Henning Baars ist Akademischer Oberrat am Lehrstuhl für ABWL und Wirtschaftsinformatik 1 der Universität Stuttgart und Sprecher der Fachgruppe „Business Intelligence“ der Gesellschaft für Informatik. Aktuelle Forschungsthemen sind „Agile Business Intelligence“, „BI und Big Data“, „BI in the Cloud“ sowie „BI und Analytics im Internet of Things“. E-Mail: [email protected] ONLINE -THEMENSPECIAL PREDICTIVE & ADVANCED ANALYTICS 05