Marktüberblick_Big_Data_Software_Lösungen Hochschule: Standort: Studiengang: Veranstaltung: Betreuer: Typ: Themengebiet: Autor(en): Studienzeitmodell: Semesterbezeichnung: Studiensemester: Bearbeitungsstatus: Prüfungstermin: Abgabetermin: Fallstudienarbeit Hochschule für Oekonomie & Management Essen Bachelor Wirtschaftsinformatik Fallstudie / Wissenschaftliches Arbeiten Prof._Dr._Uwe_Kern Fallstudienarbeit Big Data Irfan Yilmaz, Matthias Reza, Muhammed Yüksekyuva, Ivans Ivanovs Abendstudium SS15 2 Bearbeitung abgeschlossen 30.6.2015 21.6.2015 Inhaltsverzeichnis • 1 Einleitung ♦ 1.1 Einführung in die Thematik ♦ 1.2 Zielsetzung der Arbeit ♦ 1.3 Methodischer Aufbau • 2 Grundlagen Big Data ♦ 2.1 Definition ♦ 2.2 Entstehung ♦ 2.3 Nutzen und Einsatz • 3 Technische Voraussetzungen ♦ 3.1 Apache Hadoop - Ermöglichung von Big Data ♦ 3.2 Hadoop und NoSQL-Datenbanken • 4 Marktüberblick Big Data-Softwarelösungen ♦ 4.1 Marktanalyse ◊ 4.1.1 Vorwort ◊ 4.1.2 Weltmarkt Big Data ◊ 4.1.3 Big Data in Deutschland ◊ 4.1.4 Anbieter im Vergleich für eine Big Data Softwarelösung ◊ 4.1.5 Ausblick Big Data ♦ 4.2 Evaluierung der Big Data-Lösungen ♦ 4.3 Kosteneinschätzung ♦ 4.4 Big Data-Lösungen ausgewählter Anbieter ◊ 4.4.1 IBM ⋅ 4.4.1.1 Big Data Lösung IBM ⋅ 4.4.1.2 Hadoop-System ⋅ 4.4.1.3 IBM BigInsights for Apache Hadoop ⋅ 4.4.1.4 IBM InfoSphere Big Match for Hadoop Inhaltsverzeichnis 1 Marktüberblick_Big_Data_Software_Lösungen ⋅ 4.4.1.5 IBM BigInsights on Cloud ⋅ 4.4.1.6 Stream-Computing ⋅ 4.4.1.7 Weltweiter Abruf der Daten ◊ 4.4.2 Oracle ⋅ 4.4.2.1 Big Data Management • 4.4.2.1.1 Oracle Database 12c • 4.4.2.1.2 Oracle Big Data SQL • 4.4.2.1.3 Oracle NoSQL Database • 4.4.2.1.4 Oracle Big Data Connectors ⋅ 4.4.2.2 Big Data Analytics • 4.4.2.2.1 Oracle Big Data Discovery • 4.4.2.2.2 Oracle Advanced Analytics • 4.4.2.2.3 Oracle Big Data Spatial and Graph ⋅ 4.4.2.3 Big Data Integration • 4.4.2.3.1 Oracle GoldenGate for Big Data • 4.4.2.3.2 Oracle Enterprise Metadata Management ⋅ 4.4.2.4 Big Data Applications • 4.4.2.4.1 Oracle BlueKai Cloud • 4.4.2.4.2 Oracle Talent Management Cloud ◊ 4.4.3 SAP ⋅ 4.4.3.1 Big Data Lösung SAP ⋅ 4.4.3.2 SAP HANA und Apache Hadoop ⋅ 4.4.3.3 SAP-Big Data Portfolio ⋅ 4.4.3.4 SAP Predictive Analysis ⋅ 4.4.3.5 SAP Event Stream Processor (SAP ESP) ⋅ 4.4.3.6 SAP Data Services ⋅ 4.4.3.7 SAP Customer Engagement Intelligence ⋅ 4.4.3.8 SAP Fraud Management ⋅ 4.4.3.9 SAP Demand Signal Management Inhaltsverzeichnis 2 Marktüberblick_Big_Data_Software_Lösungen ⋅ 4.4.3.10 SAP Operational Equipment Effectiveness ◊ 4.4.4 Microsoft ⋅ 4.4.4.1 Big Data Lösung Microsoft ⋅ 4.4.4.2 Windows Azure ⋅ 4.4.4.3 HDInsight ⋅ 4.4.4.4 Power BI ◊ 4.4.5 Tableau • 5 Schlussbetrachtung ♦ 5.1 Zusammenfassung ♦ 5.2 Ausblick • 6 Anhang ♦ 6.1 Fußnoten ♦ 6.2 Quellenverzeichnis ♦ 6.3 Abbildungsverzeichnis ♦ 6.4 Tabellenverzeichnis ♦ 6.5 Abkürzungsverzeichnis 1 Einleitung 1.1 Einführung in die Thematik Aufgrund der Digitalisierung und den nahezu im Sekundentakt produzierten Daten, war es den Unternehmen und sonstigen Organisationen, die diese Daten zur Analyse und Auswertung nutzen, nicht mehr möglich mit den vorhandenen Technologien weiterhin zu arbeiten. Vorallem die Mobile Devices wie die Smartphones, Tablet PCs und auch die neuen Smartwatches sind der Grund für diese Datenflut. Damit die Analyse der Datenmengen wieder möglich wird, mussten neue Technologien her, die mit diesen Datenbergen umgehen konnten. Somit entstanden die Big Data Software Lösungen, die zur Analyse und Auswertung großer Datenmengen dienen. Im folgenden werden diese Software Lösungen thematisiert und ein Überblick der Big Data Lösungen unterschiedlicher Anbieter gegeben. 1.2 Zielsetzung der Arbeit Ziel dieser Fallstudie ist es, einen Überblick über die aktuellen Big Data Software Lösungen ausgewählter Anbieter zu verschaffen. Darüberhinaus wird eine Marktanalyse zum Thema Big Data Software Lösungen durchgeführt und die wichtigsten Aspekte der jeweiligen Lösungen beschrieben. Außerdem werden die unterschiedlichen Anwendungsmöglichkeiten auf diverse Tätigkeitsfelder untersucht. 1.3 Methodischer Aufbau Vorerst wird das Thema Big Data im ersten Kapitel eingeleitet, gefolgt von den Grundlagen, um den Leser in die Thematik einzuführen. 1 Einleitung 3 Marktüberblick_Big_Data_Software_Lösungen Im dritten Kapitel werden die technischen Voraussetungen und die Anforderungen an die IT-Infrastruktur behandelt. Außerdem werden auf die Themen Apache Hadoop und NoSQL Datenbanken näher eingegangen. Im vierten Kapitel wird eine Marktanalyse zu den BIg Data Software Lösungen durchgeführt, um die aktuellen Kennzahlen und das Potenzial von Big Data zu veranschaulichen. Dabei wird auch speziell auf den deutschen Markt eingegangen. Folglich wird ein Vergleich diverser Anbieter für Big Data Software Lösungen durchgeführt, um dem Leser einen Überblick über die Marktführer in diesem Bereich zu verschaffen. 2 Grundlagen Big Data 2.1 Definition Laut dem Autor Edd Dumbill, vom O'Reilly Verlag, versteht man unter dem Begriff Big Data eine große Datenmenge, die die Kapazität von konventionellen Datenbanksystemen überschreitet.[1] In der Praxis wird der Begriff Big Data nicht nur für große Datenmengen verwendet, sondern auch für das Verfahren, die zur Analyse dieser Datenmengen dient. Somit kann mit dem Begriff Big Data sowohl die Datenmenge, als auch das Verfahren oder das System gemeint sein, mit der die Daten analysiert und ausgewertet werden. Der Autor Steve Lohr von den New York Times definiert Big Data als ?ein Marketing-Instrument, die die Tür zu einem neuen Ansatz zum verstehen der Welt und dem treffen von Entscheidungen öffnet?.[2] Die Big Data Technologie ?basiert nicht auf einer singulären Technologie?, sie ?ist vielmehr das Resultat des Zusammenwirkens einer ganzen Reihe von Innovationen? und Technologien.[3] Somit gibt es nicht die eine Big Data Technologie, die für die Analyse der großen Datenmengen genutzt werden kann. Unterschiedliche technologische Komponenten ermöglichen dies erst in Kombination miteinander. Wie es in einer Publikation der Bitkom beschrieben wird, besteht Big Data aus vier unterschiedlichen Aspekten, welche in Kombination Big Data ausmachen: 1. Volume (Datenmenge): ?Immer mehr Organisationen und Unternehmen verfügen über gigantische Datenberge, die von einigen Terabyte bis hin zu Größenordnungen von Petabyte führen.?[3] 2. Variety (Datenvielfalt): ?Aus immer mehr Quellen liegen Daten unterschiedlicher Art vor, die sich grob in unstrukturierte, semistrukturierte und strukturierte Daten gruppieren lassen. [...] Die Unternehmen werden zunehmend durch externe Daten ergänzt, beispielsweise aus sozialen Netzwerken.?[3] 3. Velocity (Geschwindigkeit): ?Riesige Datenmengen müssen immer schneller ausgewertet werden, nicht selten in Echtzeit. Die Verarbeitungsgeschwindigkeit hat mit dem Datenwachstum Schritt zu halten.?[3] 4. Analytics: ?Analytics umfasst die Methoden zur möglichst automatisierten Erkennung und Nutzung von Mustern, Zusammenhängen und Bedeutungen.? Dazu kommen unterschiedliche Analysemethoden wie ?u.a. statische Verfahren, Vorhersagemodelle? oder ?Optimierungsalgorithmen? zum Einsatz.[3] 1.3 Methodischer Aufbau 4 Marktüberblick_Big_Data_Software_Lösungen 2.2 Entstehung Aufgrund der immer voranschreitenden technologischen Entwicklungen und der Digitalisierung, haben Unternehmen und Organisationen immer mehr Möglichkeiten, unterschiedliche Daten für ihre Vorteile durch analytische Verfahren, zu sammeln. Somit stieg die Menge der angesammelten Daten in den letzten Jahren rasant an. Laut Andrew McAfee and Erik Brynjolfsson wurden ab dem Jahr 2012, jeden Tag, etwa 2,5 Exabytes an Daten produziert (Stand 2012) und diese Zahl verdoppelt sich alle 40 Monate.[4] Diese Datenmenge wurde irgendwann zu groß, um von den konventionellen Datenbanksystemen ausgewertet zu werden.[1] Ein weiteres Problem bei den gesammelten Datenbergen war es, dass diese sehr unterschiedlich und vielfältig waren. Ein einheitliches Datenformat gab es nicht, da Daten aus ?immer mehr Quellen [...] unterschiedlicher Art? vorlagen.[3] Diese unterschiedlichen Datenformate konnten von einem einzigen Datenbanksytsem nicht ausgewertet werden, vorallem die Datenmenge ließ die Datenbanksysteme schnell an ihre Grenzen stoßen. Die Lösung für diese Probleme, die mit der enorm wachsenden Datenbergen entstanden, bot das ?Open-Source-Framework zur Parallelen Datenverarbeitung auf sehr skalierenden Server-Clustern? Apache Hadoop.[5] Mit der Veröffentlichung von Hadoop, wurde es in ?nahezu Echtzeit, durch verschiedenste Analyseverfahren? möglich, diese permanent wachsenden Datenberge zu analysieren und für die eigenen Vorteile auszuwerten.[5] Nachdem das Potenzial von Apache Hadoop erkannt wurde, haben viele Unternehmen eigene Big Data Lösung in ihre Datenbanksysteme integriert, die auf das Hadoop Framework basieren. Somit wird Hadoop und die Big Data Lösungen der einzelnen Anbieter permanent weiterentwickelt und verbessert. Es gibt laut einer Publikation des Frauenhofer-Institutes auch immer mehr kleine und mittlere Unternhemen (KMU), die auf Big Data Verfahren setzen und dessen Potenzial erkannt haben.[6] Somit sind nicht nur die großen Unternhemen wie beispielsweise Global Player von Big Data betroffen, sondern auch KMUs die mit ständig wachsenden Datenbergen zu tun haben und diese für ihre Vorteile ausnutzen können. Außerdem entwickeln die KMUs zum Teil auch ihre eigenen Lösungen für ihre Big Data Probleme und bieten diese auch zur Nutzung anderen Unternehmen an. Somit entstehen permanent Big Data Software Lösungen, die sich zum Teil sehr voneinander unterscheiden. 2.3 Nutzen und Einsatz Big Data Verfahren dienen zur Analyse und Auswertung von sehr großen Datenmengen mit unterschiedlichen Datenformaten. Laut Andrew McAfee und Erik Brynjolfsson, bietet Big Data den Unternehmen und Organisationen die Möglichkeit mit vielen Petabytes von Daten, in einem einzigen Datenbanksystem, zu arbeiten.[4] Dies eröffnet Unternehmen und Organisationen viele neue Wege, die gesammelten Datenmengen für ihre Vorteile zu nutzen und auszuwerten. Wie man auch auf der folgenden Abbildung sehen kann, werden die Datenberge voraussichtlich immer wachsen, wobei nur ein Teil dieser Daten von Nutzen ist. Der Großteil dieser Daten sind nicht von Relevanz und genau diese Daten werden mit dem Big Data Verfahren aussortiert, so das nur die wichtigen Daten betrachtet werden. 2.2 Entstehung 5 Marktüberblick_Big_Data_Software_Lösungen Abb.1 Opportunity for Big Data[7] Beispielsweise werden Big Data Verfahren für Marketing-Zwecke oder auch in der Medizin und anderen vielen Bereichen immer vermehrt eingesetzt. Big Data kann in nahezu allen Branchen von Nutzen sein und viele Vorteile und neue Möglichkeiten bieten. Laut einer Publikation der Bitkom, werden in naher Zukunft die Unternehmen vermehrt Big Data Verfahren einsetzen, um ihre Entscheidungsprozesse oder Geschäftsprozesse zu unterstützen.[8] Dadurch würden sich die Unternehmen Vorteile gegenüber anderen Marktteilnehmern verschaffen und somit ihre Chancen erhöhen, eine bessere Position auf dem Markt zu erreichen. Dies könnte beispielsweise mit den Vorhersagen durch Predictive Analysis geschehen, wodurch die Unternehmen mögliche Änderungen am Markt früher erkennen und sich dementsprechend vorbereiten würden. 3 Technische Voraussetzungen 3.1 Apache Hadoop - Ermöglichung von Big Data Hadoop - ist ein Projekt von Apache Software Foundation, das die Open-Source Dienstprogramme, Programmbibliotheken und Framework für die Entwicklung und Ausführung verteilter Programme verbreitet, welche auf den Clustern von hunderten und tausenden Knoten arbeiten. Hadoop wird für die Realisierung von Such- und Kontextmechanismen von vielen hochbelasteten Websiten, wie z. B. Yahoo oder Facebook, benutzt. Hadoop wurde auf MapReduce-Algorithmus von Google Inc. entwickelt. Die Anwendung wird auf große Menge gleichartiger elementaren Aufgaben unterteilt, die auf Cluster Knoten ausgeführt werden und zum einen Endergebnis führt. Nach dem Stand von April 2015 das Projekt besteht aus vier Modulen - Hadoop Common (Middleware - eine Sammlung infrastruktueller Programmbibliotheken und Dienstprogrammen, die für andere Module und verwandte Projekte verwendet werden), HDFS (Hadoop Distributed File System - Dateisystem, das zur Speicherung der großen Datenmengen mehrer Knoten dient), YARN (ein System zur Aufgabenplanung und Clusterverwaltung) und Hadoop MapReduce (eine Plattform, die der Programmierung und Ausführung verteilter 2.3 Nutzen und Einsatz 6 Marktüberblick_Big_Data_Software_Lösungen MapReduce-Berechnungen dient). Früher gab es eine Reihe von Projekten, die später zu den eigenständigen Projekten im Rahmen des Apache Software Foundation Systems geworden sind). Hadoop zählt zu den grundlegenden Big Data Technologien. Um Hadoop herum, ist ein Ecosystem von verbundenen Projekten und Technologien entstanden. Die meisten von den haben sich zu eigenständigen Projekten entwickelt. Seit 2005 gibt es einen aktiven Prozess der Kommerzialisation von Technologien. Die Geschäfte mehrerer Unternehmen werden auf die Entwicklung kommerzieler Hadoop-Distributionen und Dienstleistungen zur technischen Unterstützung des Ecosystems. Praktisch alle große Lieferanten der Informationstechnologien schließen Hadoop in seine Produktstrategien und Paletten von Lösungen. [9] 3.2 Hadoop und NoSQL-Datenbanken Hadoop und NoSQL-Datenbanken HBase - ist eine nicht relationale, verteilte mit Java geschriebene Open-Source Datenbank. Hbase ist ein Analog zu dem Google BigTable und wurde im Rahmen eines Hadoop-Projekts von Apache Software Foundation entwickelt. Es basiert auf HDFS und bietet damit BigTable ähnliche Möglichkeiten für Hadoop. Diese Datenbank ist für die häufig eränzende Daten geeignet. [10] 4 Marktüberblick Big Data-Softwarelösungen 4.1 Marktanalyse 4.1.1 Vorwort Die Marktanalyse zum Thema Big Data Softwarelösungen wird sich auf verschiedene Aspekte beziehen. Zum einen wird die derzeitige Marktbeschaffenheit dargestellt und zum anderen auch ein kleiner Blick in die Zukunft geworfen, wie die Entwicklung weitergehen könnte. Der Markt wird beleuchtet hinsichtlich der derzeitigen Verbreitung auf dem Weltmarkt so wie in Deutschland. Hierfür findet sich auch eine Gegenüberstellung in Form von Zahlen und Diagrammen im weiteren Verlauf. Des Weiteren werden Anbieter genannt, die diese Software vertreiben sowie welcher dieser Marktführerschaft besitzt. Welche Ziele sollte es für ein Unternehmen geben Big Data einzuführen oder überhaupt zu nutzen? Um eine möglichst genaue und aussagekräftige Marktanalyse zu erstellen, muss erst einmal definiert werden, welche Zielsetzung mit Big Data erreicht werden soll und kann. Die Einführung einer Big Data Softwarelösung ist eine strategische Entscheidung eines Unternehmens mit dem Ziel ?sich zu einem Analytical Competitor zu entwickeln.?[11] Hiermit ist die Fähigkeit gemeint ?durch Datenanalysen Wettbewerbsvorteile zu erzeugen.?[11] Allerdings muss das, bezogen auf die Unternehmen, auch noch differenziert betrachtet werden. Für ein Unternehmen, das seine Ausrichtung nur auf die Verarbeitung und Analyse von Daten legt ist dieses Ziel natürlich von größerer Bedeutung als es bei anderen der Fall ist. Nachdem Unternehmen sich zu einem Analytical Competitor entwickelt haben gibt es auf diesem Niveau noch eine weitere Verbesserung, die dazu beiträgt einen Wettbewerbsvorteil zu erzielen. Dieser Aspekt wird ?Informationsvorherrschaft?[12] genannt. Informationsvorherrschaft bedeutet, dass ?[..ein] Unternehmen [..] in der Öffentlichkeit als zuverlässiger Lieferant qualitätsgesicherter Analysen zur Unterstützung von Entscheidungsprozessen wahrgenommen wird.?[13] Um diese Aussage zu erläutern kann folgendes Beispiel gewählt werden: ?Eine Abteilung eines Unternehmens wird im Unternehmen als zuverlässiger Lieferant 3.1 Apache Hadoop - Ermöglichung von Big Data 7 Marktüberblick_Big_Data_Software_Lösungen qualitätsgesicherter Analysen zur Unterstützung von Entscheidungsprozessen wahrgenommen.?[13] 4.1.2 Weltmarkt Big Data Big Data hat auf der gesamten Welt in den letzten Jahren enorm an Bedeutung gewonnen. ?Der globale Umsatz mit Big Data- Produkten und -Dienstleistungen [...stieg] im Jahr 2014 auf rund 73,5 Milliarden Euro, ein Plus von 66 Prozent zum Vergleich im Vorjahr."[14] Dabei kann Big Data noch in verschiedene Teilbereiche eingeordnet werden. Diese sind datenbasierte Produkte und Analytics Services, Big Data IT und Sensoren und Maschinen. Der größte dieser drei genannten Bereiche umfasst die datenbasierten Produkte und Analytics Services. Dieser hat ?im Jahr 2014 um 64 Prozent auf weltweit 63,4 Milliarden Euro"[14] zugelegt. Dazu zählen beispielsweise ?intelligente Gebäudesteuerungen, Optimierungssysteme im Handel oder Endkundendienste in den Bereichen Lifestyle, Fitness und Gesundheit."[14] Der zweite Teilbereich Big Data IT stieg im vergangen Jahr ?um 69 Prozent auf 2,6 Milliarden Euro Umsatz"[14] und beinhaltet ?die IT-Hardware, Software und IT-Services."[14] Von den Anwendungsfeldern im Vergleich zu den ersten beiden fällt der letzte Bereich Sensoren und Maschinen klein aus. Dieser liegt aber mit einem Umsatz von 7,6 Milliarden Euro und einem Wachstum von 72 Prozent deutlich vor dem Bereich Big Data IT. Unter diesen Bereich fallen Geräte, Maschinen und Fahrzeuge, die mit dem Internet verbunden werden sollen. Diese Zahlen belegen jedoch nur den Beginn des rasanten Anstiegs von Big Data. Der Weltmarkt von Big Data soll laut mehrfachen Marktprognosen ?bis 2016 um jährlich durchschnittlich 46 Prozent"[14] steigen. Durch diesen weiteren Anstieg hätte sich der Markt ?innerhalb von fünf Jahren von 23,6 Milliarden Euro (2011) auf 160,6 Milliarden Euro (2016) nahezu [...verachtfacht]."[14] Der Grund für die weitere Zunahme liegt in der Annahme, dass Smartphones, Tablets und die sozialen Netzwerke stärker genutzt werden als noch in den Vorjahren. 4.1.3 Big Data in Deutschland Der rasante Aufstieg von Big Data auf der Welt hat auch Auswirkungen auf den Markt in Deutschland. Auch hier ist in den letzten Jahren ein Anstieg zu verzeichnen. Insgesamt stieg der Umsatz mit Big Data ?um 59 Prozent auf 6,1 Milliarden Euro."[15] Laut eines Marktforschungsinstitut soll sich der Umsatz der Big Data-Lösungen bis zum Jahr 2016 auf 13,6 Milliarden Euro nochmals verdoppeln. Die folgende Abbildung soll noch einmal die Entwicklung von Big Data in Deutschland verdeutlichen. 4.1.1 Vorwort 8 Marktüberblick_Big_Data_Software_Lösungen Abb.2 Großes Wachstum bei Big Data[15] Trotz des großen Anstiegs seit 2012 hat Big Data immer noch weniger Bedeutung als beispielsweise in den USA. Der Grund dafür liegt darin, dass viele Unternehmen Big Data keine hohen Geschäftschancen zutrauen. Dieses geht aus einer Studie der Capgemini und EMC hervor die 1.000 Unternehmen zu dieser Thematik befragt haben. Desweitern geht aus dieser hervor, dass ?nur 58 Prozent der Befragten aus Deutschland berichten, dass sie Big Data-Technologien implementiert haben.?[16] Ein weiteres Problem, dass die Einführung und Nutzung von Big Data-Technologien verhindert ist, dass der Anstoß seitens der IT erfolgt und nicht von der Geschäftsführung ausgeht. Dadurch verliert diese Strategie an Bedeutung. Laut dem Leiter Insights & Data bei Capgemini ?laufen die [..Unternehmen] Gefahr [?] ihre Wettbewerbsfähigkeit einzubüßen?[16], wenn die Möglichkeiten, die eine Big-Data-Infrastruktur bietet, nicht genutzt werden. Ein weiterer Grund für die stockende Nutzung dieser Technologien wird auch häufig in der IT gesucht. Der langsame IT-Entwicklungsprozess in Unternehmen verhindert meistens eine Einführung, da es an qualifizierten Mitarbeitern oder an der veralteten IT-Infrastruktur scheitert. Hier hat der Privotal Chief Executive Officer, der EMC Corporation, an die Unternehmen folgendes gerichtet: ?Unternehmen müssen verstehen, dass es nicht nur darauf ankommt, Daten aus verschiedenen Quellen zu verarbeiten, auszuwerten und schnell darauf zu reagieren, sondern ihr gesamtes Handeln an ihren gewonnen Erkenntnissen auszurichten. Deswegen müssen sie schnellstens in qualifizierte Mitarbeiter, Kompetenzen, Tools und moderne Plattformen investieren.?[16] 4.1.4 Anbieter im Vergleich für eine Big Data Softwarelösung Gestützt auf einer Studie von Experton, die die Anbieter auf diesem Markt vergleichen, werden auch die Softwarelösungen, die später näher gebracht werden, Beachtung finden. Der Hauptaugenmerk wird auch deswegen auf die ausgewählten Anbieter liegen. Die Mercedes unter den Big Data Softwarelösungen sind die Hersteller IBM, Microsoft und SAP. Allerdings dürfen sich diese Unternehmen keinesfalls auf ihre Marktführerschaft ausruhen. Andere drängen nämlich auch an die Spitze, wie der Anbieter Exasol, Data Watch und Neo Technology. Wobei IBM eine noch höhere Stellung zukommt. IBM punktet durch seine zahlreichen Kontakte und Akquisitionen im BI- und BA-Bereich, sowie durch 4.1.3 Big Data in Deutschland 9 Marktüberblick_Big_Data_Software_Lösungen das technische hohe Niveau seiner Lösung und durch hohe Kompetenzen im Beratungsumfeld. In der folgenden Grafik werden die Anbieter von der Experton Group in vier verschiedene Kategorien eingeteilt. Diese sind Product Challenger, Leader,Follower und Market Challenger. Alle Anbieter, die hier eingeordnet wurden, sind einem Benchmark unterzogen. Da sich Big Data in viele verschieden Teilsegmente einordnen und analysieren lässt, haben wir im Folgenden eine Auswertung aus dem Bereich der BA-Lösungen exemplarisch für die Einordnung der vier ausgewählten Anbieter ausgewählt. Abb.3 Big Data Vendor Benchmark 2015 [17] Hier auch noch verdeutlicht, dass die später vorgestellten Lösungen von IBM, Microsoft und SAP zu den Marktführern gehören. Es ist davon auszugehen, dass in den anderen Segmenten von Big Data diese Anbieter hier anzusiedeln sind. im Vergleich 4.1.5 Ausblick Big Data Basierend auf der Marktanalyse wird sich Big Data weiter entwickeln und enorm an Bedeutung gewinnen. Die Prognosen die genannt wurden belegen das schon. Die Entwicklung ist noch nicht zu Ende. Auch in Deutschland werden die Unternehmen nach und nach auf diesen Zug aufspringen, wenn sie erkannt haben, wie gewinnbringend eine solche Lösung sein kann. Gerade auch angesichts der Datenflut, die durch Smartphones, Tablets oder andere technische Entwicklungen, die Daten produzieren, entstehen, wird die Verwaltung oder die Analyse dieser Daten nur mit einer Big Data Softwarelösung zu realisieren sein. 4.2 Evaluierung der Big Data-Lösungen Im Rahmen der Evaluierung ist es das Ziel, eine Big Data Lösung auszuwählen, die den Anforderungen der Unternehmen gerecht wird. Hierfür können auf dem Markt verfügbare und in Frage kommende Lösungen beispielsweise in einer Nutzwertanalyse gegenübergestellt werden. Für diese müssen aber zuerst Kriterien erstellt werden, welche die Big Data Lösung erfüllen muss. Diese erstellten Kriterien können nochmals in einer Paarvergleich-Matrix gegeneinander gestellt werden, um herauszufinden, welches A-Kriterien (Muss-Kriterien) und welches B-Kriterien (Kann-Kriterien) für ein Unternehmen darstellen. Die Auswahl an Big Data Lösungen fällt aufgrund der Vielzahl an Anbietern auf dem Markt schwer. Umso 4.1.4 Anbieter im Vergleich für eine Big Data Softwarelösung 10 Marktüberblick_Big_Data_Software_Lösungen wichtiger ist die saubere Herausarbeitung der Kriterien. Dietmar Müller, IBM Experte, hat einen Leitfaden erstellt, um Unternehmen dabei zu unterstützen. Die Fragen, die sich die Unternehmen stellen müssen sind ?Welche Server werden benötigt? Müssen Sie die Lösung in der Cloud bereitstellen? Benötigen Sie ETL-Tools, um Daten aufzubereiten oder mehrere Datenquellen zu kombinieren? Kommt OLAP-Technologie zum Einsatz? Welche Art von Berichtswerkzeug wird benötigt?"[18] Im weiteren Verlauf werden anhand eines Beispiels fünf Kriterien herausgearbeitet, die für eine Evaluierung einer Big Data-Softwarelösung entscheidend sein können. Nun nehmen wir an, dass ein Unternehmen eine BI-Lösung einführen möchte. Der IBM-Experte Dietmar Müller verweist hier auf fünf Top-Kriterien, die der BI-Spezialist arcplan zusammengestellt hat, damit Unternehmen die richtige Lösung finden können. Die Kriterien, die hier besonders Beachtung finden sollen sind ?Flexibilität, Sichherheit, Erlernbarkeit, Mobilität und Entwicklungsfähigkeit."[18] 1. Flexibilität Die BI-Lösung soll durch die Felxibilität eine Unabhängigkeit errreichen, dies bedeutet, dass der Fokus der Anwender nicht nur auf den Datenzugriff oder die Möglichkeit der Dartenbearbeitung gelegt wird, sondern die ständig ändernden Anforderungen und Funktionen immer schnellst möglich zur Verfügung gestellt und umgesetzt werden können. In Zukunft ?wächst beispielsweise die Nachfrage nach komplexen Berichten mit Algorithmen, die nur in der Präsentationsebene gelöst werden können."[18] ?Die Berichts- und Analysesoftware sollte daher nicht nur aktuelle Anforderungen, sondern auch mögliche zukünftige Bedürfnisse bereits abdecken."[18] 2. Sicherheit Hier sollten zwei Fragen berücksichtigt werden. Zum einen ?Werden Nutzer außerhalb des Netzwerks sicher mit Berichten versorgt?"[18] Dieses sollte mit einer SSL-Verschlüsselung abgedeckt sein. Zum Anderen die Frage ?Kann die Software nutzer- und rollenbasierte Sicherheitskonzepte aus der Datenquelle übernehmen? Erlaubt die Anwendung selbst den Aufbau zusätzlicher Sicherheitsmaßnahmen auf Basis spezieller Anwendungsfälle?"[18] Wenn diese Fragen mit Ja beanwortet werden können, dann ist die Sicherheit der BI-Lösung garantiert. 3. Erlernbarkeit Wie schnell kann ein Entwickler den Aufbau der BI-Lösung erlernen? Oder kann ein Anwender zeitnah mit der Software agieren? Dieses sind Fragen, die dieses Kriterium aufwirft und beantwortet werden müssen. Durch eine ausreichende Dokumentation oder Schulungen der Entwickler und Anwender kann aber auch dieses bewerkstelltigt werden. 4. Mobilität In diesem Kriterium soll aufgezeigt werden, ob die Anwendung auch auf einem mobilen Endgerät bereitgestellt werden kann. Auch hier gibt es unterschiedliche Anforderungen seitens der Endgeräte. ?Wenn die Anwendung beispielsweise in Java läuft, so kann sie auf einem iOS-Gerät nicht angezeigt werden."[18] Des Weiteren muss sichergestellt werden, dass die Anwendung sich auch der Bildschirmgröße und der Orientierung anpassen kann. Hier spricht man von ?Responsive Design"[18]. 5. Entwicklungsfähigkeit ?BI-Trends entwickeln sich schnell und dynamisch."[18] Deswegen müssen Unternehmen in der Lage sein mit ihrer BI-Lösung auf diese Neuerungen reagiern zu können. Des Weiteren spielt auch der Zuwachs der mobilen Endgeräte im Business-Bereich eine übergeordnete Rolle, wie beispielsweise der Trend zum BYOD. 4.2 Evaluierung der Big Data-Lösungen 11 Marktüberblick_Big_Data_Software_Lösungen Laut Peter Kathmann, Leiter PreSales bei arcplan, sind die genannten Kriterien ?Felxibilität, Sicherheit, Erlernbarkeit, Mobilität und Entwicklungsfähigkeit [...] keine erschöpfenden Kritereien um BI-, Berichts- und Analysesoftware zu bewerten, aber aus unserer Sicht ein hervorragender Ansatz für eine zukunftsorientierte Softwareauswahl."[18] 4.3 Kosteneinschätzung Genaue Kosten zu den ausgewählten Anbietern ist leider nicht möglich, da dafür konkrete Angebote mit den speziellen Anforderungen an die Hersteller gesendet werden müssen. Im weiteren Verlauf aber trotzdem mal eine kleine Kosteneinschätzung zur Einführung einer Big Data-Lösung. Eine Lösung von IBM, Intel, SAP oder Microsoft ist, und das lässt sich sagen, deutlich teuerer als selber zusammengestellte Systeme. Denn hier kaufen Unternehmen nicht nur die Hard- und Software, sondern auch den Service und das Know-how der Mitarbieter, die diese vorkonfigurieren und testen. Natürlich haben auch die Zertifizierungen der Hersteller ihren Preis. ?Im einfachsten Fall, bei Software-Appliances liegen die Preise in der Regel im 4-stelligen Euro-Bereich.Kommt Hardware hinzu landet man im 5-stelligen Euro-Bereich. Die SAP Appliance für HANA beispielsweise in der Edge-Edition ab etwa 40.000 Euro erhältlich."[19] Nach oben sind jedoch bei den Appliances keine Grenzen gesetzt. Ein weiteres Beispiel, um sich die enormen Kosten einer Big Data-Lösung vorstellen zu können liefert Oracle. ?Die komplette Oracle Big-Data-Appliance kostet 450.000 US-Dollar [...]. Der Support für das System wird jährlich mit 54.000 US-Dollar und Unterstützung für das Betriebssystem mit 36.000 US-Dollar berechnet."[19] Es ist davon auszugehen, dass die ausgewählten Hersteller sich im gleichen Preissegmentt bewegen, wie Oracle. Dieses verdeutlicht auch nochmal, dass wie im Vorwort bei der Marktanalyse erwähnt, die Einführung einer Big Data-Lösung eine strategische Entscheidung ist. 4.4 Big Data-Lösungen ausgewählter Anbieter Da bereits unzählige Big Data Software Lösungen von unterschiedlichen Anbietern existieren und die Anzahl an Software Lösungen permanent weiter wächst, können hier nicht alle Big Data Lösungen vorgestellt werden. Aus diesem Grund werden im folgenden nur die fünf Big Data Software Lösungen der Anbieter IBM, Oracle, SAP, Microsoft und Tableau Software vorgestellt. 4.4.1 IBM 4.4.1.1 Big Data Lösung IBM Es gibt verschiedene Lösungen der IBM im Bereich Big Data. Diese Lösungen geben ?Benutzern unter Einbeziehung von Hadoop-Unternehmenslösungen die Möglichkeit, Daten über zahlreiche Quellen hinweg zu speichern, zu verwalten und zu analysieren. Gleichzeitig können sie die Daten für Geschäftsanalysten, Datenspezialisten und IT-Benutzer zugänglich machen.?[20] 4.3 Kosteneinschätzung 12 Marktüberblick_Big_Data_Software_Lösungen 4.4.1.2 Hadoop-System Diese Systemsoftware kombiniert die Apache Hadoop-Technologie und seine Leistungsfähigkeit mit ?unternehmensorientierter Analysefunktionalität.?[21] Durch diese Systemlösung können sie einen Einblick in die Datenmengen ihres Unternehmens gewinnen. Hadoop bietet ihrem Unternehmen folgende Leistungen an : ? ?Strukturübergreifende Datenverarbeitung und Analyse im großen Umfang mit Anwendungsbeschleunigern, Visualisierung, Dashboards, Entwicklungstools und Sicherheitsfunktion?[21] ? ?Schnelle Analyse unterschiedlicher strukturierter und unstrukturierter Datasets?[21] ? ?Modernisierung von herkömmlichen Data-Warehouse-Umgebungen mit Flexibilität für Datenspeicherung, -management und ?analyse?[21] IBM bietet hierzu drei Systeme an: ? IBM BigInsghts for Apache Hadoop ? IBM InfoSphere Big Match for Hadoop ? IBM BigInsights on Cloud Im Folgenden werden diese drei Lösungen etwas näher betrachtet. 4.4.1.3 IBM BigInsights for Apache Hadoop Diese Lösung ?kombiniert das Open-Source-Framework Apache Hadoop mit Unternehmensfunktionalität und Integration, damit eine umfangreiche Analyse mit integrierter Ausfallsicherheit und Fehlertoleranz durchgeführt werden kann.?[22] Allerdings zeichnet diese Lösung auch noch weitere nützliche Faktoren aus: ? ?Ausrichtung auf Leistung und Benutzerfreundlichkeit durch leistungsoptimierte Funktionen, Visualisierung, funktionsreiche Entwicklertools und leistungsfähige Analysefunktionen?[22]. ? ?Funktionen für Management, Sicherheit und Zuverlässigkeit zur Unterstützung umfangreicher Implementierungen und schnellerer Wertschöpfung?[22] ? ?Kombination mit Informationslösungen von IBM und anderen Anbietern zur Vereinfachung und Erweiterung der Datenbearbeitung?[22] 4.4.1.4 IBM InfoSphere Big Match for Hadoop Diese Lösung ist in der vorherigen Lösung integriert und in dieser zuständig für die ?Analyse strukturierter und unstrukturierter Daten, um detallierte Kundeninformationen abzuleiten.?[22]. 4.4.1.5 IBM BigInsights on Cloud Diese Lösung bietet ?Hadoop-as-a-Service?[23] an. Sie beinhaltet ?umfassende Funktionen einer Vor-Ort-Implementierung von InfoSphere BigInsights ohne die Kosten, Komplexitiät und Risiken, die mit dem 4.4.1.2 Hadoop-System 13 Marktüberblick_Big_Data_Software_Lösungen Management der eigenen Infrastruktur verbunden sind.? Des Weiteren sind folgende Funktionen von Vorteil für ein Unternehmen: ? ?Beschleunigung und Vereinfachung der Clusterimplementierung?[23] , d.h. ?[..sie] können Big-Data-Analysen durchführen, ohne dass dafür eine entsprechende Infrastruktur vor Ort nötig ist?[23] ? ?Skalierung entsprechend Ihren Geschäftsanforderungen?[23], dies bedeutet, dass die Infrastrukturkosten im Einklang mit den wechselnden Geschäftsanforderungen gehalten werden ? ?Innovative Tools für schnellere Wertschöpfung?[23], wie Big SQL, Big Sheets, Textanalysen ? ?Optimierte Leistung und höhere Sicherheit?[23], durch eine Bare-Metal-Infrastruktur ? ?Expertise und Best Practice?[23] 4.4.1.6 Stream-Computing Eine weitere Big Data-Lösung von IBM ist die Streaming-Lösung. Hiermit können "Unternehmen aktive, schnelle Daten analysieren, um erweiterte, genauere kognitive und Analysesysteme zu erstellen.?[24]. Dadurch bietet sich einem Unternehmen folgende Vorteile: ? Umfassende Plattform für die Entwicklung ? Debugging von Anwendungen ? Hoch skalierbare Umgebungen ? Verschiedenste Analysearten, wie Textanalyse, SPSS-Modellierung oder geografisch-räumliche Analyse Das Produkt, das diese Funktionalitäten umfasst heißt IBM InfoSphere Streams. 4.4.1.7 Weltweiter Abruf der Daten Eine weitere und nützliche Software die IBM für ihre Big Data-Softwarelösungen anbietet ist, dass Unternehmen ihre Daten und Informationen weltweit abrufen und analysieren können. Diese Software ermöglicht den Zugriff auf ?datengesteuerte Anwendungen"[25] wie z.B. Content-Management, CRM, SCM, E-Mail und ?Managementsysteme für relationale Datenbanken sowie Webseiten und vernetzte Dateisysteme?[25] , um nur einige zu nennen. Es sind noch einige Funktionen mehr, die die Software beinhaltet, aber diese im Einzelnen zu nennen wäre nicht sinnvoll, da nur ein kurzer Überblick über diese Software gegeben werden soll. 4.4.2 Oracle Die Software-Produktpalette von Oracle für Big Data umfasst folgende Kategorien: Big Data Management, Big Data Analytics, Big Data Integration, Big Data Applications.[26] 4.4.1.5 IBM BigInsights on Cloud 14 Marktüberblick_Big_Data_Software_Lösungen 4.4.2.1 Big Data Management 4.4.2.1.1 Oracle Database 12c Oracle Database 12c hat eine Mehrmandanten-Architektur. Damit können mehrere Datenbanken als Cloud-Service schnell, effizient und sicher verwaltet werden. Je nach Bedürfnissen und Budget kann zwischen drei Editionen ausgewählt werden: Enterprise Edition, Standard Edition und Standard Edition One.[27][26] 4.4.2.1.2 Oracle Big Data SQL Oracle Big Data SQL ist ein Big Data Management System, das den Zugriff auf Hadoop und NoSQL mit bereits erstellten SQL Anwendungen ermöglicht. Mit Smart Scan Service werden die Datenbewegungen minimisiert und die Leistung gesteigert.[28][26] 4.4.2.1.3 Oracle NoSQL Database Oracle NoSQL Database - einfache, horizontal skalierte Schlüssel-Wert Datenbank für Web Services und Cloud. Bietet ein starkes und flexibles Transaktionsmodell, das die Entwicklung von einer NoSQL-basierten Anwendung stark vereinfacht.[29][26] 4.4.2.1.4 Oracle Big Data Connectors Oracle Big Data Connectors verbinden Hadoop mit Oracle Database und bietet eine notwendige Infrastruktur für Big Data Lösungen. Die Softwaresuite beinhaltet folgende Komponente: Oracle SQL Connector for HDFS; Oracle Loader for Hadoop; Oracle Advanced; Analytics for Hadoop; Oracle XQuery for Hadoop; Oracle Data Integrator.[30][26] 4.4.2.2 Big Data Analytics 4.4.2.2.1 Oracle Big Data Discovery Oracle Big Data Discovery ist ein vor allem benutzerfreundliches Produkt für die visuelle Analyse von Big Data. Es ermöglicht intuitiv die Suche, Transformation und Analyse von Daten schnell durchzuführen und die Ergebnisse zu teilen und zu veröffentlichen.[31][26] 4.4.2.2.2 Oracle Advanced Analytics Oracle Advanced Analytics wandelt Oracle Database in eine umfassende fortgeschrittene analytische Plattform um. Dieses wird durch Integration von Oracle R Enterprise und Oracle Data Mining ermöglicht. Die Benutzer dieser Plattform können die Predictive-Analytics-Methoden entwickeln, sowie die für Oracle R Enterprise verfügbaren Oracle-spezifische Data-Mining-Algorithmen erstellen.[32][26] 4.4.2.1 Big Data Management 15 Marktüberblick_Big_Data_Software_Lösungen 4.4.2.2.3 Oracle Big Data Spatial and Graph Oracle Big Data Spatial and Graph ist eine Erweiterung für Apache Hadoop und NoSQL Database Big Data Plattformen, die der Speicherung und Verwaltung von geographischen Informationen dient.[33][26] 4.4.2.3 Big Data Integration 4.4.2.3.1 Oracle GoldenGate for Big Data Oracle GoldenGate for Big Data bietet eine einfache, flexible, leistungshohe, zuverlässige Data-Streaming Plattform. Ermöglicht die Integration von Transaktionsdaten in die Big Data Systeme (Apache Hadoop, Apache HBase, Apache Hive und Apache Flume) in Echtzeit, ohne die Leistung von Source-Systemen zu beeinträchtigen.[34][26] 4.4.2.3.2 Oracle Enterprise Metadata Management Oracle Enterprise Metadata Managemenet ist ein Management System, das zur Gewinnung und Verwaltung der Metadaten von Oracle und Technologien der Drittanbieter dient.[32][26] 4.4.2.4 Big Data Applications 4.4.2.4.1 Oracle BlueKai Cloud Oracle BlueKai CLoud ist eine Cloudbasierte Big Data Plattform, die den Unternehmen zur Personalisierung von Online-, Offline- und Mobile-Marketing-Kampagnen mit ausreichenden Informationen über Zielgruppen dient.[35] BlueKai Lösung schließt Data Management Plattform ein, welche gestaltet und strukturiert die Daten der relevanten Zielgruppen eines Unternehmens und hilft die personalisierten Marketing-Kampagnen zu implementieren.[35][26] Dadurch liefert diese bessere Ergebnisse. 4.4.2.4.2 Oracle Talent Management Cloud Oracle Talent Management Cloud ist ein Service, das eine komplette Talent Management Lösung bietet. Diese umfasst Profil-, Leistungs-, Zielmanagement, Rekrutierung und Einarbeitung, sowie Learning. Die Lösung hilft die Arbeitskraftförderung und -entwicklung anzutreiben und mit integrierten Tools für soziale Netzwerke, Business Intelligence, und der mobilen Verfügbarkeit zu binden.[36] 4.4.3 SAP 4.4.3.1 Big Data Lösung SAP SAP bietet nahezu für jedes Big Data Anwendungsgebiet eine Software Lösung. Diese einzelnen ?Big Data Geschäftsanwendungen mit Echtzeit Analysen? kombiniert die SAP in ihrer ?offenen [...] Plattform, der SAP HANA Plattform für Big Data?.[37] Laut der Publikation der Bitkom, stellt ?SAP HANA [..] eine wegweisende Echtzeitplattform für Analytik und Anwendungen dar?.[38] Diese Kombination bringt erhebliche Vorteile für die Anwender der Plattform mit sich, da 4.4.2.2.3 Oracle Big Data Spatial and Graph 16 Marktüberblick_Big_Data_Software_Lösungen diese mit einer einzigen Anwendung nahezu alle relevanten Geschäftsfelder abdecken können. Die SAP HANA Plattform bietet zudem die Möglichkeit ?Informationssilos? aufzulösen und in Echtzeit externe Daten zu analysieren.[39] Auch ein großer Vorteil der SAP HANA Plattform ist es, dass die Möglichkeit besteht, eigene Anwendungen auf der SAP HANA Plattform zu entwickeln. Dazu werden ?professionelle Beratungsdienstleistungen, die von der Datenmodellierung bis hin zur Entwicklung neue Programme reichen?, bereitgestellt.[39] Somit können die Unternehmen, die die SAP HANA Plattform nutzen, ihr System nach individuellen Wünschen anpassen oder eventuell auch eigene neue Programme entwicklen. Laut einer Publikation der Bitkom, ist diese Möglichkeit für die meisten Unternhemen ein großer Vorteil, da sie sich somit Vorsprünge am Markt gegenüber anderen Wettbewerbern verschaffen können.[40] 4.4.3.2 SAP HANA und Apache Hadoop Da die SAP HANA Plattform standardmäßig auf die in-Memory Technologie basiert, ist das Apache Hadoop Framework nicht Bestandteil von SAP HANA.[41]SAP bietet jedoch den Nutzern der SAP HANA Plattform die Möglichkeit, Apache Hadoop mit SAP HANA zu kombinieren. Mit dieser Kombination der in-Memory- und Hadoop-Technologien, verspricht SAP eine deutlich höhere Kapazität der Datenbanken und eine viel schnellere Verarbeitungszeit der Daten.[42] Laut dem Artikel auf der Webseite der SAP kann sich die Speicherkapazität somit bis zu 100 Petabytes erhöhen.[42] 4.4.3.3 SAP-Big Data Portfolio Das SAP-Big Data Portfolio verknüpft die SAP HANA Plattform mit den einzelnen Big Data Lösungen, für unterschiedliche Anwendungsfälle, der SAP. Im folgenden wird ein Überblick der einzelnen Big Data Lösungen geboten, indem die Lösungen jeweils kurz vorgestellt werden. 4.4.3.4 SAP Predictive Analysis Die Predictive Analysis Lösung der SAP ist ?ein Tool für die statische Analyse und das Data Mining, mit dem sich Vorhersagemodelle erstellen lassen?.[37] Mit Hilfe der Vorhersagen können Unternehmen früh über mögliche Maßnahmen gegen zukünftige Gefahren entscheiden und sich somit frühzeitig absichern. Auch ist es möglich, dass die Unternhemen Marktveränderungen frühzeitig erkennen können, und sich somit Vorteile gegenüber Mitbewerbern verschaffen können. 4.4.3.5 SAP Event Stream Processor (SAP ESP) Die Event Stream Prozessor Lösung bietet eine ?kontinuierliche Business Intelligence für eine schnelle und intelligente Entscheidungsfindung und Geschäftsführung?.[37] SAP ESP wandelt alle auf Unternehmen einströmenden Daten in aussagekräftigen Informationen um.[38] ?Dabei werden irrelevante Daten verworfen, Daten aus verschiedenen Quellen kombiniert und Ereignisse im Kontext anderer Ereignisse untersucht, um festzustellen, was wichtig ist. Diese Aufgaben werden bei sehr hoher Geschwindigkeit, in Echtzeit und für große Mengen eingehender Daten durchgeführt.?[37] Laut der Publikation der Bitkom, können die Unternehmen sich mithilfe der SAP ESP Lösung ?schneller auf sich ändernde Bedingungen reagieren, Bedrohungen und Chancen erkennen, sobald sie auftauchen und fundiertere Entscheidungen durch umfassende und zeitnahe Informationen treffen.?[37] 4.4.3.1 Big Data Lösung SAP 17 Marktüberblick_Big_Data_Software_Lösungen Zusammenfassend ermöglicht SAP ESP das ?Bearbeiten und Bewerten von Ereignissen aus Maschinendaten, sozialen Medien und weiteren Sensoren in Echtzeit?.[39] 4.4.3.6 SAP Data Services Die SAP Data Services ?bietet [...] eine verlässliche Informationsgrundlage, um operative und analytische datenbezogene Vorhaben zu unterstützen?.[37] SAP Data Services verbindet alle Daten, unabhängig von der Datenquelle und dem Datenformat, in einem System, von dem man auf alle Daten zugreifen kann.[38][42] Somit hat man eine einzige Anwendung mit der man alle Daten verwalten kann. 4.4.3.7 SAP Customer Engagement Intelligence Die SAP Customer Engagement Intelligence Lösung dient der Konsolidierung, Optimierung und der Echtzeit Überwachung und Steuerung vom Marketing und Vertrieb über alle Kanäle.[38] Laut der Bitkom Publikation, ?werden insbesondere die in Zukunft stark wachsenden Daten aus sozialen Medien, [...] aus dem Web und aus Geo-Daten auf einzigartige Weise mit intuitiven Benutzeroberflächen und schlank sowie auch mobil nutzbaren Transaktionen kombiniert?.[37] 4.4.3.8 SAP Fraud Management Die SAP Fraud Management Lösung dient der Vermeidung von Betrug, indem es Muster ?und Korrelationen aus den verschiedenen Datenquellen? nutzt.[39][42] 4.4.3.9 SAP Demand Signal Management Das SAP Demand Signal Management dient der Erfassung von externen Markt- und Verbrauchsdaten und Kombination mit Unternehmensinternen Daten und Analysen, um in Echtzeit auf die Lieferkette einzuwirken und diese mit prädikativen Analysen in vorher nicht gekannten Ausmaße zu steuern.[40] 4.4.3.10 SAP Operational Equipment Effectiveness ?Durch die neuartige Kombination von Produktionsdaten mit zahlreichen weiteren Geschäftsdaten aus den Bereichen Controlling, Finanzen und Services [...] [besteht] über die SAP Operational Equipment Effectiveness Lösung [..] die Möglichkeit, Gründe für mangelnde Anlagenauslastung, Qualitätsschwankungen und Produktionsfehler frühzeitig zu erkennen und zu analysieren.?[39] Somit kann man mit der SAP Operational Equipment Effectiveness Lösung eine bessere Produktqualität und eine optimale Nutzung der Anlagen erreichen.[40] 4.4.4 Microsoft 4.4.4.1 Big Data Lösung Microsoft Microsoft verfügt über ein sehr umfangreiches Produktportfolio und bietet seinen Kunden verschiedene Lösungen in unterschiedlichen Anwendungsgebieten der Big Data an. Laut der offiziellen Website von Microsoft können 4.4.3.5 SAP Event Stream Processor (SAP ESP) 18 Marktüberblick_Big_Data_Software_Lösungen Unternehmen ?Big Data-Lösung nutzen, um neue geschäftliche Erkenntnisse aus ihren eigenen strukturierten und unstrukturierten Daten zu gewinnen".[43] Anwendungsgebiete wie zum Beispiel die Erfassung von Echtzeitdaten, die Verdichtung und Verknüpfung in hybriden Data Warehouses, die Visualisierung und Mustererkennung sowie Verdichtung von Daten sind einige von vielen Lösungen, die Microsoft anbietet. [44] 4.4.4.2 Windows Azure "Azure ist die Cloud Computing-Plattform von Microsoft, eine wachsende Sammlung integrierter Dienste für Analyse, Computing, Datenbank, Mobilgeräte, Netzwerkbetrieb, Speicher und Web, damit Sie noch flexibler sind, mehr erreichen und dabei Geld sparen." Sie basiert auf der langjährigen Erfahrung von Microsoft im Betrieb von großen Rechenzentren, die sogenannten Mega-Data-Center. [44] Diese Rechenzentren von Microsoft Azure bieten verschiedene Dienstleistungskategorien an. Zudem ist Windows Azure ein sehr offenes und interoperabel ausgelegtes System und kann sowohl Windows als auch Linux Server als Plattform für den Betrieb von Services zur Verfügung stellen. [45] Durch die Integration von Azure in die unternehmenseigene Software, können Unternehmen ihre vorhandenen Datenbanken verknüpfen. Dadurch ist die Verwaltung sowohl im Datencenter des Unternehmens als auch in der Cloudlösung Azure möglich. Nutzer haben somit die Möglichkeit sämtliche Dienste über den Webbrowser zu verwalten und diese in der Cloud zur Verfügung zu stellen.[45] ? ?Daten in der Cloud speichern, sichern und wiederherstellen? [46] ? ?Unternehmensanwendungen auf Azure ausführen? [47] ? ?Umfangreiche Compute-Aufträge und leistungsfähige Prognoseanalysen durchführen? [48] ? ?Audio- und Videoinhalte skalierbar verschlüsseln, speichern und streamen? [49] ? ?Intelligente Produkte und Dienste anhand von IoT-Diensten (Internet der Dinge) erstellen?. [50] 4.4.4.3 HDInsight HDInsight ist ein neuer Dienst von Microsoft, welcher auf Hadoop basiert, und auf der Hortonworks Plattform gebaut ist. [51] Bei diesem Dienst handelt es sich um eine ?Hadoop-Verteilung?,[52] der die Verarbeitung von strukturierten und unstrukturierten Daten in nahezu jeder Größe, um neue Erkenntnisse und neue Geschäftsstrategien zu gewinnen, dem Kunden ermöglicht. Die neuen Ergebnisse können mit der Microsoft Business Intelligence (BI) Plattform verknüpft werden, sodass jedem berechtigten Nutzer im Unternehmen, diese zur weiteren Verarbeitung zur Verfügung gestellt werden. Es ist ?kein Kauf und keine Wartung von Hardware?[53] nötig, sodass keine weiteren Kosten anfallen. Durch die Integration von HDInsight in Azure entfällt somit auch der Zeitaufwand für die Installation oder Einrichtung.[54] Der Kunde kann Big Data-Workloads sowohl in Windows als auch in Linux bereitstellen (Plattformunabhängigkeit). ?In Excel können Benutzer Azure HDInsight als Datenquelle auswählen.? [55] Dies ermöglicht die problemlose Visualisierung von Hadoop-Daten in Excel. Des Weiteren bietet HDInsight die Erstellung von Hadoop-Cluster in der Cloud in kürzester Zeit mit wenig Aufwand. [56] Es werden viele Programmiersprachen mit leistungsstarken Programmiererweiterungen unterstützt. Dies ermöglicht die problemlose Nutzung der Programmiersprache in Hadoop. [57] 4.4.4.4 Power BI Mit diversen Power BI (Business Intelligence) Tools können Nutzer mit bekannten Werkzeugen wie Excel ?Daten aus eigenem Bestand oder der Cloud intuitiv erfassen, visualisieren und verteilen, Abfragen in natürlicher Sprache formulieren und Echtzeitdaten auf jedem mobilen Endgerät nutzen". [44] 4.4.4.1 Big Data Lösung Microsoft 19 Marktüberblick_Big_Data_Software_Lösungen 4.4.5 Tableau Tableau Software ist eine Business Intelligence Lösung, welche die Datenanalyse und -Berichte in einen durchgehenden visuellen Prozess integriert. Tableau kann in beliebiger Branche eingesetzt werden. Sie schafft einen leichten Zugang zu den Daten und deren Bearbeitung, so kann der Nutzer auf einfache Art die Daten nicht nur präsentieren sondern auch untersuchen und verstehen. Tableau arbeitet mit lokalen Quellen wie z. B. Text-Dateien, Excel-Tabellen, Access-Datenbanken, sowie extern mit den gängigen Datenbanksystemen wie beispielsweise von MySQL, SAP, Oracle, IBM. Je nach Bedarf und Budget kann man zwischen den fünf aktuellen Editionen von Tableau auswählen: Tableau Desktop - für jeden Bedarf, Tableau Online als Cloud-Dienst, Tableau Server, sowie Tableau Public und Tableau Reader als kostenlose Versionen. 5 Schlussbetrachtung 5.1 Zusammenfassung Zusammengefasst lässt sich sagen, dass der Markt Big Data noch ziemlich unerforscht ist und auch die Technologien noch weiter verbessert werden können. Bisher zeichnet sich nur ab, dass die Hersteller, die auch in anderen Lösungen einen großen Marktanteil besitzen, in dieser Sparte vorne liegen. Ein richtiger Big Data Softwarespezialist ist noch nicht in Erscheinung getreten. Big Data ist auch nur in den USA verbreitet und nicht in anderen Ländern. Auch hier wird es Veränderungen geben, sodass diese Lösung sich weiter verbreitet. 5.2 Ausblick In Zukunft werden Unternehmen verstärkt auf diese Softwarelösungen setzen, um wettbewerbsfähig zu bleiben und anderen Unternehmen etwas voraus zu haben. Aufgrund des massiven Anstiegs der Daten durch die mobilen Endgeräte können große Datenmengen nur mit solch einer Lösung ausgewertet und analysiert werden. Die Verbindung einer Big Data Lösung mit einer Cloud-Infrastruktur ist ein weiterer IT-Trend, der in den kommenden Jahren an Bedeutung gewinnen wird. Die Daten müssen von überall abrufbar sein. So wird die Anforderung an die Big Data-Lösungen in Zukunft heißen. 6 Anhang 6.1 Fußnoten 1. ? 1,0 1,1 Vgl. Dumbill (2012) 2. ? Vgl. Lohr (2012) 3. ? 3,0 3,1 3,2 3,3 3,4 3,5 Bitkom (2014), Seite 12 4. ? 4,0 4,1 Vgl. McAfee, Brynjolfsson (2012), Seite 62 5. ? 5,0 5,1 Bitkom (2014), Seite 14 6. ? Frauenhofer-Institut (2012), Seite 8 7. ? Gantz, Reinsel (2012), Seite 9 8. ? Vgl. Bitkom (2014), Seite 20 9. ? Vgl. Hadoop 10. ? Vgl. Hbase 4.4.5 Tableau 20 Marktüberblick_Big_Data_Software_Lösungen 11. ? 11,0 11,1 Vgl. Bachmann, Kemper, Gerzer (2014), Seite 48 12. ? Vgl. Bachmann, Kemper, Gerzer (2014), Seite 52 13. ? 13,0 13,1 Vgl. Bachmann, Kemper, Gerzer (2014), Seite 59 14. ? 14,0 14,1 14,2 14,3 14,4 14,5 14,6 Vgl. Bitkom-Presseinfo (04.04.2014) 15. ? 15,0 15,1 Vgl. Bitkom-Presseinfo (05.03.2014) 16. ? 16,0 16,1 16,2 Vgl. Capgemini (2015) 17. ? Vgl. Kurzlechner (2014) 18. ? 18,0 18,1 18,2 18,3 18,4 18,5 18,6 18,7 18,8 18,9 Vgl. Müller (2015) 19. ? 19,0 19,1 Vgl. CIO 20. ? Vgl. IBM-Produkte 21. ? 21,0 21,1 21,2 21,3 Vgl. IBM Hadoop-System 22. ? 22,0 22,1 22,2 22,3 22,4 Vgl. IBM BigInsights for Apache Hadoop 23. ? 23,0 23,1 23,2 23,3 23,4 23,5 23,6 Vgl. IBM BigInsights on Cloud 24. ? Vgl. IBM Stream-Computing 25. ? 25,0 25,1 Vgl. IBM Föderierte Erkennung und Navigation 26. ? 26,00 26,01 26,02 26,03 26,04 26,05 26,06 26,07 26,08 26,09 26,10 Vgl. Oracle 27. ? Vgl. Oracle Database 12c 28. ? Vgl. Oracle Big Data SQL 29. ? Vgl. Oracle NoSQL Database 30. ? Vgl. Oracle Big Data Connectors 31. ? Vgl. Oracle Big Data Discovery 32. ? 32,0 32,1 Vgl. Oracle Advanced Analytics 33. ? Vgl. Oracle Big Data Spatial and Graph 34. ? Vgl. Oracle Golden Gate for Big Data 35. ? 35,0 35,1 Vgl. Oracle Press Release (2014) 36. ? Vgl. Oracle Talent Management Cloud 37. ? 37,0 37,1 37,2 37,3 37,4 37,5 37,6 Bitkom (2014), Seite 182 38. ? 38,0 38,1 38,2 38,3 Vgl. Bitkom (2014), Seite 182 39. ? 39,0 39,1 39,2 39,3 39,4 Bitkom (2014), Seite 183 40. ? 40,0 40,1 40,2 Vgl. Bitkom (2014), Seite 183 41. ? Vgl. Färber et al. (2011), Seite 46 42. ? 42,0 42,1 42,2 42,3 Vgl. SAP 43. ? Vgl. Microsoft 44. ? 44,0 44,1 44,2 Vgl. Bitkom (2014), Seite 181 45. ? 45,0 45,1 Vgl Microsoft 46. ? Vgl. Microsoft Azure 47. ? Vgl. Microsoft Azure 48. ? Vgl. Microsoft Azure 49. ? Vgl. Microsoft Azure 50. ? Vgl. Microsoft Azure 51. ? Vgl. Microsoft HDInsight 52. ? Vgl. Microsoft HDInsight 53. ? Vgl. Microsoft HDInsight 54. ? Vgl. Microsoft HDInsight 55. ? Vgl. Microsoft HDInsight 56. ? Vgl. Microsoft HDInsight 57. ? Vgl. Microsoft HDInsight 6.1 Fußnoten 21 Marktüberblick_Big_Data_Software_Lösungen 6.2 Quellenverzeichnis Lohr (2012) Lohr, Steve: ?The Age of Big Data?, Hrsg.: The New York Times, 12. Februar 2012, auf S. SR1 in der NYT Data?; http://www.nytimes.com/2012/02/12/sunday-review/big-datas-impact-in-the-world.html?_r=3&scp= Dumbill Dumbill, Edd: ?What is big data? An introduction to the big data landscape.?, Hrsg.: O'Reilly; https://beta.or (2012) McAfee, McAfee, Andrew; Brynjolfsson, Erik: ?Big Data: The Management Revolution?, S. 62; Brynjolfsson http://ai.arizona.edu/mis510/other/Big%20Data%20-%20The%20Management%20Revolution.pdf (2012) o.V.: ?BIG DATA-VORSPRUNG DURCH WISSEN INNOVATIONSPOTENZIALANALYSE?, S. 8, Hrs o.V. (2012) http://www.iais.fraunhofer.de/fileadmin/user_upload/Abteilungen/KD/uploads_BDA/Innovationspotenziala o.V.: ?Big-Data-Technologien - Wissen für Entscheider?, S. 12,14,20,182f, Hrsg.: BITKOM; o.V. (2014) http://www.bitkom.org/files/documents/BITKOM_Leitfaden_Big-Data-Technologien-Wissen_fuer_Entsche o.V. o.V.: ?Big Data Applications?, Hrsg.: SAP; http://www.sap.com/solution/big-data/software/applications.htm o.V. o.V.: ?Big Data Platform Solutions?, Hrsg.: SAP; http://www.sap.com/solution/big-data/software/platform.h Gantz, Gantz, John; Reinsel David: ?THE DIGITAL UNIVERSE IN 2020: Big Data, Bigger Digital Shadow, and B Reinsel IDC; http://www.emc.com/collateral/analyst-reports/idc-the-digital-universe-in-2020.pdf (2012) Färber et al. Färber, Franz; Cha, Sang Kyun; Primsch, Jürgen; Bornhörd, Christof; Sigg, Stefan; Lehner, Wolfgang: ?SAP (2011) Modern Business Applications?, S. 46, Hrsg.: SIGMOD Record; http://www.sigmod.org/publications/sigmo o.V. (2014) o.V.: Presseinfo vom 04.04. ?Weltweiter Markt Big Data?, Hrsg.: BITKOM; http://www.bitkom.org/de/them o.V. (2014) o.V.: Presseinfo vom 05.03. ?Großes Wachstum bei Big Data?, Hrsg.: BITKOM; https://www.bitkom.org/de o.V.: EMC 2015 : Studie: ?So verändert Big Data den Markt?, Hrsg.: Capgemini; o.V. (2015) http://www.absatzwirtschaft.de/studie-so-veraendert-big-data-den-markt-46971/ Kurzlechner Kurzlechner, Werner: ?Big Data Anbieter im Vergleich?, Hrsg.: CIO; http://www.cio.de/a/big-data-anbieter (2014) Müller Müller, Dietmar: ?Die fünf Top-Kriterien bei der Evaluation Ihrer Analytics-Lösung?, Hrsg.:Arcplan; (2015) http://ibmexperts.computerwoche.de/a/die-fuenf-top-kriterien-bei-der-evaluation-ihrer-analytics-loesung,320 o.V. o.V.: ?Integrierte Systeme im Check?, Hrsg.: CIO; http://www.cio.de/a/integrierte-systeme-im-check,80611 o.V. o.V.: ?IBM-Produkte?, Hrsg.: IBM; http://www-03.ibm.com/software/products/de/category/bigdata o.V. o.V.: ?IBM Hadoop-System?, Hrsg.: IBM; http://www-03.ibm.com/software/products/de/category/SWP12 o.V. o.V.: ?IBM BigInsights for Apache Hadoop?, Hrsg.: IBM; http://www-03.ibm.com/software/products/de/ibm o.V. o.V.: ?IBM BigInsights on Cloud?, Hrsg.: IBM; http://www-03.ibm.com/software/products/de/ibm-biginsig o.V. o.V.: ?IBM Stream-Computing?, Hrsg.: IBM; http://www-03.ibm.com/software/products/de/category/SWP1 o.V. o.V.: ?IBM Föderierte Erkennung und Navigation?, Hrsg.: IBM; http://www-03.ibm.com/software/products o.V. o.V.: ?Welcome to Apache? Hadoop®!?, Hrsg.: Apache Software Foundation; http://hadoop.apache.org/ o.V. o.V.: ?Apache HBase ? Reference Guide!?, Hrsg.: Apache Software Foundation; http://hbase.apache.org/ o.V.: ?Oracle Talent Management?, Hrsg.: Oracle; o.V. https://www.oracle.com/applications/human-capital-management/talent-management/acquisition/index.html o.V. o.V.: ?Oracle Big Data SQL?, Hrsg.: Oracle; http://www.oracle.com/us/products/database/big-data-sql/overv o.V. o.V.: "Oracle NoSQL Database", Hrsg.: Oracle; http://www.oracle.com/us/products/database/nosql/overview o.V. o.V.: ?Oracle Big Data Connectors?, Hrsg.: Oracle; http://www.oracle.com/us/products/database/big-data-co o.V. o.V.: ?Oracle Big Data Spatial and Graph?, Hrsg.: Oracle; https://www.oracle.com/database/big-data-spatial o.V. o.V.: ?Oracle Big Data Discovery?, Hrsg.: Oracle; https://www.oracle.com/big-data/big-data-discovery/inde 6.2 Quellenverzeichnis 22 Marktüberblick_Big_Data_Software_Lösungen o.V. o.V. o.V.: ?Oracle Advanced Analytics?, Hrsg.: Oracle; http://www.oracle.com/us/products/database/options/adv o.V.: ?Oracle GoldenGate for Big Data?, Hrsg.: Oracle; https://www.oracle.com/middleware/data-integratio o.V.: ?Oracle Enterprise Metadata Management?, Hrsg.: Oracle; http://www.oracle.com/us/products/middleware/data-integration/enterprise-metadata-management/overview o.V. 6.3 Abbildungsverzeichnis Abb.-Nr. 1 2 3 4 Abbildung Opportunity for Big Data Großes Wachstum bei Big Data Big Data Vendor Benchmark 2015 Microsoft Azure 6.4 Tabellenverzeichnis 6.5 Abkürzungsverzeichnis Abkürzung Bedeutung KMU kleine und mittlere Unternehmen BI Business Intelligence-Lösung BA Business Analytics-Lösung BYOD Bring your own Device CRM Customer Relationship Management SCM Supply Chain Management Herzlich Willkommen im winfwiki-System! Auf dieser Seite können Sie Ihre Inhalte einstellen. Folgende Schritte sind dazu notwendig: 1. Autorenrechte beantragen • Jeder Teilnehmer sollte sich zunächst als Autor registrieren. • Bitte dazu den Link "Anmelden" oben rechts auf der Seite klicken, dann "Neues Benutzerkonto anlegen" wählen und mit komplettem Namen, Matr.-Nr. und gültiger E-Mail-Adresse registrieren. Die Verifikation der E-Mail-Adresse erfolgt sofort, die Schreibrechte werden Ihnen nach Prüfung schnellstmöglich gewährt 2. Wiki-Syntax erlernen • Hinweise für Studenten lesen: Hinweise für Studenten • Mit dem Thema Inhaltsverzeichnis / Gliederung zuerst vertraut machen 3. Arbeiten mit dem System • Erste Gliederung erstellen • Schrittweise die Inhalte erstellen Diese Hinweise können Sie natürlich aus Ihrem Dokument löschen, wenn Sie sie nicht mehr benötigen. 6.3 Abbildungsverzeichnis 23 Marktüberblick_Big_Data_Software_Lösungen Viel Spass...! 6.5 Abkürzungsverzeichnis 24