4 Marktüberblick Big Data-Softwarelösungen

Werbung
Marktüberblick_Big_Data_Software_Lösungen
Hochschule:
Standort:
Studiengang:
Veranstaltung:
Betreuer:
Typ:
Themengebiet:
Autor(en):
Studienzeitmodell:
Semesterbezeichnung:
Studiensemester:
Bearbeitungsstatus:
Prüfungstermin:
Abgabetermin:
Fallstudienarbeit
Hochschule für Oekonomie & Management
Essen
Bachelor Wirtschaftsinformatik
Fallstudie / Wissenschaftliches Arbeiten
Prof._Dr._Uwe_Kern
Fallstudienarbeit
Big Data
Irfan Yilmaz, Matthias Reza, Muhammed Yüksekyuva, Ivans Ivanovs
Abendstudium
SS15
2
Bearbeitung abgeschlossen
30.6.2015
21.6.2015
Inhaltsverzeichnis
• 1 Einleitung
♦ 1.1 Einführung in die Thematik
♦ 1.2 Zielsetzung der Arbeit
♦ 1.3 Methodischer Aufbau
• 2 Grundlagen Big Data
♦ 2.1 Definition
♦ 2.2 Entstehung
♦ 2.3 Nutzen und Einsatz
• 3 Technische Voraussetzungen
♦ 3.1 Apache Hadoop - Ermöglichung von Big
Data
♦ 3.2 Hadoop und NoSQL-Datenbanken
• 4 Marktüberblick Big Data-Softwarelösungen
♦ 4.1 Marktanalyse
◊ 4.1.1 Vorwort
◊ 4.1.2 Weltmarkt Big Data
◊ 4.1.3 Big Data in Deutschland
◊ 4.1.4 Anbieter im Vergleich für eine
Big Data Softwarelösung
◊ 4.1.5 Ausblick Big Data
♦ 4.2 Evaluierung der Big Data-Lösungen
♦ 4.3 Kosteneinschätzung
♦ 4.4 Big Data-Lösungen ausgewählter Anbieter
◊ 4.4.1 IBM
⋅ 4.4.1.1 Big Data Lösung IBM
⋅ 4.4.1.2 Hadoop-System
⋅ 4.4.1.3 IBM BigInsights for
Apache Hadoop
⋅ 4.4.1.4 IBM InfoSphere Big
Match for Hadoop
Inhaltsverzeichnis
1
Marktüberblick_Big_Data_Software_Lösungen
⋅ 4.4.1.5 IBM BigInsights on
Cloud
⋅ 4.4.1.6 Stream-Computing
⋅ 4.4.1.7 Weltweiter Abruf der
Daten
◊ 4.4.2 Oracle
⋅ 4.4.2.1 Big Data Management
• 4.4.2.1.1 Oracle
Database 12c
• 4.4.2.1.2 Oracle Big
Data SQL
• 4.4.2.1.3 Oracle
NoSQL Database
• 4.4.2.1.4 Oracle Big
Data Connectors
⋅ 4.4.2.2 Big Data Analytics
• 4.4.2.2.1 Oracle Big
Data Discovery
• 4.4.2.2.2 Oracle
Advanced Analytics
• 4.4.2.2.3 Oracle Big
Data Spatial and Graph
⋅ 4.4.2.3 Big Data Integration
• 4.4.2.3.1 Oracle
GoldenGate for Big
Data
• 4.4.2.3.2 Oracle
Enterprise Metadata
Management
⋅ 4.4.2.4 Big Data Applications
• 4.4.2.4.1 Oracle
BlueKai Cloud
• 4.4.2.4.2 Oracle Talent
Management Cloud
◊ 4.4.3 SAP
⋅ 4.4.3.1 Big Data Lösung SAP
⋅ 4.4.3.2 SAP HANA und
Apache Hadoop
⋅ 4.4.3.3 SAP-Big Data Portfolio
⋅ 4.4.3.4 SAP Predictive
Analysis
⋅ 4.4.3.5 SAP Event Stream
Processor (SAP ESP)
⋅ 4.4.3.6 SAP Data Services
⋅ 4.4.3.7 SAP Customer
Engagement Intelligence
⋅ 4.4.3.8 SAP Fraud
Management
⋅ 4.4.3.9 SAP Demand Signal
Management
Inhaltsverzeichnis
2
Marktüberblick_Big_Data_Software_Lösungen
⋅ 4.4.3.10 SAP Operational
Equipment Effectiveness
◊ 4.4.4 Microsoft
⋅ 4.4.4.1 Big Data Lösung
Microsoft
⋅ 4.4.4.2 Windows Azure
⋅ 4.4.4.3 HDInsight
⋅ 4.4.4.4 Power BI
◊ 4.4.5 Tableau
• 5 Schlussbetrachtung
♦ 5.1 Zusammenfassung
♦ 5.2 Ausblick
• 6 Anhang
♦ 6.1 Fußnoten
♦ 6.2 Quellenverzeichnis
♦ 6.3 Abbildungsverzeichnis
♦ 6.4 Tabellenverzeichnis
♦ 6.5 Abkürzungsverzeichnis
1 Einleitung
1.1 Einführung in die Thematik
Aufgrund der Digitalisierung und den nahezu im Sekundentakt produzierten Daten, war es den Unternehmen und
sonstigen Organisationen, die diese Daten zur Analyse und Auswertung nutzen, nicht mehr möglich mit den
vorhandenen Technologien weiterhin zu arbeiten.
Vorallem die Mobile Devices wie die Smartphones, Tablet PCs und auch die neuen Smartwatches sind der Grund
für diese Datenflut.
Damit die Analyse der Datenmengen wieder möglich wird, mussten neue Technologien her, die mit diesen
Datenbergen umgehen konnten.
Somit entstanden die Big Data Software Lösungen, die zur Analyse und Auswertung großer Datenmengen dienen.
Im folgenden werden diese Software Lösungen thematisiert und ein Überblick der Big Data Lösungen
unterschiedlicher Anbieter gegeben.
1.2 Zielsetzung der Arbeit
Ziel dieser Fallstudie ist es, einen Überblick über die aktuellen Big Data Software Lösungen ausgewählter
Anbieter zu verschaffen.
Darüberhinaus wird eine Marktanalyse zum Thema Big Data Software Lösungen durchgeführt und die
wichtigsten Aspekte der jeweiligen Lösungen beschrieben. Außerdem werden die unterschiedlichen
Anwendungsmöglichkeiten auf diverse Tätigkeitsfelder untersucht.
1.3 Methodischer Aufbau
Vorerst wird das Thema Big Data im ersten Kapitel eingeleitet, gefolgt von den Grundlagen, um den Leser in die
Thematik einzuführen.
1 Einleitung
3
Marktüberblick_Big_Data_Software_Lösungen
Im dritten Kapitel werden die technischen Voraussetungen und die Anforderungen an die IT-Infrastruktur
behandelt. Außerdem werden auf die Themen Apache Hadoop und NoSQL Datenbanken näher eingegangen.
Im vierten Kapitel wird eine Marktanalyse zu den BIg Data Software Lösungen durchgeführt, um die aktuellen
Kennzahlen und das Potenzial von Big Data zu veranschaulichen. Dabei wird auch speziell auf den deutschen
Markt eingegangen.
Folglich wird ein Vergleich diverser Anbieter für Big Data Software Lösungen durchgeführt, um dem Leser einen
Überblick über die Marktführer in diesem Bereich zu verschaffen.
2 Grundlagen Big Data
2.1 Definition
Laut dem Autor Edd Dumbill, vom O'Reilly Verlag, versteht man unter dem Begriff Big Data eine große
Datenmenge, die die Kapazität von konventionellen Datenbanksystemen überschreitet.[1] In der Praxis wird der
Begriff Big Data nicht nur für große Datenmengen verwendet, sondern auch für das Verfahren, die zur Analyse
dieser Datenmengen dient. Somit kann mit dem Begriff Big Data sowohl die Datenmenge, als auch das Verfahren
oder das System gemeint sein, mit der die Daten analysiert und ausgewertet werden.
Der Autor Steve Lohr von den New York Times definiert Big Data als ?ein Marketing-Instrument, die die Tür zu
einem neuen Ansatz zum verstehen der Welt und dem treffen von Entscheidungen öffnet?.[2]
Die Big Data Technologie ?basiert nicht auf einer singulären Technologie?, sie ?ist vielmehr das Resultat des
Zusammenwirkens einer ganzen Reihe von Innovationen? und Technologien.[3] Somit gibt es nicht die eine Big
Data Technologie, die für die Analyse der großen Datenmengen genutzt werden kann. Unterschiedliche
technologische Komponenten ermöglichen dies erst in Kombination miteinander.
Wie es in einer Publikation der Bitkom beschrieben wird, besteht Big Data aus vier unterschiedlichen Aspekten,
welche in Kombination Big Data ausmachen:
1. Volume (Datenmenge):
?Immer mehr Organisationen und Unternehmen verfügen über gigantische Datenberge, die von einigen Terabyte
bis hin zu Größenordnungen von Petabyte führen.?[3]
2. Variety (Datenvielfalt):
?Aus immer mehr Quellen liegen Daten unterschiedlicher Art vor, die sich grob in unstrukturierte,
semistrukturierte und strukturierte Daten gruppieren lassen. [...] Die Unternehmen werden zunehmend durch
externe Daten ergänzt, beispielsweise aus sozialen Netzwerken.?[3]
3. Velocity (Geschwindigkeit):
?Riesige Datenmengen müssen immer schneller ausgewertet werden, nicht selten in Echtzeit. Die
Verarbeitungsgeschwindigkeit hat mit dem Datenwachstum Schritt zu halten.?[3]
4. Analytics:
?Analytics umfasst die Methoden zur möglichst automatisierten Erkennung und Nutzung von Mustern,
Zusammenhängen und Bedeutungen.? Dazu kommen unterschiedliche Analysemethoden wie ?u.a. statische
Verfahren, Vorhersagemodelle? oder ?Optimierungsalgorithmen? zum Einsatz.[3]
1.3 Methodischer Aufbau
4
Marktüberblick_Big_Data_Software_Lösungen
2.2 Entstehung
Aufgrund der immer voranschreitenden technologischen Entwicklungen und der Digitalisierung, haben
Unternehmen und Organisationen immer mehr Möglichkeiten, unterschiedliche Daten für ihre Vorteile durch
analytische Verfahren, zu sammeln. Somit stieg die Menge der angesammelten Daten in den letzten Jahren rasant
an. Laut Andrew McAfee and Erik Brynjolfsson wurden ab dem Jahr 2012, jeden Tag, etwa 2,5 Exabytes an
Daten produziert (Stand 2012) und diese Zahl verdoppelt sich alle 40 Monate.[4]
Diese Datenmenge wurde irgendwann zu groß, um von den konventionellen Datenbanksystemen ausgewertet zu
werden.[1]
Ein weiteres Problem bei den gesammelten Datenbergen war es, dass diese sehr unterschiedlich und vielfältig
waren. Ein einheitliches Datenformat gab es nicht, da Daten aus ?immer mehr Quellen [...] unterschiedlicher Art?
vorlagen.[3] Diese unterschiedlichen Datenformate konnten von einem einzigen Datenbanksytsem nicht
ausgewertet werden, vorallem die Datenmenge ließ die Datenbanksysteme schnell an ihre Grenzen stoßen.
Die Lösung für diese Probleme, die mit der enorm wachsenden Datenbergen entstanden, bot das
?Open-Source-Framework zur Parallelen Datenverarbeitung auf sehr skalierenden Server-Clustern? Apache
Hadoop.[5] Mit der Veröffentlichung von Hadoop, wurde es in ?nahezu Echtzeit, durch verschiedenste
Analyseverfahren? möglich, diese permanent wachsenden Datenberge zu analysieren und für die eigenen Vorteile
auszuwerten.[5]
Nachdem das Potenzial von Apache Hadoop erkannt wurde, haben viele Unternehmen eigene Big Data Lösung in
ihre Datenbanksysteme integriert, die auf das Hadoop Framework basieren. Somit wird Hadoop und die Big Data
Lösungen der einzelnen Anbieter permanent weiterentwickelt und verbessert.
Es gibt laut einer Publikation des Frauenhofer-Institutes auch immer mehr kleine und mittlere Unternhemen
(KMU), die auf Big Data Verfahren setzen und dessen Potenzial erkannt haben.[6] Somit sind nicht nur die großen
Unternhemen wie beispielsweise Global Player von Big Data betroffen, sondern auch KMUs die mit ständig
wachsenden Datenbergen zu tun haben und diese für ihre Vorteile ausnutzen können.
Außerdem entwickeln die KMUs zum Teil auch ihre eigenen Lösungen für ihre Big Data Probleme und bieten
diese auch zur Nutzung anderen Unternehmen an. Somit entstehen permanent Big Data Software Lösungen, die
sich zum Teil sehr voneinander unterscheiden.
2.3 Nutzen und Einsatz
Big Data Verfahren dienen zur Analyse und Auswertung von sehr großen Datenmengen mit unterschiedlichen
Datenformaten.
Laut Andrew McAfee und Erik Brynjolfsson, bietet Big Data den Unternehmen und Organisationen die
Möglichkeit mit vielen Petabytes von Daten, in einem einzigen Datenbanksystem, zu arbeiten.[4] Dies eröffnet
Unternehmen und Organisationen viele neue Wege, die gesammelten Datenmengen für ihre Vorteile zu nutzen
und auszuwerten.
Wie man auch auf der folgenden Abbildung sehen kann, werden die Datenberge voraussichtlich immer wachsen,
wobei nur ein Teil dieser Daten von Nutzen ist. Der Großteil dieser Daten sind nicht von Relevanz und genau
diese Daten werden mit dem Big Data Verfahren aussortiert, so das nur die wichtigen Daten betrachtet werden.
2.2 Entstehung
5
Marktüberblick_Big_Data_Software_Lösungen
Abb.1 Opportunity for Big Data[7]
Beispielsweise werden Big Data Verfahren für Marketing-Zwecke oder auch in der Medizin und anderen vielen
Bereichen immer vermehrt eingesetzt.
Big Data kann in nahezu allen Branchen von Nutzen sein und viele Vorteile und neue Möglichkeiten bieten.
Laut einer Publikation der Bitkom, werden in naher Zukunft die Unternehmen vermehrt Big Data Verfahren
einsetzen, um ihre Entscheidungsprozesse oder Geschäftsprozesse zu unterstützen.[8] Dadurch würden sich die
Unternehmen Vorteile gegenüber anderen Marktteilnehmern verschaffen und somit ihre Chancen erhöhen, eine
bessere Position auf dem Markt zu erreichen. Dies könnte beispielsweise mit den Vorhersagen durch Predictive
Analysis geschehen, wodurch die Unternehmen mögliche Änderungen am Markt früher erkennen und sich
dementsprechend vorbereiten würden.
3 Technische Voraussetzungen
3.1 Apache Hadoop - Ermöglichung von Big Data
Hadoop - ist ein Projekt von Apache Software Foundation, das die Open-Source Dienstprogramme,
Programmbibliotheken und Framework für die Entwicklung und Ausführung verteilter Programme verbreitet,
welche auf den Clustern von hunderten und tausenden Knoten arbeiten. Hadoop wird für die Realisierung von
Such- und Kontextmechanismen von vielen hochbelasteten Websiten, wie z. B. Yahoo oder Facebook, benutzt.
Hadoop wurde auf MapReduce-Algorithmus von Google Inc. entwickelt. Die Anwendung wird auf große Menge
gleichartiger elementaren Aufgaben unterteilt, die auf Cluster Knoten ausgeführt werden und zum einen
Endergebnis führt.
Nach dem Stand von April 2015 das Projekt besteht aus vier Modulen - Hadoop Common (Middleware - eine
Sammlung infrastruktueller Programmbibliotheken und Dienstprogrammen, die für andere Module und verwandte
Projekte verwendet werden), HDFS (Hadoop Distributed File System - Dateisystem, das zur Speicherung der
großen Datenmengen mehrer Knoten dient), YARN (ein System zur Aufgabenplanung und Clusterverwaltung)
und Hadoop MapReduce (eine Plattform, die der Programmierung und Ausführung verteilter
2.3 Nutzen und Einsatz
6
Marktüberblick_Big_Data_Software_Lösungen
MapReduce-Berechnungen dient). Früher gab es eine Reihe von Projekten, die später zu den eigenständigen
Projekten im Rahmen des Apache Software Foundation Systems geworden sind).
Hadoop zählt zu den grundlegenden Big Data Technologien. Um Hadoop herum, ist ein Ecosystem von
verbundenen Projekten und Technologien entstanden. Die meisten von den haben sich zu eigenständigen
Projekten entwickelt. Seit 2005 gibt es einen aktiven Prozess der Kommerzialisation von Technologien. Die
Geschäfte mehrerer Unternehmen werden auf die Entwicklung kommerzieler Hadoop-Distributionen und
Dienstleistungen zur technischen Unterstützung des Ecosystems. Praktisch alle große Lieferanten der
Informationstechnologien schließen Hadoop in seine Produktstrategien und Paletten von Lösungen. [9]
3.2 Hadoop und NoSQL-Datenbanken
Hadoop und NoSQL-Datenbanken HBase - ist eine nicht relationale, verteilte mit Java geschriebene Open-Source
Datenbank. Hbase ist ein Analog zu dem Google BigTable und wurde im Rahmen eines Hadoop-Projekts von
Apache Software Foundation entwickelt. Es basiert auf HDFS und bietet damit BigTable ähnliche Möglichkeiten
für Hadoop. Diese Datenbank ist für die häufig eränzende Daten geeignet. [10]
4 Marktüberblick Big Data-Softwarelösungen
4.1 Marktanalyse
4.1.1 Vorwort
Die Marktanalyse zum Thema Big Data Softwarelösungen wird sich auf verschiedene Aspekte beziehen. Zum
einen wird die derzeitige Marktbeschaffenheit dargestellt und zum anderen auch ein kleiner Blick in die Zukunft
geworfen, wie die Entwicklung weitergehen könnte. Der Markt wird beleuchtet hinsichtlich der derzeitigen
Verbreitung auf dem Weltmarkt so wie in Deutschland. Hierfür findet sich auch eine Gegenüberstellung in Form
von Zahlen und Diagrammen im weiteren Verlauf. Des Weiteren werden Anbieter genannt, die diese Software
vertreiben sowie welcher dieser Marktführerschaft besitzt.
Welche Ziele sollte es für ein Unternehmen geben Big Data einzuführen oder überhaupt zu nutzen?
Um eine möglichst genaue und aussagekräftige Marktanalyse zu erstellen, muss erst einmal definiert werden,
welche Zielsetzung mit Big Data erreicht werden soll und kann. Die Einführung einer Big Data Softwarelösung
ist eine strategische Entscheidung eines Unternehmens mit dem Ziel ?sich zu einem Analytical Competitor zu
entwickeln.?[11] Hiermit ist die Fähigkeit gemeint ?durch Datenanalysen Wettbewerbsvorteile zu erzeugen.?[11]
Allerdings muss das, bezogen auf die Unternehmen, auch noch differenziert betrachtet werden. Für ein
Unternehmen, das seine Ausrichtung nur auf die Verarbeitung und Analyse von Daten legt ist dieses Ziel
natürlich von größerer Bedeutung als es bei anderen der Fall ist.
Nachdem Unternehmen sich zu einem Analytical Competitor entwickelt haben gibt es auf diesem Niveau noch
eine weitere Verbesserung, die dazu beiträgt einen Wettbewerbsvorteil zu erzielen. Dieser Aspekt wird
?Informationsvorherrschaft?[12] genannt. Informationsvorherrschaft bedeutet, dass ?[..ein] Unternehmen [..] in der
Öffentlichkeit als zuverlässiger Lieferant qualitätsgesicherter Analysen zur Unterstützung von
Entscheidungsprozessen wahrgenommen wird.?[13] Um diese Aussage zu erläutern kann folgendes Beispiel
gewählt werden: ?Eine Abteilung eines Unternehmens wird im Unternehmen als zuverlässiger Lieferant
3.1 Apache Hadoop - Ermöglichung von Big Data
7
Marktüberblick_Big_Data_Software_Lösungen
qualitätsgesicherter Analysen zur Unterstützung von Entscheidungsprozessen wahrgenommen.?[13]
4.1.2 Weltmarkt Big Data
Big Data hat auf der gesamten Welt in den letzten Jahren enorm an Bedeutung gewonnen. ?Der globale Umsatz
mit Big Data- Produkten und -Dienstleistungen [...stieg] im Jahr 2014 auf rund 73,5 Milliarden Euro, ein Plus von
66 Prozent zum Vergleich im Vorjahr."[14] Dabei kann Big Data noch in verschiedene Teilbereiche eingeordnet
werden. Diese sind datenbasierte Produkte und Analytics Services, Big Data IT und Sensoren und Maschinen.
Der größte dieser drei genannten Bereiche umfasst die datenbasierten Produkte und Analytics Services. Dieser hat
?im Jahr 2014 um 64 Prozent auf weltweit 63,4 Milliarden Euro"[14] zugelegt. Dazu zählen beispielsweise
?intelligente Gebäudesteuerungen, Optimierungssysteme im Handel oder Endkundendienste in den Bereichen
Lifestyle, Fitness und Gesundheit."[14] Der zweite Teilbereich Big Data IT stieg im vergangen Jahr ?um 69
Prozent auf 2,6 Milliarden Euro Umsatz"[14] und beinhaltet ?die IT-Hardware, Software und IT-Services."[14] Von
den Anwendungsfeldern im Vergleich zu den ersten beiden fällt der letzte Bereich Sensoren und Maschinen klein
aus. Dieser liegt aber mit einem Umsatz von 7,6 Milliarden Euro und einem Wachstum von 72 Prozent deutlich
vor dem Bereich Big Data IT. Unter diesen Bereich fallen Geräte, Maschinen und Fahrzeuge, die mit dem Internet
verbunden werden sollen.
Diese Zahlen belegen jedoch nur den Beginn des rasanten Anstiegs von Big Data. Der Weltmarkt von Big Data
soll laut mehrfachen Marktprognosen ?bis 2016 um jährlich durchschnittlich 46 Prozent"[14] steigen. Durch diesen
weiteren Anstieg hätte sich der Markt ?innerhalb von fünf Jahren von 23,6 Milliarden Euro (2011) auf 160,6
Milliarden Euro (2016) nahezu [...verachtfacht]."[14] Der Grund für die weitere Zunahme liegt in der Annahme,
dass Smartphones, Tablets und die sozialen Netzwerke stärker genutzt werden als noch in den Vorjahren.
4.1.3 Big Data in Deutschland
Der rasante Aufstieg von Big Data auf der Welt hat auch Auswirkungen auf den Markt in Deutschland. Auch hier
ist in den letzten Jahren ein Anstieg zu verzeichnen. Insgesamt stieg der Umsatz mit Big Data ?um 59 Prozent auf
6,1 Milliarden Euro."[15] Laut eines Marktforschungsinstitut soll sich der Umsatz der Big Data-Lösungen bis zum
Jahr 2016 auf 13,6 Milliarden Euro nochmals verdoppeln. Die folgende Abbildung soll noch einmal die
Entwicklung von Big Data in Deutschland verdeutlichen.
4.1.1 Vorwort
8
Marktüberblick_Big_Data_Software_Lösungen
Abb.2 Großes Wachstum bei Big Data[15]
Trotz des großen Anstiegs seit 2012 hat Big Data immer noch weniger Bedeutung als beispielsweise in den USA.
Der Grund dafür liegt darin, dass viele Unternehmen Big Data keine hohen Geschäftschancen zutrauen. Dieses
geht aus einer Studie der Capgemini und EMC hervor die 1.000 Unternehmen zu dieser Thematik befragt haben.
Desweitern geht aus dieser hervor, dass ?nur 58 Prozent der Befragten aus Deutschland berichten, dass sie Big
Data-Technologien implementiert haben.?[16] Ein weiteres Problem, dass die Einführung und Nutzung von Big
Data-Technologien verhindert ist, dass der Anstoß seitens der IT erfolgt und nicht von der Geschäftsführung
ausgeht. Dadurch verliert diese Strategie an Bedeutung. Laut dem Leiter Insights & Data bei Capgemini ?laufen
die [..Unternehmen] Gefahr [?] ihre Wettbewerbsfähigkeit einzubüßen?[16], wenn die Möglichkeiten, die eine
Big-Data-Infrastruktur bietet, nicht genutzt werden. Ein weiterer Grund für die stockende Nutzung dieser
Technologien wird auch häufig in der IT gesucht. Der langsame IT-Entwicklungsprozess in Unternehmen
verhindert meistens eine Einführung, da es an qualifizierten Mitarbeitern oder an der veralteten IT-Infrastruktur
scheitert. Hier hat der Privotal Chief Executive Officer, der EMC Corporation, an die Unternehmen folgendes
gerichtet: ?Unternehmen müssen verstehen, dass es nicht nur darauf ankommt, Daten aus verschiedenen Quellen
zu verarbeiten, auszuwerten und schnell darauf zu reagieren, sondern ihr gesamtes Handeln an ihren gewonnen
Erkenntnissen auszurichten. Deswegen müssen sie schnellstens in qualifizierte Mitarbeiter, Kompetenzen, Tools
und moderne Plattformen investieren.?[16]
4.1.4 Anbieter im Vergleich für eine Big Data Softwarelösung
Gestützt auf einer Studie von Experton, die die Anbieter auf diesem Markt vergleichen, werden auch die
Softwarelösungen, die später näher gebracht werden, Beachtung finden. Der Hauptaugenmerk wird auch
deswegen auf die ausgewählten Anbieter liegen.
Die Mercedes unter den Big Data Softwarelösungen sind die Hersteller IBM, Microsoft und SAP. Allerdings
dürfen sich diese Unternehmen keinesfalls auf ihre Marktführerschaft ausruhen. Andere drängen nämlich auch an
die Spitze, wie der Anbieter Exasol, Data Watch und Neo Technology. Wobei IBM eine noch höhere Stellung
zukommt. IBM punktet durch seine zahlreichen Kontakte und Akquisitionen im BI- und BA-Bereich, sowie durch
4.1.3 Big Data in Deutschland
9
Marktüberblick_Big_Data_Software_Lösungen
das technische hohe Niveau seiner Lösung und durch hohe Kompetenzen im Beratungsumfeld. In der folgenden
Grafik werden die Anbieter von der Experton Group in vier verschiedene Kategorien eingeteilt. Diese sind
Product Challenger, Leader,Follower und Market Challenger. Alle Anbieter, die hier eingeordnet wurden, sind
einem Benchmark unterzogen. Da sich Big Data in viele verschieden Teilsegmente einordnen und analysieren
lässt, haben wir im Folgenden eine Auswertung aus dem Bereich der BA-Lösungen exemplarisch für die
Einordnung der vier ausgewählten Anbieter ausgewählt.
Abb.3 Big Data Vendor Benchmark 2015 [17]
Hier auch noch verdeutlicht, dass die später vorgestellten Lösungen von IBM, Microsoft und SAP zu den
Marktführern gehören. Es ist davon auszugehen, dass in den anderen Segmenten von Big Data diese Anbieter hier
anzusiedeln sind. im Vergleich
4.1.5 Ausblick Big Data
Basierend auf der Marktanalyse wird sich Big Data weiter entwickeln und enorm an Bedeutung gewinnen. Die
Prognosen die genannt wurden belegen das schon. Die Entwicklung ist noch nicht zu Ende. Auch in Deutschland
werden die Unternehmen nach und nach auf diesen Zug aufspringen, wenn sie erkannt haben, wie
gewinnbringend eine solche Lösung sein kann. Gerade auch angesichts der Datenflut, die durch Smartphones,
Tablets oder andere technische Entwicklungen, die Daten produzieren, entstehen, wird die Verwaltung oder die
Analyse dieser Daten nur mit einer Big Data Softwarelösung zu realisieren sein.
4.2 Evaluierung der Big Data-Lösungen
Im Rahmen der Evaluierung ist es das Ziel, eine Big Data Lösung auszuwählen, die den Anforderungen der
Unternehmen gerecht wird. Hierfür können auf dem Markt verfügbare und in Frage kommende Lösungen
beispielsweise in einer Nutzwertanalyse gegenübergestellt werden. Für diese müssen aber zuerst Kriterien erstellt
werden, welche die Big Data Lösung erfüllen muss. Diese erstellten Kriterien können nochmals in einer
Paarvergleich-Matrix gegeneinander gestellt werden, um herauszufinden, welches A-Kriterien (Muss-Kriterien)
und welches B-Kriterien (Kann-Kriterien) für ein Unternehmen darstellen.
Die Auswahl an Big Data Lösungen fällt aufgrund der Vielzahl an Anbietern auf dem Markt schwer. Umso
4.1.4 Anbieter im Vergleich für eine Big Data Softwarelösung
10
Marktüberblick_Big_Data_Software_Lösungen
wichtiger ist die saubere Herausarbeitung der Kriterien. Dietmar Müller, IBM Experte, hat einen Leitfaden
erstellt, um Unternehmen dabei zu unterstützen. Die Fragen, die sich die Unternehmen stellen müssen sind
?Welche Server werden benötigt? Müssen Sie die Lösung in der Cloud bereitstellen? Benötigen Sie ETL-Tools,
um Daten aufzubereiten oder mehrere Datenquellen zu kombinieren? Kommt OLAP-Technologie zum Einsatz?
Welche Art von Berichtswerkzeug wird benötigt?"[18]
Im weiteren Verlauf werden anhand eines Beispiels fünf Kriterien herausgearbeitet, die für eine Evaluierung einer
Big Data-Softwarelösung entscheidend sein können. Nun nehmen wir an, dass ein Unternehmen eine BI-Lösung
einführen möchte. Der IBM-Experte Dietmar Müller verweist hier auf fünf Top-Kriterien, die der BI-Spezialist
arcplan zusammengestellt hat, damit Unternehmen die richtige Lösung finden können. Die Kriterien, die hier
besonders Beachtung finden sollen sind ?Flexibilität, Sichherheit, Erlernbarkeit, Mobilität und
Entwicklungsfähigkeit."[18]
1. Flexibilität
Die BI-Lösung soll durch die Felxibilität eine Unabhängigkeit errreichen, dies bedeutet, dass der Fokus der
Anwender nicht nur auf den Datenzugriff oder die Möglichkeit der Dartenbearbeitung gelegt wird, sondern die
ständig ändernden Anforderungen und Funktionen immer schnellst möglich zur Verfügung gestellt und umgesetzt
werden können. In Zukunft ?wächst beispielsweise die Nachfrage nach komplexen Berichten mit Algorithmen,
die nur in der Präsentationsebene gelöst werden können."[18] ?Die Berichts- und Analysesoftware sollte daher
nicht nur aktuelle Anforderungen, sondern auch mögliche zukünftige Bedürfnisse bereits abdecken."[18]
2. Sicherheit
Hier sollten zwei Fragen berücksichtigt werden. Zum einen ?Werden Nutzer außerhalb des Netzwerks sicher mit
Berichten versorgt?"[18] Dieses sollte mit einer SSL-Verschlüsselung abgedeckt sein. Zum Anderen die Frage
?Kann die Software nutzer- und rollenbasierte Sicherheitskonzepte aus der Datenquelle übernehmen? Erlaubt die
Anwendung selbst den Aufbau zusätzlicher Sicherheitsmaßnahmen auf Basis spezieller Anwendungsfälle?"[18]
Wenn diese Fragen mit Ja beanwortet werden können, dann ist die Sicherheit der BI-Lösung garantiert.
3. Erlernbarkeit
Wie schnell kann ein Entwickler den Aufbau der BI-Lösung erlernen? Oder kann ein Anwender zeitnah mit der
Software agieren? Dieses sind Fragen, die dieses Kriterium aufwirft und beantwortet werden müssen. Durch eine
ausreichende Dokumentation oder Schulungen der Entwickler und Anwender kann aber auch dieses
bewerkstelltigt werden.
4. Mobilität
In diesem Kriterium soll aufgezeigt werden, ob die Anwendung auch auf einem mobilen Endgerät bereitgestellt
werden kann. Auch hier gibt es unterschiedliche Anforderungen seitens der Endgeräte. ?Wenn die Anwendung
beispielsweise in Java läuft, so kann sie auf einem iOS-Gerät nicht angezeigt werden."[18] Des Weiteren muss
sichergestellt werden, dass die Anwendung sich auch der Bildschirmgröße und der Orientierung anpassen kann.
Hier spricht man von ?Responsive Design"[18].
5. Entwicklungsfähigkeit
?BI-Trends entwickeln sich schnell und dynamisch."[18] Deswegen müssen Unternehmen in der Lage sein mit
ihrer BI-Lösung auf diese Neuerungen reagiern zu können. Des Weiteren spielt auch der Zuwachs der mobilen
Endgeräte im Business-Bereich eine übergeordnete Rolle, wie beispielsweise der Trend zum BYOD.
4.2 Evaluierung der Big Data-Lösungen
11
Marktüberblick_Big_Data_Software_Lösungen
Laut Peter Kathmann, Leiter PreSales bei arcplan, sind die genannten Kriterien ?Felxibilität, Sicherheit,
Erlernbarkeit, Mobilität und Entwicklungsfähigkeit [...] keine erschöpfenden Kritereien um BI-, Berichts- und
Analysesoftware zu bewerten, aber aus unserer Sicht ein hervorragender Ansatz für eine zukunftsorientierte
Softwareauswahl."[18]
4.3 Kosteneinschätzung
Genaue Kosten zu den ausgewählten Anbietern ist leider nicht möglich, da dafür konkrete Angebote mit den
speziellen Anforderungen an die Hersteller gesendet werden müssen. Im weiteren Verlauf aber trotzdem mal eine
kleine Kosteneinschätzung zur Einführung einer Big Data-Lösung.
Eine Lösung von IBM, Intel, SAP oder Microsoft ist, und das lässt sich sagen, deutlich teuerer als selber
zusammengestellte Systeme. Denn hier kaufen Unternehmen nicht nur die Hard- und Software, sondern auch den
Service und das Know-how der Mitarbieter, die diese vorkonfigurieren und testen. Natürlich haben auch die
Zertifizierungen der Hersteller ihren Preis.
?Im einfachsten Fall, bei Software-Appliances liegen die Preise in der Regel im 4-stelligen Euro-Bereich.Kommt
Hardware hinzu landet man im 5-stelligen Euro-Bereich. Die SAP Appliance für HANA beispielsweise in der
Edge-Edition ab etwa 40.000 Euro erhältlich."[19] Nach oben sind jedoch bei den Appliances keine Grenzen
gesetzt. Ein weiteres Beispiel, um sich die enormen Kosten einer Big Data-Lösung vorstellen zu können liefert
Oracle. ?Die komplette Oracle Big-Data-Appliance kostet 450.000 US-Dollar [...]. Der Support für das System
wird jährlich mit 54.000 US-Dollar und Unterstützung für das Betriebssystem mit 36.000 US-Dollar
berechnet."[19]
Es ist davon auszugehen, dass die ausgewählten Hersteller sich im gleichen Preissegmentt bewegen, wie Oracle.
Dieses verdeutlicht auch nochmal, dass wie im Vorwort bei der Marktanalyse erwähnt, die Einführung einer Big
Data-Lösung eine strategische Entscheidung ist.
4.4 Big Data-Lösungen ausgewählter Anbieter
Da bereits unzählige Big Data Software Lösungen von unterschiedlichen Anbietern existieren und die Anzahl an
Software Lösungen permanent weiter wächst, können hier nicht alle Big Data Lösungen vorgestellt werden. Aus
diesem Grund werden im folgenden nur die fünf Big Data Software Lösungen der Anbieter IBM, Oracle, SAP,
Microsoft und Tableau Software vorgestellt.
4.4.1 IBM
4.4.1.1 Big Data Lösung IBM
Es gibt verschiedene Lösungen der IBM im Bereich Big Data. Diese Lösungen geben ?Benutzern unter
Einbeziehung von Hadoop-Unternehmenslösungen die Möglichkeit, Daten über zahlreiche Quellen hinweg zu
speichern, zu verwalten und zu analysieren. Gleichzeitig können sie die Daten für Geschäftsanalysten,
Datenspezialisten und IT-Benutzer zugänglich machen.?[20]
4.3 Kosteneinschätzung
12
Marktüberblick_Big_Data_Software_Lösungen
4.4.1.2 Hadoop-System
Diese Systemsoftware kombiniert die Apache Hadoop-Technologie und seine Leistungsfähigkeit mit
?unternehmensorientierter Analysefunktionalität.?[21] Durch diese Systemlösung können sie einen Einblick in die
Datenmengen ihres Unternehmens gewinnen. Hadoop bietet ihrem Unternehmen folgende Leistungen an :
? ?Strukturübergreifende Datenverarbeitung und Analyse im großen Umfang mit Anwendungsbeschleunigern,
Visualisierung, Dashboards, Entwicklungstools und Sicherheitsfunktion?[21]
? ?Schnelle Analyse unterschiedlicher strukturierter und unstrukturierter Datasets?[21]
? ?Modernisierung von herkömmlichen Data-Warehouse-Umgebungen mit Flexibilität für Datenspeicherung,
-management und ?analyse?[21]
IBM bietet hierzu drei Systeme an:
? IBM BigInsghts for Apache Hadoop
? IBM InfoSphere Big Match for Hadoop
? IBM BigInsights on Cloud
Im Folgenden werden diese drei Lösungen etwas näher betrachtet.
4.4.1.3 IBM BigInsights for Apache Hadoop
Diese Lösung ?kombiniert das Open-Source-Framework Apache Hadoop mit Unternehmensfunktionalität und
Integration, damit eine umfangreiche Analyse mit integrierter Ausfallsicherheit und Fehlertoleranz durchgeführt
werden kann.?[22] Allerdings zeichnet diese Lösung auch noch weitere nützliche Faktoren aus:
? ?Ausrichtung auf Leistung und Benutzerfreundlichkeit durch leistungsoptimierte Funktionen, Visualisierung,
funktionsreiche Entwicklertools und leistungsfähige Analysefunktionen?[22].
? ?Funktionen für Management, Sicherheit und Zuverlässigkeit zur Unterstützung umfangreicher
Implementierungen und schnellerer Wertschöpfung?[22]
? ?Kombination mit Informationslösungen von IBM und anderen Anbietern zur Vereinfachung und Erweiterung
der Datenbearbeitung?[22]
4.4.1.4 IBM InfoSphere Big Match for Hadoop
Diese Lösung ist in der vorherigen Lösung integriert und in dieser zuständig für die ?Analyse strukturierter und
unstrukturierter Daten, um detallierte Kundeninformationen abzuleiten.?[22].
4.4.1.5 IBM BigInsights on Cloud
Diese Lösung bietet ?Hadoop-as-a-Service?[23] an. Sie beinhaltet ?umfassende Funktionen einer
Vor-Ort-Implementierung von InfoSphere BigInsights ohne die Kosten, Komplexitiät und Risiken, die mit dem
4.4.1.2 Hadoop-System
13
Marktüberblick_Big_Data_Software_Lösungen
Management der eigenen Infrastruktur verbunden sind.? Des Weiteren sind folgende Funktionen von Vorteil für
ein Unternehmen:
? ?Beschleunigung und Vereinfachung der Clusterimplementierung?[23] , d.h. ?[..sie] können Big-Data-Analysen
durchführen, ohne dass dafür eine entsprechende Infrastruktur vor Ort nötig ist?[23]
? ?Skalierung entsprechend Ihren Geschäftsanforderungen?[23], dies bedeutet, dass die Infrastrukturkosten im
Einklang mit den wechselnden Geschäftsanforderungen gehalten werden
? ?Innovative Tools für schnellere Wertschöpfung?[23], wie Big SQL, Big Sheets, Textanalysen
? ?Optimierte Leistung und höhere Sicherheit?[23], durch eine Bare-Metal-Infrastruktur
? ?Expertise und Best Practice?[23]
4.4.1.6 Stream-Computing
Eine weitere Big Data-Lösung von IBM ist die Streaming-Lösung. Hiermit können "Unternehmen aktive,
schnelle Daten analysieren, um erweiterte, genauere kognitive und Analysesysteme zu erstellen.?[24]. Dadurch
bietet sich einem Unternehmen folgende Vorteile:
? Umfassende Plattform für die Entwicklung
? Debugging von Anwendungen
? Hoch skalierbare Umgebungen
? Verschiedenste Analysearten, wie Textanalyse, SPSS-Modellierung oder geografisch-räumliche Analyse
Das Produkt, das diese Funktionalitäten umfasst heißt IBM InfoSphere Streams.
4.4.1.7 Weltweiter Abruf der Daten
Eine weitere und nützliche Software die IBM für ihre Big Data-Softwarelösungen anbietet ist, dass Unternehmen
ihre Daten und Informationen weltweit abrufen und analysieren können. Diese Software ermöglicht den Zugriff
auf ?datengesteuerte Anwendungen"[25] wie z.B. Content-Management, CRM, SCM, E-Mail und
?Managementsysteme für relationale Datenbanken sowie Webseiten und vernetzte Dateisysteme?[25] , um nur
einige zu nennen. Es sind noch einige Funktionen mehr, die die Software beinhaltet, aber diese im Einzelnen zu
nennen wäre nicht sinnvoll, da nur ein kurzer Überblick über diese Software gegeben werden soll.
4.4.2 Oracle
Die Software-Produktpalette von Oracle für Big Data umfasst folgende Kategorien: Big Data Management, Big
Data Analytics, Big Data Integration, Big Data Applications.[26]
4.4.1.5 IBM BigInsights on Cloud
14
Marktüberblick_Big_Data_Software_Lösungen
4.4.2.1 Big Data Management
4.4.2.1.1 Oracle Database 12c
Oracle Database 12c hat eine Mehrmandanten-Architektur. Damit können mehrere Datenbanken als
Cloud-Service schnell, effizient und sicher verwaltet werden. Je nach Bedürfnissen und Budget kann zwischen
drei Editionen ausgewählt werden: Enterprise Edition, Standard Edition und Standard Edition One.[27][26]
4.4.2.1.2 Oracle Big Data SQL
Oracle Big Data SQL ist ein Big Data Management System, das den Zugriff auf Hadoop und NoSQL mit bereits
erstellten SQL Anwendungen ermöglicht. Mit Smart Scan Service werden die Datenbewegungen minimisiert und
die Leistung gesteigert.[28][26]
4.4.2.1.3 Oracle NoSQL Database
Oracle NoSQL Database - einfache, horizontal skalierte Schlüssel-Wert Datenbank für Web Services und Cloud.
Bietet ein starkes und flexibles Transaktionsmodell, das die Entwicklung von einer NoSQL-basierten Anwendung
stark vereinfacht.[29][26]
4.4.2.1.4 Oracle Big Data Connectors
Oracle Big Data Connectors verbinden Hadoop mit Oracle Database und bietet eine notwendige Infrastruktur für
Big Data Lösungen. Die Softwaresuite beinhaltet folgende Komponente: Oracle SQL Connector for HDFS;
Oracle Loader for Hadoop; Oracle Advanced; Analytics for Hadoop; Oracle XQuery for Hadoop; Oracle Data
Integrator.[30][26]
4.4.2.2 Big Data Analytics
4.4.2.2.1 Oracle Big Data Discovery
Oracle Big Data Discovery ist ein vor allem benutzerfreundliches Produkt für die visuelle Analyse von Big Data.
Es ermöglicht intuitiv die Suche, Transformation und Analyse von Daten schnell durchzuführen und die
Ergebnisse zu teilen und zu veröffentlichen.[31][26]
4.4.2.2.2 Oracle Advanced Analytics
Oracle Advanced Analytics wandelt Oracle Database in eine umfassende fortgeschrittene analytische Plattform
um. Dieses wird durch Integration von Oracle R Enterprise und Oracle Data Mining ermöglicht. Die Benutzer
dieser Plattform können die Predictive-Analytics-Methoden entwickeln, sowie die für Oracle R Enterprise
verfügbaren Oracle-spezifische Data-Mining-Algorithmen erstellen.[32][26]
4.4.2.1 Big Data Management
15
Marktüberblick_Big_Data_Software_Lösungen
4.4.2.2.3 Oracle Big Data Spatial and Graph
Oracle Big Data Spatial and Graph ist eine Erweiterung für Apache Hadoop und NoSQL Database Big Data
Plattformen, die der Speicherung und Verwaltung von geographischen Informationen dient.[33][26]
4.4.2.3 Big Data Integration
4.4.2.3.1 Oracle GoldenGate for Big Data
Oracle GoldenGate for Big Data bietet eine einfache, flexible, leistungshohe, zuverlässige Data-Streaming
Plattform. Ermöglicht die Integration von Transaktionsdaten in die Big Data Systeme (Apache Hadoop, Apache
HBase, Apache Hive und Apache Flume) in Echtzeit, ohne die Leistung von Source-Systemen zu
beeinträchtigen.[34][26]
4.4.2.3.2 Oracle Enterprise Metadata Management
Oracle Enterprise Metadata Managemenet ist ein Management System, das zur Gewinnung und Verwaltung der
Metadaten von Oracle und Technologien der Drittanbieter dient.[32][26]
4.4.2.4 Big Data Applications
4.4.2.4.1 Oracle BlueKai Cloud
Oracle BlueKai CLoud ist eine Cloudbasierte Big Data Plattform, die den Unternehmen zur Personalisierung von
Online-, Offline- und Mobile-Marketing-Kampagnen mit ausreichenden Informationen über Zielgruppen dient.[35]
BlueKai Lösung schließt Data Management Plattform ein, welche gestaltet und strukturiert die Daten der
relevanten Zielgruppen eines Unternehmens und hilft die personalisierten Marketing-Kampagnen zu
implementieren.[35][26] Dadurch liefert diese bessere Ergebnisse.
4.4.2.4.2 Oracle Talent Management Cloud
Oracle Talent Management Cloud ist ein Service, das eine komplette Talent Management Lösung bietet. Diese
umfasst Profil-, Leistungs-, Zielmanagement, Rekrutierung und Einarbeitung, sowie Learning. Die Lösung hilft
die Arbeitskraftförderung und -entwicklung anzutreiben und mit integrierten Tools für soziale Netzwerke,
Business Intelligence, und der mobilen Verfügbarkeit zu binden.[36]
4.4.3 SAP
4.4.3.1 Big Data Lösung SAP
SAP bietet nahezu für jedes Big Data Anwendungsgebiet eine Software Lösung. Diese einzelnen ?Big Data
Geschäftsanwendungen mit Echtzeit Analysen? kombiniert die SAP in ihrer ?offenen [...] Plattform, der SAP
HANA Plattform für Big Data?.[37]
Laut der Publikation der Bitkom, stellt ?SAP HANA [..] eine wegweisende Echtzeitplattform für Analytik und
Anwendungen dar?.[38] Diese Kombination bringt erhebliche Vorteile für die Anwender der Plattform mit sich, da
4.4.2.2.3 Oracle Big Data Spatial and Graph
16
Marktüberblick_Big_Data_Software_Lösungen
diese mit einer einzigen Anwendung nahezu alle relevanten Geschäftsfelder abdecken können.
Die SAP HANA Plattform bietet zudem die Möglichkeit ?Informationssilos? aufzulösen und in Echtzeit externe
Daten zu analysieren.[39] Auch ein großer Vorteil der SAP HANA Plattform ist es, dass die Möglichkeit besteht,
eigene Anwendungen auf der SAP HANA Plattform zu entwickeln. Dazu werden ?professionelle
Beratungsdienstleistungen, die von der Datenmodellierung bis hin zur Entwicklung neue Programme reichen?,
bereitgestellt.[39] Somit können die Unternehmen, die die SAP HANA Plattform nutzen, ihr System nach
individuellen Wünschen anpassen oder eventuell auch eigene neue Programme entwicklen.
Laut einer Publikation der Bitkom, ist diese Möglichkeit für die meisten Unternhemen ein großer Vorteil, da sie
sich somit Vorsprünge am Markt gegenüber anderen Wettbewerbern verschaffen können.[40]
4.4.3.2 SAP HANA und Apache Hadoop
Da die SAP HANA Plattform standardmäßig auf die in-Memory Technologie basiert, ist das Apache Hadoop
Framework nicht Bestandteil von SAP HANA.[41]SAP bietet jedoch den Nutzern der SAP HANA Plattform die
Möglichkeit, Apache Hadoop mit SAP HANA zu kombinieren.
Mit dieser Kombination der in-Memory- und Hadoop-Technologien, verspricht SAP eine deutlich höhere
Kapazität der Datenbanken und eine viel schnellere Verarbeitungszeit der Daten.[42]
Laut dem Artikel auf der Webseite der SAP kann sich die Speicherkapazität somit bis zu 100 Petabytes
erhöhen.[42]
4.4.3.3 SAP-Big Data Portfolio
Das SAP-Big Data Portfolio verknüpft die SAP HANA Plattform mit den einzelnen Big Data Lösungen, für
unterschiedliche Anwendungsfälle, der SAP.
Im folgenden wird ein Überblick der einzelnen Big Data Lösungen geboten, indem die Lösungen jeweils kurz
vorgestellt werden.
4.4.3.4 SAP Predictive Analysis
Die Predictive Analysis Lösung der SAP ist ?ein Tool für die statische Analyse und das Data Mining, mit dem
sich Vorhersagemodelle erstellen lassen?.[37]
Mit Hilfe der Vorhersagen können Unternehmen früh über mögliche Maßnahmen gegen zukünftige Gefahren
entscheiden und sich somit frühzeitig absichern.
Auch ist es möglich, dass die Unternhemen Marktveränderungen frühzeitig erkennen können, und sich somit
Vorteile gegenüber Mitbewerbern verschaffen können.
4.4.3.5 SAP Event Stream Processor (SAP ESP)
Die Event Stream Prozessor Lösung bietet eine ?kontinuierliche Business Intelligence für eine schnelle und
intelligente Entscheidungsfindung und Geschäftsführung?.[37]
SAP ESP wandelt alle auf Unternehmen einströmenden Daten in aussagekräftigen Informationen um.[38]
?Dabei werden irrelevante Daten verworfen, Daten aus verschiedenen Quellen kombiniert und Ereignisse im
Kontext anderer Ereignisse untersucht, um festzustellen, was wichtig ist. Diese Aufgaben werden bei sehr hoher
Geschwindigkeit, in Echtzeit und für große Mengen eingehender Daten durchgeführt.?[37]
Laut der Publikation der Bitkom, können die Unternehmen sich mithilfe der SAP ESP Lösung ?schneller auf sich
ändernde Bedingungen reagieren, Bedrohungen und Chancen erkennen, sobald sie auftauchen und fundiertere
Entscheidungen durch umfassende und zeitnahe Informationen treffen.?[37]
4.4.3.1 Big Data Lösung SAP
17
Marktüberblick_Big_Data_Software_Lösungen
Zusammenfassend ermöglicht SAP ESP das ?Bearbeiten und Bewerten von Ereignissen aus Maschinendaten,
sozialen Medien und weiteren Sensoren in Echtzeit?.[39]
4.4.3.6 SAP Data Services
Die SAP Data Services ?bietet [...] eine verlässliche Informationsgrundlage, um operative und analytische
datenbezogene Vorhaben zu unterstützen?.[37]
SAP Data Services verbindet alle Daten, unabhängig von der Datenquelle und dem Datenformat, in einem
System, von dem man auf alle Daten zugreifen kann.[38][42] Somit hat man eine einzige Anwendung mit der man
alle Daten verwalten kann.
4.4.3.7 SAP Customer Engagement Intelligence
Die SAP Customer Engagement Intelligence Lösung dient der Konsolidierung, Optimierung und der Echtzeit
Überwachung und Steuerung vom Marketing und Vertrieb über alle Kanäle.[38]
Laut der Bitkom Publikation, ?werden insbesondere die in Zukunft stark wachsenden Daten aus sozialen Medien,
[...] aus dem Web und aus Geo-Daten auf einzigartige Weise mit intuitiven Benutzeroberflächen und schlank
sowie auch mobil nutzbaren Transaktionen kombiniert?.[37]
4.4.3.8 SAP Fraud Management
Die SAP Fraud Management Lösung dient der Vermeidung von Betrug, indem es Muster ?und Korrelationen aus
den verschiedenen Datenquellen? nutzt.[39][42]
4.4.3.9 SAP Demand Signal Management
Das SAP Demand Signal Management dient der Erfassung von externen Markt- und Verbrauchsdaten und
Kombination mit Unternehmensinternen Daten und Analysen, um in Echtzeit auf die Lieferkette einzuwirken und
diese mit prädikativen Analysen in vorher nicht gekannten Ausmaße zu steuern.[40]
4.4.3.10 SAP Operational Equipment Effectiveness
?Durch die neuartige Kombination von Produktionsdaten mit zahlreichen weiteren Geschäftsdaten aus den
Bereichen Controlling, Finanzen und Services [...] [besteht] über die SAP Operational Equipment Effectiveness
Lösung [..] die Möglichkeit, Gründe für mangelnde Anlagenauslastung, Qualitätsschwankungen und
Produktionsfehler frühzeitig zu erkennen und zu analysieren.?[39]
Somit kann man mit der SAP Operational Equipment Effectiveness Lösung eine bessere Produktqualität und eine
optimale Nutzung der Anlagen erreichen.[40]
4.4.4 Microsoft
4.4.4.1 Big Data Lösung Microsoft
Microsoft verfügt über ein sehr umfangreiches Produktportfolio und bietet seinen Kunden verschiedene Lösungen
in unterschiedlichen Anwendungsgebieten der Big Data an. Laut der offiziellen Website von Microsoft können
4.4.3.5 SAP Event Stream Processor (SAP ESP)
18
Marktüberblick_Big_Data_Software_Lösungen
Unternehmen ?Big Data-Lösung nutzen, um neue geschäftliche Erkenntnisse aus ihren eigenen strukturierten und
unstrukturierten Daten zu gewinnen".[43] Anwendungsgebiete wie zum Beispiel die Erfassung von Echtzeitdaten,
die Verdichtung und Verknüpfung in hybriden Data Warehouses, die Visualisierung und Mustererkennung sowie
Verdichtung von Daten sind einige von vielen Lösungen, die Microsoft anbietet. [44]
4.4.4.2 Windows Azure
"Azure ist die Cloud Computing-Plattform von Microsoft, eine wachsende Sammlung integrierter Dienste für
Analyse, Computing, Datenbank, Mobilgeräte, Netzwerkbetrieb, Speicher und Web, damit Sie noch flexibler
sind, mehr erreichen und dabei Geld sparen." Sie basiert auf der langjährigen Erfahrung von Microsoft im Betrieb
von großen Rechenzentren, die sogenannten Mega-Data-Center. [44] Diese Rechenzentren von Microsoft Azure
bieten verschiedene Dienstleistungskategorien an.
Zudem ist Windows Azure ein sehr offenes und interoperabel ausgelegtes System und kann sowohl Windows als
auch Linux Server als Plattform für den Betrieb von Services zur Verfügung stellen. [45] Durch die Integration von
Azure in die unternehmenseigene Software, können Unternehmen ihre vorhandenen Datenbanken verknüpfen.
Dadurch ist die Verwaltung sowohl im Datencenter des Unternehmens als auch in der Cloudlösung Azure
möglich. Nutzer haben somit die Möglichkeit sämtliche Dienste über den Webbrowser zu verwalten und diese in
der Cloud zur Verfügung zu stellen.[45]
? ?Daten in der Cloud speichern, sichern und wiederherstellen? [46]
? ?Unternehmensanwendungen auf Azure ausführen? [47]
? ?Umfangreiche Compute-Aufträge und leistungsfähige Prognoseanalysen durchführen? [48]
? ?Audio- und Videoinhalte skalierbar verschlüsseln, speichern und streamen? [49]
? ?Intelligente Produkte und Dienste anhand von IoT-Diensten (Internet der Dinge) erstellen?. [50]
4.4.4.3 HDInsight
HDInsight ist ein neuer Dienst von Microsoft, welcher auf Hadoop basiert, und auf der Hortonworks Plattform
gebaut ist. [51] Bei diesem Dienst handelt es sich um eine ?Hadoop-Verteilung?,[52] der die Verarbeitung von
strukturierten und unstrukturierten Daten in nahezu jeder Größe, um neue Erkenntnisse und neue
Geschäftsstrategien zu gewinnen, dem Kunden ermöglicht. Die neuen Ergebnisse können mit der Microsoft
Business Intelligence (BI) Plattform verknüpft werden, sodass jedem berechtigten Nutzer im Unternehmen, diese
zur weiteren Verarbeitung zur Verfügung gestellt werden. Es ist ?kein Kauf und keine Wartung von Hardware?[53]
nötig, sodass keine weiteren Kosten anfallen. Durch die Integration von HDInsight in Azure entfällt somit auch
der Zeitaufwand für die Installation oder Einrichtung.[54] Der Kunde kann Big Data-Workloads sowohl in
Windows als auch in Linux bereitstellen (Plattformunabhängigkeit). ?In Excel können Benutzer Azure HDInsight
als Datenquelle auswählen.? [55] Dies ermöglicht die problemlose Visualisierung von Hadoop-Daten in Excel. Des
Weiteren bietet HDInsight die Erstellung von Hadoop-Cluster in der Cloud in kürzester Zeit mit wenig Aufwand.
[56] Es werden viele Programmiersprachen mit leistungsstarken Programmiererweiterungen unterstützt. Dies
ermöglicht die problemlose Nutzung der Programmiersprache in Hadoop. [57]
4.4.4.4 Power BI
Mit diversen Power BI (Business Intelligence) Tools können Nutzer mit bekannten Werkzeugen wie Excel
?Daten aus eigenem Bestand oder der Cloud intuitiv erfassen, visualisieren und verteilen, Abfragen in natürlicher
Sprache formulieren und Echtzeitdaten auf jedem mobilen Endgerät nutzen". [44]
4.4.4.1 Big Data Lösung Microsoft
19
Marktüberblick_Big_Data_Software_Lösungen
4.4.5 Tableau
Tableau Software ist eine Business Intelligence Lösung, welche die Datenanalyse und -Berichte in einen
durchgehenden visuellen Prozess integriert. Tableau kann in beliebiger Branche eingesetzt werden. Sie schafft
einen leichten Zugang zu den Daten und deren Bearbeitung, so kann der Nutzer auf einfache Art die Daten nicht
nur präsentieren sondern auch untersuchen und verstehen. Tableau arbeitet mit lokalen Quellen wie z. B.
Text-Dateien, Excel-Tabellen, Access-Datenbanken, sowie extern mit den gängigen Datenbanksystemen wie
beispielsweise von MySQL, SAP, Oracle, IBM. Je nach Bedarf und Budget kann man zwischen den fünf
aktuellen Editionen von Tableau auswählen: Tableau Desktop - für jeden Bedarf, Tableau Online als
Cloud-Dienst, Tableau Server, sowie Tableau Public und Tableau Reader als kostenlose Versionen.
5 Schlussbetrachtung
5.1 Zusammenfassung
Zusammengefasst lässt sich sagen, dass der Markt Big Data noch ziemlich unerforscht ist und auch die
Technologien noch weiter verbessert werden können. Bisher zeichnet sich nur ab, dass die Hersteller, die auch in
anderen Lösungen einen großen Marktanteil besitzen, in dieser Sparte vorne liegen. Ein richtiger Big Data
Softwarespezialist ist noch nicht in Erscheinung getreten. Big Data ist auch nur in den USA verbreitet und nicht in
anderen Ländern. Auch hier wird es Veränderungen geben, sodass diese Lösung sich weiter verbreitet.
5.2 Ausblick
In Zukunft werden Unternehmen verstärkt auf diese Softwarelösungen setzen, um wettbewerbsfähig zu bleiben
und anderen Unternehmen etwas voraus zu haben. Aufgrund des massiven Anstiegs der Daten durch die mobilen
Endgeräte können große Datenmengen nur mit solch einer Lösung ausgewertet und analysiert werden. Die
Verbindung einer Big Data Lösung mit einer Cloud-Infrastruktur ist ein weiterer IT-Trend, der in den
kommenden Jahren an Bedeutung gewinnen wird. Die Daten müssen von überall abrufbar sein. So wird die
Anforderung an die Big Data-Lösungen in Zukunft heißen.
6 Anhang
6.1 Fußnoten
1. ? 1,0 1,1 Vgl. Dumbill (2012)
2. ? Vgl. Lohr (2012)
3. ? 3,0 3,1 3,2 3,3 3,4 3,5 Bitkom (2014), Seite 12
4. ? 4,0 4,1 Vgl. McAfee, Brynjolfsson (2012), Seite 62
5. ? 5,0 5,1 Bitkom (2014), Seite 14
6. ? Frauenhofer-Institut (2012), Seite 8
7. ? Gantz, Reinsel (2012), Seite 9
8. ? Vgl. Bitkom (2014), Seite 20
9. ? Vgl. Hadoop
10. ? Vgl. Hbase
4.4.5 Tableau
20
Marktüberblick_Big_Data_Software_Lösungen
11. ? 11,0 11,1 Vgl. Bachmann, Kemper, Gerzer (2014), Seite 48
12. ? Vgl. Bachmann, Kemper, Gerzer (2014), Seite 52
13. ? 13,0 13,1 Vgl. Bachmann, Kemper, Gerzer (2014), Seite 59
14. ? 14,0 14,1 14,2 14,3 14,4 14,5 14,6 Vgl. Bitkom-Presseinfo (04.04.2014)
15. ? 15,0 15,1 Vgl. Bitkom-Presseinfo (05.03.2014)
16. ? 16,0 16,1 16,2 Vgl. Capgemini (2015)
17. ? Vgl. Kurzlechner (2014)
18. ? 18,0 18,1 18,2 18,3 18,4 18,5 18,6 18,7 18,8 18,9 Vgl. Müller (2015)
19. ? 19,0 19,1 Vgl. CIO
20. ? Vgl. IBM-Produkte
21. ? 21,0 21,1 21,2 21,3 Vgl. IBM Hadoop-System
22. ? 22,0 22,1 22,2 22,3 22,4 Vgl. IBM BigInsights for Apache Hadoop
23. ? 23,0 23,1 23,2 23,3 23,4 23,5 23,6 Vgl. IBM BigInsights on Cloud
24. ? Vgl. IBM Stream-Computing
25. ? 25,0 25,1 Vgl. IBM Föderierte Erkennung und Navigation
26. ? 26,00 26,01 26,02 26,03 26,04 26,05 26,06 26,07 26,08 26,09 26,10 Vgl. Oracle
27. ? Vgl. Oracle Database 12c
28. ? Vgl. Oracle Big Data SQL
29. ? Vgl. Oracle NoSQL Database
30. ? Vgl. Oracle Big Data Connectors
31. ? Vgl. Oracle Big Data Discovery
32. ? 32,0 32,1 Vgl. Oracle Advanced Analytics
33. ? Vgl. Oracle Big Data Spatial and Graph
34. ? Vgl. Oracle Golden Gate for Big Data
35. ? 35,0 35,1 Vgl. Oracle Press Release (2014)
36. ? Vgl. Oracle Talent Management Cloud
37. ? 37,0 37,1 37,2 37,3 37,4 37,5 37,6 Bitkom (2014), Seite 182
38. ? 38,0 38,1 38,2 38,3 Vgl. Bitkom (2014), Seite 182
39. ? 39,0 39,1 39,2 39,3 39,4 Bitkom (2014), Seite 183
40. ? 40,0 40,1 40,2 Vgl. Bitkom (2014), Seite 183
41. ? Vgl. Färber et al. (2011), Seite 46
42. ? 42,0 42,1 42,2 42,3 Vgl. SAP
43. ? Vgl. Microsoft
44. ? 44,0 44,1 44,2 Vgl. Bitkom (2014), Seite 181
45. ? 45,0 45,1 Vgl Microsoft
46. ? Vgl. Microsoft Azure
47. ? Vgl. Microsoft Azure
48. ? Vgl. Microsoft Azure
49. ? Vgl. Microsoft Azure
50. ? Vgl. Microsoft Azure
51. ? Vgl. Microsoft HDInsight
52. ? Vgl. Microsoft HDInsight
53. ? Vgl. Microsoft HDInsight
54. ? Vgl. Microsoft HDInsight
55. ? Vgl. Microsoft HDInsight
56. ? Vgl. Microsoft HDInsight
57. ? Vgl. Microsoft HDInsight
6.1 Fußnoten
21
Marktüberblick_Big_Data_Software_Lösungen
6.2 Quellenverzeichnis
Lohr (2012)
Lohr, Steve: ?The Age of Big Data?, Hrsg.: The New York Times, 12. Februar 2012, auf S. SR1 in der NYT
Data?; http://www.nytimes.com/2012/02/12/sunday-review/big-datas-impact-in-the-world.html?_r=3&scp=
Dumbill
Dumbill, Edd: ?What is big data? An introduction to the big data landscape.?, Hrsg.: O'Reilly; https://beta.or
(2012)
McAfee,
McAfee, Andrew; Brynjolfsson, Erik: ?Big Data: The Management Revolution?, S. 62;
Brynjolfsson
http://ai.arizona.edu/mis510/other/Big%20Data%20-%20The%20Management%20Revolution.pdf
(2012)
o.V.: ?BIG DATA-VORSPRUNG DURCH WISSEN INNOVATIONSPOTENZIALANALYSE?, S. 8, Hrs
o.V. (2012)
http://www.iais.fraunhofer.de/fileadmin/user_upload/Abteilungen/KD/uploads_BDA/Innovationspotenziala
o.V.: ?Big-Data-Technologien - Wissen für Entscheider?, S. 12,14,20,182f, Hrsg.: BITKOM;
o.V. (2014)
http://www.bitkom.org/files/documents/BITKOM_Leitfaden_Big-Data-Technologien-Wissen_fuer_Entsche
o.V.
o.V.: ?Big Data Applications?, Hrsg.: SAP; http://www.sap.com/solution/big-data/software/applications.htm
o.V.
o.V.: ?Big Data Platform Solutions?, Hrsg.: SAP; http://www.sap.com/solution/big-data/software/platform.h
Gantz,
Gantz, John; Reinsel David: ?THE DIGITAL UNIVERSE IN 2020: Big Data, Bigger Digital Shadow, and B
Reinsel
IDC; http://www.emc.com/collateral/analyst-reports/idc-the-digital-universe-in-2020.pdf
(2012)
Färber et al. Färber, Franz; Cha, Sang Kyun; Primsch, Jürgen; Bornhörd, Christof; Sigg, Stefan; Lehner, Wolfgang: ?SAP
(2011)
Modern Business Applications?, S. 46, Hrsg.: SIGMOD Record; http://www.sigmod.org/publications/sigmo
o.V. (2014) o.V.: Presseinfo vom 04.04. ?Weltweiter Markt Big Data?, Hrsg.: BITKOM; http://www.bitkom.org/de/them
o.V. (2014) o.V.: Presseinfo vom 05.03. ?Großes Wachstum bei Big Data?, Hrsg.: BITKOM; https://www.bitkom.org/de
o.V.: EMC 2015 : Studie: ?So verändert Big Data den Markt?, Hrsg.: Capgemini;
o.V. (2015)
http://www.absatzwirtschaft.de/studie-so-veraendert-big-data-den-markt-46971/
Kurzlechner
Kurzlechner, Werner: ?Big Data Anbieter im Vergleich?, Hrsg.: CIO; http://www.cio.de/a/big-data-anbieter
(2014)
Müller
Müller, Dietmar: ?Die fünf Top-Kriterien bei der Evaluation Ihrer Analytics-Lösung?, Hrsg.:Arcplan;
(2015)
http://ibmexperts.computerwoche.de/a/die-fuenf-top-kriterien-bei-der-evaluation-ihrer-analytics-loesung,320
o.V.
o.V.: ?Integrierte Systeme im Check?, Hrsg.: CIO; http://www.cio.de/a/integrierte-systeme-im-check,80611
o.V.
o.V.: ?IBM-Produkte?, Hrsg.: IBM; http://www-03.ibm.com/software/products/de/category/bigdata
o.V.
o.V.: ?IBM Hadoop-System?, Hrsg.: IBM; http://www-03.ibm.com/software/products/de/category/SWP12
o.V.
o.V.: ?IBM BigInsights for Apache Hadoop?, Hrsg.: IBM; http://www-03.ibm.com/software/products/de/ibm
o.V.
o.V.: ?IBM BigInsights on Cloud?, Hrsg.: IBM; http://www-03.ibm.com/software/products/de/ibm-biginsig
o.V.
o.V.: ?IBM Stream-Computing?, Hrsg.: IBM; http://www-03.ibm.com/software/products/de/category/SWP1
o.V.
o.V.: ?IBM Föderierte Erkennung und Navigation?, Hrsg.: IBM; http://www-03.ibm.com/software/products
o.V.
o.V.: ?Welcome to Apache? Hadoop®!?, Hrsg.: Apache Software Foundation; http://hadoop.apache.org/
o.V.
o.V.: ?Apache HBase ? Reference Guide!?, Hrsg.: Apache Software Foundation; http://hbase.apache.org/
o.V.: ?Oracle Talent Management?, Hrsg.: Oracle;
o.V.
https://www.oracle.com/applications/human-capital-management/talent-management/acquisition/index.html
o.V.
o.V.: ?Oracle Big Data SQL?, Hrsg.: Oracle; http://www.oracle.com/us/products/database/big-data-sql/overv
o.V.
o.V.: "Oracle NoSQL Database", Hrsg.: Oracle; http://www.oracle.com/us/products/database/nosql/overview
o.V.
o.V.: ?Oracle Big Data Connectors?, Hrsg.: Oracle; http://www.oracle.com/us/products/database/big-data-co
o.V.
o.V.: ?Oracle Big Data Spatial and Graph?, Hrsg.: Oracle; https://www.oracle.com/database/big-data-spatial
o.V.
o.V.: ?Oracle Big Data Discovery?, Hrsg.: Oracle; https://www.oracle.com/big-data/big-data-discovery/inde
6.2 Quellenverzeichnis
22
Marktüberblick_Big_Data_Software_Lösungen
o.V.
o.V.
o.V.: ?Oracle Advanced Analytics?, Hrsg.: Oracle; http://www.oracle.com/us/products/database/options/adv
o.V.: ?Oracle GoldenGate for Big Data?, Hrsg.: Oracle; https://www.oracle.com/middleware/data-integratio
o.V.: ?Oracle Enterprise Metadata Management?, Hrsg.: Oracle;
http://www.oracle.com/us/products/middleware/data-integration/enterprise-metadata-management/overview
o.V.
6.3 Abbildungsverzeichnis
Abb.-Nr.
1
2
3
4
Abbildung
Opportunity for Big Data
Großes Wachstum bei Big Data
Big Data Vendor Benchmark 2015
Microsoft Azure
6.4 Tabellenverzeichnis
6.5 Abkürzungsverzeichnis
Abkürzung
Bedeutung
KMU
kleine und mittlere Unternehmen
BI
Business Intelligence-Lösung
BA
Business Analytics-Lösung
BYOD
Bring your own Device
CRM
Customer Relationship Management
SCM
Supply Chain Management
Herzlich Willkommen im winfwiki-System! Auf dieser Seite können Sie Ihre Inhalte einstellen. Folgende Schritte
sind dazu notwendig:
1. Autorenrechte beantragen
• Jeder Teilnehmer sollte sich zunächst als Autor registrieren.
• Bitte dazu den Link "Anmelden" oben rechts auf der Seite klicken, dann "Neues Benutzerkonto anlegen"
wählen und mit komplettem Namen, Matr.-Nr. und gültiger E-Mail-Adresse registrieren. Die Verifikation
der E-Mail-Adresse erfolgt sofort, die Schreibrechte werden Ihnen nach Prüfung schnellstmöglich
gewährt
2. Wiki-Syntax erlernen
• Hinweise für Studenten lesen: Hinweise für Studenten
• Mit dem Thema Inhaltsverzeichnis / Gliederung zuerst vertraut machen
3. Arbeiten mit dem System
• Erste Gliederung erstellen
• Schrittweise die Inhalte erstellen
Diese Hinweise können Sie natürlich aus Ihrem Dokument löschen, wenn Sie sie nicht mehr benötigen.
6.3 Abbildungsverzeichnis
23
Marktüberblick_Big_Data_Software_Lösungen
Viel Spass...!
6.5 Abkürzungsverzeichnis
24
Herunterladen