EINFÜHRUNGS- VORTRAG „BIG DATA“

Werbung
EINFÜHRUNGSVORTRAG
„BIG DATA“
„Datenanalyse als
neuer Produktionsfaktor
Produktionsfaktor“
20. Mai 2014
Gigantische Datenmengen x10
die Menge der digitalen Informationen verzehnfacht sich alle
5 Jahre
90%
der weltweit verfügbaren Daten
sind in den vergangenen 2 Jahren
entstanden
30 Milliarden
Einträge auf Facebook
jeden Monat
Um Erfolg im Markt zu haben ist es essentiell, nicht nur detaillierte Einblicke in die zukünftige Entwicklung
zu haben, sondern auch die Fähigkeit zu erarbeiten sich schnell einer bestimmten Entwicklung des Marktes
anpassen zu können
können.
Agenda
1
Nutzen und Bedeutung von Big Data
2
Einsatzmöglichkeiten von Big Data
3
Implementierung und Architektur
© 2014 KPMG AG Wirtschaftsprüfungsgesellschaft, a subsidiary of KPMG Europe LLP and a member firm of the KPMG network of independent
member firms affiliated with KPMG International Cooperative ("KPMG International"), a Swiss entity. All rights reserved.
3
Agenda
1
Nutzen und Bedeutung von Big Data
2
Einsatzmöglichkeiten von Big Data
3
Implementierung und Architektur
© 2014 KPMG AG Wirtschaftsprüfungsgesellschaft, a subsidiary of KPMG Europe LLP and a member firm of the KPMG network of independent
member firms affiliated with KPMG International Cooperative ("KPMG International"), a Swiss entity. All rights reserved.
4
Nutzen und Bedeutung von Big Data
Definition und Strukturierung des Big Data Begriffes
Für den Begriff Big Data findet sich in der Literatur und Presse keine einheitliche Definition.
Grundsätzlich lässt sich der Begriff aber wie folgt strukturieren:
Definition von “Big Data”
durch Unternehmen
Zi l t
Zielsetzungen
• Gewinnung und
Nutzung entscheidungsrelevanter Erkenntnisse
• Prozessoptimierung in
Echtzeit
Größere Bandbreiten an
I f
Informationen
ti
18%
Neue Arten von Daten
und Analysen
16%
15%
Echtzeitinformationen
Art der
Informationen
• qualitativ vielfältig
• unterschiedlich
strukturiert
• Integration aus
verschiedenen Quellen
Moderne Medienarten
13%
Zustrom von Daten aus
neuen Technologien
13%
Das neueste Modewort
Dynamik und
Umfang
• schneller Wandel der
Daten
• bisher unbekannter und
stetig wachsender
D t
Datenumfang
f
© 2014 KPMG AG Wirtschaftsprüfungsgesellschaft, a subsidiary of KPMG Europe LLP and a member firm of the KPMG network of independent
member firms affiliated with KPMG International Cooperative ("KPMG International"), a Swiss entity. All rights reserved.
10%
Große Datenmengen
Daten aus sozialen
Medien
8%
7%
0% 5% 10% 15% 20%
Quelle: IBM/Oxford University (Mitte 2012)
n = 1.144 IT- und Business Experten
weltweite Befragung
5
Nutzen und Bedeutung von Big Data
Unser Verständnis von Big Data auf einen Blick
Big Data umfasst die
Bereitstellung von
K
Konzepten,
t
M
Methoden,
th d
Tools, Technologien
und IT-Architekturen,
um das exponentiell
wachsende
h
d Angebot
A
b t
an vielfältigen
Informationen für
schnelle und fundierte
Entscheidungen
aufzubereiten.
Big Data bezeichnet die Hochgeschwindigkeits-Analyse großer Datenmengen aus
vielfältigen Quellen mit dem Ziel,
Ziel wirtschaftlichen Nutzen zu erzeugen
erzeugen.
Charakteristika von Big Data:
Volume
– Datenvolumen verdoppelt
pp sich ca. alle 2 Jahre
Variety
– Vielfältige Datenquellen und -formate (Soziale Netzwerke, GPS-Signale, Youtube-Videos, )
Velocity
– Die Geschwindigkeit der Datenauswertung („Echtzeit“) ist ein bedeutender Faktor
KPMG betrachtet dabei zusätzlich die folgenden Charakteristika:
Veracity
– Adäquate Governance- und Kontrollmechanismen ermöglichen es, sogar aus einer
Kombination aus strukturierten und verunreinigten Daten gute Einblicke zu gewinnen
Value
– Datenverfügbarkeit
Datenverfügbarkeit, Operative Prozessverbesserungen
Prozessverbesserungen, Entscheidungsunterstützung
Entscheidungsunterstützung, InnoInno
vationen & Produktentwicklung, Marketing & Sales, Monetarisierung der Daten- und -analyse
• Verbessertes Verständnis durch die
Verarbeitung großer Datenmengen
Big Clarity
Big Flexibility
Big Efficiency
© 2014 KPMG AG Wirtschaftsprüfungsgesellschaft, a subsidiary of KPMG Europe LLP and a member firm of the KPMG network of independent
member firms affiliated with KPMG International Cooperative ("KPMG International"), a Swiss entity. All rights reserved.
Big
Impact
• Flexible und schnelle Anpassung der
Datenanalyse
• Zeitnahe Bereitstellung von entschei
entscheidungsrelevanten Informationen
6
Nutzen und Bedeutung von Big Data
Kriterien zur Begriffscharakterisierung – „Das V5-Konzept“
Volume
•
Entstehung immer größerer Datenmengen
•
in oft unbekanntem Ausmaß für die
betreffenden Unternehmen
•
Variety
(strukturiert semi
(strukturiert,
semi-strukturiert
strukturiert, unstrukturiert)
•
Informationsquellen werden vielfältiger
•
neben dem klassischen Reporting werden
Datenströme zunehmend in Geschäfts-
Velocity
Veracity
Value
Komplexität zahlreicher Datentypen steigt
prozesse integriert (Echtzeitauswertungen)
•
Self-Service Business Intelligence
•
Zuverlässigkeit von Informationen
(naturgemäße Unvorhersagbarkeit)
•
Prozessverbesserungen
•
Entscheidungsunterstützung
•
Monetarisierung
© 2014 KPMG AG Wirtschaftsprüfungsgesellschaft, a subsidiary of KPMG Europe LLP and a member firm of the KPMG network of independent
member firms affiliated with KPMG International Cooperative ("KPMG International"), a Swiss entity. All rights reserved.
7
Nutzen und Bedeutung von Big Data
IT-Trends und deren Zusammenwirken mit Big Data
Cloud Computing und SaaS
Zunehmende Entwicklung dezentraler
Informationsbereitstellungskonzepte
Mobile Informationstechnologien
Entstehung stark wachsender
Datenmengen und Location Based
Services
Sensoren und M2M
Vernetzung
g von Produktionsgütern,
g
Maschinen und anderen Geräten
Big
Bi
Data
Neue Herausforderungen aber
auch Möglichkeiten für den
Umgang mit den Folgen dieser
IT-Trends
IT
Trends
Social Web
Erzeugung und Distribution von Content durch
die Nutzer von Social Media Anwendungen
Verfügbare Daten und die geeignete Technik,
diese auszuwerten,
auszuwerten sind
notwendige Voraussetzungen.
Aber wie kann die Nutzung dieser
I f
Informationen
ti
ffür U
Unternehmen
t
h
aussehen?
h ?
© 2014 KPMG AG Wirtschaftsprüfungsgesellschaft, a subsidiary of KPMG Europe LLP and a member firm of the KPMG network of independent
member firms affiliated with KPMG International Cooperative ("KPMG International"), a Swiss entity. All rights reserved.
8
Nutzen und Bedeutung von Big Data
Mithilfe der klassischen Datenanalyse konnten bisher nur strukturgleiche
und komplett strukturierte Daten verarbeitet werden
Big Data ermöglicht die integrative Analyse sowohl strukturierter, semistrukturierter als
auch unstrukturierter Daten.
Big Data
Datenwelt
Strukturiert
Semistrukturiert
Unstrukturiert
(Länge und Format definiert)
(Länge und Format teils definiert)
(Länge und Format undefiniert)
Maschinell generiert
Sensordaten (RFID,
medizinische Geräte, GPSDaten)
Web-Log-Daten (Aktivitäten
auf Servern und
Netzwerken)
Point-of-Sale-Daten
(Kundendaten am POS)
Finanzdaten (Aktienkurse)
vom Menschen generiert
Inputdaten (Dateneingabe
auf Computern)
Clickstream-Daten
(Websitelinks)
Spieldaten (Aufzeichnung
des Verhaltens bei OnlineSpielen etc.)
© 2014 KPMG AG Wirtschaftsprüfungsgesellschaft, a subsidiary of KPMG Europe LLP and a member firm of the KPMG network of independent
member firms affiliated with KPMG International Cooperative ("KPMG International"), a Swiss entity. All rights reserved.
Maschinell generiert
vom Menschen generiert
Satellitenbilder
(Satellitenüberwachung,
Wetterdaten)
Interne Textdaten
(Umfrageergebnisse, EMails)
Wissenschaftliche Daten
(Seismische u. athmosphärische Daten)
Social-Media-Daten
(Facebook, Youtube)
Fotos und Videos (Verkehr)
Mobildaten ((Standortinformationen, Messages)
Radar- und Sonardaten
(Ozeanographischseismische Profile)
Websiteinhalte
(verschiedene Inhalte auf
Websites)
9
Nutzen und Bedeutung von Big Data
Durch neue Methoden der Datenspeicherung und -verarbeitung können
Marktteilnehmer Wert aus vielfältigen Daten generieren
Es reicht nicht aus, relevante Daten zu identifizieren und zugänglich zu machen.
Entscheidend für den Erfolg ist die Kompetenz, diese Daten zu nutzen.
„Unternehmen, die die Bedeutung von Big Data und Business Analytics erkennen, weisen
eine doppelt so hohe Wahrscheinlichkeit auf zu den Top Performern in ihrer Industrie zu
zählen als andere Unternehmen.“ (MIT Sloan Management Review)
Big Data Value
Distribution &
Logistik
Produktion
Echtzeit-Korrektur
von Routen auf
Basis aktueller
Verkehrsdaten
Echtzeit-Analyse
von
Optimierung von
Lieferketten
Wartungskosten↓
Auswertung der
Machine-toMachineKommunikation
(M2M)
Personalkosten↓
Maschinendaten
Fehlerkosten↓
Bestandsdaten
Lagerkosten↓
Fehlmengenkosten↓
Forschung &
Entwicklung /
Innovation
Finanz- & RisikoControlling
Marketing & Sales
Besseres
Verständnis der
Kundenbedürfnisse
Neue Faktoren für
die Bewertung des
Kreditrisikos
Verkürzung der
Time to Market
Time-to-Market
Prognosen/
Simulationen/
Szenarien in
Echtzeit
Flexible
Personalisierung
des Angebots
(Customization)
Ständig aktuelle
V l
Values-at-Risk
t Ri k
Reduktion der
Streuverluste/
Marketingkosten
Echtzeit-Analyse
wissenschaftlicher
Experimente
(z B für neue
(z.B.
Medikamente)
© 2014 KPMG AG Wirtschaftsprüfungsgesellschaft, a subsidiary of KPMG Europe LLP and a member firm of the KPMG network of independent
member firms affiliated with KPMG International Cooperative ("KPMG International"), a Swiss entity. All rights reserved.
Betrugserkennung
Detailliertere
Marktsegmentierung
(Mikrosegmente)
Monetarisierung
von Daten und
deren -analyse
Verkauf
generierter Daten
(z.B. Kunden-,
Verkaufs-,
Produktionsdaten)
an externe Nutzer
Angebot von Big
Data-Analysetools
und -methoden
10
Nutzen und Bedeutung von Big Data
Evolution von einfacher Datenanalyse hin zu Big Data (technisch)
Nachverfolgung
Integration & Nu
utzen
Visualisierung
Benachrichtigung
Manuell
Reifegrad
■ Zeitversetzte
Z it
t t Analysen
A l
zur
nachträglichen Betrachtung
■ Manuelle Aufbereitung und
Interpretation der Analysen
■ Geringe Datengranularität
und
d Qualität
Q lität
■ Manuelle Verarbeitung
externer Informationen
■ Ausweitung
A
it
der
d
Datenerhebung
■ Vorhersagen basierend auf
Datenauswertungen
■ Nutzung von Data
W h
Warehouse/Mart
/M t
■ Systeme zur Unterstützung
von Entscheidungen
© 2014 KPMG AG Wirtschaftsprüfungsgesellschaft, a subsidiary of KPMG Europe LLP and a member firm of the KPMG network of independent
member firms affiliated with KPMG International Cooperative ("KPMG International"), a Swiss entity. All rights reserved.
■ K
Kontinuierliche
ti i li h und
d iterative
it ti
Verarbeitung von Daten
■ Neue Erkenntnisse im
Hinblick auf Business
Performance
A
d
von
■ Anwendung
statistischen Methoden
■ Vollständig automatisierte
Verarbeitung
■ Data Mining
■ Strukturgleiche Daten
notwendig
■ Daten als Produktionsfaktor
■ Analyse großer Datenvolumina
möglich
■ Verarbeitung strukturierter und
unstrukturierter Daten
■ Strukturunterschiede akzeptabel
■ Erkennen von komplexen
Zusammenhängen und Mustern
■ Datenauswertung in Echtzeit
■ Analyse von „externen
„externen“ Daten
11
Nutzen und Bedeutung von Big Data
Evolution von einfacher Datenanalyse hin zu Big Data (fachlich)
Nachverfolgung
Nu
utzen
Visualisierung
Benachrichtigung
Manuell
Komplexität
■ Standard
St d d Reporting
R
ti
■ Ad hoc Reporting
■ KPI Monitoring
■ Verstehen
V t h von
Businessfaktoren
■ Visualisieren von
Transaktionen
■ Anomalien erkennen
■ Visualisieren von
Beziehungen
Kontinuierliche
ti i li h und
d iterative
it ti
■ K
Verarbeitung von Daten
■ Neue Erkenntnisse im
Hinblick auf Business
Performance
■ Anwendung
A
d
von
statistischen Methoden
■ Vollständig automatisierte
Verarbeitung
■ Data Mining
■ Strukturgleiche Daten
notwendig
© 2014 KPMG AG Wirtschaftsprüfungsgesellschaft, a subsidiary of KPMG Europe LLP and a member firm of the KPMG network of independent
member firms affiliated with KPMG International Cooperative ("KPMG International"), a Swiss entity. All rights reserved.
■ Daten als Produktionsfaktor
■ Analyse großer Datenvolumina
möglich
■ Verarbeitung strukturierter und
unstrukturierter Daten
■ Strukturunterschiede akzeptabel
■ Erkennen von komplexen
Zusammenhängen und Mustern
■ Datenauswertung in Echtzeit
■ Analyse von „externen
„externen“ Daten
12
Nutzen und Bedeutung von Big Data
Big Data – Der Markt in Zahlen
Kennzahlen belegen ein rasantes Wachstum des Big Data Marktes. Daraus ergeben sich
sowohl für bestehende als auch für neue Unternehmen große Chancen, aber auch
H
Herausforderungen.
f d
Ein starkes Wachstum im
globalen Big Data Markt
Ø36%
jährlich
15 7 Mrd.
15,7
Mrd € in 2016
Ein neues Geschäftsmodell
270 Mio.
Mi €
globaler Umsatz durch „reine“
Big Data Companies
Optimistische Erwartungen
43%
der Unternehmen
erwarten einen
ROI > 25%
Ein wachsendes Angebot
80
weltweit nennenswerte
Unternehmen bieten bereits
Big Data Lösungen an
Vorreiter
E-BusinessUnternehmen
sind prädestiniert für Big Data
Anwendungen
Neue Anbieter mit Big DataLösungen
Parstream, Exasol,
Empolis & Mellmo
gesellen sich zu
Microsoft, SAP & Co.
Kompatibilität
wachsenden Marktanteile
Schnittstellen
Die Umsatzanteile von
Europa (27% )
ermöglichen den graduellen
Übergang von konventionellen
Systemen und neuen
und den USA (42%) im globalen
Technologien zu Big Data
Big Data-Markt gleichen
Lösungen
sich an*
an
Quelle: BITKOM , Experton Group 2012
*Größere anfängliche Bedenken hinsichtlich des Datenschutzes und der Datensicherheit (vor allem in
Deutschland)) haben den USA g
gegenüber
g
Europa
p einen Vorsprung
p g in der Entwicklung
g verschafft. Es wird
erwartet, dass sich diese Marktanteile durch die Anpassung der europäischen Richtlinien auf einander
zubewegen.
© 2014 KPMG AG Wirtschaftsprüfungsgesellschaft, a subsidiary of KPMG Europe LLP and a member firm of the KPMG network of independent
member firms affiliated with KPMG International Cooperative ("KPMG International"), a Swiss entity. All rights reserved.
13
Agenda
1
Nutzen und Bedeutung von Big Data
2
Einsatzmöglichkeiten von Big Data
3
Implementierung und Architektur
© 2014 KPMG AG Wirtschaftsprüfungsgesellschaft, a subsidiary of KPMG Europe LLP and a member firm of the KPMG network of independent
member firms affiliated with KPMG International Cooperative ("KPMG International"), a Swiss entity. All rights reserved.
14
Einsatzmöglichkeiten von Big Data
Big Data ermöglicht Performanceverbesserungen und das Aufdecken neuer
Potentiale auf allen Stufen der Wertschöpfungskette
2
Infrastructure
Präventivanalyse zur
Verhinderung des
A f ll wichtiger
Ausfalls
i hti
Unternehmensysteme
Inbound Logistics
Nutzung von RealtimePOS-Daten zur
Identifizierung von Outof-Stock-Situationen
und Benachrichtigung
der Lieferanten
6
4
Procurement
Kombinierte
Auswertung von
O li
Onlinerabattangeboten
b tt
b t
und eigenen Lagerbeständen
6
Operations
Verhinderung
machineller
Produktionsausfälle
durch RealtimeAuswertung der
Maschinendaten
7
7
8
9
Service
S
In
nbound
Lo
ogistics
4
Ma
arketing
& Sales
3
Ou
utbound
Lo
ogistics
2
5
Tech. Development
Verbesserte
Informationsverarb it
beitung
und
d –analyse
l
sowie Erweiterung des
Unternehmens-Knowhow
Infrastructure
Human Resource Management
Technology Development
Procurement
1
5
3
HR Management
Schnelle und bedarfsgerechte Reaktion auf
saisonale
i
l S
Schwanh
kungen, kurzfristige
Änderungen etc. durch
Big Data-Analysen
Operations
1
Outbound Logistics
Predictive Analytics zur
zielgenauen Prognose
von Absatzmengen –
Vermeidung des
Aufbaus von unnötigen
Lagerbeständen
© 2014 KPMG AG Wirtschaftsprüfungsgesellschaft, a subsidiary of KPMG Europe LLP and a member firm of the KPMG network of independent
member firms affiliated with KPMG International Cooperative ("KPMG International"), a Swiss entity. All rights reserved.
8
Marketing & Sales
Zielgenaue Kundenansprache durch
Auswertung von Social
Media-Profilen und
sonstigen Kundendaten
9
Service
Auswertung von
Kundenfeedback aus
externen Kanälen zur
Verbesserung der
Serviceaktivitäten
15
Einsatzmöglichkeiten von Big Data
Nutzung von Informationen – Was bedeutet Big Data für Unternehmen?
Wo kommen Big Data Analysen heute schon zum Einsatz? – einige Beispiele
Daten
Anwendungen
Nutzung
Fraport AG
Auswertung von Sensor-Daten zur Vorhersage der Fluggast-Ströme
Fluggast-Ströme, um so Warteschlangen an den
Abfertigungspunkten weitestgehend zu vermeiden
Sears Corp. (US-amerikanischer Handelskonzern)
Kombination von Daten über Kunden, Produkte und Werbung zur Entwicklung kundenindividueller Werbung
((heute auch von vielen anderen Handelsunternehmen, wie Amazon, genutzt)
g
)
VISA Inc.
Kann über Kreditkartentransaktionen vorhersagen, welches Ehepaar sich in absehbarer Zeit scheiden lässt,
woraus auf die Kreditwürdigkeit geschlossen werden kann
Weitere Beispiele für
Einsatzszenarien
Branche
Einsatzmöglichkeiten
Energiewirtschaft
Steuerung des Energieverbrauches
(über Speicherung und Auswertung von Messwerten)
Finanzwirtschaft
Zahlungsstromanalysen zur Betrugserkennung
Handel
Click-Stream-Analysen im Online Handel
(Echtzeit-)Kundenanalysen / Kaufverhaltensanalysen
Telekommunikation
Location-Tracking Händler können diese Daten in Echtzeit
verwenden, um Verbraucher, die in der Nähe von Shops sind,
über Angebote zu informieren
S i l Web
Social
W b
IIndividualisierte
di id li i t Werbung
W b
Echtzeitanalysen des Nutzerverhaltens
© 2014 KPMG AG Wirtschaftsprüfungsgesellschaft, a subsidiary of KPMG Europe LLP and a member firm of the KPMG network of independent
member firms affiliated with KPMG International Cooperative ("KPMG International"), a Swiss entity. All rights reserved.
16
Einsatzmöglichkeiten von Big Data
Big Data Aktivitäten von Unternehmen weltweit und in Deutschland
Was sagen empirische Studien über den Planungsstand von
Unternehmen zum Thema Big Data?
Anteil an Unternehmen mit Big
g Data Initiativen in 2012
Big Data Aktivitäten - internationaler Querschnitt
Noch keinerlei Big DataAktivitäten gestartet
Big Data Aktivitäten
geplant
34%
Deutschland
Pilotprojekte begonnen
und erste Big Data
Lösungen implementiert
66%
28%
48%
53%
Total
24%
0%
10%
20%
30%
47%
40%
50%
mit Big Data Initiative 2012
Quelle: IBM/Oxford University (Mitte 2012) / n = 1061 / weltweite Studie
60%
70%
80%
90%
100%
ohne Big Data Initiative 2012
Quelle: TATA Consultancy Services / n = 1.217 / weltweite Studie
Big Data Aktivitäten in deutschen Unternehmen
Heute noch kein
Thema, auch nicht
in Planung
25%
Heute noch kein
Thema, aber
geplant
24%
Bereits
implementiert
8%
Mit der Thematik
beschäftigt, aber
noch nicht
umgesetzt
43%
%
Key Findings zum Planungsstand
alle Studien bestätigen, dass sich der Großteil der
U t
Unternehmen
h
mitit der
d Thematik
Th
tik befasst
b f
t
Jedoch nur wenige Unternehmen konnten ihre Big Data
Projekte bereits umsetzen
fast 50% der deutschen Unternehmen befassten sich 2012
noch nicht mit Big Data, nur wenige haben Projekte bereits
umgesetzt
Quelle: Experton Group(Mrz./Apr. 2012) / n = 63 / deutschlandweite Studie
© 2014 KPMG AG Wirtschaftsprüfungsgesellschaft, a subsidiary of KPMG Europe LLP and a member firm of the KPMG network of independent
member firms affiliated with KPMG International Cooperative ("KPMG International"), a Swiss entity. All rights reserved.
17
Einsatzmöglichkeiten von Big Data
Welche Ziele verfolgen Unternehmen mit der Auswertung der Big Data?
In welchen Bereichen fokussierten Unternehmen
branchenübergreifend ihre Big Data Investitionen in 2012
Distribution/Logistik
7%
HR
5%
Die wichtigsten Zielsetzungen von Big Data Projekten für Unternehmen
Mitarbeiterzusammenarbeit
4%
Andere
7%
Neues Geschäftsmodell
14%
Vertrieb
15%
Finance/Accounting
8%
kundennaher Einsatz
43%
Herstellung/Produkti
on
8%
Marketing
15%
Risiko-/Finanzmanagement
15%
Kundenorientierte
Ergebnisse
49%
Kundenservice
13%
IT
11%
Betriebliche Optimierung
18%
Produktentwicklung
11%
Quelle: TATA Consultancy Services / n = 1.217 / weltweite Studie
Quelle: IBM/Oxford University (Mitte 2012) / n = 1067 / weltweite Studie
Key Findings zum Einsatzgebiet und den Zielen
Insgesamt stehen vor allem vertriebsnahe Beweggründe im
Z
Zusammenhang
h
mitit Big
Bi D
Data
t P
Projekten
j kt iim V
Vordergrund
d
d
Auch die deutschlandweite Studie der EXPERTON Group sowie
eine Studie des Fraunhofer Institutes führen zu einem ähnlichen
Resümee
Viel Potential wird zudem im Logistik-Bereich gesehen
© 2014 KPMG AG Wirtschaftsprüfungsgesellschaft, a subsidiary of KPMG Europe LLP and a member firm of the KPMG network of independent
member firms affiliated with KPMG International Cooperative ("KPMG International"), a Swiss entity. All rights reserved.
18
Agenda
1
Nutzen und Bedeutung von Big Data
2
Einsatzmöglichkeiten von Big Data
3
Implementierung und Architektur
© 2014 KPMG AG Wirtschaftsprüfungsgesellschaft, a subsidiary of KPMG Europe LLP and a member firm of the KPMG network of independent
member firms affiliated with KPMG International Cooperative ("KPMG International"), a Swiss entity. All rights reserved.
19
Implementierung und Architektur
Anforderungen an Technologien zur Nutzung der Big Data
Big
Data
Welche Folgen haben diese
Dimensionen von Big Data
für die IT?
Daten
Anwendungen
Nutzung
Folgen für Software-Lösungen
Insbesondere im Software-Bereich vollziehen sich
signifikante Veränderungen, um den
Anforderungen an die Big Data gerecht zu werden
Es ergeben sich deutliche Veränderungen für
Datenbank-Technologien und Schwerpunkte
bestehender Datenbanken verändern sich
Folgen für Hardware-Lösungen
Ausbau der Bandbreiten zur Datenübermittlung
Speichermöglichkeiten der wachsenden Daten
Bereiche, in denen mit den größten Wirkungen auf die IT-Infrastruktur gerechnet wird
Sonstige
33%
0%
67%
Kapazität Bandbreite
64%
26%
10%
Netzwerk-Infrastruktur
(Switching, Router, Loadbalancing)
64%
26%
10%
Storage / Datenbanken
76%
Server / CPU-Last
23%
64%
Analyse- & Reportingsysteme
30%
55%
0%
10%
20%
30%
1%
6%
32%
40%
hohe Zustimmung
50%
60%
mittlere Zustimmung
70%
13%
80%
90%
100%
niedrige Zustimmung
Quelle: Experton Group(Mrz./Apr. 2012) / n = 85 / deutschlandweite Studie
© 2014 KPMG AG Wirtschaftsprüfungsgesellschaft, a subsidiary of KPMG Europe LLP and a member firm of the KPMG network of independent
member firms affiliated with KPMG International Cooperative ("KPMG International"), a Swiss entity. All rights reserved.
20
Implementierung und Architektur
Analytische versus Big Data Systeme und die Auswirkungen auf den
Analyseprozess
Vergleich der Schwerpunkte
Analytische
Systeme (DW / BI)
Prozess der Big Data Analyse
(explorative Analyse)
Big Data
Systeme
Zentrale Datenhaltung,
alle
ll D
Daten
t müssen
ü
exakt
kt
zueinander passen
Daten existieren an mehreren
St ll
Stellen,
U
Ungenauigkeiten
i k it
sind akzeptabel
Qualitativ hochwertige
Daten
Einfachheit der Nutzung
Strukturierte, bereinigte
und aggregierte Daten
Verarbeitung der Rohdaten
mit vielen unterschiedlichen
Formaten
Wiederkehrende Berichte
Interaktion in Echtzeit
Periodische Erstellung
Optimiert für Flexibilität
Zentralistische
Organisation
Heterogene, dezentrale
Organisation
© 2014 KPMG AG Wirtschaftsprüfungsgesellschaft, a subsidiary of KPMG Europe LLP and a member firm of the KPMG network of independent
member firms affiliated with KPMG International Cooperative ("KPMG International"), a Swiss entity. All rights reserved.
Business und IT
identifizieren Datenquellen
IT stellt Plattform zur
Verfügung
Business bewertet Daten
(Basis für kreatives
Erkunden der Daten)
Ergebnisse werden mit
klassischen Quellen
zusammengeführt
21
Implementierung und Architektur
Überwindung der Herausforderungen bei der operativen Umsetzung der Big
Data-Lösung
Stufe
Datenaufzeichnung / sammlung
Umsetzung
Herausforderungen
Identifikation relevanter Datenquellen
Definition geeigneter Filter
„Filterung“
Filt
“d
der nützlichen
üt li h D
Daten
t
Definition
D fi iti d
der „richtigen“
i hti
“M
Metadaten
t d t
Generierung von Metadaten zur Beschreibung
und Aufzeichnung der Daten
Datenbanksysteme, die den Ursprung der
Daten nachvollziehen (Provenance)
Datenextraktion aus Originalquelle
g
q
Extraktion / Bereinigung
Überführung in analysefähige Formate
Schwierigkeiten bei der Überführung der
Formate (applikationsabhängig)
Bereinigung der Daten zur Validierung
(Fehlermodelle)
Fehlermodelle und Datenbereinigungsmethoden existieren oft noch nicht
Integration / Bereinigung
Datenintegration zur Ermöglichung
automatisierter Computeranalyse
Datenbankdesign und -struktur
Datenabfrage und Data Mining
Analyse / Modellierung
Interpretation
Heterogenität der Daten
Frühe Entwicklungsstufe der Big Data
Integration
Vor- und Nachteile einzelner Designs
Interaktive Datenanalyse / Realtimeabfrage
Heterogenität, Dynamik, Interaktion und
geringe Vertrauenswürdigkeit von Big Data
Verbindung von Datenbanken und AnalyticsSoftware
Koordination zwischen Datenbanken und
Analytics-Software
Applikationen, welche Nachvollziehbarkeit der
Analyseergebnisse und ihrer Annahmen
(Provenance) gewährleisten
In bestimmten Fällen geringe Vertrauenswürdigkeit und Fehleranfälligkeit von Big
Data
Visualisierung der Ergebnisse
Komplexität erschwert die Visualisierung
© 2014 KPMG AG Wirtschaftsprüfungsgesellschaft, a subsidiary of KPMG Europe LLP and a member firm of the KPMG network of independent
member firms affiliated with KPMG International Cooperative ("KPMG International"), a Swiss entity. All rights reserved.
22
Implementierung und Architektur
Auswirkungen auf die IT-Architektur der transaktionalen und analytischen
Systeme
Durch die veränderten Schwerpunkte, die sich durch Big Data Systeme ergeben, entstehen
auch veränderte technische Anforderungen. Folgende Techniken spielen besonders
wichtige Rollen.
In-Memory
A li ti
Application
Verteilung von Daten auf Knoten
(Skalierbarkeit durch Parallelisierung
der Auswertung)
Verarbeitung mit „Map-Reduce““ Technik
(Datenanalyse, die Informationen
strukturiert, shuffelt und anschließend
reduziert))
Ablage von Daten im Arbeitsspeicher
Ermöglicht deutlich schnellere
Datenbank-Abfragen
Vor allem für analytische Anwendungen
geeignet
i
t
Steht für „Not only SQL“
Datenbanken die einen nicht
Datenbanken,
nichtrelationalen Ansatz verfolgen
Verzicht auf starre Schemata, Daten
werden ohne feste Struktur gespeichert
© 2014 KPMG AG Wirtschaftsprüfungsgesellschaft, a subsidiary of KPMG Europe LLP and a member firm of the KPMG network of independent
member firms affiliated with KPMG International Cooperative ("KPMG International"), a Swiss entity. All rights reserved.
Die bestehende ITInfrastruktur vieler
Unternehmen erlaubt einen
graduellen Übergang auf
Big Data Lösungen bzw.
bzw die
Integration mit Big Data
Konzepten
23
Implementierung und Architektur
Maßgeschneiderte Big Data-Architektur für Ihren Anwendungsfall
Um das große Datenvolumen schnell verarbeiten zu können, ist der Aufbau einer maßgeschneiderten Big Data-Architektur notwendig.
Reports
Dashboards
BI Suite
Alerts
Cockpits
p
Modelle
Reporting & Visualisierung
Analyse
Analytics (Traditionell & Advanced)
Analytische Data Warehouses & Data Marts
SQL
In Memory DB
ODS
Stream Engine
„KI“
KI“ IIndizes
di
DW
Beliebige
Analytics
-Tools
Informationsbeschaffung
Datenbanken & Tools
Operative Datenbanken
Beliebige
Reporting
-Tools
Tools
Daten
Verfeinerung
(Hadoop)
Transformation
Laden
SQL, No SQL
New SQL, Files
Automa
atisierte Ab
blaufsteuerrung
Visualisierung
Big Data Applikationen
Sicherheitsinfrastruktur
Physische Infrastruktur
© 2014 KPMG AG Wirtschaftsprüfungsgesellschaft, a subsidiary of KPMG Europe LLP and a member firm of the KPMG network of independent
member firms affiliated with KPMG International Cooperative ("KPMG International"), a Swiss entity. All rights reserved.
24
Implementierung und Architektur
Technologien & Informationsaustausch
Big Data – Technologien (Auswahl)
Regelmäßiger
Informationsaustausch
Verteilung von Daten auf Knoten
(Skalierbarkeit durch Parallelisieren der
Auswertung)
Verarbeitung mit „Map-Reduce“ Technik
(Datenanalyse, die Informationen
strukturiert, verteilt und anschließend
reduziert)
In-Memory
Application
Ablage von Daten im Arbeitsspeicher
Ermöglicht deutlich schnellere
Datenbank-Abfragen
Vor allem für analytische Anwendungen
geeignet
Steht
St
ht für
fü „Not
N t only
l SQL“
Datenbanken, die einen nicht-relationalen
Ansatz verfolgen
Verzicht auf starre Schemata, Daten
gespeichert
p
werden ohne feste Struktur g
© 2014 KPMG AG Wirtschaftsprüfungsgesellschaft, a subsidiary of KPMG Europe LLP and a member firm of the KPMG network of independent
member firms affiliated with KPMG International Cooperative ("KPMG International"), a Swiss entity. All rights reserved.
HANA
25
Implementierung und Architektur
Funktionsweise von Hadoop
Zweii grundlege
ende
technische Prinz
zipien
Der Einsatz hat Folgen für:
Volume
Variety
Velocity
• Cluster-Datei-System verteilt die
Daten auf verschiedene Systeme in
HDFS*
einem Rechnerverbund
Map
Reduce
• Ablage der Daten in zerlegter Form (die Größe der
Datenblöcke ist vom System definiert)
• Replikation der Blöcke beugt Datenverlust bei
Knotenausfall vor („Sicherheits-Blöcke“)
• Datenverarbeitung im Ablageort
durch die Aufteilung der Datenverarbeitung in kleine Portionen und
ihre parallele Abwicklung
Systemvoraussetzungen für den Hadoop-Einsatz
Grundsätzlich mit Hilfe von Standardrechnern durchführbar
Dateisystem muss auf Fehlertoleranz ausgelegt sein, da in einem solchen Rechnerverbund von Hardwareausfällen
auszugehen ist (funktioniert mit beschriebener Replikation der Blöcke)
Java Developer Kit ab V 1.6
Linux als Betriebssystem wird empfohlen
*HDFS = Hadoop Distributed File System
© 2014 KPMG AG Wirtschaftsprüfungsgesellschaft, a subsidiary of KPMG Europe LLP and a member firm of the KPMG network of independent
member firms affiliated with KPMG International Cooperative ("KPMG International"), a Swiss entity. All rights reserved.
26
Implementierung und Architektur
Funktionsweise von in Memory-Datenbanken
In-Memory
Der Einsatz hat Folgen für:
Velocity
Application
Warum ist das Speichern
p
von Informationen im Arbeitsspeicher
für Big Data Analysen so interessant?
Wenn Daten im Arbeitsspeicher und nicht auf anderen Speichermedien abgelegt werden, wird
die Geschwindigkeit erhöht, mit der Datenbanken auf diese Daten zugreifen können.
Daten können schnell ausgewertet und damit
beispielsweise sogar in Echtzeit in Prozesse
eingebunden werden!
© 2014 KPMG AG Wirtschaftsprüfungsgesellschaft, a subsidiary of KPMG Europe LLP and a member firm of the KPMG network of independent
member firms affiliated with KPMG International Cooperative ("KPMG International"), a Swiss entity. All rights reserved.
27
Implementierung und Architektur
Funktionsweise von NoSQL
Der Einsatz hat Folgen für:
Variety
y
Was macht den Einsatz einer Datenbanksprache,
die nicht nur relationale Datenstrukturen verarbeiten können,
notwendig?
Unstrukturierte Datenmengen können nicht
mit Datenbanken ausgewertet werden, die
auf Relationen und Tabellen aufbauen.
W ist
Was
i t der
d U
Unterschied
t
hi d von NoSQL
N SQL zu herkömmlichen
h kö
li h SQL
SQL-Datenbankstrukturen?
D t b k t kt
?
NoSQL benutzt eine festen Tabellenschemata als Datenspeicher
SQL kann schlecht mit häufig ändernden Datenstrukturen umgehen, die aber zunehmend wichtiger werden
NoSQL hat nur geringe Sicherheit bezüglich der Datenkonsistenz, deren Problematik sich jedoch aufgrund der häufig
extrem hohen Datenmenge relativiert
© 2014 KPMG AG Wirtschaftsprüfungsgesellschaft, a subsidiary of KPMG Europe LLP and a member firm of the KPMG network of independent
member firms affiliated with KPMG International Cooperative ("KPMG International"), a Swiss entity. All rights reserved.
28
Implementierung und Architektur
Big Data Security – Exemplarische Risiken entlang der Prozesskette
Risiken für die Datensicherheit und den Datenschutz existieren entlang der gesamten
Prozesskette von der Erfassung bis zur Bereitstellung der Berichte. Die Sicherheitsanforder ngen steigen mit Z
anforderungen
Zunahme
nahme der Datenmenge
Datenmenge, der Daten
Datenvielfalt
ielfalt und
nd der
Geschwindigkeit der Verarbeitung.
Exemplarische
Darstellung
g
Risiken:
• Verlust der Vertraulichkeit im
Datentransfer
• Nicht-autorisierte Änderung von Daten
im Transfer
Risiken:
• Netzwerk
N t
k nicht
i ht verfügbar
fü b
• Fehler während der Übertragung
Erfassung / Extraktion
SAP
!
NonSAP
Berichtswesen
Analyse
!
Analytics
!
!
!
Quellsysteme
Risiken:
• Datensynchronisation nicht möglich, da
Quellsysteme nicht verfügbar
• Nichteinhaltung von Gesetzen bei der
Erfassung
g und Speicherung
p
g von Daten
• Unsichere Rechtslage bei der
Verarbeitung (z.B. bzgl. Datenschutz)
Risiken:
• Nicht-authorisierte Änderungen
von Daten
• Gefahr von Datenschutzverstössen
durch Anreicherung von Daten
• Mangelnde Zugriffskontrolle auf
Daten
© 2014 KPMG AG Wirtschaftsprüfungsgesellschaft, a subsidiary of KPMG Europe LLP and a member firm of the KPMG network of independent
member firms affiliated with KPMG International Cooperative ("KPMG International"), a Swiss entity. All rights reserved.
Risiken:
• Mangelnder Zugriffsschutz
• (Nachträgliche) Manipulation der
Berichte?
29
Implementierung und Architektur
Big Data Security – Risikobewertung
Erfassung / Extraktion
SAP
1
3
4
NonNon
SAP
Berichtswesen
Analyse
1
2
1
A l ti
Analytics
1
3
2
3
4
Quellsysteme
Exemplarisch
Top Risiken (Auszug)
2
IT Risiko Matrix (exemplarisch)
Sehr
Hoch
Gefährdung der Aussagequalität der Berichte aufgrund
von nicht autorisierten Änderungen der Daten oder dem
Verlust der Verfügbarkeit einzelner Komponenten
Verlust der Vertraulichkeit /Integrität während der
Datenübertragung durch unzureichende
Sicherheitsmaßnahmen (Keine digitalen Signaturen,
keine Verschlüsselung)
g)
3
Verlust der Zugriffskontrolle von Daten durch
unzureichende Berechtigungskonzepte
4
Nichteinhaltung von Gesetzen und
Unternehmensrichtlinien
5
Unsichere Rechtslage z.B. hinsichtlich des
Datenschutzes kann zu unbewussten rechtlichen
Verstößen führen
Wahrsche
einlichkeit
1
1
2
3
Mittel
4
5
Sehr
Gering
Sehr
niedrig
© 2014 KPMG AG Wirtschaftsprüfungsgesellschaft, a subsidiary of KPMG Europe LLP and a member firm of the KPMG network of independent
member firms affiliated with KPMG International Cooperative ("KPMG International"), a Swiss entity. All rights reserved.
4
Mittel
Kritisch
Schadenshöhe
30
Ansprechpartner
Michael Brenner
Moritz Schneider
Senior Manager
Consulting
Manager
Consulting
Alfredstraße 277
D 45133 Essen
[email protected]
Tel.
+49 (201) 455-8569
Mobil +49 (174) 3277231
© 2014 KPMG AG Wirtschaftsprüfungsgesellschaft, a subsidiary of KPMG Europe LLP and a member firm of the KPMG network of independent
member firms affiliated with KPMG International Cooperative ("KPMG International"), a Swiss entity. All rights reserved.
Tersteegenstraße 19-31
D40474 Düsseldorf
[email protected]
Tel.
+49 (211) 475-8679
Mobil +49 (174) 3904722
31
© 2014 KPMG AG Wirtschaftsprüfungsgesellschaft, a
subsidiary of KPMG Europe LLP and a member firm of the
KPMG network of independent member firms affiliated with
KPMG International Cooperative ("KPMG International"), a
Swiss entity. All rights reserved.
Der Name KPMG, das Logo und „cutting through
complexity“ sind eingetragene Markenzeichen von KPMG
International Cooperative („KPMG
( KPMG International
International“)).
Herunterladen