ODI für Big Data

Werbung
ODI für Big Data
mehr als Konnektoren
Bodo Clausen
Senior Consultant & Competence Center Big Data Lead
Opitz Consulting Deutschland GmbH
ODI für Big Data - mehr als Konnektoren
© OPITZ CONSULTING GmbH 2016
Seite 1
Mission
Märkte
Wir entwickeln gemeinsam mit allen
Branchen Lösungen, die dazu führen, dass
sich diese Organisationen besser entwickeln
als ihr Wettbewerb.
 Branchenübergreifend
 Über 600 Kunden
Unsere Dienstleistung erfolgt
partnerschaftlich und ist auf eine langjährige
Zusammenarbeit angelegt.
29%
Handel / Logistik /
Dienstleistungen
29%
Industrie / Versorger /
Telekommunikation
42%
Öffentliche Auftraggeber / Banken und
Versicherungen / Vereine und Verbände
Leistungsangebot
Eckdaten
 Business IT Alignment
 Business Information Management
 Business Process Management
 Anwendungsentwicklung
 SOA und System-Integration
 IT-Infrastruktur-Management
 Gründung 1990
 400 Mitarbeiter
 8 Standorte
ODI für Big Data - mehr als Konnektoren
© OPITZ CONSULTING GmbH 2016
Seite 2
Themen
 Apache Hadoop?
 Startschwierigkeiten Big Data PoC
 Pragmatischer Start
 DWH Offload
 Beispiel DWH Offload mit dem ODI
 Beispiele
 Apache Hive
 Apache Pig
ODI für Big Data - mehr als Konnektoren
© OPITZ CONSULTING GmbH 2016
Seite 3
Hadoop ist
 ein Framework für die
Verwaltung von ClusterKapazitäten.
 eine Software, welche
Redundanz und Lastverteilung
gewährleistet.
 auf Skalierung mit
kostengünstiger Commodity
Hardware ausgelegt.
 eine Open-Source Plattform für
viele andere Werkzeuge.
ODI für Big Data - mehr als Konnektoren
© OPITZ CONSULTING GmbH 2016
Seite 4
Hersteller nutzen Hadoop um
 ihre Software skalierbarer zu
machen
 performanceoptimierte
Appliancelösungen
anbzubieten
 eine kostengünstige
Storagealternative anbieten zu
können.
ODI für Big Data - mehr als Konnektoren
© OPITZ CONSULTING GmbH 2016
Seite 5
Apache betreut 30+ Toplevel Big Data Projekte
 spezialisierter Anwendungszweck
 Keine Allrounder!
ODI für Big Data - mehr als Konnektoren
© OPITZ CONSULTING GmbH 2016
Seite 6
Startschwierigkeiten Big Data PoC
 Use Cases Identifizieren
 Gedanken zum Datenschutz
 Tools auswählen
 Distribution auswählen
 Hardware Sizing und ggf. Anschaffung
 Infrastruktur aufsetzen/installieren
 PoC umsetzen
ODI für Big Data - mehr als Konnektoren
© OPITZ CONSULTING GmbH 2016
Seite 7
Pragmatischer Start
 Use Case DWH Offload
 Infrastruktur Big Data Lite VM
 Möglichkeiten ODI
 Danach weitere Use Cases?
 Entwicklungs Cluster aufsetzen
 vielleicht Oracle Big Data Appliance
ODI für Big Data - mehr als Konnektoren
© OPITZ CONSULTING GmbH 2016
Seite 8
DWH Offload: Was ist das?
 Einfaches ETL und Daten auf Hadoop Cluster auslagern
 Daten empfangen
 Daten aggregieren
 Daten filtern
 Daten historisieren
 Daten persistieren
 Vorteile
 Platz für wichtigere Daten im DWH
 Resourcen frei für Analytics
 Neue Verarbeitungsmöglichkeiten
ODI für Big Data - mehr als Konnektoren
© OPITZ CONSULTING GmbH 2016
Seite 9
Das bedeutet in diesem Fall
ODI für Big Data - mehr als Konnektoren
© OPITZ CONSULTING GmbH 2016
Seite 10
Ist Zustand
Operationales System
Staging Area
Data Mart
SALES
SA_SALES
SALES_PRD_CST_MLY
Src 2 Staging
ODI für Big Data - mehr als Konnektoren
Staging 2 DM
© OPITZ CONSULTING GmbH 2016
Seite 11
Source 2 Staging (Oracle)
Logical Design
ODI für Big Data - mehr als Konnektoren
© OPITZ CONSULTING GmbH 2016
Seite 12
Source 2 Staging (Oracle)
Physical Design
ODI für Big Data - mehr als Konnektoren
© OPITZ CONSULTING GmbH 2016
Seite 13
Umwandlung zu Apache Hive Staging
Operationales System
Staging Area
Data Mart
SALES
SA_SALES
SALES_PRD_CST_MLY
Src 2 Staging
ODI für Big Data - mehr als Konnektoren
Staging 2 DM
© OPITZ CONSULTING GmbH 2016
Seite 14
Anpassungen
Oracle 2 Apache Hive
 SA_SALES Tabelle erstellen
ODI für Big Data - mehr als Konnektoren
© OPITZ CONSULTING GmbH 2016
Seite 15
Anpassungen
Oracle 2 Apache Hive
 SA_SALES im ODI zufügen
ODI für Big Data - mehr als Konnektoren
© OPITZ CONSULTING GmbH 2016
Seite 16
Anpassungen
Oracle 2 Apache Hive
 Neues Mapping Source zu Staging (Hive)
 Oracle Source
 Hive Target
 Expression Datum zu String
ODI für Big Data - mehr als Konnektoren
© OPITZ CONSULTING GmbH 2016
Seite 17
Anpassungen
Oracle 2 Apache Hive
 Neues Mapping Physical View
ODI für Big Data - mehr als Konnektoren
© OPITZ CONSULTING GmbH 2016
Seite 18
Ausführen
Oracle 2 Apache Hive
ODI für Big Data - mehr als Konnektoren
© OPITZ CONSULTING GmbH 2016
Seite 19
Anpassungen
Oracle 2 Apache Hive
ODI für Big Data - mehr als Konnektoren
© OPITZ CONSULTING GmbH 2016
Seite 20
Ergebnisse
Oracle 2 Apache Hive
ODI für Big Data - mehr als Konnektoren
© OPITZ CONSULTING GmbH 2016
Seite 21
Oracle Staging 2 DM
Operationales System
Staging Area
Data Mart
SALES
SA_SALES
SALES_PRD_CST_MLY
Src 2 Staging
ODI für Big Data - mehr als Konnektoren
Staging 2 DM
© OPITZ CONSULTING GmbH 2016
Seite 22
Staging 2 DM (Oracle)
Logical Design
ODI für Big Data - mehr als Konnektoren
© OPITZ CONSULTING GmbH 2016
Seite 23
Staging 2 DM (Oracle)
Physical Design
ODI für Big Data - mehr als Konnektoren
© OPITZ CONSULTING GmbH 2016
Seite 24
Staging 2 DM (Oracle)
SQL Code generiert
ODI für Big Data - mehr als Konnektoren
© OPITZ CONSULTING GmbH 2016
Seite 25
Daten in der Tabelle
ODI für Big Data - mehr als Konnektoren
© OPITZ CONSULTING GmbH 2016
Seite 26
Umwandlung zu Apache Hive Staging
Operationales System
Staging Area
Data Mart
SALES
SA_SALES
SALES_PRD_CST_MLY
Src 2 Staging
ODI für Big Data - mehr als Konnektoren
Staging 2 DM
© OPITZ CONSULTING GmbH 2016
Seite 27
Änderungen
Apache Hive Staging
ODI für Big Data - mehr als Konnektoren
© OPITZ CONSULTING GmbH 2016
Seite 28
Änderungen
Apache Hive Staging
ODI für Big Data - mehr als Konnektoren
© OPITZ CONSULTING GmbH 2016
Seite 29
Erzeugter Hive Code
ODI für Big Data - mehr als Konnektoren
© OPITZ CONSULTING GmbH 2016
Seite 30
Load Hive zu Oracle DWH
ODI für Big Data - mehr als Konnektoren
© OPITZ CONSULTING GmbH 2016
Seite 31
Anpassungen
um Apache PIG zu nutzen
 Logical Design
 Staging Location Hint => Pig
 Expression und Aggregate Execute on Hint => Staging
ODI für Big Data - mehr als Konnektoren
© OPITZ CONSULTING GmbH 2016
Seite 32
Anpassungen
um Apache PIG zu nutzen
 Physical Design erzeugen
ODI für Big Data - mehr als Konnektoren
© OPITZ CONSULTING GmbH 2016
Seite 33
Erzeugter Pig Code
Daten laden
String Manipulation
Aggregierung
Daten speichern
ODI für Big Data - mehr als Konnektoren
© OPITZ CONSULTING GmbH 2016
Seite 34
und Apache Spark
 Analog zu Pig
 ggf. Expressions anpassen (auch bei Pig)
ODI für Big Data - mehr als Konnektoren
© OPITZ CONSULTING GmbH 2016
Seite 35
Zusammengefasst
 ODI biete GUI für Hive, Pig, Spark Development
 Erweiterungen von Pig und Spark implizit verfügbar
 DWH Offloading als Use Case
 Pragmatischer Ansatz PoC
 Ist eine Überlegung wert
 Beispiele für Erweiterungen
 Weblogs verarbeiten
 360° Kundensicht (falls Webshop vorhanden)
 Foren, Blogs, Feeds crawlen
 Wie kommen unsere Produkte an
 Sensordaten aus z.B. Produktionslinien
 Predictive Maintenance
 Streaming der Daten
ODI für Big Data - mehr als Konnektoren
© OPITZ CONSULTING GmbH 2016
Seite 36
Kontakt
Bodo Clausen
Senior Consultant & Competence Center Big Data Lead
E-Mail: [email protected]
Telefon: 02261 6001 0
ODI für Big Data - mehr als Konnektoren
© OPITZ CONSULTING GmbH 2016
Seite 37
Herunterladen