© areto consulting gmbh 2014 Seite 1

Werbung
© areto consulting gmbh 2014
Seite 1
Inhaltsverzeichnis

Impressum ..................................................................................................................................................... 3

Über areto consulting gmbh .......................................................................................................................... 4

Über diese Marktstudie ................................................................................................................................. 5

Marktbetrachtung ......................................................................................................................................... 6

Unterstützte Datenbanken und Dateiformate .............................................................................................. 8

Stärken der vorgestellten ETL-Lösungen ...................................................................................................... 13

Übersicht der kommerziellen Aspekte und Details ....................................................................................... 14

Übersicht der Anbieter .................................................................................................................................. 16

Cubeware GmbH .................................................................................................................................... 17

Information Builders (Deutschland) GmbH ............................................................................................ 23

Microsoft Deutschland GmbH ................................................................................................................ 31

n³ data & software science GmbH ......................................................................................................... 38

Oracle Deutschland BV & Co. KG ........................................................................................................... 45

Pentaho EMEA ....................................................................................................................................... 53

SAP SE..................................................................................................................................................... 62

Syncsort GmbH....................................................................................................................................... 69

Talend Germany GmbH .......................................................................................................................... 76

Theobald Software GmbH ...................................................................................................................... 84
© areto consulting gmbh 2014
Seite 2
Impressum
Copyright © 2014 areto consulting gmbh
Alle Rechte vorbehalten, insbesondere das Recht der Vervielfältigung und Verbreitung sowie der Übersetzung. Kein Teil des Werkes darf
in irgendeiner Form (Druck, Fotokopie, Mikrofilm oder andere Verfahren) ohne schriftliche Genehmigung von areto consulting gmbh
reproduziert oder unter Verwendung elektronischer Systeme verarbeitet, vervielfältigt oder verbreitet werden.
Haftungsausschluss
Die Autoren versuchen mit größtmöglicher Sorgfalt, in der vorliegenden Studie richtige, vollständige und aktualisierte Informationen zur
Verfügung zu stellen. Fehler können jedoch nicht völlig ausgeschlossen werden. Es wird daher keinerlei Haftung oder Garantie für die
Richtigkeit, Vollständigkeit, Qualität und/oder Aktualität der veröffentlichten Informationen übernommen, es sei denn, die Fehler wurden vorsätzlich oder grob fahrlässig aufgenommen. Dies betrifft sowohl materielle als auch immaterielle Schäden Dritter, die durch die
Nutzung des Informationsangebots verursacht werden.
areto consulting gmbh
Schanzenstr. 6-20
51063 Köln
Phone +49 221 66 95 75-0
Fax +49 221 66 95 75-99
Geschäftsführer: Reinhard Mense, Jan Strackbein
HRB-Nr.: 73109 Amtsgericht Köln
http://www.areto-consulting.de
[email protected]
Autoren:
Reinhard Mense, Geschäftsführender Gesellschafter und CTO
Ulrich Kramer, Leiter Marketing und Vertrieb
© areto consulting gmbh 2014
Seite 3
Über areto consulting gmbh
Die areto consulting gmbh mit Sitz in Köln ist als IT-Beratungshaus spezialisiert auf die Themen Business Intelligence und Data Warehousing.
areto ist ein langjähriger Partner führender Hersteller im BI-Sektor wie Oracle, EXASOL oder Informatica und bietet ihren zahlreichen
Kunden im gesamten deutschsprachigen Raum Standard- und Individuallösungen sowie eigenentwickelte Applikationen und Tools.
areto unterstützt mittelständische und Großunternehmen mit umfangreichen Professional Services bei der Konzeption und Einführung,
beim Betrieb und bei der Weiterentwicklung von BI-Systemen. Zu den Leistungen gehören u.a. die Analyse der Geschäftsprozesse und
Daten, die Datenmodellierung sowie die Entwicklung von ETL-Prozessen und Reports. Weiterhin bietet areto individuelle Schulungs- und
Coachingmaßnahmen vor allem für SAP BO-Lösungen und die Entwicklung sowie die Übernahme von BI-Anwendungen von Oracle und
SAP als Managed Service.
Das Lösungsangebot von areto umfasst insbesondere Tools und Methoden, die maßgeblich zur Steigerung der Effektivität und Effizienz
bei der Nutzung von BI-Systemen beitragen:




BI CONNECT for ODI
BI CONVERT for Informatica
BI SELECT
ETL Lineage for OWB
Für einen schnellen und sicheren Wechsel vom OWB auf Informatica PowerCenter oder eine andere ETL-/ELT-Lösung steht mit
BI CONVERT ein leistungsstarkes Werkzeug zur Verfügung.
BI CONNECT verbindet den Oracle Data Integrator direkt mit dem führenden In-Memory-Datenbanksystem EXASolution von EXASOL und
schafft so die Grundlage, selbst komplexeste Datenbestände in Echtzeit zu analysieren.
Mit dem Dienstleistungspaket BI SELECT unterstützt areto Sie bei der systematischen Auswahl einer geeigneten und für Sie passenden BI-Lösung.
ETL Lineage for OWB ermöglicht im Oracle Warehouse Builder eine Lineage-Analyse bis hinunter auf Attribut-Ebene. ETL Lineage ist ein
unverzichtbares Tool bei der Durchführung von Migrationen vom Oracle Warehouse Builder auf eine neue Lösung und klärt zweifelsfrei
die Herkunft von Kennzahlen, Attributen und Daten.
areto veröffentlicht regelmäßig Studien, White Paper und Präsentationen und betreibt ab 15. Dezember 2014 unter der Adresse
www.bi-labor.de einen Blog zu allen relevanten Themen rund um Business Intelligence.
Im Frühjahr 2015 sind weitere Studien im Umfeld von In-Memory-Datenbanken sowie Predictive Analytics mit vielen Informationen über
relevante Technologien und Methoden inklusive einer umfassenden Marktübersicht geplant.
© areto consulting gmbh 2014
Seite 4
Über diese Marktstudie
Es gibt zahllose Marktstudien zu Business-Intelligence-Tools ‒ warum also eine weitere? Ganz einfach: In Projekten stellen Kunden immer wieder die Frage nach der für sie passenden ETL-Lösung. Eine Frage, die aus unserer Sicht gar nicht so einfach zu beantworten ist.
Wir sind der Meinung, dass eine sinnvolle Auswahl eines geeigneten Tools auf mehr beruhen muss als der bloßen Gegenüberstellung von
Features und Kosten. Vielmehr ist es wichtig, Kriterien und Fragen zu definieren, die wirklich relevante Aufgaben in BI-/DWH-Projekten
beschreiben und die am Ende einen echten und dauerhaften Nutzen bringen.
Dieser nachvollziehbare Anspruch wird in unserer Marktstudie zum Beispiel durch Fragen nach Standards und Möglichkeiten zur Automatisierung sowie nach Verfügbarkeit fertiger Komponenten für typische Aufgaben in ETL-Prozessen abgebildet. Dabei haben wir uns
keineswegs auf das Auflisten von Features beschränkt, sondern die Teilnehmer an dieser Studie aufgefordert, beispielhafte ETL-Prozesse
für konkrete Fragestellungen zu skizzieren.
Die gestellten Fragen und zu behandelnden Kriterien erforderten von den Teilnehmern eine intensive Auseinandersetzung, so dass teilweise mehrere Personen für die Beantwortung herangezogen wurden. Ich möchte mich deshalb bei allen Teilnehmern der Studie herzlich für ihre Unterstützung und die aufgebrachte Zeit bedanken!
Wir wollen uns stets verbessern und weiterentwickeln. Deshalb möchten wir sowohl Sie, liebe Leserinnen und Leser, als auch die Teilnehmer der Studie aufrufen: Teilen Sie uns mit, was Ihnen gefallen hat, was Ihnen fehlt oder was Sie sich anders gewünscht hätten! Wir
werden dies bei den nächsten Updates dieser Studie und bei weiteren Studien berücksichtigen.
Abschließend möchte ich Sie auch auf zwei neue Studien hinweisen, die im Frühjahr 2015 erscheinen werden: Mit In-MemoryDatenbanken und Predictive Analytics werden wir zwei derzeit besonders stark im Fokus stehende Themen behandeln. Wenn Sie rechtzeitig über das Erscheinen der Studien informiert werden möchten, teilen Sie uns das einfach per eMail mit.
Ich wünsche Ihnen viel Vergnügen beim Lesen!
Reinhard Mense
Geschäftsführender Gesellschafter und CTO
areto consulting gmbh
© areto consulting gmbh 2014
Seite 5
Marktbetrachtung
Der Markt in Deutschland für Business Intelligence-Lösungen und -Werkzeuge wächst weiter kräftig: Auf rund 1,5 Milliarden Euro summierten sich laut einer Studie des Nürnberger BARC-Instituts1 die Umsätze für Lizenzen und Wartung von BI-Systemen in 2013 ‒ ein Anstieg von satten 11 Prozent. Darin eingeschlossen sind sowohl die Verkaufszahlen bei Backend- als auch bei Frontend-Lösungen wie beispielsweise Dashboard- oder Reporting-Anwendungen. Vor allem im Bereich der Datenmanagement-Software waren vergleichsweise
hohe Zuwachsraten zu verzeichnen. Um etwa 20 Prozent stiegen laut BARC die Erlöse bei Backend-Programmen, getrieben durch neue
Anforderungen (zum Beispiel die Integration von Social Media Daten oder zunehmende Big-Data-Initiativen), durch neue Technologien
und Methoden (In-Memory-Datenbanken, Predictive Analytics) oder neue fachliche und gesetzliche Vorgaben. Auch die zunehmende
Durchdringung von SAP HANA trug kräftig zum Umsatz bei. Der Markt für ETL- oder Datenintegrationssysteme präsentiert sich uneinheitlich: Einerseits haben die Anbieter von klassischen ERP- und CRM-Anwendungen immer mehr Funktionalität für die Integration der Daten
und deren Aufbereitung in ihre Suiten eingebaut, andererseits umfasst das Marktangebot auch viele Teilgebiete, die durch spezialisierte
Hersteller abgedeckt werden. Das Marktforschungsunternehmen Gartner2 kommt in diesem Bereich zu folgender Einteilung:








Datenerfassung für Business Intelligence (BI), Analytik und Data Warehousing
Konsolidierung und Bereitstellung von Stammdaten zur Unterstützung des Stammdatenmanagements
(Master Data Management ‒ MDM)
Datenmigration / Datenkonvertierung
Die Synchronisation von Daten zwischen operativen Anwendungen
Datenaustausch und Datennutzung in verbundenen Unternehmen
Bereitstellung von Datendiensten in Verbindung mit Service-orientierten Architekturen (SOA)
Integration Cloud-basierter Daten
Big Data Initiativen
Gartner2 schätzt das Marktvolumen nur für Integrationslösung auf etwa 2,2 Milliarden Dollar ‒ umgerechnet rund 1,8 Milliarden Euro.
Damit wurden im Vorjahr etwa 9,4% mehr erzielt als in 2012. Bis zum Jahre 2018 sollen die Erlöse gar auf 2,9 Milliarden Euro steigen.
Diese Einschätzung ist leicht nachvollziehbar, denn der Anspruch an Datenmanagementsysteme wird weiter steigen: Viele neue Technologien wie In-Memory-Datenbanken, Frameworks wie Hadoop und ähnliche Verfahren werden innovative Anwendungen ermöglichen
und weitere Initiativen zur Nutzung der internen und externen Datenbestände in den Unternehmen begründen. Laut einer Studie des
Dienstleistungsunternehmens Lünendonk GmbH3 sehen Manager und Anwender in naher Zukunft folgende Anwendungsschwerpunkte:






Datenkonsolidierung, Datenintegration, Verbesserung der Datenqualität
Management Reporting und Dashboards
Finanzreporting
Planung/Budgetierung
Big Data
Risikomanagement/Unternehmenssteuerung
Die meisten dieser Themen berühren Aspekte der Datenintegration und des Datenmanagements. Insbesondere Big Data und darauf aufsetzende Verfahren wie Predictive Analytics verlangen neben der Einbeziehung neuer Datenbestände (zum Beispiel aus NoSQL- und
NewSQL-Systemen) auch eine sehr hohe Datenqualität ‒ durchaus ein Bereich, wo viele Unternehmen erheblichen Nachholbedarf haben
und sich so manche Schwäche einer unzureichenden Datenmodellierung und einer verkümmerten Data Governance offenbart. Insbesondere Banken und Finanzdienstleistungen werden mit der Umsetzung der gesetzlichen Vorgaben Datenstrukturen aufbauen müssen, die
eine flexible, zuverlässige und schnelle Bereitstellung relevanter Daten und Berichte ermöglicht. Aber auch für alle übrigen Unternehmen
gilt es, das Optimum aus der Datenflut und den im Unternehmen verborgenen Datenschätzen zu holen. Und dies hat stets mit der intensiven Nutzung von Lösungen zur Integration und Aufbereitung von Informationen zu tun.
1
Der Markt für Business Intelligence in Deutschland 2013; Business Application Research Center ‒ BARC GmbH; Juli 2014
Magic Quadrant for Data Integration Tools; Gartner Inc.; Juli 2014
3
Lünendonk®-Marktstichprobe 2014 ‒ Business Intelligence als Kernkompetenz; Lünendonk GmbH, 2014
2
© areto consulting gmbh 2014
Seite 6
Unterstützte Relationale Datenbanken
I
ODBC/JDBC
andere Datenbanken per ODBC/JDBC
andere Datenbanken per nativer Anbindung
---
J/O
J/O
J/O
J/O
J/O
●
●
---
Information Builders
●
●
J
●
●
●
●
●
●
●
J
●
●
●
●
●
Microsoft
●
●
J/O
●
J/O
●
●
●
●
●
J/O
●
J/O
●
●
●
J/O
J/O
J/O
J/O
J/O
●
●
---
J/O
J/O
J/O
J/O
J/O
●
●
---
●
●
●
●
---
●
●
●
●
●
●
●
---
●
●
●
J/O
J/O
J/O
J/O
J/O
●
●
●
J/O
J/O
J/O
J/O
J/O
●
●
●
SAP
●
J/O
J/O
●
J/O
●
●
●
●
J/O
J/O
●
J/O
●
●
●
Syncsort
●
●
J/O
●
---
●
●
●
●
●
J/O
●
---
●
●
●
Talend
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
Theobald Software
---
---
---
---
---
---
---
●
●
●
---
●
J/O
●
---
●
Pentaho
● : (native) Unterstützung
J : JDBC-Anbindung
O : ODBC-Anbindung
SAP HANA
●
als Quelle
Oracle
●
Oracle
MySQL
J/O
n data & software science
Microsoft SQL Server
J/O
3
IBM DB/2
J/O
Cubeware
andere Datenbanken per nativer Anbindung
J/O
Anbieter
andere Datenbanken per ODBC/JDBC
ODBC/JDBC
SAP HANA
Oracle
MySQL
Microsoft SQL Server
IBM DB/2
J/O
Datenbanken
als Ziel
J / O : JDBC/ODBC-Anbindung -- keine/keine Angaben
Cubeware
Andere relationale Datenbanken per ODBC/JDBC (Quelle und Ziel): EXASolution
Information Builders
Unterstützung IBM DB/2: 9.5, 9.7, 10 cli, 10 Leightweight Client
Unterstützung Microsoft SQL Server 2005, 2008 2012
Unterstützung Oracle Database 9.2, 10g, 11g, 12c
Andere relationale Datenbanken per ODBC/JDBC (Quelle): Cache, Excel (via ODBC), Greenplum DB, Hive,
JBoss, Netezza, PostgreSql, Teradata
Andere relationale Datenbanken per ODBC/JDBC (Ziel): Greenplum DB, Netezza, PostgreSql, Teradata
Andere relationale Datenbanken per nativer Anbindung (Quelle): Hyperstage, Nucleus/SAND,IBM i Access,
IDMS/SQL,Informix, Ingres,Interplex/Unisys DMS 1100, Oracle Times Ten, parAccel, Progress, PSQL, Redbrick,
Sybase, UniData, UniVerse
Andere relationale Datenbanken per nativer Anbindung (Ziel): Hyperstage, Nucleus/SAND, Informix, Ingres,
Progress, PSQL, Redbrick, Sybase
Microsoft
Andere relationale Datenbanken per ODBC/JDBC (Quelle): alle für die ein Windows ODBC Treiber erhältlich ist
Andere relationale Datenbanken per ODBC/JDBC (Ziel): alle für die ein Windows ODBC Treiber erhältlich ist
Andere relationale Datenbanken per nativer Anbindung (Quelle): alle für die ein Windows OLEDB Treiber
erhältlich ist; zusätzlich ist ein Teradata, SAP BO, Oracle CDC, REST Zugriff möglich
Andere relationale Datenbanken per nativer Anbindung (Ziel): alle für die ein Windows OLEDB Treiber
erhältlich ist; zusätzlich ist ein Teradata, SAP BO, Oracle CDC, REST Zugriff möglich
© areto consulting gmbh 2014
Seite 7
Unterstützte Relationale Datenbanken
n3 data & software science
Andere relationale Datenbanken per ODBC/JDBC (Quelle) und Ziel: Alle mit JDBC-Treiber
Oracle
Andere relationale Datenbanken per ODBC/JDBC (Quelle und Ziel): Times Ten 11.2+, Apache Derby 10.x,
Apache Hive 0.7.1, IBM Netezza NPS 3.x, 4.x, 5.x, 6.x, Ingres 2006, Interbase 2007, Paradox 9.x, 10.x, Persavive
PSQL 8, 9, 10, Postgres 7.x, 8.x, 9.x, Progress Open Edge 8.x, 9.x, 10.x, Teradata 12.x, 13.x, 14.x, dBase III, IV, V,
LDAP V3, MS Access/Excel/Word 2000, 2007, GoldenGate 10.4+, E-Business Suite 10.5.10*, 12.0*, 12.1*,
Oracle Internet Direcotry 10.1.4.3.0, Oracle Mediator, 10.1.3.4.0, 11.1.1.3.0, Oracle Service Bus 11.1.1.3.0,
Tuxedo 11.1.1.1.0, Vsam CiCs, IBM MQ Series, MS Active Directory
Andere relationale Datenbanken per nativer Anbindung (Quelle): Times Ten 11.2+, Apache Derby 10.x, Apache
Hive 0.7.1, IBM Netezza NPS 3.x, 4.x, 5.x, 6.x, Ingres 2006, Persavive PSQL 8, 9, 10, Postgres 7.x, 8.x, 9.x,
Progress Open Edge 8.x, 9.x, 10.x, SAP BW 7.0, Teradata 12.x, 13.x, 14.x, GoldenGate 10.4+, E-Business Suite
10.5.10*, 12.0*, 12.1*, Oracle Internet Direcotry 10.1.4.3.0, Oracle Mediator, 10.1.3.4.0, 11.1.1.3.0, Oracle
Service Bus 11.1.1.3.0, Tuxedo 11.1.1.1.0, SAP ERP 4.6c, 4.7, 7.0+, SAP ERP ECC 5.0, 6.0, Vsam CiCs, IBM MQ
Series, MS Active Directory
Andere relationale Datenbanken per nativer Anbindung (Ziel): Times Ten 11.2+, Apache Derby 10.x, Apache
Hive 0.7.1, IBM Netezza NPS 3.x, 4.x, 5.x, 6.x, Paradox 9.x, 10.x, Persavive PSQL 8, 9, 10, Postgres 7.x, 8.x, 9.x,
Progress Open Edge 8.x, 9.x, 10.x, SAP BW 7.0, Teradata 12.x, 13.x, 14.x, dBase III, IV, V, LDAP V3, GoldenGate
10.4+, E-Business Suite 10.5.10*, 12.0*, 12.1*, Oracle Internet Direcotry 10.1.4.3.0, Oracle Mediator,
10.1.3.4.0, 11.1.1.3.0, Oracle Service Bus 11.1.1.3.0, Tuxedo 11.1.1.1.0, SAP ERP 4.6c, 4.7, 7.0+, SAP ERP ECC
5.0, 6.0, Vsam CiCs, IBM MQ Series, MS Active Directory
Pentaho
Andere relationale Datenbanken per ODBC/JDBC (Quelle und Ziel): Apache Derby, AS/400, InfiniDB, Exasol 4,
Firebird SQL, Greenplum, H2, Hive, Hive 2, Hypersonic, Informix, Ingres, LucidDB, MaxDB (SAP DB), PostgreSQL,
SQLite, Teradata, UniVerse database;
Andere relationale Datenbanken per nativer Anbindung (Quelle und Ziel): Microsoft, Oracle und Mondrian
SAP
Unterstützung IBM DB/2: iSeries 6.4, 6.1, 7.1, LUW 9.1, 9.5, 9.7, 10.1, 10.5, zOS 8.1, 9.1, 10.5 via iSeries Access/
DB2 Connect/DataDirect ODBC
Unterstützung Microsoft SQL Server Data Direct ODBC: 2000 SP4, 2005 SP3/SP4, 2008 SP2/R2, 2012
Unterstützung MySQL 5.0, 5.1, 5.5
Unterstützung Oracle Database 9i, 10g, 10gR2, 11g, 11gR1, 11gR2, 12c, 12cR1
Unterstützung SAP HANA ab 1.0 SP6, SP7, SP8 via HANA ODBC
Andere relationale Datenbanken per ODBC/JDBC-Anbindung (Quelle und Ziel) : SAP IQ, Teradata
Andere relationale Datenbanken per nativer Anbindung (Quelle und Ziel): Netezza, Informix, SAP ASE, SAP SQL
Anywhere, HADOOP
Syncsort
Unterstützung IBM DB/2: 9.1; 9.7 and higher
Unterstützung Microsoft SQL Server 2005 and higher
Unterstützung MySQL Level 3 compliant
Unterstützung Oracle Database 10g; 11g
Unterstützung ODBC/JDBC Level 3 compliant
Andere relationale Datenbanken per ODBC/JDBC-Anbindung (Quelle und Ziel) : JDBC level 3 compliant und
ODBC Level 3 compliant
Andere relationale Datenbanken per nativer Anbindung (Quelle und Ziel): Teradata; Vertica; Sybase;
Netezza; Hive; Greenplum; Greenplum: 4.2 and higher; Hive: Hive Server 2; Netezza: 6.0 and higher Sybase: ASE
und IQ 15.0 and higher; Teradata: TD13 und TD14; Vertica: 5.1 und 6.0 und 7.0
Talend
Talend verwendet grundsätzlich JDBC für den Datenbankzugriff, wobei datenbankspezifische Komponenten
Spezifika der jeweiligen Datenbank berücksichtigen. Zusätzlich werden die jeweiligen Batch/Bulk-Load
Komponenten des Herstellers für das Laden großer Datenmengen unterstützt.
Andere relationale Datenbanken per ODBC/JDBC-Anbindung (Quelle und Ziel): generelle JDBC/ODBC
Anbindung unterschiedlichster Datenbanken möglich; Für eine vollständige Übersicht https://help.talend.com/
display/TalendPlatformforDataManagementInstallationandUpgradeGuide55EN/Home Appendix B
Theobald Software
Andere relationale Datenbanken per nativer Anbindung (Quelle und Ziel): SAP ERP
© areto consulting gmbh 2014
II
Seite 8
Unterstützte Nicht-Relationale Datenbanken
MongoDB
andere Nicht-Relationale Datenbanken
---
●
---
---
---
---
---
---
Information Builders
---
---
●
●
●
---
---
●
●
●
Microsoft
●
●
●
●
●
●
●
●
●
●
n³ data & software science
---
---
---
---
---
---
---
---
---
---
Oracle
●
---
●
●
---
●
---
●
●
---
Pentaho
●
●
●
●
●
●
●
●
SAP
---
---
---
●
---
---
---
---
●
---
Syncsort
●
●
●
●
●
●
●
●
●
●
Talend
●
●
●
●
●
●
●
●
●
●
Theobald Software
---
---
---
---
---
---
---
---
---
●
als Quelle
HBase
Google Big Table
---
● : (native) Unterstützung
Apache Cassandra
●
Anbieter
andere Nicht-Relationale Datenbanken
MongoDB
HBase
Google Big Table
Apache Cassandra
Cubeware
Datenbanken
als Ziel
-- keine/keine Angaben
Information Builders
Andere unterstützte Datenbanken (Quelle): Adabas, Datacom/DB, IDMS/DB, IMS, Lotus Notes, Millennium, Model 204,
Axiom EPM, JD Edwards EnterpriseOne, JD Edwards World, Lawson, Oracle Applications, PeopleSoft, Salesforce.com, SAP,
Siebel,Adabas/NAT, Address Doctor, CICS Transaction, CICS Transaction for Natural, IMS Transaction, IWAF, Natural Batch,
Query/400, REST, Web Services, FOCUS/FDS
Microsoft
Unterstützte Datenbanken benötigen 3rd Party connection data flow component;
diverse 3rd Party data flow components sind am Markt erhältlich, eigene Entwicklung ist einfach möglich,
da die Schnittstelle offen und dokumentiert ist
Pentaho
Andere unterstützte Datenbanken: Impala, InfoBright, Ingres VectorWise, MonetDB, Neoview, Netezza, Vertica
Syncsort
mittels HDFS bei allen Datenbanken, die diesen Standard unterstützen
© areto consulting gmbh 2014
Seite 9
Unterstützte Multidimensionale Datenbanken
Oracle Database OLAP Option
SAP Netweaver BW
SAS OLAP Server
andere multidimensionale Datenbanken
---
●
●
---
●
---
---
●
●
---
●
●
---
●
---
---
Information Builders
---
---
---
●
●
---
●
---
---
---
---
---
---
---
---
---
---
---
Microsoft
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
n³ data & software science
---
---
---
---
---
---
---
---
---
---
---
---
---
---
---
---
---
---
Oracle
---
---
---
---
●
●
---
---
---
---
---
---
---
●
●
---
---
---
Pentaho
---
---
---
●
---
---
---
---
●
---
---
---
---
---
---
---
---
---
SAP
---
---
---
---
---
---
●
---
---
---
---
---
---
---
---
●
---
---
Syncsort
---
---
---
---
---
---
---
---
---
---
---
---
---
---
---
---
---
---
Talend
---
---
---
---
---
---
●
---
●
---
---
---
---
---
---
---
---
●
Theobald Software
---
---
---
---
---
---
●
---
---
---
---
---
●
●
---
●
---
●
als Quelle
Oracle Essbase
Microsoft Analysis Services
Jedox OLAP Server
Infor BI OLAP Server
IBM Cognos TM1
andere multidimensionale Datenbanken
SAS OLAP Server
SAP Netweaver BW
●
● : (native) Unterstützung
Oracle Database OLAP Option
●
Anbieter
Oracle Essbase
Microsoft Analysis Services
Jedox OLAP Server
Infor BI OLAP Server
IBM Cognos TM1
Cubeware
Datenbanken
als Ziel
-- keine/keine Angaben
Microsoft
Unterstützte Datenbanken anderer Hersteller benötigen jeweils OLEDB/ODBC Treiber; SAP NetWeaver BW ergänzt durch
Theobald Software
Pentaho
Unterstützte andere multidimensionale Datenbanken (Quelle): Palo MOLAP Server (Plug-In specific access method),
Mondrian (native)
SAP
Unterstütze Versionen 3.5, 7.0, 7.3, 7.4, 7.4SP6
Syncsort
DMX ist ein typisches ETL Tool. Als solches bereiten DMX die Daten auf lädt sie an die benötigten Stellen.
Multidimensionale Datenbanken laden dann von dort typischerweise die Daten selbst in die Cubes
Talend
Unterstützte andere multidimensionale Datenbanken (Quelle und Ziel): Mondrian Palo
Theobald Software
Unterstützte andere multidimensionale Datenbanken (Ziel): Goddata
© areto consulting gmbh 2014
Seite 10
Unterstützte Dateien/Datenformate
JSON
andere Datenformate
XML
CSV
Fixed Length Flat File
andere Datenformate
JSON
XML
CSV
Fixed Length Flat File
Cubeware
●
●
---
---
●
---
●
---
---
●
Information Builders
●
●
●
●
●
●
●
●
●
---
Microsoft
●
●
●
●
●
●
●
●
●
●
n³ data & software science
●
●
●
●
●
●
●
●
●
●
Oracle
●
●
●
●
---
●
●
●
●
---
Pentaho
●
●
●
●
●
●
●
●
●
●
SAP
●
●
●
●
●
●
●
●
●
●
Syncsort
●
●
●
●
●
●
●
●
---
●
Talend
●
●
●
●
●
●
●
●
●
●
Theobald Software
---
---
---
---
---
●
●
●
●
●
Datenbanken
Anbieter
● : (native) Unterstützung
als Quelle
als Ziel
-- keine/keine Angaben
Cubeware
Andere Datenformate: xls/xlsx
Information Builders
Andere Datenformate: Acucobol CISAM, DB Heritage Files, Delimited Flat File, Excel (via direct retrieval),
Flat File, Informix, CISAM, MicroFocus CISAM, RMS,VSAM
Microsoft
Andere Datenformate: custom code oder 3rd Party Komponente notwendig (JSON); Excel, Access
n³ data & software science
Anderes Datenformat: Excel
Pentaho
Andere Datenformate: Email, ESRI, Google Analytics, Google Docs, GZIP, HL7, IBM Websphere MQ,
JMS, LDAP, LDIF, MS Access, MS Excel, RSS, S3 CSV, Salesforce, SAS, Yaml
SAP
Andere Datenformate: DTD, als Quelle: Excel Worksheet, Cobol Copybook, VCF Dateien (Genomsequenzen),
ESRI Shapefiles (Geodaten), beliebige weitere via Adapter SDK
Syncsort
Andere Datenformate: Informix C-ISAM; Microfocus; Unikox VSAM; ACUCOBOL GT Version; Fixed length;
Mainframe; Fortran
Talend
Andere Datenformate: HDFS, Apache Log, ARFF, EBCDIC, Excel, LDIF, Mail
Theobald Software
Anderes Datenformat: Tableau-Datenfiles
© areto consulting gmbh 2014
Seite 11
Stärken des ETL-Tools aus Sicht des Herstellers
Cubeware
Information Builders
Einfachheit in der Bedienung, selbst für die Definition komplexer ETL Prozesse; ETL und OLAP Modellierung über
ein Tool unter Verwendung eines Repositories; Definition von ETL Prozessen durch Drag & DropFunktional umfangreiches, leicht erlernbares ETL Tool. Der gesamte ETL Entwicklungsprozess erfolgt über eine
graphische Benutzeroberfläche und zwar schrittweise als Daten- und Prozess Flows. Die mit dem Data Migrator
erstellten Flows sind als lesbare Textfiles gespeichert, bestehend aus SQL Commandos und interner Scriptsprache.
So ist der gesamte Ablauf Line by Line nachvollziehbar (vollständiges Audit). Mehr als 250 Datenadapter stehen als
Quell- oder Zieladapter bereit. Der DataMigrator nutzt dieselben Metadaten wie das BI Reporting Werkzeug WebFOCUS, daraus ergeben sich Synergien für kürzere Entwicklungszeiten und Wiederverwendbarkeit von Modulen.
Microsoft
Geschwindigkeit, Remote Debugging, kurze Designzeit, vollständige API zur Programmierung.
n³ data & software science
leicht verständliche grafische Oberfläche; bedienbar mit grundlegenden Datenbank-Kenntnissen; einfach in bestehende Infrastruktur integrierbar.
Oracle
1. dynamische Codegenerierung durch Template (Knowledge Module): Der Anwender kann den genierten Code
an seine Anforderungen anpassen.
Einsatzszenarios:
- individuelle Performanceanpassungen
- neue Funktionalitäten, die Oracle nicht in das Tool eingebaut hat
- Standardisierung des Codes: wiederkehrende Schritte werden automatisch generiert und die Codestruktur ist
immer die gleiche (führt zu sehr viel kürzeren Entwicklungszeiten und geringeren Entwicklungskosten)
2. heterogene Umgebungen
3. Integration in den Oracle Product Stack von der Hardware bis zum BI Werkzeug
4. Java basierte Entwicklungsumgebung
Pentaho
Intuitiv, skalierbar, offen, Baukastenprinzip (eigene Schritte können definiert und ausgeführt werden), alle marktgängigen Speichersysteme können integriert werden.
Big Data Adaptive Layer ‒ Änderungen in Hadoop-Distributionen sind transparent; Datenbank-Repository bietet
Möglichkeiten für Teamarbeit, zur Hinzufügung von Informationen, ist Metadaten-getrieben und kann in einer
Cloud-Umgebung eingesetzt werden.
SAP
Benutzerfreundlichkeit, starke Datenqualitäts- und ETL-Transformationen in einem Tool, hohe Performance, Erweiterbarkeit via Adapter SDK, Real-Time und Batch-Szenarien in einem Tool.
Syncsort
DMXExpress ist aus Sicht des Herstellers eines der leistungsfähigsten ETL Tools am Markt. Durch seine MainframeHerkunft ist DMX gewohnt, mit wenig Ressourcen sehr effizient zu arbeiten. Typischer Weise benötigt DMX ca. 1/3
der Cores, die ein herkömmliches ETL Tool benötigt. Dazu verbraucht DMX ca. 65% weniger Memory. Durch den
Einsatz der verschiedenen DMX Features wie Compression kann der Bedarf an Plattenplatz drastisch reduziert
werden. DMX kann komplette Workflows komprimiert verarbeiten ‒ also sowohl komprimierte Files lesen, verarbeiten und wieder wegschreiben. Ein Extrahieren ist nicht nötig.
Talend
Durch native Unterstützung moderner Big-Data-Plattformen wie Hadoop und NoSQL nehmen die „Zero Footprint“
Lösungen von Talend die Komplexität und statten IT-Abteilungen so aus, dass sie schneller auf Geschäftsanforderungen reagieren können.
Talends einheitliches Lösungsportfolio basiert auf Open Source und wird vom breitesten Ökosystem in der Branche unterstützt. Es wird über ein vorhersehbares Subskriptionsmodell angeboten und beinhaltet Big Data, Datenintegration, Data Quality, Master Data Management (MDM), einen Enterprise Service Bus (ESB) und Geschäftsprozessmanagement (BPM).
Theobald Software
Instant Datawarehousing für automatisiertes Anlegen der DWH-Objekte, minimaler bis kein Eingriff in das SAP,
robustes, standardisiertes Verfahren für inkrementelle Beladungen, zentrales Security-Konzept.
© areto consulting gmbh 2014
Seite 12
Übersicht der kommerziellen Aspekte und Details
I
Welche Lizensierungsmodelle gibt es (z.B. pro CPU, pro Named User)?
Cubeware
Keine Angaben
Information Builders
pro CPU Core und pro Datenquelle
Microsoft
pro Core, min. 4 Cores
n³ data & software science
Named User
Oracle
Oracle bietet CPU-basierte Lizensierung (anhand der Cores des jeweiligen Prozessor-Anbieters) und eine Named
User Plus Lizensierung an. Es sind die Staging-/Transformations-Area zu lizensieren, die Quell- und Zielsysteme sind
in der Regel enthalten (Ausnahme: Host-Systeme, Standards-Applikationen wie z. B. SAP oder Siebel)
Pentaho
per Core für die Pentaho Plattform; zusätzlich per Node für den adaptiven Big Data Layer / Hadoop
SAP
CPU -Kerne
Syncsort
Kauf- und Mietlizenzen pro CPU
Talend
Named User, Concurrent User, Core-based
Theobald Software
pro Server
Welche kostenpflichtigen Optionen und Zusatzmodule bieten Sie an?
Cubeware
Keine Angaben
Information Builders
Keine Angaben
Microsoft
Keine
n³ data & software science
Keine Angaben
Oracle
Der Datenintegrationsbereich besteht im wesentlichen aus 3 Produkten:
1. ODI
2. Oracle Golden Gate (OGG) für Realtime Integration
3. Oracle Enterprise Data Quality (EDQ) für Data Quality and Data Profiling, optional Address Verification Server
Die drei Produkte können unabhängig voneinander betrieben werden, sie lassen sich auch integrieren und werden
dann von ODI gesteuert.
Optionen:
1. ODI Management Pack für Oracle Enterprise Manager Grid Control (z. B. für einheitliche Administration aller
Oracle Produkte oder die Optimierung des von ODI generierten Codes durch die Datenbank)
2. Adaptoren für Standard Applikationen (z. B. SAP ECC/BW, Siebel oder EBus)
3. Adaptoren für Host Systeme
Pentaho
Adaptive Big Data Layer, Data Science Pack
SAP
Keine
Syncsort
DMX-Hadoop
Talend
Mission Critical Support
Theobald Software
Keine Angaben
© areto consulting gmbh 2014
Seite 13
Übersicht der Anbieter
Vorgestellte Unternehmen und Lösungen in dieser Studie

Cubeware GmbH .............................................................................................................................................................. 17

Information Builders (Deutschland) GmbH ...................................................................................................................... 23

Microsoft Deutschland GmbH .......................................................................................................................................... 31

n³ data & software science GmbH .................................................................................................................................... 38

Oracle Deutschland BV & Co. KG ...................................................................................................................................... 45

Pentaho EMEA.................................................................................................................................................................. 53

SAP SE ............................................................................................................................................................................... 62

Syncsort GmbH ................................................................................................................................................................. 69

Talend Germany GmbH .................................................................................................................................................... 76

Theobald Software GmbH ................................................................................................................................................ 84
Weitere Anbieter

Actian Germany GmbH
63303 Dreieich
www.actian.com

IBM Deutschland GmbH
71139 Ehningen
www.ibm.de

Informatica GmbH
60528 Frankfurt am Main
www.informatica.com

SAS Institute GmbH
69118 Heidelberg
www.sas.com
Vermissen Sie ein Unternehmen oder eine Lösung? Soll Ihr Unternehmen oder Ihr ETL-System im geplanten Update der Marktstudie Anfang 2015 ebenfalls
aufgeführt werden? Setzen Sie sich bitte mit uns in Verbindung, wir werden Ihre Wünsche gerne berücksichtigen.
© areto consulting gmbh 2014
Seite 14
Cubeware GmbH
I
Anbieter
Anbieter
Cubeware GmbH, Mangfallstr. 37, 83026 Rosenheim
Webseite und eMail-Adresse
www.cubeware.com, [email protected]
Anzahl Mitarbeiter weltweit und in Deutschland
200 (weltweit), 100 (deutschlandweit)
Softwarelösung
Genaue Bezeichnung des ETL-Tools
C8 Importer
Version des aktuell verfügbaren ETL-Tools, die als Grundlage für die Beantwortung dieser Fragen herangezogen wurde
C8 Importer R8
Modul 1
C8 SAP Connect R8 (Zugriff auf SAP ERP)
Modul 2
C8 SAP OLE DB Connect R8 (Zugriff auf SAP BW)
Modul 3
C8 Infor Connect R8 (Zugriff auf ION BI)
Modul 4
C8 TM1 Connect R8 (Zugriff auf IBM Cognos TM1)
Modul 5
C8 MS AS Connect R8 (Zugriff auf Microsoft Analysis Services)
Modul 6
C8 Essbase Connect R8 (Zugriff auf Oracle Essbase)
Modul 7
C8 EXASOL Connect R8 (Zugriff auf EXASolution)
Handelt es sich um kommerzielle Software oder um eine Open Source oder
Freeware-/Shareware-Lösung?
kommerzielle Software
Architektur
Speicherung der entwickelten ETL-Prozesse (ETL-Repository)
Kann die Speicherung des ETL-Repository in einer relationalen Datenbank
erfolgen?
Nein
Kann die Speicherung des ETL-Repository außerhalb einer relationalen
Datenbank erfolgen?
Ja (die Speicherung erfolgt in einem binären XML Dateiformat)
Werden vom Client des ETL-Tools Auswertungen des ETL-Repository zur
Verfügung gestellt (z. B. in Form von vordefinierten Berichten)?
Nein
Kann auf das ETL-Repository auch außerhalb des Clients lesend zugegriffen
werden (Existieren z. B. Views, auf die mit SQL zugegriffen werden kann)?
Nein
Kann auf das ETL-Repository auch außerhalb des Clients schreibend zugegriffen werden (Existieren z. B. API-Funktionen, um Objekte im ETLRepository zu erzeugen oder zu verändern)?
Nein
Existiert ein Metadaten-Repository und ist es erweiterbar?
Nein
Welche Sicherheitslösungen bestehen für den autorisierten Zugriff
auf Metadaten?
Keine Angaben
© areto consulting gmbh 2014
Seite 15
Herunterladen