© areto consulting gmbh 2014 Seite 1 Inhaltsverzeichnis Impressum ..................................................................................................................................................... 3 Über areto consulting gmbh .......................................................................................................................... 4 Über diese Marktstudie ................................................................................................................................. 5 Marktbetrachtung ......................................................................................................................................... 6 Unterstützte Datenbanken und Dateiformate .............................................................................................. 8 Stärken der vorgestellten ETL-Lösungen ...................................................................................................... 13 Übersicht der kommerziellen Aspekte und Details ....................................................................................... 14 Übersicht der Anbieter .................................................................................................................................. 16 Cubeware GmbH .................................................................................................................................... 17 Information Builders (Deutschland) GmbH ............................................................................................ 23 Microsoft Deutschland GmbH ................................................................................................................ 31 n³ data & software science GmbH ......................................................................................................... 38 Oracle Deutschland BV & Co. KG ........................................................................................................... 45 Pentaho EMEA ....................................................................................................................................... 53 SAP SE..................................................................................................................................................... 62 Syncsort GmbH....................................................................................................................................... 69 Talend Germany GmbH .......................................................................................................................... 76 Theobald Software GmbH ...................................................................................................................... 84 © areto consulting gmbh 2014 Seite 2 Impressum Copyright © 2014 areto consulting gmbh Alle Rechte vorbehalten, insbesondere das Recht der Vervielfältigung und Verbreitung sowie der Übersetzung. Kein Teil des Werkes darf in irgendeiner Form (Druck, Fotokopie, Mikrofilm oder andere Verfahren) ohne schriftliche Genehmigung von areto consulting gmbh reproduziert oder unter Verwendung elektronischer Systeme verarbeitet, vervielfältigt oder verbreitet werden. Haftungsausschluss Die Autoren versuchen mit größtmöglicher Sorgfalt, in der vorliegenden Studie richtige, vollständige und aktualisierte Informationen zur Verfügung zu stellen. Fehler können jedoch nicht völlig ausgeschlossen werden. Es wird daher keinerlei Haftung oder Garantie für die Richtigkeit, Vollständigkeit, Qualität und/oder Aktualität der veröffentlichten Informationen übernommen, es sei denn, die Fehler wurden vorsätzlich oder grob fahrlässig aufgenommen. Dies betrifft sowohl materielle als auch immaterielle Schäden Dritter, die durch die Nutzung des Informationsangebots verursacht werden. areto consulting gmbh Schanzenstr. 6-20 51063 Köln Phone +49 221 66 95 75-0 Fax +49 221 66 95 75-99 Geschäftsführer: Reinhard Mense, Jan Strackbein HRB-Nr.: 73109 Amtsgericht Köln http://www.areto-consulting.de [email protected] Autoren: Reinhard Mense, Geschäftsführender Gesellschafter und CTO Ulrich Kramer, Leiter Marketing und Vertrieb © areto consulting gmbh 2014 Seite 3 Über areto consulting gmbh Die areto consulting gmbh mit Sitz in Köln ist als IT-Beratungshaus spezialisiert auf die Themen Business Intelligence und Data Warehousing. areto ist ein langjähriger Partner führender Hersteller im BI-Sektor wie Oracle, EXASOL oder Informatica und bietet ihren zahlreichen Kunden im gesamten deutschsprachigen Raum Standard- und Individuallösungen sowie eigenentwickelte Applikationen und Tools. areto unterstützt mittelständische und Großunternehmen mit umfangreichen Professional Services bei der Konzeption und Einführung, beim Betrieb und bei der Weiterentwicklung von BI-Systemen. Zu den Leistungen gehören u.a. die Analyse der Geschäftsprozesse und Daten, die Datenmodellierung sowie die Entwicklung von ETL-Prozessen und Reports. Weiterhin bietet areto individuelle Schulungs- und Coachingmaßnahmen vor allem für SAP BO-Lösungen und die Entwicklung sowie die Übernahme von BI-Anwendungen von Oracle und SAP als Managed Service. Das Lösungsangebot von areto umfasst insbesondere Tools und Methoden, die maßgeblich zur Steigerung der Effektivität und Effizienz bei der Nutzung von BI-Systemen beitragen: BI CONNECT for ODI BI CONVERT for Informatica BI SELECT ETL Lineage for OWB Für einen schnellen und sicheren Wechsel vom OWB auf Informatica PowerCenter oder eine andere ETL-/ELT-Lösung steht mit BI CONVERT ein leistungsstarkes Werkzeug zur Verfügung. BI CONNECT verbindet den Oracle Data Integrator direkt mit dem führenden In-Memory-Datenbanksystem EXASolution von EXASOL und schafft so die Grundlage, selbst komplexeste Datenbestände in Echtzeit zu analysieren. Mit dem Dienstleistungspaket BI SELECT unterstützt areto Sie bei der systematischen Auswahl einer geeigneten und für Sie passenden BI-Lösung. ETL Lineage for OWB ermöglicht im Oracle Warehouse Builder eine Lineage-Analyse bis hinunter auf Attribut-Ebene. ETL Lineage ist ein unverzichtbares Tool bei der Durchführung von Migrationen vom Oracle Warehouse Builder auf eine neue Lösung und klärt zweifelsfrei die Herkunft von Kennzahlen, Attributen und Daten. areto veröffentlicht regelmäßig Studien, White Paper und Präsentationen und betreibt ab 15. Dezember 2014 unter der Adresse www.bi-labor.de einen Blog zu allen relevanten Themen rund um Business Intelligence. Im Frühjahr 2015 sind weitere Studien im Umfeld von In-Memory-Datenbanken sowie Predictive Analytics mit vielen Informationen über relevante Technologien und Methoden inklusive einer umfassenden Marktübersicht geplant. © areto consulting gmbh 2014 Seite 4 Über diese Marktstudie Es gibt zahllose Marktstudien zu Business-Intelligence-Tools ‒ warum also eine weitere? Ganz einfach: In Projekten stellen Kunden immer wieder die Frage nach der für sie passenden ETL-Lösung. Eine Frage, die aus unserer Sicht gar nicht so einfach zu beantworten ist. Wir sind der Meinung, dass eine sinnvolle Auswahl eines geeigneten Tools auf mehr beruhen muss als der bloßen Gegenüberstellung von Features und Kosten. Vielmehr ist es wichtig, Kriterien und Fragen zu definieren, die wirklich relevante Aufgaben in BI-/DWH-Projekten beschreiben und die am Ende einen echten und dauerhaften Nutzen bringen. Dieser nachvollziehbare Anspruch wird in unserer Marktstudie zum Beispiel durch Fragen nach Standards und Möglichkeiten zur Automatisierung sowie nach Verfügbarkeit fertiger Komponenten für typische Aufgaben in ETL-Prozessen abgebildet. Dabei haben wir uns keineswegs auf das Auflisten von Features beschränkt, sondern die Teilnehmer an dieser Studie aufgefordert, beispielhafte ETL-Prozesse für konkrete Fragestellungen zu skizzieren. Die gestellten Fragen und zu behandelnden Kriterien erforderten von den Teilnehmern eine intensive Auseinandersetzung, so dass teilweise mehrere Personen für die Beantwortung herangezogen wurden. Ich möchte mich deshalb bei allen Teilnehmern der Studie herzlich für ihre Unterstützung und die aufgebrachte Zeit bedanken! Wir wollen uns stets verbessern und weiterentwickeln. Deshalb möchten wir sowohl Sie, liebe Leserinnen und Leser, als auch die Teilnehmer der Studie aufrufen: Teilen Sie uns mit, was Ihnen gefallen hat, was Ihnen fehlt oder was Sie sich anders gewünscht hätten! Wir werden dies bei den nächsten Updates dieser Studie und bei weiteren Studien berücksichtigen. Abschließend möchte ich Sie auch auf zwei neue Studien hinweisen, die im Frühjahr 2015 erscheinen werden: Mit In-MemoryDatenbanken und Predictive Analytics werden wir zwei derzeit besonders stark im Fokus stehende Themen behandeln. Wenn Sie rechtzeitig über das Erscheinen der Studien informiert werden möchten, teilen Sie uns das einfach per eMail mit. Ich wünsche Ihnen viel Vergnügen beim Lesen! Reinhard Mense Geschäftsführender Gesellschafter und CTO areto consulting gmbh © areto consulting gmbh 2014 Seite 5 Marktbetrachtung Der Markt in Deutschland für Business Intelligence-Lösungen und -Werkzeuge wächst weiter kräftig: Auf rund 1,5 Milliarden Euro summierten sich laut einer Studie des Nürnberger BARC-Instituts1 die Umsätze für Lizenzen und Wartung von BI-Systemen in 2013 ‒ ein Anstieg von satten 11 Prozent. Darin eingeschlossen sind sowohl die Verkaufszahlen bei Backend- als auch bei Frontend-Lösungen wie beispielsweise Dashboard- oder Reporting-Anwendungen. Vor allem im Bereich der Datenmanagement-Software waren vergleichsweise hohe Zuwachsraten zu verzeichnen. Um etwa 20 Prozent stiegen laut BARC die Erlöse bei Backend-Programmen, getrieben durch neue Anforderungen (zum Beispiel die Integration von Social Media Daten oder zunehmende Big-Data-Initiativen), durch neue Technologien und Methoden (In-Memory-Datenbanken, Predictive Analytics) oder neue fachliche und gesetzliche Vorgaben. Auch die zunehmende Durchdringung von SAP HANA trug kräftig zum Umsatz bei. Der Markt für ETL- oder Datenintegrationssysteme präsentiert sich uneinheitlich: Einerseits haben die Anbieter von klassischen ERP- und CRM-Anwendungen immer mehr Funktionalität für die Integration der Daten und deren Aufbereitung in ihre Suiten eingebaut, andererseits umfasst das Marktangebot auch viele Teilgebiete, die durch spezialisierte Hersteller abgedeckt werden. Das Marktforschungsunternehmen Gartner2 kommt in diesem Bereich zu folgender Einteilung: Datenerfassung für Business Intelligence (BI), Analytik und Data Warehousing Konsolidierung und Bereitstellung von Stammdaten zur Unterstützung des Stammdatenmanagements (Master Data Management ‒ MDM) Datenmigration / Datenkonvertierung Die Synchronisation von Daten zwischen operativen Anwendungen Datenaustausch und Datennutzung in verbundenen Unternehmen Bereitstellung von Datendiensten in Verbindung mit Service-orientierten Architekturen (SOA) Integration Cloud-basierter Daten Big Data Initiativen Gartner2 schätzt das Marktvolumen nur für Integrationslösung auf etwa 2,2 Milliarden Dollar ‒ umgerechnet rund 1,8 Milliarden Euro. Damit wurden im Vorjahr etwa 9,4% mehr erzielt als in 2012. Bis zum Jahre 2018 sollen die Erlöse gar auf 2,9 Milliarden Euro steigen. Diese Einschätzung ist leicht nachvollziehbar, denn der Anspruch an Datenmanagementsysteme wird weiter steigen: Viele neue Technologien wie In-Memory-Datenbanken, Frameworks wie Hadoop und ähnliche Verfahren werden innovative Anwendungen ermöglichen und weitere Initiativen zur Nutzung der internen und externen Datenbestände in den Unternehmen begründen. Laut einer Studie des Dienstleistungsunternehmens Lünendonk GmbH3 sehen Manager und Anwender in naher Zukunft folgende Anwendungsschwerpunkte: Datenkonsolidierung, Datenintegration, Verbesserung der Datenqualität Management Reporting und Dashboards Finanzreporting Planung/Budgetierung Big Data Risikomanagement/Unternehmenssteuerung Die meisten dieser Themen berühren Aspekte der Datenintegration und des Datenmanagements. Insbesondere Big Data und darauf aufsetzende Verfahren wie Predictive Analytics verlangen neben der Einbeziehung neuer Datenbestände (zum Beispiel aus NoSQL- und NewSQL-Systemen) auch eine sehr hohe Datenqualität ‒ durchaus ein Bereich, wo viele Unternehmen erheblichen Nachholbedarf haben und sich so manche Schwäche einer unzureichenden Datenmodellierung und einer verkümmerten Data Governance offenbart. Insbesondere Banken und Finanzdienstleistungen werden mit der Umsetzung der gesetzlichen Vorgaben Datenstrukturen aufbauen müssen, die eine flexible, zuverlässige und schnelle Bereitstellung relevanter Daten und Berichte ermöglicht. Aber auch für alle übrigen Unternehmen gilt es, das Optimum aus der Datenflut und den im Unternehmen verborgenen Datenschätzen zu holen. Und dies hat stets mit der intensiven Nutzung von Lösungen zur Integration und Aufbereitung von Informationen zu tun. 1 Der Markt für Business Intelligence in Deutschland 2013; Business Application Research Center ‒ BARC GmbH; Juli 2014 Magic Quadrant for Data Integration Tools; Gartner Inc.; Juli 2014 3 Lünendonk®-Marktstichprobe 2014 ‒ Business Intelligence als Kernkompetenz; Lünendonk GmbH, 2014 2 © areto consulting gmbh 2014 Seite 6 Unterstützte Relationale Datenbanken I ODBC/JDBC andere Datenbanken per ODBC/JDBC andere Datenbanken per nativer Anbindung --- J/O J/O J/O J/O J/O ● ● --- Information Builders ● ● J ● ● ● ● ● ● ● J ● ● ● ● ● Microsoft ● ● J/O ● J/O ● ● ● ● ● J/O ● J/O ● ● ● J/O J/O J/O J/O J/O ● ● --- J/O J/O J/O J/O J/O ● ● --- ● ● ● ● --- ● ● ● ● ● ● ● --- ● ● ● J/O J/O J/O J/O J/O ● ● ● J/O J/O J/O J/O J/O ● ● ● SAP ● J/O J/O ● J/O ● ● ● ● J/O J/O ● J/O ● ● ● Syncsort ● ● J/O ● --- ● ● ● ● ● J/O ● --- ● ● ● Talend ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● Theobald Software --- --- --- --- --- --- --- ● ● ● --- ● J/O ● --- ● Pentaho ● : (native) Unterstützung J : JDBC-Anbindung O : ODBC-Anbindung SAP HANA ● als Quelle Oracle ● Oracle MySQL J/O n data & software science Microsoft SQL Server J/O 3 IBM DB/2 J/O Cubeware andere Datenbanken per nativer Anbindung J/O Anbieter andere Datenbanken per ODBC/JDBC ODBC/JDBC SAP HANA Oracle MySQL Microsoft SQL Server IBM DB/2 J/O Datenbanken als Ziel J / O : JDBC/ODBC-Anbindung -- keine/keine Angaben Cubeware Andere relationale Datenbanken per ODBC/JDBC (Quelle und Ziel): EXASolution Information Builders Unterstützung IBM DB/2: 9.5, 9.7, 10 cli, 10 Leightweight Client Unterstützung Microsoft SQL Server 2005, 2008 2012 Unterstützung Oracle Database 9.2, 10g, 11g, 12c Andere relationale Datenbanken per ODBC/JDBC (Quelle): Cache, Excel (via ODBC), Greenplum DB, Hive, JBoss, Netezza, PostgreSql, Teradata Andere relationale Datenbanken per ODBC/JDBC (Ziel): Greenplum DB, Netezza, PostgreSql, Teradata Andere relationale Datenbanken per nativer Anbindung (Quelle): Hyperstage, Nucleus/SAND,IBM i Access, IDMS/SQL,Informix, Ingres,Interplex/Unisys DMS 1100, Oracle Times Ten, parAccel, Progress, PSQL, Redbrick, Sybase, UniData, UniVerse Andere relationale Datenbanken per nativer Anbindung (Ziel): Hyperstage, Nucleus/SAND, Informix, Ingres, Progress, PSQL, Redbrick, Sybase Microsoft Andere relationale Datenbanken per ODBC/JDBC (Quelle): alle für die ein Windows ODBC Treiber erhältlich ist Andere relationale Datenbanken per ODBC/JDBC (Ziel): alle für die ein Windows ODBC Treiber erhältlich ist Andere relationale Datenbanken per nativer Anbindung (Quelle): alle für die ein Windows OLEDB Treiber erhältlich ist; zusätzlich ist ein Teradata, SAP BO, Oracle CDC, REST Zugriff möglich Andere relationale Datenbanken per nativer Anbindung (Ziel): alle für die ein Windows OLEDB Treiber erhältlich ist; zusätzlich ist ein Teradata, SAP BO, Oracle CDC, REST Zugriff möglich © areto consulting gmbh 2014 Seite 7 Unterstützte Relationale Datenbanken n3 data & software science Andere relationale Datenbanken per ODBC/JDBC (Quelle) und Ziel: Alle mit JDBC-Treiber Oracle Andere relationale Datenbanken per ODBC/JDBC (Quelle und Ziel): Times Ten 11.2+, Apache Derby 10.x, Apache Hive 0.7.1, IBM Netezza NPS 3.x, 4.x, 5.x, 6.x, Ingres 2006, Interbase 2007, Paradox 9.x, 10.x, Persavive PSQL 8, 9, 10, Postgres 7.x, 8.x, 9.x, Progress Open Edge 8.x, 9.x, 10.x, Teradata 12.x, 13.x, 14.x, dBase III, IV, V, LDAP V3, MS Access/Excel/Word 2000, 2007, GoldenGate 10.4+, E-Business Suite 10.5.10*, 12.0*, 12.1*, Oracle Internet Direcotry 10.1.4.3.0, Oracle Mediator, 10.1.3.4.0, 11.1.1.3.0, Oracle Service Bus 11.1.1.3.0, Tuxedo 11.1.1.1.0, Vsam CiCs, IBM MQ Series, MS Active Directory Andere relationale Datenbanken per nativer Anbindung (Quelle): Times Ten 11.2+, Apache Derby 10.x, Apache Hive 0.7.1, IBM Netezza NPS 3.x, 4.x, 5.x, 6.x, Ingres 2006, Persavive PSQL 8, 9, 10, Postgres 7.x, 8.x, 9.x, Progress Open Edge 8.x, 9.x, 10.x, SAP BW 7.0, Teradata 12.x, 13.x, 14.x, GoldenGate 10.4+, E-Business Suite 10.5.10*, 12.0*, 12.1*, Oracle Internet Direcotry 10.1.4.3.0, Oracle Mediator, 10.1.3.4.0, 11.1.1.3.0, Oracle Service Bus 11.1.1.3.0, Tuxedo 11.1.1.1.0, SAP ERP 4.6c, 4.7, 7.0+, SAP ERP ECC 5.0, 6.0, Vsam CiCs, IBM MQ Series, MS Active Directory Andere relationale Datenbanken per nativer Anbindung (Ziel): Times Ten 11.2+, Apache Derby 10.x, Apache Hive 0.7.1, IBM Netezza NPS 3.x, 4.x, 5.x, 6.x, Paradox 9.x, 10.x, Persavive PSQL 8, 9, 10, Postgres 7.x, 8.x, 9.x, Progress Open Edge 8.x, 9.x, 10.x, SAP BW 7.0, Teradata 12.x, 13.x, 14.x, dBase III, IV, V, LDAP V3, GoldenGate 10.4+, E-Business Suite 10.5.10*, 12.0*, 12.1*, Oracle Internet Direcotry 10.1.4.3.0, Oracle Mediator, 10.1.3.4.0, 11.1.1.3.0, Oracle Service Bus 11.1.1.3.0, Tuxedo 11.1.1.1.0, SAP ERP 4.6c, 4.7, 7.0+, SAP ERP ECC 5.0, 6.0, Vsam CiCs, IBM MQ Series, MS Active Directory Pentaho Andere relationale Datenbanken per ODBC/JDBC (Quelle und Ziel): Apache Derby, AS/400, InfiniDB, Exasol 4, Firebird SQL, Greenplum, H2, Hive, Hive 2, Hypersonic, Informix, Ingres, LucidDB, MaxDB (SAP DB), PostgreSQL, SQLite, Teradata, UniVerse database; Andere relationale Datenbanken per nativer Anbindung (Quelle und Ziel): Microsoft, Oracle und Mondrian SAP Unterstützung IBM DB/2: iSeries 6.4, 6.1, 7.1, LUW 9.1, 9.5, 9.7, 10.1, 10.5, zOS 8.1, 9.1, 10.5 via iSeries Access/ DB2 Connect/DataDirect ODBC Unterstützung Microsoft SQL Server Data Direct ODBC: 2000 SP4, 2005 SP3/SP4, 2008 SP2/R2, 2012 Unterstützung MySQL 5.0, 5.1, 5.5 Unterstützung Oracle Database 9i, 10g, 10gR2, 11g, 11gR1, 11gR2, 12c, 12cR1 Unterstützung SAP HANA ab 1.0 SP6, SP7, SP8 via HANA ODBC Andere relationale Datenbanken per ODBC/JDBC-Anbindung (Quelle und Ziel) : SAP IQ, Teradata Andere relationale Datenbanken per nativer Anbindung (Quelle und Ziel): Netezza, Informix, SAP ASE, SAP SQL Anywhere, HADOOP Syncsort Unterstützung IBM DB/2: 9.1; 9.7 and higher Unterstützung Microsoft SQL Server 2005 and higher Unterstützung MySQL Level 3 compliant Unterstützung Oracle Database 10g; 11g Unterstützung ODBC/JDBC Level 3 compliant Andere relationale Datenbanken per ODBC/JDBC-Anbindung (Quelle und Ziel) : JDBC level 3 compliant und ODBC Level 3 compliant Andere relationale Datenbanken per nativer Anbindung (Quelle und Ziel): Teradata; Vertica; Sybase; Netezza; Hive; Greenplum; Greenplum: 4.2 and higher; Hive: Hive Server 2; Netezza: 6.0 and higher Sybase: ASE und IQ 15.0 and higher; Teradata: TD13 und TD14; Vertica: 5.1 und 6.0 und 7.0 Talend Talend verwendet grundsätzlich JDBC für den Datenbankzugriff, wobei datenbankspezifische Komponenten Spezifika der jeweiligen Datenbank berücksichtigen. Zusätzlich werden die jeweiligen Batch/Bulk-Load Komponenten des Herstellers für das Laden großer Datenmengen unterstützt. Andere relationale Datenbanken per ODBC/JDBC-Anbindung (Quelle und Ziel): generelle JDBC/ODBC Anbindung unterschiedlichster Datenbanken möglich; Für eine vollständige Übersicht https://help.talend.com/ display/TalendPlatformforDataManagementInstallationandUpgradeGuide55EN/Home Appendix B Theobald Software Andere relationale Datenbanken per nativer Anbindung (Quelle und Ziel): SAP ERP © areto consulting gmbh 2014 II Seite 8 Unterstützte Nicht-Relationale Datenbanken MongoDB andere Nicht-Relationale Datenbanken --- ● --- --- --- --- --- --- Information Builders --- --- ● ● ● --- --- ● ● ● Microsoft ● ● ● ● ● ● ● ● ● ● n³ data & software science --- --- --- --- --- --- --- --- --- --- Oracle ● --- ● ● --- ● --- ● ● --- Pentaho ● ● ● ● ● ● ● ● SAP --- --- --- ● --- --- --- --- ● --- Syncsort ● ● ● ● ● ● ● ● ● ● Talend ● ● ● ● ● ● ● ● ● ● Theobald Software --- --- --- --- --- --- --- --- --- ● als Quelle HBase Google Big Table --- ● : (native) Unterstützung Apache Cassandra ● Anbieter andere Nicht-Relationale Datenbanken MongoDB HBase Google Big Table Apache Cassandra Cubeware Datenbanken als Ziel -- keine/keine Angaben Information Builders Andere unterstützte Datenbanken (Quelle): Adabas, Datacom/DB, IDMS/DB, IMS, Lotus Notes, Millennium, Model 204, Axiom EPM, JD Edwards EnterpriseOne, JD Edwards World, Lawson, Oracle Applications, PeopleSoft, Salesforce.com, SAP, Siebel,Adabas/NAT, Address Doctor, CICS Transaction, CICS Transaction for Natural, IMS Transaction, IWAF, Natural Batch, Query/400, REST, Web Services, FOCUS/FDS Microsoft Unterstützte Datenbanken benötigen 3rd Party connection data flow component; diverse 3rd Party data flow components sind am Markt erhältlich, eigene Entwicklung ist einfach möglich, da die Schnittstelle offen und dokumentiert ist Pentaho Andere unterstützte Datenbanken: Impala, InfoBright, Ingres VectorWise, MonetDB, Neoview, Netezza, Vertica Syncsort mittels HDFS bei allen Datenbanken, die diesen Standard unterstützen © areto consulting gmbh 2014 Seite 9 Unterstützte Multidimensionale Datenbanken Oracle Database OLAP Option SAP Netweaver BW SAS OLAP Server andere multidimensionale Datenbanken --- ● ● --- ● --- --- ● ● --- ● ● --- ● --- --- Information Builders --- --- --- ● ● --- ● --- --- --- --- --- --- --- --- --- --- --- Microsoft ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● n³ data & software science --- --- --- --- --- --- --- --- --- --- --- --- --- --- --- --- --- --- Oracle --- --- --- --- ● ● --- --- --- --- --- --- --- ● ● --- --- --- Pentaho --- --- --- ● --- --- --- --- ● --- --- --- --- --- --- --- --- --- SAP --- --- --- --- --- --- ● --- --- --- --- --- --- --- --- ● --- --- Syncsort --- --- --- --- --- --- --- --- --- --- --- --- --- --- --- --- --- --- Talend --- --- --- --- --- --- ● --- ● --- --- --- --- --- --- --- --- ● Theobald Software --- --- --- --- --- --- ● --- --- --- --- --- ● ● --- ● --- ● als Quelle Oracle Essbase Microsoft Analysis Services Jedox OLAP Server Infor BI OLAP Server IBM Cognos TM1 andere multidimensionale Datenbanken SAS OLAP Server SAP Netweaver BW ● ● : (native) Unterstützung Oracle Database OLAP Option ● Anbieter Oracle Essbase Microsoft Analysis Services Jedox OLAP Server Infor BI OLAP Server IBM Cognos TM1 Cubeware Datenbanken als Ziel -- keine/keine Angaben Microsoft Unterstützte Datenbanken anderer Hersteller benötigen jeweils OLEDB/ODBC Treiber; SAP NetWeaver BW ergänzt durch Theobald Software Pentaho Unterstützte andere multidimensionale Datenbanken (Quelle): Palo MOLAP Server (Plug-In specific access method), Mondrian (native) SAP Unterstütze Versionen 3.5, 7.0, 7.3, 7.4, 7.4SP6 Syncsort DMX ist ein typisches ETL Tool. Als solches bereiten DMX die Daten auf lädt sie an die benötigten Stellen. Multidimensionale Datenbanken laden dann von dort typischerweise die Daten selbst in die Cubes Talend Unterstützte andere multidimensionale Datenbanken (Quelle und Ziel): Mondrian Palo Theobald Software Unterstützte andere multidimensionale Datenbanken (Ziel): Goddata © areto consulting gmbh 2014 Seite 10 Unterstützte Dateien/Datenformate JSON andere Datenformate XML CSV Fixed Length Flat File andere Datenformate JSON XML CSV Fixed Length Flat File Cubeware ● ● --- --- ● --- ● --- --- ● Information Builders ● ● ● ● ● ● ● ● ● --- Microsoft ● ● ● ● ● ● ● ● ● ● n³ data & software science ● ● ● ● ● ● ● ● ● ● Oracle ● ● ● ● --- ● ● ● ● --- Pentaho ● ● ● ● ● ● ● ● ● ● SAP ● ● ● ● ● ● ● ● ● ● Syncsort ● ● ● ● ● ● ● ● --- ● Talend ● ● ● ● ● ● ● ● ● ● Theobald Software --- --- --- --- --- ● ● ● ● ● Datenbanken Anbieter ● : (native) Unterstützung als Quelle als Ziel -- keine/keine Angaben Cubeware Andere Datenformate: xls/xlsx Information Builders Andere Datenformate: Acucobol CISAM, DB Heritage Files, Delimited Flat File, Excel (via direct retrieval), Flat File, Informix, CISAM, MicroFocus CISAM, RMS,VSAM Microsoft Andere Datenformate: custom code oder 3rd Party Komponente notwendig (JSON); Excel, Access n³ data & software science Anderes Datenformat: Excel Pentaho Andere Datenformate: Email, ESRI, Google Analytics, Google Docs, GZIP, HL7, IBM Websphere MQ, JMS, LDAP, LDIF, MS Access, MS Excel, RSS, S3 CSV, Salesforce, SAS, Yaml SAP Andere Datenformate: DTD, als Quelle: Excel Worksheet, Cobol Copybook, VCF Dateien (Genomsequenzen), ESRI Shapefiles (Geodaten), beliebige weitere via Adapter SDK Syncsort Andere Datenformate: Informix C-ISAM; Microfocus; Unikox VSAM; ACUCOBOL GT Version; Fixed length; Mainframe; Fortran Talend Andere Datenformate: HDFS, Apache Log, ARFF, EBCDIC, Excel, LDIF, Mail Theobald Software Anderes Datenformat: Tableau-Datenfiles © areto consulting gmbh 2014 Seite 11 Stärken des ETL-Tools aus Sicht des Herstellers Cubeware Information Builders Einfachheit in der Bedienung, selbst für die Definition komplexer ETL Prozesse; ETL und OLAP Modellierung über ein Tool unter Verwendung eines Repositories; Definition von ETL Prozessen durch Drag & DropFunktional umfangreiches, leicht erlernbares ETL Tool. Der gesamte ETL Entwicklungsprozess erfolgt über eine graphische Benutzeroberfläche und zwar schrittweise als Daten- und Prozess Flows. Die mit dem Data Migrator erstellten Flows sind als lesbare Textfiles gespeichert, bestehend aus SQL Commandos und interner Scriptsprache. So ist der gesamte Ablauf Line by Line nachvollziehbar (vollständiges Audit). Mehr als 250 Datenadapter stehen als Quell- oder Zieladapter bereit. Der DataMigrator nutzt dieselben Metadaten wie das BI Reporting Werkzeug WebFOCUS, daraus ergeben sich Synergien für kürzere Entwicklungszeiten und Wiederverwendbarkeit von Modulen. Microsoft Geschwindigkeit, Remote Debugging, kurze Designzeit, vollständige API zur Programmierung. n³ data & software science leicht verständliche grafische Oberfläche; bedienbar mit grundlegenden Datenbank-Kenntnissen; einfach in bestehende Infrastruktur integrierbar. Oracle 1. dynamische Codegenerierung durch Template (Knowledge Module): Der Anwender kann den genierten Code an seine Anforderungen anpassen. Einsatzszenarios: - individuelle Performanceanpassungen - neue Funktionalitäten, die Oracle nicht in das Tool eingebaut hat - Standardisierung des Codes: wiederkehrende Schritte werden automatisch generiert und die Codestruktur ist immer die gleiche (führt zu sehr viel kürzeren Entwicklungszeiten und geringeren Entwicklungskosten) 2. heterogene Umgebungen 3. Integration in den Oracle Product Stack von der Hardware bis zum BI Werkzeug 4. Java basierte Entwicklungsumgebung Pentaho Intuitiv, skalierbar, offen, Baukastenprinzip (eigene Schritte können definiert und ausgeführt werden), alle marktgängigen Speichersysteme können integriert werden. Big Data Adaptive Layer ‒ Änderungen in Hadoop-Distributionen sind transparent; Datenbank-Repository bietet Möglichkeiten für Teamarbeit, zur Hinzufügung von Informationen, ist Metadaten-getrieben und kann in einer Cloud-Umgebung eingesetzt werden. SAP Benutzerfreundlichkeit, starke Datenqualitäts- und ETL-Transformationen in einem Tool, hohe Performance, Erweiterbarkeit via Adapter SDK, Real-Time und Batch-Szenarien in einem Tool. Syncsort DMXExpress ist aus Sicht des Herstellers eines der leistungsfähigsten ETL Tools am Markt. Durch seine MainframeHerkunft ist DMX gewohnt, mit wenig Ressourcen sehr effizient zu arbeiten. Typischer Weise benötigt DMX ca. 1/3 der Cores, die ein herkömmliches ETL Tool benötigt. Dazu verbraucht DMX ca. 65% weniger Memory. Durch den Einsatz der verschiedenen DMX Features wie Compression kann der Bedarf an Plattenplatz drastisch reduziert werden. DMX kann komplette Workflows komprimiert verarbeiten ‒ also sowohl komprimierte Files lesen, verarbeiten und wieder wegschreiben. Ein Extrahieren ist nicht nötig. Talend Durch native Unterstützung moderner Big-Data-Plattformen wie Hadoop und NoSQL nehmen die „Zero Footprint“ Lösungen von Talend die Komplexität und statten IT-Abteilungen so aus, dass sie schneller auf Geschäftsanforderungen reagieren können. Talends einheitliches Lösungsportfolio basiert auf Open Source und wird vom breitesten Ökosystem in der Branche unterstützt. Es wird über ein vorhersehbares Subskriptionsmodell angeboten und beinhaltet Big Data, Datenintegration, Data Quality, Master Data Management (MDM), einen Enterprise Service Bus (ESB) und Geschäftsprozessmanagement (BPM). Theobald Software Instant Datawarehousing für automatisiertes Anlegen der DWH-Objekte, minimaler bis kein Eingriff in das SAP, robustes, standardisiertes Verfahren für inkrementelle Beladungen, zentrales Security-Konzept. © areto consulting gmbh 2014 Seite 12 Übersicht der kommerziellen Aspekte und Details I Welche Lizensierungsmodelle gibt es (z.B. pro CPU, pro Named User)? Cubeware Keine Angaben Information Builders pro CPU Core und pro Datenquelle Microsoft pro Core, min. 4 Cores n³ data & software science Named User Oracle Oracle bietet CPU-basierte Lizensierung (anhand der Cores des jeweiligen Prozessor-Anbieters) und eine Named User Plus Lizensierung an. Es sind die Staging-/Transformations-Area zu lizensieren, die Quell- und Zielsysteme sind in der Regel enthalten (Ausnahme: Host-Systeme, Standards-Applikationen wie z. B. SAP oder Siebel) Pentaho per Core für die Pentaho Plattform; zusätzlich per Node für den adaptiven Big Data Layer / Hadoop SAP CPU -Kerne Syncsort Kauf- und Mietlizenzen pro CPU Talend Named User, Concurrent User, Core-based Theobald Software pro Server Welche kostenpflichtigen Optionen und Zusatzmodule bieten Sie an? Cubeware Keine Angaben Information Builders Keine Angaben Microsoft Keine n³ data & software science Keine Angaben Oracle Der Datenintegrationsbereich besteht im wesentlichen aus 3 Produkten: 1. ODI 2. Oracle Golden Gate (OGG) für Realtime Integration 3. Oracle Enterprise Data Quality (EDQ) für Data Quality and Data Profiling, optional Address Verification Server Die drei Produkte können unabhängig voneinander betrieben werden, sie lassen sich auch integrieren und werden dann von ODI gesteuert. Optionen: 1. ODI Management Pack für Oracle Enterprise Manager Grid Control (z. B. für einheitliche Administration aller Oracle Produkte oder die Optimierung des von ODI generierten Codes durch die Datenbank) 2. Adaptoren für Standard Applikationen (z. B. SAP ECC/BW, Siebel oder EBus) 3. Adaptoren für Host Systeme Pentaho Adaptive Big Data Layer, Data Science Pack SAP Keine Syncsort DMX-Hadoop Talend Mission Critical Support Theobald Software Keine Angaben © areto consulting gmbh 2014 Seite 13 Übersicht der Anbieter Vorgestellte Unternehmen und Lösungen in dieser Studie Cubeware GmbH .............................................................................................................................................................. 17 Information Builders (Deutschland) GmbH ...................................................................................................................... 23 Microsoft Deutschland GmbH .......................................................................................................................................... 31 n³ data & software science GmbH .................................................................................................................................... 38 Oracle Deutschland BV & Co. KG ...................................................................................................................................... 45 Pentaho EMEA.................................................................................................................................................................. 53 SAP SE ............................................................................................................................................................................... 62 Syncsort GmbH ................................................................................................................................................................. 69 Talend Germany GmbH .................................................................................................................................................... 76 Theobald Software GmbH ................................................................................................................................................ 84 Weitere Anbieter Actian Germany GmbH 63303 Dreieich www.actian.com IBM Deutschland GmbH 71139 Ehningen www.ibm.de Informatica GmbH 60528 Frankfurt am Main www.informatica.com SAS Institute GmbH 69118 Heidelberg www.sas.com Vermissen Sie ein Unternehmen oder eine Lösung? Soll Ihr Unternehmen oder Ihr ETL-System im geplanten Update der Marktstudie Anfang 2015 ebenfalls aufgeführt werden? Setzen Sie sich bitte mit uns in Verbindung, wir werden Ihre Wünsche gerne berücksichtigen. © areto consulting gmbh 2014 Seite 14 Cubeware GmbH I Anbieter Anbieter Cubeware GmbH, Mangfallstr. 37, 83026 Rosenheim Webseite und eMail-Adresse www.cubeware.com, [email protected] Anzahl Mitarbeiter weltweit und in Deutschland 200 (weltweit), 100 (deutschlandweit) Softwarelösung Genaue Bezeichnung des ETL-Tools C8 Importer Version des aktuell verfügbaren ETL-Tools, die als Grundlage für die Beantwortung dieser Fragen herangezogen wurde C8 Importer R8 Modul 1 C8 SAP Connect R8 (Zugriff auf SAP ERP) Modul 2 C8 SAP OLE DB Connect R8 (Zugriff auf SAP BW) Modul 3 C8 Infor Connect R8 (Zugriff auf ION BI) Modul 4 C8 TM1 Connect R8 (Zugriff auf IBM Cognos TM1) Modul 5 C8 MS AS Connect R8 (Zugriff auf Microsoft Analysis Services) Modul 6 C8 Essbase Connect R8 (Zugriff auf Oracle Essbase) Modul 7 C8 EXASOL Connect R8 (Zugriff auf EXASolution) Handelt es sich um kommerzielle Software oder um eine Open Source oder Freeware-/Shareware-Lösung? kommerzielle Software Architektur Speicherung der entwickelten ETL-Prozesse (ETL-Repository) Kann die Speicherung des ETL-Repository in einer relationalen Datenbank erfolgen? Nein Kann die Speicherung des ETL-Repository außerhalb einer relationalen Datenbank erfolgen? Ja (die Speicherung erfolgt in einem binären XML Dateiformat) Werden vom Client des ETL-Tools Auswertungen des ETL-Repository zur Verfügung gestellt (z. B. in Form von vordefinierten Berichten)? Nein Kann auf das ETL-Repository auch außerhalb des Clients lesend zugegriffen werden (Existieren z. B. Views, auf die mit SQL zugegriffen werden kann)? Nein Kann auf das ETL-Repository auch außerhalb des Clients schreibend zugegriffen werden (Existieren z. B. API-Funktionen, um Objekte im ETLRepository zu erzeugen oder zu verändern)? Nein Existiert ein Metadaten-Repository und ist es erweiterbar? Nein Welche Sicherheitslösungen bestehen für den autorisierten Zugriff auf Metadaten? Keine Angaben © areto consulting gmbh 2014 Seite 15