SAS und IBM SPSS

Werbung
S
wie
SAS und IBM SPSS
ein Vergleich
Welche Analyselösung eignet sich besser?
SAS und IBM sind zwei marktführende Anbieter im Bereich Analytics-Software. Traditionell mit unterschiedlichen Anwendungsfeldern nähern sie sich
in ihren Funktionalitäten immer mehr an. Manche Konzerne haben sogar
beide Lösungen im Einsatz. Lohnt es sich, zu konsolidieren?
Industrie 4.0, Digitalisierung und das Internet of Things beschäftigen insbesondere Fertigungsunternehmen, Maschinenbauer und Automobilhersteller. Smart Factorys, in denen alles vernetzt ist, Maschine mit Maschine
kommuniziert, Prozesse zentral gesteuert werden oder sich selbst steuern,
sind in Zukunft die Regel. Und während Konzerne heute Kennzahlen einzelner Geschäftsfelder isoliert betrachten, da Abhängigkeiten nicht offensichtlich sind, lassen sich künftig beispielsweise Daten eines konzerninternen
Finanzinstituts für die Produktionsplanung zurate ziehen. Wenn die Bank
verstärktes Interesse an der Finanzierung bestimmter Automodelle registriert, könnte sie diese Daten an die Produktion übergeben, die daraufhin
optimiert würde. Idealerweise könnte die Fertigung sogar auf dieselben Daten- und Analysesysteme zugreifen, um auf Basis relevanter Informationen
aus Gegenwart und Vergangenheit für die Zukunft zu planen. Stichwort:
Predictive Analytics.
Zwei derzeit führende Anbieter derartiger Lösungen sind SAS und IBMi.
Erstere stellen Kunden mit der SAS Intelligence Platform umfangreiche Predictive-Analytics-Lösungen zur Verfügung. IBM hat mit dem Kauf von SPSS
das eigene Portfolio um leistungsfähige Analyse-Software ergänzt.
Bereits jetzt haben viele Unternehmen eine der Lösungen im Einsatz. SAS
dominiert dabei traditionell im Finanzbereich, während SPSS verstärkt von
den anderen Abteilungen bzw. Unternehmenszweigen genutzt wird. Manche Konzerne verwenden Software von beiden Anbietern in unterschiedlichen Bereichen. Daher drängt sich die Frage auf: Welches System kann
mögliche Anforderungen am umfassendsten erfüllen?
Vergleich SAS und SPSS
Im Folgenden werden SAS Intelligence Platform 9.3 (kurz: SAS) und IBM
SPSS Statistics 23, IBM SPSS Modeler 17, IBM SPSS Collaboration and
Deployment Services (CADS) 7 (Kurz SPSS) anhand unterschiedlicher Parameter verglichen: Datenquellen und -haltung, Datenanalyse, Kosten und
Integration von R. Darüber hinaus soll eine beispielhafte „Querintegration“
Klarheit bringen. Können typische Fragestellungen aus der Produktion in
SAS abgebildet werden? Lassen sich charakteristische Bank-Fragestellungen mithilfe von SPSS analysieren?
Daten: Quellen und Haltung
Datenquellen
Sowohl SAS als auch SPSS unterstützen Daten aus Datenbanken. Die Aus-
Hinsichtlich der Datenquellen sind
nahme bildet PostgreSQL, das von SPSS nicht unterstützt wird. Auch ein
sich beide Lösungen sehr ähnlich.
Import aus Excel, XML, Hadoop, Geodaten sowie Text- bzw. CSV- oder
Bei der Datenhaltung gibt es aller-
SAV- und SAS-Dateien ist bei beiden Lösungsanbietern möglich. Zudem
dings Unterschiede.
lassen sich Simulierungen generieren und Daten manuell eingeben
Ausschließlich mit SAS können Anwender Daten aus SAP BusinessWarehouse importieren. Im Gegenzug dazu ist ein Import aus IBM Cognos
BI, IBM Cognos TM1 oder IBM Data Collection nur mit SPSS möglich. DA
Daten-Quelle
SAS
SPSS
Datenbanken
Ja
Ja*
Text / CSV-Dateien (Trennzeichengetrennt)
Ja
Ja
Textdateien mit fester Breite
Ja
Ja
Excel
Ja
Ja
XML
Ja
Ja
SAV-Datei (IBM SPSS Statistics)
Ja
Ja
IBM Cognos BI
Nein
Ja
IBM Cognos TM1
Nein
Ja
IBM Data Collection
Nein
Ja
SAS-Dateien
Ja
Ja
Hadoop etc…
SAS/ACCESS
Über Analytic Server
Geodaten (shp und dbf Dateien)
Bei SAS GIS
bereits enthalten
Ja
SAP BusinessWarehouse
Ja
Nein
Simulationsgenerierung (generieren der Zufallszahlen entsprechend
einer vorgegebenen Verteilung)
Ja
Ja
Manuelle Eingabe
Ja
Ja
*Außer PostgreSQL
Datenhaltung
SAS enthält eine eigene, interne Datenbank, die auf die Anforderungen der Informationsgewinnung ausgelegt ist.ii Dies ist bei SPSS nicht der Fall. Vielmehr
ist der IBM SPSS Modeler dank Pushback-Funktionalität darauf ausgerichtet,
Data-Mining und Datenvorbereitung direkt in der Datenbank vorzunehmen.iii
Datenanalyse
Datenanalyse
SAS
SPSS
Univariate, deskriptive Analyse
Ja
Ja
Statistische Tests mit
ein, zwei oder mehr
unabhängigen bzw.
abhängigen Variablen
in unterschiedlichen
Kombinationen
Ja
Ja
Lebensdauer- und
Ereignisanalyse
(Sterbetafel-Methode,
Kaplan-Meier-Schätzer
der Überlebenswahrscheinlichkeit,
Cox-Regression)
Ja
Ja
Datenanalyse
SAS
SPSS
Screening von Feldern
Variable Selection (Knoten in SAS
Enterprise Miner)
Merkmalauswahl
(Knoten in IBM
SPSS Modeller)
Entscheidungsbäume
Decision Tree (Knoten in SAS Enterprise
Miner) Bietet ähnliche
oder sogar erweiterte Funktionalitäten
wie SPSS, erfordert
aber mehr Kenntnis
beim Anwender.
C5.0, Classification &
Regression Tree, Chi
Squared Automatic
Interaction Detector,
Quick unbiased efficient
statistical tree (Knoten
in IBM SPSS Modeler)
Cluster-Modelle
Cluster, SOM/Kohonen (Knoten in SAS
Enterprise Miner)
K-Means, Kohonen,
TwoStep, TwoStep-AS,
Anomalie (Knoten in
IBM SPSS Modeler)
Zeitreihenmodelle
(einfach, lineare Trends
nach Holt bzw. Brown,
gedämpfter Trend,
einfach saisonal, additives bzw. multiplikatives Winters-Modell)
Ja. Zusätzlich TS
Similarity Analyse in
SAS Enterprise Modeler zum Vergleich
zweier Sequenzen
Ja. Zusätzlich Temporale kausale Modellierung
sowie räumlich-zeitliche
Vorhersage (spatiotemporal prediction)
Assoziationsregeln
Ja
Ja
Neuronale Netze
Neural Network, DM
Neural und Auto Neural (Knoten in SAS
Enterprise Modeler).
Neuronales Netz
(Knoten in IBM
SPSS Modeler)
Support Vector Machine Ja
Ja
Nächste-Nachbarn-Modelle
Ja
Ja
Entity Analytics
Ja
Ja
Social Network
Nein
Ja
Text Mining
Ja
Ja
Kosten
SAS-Software ist nicht käuflich zu erwerben, sondern lediglich zu mieten, wobei
die Firma ihren Kunden individuelle Angebote erstellt.iv In der Regel beträgt
die kürzeste Mietdauer ein Jahr. SAS bietet unterschiedliche Möglichkeiten der
Implementierung. Viele Module sind bereits in der Cloud verfügbar oder werden
dort künftig verfügbar sein.
Berücksichtigen Sie nicht nur die rei-
Im Gegensatz dazu werden IBM SPSS Lizenzen gekauft.
nen Anschaffungskosten, sondern
Software
Basis
Premium
IBM SPSS Modelerv
ab ca. 4.200 EUR*
ab ca. 10.600 EUR*
IBM SPSS Statisticsvi
ab 1.100 EUR*
ab ca. 7.300 EUR*
*Preise jeweils pro User, inkl. technischer Support für zwölf Monate. Weitere
Preisinformationen auf der IBM Homepage.
auch eventuell anfallende Schulungsaufwände.
Zusätzlich zu den reinen Lizenzkosten sind auch (Um-)Schulungsaufwände zu
berücksichtigen. SPSS genießt den Ruf, leichter im Selbststudium erlernbar zu
sein als SAS, da die Bedienung intuitiver ist. Hier könnten gegebenenfalls Kursgebühren gespart werden.
„SPSS Modeler bietet eine grafische Benutzeroberfläche zur einfachen Modellierung aktionsbasierter komplexer analytischer Auswertungen, die sich problemlos von Anwendern ohne Programmierkenntnisse nutzen lässt“, so Alexander
Frank, Technical Sales Specialist/Business Analytics der IBM Software Group.
„Dennoch bietet SPSS Modeler ein breites Spektrum an mathematischen Algorithmen, Datenvorbereitungs- und Integrationsmöglichkeiten, welche die Einbindung von Daten aus verschiedenen Systemen, Technologien und Umgebungen
ermöglichen“, führt der IT-Experte weiter aus.
Grundsätzlich wird zu beiden Lösungen eine Vielzahl von Schulungen angeboten. Zudem sollten nicht nur Gebühren berücksichtigt werden, sondern auch die
Zeit, die für das Einarbeiten in die jeweilige Software benötigt wird.
Querintegration
Traditionell ist SAS die bei Banken vorherrschende Analysesoftware. Laut SASeigenen Angaben nutzen 99 der weltweit Top-100-Banken die Software des
Unternehmens. Eine typische Aufgabe von Finanzinstituten ist es, die Kreditwürdigkeit eines Kunden anhand unterschiedlicher Kriterien zu berechnen. SAS
ermöglicht dies beispielsweise anhand der Entscheidungsbaum-Funktionalität.
Auch mit SPSS lässt sich eine derartige Fragestellung beantworten – sogar mit
der gleichen Funktionalität. Auch Cluster-Modelle zur Identifizierung von Zielgruppen lassen sich in beiden Lösungen auf die gleiche Weise erstellen.
Eine Anforderung an Analysesysteme seitens der Produktion ist zum Beispiel
das Auslesen von Fehlerprotokollen, Händlerfeedback oder Reparaturberichten,
um daraus verbesserte Prozesse abzuleiten. Dies lässt sich mit der Data- und
Text-Mining-Funktionalität im IBM SPSS Modeler umsetzen.vii Auch SAS bietet
entsprechende Möglichkeiten, beispielsweise mit den Enterprise und Text Miners sowie Forecastmodulen.
Sowohl SAS als auch SPSS verfügen über spezielle Branchenlösungen. Dabei
ist in der Regel die Anzahl der Modelle eingeschränkt und vorselektiert, was die
Komplexität für den Anwender reduziert.
Integration von R
R ist eine Open-Source Analyselösung, die zunehmend an Beliebtheit gewinnt
und kommerzielle Software wie SAS und SPSS teilweise im Funktionsumfang
übertrifft. Zudem ist R flexibler. Mancherorts wird gefragt, wann sie SAS und
SPSS den Rang abläuft. Während R bei Studierenden, Universitäten und Startups beliebt ist, da keine teuren Lizenzen angeschafft werden müssen, hat die
Lösung sich bei Unternehmen bisher noch nicht durchsetzen können. Gründe
dafür sind unter anderem, dass es keinen Support gibt und im Prinzip jeder
ein R-Paket programmieren kann. Ob dieses dann so rigoros getestet wird, wie
Funktionalitäten bei SAS bzw. SPSS ist nicht immer sicher.viii
Nichtsdestotrotz reagieren SAS und SPSS auf die steigende Beliebtheit und
Die Open-Source-Statistiksoftware R
die erweiterten Funktionalitäten von R. So können Daten zwischen SAS und R
wird immer wichtiger. Sowohl SAS als
transferiert, R-Funktionen innerhalb von SAS aufgerufen und Ergebnisse von R
auch SPSS bieten Integrationsmög-
nach SAS übermittelt werden. IBM SPSS Statistics enthält R-basierte Funkti-
lichkeiten.
onserweiterungen und IBM SPSS Modeler beinhaltet einen R-Knoten, der es
erfahrenen R-Nutzern ermöglicht, eigene R-Scripte einzugeben.
Fazit
Sowohl SAS als auch SPSS bieten umfangreiche Analysemöglichkeiten und
Funktionalitäten, die unterschiedlichen Branchen und Geschäftsfeldern wertvolle Informationen liefern können. In den letzten Jahren hat sich der Funktionsumfang beider Lösungen zunehmend angeglichen. Insbesondere durch die
Übernahme von SPSS seitens IBM hat sich das Leistungsspektrum der Software stetig erhöht. Funktionen, die SAS bietet und die in SPSS selbst nicht
verfügbar sind, werden von Lösungen weiterer IBM Tochterfirmen abgedeckt.
Dabei werden die einzelnen Produkte so weiterentwickelt, dass sie vollständig
untereinander kompatibel sind und sich harmonisch ergänzen. Von IBM getätigte Investitionen in Business Intelligence, Analytics und Optimierung zahlen sich
aus, da auch SPSS von der im Mutterkonzern vorhandenen IT-Expertise und
-Know-how profitiert.
In Zukunft liegt der Fokus von SPSS voraussichtlich auf industrie- und branchenspezifischen Lösungen, in denen die Analysesoftware ein elementarer Bestandteil ist: Counter Fraud, Predictive Maintenance and Quality Optimization,
Predictive Customer Insight und neue Branchenlösungen für beispielsweise Retail, Insurance und Banking.
Aufgrund des sehr ähnlichen Leistungsumfanges der beiden Tools stellen mitt-
lerweile die jeweiligen Anschaffungs-, Nutzungs- und Supportkosten zentrale
Kriterien für Unternehmen dar. Daher gilt es, Unternehmensanforderungen klar
zu definieren. Die Anzahl der Mitarbeiter, die das Tool nutzen werden, vorhandenes IT-Know-how, bestehende IT-Infrastruktur, Datenquellen und Analysetools
müssen betrachtet werden, um eine Empfehlung für die eine oder andere Software zu geben. Erst auf dieser Basis lässt sich prüfen, ob auf eines der beiden
Systeme konsolidiert werden kann oder sogar sollte.
Gerne beraten wir Sie individuell, welche Analyselösung für Sie die richtige ist.
Wir unterstützen Sie mit Analyse, Geschäftsprozessberatung, Anforderungsmanagement, Technologieberatung, Fach- und IT-Konzepten sowie IT-Architektur.
Auch beim Rollout und im laufenden Betrieb können Sie auf unsere Unterstützung zählen.
www.sulzer.de/highlights/business-analytics/
Über die Autorin
Marina Reznic ist Senior IT-Consultant Business Analytics bei der Sulzer GmbH
in München. Der mittelständische Full-Service-Anbieter von Unternehmensund IT-Beratung wurde 1978 gegründet und zählt namhafte Automobilhersteller
zu seinen Kunden. In Deutschland verfügt die Sulzer GmbH über Standorte in
München, Ingolstadt und Stuttgart. Darüber hinaus ist das Unternehmen in Paramus (USA) vertreten.
Sie erreichen Frau Reznic unter +49 89 31858 165 oder per E-Mail an
[email protected]
©
Sulzer GmbH, Oktober 2015
i
Vgl. z.B. Forrester WaveTM Big Data Predictive Analytics Solutions, Q2 2015
ii
Vgl. http://de.saswiki.org/wiki/SAS-Software, letzter Zugriff 07.09.2015
Vgl. http://www-01.ibm.com/support/knowledgecenter/SS3RA7_15.0.0/com.ibm.
iii
spss.modeler.help/sql_overview.htm?lang=de letzter Zugriff 07.09.2015
INW T Statistics beziffert die Kosten auf ca. 5.500 EUR, Stand Oktober 2010.
iv
Letzter Zugriff 08.09.2015
v
http://www.ibm.com/marketplace/cloud/spss-modeler/de/en-de?step=Plan
letzter Zugriff 08.09.2015
vi
http://www.ibm.com/marketplace/cloud/spss-statistics/de/en-de?step=Plan
letzter Zugriff 08.09.2015
vii
http://www-03.ibm.com/software/businesscasestudies/no/no/corp?synkey=
C832269U02087M63. letzter Zugriff 09.09.2015
viii
Vgl. Z.B. die Diskussion bei Quora „How long before R overtakes SAS and
SPSS?“ http://www.quora.com/How-long-before-R-overtakes-SAS-and-SPSS
letzter Zugriff am 07.09.2015 6
Herunterladen