IBM SPSS Decision Trees

Werbung
IBM Software
Business Analytics
IBM® SPSS® Statistics 19
IBM SPSS
Decision Trees
Einfache Identifizierung von Gruppen und Vorhersage
von Ergebnissen
Highlights
IBM SPSS Decision Trees bietet Ihnen
folgende Möglichkeiten:
•
Erstellung von Klassifikationsbäumen
mithilfe der von Ihnen gewünschten
Algorithmen
•
Identifizieren von Mustern, Segmenten
und Gruppen in den Daten
•
Auswahl aus vier bewährten Methoden
des Baumaufbaus
Mit IBM® SPSS® Decision Trees* können Sie Klassifikations- und
Entscheidungsbäume erstellen, mit denen Sie leichter Gruppen
identifizieren, Beziehungen zwischen Gruppen aufdecken und künftige
Ereignisse vorhersagen. Sie können Klassifikations- und
Entscheidungsbäume zur Segmentierung, Schichtung, Vorhersage und
Dimensionsreduktion sowie zum Variablen-Screening, Ermitteln von
Wechselwirkungen, Zusammenführen von Kategorien und
Diskretisieren stetiger Variablen verwenden.
Mit übersichtlichen Diagrammen können Sie kategoriale Ergebnisse
einem Publikum ohne entsprechende Fachkenntnisse verständlich
präsentieren. Diese Baumstrukturen ermöglichen Ihnen, Ihre
Ergebnisse zu analysieren und den Modellfluss visuell zu bestimmen.
Die übersichtlichen Entscheidungsbäume decken bestimmte
Untergruppen und Beziehungen auf, die mit herkömmlichen
statistischen Verfahren möglicherweise nicht erkannt werden. Die
Daten sind in den Klassifikationsbäumen auf Verzweigungen und
Knoten verteilt. So sind Klassengrenzen gleich erkennbar.
In folgenden Szenarien können Sie Decision Trees einsetzen:
•
Datenbankgestütztes Marketing:
–– Auswählen einer Responsevariable zum Segmentieren des
Kundenbestands (z. B. Kunden, die auf eine Testmail
geantwortet/nicht geantwortet haben, Kunden mit hohen,
mittleren und niedrigen Umsätzen oder Erstkunden, die
eine Dienstleistung verlängert haben, und solche, bei denen
dies nicht der Fall war)
–– Erstellen von Profilen für Gruppen auf der Grundlage von
anderen Attributen, z. B. demografischen Angaben oder
Kundenaktivität
–– Abstimmen von neuen Werbeaktionen auf eine bestimmte
Untergruppe, Kostenreduktion und Optimierung des
Anlageertrags (ROI)
* IBM SPSS Decision Trees hieß früher PASW ® Decision Trees.
IBM Software
Business Analytics
IBM SPSS Statistics 19
•
Gründe, die für die
Verwendung von
IBM SPSS Decision Trees
sprechen:
IBM SPSS Decision Trees bietet Ihnen
folgende Möglichkeiten:
•
Identifizieren von Gruppen, Segmenten
und Mustern mit Klassifikationsbäumen
auf äußerst anschauliche Weise
•
Auswahl zwischen CHAID, Exhaustive
CHAID, C&RT und QUEST, um den für
Ihre Daten am besten geeigneten
Algorithmus zu finden
•
Darstellung von Ergebnissen auf intuitive
Weise – ideal für ein technisch weniger
versiertes Publikum
•
Speichern von Informationen aus Bäumen
als neue Variablen in Daten (Informationen
wie Knotennummer, Vorhersagewert und
Vorhersagewahrscheinlichkeiten)
•
•
Marktforschung:
–– Auswerten von Umfragen zur Zufriedenheit von Kunden,
Mitarbeitern oder Neukunden
–– Auswählen einer Variablen zum Messen der Zufriedenheit
(z. B. auf einer Skala von 1 bis 5)
–– Erstellen von Profilen von Zufriedenheitswerten anhand der
Antworten auf andere Fragen
–– Ändern von Faktoren wie Arbeitsumgebung oder
Produktqualität, die Auswirkungen auf die Zufriedenheit haben
können
Kreditrisiko-Bewertung:
–– Bestimmen von Risikogruppen (hoch, mittel oder niedrig)
–– Erstellen von Profilen von Risikogruppen auf der Grundlage von
Kundeninformationen, z. B. Kontobewegungen
–– Anbieten der richtigen Kreditlinie für die richtigen Bewerber
auf Grundlage von Risikogruppen
Bewertung von Förderprogrammen:
–– Auswählen einer Variablen mit gewünschtem und nicht
gewünschtem Ergebnis (z. B. erfolgreicher Abschluss einer
Arbeitsbeschaffungsmaßnahme)
–– Aufdecken erfolgsrelevanter Faktoren auf der Grundlage von
Bewerberinformationen
–– Anpassen von neuen Programmen für ein breiteres Publikum
Verwenden Sie die anschaulichen Baumdiagramme, um Beziehungen zu
entschlüsseln, die derzeit in Ihren Daten verborgen sind. Die Diagramme, Tabellen
und Grafiken in IBM SPSS Decision Trees lassen sich leicht interpretieren.
2
IBM Software
Business Analytics
IBM SPSS Statistics 19
Wahl zwischen vier EntscheidungsbaumAlgorithmen
IBM SPSS Decision Trees enthält vier bewährte Algorithmen
des Baumaufbaus:
•
•
•
•
Verwenden Sie Ergebnisse aus Baummodellen, um Fälle direkt in IBM
SPSS Statistics zu bewerten.
•
Marketing im öffentlichen Sektor:
–– Auswählen einer Responsevariablen zum Segmentieren
des Kundenbestands (z. B. potenzielle UniversitätsBewerber, die sich wirklich beworben haben, im
Gegensatz zu solchen, bei denen dies nicht der Fall ist)
–– Erstellen von Profilen für Gruppen auf der Grundlage
von anderen Attributen, z. B. demografischen Angaben
oder Kundenaktivität
–– Kostenreduktion und Optimierung des ROI durch
Abstimmen von neuen Werbeaktionen auf eine
bestimmte Untergruppe
CHAID: Ein schnelles, Statistik-basiertes
Entscheidungsbaumverfahren, das Mehrfach-Verzweigungen
unterstützt und jeweils Segmente und Profile für Gruppen
erstellt.
Exhaustive CHAID: Eine Modifikation von CHAID, mit
der alle möglichen Teilungen für jeden Prädiktor untersucht
werden.
Classification & Regression Trees (C&RT)): Ein
vollständiger binärer Entscheidungsbaum-Algorithmus, mit
dem Daten partitioniert und genaue homogene
Untergruppen erzeugt werden.
QUEST: Ein statistischer Algorithmus, mit dem Variablen
ohne Verzerrung ausgewählt und schnell und effizient genaue
binäre Entscheidungsbäume erstellt werden.
Mit vier Algorithmen haben Sie die Möglichkeit,
unterschiedliche Methoden für den Aufbau des Baums
auszuprobieren und das Verfahren zu ermitteln, das am besten
für die Daten geeignet ist.
IBM SPSS Decision Trees ist als reine Client-Software
verfügbar. Für eine höhere Leistung und Skalierbarkeit ist
ebenfalls eine serverbasierte Version erhältlich.
Wertzuwachs durch Zusammenarbeit
Damit Sie Posten effizient gemeinsam nutzen und
wiederverwenden, sie auf eine Art schützen, die internen und
externen Compliance-Anforderungen gerecht wird, und die
Ergebnisse veröffentlichen, sodass mehr
Unternehmensanwender die Ergebnisse anzeigen und mit
ihnen interagieren können, sollten Sie die Ergänzung Ihrer
IBM SPSS Statistics-Software durch IBM ® SPSS ®
Collaboration and Deployment Services (früher PASW ®
Predictive Enterprise Services) in Erwägung ziehen. Weitere
Informationen über diese nützlichen Funktionen erhalten Sie,
wenn Sie unter www.spss.com/software/deployment/cds
die Broschüre „Collaboration“ herunterladen.
Erstellen Sie Baummodelle in IBM SPSS Statistics mithilfe von CHAID,
Exhaustive CHAID, C&RT oder QUEST.
* IBM SPSS Statistics Base hieß früher PASW ® Statistics Base.
3
Verbessern Sie Ihre Ergebnisse durch
weiterführende Analysen mit IBM SPSS
Statistics Base
Wenn Sie IBM SPSS Decision Trees mit IBM SPSS Statistics
Base verwenden, können Sie auf einfache Weise
Klassifikationsbäume erstellen und die Ergebnisse bequem
einsetzen, um Fälle direkt in den Daten zu segmentieren und zu
gruppieren. Zusätzlich können Sie in der Form einer IBM SPSS
Statistics-Syntax, in SQL-Anweisungen oder in einfachem Text
(durch die Syntax) Regeln für die Auswahl oder die Klassifikation/
Vorhersage erstellen. Sie können diese Regeln im Viewer
anzeigen und zur späteren Verwendung in eine externe Datei
speichern, um Vorhersagen über einzelne und neue Fälle treffen
zu können. Wenn Sie Ihre Ergebnisse zum Bewerten anderer
Datendateien verwenden möchten, können Sie Informationen aus
dem Baummodell direkt in Ihre Daten schreiben oder XMLModelle zum Einsatz in IBM SPSS Statistics Base Server
erstellen.
Wählen Sie Vorhersagen direkt aus, weisen Sie Vorhersagen in Ihren Daten
aus den Modellergebnissen zu oder exportieren Sie Regeln zur späteren
Verwendung.
Unsere Statistiksoftware-Suite ist nun in drei Editionen
erhältlich: IBM SPSS Statistics Standard, IBM SPSS Statistics
Professional und IBM SPSS Statistics Premium. Diese
Editionen enthalten alle wichtigen Funktionen und bieten
Ihnen dadurch eine effiziente Möglichkeit, Ihrem gesamten
Team oder Ihrer Abteilung die benötigten Features und
Funktionen zur Verfügung zu stellen, um Analysen
durchzuführen, die zum Unternehmenserfolg beitragen.
4
IBM Software
Business Analytics
Funktionen
IBM SPSS Statistics 19
•
Bäume
•
•
•
•
•
•
•
•
•
Anzeigen von Baumdiagrammen,
Baumstrukturen, Balkendiagrammen
und Datentabellen
Bequemes Erstellen von Bäumen. Die
benutzerfreundliche Oberfläche
bietet folgende Optionen:
–– Messniveau (nominal, ordinal
und stetig)
–– Unabhängige Variablen
–– Abhängige Variablen
–– Einflussvariablen
–– Aufbaumethode
–– Ausgabeeinrichtung, u. a.
Bäume, Statistiken, Diagramme
und Regeln
–– Stichproben- oder
Kreuzvalidierung
–– Kriterien für das Anhalten
–– Gespeicherte Variablen, u. a.
Vorhersagewerte,
Wahrscheinlichkeit und
XML-Modelle
Auswahl aus vier Methoden des
Baumaufbaus
Anzeigen von Knoten mit
verschiedenen Methoden: Anzeigen
von Balkendiagrammen und/oder
Tabellen der Zielvariablen in jedem
Knoten
Erweitern und Reduzieren von
Verzweigungen und Ändern sonstiger
Darstellungseigenschaften,
beispielsweise von Schriftarten und
Farben
Anzeigen und Ausdrucken von
Bäumen
Festlegen der exakten
Vergrößerungsstufe (in Prozent) für
die Anzeige von visuellen
Baummodellen in der
Benutzeroberfläche
Automatisieren der Erstellung von
Bäumen im Produktionsmodus
–– Automatisches Generieren von
Syntax aus der Oberfläche
Erzwingen der Aufnahme eines
Prädiktors in das Modell
•
Eingeben von A-prioriWahrscheinlichkeiten,
Fehlklassifikationskosten, Erträgen,
Ausgaben und Skalenwerten
•
Aufteilen von Daten in Trainingsund Testdaten zum Überprüfen der
Genauigkeit
Anzeigen von
Auswertungsdiagrammen bzw.
Klassifikationsregeln für ausgewählte
Knoten im Knotenübersichtsfenster
•
Bereitstellung
•
Export:
–– Baumdiagramme, Diagramme
und Tabellen. Folgende
Exportformate sind verfügbar:
HTML-, Text-, Word/RTFund Excel- ®Dateien sowie PDF
Speichern von Informationen aus
dem Modell als
Variablen in der Arbeitsdatei
Exportieren von Entscheidungsregeln
zum Definieren ausgewählter
Segmente in SQL zum Bewerten von
Datenbanken, als IBM SPSS
Statistics-Syntax zum Bewerten von
IBM SPSS Statistics-Dateien oder als
einfachen Text (über Syntax)
Exportieren von Bäumen als XMLModelle zur Verwendung mit IBM
SPSS Statistics Server und dem
Statistics-Portal
Veröffentlichung von Bäumen als
Bilder und Tabellen als statische oder
interaktive Tabellen im IBM SPSS
Statistics-Portal
Auswählen bestimmter Segmente in
der Arbeitsdatei über Baumknoten
und Ausführen weiterer Analysen für
zusätzliche Erkenntnisse
•
Algorithmen für den Aufbau des
Baums
•
•
•
•
•
Durchführen von Analysen mit einem
von vier leistungsfähigen Algorithmen
für den Aufbau des Baums:
–– CHAID von Kass (1980)
–– Exhaustive CHAID-Methode
nach Biggs, de Ville und Suen
(1991)
–– Classification & Regression
Trees (C&RT) nach Breiman,
Friedman, Olshen und Stone
(1984)
–– QUEST-Methode nach Loh
und Shih (1997)
Behandeln von fehlenden
Prädiktordaten mit einer der zwei
folgenden Methoden: Zuweisen zu
einer Kategorie oder Vorschreiben
unter Verwendung einer
Ersatzvariablen
Diskretisieren stetiger
Prädiktorvariablen gemäß der
angegeben Kategorieanzahl
Beschneidungsfunktionen für
„C&RT“ und „QUEST“
Zufallsstichproben aus Quelldaten für
Stichprobenvalidierung oder
Verwendung einer Variablen zum
Teilen der Stichprobe
•
•
•
•
•
Modellauswertung
•
•
Generieren von Risiko- und
Klassifikationstabellen
Zusammenfassen der Knotenleistung
mit Auswertungsdiagrammen und
-tabellen, mit deren Hilfe die besten
Segmente identifiziert werden
können:
–– Gewinne
–– Index (Gain)
–– Response
–– Mittelwert
–– Durchschnittlicher Gewinn
–– ROI
Systemvoraussetzungen
•
Anforderungen variieren je nach
Plattform. Einzelheiten finden Sie
unter www.spss.com/de/statistics.
Informationen zu SPSS, an IBM Company
SPSS, an IBM Company, ist ein führender Anbieter von Predictive
Analytics-Software und -Lösungen. Das umfassende Produktportfolio
des Unternehmens – Datenerfassung, Statistiken, Modellierung und
Bereitstellung – erfasst die Einstellungen und Meinungen von
Menschen, sagt die Ergebnisse zukünftiger Kundeninteraktionen
voraus und ermöglicht es Ihnen, entsprechend diesen Erkenntnissen zu
handeln, indem Sie analytische Ergebnisse in Ihre Geschäftsprozesse
einbinden. IBM SPSS-Lösungen eignen sich für die Verfolgung von
vernetzten geschäftlichen Zielen im gesamten Unternehmen, da sie den
Fokus auf die Konvergenz von Analysen, IT-Architektur und
Geschäftsprozess setzen. Kunden aus Wirtschaft, öffentlichem Dienst
und dem Bildungsbereich weltweit nutzen IBM SPSS-Technologie als
Wettbewerbsvorteil bei Kundengewinnung, Kundenbindung und
Erhöhung der Kundenumsätze bei gleichzeitiger Eindämmung der
Betrugsmöglichkeiten und Minderung von Risiken. SPSS wurde im
Oktober 2009 von IBM übernommen. Weitere Informationen und
Kontakt zu Vertriebsmitarbeitern erhalten Sie unter www.spss.com
© Copyright IBM Corporation 2010
SPSS Inc., an IBM Company Headquarters,
233 S. Wacker Drive, 11th floor
Chicago, Illinois 60606
SPSS ist eine eingetragene Marke; die anderen genannten SPSS-Produkte sind
Marken von SPSS Inc., einem Unternehmen von IBM. © 2010 SPSS Inc., an IBM
Company. Alle Rechte vorbehalten.
IBM und das IBM-Logo sind Marken der International Business Machines
Corporation in den USA und/oder anderen Ländern. Eine vollständige Liste der
IBM-Marken finden Sie unter www.ibm.com/legal/copytrade.shtml.
Weitere Unternehmens-, Produkt- oder Servicenamen können Marken anderer
Hersteller sein.
Verweise in dieser Veröffentlichung auf IBM-Produkte oder -Services bedeuten nicht,
dass IBM beabsichtigt, diese Produkte oder Services in allen Ländern verfügbar zu
machen, in denen IBM tätig ist.
Eventuelle Verweise in diesen Ausführungen auf Nicht-IBM-Websites dienen
lediglich der Information. Die Nennung bedeutet nicht, dass IBM den Inhalt dieser
Websites unterstützt. Das Material auf diesen Websites ist kein Bestandteil des
Materials für dieses IBM-Produkt. Sie verwenden diese Websites auf eigenes Risiko.
Bereiten Sie bitte auf
YTD03024USEN-00
Herunterladen