IBM Software Business Analytics IBM® SPSS® Statistics 19 IBM SPSS Decision Trees Einfache Identifizierung von Gruppen und Vorhersage von Ergebnissen Highlights IBM SPSS Decision Trees bietet Ihnen folgende Möglichkeiten: • Erstellung von Klassifikationsbäumen mithilfe der von Ihnen gewünschten Algorithmen • Identifizieren von Mustern, Segmenten und Gruppen in den Daten • Auswahl aus vier bewährten Methoden des Baumaufbaus Mit IBM® SPSS® Decision Trees* können Sie Klassifikations- und Entscheidungsbäume erstellen, mit denen Sie leichter Gruppen identifizieren, Beziehungen zwischen Gruppen aufdecken und künftige Ereignisse vorhersagen. Sie können Klassifikations- und Entscheidungsbäume zur Segmentierung, Schichtung, Vorhersage und Dimensionsreduktion sowie zum Variablen-Screening, Ermitteln von Wechselwirkungen, Zusammenführen von Kategorien und Diskretisieren stetiger Variablen verwenden. Mit übersichtlichen Diagrammen können Sie kategoriale Ergebnisse einem Publikum ohne entsprechende Fachkenntnisse verständlich präsentieren. Diese Baumstrukturen ermöglichen Ihnen, Ihre Ergebnisse zu analysieren und den Modellfluss visuell zu bestimmen. Die übersichtlichen Entscheidungsbäume decken bestimmte Untergruppen und Beziehungen auf, die mit herkömmlichen statistischen Verfahren möglicherweise nicht erkannt werden. Die Daten sind in den Klassifikationsbäumen auf Verzweigungen und Knoten verteilt. So sind Klassengrenzen gleich erkennbar. In folgenden Szenarien können Sie Decision Trees einsetzen: • Datenbankgestütztes Marketing: –– Auswählen einer Responsevariable zum Segmentieren des Kundenbestands (z. B. Kunden, die auf eine Testmail geantwortet/nicht geantwortet haben, Kunden mit hohen, mittleren und niedrigen Umsätzen oder Erstkunden, die eine Dienstleistung verlängert haben, und solche, bei denen dies nicht der Fall war) –– Erstellen von Profilen für Gruppen auf der Grundlage von anderen Attributen, z. B. demografischen Angaben oder Kundenaktivität –– Abstimmen von neuen Werbeaktionen auf eine bestimmte Untergruppe, Kostenreduktion und Optimierung des Anlageertrags (ROI) * IBM SPSS Decision Trees hieß früher PASW ® Decision Trees. IBM Software Business Analytics IBM SPSS Statistics 19 • Gründe, die für die Verwendung von IBM SPSS Decision Trees sprechen: IBM SPSS Decision Trees bietet Ihnen folgende Möglichkeiten: • Identifizieren von Gruppen, Segmenten und Mustern mit Klassifikationsbäumen auf äußerst anschauliche Weise • Auswahl zwischen CHAID, Exhaustive CHAID, C&RT und QUEST, um den für Ihre Daten am besten geeigneten Algorithmus zu finden • Darstellung von Ergebnissen auf intuitive Weise – ideal für ein technisch weniger versiertes Publikum • Speichern von Informationen aus Bäumen als neue Variablen in Daten (Informationen wie Knotennummer, Vorhersagewert und Vorhersagewahrscheinlichkeiten) • • Marktforschung: –– Auswerten von Umfragen zur Zufriedenheit von Kunden, Mitarbeitern oder Neukunden –– Auswählen einer Variablen zum Messen der Zufriedenheit (z. B. auf einer Skala von 1 bis 5) –– Erstellen von Profilen von Zufriedenheitswerten anhand der Antworten auf andere Fragen –– Ändern von Faktoren wie Arbeitsumgebung oder Produktqualität, die Auswirkungen auf die Zufriedenheit haben können Kreditrisiko-Bewertung: –– Bestimmen von Risikogruppen (hoch, mittel oder niedrig) –– Erstellen von Profilen von Risikogruppen auf der Grundlage von Kundeninformationen, z. B. Kontobewegungen –– Anbieten der richtigen Kreditlinie für die richtigen Bewerber auf Grundlage von Risikogruppen Bewertung von Förderprogrammen: –– Auswählen einer Variablen mit gewünschtem und nicht gewünschtem Ergebnis (z. B. erfolgreicher Abschluss einer Arbeitsbeschaffungsmaßnahme) –– Aufdecken erfolgsrelevanter Faktoren auf der Grundlage von Bewerberinformationen –– Anpassen von neuen Programmen für ein breiteres Publikum Verwenden Sie die anschaulichen Baumdiagramme, um Beziehungen zu entschlüsseln, die derzeit in Ihren Daten verborgen sind. Die Diagramme, Tabellen und Grafiken in IBM SPSS Decision Trees lassen sich leicht interpretieren. 2 IBM Software Business Analytics IBM SPSS Statistics 19 Wahl zwischen vier EntscheidungsbaumAlgorithmen IBM SPSS Decision Trees enthält vier bewährte Algorithmen des Baumaufbaus: • • • • Verwenden Sie Ergebnisse aus Baummodellen, um Fälle direkt in IBM SPSS Statistics zu bewerten. • Marketing im öffentlichen Sektor: –– Auswählen einer Responsevariablen zum Segmentieren des Kundenbestands (z. B. potenzielle UniversitätsBewerber, die sich wirklich beworben haben, im Gegensatz zu solchen, bei denen dies nicht der Fall ist) –– Erstellen von Profilen für Gruppen auf der Grundlage von anderen Attributen, z. B. demografischen Angaben oder Kundenaktivität –– Kostenreduktion und Optimierung des ROI durch Abstimmen von neuen Werbeaktionen auf eine bestimmte Untergruppe CHAID: Ein schnelles, Statistik-basiertes Entscheidungsbaumverfahren, das Mehrfach-Verzweigungen unterstützt und jeweils Segmente und Profile für Gruppen erstellt. Exhaustive CHAID: Eine Modifikation von CHAID, mit der alle möglichen Teilungen für jeden Prädiktor untersucht werden. Classification & Regression Trees (C&RT)): Ein vollständiger binärer Entscheidungsbaum-Algorithmus, mit dem Daten partitioniert und genaue homogene Untergruppen erzeugt werden. QUEST: Ein statistischer Algorithmus, mit dem Variablen ohne Verzerrung ausgewählt und schnell und effizient genaue binäre Entscheidungsbäume erstellt werden. Mit vier Algorithmen haben Sie die Möglichkeit, unterschiedliche Methoden für den Aufbau des Baums auszuprobieren und das Verfahren zu ermitteln, das am besten für die Daten geeignet ist. IBM SPSS Decision Trees ist als reine Client-Software verfügbar. Für eine höhere Leistung und Skalierbarkeit ist ebenfalls eine serverbasierte Version erhältlich. Wertzuwachs durch Zusammenarbeit Damit Sie Posten effizient gemeinsam nutzen und wiederverwenden, sie auf eine Art schützen, die internen und externen Compliance-Anforderungen gerecht wird, und die Ergebnisse veröffentlichen, sodass mehr Unternehmensanwender die Ergebnisse anzeigen und mit ihnen interagieren können, sollten Sie die Ergänzung Ihrer IBM SPSS Statistics-Software durch IBM ® SPSS ® Collaboration and Deployment Services (früher PASW ® Predictive Enterprise Services) in Erwägung ziehen. Weitere Informationen über diese nützlichen Funktionen erhalten Sie, wenn Sie unter www.spss.com/software/deployment/cds die Broschüre „Collaboration“ herunterladen. Erstellen Sie Baummodelle in IBM SPSS Statistics mithilfe von CHAID, Exhaustive CHAID, C&RT oder QUEST. * IBM SPSS Statistics Base hieß früher PASW ® Statistics Base. 3 Verbessern Sie Ihre Ergebnisse durch weiterführende Analysen mit IBM SPSS Statistics Base Wenn Sie IBM SPSS Decision Trees mit IBM SPSS Statistics Base verwenden, können Sie auf einfache Weise Klassifikationsbäume erstellen und die Ergebnisse bequem einsetzen, um Fälle direkt in den Daten zu segmentieren und zu gruppieren. Zusätzlich können Sie in der Form einer IBM SPSS Statistics-Syntax, in SQL-Anweisungen oder in einfachem Text (durch die Syntax) Regeln für die Auswahl oder die Klassifikation/ Vorhersage erstellen. Sie können diese Regeln im Viewer anzeigen und zur späteren Verwendung in eine externe Datei speichern, um Vorhersagen über einzelne und neue Fälle treffen zu können. Wenn Sie Ihre Ergebnisse zum Bewerten anderer Datendateien verwenden möchten, können Sie Informationen aus dem Baummodell direkt in Ihre Daten schreiben oder XMLModelle zum Einsatz in IBM SPSS Statistics Base Server erstellen. Wählen Sie Vorhersagen direkt aus, weisen Sie Vorhersagen in Ihren Daten aus den Modellergebnissen zu oder exportieren Sie Regeln zur späteren Verwendung. Unsere Statistiksoftware-Suite ist nun in drei Editionen erhältlich: IBM SPSS Statistics Standard, IBM SPSS Statistics Professional und IBM SPSS Statistics Premium. Diese Editionen enthalten alle wichtigen Funktionen und bieten Ihnen dadurch eine effiziente Möglichkeit, Ihrem gesamten Team oder Ihrer Abteilung die benötigten Features und Funktionen zur Verfügung zu stellen, um Analysen durchzuführen, die zum Unternehmenserfolg beitragen. 4 IBM Software Business Analytics Funktionen IBM SPSS Statistics 19 • Bäume • • • • • • • • • Anzeigen von Baumdiagrammen, Baumstrukturen, Balkendiagrammen und Datentabellen Bequemes Erstellen von Bäumen. Die benutzerfreundliche Oberfläche bietet folgende Optionen: –– Messniveau (nominal, ordinal und stetig) –– Unabhängige Variablen –– Abhängige Variablen –– Einflussvariablen –– Aufbaumethode –– Ausgabeeinrichtung, u. a. Bäume, Statistiken, Diagramme und Regeln –– Stichproben- oder Kreuzvalidierung –– Kriterien für das Anhalten –– Gespeicherte Variablen, u. a. Vorhersagewerte, Wahrscheinlichkeit und XML-Modelle Auswahl aus vier Methoden des Baumaufbaus Anzeigen von Knoten mit verschiedenen Methoden: Anzeigen von Balkendiagrammen und/oder Tabellen der Zielvariablen in jedem Knoten Erweitern und Reduzieren von Verzweigungen und Ändern sonstiger Darstellungseigenschaften, beispielsweise von Schriftarten und Farben Anzeigen und Ausdrucken von Bäumen Festlegen der exakten Vergrößerungsstufe (in Prozent) für die Anzeige von visuellen Baummodellen in der Benutzeroberfläche Automatisieren der Erstellung von Bäumen im Produktionsmodus –– Automatisches Generieren von Syntax aus der Oberfläche Erzwingen der Aufnahme eines Prädiktors in das Modell • Eingeben von A-prioriWahrscheinlichkeiten, Fehlklassifikationskosten, Erträgen, Ausgaben und Skalenwerten • Aufteilen von Daten in Trainingsund Testdaten zum Überprüfen der Genauigkeit Anzeigen von Auswertungsdiagrammen bzw. Klassifikationsregeln für ausgewählte Knoten im Knotenübersichtsfenster • Bereitstellung • Export: –– Baumdiagramme, Diagramme und Tabellen. Folgende Exportformate sind verfügbar: HTML-, Text-, Word/RTFund Excel- ®Dateien sowie PDF Speichern von Informationen aus dem Modell als Variablen in der Arbeitsdatei Exportieren von Entscheidungsregeln zum Definieren ausgewählter Segmente in SQL zum Bewerten von Datenbanken, als IBM SPSS Statistics-Syntax zum Bewerten von IBM SPSS Statistics-Dateien oder als einfachen Text (über Syntax) Exportieren von Bäumen als XMLModelle zur Verwendung mit IBM SPSS Statistics Server und dem Statistics-Portal Veröffentlichung von Bäumen als Bilder und Tabellen als statische oder interaktive Tabellen im IBM SPSS Statistics-Portal Auswählen bestimmter Segmente in der Arbeitsdatei über Baumknoten und Ausführen weiterer Analysen für zusätzliche Erkenntnisse • Algorithmen für den Aufbau des Baums • • • • • Durchführen von Analysen mit einem von vier leistungsfähigen Algorithmen für den Aufbau des Baums: –– CHAID von Kass (1980) –– Exhaustive CHAID-Methode nach Biggs, de Ville und Suen (1991) –– Classification & Regression Trees (C&RT) nach Breiman, Friedman, Olshen und Stone (1984) –– QUEST-Methode nach Loh und Shih (1997) Behandeln von fehlenden Prädiktordaten mit einer der zwei folgenden Methoden: Zuweisen zu einer Kategorie oder Vorschreiben unter Verwendung einer Ersatzvariablen Diskretisieren stetiger Prädiktorvariablen gemäß der angegeben Kategorieanzahl Beschneidungsfunktionen für „C&RT“ und „QUEST“ Zufallsstichproben aus Quelldaten für Stichprobenvalidierung oder Verwendung einer Variablen zum Teilen der Stichprobe • • • • • Modellauswertung • • Generieren von Risiko- und Klassifikationstabellen Zusammenfassen der Knotenleistung mit Auswertungsdiagrammen und -tabellen, mit deren Hilfe die besten Segmente identifiziert werden können: –– Gewinne –– Index (Gain) –– Response –– Mittelwert –– Durchschnittlicher Gewinn –– ROI Systemvoraussetzungen • Anforderungen variieren je nach Plattform. Einzelheiten finden Sie unter www.spss.com/de/statistics. Informationen zu SPSS, an IBM Company SPSS, an IBM Company, ist ein führender Anbieter von Predictive Analytics-Software und -Lösungen. Das umfassende Produktportfolio des Unternehmens – Datenerfassung, Statistiken, Modellierung und Bereitstellung – erfasst die Einstellungen und Meinungen von Menschen, sagt die Ergebnisse zukünftiger Kundeninteraktionen voraus und ermöglicht es Ihnen, entsprechend diesen Erkenntnissen zu handeln, indem Sie analytische Ergebnisse in Ihre Geschäftsprozesse einbinden. IBM SPSS-Lösungen eignen sich für die Verfolgung von vernetzten geschäftlichen Zielen im gesamten Unternehmen, da sie den Fokus auf die Konvergenz von Analysen, IT-Architektur und Geschäftsprozess setzen. Kunden aus Wirtschaft, öffentlichem Dienst und dem Bildungsbereich weltweit nutzen IBM SPSS-Technologie als Wettbewerbsvorteil bei Kundengewinnung, Kundenbindung und Erhöhung der Kundenumsätze bei gleichzeitiger Eindämmung der Betrugsmöglichkeiten und Minderung von Risiken. SPSS wurde im Oktober 2009 von IBM übernommen. Weitere Informationen und Kontakt zu Vertriebsmitarbeitern erhalten Sie unter www.spss.com © Copyright IBM Corporation 2010 SPSS Inc., an IBM Company Headquarters, 233 S. Wacker Drive, 11th floor Chicago, Illinois 60606 SPSS ist eine eingetragene Marke; die anderen genannten SPSS-Produkte sind Marken von SPSS Inc., einem Unternehmen von IBM. © 2010 SPSS Inc., an IBM Company. Alle Rechte vorbehalten. IBM und das IBM-Logo sind Marken der International Business Machines Corporation in den USA und/oder anderen Ländern. Eine vollständige Liste der IBM-Marken finden Sie unter www.ibm.com/legal/copytrade.shtml. Weitere Unternehmens-, Produkt- oder Servicenamen können Marken anderer Hersteller sein. Verweise in dieser Veröffentlichung auf IBM-Produkte oder -Services bedeuten nicht, dass IBM beabsichtigt, diese Produkte oder Services in allen Ländern verfügbar zu machen, in denen IBM tätig ist. Eventuelle Verweise in diesen Ausführungen auf Nicht-IBM-Websites dienen lediglich der Information. Die Nennung bedeutet nicht, dass IBM den Inhalt dieser Websites unterstützt. Das Material auf diesen Websites ist kein Bestandteil des Materials für dieses IBM-Produkt. Sie verwenden diese Websites auf eigenes Risiko. Bereiten Sie bitte auf YTD03024USEN-00