UNIVERSITY OF FRIBOURG Seminar Customer Relationship Management Fuzzy RFM Modell Verfasser: Patrik Hugi 6. Semester Wirtschaftsinformatik UniFR Brunngasse 48, 3011 Bern ++41 (0) 79 695 13 78 [email protected] Eingereicht: - Dokumentation - Dateien Einleitung Abstract In dieser Arbeit soll aufgezeigt werden, wie eine unscharfe Klassifizierung vorgenommen wird und welche Vor- und Nachteile eine unscharfe Klassifizierung bringt. Die Klassifizieung wird anhand der RFM Methode vorgenommen. RFM steht für Recency, Frequency (Frequenz) und Monetary. Studien haben gezeigt, dass Kunden mit einem höheren RFM Wert einen höheren Wert für das Unternehmen generieren und desshalb in ein anderes Kundensegment eingeteilt werden können. Mithilfe der unscharfen (Fuzzy) Logik wird gezeigt, dass die Klassenzugehörigkeit eines Kunden präziser bestimmt werden kann und das ein Kunde in mehreren Klassen gleichzeitig sein kann. Keywords: CRM, RFM, Fuzzy-RFM, fCQL 2 / 25 Einleitung Inhaltsverzeichnis 1. Einleitung ......................................................................................................................................4 1.1. Fragestellung und Zielsetzung ....................................................................................... 4 1.2. Vorgehensweise ............................................................................................................. 4 2. Die RFM Methode ..........................................................................................................................4 2.1. Scoring Modell ................................................................................................................ 5 2.2. RFM im Online Marketing ............................................................................................... 6 2.3. Der Kundenwert ............................................................................................................. 6 3. Einführung in die Fuzzy Klassifikation .......................................................................................6 3.1. 3.2. 3.3. 3.4. 3.5. 4. Fuzzy - RFM .................................................................................................................................11 4.1. 4.2. 4.3. 4.4. 5. Klassische Mengen versus Fuzzy Mengen .................................................................... 7 Linguistische Variablen .................................................................................................. 8 Mehrdimensionale Fuzzy Klassifikation........................................................................ 10 Fuzzy Klassifikation in Datenbanken ............................................................................ 10 Fazit zur Fuzzy Klassifikation und fCQL ....................................................................... 11 Vorgehen ...................................................................................................................... 12 Vorteile des Fuzzy – RFM ............................................................................................ 16 Nachteile der Fuzzy – RFM Methode ........................................................................... 16 Vergleich RFM vs. Fuzzy-RFM..................................................................................... 17 Fuzzy – Klassifikation in der Praxis ..........................................................................................19 5.1. Beispiel einer Retail Bank ............................................................................................ 20 5.2. Beispiel Coop@home ................................................................................................... 21 6. Implikation und Schlusswort .....................................................................................................22 7. Literaturangaben ........................................................................................................................23 7.1. Quellenangaben ........................................................................................................... 23 7.2. Verwendete Software ................................................................................................... 24 7.3. Abbildungsverzeichnis .................................................................................................. 24 8. Anhang ........................................................................................................................................25 3 / 25 Einleitung 1. Einleitung 1.1. Fragestellung und Zielsetzung Diese Arbeit soll aufzeigen, welche Vorteile eine unscharfe (fuzzy) Klassifikation der Kunden gegenüber einer scharfen Klassifikation bringen kann. Die Klassifikation wird anhand des RFM (Recency, Frequency, Monetary) Modell erklärt. Der Fuzzy Ansatz lässt sich auf weitere Methoden übertragen, wie zum Beispiel für eine unscharfe ABC-Analyse, SWOT, Kreditwürdigkeitsprüfung usw. 1.2. Vorgehensweise Zuerst soll erklärt werden, was RFM genau ist, woher es kommt und wozu es verwendet wird. Im zweiten Teil wird die unscharfe Klassifikation erklärt und am RFM Modell angewendet. In diesem Teil wird ausführlich erklärt, wie die Klassen gebildet werden und die Zugehörigkeit der Kunden zu den Klassen berechnet wird. Das RFM Modell wird dann mit dem unscharfen, sogenannten Fuzzy-RFM verglichen und so werden die Vorzüge und Nachteile aufgezeigt. Im vierten Kapitel wird eine Klassifikation mithilfe einer Excel Tabelle durchgeführt und im fünften Kapitel werden mögliche Anwendungen in der Praxis gezeigt. 2. Die RFM Methode Die Abkürzung RFM steht für: Recency wann der Kunde zuletzt eingekauft hat Frequency wie viele Einkäufe der Kunde gemacht hat (innerhalb einer bestimmten Periode) Monetary wie viel Geld der Kunden ausgibt (innerhalb einer bestimmten Periode) RFM ist weit verbreitet im Direkt Marketing, um Kunden zu selektieren, an welche bestimmte Angebote gerichtet werden sollen. Die RFM Analyse nutzt Kundendaten aus vergangen Bestellungen. Die RFM Theorie besagt, dass Kunden welche vor kurzem, häufiger und für mehr Geld eingekauft haben, wahrscheinlich eher auf ein speizelles Angebot (Offering) eingehen werden, als Kunden die vor längerer Zeit, seltener und für weniger Geld eingekauft haben. Diese Annahme wirkt intuitiv einleuchtend und konnte auch empirisch bestätigt werden. Eine RFM Analyse kann auch eingesetzt werden, um zum Beispiel neuen Kunden spezielle Angebote zu machen oder um Kunden zu „reaktivieren“ welche lange nichts mehr bestellt haben. Auch weitere Marketing Aktivitäten sind denkbar, zum Beispiel Anreize schaffen, um Kunden welche selten einkaufen, dazu zu bringen, häufiger oder für mehr Geld einzukaufen. Ein grosser Vorteil der RFM Methode ist ihre Einfachheit. Die notwendigen Daten sind leicht erfassbar und schnell verfügbar. Die Firma braucht kein komplexes CRM oder Data-Minning Programm um diese 4 / 25 Die RFM Methode Daten zu erheben. Früher wurden Kundendaten mit Bestellinformationen auf Karteikarten festgehalten. Heute verwendet man dazu ein Datenbanksystem. Wenn die Bestellungen der Kunden in der Datenbank erfasst wurden, können die RFM Werte ohne grössere Umstände abgefragt werden. Die vorhandenen Daten sollten nun in eine möglichst sinnvolle Relation gebracht werden, dass heisst sie müssen klassifiziert werden um bestimmte Gruppen von Kunden gezielt ansprechen zu können. Ein einfacher Ansatz ist ein Bewertungsverfahren mithilfe von Punkten (Scoring Modell). 2.1. Scoring Modell Für die drei Variablen Recency, Frequency und Monetary werden mehrere Klassen gebildet. Recency (der letzte Einkauf) wird zum Beispiel klassiert in „weniger als 6 Monate“, „zwischen 7 bis 9 Monaten“, „zwischen 9-12 Monaten“ usw. Jede Klasse erhält dann eine gewisse Punktzahl. Wie die Klassen eingeteilt werden und wie viele Punkte für jede Klasse vergeben werden, ist sehr individuell und muss unter Umständen für jede Marketing Aktion neu angepasst werden. Dieses Scoring Modell mit der scharfen Abgrenzung der Klassen ist sehr problematisch wie an folgendem Beispiel gezeigt werden soll: Variablen Anfangswert Recency Punkte pro Variable 25 <= 6 Monate 7‐9 Monate 10‐12 Monate 13‐18 Monate 19‐24 Monate Früher Letzter Einkauf Frequency Anzahl Bestelllungen Monetary 40 5 Pro Hauptkatalog Mailings seit der letzten Bestellung C1 1. Klasse (beste) C2 2. Klasse C3 3. Klasse ‐15 6 ‐15 Pro Mailing 1 HK, 1 M ‐2 5 / 25 Total Score 25 ‐5 2 12 210 € 45 Bartok 25 23 7 6 Monate Monate Monate 25 40 9 54 10 60 24 € 5 28 € 15 4 24 ‐6 25 Pro Spezial Katalog ‐12 ‐5 25 Monate 151‐200 26‐50 € 51‐100 € 101‐150 € € > 200 € 5 15 25 35 40 45 <= 25 € 15 Schubert Grieg 25 Anzahl Bestellungen multipliziert mit Faktor 6 Durchschnitt des Umsatzes der letzten 3 Bestellungen Mailingkosten 25 Gluck 120 € 35 1 HK, 1 M 1 HK, 1M 1HK, 1 M ‐14 ‐14 ‐14 ‐14 28 40 70 101 Einführung in die Fuzzy Klassifikation C4 4. Klasse (schlechteste) Anhand dieser Scoring Tabelle soll gezeigt werden, warum eine scharfe Abgrenzung zu ungenauer Kundenbewertung führen kann. Die Kunden Gluck und Schubert unterscheiden sich in ihrem Einkaufverhalten nur unwesentlich. Der letzte Einkauf bei Gluck war 25 Monate her und der letzte von Schubert 23 Monate. Die Frequenz ist mit zwei, respektive vier Bestellungen auch nah beisammen. Die Werbekosten sind bei beiden gleich und Kunde Gluck hatte sogar einen höheren Umsatz bei seinen Einkäufen. Trotzdem kommt er nur auf 28 Punkte gegenüber den 40 von Schubert. Das kommt daher, dass beide bei jedem Indikator ziemlich nah an der Grenze sind. Schubert ist jedoch bei fast allen Indikatoren eine Stufe höher und erhält so eine deutlich höhere Punktezahl (+40%) als der Kunde Gluck. Das gleiche gilt für die beiden Kunden Grieg und Bartok; beide kaufen ähnlich häufig und zu einem ähnlichen Wert ein. Jedoch liegt Bartok jeweils knapp in der nächsten Stufe und erreicht so insgesamt 44% Punkte mehr als Grieg was ihn die beste Klasse bringt. 2.2. RFM im Online Marketing Was früher die grossen Versandhäuser mit den Katalogen waren, sind heute die Webshops. Es werden zwar keine Kataloge mehr versandt, da das ganze Angebot Online besichtigt werden kann, jedoch müssen auch für einen Web Shop Marketing Massnahmen getroffen werden. Zusätzlich zu den Werten Recency, Frequency und Monetary könnte man bei einem Webshop weitere Daten erfassen, wie zum Beispiel das Verhalten des Kunden beim Besuch der Webseite: wie häufig kommt er, wie lange bleibt er und welche Links klickt er. Diese Daten könnten dann in Verbindung gebracht werden mit den tatsächlichen Bestellungen des Kunden, um so Rückschlüsse auf das Kaufverhalten zu gewinnen und geeignete Marketing Massnahmen treffen zu können. 2.3. Der Kundenwert Neben den Marketing Aktivitäten, kann das RFM Modell auch dazu genutzt werden, den Kundenwert (Customer Lifetime Value CLV), zu bestimmen. Anhand des gegenwärtigen Kundenwertes lässt sich jedoch nicht unbedingt auf den zukünftigen Kundenwert schliessen. Weitere Faktoren wie Veränderungen im Markt, Kundenverhalten usw. müssen ebenso berücksichtigt werden. 3. Einführung in die Fuzzy Klassifikation Im vorherigen Teil wurde aufgezeigt, dass eine scharfe Klassifikation problematisch ist, da wegen kleiner Abweichungen bei den Kunden, Ressourcen (z.B. Marketing Budget) nicht optimal eingesetzt 6 / 25 Einführung in die Fuzzy Klassifikation werden. Ein anderer Ansatz soll die unscharfe (sogenannte Fuzzy-) Klassifizierung aufzeigen. Zuerst wird kurz erklärt, was die Fuzzy Logik ist und wie sie in einer Datenbank angewendet werden kann. 3.1. Klassische Mengen versus Fuzzy Mengen Für einen Computer ist eine Bedingung entweder wahr oder falsch (Binärlogik). Oft ist diese scharfe Abgrenzung zwischen wahr oder falsch jedoch nicht ausreichend für eine genaue Einteilung. Für viele Anwendungen wäre es praktisch, wenn man Steuerungen mithilfe von Verbalen Anweisungen programmieren kann. Zum Beispiel eine Steuerung einer Heizung so programmieren, dass bei „ungefähr“ 19°C das Ventil „ein bisschen“ geöffnet wird. Die Begriffe „ungefähr“ und „ein bisschen“ können vom Computer jedoch nicht interpretiert werden. Der Computer weiss nicht, wie viel „ein bisschen“ sein soll. Oft können komplexe Probleme jedoch relativ einfach beschrieben werden, wenn unscharfe Begriffe wie „ein bisschen“ oder „ungefähr“ verwendet werden. Solche Begriffe nennt man linguistische Werte. In der klassischen Mengenlehre kann ein Element entweder einer Menge angehören oder nicht. Will man nun alle Kunden mit einem mittleren Wert beschreiben, definiert man ein Intervall zum Beispiel zwischen 4‘000 bis 6‘000. Somit würde ein Kunde mit 3‘900 Umsatz (evt. zu Unrecht) in eine tiefere Kategorie eingestuft werden. Im Gegensatz zu den klassischen Mengen können bei den unscharfen Mengen, Elemente auch nur zu einem bestimmten Grad zu einer Menge dazu gehören oder nicht. Diese Zugehörigkeit wird üblicherweise durch eine Zahl aus dem Intervall [0,1] beschrieben. Dabei bedeutet 0 keine Zugehörigkeit und 1 volle Zugehörigkeit. Ein Kunde mit dem Wert 0.8 könnte also zum Beispiel 20% zur tiefen und 80% zur mittleren Kategorie gehören. 7 / 25 Einführung in die Fuzzy Klassifikation Abbildung 1: Fuzzy Menge Ausführlichere Erklärung zur Fuzzy Logik unter: http://www.iicm.tu-graz.ac.at/greif/node9.html 3.2. Linguistische Variablen Für die Indikatoren werden Begriffe definiert. Ein Vorteil der Linguistischen Variablen ist, dass die Begriffe, mit denen im Marketing verwendeten Termen, abgeglichen werden können und so die Arbeit intuitiver macht und erleichtert. Abbildung 2: Begriff Domänen In Abbildung 2 ist zu sehen, dass für ein Indikator zwei, drei oder mehrere Begriffe definiert werden können. Anstelle von Begriffen können auch quantitative Werte verwendet werden. 8 / 25 Einfüh hrung in die Fuzzy Klassifikation Abbildung 3: 3 Linguistisc che Variablen (Source: Naiade Manual)) ng 3 wurden n insgesam mt sieben Be egriffe für de en Bereich zwischen 0 und 1 gew wählt. Gut In Abbildun zu sehen isst die Übersschneidung g der Funktio onen. Ein Wert W im Bere eich „Good““ befindet sich gleichzeitig g auch noch h im Bereich h „More or Less L Good““ und „Very Good“. Die e Zugehörigkeit zum Bereich Go ood, nimmt gegen den Rand linkss und rechts s ab. Abbildung 4: 4 Funktionen n für linguistis sche Var. (So ource: Naiade e Manual) 9 / 25 Einfüh hrung in die Fuzzy Klassifikation In Abbildun ng 4 wird eine Möglichkeit gezeigtt, wie eine Zahl Z einen linguistische en Wert zug gewiesen bekommt. Ein Wert, zum z Beispie el 0.85, würd de also mit dem Wert 0.875 0 zur K Klasse „Good“ und g mit einem Wert von 0.02 0 noch zur Klasse „V Very Good““ gehören. gleichzeitig 3.3. Mehrrdimension nale Fuzzy Klassifikattion Die Fuzzy Klassifikatio on ist nicht beschränktt auf drei Ind dikatoren. Die D Klassen nzugehörigk keit kann net werden. Ab vier Ind dikatoren istt das ganze e jedoch auch für vier oder mehr Indikatorren berechn bar und es entstehen e m mindestens 16 Kombin nationen derr Indikatoren. Wenn nicht mehrr visualisierb ein Kunden nwert mithilfe von meh hr als drei In ndikatoren bestimmt b we erden soll isst es von Vo orteil, Werte zu gruppieren g u dann mit den grupp um pierten Werrten neue Klassen K zu b bilden. 3.4. Fuzzy y Klassifikation in Da atenbanken n Das fCQL Toolkit der UniFr kann n in ein RDB BMS (Relation Data Ba ase Manage ement Syste em) w ohn ne den Date enbereich ändern zu müssen. m Dass Toolkit gen neriert aus fCQL integriert werden, anfragen SQL S queriess und kann über eine grafische g Be enutzeroberrfläche gestteuert werden. Auf dieser Obe erfläche werden die Lin nguistischen n Variablen angezeigt mit deren H Hilfe die uns scharfen abfragen gestartet g we erden könne en. Abbildung 5: fCQL Too olkit (UniFR) 1 / 25 10 Fuzzy - RFM 3.4.1. Umwandlung Fuzzy-SQL in SQL Da das Datenbank Management System (DBMS) die Daten nur mittels der Sprache SQL abfragen kann, wird das Fuzzy-Statement vom Toolkit in ein normales SQL Statement umgewandelt. Die folgende Tabelle zeigt den Unterschied zwischen einem SQL und fCQL Statement: SQL fCQL Select Attribute classify Object from Relation from Relation where Condition of Selection with ClassificationCondition classify from with customer customer portfolio customer recency is very recent and customer fre qency is frequent or middle Beispiel einer fCQL Abfrage. Das Resultat wäre dann eine Liste aller Kunden, welche dieser Klassifizierung entsprechen mit einem Faktor der aussagt, zu welchem Teil (in Prozent) diese Aussage auf die Kunden zutrifft. 3.5. Fazit zur Fuzzy Klassifikation und fCQL Ein Vorteil der Fuzzy Klassifikation und fCQL ist, dass die Zugehörigkeit eines Elementes zu jeder Klasse einen Wert zwischen 0 und 1 annehmen kann. Das heisst ein Element kann zum Beispiel mit dem Wert 0.1 also zu 10% zu einer Klasse X gehören und zu 90% derselben Klasse nicht. Ein weiterer wichtiger Aspekt ist, dass ein Element gleichzeitig in mehreren Klassen sein kann. Ein Element kann also zum Beispiel mit 30% zur Klasse X und mit 70% zur Klasse Y gehören. Die Fuzzy Bewertung erlaubt eine Sortierung und Segmentierung welche präziser und flexibler ist als eine scharfe Segmentierung. 4. Fuzzy - RFM Die vorgestellte unscharfe Klassifikation soll nun auf das RFM Modell angewendet werden. Dazu wurde eine Excel Tabelle erstellet mit 100 Kunden mit den Indikatoren Recency und Frequency. Für diese 100 Kunden wurden Zufallswerte im Bereich 0 bis 50 für die Frequency und Werte im 11 / 25 Fuzzy - RFM Bereich 0-730 (2 Jahre) im Bereich Recency generiert. Um das Beispiel einfacher erklären und darstellen zu können, wird der Indikator Monetary weggelassen. Bemerkung: Der Indikator Monetary, also der Umsatz je Kunde, ist im RFM Modell weniger bedeutend als die Indikatoren Recency und Frequency, da Kunden mit einem höheren Frequency und Recency Wert treuer sind, und auf langer Sicht wertvollere Kunden sind als solche die zwar einen hohen Umsatz generieren aber seltener und weniger häufig einkaufen. 4.1. Vorgehen Zuerst werden die Indikatoren definiert. Für die Indikatoren werden dann linguistische Variablen definiert welche einen bestimmten Bereich eines Indikators abdecken. Anschliessend wird für jeden Kunden die Zugehörigkeit zur jeweiligen Klasse mithilfe des „Gamma Operators“ berechnet. Dieser Zugehörigkeitswert wird noch normalisiert. Im folgenden Abschnitt werden die Schritte ausführlicher erklärt. 4.1.1. Indikatoren definieren Zuerst müssen die Indikatoren ausgewählt werden. In dieser Arbeit soll die Fuzzy Segmentierung anhand der Indikatoren Recency, Frequency und Monetary erläutert werden. Für jeden der drei Indikatoren muss ein Wertebereich festgelegt werden damit man für die einzelnen Kunden entsprechend diesem Bereich, einen Wert zwischen 0 und 1 ausrechnen kann. Es stellt sich die Frage, wie man zum Beispiel die Recency genau festlegen will. Soll ein Zeitraum genommen werden welcher alle Kunden abdeckt oder nur die Bestellungen der letzten ein oder zwei Jahre? Eine ähnliche Frage stellt sich auch bei der Bestimmung des Monetary Wertes: Soll der Gesamtumsatz eines Kunden als Indikator genommen werden oder nur der durchschnittliche Wert der letzten drei Einkäufe? Solche Fragen gilt es bei der Definition der Indikatoren genau zu klären, und auf die Anforderungen aus dem Marketing abzustimmen. Eine Implementierung muss ermöglichen, dass eine spätere Anpassung der Werte ohne grossen Aufwand geschehen kann. Dies sollte bei Verwendung eines RDBMS mit gut gepflegten Daten ohne grössere Schwierigkeiten machbar sein, da die Kundendaten jederzeit in der Datenbank zur Verfügung stehen. Will man zum Beispiel die Häufigkeit (Frequency) statt über ein Jahr, über zwei Jahre ermitteln, können diese Informationen einfach mittels Anpassung der Datenbandabfragen ausfindig gemacht werden. 4.1.2. Probleme beim definieren des Wertebereiches Die Definition des Wertebereiches bringt einige Gefahren mit sich, die beachtet werden sollten: 12 / 25 Fuzz zy - RFM Bei dem ob ben beschrieben Vorge ehen wird angenomme a en, dass alle e Kunden e etwa gleichm mässig über den gesamten g W Wertebereich h verteilt sin nd. In der Praxis P wird das d wohl ka aum zutreffe en. Wenn ein Kunde K Beisspielsweise sehr häufig g einkauft un nd man die Werte der andern Kun nden relativv zu diesem Spitzenwert berechne et, werden diese d schlec cht abschne eiden. Dasss heisst, man muss bei M be enutzten we elche bewirkkt, dass die durchschniittlichen der Bewerttung eine sttatistische Methode Kunden au uf einen mitttleren Wert von etwa 0.5 0 kommen n. Kund de 1.00 0.90 0.80 0.70 0.60 0.50 0.40 0.30 0.20 0.10 0.00 1 2 3 4 5 6 7 8 9 10 K01 K02 K03 K04 K05 K06 K07 K08 K09 K10 Mitttelwert Freq quency 46 19 17 15 13 11 7 6 3 1 13.80 0.92 0.38 0.34 0.30 0.26 0.22 0.14 0.12 0.06 0.02 0.28 Abbildung 6: 6 Problem Ex xtremwerte Die Mehrheit der Kund den hat zwiischen 10 und u 20-mal eingekauft e (Mittelwert 13.8). Wenn für die e obere Grenze von n 50 definiert wird und den Kunden, entsprecchend ihren Frequenz eine Frequenze en einen We ert zwischen n 0 und 1 ausrechnet (zum ( Beispiiel für Kund de K01: 1 / 50 5 * 46) so erhält man n einen Mitte elwert für allle Kunden von 0.28. Wenn nun der Bereich h der linguisstischen Va ariablen so definiert d ist dass sie zw wischen 0 und u 1 etwa eilt sind, we erden die meisten m Kund den in die Klasse K „selte en“, welche e im Bereich h zwischen gleich verte 0.15 und 0.35 0 liegt, fa allen und die es nur weil ein e Kunde im i Vergleich h zum durchschnitt seh hr viel häufiger einkauft. Eine e Lösung wäre w es, die Bereiche der linguistisschen Varia ablen anzup passen n statistische es Verfahre en benutzen n, welche diie Werte im mittleren Bereich B oder noch besser, ein wichtet als die Randwerrte. höher gew Neben derr Gewichtun ng der Werte e stellt sich zudem die Frage, welches die ob bere Grenze e sein soll. In diesem Beispiel wu urde 50 genommen, da a der Spitze enkunde K01 eine Freq quenz von 46 4 hat und G auf jeden Fall höher h sein muss m als de er höchste W Wert eines Kunden. der Wert der oberen Grenze 1 / 25 13 Fuzz zy - RFM Abbildung 7: 7 Verschobe ener Bereich en Kunden sind s im Bere eich A. Da diese d Kunden jedoch zahlenmäss z sig am häuffigsten Die meiste auftreten sollten s sie einen mittlerren Bereich B abdecken. 4.1.3. Liinguistische Variablen n definieren n Für den Ind dikator „Fre equency „ werden w die Terme T „selte en“ (Wert 0 bis 0.35), „„mittel“ (Wert 0.36 – 0.65) und häufig h (Werrt 0.66 bis 1), gebildet. Für den Ind dikator Reccency die Be egriffe „kürz zlich“, „mittel“, un nd „lange he er“. 4.1.4. Fu uzzy Wert berechnen b Mithilfe ein ner Funktion n, genannt „Membersh „ ip Function“ wird für je eden Indikattor ein Fuzz zy Wert bestimmt. Diese Mem mbership Funktion kann n auf versch hiedene Arte en impleme entiert sein (siehe ( A 3.4 4). Grafik in Abschnitt 0 0.2 0.4 0.6 0.8 1 µsttrong µweak Abbildun ng 8: Diskrete e Funkrion 1 / 25 14 Fuzzy - RFM Kunde A hat 30-mal eingekauft. Die Obergrenze des Indikators Frequency wird auf 50 gesetzt. So hat ein Kunde die beiden Fuzzy Werte 0.6 „Zugehörigkeit“, da 1 / 50 * 30 = 0.6, und 1 – 0.6 = 0.4 „nicht Zugehörigkeit“. Für die Recency wurde der Wert, welcher aus dem Intervall 0 bis 1 kommt noch von eins abgezogen, da eine kleine Zahl hier bedeutet, dass ein Kunde erst kürzlich eingekauft hat, er hat also einen hohen, positiven Recency Wert. Ein Kunden der vor 14 Tagen eingekauft hat erhält mit der Obergrenze 730 Tagen (2 Jahre) ein Wert von 0.019 (1 / 730 * 14) also einen Fuzzy Wert von 0.981 (1-0.019 =0.981 Zugehörigkeit) und 0.019 „nicht Zugehörigkeit“. Hier zeigt sich auch wie praktisch die linguistischen Werte sind. Der Term „kürzlich“ hätte zum Beispiel den Wertebereich 1.0 bis 0.8 und der Term „lange her“ den Bereich 0.0 bis 0.2. Es ist dann einfacher und intuitiver mit den Termen anstatt mit den Zahlen zu arbeiten. Wenn die Indikatoren definiert wurden kann im nächsten Schritt der Fuzzy Wert für jede Klasse berechnet werden. Dies geschieht mithilfe des y (Gamma) Operators (siehe Abbildung 9). Das u(Ai) ist die Klasse (x), m ist die Anzahl der Klassen, u(i) ist die Zugehörigkeit im Bereich 0 bis 1 zur Klasse (x) und y ist der Gamma Operator (in dieser Arbeit immer 0.5). Die Zugehörigkeiten je Klasse werden miteinander multipliziert, das Ergebnis mit 0.5 Potenziert und mit dem Produkt der Gegenwerte je Klasse (1-ui(x)) wieder multipliziert. ⎛ m ⎞ μ Ai ( x) = ⎜ ∏ μi ( x) ⎟ ⎝ i =1 ⎠ (1− y ) y m ⎛ ⎞ * ⎜ 1 − ∏ (1 − μi ( x)) ⎟ , x ∈ X , 0 ≤ y ≤ 1 i =1 ⎝ ⎠ Abbildung 9: Gamma - Operator Beispiel zur Berchnung eines Kunden mit 2 Indikatoren und den 0.6 und 0.45 je Indikator: C1 = ( 0.6*0.55 ) (1− 0.5) C 2 = ( 0.6*0.45 ) C 3 = ( 0.4*0.55 ) * (1 − ((1 − 0.6 ) *(1 − 0.55)))0.5 = 0.5202 (1− 0.5) * (1 − ((1 − 0.6 ) *(1 − 0.45)))0.5 = 0.458 (1− 0.5) * (1 − ((1 − 0.4 ) *(1 − 0.55)))0.5 = 0.4007 C 4 = ( 0.4*0.45 ) (1− 0.5) * (1 − ((1 − 0.4 ) *(1 − 0.45)))0.5 = 0.34573 ________________________________________________ 1.7571 4.1.5. Fuzzy Wert normalisieren Da die Klassenzugehörigkeit einer Funktion abhängig ist von der Anzahl der Klassen, muss der bestimmte Fuzzy Wert für jede Klasse noch normalisiert werden. Dazu wird der Wert der Klasse durch die Summe aller Klassen dividiert. 15 / 25 Fuzzy - RFM Zum Beispiel für Klasse C1: 0.52 / 1.727 = 0.301 Das heisst ein Kunde kann zu 30.1 Prozent zur Klasse C1 gehören, zu 26.57 % zu C2, zu 23,2% zu C3 und zu 20.1% zu C4. Er gehört also allen Klassen an zu einem bestimmten Teil an. Klasse Funktion für jede Klasse C Class C1 C2 C3 C4 Recency kürzlich kürzlich lange her lange her Frequency häufig selten häufig selten Klassenzugehörigkeit der Attribute Recency 0.6 0.6 0.4 0.4 Frequency 0.55 0.45 0.55 0.45 Total Absolute Normalisierte Zugehörigkeit Zugehörigkeit Zugehörigkeit in Prozent 0.520 0.459 0.401 0.347 1.727 0.301 0.266 0.232 0.201 1.000 Prozent 30.12 26.57 23.20 20.11 100.00 4.2. Vorteile des Fuzzy – RFM Gezielteres Direktmarketing Dank der Fuzzy Segmentierung kann die Klasse, auf welche eine Marketing Strategie angewendet werden soll, präziser definiert werden. Mit der scharfen Methode ist es natürlich auch möglich die Klassen, dass heisst eine Menge innerhalb einer bestimmten Klasse, genauer zu definieren indem man die Variablen anpasst, man wird jedoch mit der scharfen Methode immer eine Grenze ziehen welche Kunden einschliesst welche in eine niedrigere Klasse gehörten und andere ausschliesst welche in eine bessere Klasse sollten. Angepasste Rabatte Der Fuzzy Ansatz unterstütz den Trend einer Individuelleren Kundenbetreuung, da zum Beispiel die Rabatte für einen Kunden genauer, entsprechend seinem effektiven Wert, gegeben werden können. Das kann jedoch auch Schwierigkeiten bieten (siehe Abschnitt 4.3, Nachteile) 4.3. Nachteile der Fuzzy – RFM Methode Doppelte Klassenzugehörigkeit Durch die Fuzzy Klassifizierung kann ein Kunde in mehreren Klassen gleichzeitig sein. Problematisch kann das dann werden, wenn unterschiedliche Marketing Massnahmen für verschieden Klassen gestartet werden, welche bestimmte Kunden unter Umständen doppelt erreichen. 16 / 25 Fuzzy - RFM M1 M12 M2 Abbildung 10: Doppelte Zugehörigkeit M1 könnte zum Beispiel eine Marketing Massnahme sein welche angepasst ist auf Kunden welche viel Eingekauft haben aber lange nicht mehr und M2 eine Massnahme um Kunden zurückzugewinnen welche wenig und lange nicht mehr eingekauft haben. Da M1 die Wertvollere Klasse bildet, werden evtl. wertvollere Anreize eingesetzt. Die Marketing Aktionen sollten auf jeden Fall so aufeinander abgestimmt werden, dass Kunden, welche zu beiden Klassen gehören (M12) nicht zweimal angesprochen werden. Zusätzlicher Aufwand Obwohl die Berechnung des Fuzzy Wertes relativ einfach ist und auch keine Änderungen im bestehenden RDBMS nötig sind, ist es doch ein zusätzlicher Aufwand und der Nutzen welcher aus einer unscharfen Klassifikation resultieren kann muss zuerst aufgezeigt werden. Individuelle Vorzüge müssen kommuniziert werden Individuelle Rabatte könnten im B2B (Business to Business) Bereich angewendet werden, im B2C (Business to Client) Bereich auch, jedoch müsste die Methode dem Kunden kommuniziert werden, da ein Kunde sonst nicht verstehen kann, warum er weniger Rabatt erhält als andere Kunden. Diese Kommunikation bringt wieder zusätzlichen Aufwand. Wenn individuelle Rabatte gegeben werden, muss gezeigt werden, dass dies auch für das Unternehmen wirtschaftlicher ist als eine Rabattpolitik welche auf scharfen Klassen beruht. 4.4. Vergleich RFM vs. Fuzzy-RFM An einem theoretischen Beispiel soll aufgezeigt werden, welche Möglichkeiten ein Fuzzy Ansatz bei der Klassifizierung bringen kann. 17 / 25 Fuzz zy - RFM Eine Excel Tabelle wurrde erstellt mit m 100 Kund den. Zur Vereinfachung g werden fürr das Beispie el nur für die Indikato oren Recenccy und Frequ uency verwe endet. Für den d Indikatorr Recency w wurde ein Be ereich zwischen 0 und 730 Ta age (2 Jahre e) gewählt. Für F die Freq quency ein Bereich B zwischen 0 bis 50. 5 Mit der Javva Methode „Random“ „ w für jeden wird n Indikator und u für jeden n Kunden eiine Zufallsza ahl im jeweiligen Bereich B generiert. Die Verteilu ung der Zufa allszahlen welche w die Ja ava Methode e ausgegeben hat ist wiie folgt: Abbildung 11: Vertielung g Recency Abbild dung 12: Verte eilung Freque ency Die einhund dert Kunden n sind über den d gesamte en Wertebereich ziemlicch gleichmä ässig verteilt. In der Praxis wäre e die Verteilung wohl vie el unregelmässiger und das Problem welches iin Abschnitt 4.1.2 beschriebe en wurde mu uss berücksichtigt werde en. In der Exce el Tabelle wiird dann ein scharfer un nd ein Fuzzy y Wert für jed den Kunden n berechnet. Mithilfe eines Diagrramms kann n der Untersschied zwiscchen der sch harfen und der d unscharffen Segmentierung visualisiert werden (sie ehe Anhang und entspre echende Exc cel Files). 1 / 25 18 Fuzzy – Klassifikation in der Praxis Abbildung 13: Scharfe Selektion Abbildung 14: Unscharfe Selektion (30%) Im linken Bild werden die Kunden scharf der Klasse oben links zugeordnet. Die Achsen auf den Werten 0.5 bilden die Grenze der Klassen. Im Rechten Bild sind die Kunden, welche zu mindestens 30% der Klasse oben links angehören. Das Diagramm zeigt, dass Kunden welche unscharf selektiert wurden, sich auch ausserhalb der scharfen Klasse befinden können, da ihr Wert für einen Indikator besonders hoch ist. Im Vergleich zur scharfen Selektion werden Kunden, welche sich an der unteren rechten Grenze befinden, in der unscharfen Selektion nicht berücksichtig, da ihre Klassenzugehörigkeit unter 30% ist. Abbildung 15: Kunden am Klassenrand In Bild 15 ist zu sehen, dass sich Kunde K012 nur zu 28% in die Klasse C1 gehört. Es gibt Kunden (zum Beispiel K073) am Rand der Klasse C1 sind und einen höheren Zugehörigkeitswert haben als der Kunde K012. Die Fuzzy Methode ist also präziser und genauer als die scharfe Klassifikation. 5. Fuzzy – Klassifikation in der Praxis 19 / 25 Fuzzy – Klassifikation in der Praxis Das RFM Modell ist nur eine von vielen Anwendungen für die unscharfe Klassifikation. Die Indikatoren müssen nicht unbedingt Recency, Frequency oder Monetary heissen, sondern können durch beliebige, andere Performance Indikatoren ersetzt werden Beispiele für andere Customer Performance Indikatoren: - Loyalität (Nutzung einer grossen Breite der Produktpalette) - Kundenpotential - Vermögen Die Methode bleibt für alle Indikatoren die gleiche. Im folgenden Teil wird das CRM und die Klassifikationsmethoden von einer Retailbank und Coop kurz vorgestellt. Anhand dieser Beispiele soll gezeigt werden, wo eine Fuzzy Klassifikation eingesetzt werden könnte und welche Vorteile daraus allenfalls resultieren könnten. 5.1. Beispiel einer Retail Bank 5.1.1. Kundensegmentierung bei der Bank Die Bank verwendet einen Segmentierungsansatz welcher aus den drei Indikatoren Vermögen, Kundenpotential und Loyalität besteht. Aus diesen Indikatoren ergibt sich ein Würfel mit acht Klassen. Auf die einzelnen Klassen innerhalb des Würfels werden bestimmte Normstrategien angewendet. Die Segmentierung soll gewährleisten, dass die besten Kunden auch am besten betreut werden. 5.1.2. Möglichkeiten für einen Fuzzy Ansatz Ein Fuzzy Ansatz könnte einen Vorteil bringen, da man erstens eine Klasse präziser bilden könnte und zweites könnten die Kunden einfacher innerhalb einer Klasse sortiert werden. Beschränkte Ressourcen könnten so genauer eingesetzt werden. 20 / 25 Fuzzy – Klassifikation in der Praxis Abbildung 16: Scharfer vs. Unscharfer Würfel In Abbildung 16 ist zu sehen, dass mit drei Indikatoren ein Würfel mit acht Klassen entsteht (bei zwei Ausprägungen je Klasse). Rechts ist ein Würfel mit ebenfalls drei Indikatoren jedoch ohne Klassengrenzen. Will man nun die Kunden innerhalb einer Klasse sortieren, müsste man bei der scharfen Klassierung die Rangfolge der Indikatoren für die Sortierung festgelegt werden. Beim rechten Würfel ist das nicht nötig, da alle Kunden zu allen Klassen gleichzeitig gehören, so könnte man eine Abfrage starten die eine Rangliste mit der Klassenzugehörigkeit für jeden Kunden generiert. 5.2. Beispiel Coop@home Coop betreibt seit 1998 ein Online Portal für Wein Bestellungen und seit 2001 können auf dem Portal Coop@home auch Lebensmittel eingekauft werden. Die Lieferung erfolgt durch eigene Transporte oder durch die Post. Marketing von Coop@home Das Portal wird zurzeit mittels Print Medien und Online Kampagnen beworben. Anzeigen erscheinen in der Coop Zeitung, der NZZ am Sonntag und der leMatin dimanche. Für die Online Kampagnen wird Bannerwerbung dynamisch in verschiedenen Internet Portalen und Seiten geschaltet. Die Online Kampagnen sollen vor allem der Neukundengewinnung dienen. Für die bestehenden Kunden werden Angebote per Mail versandt. CRM bei Coop@home Die CRM Massnahmen lassen sich einteilen in die Neukundenbegleitung: spezielle Angebote für Neukunden, Kundenbindung: Anreize schaffen für bestehende Kunden und Kundenrückgewinnung: Nachfassaktionen. 21 / 25 Implikation und Schlusswort Eine Massnahme zur Kundenbindung sind zum Beispiel günstigere Lieferbedingungen für Stammkunden: Wenn der Kunde innerhalb von drei Wochen wieder bestellt erhält er Vergünstigungen bei der Lieferung. 5.2.1. Kundensegmentierung bei Coop@home Viele Kunden bestellen ausschliesslich Wein. Die Kunden welche nur Wein bestellen sollten anders angesprochen werden, als die Lebensmittelkunden da die Kundengruppe „Wein“ vorwiegend Männer sind und die Kunden „Lebensmittel“ vorwiegend Hausfrauen. Wichtige Kriterien für eine Segmentierung ist die Art des Warenkorbes (Wein, Lebensmittle, gemischt, usw.) und quantitative Kriterien wie die Frequenz der Bestellungen. In Planung ist eine ABC Segmentierung. In Zukunft soll die Entwicklung des Kunden genauer analysiert werden können um so auch den Kundenwert besser zu bestimmen. 5.2.2. Risiken bei einem Fuzzy Ansatz Risiken bei unscharfer Klassifizierung Die Ansprache der Kunden kann unter Umständen noch komplexer werden als sie schon ist. Da ein Kunde in mehreren Klassen gleichzeitig ist besteht die Gefahr, dass er unter Umständen zweimal angesprochen wird. Falls verschiedene Marketing Aktivitäten, für zwei unterschiedliche unscharfe Klassen welche sich überlappen, durchgeführt werden. 6. Implikation und Schlusswort Ein wichtiger Vorteil der Fuzzy ist, dass die Kunden präziser und fairer, entsprechend dem wahren Wert, bewertet werden. Ein weiterer Vorteil ist, dass die Datenbankabfragen den jeweiligen Bedürfnissen genauer angepasst werden können. Nach der intensiven Beschäftigung mit der Methode habe ich einen guten Einblick in die Klassifizierung und in die Fuzzy Logik erhalten. Beim Arbeiten am Thema kamen Fragen auf, die unbeantwortet blieben und für eine Weiterbearbeitung Interessant wären: - Welchen Vorteil bringt es, dass ein Kunde in mehreren Klassen gleichzeitig befindet? - Wie soll der Wertebereich der Indikatoren definiert werden, damit alle Kunden gerecht bewertet werden? 22 / 25 Literaturangaben - Welche andere Methoden gibt es um einen Fuzzy Wert zu berechnen als der Vorgestellte und was ist der Unterschied im Resultat? - Welche weitere Anwendungsmöglichkeiten für die Fuzzy Klassifikation gibt es? Ich habe festgestellt, dass die unscharfe Klassifizierung in der Praxis noch nicht weit verbreitet ist, dass Interesse jedoch da ist. Es muss aber aufgezeigt werden können, welche wirtschaftlichen Vorteile ein Fuzzy Ansatz gegenüber dem scharfen hat. 7. Literaturangaben 7.1. Quellenangaben Die Quellen aus dem Internet werden im Skript direkt angegeben. Desweitern wurden folgende Bücher und Internetquellen für die Arbeit verwendet: 7.1.1. Bücher Marketing [FörsterKreuz2002] Förster A. , Kreuz P.; Offensives Marketing im e-Business; Loyale Kunden gewinnen – CRM Potenziale nutzen; Springer Verlag, 2002 [Schwarz2007] 7.1.2. Schwarz T.; Leitfaden Online Marketing, Marketing Börse, 2007 Artikel, Forschungs- und Arbeits- Papiere RFM Model [Fader2005] Peter Fader, Bruce Hardie, Ka Lok Lee, RFM and CLV: Using Iso-Value Curves for Customer Base Analysis, Journal of Marketing Research Vol. XLII (2005) [Mason 2003] Mason, Charlotte; Recency, Frequency and Monetary (RFM) Analysis; KenanFlagler Business School, University of North Carolina, 2003 [Aggelis] Aggelis V., Customer Clustering using RFM analysis; University of Patras, Greece Fuzzy Ansatz 23 / 25 Literaturangaben [Meier 2007] Meier A., Mezger Ch., Werro N., Schindler G.; Zur unscharfen Klassifikation von Datenbanken mit fCQL, Universität Fribourg [Meier 2007] Meier A., Werro N.; A Fuzzy Classification Model for Online Customers, Universität of Fribourg, Informatica 31 2007 [Sellers Hughes 2008] Sellers J., Hughes A.; RFM Migration Analysis – a new approach to a proven technique; Database Marketing Institute, 2008 [McCarthy Hastak 2006] McCarthy J., Hastak M.; Segmentation approaches in data-mining: A comparison of RFM, CHAID, and logistic regression; Journal of Business Research 60, 2007 [Novo] Novo J.; Customer Response, Retention and Valuation Concepts (RFM Model) [Elssenwenger] Elssenwenger T., Kundenwert – Customer Lifetime Value, Loyaltix 7.2. Verwendete Software Microsoft EXCEL 2007 mit Makros Eclipse 3.2, mit Java JDK 6.0 SPSS 16.0 7.3. Abbildungsverzeichnis Abbildung 1: Fuzzy Menge .......................................................................................................................8 Abbildung 2: Begriff Domänen..................................................................................................................8 Abbildung 3: Linguistische Variablen (Source: Naiade Manual) ...............................................................9 Abbildung 4: Funktionen für linguistische Var. (Source: Naiade Manual) .................................................9 Abbildung 5: fCQL Toolkit (UniFR) .........................................................................................................10 Abbildung 6: Problem Extremwerte ........................................................................................................13 Abbildung 7: Verschobener Bereich .......................................................................................................14 Abbildung 8: Diskrete Funkrion ..............................................................................................................14 Abbildung 9: Gamma - Operator ............................................................................................................15 Abbildung 10: Doppelte Zugehörigkeit ...................................................................................................17 Abbildung 11: Vertielung Recency .........................................................................................................18 Abbildung 12: Verteilung Frequency ......................................................................................................18 Abbildung 13: Scharfe Selektion ............................................................................................................19 24 / 25 Anhang Abbildung 14: Unscharfe Selektion (30%) ..............................................................................................19 Abbildung 15: Kunden am Klassenrand .................................................................................................19 Abbildung 16: Scharfer vs. Unscharfer Würfel........................................................................................21 8. Anhang Dateien: Datei 1: CRM - Fuzzy RFM Modell - P.Hugi.docx Datei 2: RFM Modell.xlsm Datei 3: RFM Modell-Office2003.xls Datei 4: SPSS RFM-Data, SPSS RFM-Graph 24 Seiten, ca. 5‘000 Wörter Bern, 25.04.2007 Patrik Hugi 25 / 25