Ermittlung von Präferenzen für Produkteigenschaften mit Hilfe der Choice-Based Conjoint Analyse, Teil II Dr. Sonja Gensler, Frankfurt am Main In diesem zweiten Teil des Beitrags werden die Ergebnisse der Choice-Based Conjoint Analyse interpretiert. Es wird zudem gezeigt, wie auf der Basis der Ergebnisse einer Choice-Based Conjoint Analyse eine Marktsimulation durchgeführt werden kann. Alle Berechnungen werden mit Microsoft EXCEL durchgeführt und können anhand eines aus dem Internet herunterladbaren Tabellenkalkulationsblatts nachvollzogen werden. Dr. Sonja Gensler ist Habilitandin am Lehrstuhl für Electronic Commerce der Johann Wolfgang Goethe-Universität Frankfurt am Main. Bevorzugte Forschungsgebiete: Marketing, Kundenmanagement, Marktforschung. Die Choice-Based Conjoint Analyse ist heute die am häufigsten eingesetzte Variante der traditionellen Conjoint Analyse. Das Ziel der Choice-Based Conjoint Analyse besteht darin, Präferenzen für Produkteigenschaften und deren Ausprägungen zu ermitteln. Diese Präferenzen werden durch die Nutzenbeiträge der einzelnen Produkteigenschaften und deren Ausprägungen abgebildet. Die Nutzenparameter für die einzelnen Ausprägungen der Eigenschaften werden mittels einer Maximum-Likelihood Schätzung geschätzt. Basierend auf den geschätzten Nutzenparametern können dann Marktsimulationen durchgeführt werden, um die Rentabilität neuer Produkte zu beurteilen. Eine detaillierte Darstellung aller für die Schätzung der Nutzenparameter in einer Choice-Based Conjoint Analyse notwendigen Schritte findet sich im ersten Teil dieses Beitrags (WiSt, Nr. 5/2006). Im Folgenden wird diskutiert, wie die Güte der geschätzten Nutzenparameter beurteilt und wie eine Marktsimulation durchgeführt werden kann. Die Berechnungen für ein konkretes Beispiel können anhand eines aus dem Internet herunterladbaren Tabellenkalkulationsblatts nachvollzogen werden (www.ecommerce.wiwi.uni-frankfurt.de/conjoint.html). 1. Beurteilung der Güte der geschätzten Nutzenparameter Eine Beurteilung der Güte der geschätzten Nutzenparameter kann anhand der folgenden Kriterien erfolgen: ) Plausibilität der geschätzten Nutzenparameter: Diese fordert, dass die geschätzten Nutzenparameter mit den a-priori Erwartungen bezüglich der Nutzenparameter (Face Validität) übereinstimmen. Zudem kann deren Signifikanz überprüft werden. ) Anpassungsgüte des Modells (interne Validität): Die beobachteten Auswahlentscheidungen sollten mittels 316 WiSt Heft 6 · Juni 2006 der geschätzten Nutzenparameter möglichst gut reproduziert werden. ) Prognosevalidität: Die Auswahlentscheidungen bezüglich der Stimuli in den Hold-Out Choice Sets sollen anhand der geschätzten Nutzenparameter möglichst genau vorhergesagt werden. Die Plausibilität der geschätzten Nutzenparameter kann auf Basis der geschätzten Einflussrichtung (Vorzeichen) auf den Nutzenwert eines Stimulus vorgenommen werden. Die Einflussrichtung eines Nutzenparameters auf den Nutzenwert lässt sich direkt anhand des Vorzeichens ablesen. Ein positives Vorzeichen bewirkt eine Erhöhung des Nutzenwertes bei Vorliegen der Eigenschaftsausprägung und somit eine Erhöhung der Auswahlwahrscheinlichkeit. Eine Interpretation der Stärke des Einflusses ist jedoch nicht direkt möglich. Die Gütemaße zur Beurteilung der Anpassung des Modells an die Beobachtungen basieren auf dem Wert der Likelihood-Funktion. Jedoch sind die herangezogenen Tests streng genommen nur für große Stichproben als valide anzusehen. Der Likelihood-Ratio Test setzt beispielsweise den mit „-2“ multiplizierten logarithmierten Wert des Likelihoods des geschätzten Modells mit dem mit „-2“ multiplizierten logarithmierten Wert des Likelihoods des Null-Modells L(0) in Beziehung (vgl. Train, 2002, S. 78). Das NullModell beschreibt dabei das Modell, in dem alle Nutzenparameter den Wert „0“ annehmen. Der Vergleich der beiden Modelle dient somit dazu, festzustellen, ob die unabhängigen Variablen die Erklärungskraft des Modells verbessern. LR = ⏐– 2 ln L (0)⏐ – ⏐– 2 ln L⏐ (1) Je größer der Wert der Likelihood-Ratio Teststatistik, desto besser ist die Anpassung des Modells an die Beobachtungen. Der Wert des Likelihood-Ratio Tests ist asymptotisch Chi-Quadrat verteilt mit |K| Freiheitsgraden, wobei |K| der Anzahl der zu schätzenden Parameter entspricht. Zudem kann auch die Hit Rate, die den Anteil korrekt wiedergegebener Auswahlentscheidungen betrachtet, angewendet werden. Die Güte dieses Maßes wird jedoch von der Anzahl der Stimuli in einem Choice Set beeinflusst. Denn so ergibt sich beispielsweise bei einer rein willkürlichen Auswahl bei drei Stimuli je Choice Set eine Trefferquote von 33%. Bei einer Beurteilung der Hit Rate ist dies zu berücksichtigen. Aus diesem Grund ist es nicht möglich, einen Wert anzugeben, der eine gute Hit Rate kennzeichnet. Die Prognosevalidität kann auf Basis von Hold-Out Choice Sets beurteilt werden, die nicht zur Schätzung der Nutzenparameter herangezogen werden. Als Gütemaß eignet Gensler, Choice-Based Conjoint Analyse, Teil II sich auch hier die Hit Rate. Diese gibt dann an, in wie vielen Fällen, die Auswahlentscheidung der Konsumenten in den Hold-Out Choice Sets richtig vorhergesagt wird. Auch für dieses Gütemaß gilt, dass die Hit Rate bei einem rein willkürlichen Auswahlverhalten bei der Beurteilung zu berücksichtigen ist. Codierung Ausprägung Marke Podi CreatiX RioGrande 20 GB 5 GB 1 GB Radio und Stoppuhr Radio Stoppuhr 80 g 140 g 160 € 180 € 240 € Kapazität 2. Interpretation der Nutzenparameter Die geschätzten Nutzenparameter repräsentieren den Beitrag einer Eigenschaftsausprägung zum Nutzenwert eines Stimulus. Eine direkte Interpretation der geschätzten Nutzenparameter ist allerdings aufgrund der Modellspezifikation (logistische Verteilung) nicht möglich. Für eine Interpretation der Nutzenparameter können die Bedeutungsgewichte der Eigenschaften betrachtetet werden. Eine Berechnung der Bedeutungsgewichte der einzelnen Eigenschaften erlaubt, die Relevanz der einzelnen Eigenschaften für die Auswahlentscheidungen der Konsumenten zu ermitteln. Das Bedeutungsgewicht einer Eigenschaft wird ermittelt, indem die Spannweite der geschätzten Nutzenparameter einer Eigenschaft durch die Summe der Spannweiten aller Eigenschaften dividiert wird. Die Spannweite einer Eigenschaft ist dabei definiert als die Differenz zwischen dem höchsten und dem niedrigsten Nutzenparameter der Ausprägungen einer Eigenschaft (vgl. Vriens/Oppewal/Wedel, 1998). ^ max{ q BGj = m∈Mj 7 j’∈J j,m} ^ min { q } – m∈M j,m j ^ min ^ (max ∀j∈J m∈Mj { q j’,m } – m∈Mj{ q j’,m}) (2) BGj: Bedeutungsgewicht der j-ten Eigenschaft, ^ q j,m: geschätzter Nutzungsparameter der m-ten Ausprägung der j-ten Eigenschaft, Mj: Indexmenge der Ausprägungen der j-ten Eigenschaft. Dummy Dummy Variable 1 Variable 2 Eigenschaft Ausstattung Gewicht Preis 1 0 -1 1 0 -1 1 0 -1 1 -1 1 0 -1 0 1 -1 0 1 -1 0 1 -1 0 1 -1 Tab. 1: Effekt-Codierung der Eigenschaftsausprägungen Choice Set 1 CreatiX 20 GB Radio 80 g 240 Euro Choice Set 2 RioGrande 1 GB Stoppuhr 140 g 160 Euro … Choice Set 12 RioGrande 1 GB Radio 140 g 240 Euro Podi 5 GB Ich würde keinen der Radio + Stoppuhr MP3 Player kaufen. 140 g 180 Euro creati Ich würde keinen der 20 GB Radio + Stoppuhr MP3 Player kaufen. 80 g 180 Euro Podi 5 GB Stoppuhr 80 g 160 Euro Ich würde keinen der MP3 Player kaufen. Tab. 2: Auszug der betrachteten Choice Sets 3. Beispiel zur Schätzung und Interpretation der Nutzenparameter Um die vorangegangenen Ausführungen zu verdeutlichen, wird als Beispiel die Gestaltung eines MP3 Players aufgegriffen, der bestmöglich den Präferenzen der Konsumenten entsprechen soll. Es werden die folgenden Eigenschaften und Ausprägungen berücksichtigt: Marke (Podi, CreatiX, RioGrande), Kapazität (20 GB, 5 GB, 1 GB), Ausstattung (Radio und Stoppuhr, Radio, Stoppuhr), Gewicht (80 g, 140 g) und Preis (160 c, 180 c, 240 c). Es wird das Teilnutzenwert-Modell als Bewertungsfunktion der einzelnen Eigenschaften herangezogen. Die Eigenschaftsausprägungen werden Effekt-codiert (vgl. Tab. 1). Die Auswahlwahrscheinlichkeit für einen Stimulus in einem Choice Set ergibt sich dann bei Berücksichtigung einer Nicht-Wahl Option wie folgt: exp(vi) (3) ∀i∈Ca und Ca⊆I Pi = 7 exp(vi’) i’∈Ca vi = q 0 · x0,i + (1 – x0,i) · [ q Marke,Podi · xi,Marke,Podi + q Marke,CreatiX · xi,Marke,CreatiX + q Kapazität,20GB · xi,Kapazität,20GB + q Kapazität,5GB · xi,Kapazität,5GB + q Ausstattung,R + S · xi,Ausstattung,R + S + q Ausstattung,R · xi,Ausstattung,R + q Gewicht,80g · xi,Gewicht,80g + q Preis,160Euro · xi,Preis,160Euro + q Preis,180Euro · xi,Preis,180Euro] vi: Nutzen des i-ten Stimulus, x0,i: binäre Variable für die Nicht-Wahl Option. Es werden zwölf Choice Sets generiert, die jeweils durch zwei Stimuli und eine Nicht-Wahl Option repräsentiert werden (Auszug vgl. Tab. 2, Darstellung aller Choice Sets unter: www.ecommerce. wiwi.uni-frankfurt.de/conjoint.html). So liegen für jeden Konsumenten zwölf Auswahlentscheidungen vor. Zudem werden drei Hold-Out Choice Sets WiSt Heft 6 · Juni 2006 317 Wissenschaftliche Beiträge Hold-Out Choice Set 1 Podi RioGrande 1 GB 20 GB Ich würde keinen der Radio + Stoppuhr Stoppuhr MP3 Player kaufen. 140 g 80 g 180 Euro 240 Euro Hold-Out Choice Set 2 RioGrande CreatiX Ich würde keinen der 20 GB 5 GB Radio + Stoppuhr MP3 Player kaufen. Radio 140 g 80 g 240 Euro 160 Euro Hold-Out Choice Set 3 CreatiX Podi Ich würde keinen der 1 GB 5 GB MP3 Player kaufen. Stoppuhr Radio 80 g 140 g 180 Euro 160 Euro Tab. 3: Betrachtete Hold-Out Choice Sets Eigenschaft Ausprägung Startwerte Marke Podi CreatiX RioGrande Kapazität 20 GB 5 GB 1 GB Ausstattung Radio + Stoppuhr Radio Stoppuhr Gewicht 80 g 140 g Preis 160 € 180 € 240 € Nicht-Wahl Option 3,00 3,00 -6,00 3,00 3,00 -6,00 3,00 3,00 -6,00 3,00 -3,00 3,00 3,00 -6,00 Ê * Ê ** (n = 10) (n = 1) 3,06 0,56 -3,62 3,74 2,04 -5,79 0,75 -0,31 -0,44 2,11 -2,11 2,96 0,99 -3,95 -0,21 2,37 -9,12 6,75 11,62 10,95 -22,57 0,46 1,46 -1,92 -2,02 2,02 8,10 5,85 -13,95 -4,44 * fett gedruckte Werte sind auf dem 10% Niveau signifikant, ** kursiv gedruckte Werte sind nicht plausibel. Tab. 4: Geschätzte Nutzenparameter für das Beispiel entwickelt, die eine Beurteilung des geschätzten Modells hinsichtlich seiner Prognosevalidität erlauben (vgl. Tab. 3). Zur Schätzung der Nutzenparameter ist es erforderlich, Startwerte vorzugeben. Diese haben einen Einfluss auf die Schätzung der Nutzenparameter und es sollten daher unterschiedliche Startwerte vorgegeben werden. So kann sichergestellt werden, dass die geschätzten Nutzenparameter stabil sind. Die Schätzung der Nutzenparameter in EXCEL für sowohl einen Konsument als auch zehn Konsumenten kann unter www.ecommerce.wiwi.uni-frankfurt.de/conjoint.html nachvollzogen werden. Es werden auf Basis einer Maximum-Likelihood Schätzung die folgenden Nutzenparameter für die einzelnen Eigenschaftsausprägungen ermittelt (vgl. Tab. 4). Es wird deutlich, dass bei einer individuellen Schätzung der Nutzenparameter (ein Konsument) die geschätzten Nutzenparameter weder stabil noch plausibel sind. Daher wird im Folgenden nur die Schätzung für zehn Konsumenten weiter betrachtet. Diese erweisen sich als stabil und hinsichtlich ihres Einflusses auf die Auswahlwahrscheinlichkeit eines Stimulus als plausibel. Der logarithmierte Wert des Likelihoods des geschätzten Modells weist einen Wert von -43,97 auf, wohingegen bei dem Null-Modell der logarithmierte Wert des Likelihoods -131,93 beträgt. Es ergibt sich somit ein Wert für die Likelihood-Ratio Teststatistik von: LR = |-2*(-131,93)| – |-2* (-43,97)| = 175,92. Bei zehn Freiheitsgraden ergibt sich bei einem Signifikanzniveau von 5% ein theoretischer Chi-Quadrat Wert von 18,31. Somit stellt das geschätzte Modell eine signifikante Verbesserung gegenüber dem Null-Modell dar und die Nullhypothese, dass die unabhängigen Variablen keinen Erklärungsgehalt haben, kann verworfen werden. Für die Hit Rate ergibt sich ein Wert von 83,3%. Bei einem rein willkürlichen Auswahlverhalten ergibt sich ein Wert von 33%. Die Hit Rate wird daher als sehr gut eingestuft. Die Bedeutungsgewichte der Eigenschaften sind in Tab. 5 dargestellt. Es zeigt sich, dass die Eigenschaft Kapazität 318 WiSt Heft 6 · Juni 2006 Eigenschaft Marke Kapazität Ausstattung Gewicht Preis Summe Spannweite 3,06 - (-3,62) 3,74 - (-5,79) 0,75 - (-0,44) 2,11 - (-2,11) 2,96 - (-3,95) = 6,68 = 9,53 = 1,19 = 4,22 = 6,91 28,55 Bedeutungsgewicht 6,68/28,55 9,53/28,55 1,19/28,55 4,22/28,55 6,91/28,55 = = = = = 23% 33% 4% 14% 24% Tab. 5: Bedeutungsgewichte der Eigenschaften die größte Relevanz für die Konsumenten hat, gefolgt von den Eigenschaften Preis und Marke. Die Prognosevalidität wird auf Basis der Hit Rate in den Hold-Out Choice Sets beurteilt. Es ergibt sich ein Wert von 93,3%. Das heißt, in 93,3% der Fälle wurde die Auswahlentscheidung eines Konsumenten richtig prognostiziert. Dieser Wert kann als sehr gut eingestuft werden, da sich bei einem rein willkürlichen Auswahlverhalten ein Wert von 33% ergeben würde. 4. Marktsimulation auf Basis der geschätzten Nutzenparameter Häufig wird die Choice-Based Conjoint Analyse eingesetzt, um den Erfolg einer Neuprodukteinführung abzuschätzen. Hierfür wird eine Marktsimulation durchgeführt. Es gilt das Marktpotenzial wie auch die Kosten für die einzelnen Eigenschaftsausprägungen zu bestimmen. Zudem müssen unterschiedliche Produkte vorgegeben werden, die sich schon auf dem Markt befinden oder neu eingeführt werden sollen und den Markt hinreichend gut beschreiben. Im Gegensatz zur traditionellen Conjoint Analyse (vgl. Skiera/Gensler, 2002a und 2002b), bei der für eine Marktsimulation eine Auswahlregel zu spezifizieren ist, ist bei der Choice-Based Conjoint Analyse diese bereits im Modell verankert. Gensler, Choice-Based Conjoint Analyse, Teil II Produkt 1 Kosten für die Ausprägungen der Eigenschaften 80,00 € 15,00 € 5,00 € 25,00 € Produkt 2 Podi CreatiX 20GB 20GB Radio Radio + Stoppuhr 80g 140g 240 € 180 € Marktpotenzial: 10.000.000 Stück Produkt 3 RioGrande 5GB Radio + Stoppuhr 80g 160 € Tab. 6: Vorgaben für die Marktsimulation Für das Beispiel der MP3 Player werden die folgenden drei Produkte betrachtet, (vgl. Tab. 6). Eine Firma möchte darüber entscheiden, ob sich die Einführung eines bestimmten Produkts (Produkt 1) als rentabel erweisen wird. Auf Basis der geschätzten Nutzenparameter ergibt sich für die drei betrachteten Produkte der folgende Nutzenwert: Nutzen (Produkt 1) = 3,06 + 3,74 + (-0,31) + 2,11 + (-3,95) = 4,66 Nutzen (Produkt 2) = 0,56 + 3,74 + 0,75 + (-2,11) + 0,99 = 3,93 Nutzen (Produkt 3) = -3,62 + 2,04 + 0,75 + 2,11 + 2,96 = 4,24 Nutzen (Nicht-Wahl Option) = -0,21 Hieraus ergeben sich die folgenden Auswahlwahrscheinlichkeiten: exp (4,66) PProdukt 1 = exp (4,66) + exp (3,93) + exp (4,24) + exp ( – 0,21) = PProdukt 2 = = PProdukt 3 = = PNicht-Wahl = 105,43 = 46,5% 226,69 exp (3,93) exp (4,66) + exp (3,93) + exp (4,24) + exp ( – 0,21) 50,85 = 22,4% 226,69 exp (4,24) exp (4,66) + exp (3,93) + exp (4,24) + exp ( – 0,21) 69,60 = 30,7% 226,69 exp ( – 0,21) exp (4,66) + exp (3,93) + exp (4,24) + exp ( – 0,21) 0,81 = = 0,4% 226,69 Für das Produkt 1 ergibt sich somit eine gesamte Absatzmenge von 4.650.000 Stück (= 10.000.000*46,5%). Die variablen Stückkosten betragen 125,00 c und bei einem Preis von 240,00 c ergibt sich ein Stückdeckungsbeitrag von 115,00 c sowie ein Gesamt-Deckungsbeitrag von 534.750.000 c. Die Einführung dieses MP3 Player erscheint somit vorteilhaft, wenn die Entwicklungskosten und Marketingkosten diesen Betrag nicht übersteigen. 5. Zusammenfassung und Ausblick Ausprägungen zu ermitteln und somit die Präferenzen von Konsumenten abzubilden. Dabei ergibt sich bei der ChoiceBased Conjoint Analyse der Nutzenwert eines Produkts aus einer deterministischen und einer stochastischen Komponente. Aus diesem Grund kann die Auswahlentscheidung der Konsumenten nur mit einer gewissen Wahrscheinlichkeit angegeben werden. Die Grundlage für die Schätzung der Nutzenparameter bilden die Auswahlentscheidungen der Konsumenten. Diese zeichnen sich durch einen relativ geringen Informationsgehalt aus. Andererseits erweist sich diese Art der Erhebung der Präferenzen von Konsumenten als realitätsnah. Da jedoch die Auswahlentscheidungen der Konsumenten relativ wenig Informationen enthalten und selten hinreichend viele Auswahlentscheidungen für einen Konsumenten erhoben werden können, kann nur eine aggregierte Schätzung der Nutzenparameter erfolgen. Dies erlaubt einerseits eine stabile Schätzung der Nutzenparameter. Andererseits können die Nutzenparameter jedoch aufgrund der Unterschiedlichkeit der Konsumenten (Heterogenität in den Präferenzen zwischen den Konsumenten) systematisch verzerrt sein. Aus diesem Grund beschäftigen sich neuere Ansätze zur Schätzung der Nutzenparameter im Rahmen der ChoiceBased Conjoint Analyse damit, wie die Heterogenität in den Präferenzen zwischen den Konsumenten angemessen abgebildet werden kann. In diesem Zusammenhang werden Latent Class Modelle und hierarchische Bayes Modelle diskutiert. Während Latent Class Modelle eine segmentbezogene Schätzung der Nutzenparameter vornehmen, realisieren hierarchische Bayes Modelle eine individuelle Schätzung der Nutzenparameter (vgl. Gensler, 2003). Somit kann die Annahme einer homogenen Nutzenstruktur aufgehoben und die Validität der geschätzten Nutzenparameter erhöht werden. Diese Weiterentwicklungen haben unter anderem dazu geführt, dass die Choice-Based Conjoint Analyse heute die am häufigsten eingesetzte Variante der Conjoint Analyse ist. Literatur Gensler, S., Heterogenität in der Präferenzanalyse, Wiesbaden 2003. Skiera, B., S. Gensler, Berechnung von Nutzenfunktionen und Marktsimulationen mit Hilfe der Conjoint-Analyse, Teil I, in: WiSt – Wirtschaftswissenschaftliches Studium, 31. Jg. (2002a), S. 200–206. Skiera, B., S. Gensler, Berechnung von Nutzenfunktionen und Marktsimulationen mit Hilfe der Conjoint-Analyse, Teil II, in: WiSt – Wirtschaftswissenschaftliches Studium, 31. Jg. (2002b), S. 258–263. Train, K., Discrete Choice Models with Simulation, Cambridge 2002. Vriens, M., H. Oppewal, M. Wedel, Ratings-Based versus ChoiceBased Latent Class Conjoint Models. An Empirical Comparison, in: Journal of the Market Research Society, Vol. 40 (1998), S. 237–248. Ziel der Choice-Based Conjoint Analyse ist es, die Nutzenparameter für Eigenschaften beziehungsweise deren WiSt Heft 6 · Juni 2006 319