Auswahlbasierte Conjoint-Analyse - CBCA Hier stellen wir nun eine Weiterentwicklung der Conjoint-Analyse vor, die sich in der Marktforschungspraxis und teilweise auch in der Umweltökonomie großer Beliebtheit erfreut. Grundlage ist das Lehrbuch von Backhaus, Erichson und Weiber: Fortgeschrittene Multivariate Analysemethoden. Springer, Berlin 2011; zitiert hier als Backhaus u.a. 2011 Hingewiesen sei auf die Internetseite zu den beiden Backhaus-Lehrbüchern www.multivariate.de Wir wollen von empirisch erhobenen Gesamturteilen über Produkte auf die Präferenzen für Eigenschaften dieser Produkte schließen. Man spricht auch von dekompositionellen Verfahren. Der Gesamtnutzen wird sozusagen in Teilnutzen zerlegt. CBCA – Beispiele für die Anwendung Während bei der Traditionellen CA die Nutzen direkt abgefragt werden, werden bei der Auswahlbasierten CA (simulierte) Auswahlentscheidungen beobachtet. Backhaus u.a. 2011, S. 319 Abbildung 7.1 CBCA - Erhebungsdesign Ein im Vergleich zur TCA anderes Erhebungsdesign. Welches dieser Produkte würden Sie kaufen? Natürlich mit Wirkungen. Nominales Skalenniveau statt ordinalem Skalenniveau erfordert andere Schätzverfahren. Schätzungen statt auf individueller Ebene auf aggregierter Ebene. TCA CBCA Realitätsnähe Informationsmenge Backhaus u.a. 2011, S. 317 ff. CBCA – Vergleich zur Traditionellen Conjoint-Analyse wichtigster Unterschied Backhaus u.a. 2011, S. 321 Abbildung 7.2 Auswahlbasierte Conjoint-Analyse - Anwendungsbeispiel Becher oder Tüte, hoher oder niedriger Preis? Variante des Beispiels: Im Wildpark „Starke Sau“ soll Wildfutter verkauft werden. Es ist zu entscheiden, ob das Futter in Papiertüten oder in Bechern verpackt werden soll und zu welchem Preis es verkauft werden soll. Zur Untersuchung der Fragestellung soll eine Stichprobe mit N=6 Befragten durchgeführt werden. Backhaus u.a. 2011, S. 317 ff. CBCA - Erhebungsdesign Umfang und Art der Stichprobe Ein generelles Problem der Marktforschung Gestaltung der Stimuli (Alternativen) Durch welche Kombination von Eigenschaftsausprägungen werden die Stimuli definiert und wie werden sie den Testpersonen präsentiert? (verbal, visuell, physisch) Gestaltung von Auswahlsituationen Zwischen wie vielen Stimuli sollen die Testpersonen auswählen? Wie viele Auswahlentscheidungen sollen sie treffen? Wir benötigen dann noch ein verhaltenstheoretisches Modell zur Bildung von Nutzenbeurteilungen (Präferenzen). Weiter eine statistische Methode zur Auswertung. Backhaus u.a. 2011, S. 322 Auswahlbasierte Conjoint-Analyse - Analyseschritte Aus den Überlegungen ergibt sich die folgende Reihenfolge der Schritte der Conjoint-Analyse: 1 Gestaltung der Stimuli 2 Gestaltung der Auswahlsituation 3 Spezifikation eines Nutzenmodells 4 Spezifikation eines Auswahlmodells 5 Schätzung der Nutzenwerte 6 Interpretation und Anwendung 7 Disaggregation der Nutzenwerte Backhaus u.a. 2011, S. 323 Abbildung 7.3 CBCA – Gestaltung der Stimuli Verpackung Preis in € € 1,00 € 1,30 € 1,00 € 1,30 Futter 1 Futter 2 Futter 3 Futter 4 Papier Papier Becher Becher 1,00 1,30 1,00 1,30 NoneOption Die Zahl der Stimuli ergibt sich durch Kombination der Eigenschaftsausprägungen. Hier haben wir zwei Eigenschaften mit je zwei Ausprägungen, also vier Stimuli (ohne die None-Option). Bei vier Eigenschaften mit jeweils drei Ausprägungen würden sich schon 81 Stimuli ergeben. Mit der Anzahl der Stimuli wächst natürlich der Befragungsaufwand. Backhaus u.a. 2011, S. 317 ff. vgl. Abb. 7.4, S. 323 CBCA – Beispiel für eine schriftliche Abfrage Sie stehen an der Kasse des Wildparks „Starke Sau“ und möchten Wildfutter kaufen. Stellen Sie sich vor, dort stünden die folgenden Möglichkeiten zur Wahl. Futter 1 Futter 2 Papier Papier € 1,00 € 1,30 Futter 3 Futter 4 Becher Becher € 1,00 € 1,30 Fragestellung Das nennt man Choice-Set Hier ist das Choice-Set vollständig. Bei einer großen Zahl Stimuli muß man eine Auswahl treffen. Für das Beispiel sei festgelegt, daß jede der sechs Testpersonen zweimal aus einer Zweier-Alternative auswählen muß, jeweils mit None-Option. Jede Testperson bekommt also zwei (unvollständige) Choice-Sets vorgelegt. Backhaus u.a. 2011, S. 317 ff. Abb. 7.5, S. 324 CBCA – Auswahl von Choice Sets Das sind die beiden Choice-Sets für die erste Testperson. C in der nächsten Folie D in der nächsten Folie Bei K Stimuli lassen sich K∗ πΎ−1 2 Für das Beispiel ergeben sich bei K = 4 Stimuli: paarweise Choice-Sets bilden. K∗ πΎ−1 2 = 4∗3 2 = 12 2 =6 paarweise Choice-Sets Backhaus u.a. 2011, S. 317 ff. Abb. 7.6, S. 325 CBCA – Auswahl von Choice Sets Hier sind die sechs möglichen Choice-Sets für das Beispiel zusammengestellt: 2 x Papier 2 x € 1,00 ohne Überlappung ohne Überlappung 2 x € 1,30 2 x Becher In Choice-Set A kommt Papier zweimal vor. Das nennt man Überlappung. Bei den Choice-Sets C und D bestehen keine Überlappungen. Backhaus u.a. 2011, S. 317 ff. Abb. 7.7, S. 325 CBCA – Auswahl von Choice Sets Es lassen sich natürlich auch Choice-Sets mit mehr als zwei Alternativen bilden. Wenn s die Größe eines Choice-Sets ist, dann beträgt die Anzahl der möglichen ChoiceSets : K∗ πΎ! π ! πΎ−π ! Formel 7.2 Würden wir bei unserem Beispiel Choice-Sets mit mehr als zwei Auswahlmöglichkeiten wählen, wären möglich: s=2 6 Choice-Sets – siehe oben s=3 4 S=4 1 Es stellt sich die Frage, wie groß man die Choice Sets wählen sollte und wieviel Choice-Sets man einer Versuchsperson vorlegen kann. CBCA – Auswahl von Choice Sets Für das Beispiel sei festgelegt: Umfang der Choice-Sets = 2, Anzahl der Choice-Sets pro Versuchsperson = 2, Zuordnung von Choice Sets zu Testpersonen: Nur Choice-Sets ohne Überlappung, None-Option: ja A A B überwiegt, die None-Option kommt nicht vor. Backhaus u.a. 2011, S. 317 ff. Abb. 7.8, S. 327 CBCA Da sich in der vorhergehenden Tabelle in der rechten Spalte unter den gewählten Optionen (A bzw. B) jeweils verschiedene Stimuli verbergen, müssen wir die Daten so in eine Tabelle übertragen, daß die Auswahlentscheidungen den Stimuli richtig zugeordnet werden. Person i 1 2 3 4 5 6 Auswahlsituation r 1 2 3 4 5 6 7 8 9 10 11 12 Stimuli k None Daten 1 2 3 4 Papier/1,00 € Papier/1,30 € Becher/1,00 € Becher/1,30 € 1 0 0 1 0 1 1 0 0 1 1 0 1 0 0 1 1 0 0 1 0 1 1 0 0 1 1 0 1 0 0 1 1 0 0 1 0 1 1 0 0 1 1 0 1 0 0 1 5 None 1 1 1 1 1 1 1 1 1 1 1 1 Wahl d(r,k) 4 3 3 1 4 3 3 4 1 3 3 4 Becher für € 1,30 gewählt Wir verwenden eine binäre Codierung. 1 bedeutet, daß der Stimulus im Choice Set enthalten ist. 0 bedeutet, daß der Stimulus im Choice-Set nicht enthalten ist. In der rechten Spalte stehen die numerischen Codes für die gewählten Stimuli. Bei der ersten Auswahlentscheidung hat sich die erste Versuchsperson für den Becher für € 1,30 entschieden. Backhaus u.a. 2011, S. 317 ff. Abb. 7.9, S. 328 CBCA - Fragestellungen • Was ist den Konsumenten mehr wert, Wildfutter in Papiertüten oder im Becher? • Wie stark ist jeweils der Einfluß von Verpackung und Preis auf das Kaufverhalten? • Läßt sich mit der Becherverpackung ein höherer Verkaufspreis realisieren, der die höheren Produktionskosten gegenüber der Papiertüte (über-)kompensiert? Die erste Frage läßt sich durch Betrachtung der Daten beantworten. Bei zwölf Wahlentscheidungen wurde zehnmal die Becherverpackung gewählt. Backhaus u.a. 2011, S. 328 Auswahlbasierte Conjoint-Analyse – Spezifikation eines Nutzenmodells Wie kommen in den Köpfen der Menschen Nutzenbeurteilungen (Präferenzen) zustande? z.B. Wirtschaftlichkeit, Energiegehalt Wie ist der Zusammenhang zwischen der Ausprägung einer Eigenschaft und dem Nutzen, der bewirkt wird? Dies läßt sich mit prinzipiell unterschiedlichen Zusammenhängen darstellen. Man spricht auch von elementaren Teilnutzenmodellen. Für jede Eigenschaft muß man sich für ein Teilnutzen-Modell entscheiden. z.B. Temperatur, Konsistenz Das Gesamtnutzen-Modell entsteht dann durch additive oder multiplikative Verknüpfung der Teilnutzenmodelle. Standard bei der CA ist das additive Teilwert-Nutzenmodell – die Verknüpfung der Teilwert-Modelle für die Eigenschaften geschieht also durch Addition. flexibel, aber wenig effizient. Backhaus u.a. 2011, S. 317 ff. Abb. 7.10, S. 330 Auswahlbasierte Conjoint-Analyse – Spezifikation eines Nutzenmodells Additive Nutzenmodelle werden auch als kompensatorische Nutzenmodelle bezeichnet. Bei multiplikativer Verknüpfung führt ein Teilnutzen von 0 zu einem Gesamtnutzen von 0. Die CBCA ist nicht an ein bestimmtes Nutzenmodell gebunden. Das additive Teilwert-Nutzenmodell ist sehr flexibel und daher das gebräuchlichste Nutzenmodell. Es läßt sich auch anwenden, wenn der Untersucher keinerlei Vorstellung über den Zusammenhang von Eigenschaftsausprägungen und Nutzen besitzt. Das Vektor-Modell ist viel effizienter, aber nur bei metrisch meßbaren Eigenschaften anwendbar. Es können auch beliebige nichtlineare Modelle Anwendung finden. Das Idealpunktmodell ist dafür nur ein Beispiel. Nutzenverläufe sind oft durch abnehmenden Grenznutzen gekennzeichnet. Backhaus u.a. 2011, S. 317 ff. Auswahlbasierte Conjoint-Analyse Im Beispiel haben wir J = 2 Eigenschaften mit jeweils M = 2 Ausprägungen. Bei Einbeziehung der NoneOption ergibt sich formal noch eine dritte Eigenschaft mit nur einer Ausprägung. Es gelte: Bezeichnungen für Eigenschaften und Teilnutzen im Beispiel Die Gesamtnutzenwerte uk erhält man durch uk = b11 * x11k + b12 * x12k + b21 *x21k + b22 * x22k + b31 * x31k π½ ππ π’π = πππ ∗ π₯πππ π=1 π=1 die bjm sind die Teilnutzen für die Eigenschaften j mit den Ausprägungen m die xmjk sind Dummy-Variable, die 1 sind, wenn Stimulus k bezüglich die Eigenschaft j die Ausprägung m hat, sonst 0 Backhaus u.a. 2011, S. 317 ff. Abb. 7.11, S. 332 Auswahlbasierte Conjoint-Analyse Für das Beispiel sind die Werte der Dummy-Variablen in der folgenden Tabelle angegeben. Daraus lassen sich die Teilnutzenwerte berechnen. Eigenschaft j: Ausprägung m: Stimulus k 1 2 3 4 5 1 2 Verpackung 1 2 Papier Becher 1 0 1 0 0 1 0 1 0 0 Preis 1 1,00 € 1 0 1 0 0 3 2 1,30 € 0 1 0 1 0 None 0 0 0 0 1 das sind die xjmk Definition der Stimuli mittels binärer Codierung Wenn wir die Teilnutzen, die wegen der jeweils nicht vorhandenen Eigenschaftsausprägungen 0 sind (xjmk = 0), weglassen, bekommen wir die Gesamtnutzen der fünf Stimuli. u1 = b11 + b21 Papier / € 1,00 u2 = b11 + b22 Papier / € 1,30 u3 = b12 + b21 Becher/ € 1,00 u4 = b12 + b22 Becher / € 1,30 u5 = b31 None-Option Backhaus u.a. 2011, S. 317 ff. Abb. 7.12, S. 332 Auswahlbasierte Conjoint-Analyse – Spezifikation eines Auswahlmodells Im Unterschied zur Traditionellen Conjoint-Analyse wird bei der CBCA neben einem Nutzenmodell noch ein Auswahlmodell benötigt. Die CBCA basiert ja auf Beobachtungen von Wahlentscheidungen, aus denen die Nutzenbeurteilungen indirekt abgeleitet werden sollen, die bei der TCA direkt erfragt werden. Wir brauchen deshalb ein Modell, welches beschreibt, wie sich eine Person auf Basis ihrer Nutzenvorstellungen bei der Auswahl zwischen Alternativen entscheidet. Wir nennen dieses Modell Choice-Modell. Ein Modell für individuelles Entscheidungsverhalten bei diskreten Alternativen. Das ist eine starke Vereinfachung des komplexen menschlichen Entscheidungsverhaltens. Die Modelle liefern i.d.R. keine eindeutige Entscheidung, sondern Wahrscheinlichkeiten für die Wahl der Alternativen. Backhaus u.a. 2011, S. 317 ff. Auswahlbasierte Conjoint-Analyse Zur Wahl stehen insbesondere die folgenden Modelle: Die Wahl der Modelle ist prinzipiell frei. Wird für die CBCA eine Software verwendet, ist man natürlich auf die darin implementierten Modelle beschränkt. Backhaus u.a. 2011, S. 317 ff. Abb. 7.13, S. 333 Auswahlbasierte Conjoint-Analyse – Spezifikation eines Auswahlmodells Das Max-Utility-Modell oder auch First-Choice-Modell bildet eine Ausnahme. In diesem Modell erhält die Alternative mit dem größten Nutzen die Wahrscheinlichkeit 1, alle anderen Alternativen folglich die Wahrscheinlichkeit 0. Das bedeutet, daß immer die Alternative gewählt wird, die den höchsten Nutzen hat. Das ist ein deterministisches Modell, welches streng nutzenmaximierendes Verhalten beschreibt. Damit ist es natürlich ein Extremfall. Es ist ziemlich unwahrscheinlich, daß es die Realität oft treffend beschreibt. Backhaus u.a. 2011, S. 317 ff. Abb. 7.13, S. 333 Auswahlbasierte Conjoint-Analyse – Spezifikation eines Auswahlmodells Der dem First-Choice-Modell entgegengesetzte Extremfall ist das Random-Choice-Modell. Hier sind die Auswahlwahrscheinlichkeiten für alle Alternativen gleich, unabhängig von ihrem jeweiligen Nutzen. Backhaus u.a. 2011, S. 317 ff. Abb. 7.13, S. 333 Auswahlbasierte Conjoint-Analyse – Spezifikation eines Auswahlmodells Beim Attraction-Modell verhalten sich die Auswahlwahrscheinlichkeiten proportional zu den Nutzenwerten der Alternativen. Backhaus u.a. 2011, S. 317 ff. Abb. 7.13, S. 333 Auswahlbasierte Conjoint-Analyse – Spezifikation eines Auswahlmodells Gewöhnlich findet das Logit-Choice-Modell Anwendung in der CBCA. Bei mehr als zwei Alternativen erweitert zum Multinominalen-Logit-Choice-Modell. Durch den Parameter β läßt sich das Modell flexibel an das unterschiedliche Auswahlverhalten von Personen anpassen. Der Parameter β läßt sich als Rationalitätsparameter interpretieren. β→ ∞ Das nähert das Modell dem Max-Utility-Modell an π½→0 Das nähert das Modell dem Random-Choice-Modell an Backhaus u.a. 2011, S. 317 ff. Abb. 7.13, S. 333 Auswahlbasierte Conjoint-Analyse – logistische Funktion Der Wertebereich der abhängigen Variable y liegt zwischen 0 und 1, so daß sich das Modell zur Darstellung von Wahrscheinlichkeiten eignet. Backhaus u.a. 2011, S. 317 ff. Abb. 7.14, S. 335 Auswahlbasierte Conjoint-Analyse – binäres Logit-ChoiceModell Zeigt den gleichen Verlauf wie die logistische Kurve. Der Einfachheit halber ist hier auf den Parameter β und den Index i verzichtet worden. Backhaus u.a. 2011, S. 317 ff. Abb. 7.15, S. 335 Auswahlbasierte Conjoint-Analyse – binäres Logit-ChoiceModell Nehmen wir an, daß u2 gegeben ist und variieren wir u1, dann zeigt der Verlauf in der Abbildung die resultierenden Wahrscheinlichkeiten für die Wahl von Alternative 1 an. 0,73 Gilt z.B. u2 = 5 und u1 = 6, dann erhält man für die Alternative 1 die Wahrscheinlichkeit prob (1β«Χβ¬2) = π6 π 6 +π 5 = 1 1+ π −[6−5] 1 2 3 4 5 6 7 8 9 10 = 0,73 und damit für die Alternative 2 prob (2β«Χβ¬1) = 1 - prob (1β«Χβ¬2) Das binäre Logit-Choice-Modell läßt sich linearisieren. =0,27 Dadurch läßt es sich leicht schätzen. Backhaus u.a. 2011, S. 317 ff. Abb. 7.15, S. 335 Auswahlbasierte Conjoint-Analyse – Eigenschaften des binären Logit-Choice-Modells 1 Die Wahrscheinlichkeit für die Wahl einer Alternative ist abhängig von ihrem Nutzen und den Nutzen der übrigen Alternativen. 2 Die Wahrscheinlichkeiten sind nur abhängig von den Differenzen der Nutzenhöhen, nicht von den absoluten Höhen der Nutzen. 3 Wenn zwei Alternativen einander sehr ähnlich sind, dann wirken schon kleine Änderungen der Nutzenwerte stark auf die Wahrscheinlichkeiten. Bei großen Nutzenunterschieden wirken sich dagegen kleinere Änderungen nur geringfügig aus. 4 Das Verhältnis der Wahrscheinlichkeiten von zwei Alternativen ist unabhängig davon, ob eine dritte Alternative im Choice-Set enthalten ist oder nicht (Constant Ratio Rule). Da im Beispiel die None-Option nicht gewählt wurde, kann das binäre Logit-Modell verwendet werden. Backhaus u.a. 2011, S. 336 Da im Beispiel die None-Option nicht gewählt wurde, kann das binäre Logit-Modell verwendet werden. In der ersten Auswahlsituation wurden folgende Alternativen präsentiert: k = 1 (Papier / € 1,00) k = 4 (Becher / € 1,30) Die Wahrscheinlichkeit für die Wahl des Bechers ergibt sich damit: ππππ 4 β«Χβ¬1 = 1 1 + π −(π’4 −π’1) Backhaus u.a. 2011, S. 337 CBCA – Anwendung des binären Logit-Modells Anstelle der Gesamtnutzenwerte lassen sich auch die Nutzenfunktionen bzw. die Teilnutzen in das Logit-Modell einsetzen. Für die Alternativen unseres Beispiels sind sie oben wie folgt angegeben: ππππ 4β«Χβ¬1 = u1 = b11 + b21 Papier / € 1,00 u2 = b11 + b22 Papier / € 1,30 u3 = b12 + b21 Becher/ € 1,00 u4 = b12 + b22 Becher / € 1,30 u5 = b31 None-Option 1 1 + π −(π’4 −π’1) = 1 1 + π− π12+π22 −(π11+π 21) Formel 7.12 Damit diese und die übrigen Wahrscheinlichkeiten berechnet werden können, müssen jetzt nur noch die Teilnutzen geschätzt werden. Backhaus u.a. 2011, S. 337 CBCA - Schätzung der Nutzenwerte Das Logit-Choice-Modell läßt sich vereinfacht beschreiben als eine Funktion prob(k) = ππ π’1 , … , π’πΎ Mit π’π = ππ’ πππ j=1, … , J; m=1, … , M (k =1, … , K) (Nutzenmodell) Zu schätzen sind die Teilnutzen bjm. Leider sind Werte für die Wahrscheinlichkeit prob(k) nicht beobachtbar. Es gibt also keine Beobachtungswerte. Es liegen nur Auswahldaten vor. Die besitzen nominales Skalenniveau, kein metrisches oder ordinales Skalenniveau. Daher kann die Regressionsanalyse und die Kleinst-Quadrate-Methode keine Anwendung finden. Deshalb muß hier zur sogenannten Maximum-Likelihood-Methode gegriffen werden. Im Prinzip werden mit dieser Methode die Schätzwerte für die unbekannten Parameter so bestimmt, daß die realisierten Daten (die getroffenen Auswahlentscheidungen) eine maximale Plausibilität erlangen. Die unbekannten Teilnutzenwerte sind so zu schätzen, daß sich die beobachteten Wahlentscheidungen möglichst plausibel erklären lassen. Backhaus u.a. 2011, S. 337 f. CBCA - Schätzung der Nutzenwerte Das ist der Fall, wenn Wahrscheinlichkeit für die jeweils gewählte Alternative k in einer bestimmten Auswahlsituation r möglichst groß wird. Das muß natürlich für alle Auswahlsituationen gelten. Damit läßt sich die folgende Likelihood-Funktion L formulieren: π πΎ πππππ (π)πππ → πππ₯! πΏ= π=1 π=1 Für die praktische Berechnung ist es von Vorteil, die Wahrscheinlichkeiten zu logarithmieren. Dadurch erhält man die sogenannte Log-Likelihood-Funktion LL π πΎ πΏπΏ = ln πππππ π ∗ πππ → πππ₯! π=1 π=1 Da der Logarithmus eine streng monoton steigende Funktion ist, führt die Maximierung beider Funktionen zum selben Ergebnis. Backhaus u.a. 2011, S. 338 Anstelle der Produkte in der Likelihood-Funktion erhält man in der Log-Likelihood-Funktion Summen. Das vereinfacht die Berechnung. CBCA - Schätzung der Nutzenwerte Das Schätzproblem der CBCA läßt sich damit unter Verwendung der beschriebenen Modelle wie folgt darstellen: π πΎ ln πππππ π β« πΧβ¬′ ∈ πΆππ πΏπΏ = ∗ πππ → πππ₯! π=1 π=1 mit πππππ π β« πΧβ¬′ ∈ πΆππ = π½ 1 1+ π′≠π∈πΆππ π −[π’π −π’ ′ ] π (Choice-Modell) ππ π’π = πππ ∗ π₯πππ π=1 π=1 (Nutzenmodell) Die Teilnutzen sind so zu bestimmen, daß LL maximal wird. LL kann nur negative Werte annehmen, da der Logarithmus einer Wahrscheinlichkeit negativ ist. Die Maximierung von LL bedeutet also, daß man dem Wert 0 möglichst nahe kommt. LL = 0 würde sich ergeben, wenn für alle gewählten Alternativen die Wahrscheinlichkeit gleich 1 wäre und gleichzeitig für alle nicht gewählten Alternativen die Wahrscheinlichkeit gleich 0 wäre. Backhaus u.a. 2011, S. 338 CBCA – Verlauf der LL-Funktion eines Teilnutzens bjm = 4 Hier ist das Maximum LL = - 3,8 bei bjm = 5,6 5,6 LL = -8,1 Die Abbildung veranschaulicht den Verlauf von LL bei Variation eines einzelnen Teilnutzens bjm bei Konstanz der übrigen Teilnutzen. Zur Auffindung eines globalen Optimums ist allerdings die simultane Anpassung aller Teilnutzen erforderlich. Backhaus u.a. 2011, S. 317 ff. Abbildung 7.16, S. 339 CBCA - Schätzung der Nutzenwerte Die Lösung des Optimierungsproblems erfordert die Anwendung iterativer Algorithmen. Leider bieten diese Algorithmen grundsätzlich keine Gewähr dafür, ein globales Optimum zu finden. Andererseits wurde von McFadden gezeigt, daß die Log-Likelihood-Funktion konkav ist. Das erleichtert die Optimierung. Der Anwender muß Startwerte festlegen. Von der mehr oder weniger geschickten Wahl der Startwerte hängt die Rechenzeit ab. Backhaus u.a. 2011, S. 317 ff. CBCA - Rechnerische Umsetzung des Beispiels mit MS Excel Die folgenden Schritte müssen durchgeführt werden: a) b) c) d) e) f) Transformation der Daten Ermittlung von Startwerten Berechnung der Gesamtnutzenwerte Berechnung der Auswahlwahrscheinlichkeiten Prognose von Auswahlentscheidungen Maximum-Likelihood-Schätzung Mit Ausnahme von a) und e) sind die Schritte aber schon behandelt worden. Backhaus u.a. 2011, S. 340 CBCA – binäre Codierung der Daten (Auswahlentscheidungen) In der Likelihood-Funktion tauchen die empirischen Daten (die Auswahlentscheidungen drk ) in binärer Form auf. Daher müssen zuerst die vorliegenden Daten (die 12 Auswahlentscheidungen) in binäre Dummy-Variablen drk transformiert werden. Da in einer Auswahlsituation nur eine Alternative gewählt werden kann, müssen die Summen in den Zeilen jeweils 1 ergeben. Backhaus u.a. 2011, S. 317 ff. Abb. 7.17, S. 341 CBCA - Ermittlung von Startwerten Für die Ermittlung sinnvoller Startwerte benötigt man eine Heuristik. Hier sei die folgende verwendet: Wir zählen für jede Eigenschaftsausprägung, wie oft sie unter den gewählten Stimuli vorkommt. Dies geht wie folgt aus den Spaltensummen der vorstehenden Tabelle (Abb. 7.17) hervor: Papier b11 =2+0=2 Becher b12 = 6 + 4 = 10 € 1,00 b21 =2+6=8 € 1,30 b22 =0+4=4 Backhaus u.a. 2011, S. 341 CBCA - Ermittlung von Startwerten Papier b11 =2+0=2 Becher b12 = 6 + 4 = 10 € 1,00 b21 =2+6=8 € 1,30 b22 =0+4=4 In der Conjoint-Analyse ist es üblich, die Teilnutzenwerte für jede Eigenschaft so zu normieren, daß sie sich zu Null summieren (Reparametrisierungsbedingung) π πππ = 0 π=1 Die obigen Werte sind daher wie folgt zu transformieren: πππ β πππ − ππ. Die Mittelwerte sind : b1 = 6 und b2 = 6 - also ergibt sich: Für die None-Option sei ein Wert kleiner als der kleinste Teilnutzenwert gewählt, z.B. b3 = -10 Papier 2 – 6 = -2 Becher 10 – 6 = 4 € 1,00 8–6=2 € 1,30 4–4=0 Backhaus u.a. 2011, S. 341 f. CBCA – Berechnung der Gesamtnutzen für die Startwerte Durch Einsetzen der obigen Teilnutzenwerte in das Nutzenmodell (Formel 7.16) erhält man die Gesamtnutzenwerte für die Stimuli. Die folgende Tabelle zeigt die Berechnung der Gesamtnutzen mit Hilfe der binären Kodierung der Stimuli (vgl. Abb. 7.12) Backhaus u.a. 2011, S. 317 ff. Abbildung 7.18, S. 342 Auswahlbasierte Conjoint-Analyse – Berechnung der Auswahlwahrscheinlichkeiten Die Tabelle enthält die Auswahlwahrscheinlichkeiten, die sich für die Startwerte ergeben. Jede Zelle des Exel-Tableaus enthält das Choice-Modell gemäß Formel 7.16 und greift auf die Gesamtnutzenwerte der vorherigen Tabelle (Abb. 7.18)) zu, die mit den Teilnutzenwerten verlinkt sind. Backhaus u.a. 2011, S. 317 ff. Abb. 7.19, S. 342 Auswahlbasierte Conjoint-Analyse – Berechnung der Auswahlwahrscheinlichkeiten ππππ 4β«Χβ¬1,5 = = 1 1 + π − π’4−π’1 + π −[π’4−π’5] 1 1 + π − 2+2 + π −[2+10] 1 = 1+0,02+0,00 = 0,98 Backhaus u.a. 2011, S. 342 Auswahlbasierte Conjoint-Analyse – prognostizierte Wahl und Trefferquote Es wird in einer Auswahlsituation r diejenige Alternative k gewählt werden, für die die Auswahlwahrscheinlichkeit am größten ist. Das ist eine Ex-Post-Prognose der Auswahl, der hier die tatsächliche Wahl gegenübergestellt wird. Verwendet wurden hier die Auswahlwahrscheinlichkeiten aus Abbildung 7.19. Das zeigt, daß bereits mit der einfachen Heuristik eine recht hohe Trefferquote erzielt worden ist. Wären alle Startwerte auf 0 gesetzt worden, hätte sich eine Trefferquote von 17,6% ergeben. Durch die Optimierung läßt sich die Trefferquote noch verbessern. Backhaus u.a. 2011, S. 317 ff. Abb. 7.20, S. 343 Auswahlbasierte Conjoint-Analyse – Maximum-LikelihoodSchätzung Dies sind die logarithmierten Wahrscheinlichkeiten, berechnet für die Startwerte. Unten rechts steht der Log-Likelihood-Wert LL = -8,1. Die Startwerte sind jetzt so zu verbessern, daß LL maximal wird (also 0 näher kommt). Dies wird über ein Optimierungsprogramm erreicht – hier wird der Excel-Solver eingesetzt. Zielzelle wird dabei die mit dem LL-Wert. Verändert werden die Startwerte. Backhaus u.a. 2011, S. 317 ff. Abb. 7.21, S. 344 Auswahlbasierte Conjoint-Analyse – Berechnung der Gesamtnutzen nach Optimierung der Teilnutzen Diese Tabelle zeigt nun das Ergebnis nach dem iterativen Optimierungsprozeß. LL ist mit -3,8 deutlich näher als 0 als in der Konstellation mit den Startwerten. Startwerte Papier 2 – 6 = -2 Becher 10 – 6 = 4 € 1,00 8–6=2 € 1,30 4–4=0 Hier war der Startwert 4 LL wurde von -8,1 auf -3,8 verbessert Backhaus u.a. 2011, S. 317 ff. Abb. 7.22, S. 345 Auswahlbasierte Conjoint-Analyse – Auswahlwahrscheinlichkeiten nach Optimierung der Teilnutzen Diese Tabelle zeigt die Auswahlwahrscheinlichkeiten, die zu den optimalen Werten gehören. Die Trefferquote hat sich im Beispiel nicht erhöht, trotz der Verbesserung der Nutzenwerte und Wahrscheinlichkeiten. Backhaus u.a. 2011, S. 317 ff. Abb. 7.23, S. 345 Interpretation NoneOption Verpackung Papier Becher Preis in € Teilnutzenwerte b11 = -5,614 b12 = 5,614 1,00 1,30 b21 = 5,267 b22 = -5,267 Der Becher hat einen höheren Nutzenwert als die Papiertüte. € 1,00 hat einen höheren Nutzenwert als € 1,30. b31 = -22,35 Ich würde auch lieber nur 1,-- € zahlen. Die einzelnen Zahlen haben keinen Aussagewert. Es kommt lediglich auf die Unterschiede zwischen den Teilnutzenwerten einer Eigenschaft an. Der Becher hat einen höheren Nutzenwert als die Papiertüte. € 1,00 hat einen höheren Nutzenwert als € 1,30. Wir bilden nun die Differenzen: Backhaus u.a. 2011, S. 346 f. None-Option Verpackung Papier Becher Interpretation Preis in € Teilnutzenwerte b11 = -5,614 b12 = 5,614 1,00 1,30 b21 = 5,267 b22 = -5,267 Becher - Papier b12 – b11 5,614 – (-5,614) = 11,23 € 1,30 - € 1,00 b22 – b21 -5,267 – 5,267 = -10,53 b31 = -22,35 Der Vorteil, der sich für einen Konsumenten aus dem Becher ergibt, ist größer als der Nachteil aus dem höheren Preis. Papier / € 1,00 : u1 = b11 + b21 - 5,614 + 5,267 = -0,35 Becher / € 1,30 : u4 = b12 + b22 5,614 + (-5,267) = 0,35 Aus den Nutzenwerten resultieren unter Vernachlässigung der None-Option die folgenden Auswahlwahrscheinlichkeiten Es würde also bei einem 1 1 1 ππππ 4β«Χβ¬1 = 1+π − π’1−π’4 = 1+π − −0,35−0,35 = 1+π 0,7 = 0,33 1 1 1 ππππ 1β«Χβ¬4 = 1+π − π’4−π’1 = 1+π − 0,35+0,35 = 1+π −0,7 = 0,67 gleichzeitigen Angebot der beiden Alternativen überwiegend die teurere Alternative gewählt. Backhaus u.a. 2011, S. 346 Modifikationen der CBCA Bei qualitativen Eigenschaften ist das Teilwert-Modell nicht zu umgehen. Im Beispiel liegt aber eine qualitative Eigenschaft vor und eine quantitative. Der Nutzenverlauf des Preises läßt sich auch mit dem Vektor-Modell abbilden. Dadurch könnte die Interpretation der Ergebnisse verbessert werden. Es hätte auch Vorteile für die Prognose. Es wäre natürlich naheliegend, die Datenerhebung zu verbessern, indem mehr als die zwei Alternativen (€ 1,00 und € 1,30) abgefragt werden. Dadurch würde sich die Zahl der zu schätzenden Parameter nicht erhöhen. Dann könnten auch individuelle Nutzenschätzungen durchgeführt werden. Backhaus u.a. 2011, S. 347 CBCA - Modifikation des Nutzenmodells π½ ππ π’π = π½′ πππ ∗ π₯πππ + π=1 π=1 π½π ∗ π₯π π=π½+1 xjmk ist eine Dummy-Variable, die die Ausprägung der qualitativen Eigenschaft j (j = 1 .. J) angibt. xj ist eine metrische Variable, die die Ausprägung der quantitativen Variable angibt. Mit βj sind die Koeffizienten der metrischen Variable bezeichnet. Bei nur je einer qualitativen und quantitativen Eigenschaft vereinfacht sich die Formel zu: π’π = ππ + π½ ∗ π₯ mit k = 1, … , K und K = M (Formel 7.20) Die K Stimuli sind jetzt eindeutig durch die M Ausprägungen der qualitativen Eigenschaft definiert. Bei Einbeziehung der None-Option ergeben sich K = M + 1 Stimuli. Backhaus u.a. 2011, S. 347 CBCA Für die Formel 7.20 können wir auch schreiben: π π’π = π½ ∗ ( π½π + π₯) oder, da die Skala der Teilnutzenwerte nicht festgelegt ist: π π’π = π½ ∗ (ππ +π₯) mit ππ β π½π Setzen wir jetzt x = -P, so erhält man die Nutzenfunktion π’π = π½ ∗ (ππ −ππ ) Dies läßt sich interpretieren als der Nettonutzen eines Produktes k zum Preis Pk Durch Einsetzen dieser Nutzenfunktion in das Choice-Modell der CBCA (gemäß 7.16) erhält man: Backhaus u.a. 2011, S. 347 f. CBCA - Logit-Preismodell ππππ π β« πΧβ¬′ ∈ πΆππ = = 1 1+ π′≠π∈πΆππ π −[π’π −π’π′ ] 1 1+ π′≠π∈πΆππ π (Formel 7.24) −π½∗[(π½π −ππ )−π½∗(ππ′ −ππ′ )] Nach Umformung von 7.24 erhält man das folgende Modell, das wir als Logit-Preismodell bezeichnen: = 1 1+ π′≠π∈πΆππ (Formel 7.25) π −π½∗[ ππ −ππ′ +(ππ′ −ππ )] Die Wahlwahrscheinlichkeit eines Produktes in einem Choice Set r ist abhängig von den Nutzendifferenzen und den Preisdifferenzen gegenüber allen anderen Produkten im Choice Set. Im Unterschied zum Teilwertmodell gehen die Preise wertmäßig in das LogitPreismodell ein. Die erhaltenen Nutzenwerte sind daher automatisch in den Geldeinheiten skaliert. Die Ergebnisse der CBCA sind daher der Interpretation leicht zugänglich. Backhaus u.a. 2011, S. 348 CBCA – das binäre Logit-Preismodell Bei nur zwei Produkten (und Vernachlässigung der None-Option) reduziert sich das Modell zu einem binären LogitModell, das hier grafisch dargestellt ist. Becher Papiertüte (Formel 7.26) Die Abbildung gibt den Verlauf der Wahrscheinlichkeit für die Wahl der Becherverpackung gegenüber der Papierverpackung in Abhängigkeit von den Nutzenwerten der Produkte und ihren Preisen an. Backhaus u.a. 2011, S. 317 ff. Abb. 7.24, S. 349 CBCA Die Wahrscheinlichkeit für die Wahl des Bechers ist umso höher, je • größer der Nutzen des Bechers • niedriger der Preis des Bechers • niedriger der Nutzen der Papiertüte • höher der Preis der Papiertüte Übersteigt der Nutzen des Bechers den der Papiertüte um den gleichen Betrag, um den der Becher teurer ist als die Papiertüte, dann gilt: (π2 −π1 ) = (π2 − π1 ) bzw. (π2 −π1 ) + (π1 − π2 ) = 0 und man erhält damit eingesetzt in 7.26 (das ist die Formel in der Grafik auf der vorherigen Seite) 1 ππππ 2 β«Χβ¬1 = 1+π −π½∗[0] = 0,5 Wenn also der Nutzenvorteil des Bechers durch seinen Preisnachteil kompensiert wird, dann besteht Indifferenz zwischen den Angeboten, die Auswahlwahrscheinlichkeit ist dann jeweils 50%. Backhaus u.a. 2011, S. 349 CBCA Spiegelbildlich ergibt sich für die Wahrscheinlichkeit der Wahl der Papiertüte gegenüber dem Becher ππππ 1β«Χβ¬2 = 1 1 + π −π½∗[ π1 −π2 +(π2 −π1 )] Die Bezugs-Formel ist auch 7.26, die in der Grafik mit der Wahrscheinlichkeitskurve. Backhaus u.a. 2011, S. 350 CBCA – Beispiels-Daten zum Logit-Preismodell Dies ist nun der Datensatz für die Anwendung des Logit-Preismodells, der sich gegenüber Abb. 7.9 vereinfacht hat. Inhaltlich sind die Daten in den Abb. 7.9 und 7.25 identisch. Damit vereinfacht sich auch das Erhebungsdesign. Abgesehen von der None-Option haben wir nur noch zwei Alternativen, die beiden Verpackungsarten. Die Preise können jetzt zwischen den Auswahlsituationen beliebig variieren, ohne daß sich die Struktur des Erhebungsdesigns bzw. des Modells ändert. Backhaus u.a. 2011, S. 317 ff. Abb. 7.25, S. 350 CBCA – Ergebnis für das Beispiel zum Logit-Preismodell Die Schätzung des Logit-Preismodells mittels Maximum-Likelihood-Methode liefert folgende Werte: b1 = -0,16 Nutzenwert des Futters in der Papiertüte b2 = 0,16 Nutzenwert des Futters im Becher β = 27,6 Differenz = 0,32 € Auch hier ist wieder nur einer der beiden Nutzenwerte zu schätzen, da sich der andere durch die Reparametrisierungsbedingung (b1 + b2 = 0) ergibt. Für die Nutzendifferenz zwischen den Verpackungen können wir jetzt angeben, daß sie € 0,32 beträgt. Backhaus u.a. 2011, S. 317 ff. Abb. 7.26, S. 351 CBCA – Logit-Preismodell Für die Wahl des Bechers erhält man mit obigen Werten die folgende Wahrscheinlichkeitsfunktion: ππππ 2β«Χβ¬1 = = 1 1 + π −π½∗[ π2 −π1 +(π1 −π2 )] (Bezug ist Formel 7.26) 1 1 + π −27,6∗[ 0,16+0,16 +(π1 −π2 ] Setzen wir für das Futter in Papierverpackung einen Preis von € 1,00 und für die Becherverpackung € 1,30, so erhalten wir: ππππ 2β«Χβ¬1 = 1 1 + π −27,6∗[ 0,16+0,16 +(1,00−1,30)] = 0,67 Das Logit Preismodell liefert dieselben Wahrscheinlichkeiten wie das oben verwendete Teilwert-Modell. Das Modell ist aber anschaulicher geworden und seine Praktikabilität hat sich erhöht. Wir können nämlich jetzt Wahrscheinlichkeiten für beliebige Preise berechnen. Backhaus u.a. 2011, S. 350 f. CBCA – Preis-Response-Funktion des Bechers Wird der Preis für die Papiertüte auf € 1,15 festgelegt, erhalten wir die folgende Preisresponsefunktion, die die Wahrscheinlichkeit für die Wahl des Bechers als Funktion seines Preises angibt. Wahrscheinlichkeit der Wahl des Bechers Würde der Preis des Bechers auf € 1,45 festgelegt, wäre die Auswahlwahrscheinlich etwas größer als 0,6. Preis des Bechers Backhaus u.a. 2011, S. 317 ff. Abb. 7.26, S. 351 CBCA - Vorteile des Logit-Preismodells • relativ einfaches Erhebungsdesign • in Geldeinheiten skalierte Nutzenwerte • Möglichkeit der Ableitung einer Preis-Response-Funktion, mit der sich Kaufwahrscheinlichkeiten für beliebige PreisKombinationen berechnen lassen Backhaus u.a. 2011, S. 351 Modifiziertes Erhebungsdesign- Individualisierung der Analyse Für das Beispiel war angenommen, sechs Versuchspersonen seien je zwei Wahlentscheidungen abverlangt worden. Man könnte jeder Person eine höhere Anzahl von Wahlentscheidungen abverlangen. Im Beispiel wäre das problematisch, weil die Informationen redundant würden, denn das Choice-Set ist stark eingeschränkt. Die Fragen würden sich wiederholen. Wenn aber die Preise stärker variiert würden, wäre das denkbar. Bei Anwendung des Teilwert-Modells würde sich dadurch die Anzahl der zu schätzenden Parameter erhöhen, aber im Logit-Preismodell wäre es unproblematisch. Bei diesem Modell können wir die abgefragten preise variieren, ohne eine höhere Zahl von Parametern schätzen zu müssen. CBCA - Datensatz 2: Eine Person, 12 Auswahlsituationen Wir nehmen an, einer Person seien zwölf Alternativen angeboten worden. Beispiel wie oben, aber stärker variierte Preise. 1= Papiertüte 2= Becher 3= Non-Option Non-Option Non-Option Weil auch die Non-Option gewählt wurde, müssen wir ein multinominales Modell schätzen statt eines binären. 1,00 bis 1,40 1,00 bis 1,60 statt nur 1,00 oder 1,30 Backhaus u.a. 2011, S. 317 ff. Abb. 7.27, S. 353 CBCA – Logit-Preismodell individualisiert Das Individuelle Logit-Preismodell lautet: π −π½π∗(πππ −ππ ) −π½π (πππ −ππ ) π∈πΆππ π ′ ππππ π β«= πππΆ ∈ πΧβ¬ = mit πππ : ππ’π‘π§ππ π£ππ π΄ππ‘πππππ‘ππ£ππ π πüπ ππππ ππ π π½π : π ππ‘πππππππ‘äπ‘π πππππππ‘ππ πüπ ππππ ππ π ππ : πππππ π£ππ π΄ππ‘πππππ‘ππ£π π 1 1+ π′≠π∈πΆππ π −π½∗[(πππ −ππ )−(πππ′ −ππ′ )] Für die Non-Option setzen wir einen Preis von Null. Die Schätzung mit der Maximum-Likelihood-Methode liefert die Daten aus Abb. 7.27 folgende Werte: b1 = -0,19 b2 = 0,19 b3 = -1,39 β = 30 Die Nutzendifferenz zw. Papier und Becher beträgt für die Versuchsperson € 0,38. Das Futter im Becher zu kaufen, ist ihr € 0,38 wert. Backhaus u.a. 2011, S. 353 CBCA Mit Hilfe des geschätzten Nutzenwertes für die non-Option lassen sich jetzt auch die absoluten Nutzenwerte für die Produkte angeben. Dazu wird der Nullpunkt der monetären Nutzenskala so verankert, daß die Non-Option den Nutzenwert Null erhält. Dazu addieren wir –b3 = 1,39 zu allen Nutzenwerten. b1 = € 1,20 Nutzenwert des Futters in der Papiertüte = - 0,19 + 1,39 = 1,20 b2 = € 1,58 Nutzenwert des Futters im Becher = 0,19 + 1,39 = 1,58 b3 = 0,00 Nutzenwert der Non-Option = - 1,39 + 1,39 = 0 Auf die Wahrscheinlchkeiten des Logit-Modells hat diese Skalenverschiebung keinen Einfluß. Die neuen Nutzenwerte (oben) lassen sich jetzt als Zahlungsbereitschaften der Testperson für die Produkte interpretieren. Damit die Zahlungsbereitschaften mittel CBCA ausgelotet werden können, ist es nötig, die Preise so zu variieren, daß auch die Non-Option gewählt wird. Die Testperson hat hier sehr konsistent gewählt. Die Trefferquote beträgt 91,7%. 100% konsistentes Verhalten kann man nicht erwarten. Das Modell liefert auch nur Wahrscheinlichkeiten. Backhaus u.a. 2011, S. 354 CBCA Für die Wahl des Bechers erhält man mit den Werten des Beispiels folgende Wahrscheinlichkeitsfunktion: πππππ 2 β«Χβ¬3,1 = = 1 1 + π −π½π ∗ ππ2 −π2 − ππ1 −π1 + π −π½π ∗ ππ2 −π2 − ππ3 −π3 1 1 + π −30∗ 0,19−π2 − −0,19−π1 + π −30∗ 0,19−π2 − −1,39−π3 Wird der Preis der Papiertüte auf € 1,15 fixiert und den der Non-Option auf Null angenommen, ergibt sich die folgende Preis-Response-Funktion: = 1 1 + π −30∗ 0,19−π2 − −0,19−1,15 = + π −30∗ 0,19−π2 − −1,39−0 1 1 + π −30∗[1,53−π2] + π −30∗[1,58−π2] Backhaus u.a. 2011, S. 354 CBCA – individuelle Preis-Response-Funktion des Bechers Wahrscheinlichkeit der Wahl des Bechers Preis des Bechers Mit der Erhöhung des Preises des Bechers sinkt nicht nur die Wahrscheinlichkeit der Wahl des Bechers, sondern gleichzeitig steigt die Wahrscheinlichkeit der Wahl der Papiertüte. Gleichzeitig steigt bei hohen Preisen von Becher und Tüte auch die Wahrscheinlichkeit für die Wahl der Non-Option. Backhaus u.a. 2011, S. 317 ff. Abb. 7.28, S. 355 CBCA - Auswahlwahrscheinlichkeiten In dieser Grafik sind daher alle drei Kurven eingetragen, die sich an jeder Stelle zu 1,0 addieren. Wahrscheinlichkeit Ist der Preis des Bechers höher als ca. €1,53, wird die Wahl der Papiertüte zu € 1,15 wahrscheinlicher als die Wahl des Bechers. Preis des Bechers Backhaus u.a. 2011, S. 317 ff. Abb. 7.29, S. 355 CBCA - Marktsimulationen Führt man eine CBCA mit einer repräsentativen Stichprobe durch, lassen sich durch Aggregation der individuellen Preisresponsefunktionen Marktsimulationen durchführen. So kann man ermitteln, wie der Preis eines Produktes auf die mengenmäßige Nachfrage wirkt. Auch die Wirkung auf die Nachfrage nach den konkurrierenden Produkten kann ermittelt werden. Umgekehrt natürlich auch (Wirkung des Preises des Konkurrenzprodukts auf die nachgefragte Menge des Produkts) Backhaus u.a. 2011, S. 356 CBCA - Disaggregation der Nutzenwerte Sie haben also eine CBCA durchgeführt. Wie homogen sind denn die Nutzenvorstellungen der Befragten? Der Hinweis des Professors könnte wichtig sein. Ich müßte nach einem Verfahren suchen, das mir die Berücksichtigung von Heterogenität erlaubt. Im vorstehenden Beispiel ist zwar eine individuelle Nutzenfunktion geschätzt worden, für die CBCa ist es aber typisch, daß aggregierte Analysen vorgenommen werden. Für individuelle Analysen stehen typischerweise zu wenig Informationen zur Verfügung. Deshalb muß die Heterogenität ggf. in einem zweiten Schritt berücksichtigt werden. Das folgende Beispiel zeigt, daß Heterogenität eine große Bedeutung besitzen kann. Backhaus u.a. 2011, S. 356 CBCA – gruppenspezifische und aggregierte Nutzenfunktionen Wir sehen hier das Ergebnis einer CBCA für Margarine. Über alle Befragten ist das Ergebnis aggregiert. Die Kunden wurden befragt nach den Preis, nach dem Geschmack und nach der Marke. Ergebnis: 1. Je billiger, desto lieber wird die Margarine genommen. 2. Geschmack nach Butter wird stark bevorzugt. 3. Die Marke RAMA wird stark bevorzugt. Die größte Bedeutung scheint dem Preis zuzukommen. Preis Geschmack Marke Dies kann jedoch Durch die Aggregation zustandekommen, wie die folgende Abbildung zeigt. Backhaus u.a. 2011, S. 317 ff. Abb. 7.30, S. 357 CBCA – gruppenspezifische und aggregierte Nutzenfunktionen Das Befragungsergebnis ist durch die Befragung von zwei Gruppen unterschiedlicher Größe zustandegekommen. Die Gruppe der überzeugten RAMA-Käufer war deutlich größer als die der überzeugten LÄTTa-Käufer. Dadurch wurde durch die Aggregation die große Bedeutung der Marke für die Kaufentscheidung verdeckt. Backhaus u.a. 2011, S. 317 ff. Abb. 7.30, S. 357 CBCA – Formen der Disaggregation von Nutzenschätzungen Die aus dem Margarine-Beispiel zu ziehende Lehre ist, daß man die Nutzenschätzungen besser segmentiert durchführen sollte, wenn Heterogenität zu erwarten ist. Die Frage ist natürlich: Wie bildet man die Segmente? Innerhalb der Segmente sollten die Präferenzen der Befragten möglichst ähnlich sein. Zwischen den Segmenten sollten deutliche Unterschiede bestehen. Backhaus u.a. 2011, S. 317 ff. Abb. 7.31, S. 358 CBCA – A priori Segmentierung Im Beispiel wäre es möglich, die Befragten in zwei Gruppen zu trennen: 1. die, die überwiegend das Produkt RAMA gewählt haben 2. die, die überwiegend das Produkt LÄTTA gewählt haben Die Häufigkeiten, mit denen etwas gewählt wird, sind nicht immer für die Segmentierung hilfreich. Man weiß ja nicht vorher, welche Merkmale große Bedeutung besitzen. Man kann auch Clusteranalysen durchführen. Backhaus u.a. 2011, S. 317 ff. CBCA - Latent-Class-Ansatz zur Segmentierung Wenn ich mir die Befragten so anschaue, kann ich auf Anhieb keine Unterschiede erkennen, nach denen ich sie einzelnen Gruppen zuordnen könnte. Die Befragten Wahrscheinlichkeit 0,3 Wahrscheinlichkeit 0,7 Gruppe 1 Gruppe 2 Beim Latent-Class-Ansatz geht man davon aus, daß in einer Stichprobe von Befragten eine bestimmte Anzahl nicht direkt beobachtbarer Gruppen existiert. Im Unterschied zur A priori Segmentierung wird jeder Befragte nicht genau einer Gruppe zugerechnet, sondern er wird mit einer gewissen Wahrscheinlichkeit den Gruppen zugeordnet. So gehen seine Antworten in die Berechnungen für mehrere Gruppen ein, aber gewichtet. Die Zuordnung erfolgt simultan mit der Nutzenschätzung. Man nennt das auch ein Mischverteilungsmodell (Finite-Mixture-Model). Backhaus u.a. 2011, S. 358 f.