Vorlesung Marktforschung Erhebungsmethoden und Messtheorie Sommersemester 2010 TU Berlin, Lehrstuhl Marketing Prof. Dr. V. Trommsdorff, Sekr. WIL-B-3-1, Wilmersdorfer Straße 148, 10585 Berlin, Tel: +49.(0)30.314-29.922, www.marketing-trommsdorff.de Technische Universität Berlin Lehrstuhl Marketing Professor Dr. Volker Trommsdorff Agenda • Fortsetzung Erhebungsmethoden • Marktforschung-Projektplanung • Stichprobenplanung • Befragung • Skalierung • Datenaufbereitung und Datenanalyse • Einfache Statistiken • Univariate Statistiken • Bivariate Statistiken • Signifikanztest • Prüfstatistik Technische Universität Berlin Lehrstuhl Marketing Professor Dr. Volker Trommsdorff Marktforschung – Erhebungsmethoden und Messtheorie 2 Erhebungsmethoden Marktforschungs-Projektablauf Problem Problemdefinition Design Hypothesenbildung Operationalisierung nach Subjekten nach Konstrukten nach Objekten Stichproben Indikatoren Fragebogen Erhebung Datengewinnung Bereinigung Datensatz Datenanalyse Exploration Konfirmation Interpretation Bericht Technische Universität Berlin Lehrstuhl Marketing Professor Dr. Volker Trommsdorff Marktforschung – Erhebungsmethoden und Messtheorie 3 Erhebungsmethoden Stichprobenplanung Bestimmung der Grundgesamtheit, über die ausgesagt werden soll Stichprobenzielwerte (Aussageneinheiten und Toleranzen) Festlegung des Stichprobenumfangs Auswahlbasis (Repräsentationsmenge für die Auswahl) Auswahlverfahren (Quota, Random, Schichtung etc.) Planung und Durchführung der Auswahl Technische Universität Berlin Lehrstuhl Marketing Professor Dr. Volker Trommsdorff Marktforschung – Erhebungsmethoden und Messtheorie 4 Erhebungsmethoden Auswahlverfahren für repräsentative Teilerhebung Repräsentative Stichproben zufällig („Random“) einfach Klumpen gesteuert („Quota“) geschichtet Quota typisch Fokus Technische Universität Berlin Lehrstuhl Marketing Professor Dr. Volker Trommsdorff Marktforschung – Erhebungsmethoden und Messtheorie 5 Erhebungsmethoden Kennzeichen der Quotenauswahl • Verteilung bestimmter Merkmale in der Grundgesamtheit bekannt • Repräsentativität durch Vorgabe von Quoten gemäß dieser Verteilung • Interviewer sucht Auskunftspersonen nach Quoten, nicht nach Adressen Vorteile • einfach und billig • gute Ergebnisse • in Praxis akzeptiert Nachteile • Qualität hängt von Durchführung ab • Interviewerwillkür bei der Auswahl • theoretische Fehlerberechnung unmöglich • z.T. Unkenntnis über Verteilung interessierender Merkmale in der Grundgesamtheit, dann ist eine Voruntersuchung notwendig Technische Universität Berlin Lehrstuhl Marketing Professor Dr. Volker Trommsdorff Marktforschung – Erhebungsmethoden und Messtheorie 6 Erhebungsmethoden Quotenauswahl – Schritte 1. Lege 2-4 Quotierungsmerkmale fest. z.B. Alter, Geschlecht, Berufsgruppe 2. Entscheide relevante Quotenausprägungen. z.B. 16-30J., 31-45J., 46-60J. 3. Ermittle deren Häufigkeiten aus der Statistik (unverbunden oder verbunden). z.B. 15% 16-30jährige, 6% 16-30jährige Männer 4. Bestimme entsprechende absolute Quoten für die zu ziehende Stichprobe. z.B. 150 16-30jährige Frauen, 60 1630jährige Männer 5. Stelle Quotierungspläne für die Interviewer her so, dass die Summe der quotierten Ausprägungen der angestrebten Verteilung der Stichprobe entspricht. z.B. "befragen Sie zwei 16-30-jährige Männer..." 6. Quotenkontrolle der fertigen Fragebögen: Die Stichprobe muss die Merkmalsverteilung der Grundgesamtheit aufweisen. Technische Universität Berlin Lehrstuhl Marketing Professor Dr. Volker Trommsdorff Marktforschung – Erhebungsmethoden und Messtheorie 7 Erhebungsmethoden Stichprobenumfang nicht abhängig vom Grundgesamtheitsumfang, aber von: 1. vom tolerierten Stichprobenfehler e, (e = Fehlertoleranz) in dessen Grenzen der Stichprobenmesswert vom wahren Wert abweichen darf n ~ 1/e2 2. vom Sicherheitsgrad 1-α, (α = Irrtumswahrscheinlichkeit) z.B. 99% (hoch sicher) oder 95% (sicher) Wahrscheinlichkeit der Aussage "Messwert weicht maximal um e vom wahren Wert ab“ n ~ z2 z = standardnormalverteilte Ausprägung des Messwertes z=1 für α = 68%, 2 für 95,5%, 3 für 99,7% Sicherheitsgrad 3. Der Differenziertheit der zu treffenden Aussage, d.h. von der Untergruppierung: welchen Anteil r hat die kleinste Stichprobe ni, für die der Stichprobenfehler e und der Sicherheitsgrad 1-α gelten sollen? n = r·ni, (n Vielfaches des Stichprobenumfanges ni) 4. Der (vor der Erhebung noch unbekannten) Streuung S des zu untersuchenden Merkmals in der Grundgesamtheit Sx (ggf. “konservativ” = pessimistisch schätzen) (S = Standardabweichung) Technische Universität Berlin Lehrstuhl Marketing Professor Dr. Volker Trommsdorff Marktforschung – Erhebungsmethoden und Messtheorie 8 Erhebungsmethoden Geschichtete Stichproben Schichtung heißt Ausnutzen der Clusterung von Teilstichproben (intern homogen, extern heterogen): Je besser die Trennschärfe (Korrelation von Messvariable und Schichtungsmerkmal), desto stärker der „Schichtungseffekt“ 1. Grundgesamtheit nach trennscharfen Merkmalen in Schichten aufteilen 2. Aus jeder Schicht eine eigene Stichprobe ziehen 3. Parameter der Gesamtstichprobe aus gewichteten Schichtparametern bestimmen 4. Bei effizienter Schichtung größere Genauigkeit bzw. kleinerer Stichprobenumfang Technische Universität Berlin Lehrstuhl Marketing Professor Dr. Volker Trommsdorff Marktforschung – Erhebungsmethoden und Messtheorie 9 Erhebungsmethoden Befragungsarten nach vier Kriterien Standardisierung unstrukturiert halbstrukturiert strukturiert • geschl. Fragen • Ratings • Zahlenfragen Kontaktarten brieflich telefonisch persönlich online Soziale Situation Gruppendiskussion Gruppenbefragung Einzelinterview Inhalt Demographie Fakten, Wissen Disposition Befragungstechnische Kriterien Technische Universität Berlin Lehrstuhl Marketing Professor Dr. Volker Trommsdorff Marktforschung – Erhebungsmethoden und Messtheorie 10 Erhebungsmethoden Fragebogentechnisch-funktionale Fragentypen Eisbrecher Am Anfang des Interviews zur Reduzierung von Hemmungen Puffer beim Übergang zu neuem Thema Eisbrecher/Puffer Nicht auswerten! Überrumpelung den zu erhebenden Sachverhalt als Selbstverständlichkeit unterstellen Fallgruben zur Aufdeckung unwahrer Antworten Training Einüben der antwortrelevanten Leistungsart, z.B. sich an weit zurückliegende Dinge erinnern Filter Selektion von Befragten für spezielle Zusatzfragen Gabelung für inhaltlich verschiedene parallele Subgruppenbefragungen Technische Universität Berlin Lehrstuhl Marketing Professor Dr. Volker Trommsdorff Marktforschung – Erhebungsmethoden und Messtheorie 11 Erhebungsmethoden Frageformen offen: keine Antwortvorgabe / geschlossen: mit Antwortvorgaben Ratingskalen sind eine Form der geschlossenen Frage: stimmt ganz genau stimmt überhaupt nicht Offene Frage + mehr individuelle Information Geschlossene Frage - möglicher Informationsverlust + für Explorationen + für quantitative Standard-Mafo + wenig Antwortsteuerung - spezielle Fehlertendenzen - schwer vergleichbare Antworten + geringerer Aufwand (kein Kodieren) Technische Universität Berlin Lehrstuhl Marketing Professor Dr. Volker Trommsdorff Marktforschung – Erhebungsmethoden und Messtheorie 12 Erhebungsmethoden Skalierungen in der Marktforschung - Beispiel für Rating-Skalen schlecht 1 2 3 4 5 gut gering groß stimme dagegen stimme dafür -2 -1 0 1 2 wenig gefällt mir gut J K viel L gefällt mir nicht Technische Universität Berlin Lehrstuhl Marketing Professor Dr. Volker Trommsdorff Marktforschung – Erhebungsmethoden und Messtheorie 13 Erhebungsmethoden Fragebogen zu gestalten ist keineswegs trivial – einige Regeln • verständliche Formulierung • eindeutige und präzise Fragen • keine Suggestivfragen • übersichtliche Gestaltung • “richtige” Fragen-Reihenfolge • Umfang begrenzen • keinesfalls ohne Pretest ins Feld Technische Universität Berlin Lehrstuhl Marketing Professor Dr. Volker Trommsdorff Marktforschung – Erhebungsmethoden und Messtheorie 14 Erhebungsmethoden Befragungsartefakte / Antworttendenzen Beispiel: Einstellungen zum Betreiben von Peep-Shows Die Frage wurde zwei Stichproben vorgelegt: a) mit der Formulierung “sollte man verbieten” b) mit der Formulierung “sollte man erlauben” Ergebnisse Frageversion Antworten im Sinne von... „verbieten“ „erlauben“ ... verbieten (nicht erlauben)... 28% 50% ... erlauben (nicht verbieten)... 72% 50% Summe 100% 100% Anzahl 47 38 Quelle: Hipper (1983), S. 4, vgl. auch Schumann & Presser (1981) Technische Universität Berlin Lehrstuhl Marketing Professor Dr. Volker Trommsdorff Marktforschung – Erhebungsmethoden und Messtheorie 15 Erhebungsmethoden Befragung als Kommunikationsprozess mit vier fehleranfälligen Schnittstellen S1: kodieren S2: dekodieren Frage Frager Befragter Antwort S4: dekodieren S3: kodieren Technische Universität Berlin Lehrstuhl Marketing Professor Dr. Volker Trommsdorff Marktforschung – Erhebungsmethoden und Messtheorie 16 Erhebungsmethoden Befragungsartefakt Ein Befragungsartefakt ist eine Tendenz, auf eine Frage systematisch anders zu antworten als es dem Messziel entspricht Befragungsartefakte formal erfassbar • Extremtendenz, Zentraltendenz • Ja-Sager-Tendenz • Halo-Effekt • Reihenfolge-Effekte (primacy, recency) • Gambling (Streumuster) • Skalenniveau-Verzerrung • Item-Nonresponse nur inhaltlich erfassbar • sozial-normative Erwünschtheit • Tabus • Rationalitäts-Effekt • Konsistenz-Effekt • Informiertheits-Effekt • Kooperation • Kognitive Überforderung Artefakte senken die Validität, aber sie erhöhen die Reliabilität „zuverlässig das Falsche messen“ „it is better to be roughly right than exactly wrong“! Technische Universität Berlin Lehrstuhl Marketing Professor Dr. Volker Trommsdorff Marktforschung – Erhebungsmethoden und Messtheorie 17 Erhebungsmethoden Systematische Befragungs-Fehlerquellen Interviewer Rolle Persönlichkeit Wahrnehmung Befragter Rolle Persönlichkeit Wahrnehmung Antwort Frageform Wording Kontext Struktur Skala Frageinhalt Tabus Zentralität Involvement usw. Technische Universität Berlin Lehrstuhl Marketing Professor Dr. Volker Trommsdorff Marktforschung – Erhebungsmethoden und Messtheorie 18 Erhebungsmethoden Grundlagen der Skalierung Skala: Fragenbatterie, die der Messung eines Merkmales dient Skalierung: Konstruktion und Eichung einer Skala Anforderungen an Skalen: hohes Skalenniveau / Eindimensionalität / Validität Item: Einzelfrage einer Skala Itemcharakteristiken: Skalenwert monoton nicht-monoton deterministisch probabilistisch latente Konstruktausprägung Technische Universität Berlin Lehrstuhl Marketing Professor Dr. Volker Trommsdorff Marktforschung – Erhebungsmethoden und Messtheorie 19 Erhebungsmethoden Likert-Skala Verfahren der summierten Ratings • Items sind fünfstufige Ratings • Vorgehensweise: • gleichviele “günstige” und “ungünstige” Items formulieren • je Item ein Rating • Pretest der Items • Eliminieren der “schlechten” Items • verbleibende, ca. 10-30 Items, den Befragten vorgeben Summenwert der zahlenmäßig kodierten Ankreuzungen bilden • Annahme : mitgemessene Fremddimensionen werden “herausgemittelt” Technische Universität Berlin Lehrstuhl Marketing Professor Dr. Volker Trommsdorff Marktforschung – Erhebungsmethoden und Messtheorie 20 Erhebungsmethoden Likert-Skala Beispiele Angenommen, es sollen die Einstellungen zu Off-Road-Autos gemessen werden Itembeispiele: “Off-Road-Autos verbinden Spaß und Funktionalität” “Off-Road-Autos fahren nur Angeber” “Frauen fühlen sich in OFF-Road-Autos besser geschützt” stimme ganz entschieden zu..... ( ) stimme zu ................................. ( ) unentschieden ........................... ( ) stimme nicht zu ........................ ( ) stimme ganz und gar nicht zu .. ( ) stimme ganz entschieden zu..... ( ) stimme zu ................................. ( ) unentschieden ........................... ( ) stimme nicht zu ........................ ( ) stimme ganz und gar nicht zu .. ( ) stimme ganz entschieden zu..... ( ) stimme zu ................................. ( ) unentschieden ........................... ( ) stimme nicht zu ........................ ( ) stimme ganz und gar nicht zu .. ( ) Technische Universität Berlin Lehrstuhl Marketing Professor Dr. Volker Trommsdorff Marktforschung – Erhebungsmethoden und Messtheorie 21 Erhebungsmethoden Likert-Skala Beispiel (Zustimmung bzw. Ablehnung) OC - Kurven des Items Itemwert fiktive Werte 5 4 3 Item 1 Item 2 (Ablehnung bzw. Zustimmung ) 2 Item 3 1 latententes Kontinuum Technische Universität Berlin Lehrstuhl Marketing Professor Dr. Volker Trommsdorff Marktforschung – Erhebungsmethoden und Messtheorie 22 Erhebungsmethoden Thurstone-Skala Beispiel “Wir würden gerne wissen, was Sie von OFF-Road-Autos halten. Sehen Sie sich einmal diese Karte an: Da sind einige Meinungen aufgeschrieben, die man so hört. Bitte suchen Sie die Meinung heraus, die Ihrer Ansicht nach am besten auf Off-Road-Autos zutrifft. Sie brauchen mir nur die Nummer dieser Feststellung zu nennen” (Interviewer: nur eine Angabe!) 1 () 2 () 3 () 4 () 5 () 6 () 7 () 8 () Vorlage : 1. Off-Road-Autos sind für den Stadtverkehr ungeeignet. 2. Off-Road-Autos sind genauso gut wie andere Autos. 3. Off-Road-Autos sind auch für den Stadtverkehr hervorragend geeignet. ... ( weitere Statements) 8. ... l1 l2 l3 Skalenwerte der Jurorenurteile: 2.7 (l1 ); 5.5 ( l2); 9.6 ( l3); ... Technische Universität Berlin Lehrstuhl Marketing Professor Dr. Volker Trommsdorff Marktforschung – Erhebungsmethoden und Messtheorie 23 Erhebungsmethoden Thurstone-Skala OC - Kurven der Items: Itemwerte fiktive Werte 1 Item 2 Item 3 Ablehnung Item 1 0 2,7 5,5 9,6 latententes Kontinuum (Skalenwerte der Jurorenurteile) Technische Universität Berlin Lehrstuhl Marketing Professor Dr. Volker Trommsdorff Marktforschung – Erhebungsmethoden und Messtheorie 24 Erhebungsmethoden Thurstone-Skala - gleichbreite Intervalle • Items sind hier nicht-monotone Aussagen: Man kann nur wenigen zustimmen, die mit der eigenen Einstellung übereinstimmen. • Vorgehensweise: - zahlreiche Items formulieren - durch Experten in „gleich breit“ empfundene Intervalle des Einstellungskontinuums einsortieren lassen - Itemanalyse - Auswahl der akzeptablen Items und Zusammenstellung zur Skala Technische Universität Berlin Lehrstuhl Marketing Professor Dr. Volker Trommsdorff Marktforschung – Erhebungsmethoden und Messtheorie 25 Erhebungsmethoden Klassische Skalierungsverfahren im Überblick Verfahren (Autor) gleicherscheinende summierte Intervalle Ratings Kriterium Skalenniveau Sicherung des metrischen Skalenniveaus Prüfkriterium für Eindimensionalität Itemtyp Paarvergleichsskalierung Skalogrammanalyse (Thurstone) metrisch subjektiv: durch Βeurteiler Streuung der Itemskalenwerte (Likert) quasimetrisch subjektiv: durch Befragte Diskriminanzfähigkeit der Items (Guttman) (Edwards) metrisch ordinal theoretisch: Law of comparative judgement Transitivität der Fehlerzahl der Paarvergleiche Items nichtmonoton monoton nichtmonoton nein gering zwingend mittel Vorstudie zwingend Erhebungsaufwand hoch kumulativ monoton nein gering Technische Universität Berlin Lehrstuhl Marketing Professor Dr. Volker Trommsdorff Marktforschung – Erhebungsmethoden und Messtheorie 26 Erhebungsmethoden Gruppendiskussion Qualitative Mafo-Methode: • • • • • • 8-10 Zielpersonen, homogen ausgewählt neutrale Umgebung, “runder Tisch”, Bewirtung Moderator / Animateur Aufzeichnungsgerät, Metaplanmaterial ggf. Anschauungsmaterial 1-8 Stunden Dauer Einsatzbereiche: • • • • • explorative Marktforschung bei verborgenen Problemen Tabu- und Prestige-Themen für Produktinnovationen bei “high-touch”-Produkten Bewertung: + vernachlässigt, aber im Kommen +/- kann sehr aufschlußreich sein - nicht repräsentativ + billig Technische Universität Berlin Lehrstuhl Marketing Professor Dr. Volker Trommsdorff Marktforschung – Erhebungsmethoden und Messtheorie 27 Erhebungsmethoden Beobachtung ist der Prototyp des befragungsfreien Messens • Kommunikationsfehler beim Befragen ausschalten ! • beobachtbare Indikatoren für Konstrukte erforderlich • nicht grundsätzlich objektiver als Befragung • gleiche Gütekriterien und Validierungsprobleme Unterscheidungen: systematisch - unsystematisch natürliche - experimentelle Situation teilnehmend - nicht teilnehmend Kategorienkonstruktion: empirisch theoriegeleitet Fehlertendenzen: Unvollständigkeit Interpretationsfehler Maßstabsveränderung Technische Universität Berlin Lehrstuhl Marketing Professor Dr. Volker Trommsdorff Marktforschung – Erhebungsmethoden und Messtheorie 28 Erhebungsmethoden Nichtreaktive Sonderverfahren Für den Messvorgang bedarf es keiner Reaktion des Messobjekts (Antwort) auf einen Messstimulus (Frage) Trickreiche Anordnungen zur Vermeidung der Probleme des reaktiven Messens Beispiele: • Müllauswertung • präparierte Zeitschriften, Fingerabdrücke • Einnahmen in Parkuhren bei Einkaufsvierteln • Wasserverbrauch und Beliebtheit von Sendungen • leere Zigarettenschachteln und Marktanteil Technische Universität Berlin Lehrstuhl Marketing Professor Dr. Volker Trommsdorff Marktforschung – Erhebungsmethoden und Messtheorie 29 Erhebungsmethoden Inhaltsanalyse Vorgehen 1. Operationalisierung der Fragestellung 2. Auswahl des zu analysierenden sprachlichen Materials 3. Bestimmung der sprachlichen Einheiten (z.B. Worte, Wortkombinationen, Sätze) 4. Entwicklung eines Kategorieschemas Anforderungen: - eindeutige Zurechenbarkeit - erschöpfend - operational 5. Auszählen, Indexbildung, Hypothesenprüfung 6. Reliabilitäts- und Validitätsprüfung Technische Universität Berlin Lehrstuhl Marketing Professor Dr. Volker Trommsdorff Marktforschung – Erhebungsmethoden und Messtheorie 30 Agenda • Fortsetzung Erhebungsmethoden • Experiment • Marktforschung-Projektplanung • Stichprobenplanung • Befragung • Skalierung • Datenaufbereitung und Datenanalyse • Einfache Statistiken • Univariate Statistiken • Bivariate Statistiken • Signifikanztest • Prüfstatistik Technische Universität Berlin Lehrstuhl Marketing Professor Dr. Volker Trommsdorff Marktforschung – Erhebungsmethoden und Messtheorie 31 Datenaufbereitung und Datenanalyse Datenaufbereitung Codierung • Zuordnung von (numerischen) Zeichen zu Antwortreaktionen, z.B. Student = 1, Rentner = 2, Professor = 3, Hausfrau = 4 völlig dagegen = -2, dagegen = -1, indifferent = 0, dafür = 1, sehr dafür = 2 • Codieren ist formales Abbilden von Antworten • bei geschlossenen bzw. quantitativen Fragen ist Codierung Teil der Frageformulierung • bei offenen, insbesondere nominalen Fragen wird nach der Erhebung codiert • Codieren ist ein Teil des Messvorgangs, also potenziell fehlerbehaftet • Grundproblem: Übereinstimmung der Kategorien von Fragendem und Befragtem Technische Universität Berlin Lehrstuhl Marketing Professor Dr. Volker Trommsdorff Marktforschung – Erhebungsmethoden und Messtheorie 32 Datenaufbereitung und Datenanalyse Datenaufbereitung Codierprobleme Ansprüche an Codes Eindimensionalität / Ausschließlichkeit Vollständigkeit Codierarten geschlossene / numerische Fragen Feldcodierung nachträgliche Codierung Code-Umfang (Kriterien) Forschungsziel (Differenziertheit) Probleme Mehrfachnennungen Codier-Reliabilität Codieren ist ein Teil des Messvorgangs (!) Technische Universität Berlin Lehrstuhl Marketing Professor Dr. Volker Trommsdorff Marktforschung – Erhebungsmethoden und Messtheorie 33 Datenaufbereitung und Datenanalyse Datenbereinigung Inkonsistente Antworten - manche Fälle können durch logische Abfrage herausgefunden werden - gegebenenfalls aus der Auswertung herausnehmen Eingabe- und Codierfehler - Datei enthält Ausprägungen, die nach der Codekonstruktion nicht vorkommen dürfen - diese Codierfehler können mit Suchabfragen gefunden werden Interviewer-Bias - Interviewer können - auch ungewollt - Befragte beeinflussen, z.B. wenn sie bestätigend kommentieren usw. - zur Diagnose Test der Hypothese, daß es zwischen Interviewern systematische Unterschiede gibt - wenn Untersuchungsergebnisse zwischen den Interviewern signifikant abweichen, gegebenenfalls Eliminierung von Interviews Technische Universität Berlin Lehrstuhl Marketing Professor Dr. Volker Trommsdorff Marktforschung – Erhebungsmethoden und Messtheorie 34 Datenaufbereitung und Datenanalyse Datenmatrix • • Ausgangspunkt einer Auswertung ist eine maschienenlesbare Datenmatrix Sie hat die allgemeine Form: Messvariablen (hier: Fragen) 1 ................................... j ....................................... m 1 . . Fälle = Messobjekte (hier: APn) . i . Messwerte (Ausprägungen) . . n Technische Universität Berlin Lehrstuhl Marketing Professor Dr. Volker Trommsdorff Marktforschung – Erhebungsmethoden und Messtheorie 35 Datenaufbereitung und Datenanalyse Datenaufbereitung – lpsative Messwerte / Ipsativierung Standardisierung Problem: Statistische Bereinigung der Datenmatrix um personenspezifische, vom Inhalt (Ausprägung des zu messenden Merkmals) unabhängige Antworttendenzen. Beispiel: Befragter A - kreuzt Einstellungsskalen immer ganz extrem an (1; 7) Befragter B - bevorzugt die Skalenmitte (3; 4; 5) Befragter C - bevorzugt die linke Skalenhälfte (1; 2; 3) usw. Standardisierung: Vorausgesetzt, dass die Ratings jedes Befragten eine “Stichprobe aus dem Universum seiner Ratingantworten” sind, können die genannten Quellen von Fehlervarianz durch zeilenweise z-Standardisierung der Datenmatrix eliminiert werden. Berechnung: Σ si = {1/ni Σ (xij - xj)2}1/2 zij = bereinigtes “Rating” von Person i bei Item j xij = Ratings von Person i bei Item j xj = itemspezifischer Mittelwert si = personenspezifische Standardabweichung ni = Zahl der abgegebenen Ratings von Person i Wertebereich: gestutzte Normalverteilung Technische Universität Berlin Lehrstuhl Marketing Professor Dr. Volker Trommsdorff Marktforschung – Erhebungsmethoden und Messtheorie 36 Datenaufbereitung und Datenanalyse Datenanalyse • einfache Statistiken – multivariate Verfahren Technische Universität Berlin Lehrstuhl Marketing Professor Dr. Volker Trommsdorff Marktforschung – Erhebungsmethoden und Messtheorie 37 Datenaufbereitung und Datenanalyse Einfache Statistiken – univariate Statistiken Aussage Skalenniveau Zentraltendenz Nominal Modalwert x = xj ^ J = j (max(n j )) Ordinal Median ~ J = j (min(Σ n j ≥ j X i j nj N J J0 Ju Konzentrationsmaße, z.B. Σj ( n 3j − n j ) K= N3 − N Quartilsabstand D = ( x Jo − x ju ) / 2 x = xj Metrisch Streuung N )) 2 Arithmetisches Mittel 1 x = ∑ xi N i 3N )) 4 N ≥ )) 4 Jo = j (min(∑ n j ≥ Ju = j (min(∑ n j Standardabweichung S= 1 N ∑ (x i −x ) 2 i = Variable, z.B. Schulbildung = Fall-Index, z.B. Person = Ausprägungs-Index, z.B. Abitur j = Häufigkeit einer Ausprägung j, j = Fallzahl = Index der Medien- bzw. Modal-Ausprägung, z.B. Mittlere Reife = Index der oberen Quartilsausprägung, z.B. Abitur = Index der unteren Quartilsausprägung, z.B. Hauptschule Σn = N Technische Universität Berlin Lehrstuhl Marketing Professor Dr. Volker Trommsdorff Marktforschung – Erhebungsmethoden und Messtheorie 38 Datenaufbereitung und Datenanalyse Boxplot Grafische Statistik von Tukey größter Wert oberes Quartil Boxlänge umfaßt 50% der Werte, den “Kern in der Mitte” * Medianwert unteres Quartil maximal eine Boxlänge von Box entfernt kleinster Wert im Streubereich x Ausreißerwert Technische Universität Berlin Lehrstuhl Marketing Professor Dr. Volker Trommsdorff Marktforschung – Erhebungsmethoden und Messtheorie 39 Datenaufbereitung und Datenanalyse Bivariate Statistiken Kriterien: • Skalenniveau • Zahl der Ausprägungen • Grad der Aggregation • Kausalrichtung der Hypothese • Erhaltung wesentlicher Informationen • Interpretations-Plausibilität • Vergleichbarkeit (andere Untersuchungen) Technische Universität Berlin Lehrstuhl Marketing Professor Dr. Volker Trommsdorff Marktforschung – Erhebungsmethoden und Messtheorie 40 Datenaufbereitung und Datenanalyse Prozentsatzdifferenz Klausurerfolg VorlesungsBesuch a.V. (1) a.V. (2) Σ u.V. (1) 55 22% 183 51% 238 u.V. (2) 199 78% 179 49% 378 Σ 254 362 Skalenniveau : ab nominal Zahl der Ausprägungen :2x2 Aggregation : Häufigkeiten Kausalrichtung : nicht notwendig Information : hier kein Verlust Interpretation : plausibel Vergleichbarkeit : nur gleiche Tabellenform Problematik : Zellenbesetzung D = 29 % = 51 - 22 = 78 - 49 616 Technische Universität Berlin Lehrstuhl Marketing Professor Dr. Volker Trommsdorff Marktforschung – Erhebungsmethoden und Messtheorie 41 Datenaufbereitung und Datenanalyse Vierfelderkorrelation Φ a b a+b c d c+d a+c b+d N −1 ≤ Φ = a.d − b.c ≤ +1 ( a + b).(c + d ).(a + c ).b + d ) Skalenniveau : ab nominal Zahl der Ausprägungen :2x2 Aggregation : Häufigkeiten Kausalrichtung : nicht notwendig Information : bei Nominaldaten vollständig Interpretation : χ2 – basiert, korrelationsäquivalent Vergleichbarkeit : gut Technische Universität Berlin Lehrstuhl Marketing Professor Dr. Volker Trommsdorff Marktforschung – Erhebungsmethoden und Messtheorie 42 Datenaufbereitung und Datenanalyse Einfache Statistiken Beispiel: Kendall´s τb Bewertung: τb misst den Grad, mit dem zwei verschiedene Messvariablen die Messobjekte ähnlich rangordnen Skalenniveau ab ordinal (sonst keine Ordnung). Zahl der Ausprägungen nicht zu wenig (sonst zahlreiche ties). Aggregationgrad Kausalrichtung zweidimensionale Häufigkeitstabellen. keine Interpretation plausibel (nomierter Konkordanzüberschuss) Vergleichbarkeit Tabellen mit gleicher Spalten- und Zeilenzahl Kritik τb kann bei “nicht-quadratischen” Tabellen die Maximalwerte +1/-1 nicht erreichen Da nur Ranginformation genutzt wird, ist die optimal Statistik bei höheren Skalenniveaus nicht Technische Universität Berlin Lehrstuhl Marketing Professor Dr. Volker Trommsdorff Marktforschung – Erhebungsmethoden und Messtheorie 43 Datenaufbereitung und Datenanalyse Einfache Statistiken Beispiel : Kendall´s τb Zahlenbeispiel : BRD Japan 1968 3 5,84 1969 5 6,25 1970 7 6 1971 4,5 5,5 1972 3,5 4,25 1973 6 6 1974 6,5 9 1975 4,5 8 Technische Universität Berlin Lehrstuhl Marketing Professor Dr. Volker Trommsdorff Marktforschung – Erhebungsmethoden und Messtheorie 44 Datenaufbereitung und Datenanalyse Einfache Statistiken - Beispiel : Kendall´s τb Auszählung der konkordanten (K), diskonkordanten (D) und gebundenen (T) Fälle am Zahlenbeispiel: 1968 1968 1969 1970 1971 1972 1973 1974 1975 - K K D D K K K - D K K D K D - K K Ty D D - K K K Tx - K K K - K D - K 1969 1970 1971 1972 1973 1974 Beispiel : 1975 X Y 1971 4,5 5,5 1972 3,5 4,25 Ordnung: Abstieg Abstieg τb = Nc = 18 Nd = 8 Tx = 1 Ty = 1 -----------( ) = 28 N 2 - Konkordanz 18 − 8 10 = = 0,370 27 (18 + 8 + 1)(18 + 8 + 1) Technische Universität Berlin Lehrstuhl Marketing Professor Dr. Volker Trommsdorff Marktforschung – Erhebungsmethoden und Messtheorie 45 Datenaufbereitung und Datenanalyse Einfache Statistiken - Beispiel : Kendall´s τb Nc Nd Tx Ty = Zahl aller konkordant geordneten Paare von Fällen = Zahl aller diskordant geordneten Paare von Fällen = Zahl der Paare, die in der ersten Variablen wegen gleicher Ausprägung nicht geordnet werden können = Zahl der Paare, die in der zweiten Variablen wegen gleicher Ausprägung nicht geordnet werden können Die Gesamtzahl aller Paare von Fällen, die aus n Messobjekten gebildet werden können, N = Nc+Nd+Tx+Ty , ist n 1 N = = * n * ( n − 1) 2 2 Technische Universität Berlin Lehrstuhl Marketing Professor Dr. Volker Trommsdorff Marktforschung – Erhebungsmethoden und Messtheorie 46 Datenaufbereitung und Datenanalyse Scheinkorrelation • Beispiel: Mögliche Fehlinterpretationen eines Befundes aus Burda Marktforschung, Typologie der Wünsche 1980, Bd. 2 • Von je 100 deutschen, mindestens 14-jährigen (Personen/ regelmäßigen Biertrinkern/ regelmäßigen Weintrinkern) stimmen folgende Anteile stark oder sehr stark der Norm zu: “sich mindestens einmal im Jahr gründlich untersuchen zu lassen”: bejaht stark / sehr stark Personen gesamt 58% regelmäßige Biertrinker 54% regelmäßige Weintrinker 61% Falsche Folgerung: Biertrinker sind unterdurchschnittlich “gesundheitsbewusst”, Weintrinker überdurchschnittlich. Technische Universität Berlin Lehrstuhl Marketing Professor Dr. Volker Trommsdorff Marktforschung – Erhebungsmethoden und Messtheorie 47 Datenaufbereitung und Datenanalyse Scheinkorrelation – Fortsetzung des Beispiels Aufgliederung des Befundes nach Geschlecht: bejaht stark / sehr stark gesamt weiblich männlich Personen gesamt 58% 63% 51% regelmäßige Biertrinker 54% 65% 49% regelmäßige Weintrinker 61% 66% 54% Die Scheinkorrelation zwischen “Gesundheitsbewusstsein” und “Getränkepräferenz” entsteht durch die Hintergrundvariable Geschlecht: Mehr Frauen als Männer lassen sich regelmäßig untersuchen (63% : 51%) und mehr Männer als Frauen trinken regelmäßig Bier (72% : 46%); (nicht in obigen Tabellen ausgewiesen!). Geschlecht Untersuchungshäufigkeit Getränkepräferenz Scheinkorrelation Technische Universität Berlin Lehrstuhl Marketing Professor Dr. Volker Trommsdorff Marktforschung – Erhebungsmethoden und Messtheorie 48 Datenaufbereitung und Datenanalyse Weitere Beispiele für Scheinkorrelation Hohe Korrelationen von • Schuhgröße und Wortschatz • Körpergröße und Haarlänge Erklärungen? Technische Universität Berlin Lehrstuhl Marketing Professor Dr. Volker Trommsdorff Marktforschung – Erhebungsmethoden und Messtheorie 49 Datenaufbereitung und Datenanalyse Scheinkorrelation heißt scheinbar ja oder scheinbar nein Beispiel 2: scheinbar hohe Korrelation Beispiel 3: scheinbar keine Korrelation y y x Bei Kontrolle von Z (Z1/Z2) verschwindet der scheinbare x-y-Zusammenhang x Bei Kontrolle von Z(x/o) zeigen sich starke x-y-Zusammenhänge Technische Universität Berlin Lehrstuhl Marketing Professor Dr. Volker Trommsdorff Marktforschung – Erhebungsmethoden und Messtheorie 50 Datenaufbereitung und Datenanalyse Signifikanztest - Beispiel: Chi-Quadrat-Test Fragestellungen: a) Vergleich von (2) empirischen Verteilungen miteinander b) Vergleich einer empirischen mit einer theoretischen Verteilung (z.B.Gleichverteilung) Nullhypothese: Die (2) Häufigkeitsverteilungen sind statistisch gleich, beide sind Stichproben aus derselben Population Prüfstatistik: Chi-Quadrat-Verteilung mit k-1 Freiheitsgraden; k= Zahl der Kategorien (beim Vergleich von m Verteilungen miteinander: (k-1)(m-1) Freiheitsgrade) Technische Universität Berlin Lehrstuhl Marketing Professor Dr. Volker Trommsdorff Marktforschung – Erhebungsmethoden und Messtheorie 51 Datenaufbereitung und Datenanalyse Signifikanztest - Beispiel: Chi-Quadrat-Test Testgröße: X 2 = ∑ ( − f 0 f e ) f f 2 f e 0 e = beobachtete (observed) Zellenbesetzung = aufgrund der Nullhypothese zu erw. (expected) Zellenbesetzung Anwendungsvoraussetzungen: klassifizierte bzw. nominal skalierte Daten mit gleicher Klasseneinteilung der zu vergleichenden Samples Zellenbesetzungen dürfen nicht als Relativzahlen eingesetzt werden, sondern als absolute Häufigkeiten fe darf in keiner Zelle kleiner als 5 sein, sonst ist verteilt x 2 nicht mehr annähernd Chi-Quadrat- Technische Universität Berlin Lehrstuhl Marketing Professor Dr. Volker Trommsdorff Marktforschung – Erhebungsmethoden und Messtheorie 52 Datenaufbereitung und Datenanalyse Nur ein Test je Hypothese! Wenn keine Hypothesen vorliegen (explorative Untersuchung) oder mehrere Signifikanztests je Hypothese gerechnet werden, ist Fehler erster Art (richtige Nullhypothese fälschlich abgelehnt) größer als Tabellenwert α Beispiel 1: Umfrage mit 100 Variablen (mögliche u.V.) und einer a.V. Selbst wenn alle 100 Nullhypothesen H0 stimmen (reine Zufallsvariablen), sind bei α = 5% fünf “signifikante” Ergebnisse zu erwarten. Beispiel 2: Eine Suche nach signifikanten Korrelationen zwischen sämtlichen Paaren der 100 Variablen dieser Untersuchung ergibt, obwohl sämtliche Nullhypothesen H0 stimmen (reine Zufallsvariablen), 248 “signifikante” Korrelationen (5% der rechenbaren Signifikanztests, das sind 100 oder 4950 Tests) 2 Fazit: Nie Signifikanztests rechnen, wenn nicht genau eine Hypothese vorliegt Technische Universität Berlin Lehrstuhl Marketing Professor Dr. Volker Trommsdorff Marktforschung – Erhebungsmethoden und Messtheorie 53 Datenaufbereitung und Datenanalyse Prüfstatistik Durchführung eines Signifikanztests 1. 2. 3. 4. 5. Formulierung der Nullhypothese (H0) aus der erwarteten Hypothese (HA) Spezifizierung der Teststatistik (siehe Kriterien der Testauswahl) Festlegung des Signifikanzniveaus α (Fehler 1. Art); Konservatismus-Entscheidung Berechnung der Wahrscheinlichkeit p dafür, daß im Falle der Gültigkeit von H0 die empirisch vorgefundenen Daten auftreten konnten Entscheidung für H0 falls p > α, sonst Beibehaltung der Alternativhypothese HA Häufigste Fehler: • • • • • Signifikanz als Effektstärke interpretiert; kleine Effekte können signifikant sein vice versa es gab keine (oder zahlreiche) Hypothesen; Test nur bei einer Hypothese zulässig falsche Teststatistik (z.B. zu hoch angenommenes Skalenniveau) zweiseitige Hypothese einseitig getestet - vice versa (Folge: falsche Interpretation) Verbundenheit von Stichproben nicht beachtet (Folge: zu konservatives Testen) Technische Universität Berlin Lehrstuhl Marketing Professor Dr. Volker Trommsdorff Marktforschung – Erhebungsmethoden und Messtheorie 54 Datenaufbereitung und Datenanalyse Signifikanztest – Ist die Hypothese gerichtet? • Konservativitätsgrundsatz: • Gerichtete Hypothesen können einseitig, ungerichtete Hypothesen müssen zweiseitig getestet werden. • Zweiseitiger Test gerichteter Hypothesen erhöht den Fehler zweiter Art. • Einseitiger Test ungerichteter Hypothesen erhöht den Fehler erster Art (ist konservativ). Einseitiger Test: “Sonderangebotspolitik senkt die Markentreue“ α Rejektionsbereich Markentreue Zweiseitiger Test: “Sonderangebotspolitik beeinflusst die Markentreue“ α/2 α/2 Markentreue Rejektionsbereich Rejektionsbereich” ”Erhöhung” Senkung” (Fehler erster Art auf zwei Seiten verteilt, H0 wird eher beibehalten) Technische Universität Berlin Lehrstuhl Marketing Professor Dr. Volker Trommsdorff Marktforschung – Erhebungsmethoden und Messtheorie 55 Datenaufbereitung und Datenanalyse Prüfstatistik Kriterien für Testmodellwahl • Deskriptivstatistik, in der Hypothese ausgedrückt ist (u.a. arithmetisches Mittel, Häufigkeitsverteilung, Korrelation) • Zahl der zu vergleichenden Stichproben (1, 2, viele) • Verbundenheit zu vergleichenden Stichprobe (ja, nein) • Hypothesenrichtung (einseitig, zweiseitig) • formale Anforderungen (Skalenniveau, Verteilungsparameter) • Konservativismus (Risiko des Fehlers erster Art) Technische Universität Berlin Lehrstuhl Marketing Professor Dr. Volker Trommsdorff Marktforschung – Erhebungsmethoden und Messtheorie 56 Datenaufbereitung und Datenanalyse Prüfstatistik – Ausgewählte Testmodelle für Nominaldaten Prüfstatistik Nominal Häufigkeiten Ordinal Rangordnungen eine Gruppe zwei Gruppen Metrisch Meßwerte viele Gruppen 2-kategorialer Binomialtest unabhängig: Chi-Quadrat-Test unabhängig: Chi-Quadrat-Test k-kategorialer Chiquadrattest abhängig: McNemar-Test abhängig: Cochran Q-Test Technische Universität Berlin Lehrstuhl Marketing Professor Dr. Volker Trommsdorff Marktforschung – Erhebungsmethoden und Messtheorie 57 Datenaufbereitung und Datenanalyse Prüfstatistik – Ausgewählte Testmodelle für Ordinaldaten Prüfstatistik Nominal Häufigkeiten zwei Gruppen eine Gruppe Kolmogorov SmirnovTest unabhängig: Mediantest U-Test Metrisch Meßwerte Ordinal Rangordnungen abhängig: Signtest Wilcoxontest viele Gruppen unabhängig: Kruskal-WallisH -Test abhängig: Friedmanns Rang -VA Technische Universität Berlin Lehrstuhl Marketing Professor Dr. Volker Trommsdorff Marktforschung – Erhebungsmethoden und Messtheorie 58 Datenaufbereitung und Datenanalyse Signifikanz und Stichprobenumfang Sechs unabhängige Untersuchungen derselben Hypothese über einen Marketingeffekt haben bei verschiedenen Stichprobengrößen auf unterschiedlichem Signifikanzniveau (siehe α) sämtlich signifikante Ergebnisse gebracht: Untersuchung 1 2 3 4 5 6 Rang Stichprobenumfang 200 200 1.000 100 8.000 800 Signifikanzniveau Irrtumswahrscheinlichkeit schwach signifikant α < 7,5% schwach signifikant α < 10% hoch signifikant α < 1% hoch signifikant α < 1% signifikant α < 5% signifikant α < 5% Bewerten Sie den Wert der Studien hinsichtlich ihrer Beiträge zur wissenschaftlichen Lösung des betreffenden Marketingproblems Rangordnen Sie dazu alle Untersuchungen (1=beste, 6=schwächste Studie) in Spalte „ „ (Ziffer 1-6 eintragen) je nachdem, wie ihr Erkenntnisbeitrag für die Wissenschaft Ihres Erachtens ist Technische Universität Berlin Lehrstuhl Marketing Professor Dr. Volker Trommsdorff Marktforschung – Erhebungsmethoden und Messtheorie 59