Technische Universität Berlin - marketing.tu

Vorlesung Marktforschung
Erhebungsmethoden und Messtheorie
Sommersemester 2010
TU Berlin, Lehrstuhl Marketing Prof. Dr. V. Trommsdorff, Sekr. WIL-B-3-1, Wilmersdorfer Straße 148, 10585 Berlin, Tel: +49.(0)30.314-29.922, www.marketing-trommsdorff.de
Technische Universität Berlin
Lehrstuhl Marketing Professor Dr. Volker Trommsdorff
Agenda
•
Fortsetzung Erhebungsmethoden
• Marktforschung-Projektplanung
• Stichprobenplanung
• Befragung
• Skalierung
•
Datenaufbereitung und Datenanalyse
• Einfache Statistiken
• Univariate Statistiken
• Bivariate Statistiken
• Signifikanztest
• Prüfstatistik
Technische Universität Berlin
Lehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Erhebungsmethoden und Messtheorie
2
Erhebungsmethoden
Marktforschungs-Projektablauf
Problem
Problemdefinition
Design
Hypothesenbildung
Operationalisierung
nach Subjekten
nach Konstrukten
nach Objekten
Stichproben
Indikatoren
Fragebogen
Erhebung
Datengewinnung
Bereinigung
Datensatz
Datenanalyse
Exploration
Konfirmation
Interpretation
Bericht
Technische Universität Berlin
Lehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Erhebungsmethoden und Messtheorie
3
Erhebungsmethoden
Stichprobenplanung
Bestimmung der Grundgesamtheit, über die ausgesagt werden soll
Stichprobenzielwerte (Aussageneinheiten und Toleranzen)
Festlegung des Stichprobenumfangs
Auswahlbasis (Repräsentationsmenge für die Auswahl)
Auswahlverfahren (Quota, Random, Schichtung etc.)
Planung und Durchführung der Auswahl
Technische Universität Berlin
Lehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Erhebungsmethoden und Messtheorie
4
Erhebungsmethoden
Auswahlverfahren
für repräsentative Teilerhebung
Repräsentative
Stichproben
zufällig
(„Random“)
einfach
Klumpen
gesteuert
(„Quota“)
geschichtet
Quota
typisch
Fokus
Technische Universität Berlin
Lehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Erhebungsmethoden und Messtheorie
5
Erhebungsmethoden
Kennzeichen der Quotenauswahl
• Verteilung bestimmter Merkmale in der Grundgesamtheit bekannt
• Repräsentativität durch Vorgabe von Quoten gemäß dieser Verteilung
• Interviewer sucht Auskunftspersonen nach Quoten, nicht nach Adressen
Vorteile
• einfach und billig
• gute Ergebnisse
• in Praxis akzeptiert
Nachteile
• Qualität hängt von Durchführung ab
• Interviewerwillkür bei der Auswahl
• theoretische Fehlerberechnung
unmöglich
• z.T. Unkenntnis über Verteilung
interessierender Merkmale in der
Grundgesamtheit, dann ist eine
Voruntersuchung notwendig
Technische Universität Berlin
Lehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Erhebungsmethoden und Messtheorie
6
Erhebungsmethoden
Quotenauswahl – Schritte
1. Lege 2-4 Quotierungsmerkmale fest.
z.B. Alter, Geschlecht, Berufsgruppe
2. Entscheide relevante Quotenausprägungen.
z.B. 16-30J., 31-45J., 46-60J.
3. Ermittle deren Häufigkeiten aus der Statistik (unverbunden
oder verbunden).
z.B. 15% 16-30jährige, 6% 16-30jährige
Männer
4. Bestimme entsprechende absolute Quoten für die zu
ziehende Stichprobe.
z.B. 150 16-30jährige Frauen, 60 1630jährige Männer
5. Stelle Quotierungspläne für die Interviewer her so, dass die
Summe der quotierten Ausprägungen der angestrebten
Verteilung der Stichprobe entspricht.
z.B. "befragen Sie zwei 16-30-jährige
Männer..."
6. Quotenkontrolle der fertigen Fragebögen: Die Stichprobe muss die Merkmalsverteilung der Grundgesamtheit
aufweisen.
Technische Universität Berlin
Lehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Erhebungsmethoden und Messtheorie
7
Erhebungsmethoden
Stichprobenumfang
nicht abhängig vom Grundgesamtheitsumfang, aber von:
1. vom tolerierten Stichprobenfehler e,
(e = Fehlertoleranz)
in dessen Grenzen der Stichprobenmesswert vom wahren Wert abweichen darf
n ~ 1/e2
2. vom Sicherheitsgrad 1-α,
(α = Irrtumswahrscheinlichkeit)
z.B. 99% (hoch sicher) oder 95% (sicher)
Wahrscheinlichkeit der Aussage
"Messwert weicht maximal um e vom wahren Wert ab“
n ~ z2
z = standardnormalverteilte Ausprägung des Messwertes
z=1 für α = 68%, 2 für 95,5%, 3 für 99,7% Sicherheitsgrad
3. Der Differenziertheit der zu treffenden Aussage, d.h. von der Untergruppierung: welchen Anteil r
hat die kleinste Stichprobe ni,
für die der Stichprobenfehler e und der Sicherheitsgrad 1-α gelten sollen?
n = r·ni, (n Vielfaches des Stichprobenumfanges ni)
4. Der (vor der Erhebung noch unbekannten) Streuung S
des zu untersuchenden Merkmals in der Grundgesamtheit Sx
(ggf. “konservativ” = pessimistisch schätzen)
(S = Standardabweichung)
Technische Universität Berlin
Lehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Erhebungsmethoden und Messtheorie
8
Erhebungsmethoden
Geschichtete Stichproben
Schichtung heißt Ausnutzen der Clusterung von Teilstichproben (intern homogen, extern
heterogen): Je besser die Trennschärfe (Korrelation von Messvariable und
Schichtungsmerkmal), desto stärker der „Schichtungseffekt“
1. Grundgesamtheit nach trennscharfen Merkmalen in Schichten aufteilen
2. Aus jeder Schicht eine eigene Stichprobe ziehen
3. Parameter der Gesamtstichprobe aus gewichteten Schichtparametern bestimmen
4. Bei effizienter Schichtung größere Genauigkeit bzw. kleinerer Stichprobenumfang
Technische Universität Berlin
Lehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Erhebungsmethoden und Messtheorie
9
Erhebungsmethoden
Befragungsarten nach vier Kriterien
Standardisierung
unstrukturiert
halbstrukturiert
strukturiert
• geschl. Fragen
• Ratings
• Zahlenfragen
Kontaktarten
brieflich
telefonisch
persönlich
online
Soziale Situation
Gruppendiskussion
Gruppenbefragung
Einzelinterview
Inhalt
Demographie
Fakten, Wissen
Disposition
Befragungstechnische Kriterien
Technische Universität Berlin
Lehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Erhebungsmethoden und Messtheorie
10
Erhebungsmethoden
Fragebogentechnisch-funktionale Fragentypen
Eisbrecher
Am Anfang des Interviews zur Reduzierung von Hemmungen
Puffer
beim Übergang zu neuem Thema Eisbrecher/Puffer
Nicht auswerten!
Überrumpelung
den zu erhebenden Sachverhalt als Selbstverständlichkeit
unterstellen
Fallgruben
zur Aufdeckung unwahrer Antworten
Training
Einüben der antwortrelevanten Leistungsart,
z.B. sich an weit zurückliegende Dinge erinnern
Filter
Selektion von Befragten für spezielle Zusatzfragen
Gabelung
für inhaltlich verschiedene parallele Subgruppenbefragungen
Technische Universität Berlin
Lehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Erhebungsmethoden und Messtheorie
11
Erhebungsmethoden
Frageformen
offen: keine Antwortvorgabe / geschlossen: mit Antwortvorgaben
Ratingskalen sind eine Form der geschlossenen Frage:
stimmt ganz genau
stimmt überhaupt nicht
Offene Frage
+
mehr individuelle Information
Geschlossene Frage
-
möglicher Informationsverlust
+
für Explorationen
+
für quantitative Standard-Mafo
+
wenig Antwortsteuerung
-
spezielle Fehlertendenzen
-
schwer vergleichbare Antworten
+
geringerer Aufwand (kein Kodieren)
Technische Universität Berlin
Lehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Erhebungsmethoden und Messtheorie
12
Erhebungsmethoden
Skalierungen in der Marktforschung - Beispiel für Rating-Skalen
schlecht
1
2
3
4
5
gut
gering
groß
stimme dagegen
stimme dafür
-2
-1
0
1
2
wenig
gefällt mir gut
J
K
viel
L
gefällt mir nicht
Technische Universität Berlin
Lehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Erhebungsmethoden und Messtheorie
13
Erhebungsmethoden
Fragebogen zu gestalten ist keineswegs trivial – einige Regeln
• verständliche Formulierung
• eindeutige und präzise Fragen
• keine Suggestivfragen
• übersichtliche Gestaltung
• “richtige” Fragen-Reihenfolge
• Umfang begrenzen
• keinesfalls ohne Pretest ins Feld
Technische Universität Berlin
Lehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Erhebungsmethoden und Messtheorie
14
Erhebungsmethoden
Befragungsartefakte / Antworttendenzen
Beispiel: Einstellungen zum Betreiben von Peep-Shows
Die Frage wurde zwei Stichproben vorgelegt:
a) mit der Formulierung “sollte man verbieten”
b) mit der Formulierung “sollte man erlauben”
Ergebnisse
Frageversion
Antworten im Sinne von...
„verbieten“
„erlauben“
... verbieten (nicht erlauben)...
28%
50%
... erlauben (nicht verbieten)...
72%
50%
Summe
100%
100%
Anzahl
47
38
Quelle: Hipper (1983), S. 4, vgl. auch Schumann & Presser (1981)
Technische Universität Berlin
Lehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Erhebungsmethoden und Messtheorie
15
Erhebungsmethoden
Befragung als Kommunikationsprozess
mit vier fehleranfälligen Schnittstellen
S1: kodieren
S2: dekodieren
Frage
Frager
Befragter
Antwort
S4: dekodieren
S3: kodieren
Technische Universität Berlin
Lehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Erhebungsmethoden und Messtheorie
16
Erhebungsmethoden
Befragungsartefakt
Ein Befragungsartefakt ist eine Tendenz, auf eine Frage systematisch anders zu
antworten als es dem Messziel entspricht
Befragungsartefakte
formal erfassbar
• Extremtendenz, Zentraltendenz
• Ja-Sager-Tendenz
• Halo-Effekt
• Reihenfolge-Effekte (primacy, recency)
• Gambling (Streumuster)
• Skalenniveau-Verzerrung
• Item-Nonresponse
nur inhaltlich erfassbar
• sozial-normative Erwünschtheit
• Tabus
• Rationalitäts-Effekt
• Konsistenz-Effekt
• Informiertheits-Effekt
• Kooperation
• Kognitive Überforderung
Artefakte senken die Validität, aber sie erhöhen die Reliabilität
„zuverlässig das Falsche messen“
„it is better to be roughly right than exactly wrong“!
Technische Universität Berlin
Lehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Erhebungsmethoden und Messtheorie
17
Erhebungsmethoden
Systematische Befragungs-Fehlerquellen
Interviewer
Rolle
Persönlichkeit
Wahrnehmung
Befragter
Rolle
Persönlichkeit
Wahrnehmung
Antwort
Frageform
Wording
Kontext
Struktur
Skala
Frageinhalt
Tabus
Zentralität
Involvement
usw.
Technische Universität Berlin
Lehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Erhebungsmethoden und Messtheorie
18
Erhebungsmethoden
Grundlagen der Skalierung
Skala:
Fragenbatterie, die der Messung eines Merkmales dient
Skalierung:
Konstruktion und Eichung einer Skala
Anforderungen
an Skalen:
hohes Skalenniveau / Eindimensionalität / Validität
Item:
Einzelfrage einer Skala
Itemcharakteristiken:
Skalenwert
monoton
nicht-monoton
deterministisch
probabilistisch
latente
Konstruktausprägung
Technische Universität Berlin
Lehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Erhebungsmethoden und Messtheorie
19
Erhebungsmethoden
Likert-Skala
Verfahren der summierten Ratings
• Items sind fünfstufige Ratings
• Vorgehensweise:
• gleichviele “günstige” und “ungünstige” Items formulieren
• je Item ein Rating
• Pretest der Items
• Eliminieren der “schlechten” Items
• verbleibende, ca. 10-30 Items, den Befragten vorgeben
Summenwert der zahlenmäßig kodierten Ankreuzungen bilden
• Annahme : mitgemessene Fremddimensionen werden “herausgemittelt”
Technische Universität Berlin
Lehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Erhebungsmethoden und Messtheorie
20
Erhebungsmethoden
Likert-Skala
Beispiele
Angenommen, es sollen die Einstellungen zu Off-Road-Autos gemessen werden
Itembeispiele:
“Off-Road-Autos
verbinden Spaß und
Funktionalität”
“Off-Road-Autos fahren
nur Angeber”
“Frauen fühlen sich in
OFF-Road-Autos besser
geschützt”
stimme ganz entschieden zu..... ( )
stimme zu ................................. ( )
unentschieden ........................... ( )
stimme nicht zu ........................ ( )
stimme ganz und gar nicht zu .. ( )
stimme ganz entschieden zu..... ( )
stimme zu ................................. ( )
unentschieden ........................... ( )
stimme nicht zu ........................ ( )
stimme ganz und gar nicht zu .. ( )
stimme ganz entschieden zu..... ( )
stimme zu ................................. ( )
unentschieden ........................... ( )
stimme nicht zu ........................ ( )
stimme ganz und gar nicht zu .. ( )
Technische Universität Berlin
Lehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Erhebungsmethoden und Messtheorie
21
Erhebungsmethoden
Likert-Skala
Beispiel
(Zustimmung bzw.
Ablehnung)
OC - Kurven des Items
Itemwert
fiktive Werte
5
4
3
Item 1
Item 2
(Ablehnung bzw.
Zustimmung )
2
Item 3
1
latententes Kontinuum
Technische Universität Berlin
Lehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Erhebungsmethoden und Messtheorie
22
Erhebungsmethoden
Thurstone-Skala
Beispiel
“Wir würden gerne wissen, was Sie von OFF-Road-Autos halten. Sehen Sie sich
einmal diese Karte an: Da sind einige Meinungen aufgeschrieben, die man so
hört. Bitte suchen Sie die Meinung heraus, die Ihrer Ansicht nach am besten auf
Off-Road-Autos zutrifft. Sie brauchen mir nur die Nummer dieser Feststellung
zu nennen” (Interviewer: nur eine Angabe!)
1 () 2 () 3 () 4 () 5 () 6 () 7 () 8 ()
Vorlage :
1. Off-Road-Autos sind für den Stadtverkehr
ungeeignet.
2. Off-Road-Autos sind genauso gut wie andere
Autos.
3. Off-Road-Autos sind auch für den Stadtverkehr
hervorragend geeignet.
... ( weitere Statements)
8. ...
l1
l2
l3
Skalenwerte der Jurorenurteile: 2.7 (l1 ); 5.5 ( l2); 9.6 ( l3); ...
Technische Universität Berlin
Lehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Erhebungsmethoden und Messtheorie
23
Erhebungsmethoden
Thurstone-Skala
OC - Kurven der Items:
Itemwerte
fiktive Werte
1
Item 2
Item 3
Ablehnung
Item 1
0
2,7
5,5
9,6
latententes Kontinuum (Skalenwerte der Jurorenurteile)
Technische Universität Berlin
Lehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Erhebungsmethoden und Messtheorie
24
Erhebungsmethoden
Thurstone-Skala - gleichbreite Intervalle
•
Items sind hier nicht-monotone Aussagen: Man kann nur wenigen
zustimmen, die mit der eigenen Einstellung übereinstimmen.
•
Vorgehensweise:
- zahlreiche Items formulieren
- durch Experten in „gleich breit“ empfundene Intervalle des
Einstellungskontinuums einsortieren lassen
- Itemanalyse
- Auswahl der akzeptablen Items und Zusammenstellung zur
Skala
Technische Universität Berlin
Lehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Erhebungsmethoden und Messtheorie
25
Erhebungsmethoden
Klassische Skalierungsverfahren im Überblick
Verfahren (Autor) gleicherscheinende summierte
Intervalle
Ratings
Kriterium
Skalenniveau
Sicherung des
metrischen
Skalenniveaus
Prüfkriterium
für
Eindimensionalität
Itemtyp
Paarvergleichsskalierung
Skalogrammanalyse
(Thurstone)
metrisch
subjektiv:
durch
Βeurteiler
Streuung der
Itemskalenwerte
(Likert)
quasimetrisch
subjektiv:
durch
Befragte
Diskriminanzfähigkeit der Items
(Guttman)
(Edwards)
metrisch
ordinal
theoretisch:
Law of comparative
judgement
Transitivität der
Fehlerzahl der
Paarvergleiche
Items
nichtmonoton
monoton
nichtmonoton
nein
gering
zwingend
mittel
Vorstudie
zwingend
Erhebungsaufwand hoch
kumulativ
monoton
nein
gering
Technische Universität Berlin
Lehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Erhebungsmethoden und Messtheorie
26
Erhebungsmethoden
Gruppendiskussion
Qualitative Mafo-Methode:
•
•
•
•
•
•
8-10 Zielpersonen, homogen ausgewählt
neutrale Umgebung, “runder Tisch”, Bewirtung
Moderator / Animateur
Aufzeichnungsgerät, Metaplanmaterial
ggf. Anschauungsmaterial
1-8 Stunden Dauer
Einsatzbereiche:
•
•
•
•
•
explorative Marktforschung
bei verborgenen Problemen
Tabu- und Prestige-Themen
für Produktinnovationen
bei “high-touch”-Produkten
Bewertung:
+ vernachlässigt, aber im Kommen
+/- kann sehr aufschlußreich sein
- nicht repräsentativ
+ billig
Technische Universität Berlin
Lehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Erhebungsmethoden und Messtheorie
27
Erhebungsmethoden
Beobachtung ist der Prototyp des befragungsfreien Messens
• Kommunikationsfehler beim Befragen ausschalten !
• beobachtbare Indikatoren für Konstrukte erforderlich
• nicht grundsätzlich objektiver als Befragung
• gleiche Gütekriterien und Validierungsprobleme
Unterscheidungen:
systematisch - unsystematisch
natürliche - experimentelle Situation
teilnehmend - nicht teilnehmend
Kategorienkonstruktion:
empirisch
theoriegeleitet
Fehlertendenzen:
Unvollständigkeit
Interpretationsfehler
Maßstabsveränderung
Technische Universität Berlin
Lehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Erhebungsmethoden und Messtheorie
28
Erhebungsmethoden
Nichtreaktive Sonderverfahren
Für den Messvorgang bedarf es keiner Reaktion
des Messobjekts (Antwort) auf einen Messstimulus (Frage)
Trickreiche Anordnungen zur Vermeidung der Probleme
des reaktiven Messens
Beispiele:
• Müllauswertung
• präparierte Zeitschriften, Fingerabdrücke
• Einnahmen in Parkuhren bei Einkaufsvierteln
• Wasserverbrauch und Beliebtheit von Sendungen
• leere Zigarettenschachteln und Marktanteil
Technische Universität Berlin
Lehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Erhebungsmethoden und Messtheorie
29
Erhebungsmethoden
Inhaltsanalyse
Vorgehen
1. Operationalisierung der Fragestellung
2. Auswahl des zu analysierenden sprachlichen Materials
3. Bestimmung der sprachlichen Einheiten
(z.B. Worte, Wortkombinationen, Sätze)
4. Entwicklung eines Kategorieschemas
Anforderungen:
- eindeutige Zurechenbarkeit
- erschöpfend
- operational
5. Auszählen, Indexbildung, Hypothesenprüfung
6. Reliabilitäts- und Validitätsprüfung
Technische Universität Berlin
Lehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Erhebungsmethoden und Messtheorie
30
Agenda
•
Fortsetzung Erhebungsmethoden
• Experiment
• Marktforschung-Projektplanung
• Stichprobenplanung
• Befragung
• Skalierung
•
Datenaufbereitung und Datenanalyse
• Einfache Statistiken
• Univariate Statistiken
• Bivariate Statistiken
• Signifikanztest
• Prüfstatistik
Technische Universität Berlin
Lehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Erhebungsmethoden und Messtheorie
31
Datenaufbereitung und Datenanalyse
Datenaufbereitung
Codierung
•
Zuordnung von (numerischen) Zeichen zu Antwortreaktionen,
z.B. Student = 1, Rentner = 2, Professor = 3, Hausfrau = 4
völlig dagegen = -2, dagegen = -1, indifferent = 0, dafür = 1, sehr dafür = 2
•
Codieren ist formales Abbilden von Antworten
•
bei geschlossenen bzw. quantitativen Fragen ist Codierung Teil der
Frageformulierung
•
bei offenen, insbesondere nominalen Fragen wird nach der Erhebung codiert
•
Codieren ist ein Teil des Messvorgangs, also potenziell fehlerbehaftet
•
Grundproblem: Übereinstimmung der Kategorien von Fragendem und Befragtem
Technische Universität Berlin
Lehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Erhebungsmethoden und Messtheorie
32
Datenaufbereitung und Datenanalyse
Datenaufbereitung
Codierprobleme
Ansprüche an Codes
Eindimensionalität / Ausschließlichkeit
Vollständigkeit
Codierarten
geschlossene / numerische Fragen
Feldcodierung
nachträgliche Codierung
Code-Umfang (Kriterien)
Forschungsziel (Differenziertheit)
Probleme
Mehrfachnennungen
Codier-Reliabilität
Codieren ist ein Teil des Messvorgangs (!)
Technische Universität Berlin
Lehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Erhebungsmethoden und Messtheorie
33
Datenaufbereitung und Datenanalyse
Datenbereinigung
Inkonsistente Antworten
- manche Fälle können durch logische Abfrage herausgefunden werden
- gegebenenfalls aus der Auswertung herausnehmen
Eingabe- und Codierfehler
- Datei enthält Ausprägungen, die nach der Codekonstruktion nicht vorkommen
dürfen
- diese Codierfehler können mit Suchabfragen gefunden werden
Interviewer-Bias
- Interviewer können - auch ungewollt - Befragte beeinflussen,
z.B. wenn sie bestätigend kommentieren usw.
- zur Diagnose Test der Hypothese, daß es zwischen Interviewern systematische Unterschiede
gibt
- wenn Untersuchungsergebnisse zwischen den Interviewern signifikant abweichen,
gegebenenfalls Eliminierung von Interviews
Technische Universität Berlin
Lehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Erhebungsmethoden und Messtheorie
34
Datenaufbereitung und Datenanalyse
Datenmatrix
•
•
Ausgangspunkt einer Auswertung ist eine maschienenlesbare Datenmatrix
Sie hat die allgemeine Form:
Messvariablen (hier: Fragen)
1 ................................... j ....................................... m
1
.
.
Fälle =
Messobjekte
(hier: APn)
.
i
.
Messwerte (Ausprägungen)
.
.
n
Technische Universität Berlin
Lehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Erhebungsmethoden und Messtheorie
35
Datenaufbereitung und Datenanalyse
Datenaufbereitung – lpsative Messwerte / Ipsativierung
Standardisierung
Problem: Statistische Bereinigung der Datenmatrix um personenspezifische,
vom Inhalt (Ausprägung des zu messenden Merkmals) unabhängige
Antworttendenzen.
Beispiel:
Befragter A - kreuzt Einstellungsskalen immer ganz extrem an (1; 7)
Befragter B - bevorzugt die Skalenmitte (3; 4; 5)
Befragter C - bevorzugt die linke Skalenhälfte (1; 2; 3)
usw.
Standardisierung:
Vorausgesetzt, dass die Ratings jedes Befragten eine
“Stichprobe aus dem Universum seiner Ratingantworten” sind,
können die genannten Quellen von Fehlervarianz durch zeilenweise
z-Standardisierung der Datenmatrix eliminiert werden.
Berechnung:
Σ
si = {1/ni Σ (xij - xj)2}1/2
zij = bereinigtes “Rating” von Person i bei Item j
xij = Ratings von Person i bei Item j
xj = itemspezifischer Mittelwert
si = personenspezifische Standardabweichung
ni = Zahl der abgegebenen Ratings von Person i
Wertebereich: gestutzte Normalverteilung
Technische Universität Berlin
Lehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Erhebungsmethoden und Messtheorie
36
Datenaufbereitung und Datenanalyse
Datenanalyse
• einfache Statistiken
– multivariate Verfahren
Technische Universität Berlin
Lehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Erhebungsmethoden und Messtheorie
37
Datenaufbereitung und Datenanalyse
Einfache Statistiken – univariate Statistiken
Aussage
Skalenniveau
Zentraltendenz
Nominal
Modalwert
x = xj
^
J = j (max(n j ))
Ordinal
Median
~
J = j (min(Σ n j ≥
j
X
i
j
nj
N
J
J0
Ju
Konzentrationsmaße, z.B.
Σj ( n 3j − n j )
K=
N3 − N
Quartilsabstand
D = ( x Jo − x ju ) / 2
x = xj
Metrisch
Streuung
N
))
2
Arithmetisches Mittel
1
x = ∑ xi
N i
3N
))
4
N
≥
))
4
Jo = j (min(∑ n j ≥
Ju = j (min(∑ n j
Standardabweichung
S=
1
N
∑ (x
i
−x
)
2
i
= Variable, z.B. Schulbildung
= Fall-Index, z.B. Person
= Ausprägungs-Index, z.B. Abitur
j
= Häufigkeit einer Ausprägung j,
j
= Fallzahl
= Index der Medien- bzw. Modal-Ausprägung, z.B. Mittlere Reife
= Index der oberen Quartilsausprägung, z.B. Abitur
= Index der unteren Quartilsausprägung, z.B. Hauptschule
Σn = N
Technische Universität Berlin
Lehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Erhebungsmethoden und Messtheorie
38
Datenaufbereitung und Datenanalyse
Boxplot
Grafische Statistik von Tukey
größter Wert
oberes Quartil
Boxlänge
umfaßt 50%
der Werte, den
“Kern in der
Mitte”
*
Medianwert
unteres Quartil
maximal eine
Boxlänge von
Box entfernt
kleinster Wert im
Streubereich
x
Ausreißerwert
Technische Universität Berlin
Lehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Erhebungsmethoden und Messtheorie
39
Datenaufbereitung und Datenanalyse
Bivariate Statistiken
Kriterien:
• Skalenniveau
• Zahl der Ausprägungen
• Grad der Aggregation
• Kausalrichtung der Hypothese
• Erhaltung wesentlicher Informationen
• Interpretations-Plausibilität
• Vergleichbarkeit (andere Untersuchungen)
Technische Universität Berlin
Lehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Erhebungsmethoden und Messtheorie
40
Datenaufbereitung und Datenanalyse
Prozentsatzdifferenz
Klausurerfolg
VorlesungsBesuch
a.V.
(1)
a.V.
(2)
Σ
u.V.
(1)
55
22%
183
51%
238
u.V.
(2)
199
78%
179
49%
378
Σ
254
362
Skalenniveau
: ab nominal
Zahl der Ausprägungen
:2x2
Aggregation
: Häufigkeiten
Kausalrichtung
: nicht notwendig
Information
: hier kein Verlust
Interpretation
: plausibel
Vergleichbarkeit
: nur gleiche Tabellenform
Problematik
: Zellenbesetzung
D = 29 %
= 51 - 22
= 78 - 49
616
Technische Universität Berlin
Lehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Erhebungsmethoden und Messtheorie
41
Datenaufbereitung und Datenanalyse
Vierfelderkorrelation Φ
a
b
a+b
c
d
c+d
a+c
b+d
N
−1 ≤ Φ =
a.d − b.c
≤ +1
( a + b).(c + d ).(a + c ).b + d )
Skalenniveau
: ab nominal
Zahl der Ausprägungen
:2x2
Aggregation
: Häufigkeiten
Kausalrichtung
: nicht notwendig
Information
: bei Nominaldaten vollständig
Interpretation
: χ2 – basiert, korrelationsäquivalent
Vergleichbarkeit
: gut
Technische Universität Berlin
Lehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Erhebungsmethoden und Messtheorie
42
Datenaufbereitung und Datenanalyse
Einfache Statistiken
Beispiel: Kendall´s τb
Bewertung:
τb misst den Grad, mit dem zwei verschiedene
Messvariablen die Messobjekte ähnlich rangordnen
Skalenniveau
ab ordinal (sonst keine Ordnung).
Zahl der Ausprägungen nicht zu wenig (sonst zahlreiche ties).
Aggregationgrad
Kausalrichtung
zweidimensionale Häufigkeitstabellen.
keine
Interpretation
plausibel (nomierter Konkordanzüberschuss)
Vergleichbarkeit
Tabellen mit gleicher Spalten- und Zeilenzahl
Kritik
τb kann bei “nicht-quadratischen” Tabellen die
Maximalwerte +1/-1 nicht erreichen
Da nur Ranginformation genutzt wird, ist die
optimal
Statistik bei höheren Skalenniveaus nicht
Technische Universität Berlin
Lehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Erhebungsmethoden und Messtheorie
43
Datenaufbereitung und Datenanalyse
Einfache Statistiken
Beispiel : Kendall´s τb
Zahlenbeispiel :
BRD
Japan
1968
3
5,84
1969
5
6,25
1970
7
6
1971
4,5
5,5
1972
3,5
4,25
1973
6
6
1974
6,5
9
1975
4,5
8
Technische Universität Berlin
Lehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Erhebungsmethoden und Messtheorie
44
Datenaufbereitung und Datenanalyse
Einfache Statistiken - Beispiel : Kendall´s τb
Auszählung der konkordanten (K), diskonkordanten (D) und gebundenen (T) Fälle am Zahlenbeispiel:
1968
1968
1969
1970
1971
1972
1973
1974
1975
-
K
K
D
D
K
K
K
-
D
K
K
D
K
D
-
K
K
Ty
D
D
-
K
K
K
Tx
-
K
K
K
-
K
D
-
K
1969
1970
1971
1972
1973
1974
Beispiel :
1975
X
Y
1971
4,5
5,5
1972
3,5
4,25
Ordnung:
Abstieg
Abstieg
τb =
Nc = 18
Nd = 8
Tx = 1
Ty = 1
-----------( ) = 28
N
2
-
Konkordanz
18 − 8
10
=
= 0,370
27
(18 + 8 + 1)(18 + 8 + 1)
Technische Universität Berlin
Lehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Erhebungsmethoden und Messtheorie
45
Datenaufbereitung und Datenanalyse
Einfache Statistiken - Beispiel : Kendall´s τb
Nc
Nd
Tx
Ty
= Zahl aller konkordant geordneten Paare von Fällen
= Zahl aller diskordant geordneten Paare von Fällen
= Zahl der Paare, die in der ersten Variablen wegen
gleicher Ausprägung nicht geordnet werden können
= Zahl der Paare, die in der zweiten Variablen wegen
gleicher Ausprägung nicht geordnet werden können
Die Gesamtzahl aller Paare von Fällen, die aus n Messobjekten
gebildet werden können,
N = Nc+Nd+Tx+Ty , ist
n
1


N = =
* n * ( n − 1)
2
 2
Technische Universität Berlin
Lehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Erhebungsmethoden und Messtheorie
46
Datenaufbereitung und Datenanalyse
Scheinkorrelation
• Beispiel: Mögliche Fehlinterpretationen eines Befundes aus Burda Marktforschung,
Typologie der Wünsche 1980, Bd. 2
• Von je 100 deutschen, mindestens 14-jährigen (Personen/ regelmäßigen Biertrinkern/
regelmäßigen Weintrinkern) stimmen folgende Anteile stark oder sehr stark der Norm zu:
“sich mindestens einmal im Jahr gründlich untersuchen zu lassen”:
bejaht stark / sehr stark
Personen gesamt
58%
regelmäßige Biertrinker
54%
regelmäßige Weintrinker
61%
Falsche Folgerung:
Biertrinker sind unterdurchschnittlich “gesundheitsbewusst”,
Weintrinker überdurchschnittlich.
Technische Universität Berlin
Lehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Erhebungsmethoden und Messtheorie
47
Datenaufbereitung und Datenanalyse
Scheinkorrelation – Fortsetzung des Beispiels
Aufgliederung des Befundes nach Geschlecht:
bejaht stark / sehr stark
gesamt
weiblich
männlich
Personen gesamt
58%
63%
51%
regelmäßige Biertrinker
54%
65%
49%
regelmäßige Weintrinker
61%
66%
54%
Die Scheinkorrelation zwischen “Gesundheitsbewusstsein” und “Getränkepräferenz”
entsteht durch die Hintergrundvariable Geschlecht:
Mehr Frauen als Männer lassen sich regelmäßig untersuchen (63% : 51%) und mehr
Männer als Frauen trinken regelmäßig Bier (72% : 46%);
(nicht in obigen Tabellen ausgewiesen!).
Geschlecht
Untersuchungshäufigkeit
Getränkepräferenz
Scheinkorrelation
Technische Universität Berlin
Lehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Erhebungsmethoden und Messtheorie
48
Datenaufbereitung und Datenanalyse
Weitere Beispiele für Scheinkorrelation
Hohe Korrelationen von
• Schuhgröße und Wortschatz
• Körpergröße und Haarlänge
Erklärungen?
Technische Universität Berlin
Lehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Erhebungsmethoden und Messtheorie
49
Datenaufbereitung und Datenanalyse
Scheinkorrelation heißt scheinbar ja oder scheinbar nein
Beispiel 2:
scheinbar hohe Korrelation
Beispiel 3:
scheinbar keine Korrelation
y
y
x
Bei Kontrolle von Z (Z1/Z2)
verschwindet der scheinbare
x-y-Zusammenhang
x
Bei Kontrolle von Z(x/o) zeigen sich
starke x-y-Zusammenhänge
Technische Universität Berlin
Lehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Erhebungsmethoden und Messtheorie
50
Datenaufbereitung und Datenanalyse
Signifikanztest - Beispiel: Chi-Quadrat-Test
Fragestellungen:
a) Vergleich von (2) empirischen Verteilungen miteinander
b) Vergleich einer empirischen mit einer theoretischen
Verteilung (z.B.Gleichverteilung)
Nullhypothese: Die (2) Häufigkeitsverteilungen sind statistisch gleich, beide
sind Stichproben aus derselben Population
Prüfstatistik:
Chi-Quadrat-Verteilung mit k-1 Freiheitsgraden;
k= Zahl der Kategorien (beim Vergleich von m Verteilungen
miteinander: (k-1)(m-1) Freiheitsgrade)
Technische Universität Berlin
Lehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Erhebungsmethoden und Messtheorie
51
Datenaufbereitung und Datenanalyse
Signifikanztest - Beispiel: Chi-Quadrat-Test
Testgröße:
X
2
=
∑
(
−
f
0
f
e
)
f
f
2
f
e
0
e
= beobachtete (observed)
Zellenbesetzung
= aufgrund der Nullhypothese zu
erw. (expected) Zellenbesetzung
Anwendungsvoraussetzungen:
klassifizierte bzw. nominal skalierte Daten mit gleicher Klasseneinteilung der zu
vergleichenden Samples
Zellenbesetzungen dürfen nicht als Relativzahlen eingesetzt werden, sondern als
absolute
Häufigkeiten
fe
darf in keiner Zelle kleiner als 5 sein, sonst ist
verteilt
x
2
nicht mehr annähernd Chi-Quadrat-
Technische Universität Berlin
Lehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Erhebungsmethoden und Messtheorie
52
Datenaufbereitung und Datenanalyse
Nur ein Test je Hypothese!
Wenn keine Hypothesen vorliegen (explorative Untersuchung) oder mehrere
Signifikanztests je Hypothese gerechnet werden, ist Fehler erster Art (richtige
Nullhypothese fälschlich abgelehnt) größer als Tabellenwert α
Beispiel 1:
Umfrage mit 100 Variablen (mögliche u.V.) und einer a.V.
Selbst wenn alle 100 Nullhypothesen H0 stimmen (reine
Zufallsvariablen),
sind bei α = 5% fünf “signifikante” Ergebnisse zu erwarten.
Beispiel 2:
Eine Suche nach signifikanten Korrelationen zwischen sämtlichen
Paaren der 100 Variablen dieser Untersuchung ergibt,
obwohl sämtliche Nullhypothesen H0 stimmen (reine Zufallsvariablen),
248 “signifikante” Korrelationen
(5% der rechenbaren Signifikanztests, das sind 100 oder 4950 Tests)
2
Fazit: Nie Signifikanztests rechnen, wenn nicht genau eine Hypothese vorliegt
Technische Universität Berlin
Lehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Erhebungsmethoden und Messtheorie
53
Datenaufbereitung und Datenanalyse
Prüfstatistik
Durchführung eines Signifikanztests
1.
2.
3.
4.
5.
Formulierung der Nullhypothese (H0) aus der erwarteten Hypothese (HA)
Spezifizierung der Teststatistik (siehe Kriterien der Testauswahl)
Festlegung des Signifikanzniveaus α (Fehler 1. Art); Konservatismus-Entscheidung
Berechnung der Wahrscheinlichkeit p dafür, daß im Falle der Gültigkeit von H0 die empirisch
vorgefundenen Daten auftreten konnten
Entscheidung für H0 falls p > α, sonst Beibehaltung der Alternativhypothese HA
Häufigste Fehler:
•
•
•
•
•
Signifikanz als Effektstärke interpretiert; kleine Effekte können signifikant sein vice versa
es gab keine (oder zahlreiche) Hypothesen; Test nur bei einer Hypothese zulässig
falsche Teststatistik (z.B. zu hoch angenommenes Skalenniveau)
zweiseitige Hypothese einseitig getestet - vice versa (Folge: falsche Interpretation)
Verbundenheit von Stichproben nicht beachtet (Folge: zu konservatives Testen)
Technische Universität Berlin
Lehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Erhebungsmethoden und Messtheorie
54
Datenaufbereitung und Datenanalyse
Signifikanztest – Ist die Hypothese gerichtet?
• Konservativitätsgrundsatz:
• Gerichtete Hypothesen können einseitig, ungerichtete Hypothesen müssen zweiseitig
getestet werden.
• Zweiseitiger Test gerichteter Hypothesen erhöht den Fehler zweiter Art.
• Einseitiger Test ungerichteter Hypothesen erhöht den Fehler erster Art (ist konservativ).
Einseitiger Test: “Sonderangebotspolitik senkt die Markentreue“
α
Rejektionsbereich
Markentreue
Zweiseitiger Test: “Sonderangebotspolitik beeinflusst die Markentreue“
α/2
α/2
Markentreue
Rejektionsbereich
Rejektionsbereich”
”Erhöhung”
Senkung”
(Fehler erster Art auf zwei Seiten verteilt, H0 wird eher beibehalten)
Technische Universität Berlin
Lehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Erhebungsmethoden und Messtheorie
55
Datenaufbereitung und Datenanalyse
Prüfstatistik
Kriterien für Testmodellwahl
• Deskriptivstatistik, in der Hypothese ausgedrückt ist
(u.a. arithmetisches Mittel, Häufigkeitsverteilung, Korrelation)
• Zahl der zu vergleichenden Stichproben (1, 2, viele)
• Verbundenheit zu vergleichenden Stichprobe (ja, nein)
• Hypothesenrichtung (einseitig, zweiseitig)
• formale Anforderungen (Skalenniveau, Verteilungsparameter)
• Konservativismus (Risiko des Fehlers erster Art)
Technische Universität Berlin
Lehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Erhebungsmethoden und Messtheorie
56
Datenaufbereitung und Datenanalyse
Prüfstatistik – Ausgewählte Testmodelle für Nominaldaten
Prüfstatistik
Nominal
Häufigkeiten
Ordinal
Rangordnungen
eine
Gruppe
zwei
Gruppen
Metrisch
Meßwerte
viele
Gruppen
2-kategorialer
Binomialtest
unabhängig:
Chi-Quadrat-Test
unabhängig:
Chi-Quadrat-Test
k-kategorialer
Chiquadrattest
abhängig:
McNemar-Test
abhängig:
Cochran Q-Test
Technische Universität Berlin
Lehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Erhebungsmethoden und Messtheorie
57
Datenaufbereitung und Datenanalyse
Prüfstatistik – Ausgewählte Testmodelle für Ordinaldaten
Prüfstatistik
Nominal
Häufigkeiten
zwei
Gruppen
eine
Gruppe
Kolmogorov
SmirnovTest
unabhängig:
Mediantest
U-Test
Metrisch
Meßwerte
Ordinal
Rangordnungen
abhängig:
Signtest
Wilcoxontest
viele
Gruppen
unabhängig:
Kruskal-WallisH -Test
abhängig:
Friedmanns
Rang -VA
Technische Universität Berlin
Lehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Erhebungsmethoden und Messtheorie
58
Datenaufbereitung und Datenanalyse
Signifikanz und Stichprobenumfang
Sechs unabhängige Untersuchungen derselben Hypothese über einen Marketingeffekt
haben bei verschiedenen Stichprobengrößen auf unterschiedlichem Signifikanzniveau (siehe α)
sämtlich signifikante Ergebnisse gebracht:
Untersuchung
1
2
3
4
5
6
Rang
Stichprobenumfang
200
200
1.000
100
8.000
800
Signifikanzniveau Irrtumswahrscheinlichkeit
schwach signifikant
α < 7,5%
schwach signifikant
α < 10%
hoch signifikant
α < 1%
hoch signifikant
α < 1%
signifikant
α < 5%
signifikant
α < 5%
Bewerten Sie den Wert der Studien hinsichtlich ihrer Beiträge
zur wissenschaftlichen Lösung des betreffenden Marketingproblems
Rangordnen Sie dazu alle Untersuchungen (1=beste, 6=schwächste Studie) in Spalte „ „
(Ziffer 1-6 eintragen) je nachdem, wie ihr Erkenntnisbeitrag für die Wissenschaft Ihres Erachtens ist
Technische Universität Berlin
Lehrstuhl Marketing Professor Dr. Volker Trommsdorff
Marktforschung – Erhebungsmethoden und Messtheorie
59