Statistische Erhebung und Auswertung von Daten

Werbung
Statistische Erhebung und Auswertung
von Daten zum Verbraucherverhalten
von Jugendlichen der 8. Klasse
Schriftliche Hausarbeit im Rahmen der Ersten Staatsprüfung für das Lehramt für
die Sekundarstufe II mit Zusatzprüfung für die Sekundarstufe I, dem Staatlichen
Prüfungsamt für Erste Staatsprüfungen für Lehrämter an Schulen in Dortmund
vorgelegt von:
Miriam Hillemann
Siegen, den 14.12.2006
Themensteller: XXX
Universität Siegen
Fachbereich Mathematik
Inhaltsverzeichnis
I. Theoretische Überlegungen
8
1. Einleitung
9
2. Hypothesenbildung
2.1. Hypothesentypen . . . . . . . . . . . . . . . . . . . .
2.1.1. Wenn-dann-Hypothesen . . . . . . . . . . . .
2.1.2. Je-desto-Hypothesen . . . . . . . . . . . . . .
2.1.3. Individual- Kollektiv- und Kontexthypothesen
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
11
12
12
12
13
3. Repräsentativität
15
4. Fragebogenkonstruktion
4.1. Frageformen . . . . . . . . . . . . . . . . .
4.2. Frageformulierung . . . . . . . . . . . . . .
4.3. Anordnung der Fragen im Erhebungsbogen
4.4. Vortest . . . . . . . . . . . . . . . . . . . .
17
17
18
20
21
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
5. Über die Mathematik in der Statistik
22
6. Stochastische Grundlagen
6.1. Allgemeine Grundlagen . . . . . . . . . .
6.2. Konkrete Wahrscheinlichkeitsverteilungen
6.2.1. Diskrete Verteilungen . . . . . . .
6.2.2. Stetige Verteilungen . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
23
23
27
27
28
7. Parameterschätzung
7.1. Punktschätzung . . . . . . . . . . . . . . . . . .
7.1.1. Gütekriterien . . . . . . . . . . . . . . .
7.1.2. Konstruktion von Schätzfunktionen . . .
7.2. Intervallschätzung . . . . . . . . . . . . . . . . .
7.2.1. Intervallschätzer für den Erwartungswert
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
30
30
30
33
37
38
.
.
.
.
.
40
40
41
41
43
44
8. Hypothesentest
8.1. Grundidee statistischer Tests . . . . . .
8.2. Binomialtest . . . . . . . . . . . . . . .
8.2.1. Exakter Binomialtest . . . . . .
8.3. Vergleich zweier relativer Häufigkeiten
8.4. χ2 -Anpassungstest . . . . . . . . . . .
9. Verteilungsfreie Testverfahren
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
45
2
Inhaltsverzeichnis
9.1. Tabellenanalyse und Unabhängigkeitstest . . . . .
9.1.1. Spaltenprozentuierung . . . . . . . . . . .
9.1.2. Fisher-Test . . . . . . . . . . . . . . . . .
9.1.3. Yates-Test . . . . . . . . . . . . . . . . . .
9.1.4. χ2 -Unabhängigkeitstest für 2 × 2-Tabellen
9.1.5. χ2 -Unabhängigkeitstest für m × n-Tabellen
9.2. Wilcoxon-Rangsummentest . . . . . . . . . . . . .
9.2.1. Exakter Rangsummentest . . . . . . . . .
9.2.2. Approximativer Rangsummentest . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
45
48
49
51
51
52
57
58
59
10.Regressionsanalyse
61
10.1. Multiple kategoriale Regression . . . . . . . . . . . . . . . . . . . . . 62
II. Praktische Anwendung
66
11.Aufbau der Untersuchung
11.1. Konkretisierung des Forschungsthemas .
11.1.1. Erste Theorie . . . . . . . . . . .
11.1.2. Zweite Theorie . . . . . . . . . .
11.1.3. Dritte Theorie . . . . . . . . . . .
11.2. Zur Repräsentativität der Untersuchung
11.3. Die Entwicklung des Fragebogens . . . .
67
67
67
68
71
74
75
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
12.Durchführung der Untersuchung
77
13.Untersuchung der ersten Theorie
13.1. Unterscheidet sich die durchschnittliche Taschengeldhöhe nach Schulform? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
13.1.1. Versuch der Anpassung einer Normalverteilung . . . . . . .
13.1.2. Wilcoxon-Rangsummentest . . . . . . . . . . . . . . . . . . .
13.2. Ist die Wahrscheinlichkeit, dass ein Gymnasiast kein Taschengeld erhält, höher als das ein Hauptschüler kein Taschengeld erhält? . . . .
13.2.1. Vergleich zweier relativer Häufigkeiten . . . . . . . . . . . .
13.2.2. Exakter Binomialtest . . . . . . . . . . . . . . . . . . . . . .
13.3. Leihen sich Gymnasiasten und Hauptschüler seltener Geld als Realschüler? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
13.3.1. Exakter Binomialtest . . . . . . . . . . . . . . . . . . . . . .
13.4. Hängt das Sparverhalten der Jugendlichen mit der Schulform zusammen? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
13.4.1. χ2 -Unabhängigkeitstest . . . . . . . . . . . . . . . . . . . . .
13.5. Hängt das Sparverhalten der Jugendlichen mit der Taschengeldhöhe
zusammen? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
13.5.1. χ2 -Unabhängigkeitstest . . . . . . . . . . . . . . . . . . . . .
13.6. Hängt das Sparverhalten der Jugendlichen stärker von der Schulform
oder der Taschengeldhöhe ab? . . . . . . . . . . . . . . . . . . . . .
13.6.1. Multiple Regressionsanalyse . . . . . . . . . . . . . . . . . .
13.7. Unterscheidet sich das Verhältnis zum Geld der Schüler je nach Schulform? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
13.7.1. χ2 -Unabhängigkeitstest . . . . . . . . . . . . . . . . . . . . .
78
3
. 78
. 80
. 83
. 86
. 86
. 87
. 88
. 89
. 91
. 91
. 93
. 94
. 95
. 95
. 96
. 97
Inhaltsverzeichnis
13.8. Fazit zur ersten Theorie . . . . . . . . . . . . . . . . . . . . . . . . . 98
14.Untersuchung der zweiten Theorie
14.1. Unterscheidet sich das Informationsverhalten je nach Schulform? . . .
14.1.1. χ2 -Unabhängigkeitstest . . . . . . . . . . . . . . . . . . . . . .
14.2. Unterscheiden sich die Informationsquellen je nach Schulform? . . . .
14.2.1. Ungewichteter χ2 -Unabhängigkeitstest . . . . . . . . . . . . .
14.2.2. Gewichteter χ2 -Unabhängigkeitstest . . . . . . . . . . . . . . .
14.3. Wofür verwenden Schüler der achten Klasse ihr Taschengeld? . . . . .
14.4. Vergleichen Gymnasiasten häufiger Preise als Hauptschüler Preise? . .
14.4.1. χ2 -Unabhängigkeitstest . . . . . . . . . . . . . . . . . . . . . .
14.4.2. Exakter Binomialtest . . . . . . . . . . . . . . . . . . . . . . .
14.5. Hat die Schulform einen Einfluss darauf, ob ein Schüler ein zielstrebiges Einkaufsverhalten hat? . . . . . . . . . . . . . . . . . . . . . . .
14.5.1. χ2 -Unabhängigkeitstest . . . . . . . . . . . . . . . . . . . . . .
14.6. Welche siegener Bekleidungsgeschäfte sind am beliebtesten? . . . . .
14.7. Kaufen Schüler höherer Schulformen in preisgünstigeren Geschäften? .
14.7.1. Ungewichteter χ2 -Unabhängigkeitstest . . . . . . . . . . . . .
14.7.2. Exakter Binomialtest . . . . . . . . . . . . . . . . . . . . . . .
14.7.3. Unterscheidet sich das Einkaufsverhalten der Schüler je nach
Schulform? . . . . . . . . . . . . . . . . . . . . . . . . . . . .
14.7.4. χ2 - Unabhängigkeitstest . . . . . . . . . . . . . . . . . . . . .
14.8. Fazit zur zweiten Theorie . . . . . . . . . . . . . . . . . . . . . . . . .
15.Untersuchung der dritten Theorie
15.1. Unterscheidet sich die tägliche Fernsehnutzungsdauer der Jugendlichen je nach Schulform? . . . . . . . . . . . . . . . . . . . . . . . .
15.1.1. χ2 -Unabhängigkeitstest . . . . . . . . . . . . . . . . . . . . .
15.2. Unterscheiden sich die Uhrzeiten, zu denen Jugendliche Fernsehen
schauen je nach Schulform? . . . . . . . . . . . . . . . . . . . . . .
15.2.1. Gewichteter χ2 -Unabhängigkeitstest . . . . . . . . . . . . . .
15.3. Schauen Schüler höherer Schulformen häufiger öffentlich-rechtliche
Fernsehsender als Schüler niedrigerer Schulformen? . . . . . . . . .
15.3.1. χ2 -Unabhängigkeitstest . . . . . . . . . . . . . . . . . . . . .
15.4. Sind Schüler einer höheren Schulform täglich weniger Werbeminuten
ausgesetzt als Schüler einer niedrigeren Schulform? . . . . . . . . .
15.5. Haben Schüler einer höheren Schulform ein besseres Fernsehnutzungsverhalten als Schüler einer niedrigeren Schulform? . . . . . . . . . .
15.5.1. χ2 -Unabhängigkeitstest . . . . . . . . . . . . . . . . . . . . .
15.6. Fazit zur dritten Theorie . . . . . . . . . . . . . . . . . . . . . . . .
16.Resumee
99
99
99
100
101
102
103
104
105
106
107
108
109
110
111
112
114
115
115
118
. 118
. 119
. 120
. 121
. 123
. 123
. 124
. 126
. 127
. 127
129
4
Inhaltsverzeichnis
III. Anhang
132
A. Die Sammlung der Fragen aus dem Seminar
133
B. Fragebogenprototyp
136
C. Fragebogen
138
Literaturverzeichnis
141
5
Tabellenverzeichnis
2.1.
Individual, Kollektiv- und Kontexthypothesen . . . . . . . . . . . . . . 14
8.1.
8.2.
Entscheidungsregeln für den exakten Binomialtest . . . . . . . . . . . . 43
Entscheidungsregeln zum Vergleich zweier Wahrscheinlichkeiten . . . . 44
9.1.
9.2.
9.3.
Kontingenztafeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
Entscheidungsregeln für den exakten Wilcoxon-Rangsummentest . . . . 59
Entscheidungsregeln für den approximativen Rangsummentest . . . . . 60
11.1. Interpretationsregeln für das Verhältnis zum Geld . . . . . . . . . . . . 68
11.2. Interpretationsregeln zum Einkaufsverhalten der Schüler . . . . . . . . 71
11.3. Interpretationsregeln zum Fernsehnutzungsverhalten der Schüler . . . . 73
12.1. Umfragetermine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
13.1.
13.2.
13.3.
13.4.
13.5.
13.6.
13.7.
13.8.
13.9.
13.10.
13.11.
13.12.
13.13.
Anzahl der Schüler die Taschengeld erhalten . . . . . . . . . . . . . . .
Durchschnittliche Taschengeldhöhe sortiert nach Schulformen . . . . . .
Klasseneinteilung und die berechneten Werte für den χ2 -Anpassungstest
Anzahl der Schüler die kein Taschengeld erhalten . . . . . . . . . . . .
Vierfeldertafel zum Taschengeld . . . . . . . . . . . . . . . . . . . . . .
Absolute Häufigkeiten des Geldleihverhaltens . . . . . . . . . . . . . . .
Absolute Häufigkeiten des Geldleihverhaltens klassifiziert . . . . . . . .
Anzahl der Schüler die einen Nebenjob besitzen . . . . . . . . . . . . .
Absolute Häufigkeiten des Sparverhaltens . . . . . . . . . . . . . . . . .
Absolute Häufigkeiten des Sparverhaltens klassifiziert . . . . . . . . . .
Relative Häufigkeiten des Sparverhaltens . . . . . . . . . . . . . . . . .
Erwartete Häufigkeiten des Sparverhaltens . . . . . . . . . . . . . . . .
Die Relation der Taschengeldhöhe zum Sparverhalten getrennt nach
Schulformen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
13.14. Sparverhalten zur Taschengeldrelation . . . . . . . . . . . . . . . . . .
13.15. Das Verhältnis zum Geld der Schüler in absoluten Häufigkeiten dargestellt
14.1. Absolute Daten der Schüler, die sich über ein Produkt informieren,
wenn sie es kaufen möchten . . . . . . . . . . . . . . . . . . . . . . .
14.2. Genutzte Informationsquellen . . . . . . . . . . . . . . . . . . . . . .
14.3. Qualität der Informationsquellen . . . . . . . . . . . . . . . . . . . .
14.4. Ungewichtete absolute Häufigkeiten und prozentuale Anteile zu den
genutzte Informationsquellen unterschieden nach ihrer Qualität . . .
14.5. Ungewichtete relative und erwartete Häufigkeiten zu den genutzte Informationsquellen unterschieden nach ihrer Qualität . . . . . . . . . .
14.6. Gewichtete absolute, relative und erwartete Häufigkeiten zu den genutzten Informationsquellen, unterschieden nach ihrer Qualität . . . .
14.7. Wofür geben Jugendliche der achten Klasse ihr Taschengeld aus? . . .
6
78
78
82
86
87
88
89
90
91
91
92
92
93
94
96
. 99
. 100
. 101
. 101
. 102
. 103
. 104
Tabellenverzeichnis
14.8. Preisvergleich in absoluten Häufigkeiten . . . . . . . . . . . . . . . .
14.9. Wie oft gehen Schüler der achten Klasse los um etwas bestimmtes zu
kaufen und kaufen dann etwas völlig anderes? . . . . . . . . . . . . .
14.10. Die bei Jugendlichen der achten Klasse beliebtesten Geschäfte, in denen
Bekleidung gekauft werden kann . . . . . . . . . . . . . . . . . . . . .
14.11. Siegener Bekleidungsgeschäfte nach ihrem Preisniveau sortiert . . . .
14.12. Welche Geschäfte bevorzugen Schüler unterschiedlicher Schulformen?
14.13. Zusammenfassung von Tabelle 14.12 . . . . . . . . . . . . . . . . . .
14.14. Das Einkaufsverhalten von Schülern der achten Klasse getrennt nach
Schulform . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
15.1.
15.2.
15.3.
15.4.
15.5.
15.6.
15.7.
15.8.
15.9.
. 105
. 108
.
.
.
.
. 114
Fernsehnutzungsdauer der Jugendlichen in Stunden . . . . . . . . . . .
Richtungstest . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Fernsehnutzungszeiten von Montags bis Freitags . . . . . . . . . . . . .
Fernsehnutzungszeiten am Wochenende . . . . . . . . . . . . . . . . . .
Gewichtete Klassifizierung der Fernsehnutzungszeiten von Montag bis
Freitag . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Gewichtete Klassifizierung der Fernsehnutzungszeiten am Wochenende .
Anzahl der Schüler, die die öffentlich-rechtlichen Fernsehsender nutzen
Fernsehnutzungsverhalten von Schülern der achten Klasse . . . . . . . .
Richtungstest zum Fernsehnutzungsverhalten . . . . . . . . . . . . . . .
7
109
110
111
112
118
120
120
120
121
121
123
126
127
Teil I.
Theoretische Überlegungen
8
1. Einleitung
Mit der Entwicklung der neuen „Rahmenvorgabe für die ökonomische Bildung in
der Sekundarstufe I“, die ab dem Schuljahr 2005/06 in NRW verbindlich umgesetzt
werden muss, hat eine Umbruchsphase für die Vermittlung wirtschaftlicher Inhalte
in allen Schulformen begonnen. Die Lernbereiche Arbeitslehre, Gesellschaftslehre,
Erdkunde, Geschichte und Politik, welche künftig für die ökonomische Bildung in
der Schule zuständig sind, sollen nicht nur Wissen vermitteln, sondern sie sollen sich
an einem Kompetenzbegriff orientieren, der folgendermaßen definiert ist:
"[...]‘die bei Individuen verfügbaren oder von ihnen erlernbaren kognitiven Fähigkeiten und Fertigkeiten, bestimmte Probleme zu lösen, sowie
die damit verbundenen motivationalen, volitionalen und sozialen Bereitschaften und Fähigkeiten, die Problemlösungen in variablen Situationen
erfolgreich und verantwortungsvoll nutzen zu können.“ 1 .
Diesem Ansatz liegt die Vorstellung zu Grunde, dass „Kompetenzen zur Bewältigung ökonomisch bedeutsamer Problemstellungen [...] ein unverzichtbarer Bestandteil der Allgemeinbildung und der berufsvorbereitenden Bildung“ 2 sind. Dabei werden die ökonomischen Kompetenzen in drei Teilbereiche ausdifferenziert, nämlich in
„Sachkompetenz“, „Urteilskompetenz“ und „Entscheidungs-/Handlungskompetenz“ 3 .
Hierbei versteht man unter der Sachkompetenz, „die Verfügung über grundlegende wirtschaftliche Kenntnisse und Methoden, die zum Verständnis ökonomischer
Strukturen und Prozesse notwendig sind“ 4 . Die ökonomische Sachkompetenz ist von
Bedeutung um in konkreten wirtschaftlichen Situationen urteilen und handeln zu
können. Die Urteilskompetenz meint die Fähigkeit, selbstständig ökonomische Situationen beurteilen zu können5 und die Handlungskompetenz bezieht sich auf „die
aktiven Bewältigung von ökonomischen Situationen“ 6 .
Ausgangspunkt des Forschungsinteresses an den ökonomischen Kompetenzen von
Jugendlichen sind einerseits die häufig vorgebrachten Klagen (z. B. von den Eltern,
der Schulen und der Wirtschaft), dass Jugendliche keine Kenntnisse über wirtschaftlichen Zusammenhänge besäßen, andererseits der offenkundige Sachverhalt, dass
Jugendliche eine wichtige Konsumentengruppe sind und als solche heftig umworben werden. Hinzu kommt, dass in der öffentlich geführten Verschuldungsdebatte,
die vor allem von Jugend- und Verbraucherschutzeinrichtungen auf der Grundlage
empirischer Befunde angestoßen wird, zunehmend deutlich wird, dass Jugendliche
nicht mehr mit den ihnen zur Verfügung stehenden finanziellen Mitteln auskommen.
1
Bundesministerium für Bildung und Forschung (2003) S. 72.
Ministerium für Schule, Jugend und Kinder des Landes Nordrhein-Westfalen (2004) S. 7.
3
Ministerium für Schule, Jugend und Kinder des Landes Nordrhein-Westfalen (2004) S. 15.
4
Ministerium für Schule, Jugend und Kinder des Landes Nordrhein-Westfalen (2004) S. 15.
5
Vgl. Ministerium für Schule, Jugend und Kinder des Landes Nordrhein-Westfalen (2004) S. 16.
6
Vgl. Ministerium für Schule, Jugend und Kinder des Landes Nordrhein-Westfalen (2004).
2
9
1. Einleitung
Deswegen tritt häufig eine Diskrepanz zwischen dem Streben nach Bedürfnisbefriedigung und den dazu erforderlichen, aber nicht vorhandenen finanziellen Mitteln
auf.
Vor diesem Hintergrund entwickelte sich die Forschungsfrage danach, ob Jugendliche
durch ihre Lebenspraxis als Konsumenten wirtschaftliche Kompetenzen unabhängig
vom Schulunterricht erwerben oder ob sie wirtschaftlich aktiv sind, ohne dass ihnen dabei ökonomische Zusammenhänge bewusst sind. In dieses Forschungsprojekt
ist meine Untersuchung: „Das Verbraucherverhalten von Jugendlichen der achten
Klasse“ eingebunden.
Da es in den bekannten Sozialstrukturanalysen Hinweise auf schichtspezifisches Verhalten in bestimmten Bereichen gibt und da Vermutungen bestehen, dass sich Kinder aus unterschiedlichen Schichten auf unterschiedliche Schulformen konzentrieren,
war es für mich von Interesse, das Verbraucherverhalten im Zusammenhang mit der
Schulform zu untersuchen.
In der folgenden Untersuchung beschränke ich mich auf Jugendliche der achten Klasse, also auf in den meisten Fällen 14-jährige Jugendliche, da diese zunehmend von
der Werbung als auch in ihrem eigenen Selbstbild als selbstständige Konsumenten
wahrgenommen werden.
Für die Untersuchung wurden solche Bereiche in den Blick genommen, mit denen Jugendliche vertraut sind, z. B. Taschengeld, Konsum, Mediennutzung und in denen
zugleich durch die Reflexion der Zusammenhänge grundlegende ökonomische Kategorien wie z. B. Kosten-Nutzen-Überlegungen oder Handeln unter Restriktionen
prinzipiell erlernt werden könnten.
Im Rahmen der Bemühungen um die Entwicklung nationaler Bildungsstandards
könnten die Ergebnisse der Untersuchung einerseits einen Beitrag leisten für die
Entwicklung von Diagnoseverfahren, die z. B. bei der Konstruktion von Tests für
Lernstandserhebungen bei dem realen Konsumentenverhalten der Jugendlichen ansetzten. Auf der anderen Seite – gleichzeitig mit dem vorherigen Gesichtspunkt verknüpft – könnten von den Untersuchungsergebnissen Impulse zu einer stärkeren
Orientierung des Wirtschaftsunterrichts an der Lebenssituation der Schülerinnen
und Schüler ausgehen. Auf diese Weise könnte der Auftrag erfüllt werden, Schüler
über die Vermittlung von Sach- und Urteilskompetenz hinaus dazu zu befähigen, in
relevanten Lebenssituationen kompetent zu entscheiden und zu handeln.
10
2. Hypothesenbildung
Um das Forschungsthema zu problematisieren und zu konkretisieren ist die Bildung
von Hypothesen notwendig. Eine Hypothese ist in der Regel eine Vermutung über
einen Tatbestand. Im Kontext sozialwissenschaftlicher Theorien wird unter einer
Hypothese eine Vermutung über einen Zusammenhang zwischen mindestens zwei
Sachverhalten verstanden. Daher nennt man solche Hypothesen auch Zusammenhangshypothesen.7
Die einzelnen Variablen8 innerhalb einer Hypothese müssen keinen kausalen Zusammenhang aufweisen. So könnte es sein, dass beide Variablen der Hypothese eine
Folgerung eines dritten nicht betrachteten Merkmals sind. Eine gültige Hypothese
wäre: Je besser ausländische Kinder die deutsche Sprache beherrschen, desto höher
ist ihr Allergierisiko. Hier könnte der Zusammenhang aus einem dritten Faktor, z. B.
der Höhe der Integration (Annahme deutscher Essgewohnheiten, Hygiene), folgen.
Hypothesen entwickeln sich aus theoretischen Vorüberlegungen, daher bestimmen
sie bis zu einem gewissen Grad die Auswahl der zu untersuchenden Merkmale. Aus
diesem Grund ist die Konstruktion eines Fragebogens erst nach der Hypothesenbildung möglich.9
Bei der Hypothesenbildung ist es gleichgültig, wie der Forscher zu diesen gelangt. Er
kann sie z. B. aus seinem Alltagsvorverständnis über einen Tatbestand, aus Zeitungsberichten oder aus Beobachtungen entwickeln. Hierbei ist ausschließlich interessant,
ob sich die Vermutungen des Forschers empirisch widerlegen oder bestätigen lassen.
Die Hypothesenbildung ist umso einfacher, je eingegrenzter der Forschungsgegenstand ist.
Für die Untersuchung werden die einzelnen Hypothesen zu einer Theorie zusammengefasst. In den Sozialwissenschaften wird unter einer Theorie „ein System logisch
widerspruchsfreier Aussagen über den jeweiligen Untersuchungsgegenstand mit den
zugehörigen Definitionen der verwendeten Begriffe“ 10 verstanden.
Empirische Theorien haben drei Anforderungen zu erfüllen11 :
1. Die Hypothesen müssen einen Bezug zur Realität haben und prinzipiell empirisch falsifizierbar sein.
2. Die einzelnen Hypothesen stehen in einem erkennbaren Zusammenhang zueinander und beziehen sich auf den gleichen Gegenstandsbereich.
7
Vgl. Kromrey (2006) S. 53.
Eine Variable bezeichnet ein Merkmal oder eine Eigenschaft von Personen, Gruppen, Organisationen oder anderen Merkmalsträgern.
9
Vgl. Kromrey (2006) S. 53.
10
Kromrey (2006) S. 52.
11
Kromrey (2006) S. 54.
8
11
2. Hypothesenbildung
3. Die Aussagen müssen miteinander logisch verträglich sein. Das heißt, sie dürfen
sich nicht gegenseitig widersprechen.
2.1. Hypothesentypen
In den Naturwissenschaften werden fast immer deterministische Hypothesen verwendet. Diese stellen einen exakten, ausnahmslos gültigen Zusammenhang zwischen
verschiedenen Variablen dar. Da in den Sozialwissenschaften hingegen in der Regel
mit probabilistischen Hypothesen gearbeitet wird, betrachte ich im Folgenden nur
diese Hypothesenart. Im Falle solcher Hypothesen treffen Zusammenhänge nur mit
einer gewissen Wahrscheinlichkeit zu.12 Eine Hypothese gilt dann als erwiesen, falls
eine hinreichende Übereinstimmung zwischen der Hypothese und der beobachtbaren
Erfahrungswelt besteht.13
Im Folgenden werden Hypothesen die den Zusammenhang zwischen zwei Variablen
darstellen betrachtet. Mit diesen trifft der Forscher Aussagen über die abhängige
Variable B unter der Bedingung des Wertes der unabhängigen Variablen A.
2.1.1. Wenn-dann-Hypothesen
Wenn-dann-Hypothesen stellen den Bezug zweier dichotomer Variablen (Variablen,
die nur zwei Zustände annehmen können) dar. Es gibt zwei Arten von Wenn-dannHypothesen, die auf der Aussagenlogik basieren14 :
1. Die Implikationshypothesen stellen eine logische Folgerung zwischen zwei Aussagen dar. Das heißt, wenn A eintritt, dann wird B erwartet. Demzufolge ist
A eine hinreichende Bedingung für B.
2. Die Äquivalenzhypothesen stellen eine „genau-dann-wenn-Beziehung“ dar. Das
heißt, wenn A eintritt dann wird B erwartet und wenn ¬A eintritt dann wird
¬B erwartet. Demzufolge ist A eine hinreichende und notwendige Bedingung
für B.
2.1.2. Je-desto-Hypothesen
Je-desto-Hypothesen stellen den Bezug zwischen zwei ordinalen Variablen (Variable,
deren Werte eine Ordnung zulassen) dar. Die einfachsten Formen dieser Hypothesen
stellen monotone Zusammenhänge dar. Diese Zusammenhänge können15
• monoton steigend sein, d. h. je größer der Wert der unabhängigen Variablen
A, desto größer ist der Wert der abhängigen Variablen B.
• monoton fallend sein, d. h. je größer der Wert der unabhängigen Variablen A,
desto kleiner ist der Wert der abhängigen Variablen B.
12
Vgl.
Vgl.
14
Vgl.
15
Vgl.
13
Diekmann (2005) S. 107f.
Mayer (2002) S. 17.
Diekmann (2005) S. 108.
Diekmann (2005) S. 112.
12
2. Hypothesenbildung
Zudem können Je-desto-Hypothesen auch nicht monotone Zusammenhänge darstellen. Beispiele hierfür sind u-förmige oder umgekehrt u-förmige Zusammenhänge,
welche sich z. B. als eine nach oben oder unten geöffneten Parabel darstellen lassen. Da sich solche Zusammenhänge nicht als Je-desto-Hypothesen ausdrücken lassen, werden diese in der Regel abschnittsweise formuliert. Für einen u-förmigen
Zusammenhang heißt das, dass bis zum Minimum ein monoton fallender und ab
da ein monoton steigender Zusammenhang besteht. Bei umgekehrt u-förmigen Zusammenhängen gilt dies analog. Das bedeutet für die Hypothesenformulierung, dass
nicht monotone Zusammenhänge als mehrere Je-desto-Hypothesen formuliert werden müssen.
Durch die Angabe einer mathematische Funktion kann die Je-desto-Hypothese präzisiert werden. Hierbei steigt der Informationsgehalt gegenüber der unspezifischen
Hypothesenform.16
y
Art des Zusammenhangs
(1) linear steigend:
y = bx + c mit b > 0
(2) linear fallend:
y = bx + c mit b < 0
(3) exponentiell steigend:
y = aebx mit b > 0
(4) exponentiell fallend:
y = aebx mit b < 0
(5) logarithmisch:
y = a · log(bx + x)
(1)
(3)
(5)
(2)
(4)
x
Abbildung 2.1.: Verschiedene spezielle Je-desto-Hypothesen17
Zum besseren Verständnis können jedoch Wenn-dann- und Je-desto-Hypothesen in
anderer Form formuliert werden, wenn implizit klar ist, welcher Hypothesentyp gemeint ist.
2.1.3. Individual- Kollektiv- und Kontexthypothesen
Abhängig von den Merkmalstypen der Variablen wird zwischen Individual-, Kollektivund Kontexthypothesen unterschieden.
Bei den Individualhypothesen handelt es sich sowohl bei der unabhängigen als auch
bei der abhängigen Variable um Individualmerkmale. Ein Beispiel für eine Individualhypothese lautet: „Je höher der Bildungsabschluß einer Person, desto höher ist ihr
persönliches Nettoeinkommen.“ 18 Demnach sind die Merkmale Bildungsabschlüsse
und Nettoeinkommen Individualmerkmale.
16
Vgl. Diekmann (2005) S. 111–114.
Vgl. Diekmann (2005) S. 115.
18
Diekmann (2005) S. 116.
17
13
2. Hypothesenbildung
Hypothesen, welche sich auf Zusammenhänge zwischen Kollektivmerkmale beziehen, bezeichnet man als Kollektivhypothesen. Ein Beispiel für solch eine Hypothese
lautet: Je höher das Volkseinkommen einer Gesellschaft, desto größer ist die gesellschaftliche Zufriedenheit. Aus Kollektivhypothesen kann man nicht logisch zwingend
die korrespondierende Individualhypothese folgern. Es besteht die Möglichkeit, dass
auf der Kollektivebene ein positiver Zusammenhang zwischen den Variablen A und
B besteht. Dieser positive Zusammenhang ist jedoch nicht zwingend für die Individualebene. Auf der Individualebene kann zwischen den angegebenen Variablen (1.)
ein positiver, (2.) gar kein oder (3.) ein negativer Zusammenhang bestehen. Für die
Übertragung des eben genannten Beispiels auf die Individualebene gilt nicht automatisch: Je höher das Einkommen einer Person, desto zufriedener ist sie. Einen falschen
Schluss von einer Kollektiv- auf eine Individualhypothese wird als ökologischer Fehler
bezeichnet. Um eine Kollektivhypothese zu überprüfen müssen verschiedene Kollektive nebeneinander auf diese Merkmale getestet werden. Im oben genannten Beispiel
ist es notwendig verschiedene Gesellschaften auf ihre Zufriedenheit in Abhängigkeit
zum Volkseinkommen zu testen.19
Kontexthypothesen sind in soziologischen Untersuchungen von besonderem Interesse. Diese Art von Hypothesen können als Mischform von Individual- und Kollektivhypothesen bezeichnet werden. Im Unterschied zu den Individual- und Kollektivhypothesen setzt sich die Kontexthypothese aus jeweils einem Individualmerkmal und
einem Kollektivmerkmal zusammen. Dabei stellt die unabhängige Variable das Kollektivmerkmal und die abhängige Variable das Individualmerkmal dar. Demnach
werden Kontexthypothesen benutzt um den Einfluss von Kollektivmerkmalen auf
das individuelle Handeln zu beschreiben. Ein Beispiel für eine solche Hypothese lautet: „Je höher die soziale Integration in einer sozialen Gruppe (= Kollektivmerkmal),
desto geringer ist die Wahrscheinlichkeit, daß sich eine Person, die Mitglied der sozialen Gruppe ist, abweichend verhält (=Individualmerkmal).“ 20 Wie schon bei den
Kollektivhypothesen beschrieben, reicht es bei den Kontexthypothesen nicht aus,
nur ein Kollektiv zu erheben. Erst nach einem ausreichenden Vergleich von verschiedenen Kollektiven kann man Aussagen über die Gültigkeit der Kontexthypothese
machen.21
Individualhypothese
Kollektivhypothese
Kontexthypothese
unabhängige Variable
Individualmerkmal
Kollektivmerkmal
Kollektivmerkmal
abhängige Variable
Individualmerkmal
Kollektivmerkmal
Individualmerkmal
Tabelle 2.1.: Individual, Kollektiv- und Kontexthypothesen22
19
Vgl. Diekmann (2005) S. 116.
Diekmann (2005) S. 118.
21
Vgl. Diekmann (2005) S. 118f.
22
Vgl. Diekmann (2005) S. 118.
20
14
3. Repräsentativität
Die Erhebung der Grundgesamtheit wäre für eine Untersuchung der optimale Fall.
Da dies jedoch in der Realität nicht möglich ist, ist es notwendig sich auf eine Teilmenge der Grundgesamtheit zu beschränken. Diese bezeichnet man als Stichprobe.
In den Sozialwissenschaften spielt die Repräsentativität einer Erhebung eine große
Rolle.
„Damit Rückschlüsse von der Stichprobe auf die Grundgesamtheit möglich sind, muss diese ein verkleinertes Abbild der Grundgesamtheit darstellen.[...] Die Verteilungen aller interessierenden Merkmale in der Stichprobe muss repräsentativ für die Grundgesamtheit sein.“ 23
Für die Auswahl der Stichprobe wird bei der Stichprobenbildung zwischen zufallsgesteuerten und nicht zufallsgesteuerten Auswahlverfahren unterschieden.
Bei den nicht zufallsgesteuerten Stichprobenauswahlverfahren wird durch bewusste Auswahl der Stichprobe versucht ein verkleinertes Abbild der Grundgesamtheit
zu erhalten. Die Auswahl eines verkleinerten aber exakten Abbildes der Grundgesamtheit ist in der Realität jedoch schwer zu gewährleisten, da es unmöglich ist,
alle Merkmale einer Gesellschaft (z. B. Anteil männlicher und weiblicher Personen,
Anteil ausländischer Personen usw.) gleichzeitig zu berücksichtigen.24
Bei der zufallsgesteuerten Auswahl wird aus der Grundgesamtheit zufällig eine Stichprobe ausgewählt, daher wird eine solche Stichprobe auch als Zufallsstichprobe bezeichnet. Hierbei werden alle Elemente der Grundgesamtheit als gleich wahrscheinlich betrachtet und es kann kein Element mehrfach ausgewählt werden. Dieses entspricht im Urnenmodell „ziehen ohne Zurücklegen“. Dieses Verfahren lässt bei hinreichend großer Stichprobe erwarten, dass die relative Merkmalshäufigkeit der Stichprobe der relativen Merkmalshäufigkeit der Grundgesamtheit entspricht. Somit wird
erwartet, dass die Repräsentativität mit diesem Auswahlverfahren von sich aus gegeben ist.25
Es gibt zwei Formen von Zufallsstichproben. Zum einen die „einfache Zufallsstichprobe“ 26 und zum anderen die „mehrstufige Zufallsstichprobe“ 27 . Von einer einfachen Zufallsstichprobe wird gesprochen, wenn die Ziehung der Stichprobe in einem
Auswahlschritt erfolgt und somit jede Person aus der Grundgesamtheit die gleiche
Chance hat, in die Stichprobe zu gelangen. Bei der mehrstufigen Zufallsstichprobe findet die Auswahl der Stichprobe in mehreren Schritten statt. Ermittelt man
beispielsweise für eine Schülerumfrage zunächst eine Zufallsauswahl der Schulen (1.
23
Mayer (2002) S. 59.
Vgl Diekmann (2005) S. 368.
25
Vgl. Diaz-Bone (2006) S. 133.
26
Diaz-Bone (2006) S. 133.
27
Diaz-Bone (2006) S. 133.
24
15
3. Repräsentativität
Stufe), um dann aus den ausgewählten Schulen eine Zufallsauswahl von Klassen
(2. Stufe) zu ziehen, aus denen dann abschließend ein oder mehrere zu befragende Schüler (3. Stufe) zufällig ermittelt wird, so hat man eine dreistufige Auswahl.
Kennzeichnend für mehrstufige Auswahlverfahren ist, dass die zufällig ausgewählten Einheiten auf den vorangehenden Stufen jeweils größere Einheiten sind und erst
auf der letzten Stufe die Personen ausgewählt werden, die erhoben werden. Eine
besondere Form der mehrstufigen Zufallsstichprobe ist die „Klumpenstichprobe“ 28 .
Sie ist dadurch gekennzeichnet, dass auf der letzten Stufe alle Elemente der auf
der vorletzten Stufe ausgewählten Einheit erhoben werden.29 Im vorangegangenen
Beispiel wäre eine Klumpenstichprobe, wenn alle Schüler aus der auf der 2. Stufe
ausgewählten Klasse erhoben werden. Die Schüler der gezogenen Klasse bilden dann
einen Klumpen.
28
29
Diaz-Bone (2006) S. 133.
Vgl. Diaz-Bone (2006) S. 133.
16
4. Fragebogenkonstruktion
Nach dem Aufstellen der Hypothesen kommt es zu der Entscheidung für eine Erhebungsform. Da dies in meinem Fall eine Erhebung mittels eines Fragebogens ist,
beschäftige ich mich im Folgenden mit der Fragebogenkonstruktion. Hierfür sind die
vorher formulierten Hypothesen von großer Wichtigkeit, denn sie sind der Grund,
warum bestimmte Fragen gestellt werden. Das Ziel der Fragen sind Antworten, die
als Daten für die Überprüfung der Hypothesen dienen sollen.30 Demnach ist die
Frage das Bindeglied zwischen den Hypothesen und den Antworten.31
Die Fragebogenkonstruktion ist in drei Teilbereiche aufzuspalten. Anfangs muss die
Frageform jeder einzelnen Frage bestimmt werden. Anschließend müssen die Fragen
formuliert und zu einem Fragebogen zusammengefügt werden.
4.1. Frageformen
Der Fragebogenentwickler muss sich bei jeder Frage für eine Frageform entscheiden.
Er hat die Wahl zwischen offenen, geschlossenen und halboffenen (hybride) Fragen.
Diese unterscheiden sich nach der Art der Antwortvorgaben.32 Bei geschlossenen
Fragen werden den zu befragenden Personen alle relevanten Antwortmöglichkeiten
vorgegeben. Hier hat der Befragte lediglich die Aufgabe aus diesen Antwortmöglichkeiten eine oder eventuell mehrere auszuwählen, während er bei offenen Fragen
seine Antwort selbstständig formulieren muss, da keine Antwortmöglichkeiten vorgegeben sind.33 Daher setzen solche Fragen beim Befragten viel Vorwissen voraus.
Der Befragte muss in der Lage sein seine Antwort schriftlich zu artikulieren, d. h.
er muss z. B. schreiben können und die Fähigkeit besitzen, einen Text eigenständig
zu strukturieren. Außerdem erfordert die Formulierung eines Fließtextes eine höhere
Motivation zur Beantwortung einer Frage, als das Auswählen aus vorgegebenen Antwortmöglichkeiten. Es ist davon auszugehen, dass diese Merkmale bei Angehörigen
höherer Bildungsschichten im stärkeren Maße vorhanden sind, als bei Personen in
unteren sozialen Schichten.34 In der Regel eignen sich offene Frage besonders gut
„um Wissen zu überprüfen, um den Sprachgebrauch der Bevölkerung zu einem bestimmten Themenbereich kennen zu lernen, um die ‚Aktualität‘ von Themen oder
Argumenten zu messen sowie um Gebiete von besonderer individueller Vielfalt zu erkunden.“ 35 Die Auswertung offener Fragen ist äußerst schwierig, da zu diesem Zweck
eine Inhaltsanalyse notwendig ist. Eine Sonderform offener Fragen, welche eine nicht
30
Vgl. Kromrey (2006) S. 370.
Vgl. Friedrichs (1982) S. 204.
32
Vgl. Kromrey (2006) S. 375.
33
Vgl. Atteslander (2000) S. 158f.
34
Vgl. Kromrey (2006) S. 376.
35
Kromrey (2006) S. 376.
31
17
4. Fragebogenkonstruktion
so komplexe Auswertung erfordert, bilden die formal offenen Fragen.36 Solche Fragen
erkundigen sich z. B. nach Häufigkeit oder Dauer einer Aktivität. Sie können auch
nach Mengen oder physikalischen Größen fragen. Charakteristikum dieser Frage ist,
dass der Befragte zu ihrer Beantwortung nur ein einziges Wort, eine einzige Zahl
oder z. B. eine Zeitspanne aufschreiben muss.37
Die gelegentliche Einstreuung offener Fragen macht die Befragung abwechslungsreicher und interessanter, was die Motivation des Befragten den Fragebogen vollständig
zu beantworten aufrechterhält.
Die geschlossene Frageform ist in der empirischen Sozialforschung der dominierende Fragetyp. Die Entwicklung geschlossener Fragen ist viel aufwändiger, da hier
passende Antwortalternativen entwickelt werden müssen. Um das gesamte Spektrum von potentiellen Antwortalternativen zu berücksichtigen erfordert dies eine
intensive Auseinandersetzung mit dem Thema der Frage und der Zielgruppe. Dennoch besteht bei geschlossenen Fragen immer die Gefahr, dass die vorgegebenen
Antwortmöglichkeiten unvollständig sind. Des Weiteren kann es passieren, dass die
Antwortkategorien falsch gewählt werden und diese nicht aus der Lebenswelt der
Zielgruppe stammen. In solchen Fällen kann der Befragte Schwierigkeiten haben,
seine gewünschte Antwort in den vorgegebenen Antwortmöglichkeiten wieder zu finden.38
Gut entwickelte geschlossene Fragen bringen jedoch einige Vorteile für den Befragten und den Forscher mit sich. Geschlossene Fragen erleichtern den Befragten die
Beantwortung der Fragen. Besonders für Personen mit Verbalisierungsproblemen ist
dies von Vorteil. Geschlossene Fragen sind in der Regel schneller als offene Fragen zu
beantworten, was einen geringeren Zeitaufwand für den Befragten bedeutet. Im Vergleich zu offenen Fragen, erfordern geschlossene Fragen einen geringeren Aufwand bei
der Auswertung. Des Weiteren lassen sich die Antworten der Befragten dieses Fragetyps sehr gut miteinander vergleichen. Die Fragebögen können unmittelbar nach
oder sogar schon während der Auswertung miteinander verglichen werden. Dies ist
bei offenen Fragen erst nach einer intensiven Inhaltsanalyse möglich.39
Ein Kompromiss zwischen den geschlossenen und offenen Fragen sind die halboffenen
Fragen. Dieser Fragetyp bietet dem Befragten vorformulierte Antwortmöglichkeiten
und zusätzlich noch die Gelegenheit seine Antwort eigenständig zu formulieren.40
Um bei der Beantwortung der Fragen Ermüdungserscheinungen entgegenzutreten,
sollten zwischen den geschlossenen Fragen gelegentlich offene Fragen verwendet werden.
4.2. Frageformulierung
Die Frageformulierung nimmt einen großen Teil der Fragebogenkonstruktion ein. Die
Fragen des Erhebungsbogens müssen so formuliert sein, dass die Fragen von allen zu
36
Vgl.
Vgl.
38
Vgl.
39
Vgl.
40
Vgl.
37
Diekmann (2005) S. 409.
Kromrey (2006) S. 179.
Kromrey (2006) S. 376.
Diekmann (2005) S. 408.
Diekmann (2005) S. 408.
18
4. Fragebogenkonstruktion
befragenden Personen in möglichst gleicher Weise verstanden werden. Des Weiteren
müssen sie so gestellt sein, dass die Abwehrmechanismen der Testpersonen auf ein
Minimum beschränkt werden. Denn es lässt sich vermuten, dass die Bereitschaft des
Befragten eine Frage zu beantworten sinkt, je mehr eine Frage in den Privatbereich
des Befragten eindringt.41 Daher sind bei der Frageformulierung einige Grundregeln
zu beachten:
1. Fragen sollten so kurz, verständlich, präzise und direkt wie möglich formuliert
werden. Ein Befragter wird selten zugeben, dass er eine Frage nicht verstanden
hat. In diesem Fall wird er in der Regel im Sinne der sozialen Erwünschtheit
antworten. Da die Fragen für alle Personen der Zielgruppe verständlich sein
müssen, sollte auf komplizierte Sätze, z. B. Hypotaxe, verzichtet werden. Die
Fragen sollten für die Zielgruppe verständliche Wörter enthalten, daher sind
Fremdwörter und unbekannte Fachausdrücke zu vermeiden. So soll ein dem
Fragebogen und der Zielgruppe adäquates Sprachniveau erreicht werden.42
2. Um Missverständnisse und Verfälschungen zu vermeiden, sollten Fragen keine
doppelten Negationen enthalten. Um die Motivation der Befragten, den Fragebogen zu beantworten, zu erhalten, sollten diese nicht überfordert werden. Fragen mit doppelten Verneinungen jedoch erfordern eine höhere Konzentration
und längeres Nachdenken. Dies kann die Befragten verunsichern und dadurch
zu verfälschten Antworten führen.43
3. Eine Lenkung der Antwortreaktion des Befragten ist zu vermeiden. Um keine bestimmte Beantwortung der Fragen zu provozieren, verzichtet man bei
der Frageformulierung auf Suggestivfragen und auf stark positiv oder negativ besetzte Begriffe.44 Des Weiteren soll der Verzicht auf stark wertbesetzte
Begriffe verhindern, dass Fragen nach der sozialen Erwünschtheit beantwortet
werden.45
4. Fragen sollten sich nur auf einen Sachverhalt beziehen. Bei Fragen, die mehrere Sachverhalte gleichzeitig beinhalten, kann es leicht zu Missverständnissen
kommen, was die Erhebung verfälscht. Daher sollten mehrere eindimensionale
Fragen anstelle einer mehrdimensionalen Frage konstruiert werden.46
5. Fragen, die die Privatsphäre der Befragten betreffen, sollten möglichst sensibel
formuliert werden, um den Befragten eine ehrliche Antwort zu erleichtern.47
6. Bei der Bildung von Antwortkategorien geschlossener Fragen ist zu beachten,
dass diese „disjunkt, erschöpfend und präzise“ 48 sind. Die Antwortmöglichkeiten sollten hinreichend genau zwischen verschiedenen Sachverhalten unterscheiden. Außerdem sollten sie im Hinblick auf positive und negative Antworten ausgeglichen sein, um so die Gleichwertigkeit der verschiedenen Antworten
zu demonstrieren.49
41
Vgl. Kromrey (2006) S. 380.
Vgl. Diekmann (2005) S. 410.
43
Vgl. Diekmann (2005) S. 411.
44
Vgl. Diekmann (2005) S. 412f.
45
Vgl. Atteslander (2000) S. 171.
46
Vgl. Diekmann (2005) S. 412.
47
Vgl. Kromrey (2006) S. 381.
48
Diekmann (2005) S. 411.
49
Vgl. Diekmann (2005) S. 411.
42
19
4. Fragebogenkonstruktion
7. Bei Fragen, die Mehrfachnennungen erlauben, ist der Befragte explizit darauf
hinzuweisen.
8. Fragen, die nach Häufigkeiten, Dauer oder physikalischen Größen fragen, müssen mit den entsprechenden Maßeinheiten angegeben werden, da das Fehlen
solcher Einheiten meist Verwirrung bei den Befragten stiftet.50
9. Sowohl bei den Fragen als auch bei den Antwortmöglichkeiten sind unbestimmte Zahlwörter, wie z. B. oft, selten, häufig, manchmal, zu vermeiden. Solche
unbestimmten Worte können sowohl vom Forscher, wie auch vom Befragten
unterschiedlich interpretiert werden. Dies kann zu Auswertungsproblemen und
letztendlich auch zu ungewollten Verfälschungen der Erhebung führen.
Für die äußere Erscheinung des Fragebogens ist die Abfassung eines Begleittextes
am Anfang und einen abschließenden Dank am Ende des Erhebungsbogens von
hoher Bedeutung. Der kurze, einführende Text soll die Motivation der Befragten
den Fragebogen auszufüllen anheben. Außerdem soll er den Befragten über den
Kontext der Untersuchung informieren und ihn über die anonyme Datenbehandlung
aufklären.
4.3. Anordnung der Fragen im Erhebungsbogen
Die fertig formulierten Fragen müssen zu einem Fragebogen zusammengefügt werden. Bei der Anfertigung des Fragebogens werden die Fragen nicht zufällig zusammengestellt. Der Fragebogen muss sachlich nachvollziehbar gegliedert sein. Zu diesem Zweck werden Fragen, die ein bestimmtes Thema erfassen zu einem Komplex
zusammengefasst.51
Um den Untersuchungsteilnehmern zu Beginn der Befragung die Unsicherheit bzgl.
der Erhebung zu nehmen, sollte der Fragebogen mit möglichst neutralen und einfachen Fragen beginnen. Solche Fragen bezeichnet man als „Eröffnungs- oder Eisbrecherfragen“ 52 . Da die Motivation der Befragten zum Ende des Erhebungsbogens
sinkt, sollten die wichtigsten Fragen im zweiten Drittel des Fragebogens platziert
werden.53
Bei der Frageanordnung können zwei unerwünschte, verzerrende Effekte auftreten:
Zum einen der Ausstrahlungseffekt, auch „halo effect“ 54 genannt und zum anderen
der „Platzierungseffekt“ 55 . Mit dem Ausstrahlungseffekt bezeichnet man den Einfluss einer Frage auf die Wahrnehmung umstehender Fragen, da im Normalfall keine
Frage von den zu befragenden Personen völlig isoliert betrachtet wird. Dies kann
eine Verzerrung der Erhebung zur Folge haben. Die Vermeidung dieses Effekts ist
in der Mikroplanung (Planung der Fragereihenfolge innerhalb eines Themenkomplexes) zu berücksichtigen. Wie die Fragen, können sich auch die einzelnen Themenkomplexe untereinander beeinflussen. Dieses bezeichnet man als Platzierungseffekt.
50
Vgl. Atteslander (2000) S. 171.
Vgl. Kromrey (2006) S. 383.
52
Kromrey (2006) S. 382.
53
Vgl. Kromrey (2006) S. 382.
54
Kromrey (2006) S. 385.
55
Kromrey (2006) S. 385.
51
20
4. Fragebogenkonstruktion
Die Vermeidung eines Platzierungseffekts ist in der Makroplanung (Planung der
Reihenfolge der einzelnen Themenkomplexe) zu berücksichtigen. Die völlige Vermeidung von Ausstrahlungs- und Platzierungseffekten kann jedoch in einer schriftlichen
Befragung selten realisiert werden.56
4.4. Vortest
Da sich bei der Fragebogenkonstruktion Fehler selten gänzlich vermeiden lassen ist
es notwendig, den fertigen Erhebungsbogen vor Untersuchungsbeginn zu testen und
gegebenenfalls zu verbessern. Der Vortest (engl. Pretest) wird eingesetzt, um die
Verständlichkeit der Fragen und die Vollständigkeit der Antwortmöglichkeiten zu
überprüfen.
Außerdem sollte, um die eigentliche Befragung realistisch planen zu können, die
durchschnittliche Befragungszeit ermittelt werden. Im Anschluss an den Pretest sollten Interviews mit den Vortestteilnehmern helfen die letzten Unklarheiten und Fehler
im Fragebogen zu beseitigen.57
56
57
Vgl. Kromrey (2006) S. 385f.
Vgl. Diekmann (2005) S. 415f.
21
5. Über die Mathematik in der
Statistik
Die Mathematik, speziell die Statistik, ist für die Sozialwissenschaft ein wichtiges
Hilfsmittel. Eine bedeutende Rolle spielt die Mathematik für die Auswertung von
Daten. „Die Statistik befasst sich mit der Sammlung, Darstellung und Analyse von
Sachverhalten, die numerisch messbar sind und in größerer Zahl vorliegen.“ 58 Die
Statistik lässt sich in zwei Bereiche aufteilen. Zum einen die deskriptive Statistik
und zum anderen die induktive Statistik. Bei der deskriptiven Statistik geht es um
die Beschreibung einer Grundgesamtheit. Daher wird die deskriptive Statistik auch
als beschreibende Statistik bezeichnet. Die Verfahren der induktiven Statistik, welche sich in die Schätzstatistik und Teststatistik aufteilen lassen, beruhen auf Messungen eines Merkmals X in einer Teilgruppe der Grundgesamtheit. Das Ziel der
induktiven Statistik ist es, mittels einer Stichprobe X1 , X2 , . . . , Xn , Aussagen über
die zugrundeliegende Verteilung und somit auch Aussagen über die Grundgesamtheit zu gewinnen. Dieses bedeutet, dass man als induktive Statistik den Teil der
Statistik bezeichnet, in dem alle Techniken zusammengefasst werden, die es möglich
machen von einer Stichprobe auf die Grundgesamtheit zu schließen.
Da ich bei meiner Untersuchung nicht alle siegener Schüler der achten Klasse, sondern nur eine Stichprobe dieser betrachte, behandle ich im Folgenden nur die induktive Statistik. Die dafür benötigenden Grundlagen aus der Stochastik und Wahrscheinlichkeitstheorie werden zunächst kurz im Grundlagenkapitel behandelt. Im
Anschluss daran sollen die für meine Studie relevante Methoden der Schätzstatistik
und Teststatistik behandelt werden.
58
Schulze (2003) S. 4.
22
6. Stochastische Grundlagen
Im Folgenden Kapitel sollen die für meine Arbeit relevanten Grundlagen aus der
Stochastik und Wahrscheinlichkeitstheorie kurz eingeführt werden. Hierfür halte ich
mich im Wesentlichen an die Werke Henze (2003) und Behnen/Neuhaus (1984).
6.1. Allgemeine Grundlagen
Definition 1 (Nominales Merkmal)
Ein Merkmal heißt nominal, wenn die möglichen Merkmalsausprägungen zwar unterschieden, nicht aber in eine Rangfolge gebracht werden können (vgl. Abbildung a).
Definition 2 (Ordinales Merkmal)
Ein Merkmal heißt ordinal, wenn sich die möglichen Merkmalsausprägungen in eine
Rangfolge bringen lassen und sich mit Namen oder Zahlen bezeichnen lassen. Es
müssen jedoch keine Abstände zwischen den Merkmalsausprägungen definiert sein
(vgl. Abbildung b).
Definition 3 (Metrisches Merkmal)
Ein ordinales Merkmal heißt metrisch, wenn die Distanzen zwischen den einzelnen
Merkmalen definiert sind (vgl. Abbildung c).
A
B
A ↔ B
A < B < C
C
(a) Nominale Merkmale
(b) Ordinale Merkmale
←→
C
(c) Metrische Merkmale
Abbildung 6.1.: Vergleich nominal, ordinal und metrisch skalierter Merkmale
Definition 4 (σ-Algebra und messbarer Raum)
Sei S eine Menge. Dann heißt B ⊂ P(S) σ-Algebra über S, wenn gilt
S ∈ B,
A ∈ B ⇒ Ac ∈ B,
[
Ai ∈ B, i ∈ I ⇒
Ai ∈ B.
i∈I
Das Tupel (S, B) heißt messbarer Raum.
23
6. Stochastische Grundlagen
Bemerkung 5
Falls S abzählbar ist, dann ist P(S) eine σ-Algebra. Für S = R wird üblicherweise
die borelsche σ-Algebra B verwendet. Diese wird von den Halbstrahlen (−∞, t), t ∈
R erzeugt und enthält u.A. alle offenen, abgeschlossenen, endlichen und abzählbaren
Mengen.
Definition 6 (Wahscheinlichkeitsmaß und Wahrscheinlichkeitsraum)
Sei (S, B) ein messbarer Raum. Dann heißt P : B 7→ [0, 1] Wahrscheinlichkeitsmaß
auf (S, B), wenn gilt
P (S) = 1
X
Bi ∈ B, i ∈ I, p.d. ⇒ P
i∈I
Bi
!
=
X
P (Bi ).
i∈I
Das Tripel (S, B, P ) heißt Wahrscheinlichkeitsraum.
Definition 7 (Bedingte Wahrscheinlichkeit)
Sei (S, B, P ) ein Wahrscheinlichkeitsraum. Sei A ∈ B mit P (A) > 0. Dann ist die
bedingte Wahrscheinlichkeit von B gegeben A definiert durch
P (B|A) :=
P (A ∩ B)
.
P (A)
Insbesondere ist die bedingte Verteilung PA := P (•|A) eine Wahrscheinlichkeitsverteilung auf (S, B).
Definition 8 (Zufallsvariable)
Es seinen (Ω, A, P ) ein Wahrscheinlichkeitsraum und (S, B) ein messbarer Raum.
Eine Funktion X : Ω 7→ S heißt Zufallsvariable, wenn X A − B-messbar ist, d. h.
wenn gilt
∀B ∈ B : X −1 (B) ∈ A.
Dann schreibt man X : (Ω, A) 7→ (S, B).
Da die meisten in der Realität vorkommenden Abbildungen messbar sind, wird im
Folgenden die Messbarkeit nicht mehr betrachtet.
Definition 9 (Verteilung einer Zufallsvariable)
Sei (Ω, A, P ) ein Wahrscheinlichkeitsraum, (S, B) ein messbarer Raum und X : Ω 7→
S eine Zufallsvariable. Dann ist
L(X) : B 7→ [0, 1],
B → P (X −1 (B))
ein Wahrscheinlichkeitsmaß auf (S, B). Dieses heißt Verteilung von X. Man schreibt
P (X ∈ B) := L(X)(B) und P (X = x) := L(X)({x}).
24
6. Stochastische Grundlagen
Definition 10 (Unabhängigkeit)
Die Zufallsvariablen Xi : (Ω, A) 7→ (Si , Bi ), i = 1, 2, . . . , n sind unabhängig, falls gilt
P (X1 ∈ B1 , X2 ∈ B2 , . . . , Xn ∈ Bn ) =
n
Y
i=1
P (Xi ∈ Bi ),
∀Bi ∈ Bi .
Gilt zusätzlich L(X1 ) = L(X2 ) = · · · = L(Xn ), so bezeichnet man X1 , X2 , . . . , Xn als
unabhängig, identische verteilte Zufallsvariablen oder kurz als iid (engl: independent,
identical distributed).
Definition 11 (Verteilungsfunktion, Dichte)
Sei X eine reellwertige Zufallsvariable. Dann ist die Verteilungsfunktion von X definiert durch
F : R 7→ [0, 1], x → P (X ≤ x).
Ist F differenzierbar, so heißt f = F ′ Dichte von X.
Definition 12 (Produktmaß)
Seien (Si , Bi , Pi ) mit i = 1, 2, . . . n Wahrscheinlichkeitsräume und Xi ∈ Si Zufallsvariablen. Dann ist die Produkt-σ-Algebra B definiert als die kleinste σ-Algebra, die
alle Mengen
B1 × B2 × · · · × Bn , Bi ∈ Bi
enthält.
Das Produktmaß P auf B ist definiert durch
P (X1 ∈ B1 , X2 ∈ B2 , . . . , Xn ∈ Bn ) :=
n
Y
Pi (Xi = Bi ).
i=1
Hat jedes Xi eine Dichte fi , so ist die Poduktdichte f : Rn 7→ R definiert durch
f (x1 , x2 , . . . , xn ) :=
n
Y
fi (xi )
i=1
die Dichte des Produktmaßes.
Satz 13
Die Zufallsvariablen X1 , X2 , . . . , Xn sind genau dann unabhängig, wenn der Vektor
(X1 , X2 , . . . , Xn ) nach dem Produktmaß verteilt ist.
Definition 14 (Quantil)
Sei X eine Zufallsvariable mit Verteilungsfunktion F . Dann ist die Quantilfunktion
F −1 definiert durch
F −1 : (0, 1) 7→ R,
p → inf{x ∈ R : F (x) ≥ p}.
Der Wert F −1 (p) wird als p-Quantil von F bzw. X bezeichnet.
25
6. Stochastische Grundlagen
Definition 15 (Erwartungswert)
Für eine stetige, reellwertige Zufallsvariable X mit Dichte f ist der Erwartungswert
E(X) definiert durch
Z
∞
E(X) :=
−∞
x · f (x)dx.
Für eine diskrete, reellwertige Zufallsvariable X : Ω 7→ S ⊂ R ist der Erwartungswert E(X) definiert durch
X
X
E(X) :=
X(ω)P (ω) =
x · P (X = x).
ω∈Ω
x∈S
Definition 16 (Varianz, Standardabweichung)
Sei X eine Zufallsvariable, so dass der Erwartungswert E(X) existiert, dann bezeichnet
V ar(X) := E(X − E(X))2 = E(X 2 ) − (E(X))2
die Varianz von X.
Die Standardabweichung σ ist definiert durch
p
σ := V ar(X).
Satz 17
Seien α, β ∈ R und X und Y reellwertige Zufallsvariablen.
Der Erwartungswert ist linear, d. h. es gilt
E(αX + βY ) = αE(X) + βE(Y ),
wenn die rechte Seite definiert ist.
Für die Varianz gilt
V ar(αX) = α2 V ar(X)
und, falls X und Y unabhängig sind,
V ar(X + Y ) = V ar(X) + V ar(Y ).
Zentraler Grenzwertsatz
Seien in diesem Abschnitt X1,n , X2,n , . . . Xn,n n ∈ N unabhängige Zufallsvariablen
2
mit E(Xi,n ) = 0 (sonst ersetze Xi,n durch Xi,n − EXi,n ) und σi,n
= E(Xi,n )2 ∈
(0, ∞).
Dann definiere

τn2 := E 
n
X
i=1
26
!2 
Xi,n  .
6. Stochastische Grundlagen
Die Lindeberg-Bedingung ist
∀ε > 0 :
lim E
n→∞
Xi,n
τn
2
1n Xi,n >εo
τn
!
= 0.
Satz 18 (Zentraler Grenzwertsatz)
Ist Φ die Verteilungsfunktion der Normalverteilung, so gilt unter Lindebergbedingung
!
n
1 X
∀x ∈ R : P
Xi,n ≤ x → Φ(x), n → ∞.
τn i=1
Bemerkung 19
Sind X1 , X2 , . . . iid Zufallsvariablen mit µ = E(Xi ) und σ 2 := (Xi − µ)2 ∈ (0, ∞),
so erfüllen Xi − µ die Lindebergbedingung und es folgt
!
!
√
n
n 1X
∀x ∈ R : P
Xi − µ ≤ x → Φ(x), n → ∞.
σ
n i=1
6.2. Konkrete Wahrscheinlichkeitsverteilungen
Hier an dieser Stelle werden die für meine Arbeit wichtigen Wahrscheinlichkeitsverteilungen behandelt. Dabei ist anzumerken, dass es noch viele weitere Wahrscheinlichkeitsverteilungen gibt, die aber an dieser Stelle nicht erwähnt werden.
6.2.1. Diskrete Verteilungen
Binomialverteilung Die Binomialverteilung Bn,p beschreibt die Anzahl der Erfolge
beim n-maligen Münzwurf mit der Erfolgswahrscheinlichkeit p.
n k
Zähldichte:
P (X = k) = Bn,p (k) =
p (1 − p)n−k
k
Träger:
TX = {0, 1, . . . , n}
Erwartungswert:
E(X) = np
Varianz:
V ar(X) = np(1 − p)
27
6. Stochastische Grundlagen
Diskrete Gleichverteilung Die diskrete Gleichverteilung GS ordnet jedem Element
der Menge S = {x1 , x2 , . . . , xn } die gleiche Wahrscheinlichkeit zu. Erwartungswert und Varianz sind nur für S ⊂ R definiert.
Zähldichte:
P (X = xk ) =
Träger:
TX = S
1
n
n
Erwartungswert:
1X
E(X) =
xk
n k=1
Hypergeometrische Verteilung Die hypergeometrische Verteilung Hypn,r,s mit Parametern n, r und s beschreibt das n-malige Ziehen ohne Zurücklegen aus einer
Urne mit r roten und s schwarzen Kugeln.
s r
k
n−k
r+s
n
Zähldichte:
P (X = xk ) =
Träger:
TX = {max(0, n − s), . . . , min(r, n)}
n·r
E(X) =
r+s
Erwartungswert:
6.2.2. Stetige Verteilungen
Stetige Gleichverteilung Die stetige Gleichverteilung Ra,b ist die Gleichverteilung
auf dem Intervall [a, b].
Dichte:
Verteilungsfunktion:
Träger:
Erwartungswert:
Varianz:
1[a,b] (x)
b − a
0
für x < a

x−a
F (x) = b−a für a ≤ x < b


1
für b ≤ x
f (x) =
TX = [a, b]
a+b
E(X) =
2
1
V ar(X) = (b − a)2
12
28
6. Stochastische Grundlagen
Normalverteilung Die Normalverteilung Nµ,σ2 hängt von dem Mittelwert µ und der
Varianz σ 2 ab. Die Normalverteilung N0,1 wird als Standardnormalverteilung
bezeichnet.
1
Dichte:
f (x) = √
Träger:
Erwartungswert:
Varianz:
TX = R
E(X) = µ
V ar(X) = σ 2
2πσ 2
e−
(x−µ)2
2σ 2
χ2 -Verteilung Die χ2 -Verteilung χ2k mit k Freiheitsgraden ist die Verteilung der
Summe von k quadrierten standartnormalverteilten Zufallsvariablen.
k
Dichte:
Träger:
Erwartungswert:
Varianz:
x
x 2 −1 e− 2
f (x) = 1[0,∞)(x) · k k 22Γ 2
TX = [0, ∞)
E(X) = n
V ar(X) = 2n
29
7. Parameterschätzung
7.1. Punktschätzung
Die in diesem Kapitel beschriebende Punktschätzung ist im Wesentlichen beschrieben nach Cramer (2003) S. 65f und Fahrmeir et al. (2004) S. 364ff.
Bei der Punktschätzung soll ein spezieller Wert, der für ein betrachtetes Merkmal
charakteristisch ist, für die Grundgesamtheit geschätzt werden.
Definition 20 (Punktschätzung)
Sei X ∈ S ein Merkmal, dessen Verteilung Q aus einer Familie Q von Wahrscheinlichkeitsmaßen über S stammt. Sei T : Q 7→ K eine Abbildung, die jedem Q ∈ Q
einen Kennwert T (Q) zuordnet.
Seien X1 , X2 , . . . , Xn iid eine Stichprobe. Eine Punktschätzung ist eine Abbildung
Tˆn : S n 7→ K. Für ein Stichprobenergebnis x1 , x2 , . . . , xn ist Tˆn (x1 , x2 , . . . , xn ) ein
Schätzwert für T (Q).
Ist die Abbildung T bijektiv, so nennt man T eine Parametrisierung von Q. Dann
bezeichnet man Θ := K als Parameterraum und bezeichnet zu jedem ϑ ∈ Θ mit Qϑ
die eindeutig bestimmte Verteilung Qϑ ∈ Q mit T (Qϑ ) = ϑ. Den Schätzer bezeichnet
man als ϑˆn := Tˆn .
Bemerkung 21
Der Kennwert kann z. B. der Erwartungswert, die Varianz oder einfach ein Parameter
einer Wahrscheinlichkeitsverteilung sein.
Nicht jeder Schätzer ist sinnvoll. Um die Qualität des Schätzers beurteilen zu können,
sind Kriterien zu definieren, welcher ein Schätzer sinnvollerweise erfüllen sollte. Zu
diesen Kriterien zählt die Erwartungstreue und die Konsistenz eines Schätzers.
7.1.1. Gütekriterien
Die beschriebenen Gütekriterien sind nachzulesen in Cramer (2003) S. 65ff und
Fahrmeir et al. (2004) S. 367ff.
30
7. Parameterschätzung
7.1.1.1. Erwartungstreue
Definition 22 (Erwartungstreue)
Ein Schätzer Tˆn heißt erwartungstreu, falls für jedes Q ∈ Q gilt:
E Tˆn = T (Q)
In der Regel ist es jedoch nicht notwendig, dass ein Schätzer Tˆn erwartungstreu ist.
Die meisten Ergebnisse der mathematischen Statistik gelten erst asymptotisch, also
wenn der Stichprobenumfang ins unendliche wächst. Daher reicht es aus, wenn die
Erwartungstreue im Grenzwert gilt.
Definition 23 (Asymptotische Erwartungstreue)
Ein Schätzer Tˆn heißt asymptotisch erwartungstreu, falls für jedes Q ∈ Q gilt:
lim E Tˆn = T (Q)
n→∞
Damit der Schätzer Tˆn numerisch berechenbar ist, darf Tˆn natürlich nicht von dem
unbekannten Wert T (Q) abhängen!
Bei zwei oder mehr erwartungstreuen Schätzern ist derjenige, mit der kleineren
Varianz zu bevorzugen.
Ist ein Schätzer nicht erwartungstreu, führt die Punktschätzung zu verzerrten Schätzungen. In der Mathematik spricht man bei Verzerrungen auch von Bias.
Definition 24 (Bias)
Für einen Schätzer Tˆn ist der Bias definiert durch
ˆ
Bias Tn := E Tˆn − T (Q).
7.1.1.2. Konsistenz
Definition 25 (Mittlere quadratische Abweichung)
Für einen Schätzer Tˆn heißt
2
ˆ
ˆ
mqA Tn = E Tn − T (Q)
mittlere quadratische Abweichung.
Definition 26 (Konsistenz)
Ein asymptotisch erwartungstreuer Schätzer Tˆn heißt konsistent, falls für jedes Q ∈
Q gilt:
lim mqA Tˆn = 0.
n→∞
31
7. Parameterschätzung
Satz 27
Für einen erwartungstreuer Schätzer Tˆn gilt
ˆ
mqA Tn = V ar Tˆn .
Für einen asymptotischen erwartungstreuen Schätzer gilt
lim mqA Tˆn = lim V ar Tˆn .
n→∞
n→∞
Beweis. Für erwartungstreue Schätzer gilt E Tˆn = T (Q) und somit
2
2
mqA Tˆn = E Tˆn − T (Q) = E Tˆn − E Tˆn
= V ar Tˆn .
Für asymptotisch erwartungstreue Schätzer gilt lim E Tˆn = T (Q) und somit
n→∞
lim mqA Tˆn
n→∞
2
= lim E Tˆn − T (Q)
n→∞
2
=E lim Tˆn − lim E Tˆn
n→∞
n→∞
2
=E lim Tˆn − E Tˆn
n→∞
2
= lim E Tˆn − E Tˆn
n→∞
= lim V ar Tˆn .
n→∞
Korollar 28
Ein asymptotisch erwartungstreuer Schätzer ist konsistent, wenn die Varianz gegen
Null konvergiert.
Beweis. Sei Tˆn ein asymptotisch erwartungstreuer Schätzer. Nach Satz 27 gilt
lim V ar Tˆn = 0 ⇔ lim mqA Tˆn = 0
n→∞
n→∞
Beispiel 29
Das arithmetische Mittel ist ein erwartungstreuer, konsistenter Schätzer für den
Mittelwert.
Beweis. Sei X1 , X2 , . . . , Xn eine iid Stichprobe mit L(X1 ) = L(X2 ) . . . = L(Xn ) =:
L(X).
32
7. Parameterschätzung
Dann gilt die Erwartungstreue wegen:
n
E Tˆn = E
=
1X
Xi
n i=1
!
n
1X
E(Xi )
n i=1
n
1X
=
E(X) = E(X) = m(L(X))
n i=1
Weiter gilt die Konsistenz wegen:
n
lim V ar Tˆn = lim V ar
n→∞
n→∞
1X
Xi
n i=1
!
!
2
n
X
1
= lim
V ar
Xi
n→∞ n
i=1
2 X
n
1
= lim
V ar (Xi )
n→∞ n
i=1
1
· V ar (X) = 0
n→∞ n
= lim
7.1.2. Konstruktion von Schätzfunktionen
Bisher wurde der Punktschätzer und seine wünschenswerten Eigenschaften beschrieben. Im folgenden Abschnitt soll die Herkunft einer Schätzfunktion geklärt werden.
Hierfür sollen zwei Methoden, zum einen die Momentenmethode und zum anderen die Maximum-Likelihood-Methode, wie man eine Schätzfunktion für einen unbekannten Parameter ϑ findet, erklärt werden. Beide Methoden stützen sich zum
Großteil auf die Werke von Hansen (1977) S. 157f, Fahrmeir et al. (2004) S. 376ff
und Hartung (1982) S. 126f.
7.1.2.1. Momentenmethode
Die Momentenmethode ist eine der ältesten Schätztechniken. Die Momentenmethode ist in der indirekten Statistik ein Schätzverfahren, mit dem die Parameter einer
theoretischen Verteilung einer Grundgesamtheit geschätzt werden können. Hierbei
werden die Parameter in Abhängigkeit von den Momenten der Verteilung ausgedrückt. Den Momentschätzer erhält man, in dem man die empirischen Momente
anstelle der Momente in die Gleichung einsetzt. Anschließend erhält man eine Schätzung des entsprechenden Parameters der theoretischen Verteilung, indem man die
Werte der Stichprobe in den Momentschätzer einsetzt.
In der Anwendung ist die Momentenmethode sehr einfach, die daraus resultierenden
Schätzer sind jedoch nicht immer erwartungstreu.
33
7. Parameterschätzung
Definition 30 (Moment)
Das r-te Moment µr mit r = 0, 1, 2, . . . der Zufallsvariable X ist definiert durch
µr = E (X r ) .
Definition 31 (Empirischer Moment)
Den Schätzer
n
1X r
mˆn,r =
X
n i=1 i
für das Moment µr bezeichnet man als empirisches Moment.
Definition 32 (Momentschätzer)
Hängt der unbekannten Parameter ϑ durch den funktionalen Zusammenhang ϑ =
h(µ1 , µ2 , . . . , µk ) von den Momenten µi ab, so bezeichnet man
ϑˆnn = h(mˆn,1 , mˆn,2, . . . , mˆn,k )
als Momentschätzer.
Beispiel 33
Im Folgenden soll die Varianz geschätzt werden.
V ar (X) =E (X − EX)2
=E X 2 − 2XEX + (EX)2
=E X 2 − 2 (EX)2 + (EX)2
=E X 2 − (EX)2
=µ2 − µ21
Somit ist der Momentschätzer für die Varianz
n
ϑˆnn
1X 2
X −
=
n i=1 i
n
1X
Xi
n i=1
!2
7.1.2.2. Die Maximum-Likelihood-Methode
Die Maximum-Likelihood-Methode ist eines der bekanntesten und am häufigsten
verwendeten Verfahren zur möglichst genauen Schätzung einer Verteilung auf der
Grundlage der Stichprobenwerte.
Maximum-Likelihood-Methode für diskrete Wahrscheinlichkeitsverteilungen
Bei der diskreten Maximum-Likelihood-Methode versucht man seinen Schätzer so zu
konstruieren, dass die Wahrscheinlichkeit, des zu schätzenden Kennwertes, möglichst
maximal ist.
Definition 34 (Maximum-Likelihood-Schätzer (ML-Schätzer))
Sei Q = {Qϑ : ϑ ∈ Θ} eine parametrisierte Familie von diskreten Wahrscheinlichkeitsmaßen. Ein Schätzer ϑˆn : S n 7→ Θ heißt Maximum-Likelihood-Schätzer, wenn
34
7. Parameterschätzung
für jede Stichprobe X1 , X2 , . . . , Xn gilt:
n
Qϑˆn (X1 ,X2 ,...,Xn ) (X1 , X2 , . . . , Xn ) = max(Qϑ )n (X1 , X2 , . . . , Xn ).
ϑ∈Θ
Das bedeutet, ein Schätzer ist genau dann ein ML-Schätzer, wenn für jedes Stichprobenergebnis x1 , x2 , . . . , xn die Wahrscheinlichkeit dieses Ergebnisses maximal für
die geschätzte Verteilung ist.
Für eine iid Stichprobe X1 , X2 , . . . , Xn , deren Verteilung Qϑ von einem unbekannten
Parameter ϑ abhängt, kann mit dem Maximum-Likelihood-Prinzip der ML-Schätzer
berechnet werden.
Dazu definiert man die Likelihood-Funktion L : Θ 7→ [0, 1], die für jeden Parameter
ϑ die Wahrscheinlichkeit des Eintretens der Stichprobe unter der Verteilung Qϑ
berechnet.
Die Likelihood-Funktion L(ϑ) errechnet sich wie folgt über das Produktmaß:
L(ϑ) =L(X1 , X2 , . . . , Xn )(X1 , X2 , . . . , Xn )
=(Qϑ )n (X1 , X2 , . . . , Xn )
n
Y
=
Qϑ (Xi )
i=1
Um einen ML-Schätzer zu erhalten ist die Likelihood-Funktion in Abhängigkeit von
ϑ zu maximieren. Dieses erfolgt, indem man die Nullstelle der ersten Ableitung von
L(ϑ) bestimmt. Um zu überprüfen, ob es sich tatsächlich um ein Maximum handelt,
ist noch die zweite Ableitung zu bilden. Wenn sich jedoch aus Plausibilitätsüberlegungen direkt das Maximum bestimmen lässt verzichtet man in der Regel auf diesen
Rechenschritt.
Da das Ableiten von L(ϑ) sehr kompliziert und aufwändig werden kann, wird häufig
auch die logarithmierte Likelihood-Funktion
l(ϑ) =
n
X
ln(Qϑ (Xi ))
i=1
verwendet, da sie ihr Maximum an derselben Stelle wie die nicht-logarithmierte
Likelihood-Funktion besitzt.
Beispiel 35 (ML-Schätzer für B1,p -Verteilung)
Seien X1 , X2 . . . , Xn eine iid-Stichprobe mit L(Xi ) = B1,p . Dann ist
n
1X
ϑˆn (X1 , X2 , . . . , Xn ) =
Xi
n i=1
der ML-Schätzer für ϑ = p.
35
7. Parameterschätzung
Beweis. Die Likelihood-Funktion L ist gegeben durch
L(p) =
n
Y
B1,p (Xi )
i=1
=
n
Y
(pXi + (1 − p)(1 − Xi ))
i=1
Pn
=p
i=1
Pn
Xi
· (1 − p)
Pn
i=1 (1−Xi )
= p i=1 Xi · (1 − p)n−
= ps · (1 − p)n−s
Pn
i=1
wobei in der letzten Umformung die Substitution s :=
Xi
Pn
i=1
Xi verwendet wurde.
Für s = 0 hat L(p) = (1 − p)n offenbar ein Maximum bei p = 0, für s = n hat
L(p) = pn ein Maximum bei p = 1. Daher sei im Folgenden 1 ≤ s ≤ n − 1.
Für die erste Ableitung von L ergibt sich
L′ (p) = sps−1 (1 − p)n−s − ps (n − s)(1 − p)n−s−1
= ps−1 (1 − p)n−s−1 (s(1 − p) − (n − s)p)
= ps−1 (1 − p)n−s−1 (s − np).
Daher folgt
L′ (p) = 0 ⇔ ps−1 (1 − p)n−s−1(s − np) = 0
⇔ (p = 0 ∧ s ≥ 2) ∨ (p = 1 ∧ s ≤ n − 2) ∨ s = np.
Wegen L(0) = L(1) = 0 hat L das Maximum für s = np, also bei
n
s
1X
p= =
Xi .
n
n i=1
Maximum-Likelihood-Methode für stetige Wahrscheinlichkeitsverteilungen
Definition 36 (Maximum-Likelihood-Schätzer (ML-Schätzer))
Sei Q = {Qϑ : ϑ ∈ Θ} eine parametrisierte Familie von stetigen Wahrscheinlichkeitsmaßen Qϑ mit der Dichte fϑ . Ein Schätzer ϑˆn : S n 7→ Θ heißt MaximumLikelihood-Schätzer, wenn für jede iid Stichprobe X1 , X2 , . . . , Xn gilt:
n
Y
fϑˆn (X1 ,X2 ,...,Xn ) (Xi ) = max
ϑ∈Θ
i=1
36
n
Y
i=1
fϑ (Xi )
7. Parameterschätzung
Für stetige Wahrscheinlichkeitsverteilungen ergibt sich die Likelihood-Funktion wie
folgt aus der Produktdichte:
L(ϑ) =
n
Y
fϑ (Xi )
(7.1)
i=1
Die Maximierung der Likelihood-Funktion für stetige Verteilungen erfolgt analog
zum diskreten Fall.
Als logarithmierte Likelihood-Funktion für stetige Verteilungen ergibt sich
l(ϑ) =
n
X
ln fϑ (Xi ).
i=1
7.2. Intervallschätzung
Während die Punktschätzung einen konkreten Wert für einen unbekannten Kennwert T (Q) liefert, welcher häufig nicht der Realität entspricht, bestimmt das Konfidenzintervall einen Bereich, in dem sich der unbekannte Wert T (Q) mit einer zuvor
festgelegten Wahrscheinlichkeit befindet. Das Konfidenzintervall, auch Vertrauensintervall genannt, sagt somit etwas über die Genauigkeit der Schätzung aus. Wie
schon die Punktschätzung hängt auch das Konfidenzintervall von der vorausgesetzten Verteilungsannahme ab.
Die nachstehend beschriebende Intervallschätzung stützt sich im Wesentlichen auf
Cramer (2003) S. 70ff, Fahrmeir et al. (2004) S. 385ff und Hartung (1982) S. 129ff.
Definition 37 (Konfidenzintervall)
Sei X ∈ S ein Merkmal, dessen Verteilung Q aus einer Familie Q von Wahrscheinlichkeitsmaßen über S stammt. Seien T : Q 7→ K ⊂ R eine Abbildung, die jedem
Q ∈ Q einen Kennwert T (Q) zuordnet.
Seien X1 , X2 , . . . , Xn eine iid Stichprobe. Es gebe Abbildungen Ûn : S n 7→ K ∪{−∞}
und Ôn : S n 7→ K ∪ {∞} mit
∀(x1 , x2 , . . . , xn ) ∈ S n :
Ûn (x1 , x2 , . . . , xn ) ≤ Ôn (x1 , x2 , . . . , xn ).
Gilt für eine Wahrscheinlichkeit (1 − α)
P (Ûn ≤ T (Q) ≤ Ôn ) ≥ 1 − α,
so ist [Ûn , Ôn ] ein (1 − α)-Intervallschätzer für T (Q).
Für ein Stichprobenergebnis (x1 , x2 , . . . , xn ) heißt
[u, o] := [Ûn (x1 , x2 , . . . , xn ), Ôn (x1 , x2 , . . . , xn )]
(1 − α)-Konfidenzintervall für T (Q).
37
7. Parameterschätzung
Für eine Realisation (x1 , x2 , . . . , xn ) liegt der zu schätzende Wert T (Q) mit einer
Wahrscheinlichkeit von 1 − α in dem Intervall [u, o]. Somit ist u eine untere und o
eine obere Schranke für den zu schätzenden Wert.
Definition 38 (Einseitiges Konfidenzintervall)
Ist konstant Ûn := −∞, bzw. Ôn := ∞ definiert, so heißt [−∞, Ôn ] bzw. [Ûn , ∞]
einseitiger Intervallschätzer. Das zugehörige Konfidenzintervall [−∞, o] bzw. [u, ∞]
heißt einseitiges Konfidenzintervall.
Bemerkung 39
Das a priori festgelegte Signifikanzniveau α sowie das Konfidenzniveau 1 − α beschreibt den Informationsgehalt eines Ereignisses bzw einer Messung. Übliche Werte
für das Signifikanzniveau α ist α = 0, 1 sowie α = 0, 05 oder α = 0, 01. Je geringer
das Signifikanzniveau ist, desto höher ist der Informationsgehalt.
In der Praxis gibt es zwei Möglichkeiten, ein Konfidenzintervall zu ermitteln: Zum
einen das approximative Konfidenzintervall und zum anderen das exakte Konfidenzintervall. Das exakte Konfidenzintervall ist jedoch nur für spezielle Verteilungen
zu bestimmen. Das Verfahren des approximativen Konfidenzintervalls findet seine
Anwendung bei großen Stichproben. Dieses Verfahren benutzt den Zentralen Grenzwertsatz für die Schätzung des Intervalls. Da der Zentrale Grenzwertsatz nur für
große Stichprobenumfänge geeignet ist, wird bei kleinen Stichprobengrößen – falls
möglich – das exakte Konfidenzintervall bestimmt.
7.2.1. Intervallschätzer für den Erwartungswert
Sei X1 , X2 , . . . , Xn eine iid Stichprobe mit L(Xi ) = L(X) = Q. Ist T (Q) := E(X) =
µ, d. h. der Mittelwert der Verteilung Q zu Schätzen, so lässt sich bei bekannter
Varianz σ 2 = V ar(X) ein Konfidenzintervall für E(X) konstruieren.
P
Es ist T̂n (X1 , X2 , . . . , Xn ) := ni=1 Xi ein Schätzer für E(X). Nach dem zentralen
Grenzwertsatz ist dann für große Stichprobenumfänge
√
n
P
(T̂n (X1 , X2 , . . . , Xn ) − µ) ≤ x ≈ Φ(x)
σ
√
n
⇒P x≤
(T̂n (X1 , X2 , . . . , Xn ) − µ) ≤ y ≈ Φ(y) − Φ(x)
σ
Verwendet man nun für x den Wert u α2 und für y den Wer u1− α2 , so ist
P
√
n
u α2 ≤
(T̂n (X1 , X2 , . . . , Xn ) − µ) ≤ u1− α2
σ
38
≈ 1 − α.
7. Parameterschätzung
Mit u α2 = −u1− α2 und den Äquivalenzen
√
n
(T̂n (X1 , X2 , . . . , Xn ) − µ) ≤ u1− α2
u α2 ≤
σ
σ
σ
⇔ − √ u1− α2 ≤ T̂n (X1 , X2 , . . . , Xn ) − µ ≤ √ u1− α2
n
n
σ
σ
⇔ T̂n (X1 , X2 , . . . , Xn ) − √ u1− α2 ≤ µ ≤ T̂n (X1 , X2 , . . . , Xn ) + √ u1− α2
n
n
folgt
σ
σ
P T̂n (X1 , X2 , . . . , Xn ) − √ u1− α2 ≤ µ ≤ T̂n (X1 , X2 , . . . , Xn ) + √ u1− α2 ≈ 1 − α.
n
n
Somit ist
σ
σ
[Ûn , Ôn ] = T̂n (X1 , X2 , . . . , Xn ) − √ u1− α2 , T̂n (X1 , X2 , . . . , Xn ) + √ u1− α2
n
n
ein approximatives Konfidenzintervall für den Mittelwert µ.
Ist die Varianz σ 2 nicht bekannt, so wird sie mittels des erwartungstreuen Schätzers
v
u
n
u 1 X
t
σ̂ :=
(Xi − T̂n (X1 , X2 , . . . , Xn ))2
n − 1 i=1
geschätzt. Für das approximative Konfidenzintervall ergibt sich:
σ̂
σ̂
[Ûn , Ôn ] = T̂n (X1 , X2 , . . . , Xn ) − √ u1− α2 , T̂n (X1 , X2 , . . . , Xn ) + √ u1− α2 (7.2)
n
n
39
8. Hypothesentest
Im Wesentlichen stütze ich mich im folgenden Kapitel hauptsächlich auf Vogel (1997)
S. 223ff, Cramer (2003) S. 83ff, Hartung (1982) S. 133ff und Witting (1978) S. 102ff.
8.1. Grundidee statistischer Tests
Der statistische Test, häufig auch einfach als Hypothesentest bezeichnet, ist ein
Verfahren der Inferenzstatistik, welcher auf einer Stichprobe X1 , X2 , . . . , Xn basierend eine Aussage trifft, ob eine formulierte Hypothese für eine Grundgesamtheit
anzunehmen oder abzulehnen ist. Er ist neben dem Schätzen von Kennwerten (Parametern) theoretischer Verteilungen für eine Grundgesamtheit in der empirischen
Sozialforschung von zentralem Interesse.
Zu Beginn eines statistischen Tests muss das Testproblem formuliert werden. Hierbei
wird die Hypothese, welche auf ihre Gültigkeit zu prüfen ist, als Alternativhypothese
HA und die ihr gegenübergestellte, die gegenteilige Aussage, als Nullhypothese H0
bezeichnet. Wichtig hierbei ist, dass sich die Aussagen der Alternativhypothese und
Nullhypothesen gegenseitig ausschließen.
Da die untersuchte Stichprobe zufälligen Einflüssen ausgesetzt ist, führt die Methode
nicht notwendigerweise zur richtigen Entscheidung und Fehlentscheidungen können
auftreten, weshalb eine absolut gültige Aussage nicht möglich ist. Demnach können
folgende Ausgänge eines statistischen Tests eintreten:
Ergebnis des
Testverfahrens
H0 richtig
HA richtig
In der Grundgesamtheit ist richtig
Nullhypothese H0
Alternativhypothese HA
korrekte Entscheidung Fehler 2. Art
Fehler 1. Art
korrekte Entscheidung
Wie in der Abbildung gezeigt können 2 Arten von Fehlentscheidungen auftreten.
Definition 40 (Fehler 1. Art, Fehler 2. Art)
Bei einem statistischen Testproblem H0 gegen HA und einem geeigneten statistischen
Test spricht man von einem
• Fehler 1. Art (α-Fehler), wenn H0 verworfen wird, obwohl H0 wahr ist,
• Fehler 2. Art (β-Fehler), wenn H0 beibehalten wird, obwohl HA wahr ist.
40
8. Hypothesentest
Der Fehler 1. Art wird in der Realität als schwerwiegender angesehen als der Fehler 2. Art. Unter dem Fehler 1. Art versteht man das Annehmen einer Hypothese,
obwohl sie falsch ist und bei einem Fehler 2. Art lehnt man eine Hypothese ab,
obwohl sie eigentlich wahr ist. Hieraus folgt die Ungleichbehandlung des Fehlers 1.
und 2. Art. Um schwerwiegende Fehler zu vermeiden, werden statistische Tests so
konstruiert, dass die Wahrscheinlichkeit für das Auftreten des Fehlers 1. Art durch
eine kleine obere Schranke kontrolliert wird. Diese obere Schranke wird auch als
Signifikanzniveau α bezeichnet. Übliche Werte hierfür sind α = 0, 1; 0, 05; 0, 01.
Die Verwerfung der H0 -Hypothese ist somit durch das Signifikanzniveau α kontrolliert. Die Wahrscheinlichkeit für das Auftreten des Fehlers 2. Art wird jedoch nicht
kontrolliert.
Definition 41 (Signifikanztest)
Ein statistischer Test heißt Signifikanztest zum Signifikanzniveau α mit 0 < α < 1,
falls gilt
P (HA annehmen |H0 wahr ) ≤ α
d. h.
P (Fehler 1. Art) ≤ α.
Es ist jedoch zu sagen, dass die Fehlerwahrscheinlichkeit für den Fehler 2. Art wächst,
je kleiner α gewählt wird. Aus diesem Grund ist bei der Wahl des statistischen Testverfahrens darauf zu achten, daß die Fehlerwahrscheinlichkeit 2. Art bei vorgegebener Fehlerwahrscheinlichkeit 1. Art möglichst gering ist.
8.2. Binomialtest
Grundlage des Binomialtest ist eine iid Stichprobe X1 , X2 , . . . , Xn mit zwei Merkmalsausprägungen, welche mit 0 und 1 bezeichnet werden. Jedes Merkmal Xi ist
dann B1,p -verteilt. Zu einer vorgegebenen Wahrscheinlichkeit p0 können nun folgende Hypothesenpaare überprüft werden. Für das erste Hypothesenpaar gilt:
H0 : Die Erfolgswahrscheinlichkeit von Xi ist größer oder gleich p0 (i. Z. p ≥ p0 ).
HA : Die Erfolgswahrscheinlichkeit von Xi ist kleiner als p0 (i. Z. p < p0 ).
Oder umgekehrt für das zweite Hypothesenpaar:
H0 : Die Erfolgswahrscheinlichkeit von Xi ist kleiner oder gleich p0 (i. Z. p ≤ p0 ).
HA : Die Erfolgswahrscheinlichkeit von Xi ist größer als p0 (i. Z. p > p0 ).
8.2.1. Exakter Binomialtest
Die Idee des exakten Binomialtests ist, unter Annahme der Nullhypothese die Wahrscheinlichkeit eines Ergebnisses zu bestimmen, welches die Alternativhypothese mindestens so sehr bestätigt wie das vorliegende Ergebnis E := x1 , x2 , . . . , xn .
P
Zu einer Stichprobe X1 , X2 , . . . , Xn sei Y := ni=1 Xi die Anzahl der Erfolge. Sei e
die Anzahl der Erfolge in E.
41
8. Hypothesentest
Die Wahrscheinlichkeit für ein Ergebnis mit Y = k Erfolgen ist unter Annahme der
Nullhypothese
n k
P (Y = k) = Bn,p0 (k) =
p0 (1 − p0 )n−k .
k
Für das erste Hypothesenpaar bestätigt jedes Ergebnis mit Y = k ≤ e Erfolgen
die Alternativhypothese mindestens so sehr wie E. Die Gesamtwahrscheinlichkeit
für irgend ein Ergebnis mit Y = k ≤ e Erfolgen unter Annahme der Nullhypothese
ist
e
e X
X
n k
P (Y ≤ e) =
Bn,p0 (k) =
p0 (1 − p0 )n−k .
k
k=0
k=0
Die Nullhypothese wird zu einem Signifikanzniveau α verworfen, falls P (Y ≤ e) < α
ist.
Mit bu,α wird der kleinste Wert für e bezeichnet, so dass die Nullhypothese nicht
mehr verworfen werden kann, d. h. bu,α ist diejenige Zahl, für die gilt
P (Y ≤ bu,α − 1) ≤ α < P (Y ≤ bu,α )
bu,α −1 bu,α X n
X
n k
k
n−k
⇔
p0 (1 − p0 )
≤α<
p0 (1 − p0 )n−k .
k
k
k=0
k=0
(8.1)
Die Nullhypothese kann somit genau für Ergebnisse mit e < bu,α Erfolgen abgelehnt
werden, bu,α wird daher als kritische untere Schranke bezeichnet.
Für das zweite Hypothesenpaar bestätigt jedes Ergebnis mit Y = k ≥ e Erfolgen die
Alternativhypothese mindestens so sehr wie E. Die Nullhypothese kann zu einem
Signifikanzniveau α verworfen werden, wenn gilt
P (Y ≥ e) =
n
X
k=e
n X
n k
Bn,p0 (k) =
p (1 − p0 )n−k < α.
k 0
k=e
Mit bo,1−α wird der größte Wert für e bezeichnet, so dass die Nullhypothese nicht
mehr verworfen werden kann, d. h. bo,1−α ist diejenige Zahl für die gilt
⇔
n
X
k=bo,1−α
P (Y ≥ bo,1−α + 1) ≤ α < P (Y ≤ bo,1−α )
n
X
n k
n k
n−k
p0 (1 − p0 )
≤α<
p0 (1 − p0 )n−k .
k
k
+1
k=b
o,1−α
Die Nullhypothese kann somit genau für Ergebnisse mit e > bo,1−α Erfolgen abgelehnt werden, bo,1−α wird daher als kritische obere Schranke bezeichnet.
42
8. Hypothesentest
Diese Darstellung der oberen Schranke lässt sich umformen zu
P (Y ≥ bo,1−α + 1) ≤ α < P (Y ≤ bo,1−α )
n
n
X
X
n k
n k
n−k
⇔
p0 (1 − p0 )
≤α<
p0 (1 − p0 )n−k
k
k
k=b
+1
k=b
o,1−α
o,1−α
bo,1−α −1 X n
X
n k
k
n−k
⇔ 1−
p0 (1 − p0 )
≤α<1−
p0 (1 − p0 )n−k
k
k
k=0
k=0
bo,1−α bo,1−α −1 X n
X
n k
⇔
pk0 (1 − p0 )n−k − 1 ≥ −α >
p (1 − p0 )n−k − 1
k
k 0
k=0
k=0
bo,1−α bo,1−α −1 X
X n
n k
⇔
p0 (1 − p0 )n−k < 1 − α ≤
pk0 (1 − p0 )n−k .
k
k
k=0
k=0
bo,1−α
Zusammenfassend gilt für die Entscheidungsvorschrift
H0
p ≥ p0
p ≤ p0
HA
p < p0
p > p0
H0 wird abgelehnt, falls
e < bu,α
e > bo,1−α
Tabelle 8.1.: Entscheidungsregeln für den exakten Binomialtest
Bemerkung 42
Ein Problem dieses Tests sehe ich darin, dass die Wahrscheinlichkeit p0 nicht fest
vorgegeben ist, sondern geschätzt wird. Dieses bringt eine zusätzliche Testungenauigkeit.
8.3. Vergleich zweier relativer Häufigkeiten
Der im Folgenden beschriebene Test, welcher sich im Wesentlichen auf Cramer (2003)
S. 89 stützt, vergleicht die Erfolgswahrscheinlichkeit von B1,p -verteilten Merkmalen.
Hierzu seien X1 , X2 , . . . , Xn verteilt nach B1,p1 und Y1 , Y2 , . . . , Ym verteilt nach B1,p2
stochastisch unabhängige iid Stichproben. Dazu definiert man
n
d :=
m
1X
1 X
Xi −
Yj ,
n i=1
m j=1
1
p :=
n+m
n
X
Xi +
i=1
j=1
und die Prüfstatistik
V :=
d
p(1 − p)
1
n
43
+
m
X
1
m
.
Yj
!
8. Hypothesentest
Für die Entscheidungsregeln ergibt sich mit dem Quantil u1−α der Standardnormalverteilung:
H0
p1 ≤ p2
p1 ≥ p2
HA
p1 > p2
p1 < p2
H0 wird abgelehnt, falls
V > u1−α
V < −u1−α
Tabelle 8.2.: Entscheidungsregeln zum Vergleich zweier Wahrscheinlichkeiten
Dieses ist plausibel, da V umso größer wird, je größer die Differenz d zwischen p1
und p2 ist. Daher ist ein großer Wert für V ein Indikator dafür, dass tatsächlich
p1 > p2 ist. Entsprechend ist bei kleinen Werten V wahrscheinlich p1 < p2 .
8.4. χ2-Anpassungstest
Der im Folgenden beschriebende χ2 -Anpassungstest stützt sich hauptsächlich auf
Cramer (2003) S. 99f.
Der χ2 -Anpassungstest dient zur Überprüfung der Verteilungseigenschaften einer
statistischen Grundgesamtheit, d. h. der Test überprüft, ob die Daten einer bestimmten Verteilung entsprechen. Die Kenntnis der Wahrscheinlichkeitsverteilung
ist notwendig für die Durchführung eines Hypothesentests.
Bei dem χ2 Anpassungstest wird ein Merkmal x betrachtet, dessen Wahrscheinlichkeitsverteilung in der Grundgesamtheit unbekannt ist. Hierbei wird folgende Nullhypothese aufgestellt:
H0 : Das Merkmal X hat die Wahrscheinlichkeitsverteilung Q.
Zur Durchführung des Tests ist es notwendig, die Daten zu kategorisieren. Dazu
wird eine endliche disjunkte Überdeckung (Mj )j=1,2,...,m des Grundraums definiert.
Die q Daten werden somit zu m Klassen zusammengefasst, die Anzahl der Elemente
der j-ten Klasse wird mit qj bezeichnet.
Die unter Nullhypothese erwartete Anzahl von Elementen in der j-ten Klasse ist
rj = Q(Mj ) · q.
Daraus resultiert die χ2 -Prüfstatistik
χ2 = q ·
m
X
(qj − rj )2
.
r
j
j=1
Diese ist offenbar sehr klein, falls qj und rj ungefähr gleich sind. Nach dem Satz von
Fischer (Satz 52) ist sie annähernd χ2 -verteilt mit m − 1 Freiheitsgraden.
Zu einem Signifikanzniveau α wird die Nullhypothese abgelehnt, falls χ2 > χ2m−1;1−α
ist.
44
9. Verteilungsfreie Testverfahren
9.1. Tabellenanalyse und Unabhängigkeitstest
Für eine Tabellenanalyse ist es nicht notwendig, die statistische Verteilung der Daten
zu kennen. Die Analyse von Daten mit Hilfe von Tabellen beruht auf der Untersuchung der absoluten bzw. relativen Häufigkeitsverteilung eines Merkmals.
Hierzu definiert Cramer (2003) S. 33 die absoluten und relativen Häufigkeiten wie
folgt:
Definition 43 (Absolute Häufigkeit, Relative Häufigkeit)
Sei X eine diskrete Variable mit den Realisationsmöglichkeiten x1 , x2 , . . . , xj . Die
Anzahl des Vorkommens von xi in einer Stichprobe X1 , X2 , . . . , Xq heißt absolute
Häufigkeit qi . Formal ist qi definiert durch
qi :=
q
X
1{xi } (Xj ).
j=1
Für den Vergleich unterschiedlicher Datensätze wird ein normiertes Maß, die relative
Häufigkeit verwendet. Die relative Häufigkeit fi von xi ist
fi :=
qi
.
q
Sind die Zufallsvariablen X1 , X2 , . . . , Xq unabhängig, so ist für einen großen Stichprobenumfang fi ≈ P (X = xi ).
Bei Fragen, die Mehrfachantworten zulassen, wird die Antwort durch eine Teilmenge
X der Realisationsmöglichkeiten {x1 , x2 , . . . , xj } repräsentiert. Ist X1 , X2 , . . . , Xq
eine solche Stichprobe, dann gibt es verschiedene Möglichkeiten, die Begriffe relative
Häufigkeit und absolute Häufigkeit zu übertragen.
Definition 44 (Gewichtete und ungewichtete absolute und relative Häufigkeit)
Sei X1 , X2 , . . . , Xq eine Stichprobe mit Xi ⊂ {x1 , x2 , . . . , xj }.
• Bei der gewichteten absoluten Häufigkeit wird jedes Xk gleich gewichtet, d. h.
man definiert die gewichtete absolute Häufigkeit q g := q und
qig :=
q
X
1Xj (xi )
j=1
|Xj |
45
,
i = 1, 2, . . . , j.
9. Verteilungsfreie Testverfahren
• Bei der ungewichteten absoluten Häufigkeit wird jedes Element der Xk gleich
gewichtet, d. h. man definiert die ungewichtete absolute Häufigkeit
u
q :=
q
X
j=1
qiu :=
q
X
|Xj |,
1Xj (xi ),
i = 1, 2, . . . , j.
j=1
Die gewichteten bzw. ungewichteten relativen Häufigkeiten werden entsprechend definiert durch
qu
qg
fig := ig und fiu := iu , i = 1, 2, . . . , j.
q
q
Bemerkung 45
Falls die Realisationsmöglichkeiten x1 , x2 , . . . , xj kategorisiert werden, so werden sie
in disjunkte Klassen x′1 , x′2 , . . . , x′k ⊂ {x1 , x2 , . . . , xj } aufgeteilt. Die (gewichteten
oder ungewichteten) absoluten und relativen Häufigkeiten der Klassen ergeben sich
dann durch q ′ := q und
X
qi′ :=
ql
xl ∈x′i
bzw. analog für q ′g , qi′g , q ′u und qi′u .
Die relativen Häufigkeiten der Klassen ergeben sich entsprechend durch
fi′ :=
qi′
q′
bzw. analog für f ′g , fi′g , f ′u und fi′u .
Die Tabellenanalyse eignet sich gut, um nominale Merkmale zu analysieren. Im Allgemeinen wird von m × n-Kontingenztabellen gesprochen. Die einfachste Art von
Häufigkeitstabellen, welche aber in der empirischen Sozialforschung häufig verwendet
werden, sind die 2 × 2-Tabellen (Vierfeldertabellen). Diese ermöglichen die Betrachtung von zwei dichotomen Merkmalen X und Y .
x(1)
x(2)
..
.
x(m)
Summe
y(1)
q11
q21
..
.
qm1
q•1
y(2)
q12
q22
qm2
q•2
...
...
...
..
.
...
...
y(n)
q1n
q2n
..
.
qmn
q•n
Summe
q1•
q2•
..
.
qm•
q
x(1)
x(2)
..
.
x(m)
Summe
(a) absolute Häufigkeiten
y(1)
f11
f21
..
.
fm1
f•1
y(2)
f12
f22
fm2
f•2
...
...
...
..
.
...
...
y(n)
f1n
f2n
..
.
fmn
f•n
Summe
f1•
f2•
..
.
fm•
1
(b) relative Häufigkeiten
Tabelle 9.1.: Kontingenztafeln
Die Werte qi• bzw. fi• mit i = 1, 2, . . . , m und q•j bzw. f•j mit j = 1, 2, . . . , n werden
als Zeilensumme bzw. Spaltensumme bezeichnet.
46
9. Verteilungsfreie Testverfahren
D.h für die Zeilensumme gilt
qi• =
fi• =
n
X
j=1
n
X
qij ,
i = 1, 2, . . . , m bzw.
fij ,
i = 1, 2, . . . , m
qij ,
j = 1, 2, . . . , n bzw.
fij ,
j = 1, 2, . . . , n.
j=1
und für die Spaltensumme
q•j =
f•j =
m
X
i=1
m
X
i=1
Die Zeilensumme und Spaltensumme wird nach Cramer (2003) S. 34 für Kontingenztafeln mit absoluten Häufigkeiten als Randhäufigkeit bzw. für Kontingenztafeln
mit relativen Häufigkeiten als Randverteilung bezeichnet.
Für die Summe der Randhäufigkeiten bzw. Randverteilung gilt:
m
X
i=1
m
X
qi• = q
n
X
und
j=1
n
X
fi• = 1 und
i=1
q•j = q bzw.
f•j = 1.
j=1
Die Wahrscheinlichkeit der Elementarereignisse des Merkmaltupels (X, Y ) wird bezeichnet mit
pij = P (X = x(i), Y = y(j)),
i = 1, 2, . . . , m;
j = 1, 2, . . . , n.
Des Weiteren ist
pi• :=
n
X
pij = P (X = x(i)),
j=1
p•j :=
m
X
pij = P (Y = y(j)).
i=1
Nach Definition 43 wird für große Stichproben pij ≈ fij sein.
Bemerkung 46
Die relativen Häufigkeiten sind Maximum-Likelihood-Schätzer für die Wahrscheinlichkeiten. Genauer:
• fij ist ML-Schätzer für pij
• fi• ist ML-Schätzer für pi•
• f•j ist ML-Schätzer für p•j
47
9. Verteilungsfreie Testverfahren
Im Falle der Unabhängigkeit der Variablen X und Y ist insbesondere fi• · f•j ein
ML-Schätzer für pij .
Beweis. Es ist 1(x(i),y(j)) (X, Y ) eine B1,p -verteilte Zufallsvariable mit p = P (X =
x(i), Y = y(j)) = pij . Nach Beispiel 35 ist somit ein ML-Schätzer ϑˆq für pij gegeben
durch
q
qij
1X
ϑˆq ((X1 , Y1), . . . , (Xq , Yq )) =
1(x(i),y(j)) (Xk , Yk ) =
= fij .
q
q
k=1
Der Beweis für fi• und f•j verläuft analog. Im Falle der Unabhängigkeit ist somit
fi• · f•j ein ML-Schätzer für
pi• · p•j = P (X = x(i)) · P (Y = y(j)) = P (X = x(i), Y = y(j)) = pij .
9.1.1. Spaltenprozentuierung
Die Spaltenprozentuierung, welche im Wesentlichen aus Diaz-Bone (2006) S. 66 erarbeitet wurde, ist die einfachste Methode, mit der die Beziehungen zweier Variablen
X und Y zueinander untersucht werden kann.
Satz 47
Für die Variablen X und Y gilt
X und Y sind unabhängig ⇔ ∀j = 1, 2, . . . , n :
p1j
p2j
pmj
=
= ··· =
p1•
p2•
pm•
Beweis. Zur Rückrichtung: Sei
p1j
p2j
pmj
=
= ··· =
p1•
p2•
pm•
Aus pij = P (X = x(i), Y = y(j)) und pi• = P (X = x(i)) folgt
∀i, k ∈ {1, 2, . . . , n} :
P (X = x(i), Y = y(j))
P (X = x(k), Y = y(j))
=
.
P (X = x(i))
P (X = x(k))
48
9. Verteilungsfreie Testverfahren
Somit gilt
P (X = x(i))P (Y = y(j)) = P (X = x(i))
n
X
P (X = x(k), Y = y(j))
k=1
= P (X = x(i))
n
X
P (X = x(k))
P (X = x(k), Y = y(j))
P (X = x(k))
P (X = x(k))
P (X = x(i), Y = y(j))
P (X = x(i))
k=1
= P (X = x(i))
n
X
k=1
n
P (X = x(i), Y = y(j)) X
P (X = x(k))
= P (X = x(i))
P (X = x(i))
k=1
= P (X = x(i), Y = y(j))
und daher die Unabhängigkeit.
Zur Hinrichtung: Sind umgekehrt X und Y unabhängig, so gilt für j = 1, 2, . . . n
und beliebige i, k
pij
P (X = x(i), Y = y(j))
P (X = x(k), Y = y(j))
pij
=
= P (Y = y(j)) =
=
pi•
P (X = x(i))
P (X = x(k))
pk•
Da
fij
fi•
≈
pij
pi•
ist, werden die Variablen X und Y als unabhängig voneinander ange-
nommen, falls
f1j
f1•
≈
f2j
f2•
≈ ··· ≈
fmj
fm•
gilt.
Bemerkung 48
Die statistische Unabhängigkeit ist eine symmetrische Eigenschaft, das heißt, wenn
X und Y unabhängig sind, so sind auch umgekehrt Y und X voneinander unabhängig. Daher ist es gleich ob man eine Spaltenprozentuierung oder eine Reihenprozentuierung durchführt, denn man erhält für beide Verfahren das selbe Ergebnis.
9.1.2. Fisher-Test
Der nachstehend beschriebene Fischer-Test stützt sich im Wesentlichen auf Hartung (1982) S. 414 und Rüger (2002) S. 232ff.
Der Fisher-Test testet zwei dichotome Variablen X und Y auf Abhängigkeit. Er
wird im Allgemeinen nur für sehr kleine Stichprobengrößen verwendet, da der Rechenaufwand für größere Stichproben sehr hoch ist. Umfangreichere Stichproben
werden daher in der Regel mit Hilfe des Yates-Tests oder des allgemeinen χ2 Unabhängigkeitstests untersucht. Der Fisher-Test ist nur eine Sonderform des χ2 Test. Der Fisher-Test lässt sich nur auf dichotome Variablen, also auf 2 × 2-Tabellen
anwenden.
Die Grundidee des Fisher-Test ist die Überprüfung eines vorliegenden Testergebnisses unter der Annahme, dass die Variablen unabhängig sind.
Hierbei werden zwei Hypothesen definiert.
49
9. Verteilungsfreie Testverfahren
Nullhypothese H0 : Die Variablen X und Y sind unabhängig, d. h.
∀i, j : pij = pi• · p•j .
Alternativhypothese HA : Die Variablen X und Y sind abhängig, d. h.
∃i, j : pij 6= pi• · p•j .
Anschließend wird die Wahrscheinlichkeit des Stichprobenergebnisses oder eines extremeren Ergebnisses unter Annahme der Nullhypothese berechnet. Mit Hilfe der
hypergeometrischen Verteilung, die für diskrete Variablen definiert ist, lässt sich die
Wahrscheinlichkeit berechnen, mit der bei gegebenen univariaten Randverteilungen
eine bestimmte Häufigkeitsverteilung in der Vierfeldertabelle auftritt. Liegt diese
unter dem a-priori festgelegtem Signifikanzniveau, so wird die Alternativhypothese
angenommen.
Bei festgelegten Randverteilungen der Kontingenztabelle ist die gesamte Tabelle
durch Festlegung eines Wertes bestimmt. Die Wahrscheinlichkeit des Auftretens einer Tabelle ist durch die hypergeometrische Verteilung gegeben, d. h.
q11 + q21
q12 + q22
y(1) y(2)
q11
q12
für die Tabelle T := x(1) q11 q12
pT := q11 + q12 + q21 + q22
x(2) q21 q22
q11 + q12
Sei S die Tabelle des Stichprobenergebnisses. Dann wird die Menge T der Tabellen
bestimmt, die die Alternativhypothese mindestens so sehr bestätigen wie S. Es ist
T := {T : pT ≤ pS }.
Gilt für die Wahrscheinlichkeit p, dass eine Tabelle aus T trotz Zutreffen der Nullhypothese auftritt ist nun
X
p=
pT ≤ α,
T ∈T
so kann die Nullhypothese verworfen und die Alternativhypothese angenommen werden.
Beispiel 49
15 Jugendliche (5 Jungen, 10 Mädchen) wurden befragt, ob sie einen Nebenjob
besitzen. Dabei ist folgende Kontingenztabelle entstanden:
x(1)
x(2)
y(1) y(2)
1
4
7
3
Hierbei steht die Variable X für das Geschlecht. Sie hat die Merkmalsausprägungen
x(1) = männlich und x(2) = weiblich. Die Variable Y hat die Merkmalsausprägungen
y(1) = arbeitet und y(2) = arbeitet nicht. Zu einem Signifikanzniveau α = 0, 05 soll
nun getestet werden, ob die Variablen X und Y abhängig voneinander sind.
Die Ermittlung aller möglichen Tabellen unter vorgegebener Randverteilung und
deren Eintrittswahrscheinlichkeit ergibt:
50
9. Verteilungsfreie Testverfahren
y(1) y(2)
x(1) 0
5
x(2) 8
2
y(1) y(2)
x(1) 1
4
x(2) 7
3
y(1) y(2)
x(1) 2
3
x(2) 6
4
0.007
0.093
0.326
y(1) y(2)
x(1) 3
2
x(2) 5
5
y(1) y(2)
x(1) 4
1
x(2) 4
6
y(1) y(2)
x(1) 5
0
x(2) 3
7
0.392
0.163
0.019
Nun müssen alle Wahrscheinlichkeiten aufsummiert werden, die kleiner oder gleich
sind als unser eingetretenes Ereignis. Für dieses Beispiel bedeutet das konkret:
p = 0, 007 + 0, 093 + 0, 019 = 0, 119.
Es ist also 0, 119 ≥ 0, 05, damit ist p ≥ α. Somit muss die Alternativhypothese
verworfen werden.
Der Fisher-Test lässt sich jedoch für große Stichprobenumfänge nicht anwenden. Für
mittelgroße Stichproben verwendet man den Yates-Test.
9.1.3. Yates-Test
Auch der Yates-Test, welcher hier im Wesentlichen nach Hartung (1982) S. 414 beschrieben wird, wird zur Unabhängigkeitsanalyse dichotomer Merkmale verwendet.
Er wird für Untersuchungsumfänge bis ungefähr 60 Stichproben angewandt.
Dafür wird die χ2Y ates -Teststatistik berechnet:
χ2Y ates
|q11 q22 − q12 q21 | −
=
q1• q2• q•1 q•2
q 2
2
Diese Teststatistik ist annähernd χ21 -verteilt. Daher kann die Abhängigkeit der Variablen auf einem Signifikanzniveau α angenommen, d. h. die Unabhängigkeitshypothese H0 verworfen werden, wenn χ2Y ates > χ21;1−α gilt. Dabei ist χ21;1−α das 1−α-Quantil
der χ2 -Verteilung mit einem Freiheitsgrad.
Bemerkung 50
Die Verteilungsfunktion der χ2 -Verteilung ist nicht explizit ausrechenbar, sie bzw.
ihre Quantile sind vertafelt und dort entsprechend abzulesen.
9.1.4. χ2 -Unabhängigkeitstest für 2 × 2-Tabellen
Der folgende χ2 -Unabhängigkeitstest ist im Wesentlichen in Anlehnung an Cramer (2003) S. 105ff, Hartung (1982) S. 118f und Rüger (2002) S. 220ff beschrieben.
51
9. Verteilungsfreie Testverfahren
Für groß werdende Stichprobenumfänge q spielt der lineare Summand 2q aus dem
Zähler der χ2Y ates -Teststatistik eine zunehmend kleinere Rolle. Daher wird bei großen
Stichprobenumfängen die χ2 -Statistik berechnet durch:
χ2 =
(q11 q22 − q12 q21 )2
q1• q2• q•1 q•2
(9.1)
Wie beim Yates-Test ist diese annähernd χ21 -verteilt. Daher wird auch hier die Nullhypothese verworfen, falls χ2 > χ21;1−α gilt.
Die Richtung der Abhängigkeit
Um Aussagen über die Richtung der Abhängigkeit machen zu können, werden die
Hypothesen wie folgt verändert:
p21
p11
≤
,
p1•
p2•
p11
p21
Fall 2 : H0 :
≥
,
p1•
p2•
Fall 1 : H0 :
p11
p21
>
p1•
p2•
p11
p21
HA :
<
p1•
p2•
HA :
Die Nullhypothese kann nach Cramer (2003) S. 107 verworfen werden, wenn
Fall 1 : χ2 ≥ χ21,1−2α und q11 · q22 > q12 · q21
Fall 2 : χ2 ≥ χ21,1−2α und q11 · q22 < q12 · q21
Bemerkung 51
Man beachte, dass die Nullhypothese wegen χ21,1−α ≥ χ21,1−2α insbesondere verworfen
werden kann, wenn
Fall 1 : χ2 ≥ χ21,1−α und q11 · q22 > q12 · q21
Fall 2 : χ2 ≥ χ21,1−α und q11 · q22 < q12 · q21
Somit wird zuerst ein gewöhnlicher χ2 -Unabhängigkeitstest durchgeführt und im
Fall der Abhängigkeit eine weitere Bedingung für die Richtung getestet.
9.1.5. χ2 -Unabhängigkeitstest für m × n-Tabellen
Folgende Verallgemeinerung des χ2 -Unabhängigkeitstest stützt sich im Wesentlichen
auf Cramer (2003) S. 199f und Hartung (1982) S. 435.
Die χ2 -Statistik aus der Gleichung (9.1) lässt sich darstellen als
2 X
2
X
(fij − eij )2
χ =q·
.
eij
i=1 j=1
2
Hierbei sind fij die relativen Häufigkeiten und eij := fi• f•j .
52
9. Verteilungsfreie Testverfahren
Falls die Variablen unabhängig sind, ist
eij := fi• f•j ≈ pi• p•j = P (X = x(i))P (Y = y(i))
unabh.
= P (X = x(i), Y = y(i)) = pij ≈ fij
eine Approximation der relativen Häufigkeit. Es lässt sich sogar zeigen, das eij dann
der Maximum-Likelihood-Schätzer für fij ist.
Es ist plausibel, dass fij um so mehr von eij abweicht, also (fij −eij )2 umso größer ist,
je abhängiger die Variablen sind. Die Division durch eij skaliert diese Abweichung.
Daher ist χ2 nach dieser Darstellung ein plausibles Maß für die Abhängigkeit der
Variablen.
Diese Darstellung der χ2 -Statistik lässt sich für m×n-Tabellen verallgemeinern zu
χ2 = q ·
m X
n
X
(fij − eij )2
.
e
ij
i=1 j=1
Satz 52 (Satz von Fischer59 )
Seien X1 , X2 , . . . , Xq eine iid Stichprobe der Merkmale {a1 , . . . , ar } mit L(Xk ) =
L(X). Seien ek ML-Schätzer für P (X = k). Sei
qk = |{j : Xj = ak }| ,
k = 1, . . . , r.
Dann konvergiert die Verteilung der Testgröße
χ˜2 =
r
X
(qk − qek )2
qek
k=1
für wachsenden Stichprobenumfang gegen eine χ2 -Verteilung mit r − 1 Freiheitsgraden.
Nach dem Satz von Fischer ist die Teststatistik χ2 somit χ2(m−1)(n−1) -verteilt. Denn
eij sind im Falle der Unabhängigkeit Maximum-Likelihood-Schätzer für pij und es
gilt:
59
Vgl. Küchler (2006) S. 259.
53
9. Verteilungsfreie Testverfahren
m X
n
X
(fij − eij )2
χ =q
eij
i=1 j=1
2
qij
m X
n
−
e
X
ij
q
=q
eij
i=1 j=1
2
=q
m X
n
X
1
q2
(qij − qeij )2
i=1 j=1
=q
=
1
qeij
q
m X
n 1
X
(qij − qeij )2
q
i=1 j=1
m
n
XX
i=1 j=1
qeij
(qij − qeij )2
qeij
Nun ergibt sich die Anzahl der Freiheitsgrade im Satz von Fisher gerade dadurch,
dass die r −1 Größen q1 , q2 , . . . qr−1 die Werte q1 , q2 , . . . qr−1 , qr vollständig definieren.
Für unseren χ2 -Test werden die Werte qij , i = 1, 2, . . . , m; j = 1, 2, . . . , n eindeutig
durch die Kenntnis der Werte für qij , i = 1, 2, . . . , m−1; j = 1, 2, . . . , n−1 festgelegt.
Somit konvergiert die Teststatistik χ2 gegen eine χ2 -Verteilung mit (m − 1)(n − 1)
Freiheitsgraden.
Daher wird für m × n-Tabellen die Unabhängigkeitshypothese H0 bei einem Signifikanzniveau α verworfen, wenn χ2 > χ2(m−1)(n−1);1−α ist.
Die Richtung der Abhängigkeit
Die in Bemerkung 51 dargestellte Idee für das Testen einer Richtung lässt sich auf
m × n-Tabellen mit Ordinale Merkmalen übertragen. Dabei wird zuerst mittels des
χ2 -Unabhängigkeitstests die Abhängigkeit der Variablen festgestellt und anschließend eine weitere Bedingung für die Richtung geprüft.
Im 2 × 2-Fall lautet die Bedingung
⇔
⇔
⇔
⇔
q11 · q22 > q12 · q21
f12 f21
f11 f22
·
> q2 ·
·
q2 ·
f1• f2•
f1• f2•
f11 f2• − f21
f1• − f11 f21
·
>
·
f1•
f2•
f1•
f2•
f11 f11 f21
f21 f11 f21
−
·
>
−
·
f1• f1• f2•
f2• f1• f2•
f11
f21
>
f1•
f2•
bzw. analog
q11 · q22 < q12 · q21 ⇔
54
f11
f21
<
.
f1•
f2•
9. Verteilungsfreie Testverfahren
Diese Überlegung lässt sich auf m × 2 übertragen. Dann lauten die Hypothesen
pi1
pj1
≤
,
pi•
pj•
pj1
pi1
Fall 2 : H0 : ∃i < j :
≥
,
pi•
pj•
Fall 1 : H0 : ∃i < j :
pi1
pj1
>
pi•
pj•
pi1
pj1
HA : ∀i < j :
<
pi•
pj•
HA : ∀i < j :
Mit der obigen Äquivalenz kann analog zum 2 × 2-Fall in Bemerkung 51 die Nullhypothese abgelehnt werden, wenn
qi1
qj1
>
qi•
qj•
qj1
qi1
und ∀i < j :
<
qi•
qj•
Fall 1 : χ2 ≥ χ21,1−α und ∀i < j :
2
Fall 2 : χ ≥
χ21,1−α
(9.2)
Diese Überlegungen können auf beliebige m × n-Tabellen übertragen werden. Die
allgemeine Idee kann auf zwei äquivalente Weisen plausibel gemacht werden:
• Werden die Merkmale y(1) < y(2) < · · · < y(n) in zwei Mengen {y(i) : i ≤ k}
und {y(i) : i > k} zerlegt und die Realisationen zusammengefasst, so ergibt
sich eine m × 2-Tabelle mit
k
qi1
:=
k
X
qil ,
k
qi2
:=
l=1
m
X
qil ,
i = 1, 2, . . . , m
l=k+1
Zwischen den Variablen der m × n-Tabelle gilt genau dann eine gerichtete
Abhängigkeit, wenn für jedes k = 1, . . . , m−1 und die Zerlegung {y(i) : i ≤ k}
und {y(i) : i > k} in der so entstandenen m×2-Tabelle gerichtete Abhängigkeit
gilt, d. h. wenn für alle k = 1, 2, . . . , m − 1 gilt:
∀i < j :
k
k
qj1
qi1
>
qi•
qj•
bzw. ∀i < j :
k
k
qj1
qi1
<
.
qi•
qj•
(9.3)
• Die Variable nimmt für x(i) dann kleinere Werte als für x(j) an, wenn für
jedes k = 1, 2, . . . , m − 1 gilt
P (Y ≤ y(k)|X = x(i)) > P (Y ≤ y(k)|X = x(j)).
(9.4)
Dieses ist äquivalent zu
P (Y ≤ y(k)|X = x(i)) > P (Y ≤ y(k)|X = x(j))
⇔
⇔
k
X
l=1
k
X
l=1
P (Y = y(l)|X = x(i)) >
k
X
P (Y = y(l)|X = x(j))
l=1
k
X pjl
pil
>
pi•
pj•
l=1
(9.5)
55
9. Verteilungsfreie Testverfahren
Es existiert genau dann eine gerichtete Abhängigkeit, wenn für x(i) > x(j)
auch P (Y ≤ y(k)|X = x(i)) > P (Y ≤ y(k)|X = x(j)) bzw. P (Y ≤ y(k)|X =
x(i)) < P (Y ≤ y(k)|X = x(j)) gilt. Für großen Stichprobenumfang gilt
qil
fil
pil
=
≈
qi•
fi•
pi•
p
q
jl
jl
≈ pj•
. Wird dieses in die obige Darstellung (9.5) eingesetzt,
und analog ist qj•
so ergibt sich die Bedingung (9.3).
Somit ergibt sich für allgemeine m × n-Tabellen: Die Hypothesen sind
Fall 1: Die Alternativhypothese ist „Je größer X desto größer Y “, d. h.
H0 :
HA :
∃i < j∃k : P (Y ≤ y(k)|X = x(i)) ≤ P (Y ≤ y(k)|X = x(j)),
∀i < j∀k : P (Y ≤ y(k)|X = x(i)) > P (Y ≤ y(k)|X = x(j)).
Fall 2: Die Alternativhypothese ist „Je größer X desto kleiner Y “, d. h.
H0 :
HA :
∃i < j∃k : P (Y ≤ y(k)|X = x(i)) ≥ P (Y ≤ y(k)|X = x(j)),
∀i < j∀k : P (Y ≤ y(k)|X = x(i)) < P (Y ≤ y(k)|X = x(j)).
Aus obigen Überlegungen folgt die Entscheidungsregel: Lehne H0 ab, wenn
2
Fall 1 : χ ≥
χ21,1−α
Fall 2 : χ2 ≥ χ21,1−α
k
k
X
X
qil
qjl
und ∀i < j∀k :
>
qi•
qj•
l=1
l=1
k
k
X
X
qil
qjl
<
und ∀i < j∀k :
qi•
qj•
l=1
(9.6)
l=1
Bemerkung 53
Für diesen Test lässt sich – im Gegensatz zum Test für 2×2-Tabellen – kein explizites
Signifikanzniveau angeben. Bei 2 × 2-Tabellen enthält eine signifikante Abhängigkeit
automatisch eine Richtung, d. h. der Wert f11 ist deutlich größer oder deutlich kleiner
als f21 . Die Wahrscheinlichkeit, dass ein solches Ergebnis unter Abhängigkeit in die
andere Richtung eintritt, ist gering.
Beim allgemeinen Test hingegen testet der χ2 -Test nur, ob mindestens ein Wert
abhängig ist. Dieses impliziert jedoch nicht, dass in anderen Feldern die Unterschiede
groß sind. So wird in dem Beispiel in den unten dargestellten Tabellen die Hypothese
„Je größer X desto größer Y “ angenommen, obwohl die Hypothese falsch ist. Jedoch
ist dieses Resultat für die relativen Häufigkeiten nicht unwahrscheinlich.
p
x(1)
x(2)
x(3)
y(1) y(2)
0.8
0.2
0.3
0.7
0.3
0.7
f
x(1)
x(2)
x(3)
y(1) y(2)
0.8
0.2
0.31 0.69
0.3
0.7
Daher ist die Richtung der Abhängigkeit nur dann „signifikant“, wenn die Unterschiede hinreichend groß sind.
56
9. Verteilungsfreie Testverfahren
9.2. Wilcoxon-Rangsummentest
Der im Folgenden beschriebende Test stützt sich im Wesentlichen auf Cramer (2003)
S. 103f und Hartung (1982) S. 513ff.
Mit dem Wilcoxon-Rangsummentest60 werden zwei iid Stichproben X1 , X2 , . . . , Xn
und Y1 , Y2 , . . . , Ym vergleichbarer, ordinaler Merkmale X und Y miteinander verglichen. Neben der Voraussetzung, dass die Merkmale X und Y ordinal sind, muss auch
die Verteilungsfunktion dieser Merkmale stetig sein, da dann die Wahrscheinlichkeit,
dass Merkmale mehrfach vorkommen, Null ist.
Definition 54
Seinen X und Y vergleichbare ordinale Merkmale. Man sagt X nimmt tendenziell
kleinere Werte an als Y (i. Z. X <t Y ), wenn gilt
1
P (X < Y ) > .
2
Anschaulich bedeutet dieses, falls aus der Stichprobe ein x und y gezogen wird, so
ist wahrscheinlich x < y.
Analog wird X ≤t Y , X ≥t Y und X >t Y definiert.
Es können nun die folgenden Hypothesen untersucht werden:
H0 : Das Merkmal X nimmt tendenziell kleinere oder gleiche Werte wie das Merkmal Y an (X ≤t Y ).
HA : Das Merkmal X nimmt tendenziell größere Werte als das Merkmal Y an
(X >t Y ).
Oder umgekehrt kann untersucht werden:
H0 : Das Merkmal X nimmt tendenziell größere oder gleiche Werte wie das Merkmal
Y an (X ≥t Y ).
HA : Das Merkmal X nimmt tendenziell kleinere Werte als das Merkmal Y an
(X >t Y ).
Eine zentrale Kenngröße für diesen Test ist der Rang eines Wertes in einer Stichprobe.
Definition 55 (Rang, Rangwert)
Seien X1 , X2 , . . . , Xn die Stichprobe eines ordinalen Merkmals. Dann bezeichnet X(i)
mit i = 1, 2, . . . , n in einem geordneten Datensatz X(1) ≤ X(2) ≤ · · · ≤ X(n) den i-ten
Rangwert. Der Rang R(Xi ) ist die Position den i-ten Beobachtung in dem geordneten
Datensatz.
Kommt der Wert Xi in dem Datensatz nur einmal vor, so ist
R(Xi ) = j ⇔ Xi = X(j) .
60
Man bezeichnet den approximativen Rangsummentest auch als U-Test von Mann-Whitney
57
9. Verteilungsfreie Testverfahren
Falls der Wert Xi mehrfach im Datensatz vorkommt, so ist
X(j−1) < X(j) = X(j+1) = · · · = X(j+s) < X(j+s+1) .
|
{z
}
=Xi
Der Rang R(Xi ) ist dann definiert durch
j+s
1 X
R(Xi ) =
k.
s + 1 k=j
Für den Wilcoxon-Rangsummentest werden die beiden Stichproben Xi und Yj mit
i = 1, 2, . . . , n und j = 1, 2, . . . , m zusammengefasst zu einer Menge
Z := {X1 , X2 , . . . , Xn , Y1 , Y2, . . . , Ym }.
Anschließend werden die Rangsummen berechnet durch
WX :=
n
X
RZ (Xi ),
WY :=
m
X
RZ (Yj ).
j=1
i=1
Da die Summe WX + WY = 12 (n + m)(n + m + 1) konstant ist, genügt es, die
Rangsumme WX zu berechnen.
9.2.1. Exakter Rangsummentest
Für Stichproben X1 , X2 , . . . , Xn und Y1 , Y2 , . . . , Ym wird Wn,m := WX definiert. Des
Weiteren ist
pn,m (w) := P (Wn,m = w)
die Wahrscheinlichkeit unter Annahme der Nullhypothese, dass Wn,m = w ist.
Lemma 56
Für pn,m gilt die Rekursion
pn,m(w) = pn−1,m (w − n − m) ·
n
m
+ pn,m−1 (w) ·
.
n+m
n+m
Beweis. Durch Aufspalten der Wahrscheinlichkeit P (Wn,m = w) in die beiden Fälle,
dass das größte Element der Menge Z ein Xi bzw. ein Yj (i. Z. max(Z) = X bzw.
max(Z) = Y ) ist, ergibt sich:
58
9. Verteilungsfreie Testverfahren
pn,m (w) = P (Wn,m = w)
= P (Wn,m = w| max(Z) = X) · P (max(Z) = X)
+ P (Wn,m = w| max(Z) = Y ) · P (max(Z) = Y )
m
n
= P (Wn−1,m = w − n − m) ·
+ P (Wn,m−1 = w) ·
n+m
n+m
n
m
= pn−1,m (w − n − m) ·
+ pn,m−1 (w)
.
n+m
n+m
• Falls H0 : X ≤t Y und HA : X >t Y , so ist die kritische Schranke cu,α die
kleinste Zahl, für die P (Wn,m ≤ cu,α ) > α gilt. Das heißt cu,α ist die eindeutig
bestimmte Zahl, für die gilt:
cu,α −1
X
w=0
pn,m (w) ≤ α <
cu,α
X
pn,m (w).
w=0
• Falls H0 : X ≥t Y und HA : X <t Y , so ist die kritische Schranke co,α die
größte Zahl, für die P (Wn,m ≥ co,α ) > α gilt. Das heißt co,α ist die eindeutig
bestimmte Zahl, für die gilt:
X
X
pn,m (w) ≤ α <
pn,m (w).
w≥co,α +1
w≥co,α
Es ergeben sich die folgenden Entscheidungsvorschriften:
H0
X ≥t Y
X ≤t Y
H0 wird abgelehnt, falls
WX < cu,α
WX > co,α
HA
X <t Y
X >t Y
Tabelle 9.2.: Entscheidungsregeln für den exakten Wilcoxon-Rangsummentest
9.2.2. Approximativer Rangsummentest
Für diesen Test wird eine Kenngröße U später eingeführt. Dazu wird jedem Merkmal
Xi ∈ Z die Anzahl Ni := |{Yj : Yj > Xi }| der Yj , die größer als Xi sind, zugeordnet.
Dann wird definiert
n
X
U :=
Ni .
i=1
Lemma 57
Es gilt die Gleichung
U = nm +
n(n + 1)
− WX .
2
59
9. Verteilungsfreie Testverfahren
Beweis. O.B.d.A. lässt sich X1 < X2 < · · · < Xn voraussetzen. Dann gibt es insgesamt n + m − R(Xi ) Elemente in Z, die größer sind als Xi . Davon sind n − i
Elemente aus X1 , X2 , . . . , Xn . Die übrigen (n + m − R(Xi )) − (n − i) Elemente sind
aus Y1 , Y2, . . . , Ym . Somit gilt
Ni = (n + m − R(Xi )) − (n − i) = m + i − R(Xi )
n
X
n(n + 1)
⇒U=
Ni = nm +
− WX .
2
i=1
Für den Erwartungswert und die Varianz von U gilt
E(U) =
nm
,
2
V ar(U) =
nm(n + m + 1)
.
12
Als Prüfstatistik definiert man die Normierung von U:
U − nm
U − E(U)
2
=q
U∗ = p
nm(n+m+1)
V ar(U)
12
Obwohl U eine Summe von abhängigen Zufallsvariablen ist – der zentrale Grenzwertsatz also nicht angewendet werden kann – lässt sich U ∗ für große Stichproben
dennoch durch die Standardnormalverteilung approximieren. Als kritische Schranke,
die nötig ist um eine Entscheidung bzgl. der Hypothesen treffen zu können, verwendet man daher das Quantil der Standardnormalverteilung u1−α .
Nach der Testdurchführung ist H0 entweder unter einem bestimmten Signifikanzniveau anzunehmen oder abzulehnen. Für die Entscheidungsvorschrift gilt:
H0
X ≥t Y
X ≤t Y
H0 wird abgelehnt, falls
U ∗ > u1−α
U ∗ < −u1−α
HA
X <t Y
X >t Y
Tabelle 9.3.: Entscheidungsregeln für den approximativen Rangsummentest
60
10. Regressionsanalyse
Die im folgenden Beschriebende multiple Regressionsanalyse stützt sich im Wesentlichen auf Lang (2005) S. 2 ff, Schulze (2003) S. 168ff und 235ff und Steland (2003)
272f.
Die Regressionsanalyse ist ein Analyseverfahren, mit dessen Hilfe sich Beziehungen
zwischen einer abhängigen Variable Y (Response-Variable) und einer oder mehreren unabhängiger metrischen Variablen X1 , X2 , . . . , Xn (Prädiktor-Variablen oder
auch Regressoren) feststellen lassen. Die Variablen X1 , X2 , . . . , Xn sind untereinander unabhängig. Möchte man die Abhängigkeit der Variable Y von einer einzigen
Variablen X1 bestimmen, so spricht man von einer einfachen Regression, falls die
Abhängigkeit von Y zu mehreren Variablen X1 , X2 , . . . , Xn geprüft werden soll, so
spricht man von einer multiplen Regression. Des Weiteren wird zwischen einer linearen und nicht-linearen Regression unterschieden. Eine lineare Regression wird
durchgeführt, falls ein linearer Zusammenhang zwischen den Variablen Y und Xi
mit i = 1, 2, . . . , n angenommen wird, während eine bei einer nicht-linearen Regression ein nicht-linearer Zusammenhang angenommen wird.
Liegt kein metrisches, sondern nur ein nominales oder ordinales Skalenniveau vor, so
ist eine kategoriale Regression durchzuführen. Wie auch bei der Regressionsanalyse
für metrisches Skalenniveau kann auch die kategoriale Regression zwischen einer einfachen und multiplen sowie der linearen und nicht-linearen Regression unterschieden
werden.
Der wesentliche Unterschied der kategorialen Regression zu einer „normalen“ Regression zeigt sich darin, dass bei der kategorialen Regression eine endliche Anzahl von
Kategorien vorliegt, während die unabhängigen Variablen bei der normalen Regression beliebige reelle Werte annehmen können. Bei der kategorialen Regression werden
daher den einzelnen Kategorien Werte zugeordnet, d.h sie werden kodiert, was bei
einer normalen Regression nicht notwendig ist. Neben der einfachen Kodierung der
Kategorien mittels bloßer Durchnummerierung sind z. B. die Dummykodierung oder
die Effizienzkodierung weitere Möglichkeiten, die Kategorien zu kodieren.
Da ich für die Auswertung meiner Daten nur die multiple kategoriale Regression verwende, möchte ich mich in dieser Arbeit auf diesen Regressionstypen beschränken.
Andere Regressionstypen lassen sich in den Standardwerken der Statistik nachlesen.
61
10. Regressionsanalyse
10.1. Multiple kategoriale Regression61
Seien X1 , X2 , . . . , Xn nominal oder ordinal skalierte Variablen und Ỹ eine von den
Merkmalen X1 , X2 , . . . , Xn abhängige, dichotome Variable. Die p Beobachtungen
y˜i , xi1 , xi2 , . . . , xin ,
i = 1, 2, . . . , p
lassen sich anhand gleicher Kovariablenvektoren (xi1 , xi2 , . . . , xin ) zu g Gruppen zusammenfassen. Die Anzahl der Beobachtungen der j-ten Gruppe heißt nj , die Anzahl
der Erfolge innerhalb der j-ten Gruppe heißt yj . So ergibt sich die Darstellung
Gruppe 1
..
.
Gruppe j
..
.
Gruppe g
 
n1
 .. 
.
 
nj 
.
 .. 
ng
 
y1
 .. 
.
 
y := yj 
.
 .. 
yg


x11 . . . x1n
.. 
 ..
. 
 .


A := xj1 . . . xjn 
 .
.. 
 ..
. 
xg1 . . . xgn
Die yj lassen sich nun als Realisationen der unabhängigen Zufallsvariablen Yj auffassen. Da Ỹ B1,p -verteilt ist, ist Yj verteilt nach Bnj ,pj . Dabei ist
pj = P (Ỹ = 1|X1 = xj1 , X2 = xj2 , . . . , Xn = xjn )
die Wahrscheinlichkeit für einen Erfolg von Ỹ bei Eintreten des Kovariablenvektors
(xj1 , xj2 , . . . , xjn ).
Zur Schätzung des Parametervektors p = (p1 , p2 , . . . , pg ) ist das Maximum der
Likelihood-Funktion
g g
Y
Y
nj yj
pj (1 − pj )nj −yj
Bnj ,pj (yj ) =
L(p) =
yj
j=1
j=1
zu bestimmen
Für das Regressionsmodell wird angenommen, dass zwischen den Wahrscheinlichkeiten pj und dem Kovariablenvektor (xj1 , xj2 , . . . , xjn ) ein funktionaler Zusammenhang
pj = f ((xj1 , xj2 , . . . , xjn )) besteht. Eine Möglichkeit ist der lineare Zusammenhang
pj = β0 + β1 xj1 + β2 xj2 + · · · + βn xjn ,
j = 1, 2, . . . , g.
Hierbei ist das Problem, dass pj beliebige Werte annehmen kann. Um sicherzustellen, dass die Wahrscheinlichkeiten pj nur Werte in [0, 1] annehmen können, müssen Bedingungen an die βi gestellt werden. Dieses führt bei der Optimierung der
Likelihood-Funktion zu erheblichen Schwierigkeiten.
Daher definiert man eine streng monoton wachsende Funktion F : R 7→ [0, 1] und
setzt
ηj := β0 + β1 xj1 + β2 xj2 + · · · + βn xjn ,
61
und pj = F (ηj ),
j = 1, 2, . . . , g.
Im Falle einer dichotomen abhängigen Variable Y spricht man auch von binäre multiple Regression.
62
10. Regressionsanalyse
Dadurch ist für beliebige Werte von βi sichergestellt, dass pj ∈ [0, 1] gilt. Man
bezeichnet ηj als linearen Prädiktor und F als Responsefunktion.
Möglichkeiten für die Responsefunktion F sind:
ex
F (x) =
1 + ex
oder F (x) = Φ(x) =
Z
x
∞
1 −t2
√ e 2 dt
2π
Im Fall der ersten Responsefunktion wird vom Logitmodell gesprochen, im Fall der
zweiten vom Probitmodell.
Der Parameter p = (p1 , p2 , . . . , pg ) der Likelihood-Funktion kann somit als Funktion
von β := (β0 , β1 , . . . , βn ) durch
p(β) = (F (η1 ), F (η2 ), . . . , F (ηg ))
ausgedrückt werden.
Dadurch ergibt sich die von β abhängige Likelihood-Funktion L(p(β)). Diese ist nun
in Abhängigkeit von β zu maximieren.
Durch Logarithmieren ergibt sich die Loglikelihood-Funktion l(p(β))
l(p(β)) = ln L(p(β))
!
g Y
nj yj
= ln
pj (1 − pj )nj −yj
y
j
j=1
g X
nj
pj
ln
+ yj ln
+ nj ln(1 − pj ) .
=
y
1
−
p
j
j
j=1
Zur Bestimmung des Maximums muss die Nullstelle des Gradienten bestimmt werden. Für die partiellen Ableitungen ergibt sich nach der Kettenregel
1 − pj (1 − pj ) + pj
−nj
yj − nj pj
∂l
= yj ·
·
+
=
2
∂pj
pj
(1 − pj )
1 − pj
pj (1 − pj )
∂pj
∂pj ∂ηj
∂pj
=
=
xji
∂βi
∂ηj ∂βi
∂ηj
und somit
g
g
X ∂l ∂pj
X yj − nj pj ∂pj
∂l
=
=
xji ,
∂βi
∂pj ∂βi
p (1 − pj ) ∂ηj
j=1
j=1 j
wobei xj0 := 1 für j = 1, . . . , g definiert wird.
Damit die Loglikelihood-Funktion ein Maximum hat, muss somit gelten:
∀i = 1, . . . , n :
g
X
yj − nj pj ∂pj
xji = 0.
p (1 − pj ) ∂ηj
j=1 j
63
10. Regressionsanalyse
Im Fall des Logitmodells ergibt sich
F (x) =
ex (1 + ex ) − ex · ex
ex
ex
′
⇒
F
(x)
=
=
1 + ex
(1 + ex )2
(1 + ex )2
und somit
∂pj
eηj
.
=
∂ηj
(1 + eηj )2
Dort muss für ein Maximum der Loglikelihood-Funktion gelten
∀i = 1, . . . , n :
g
X
j=1
xji ·
(yj − nj pj )eηj
= 0.
pj (1 − pj ) (1 + eηj )2
Dieses Gleichungssystem ist jedoch zu kompliziert, um algebraisch gelöst zu werden. In der Praxis verwendet man daher numerische Methoden, z. B. das NewtonVerfahren. Dabei ist für das Logit- und des Probitmodells die Existenz einer eindeutigen Lösung gesichert, falls für jedes j = 1, . . . , g die Ungleichung 0 < yj < nj
erfüllt ist.
Ein Problem der binären Regression besteht darin, dass durch die Kodierung der
Merkmale mit natürlichen Zahlen eine metrische Struktur impliziert wird. Im Falle
nominaler Merkmale sollte jedoch weder eine ordinale, noch eine metrische Struktur
vorausgesetzt werden.
Dieses Problem kann durch die Dummy- oder Effekt-Kodierung umgangen werden.
Sei dazu Xi eine Variable mit l Kategorien. Dann wird Xi durch die l − 1 Variablen
Xik , k = 1, . . . , l − 1 ersetzt. Die Variable Xik repräsentiert nun, ob die Variable Xi
in die k-te Kategorie fällt. Eine Variable für die l-te Kategorie wird nicht benötigt,
da Xi genau dann in der l-ten Kategorie ist, wenn sie in keiner der übrigen ist. Diese
Kategorie wird als Referenzkategorie bezeichnet. Formal ist Xik definiert durch
1 falls Xi = k
k
Dummy-Kodierung: Xi :=
0 sonst.

 1 falls Xi = k
k
−1 falls Xi = l
Effekt-Kodierung: Xi :=

0 sonst.
Wird der Parameter vor Xik mit βik bezeichnet, so hat β die Form
β = β11 , . . . , β1l1 −1 , . . . , βn1 , . . . , βnln−1 ,
wobei li die Anzahl der Kategorien des Merkmals Xi ist.
Im Anschluss der Regressionsanalyse muss der geschätzten Parameter β interpretiert
werden. Bei der Dummy-Kodierung bedeutet das Vorliegen eines positiven Parameters βik eine Erhöhung der Wahrscheinlichkeit gegenüber der Referenzkategorie von
Xi , während ein negativer Parameter βik eine Verringerung der Wahrscheinlichkeit
gegenüber der Referenzkategorie bedeutet.
64
10. Regressionsanalyse
Bei der Effekt-Kodierung berechnet sich der Koeffizient βili der Referenzkategorie
durch
βili = −βi1 − βi2 − · · · − βili −1 , i = 1, 2, . . . , n.
Bei der Effekt-Kodierung lassen sich die Parameter βik nicht nur mit der Referenzkategorie, sondern auch direkt miteinander vergleichen. Des Weiteren lassen sich die
Parameter βik nicht nur innerhalb eines Merkmals Xi , sondern auch über verschiedene Merkmale hinweg vergleichen. Treten für ein Merkmal Xi betragsmäßig große
Werte βik auf, so ist die Abhängigkeit des Merkmals Y von Xi groß, für betragsmäßig
kleine Werte βik klein.
65
Teil II.
Praktische Anwendung
66
11. Aufbau der Untersuchung
11.1. Konkretisierung des Forschungsthemas
Um das Forschungsthema „Das Verbraucherverhalten von Jugendlichen der achten
Klasse“ zu konkretisieren ist mindestens eine Theorie, welche aus verschiedenen Hypothesen besteht, zu formulieren. Im Folgenden werden die Theorien, welche in dieser
Arbeit untersucht werden sollen, formuliert. Hierbei sind die Theorien und Hypothesen nach den bereits beschriebenden Regeln entwickelt worden (siehe Seite 11ff).
11.1.1. Erste Theorie
Die erste von mir aufgestellte Theorie lautet:
Das Verhältnis der Schüler zu ihrem Taschengeld unterscheidet sich
je nach Schulform.
Da angenommen wird, dass das Verhältnis eines Schülers zu seinem Geld in der
Regel von den ihm zur Verfügung stehenden finanziellen Mitteln, also von seiner
Taschengeldhöhe abhängt, soll zunächst geprüft werden, wie viel Taschengeld den
Schülern im Durchschnitt zur Verfügung steht. Im Folgenden soll dies getrennt für
die einzelnen Schulformen betrachtet werden. Hierzu wird folgende Hypothese formuliert:
• Die Taschengeldhöhe unterscheidet sich je nach Schulform.
Je höher die Schulform, desto niedriger ist das Taschengeld der Jugendlichen.
Da vermutet wird, dass Gymnasiasten weniger Taschengeld erhalten als Hauptschüler oder Realschüler, vermute ich auch, dass Gymnasiasten häufiger als Hauptschüler
kein Taschengeld erhalten. Hierzu soll folgende Hypothese überprüft werden:
• Die Wahrscheinlichkeit, dass ein Gymnasiast kein Taschengeld erhält, ist größer, als die Wahrscheinlichkeit, dass ein Hauptschüler kein Taschengeld erhält.
Da ich annehme, dass sich das Verhältnis der Schüler zu ihrem Geld durch ihr
Geldleih- und Geldsparverhalten ausdrückt, muss dieses Verhalten mit Hilfe des
Fragebogens getestet werden. Um zu testen, ob das Verhältnis der Schüler zum
Geld von der Schulform abhängig ist, sind folgende Hypothesen zu untersuchen:
• Das Geldleihverhalten unterscheidet sich je nach Schulform.
Je höher die Schulform der Jugendlichen, desto seltener leihen sie sich Geld.
• Das Sparverhalten unterscheidet sich je nach Schulform.
Je höher die Schulform der Jugendlichen, desto häufiger sparen sie.
67
11. Aufbau der Untersuchung
Falls durch das Testen der Theorie diese bestätigt wird, sind die Daten angemessen
zu interpretieren. Hier stellt sich dann die Frage “Welche Schüler haben ein besseres
Verhältnis zum Geld?“ Hier ist zunächst zu definieren, was man unter einem guten
Verhältnis zum Geld versteht oder wodurch sich ein gutes Verhältnis zum Geld
ausdrückt.
Meiner Definition nach zeigt ein Schüler ein gutes Verhältnis zum Geld, falls
• er regelmäßig Geld spart und
• er sich selten oder sogar nie Geld leiht.
Für die Auswertung wird demnach einem Schüler, der regelmäßig etwas von seinem
Geld spart und sich selten bzw. nie Geld leiht ein besseres Verhältnis zum Geld
zugeordnet. Einem Schüler wird ein durchschnittliches Verhältnis zu seinem Geld
zugeordnet, falls nur eines dieser Merkmale zutrifft, d. h. er entweder regelmäßig
spart oder sich selten oder sogar nie Geld leiht. Demnach wir einem Schüler ein
schlechtes Verhältnis zugeordnet, falls er selten oder nie Geld spart, sich jedoch
regelmäßig Geld leiht.
Gutes
Durchschnittl.
Durchschnittl.
Schlechtes
Verhältnis
Verhältnis
Verhältnis
Verhältnis
Sparverhalten
regelmäßig selten / nie
+
−
+
−
−
+
−
+
Leihverhalten
regelmäßig selten / nie
−
+
+
−
−
+
+
−
Tabelle 11.1.: Interpretationsregeln für das Verhältnis zum Geld
11.1.2. Zweite Theorie
Die zweite Theorie, welche untersucht werden soll, zielt direkt auf das Verbraucherverhalten, hier speziell auf das Einkaufsverhalten der Jugendlichen. Die Theorie, die
ich diesbezüglich aufstelle, lautet:
Das Einkaufsverhalten der Jugendlichen unterscheidet sich je nach
Schulform.
Die Theorie ist dadurch entstanden, dass vermutet wird, das sich das Verhältnis
zum Geld der Jugendlichen je nach Schulform unterscheidet. Da aber das Geld und
somit auch das persönliche Verhältnis einer Person direkt in Verbindung mit dem
Einkaufsverhalten steht, liegt es nahe, dass sich auch das Einkaufsverhalten der
Jugendlichen je nach Schulform unterscheidet.
Das Einkaufsverhalten kann durch das konkrete Verhalten der Jugendlichen, wenn
sie sich ein bestimmtes Produkt kaufen möchten, beschrieben werden. Dabei wird
betrachtet, ob Jugendliche, die in die Stadt gehen um ein bestimmtes Produkt zu
kaufen, auch nur dieses Produkt kaufen, oder ob sie in der Stadt ihr Ziel verfehlen
und ein völlig anderes Produkt, dass ihre Aufmerksamkeit angezogen hat, erwerben.
Des Weiteren können Aussagen über das Einkaufsverhalten getroffen werden, indem
betrachtet wird, inwiefern Jugendliche in verschiedene Geschäfte gehen um Preise
zu vergleichen und sich anschließend für das preisgünstigste Produkt entscheiden.
68
11. Aufbau der Untersuchung
Ebenso ist für das Einkaufsverhalten von Bedeutung, ob und wo sich Jugendliche
Informationen über ein bestimmtes Produkt beschaffen. Unter dem Gesichtspunkt
des Verbraucherverhalten ist auch von besonderem Interesse, in welchen Geschäften
die Schüler der achten Klasse bevorzugt einkaufen. Hierbei ist sowohl die Unterscheidung nach der Schulform als auch nach der Taschengeldhöhe von Bedeutung.
Um Aussagen über die Informationsquellen der Schüler unterschiedlicher Schulformen zu gewinnen wird folgende Hypothese untersucht:
• Schüler unterschiedlicher Schulformen nutzen verschiedene Informationsquellen, wenn sie sich über ein bestimmtes Produkt informieren.
Je höher die Schulform, desto bessere Informationsquellen werden genutzt.
Hierzu ist zunächst zu definieren, was eine „gute“, „durchschnittliche“ und „schlechte“
Informationsquelle ist. Unter einer guten Informationsquelle verstehe ich eine objektive, neutrale und ausführliche Informationsquelle wie z. B. eine Fachzeitschrift.
Demnach ist der Informationsgehalt bei einer guten Informationsquelle sehr hoch.
Eine schlechte Informationsquelle hingegen ist sehr interessengesteuert. Damit ist gemeint, dass die Informationsquelle nicht informieren möchte, sondern ihre Interessen
durchsetzten möchte, z. B. der gute Absatz eines Produktes. Die Fernsehwerbung
zum Beispiel bezeichne ich als eine solche interessengesteuerte Informationsquelle.
Demnach bezeichne ich als eine Informationsquelle, die nur gering interessengesteuert ist und eine gewisses Maß an Objektivität gewährleistet, als durchschnittliche
Informationsquelle.
Für die Untersuchung der Theorie sind unter dem Aspekt des Preisvergleichs folgende Hypothesen zu untersuchen:
• Ob ein Schüler Preise vergleicht, wenn er sich ein bestimmtes Produkt kaufen
möchte, hängt von der Schulform ab.
Je höher die Schulform der Jugendlichen, desto wahrscheinlicher ist es, dass
sich ein Jugendlicher über den Preis eines Produktes in verschiedenen Geschäften informiert, wenn er es kaufen möchte.
Um herauszufinden, welche Schüler (Gymnasiasten, Hauptschüler oder Realschüler) im Einkaufsverhalten zielstrebiger sind und sich somit von den äußeren Reizen,
wie z. B. Werbung, Preise etc. weniger beeinflussen lassen, soll folgende Hypothese
überprüft werden:
• Die Schulform hat einen Einfluss darauf, ob ein Schüler ein zielstrebiges Einkaufsverhalten hat oder ob er sich von vielen äußeren Reizen beeinflussen lässt.
Je höher die Schulform, desto zielstrebiger ist der Schüler in seinem Einkaufsverhalten.
Da ich vermute, dass sich das Einkaufsverhalten und das Verhältnis zum Geld je
nach Schulform unterscheidet, gehe ich davon aus, dass sich dieses Verhalten auch in
den bevorzugten Geschäften, in denen Schüler einkaufen, widerspiegelt. Ich vermute
daher, dass Schüler, die ein gutes Verhältnis zu ihrem Geld haben, hauptsächlich in
günstigeren Geschäften einkaufen, während Schüler, die ein lockeres Verhältnis zu
ihrem Geld haben, auch häufiger in teureren Geschäften einkaufen.
• Die Geschäfte, in denen Schüler einkaufen, unterscheiden sich je nach Schulform.
69
11. Aufbau der Untersuchung
Wie in der ersten Theorie müssen die Ergebnisse anschließend angemessen interpretiert werden. Hierbei orientiere ich mich am ökonomischen Prinzip der Nutzenmaximierung, welches besagt, das der Verbraucher versucht, „[...]die vorhandenen Mittel
(das heißt das ihm zur Verfügung stehende Geld) so zu verwenden, daß sie ihm [...]
den höchsten Nutzen“ 62 bringt.
Stark vereinfacht lässt sich sagen, dass einem Schüler ein gutes Einkaufsverhalten
zugeordnet wird, wenn
• er sich vor dem Kauf eines Produktes über dieses informiert, wobei sich die Art
Informationsquellen nach ihrer Qualität unterschieden lässt. Hier wird z. B.
den Informationsquellen Internet oder Fachzeitschriften eine höhere Qualität
zugeordnet als dem öffentlich-rechtlichen und privaten Fernsehen.
• er sich vor dem Kauf eines Produktes in verschiedenen Geschäften über die
Preise informiert und das Produkt dann im preisgünstigstem Geschäft kauft.
• er in seinem Einkaufsverhalten sehr zielstrebig ist, d. h. selten oder nie Spontankäufe tätigt, und sich von seinem eigentlichem Kaufziel nicht durch äußere
Reize ablenken lässt.
Dementsprechend gilt für ein schlechtes Verbraucherverhalten die gegenteiligen Verhaltensweisen. Einem Schüler wird ein schlechtes Verbraucherverhalten zugeordnet
wenn
• er sich vor dem Kauf eines Produktes nicht über dieses informiert.
• er vor dem Kauf eines Produktes nicht in verschiedene Geschäfte geht um
Preise zu vergleichen und das gewünschte Produkt dementsprechend in dem
ersten Geschäft kauft.
• er in seinem Einkaufsverhalten nicht sehr zielstrebig ist, d. h. sich von äußeren
Reizen ablenken lässt und deshalb häufig ein anderes Produkt kauft, wenn er
in die Stadt geht, als er eigentlich kaufen wollte.
Die in der nachstehenden Tabelle dargestellten Interpretationsregeln wurden folgendermaßen entwickelt:
• Die Merkmale der Tabelle werden wie folgt gewichtet:
– „informiert sich“ mit 40%
– „vergleicht Preise“ mit 40%
– „tätigt Spontankäufe“ mit 20%
• Jeder Merkmalsausprägung wird eine Punktzahl von 0 bis 10 zugeordnet, wobei 0 schlechte und 10 optimale Verhaltensweisen entsprechen. Diese Wertung
ist der Tabelle zu entnehmen.
• Der in der letzten Spalte aufgeführte Wert ist die gewichtete Summe der Punkte. Informiert sich ein Schüler z. B. bei schlechten (4 Punkte), vergleicht Preise
(10 Punkte) und tätigt selten Spontankäufe (5 Punkte) so ergibt sich für dieses
Verhalten ein Wert von 4 · 0, 4 + 10 · 0, 4 + 5 · 0, 2 = 6, 6.
62
May (2003) S. 6.
70
11. Aufbau der Untersuchung
• Die Zeilen der 24 möglichen Kombinationen werden danach absteigend nach
der Größe des errechneten Wertes sortiert. Anschließend werden die Schranken für die Verhaltensweisen festgelegt. In meinem Fall wird den Werten bis
einschließlich 4 ein schlechtes, den Werten größer 4 bis einschließlich 7 ein angemessenes und den Werten größer 7 ein gutes Einkaufsverhältnis zugeordnet.
Punkte
Gutes
Einkaufsverhalt
Angemessenes
Einkaufsverhalten
schlechtes
Einkaufsverhalten
gut
10
+
+
−
+
−
−
−
−
+
−
−
+
−
−
+
−
−
−
−
−
−
−
−
−
informiert sich
mittel schlecht
7
4
−
−
−
−
+
−
−
−
+
−
−
+
+
−
−
+
−
−
−
−
−
+
−
−
−
−
+
−
−
−
−
−
+
−
−
+
+
−
−
+
−
−
−
+
−
−
−
−
nie
0
−
−
−
−
−
−
−
−
−
+
−
−
+
−
−
+
−
−
−
−
+
−
+
+
Schüler
vergleicht Preise
ja
nein
10
0
+
−
+
−
+
−
+
−
+
−
+
−
+
−
+
−
−
+
+
−
+
−
−
+
+
−
−
+
−
+
+
−
−
+
−
+
−
+
−
+
−
+
−
+
−
+
−
+
tätigt Spontankäufe
nie selten häufig
10
5
0
+
−
−
−
+
−
+
−
−
−
−
+
−
+
−
+
−
−
−
−
+
−
+
−
+
−
−
+
−
−
−
−
+
−
+
−
−
+
−
+
−
−
−
−
+
−
−
+
−
+
−
+
−
−
−
−
+
−
+
−
+
−
−
−
−
+
−
+
−
−
−
+
P
10
9
8,8
8
7,8
7,6
6,8
6,6
6
6
5,6
5
5
4,8
4
4
3,8
3,6
2,8
2,6
2
1,6
1
0
Anmerkung: Die Unterteilung der Spalte „informiert sich“ in gut, mittel, schlecht, resultiert
aus der Qualität der Informationsquellen. Die Spalte nie bedeutet, dass sich der Schüler
nicht informiert.
Tabelle 11.2.: Interpretationsregeln zum Einkaufsverhalten der Schüler
11.1.3. Dritte Theorie
Die dritten Theorie, die untersucht werden soll, lautet:
Das Fernsehkonsumverhalten unterscheidet sich je nach Schulform.
Für diese Theorie ist es notwendig, dass Fernsehkonsumverhalten der Jugendlichen
zu analysieren. Die Untersuchung des Mediennutzungsverhalten ist unter dem Gesichtspunkt des Verbraucherverhaltens von Nöten, da davon ausgegangen wird, dass
das Medium Fernsehen einen Einfluss auf das Verbraucherverhalten, speziell auf das
Einkaufsverhalten der Jugendlichen, hat. Hierbei wird davon ausgegangen, dass das
71
11. Aufbau der Untersuchung
Fernsehen ihren Einfluss durch das Werbeprogramm auf die Jugendlichen ausübt.
Da der Werbebranche dieser hohe Einfluss auf Jugendliche bekannt ist, sind diese
eine stark umworbene Zielgruppe. Für eine Untersuchung zum Verbraucherverhalten
ist es daher notwendig zu analysieren, wie viel Werbung auf Jugendliche im Durchschnitt einwirkt. Aus diesem Grund ist es unerlässlich, die Fernsehnutzungsdauer zu
betrachten. Die hierzu aufgestellt Hypothese lautet:
• Die Fernsehnutzungsdauer unterscheidet sich je nach Schulform.
Je höher die Schulform, desto geringer ist die Fernsehnutzungsdauer der Schüler.
Da das Werbeprogramm der Medien abhängig von der Tageszeit ist, ist es von Bedeutung herauszufinden, um welche Uhrzeiten Jugendliche bevorzugt Fernsehen schauen. Es wird davon ausgegangen, dass das Werbeprogramm vormittags hauptsächlich
die Zielgruppe der Hausfrauen anspricht, während am Nachmittag und im Vorabendprogramm häufig Jugendliche angesprochen werden. Meine hierzu formulierte
Hypothese lautet:
• Die Uhrzeiten, zu denen Jugendliche Fernsehen schauen, unterscheiden sich je
nach Schulform.
• Die Uhrzeiten, zu denen Jugendliche Fernsehen schauen, unterscheiden sich
zwischen dem Wochenende (Samstag und Sonntag) und der Arbeitswoche
(Montag bis Freitag).
Um zu analysieren, wie viel Werbung auf Jugendliche einwirkt, ist es notwendig
zu betrachten, welche Fernsehkanäle von den Jugendlichen bevorzugt geguckt werden. Hierzu wird davon ausgegangen, dass die Fernsehkanäle unterschiedlich viele
Werbeminuten ausstrahlen. Die formulierten Hypothesen lauten folgendermaßen:
• Je höher die Schulform, desto mehr Jugendliche schauen öffentlich-rechtliche
Fernsehsender.
• Gymnasiasten sind täglich weniger Werbeminuten ausgesetzt als Realschüler
oder Hauptschüler.
Nachdem die genannten Hypothesen analysiert wurden bleibt noch zu klären, was
ein gutes und was ein schlechtes Fernsehkonsumverhalten ist. Meine Unterteilung
in gutes bzw. schlechtes Fersehkonsumverhalten stützt sich auf folgende subjektive
Annahmen: Einerseits wird davon ausgegangen, daß ein hoher Fersehkonsum und
intensive Nutzung privater Sender mit einer verstärkten Konfrontation mit Fersehwerbung einhergehen. Andererseits unterstelle ich, dass ein hoher Konsum von Werbespots dem Gedanken des rationalen Verbraucherverhaltens entgegen wirkt. Für
die Entwicklung dieser Interpretationsregeln werden die Merkmale, welche für die
Interpretation von Bedeutung sind, wie folgt von mir gewichtet:
• „Fernsehnutzungsdauer in Stunden“ mit 50%
• „Schüler schaut vormittags Fernsehen“ mit 25%
• „Schüler schaut öffentlich-rechtliche Fernsehsender“ mit 25%
Die folgenden Interpretationsregeln wurden nach der gleichen Methode wie Tabelle 11.2 entwickelt.
72
Punkte
Gutes
Fernsehnutzungsverhalten
73
schlechtes
Fernsehnutzungsverhalten
Schüler
vormittags
nein
10
+
+
+
+
−
+
−
+
+
−
−
+
−
+
−
−
+
−
−
−
schaut
Fernsehen
ja
0
−
−
−
−
+
−
+
−
−
+
+
−
+
−
+
+
−
+
+
+
Schüler schaut öffentlichrechtliche Fernsehsender
ja
nein
10
0
+
−
+
−
+
−
−
+
+
−
−
+
+
−
+
−
−
+
+
−
−
+
+
−
−
+
−
+
+
−
−
+
−
+
+
−
−
+
−
+
Tabelle 11.3.: Interpretationsregeln zum Fernsehnutzungsverhalten der Schüler
P
10
9,5
8
7,5
7,5
7
7
6,5
5,5
5,5
5
5
4,5
4
4
3
2,5
2,5
1,5
0
11. Aufbau der Untersuchung
Durchschnittlich
Fernsehnutzungsverhalten
Fernsehnutzungsdauer
in Stunden
0−1 1−2 2−3 3−5 >5
10
6
6
3
0
+
−
−
−
−
−
+
−
−
−
−
−
+
−
−
+
−
−
−
−
+
−
−
−
−
−
+
−
−
−
−
+
−
−
−
−
−
−
+
−
−
−
+
−
−
−
−
+
−
−
+
−
−
−
−
−
−
−
−
+
−
+
−
−
−
−
−
−
+
−
−
−
−
+
−
−
−
+
−
−
−
−
−
−
+
−
−
−
−
+
−
−
−
+
−
−
−
−
−
+
11. Aufbau der Untersuchung
11.2. Zur Repräsentativität der Untersuchung
Um Rückschlüsse von der Stichprobe auf die Grundgesamtheit zu ziehen ist es
notwendig, dass die Stichprobe ein verkleinertes Abbild der Grundgesamtheit darstellt.
Da es sich bei meiner Untersuchung um das Verbraucherverhalten von Jugendlichen der achten Klasse, handelt ist die Stichprobe aus allen Jugendlichen der achten
Klasse zu entnehmen. Hierbei ist noch zu erwähnen, dass sich die Untersuchung auf
die Stadt Siegen beschränkt. Um an ein verkleinertes Abbild der Grundgesamtheit
der Jugendlichen der achten Klasse innerhalb Siegen zu gelangen ist es notwendig,
die Anteile der Jugendlichen in den achten Klassen innerhalb der Grundgesamtheit
mit den gleichen Anteilen in der Stichprobe zu verteilen. Hierzu ist es zunächst notwendig, Informationen über die Grundgesamtheit zu ermitteln. Nach Aussagen des
„Landesamt für Datenverarbeitung und Statistik NRW“ 63 befinden sich insgesamt
7923 Schüler64 in der Sekundarstufe I. Davon gehen 1719 Schüler zur Hauptschule,
2060 Schüler zur Realschule, 2582 Schüler zum Gymnasium und 1562 Schüler zur
Gesamtschule. Von den 7923 Schüler befinden sich 1403 Schüler in der achten Klasse. Von den Schülern der achten Klasse befinden sich 334 Schüler (23,8%) auf der
Hauptschule, 376 Schüler (26,8%) auf der Realschule, 433 Schüler (30,8%) auf dem
Gymnasium und 260 Schüler(18,5%) auf der Gesamtschule. Um eine gute Repräsentativität zu gewährleisten müssten diese Prozente innerhalb der Stichprobe eingehalten werden. Dies ist jedoch aufgrund meiner Möglichkeiten und aufgrund meiner
Abhängigkeit von den Schulen nicht einzuhalten. Nachdem die Schulen angeschrieben wurden und ihre Zustimmung gegeben haben, ergab sich für meine Stichprobe
folgende Verteilung. Insgesamt konnten 167 Gymnasiasten, 62 Hauptschüler und 160
Realschüler an der Befragung teilnehmen. Bei einer Gesamtmenge von 389 Schülern
ergibt dieses für die Befragung, dass 42,9% Gymnasiasten, 15,9% Hauptschüler und
41,1% Realschüler befragt werden konnten. Auf die Befragung der Gesamtschulen
musste leider verzichtet werden, da die Schulleitung ihr Einverstädnis zu dieser Befragung nicht gab.
Für die Auswahl meiner Stichprobe wurde das Modell der mehrstufigen Zufallsstichprobe (siehe Seite 15) angewandt. Auf der 1. Stufe wurden die zufällig ausgewählten
Schulen im Raum Siegen angeschrieben.
Hierbei handelte es sich um die folgenden Schulen:
1. Gesamtschulen
• Bertha-von-Suttner-Gesamtschule (Zustimmung nicht erhalten)
• Gesamtschule Siegen-Eiserfeld (Zustimmung nicht erhalten)
2. Gymnasien
• Fürst-Johann-Moritz-Gymnasium (Zustimmung erhalten)
• Gymnasium Auf der Morgenröthe (Zustimmung erhalten)
• Gymnasium Am Löhrtor (Zustimmung nicht erhalten)
63
64
Landesamt für Datenverarbeitung und Statistik NRW (2006).
Im folgenden benutze ich das Wort „Schüler“ für beide Geschlechtertypen.
74
11. Aufbau der Untersuchung
• Peter-Paul-Rubens-Gymnasium (Zustimmung erhalten)
3. Hauptschulen
• Hauptschule Eiserfeld (Zustimmung nicht erhalten)
• Geschwister-Scholl-Schule (Zustimmung erhalten)
• Haardter-Berg-Schule (Zustimmung erhalten)
4. Realschule
• Realschule am Häusling (Zustimmung erhalten)
• Realschule am Schiessberg (Zustimmung nicht erhalten)
• Realschule/Aufbaurealschule am Oberen Schloß (Zustimmung erhalten)
Auf der 2. Stufe wurden mir nun von den Schulen jeweils 2 bis 3 Klassen für die
Befragung angeboten. Auf der 3. Stufe werden in der Regel aus diesen Klassen
zufällig ein oder mehrere Schüler gewählt. Für meine Untersuchung wurden immer
alle Schüler einer Klasse in die Befragung einbezogen, daher bezeichnet man diese
Form der Stichprobe auch als Klumpenstichprobe.
Da eine zufallsgesteuerte Auswahl der Stichprobe durchgeführt wurde, wird davon
ausgegangen, dass das Auftreten der relativen Merkmalshäufigkeit der Stichprobe
der relativen Merkmalshäufigkeit der Grundgesamtheit entspricht. Es wird davon
ausgegangen, dass durch dieses Auswahlverfahren die Repräsentativität von sich
aus gegeben ist.
Ein wesentliches Problem für die Repräsentativität meiner Untersuchung sehe ich in
den fehlenden Untersuchungsdaten bzgl. der Gesamtschule. Durch diesen Umstand
lässt sich kein exaktes verkleinertes Abbild der Grundgesamtheit für die Stichprobe
erhalten.
11.3. Die Entwicklung des Fragebogens
Im folgenden Abschnitt wird beschrieben, wie der Fragebogen (siehe Anhang C)
entwickelt wurde. Der Fragebogen ist unter Beachtung der bereits beschriebenden
Regeln und Empfehlungen von Seite 17 konstruiert worden.
Nachdem das Forschungsthema konkretisiert wurde ist der Fragebogen zu konstruieren. Hierbei sind die vorher formulierten Hypothesen von Bedeutung. Der Fragebogen ist so zu formulieren, dass dieser die zur Analyse der Theorie benötigten
Merkmale abfragt. Hierbei hat der Fragebogen in seiner Entwicklung bis zur Endfassung mehrere Phasen durchlaufen.
Die erste Phase der Fragebogenentwicklung fand im Rahmen eines Seminars zur
„Wirtschaftsdidaktik“ statt. Nachdem den Studenten das Vorhaben beschrieben wurde, bekamen sie die Aufgabe sich in die Zielgruppe, 14-jährige Jugendliche zu versetzen. Zur Analyse der Zielgruppe gehörte z. B. das Erforschen der Interessen von
14-jährigen Jugendlichen. Im nächsten Schritt bekamen sie die Aufgabe sich eigene
Hypothesen zu diesem Thema zu überlegen. Anschließend sollten sie versuchen, dazu passende Fragen zu erstellen. Als Hilfsmittel wurde ihnen dazu eine Liste mit den
75
11. Aufbau der Untersuchung
Empfehlungen zur Frageformulierung, ähnlich wie im Kapitel 4.2 beschrieben, an
die Hand gegeben. Eine Liste der von den Studenten formulierten Fragen mit den
möglichen Antworten befindet sich im Anhang A.
In der zweiten Phase der Fragebogenentwicklung wurde von mir ein erster Fragebogen konstruiert. Hierfür wurden aus dem Fragenkatalog von Seite A die für die
Studie relevanten Fragen herausgefiltert. Diese wurden zum Teil umformuliert und
ergänzt, so dass sie den Empfehlungen der Frageformulierungen entsprachen. Außerdem mussten die Fragen zum Teil der Zielgruppe angepasst werden. Dieser Fragebogenprototyp wurde nach Gesprächen in einem Doktorandenseminar der Wirtschaftsdidaktik und der Erziehungswissenschaft mehrfach überarbeitet und verbessert. Im
Anschluss daran wurde noch der Fragebogenbegleittext formuliert. Dabei entstand
der in Anhang B dargestellte Fragebogen.
In der dritten Phase wurde der Vortest durchgeführt. Der Testdurchlauf sollte dazu
dienen, den Fragebogen sinnvoll zu überarbeiten und übersehende Fehler zu korrigieren. Der Fragebogen wurde hierbei während meines fünf wöchigen Unterrichtspraktikums am Peter-Paul-Rubens-Gymnasium in allen achten Klassen getestet. Während
die Schüler den Fragebogen ausfüllten notierte ich mir die von den Schülern gestellten Fragen. Hierbei traten besonders häufig Probleme bei der Frage 3, 10, 12, 14,
15, 18 auf. Bei der Frage 3 war den Schülern nicht ganz klar, auf welchen Zeitraum
sich das Taschengeld bezieht. Um dieses Problem zu beheben, wurde in der Korrekturphase die Frage 3 und 4 zusammengefasst. Bei der Frage 14 ist das Problem
aufgetreten, dass ein Zeitraum bei den Ankreuzmöglichkeiten gänzlich fehlte. Der
fehlende Zeitraum „0-1 Stunde“ wurde in der anschließenden Korrektur eingefügt.
Bei den Fragen 10, 12 und 15 fehlten nach Schüleransicht weitere Antwortmöglichkeiten. In der Korrekturphase wurden daher noch einige Antwortmöglichkeiten
hinzugefügt. Das nächste Problem ergab sich bei der Frage 18. Mit dieser konnten sich einige Schüler nicht identifizieren, da die Ankreuzmöglichkeit „SMS“ nicht
vorhanden war. Des Weiteren haben mich die Schüler auf einige Rechtschreibfehler
aufmerksam gemacht. In einem anschließenden Gespräch mit den Schülern bzgl. des
Fragebogens haben sie mir viele, teilweise gute Verbesserungsvorschläge genannt,
die in der Korrekturphase zum Teil mit eingearbeitet werden konnten. Durch diese
Verbesserung und Hinzufügen weiterer Fragen entstand der für meine Untersuchung
eigentliche Fragebogen, welcher in Anhang C nachzulesen ist.
76
12. Durchführung der
Untersuchung
Die Durchführung der Untersuchung fand an insgesamt 6 Tagen statt.
Datum
17.08.2006
18.08.2006
28.08.2006
29.08.2006
30.08.2006
04.10.2006
18.11.2006
Schule
Hauptschule Schießberg
Gymnasium auf der Morgenröthe
Haardter Berg Schule
Realschule am Oberen Schloß
Peter-Paul-Rubens-Gymnasium
Realschule am Häusling
Fürst-Johan-Moritz-Gymnasium
Anzahl der Klassen
2
2
2
3
2
3
2
Tabelle 12.1.: Umfragetermine
Da die Gleichheit der Untersuchungsbedingungen für eine empirische Untersuchung
von großer Bedeutung ist, führte ich die Umfrage persönlich in den Klassen durch.
Aufgrund meiner Anwesenheit in den Klassen an den oben genannten Tagen konnte
ich versuchen, die Untersuchungsbedingungen relativ gleich zu halten. Um dieses
zu gewährleisten, las ich z. B. den Fragebogeneinleitungstext mit den Schülern gemeinsam und wies auf bestimmte Schwierigkeiten hin. Ein weiterer Vorteil, dass ich
die Umfrage persönlich durchführte, liegt darin, dass ich den Schülern jederzeit für
Fragen bzgl. des Fragebogens zur Verfügung stand.
Ein wesentliches Problem bei der Einhaltung der gleichen Untersuchungsbedingungen sehe ich darin, dass ich die Schulen alle an verschiedenen Tagen und zu unterschiedlichen Uhrzeiten besuchte. Hierbei konnte es passieren, dass ich z. B. einmal
die Umfrage morgens, direkt nach Schulbeginn und ein anderes mal die Umfrage
erst in der sechsten Stunde, kurz vor Unterrichtsende durchführte. Des Weiteren
konnte es passieren, dass ich eine Schule an einem Montag und eine andere Schule
an einem Freitag befragt habe. Dies führt zu unterschiedlichen Untersuchungsbedingungen, da die Konzentration, Leistungsfähigkeit, Aufnahmevermögen und Interesse
der Schüler je nach Wochentag und Uhrzeit schwankt. Durch diese unterschiedlichen
Untersuchungsbedingungen könnte die Repräsentativität der Untersuchung verletzt
sein.
77
13. Untersuchung der ersten
Theorie
In diesem Kapitel soll nun meine erste Theorie „Das Verhältnis der Schüler zu ihrem
Taschengeld unterscheidet sich je nach Schulform“ untersucht werden.
13.1. Unterscheidet sich die durchschnittliche
Taschengeldhöhe nach Schulform?
Um Aussagen über das Verhältnis der Jugendlichen zu ihrem Geld treffen zu können,
ist die Kenntnis der Taschengeldhöhe der Jugendlichen von zentraler Bedeutung.
Hierbei hat die Untersuchung meiner Stichprobe folgendes ergeben:
Taschengeld Schüleranzahl
ja
342
nein
28
keine Angabe
18
P
388
Tabelle 13.1.: Anzahl der Schüler die Taschengeld erhalten65
Unter der Annahme, dass die Schüler Taschengeld erhalten, wird die durchschnittliche Taschengeldhöhe aller Schüler und nach Schulformen getrennt betrachtet.66
Schulform
Hauptschule
Realschule
Gymnasium
Gesamt
Anzahl der Schüler Durchschnittliche Taschengeldhöhe
52
28,73
138
26,95
152
20,81
342
24,44
Tabelle 13.2.: Durchschnittliche Taschengeldhöhe sortiert nach Schulformen67
Wie der Tabelle entnommen werden kann, nimmt innerhalb meiner Stichprobe die
durchschnittliche Taschengeldhöhe mit der Höhe der Schulform ab.
65
1 Schüler ohne Angaben.
Die genaue Häufigkeitsverteilung des Taschengeldes ist im Anhang nachzulesen.
67
47 Schüler ohne Angaben.
66
78
13. Untersuchung der ersten Theorie
Das durchschnittliche Taschengeld der Grundgesamtheit wird mittels des erwartungstreuen, konsistenten Schätzer aus Beispiel 29 geschätzt. Die sich für die Grundgesamtheit ergebenen Durchschnittswerte sind identisch mit den Durchschnittswerten der Stichprobe, welche in der Tabelle 13.2 abgelesen werden können. Unter der Annahme, dass die Schüler Taschengeld erhalten, ergibt sich das (1 − α)Konfidenzintervall für den Mittelwert nach der Formel (7.2) wie folgt:
T̂342 (X1 , X2 , . . . , X342 ) = 24, 44,
v
u
342
u 1 X
t
σ̂ =
(Xi − T̂342 (X1 , X2 , . . . , X342 ))2 = 19, 9873.
341 i=1
Zu einem Signifikanzniveau von α = 0, 05 ergibt sich das folgende Intervall
19, 9873
19, 9873
· 1, 9600; 24, 44 + √
· 1, 9600] = [22, 3217; 26, 5583]
[24, 44 − √
342
342
Der Mittelwert des Taschengeldes aller Schüler, die Taschengeld erhalten, liegt in
dem 0, 95-Konfidenzintervall [22,3217;26,5583].
Daher ist es interessant die folgende Theorie zu testen.
Die durchschnittliche Taschengeldhöhe unterscheidet sich je nach Schulform.
Um eine Aussage über diese Hypothese zu tätigen, ist folgendes zu testen:
1. Jugendliche der Hauptschule erhalten durchschnittlich mehr Taschengeld, als
Jugendliche der Realschule und des Gymnasiums.
2. Jugendliche der Realschule erhalten durchschnittlich weniger Taschengeld als
Hauptschüler aber mehr als Gymnasiasten.
3. Jugendliche vom Gymnasium erhalten durchschnittlich weniger Taschengeld
als Hauptschüler oder Realschüler.
Um einen Hypothesentest durchführen zu können ist eine Kenntnis über die Wahrscheinlichkeitsverteilung des zu untersuchenden Merkmals, in meinem Fall die Taschengeldhöhe, notwendig.
Zu diesem Zweck wurden von mir einige Wahrscheinlichkeitsverteilungen mit Hilfe
des χ2 -Anpassungstest auf ihre Zugehörigkeit zum Merkmal Taschengeldhöhe getestet. Jedoch konnte ich keine passende Verteilung finden.
Für das Testen einiger Verteilungen möchte ich den χ2 -Anpassungstest exemplarisch
für die Normalverteilung vorstellen.
79
13. Untersuchung der ersten Theorie
13.1.1. Versuch der Anpassung einer Normalverteilung
Zur Untersuchung, ob die Daten einer Normalverteilung entsprechen, werden zuerst
mittels der Maximum-Likelihood-Methode die konkreten Parameter der Normalverteilung geschätzt. Anschließend wird mit Hilfe des χ2 -Anpassungstest getestet, ob
die Daten dieser Verteilung entsprechen.
13.1.1.1. Maximum-Likelihood-Schätzung des Mittelwerts und der Varianz
einer Normalverteilung
Für die Dichte einer normalverteilten Zufallsvariable gilt
f (x) = p
1
1
2
· e− 2σ2 (x−µ) .
2µσ 2
Nach (7.1) errechnet sich die Likelihood-Funktion wie folgt:
2
L(µ, σ ) =
n
Y
i=1
√
1
2πσ 2
−
·e
1
(xi −µ)2
2σ 2
=
√
1
2πσ 2
n
1
· e− 2σ2
Pn
2
i−1 (xi −µ)
Um das Maximum zu bestimmen ist L(µ, σ 2 ) abzuleiten. Da die Likelihood-Funktion
an der selben Stelle ihr Maximum besitzt wie die logarithmierte Likelihood-Funktion
kann das Maximum der logarithmierten Likelihood-Funktion bestimmt werden.
l(µ, σ 2 ) = ln L(µ, σ 2 )
1 Pn
n
2
= ln (2πσ 2 )− 2 · e− 2σ2 i=1 (xi −µ)
1 Pn
− n 2
= ln 2πσ 2 2 + ln e− 2σ2 i=1 (xi −µ)
n
n
1 X
2
= − ln 2µσ − 2
(xi − µ)2
2
2σ i=1
Damit die logarithmische Likelihood-Funktion ein Extrempunkt hat muss l′ (µ, σ 2 ),
also die partiellen Ableitungen von l nach µ und nach σ 2 , eine Nullstelle haben.
Es ist
n
n
∂
1 X
1 X
l(µ, σ 2 ) = 0 − 2 2
(xi − µ)(−1) = 2
(xi − µ),
∂µ
2σ i=1
σ i=1
n
∂
n 1
1 X
2
l(µ,
σ
)
=
−
+
(xi − µ)2 .
∂(σ 2 )
2 σ 2 2σ 4 i=1
Zur Bestimmung der Nullstelle muss nun das Tupel (µ, σ 2 ) gefunden werden, für die
beide partielle Ableitungen Null ergeben.
80
13. Untersuchung der ersten Theorie
Für die Nullstelle der ersten partielle Ableitung ergibt sich:
∂
l(µ, σ 2 ) = 0
∂µ
n
1 X
⇔ 2
(xi − µ) = 0
σ i=1
⇔
⇔
n
X
i=1
n
X
i=1
(xi − µ) = 0
xi − nµ = 0
n
1X
⇔µ=
xi
n i=1
Der Schätzer für µ ist somit
n
1X
µˆn (x1 , x2 , . . . , xn ) =
xi .
n i=1
Für die Nullstelle der zweiten partiellen Ableitung ergibt sich:
∂
l(µ, σ 2 ) = 0
2
∂(σ )
n
1 X
n 1
⇔ −
+
(xi − µ)2 = 0
2 σ 2 2σ 4 i=1
n
n
1X
⇔ σ2 =
(xi − µ)2
2
2 i=1
n
1X
⇔σ =
(xi − µ)2
n i=1
2
n
1X
⇔σ =
(xi − µˆn (x1 , x2 , . . . , xn ))2
n i=1
2
Der Schätzer für σ 2 ist somit
n
1X
(xi − µˆn (x1 , x2 , . . . , xn ))2 .
σˆn2 (x1 , x2 , . . . , xn ) =
n i=1
Der Schätzer µˆn , σˆn2 ist der Maximum-Likelihood-Schätzer für die Normalverteilung mit unbekanntem Mittelwert und unbekannter Varianz.
Der Schätzer µˆn , σˆn2 liefert für meine Grundgesamtheit den Mittelwert µˆn des
Taschengeldes und die Varianz σˆ2 .
n
81
13. Untersuchung der ersten Theorie
3
µˆn (x1 , x2 , . . . , xn ) =
1 X
42xi = 24, 44
342 i=1
342
1 X
σˆn2 (x1 , x2 , . . . , xn ) =
(xi − 24, 44)2 = 398, 27
342 i=1
Falls das Merkmal Taschengeldhöhe normalverteilt wäre, würde es der N24,44;398,27
Verteilung entsprechen.
13.1.1.2. χ2 -Anpassungstest
Für den Anpassungstest werden folgende Hypothesen formuliert:
H0 : Das Merkmal Taschengeld ist normalverteilt nach N24,44;398,27 .
HA : Das Merkmal Taschengeld ist nicht normalverteilt nach N24,44;398,27 .
Nun werden n Beobachtungen in m verschiedene Kategorien eingeteilt. Anschließend
wird die erwartete Häufigkeit unter der Annahme, das die Normalverteilung zutrifft,
berechnet. Daraus wird nun die Prüfgröße χ2 ermittelt.
Klassen Häufigkeiten Erwartete Häufigkeit
χ2j
0-10
51
42,5148781 1,69346114
10-20
164
60,6378344 176,189295
20-30
69
67,6324541 0,02765214
30-40
25
58,9907365 19,5856203
40-50
17
40,2364381 13,4189824
50-60
3
21,4607180 15,8800889
60-70
2
8,9499133 5,39684503
70-80
3
2,9180693 0,00230037
80-90
2
0,7437536 2,12187857
90-100
1
0,1481744 4,8969789
100-110
0
0,0230715 0,02307149
110-120
1
0,0028072 354,227706
120-130
0
0,0002669 0,00026687
130-140
1
0,0000198 50455,0073
140-150
3
0,0000011 7829329,27
P
342
7880377,74
Tabelle 13.3.: Klasseneinteilung
Anpassungstest68
und
die
berechneten
Werte
für
den
χ2 -
Für das χ2 -Quantil zu einem Signifikanzniveau von α = 0, 05 mit 14 Freiheitsgraden
ergibt sich χ214;0,95 = 6, 5706. H0 wird abgelehnt falls χ2 > χ2m−1;1−α erfüllt ist. In
meinem Fall ist χ2 = 342·7880377, 74 = 2695089187, 08 > 6, 5706 = χ214;0,95 , d. h. die
Nullhypothese wird abgelehnt. Das Merkmal Taschengeld ist nicht normalverteilt.
68
47 Schüler haben die Frage bzgl. des Taschengeldes nicht beantwortet.
82
13. Untersuchung der ersten Theorie
Man sieht das die Werte in den Flanken nicht der Normalverteilung entsprechen.
Diese Abweichung von der Normalverteilung in den Flanken hat eine sehr hohe
Gewichtung ,da die erwarteten Häufigkeiten dort sehr klein sind. Daraus resultiert
der besonders große Wert für die χ2 -Prüfstatistik. Außerdem erkennt man auch im
Zentrum der Normalverteilung eine deutliche Abweichung (z. B. χ22 = 176, 189295).
Allein an dieser Stelle ist die Abweichung schon zu groß, was zur Verwerfung der
Nullhypothese führt.
13.1.2. Wilcoxon-Rangsummentest
Um trotz der fehlenden Kenntnis eine Aussage bzgl. der oben genannten Hypothese
tätigen zu können, greift man zu verteilungsfreien Tests. Hier bietet sich der Rangsummentest von Wilcoxon bzw.der U-Test von Mann-Whitney an. Da mir eine recht
große Stichprobe vorliegt, wird der approximativen Rangsummentest angewandt. Da
der Rangsummentest ein Zweistichprobentest ist und außerdem keine Aussagen über
die durchschnittliche Taschengeldhöhe macht, müssen die Hypothesen umformuliert
werden.
1. Jugendliche des Gymnasiums erhalten tendenziell weniger Taschengeld als Jugendliche der Hauptschule.
2. Jugendliche des Gymnasiums erhalten tendenziell weniger Taschengeld als Jugendliche der Realschule.
3. Jugendliche der Realschule erhalten tendenziell weniger Taschengeld als Jugendliche der Hauptschule.
Somit ist zu jeder Hypothese ein Rangsummentest durchzuführen. Mir ist bewusst,
dass die Verteilungsfunktion des Merkmals Taschengeld nicht stetig ist, was man
daran erkennen kann, dass die Wahrscheinlichkeit, dass eine Merkmalsausprägung
mehrfach auftritt, nicht Null ist. Dennoch wird im Folgenden die Verteilungsfunktion
des Merkmals Taschengeld annähernd stetig verteilt angenommen. Nach Hartung69
69
Vgl. Hartung (1982) S. 515.
83
13. Untersuchung der ersten Theorie
wird im Falle von Bindungen (mehrere Messwerte sind gleich) den Werten das arithmetische Mittel der in Frage kommenden Ränge zugewiesen.
Erstes Hypothesenpaar
Die Alternativ- und Nullhypothese ist hier folgendermaßen formuliert.
HA : Jugendliche des Gymnasiums erhalten tendenziell weniger Taschengeld als Jugendliche der Hauptschule (d. h. X <t Y ).
H0 : Jugendliche des Gymnasiums erhalten tendenziell gleich viel oder mehr Taschengeld als Jugendliche der Hauptschule (d. h. X ≥t Y ).
Um den Rangsummentest durchzuführen zu können, muss nun für jedes Element der
Stichprobenvereinigung X1 , X2 , . . . , Xn , Y1 , Y2 , . . . , Yn der Rang berechnet werden.
Im Folgenden wird die Rangsumme der beiden Stichproben berechnet.
WX =
162
X
R(Xi ) = 17238, 5
i=1
WY =
58
X
R(Yi ) = 7071, 5
i=1
Mit Hilfe dieser Werte berechnet man nun U und anschließend die Prüfgröße U*.
162(162 + 1)
− 17238, 5 = 5360, 5
2
5360, 5 − 162·58
2
U∗ = q
= 1, 5926
U = 162 · 58 +
162·58·162+58+1
12
Für das Quantil der Standardnormalverteilung gilt u1−α = 1, 2816 mit α = 0, 1.
H0 wird abgelehnt, falls U ∗ > u1−α gilt. In meinem Fall ist U ∗ = 1, 5926 > 1, 2816 =
u1−α . Somit kann die Nullhypothese abgelehnt werden und die Alternativhypothese
trifft mit einer 90-prozentigen Wahrscheinlichkeit zu. D.h. mit 90-prozentiger Wahrscheinlichkeit erhalten Jugendliche des Gymnasiums tendenziell weniger Taschengeld
als Jugendliche der Hauptschule.
Analog zum ersten Hypothesenpaar werden die Hypothesenpaare 2 und 3 geprüft.
Zweites Hypothesenpaar
Die Alternativ- und Nullhypothese sind hier folgendermaßen formuliert:
HA : Jugendliche des Gymnasiums erhalten tendenziell weniger Taschengeld als Jugendliche der Realschule. (d. h. X <t Y ).
H0 : Jugendliche des Gymnasiums erhalten tendenziell gleich viel oder mehr Taschengeld als Jugendliche der Realschule. (d. h. X ≥t Y ).
84
13. Untersuchung der ersten Theorie
Für die Rangsummen und für U und U ∗ ergibt sich
WX =
WY =
162
X
i=1
151
X
R(Xi ) = 23735, 5
R(Yi ) = 25405, 5
i=1
162(162 + 1)
− 23735, 5 = 13929, 5
2
13929, 5 − 162·151
∗
2
U =q
= 2, 1230
U = 162 · 151 +
162·151·(162+151+1)
12
Das Quantil der Standardnormalverteilung zu einem Signifikanzniveau α = 0, 1 ist
u1−α = 1, 2816. Damit gilt U ∗ = 2, 1230 > 1, 2816 = u1−α . Die Nullhypothese kann
somit abgelehnt werden und die Alternativhypothese kann mit einer 90-prozentigen
Wahrscheinlichkeit angenommen werden. Hier kann die Nullhypothese sogar zu einem Signifikanzniveau von α = 0, 05 abgelehnt werden, denn das Quantil der Standardabweichung zu einem Signifikanzniveau von α = 0, 05 ist u1−α = 1, 6449. Damit
ist U ∗ = 2, 1230 >= 1, 6449 = u1−α und die Nullhypothese kann abgelehnt werden.
Die Alternativhypothese kann sogar mit einer 95-prozentigen Wahrscheinlichkeit angenommen werden. D.h. mit 95-prozentiger Wahrscheinlichkeit erhalten Jugendliche
des Gymnasiums weniger Taschengeld als Jugendliche der Realschule.
Drittes Hypothesenpaar
Die Hypothesen werden hier folgendermaßen formuliert:
HA : Jugendliche der Realschule erhalten tendenziell weniger Taschengeld als Jugendliche der Hauptschule. (d. h. X <t Y ).
H0 : Jugendliche der Realschule erhalten tendenziell gleich viel oder mehr Taschengeld als Jugendliche der Hauptschule. (d. h. X ≥t Y ).
Für die Rangsummen und für U und U ∗ ergibt sich
WX =
WY =
151
X
i=1
58
X
R(Xi ) = 15912, 5
R(Yi ) = 7020, 5
i=1
151(151 + 1)
− 15912, 5 = 4321, 5
2
4321, 5 − 151·58
2
U∗ = q
= −0, 1469
U = 151 · 58 +
151·58·(151+58+1)
12
Das Quantil der Standardnormalverteilung ist mit α = 0, 1 wie in der Hypothese 1
und 2 bestimmt durch u1−α = 1, 2816.
85
13. Untersuchung der ersten Theorie
Jetzt ist U ∗ = −0, 1469 < 1, 2816 = u1−α und damit kann die Nullhypothese mit einem Signifikanzniveau von 10% nicht abgelehnt werden. Hier kann keine signifikante
Aussage getroffen werden.
13.2. Ist die Wahrscheinlichkeit, dass ein
Gymnasiast kein Taschengeld erhält, höher
als das ein Hauptschüler kein Taschengeld
erhält?
Unter dem Gesichtspunkt, dass Gymnasiasten tendenziell weniger Taschengeld erhalten, ist zu vermuten, dass die Wahrscheinlichkeit, dass ein Gymnasiast kein Taschengeld bekommt, größer ist, als dass ein Hauptschüler kein Taschengeld erhält.
Somit lautet meine Hypothese:
Die Wahrscheinlichkeit, dass ein Schüler des Gymnasiums kein Taschengeld
erhält, ist höher als die Wahrscheinlichkeit, dass ein Schüler der Hauptschule
kein Taschengeld erhält.
In der vorliegenden Stichprobe ist die Anzahl der Schüler, die kein Taschengeld
erhalten, folgendermaßen nach Schulform aufgeteilt:
Schulform
Gymnasium
Realschule
Hauptschule
Gesamt
Gesamtanzahl
der Schüler
162
151
58
371
Anzahl der Schüler
ohne Taschengeld
10
13
5
28
Anzahl der Schüler ohne
Taschengeld in %
6,1728
8,6093
8,6207
7,5472
Tabelle 13.4.: Anzahl der Schüler die kein Taschengeld erhalten
Wie man der Tabelle entnehmen kann, bekommen innerhalb der Stichprobe 8,6207%
der Hauptschüler und 6,1728% der Gymnasiasten kein Taschengeld. Dieses widerspricht meiner eigentlichen Hypothese. Daher ist zu prüfen, ob die Wahrscheinlichkeit, dass ein Hauptschüler kein Taschengeld bekommt größer ist, als das ein
Gymnasiast kein Taschengeld bekommt.
13.2.1. Vergleich zweier relativer Häufigkeiten
Mit Hilfe dieses Test lassen sich die relativen Häufigkeiten zweier binomialverteilter
Merkmale X und Y der iid Stichproben X1 , X2 , · · · , Xn und Y1 , Y2, · · · , Ym miteinander vergleichen. In meinem Fall möchte ich die relative Häufigkeit der Gymnasiasten,
die kein Taschengeld erhalten mit der relativen Häufigkeit der Hauptschüler, die kein
Taschengeld erhalten, vergleichen.
Die Hypothesen werden ähnlich wie bei dem exakten Binomialtest formuliert:
H0 : pGym ≥ pHaupt ,
HA : pGym < pHaupt
86
13. Untersuchung der ersten Theorie
Für die relativen Häufigkeiten ergibt sich aus Tabelle 13.5
162
fGym
1 X
10
=
Xi =
,
162 i=1
162
58
fHaupt
1 X
5
=
Yj = .
58 j=1
58
Für die Differenz der relativen Häufigkeiten d ergibt sich nun
d=
10
5
115
−
=−
= −0, 0245.
162 58
4698
Für die Prüfstatistik V ergibt sich daraus
V =q
3
(1
44
−0, 0245
−
3
)( 1
44 162
+
1
)
58
= −0, 6352.
Für das Quantil der Standardnormalverteilung u1−α zu einem Signifikanzniveau
α = 0, 1 ergibt sich u0,9 = 1, 2816. Aus den Entscheidungsregeln für diesen Test
wird H0 abgelehnt, falls V < −u1−α ist. Für meinen Fall gilt V = −0, 6352 >
−1, 2816 = −u0,9 . Daher kann die Nullhypothese zum angegebenen Signifikanzniveau nicht abgelehnt werden.
13.2.2. Exakter Binomialtest
Zum Testen der eben genannten Hypothese ist die Durchführung eines Binomialtest
möglich, da die Stichprobe nur zwei Merkmalsausprägungen annehmen kann. Zum
einen die Ausprägung, dass der Schüler Taschengeld erhält und zum anderen, dass
der Schüler kein Taschengeld erhält.
P
Erhält Taschengeld Erhält kein Taschengeld
Gymnasium
152
10 162
Hauptschule
53
5
58
P
205
15 220
Tabelle 13.5.: Vierfeldertafel zum Taschengeld
Für den Test wird folgende Alternativ- und Nullhypothese formuliert:
H0 : Die Wahrscheinlichkeit, dass ein Schüler vom Gymnasium kein Taschengeld
erhält ist größer oder gleich der Wahrscheinlichkeit, dass ein Hauptschüler
kein Taschengeld erhält.
HA : Die Wahrscheinlichkeit, dass ein Schüler vom Gymnasium kein Taschengeld
erhält ist kleiner als die Wahrscheinlichkeit, dass ein Schüler der Hauptschule
kein Taschengeld erhält.
Da hier die unbekannte Wahrscheinlichkeit p (Wahrscheinlichkeit dass ein Gymnasiast kein Taschengeld erhält) mit einer vorgegebenen Wahrscheinlichkeit p0 (Wahrscheinlichkeit, dass ein Hauptschüler kein Taschengeld erhält) verglichen wird, ist
zunächst p0 festzulegen, sei daher p0 = 0,0862.
Somit ist zu testen:
87
13. Untersuchung der ersten Theorie
H0 : p ≥ 0, 0862
HA : p < 0, 0862
Zu dem Signifikanzniveau α = 0, 1 ergibt sich die kritische Schranke bu;0,1 (0, 0862)
rechnerisch wie folgt:
8 9 X
X
162
162
k
162−k
0, 0862 (1 − 0, 0862)
≤ 0, 1 <
0, 0862k (1 − 0, 0862)162−k
k
k
k=0
k=0
⇔ 0, 0551 ≤ 0, 1 < 0, 1006
Somit ist ist bu;0,1 (0, 0862) = 9.
Die Nullhypothese wird abgelehnt, falls e < bu;α (p0 ) gilt. Speziell für mein Testergebnis gilt e = 10 > 9 = bu;0,1 (0, 0862) und somit kann H0 nicht abgelehnt werden.
Aus diesem Testergebnis und dem Ergebnis des Vergleichs der relativen Häufigkeit
lässt sich H0 nicht ablehnen. Anhand der Daten meiner Stichprobe lässt sich zwar
vermuten, dass ein Zusammenhang zwischen der Schulform und der Tatsache, ob ein
Schüler Taschengeld erhält oder nicht, besteht. Doch mit Hilfe der durchgeführten
Tests lässt sich keine eindeutige Aussage bzgl. dieser Hypothese machen.
13.3. Leihen sich Gymnasiasten und Hauptschüler
seltener Geld als Realschüler?
Neben der Kenntnisse bzgl. des Taschengeldes ist für die Theorie von großer Bedeutung, ob Jugendliche mit ihrem Taschengeld auskommen oder ob sie sich zusätzliches
Geld leihen. Unter dem Gesichtspunkt der Theorie ist es auch von großem Interesse,
ob Jugendliche einen Teil ihres zur Verfügung stehenden Geldes sparen. Zu Beginn
soll nun das Geldleih- und Geldsparverhalten getrennt nach Schulform betrachtet
werden.
Gymnasiasten
Realschüler
Hauptschüler
P
Mehrmals
pro Monat
14
21
8
43
Geld leihen
P
Einmal
Seltener als einmal Nie
pro Monat
pro Monat
18
62 72 166
20
68 50 159
5
21 28 62
43
151 150 387
Tabelle 13.6.: Absolute Häufigkeiten Geldleihverhaltens70
Da für das Verbraucherverhalten von Bedeutung ist, ob die Schüler in der Regel mit
ihrem Geld auskommen oder sich regelmäßig Geld leihen müssen, fasse ich die erste
und zweite Spalte der Tabelle zu einer Tabelle zusammen, da sich in diesen Fällen
die Schüler regelmäßig Geld leihen.
70
2 Personen ohne Angabe.
88
13. Untersuchung der ersten Theorie
Gymnasiasten
Realschüler
Hauptschüler
P
Geld leihen
Seltener als
einmal pro Monat
62
68
21
151
Mindestens
einmal pro Monat
32
41
13
86
Nie
P
72 166
50 159
28 62
150 387
Tabelle 13.7.: Absolute Häufigkeiten des Geldleihverhaltens klassifiziert
In Prozent bedeuten diese Werte, dass sich 19,28% der Gymnasiasten, 25,79% der
Realschüler und 20,97% der Hauptschüler mindestens einmal pro Monat zusätzlich
zu ihrem Taschengeld noch Geld leihen. Diese Datenverteilung hatte ich nicht vermutet. Meine Vermutung ging eher in die Richtung, dass sich Gymnasiasten, aufgrund
des tendenziell niedrigeren Taschengeldes häufiger Geld leihen.
Nach den Daten meiner Stichprobe entsteht nun aber die Frage, ob sich Gymnasiasten und Hauptschüler signifikant seltener Geld leihen als Realschüler.
13.3.1. Exakter Binomialtest
Für den exakten Binomialtest können Merkmale nur auf zwei Merkmalsausprägungen getestet werden. Dieses ist hier zum einen die Merkmalsausprägung, die Schüler
leihen sich mindestens einmal pro Monat Geld und zum andernen, die Schüler leihen
sich weniger als einmal im Monat Geld, wobei diese Merkmalsausprägung alle Schüler beinhaltet, die sich seltener als einmal pro Monat Geld leihen und diejenigen die
sich nie Geld leihen.
Die Hypothesen werden formuliert als:
H0 : Gymnasiasten bzw. Hauptschüler leihen sich mindestens so häufig Geld wie
Realschüler.
HA : Gymnasiasten bzw. Hauptschüler leihen sich seltener Geld als Realschüler.
Zunächst soll der Test mit den Gymnasiasten durchgeführt werden. Hierbei ist zunächst eine Wahrscheinlichkeit p0 zu wählen, die mit der Wahrscheinlichkeit p, dass
sich ein Gymnasiast Geld leiht, verglichen werden kann. Hierbei ist p0 die geschätzte
Wahrscheinlichkeit, dass sich ein Realschüler Geld leiht und damit ist p0 = 0, 2579.
Somit ist zu testen:
H0 : p ≥ 0, 2579
HA : p < 0, 2579
Unter einem Signifikanzniveau von α = 0, 05 ergibt sich die kritische Schranke
bu;0,05 (0, 2579) rechnerisch wie folgt:
33 X
166
k=0
k
k
0, 2579 (1 − 0, 2579)
166−k
34 X
166
0, 2579k (1 − 0, 2579)166−k
≤ 0, 05 <
k
k=0
⇔ 0, 0464 ≤ 0, 05 < 0, 0676
Somit ist ist bu;0,05 (0, 2579) = 34
89
13. Untersuchung der ersten Theorie
Nach den in Tabelle 8.1 dargestellten Entscheidungsvorschriften für den exakten
Binomialtest wird die Nullhypothese abgelehnt im Falle e < bu;α (p0 ). Die Anzahl
der Treffer e, wobei die Gymnasiasten die sich mindestens einmal pro Monat Geld
leihen als Treffer bezeichnet werden beträgt e = 32 und somit ist e = 32 < 34 =
bu;0,05 (0, 2579). Somit wird die Nullhypothese mit einer Irrtumswahrscheinlichkeit
von 5% abgelehnt und die Alternativhypothese wird angenommen, was bedetutet,
dass sich Gymnasiasten signifikant seltener Geld leihen als Realschüler.
Nun wird dieser Test auch für die Hauptschüler durchgeführt. Hier ist die Wahrscheinlichkeit p0 identisch zum vorhergehenden Test, d. h. p0 = 0, 2579 und es ist
abermals zu testen
H0 : p ≥ 0, 2579
HA = p < 0, 2579
Unter einem Signifikanzniveau von α = 0, 05 ergibt sich für die kritische Schranke
bu;0,05 (0, 2579) = 10. In diesem Fall kann die Nullhypothese zum Signifikanzniveau
α = 0, 05 nicht abgelehnt werden, da e = 13 > 10 = bu;0,05 (0, 2579) beträgt. Selbst
zu einem Signifikanzniveau von α = 0, 1 kann die Nullhypothese nicht abgelehnt
werden. Hier wäre e = 13 > 12 = bu;0,05 (0, 2579).
Obwohl die Anteile der Gymnasiasten und der Hauptschüler, die sich mindestens
einmal pro Monat Geld leihen, annähernd gleich sind, können dennoch nicht beide
Nullhypothesen abgelehnt werden. Dieses kann im Wesentlichen daher kommen, dass
die Stichprobe der Hauptschüler vergleichsweise mit der anderen Stichprobe recht
klein ist.
Nachdem ich nun signifikant nachgewiesen habe, dass sich Gymnasiasten seltener
Geld leihen als Realschüler, stellt sich die Frage nach dem Grund. Eine Vermutung,
warum sich Gymnasiasten seltener Geld leihen, liegt darin, dass eventuell mehr Gymnasiasten als Realschüler sich zusätzlich zu ihrem Taschengeld noch Geld durch einen
kleinen Nebenjob (z. B. Zeitungen austragen) hinzuverdienen. Um dies überprüfen
zu können ist es notwendig zu wissen, wie viele Gymnasiasten und Realschüler einen
Nebenjob besitzen.
Besitzen einen Job
Gymnasiasten
Realschüler
Hauptschüler
P
Besitzen einen
Job in %
41,5
42,3
16,3
51
52
20
123
P
Besitzen
keinen Job
116 167
108 160
42 62
266 389
Tabelle 13.8.: Anzahl der Schüler die einen Nebenjob besitzen
Hier an dieser Stelle kann ich meine Vermutung, dass Gymnasiasten häufiger einen
Nebenjob besitzen als Realschüler, verwerfen, da der Anteil der Gymnasiasten, die
einen Job besitzen, annähernd gleich ist mit dem Anteil der Realschüler, die einen
Job besitzen.
90
13. Untersuchung der ersten Theorie
13.4. Hängt das Sparverhalten der Jugendlichen
mit der Schulform zusammen?
Im Folgenden soll nun das Sparverhalten der Schüler betrachtet werden. Hierfür
wird zunächst das Sparverhalten innerhalb der Stichprobe betrachtet.
Gymnasiasten
Realschüler
Hauptschüler
P
Sparen jeden
Monat
85
53
14
152
Sparen manchmal
Sparen nie
70
95
36
201
P
11 166
12 160
12 62
35 388
Tabelle 13.9.: Absolute Häufigkeiten des Sparverhaltens71
Ähnlich wie für das Geldleihverhalten interessieren auch beim Sparverhalten besonders die Personen, die regelmäßig Geld sparen. Dieses sind in meinem Fall gerade die
Schüler, die jeden Monat etwas Geld sparen. Alle anderen Schüler werden zusammengefasst zu einer Gruppe, welche selten bis nie spart. Daher ergibt sich folgendes
Sparverhalten:
Gymnasiasten
Realschüler
Hauptschüler
P
P
Sparen regelmäßig Sparen selten bis nie
85
81 166
53
107 160
14
48 62
152
236 388
Tabelle 13.10.: Absolute Häufigkeiten des Sparverhaltens klassifiziert
Nach den Tabellen zum Sparverhalten zeigt sich, dass 51,20% der Gymnasiasten,
33,13% der Realschüler und 22,58% der Hauptschüler regelmäßig sparen. Auffällig
ist, dass gerade die Schülergruppe, die tendenziell am wenigsten Taschengeld erhält (Gymnasiasten), am meisten sparen und die Schülergruppe, die tendentziell
am meisten Taschengeld erhält (Hauptschüler), am wenigsten sparen. Im Folgenden
wird nun getestet, ob das Sparverhalten abhähgig von der Schulform ist, oder ob es
vielleicht abhängig von der Höhe des Taschengeldes ist. Um die Abhängingkeit der
Merkmale Sparen und Schulform zu überprüfen, wird der χ2 -Unabhängingkeitstest
angewandt.
13.4.1. χ2 -Unabhängigkeitstest
Um die Abhängigkeit zu testen, werden folgende Hypothesen formuliert:
HA : Das Sparverhalten ist abhängig von der Schulform.
H0 : Das Sparverhalten ist unabhängig von der Schulform.
71
1 Person ohne Angabe.
91
13. Untersuchung der ersten Theorie
Um die χ2 -Prüfstatistik berechnen zu können, müssen die relativen und die erwarteten Häufigkeiten f und e berechnet werden.
Sparen regelmäßig Sparen selten bis nie
0,2191
0,2088
0,1366
0,276
0,0361
0,1237
0,3918
0,6082
Gymnasiasten
Realschüler
Hauptschüler
P
P
0,4278
0,4124
0,1598
1
Tabelle 13.11.: Relative Häufigkeiten des Sparverhaltens
Sparen regelmäßig Sparen selten bis nie
0,1676
0,2602
0,1615
0,2508
0,0626
0,0972
0,3918
0,6082
Gymnasiasten
Realschüler
Hauptschüler
P
P
0,4278
0,4124
0,1598
1
Tabelle 13.12.: Erwartete Häufigkeiten des Sparverhaltens
Für die χ2 -Prüfstatistik ergibt sich
3 X
2
X
(fij − eij )2
χ = 388 ·
= 19, 7045.
eij
i=1 j=1
2
(13.1)
Als Quantil χ2(m−1)(n−1);1−α zu einem Signifikanzniveau α = 0, 05 ergibt sich χ22;0,95 =
0, 1026. Die Unabhängigkeitshypothese wird abgelehnt, falls χ2 > χ2(m−1)(n−1);1−α
gilt. Für den durchgeführten Test ergab sich χ2 = 19, 7045 > 0, 1026 = χ22;0,95 . Somit kann die Nullhypothese zu einem Signifikanzniveau von 5% abgelehnt werden
und die Alternativhypothese wird angenommen. Es besteht also eine Abhängingkeit
zwischen den Merkmalen „Sparen“ und „Schulform“. Je höher die Schulform, desto
häufiger wird regelmäßig gespart,d. h. konkret, dass Gymnasiasten signifikant am
häufigsten und Hauptschüler signifikant am seltesten sparen. Auffällig ist hier, dass
gerade die Schüler die tendenziell am wenigsten Taschengeld erhalten am meisten
sparen und die Schüler die tendenziell am meisten Taschengeld erhalten am wenigsten sparen. Somit ist das Interesse groß zu testen, ob das Sparverhalten von der
Taschengeldhöhe abhängig ist.
Für die gezeigte Abhängigkeit zwischen dem Sparverhalten und der Schulform kann
eine eindeutige Richtung angegeben werden. Hierzu ist die folgende Alternativhypothese „Je höher die Schulform, desto häufiger wird regelmäßig gespart“ zu testen.
Das mathematische Testproblem lautet daher:
HA : ∀i < j :
pi1
pj1
>
pi•
pj•
H0 : ∃i < j :
pi1
pj1
≤
pi•
pj•
Nach den Entscheidungsregeln von (9.2) wird H0 abgelehnt, falls
χ2 ≥ χ21,1−α und ∀i < j :
92
qi1
qj1
>
.
qi•
qj•
13. Untersuchung der ersten Theorie
Die Gültigkeit der ersten Bedingung wurde bereits im χ2 -Test gezeigt.
Aus der Tabelle 13.10 ergibt sich nun konkret
q11
q21
q31
>
>
⇔ 0, 512 > 0, 331 > 0, 226 (monoton fallend).
q1•
q2•
q3•
Somit kann eine Richtung angenommen werden. Daher wird H0 abgelehnt und HA :
„Je höher die Schulform, desto häufiger wird regelmäßig gespart“ angenommen.
13.5. Hängt das Sparverhalten der Jugendlichen
mit der Taschengeldhöhe zusammen?
Im Folgenden ist relevant, ob das Sparverhalten allein von der Schulform abhängt
oder ob das Sparverhalten auch mit der Taschengeldhöhe korreliert. Meine zu testende Hypothese lautet:
H0 : Das Sparverhalten ist nicht abhängig von der Taschengeldhöhe.
HA : Das Sparverhalten ist abhängig von der Taschengeldhöhe.
Hierfür teile ich zunächst die Taschengeldhöhen nach einer Empfehlung des Jugendamts72 in drei Klassen ein. Jugendliche die ein Taschengeld von weniger als 20 Euro
erhalten, werden in die Klasse „wenig“, Jugendliche, die ein Taschengeld zwischen
20 und 30 Euro erhalten, werden in die Klasse „angemessen“ und Jugendliche die
ein Taschengeld von mehr als 30 Euro pro Monat erhalten werden in die Klasse
„viel“ eingestuft. Unter der Annahme, dass die Jugendlichen Taschengeld erhalten
und sparen, ergibt sich aus den Daten meiner Stichprobe folgende Tabelle:
Gymnasium
P
Taschengeldhöhe
viel
angemessen
wenig
Realschule
P
Hauptschule
P
Gesamtsumme
viel
angemessen
wenig
viel
angemessen
wenig
Sparen regelmäßig Sparen selten/nie
8
10
28
31
47
37
83
78
9
19
21
37
21
44
51
100
5
8
4
18
5
18
14
44
148
222
P
18
59
84
161
28
58
65
151
13
22
23
58
370
Tabelle 13.13.: Die Relation der Taschengeldhöhe zum Sparverhalten getrennt nach
Schulformen73
72
73
Vgl. Popp (2002).
19 Schüler ohne Angaben
93
13. Untersuchung der ersten Theorie
Wenn man die Tabelle 13.13 betrachtet, besonders die Daten der Realschüler und
der Gymnasiasten, lässt sich vermuten, dass die Taschengeldhöhe einen Einfluss
auf das Sparverhalten hat. Hier ist zu erkennen, dass gerade die Schüler mit wenig Taschengeld am meisten sparen. Um zu testen ob das Sparverhalten mit der
Taschengeldhöhe zusammenhängt betrachte ich im Folgendem das Sparverhalten in
Abhängigkeit zur Taschengeldhöhe, nicht nach Schulformen getrennt.
P
Sparen regelmäßig Sparen selten bis nie
Taschengeldhöhe
viel
22
37 59
angemessen
53
86 139
wenig
73
99 172
Summe
148
222 370
Tabelle 13.14.: Sparverhalten zur Taschengeldrelation
Um diese beiden Merkmale auf ihre Abhängigkeit zu überprüfen, wird der χ2 Unabhängigkeitstest angewandt.
13.5.1. χ2 -Unabhängigkeitstest
Aus den relativen Häufigkeiten f und den erwarteten Häufigkeiten e, welche sich
aus der Tabelle 13.14 ergeben, ergibt sich für die χ2 -Prüfstatistik
2
χ = 370
3 X
2
X
(fij − eij )2
eij
i=1 j=1
= 0, 8108.
(13.2)
Zu einem Signifikanzniveau α = 0, 05 ergibt sich für das Quantil χ22;0,95 = 0, 1026.
Nach den Entscheidungsvorschriften des χ2 -Unabhängigkeitstests kann die Nullhypothese von Seite 93 zu einem Signifikanzniveau von 5% abgelehnt werden, denn es
gilt χ2 = 0, 8108 > 0, 1026 = χ22;0,95 . Der Test hat somit ergeben, dass das Sparverhalten der Jugendlichen abhängig von ihrer Taschengeldhöhe ist.
Für die gezeigte Abhängigkeit zwischen dem Sparverhalten und der Taschengeldhöhe
kann eine eindeutige Richtung angegeben werden. Hierzu ist die folgende Alternativhypothese „Je mehr Taschengeld ein Schüler erhält, desto häufiger wird selten
gespart“ zu testen. Das mathematische Testproblem lautet daher:
H0 : ∃i < j :
pi1
pj1
≥
,
pi•
pj•
HA : ∀i < j :
pi1
pj1
<
.
pi•
pj•
Nach den Entscheidungsregeln von (9.2) wird H0 abgelehnt, falls
χ2 ≥ χ21,1−α und ∀i < j :
qi1
qj1
<
.
qi•
qj•
Die erste Bedingung wurde bereits durch die Abhängigkeit gezeigt.
Aus der Tabelle 13.14 ergibt sich nun konkret
q11
q21
q31
<
<
⇔ 0, 373 < 0, 381 < 0, 424 (monoton steigend).
q1•
q2•
q3•
94
13. Untersuchung der ersten Theorie
In diesem Fall kann eine Richtung eindeutig angenommen werden. Somit wird H0
abgelehnt dementsprechend HA angenommen.
An dieser Stelle kann ich somit sagen, dass das Sparverhalten der Jugendlichen von
mehreren Faktoren abhängt. Hier ist voneinander getrennt gezeigt worden, dass das
Sparverhalten sowohl von der Schulform als auch von der Höhe des Taschengeldes
abhängt.
13.6. Hängt das Sparverhalten der Jugendlichen
stärker von der Schulform oder der
Taschengeldhöhe ab?
Eine Vermutung von mir ist jedoch, dass zwischen der Taschengeldhöhe und dem
Sparverhalten kein kausaler Zusammenhang besteht. Eine Erklärung von mir, warum
signifikant getestet werden konnte, dass das Sparverhalten von der Taschengeldhöhe
abhängt, liegt darin, dass beide Variablen von der Schulform abhängig sind. Um
herauszufinden, von welcher Variable das Sparverhalten nun tatsächlich abhängt
wird, eine multiple kategoriale Regressionsanalyse durchgeführt.
13.6.1. Multiple Regressionsanalyse
Die abhängige Variable Y repräsentiert das Sparverhalten. Als unabhängige Variablen sind X1 die Schulform und X2 die Taschengeldhöhe. Mittels der EffektKodierung und den Referenzkategorien Hauptschule für die Schulform bzw. wenig
Taschengeld für die Taschengeldhöhe ergeben sich die Variablen
X11
X12
X21
X22
:
:
:
:
Der
Der
Der
Der
Schüler
Schüler
Schüler
Schüler
besucht das Gymnasium.
besucht die Realschule.
erhält viel Taschengeld.
erhält ein angemessenes Taschengeld.
Durch Gruppierung der Ergebnisse in die insgesamt 9 verschiedenen Gruppen ergibt
sich:
Schulform
Taschengeld nj yj X01 X11 X12 X21 X22
Gruppe 1 Hauptschule wenig
23
5
1 -1 -1 -1 -1
Gruppe 2 Hauptschule angemessen 22
4
1 -1 -1
0
1
Gruppe 3 Hauptschule viel
13
5
1 -1 -1
1
0
Gruppe 4 Realschule
wenig
65 21
1
0
1 -1 -1
Gruppe 5 Realschule
angemessen 58 21
1
0
1
0
1
Gruppe 6 Realschule
viel
28
9
1
0
1
1
0
Gruppe 7 Gymnasium wenig
84 47
1
1
0 -1 -1
Gruppe 8 Gymnasium angemessen 59 28
1
1
0
0
1
Gruppe 9 Gymnasium viel
18
8
1
1
0
1
0
95
13. Untersuchung der ersten Theorie
Bei der Wahl des Logitmodells ergeben sich für die Parameter βik folgende Werte:
β01 = 0, 5877
β11 = 0, 6440 β12 = −0, 0865 β13 = −0, 5574
β21 = 0, 0120 β22 = −0, 0703 β23 = 0, 0583.
Offenbar sind die Unterschiede der Koeffizienten β1k größer als die Differenzen der
Koeffizienten β2k . Daraus lässt sich interpretieren, dass das Sparverhalten der Jugendlichen deutlicher von der Schulform als von der Taschengeldhöhe der Jugendlichen
abhängt.
13.7. Unterscheidet sich das Verhältnis zum Geld
der Schüler je nach Schulform?
Die Abhängigkeit der verschiedenen Merkmale, welche als Indikatoren für das Verhältnis der Schüler zu ihrem Geld zählen, von der Schulform wurde bestätigt. Um
eine abschließende Aussage bzgl. der ersten Theorie treffen zu können wird nun das
konkrete Verhältnis der Schüler zu ihre Geld, abhängig nach Schulform, getestet.
Hierzu ergibt sich aus meiner Datensammlung nach Anwendung der Interpretationsregeln aus Tabelle 11.1 folgende Tabelle
Gymnasiasten
Realschüler
Hauptschüler
P
Verhältnis zum Geld
P
gut durchschnittlich schlecht
12
94
61 167
10
75
75 160
3
21
38 62
25
190
174 389
Tabelle 13.15.: Das Verhältnis zum Geld der Schüler in absoluten Häufigkeiten dargestellt
Der Tabelle lässt sich entnehmen, dass von den Gymnasiasten 7,18% ein gutes,
56,29% ein durchschnittliches und 36,53% ein schlechtes Verhältnis zum Geld haben. Von den Realschülern weisen insgesamt 6,25% ein gutes, 46,86% ein durchschnittliches und ebenfalls 46,86% ein schlechtes Verhältnis zum Geld auf. Von den
Hauptschülern zeigen 5% ein gutes, 33,87% ein durchschnittliches und 61,29% ein
schlechtes Verhältnis zum Geld (vgl. Abbildung 13.1).
96
36,53%
46,86%
61,29%
56,29%
46,86%
33,87%
6
5
4
3
2
1
0
7,18%
6,25%
5,00%
13. Untersuchung der ersten Theorie
Gymnasiasten
Realschüler
Hauptschüler
gut
0
1
2 mittel
3
4schlecht
5
Abbildung 13.1.: Das Verhältnis der Schüler zum Geld getrennt nach Schulform
Ein χ2 -Unabhängigkeitstest soll nun die Abhängigkeit des Verhältnisses zum Geld
der Schüler von der Schulform testen.
13.7.1. χ2 -Unabhängigkeitstest
H0 : Das Verhältnis der Schüler zum Geld ist unabhängig von der Schulform.
HA : Das Verhältnis der Schüler zum Geld ist abhängig von der Schulform.
Für die χ2 -Prüfstatistik ergibt sich
χ2 = 389
3 X
3
X
(fij − eij )2
eij
i=1 j=1
= 11, 7460
Für das χ2 -Quantil mit 4 Freiheitsgraden zu einem Signifikanzniveau von α = 0, 05
ergibt sich χ24;0,95 = 0, 7107. Somit kann die Unabhängigkeitshypothese abgelehnt
werden und die Abhängigkeit des Verhältnisses der Schüler zum Geld von der Schulform wird mit einer Irrtumswahrscheinlichkeit von 5% angenommen.
Im Folgenden soll die Richtung der Abhängigkeit geprüft werden. Hierzu wird folgende Alternativhypothese aufgestellt
HA : Je höher die Schulform, desto besser ist das Verhältnis der Schüler zum Geld.
Um die Entscheidungsregeln (9.6) gut anwenden zu können wird die nachstehenden
Tabelle formuliert.
qi1
qi•
0,0719
0,0625
0,0484
qi1 qi2
+
qi• qi•
0,6347
0,5313
0,3871
Nach den Entscheidungsregeln wird H0 abgelehnt und HA angenommen, da beide
Spalten monoton fallend sind
0, 0719 > 0, 0625 > 0, 0484,
0, 6347 > 0, 5313 > 0, 3871.
97
13. Untersuchung der ersten Theorie
Demnach zeigen Gymnasiasten häufiger ein gutes Verhältnis zum Geld als Hauptschüler. Die Hauptschüler zeigen dagegen häufiger ein schlechtes Verhältnis zum
Geld als Gymnasiasten. Die Realschüler befinden sich im Mittelfeld.
13.8. Fazit zur ersten Theorie
Die Untersuchung meiner ersten Theorie hat gezeigt, dass das Verhältnis zum Geld
der Jugendlichen tatsächlich von der Schulform abhängt. Obwohl Jugendliche des
Gymnasiums durchschnittlich weniger Taschengeld erhalten, nämlich 20,81 Euro,
als Jugendliche der Hauptschule mit durchschnittlich 28,72 Euro oder Realschüler
mit durchschnittlich 26,95 Euro hat sich gezeigt, dass sich Gymnasiasten signifikant
seltener von ihren Eltern oder Freunden Geld leihen und regelmäßiger als Realschüler oder Hauptschüler einen Teil ihres Geldes sparen. Die Schüler der Hauptschule
ist diejenige Schülergruppe, welche am meisten Taschengeld erhält, sich regelmäßig noch zusätzlich zu ihrem Taschengeld Geld leiht und am seltensten Geld spart.
Nach meiner eigenen Interpretation auf Seite 68 ordne ich somit den Schülern des
Gymnasiums ein besseres Verhältnis zum Geld zu als den Schülern der Realschule
oder der Hauptschule. Es hat sich gezeigt, dass Hauptschüler, im Vergleich zu Schülern anderer Schulformen, einen schlechteren Umgang mit Geld bzw. ein schlechteres
Verhältnis dazu haben, während sich die Realschüler im Mittelfeld befinden. Die anfänglich signifikant gezeigte Abhängigkeit des Sparverhaltens zur Taschengeldhöhe
resultierte aus der Abhängigkeit des Sparverhaltens zur Schulform. Die Regressionsanalyse bestätigte, dass zwischen dem Sparverhalten und der Taschengeldhöhe nur
ein sehr kleiner Zusammenhang besteht, während die Abhängigkeit zur Schulform
eindeutig ist. Abschließend sind noch die Gesamtzahlen zu erwähnen. Die Untersuchung hat gezeigt, dass nur 6,43% der befragten Schüler ein gutes und 48,84%
der Schüler ein durchschnittliches Verhältnis zu ihrem Geld pflegen. Es zeigt sich
jedoch auch, dass 44,73% der befragten Schüler ein schlechtes Verhältnis zu ihrem
Geld haben (vgl. Abbildung 13.2). Es ist noch zu erwähnen, dass der Gesamtdurchschnitt des Taschengeldes ,aller befragten Schüler, 24,44 Euro beträgt, was auch den
empfehlungen des Jugendamtes entspricht74
48,84%
6,43%
gutes Verhalten
durchschnittliches Verhalten
schlechtes Verhalten
44,73%
Abbildung 13.2.: Das Verhältnis der Schüler zum Geld
74
Das Jugendamt empfiehlt für Schüler im Alter zwischen 14 und 15 Jahren, ein monatlichen
Taschengeld von 23-26 Euro.
98
14. Untersuchung der zweiten
Theorie
Im folgenden Auswertungsabschnitt soll nun das Einkaufsverhalten von Schüler unterschiedlicher Schulformen betrachtet werden. Unter der Fragestellung: „Wie Verhalten sich Jugendliche, wenn sie ein bestimmtes Produkt kaufen möchten“ werden
verschiedene Merkmale betrachtet. Welche Merkmale hierbei genau betrachtet werden sollen, ist bereits auf Seite 68 beschrieben.
14.1. Unterscheidet sich das Informationsverhalten
je nach Schulform?
Zunächst soll betrachtet werden, ob sich die Schüler über ein Produkt informieren,
wenn sie es kaufen möchten.
Da ich vermute, dass sich das Informationsverhalten der 14-jährigen Jugendlichen
je nach Schulform unterscheidet, sollen die Daten meiner Stichprobe getrennt nach
Schulform betrachtet werden.
P
Informieren sich Informieren sich nicht
Gymnasiasten
162
5 167
Realschüler
149
11 160
Hauptschüler
60
2
62
P
371
18 389
Tabelle 14.1.: Absolute Daten der Schüler, die sich über ein Produkt informieren,
wenn sie es kaufen möchten
Die Tabelle zeigt, dass sich 97% der Gymnasiasten, 93% der Realschüler und 96% der
Hauptschüler informieren, wenn sie sich ein bestimmtes Produkt kaufen möchten.
Um zu untersuchen, ob das Informationsverhalten von der Schulform abhängig ist,
wird der χ2 -Unabhängigkeitstest angewandt.
14.1.1. χ2 -Unabhängigkeitstest
Für den χ2 -Unabhängigkeitstest werden die Hypothesen wie folgt formuliert:
H0 : Das Informationsverhalten der Schüler ist unabhängig von der Schulform.
HA : Das Informationsverhalten der Schüler ist abhängig von der Schulform.
99
14. Untersuchung der zweiten Theorie
Aus den relativen Häufigkeiten f und den erwarteten Häufigkeiten e, welche sich
aus der Tabelle 14.1 ergeben, ergibt sich für die χ2 -Prüfstatistik
χ2 = 389
3 X
2
X
(fij − eij )2
eij
i=1 j=1
= 3, 1171.
Zu einem Signifikanzniveau α = 0, 05 ergibt sich für das Quantil χ22;0,95 = 0, 1026.
Nach den Entscheidungsvorschriften des χ2 -Unabhängigkeitstests kann die Nullhypothese zu einem Signifikanzniveau von α = 0, 05 abgelehnt werden, denn es gilt
χ2 = 3, 1171 > 0, 1026 = χ22;0,95 . Damit wird HA mit einer Irrtumswahrscheinlichkeit von 5% angenommen, was bedeutet, dass das Informationsverhalten von der
Schulform abhängig ist.
Für die signifikant gezeigte Abhängigkeit lässt sich jedoch keine Richtung festlegen,
da aus Tabelle 14.1 zu erkennen ist, dass Hauptschüler und Gymnasiasten annähernd
das gleiche Informationsverhalten zeigen.
14.2. Unterscheiden sich die Informationsquellen je
nach Schulform?
Im Folgenden ist nun von Interesse, ob sich auch die Informationsquellen je nach
Schulform unterscheiden oder ob die Schüler alle die gleichen Informationsquellen
nutzen. Den Schülern war es gestattet, mehrere Antwortmöglichkeiten anzukreuzen.
Ein erster Einblick über die genutzten Informationsquellen soll folgende Kontingenztabelle ermöglichen:
Gymnasiasten
Realschüler
Hauptschüler
P
Gymnasiasten
Realschüler
Hauptschüler
P
Internet
95
81
32
198
Kino
2
7
2
11
TV
54
76
26
156
Radio
7
5
2
14
Familie
60
66
23
149
Plakate
14
17
5
36
Freunde Zeitschriften Fachhandel
114
77
47
106
76
47
40
23
8
260
176
102
Tabelle 14.2.: Genutzte Informationsquellen
Um Aussagen darüber machen zu können, ob Schüler tendenziell eher „gute“ oder
„schlechte“ Informationsquellen nutzen, werden die in der Tabelle genannten Quellen
wie auf Seite 69 beschrieben kategorisiert. Hierbei sollen diese in die Kategorien
„gute“ Informationsquellen, „durchschnittliche“ Informationsquellen und „schlechte“
Informationsquellen eingeteilt werden. Eine mögliche subjektive Kategorisierung ist
hierbei:
100
14. Untersuchung der zweiten Theorie
Informationsquellen
durchschnittliche
gute
Internet
Zeitschrift
Fachhandel Familie
Freunde
schlechte
TV
Radio
Kino
Plakate
Tabelle 14.3.: Qualität der Informationsquellen
Ein Problem der Kategorisierung ist die Zuordnung der Informationsquellen zu ihrer
entsprechenden Kategorie. Das Internet und der Fachhandel wird als gute Informationsquelle bezeichnet, da ich davon ausgehe, das der Informationsgehalt recht hoch
ist. Den Fachhändler halte ich in seiner Beratung für sehr kompetent und im Internet hat der Nutzer die Möglichkeit, sich auf objektiven Informationsseiten zu
informieren. Die Zeitschrift wird von mir als durchschnittliche Informationsquelle
bezeichnet, da ich zum einen die reine Produktwerbung betrachten kann, welche
nicht so objektiv sein wird, oder zum anderen Fachberichte bzgl. eines Produkts, in
denen ich einen recht hohen Informationsgehalt vermute (z. B. in Fachzeitschriften).
Eltern und Freunde wurden den durchschnittlichen Informationsquellen zugeordnet,
da ich sie nicht für interessengesteuert halte aber dennoch in vielen Bereichen in
ihrer Beratung mangels Produktkenntnisse, für inkompetent. Unter die schlechten
Informationsquellen fallen bei mir das Fernsehen, Radio, Kino und die Plakate. Dies
sind alles Informationsquellen, die sehr interessengesteuert sind und bei denen der
objektive Informationsgehalt sehr niedrig ist.
Aus der Kategorisierung und der Tabelle 14.2 ergibt sich die folgende Tabelle:
qu
Gymnasiasten
Realschüler
Hauptschüler
Gesamt
gut/in % durchschnittlich/in % schlecht/in %
142/30,21
251/53,4
77/16,38
128/26,61
248/21,56*
105/21,83*
40/23,53
95/55,88*
35/20,59*
310/27,65
594/52,99
217/19,36
Gesamt
470/41,93
481/42,91
170/15,16
1121/100
Tabelle 14.4.: Ungewichtete absolute Häufigkeiten und prozentuale Anteile zu den
genutzte Informationsquellen unterschieden nach ihrer Qualität
Im Folgenden soll mit Hilfe eines χ2 -Unabhängigkeitstest folgende Hypothese analysiert werden:
H0 : Welche Informationsquellen ein Schüler der achten Klasse nutzt ist unabhängig
von seiner Schulform.
HA : Welche Informationsquellen ein Schüler der achten Klasse nutzt ist abhängig
von seiner Schulform.
14.2.1. Ungewichteter χ2 -Unabhängigkeitstest
Diese Art des χ2 -Tests wird angewandt, falls das zu behandelnde Merkmal X Mehrfachantworten zulässt. Es ist noch zu erwähnen, dass beim ungewichteten χ2 -Unabhängigkeitstest Schüler, die mehrere Informationsquellen angegeben haben, einen
101
14. Untersuchung der zweiten Theorie
größeren Einfluss auf das Testergebnis haben, als Schüler die nur eine Informationsquelle angegeben haben. Während der Wert q bei Fragen die nur Einfachantworten
zulassen, immer die Stichprobengröße repräsentiert, wird q = q u bei Fragen die
Mehrfachantworten zulassen definiert als die Anzahl der gegebenen Antworten. Für
die Durchführung meines Test ist demnach q u = 1121.
Unter der Annahme, dass sich ein Schüler informiert, ergibt sich für die ungewichteten relativen Häufigkeiten f u und die ungewichteten erwarteten Häufigkeiten eu die
folgenden Kontingenztabellen:
fu
Gymnasiasten
Realschüler
Hauptschüler
P
eu
Gymnasiasten
Realschüler
Hauptschüler
P
gut durchschnittlich
0,1267
0,2239
0,1142
0,2212
0,0357
0,0847
0,2766
0,5298
schlecht
0,0687
0,0937
0,0312
0,1936
gut durchschnittlich
0,1159
0,2222
0,1187
0,2274
0,0419
0,0804
0,2765
0,53
schlecht
0,0812
0,0831
0,0294
0,1937
P
0,4193
0,4291
0,1516
1
P
0,4193
0,4292
0,1517
1
Tabelle 14.5.: Ungewichtete relative und erwartete Häufigkeiten zu den genutzte Informationsquellen unterschieden nach ihrer Qualität
Aus den ungewichteten relativen und erwarteten Häufigkeiten f u und eu ergibt sich
für die χ2 -Prüfstatistik
3 X
3
X
(fiju − euij )2
χ = 1121
= 6, 6168.
u
e
ij
i=1 j=1
2
Zu einem Signifikanzniveau von α = 0, 05 ergibt sich für das χ2 -Quantil χ24;0,95 =
0, 7107. Nun ist χ2 = 6, 6168 > 0, 7107 = χ24;0,95 . Nach den Entscheidungsvorschriften für diesen Test wird H0 mit einer Irrtumswahrscheinlichkeit von 5% abgelehnt
und HA wird angenommen.
14.2.2. Gewichteter χ2 -Unabhängigkeitstest
Beim gewichteten χ2 -Unabhängigkeitstest wird davon ausgegangen, dass sich jeder
Schüler gleich viel informiert und somit hat jeder Schüler den gleichen Einfluss auf
das Testergebnis.
Die gewichteten absoluten, relativen und erwarteten Häufigkeiten q g , f g und eg ergeben
102
14. Untersuchung der zweiten Theorie
qg
Gymnasiasten
Realschüler
Hauptschüler
P
fg
Gymnasiasten
Realschüler
Hauptschüler
P
eg
Gymnasiasten
Realschüler
Hauptschüler
P
gut durchschnittlich schlecht
51,2190
88,6119 20,1691
41,327
80,681 26,9920
15,9333
31,8667
10,2
108,4793
201,1596 57,3611
gut durchschnittlich
0,1396
0,2414
0,1126
0,2198
0,0434
0,0868
0,2956
0,548
schlecht
0,0551
0,0735
0,0278
0,1564
gut durchschnittlich
0,1289
0,2390
0,120
0,2225
0,0467
0,0866
0,2956
0,5481
schlecht
0,0681
0,0635
0,0247
0,1563
P
160
149
58
367
P
0,4361
0,4059
0,158
1
P
0,4360
0,4060
0,1580
1
Tabelle 14.6.: Gewichtete absolute, relative und erwartete Häufigkeiten zu den genutzten Informationsquellen, unterschieden nach ihrer Qualität
Für die χ2 -Prüfstatistik ergibt sich
χ2 = 367
3 X
3
X
(fijg − egij )2
egij
i=1 j=1
= 2, 2676.
Auch mit dem gewichteten Test wird H0 abgelehnt, denn es gilt χ2 = 2, 2676 >
0, 7107 = χ24;0,95 .
Nach dem Erhalt der Testergebnisse lässt sich mit einer Irrtumswahrscheinlichkeit
von 5% sagen, dass eine Abhängigkeit zwischen den von den Schülern genutzten
Infomationsquellen und der Schulform besteht. Bei der Betrachtung der pozentualen
Werte in Tabelle 14.4 lässt sich jedoch keine eindeutige Richtung benennen, was an
den mit * markierten Werten liegt.
14.3. Wofür verwenden Schüler der achten Klasse
ihr Taschengeld?
Im Folgenden soll betrachtet werden, ob Schüler Preise vergleichen, wenn sie sich
ein bestimmtes Produkt kaufen möchten und ob sich dieses je nach Schulform unterscheidet. Anschließend soll analysiert werden, wie zielstrebig Schüler in ihrem Einkaufsverhalten sind, wenn sie ein bestimmtes Produkt kaufen möchten. Zunächst
soll jedoch betrachtet werden, für welche Produkte Schüler der achten Klasse ihr
Taschengeld verwenden. Hierzu haben die 205 befragten Mädchen und 184 Jungen
folgende Antworten gegeben.
103
14. Untersuchung der zweiten Theorie
Musik
Kino
Sport
Schminke
Kleidung
Schulsachen
Süßigkeiten
Handy
Computer
Zeitschriften
männlich
63
71
77
3
78
21
59
93
120
68
weiblich
99
100
38
118
141
31
71
122
20
123
P
162
171
115
121
219
52
130
215
140
191
Tabelle 14.7.: Wofür geben Jugendliche der achten Klasse ihr Taschengeld aus?
Die Datenverteilung der Tabelle bestätigt meine Erwartungen, dass Jungen und
Mädchen unterschiedliche Produkte erwerben. Die Tabelle zeigt, dass Mädchen ihr
Taschengeld hauptsächlich für Bekleidung, Zeitschriften und ihr Handy ausgeben,
während Jungen in erster Linie ihr Taschengeld für Computerspiele, gefolgt von Handy und Kleidung ausgeben. Des Weiteren lässt sich bestätigen, dass Jungen häufiger
ihr Geld für Sportartikel, während Mädchen ihr Geld häufiger für Schminke ausgeben. Im Allgemeinen zeigt sich, dass das Taschengeld der Jugendlichen hauptsächlich
für Kleidung, Handy und Zeitschriften ausgegeben wird. Des Weiteren wird meine
Vermutung, dass Jugendliche selten Geld für Schulsachen ausgeben, bestätigt.
Betrachtet man die von den Schülern gekauften Produkten getrennt nach Schulform75 , so zeigt sich zwischen den Schulformen und den gekauften Produkten kein besonderer Unterschied. Sowohl die Ausgaben für Kleidung, Zeitschriften, Sportartikel,
Schminke, Handy, Musik, Kino, Süßigkeiten oder PC sind zwischen den Schulformen
annähernd gleich. Der einzige etwas auffälligere Unterschied zeigt sich bei den Schulsachen. Die erhobenen Daten zeigen, dass insgesamt 9 (5,3892%) Gymnasiasten, 30
(18,75%) Realschüler und 13 (20,9677%) Hauptschüler ihre Schulsachen von ihrem
Taschengeld kaufen. Der χ2 -Unabhängigkeitstest, der dieses Ergebnis mit der Taschengeldhöhe vergleicht zeigt, dass die Schülergruppe mit dem meisten Taschengeld
ihre Schulsachen von ihrem Taschengeld selbst erwerben, während die Schülergruppe
mit dem wenigsten Taschengeld ihre Schulsachen nicht selbstständig erwerben. Der
χ2 -Test lehnt die Unabhängigkeitshypothese ab, da χ2 = 16, 2743 > 0, 1026 = χ22;0,95
11
31
und da qq1•
= 0, 05390 > qq21
= 0, 1875 > qq3•
= 0, 2097 gilt die oben beschriebene
2•
Richtung, dass Hauptschüler häufiger ihre Schulsachen selbst kaufen als Gymnasiasten.
14.4. Vergleichen Gymnasiasten häufiger Preise als
Hauptschüler Preise?
Im Folgenden ist es nun unter dem Gesichtspunkt des Verbraucherverhaltens interessant zu analysieren, wie sich die Jugendlichen verhalten, wenn sie sich ein bestimm75
Die Tabelle wird aufgrund ihrer Komplexität hier nicht dargestellt.
104
14. Untersuchung der zweiten Theorie
tes Produkt kaufen möchten und ob sich das Einkaufsverhalten je nach Schulform
unterscheidet.
Hier soll die Frage untersucht werden: Kaufen Jugendliche unabhängig vom Preis
ein Produkt im ersten Geschäft oder vergleichen sie zunächst die Produktpreise in
mehreren Geschäften? Letzteres Verhalten möchte ich wegen des Preisbewusstseins
als gutes Einkaufsverhalten definieren, während andere Verhaltensweisen als schlecht
gelten.
Bei der Betrachtung der erhobenen Daten ergibt sich folgende Tabelle. Dabei werden
die Daten für die folgenden Untersuchungen zu zwei Kategorien zusammengefasst.
Gymnasiasten
Realschüler
Hauptschüler
P
Vergleichen Preise
P
ja nein
91
75
166
82
73
155
35
27
62
208 175
383
Tabelle 14.8.: Preisvergleich in absoluten Häufigkeiten76
Hierbei ist zu erwähnen, dass 6 Schüler zu dieser Frage keine Angaben gemacht haben. Die Tabelle zeigt, dass 54,82% der Gymnasiasten, 52,9% der Realschüler und
56,45% der Hauptschüler Preise vergleichen. Hier sind die Unterschiede zwischen
den einzelnen Schulformen nicht besonders hoch. Meine anfängliche Hypothese von
69 „ Je höher die Schulform der Jugendlichen, desto wahrscheinlicher ist es, dass sich
ein Jugendlicher über ein Produkt informiert, wenn er es kaufen möchte“ wird aufgrund der vorliegenden Datenverteilung nicht geprüft. Nachdem die Abhängigkeit
der Merkmale „Schulform“ und „Preisvergleich“ gezeigt worden ist, wird die Hypothese „Hauptschüler vergleichen häufiger als Gymnasiasten und diese häufiger als
Realschüler Preise“ untersucht.
Der folgende Test soll prüft, ob die Merkmale „Preisvergleich“ und „Schulform“ voneinander abhängig sind.
14.4.1. χ2 -Unabhängigkeitstest
H0 : Die Merkmale Preisvergleich und Schulform sind unabhängig voneinander.
HA : Die Merkmale Preisvergleich und Schulform sind abhängig voneinander.
Für die Prüfstatistik ergibt sich
2
χ = 383
3 X
2
X
(fij − eij )2
eij
i=1 j=1
= 0, 2556.
(14.1)
Für das Quantil ergibt sich χ22;0,95 = 0, 1026. Demnach wird H0 zu einem Signifikanzniveau von 5% abgelehnt und die Abhängigkeitshypothese kann angenommen
76
6 Schüler ohne Angaben.
105
14. Untersuchung der zweiten Theorie
werden. Da die χ2 -Prüfstatistik jedoch recht klein ist und die Differenz zwischen
der Prüfstatistik und dem χ2 -Quantil recht klein ist, kann von einer sehr geringen
Abhängigkeit ausgegangen werden. Eine eindeutige Richtung der Abhängigkeit kann
jedoch nicht angegeben werden. Nach der Betrachtung der prozentualen Verteilung
erkennt man jedoch, dass Hauptschüler am häufigsten Preise vergleichen, gefolgt
von den Gymnasiasten und den Realschülern. Diese Werte wiederlegen direkt meine
ursprüngliche Hypothese, dass Gymnasiasten häufiger Preise vergleichen als Gymnasiasten oder Realschüler.
Der Binomialtest soll nun zeigen, dass Hauptschüler häufiger als Gymnasiasten und
Realschüler Preise vergleichen.
14.4.2. Exakter Binomialtest
Im Folgenden sollen die Hypothesen getestet werden:
1. H0 : Die Wahrscheinlichkeit, dass ein Hauptschüler Preise vergleicht, ist maximal so groß wie die Wahrscheinlichkeit, dass ein Gymnasiast Preise
vergleicht.
HA : Die Wahrscheinlichkeit, dass ein Hauptschüler Preise vergleicht, ist größer
als die Wahrscheinlichkeit, dass ein Gymnasiast Preise vergleicht.
2. H0 : Die Wahrscheinlichkeit, dass ein Hauptschüler Preise vergleicht, ist maximal so groß, wie die Wahrscheinlichkeit, dass ein Realschüler Preise
vergleicht.
HA : Die Wahrscheinlichkeit, dass ein Hauptschüler Preise vergleicht, ist größer
als die Wahrscheinlichkeit, dass ein Realschüler Preise vergleicht.
3. H0 : Die Wahrscheinlichkeit, dass ein Gymnasiast Preise vergleicht, ist maximal so groß, wie die Wahrscheinlichkeit, dass ein Realschüler Preise
vergleicht.
HA : Die Wahrscheinlichkeit, dass ein Gymnasiast Preise vergleicht, ist größer
als die Wahrscheinlichkeit, dass ein Realschüler Preise vergleicht.
Erstes Hypothesenpaar
Zunächst ist die Wahrscheinlichkeit p0 = 0, 5482 (Wahrscheinlichkeit das ein Gymnasiast Preise vergleicht) zu wählen. Somit ist zu testen:
H0 : p ≤ 0, 5482
HA : p > 0, 5482
Unter einem Signifikanzniveau von α = 0, 05 ergibt sich die kritische Schranke
bo;0,95 (0, 5482) rechnerisch wie folgt:
39 40 X
X
62
62
k
62−k
0, 5482 (1 − 0, 5482)
≤ 0, 95 <
0, 5482k (1 − 0, 5482)62−k
k
k
k=0
k=0
⇔ 0, 9211 ≤ 0, 95 < 0, 9529
106
14. Untersuchung der zweiten Theorie
Als kritische Schranke ergibt sich somit bo;0,95 (0, 5482) = 40. Nach den Entscheidungsregeln der Tabelle 8.1 wird H0 abgelehnt, falls e > bo;1−α (p0 ). Für diesen Test
gilt e = 35 < 40 = bo;0,95 (0, 5482). Daher kann die Nullhypothese nicht abgelehnt
werden. Somit lässt sich keine Aussage bzgl. der formulierten Hypothese treffen.
Erst bei einem Signifikanzniveau von α ≈ 0, 45 könnte die Nullhypothese abgelehnt
werden, dieses Signifikanzniveau ist jedoch viel zu hoch, um eine Hypothese anzunehmen.
Zweites Hypothesenpaar
Die Wahrscheinlichkeit p0 (Wahrscheinlichkeit das ein Realschüler Preise vergleicht)
wurde gewählt als p0 = 0, 5290. Demnach sind folgende Hypothesen zu testen:
H0 : p ≤ 0, 5290
HA : p > 0, 5290
Unter einem Signifikanzniveau von α = 0, 05 ergibt sich für die kritische Schranke
bo;0,95 (0, 5290) = 39. Auch hier kann die Nullhypothese nicht abgelehnt werden, da
e = 35 < 39 = bo;0,95 (0, 5290). Erst bei der viel zu hohen Irrtumswahrscheinlichkeit
von α = 0, 33 könnte die Nullhypothese abgelehnt werden.
Drittes Hypothesenpaar
Für die Wahrscheinlichkeit p0 wird ebenfalls p0 = 0, 529 gewählt. Es gelten ebenfalls
die Hypothesen
H0 : p ≤ 0, 529
HA : p > 0, 529.
Zu einem Signifikanzniveau von α = 0, 05 ergibt sich für die kritische Schranke
bo;0,95 (0, 529) = 98. Wie in den ersten beiden Fällen kann auch hier die Nullhypothese nicht abgelehnt werden, da e = 91 < 98 = bo;0,95 (0, 529). Erst bei einer
Irrtumswahrscheinlichkeit von α = 0, 34 könnte die Nullhypothese abgelehnt werden.
Demnach kann ich über meine Hypothese, die besagt dass Hauptschüler häufiger
als Gymnasiasten und diese häufiger als Realschüler Preise vergleichen, keine signifikante Aussage machen, obwohl die aus der Tabelle 14.8 berechneten prozentualen
Anteile diese Aussage vermuten lassen. Der Testausgang lässt sich damit erklären,
dass die prozentualen Anteile sehr nahe beieinander liegen.
14.5. Hat die Schulform einen Einfluss darauf, ob
ein Schüler ein zielstrebiges
Einkaufsverhalten hat?
Da der Abhängigkeitestest eine geringe Abhängigkeit des Merkmals „Preisvergleich“
und „Schulform“ gezeigt hat, vermute ich auch nur eine geringe Abhängigkeit zwischen dem Merkmal „Zielstrebigkeit“ und „Schulform“, da auch diese Merkmalskombination nach meiner Interpretation einen direkten Bezug zum Einkaufsverhalten
hat. Folgende Ergebnisse wurden aus den Daten der Schülerbefragung gewonnen.
107
14. Untersuchung der zweiten Theorie
Gymnasiasten
Realschüler
Hauptschüler
Gesamt
häufig
38
41
14
93
in %
22,75
25,62
22,58
23,91
selten in %
109 65,27
93 58,13
39 62,9
241 61,95
nie
20
26
9
55
in %
11,98
16,25
14,52
14,14
P
167
160
62
389
Tabelle 14.9.: Wie oft gehen Schüler der achten Klasse los um etwas bestimmtes zu
kaufen und kaufen dann etwas völlig anderes?
Die Tabelle zeigt auf, dass sich 23,91% der befragen Schüler häufig von äußeren Reizen beeinflussen lassen und häufig Spontankäufe tätigen. Nur insgesamt 14,14% der
befragten Schüler zeigen ein sehr zielstrebiges Einkaufsverhalten. Insgesamt 61,95%
der befragten Schüler geben zu, dass sie sich zwischendurch von äußeren Reizen beeinflussen lassen und ein völlig anderes Produkt kaufen, als sie eigentlich erwerben
wollten.
Die Tabelle zeigt jedoch, dass die prozentualen Unterschiede zwischen den einzelnen
Schulformen nicht so bedeutend groß sind. Falls eine minimale Abhängigkeit zwischen den beiden Merkmalen „Zielstrebigkeit“ und „Schulform“ bestehen sollte, ist
es jedoch nicht möglich, eine Aussage über eine Richtung zu tätigen.
Mit dem χ2 -Unabhängigkeitstest soll nun geprüft werden, ob überhaupt eine signifikante Abhängigkeit zwischen den beiden betrachteten Merkmalen besteht.
14.5.1. χ2 -Unabhängigkeitstest
H0 : Ob ein Schüler in seinem Einkaufsverhalten zielstrebig ist, ist unabhängig von
der Schulform, die der Schüler besucht.
HA : Ob ein Schüler in seinem Einkaufsverhalten zielstrebig ist, ist abhängig von
der Schulform, die der Schüler besucht.
Aus der aus Tabelle 14.9 resultierenden relativen Häufigkeit f und der erwarteten
Häufigkeit e ergibt sich folgende Prüfstatistik:
χ2 = 389
3 X
3
X
(fij − eij )2
eij
i=1 j=1
= 2, 0830.
Für das χ2 -Quantil mit 4 Freiheitsgraden zu einem Signifikanzniveau α = 0, 05 ergibt
sich χ24;0,95 = 0, 7107. Damit wird die H0 abgelehnt, da χ2 = 2, 0830 > 0, 7107 =
χ24;0,95 . Hier zeigt sich eine minimal größere Abhängigkeit zwischen den Merkmalen
„Zielstrebigkeit“ und „Schulform“ als zwischen den Merkmalen „Preisvergleich“ und
„Schulform“.
108
14. Untersuchung der zweiten Theorie
14.6. Welche siegener Bekleidungsgeschäfte sind
am beliebtesten?
Um Aussagen bezüglich der beliebtesten Geschäfte, welche Bekleidungstextilien anbieten, von Jugendlichen der achten Klasse tätigen zu können, werden die erhobenen Daten der Frage 16 des Fragebogens (siehe Anhang C) betrachtet. Hierbei
ist anzumerken, dass die Schüler die Möglichkeit hatten, mehrere Geschäfte anzukreuzen. Aus der folgenden Tabelle lässt sich entnehmen, dass bei den Mädchen
H&M, NewYorker und Pimky und bei den Jungen H&M, C&A und Kataloge zu
den beliebtesten Geschäften, in denen Bekleidung gekauft wird, zählen. Fasst man
die Anzahl der männlichen und weiblichen Antworten eines Geschäftes zusammen,
so erhält man nach Sortierung der Daten eine Rangordnung zu den beliebtesten
siegener Geschäften in denen Bekleidungstextilien gekauft werden können. Daraus
ergibt sich, dass dass beliebteste Geschäft von Jugendlichen der achten Klasse H&M,
gefolgt von C&A und NewYorker ist. Aus den insgesamt 184 männlichen und 205
weiblichen Antwortet ergab sich folgende Tabelle 77 :
Geschäfte
ESPRIT
S-Oliver
H&M
Pimky
Orsay
Karstadt
Aldi
Takko
Windsurfing
C&A
Wal Mart
Mango
Tschibo
NewYorker
Kataloge
Internet
männlich weiblich
38
76
60
70
111
153
2
114
5
82
57
34
23
12
27
40
40
18
95
109
25
12
5
49
15
24
61
131
65
63
32
14
Gesamt
114
130
264
116
87
91
35
67
58
204
37
54
39
192
128
46
Tabelle 14.10.: Die bei Jugendlichen der achten Klasse beliebtesten Geschäfte, in
denen Bekleidung gekauft werden kann
77
Die genaue Rangordnung der beliebtesten Geschäfte kann der Tabelle 14.10 durch einfaches
sortieren der Daten entnommen werden
109
14. Untersuchung der zweiten Theorie
H&M
C&A
NewYorker
S-Oliver
Kataloge
Pimky
Esprit
Karstadt
Orsay
Takko
Windsurfing
Mango
Internet
Tschibo
Wal Mart
Aldi
264
204
192
130
128
116
114
91
87
67
58
54
46
39
37
35
männlich
weiblich
Abbildung 14.1.: Siegener Geschäfte sortiert nach dem Grad ihrer Beliebtheit
14.7. Kaufen Schüler höherer Schulformen in
preisgünstigeren Geschäften?
Unter der Fragestellung des Einkaufsverhaltens und den bisherigen Testergebnissen
kommt die Frage auf, ob Schüler höherer Schulform in preisgünstigeren Geschäften einkaufen als Schüler niedrigerer Schulform. Dies lässt vermuten, wenn man
die vorhergehende Theorie bedenkt. Demnach haben Gymnasiasten ein signifikant
besseres Verhältnis zum Geld als Hauptschüler oder Realschüler. Des Weiteren erhalten Gymnasiasten tendenziell ein geringeres Taschengeld als Hauptschüler, demnach könnte man ein preisbewusstes Einkaufsverhalten vermuten, auch wenn der
χ2 -Unabhängigkeitstest bzgl. der Abhängigkeit zwischen der Schulform und Preisvergleich (siehe Gleichung (14.1)) zwar eine Abhängigkeit gezeigt, doch eine Richtung nicht bestätigt hat. Im Folgenden werden die bereits benannten Bekleidungsgeschäfte nach meinen eigenen Vorstellungen bzgl. des Preisniveaus der Geschäfte
kategorisiert und nach Schulform sortiert betrachtet.
Geschäfte
Preisniveau
niedrig
mittel
Aldi
H&M
Takko
Pimky
Wal-Mart Orsay
Tschibo
Karstadt
C&A
NewYorker
Kataloge
Internet
hoch
ESPRIT
S-Oliver
Windsurfing
Mango
Tabelle 14.11.: Siegener Bekleidungsgeschäfte nach ihrem Preisniveau sortiert
110
14. Untersuchung der zweiten Theorie
Mit dieser Kategorisierung ergibt sich die folgende nach Schulformen getrennte Verteilung:
Gymnasium
Realschule
Hauptschule
P
P
niedrig mittel hoch
150
389
149 688
162
377
159 698
70
158
48 276
382
924
356 1662
Tabelle 14.12.: Welche Geschäfte bevorzugen Schüler unterschiedlicher Schulformen?
Der ungewichtete χ2 -Unabhängigkeitstest soll bestätigen, dass ein Zusammenhang
zwischen der Schulform und dem Preisniveau der Geschäfte in denen die Schüler
ihre Kleidung kaufen, besteht.
14.7.1. Ungewichteter χ2 -Unabhängigkeitstest
H0 : Die Merkmale Schulform und Preisniveau der Bekleidungsgeschäfte sind unabhängig voneinander.
HA : Die Merkmale Schulform und Preisniveau der Bekleidungsgeschäfte sind abhängig voneinander.
Für die Prüfstatistik χ2 ergibt sich mit den relativen Häufigkeiten f und den erwarteten Häufigkeiten e folgenden Wert:
χ2 = 1662
3 X
3
X
(fiju − euij )2
= 4, 3850.
u
e
ij
i=1 j=1
Zu einem Signifikanzniveau von α = 0, 05 ergibt sich für das χ2 -Quantil χ24;0,95 =
0, 7107. Nun ist χ2 = 4, 3850 > 0, 7107 = χ24;0,95 . Nach den Entscheidungsvorschriften für diesen Test wird H0 mit einer Irrtumswahrscheinlichkeit von 5% abgelehnt
und HA wird angenommen.
Über die Richtungshypothese HA : „Je höher die Schulform, desto häufiger wird in
preisgünstigen Geschäften eingekauft“ lässt sich keine eindeutige Aussage treffen,
denn in unserem Fall gilt:
q11
q21
q31
= 21, 8023 <
23, 2092 <
= 25, 3623 (monoton steigend)
q1•
q2•
q3•
q11 q12
q21 q22
q31 q32
+
= 78, 3430 >
+
= 77, 2207 <
+
= 82, 6087 (nicht monoton)
q1• q1•
q2• q2•
q3• q3•
Ähnlich zu den Tests, welche die Abhängigkeit der Merkmale Preisvergleich bzw.
Zielstrebigkeit und Schulform testet, lässt sich auch bei dem Test im ungewichteten
Fall keine eindeutige Richtung nachweisen. Da die Wahrscheinlichkeit annähernd
gleich groß ist, dass ein Gymnasiast in Geschäften mit einem niedrigeren Preisniveau und Geschäften mit einem hohen Preisniveau einkauft, lässt sich nicht sagen,
111
14. Untersuchung der zweiten Theorie
dass Gymnasiasten häufiger in teureren als in billigeren Geschäften – oder umgekehrt – einkaufen. Analog gilt dies für die Realschule. Bei den Hauptschülern lässt
sich anhand der Daten aufzeigen, dass sie häufiger in billigeren Geschäften als in teureren Geschäften einkaufen. Bei allen Schulen lässt sich jedoch eine große Tendenz
zur Mitte aufzeigen, was bedeutet, dass Geschäfte der mittleren Preiskategorie bevorzugt werden. Der gewichtete χ2 -Unabhängigkeitstest bestätigt die Abhängigkeit.
Die Nullhypothese wird abgelehnt, denn es gilt χ2 = 2, 8144 > 0, 7107 = χ24;0,95 .
Unter der Annahme, das jeder Proband für die Auswertung gleich viel zählt (gewichteter Test), lässt sich eine Richtung ganz knapp bestimmen. Hierzu wurde folgende
Alternativhypothese geprüft: „Je höher die Schulform, desto weniger kaufen die Schüler
in Geschäften
mit einem niedrigen Preisniveau ein“. Für die gewichteten Werte
pgi1
pgi1
pgi2
und pg + pg gilt:
pg
i•
i•
i•
pg21
pg31
pg11
= 0, 2013 < g = 0, 2287 < g = 0, 3070 (monoton steigend)
pg1•
p2•
p3•
g
g
g
g
p11 p12
p21 p22
pg31 pg32
+
=
0,
7885
<
+
=
0,
8066
<
+
= 0, 8076 (monoton steigend)
pg1• pg1•
pg2• pg2•
pg3• pg3•
Die eben genannte Knappheit der Richtung ist an den fast identischen Werten
pg22
pg2•
pg31
pg3•
pg32
pg3•
pg21
pg2•
+
= 0, 8066 ≈
+
= 0, 8076 zu erkennen. Durch den knappen Testausgang
ist die Richtungsaussage vermutlich nicht signifikant, daher verliert sie erheblich an
Bedeutung. Da ich keine eindeutige Richtung im χ2 -Test bzgl. der Abhängigkeit
zwischen Schulform und Preisvergleich angeben kann (vgl. Seite 105), kann dieses
Testergebnis in die Richtung interpretieren werden, dass die Höhe der Schulform
etwas über das Qualitäts- und Markenbewusstsein der Schüler aussagt. Aus diesem
Ergebnis folgt die Aussage „Je höher die Schulform, desto höher ist das Qualitätsund Markenbewusstsein der Schüler“. Im Folgenden soll der Binomialtest zeigen,
dass Gymnasiasten seltener als Hauptschüler oder Realschüler in preisgünstigere
Geschäfte gehen.
14.7.2. Exakter Binomialtest
Für die Durchführung eines Binomialtest ist es notwendig die Tabelle 14.12 folgendermaßen zusammen zu fassen:
P
niedrig mittel bis hoch
Gymnasiasten
150
538
688
Realschüler
162
536
698
70
206
276
Hauptschüler
P
382
1280 1662
Tabelle 14.13.: Zusammenfassung von Tabelle 14.12
112
14. Untersuchung der zweiten Theorie
Für die durchzuführenden Binomialtests werden folgende Hypothesen formuliert:
1. H0 : Die Wahrscheinlichkeit, dass ein Gymnasiast in einem preisgünstigen Geschäft einkauft, ist mindestens so groß, wie die Wahrscheinlichkeit, dass
ein Realschüler in einem preisgünstigen Geschäft einkauft.
HA : Die Wahrscheinlichkeit, dass ein Gymnasiast in einem preisgünstigen Geschäft einkauft ist, kleiner als die Wahrscheinlichkeit, dass ein Realschüler
in einem preisgünstigen Geschäft einkauft.
2. H0 : Die Wahrscheinlichkeit, dass ein Gymnasiast in einem preisgünstigen Geschäft einkauft, ist mindestens so groß, wie die Wahrscheinlichkeit, dass
ein Realschüler in einem preisgünstigen Geschäft einkauft.
HA : Die Wahrscheinlichkeit, dass ein Gymnasiast in einem preisgünstigen Geschäft einkauft, ist kleiner als die Wahrscheinlichkeit, dass ein Hauptschüler in einem preisgünstigen Geschäft einkauft.
3. H0 : Die Wahrscheinlichkeit, dass ein Realschüler in einem preisgünstigen Geschäft einkauft, ist mindestens so groß, wie die Wahrscheinlichkeit, dass
ein Hauptschüler in einem preisgünstigen Geschäft einkauft.
HA : Die Wahrscheinlichkeit, dass ein Realschüler in einem preisgünstigen Geschäft einkauft, ist kleiner als die Wahrscheinlichkeit, dass ein Hauptschüler in einem preisgünstigen Geschäft einkauft.
Erstes Hypothesenpaar
Zu einer geschätzten Wahrscheinlichkeit p0 = 0, 2321 (Wahrscheinlichkeit das ein
Realschüler in einem preisgünstigem Geschäft einkauft) lauten die Hypothesen
HA : p < 0, 2321 H0 ≥ 0, 2321.
Zu einem Signifikanzniveau von α = 0, 05 ergibt sich folgende Rechnung für die
untere Schranke bu,0,05 (0, 2321):
141 X
688
k=0
k
k
0, 2321 (1 − 0, 2321)
688−k
142 X
688
≤ 0, 05 <
0, 2321k (1 − 0, 2321)688−k
k
k=0
⇔ 0, 0488 ≤ 0, 05 < 0, 0589.
Nach den Entscheidungsregeln für den exakten Binomialtest wird H0 abgelehnt, falls
e < bu,0,05 . Für den durchgeführten Test gilt e = 150 > 142 = bu,0,05 (0, 2321). Somit
kann die Nullhypothese mit einem Signifikanzniveau von 5% nicht abgelehnt werden.
Selbst zu einem Signifikanzniveau von α = 0, 1 kann die Nullhypothese noch nicht
abgelehnt werden. Das Testergebnis resultiert aus den geringen prozentualen unterschieden zwischen Gymnasiasten und Realschüler, die in preisgünstigen Geschäften
einkaufen.
113
14. Untersuchung der zweiten Theorie
Zweites Hypothesenpaar
Zu einer geschätzten Wahrscheinlichkeit p0 = 0, 2536 (Wahrscheinlichkeit das ein
Hauptschüler in einem preisgünstigem Geschäft einkauft) lauten die Hypothesen
HA : p < 0, 2536 H0 : p ≥ 0, 2536.
Analog zu der obigen Rechnung ergibt sich für die untere Schranke bu,0,05 (0, 2536) =
156. Für den Testausgang gilt e = 150 < 156 = bu,0,05 (0, 2536). Demnach kann die
Nullhypothese zu einem Signifikanzniveau von 5% abgelehnt werden und die Alternativhypothese kann angenommen werden. Daher lässt sich sagen, dass Gymnasiasten
seltener als Hauptschüler in preisgünstigen Geschäften einkaufen.
Drittes Hypothesenpaar
Wie im zweiten Hypothesenpaar ist die geschätzte Wahrscheinlichkeit p0 = 0, 2536.
Somit lauten die zu testenden Hypothesen
HA : p < 0, 2536 H0 : p ≥ 0, 2536.
Für die untere Schranke ergibt sich bu,0,05 (0, 2536) = 158. Nach den Entscheidungsvorschriften wird die Nullhypothese zu einem Signifikanzniveau von 5% nicht abgelehnt, da e = 162 > 158 = bu,0,05 (0, 2536).
14.7.3. Unterscheidet sich das Einkaufsverhalten der Schüler
je nach Schulform?
Bisher wurden die Merkmale, welche als Indikator für das Einkaufsverhalten stehen,
einzelnd in Abhängigkeit zur Schulform betrachtet. Im folgenden Test sollen all diese
Merkmale zusammen betrachtet werden, um eine Aussage über das Einkaufsverhalten von siegener Schülern der achten Klasse machen zu können.
Wie ich bereits auf Seite 70 erklärt habe, ordne ich einem Schüler, ein gutes Einkaufsverhalten zu, wenn er sich gut über ein Produkt informiert, in verschiedenen
Geschäften Preise vergleicht und in seinem Einkaufsverhalten zielstrebig ist. Analog
gilt dieses umgekehrt für ein schlechtes Einkaufsverhalten. Aus den Interpretationsregeln der Tabelle 11.2 ergibt sich nach Schulform sortiert folgende Verteilung des
Einkaufsverhaltens:
Gymnasiasten
Realschüler
Hauptschüler
P
Einkaufsverhalten
gut
in % angemessen
in % schlecht
in %
76 45,509
40 23,9521
51 30,5389
60
37,5
44
27,5
56
35
21 33,871
24 38,7097
17 27,4194
157 40,3599
108 27,7635
124 31,8766
P
167
160
62
389
Tabelle 14.14.: Das Einkaufsverhalten von Schülern der achten Klasse getrennt nach
Schulform (vgl. Abbildung 14.2)
114
14. Untersuchung der zweiten Theorie
4
0
0 gut1
30,54%
35,00%
27,42%
1
23,95%
27,50%
38,71%
2
45,51%
37,50%
33,87%
3
Gymnasiasten
Realschüler
Hauptschüler
angemessen
2
3
4schlecht
5
Abbildung 14.2.: Das Einkaufsverhalten von Schülern der achten Klasse getrennt
nach Schulform
Der folgende χ2 -Unabhängigkeitstest wird die Abhängigkeit der Variablen Schulform
und Einkaufsverhalten bestätigen.
14.7.4. χ2 - Unabhängigkeitstest
H0 : Das Einkaufsverhalten der Schüler ist nicht abhängig von der Schulform.
HA : Das Einkaufsverhalten der Schüler ist abhängig von der Schulform.
Nach der Bestimmung der Werte für f und e aus der Tabelle 14.14 erhält man für
die χ2 -Prüfstatistik zu einem Signifikanzniveau α = 0, 05
2
χ = 389
3 X
3
X
(fij − eij )2
eij
i=1 j=1
= 6, 5915.
Das χ2 -Quantil mit 4 Freiheitsgraden ergibt χ24;0,95 = 0, 7107. Nach den Entscheidungregeln für den χ2 -Unabhängigkeitstest wird H0 abgelehnt, denn χ2 = 6, 5915 >
0, 7107 = χ24;0,95 . Eine Richtung der Abhängigkeiteit lässt sich für die beiden Merki1
i2
i1
male nicht bestimmen, denn hier gilt nicht, dass die Spalten ppi•
und ppi•
+ ppi•
beide
monoton steigend oder fallend sind. Hier gilt für die Spalten 0, 4551 > 0, 3750 >
0, 3387 und 0, 6946 > 0, 650 < 0, 7258. Somit verletzt die zweite Ungleichung die
Monotoniebedingung.
14.8. Fazit zur zweiten Theorie
Es ist recht schwierig ein eindeutiges Fazit zum Einkaufsverhalten von Schülern der
achten Klasse zu ziehen, da die Testergebnisse einen Zusammenhang zwischen den
einzelnen Merkmalen gezeigt haben, jedoch eine Aussage bezüglich einer Richtung
nicht zulassen. Meine Theorie „Das Einkaufsverhalten der Jugendlichen unterscheidet sich je nach Schulform“ lässt anhand eines χ2 - Unabhängigkeitstests bestätigen,
doch eine Aussage über die Richtung, wie in der ersten Theorie, ist ausgeschlossen.
Daher lässt sich meine Vermutung „Je höher die Schulform, desto besser ist das
Einkaufsverhalten der Schüler“ nicht signifikant bestätigen.
115
14. Untersuchung der zweiten Theorie
Die durchgeführten Test haben zunächst gezeigt, wofür Schüler der achten Klasse bevorzugt ihr Taschengeld verwenden. Hier hat sich gezeigt, dass Mädchen ihr
Taschengeld hauptsächlich für neue Kleidung ausgeben, während Jungen ihr Taschengeld in der Regel am häufigsten für Computerspiele ausgeben. Die Betrachtung der von den Schülern gekauften Produkten, getrennt nach der Schulform hat
keinen besonderen Unterschied gezeigt. Dieses bringt zum Ausdruck, dass Schüler
von Gymnasien, Realschulen oder Hauptschulen im gleichen Verhältnis Produkte wie
Kleidung, Computerspiele, Musik, Schminke usw. erwerben. Ein signifikanter unterschied zeigte sich im Einkauf von Schulsachen. Hier hat der χ2 -Unabhängigkeitstest
und deren Richtungstest gezeigt, dass mehr Hauptschüler ihre Schulsachen von ihrem Taschengeld kaufen müssen als Realschüler oder Gymnasiasten. Hiermit lässt
sich dann bestätigen, dass die Taschengeldhöhe einen Einfluss darauf hat, ob ein
Schüler seine Schulsachen selber kaufen muss oder nicht. Die Schülergruppe, welche das höchste Taschengeld erhält (Hauptschüler) muss häufiger ihr Taschengeld
für Schulsachen aufwenden, als die Schülergruppe mit dem geringsten Taschengeld
(Gymnasiasten).
Bei der Betrachtung des Einkaufsverhaltens ist es notwendig, dreierlei zu analysieren. Zum ersten das Informationsverhalten der Schüler, dann ob ein Schüler Preise
vergleicht, wenn er sich ein bestimmtes Produkt kauft und als drittes die Zielstrebigkeit im Einkaufsverhalten.
Die Betrachtung des Informationsverhaltens zeigte, dass sich fast alle Schüler informieren wenn sie sich ein bestimmtes Produkt kaufen. Hier haben meine Daten
ergeben, dass sich 97% der Gymnasiasten, 93% der Realschüler und 96% der Hauptschüler sich über ein Produkt informieren, bevor sie es kaufen möchten. Eine Richtung bzgl. der Höhe der Schulform und des Informationsverhaltens ließ sich jedoch
nicht angeben. Auch die Betrachtung der Qualität der genutzten Informationsquellen ließ keine Aussage bezüglich der Richtung zu.
Die Analyse der Merkmale „Preisvergleich“ und „Schulform“ bestätigte die Abhängigkeit des Merkmals „Preisvergleich“ von der Schulform signifikant. Die Datenbetrachtung hat meine anfängliche Hypothese „Je höher die Schulform der Jugendlichen, desto wahrscheinlicher ist es, dass sich ein Jugendlicher über ein Produkt
informiert bevor er es kauft“ widerlegt, da sich zeigte, dass 54,82% der Gymnasiasten, 52,90% der Realschüler und 56,45% der Hauptschüler Preise vergleichen.
Aber auch die Hypothese „Die Wahrscheinlichkeit, dass ein Hauptschüler Preise vergleicht ist größer als die Wahrscheinlichkeit dass ein Gymnasiast oder ein Realschüler
Preise vergleicht“ konnte nicht zu einem angemessenen Signifikanzniveau bestätigt
werden.
Neben dem Merkmal „Preisvergleich“ konnte betrachtet werden, welche die beliebtesten Bekleidungsgeschäfte in Siegen sind und welche Schüler eher in preisgünstigeren
Geschäften einkaufen. Hierzu zeigte sich, dass H&M, C&A und NewYorker die beliebtesten siegener Bekleidungsgeschäfte sind. Diesen Geschäften wurde ein mittleres
bis niedriges Preisniveau zugeordnet. Die Betrachtung des Merkmals „Preisniveau
der Geschäfte“ zum Merkmal „Schulform“ ergab eine Abhängigkeit. Eine Aussage
bzgl. der Richtung ist jedoch kaum möglich. Auch wenn der gewichtete Test eine
knappe Richtung bestätigte, wird diese wegen der Knappheit als nicht signifikant
angenommen. Die Durchführung eines Binomialtest lässt jedoch zumindest die Aussage zu, dass ein Gymnasiast seltener als ein Hauptschüler in einem preisgünstigem
116
14. Untersuchung der zweiten Theorie
Geschäft einkauft. Dieses Ergebnis kann so interpretiert werden, dass Gymnasiasten
ein höheres Qualitätsbewusstsein besitzen als Hauptschüler.
Das Testen der Merkmale „Zielstrebigkeit“ und „Schulform“ hat die Abhängigkeit
dieser Merkmale bestätigt. Ähnlich wie im Test bzgl. des Preisvergleichs ließ sich
auch hier keine Richtung zuordnen. Demnach lässt sich nicht sagen, dass Gymnasiasten ein zielstrebigeres Verhalten haben als Hauptschüler oder Realschüler. Die
Datenbetrachtung hierzu zeigte sogar, dass Gymnasiasten und Hauptschüler ein fast
identisches Verhalten haben. Da die einzelnen Tests keine Richtung aufzeigen, verwundert es nicht, dass der in Abschnitt 14.7.3 dargestellte zusammenfassende Test
ebenfalls keine Richtung aufweist.
117
15. Untersuchung der dritten
Theorie
In diesem Kapitel soll nun meine dritte Theorie „Das Fernsehkonsumverhalten unterscheidet sich je nach Schulform.“, welche ab Seite 71 beschrieben ist, untersucht
werden. Hierbei soll zunächst betrachtet werden, wie lange die Jugendlichen täglich
Fernsehen schauen. Im Anschluss daran soll analysiert werden, zu welchen Uhrzeiten
bzw. Tageszeiten am meisten Fernsehen geschaut wird und zum Abschluss soll betrachtet werden, wie viele Werbeminuten auf die Jugendlichen täglich einwirken.
15.1. Unterscheidet sich die tägliche
Fernsehnutzungsdauer der Jugendlichen je
nach Schulform?
Um das Fernsehkonsumverhalten von Jugendlichen der achten Klasse zu untersuchen, ist es notwendig, die tägliche Fernsehnutzungsdauer dieser zu betrachten.
Hierzu liegt nach der Untersuchung folgende Datenverteilung vor:
Gymnasiasten
Realschüler
Hauptschüler
P
Fernsehnutzungsdauer in Stunden
0–1
1–2
2–3
3–5
5
27
62
42
28
5
14
40
45
41
17
5
12
22
14
9
46
114
109
83
31
P
164
157
62
383
Tabelle 15.1.: Fernsehnutzungsdauer der Jugendlichen in Stunden78
Wenn man die durchschnittliche Fernsehnutzungsdauer jeder Spalte bestimmt und
die letzte Spalte > 5 mit 5 Stunden bewertet, lässt sich der Mittelwert für die Fernsehnutzungsdauer aller Schüler mit Hilfe eines erwartungstreuen und konsistenten
Schätzers (siehe Beispiel 29) bestimmen. Für die durchschnittliche Fernsehnutzungsdauer ergibt sich demnach:
383
1 X
Xi = 2, 4896 h.
383 i=1
78
6 Personen ohne Angabe.
118
15. Untersuchung der dritten Theorie
Da der Punktschätzer jedoch keine Information darüber liefert, wo der tatsächliche
Wert der Fernsehnutzungsdauer der Schüler, liegt wird im Folgenden mit der Intervallschätzung ein Intervall bestimmt, in dem die tatsächliche Fernsehnutzungsdauer
mit einer vorgegebenen Wahrscheinlichkeit liegt.
T̂383 (X1 , X2 , . . . , X383 ) = 2, 4896
v
u
383
u 1 X
t
σ̂ =
(Xi − T̂383 (X1 , X2 , . . . , X383 ))2 = 1, 3330.
382 i=1
Zu einem Signifikanzniveau von α = 0, 05 ergibt sich das folgende Intervall
1, 3330
1, 3330
2, 4896 − √
· 1, 9600; 2, 4896 + √
· 1, 9600 = [2, 3561; 2, 6231]
383
383
Analog ergibt sich der Mittelwert und das 0,95-Konfidenzintervall für die Fernsehnutzungsdauer der Schüler verschiedener Schulformen:
164
Gymnasiasten:
1 X
Xi = 2, 1250 h [u; o] = [1, 9388; 2, 3112]
164 i=1
157
Realschüler:
1 X
Xi = 2, 7293 h [u; o] = [2, 5174; 2, 9412]
157 i=1
62
Hauptschüler:
1 X
Xi = 2, 8468 h
62 i=1
[u; o] = [2, 5090; 3, 1846]
Den Ergebnissen lässt sich entnehmen, dass Hauptschüler durchschnittlich am längsten und Gymnasiasten durchschnittlich am wenigsten Fernsehen schauen. Der Gesamtdurchschnitt der Fernsehnutzungsdauer beträgt 2,4896 Stunden täglich.
15.1.1. χ2 -Unabhängigkeitstest
Der folgende Test soll die Abhängigkeit der Merkmale „Fernsehnutzungsdauer“ und
„Schulform“ prüfen. Anschließend prüft der Richtungstest die Hypothese „Je höher
die Schulform der Jugendliche, desto geringer ist die Fernsehnutzungsdauer dieser“.
Die Hypothesen für den χ2 -Unabhängigkeitstest lauten:
H0 : Die Fernsehnutzungsdauer der Jugendlichen ist unabhängig von der Schulform.
HA : Die Fernsehnutzungsdauer der Jugendlichen ist abhängig von der Schulform.
Mit den relativen Häufigkeiten f und den erwarteten Häufigkeiten e, die sich aus
Tabelle 15.1 errechnet lassen ergibt sich für die χ2 -Prüfstatistik und für das Quantil
χ28;0,95 zu einem Signifikanzniveau von α = 0, 05
χ2 = 25, 9164,
χ28;0,95 = 2, 7326.
119
15. Untersuchung der dritten Theorie
Somit ergibt sich χ2 = 25, 9164 > 2, 7326 = χ28;0,95 und die Nullhypothese kann mit
einer Irrtumswahrscheinlichkeit von 5% abglehnt werden. Damit gilt die Abhängigkeit der beiden Merkmale.
Für den Richtungstest wird folgende Alternativhypothese formuliert „Je höher die
Schulform, desto geringer ist die Fernsehnutzungsdauer.“
Hierzu ergibt sich aus der Tabelle 15.1 die folgende Tabelle:
Gymnasiasten
Realschüler
Hauptschüler
P1
qij
j=1 qi•
0,1646
0,0892
0,0806
P2
qij
j=1 qi•
0,5427
0,3439
0,2742
P3
qij
j=1 qi•
0,7988
0,6306
0,6290
P4
qij
j=1 qi•
0,9695
0,8917
0,8548
Tabelle 15.2.: Richtungstest
Da alle Spalten monoton fallend sind, kann eine eindeutige Richtung angenommen
werden. Somit wird die Alternativhypothese angenommen.
15.2. Unterscheiden sich die Uhrzeiten, zu denen
Jugendliche Fernsehen schauen je nach
Schulform?
Hierzu sollen zunächst die genauen Fernsehnutzungsuhrzeiten am Wochenende und
in der Arbeitswoche betrachtet werden.
Gym.
Real.
Haupt.
P
Gym.
Real.
Haupt.
P
vor 6
2
9
3
14
6–8
4
8
3
15
Fernsehnutzungszeiten von Montag bis Freitag
8–10 10–12 12–14 14–16 16–18 18–20 nach 20
3
0
8
47
47
97
123
3
3
26
59
63
104
112
0
1
7
38
19
31
34
6
4
41
144
129
232
269
P
331
387
136
854
Tabelle 15.3.: Fernsehnutzungszeiten von Montags bis Freitags
vor 6
5
8
5
18
6–8
6
8
2
16
Fernsehnutzungszeiten am Wochenende
8–10 10–12 12–14 14–16 16–18 18-20
17
27
22
22
31
80
28
47
31
39
46
94
6
17
12
17
20
28
51
91
65
78
97
202
nach 20
152
135
43
330
P
362
436
150
948
Tabelle 15.4.: Fernsehnutzungszeiten am Wochenende
Im Allgemeinen lässt sich erkennen, dass sowohl an Arbeitstagen als auch am Wochenende eine Tendenz zu späteren Fernsehnutzungsuhrzeiten besteht.
120
15. Untersuchung der dritten Theorie
Der Tabelle lässt sich entnehmen, dass innerhalb der Woche relativ wenige Schüler
vormittags (zwischen vor 6–14Uhr) Fernsehen schauen. Dieses liegt daran, dass zu
diesen Uhrzeiten in der Regel alle Schüler in der Schule sind. Dass dennoch zu den
Uhrzeiten ein paar Werte zu verzeichnen sind, liegt daran, dass die Befragung relativ
kurz nach den Ferien durchgeführt wurde und somit von den Schülern auch das Vormittagsprogramm in Anspruch genommen wurde. Am Wochenende zeigt sich, dass
weniger Schüler das Nachmittagsprogramm nutzen als innerhalb der Woche. Dies
könnte daran liegen, dass Schüler am Wochenende häufig anderen Beschäftigungen
(z. B. Hobbys, Freunde treffen) nachgehen.
Im Folgenden werden nun die genannten Uhrzeiten klassifiziert. Hierbei werden die
Uhrzeiten von vor 6 bis 12 Uhr in die Klassen vormittags, die Zeiten ab 12 bis 18
Uhr in nachmittags und die Zeiten ab 18 Uhr in abends eingeteilt. Dazu ergeben
sich folgende gewichtete Tabellen:
Gymnasiasten
Realschüler
Hauptschüler
P
vormittags
4,33
9,67
3,83
17,83
Montag - Freitag
nachmittags abends
47,33 109,33
52,17
96,17
24,33
32,83
123,83 238,33
P
161
158
61
380
Tabelle 15.5.: Gewichtete Klassifizierung der Fernsehnutzungszeiten von Montag bis
Freitag79
Gymnasiasten
Realschüler
Hauptschüler
P
vormittags
20,33
29,17
12
61,4999
Wochenende
nachmittags
abends
22,33
121,33
30,5
92,17
15,5
31,5
68,3333 244,9999
P
164
151,83
59
374,8332
Tabelle 15.6.: Gewichtete Klassifizierung der Fernsehnutzungszeiten am Wochenende80
Die genannten fehlenden Daten können in vielen Fällen daher resultieren, dass manche Schüler während der Woche oder am Wochenende kein Fernsehen schauen. Der
Vergleich dieser beiden Tabellen zeigt, dass während der Woche seltener vormittags Fernsehen geschaut wird, während am Wochenende das Fernsehen von einigen
Schülern auch vormittags genutzt wird.
15.2.1. Gewichteter χ2 -Unabhängigkeitstest
Die folgenden gewichteten χ2 - Unabhängigkeitstests mit ihrem Richtungstest testen
die Hypothese:
79
80
9 Personen ohne Angaben.
14 Personen ohne Angaben.
121
15. Untersuchung der dritten Theorie
H0 : Die Tageszeiten, zu denen Jugendliche Fernsehen schauen, sind sowohl während der Arbeitswoche als auch am Wochenende unabhängig von der Schulform.
HA : Die Tageszeiten, zu denen Jugendliche Fernsehen schauen, sind sowohl während der Arbeitswoche als auch am Wochenende abhängig von der Schulform.
Im Folgenden soll der gewichtete Unabhängigkeitstest durchgeführt werden, da hier
eine Frage untersucht wird, die Mehrfachantworten zulässt, ist es für die Auswertung
wichtig, dass jeder Schüler den gleichen Einfluss auf das Testergebnis hat, demnach
hat ein Schüler, der drei oder zwei Antwortalternativen angegeben hat den gleichen Einfluss auf das Testergebnis als ein Schüler, der nur eine Antwortalternative
ausgewählt hat.
Für die χ2 -Prüfstatistik bzgl. der Tageszeiten während der Arbeitswoche (vgl. Tabelle 15.5) und das Quantil χ24;0,95 zu einem Signifikanzniveau von α = 0, 05 mit 4
Freiheitsgraden ergibt sich
χ2 = 5, 4439,
χ24;0,95 = 0, 7107.
Für die χ2 -Prüfstatistik bzgl. der Tageszeiten am Wochenende (vgl. Tabelle 15.6)
und das Quantil χ24;0,95 zu einem Signifikanzniveau von α = 0, 05 mit 4 Freiheitsgraden ergibt sich
χ2 = 10, 8460, χ24;0,95 = 0, 7107.
Demnach werden in beiden Fällen die Unabhängigkeitshypothesen H0 abgelehnt.
Denn es gilt im ersten Fall χ2 = 5, 4439 > 0, 7107 = χ24;0,95 und im zweiten Fall
χ2 = 10, 8460 > 0, 7107 = χ24;0,95 . Daher wird HA zu einer Irrtumswahrscheinlichkeit
von 5% angenommen.
Für die folgenden Richtungstests wird nachstehende Alternativhypothese formuliert:
HA : Je höher die Schulform, desto weniger Schüler schauen vormittags Fernsehen.
Um diese Hypothese bestätigen zu können muss nach den Entscheidungsregeln folgende Monotonie gelten:
q11
q21
q31
<
<
q1•
q2•
q3•
und
q11 q12
q21 q22
q31 q32
+
<
+
<
+
.
q1• q1•
q2• q2•
q3• q3•
Für den ersten Fall, die Tageszeiten während der Arbeitswoche, gilt
2, 6913 < 6, 1177 < 6, 2841 und 32, 0907 < 39, 1345 < 46, 1743.
Für den zweiten Fall, die Tageszeiten am Wochenende, gilt
12, 3982 < 19, 1886 < 20, 3390 und 26, 0159 < 39, 2544 < 46, 6102.
In beiden Fällen sind jeweils die Folge der Werten, der beide Ungleichungketten,
monoton steigend. Daher kann die Alternativhypothese angenommen werden. Demnach gilt, sowohl während der Arbeitswoche als auch am Wochenende die Richtung,
122
15. Untersuchung der dritten Theorie
je höher die Schulform, desto weniger Schüler schauen vormittags Fernsehen. Daher gilt umgekehrt: Je höher die Schulform, desto mehr Schüler schauen abends
Fernsehen.
Beim Auszählen der Daten ist mir aufgefallen, dass einige Schüler sowohl am Wochenende als auch während der Arbeitswoche gesagt haben, dass sie sowohl vormittags, nachmittags als auch abends Fernsehen schauen.
15.3. Schauen Schüler höherer Schulformen
häufiger öffentlich-rechtliche Fernsehsender
als Schüler niedrigerer Schulformen?
Bei der Betrachtung der von Jugendlichen geschauten Fernsehsender fällt besonders auf, dass die öffentlich-rechtliche Sender nur selten von ihnen geschaut werden. Es werden hauptsächlich die privaten Sender geschaut. Bei diesen werden von
den Jugendlichen hauptsächlich die Sender RTL, Pro7 und SAT1 und die Musiksender VIVA und MTV bevorzugt. Im Folgenden wird nun mit Hilfe eines χ2 Unabhängigkeitstest und dem Richtungstest geprüft, ob mehr Schüler einer höheren
Schulform die öffentlich-rechtlichen Fernsehsender nutzen als Schüler einer niedrigen
Schulform.
15.3.1. χ2 -Unabhängigkeitstest
Die Abhängigkteits- und Unabhängigkeitshypothesen wurden formuliert als:
H0 : Ob ein Schüler die öffentlich-rechtlichen Fernsehsender nutzt ist unabhängig
von der Schulform des Schülers.
HA : Ob ein Schüler die öffentlich-rechtlichen Fernsehsender nutzt ist abhängig von
der Schulform des Schüler.
Folgende Datenverteilung ergab die Schülerbefragung:
Gymnasiasten
Realschüler
Hauptschüler
P
Fernsehsender
öffentlich-rechtliche private
17
146
15
142
2
60
34
348
P
163
157
62
382
Tabelle 15.7.: Anzahl der Schüler, die die öffentlich-rechtlichen Fernsehsender nutzen81
81
7 Personen ohne Angaben.
123
15. Untersuchung der dritten Theorie
Die Berechnung der χ2 -Prüfstatistik und des χ2 -Quantils χ22;0,95 zu einem Signifikanzniveau α = 0, 05 ergibt
χ2 = 3, 0150 χ22;0,95 = 0, 1026.
Da χ2 = 3, 0150 > 0, 1026 = 0, 1026 kann H0 zu einem Signifikanzniveau von 5% abgelehnt werden. Die Abhängigkeit der beiden Merkmale wird daher angenommen.
Die Alternativhypothese für den Richtungstest wird formuliert als:
HA : Je höher die Schulform, desto mehr Schüler nutzen die öffentlich-rechtlichen
Fernsehsender.
i1
Sind die Werte qqi•
mit i = 1, 2, 3, welche aus Tabelle 15.7 berechnet werden können
i2
mit i1 , 2, 3 automatisch monoton steigend,
monoton fallen und somit die Werte qqi•
i1
wird die formulierte Alternativhypothese bestätigt. Die Berechnung der Werte qqi•
qi2
und qi• ergibt:
10, 4294 > 9, 5541 > 3, 2238 monoton fallend
89, 5706 > 90, 4459 > 96, 7742 monoton steigend.
Somit kann HA angenommen werden.
15.4. Sind Schüler einer höheren Schulform täglich
weniger Werbeminuten ausgesetzt als
Schüler einer niedrigeren Schulform?
Da sich gezeigt hat, das Schüler einer höheren Schulform täglich weniger Fernsehen
schauen als Schüler einer niedrigere Schulform und da sich gezeigt hat, dass die Höhe
der Schulform einen Einfluss darauf hat, ob Schüler die öffentlich-rechtlichen Fernsehsender nutzen, vermute ich, dass Schüler einer höheren Schulform täglich weniger
Werbeminuten ausgesetzt sind als Schüler einer niedrigeren Schulform. Um die Werbeminuten, denen die Jugendlichen täglich ausgesetzt sind, berechnen zu können,
ist es zunächst notwendig, herauszufinden, wie viele Minuten die einzelnen Fernsehsender täglich ausstrahlen. Informationen darüber konnten jedoch nicht gefunden
werden. Der Rundfunkstaatsvertrag82 besagt jedoch, dass die öffentlich-rechtlichen
Fernsehsender nur von Montag bis Samstag von 17–20 Uhr Werbung ausstrahlen
dürfen. Des Weiteren besagt der Vertrag, dass diese Sender täglich nicht mehr als 20
Minuten ausstrahlen dürfen. Den privaten Fersehsendern dagegen ist es laut Vertrag
erlaubt 12 Minuten Werbung pro Stunde auszustrahlen. Mit Hilfe dieser Angaben,
der von den Schüler genutzten Fernsehprogramme und die täglichen durchschnittlichen Fernsehnutzungsdauer wurden die ungefähren Werbeminuten, die ein Schüler
täglich aufnimmt, berechnet. Daher wird den öffentlich-rechtlichen Fernsehsendern
20/24 = 0, 8333 Werbeminuten pro Stunde und den privaten Fernsehsendern 12
Werbeminuten pro Stunde zugeordnet. Hat ein Schüler z. B. angegeben, dass er täglich 2–3 Stunden, am Liebsten die Programme RTL, VIVA und ARD schaut, wurden
82
LKF – Landesanstalt für Kommunikation Baden-Würtemberg (1991).
124
15. Untersuchung der dritten Theorie
die durchschnittlichen Werbeminuten wie folgt berechnet:
2 · 12 min + 1 · 0, 8333 min
· 2, 5 = 20, 6944 min
3
Nachdem eine solche Rechnung für jeden einzelnen Schüler durchgeführt wurde, wird
der Mittelwert der von den Schülern täglich aufgenommenen Werbeminuten mittels
eines erwartungstreuen und konstisten Schätzer (siehe Beispiel 29) bestimmt. Hierbei
ergab sich für den geschätzten Mittelwert:
383
1 X
Xi = 29, 4507.
383 i=1
Da im Folgenden die Werbeminuten von Schülern unterschiedlicher Schulformen
verglichen werden, ist es notwendig, die Mittelwerte der auf die Schüler täglich einwirkenden Werbeminuten für jede einzelne Schulform zu berechnen.
163
Gymnasiasten:
1 X
Xi = 25, 4177
163 i=1
157
Realschüler:
1 X
Xi = 32, 5366
157 i=1
157
Hauptschüler:
1 X
Xi = 32, 3044
62 i=1
Da der Punktschätzer jedoch keine Information darüber liefert, wo der tatsächliche
Wert für die von den Schülern konsumierten Werbeminuten liegt wird im Folgenden
mit der Intervallschätzung ein Intervall bestimmt, in dem die tatsächlich konsumierten Werbeminuten mit einer vorgegebenen Wahrscheinlichkeit liegen.
Das 0,95-Konfidenzintervall für den Mittelwert der konsumierten Werbeminuten aller Schüler ergibt sich nach Gleichung (7.2) wie folgt:
T̂383 (X1 , X2 , . . . , X383 ) = 29, 4507,
v
u
383
u 1 X
t
σ̂ =
(Xi − T̂n (X1 , X2 , . . . , X383 ))2 = 15, 7553.
382 i=1
Zu einem Signifikanzniveau von α = 0, 05 ergibt sich das folgende Intervall
15, 7553
15, 7553
29, 4507 − √
· 1, 9600; 29, 4507 + √
· 1, 9600 = [27, 8728; 31, 0286]
383
383
Analog ergeben sich die 0,95-Konfidenzintervalle zu den von den Schülern konsu-
125
15. Untersuchung der dritten Theorie
mierten Werbeminuten für die unterschiedlichen Schulformen:
Gymnasiasten: [23, 1140; 27, 7214]
Realschüler:
[26, 8736; 38, 1996]
Hauptschüler: [28, 4196; 36, 1892]
Dem Punktschätzer zu Folge konsumieren Gymnasiasten täglich 25,4177 Minuten,
Realschüler 32,5366 Minuten und Hauptschüler 32,3044 Minuten Werbung. Demnach lässt sich sagen, dass Gymnasiasten täglich weniger Werbeminuten ausgesetzt
sind als Realschüler oder Hauptschüler. Eine Aussage bzgl. der Realschüler und
Hauptschüler ist meiner Meinung nach nicht möglich, da die durchschnittlichen Werbeminuten beider Schularten annähernd gleich sind.
15.5. Haben Schüler einer höheren Schulform ein
besseres Fernsehnutzungsverhalten als
Schüler einer niedrigeren Schulform?
Nach dem sich die vorhergehenden Hypothesen signifikant bestätigt haben, stellt
sich zum Abschluss der Theorie die Frage, ob Schüler einer höheren Schulform ein
besseres Fernsehnutzungsverhalten haben, als Schüler einer niedrigen Schulform. Mit
Hilfe der Interpretationsregeln, welche in Tabelle 11.3 formuliert wurden, wird im
Folgenden dargestellt, wie viele Schüler jeder Schulform ein gutes, durchschnittliches
und schlechtes Fernsehnutzungsverhalten haben.
Gymnasiasten
Realschüler
Hauptschüler
P
Fernsehnutzungsverhalten
gut durchschnittlich schlecht
31
75
55
18
59
79
5
24
33
54
158
167
P
161
156
62
379
34,16%
50,64%
53,23%
46,58%
37,82%
38,71%
6
5
4
3
2
1
0
19,25%
11,54%
8,06%
Tabelle 15.8.: Fernsehnutzungsverhalten von Schülern der achten Klasse83 (vgl. Abbildung 15.1)
Gymnasiasten
Realschüler
Hauptschüler
gut durchschnittl. schlecht
0
1
2
3
4
5
Abbildung 15.1.: Fernsehnutzungsverhalten von Schülern der achten Klasse
83
10 Personen ohne Angaben.
126
15. Untersuchung der dritten Theorie
Die Datenverteilung zeigt, dass 14,25% der befragen Schüler ein gutes, 41,69% ein
durchschnittliches und 44,06% ein schlechtes Fernsehnutzungsverhalten haben.
15.5.1. χ2 -Unabhängigkeitstest
Da sich beim Testen der Theorie gezeigt hat, dass Schüler einer höheren Schulform
eine geringere Fernsehnutzungsdauer haben, seltener als Schüler anderer Schulformen vormittags Fernsehen schauen, häufiger als Schüler anderer Schulformen die
öffentlich-rechtlichen Fernsehsender nutzen und dementsprechend täglich weniger
Werbeminuten konsumieren, wird folgende Hypothese aufgestellt:
HA : Je höher die Schulform, desto besser ist das Fernsehnutzungsverhalten der
Schüler.
Um eine Aussage bzgl. dieser Hypothese tätigen zu können ist es zunächst notwendig, eine Abhängigkeit zwischen den Merkmalen „Fernsehnutzungsverhalten“ und
„Schulform“ festzustellen. Die Berechnung der χ2 -Prüfstatistik und des χ2 -Quantils
ergaben die Werte
χ2 = 13, 2129, χ24;0,95 = 0, 7107.
Nach den Entscheidungsregeln wird hier die Unabhängigkeit mit einem Signifikanzniveau von 5% abgelehnt. Nachdem die Abhängigkeit gezeigt ist, kann der Richtungstest durchgeführt werden. Um eine Aussage bzgl. der Richtung treffen zu können
wird nachstehenden Tabelle aufgestellt.
Gymnasium
Realschule
Hauptschule
qi1
qi•
0,1925
0,1154
0,0806
qi1 qi2
+
qi• qi•
0,6584
0,4936
0,4677
Tabelle 15.9.: Richtungstest zum Fernsehnutzungsverhalten
Da beide Spalten monoton fallend sind, kann nach den formulierten Entscheidungsregeln (9.6) die Hypothese: „Je höher die Schulform, desto besser ist das Fernsehnutzungsverhalten“ angenommen werden.
15.6. Fazit zur dritten Theorie
Die Untersuchung der dritten Theorie hat eindeutig gezeigt, dass Schüler einer höheren Schulform ein besseres Fernsehnutzungsverhalten haben als Schüler einer niedrigeren Schulform haben. Insgesamt lässt sich sagen, dass von den befragten Schülern
nur 14,25% ein gutes und 41,69% ein durchschnittliches Fernsehkonsumverhalten
haben, dementsprechend haben 44,06% aller befragten Schüler ein schlechtes Fersehkonsumverhalten (vgl. Abbildung 15.2). Durchschnittliche schauen die Schüler
täglich 2,4896 Stunden Fernsehen84 . Wenn man diese Daten nach Schulformen getrennt betrachtet zeigt sich, dass 19,25% der befragten Gymnasiasten, 11,54% der
84
Fast identlisch Ergebnisse lassen sich in einer Untersuchung von Fischer (2000) S. 30ff bestätigen.
127
15. Untersuchung der dritten Theorie
Realschüler und nur 8,65% der Hauptschüler ein gutes Fernsehnutzungverhalten haben. Demgegenüber haben 34,16% der Gymnasiasten, 50,64% der Realschüler und
53,23% ein schlechtes Fernsehnutzungsverhalten. Der hohe Anteil an Schülern mit
einem schlechten Fernsehnutzungsverhalten resultiert aus der hohen Gewichtung des
Merkmals „Fernsehnutzngsdauer“ bei den Interpretationsregeln. Dennoch halte ich
diese Gewichtung für sinnvoll, da ich davon ausgehe, dass ein Schüler mit einer hohen Fernsehnutzungsdauer auch ein schlechteres Fernsehkonsumverhalten hat. Bei
der Betrachtung der Fernsehnutzngdauer hat sich gezeigt, dass Gymnasiasten im
Durchschnitt täglich 2,1250 Stunden, Realschüler 2,7293 Stunden und Hauptschüler
2,8468 Stunden Fernsehen schauen. Betrachtet man zusätzlich noch die Fersehsender, welche Jugendliche der achten Klasse bevorzugt schauen, fällt auf, dass nur
sehr wenige Schüler85 die öffentlich-rechtlichen Fernsehsender nutzen. Hierbei haben
meine Tests gezeigt, dass häufiger Schüler einer höheren Schulform die öffentlichrechtlichen Sender schauen, als Schüler einer niedrigeren Schulform. Die Ergebnisse
bzgl. der Fernsehnutzungdauer und der von Schülern bevorzugten Fernsehsender
führten zu dem Ergebnis, dass Gymnasiasten täglich weniger Werbeminuten konsumieren als Realschüler oder Hauptschüler.
41,69%
14,25%
44,06%
gutes Fernsehkonsumverhalten
durchschnittliches Fernsehkonsumverhalten
schlechtes Fernsehkonsumverhalten
Abbildung 15.2.: Das Fernsehkonsumverhalten der Schüler
85
Insgesamt nur 34 Schüler (8,38%)
128
16. Resumee
Die Auswertung der empirischen Untersuchung „Das Verbraucherverhalten von Jugendlichen der achten Klasse“, an der insgesamt 389 siegener Schülerinnen und Schüler verschiedener Schulformen teilnahmen, wurde unter dem Gesichtspunkt, ob das
Verbraucherverhalten von Jugendlichen schulformspezifisch ist, betrachtet. Da ich
vermute, dass sich das individuelle Verbraucherverhalten unter anderem konstituiert durch das Verhältnis zum Geld, das Einkaufsverhalten und das Medienverhalten
wurden im Wesentlichen folgende drei Theorien untersucht:
1. Das Verhältnis der Jugendlichen zum Geld unterscheidet sich je nach Schulform.
2. Das Einkaufsverhalten der Jugendlichen unterscheidet sich je nach Schulform.
3. Das Fernsehkonsumverhalten unterscheidet sich je nach Schulform.
Die Untersuchung der ersten Theorie zeigte, dass Schüler einer höheren Schulform
ein besseres Verhältnis zum Geld haben, als Schüler einer niedrigeren Schulform.
Obwohl die Taschengeldhöhe mit steigender Schulform abnimmt, leihen sich Schüler
höherer Schulformen seltener Geld und sparen regelmäßiger. Jedoch haben insgesamt
nur 6,43% der befragten Schüler ein gutes Verhältnis zum Geld, 44,73% hingegen
ein schlechtes.
Die Auswertung der zweiten Theorie zeigte, dass sich das Einkaufsverhalten der
Schüler je nach Schulform unterscheidet. Jedoch lässt sich keine Aussage über eine
Richtung treffen. Es stellte sich heraus, dass sich fast alle Schüler über ein Produkt
informieren, wenn sie es kaufen möchten. Dabei verwenden fast 30% der Schüler
mehrheitlich gute Informationsquellen, auf interessengesteuerte Quellen stützen sich
nur 15%. Rund 55% der Schüler holen häufig die Meinung der Eltern oder Freunde
ein.
Jedoch lässt sich nicht bestätigen, dass Schüler höherer Schulformen ein besseres
Informationsverhalten haben. Zwar informieren sie sich häufiger bei guten Informationsquellen, jedoch nicht unbedingt seltener bei schlechten Informationsquellen.
Insgesamt vergleichen 54,30% der Schüler vor dem Kauf eines Produktes Preise, dabei besteht nur eine geringe Abhängigkeit von der Schulform. Für die Zielstrebigkeit
der Schüler lässt sich ebenfalls keine Tendenz in Abhängigkeit von der Schulform
feststellen.
Daher lässt sich vermuten, dass die Schulform keinen großen Einfluss auf das Einkaufsverhalten hat. Ob das Einkaufsverhalten von anderen Merkmalen – z. B. der
Taschengeldhöhe oder dem Fernsehnutzungsverhalten – abhängt, wäre noch näher
zu untersuchen.
Die Untersuchung der dritten Theorie zeigte eindeutig, dass Schüler einer höheren
Schulform ein besseres Fernsehnutzungsverhalten haben als Schüler einer niedrigeren
129
16. Resumee
Schulform. Denn Schüler einer höheren Schulform schauen täglich durchschnittlich
weniger Stunden Fernsehen. Des Weiteren sind Gymnasiasten täglich weniger Werbeminuten ausgesetzt als Schüler anderer Schulformen. Dieses liegt daran, dass sie im
Durchschnitt weniger Fernsehen schauen und häufiger öffentlich-rechtliche Sender,
bei denen der Werbeanteil geringer ist als bei privaten Sendern. Insgesamt haben
nur 14,24% der befragten Schüler ein gutes Fernsehkonsumverhalten, mit 44,06%
hat jedoch fast die Hälfte ein schlechtes.
Dieses Ergebnis ist im Hinblick auf die aktuelle „Shell-Jugendstudie 2006“ nicht
verwunderlich.
„Jugendliche aus den sozial privilegierten Elternhäusern besuchen aussichtsreichere Schulformen und durchlaufen in der Regel hochwertige berufliche Ausbildungen einschließlich Hochschulgängen. Jugendliche aus
der Unterschicht hingegen finden sich häufiger an Hauptschulen und Sonderschulen. Dabei erzielen sie auch im anschließenden beruflichen Ausbildungsweg nicht die Resultate, die ihrem möglichen Potenzial entsprechen.“ 86
Nach der Shell-Studie lässt sich, die Schulform als ein Indikator für die Schichtzugehörigkeit verstehen. Auch die Veröffentlichung des siegener Soziologen Rainer
Geißler „Die Sozialstruktur Deutschlands“ bestärkt mich in meinem Eindruck, dass
Hauptschüler zu einem höheren Anteil der Unterschicht angehören, wo tendenziell von einem niedrigeren Bildungsstand der Eltern und eng begrenzten finanziellen Ressourcen ausgegangen werden kann, während Gymnasiasten häufig aus einem
umfassender gebildeten und wohlhabenderen Elternhaus stammen. Hinsichtlich der
Realschule kann man davon ausgehen, dass sich dort beide Bevölkerungsschichten
treffen. Vor diesem Hintergrund ist anzunehmen, dass das Verbraucherverhalten
der Jugendlichen zum Teil aus ihrer Schichtzugehörigkeit resultiert. Viele Beobachtungen zeigen, dass sich Schüler sehr stark an ihrem Elternhaus und ihrem sozialen Umfeld orientieren und von diesen viele Werte und Vorstellungen übernehmen.
Im bereits erwähnten Buch von Rainer Geißler sind die verschiedenen Wertvorstellungen der Schichten nachzulesen. Hinzu kommt, dass die begrenzten finanziellen
Mittel der Unterschicht häufig gerade ausreichen, um die Lebensunterhaltskosten
zu decken. Eine Zukunftsplanung ist unter diesen Bedingungen nur schwer möglich. Da die Jugendlichen tagtäglich mit den Verhaltensweisen und Vorstellungen
ihrer Eltern konfroniert sind, werden diese häufig übernommen, was das von mir
analysierte Verhalten der Hauptschüler zumindest teilweise erklären könnte. Die beobachteten besseren Ergebnisse der Gymnasialschüler erkläre ich mir durch deren
im Durchschnitt höheren Bildungsmotivation. Diese führe ich darauf zurück,dass
die Berufstätigkeit der Eltern nicht nur zur Sicherung des Lebensunterhalts dient,
sonder auch Spielräume zur Selbstverwirklichung eröffnen. Aufgrund seltenerer finanzieller Probleme der Mittelschicht hat diese die Möglichkeit, sich ökonomisch für
die Zukunft abzusichern, wodurch möglicherweise das vergleichsweise höhere Sparverhalten von Gymnasiasten zu erklären wäre. Des Weiteren werden die Verhaltensweisen der Jugendlichen gerade in der Pubertät oft durch die Peergroup verstärkt.
Da sich Jugendliche häufig in schulformhomogenen Gruppen befinden, übertragen
sich die für die jeweilige Schulform typischen Verhaltensweisen auch auf Jugendliche,
deren Familien die jeweils „schichtspezifischen“ Werte nicht so sehr vertreten. Neben
86
Hurrelmann/Albert/Schneekloth (2006).
130
16. Resumee
der Familie und der Peergroup haben heute die Medien zunehmend einen größeren
Einfluss auf die Jugendlichen. So macht das Fernsehen einen wesentlichen Teil der
Freizeitgestaltung von Jugendlichen aus. Eine Begründung hierfür ist, dass heutzutage Kinder und Jugendliche rund zwei Drittel ihrer Freizeit im Haus verbringen87 ,
während der Anteil der Freizeitaktivitäten, die im Freien stattfinden, immer weiter
sinkt. Dieses liegt zum einen daran, dass es innerhalb der Stadt für Jugendliche
wenig Möglichkeiten zur Freizeitgestaltung außer Haus gibt. Zum anderen könnten
Jugendliche aufgrund der rückläufigen Geburtenraten weniger gleichaltrige Freunde
zur Freizeitgestaltung in der direkten Nachbarschaft haben. Als zusätzlicher Faktor
ist zu berücksichtigen, dass eingeschränkte finanzielle Möglichkeiten der Eltern, es
Jugendlichen nicht erlauben, an kostenpflichtigen Freizeitaktivitäten teilzunehmen,
was zu einem erhöhten Fernsehkonsum beitragen kann.
Im Hinblick auf den Schulunterricht, welcher wirtschaftliche Kompetenzen vermitteln soll, ist es meiner Meinung nach notwendig sich an die Lebenspraxis und Lebenssituation der Schüler zu orientieren. Neben der reinen Wissensvermittlung ist es aus
meiner Sicht notwendig den Schülern eine Hilfestellung bei der Zukunftsorientierung
zu bieten. Hierfür sollen sie motiviert werden ihre Möglichkeiten und Chancen besser
zu nutzen und darüber hinaus auszuweiten. Eine weitere Möglichkeit Jugendliche zu
bestärken und zu unterstützen kann ich mir, durch von der Schule durchgeführte
kompentatorische Maßnahmen für Jugendliche mit schlechteren Voraussetzungen,
z.B. geringere finanzielle Mittel, vorstellen. Solche kompensatorische Maßnahmen
könnten z. B. durch die Ausweitung der Ganztageseinrichtungen mit kostenlosen
Jugendförderprogrammen und Freizeitangeboten, verwirklicht werden.
87
Vgl. Fischer (2000) S. 30.
131
Teil III.
Anhang
132
A. Die Sammlung der Fragen aus
dem Seminar
1. Wann bekommst du dein Taschengeld?
• wöchentlich
• monatlich
• ich bekomme kein Taschengeld
2. Wofür gibst du dein Geld aus?
• Kleidung
• Schulsachen
• CD’s, DVD’s
• Snacks
• Handy
• Schminke
3. Welchen Fernsehkanal schaust du am liebsten?
• Pro 7
• RTL
• ARD/ZDF/WDR
• Kabel
• Sat 1
4. Welche Werbung hat besondere Anziehung auf dich?
• Klingeltöne
• Kosmetik
• Autos
• Lebensmittel
• Sportartikel
• CD´s, DVD´s
• Alkohol, Tabak
5. Durch welche Medien informierst du dich über ein Produkt?
• Computer/Internet
• Radio
• Fernsehen
• Freunde/ Familie
• Plakate
• Kino
• Zeitschriften
6. Wie hoch ist dein Taschengeld?
7. Gehst du arbeiten?
• ja
• nein
8. Hast du ein Handy?
• ja
• nein
9. Hast du schon mal unabsichtig ein Klingelton-Abo gekauft?
• ja
• nein
10. Hast du schon mal kurzzeitig dein Konto überzogen?
• ja
• nein
133
A. Die Sammlung der Fragen aus dem Seminar
11. Bittest du deine Eltern öfter um eine Taschengelderhöhung oder einen Vorschuss?
• ja
• nein
12. Was ist deine lieblings TV-Sendung?
13. Welche Schule besuchst du?
• Hauptschule
• Realschule
• Gymnasium
14. Wie viel Geld gibst du für Klamotten aus?
• alles
• viel
• kaum etwas
• nichts
15. Geschlecht?
• männlich
• die Hälfte
• weiblich
16. Bekommst du von deinen Eltern oder Großeltern Geld, wenn du . . . ?
• den Müll rausträgst
• staubsaugst
• das Auto wäschst
• spülst
• putzt
• bügelst
17. Wo kaufst du am liebsten Klamotten?
• Esprit
• S-Oliver
• H&M
• C&A
• Orsay
• Karstadt
• Wal Mart
• Aldi
• Windsurfing • Kataloge
• Takko
• Kik
• Pimky
• Lidl
• Mango
18. Verdienst du dir Geld hinzu um dein Taschengeld aufzubessern?
• ja
• nein
19. Hast du schon einmal etwas gekauft und dich hinterher darüber geärgert?
• nie
• selten
• oft
• sehr oft
20. Wenn ich etwas kaufe, dann ist mir die Marke wichtig.
• stimme nicht zu
• stimme eher nicht zu
• stimme eher zu
• stimme voll zu
21. Informierst du dich über ein Produkt das du kaufen möchtest?
• nie
• selten
• oft
• sehr oft
22. Mit wem gehst du normalerweise einkaufen?
• allein
• mit Freunden
134
• mit den Eltern
A. Die Sammlung der Fragen aus dem Seminar
23. Hast du am Ende des Monats noch Taschengeld übrig?
• immer
• oft
• selten
• manchmal
• nie
135
B. Fragebogenprototyp
136
B. Fragebogenprototyp
137
C. Fragebogen
138
C. Fragebogen
139
C. Fragebogen
140
Literaturverzeichnis
Atteslander, Peter: Methoden der empirischen Sozialforschung. 9. Auflage.
Berlin: Walter de Gruyter, 2000, ISBN 3–11–016835–9
Behnen/Neuhaus: Grundkurs Stochastik. 1. Auflage. Stuttgart: Teubner, 1984,
ISBN 3–519–02069–6
Bundesministerium für Bildung und Forschung: Zur Entwicklung nationaler
Bildungsstandards. 4. Auflage. Berlin, 2003
Cramer, Erhard: Statistik für Lehramtsstudierende. Siegen, 2003
Diaz-Bone, Rainer: Statistik für Soziologen. 1. Auflage. Konstanz: UTB, 2006,
ISBN 3–8252–2782–0
Diekmann, Andreas: Empirische Sozialforschung. 13. Auflage. Reinbeck bei
Hamburg: Rowohlt Taschenbuch Verlag, 2005, ISBN 3–499–55551–4
Fahrmeir et al.: Statistik. 4. Auflage. Berlin, Heidelberg: Springer, 2004, ISBN
3–540–21232–9
Fischer, Gabriele: Fernsehmotive und Fernsehkonsum von Kindern. 2. Auflage.
München: Reinhard Fischer, 2000, ISBN 3–88927–268
Friedrichs: Methoden empirischer Sozialforschung. 10. Auflage. Opladen:
VS-Verlag, 1982, ISBN 3–53122028–4
Hansen: Methodenlehre der Statistik. 2. Auflage. München: Vahlen, 1977, ISBN
3–8006–0639–9
Hartung, Joachim: Statistik. 1. Auflage. Frechen: Oldenbourg, 1982, ISBN
3–486–26791–4
Henze, Norbert: Stochastik für Einsteiger. 4. Auflage. Wiesbaden: Vieweg, 2003,
ISBN 3–528–36894–2
Hurrelmann, Prof. Dr. Klaus/Albert, Prof. Dr. Mathias/Schneekloth,
Ulrich: 15. Shell-Jugenstudie – Jugend 2006. 2006 hURL:
www.shell.com/static/de-de/downloads/2006/pdf/zusammenfassung_
jugendstudie2006.pdfi – Zugriff am 27. Oktober 2006
Küchler, Uwe: Elementare Wahrscheinlichkeitstheorie. Berlin, 2006
Kromrey, Helmut: Empirischen Sozialforschung. 11. Auflage. Stuttgart: Lucius
& Lucius, 2006, ISBN 3–8252–1040–5
Landesamt für Datenverarbeitung und Statistik NRW: Die Verteilung der
siegener Schüler auf die verschiedenen Schulformen. 2006 hURL:
http://www.landesdatenbank-nrw.dei – Zugriff am 17. Juli 2006
141
Literaturverzeichnis
Lang, Stefan: Kategoriale Regression. München, 2005
LKF – Landesanstalt für Kommunikation Baden-Würtemberg:
Landesvertrag über den Rundfunk im vereinten Deutschland. Stuttgart, 1991
May, Hermann: Wirtschaftsbürger Taschenbuch. 6. Auflage. München:
Oldenbourg, 2003, ISBN 3–486–27237–3
Mayer, Prof. Dr. Horst O.: Interview und schriftliche Befragung. München: R.
Oldenbourg, 2002, ISBN 3–486–25910–5
Ministerium für Schule, Jugend und Kinder des Landes
Nordrhein-Westfalen: Rahmenvorgabe für die ökonomische Bildung in der
Sekundarstufe I. 1. Auflage. Frechen: Ritterbach, 2004, ISBN 3–89314–207–X
Popp, Hemlut: Die Taschengeldfrage. 2002 hURL:
http://www.jugendamt.nuernberg.de/downloads/taschengeld.pdfi –
Zugriff am 08. Oktober 2006
Rüger, Bernhard: Test und Schätztheorie. München: Oldenbourg, 2002, ISBN
3–486–25130–9
Schulze: Beschreibende Statistik. 5. Auflage. München: R. Oldenbourg, 2003,
ISBN 3–486–27347–7
Steland, Ansgar: Mathematische Grundlagen der empirischen Forschung.
1. Auflage. Berlin: Springer, 2003, ISBN 3–540–03700–4
Vogel, Friedrich: Beschreibende und schließende Statistik. 10. Auflage.
München: Oldenbourg, 1997, ISBN 3–486–24360–8
Witting, Hermann: Matematische Statistik. 3. Auflage. Stuttgart: Teubner,
1978, ISBN 3–519–22036–9
142
Ich versichere, dass ich die schriftliche Hausarbeit – einschließlich beigefügter
Zeichnungen, Kartenskizzen und Darstellungen – selbständig verfasst und keine
anderen als die angegebenen Quellen und Hilfsmittel benutzt habe. Alle Stellen der
Arbeit, die dem Wortlaut oder dem Sinne nach anderen Werken entnommen sind,
habe ich in jedem Fall unter Angabe der Quelle deutlich als Entlehnung kenntlich
gemacht.
143
Herunterladen