Statistische Erhebung und Auswertung von Daten zum Verbraucherverhalten von Jugendlichen der 8. Klasse Schriftliche Hausarbeit im Rahmen der Ersten Staatsprüfung für das Lehramt für die Sekundarstufe II mit Zusatzprüfung für die Sekundarstufe I, dem Staatlichen Prüfungsamt für Erste Staatsprüfungen für Lehrämter an Schulen in Dortmund vorgelegt von: Miriam Hillemann Siegen, den 14.12.2006 Themensteller: XXX Universität Siegen Fachbereich Mathematik Inhaltsverzeichnis I. Theoretische Überlegungen 8 1. Einleitung 9 2. Hypothesenbildung 2.1. Hypothesentypen . . . . . . . . . . . . . . . . . . . . 2.1.1. Wenn-dann-Hypothesen . . . . . . . . . . . . 2.1.2. Je-desto-Hypothesen . . . . . . . . . . . . . . 2.1.3. Individual- Kollektiv- und Kontexthypothesen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 12 12 12 13 3. Repräsentativität 15 4. Fragebogenkonstruktion 4.1. Frageformen . . . . . . . . . . . . . . . . . 4.2. Frageformulierung . . . . . . . . . . . . . . 4.3. Anordnung der Fragen im Erhebungsbogen 4.4. Vortest . . . . . . . . . . . . . . . . . . . . 17 17 18 20 21 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5. Über die Mathematik in der Statistik 22 6. Stochastische Grundlagen 6.1. Allgemeine Grundlagen . . . . . . . . . . 6.2. Konkrete Wahrscheinlichkeitsverteilungen 6.2.1. Diskrete Verteilungen . . . . . . . 6.2.2. Stetige Verteilungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 23 27 27 28 7. Parameterschätzung 7.1. Punktschätzung . . . . . . . . . . . . . . . . . . 7.1.1. Gütekriterien . . . . . . . . . . . . . . . 7.1.2. Konstruktion von Schätzfunktionen . . . 7.2. Intervallschätzung . . . . . . . . . . . . . . . . . 7.2.1. Intervallschätzer für den Erwartungswert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 30 30 33 37 38 . . . . . 40 40 41 41 43 44 8. Hypothesentest 8.1. Grundidee statistischer Tests . . . . . . 8.2. Binomialtest . . . . . . . . . . . . . . . 8.2.1. Exakter Binomialtest . . . . . . 8.3. Vergleich zweier relativer Häufigkeiten 8.4. χ2 -Anpassungstest . . . . . . . . . . . 9. Verteilungsfreie Testverfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 2 Inhaltsverzeichnis 9.1. Tabellenanalyse und Unabhängigkeitstest . . . . . 9.1.1. Spaltenprozentuierung . . . . . . . . . . . 9.1.2. Fisher-Test . . . . . . . . . . . . . . . . . 9.1.3. Yates-Test . . . . . . . . . . . . . . . . . . 9.1.4. χ2 -Unabhängigkeitstest für 2 × 2-Tabellen 9.1.5. χ2 -Unabhängigkeitstest für m × n-Tabellen 9.2. Wilcoxon-Rangsummentest . . . . . . . . . . . . . 9.2.1. Exakter Rangsummentest . . . . . . . . . 9.2.2. Approximativer Rangsummentest . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 48 49 51 51 52 57 58 59 10.Regressionsanalyse 61 10.1. Multiple kategoriale Regression . . . . . . . . . . . . . . . . . . . . . 62 II. Praktische Anwendung 66 11.Aufbau der Untersuchung 11.1. Konkretisierung des Forschungsthemas . 11.1.1. Erste Theorie . . . . . . . . . . . 11.1.2. Zweite Theorie . . . . . . . . . . 11.1.3. Dritte Theorie . . . . . . . . . . . 11.2. Zur Repräsentativität der Untersuchung 11.3. Die Entwicklung des Fragebogens . . . . 67 67 67 68 71 74 75 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.Durchführung der Untersuchung 77 13.Untersuchung der ersten Theorie 13.1. Unterscheidet sich die durchschnittliche Taschengeldhöhe nach Schulform? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13.1.1. Versuch der Anpassung einer Normalverteilung . . . . . . . 13.1.2. Wilcoxon-Rangsummentest . . . . . . . . . . . . . . . . . . . 13.2. Ist die Wahrscheinlichkeit, dass ein Gymnasiast kein Taschengeld erhält, höher als das ein Hauptschüler kein Taschengeld erhält? . . . . 13.2.1. Vergleich zweier relativer Häufigkeiten . . . . . . . . . . . . 13.2.2. Exakter Binomialtest . . . . . . . . . . . . . . . . . . . . . . 13.3. Leihen sich Gymnasiasten und Hauptschüler seltener Geld als Realschüler? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13.3.1. Exakter Binomialtest . . . . . . . . . . . . . . . . . . . . . . 13.4. Hängt das Sparverhalten der Jugendlichen mit der Schulform zusammen? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13.4.1. χ2 -Unabhängigkeitstest . . . . . . . . . . . . . . . . . . . . . 13.5. Hängt das Sparverhalten der Jugendlichen mit der Taschengeldhöhe zusammen? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13.5.1. χ2 -Unabhängigkeitstest . . . . . . . . . . . . . . . . . . . . . 13.6. Hängt das Sparverhalten der Jugendlichen stärker von der Schulform oder der Taschengeldhöhe ab? . . . . . . . . . . . . . . . . . . . . . 13.6.1. Multiple Regressionsanalyse . . . . . . . . . . . . . . . . . . 13.7. Unterscheidet sich das Verhältnis zum Geld der Schüler je nach Schulform? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13.7.1. χ2 -Unabhängigkeitstest . . . . . . . . . . . . . . . . . . . . . 78 3 . 78 . 80 . 83 . 86 . 86 . 87 . 88 . 89 . 91 . 91 . 93 . 94 . 95 . 95 . 96 . 97 Inhaltsverzeichnis 13.8. Fazit zur ersten Theorie . . . . . . . . . . . . . . . . . . . . . . . . . 98 14.Untersuchung der zweiten Theorie 14.1. Unterscheidet sich das Informationsverhalten je nach Schulform? . . . 14.1.1. χ2 -Unabhängigkeitstest . . . . . . . . . . . . . . . . . . . . . . 14.2. Unterscheiden sich die Informationsquellen je nach Schulform? . . . . 14.2.1. Ungewichteter χ2 -Unabhängigkeitstest . . . . . . . . . . . . . 14.2.2. Gewichteter χ2 -Unabhängigkeitstest . . . . . . . . . . . . . . . 14.3. Wofür verwenden Schüler der achten Klasse ihr Taschengeld? . . . . . 14.4. Vergleichen Gymnasiasten häufiger Preise als Hauptschüler Preise? . . 14.4.1. χ2 -Unabhängigkeitstest . . . . . . . . . . . . . . . . . . . . . . 14.4.2. Exakter Binomialtest . . . . . . . . . . . . . . . . . . . . . . . 14.5. Hat die Schulform einen Einfluss darauf, ob ein Schüler ein zielstrebiges Einkaufsverhalten hat? . . . . . . . . . . . . . . . . . . . . . . . 14.5.1. χ2 -Unabhängigkeitstest . . . . . . . . . . . . . . . . . . . . . . 14.6. Welche siegener Bekleidungsgeschäfte sind am beliebtesten? . . . . . 14.7. Kaufen Schüler höherer Schulformen in preisgünstigeren Geschäften? . 14.7.1. Ungewichteter χ2 -Unabhängigkeitstest . . . . . . . . . . . . . 14.7.2. Exakter Binomialtest . . . . . . . . . . . . . . . . . . . . . . . 14.7.3. Unterscheidet sich das Einkaufsverhalten der Schüler je nach Schulform? . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14.7.4. χ2 - Unabhängigkeitstest . . . . . . . . . . . . . . . . . . . . . 14.8. Fazit zur zweiten Theorie . . . . . . . . . . . . . . . . . . . . . . . . . 15.Untersuchung der dritten Theorie 15.1. Unterscheidet sich die tägliche Fernsehnutzungsdauer der Jugendlichen je nach Schulform? . . . . . . . . . . . . . . . . . . . . . . . . 15.1.1. χ2 -Unabhängigkeitstest . . . . . . . . . . . . . . . . . . . . . 15.2. Unterscheiden sich die Uhrzeiten, zu denen Jugendliche Fernsehen schauen je nach Schulform? . . . . . . . . . . . . . . . . . . . . . . 15.2.1. Gewichteter χ2 -Unabhängigkeitstest . . . . . . . . . . . . . . 15.3. Schauen Schüler höherer Schulformen häufiger öffentlich-rechtliche Fernsehsender als Schüler niedrigerer Schulformen? . . . . . . . . . 15.3.1. χ2 -Unabhängigkeitstest . . . . . . . . . . . . . . . . . . . . . 15.4. Sind Schüler einer höheren Schulform täglich weniger Werbeminuten ausgesetzt als Schüler einer niedrigeren Schulform? . . . . . . . . . 15.5. Haben Schüler einer höheren Schulform ein besseres Fernsehnutzungsverhalten als Schüler einer niedrigeren Schulform? . . . . . . . . . . 15.5.1. χ2 -Unabhängigkeitstest . . . . . . . . . . . . . . . . . . . . . 15.6. Fazit zur dritten Theorie . . . . . . . . . . . . . . . . . . . . . . . . 16.Resumee 99 99 99 100 101 102 103 104 105 106 107 108 109 110 111 112 114 115 115 118 . 118 . 119 . 120 . 121 . 123 . 123 . 124 . 126 . 127 . 127 129 4 Inhaltsverzeichnis III. Anhang 132 A. Die Sammlung der Fragen aus dem Seminar 133 B. Fragebogenprototyp 136 C. Fragebogen 138 Literaturverzeichnis 141 5 Tabellenverzeichnis 2.1. Individual, Kollektiv- und Kontexthypothesen . . . . . . . . . . . . . . 14 8.1. 8.2. Entscheidungsregeln für den exakten Binomialtest . . . . . . . . . . . . 43 Entscheidungsregeln zum Vergleich zweier Wahrscheinlichkeiten . . . . 44 9.1. 9.2. 9.3. Kontingenztafeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46 Entscheidungsregeln für den exakten Wilcoxon-Rangsummentest . . . . 59 Entscheidungsregeln für den approximativen Rangsummentest . . . . . 60 11.1. Interpretationsregeln für das Verhältnis zum Geld . . . . . . . . . . . . 68 11.2. Interpretationsregeln zum Einkaufsverhalten der Schüler . . . . . . . . 71 11.3. Interpretationsregeln zum Fernsehnutzungsverhalten der Schüler . . . . 73 12.1. Umfragetermine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 13.1. 13.2. 13.3. 13.4. 13.5. 13.6. 13.7. 13.8. 13.9. 13.10. 13.11. 13.12. 13.13. Anzahl der Schüler die Taschengeld erhalten . . . . . . . . . . . . . . . Durchschnittliche Taschengeldhöhe sortiert nach Schulformen . . . . . . Klasseneinteilung und die berechneten Werte für den χ2 -Anpassungstest Anzahl der Schüler die kein Taschengeld erhalten . . . . . . . . . . . . Vierfeldertafel zum Taschengeld . . . . . . . . . . . . . . . . . . . . . . Absolute Häufigkeiten des Geldleihverhaltens . . . . . . . . . . . . . . . Absolute Häufigkeiten des Geldleihverhaltens klassifiziert . . . . . . . . Anzahl der Schüler die einen Nebenjob besitzen . . . . . . . . . . . . . Absolute Häufigkeiten des Sparverhaltens . . . . . . . . . . . . . . . . . Absolute Häufigkeiten des Sparverhaltens klassifiziert . . . . . . . . . . Relative Häufigkeiten des Sparverhaltens . . . . . . . . . . . . . . . . . Erwartete Häufigkeiten des Sparverhaltens . . . . . . . . . . . . . . . . Die Relation der Taschengeldhöhe zum Sparverhalten getrennt nach Schulformen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13.14. Sparverhalten zur Taschengeldrelation . . . . . . . . . . . . . . . . . . 13.15. Das Verhältnis zum Geld der Schüler in absoluten Häufigkeiten dargestellt 14.1. Absolute Daten der Schüler, die sich über ein Produkt informieren, wenn sie es kaufen möchten . . . . . . . . . . . . . . . . . . . . . . . 14.2. Genutzte Informationsquellen . . . . . . . . . . . . . . . . . . . . . . 14.3. Qualität der Informationsquellen . . . . . . . . . . . . . . . . . . . . 14.4. Ungewichtete absolute Häufigkeiten und prozentuale Anteile zu den genutzte Informationsquellen unterschieden nach ihrer Qualität . . . 14.5. Ungewichtete relative und erwartete Häufigkeiten zu den genutzte Informationsquellen unterschieden nach ihrer Qualität . . . . . . . . . . 14.6. Gewichtete absolute, relative und erwartete Häufigkeiten zu den genutzten Informationsquellen, unterschieden nach ihrer Qualität . . . . 14.7. Wofür geben Jugendliche der achten Klasse ihr Taschengeld aus? . . . 6 78 78 82 86 87 88 89 90 91 91 92 92 93 94 96 . 99 . 100 . 101 . 101 . 102 . 103 . 104 Tabellenverzeichnis 14.8. Preisvergleich in absoluten Häufigkeiten . . . . . . . . . . . . . . . . 14.9. Wie oft gehen Schüler der achten Klasse los um etwas bestimmtes zu kaufen und kaufen dann etwas völlig anderes? . . . . . . . . . . . . . 14.10. Die bei Jugendlichen der achten Klasse beliebtesten Geschäfte, in denen Bekleidung gekauft werden kann . . . . . . . . . . . . . . . . . . . . . 14.11. Siegener Bekleidungsgeschäfte nach ihrem Preisniveau sortiert . . . . 14.12. Welche Geschäfte bevorzugen Schüler unterschiedlicher Schulformen? 14.13. Zusammenfassung von Tabelle 14.12 . . . . . . . . . . . . . . . . . . 14.14. Das Einkaufsverhalten von Schülern der achten Klasse getrennt nach Schulform . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15.1. 15.2. 15.3. 15.4. 15.5. 15.6. 15.7. 15.8. 15.9. . 105 . 108 . . . . . 114 Fernsehnutzungsdauer der Jugendlichen in Stunden . . . . . . . . . . . Richtungstest . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Fernsehnutzungszeiten von Montags bis Freitags . . . . . . . . . . . . . Fernsehnutzungszeiten am Wochenende . . . . . . . . . . . . . . . . . . Gewichtete Klassifizierung der Fernsehnutzungszeiten von Montag bis Freitag . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Gewichtete Klassifizierung der Fernsehnutzungszeiten am Wochenende . Anzahl der Schüler, die die öffentlich-rechtlichen Fernsehsender nutzen Fernsehnutzungsverhalten von Schülern der achten Klasse . . . . . . . . Richtungstest zum Fernsehnutzungsverhalten . . . . . . . . . . . . . . . 7 109 110 111 112 118 120 120 120 121 121 123 126 127 Teil I. Theoretische Überlegungen 8 1. Einleitung Mit der Entwicklung der neuen „Rahmenvorgabe für die ökonomische Bildung in der Sekundarstufe I“, die ab dem Schuljahr 2005/06 in NRW verbindlich umgesetzt werden muss, hat eine Umbruchsphase für die Vermittlung wirtschaftlicher Inhalte in allen Schulformen begonnen. Die Lernbereiche Arbeitslehre, Gesellschaftslehre, Erdkunde, Geschichte und Politik, welche künftig für die ökonomische Bildung in der Schule zuständig sind, sollen nicht nur Wissen vermitteln, sondern sie sollen sich an einem Kompetenzbegriff orientieren, der folgendermaßen definiert ist: "[...]‘die bei Individuen verfügbaren oder von ihnen erlernbaren kognitiven Fähigkeiten und Fertigkeiten, bestimmte Probleme zu lösen, sowie die damit verbundenen motivationalen, volitionalen und sozialen Bereitschaften und Fähigkeiten, die Problemlösungen in variablen Situationen erfolgreich und verantwortungsvoll nutzen zu können.“ 1 . Diesem Ansatz liegt die Vorstellung zu Grunde, dass „Kompetenzen zur Bewältigung ökonomisch bedeutsamer Problemstellungen [...] ein unverzichtbarer Bestandteil der Allgemeinbildung und der berufsvorbereitenden Bildung“ 2 sind. Dabei werden die ökonomischen Kompetenzen in drei Teilbereiche ausdifferenziert, nämlich in „Sachkompetenz“, „Urteilskompetenz“ und „Entscheidungs-/Handlungskompetenz“ 3 . Hierbei versteht man unter der Sachkompetenz, „die Verfügung über grundlegende wirtschaftliche Kenntnisse und Methoden, die zum Verständnis ökonomischer Strukturen und Prozesse notwendig sind“ 4 . Die ökonomische Sachkompetenz ist von Bedeutung um in konkreten wirtschaftlichen Situationen urteilen und handeln zu können. Die Urteilskompetenz meint die Fähigkeit, selbstständig ökonomische Situationen beurteilen zu können5 und die Handlungskompetenz bezieht sich auf „die aktiven Bewältigung von ökonomischen Situationen“ 6 . Ausgangspunkt des Forschungsinteresses an den ökonomischen Kompetenzen von Jugendlichen sind einerseits die häufig vorgebrachten Klagen (z. B. von den Eltern, der Schulen und der Wirtschaft), dass Jugendliche keine Kenntnisse über wirtschaftlichen Zusammenhänge besäßen, andererseits der offenkundige Sachverhalt, dass Jugendliche eine wichtige Konsumentengruppe sind und als solche heftig umworben werden. Hinzu kommt, dass in der öffentlich geführten Verschuldungsdebatte, die vor allem von Jugend- und Verbraucherschutzeinrichtungen auf der Grundlage empirischer Befunde angestoßen wird, zunehmend deutlich wird, dass Jugendliche nicht mehr mit den ihnen zur Verfügung stehenden finanziellen Mitteln auskommen. 1 Bundesministerium für Bildung und Forschung (2003) S. 72. Ministerium für Schule, Jugend und Kinder des Landes Nordrhein-Westfalen (2004) S. 7. 3 Ministerium für Schule, Jugend und Kinder des Landes Nordrhein-Westfalen (2004) S. 15. 4 Ministerium für Schule, Jugend und Kinder des Landes Nordrhein-Westfalen (2004) S. 15. 5 Vgl. Ministerium für Schule, Jugend und Kinder des Landes Nordrhein-Westfalen (2004) S. 16. 6 Vgl. Ministerium für Schule, Jugend und Kinder des Landes Nordrhein-Westfalen (2004). 2 9 1. Einleitung Deswegen tritt häufig eine Diskrepanz zwischen dem Streben nach Bedürfnisbefriedigung und den dazu erforderlichen, aber nicht vorhandenen finanziellen Mitteln auf. Vor diesem Hintergrund entwickelte sich die Forschungsfrage danach, ob Jugendliche durch ihre Lebenspraxis als Konsumenten wirtschaftliche Kompetenzen unabhängig vom Schulunterricht erwerben oder ob sie wirtschaftlich aktiv sind, ohne dass ihnen dabei ökonomische Zusammenhänge bewusst sind. In dieses Forschungsprojekt ist meine Untersuchung: „Das Verbraucherverhalten von Jugendlichen der achten Klasse“ eingebunden. Da es in den bekannten Sozialstrukturanalysen Hinweise auf schichtspezifisches Verhalten in bestimmten Bereichen gibt und da Vermutungen bestehen, dass sich Kinder aus unterschiedlichen Schichten auf unterschiedliche Schulformen konzentrieren, war es für mich von Interesse, das Verbraucherverhalten im Zusammenhang mit der Schulform zu untersuchen. In der folgenden Untersuchung beschränke ich mich auf Jugendliche der achten Klasse, also auf in den meisten Fällen 14-jährige Jugendliche, da diese zunehmend von der Werbung als auch in ihrem eigenen Selbstbild als selbstständige Konsumenten wahrgenommen werden. Für die Untersuchung wurden solche Bereiche in den Blick genommen, mit denen Jugendliche vertraut sind, z. B. Taschengeld, Konsum, Mediennutzung und in denen zugleich durch die Reflexion der Zusammenhänge grundlegende ökonomische Kategorien wie z. B. Kosten-Nutzen-Überlegungen oder Handeln unter Restriktionen prinzipiell erlernt werden könnten. Im Rahmen der Bemühungen um die Entwicklung nationaler Bildungsstandards könnten die Ergebnisse der Untersuchung einerseits einen Beitrag leisten für die Entwicklung von Diagnoseverfahren, die z. B. bei der Konstruktion von Tests für Lernstandserhebungen bei dem realen Konsumentenverhalten der Jugendlichen ansetzten. Auf der anderen Seite – gleichzeitig mit dem vorherigen Gesichtspunkt verknüpft – könnten von den Untersuchungsergebnissen Impulse zu einer stärkeren Orientierung des Wirtschaftsunterrichts an der Lebenssituation der Schülerinnen und Schüler ausgehen. Auf diese Weise könnte der Auftrag erfüllt werden, Schüler über die Vermittlung von Sach- und Urteilskompetenz hinaus dazu zu befähigen, in relevanten Lebenssituationen kompetent zu entscheiden und zu handeln. 10 2. Hypothesenbildung Um das Forschungsthema zu problematisieren und zu konkretisieren ist die Bildung von Hypothesen notwendig. Eine Hypothese ist in der Regel eine Vermutung über einen Tatbestand. Im Kontext sozialwissenschaftlicher Theorien wird unter einer Hypothese eine Vermutung über einen Zusammenhang zwischen mindestens zwei Sachverhalten verstanden. Daher nennt man solche Hypothesen auch Zusammenhangshypothesen.7 Die einzelnen Variablen8 innerhalb einer Hypothese müssen keinen kausalen Zusammenhang aufweisen. So könnte es sein, dass beide Variablen der Hypothese eine Folgerung eines dritten nicht betrachteten Merkmals sind. Eine gültige Hypothese wäre: Je besser ausländische Kinder die deutsche Sprache beherrschen, desto höher ist ihr Allergierisiko. Hier könnte der Zusammenhang aus einem dritten Faktor, z. B. der Höhe der Integration (Annahme deutscher Essgewohnheiten, Hygiene), folgen. Hypothesen entwickeln sich aus theoretischen Vorüberlegungen, daher bestimmen sie bis zu einem gewissen Grad die Auswahl der zu untersuchenden Merkmale. Aus diesem Grund ist die Konstruktion eines Fragebogens erst nach der Hypothesenbildung möglich.9 Bei der Hypothesenbildung ist es gleichgültig, wie der Forscher zu diesen gelangt. Er kann sie z. B. aus seinem Alltagsvorverständnis über einen Tatbestand, aus Zeitungsberichten oder aus Beobachtungen entwickeln. Hierbei ist ausschließlich interessant, ob sich die Vermutungen des Forschers empirisch widerlegen oder bestätigen lassen. Die Hypothesenbildung ist umso einfacher, je eingegrenzter der Forschungsgegenstand ist. Für die Untersuchung werden die einzelnen Hypothesen zu einer Theorie zusammengefasst. In den Sozialwissenschaften wird unter einer Theorie „ein System logisch widerspruchsfreier Aussagen über den jeweiligen Untersuchungsgegenstand mit den zugehörigen Definitionen der verwendeten Begriffe“ 10 verstanden. Empirische Theorien haben drei Anforderungen zu erfüllen11 : 1. Die Hypothesen müssen einen Bezug zur Realität haben und prinzipiell empirisch falsifizierbar sein. 2. Die einzelnen Hypothesen stehen in einem erkennbaren Zusammenhang zueinander und beziehen sich auf den gleichen Gegenstandsbereich. 7 Vgl. Kromrey (2006) S. 53. Eine Variable bezeichnet ein Merkmal oder eine Eigenschaft von Personen, Gruppen, Organisationen oder anderen Merkmalsträgern. 9 Vgl. Kromrey (2006) S. 53. 10 Kromrey (2006) S. 52. 11 Kromrey (2006) S. 54. 8 11 2. Hypothesenbildung 3. Die Aussagen müssen miteinander logisch verträglich sein. Das heißt, sie dürfen sich nicht gegenseitig widersprechen. 2.1. Hypothesentypen In den Naturwissenschaften werden fast immer deterministische Hypothesen verwendet. Diese stellen einen exakten, ausnahmslos gültigen Zusammenhang zwischen verschiedenen Variablen dar. Da in den Sozialwissenschaften hingegen in der Regel mit probabilistischen Hypothesen gearbeitet wird, betrachte ich im Folgenden nur diese Hypothesenart. Im Falle solcher Hypothesen treffen Zusammenhänge nur mit einer gewissen Wahrscheinlichkeit zu.12 Eine Hypothese gilt dann als erwiesen, falls eine hinreichende Übereinstimmung zwischen der Hypothese und der beobachtbaren Erfahrungswelt besteht.13 Im Folgenden werden Hypothesen die den Zusammenhang zwischen zwei Variablen darstellen betrachtet. Mit diesen trifft der Forscher Aussagen über die abhängige Variable B unter der Bedingung des Wertes der unabhängigen Variablen A. 2.1.1. Wenn-dann-Hypothesen Wenn-dann-Hypothesen stellen den Bezug zweier dichotomer Variablen (Variablen, die nur zwei Zustände annehmen können) dar. Es gibt zwei Arten von Wenn-dannHypothesen, die auf der Aussagenlogik basieren14 : 1. Die Implikationshypothesen stellen eine logische Folgerung zwischen zwei Aussagen dar. Das heißt, wenn A eintritt, dann wird B erwartet. Demzufolge ist A eine hinreichende Bedingung für B. 2. Die Äquivalenzhypothesen stellen eine „genau-dann-wenn-Beziehung“ dar. Das heißt, wenn A eintritt dann wird B erwartet und wenn ¬A eintritt dann wird ¬B erwartet. Demzufolge ist A eine hinreichende und notwendige Bedingung für B. 2.1.2. Je-desto-Hypothesen Je-desto-Hypothesen stellen den Bezug zwischen zwei ordinalen Variablen (Variable, deren Werte eine Ordnung zulassen) dar. Die einfachsten Formen dieser Hypothesen stellen monotone Zusammenhänge dar. Diese Zusammenhänge können15 • monoton steigend sein, d. h. je größer der Wert der unabhängigen Variablen A, desto größer ist der Wert der abhängigen Variablen B. • monoton fallend sein, d. h. je größer der Wert der unabhängigen Variablen A, desto kleiner ist der Wert der abhängigen Variablen B. 12 Vgl. Vgl. 14 Vgl. 15 Vgl. 13 Diekmann (2005) S. 107f. Mayer (2002) S. 17. Diekmann (2005) S. 108. Diekmann (2005) S. 112. 12 2. Hypothesenbildung Zudem können Je-desto-Hypothesen auch nicht monotone Zusammenhänge darstellen. Beispiele hierfür sind u-förmige oder umgekehrt u-förmige Zusammenhänge, welche sich z. B. als eine nach oben oder unten geöffneten Parabel darstellen lassen. Da sich solche Zusammenhänge nicht als Je-desto-Hypothesen ausdrücken lassen, werden diese in der Regel abschnittsweise formuliert. Für einen u-förmigen Zusammenhang heißt das, dass bis zum Minimum ein monoton fallender und ab da ein monoton steigender Zusammenhang besteht. Bei umgekehrt u-förmigen Zusammenhängen gilt dies analog. Das bedeutet für die Hypothesenformulierung, dass nicht monotone Zusammenhänge als mehrere Je-desto-Hypothesen formuliert werden müssen. Durch die Angabe einer mathematische Funktion kann die Je-desto-Hypothese präzisiert werden. Hierbei steigt der Informationsgehalt gegenüber der unspezifischen Hypothesenform.16 y Art des Zusammenhangs (1) linear steigend: y = bx + c mit b > 0 (2) linear fallend: y = bx + c mit b < 0 (3) exponentiell steigend: y = aebx mit b > 0 (4) exponentiell fallend: y = aebx mit b < 0 (5) logarithmisch: y = a · log(bx + x) (1) (3) (5) (2) (4) x Abbildung 2.1.: Verschiedene spezielle Je-desto-Hypothesen17 Zum besseren Verständnis können jedoch Wenn-dann- und Je-desto-Hypothesen in anderer Form formuliert werden, wenn implizit klar ist, welcher Hypothesentyp gemeint ist. 2.1.3. Individual- Kollektiv- und Kontexthypothesen Abhängig von den Merkmalstypen der Variablen wird zwischen Individual-, Kollektivund Kontexthypothesen unterschieden. Bei den Individualhypothesen handelt es sich sowohl bei der unabhängigen als auch bei der abhängigen Variable um Individualmerkmale. Ein Beispiel für eine Individualhypothese lautet: „Je höher der Bildungsabschluß einer Person, desto höher ist ihr persönliches Nettoeinkommen.“ 18 Demnach sind die Merkmale Bildungsabschlüsse und Nettoeinkommen Individualmerkmale. 16 Vgl. Diekmann (2005) S. 111–114. Vgl. Diekmann (2005) S. 115. 18 Diekmann (2005) S. 116. 17 13 2. Hypothesenbildung Hypothesen, welche sich auf Zusammenhänge zwischen Kollektivmerkmale beziehen, bezeichnet man als Kollektivhypothesen. Ein Beispiel für solch eine Hypothese lautet: Je höher das Volkseinkommen einer Gesellschaft, desto größer ist die gesellschaftliche Zufriedenheit. Aus Kollektivhypothesen kann man nicht logisch zwingend die korrespondierende Individualhypothese folgern. Es besteht die Möglichkeit, dass auf der Kollektivebene ein positiver Zusammenhang zwischen den Variablen A und B besteht. Dieser positive Zusammenhang ist jedoch nicht zwingend für die Individualebene. Auf der Individualebene kann zwischen den angegebenen Variablen (1.) ein positiver, (2.) gar kein oder (3.) ein negativer Zusammenhang bestehen. Für die Übertragung des eben genannten Beispiels auf die Individualebene gilt nicht automatisch: Je höher das Einkommen einer Person, desto zufriedener ist sie. Einen falschen Schluss von einer Kollektiv- auf eine Individualhypothese wird als ökologischer Fehler bezeichnet. Um eine Kollektivhypothese zu überprüfen müssen verschiedene Kollektive nebeneinander auf diese Merkmale getestet werden. Im oben genannten Beispiel ist es notwendig verschiedene Gesellschaften auf ihre Zufriedenheit in Abhängigkeit zum Volkseinkommen zu testen.19 Kontexthypothesen sind in soziologischen Untersuchungen von besonderem Interesse. Diese Art von Hypothesen können als Mischform von Individual- und Kollektivhypothesen bezeichnet werden. Im Unterschied zu den Individual- und Kollektivhypothesen setzt sich die Kontexthypothese aus jeweils einem Individualmerkmal und einem Kollektivmerkmal zusammen. Dabei stellt die unabhängige Variable das Kollektivmerkmal und die abhängige Variable das Individualmerkmal dar. Demnach werden Kontexthypothesen benutzt um den Einfluss von Kollektivmerkmalen auf das individuelle Handeln zu beschreiben. Ein Beispiel für eine solche Hypothese lautet: „Je höher die soziale Integration in einer sozialen Gruppe (= Kollektivmerkmal), desto geringer ist die Wahrscheinlichkeit, daß sich eine Person, die Mitglied der sozialen Gruppe ist, abweichend verhält (=Individualmerkmal).“ 20 Wie schon bei den Kollektivhypothesen beschrieben, reicht es bei den Kontexthypothesen nicht aus, nur ein Kollektiv zu erheben. Erst nach einem ausreichenden Vergleich von verschiedenen Kollektiven kann man Aussagen über die Gültigkeit der Kontexthypothese machen.21 Individualhypothese Kollektivhypothese Kontexthypothese unabhängige Variable Individualmerkmal Kollektivmerkmal Kollektivmerkmal abhängige Variable Individualmerkmal Kollektivmerkmal Individualmerkmal Tabelle 2.1.: Individual, Kollektiv- und Kontexthypothesen22 19 Vgl. Diekmann (2005) S. 116. Diekmann (2005) S. 118. 21 Vgl. Diekmann (2005) S. 118f. 22 Vgl. Diekmann (2005) S. 118. 20 14 3. Repräsentativität Die Erhebung der Grundgesamtheit wäre für eine Untersuchung der optimale Fall. Da dies jedoch in der Realität nicht möglich ist, ist es notwendig sich auf eine Teilmenge der Grundgesamtheit zu beschränken. Diese bezeichnet man als Stichprobe. In den Sozialwissenschaften spielt die Repräsentativität einer Erhebung eine große Rolle. „Damit Rückschlüsse von der Stichprobe auf die Grundgesamtheit möglich sind, muss diese ein verkleinertes Abbild der Grundgesamtheit darstellen.[...] Die Verteilungen aller interessierenden Merkmale in der Stichprobe muss repräsentativ für die Grundgesamtheit sein.“ 23 Für die Auswahl der Stichprobe wird bei der Stichprobenbildung zwischen zufallsgesteuerten und nicht zufallsgesteuerten Auswahlverfahren unterschieden. Bei den nicht zufallsgesteuerten Stichprobenauswahlverfahren wird durch bewusste Auswahl der Stichprobe versucht ein verkleinertes Abbild der Grundgesamtheit zu erhalten. Die Auswahl eines verkleinerten aber exakten Abbildes der Grundgesamtheit ist in der Realität jedoch schwer zu gewährleisten, da es unmöglich ist, alle Merkmale einer Gesellschaft (z. B. Anteil männlicher und weiblicher Personen, Anteil ausländischer Personen usw.) gleichzeitig zu berücksichtigen.24 Bei der zufallsgesteuerten Auswahl wird aus der Grundgesamtheit zufällig eine Stichprobe ausgewählt, daher wird eine solche Stichprobe auch als Zufallsstichprobe bezeichnet. Hierbei werden alle Elemente der Grundgesamtheit als gleich wahrscheinlich betrachtet und es kann kein Element mehrfach ausgewählt werden. Dieses entspricht im Urnenmodell „ziehen ohne Zurücklegen“. Dieses Verfahren lässt bei hinreichend großer Stichprobe erwarten, dass die relative Merkmalshäufigkeit der Stichprobe der relativen Merkmalshäufigkeit der Grundgesamtheit entspricht. Somit wird erwartet, dass die Repräsentativität mit diesem Auswahlverfahren von sich aus gegeben ist.25 Es gibt zwei Formen von Zufallsstichproben. Zum einen die „einfache Zufallsstichprobe“ 26 und zum anderen die „mehrstufige Zufallsstichprobe“ 27 . Von einer einfachen Zufallsstichprobe wird gesprochen, wenn die Ziehung der Stichprobe in einem Auswahlschritt erfolgt und somit jede Person aus der Grundgesamtheit die gleiche Chance hat, in die Stichprobe zu gelangen. Bei der mehrstufigen Zufallsstichprobe findet die Auswahl der Stichprobe in mehreren Schritten statt. Ermittelt man beispielsweise für eine Schülerumfrage zunächst eine Zufallsauswahl der Schulen (1. 23 Mayer (2002) S. 59. Vgl Diekmann (2005) S. 368. 25 Vgl. Diaz-Bone (2006) S. 133. 26 Diaz-Bone (2006) S. 133. 27 Diaz-Bone (2006) S. 133. 24 15 3. Repräsentativität Stufe), um dann aus den ausgewählten Schulen eine Zufallsauswahl von Klassen (2. Stufe) zu ziehen, aus denen dann abschließend ein oder mehrere zu befragende Schüler (3. Stufe) zufällig ermittelt wird, so hat man eine dreistufige Auswahl. Kennzeichnend für mehrstufige Auswahlverfahren ist, dass die zufällig ausgewählten Einheiten auf den vorangehenden Stufen jeweils größere Einheiten sind und erst auf der letzten Stufe die Personen ausgewählt werden, die erhoben werden. Eine besondere Form der mehrstufigen Zufallsstichprobe ist die „Klumpenstichprobe“ 28 . Sie ist dadurch gekennzeichnet, dass auf der letzten Stufe alle Elemente der auf der vorletzten Stufe ausgewählten Einheit erhoben werden.29 Im vorangegangenen Beispiel wäre eine Klumpenstichprobe, wenn alle Schüler aus der auf der 2. Stufe ausgewählten Klasse erhoben werden. Die Schüler der gezogenen Klasse bilden dann einen Klumpen. 28 29 Diaz-Bone (2006) S. 133. Vgl. Diaz-Bone (2006) S. 133. 16 4. Fragebogenkonstruktion Nach dem Aufstellen der Hypothesen kommt es zu der Entscheidung für eine Erhebungsform. Da dies in meinem Fall eine Erhebung mittels eines Fragebogens ist, beschäftige ich mich im Folgenden mit der Fragebogenkonstruktion. Hierfür sind die vorher formulierten Hypothesen von großer Wichtigkeit, denn sie sind der Grund, warum bestimmte Fragen gestellt werden. Das Ziel der Fragen sind Antworten, die als Daten für die Überprüfung der Hypothesen dienen sollen.30 Demnach ist die Frage das Bindeglied zwischen den Hypothesen und den Antworten.31 Die Fragebogenkonstruktion ist in drei Teilbereiche aufzuspalten. Anfangs muss die Frageform jeder einzelnen Frage bestimmt werden. Anschließend müssen die Fragen formuliert und zu einem Fragebogen zusammengefügt werden. 4.1. Frageformen Der Fragebogenentwickler muss sich bei jeder Frage für eine Frageform entscheiden. Er hat die Wahl zwischen offenen, geschlossenen und halboffenen (hybride) Fragen. Diese unterscheiden sich nach der Art der Antwortvorgaben.32 Bei geschlossenen Fragen werden den zu befragenden Personen alle relevanten Antwortmöglichkeiten vorgegeben. Hier hat der Befragte lediglich die Aufgabe aus diesen Antwortmöglichkeiten eine oder eventuell mehrere auszuwählen, während er bei offenen Fragen seine Antwort selbstständig formulieren muss, da keine Antwortmöglichkeiten vorgegeben sind.33 Daher setzen solche Fragen beim Befragten viel Vorwissen voraus. Der Befragte muss in der Lage sein seine Antwort schriftlich zu artikulieren, d. h. er muss z. B. schreiben können und die Fähigkeit besitzen, einen Text eigenständig zu strukturieren. Außerdem erfordert die Formulierung eines Fließtextes eine höhere Motivation zur Beantwortung einer Frage, als das Auswählen aus vorgegebenen Antwortmöglichkeiten. Es ist davon auszugehen, dass diese Merkmale bei Angehörigen höherer Bildungsschichten im stärkeren Maße vorhanden sind, als bei Personen in unteren sozialen Schichten.34 In der Regel eignen sich offene Frage besonders gut „um Wissen zu überprüfen, um den Sprachgebrauch der Bevölkerung zu einem bestimmten Themenbereich kennen zu lernen, um die ‚Aktualität‘ von Themen oder Argumenten zu messen sowie um Gebiete von besonderer individueller Vielfalt zu erkunden.“ 35 Die Auswertung offener Fragen ist äußerst schwierig, da zu diesem Zweck eine Inhaltsanalyse notwendig ist. Eine Sonderform offener Fragen, welche eine nicht 30 Vgl. Kromrey (2006) S. 370. Vgl. Friedrichs (1982) S. 204. 32 Vgl. Kromrey (2006) S. 375. 33 Vgl. Atteslander (2000) S. 158f. 34 Vgl. Kromrey (2006) S. 376. 35 Kromrey (2006) S. 376. 31 17 4. Fragebogenkonstruktion so komplexe Auswertung erfordert, bilden die formal offenen Fragen.36 Solche Fragen erkundigen sich z. B. nach Häufigkeit oder Dauer einer Aktivität. Sie können auch nach Mengen oder physikalischen Größen fragen. Charakteristikum dieser Frage ist, dass der Befragte zu ihrer Beantwortung nur ein einziges Wort, eine einzige Zahl oder z. B. eine Zeitspanne aufschreiben muss.37 Die gelegentliche Einstreuung offener Fragen macht die Befragung abwechslungsreicher und interessanter, was die Motivation des Befragten den Fragebogen vollständig zu beantworten aufrechterhält. Die geschlossene Frageform ist in der empirischen Sozialforschung der dominierende Fragetyp. Die Entwicklung geschlossener Fragen ist viel aufwändiger, da hier passende Antwortalternativen entwickelt werden müssen. Um das gesamte Spektrum von potentiellen Antwortalternativen zu berücksichtigen erfordert dies eine intensive Auseinandersetzung mit dem Thema der Frage und der Zielgruppe. Dennoch besteht bei geschlossenen Fragen immer die Gefahr, dass die vorgegebenen Antwortmöglichkeiten unvollständig sind. Des Weiteren kann es passieren, dass die Antwortkategorien falsch gewählt werden und diese nicht aus der Lebenswelt der Zielgruppe stammen. In solchen Fällen kann der Befragte Schwierigkeiten haben, seine gewünschte Antwort in den vorgegebenen Antwortmöglichkeiten wieder zu finden.38 Gut entwickelte geschlossene Fragen bringen jedoch einige Vorteile für den Befragten und den Forscher mit sich. Geschlossene Fragen erleichtern den Befragten die Beantwortung der Fragen. Besonders für Personen mit Verbalisierungsproblemen ist dies von Vorteil. Geschlossene Fragen sind in der Regel schneller als offene Fragen zu beantworten, was einen geringeren Zeitaufwand für den Befragten bedeutet. Im Vergleich zu offenen Fragen, erfordern geschlossene Fragen einen geringeren Aufwand bei der Auswertung. Des Weiteren lassen sich die Antworten der Befragten dieses Fragetyps sehr gut miteinander vergleichen. Die Fragebögen können unmittelbar nach oder sogar schon während der Auswertung miteinander verglichen werden. Dies ist bei offenen Fragen erst nach einer intensiven Inhaltsanalyse möglich.39 Ein Kompromiss zwischen den geschlossenen und offenen Fragen sind die halboffenen Fragen. Dieser Fragetyp bietet dem Befragten vorformulierte Antwortmöglichkeiten und zusätzlich noch die Gelegenheit seine Antwort eigenständig zu formulieren.40 Um bei der Beantwortung der Fragen Ermüdungserscheinungen entgegenzutreten, sollten zwischen den geschlossenen Fragen gelegentlich offene Fragen verwendet werden. 4.2. Frageformulierung Die Frageformulierung nimmt einen großen Teil der Fragebogenkonstruktion ein. Die Fragen des Erhebungsbogens müssen so formuliert sein, dass die Fragen von allen zu 36 Vgl. Vgl. 38 Vgl. 39 Vgl. 40 Vgl. 37 Diekmann (2005) S. 409. Kromrey (2006) S. 179. Kromrey (2006) S. 376. Diekmann (2005) S. 408. Diekmann (2005) S. 408. 18 4. Fragebogenkonstruktion befragenden Personen in möglichst gleicher Weise verstanden werden. Des Weiteren müssen sie so gestellt sein, dass die Abwehrmechanismen der Testpersonen auf ein Minimum beschränkt werden. Denn es lässt sich vermuten, dass die Bereitschaft des Befragten eine Frage zu beantworten sinkt, je mehr eine Frage in den Privatbereich des Befragten eindringt.41 Daher sind bei der Frageformulierung einige Grundregeln zu beachten: 1. Fragen sollten so kurz, verständlich, präzise und direkt wie möglich formuliert werden. Ein Befragter wird selten zugeben, dass er eine Frage nicht verstanden hat. In diesem Fall wird er in der Regel im Sinne der sozialen Erwünschtheit antworten. Da die Fragen für alle Personen der Zielgruppe verständlich sein müssen, sollte auf komplizierte Sätze, z. B. Hypotaxe, verzichtet werden. Die Fragen sollten für die Zielgruppe verständliche Wörter enthalten, daher sind Fremdwörter und unbekannte Fachausdrücke zu vermeiden. So soll ein dem Fragebogen und der Zielgruppe adäquates Sprachniveau erreicht werden.42 2. Um Missverständnisse und Verfälschungen zu vermeiden, sollten Fragen keine doppelten Negationen enthalten. Um die Motivation der Befragten, den Fragebogen zu beantworten, zu erhalten, sollten diese nicht überfordert werden. Fragen mit doppelten Verneinungen jedoch erfordern eine höhere Konzentration und längeres Nachdenken. Dies kann die Befragten verunsichern und dadurch zu verfälschten Antworten führen.43 3. Eine Lenkung der Antwortreaktion des Befragten ist zu vermeiden. Um keine bestimmte Beantwortung der Fragen zu provozieren, verzichtet man bei der Frageformulierung auf Suggestivfragen und auf stark positiv oder negativ besetzte Begriffe.44 Des Weiteren soll der Verzicht auf stark wertbesetzte Begriffe verhindern, dass Fragen nach der sozialen Erwünschtheit beantwortet werden.45 4. Fragen sollten sich nur auf einen Sachverhalt beziehen. Bei Fragen, die mehrere Sachverhalte gleichzeitig beinhalten, kann es leicht zu Missverständnissen kommen, was die Erhebung verfälscht. Daher sollten mehrere eindimensionale Fragen anstelle einer mehrdimensionalen Frage konstruiert werden.46 5. Fragen, die die Privatsphäre der Befragten betreffen, sollten möglichst sensibel formuliert werden, um den Befragten eine ehrliche Antwort zu erleichtern.47 6. Bei der Bildung von Antwortkategorien geschlossener Fragen ist zu beachten, dass diese „disjunkt, erschöpfend und präzise“ 48 sind. Die Antwortmöglichkeiten sollten hinreichend genau zwischen verschiedenen Sachverhalten unterscheiden. Außerdem sollten sie im Hinblick auf positive und negative Antworten ausgeglichen sein, um so die Gleichwertigkeit der verschiedenen Antworten zu demonstrieren.49 41 Vgl. Kromrey (2006) S. 380. Vgl. Diekmann (2005) S. 410. 43 Vgl. Diekmann (2005) S. 411. 44 Vgl. Diekmann (2005) S. 412f. 45 Vgl. Atteslander (2000) S. 171. 46 Vgl. Diekmann (2005) S. 412. 47 Vgl. Kromrey (2006) S. 381. 48 Diekmann (2005) S. 411. 49 Vgl. Diekmann (2005) S. 411. 42 19 4. Fragebogenkonstruktion 7. Bei Fragen, die Mehrfachnennungen erlauben, ist der Befragte explizit darauf hinzuweisen. 8. Fragen, die nach Häufigkeiten, Dauer oder physikalischen Größen fragen, müssen mit den entsprechenden Maßeinheiten angegeben werden, da das Fehlen solcher Einheiten meist Verwirrung bei den Befragten stiftet.50 9. Sowohl bei den Fragen als auch bei den Antwortmöglichkeiten sind unbestimmte Zahlwörter, wie z. B. oft, selten, häufig, manchmal, zu vermeiden. Solche unbestimmten Worte können sowohl vom Forscher, wie auch vom Befragten unterschiedlich interpretiert werden. Dies kann zu Auswertungsproblemen und letztendlich auch zu ungewollten Verfälschungen der Erhebung führen. Für die äußere Erscheinung des Fragebogens ist die Abfassung eines Begleittextes am Anfang und einen abschließenden Dank am Ende des Erhebungsbogens von hoher Bedeutung. Der kurze, einführende Text soll die Motivation der Befragten den Fragebogen auszufüllen anheben. Außerdem soll er den Befragten über den Kontext der Untersuchung informieren und ihn über die anonyme Datenbehandlung aufklären. 4.3. Anordnung der Fragen im Erhebungsbogen Die fertig formulierten Fragen müssen zu einem Fragebogen zusammengefügt werden. Bei der Anfertigung des Fragebogens werden die Fragen nicht zufällig zusammengestellt. Der Fragebogen muss sachlich nachvollziehbar gegliedert sein. Zu diesem Zweck werden Fragen, die ein bestimmtes Thema erfassen zu einem Komplex zusammengefasst.51 Um den Untersuchungsteilnehmern zu Beginn der Befragung die Unsicherheit bzgl. der Erhebung zu nehmen, sollte der Fragebogen mit möglichst neutralen und einfachen Fragen beginnen. Solche Fragen bezeichnet man als „Eröffnungs- oder Eisbrecherfragen“ 52 . Da die Motivation der Befragten zum Ende des Erhebungsbogens sinkt, sollten die wichtigsten Fragen im zweiten Drittel des Fragebogens platziert werden.53 Bei der Frageanordnung können zwei unerwünschte, verzerrende Effekte auftreten: Zum einen der Ausstrahlungseffekt, auch „halo effect“ 54 genannt und zum anderen der „Platzierungseffekt“ 55 . Mit dem Ausstrahlungseffekt bezeichnet man den Einfluss einer Frage auf die Wahrnehmung umstehender Fragen, da im Normalfall keine Frage von den zu befragenden Personen völlig isoliert betrachtet wird. Dies kann eine Verzerrung der Erhebung zur Folge haben. Die Vermeidung dieses Effekts ist in der Mikroplanung (Planung der Fragereihenfolge innerhalb eines Themenkomplexes) zu berücksichtigen. Wie die Fragen, können sich auch die einzelnen Themenkomplexe untereinander beeinflussen. Dieses bezeichnet man als Platzierungseffekt. 50 Vgl. Atteslander (2000) S. 171. Vgl. Kromrey (2006) S. 383. 52 Kromrey (2006) S. 382. 53 Vgl. Kromrey (2006) S. 382. 54 Kromrey (2006) S. 385. 55 Kromrey (2006) S. 385. 51 20 4. Fragebogenkonstruktion Die Vermeidung eines Platzierungseffekts ist in der Makroplanung (Planung der Reihenfolge der einzelnen Themenkomplexe) zu berücksichtigen. Die völlige Vermeidung von Ausstrahlungs- und Platzierungseffekten kann jedoch in einer schriftlichen Befragung selten realisiert werden.56 4.4. Vortest Da sich bei der Fragebogenkonstruktion Fehler selten gänzlich vermeiden lassen ist es notwendig, den fertigen Erhebungsbogen vor Untersuchungsbeginn zu testen und gegebenenfalls zu verbessern. Der Vortest (engl. Pretest) wird eingesetzt, um die Verständlichkeit der Fragen und die Vollständigkeit der Antwortmöglichkeiten zu überprüfen. Außerdem sollte, um die eigentliche Befragung realistisch planen zu können, die durchschnittliche Befragungszeit ermittelt werden. Im Anschluss an den Pretest sollten Interviews mit den Vortestteilnehmern helfen die letzten Unklarheiten und Fehler im Fragebogen zu beseitigen.57 56 57 Vgl. Kromrey (2006) S. 385f. Vgl. Diekmann (2005) S. 415f. 21 5. Über die Mathematik in der Statistik Die Mathematik, speziell die Statistik, ist für die Sozialwissenschaft ein wichtiges Hilfsmittel. Eine bedeutende Rolle spielt die Mathematik für die Auswertung von Daten. „Die Statistik befasst sich mit der Sammlung, Darstellung und Analyse von Sachverhalten, die numerisch messbar sind und in größerer Zahl vorliegen.“ 58 Die Statistik lässt sich in zwei Bereiche aufteilen. Zum einen die deskriptive Statistik und zum anderen die induktive Statistik. Bei der deskriptiven Statistik geht es um die Beschreibung einer Grundgesamtheit. Daher wird die deskriptive Statistik auch als beschreibende Statistik bezeichnet. Die Verfahren der induktiven Statistik, welche sich in die Schätzstatistik und Teststatistik aufteilen lassen, beruhen auf Messungen eines Merkmals X in einer Teilgruppe der Grundgesamtheit. Das Ziel der induktiven Statistik ist es, mittels einer Stichprobe X1 , X2 , . . . , Xn , Aussagen über die zugrundeliegende Verteilung und somit auch Aussagen über die Grundgesamtheit zu gewinnen. Dieses bedeutet, dass man als induktive Statistik den Teil der Statistik bezeichnet, in dem alle Techniken zusammengefasst werden, die es möglich machen von einer Stichprobe auf die Grundgesamtheit zu schließen. Da ich bei meiner Untersuchung nicht alle siegener Schüler der achten Klasse, sondern nur eine Stichprobe dieser betrachte, behandle ich im Folgenden nur die induktive Statistik. Die dafür benötigenden Grundlagen aus der Stochastik und Wahrscheinlichkeitstheorie werden zunächst kurz im Grundlagenkapitel behandelt. Im Anschluss daran sollen die für meine Studie relevante Methoden der Schätzstatistik und Teststatistik behandelt werden. 58 Schulze (2003) S. 4. 22 6. Stochastische Grundlagen Im Folgenden Kapitel sollen die für meine Arbeit relevanten Grundlagen aus der Stochastik und Wahrscheinlichkeitstheorie kurz eingeführt werden. Hierfür halte ich mich im Wesentlichen an die Werke Henze (2003) und Behnen/Neuhaus (1984). 6.1. Allgemeine Grundlagen Definition 1 (Nominales Merkmal) Ein Merkmal heißt nominal, wenn die möglichen Merkmalsausprägungen zwar unterschieden, nicht aber in eine Rangfolge gebracht werden können (vgl. Abbildung a). Definition 2 (Ordinales Merkmal) Ein Merkmal heißt ordinal, wenn sich die möglichen Merkmalsausprägungen in eine Rangfolge bringen lassen und sich mit Namen oder Zahlen bezeichnen lassen. Es müssen jedoch keine Abstände zwischen den Merkmalsausprägungen definiert sein (vgl. Abbildung b). Definition 3 (Metrisches Merkmal) Ein ordinales Merkmal heißt metrisch, wenn die Distanzen zwischen den einzelnen Merkmalen definiert sind (vgl. Abbildung c). A B A ↔ B A < B < C C (a) Nominale Merkmale (b) Ordinale Merkmale ←→ C (c) Metrische Merkmale Abbildung 6.1.: Vergleich nominal, ordinal und metrisch skalierter Merkmale Definition 4 (σ-Algebra und messbarer Raum) Sei S eine Menge. Dann heißt B ⊂ P(S) σ-Algebra über S, wenn gilt S ∈ B, A ∈ B ⇒ Ac ∈ B, [ Ai ∈ B, i ∈ I ⇒ Ai ∈ B. i∈I Das Tupel (S, B) heißt messbarer Raum. 23 6. Stochastische Grundlagen Bemerkung 5 Falls S abzählbar ist, dann ist P(S) eine σ-Algebra. Für S = R wird üblicherweise die borelsche σ-Algebra B verwendet. Diese wird von den Halbstrahlen (−∞, t), t ∈ R erzeugt und enthält u.A. alle offenen, abgeschlossenen, endlichen und abzählbaren Mengen. Definition 6 (Wahscheinlichkeitsmaß und Wahrscheinlichkeitsraum) Sei (S, B) ein messbarer Raum. Dann heißt P : B 7→ [0, 1] Wahrscheinlichkeitsmaß auf (S, B), wenn gilt P (S) = 1 X Bi ∈ B, i ∈ I, p.d. ⇒ P i∈I Bi ! = X P (Bi ). i∈I Das Tripel (S, B, P ) heißt Wahrscheinlichkeitsraum. Definition 7 (Bedingte Wahrscheinlichkeit) Sei (S, B, P ) ein Wahrscheinlichkeitsraum. Sei A ∈ B mit P (A) > 0. Dann ist die bedingte Wahrscheinlichkeit von B gegeben A definiert durch P (B|A) := P (A ∩ B) . P (A) Insbesondere ist die bedingte Verteilung PA := P (•|A) eine Wahrscheinlichkeitsverteilung auf (S, B). Definition 8 (Zufallsvariable) Es seinen (Ω, A, P ) ein Wahrscheinlichkeitsraum und (S, B) ein messbarer Raum. Eine Funktion X : Ω 7→ S heißt Zufallsvariable, wenn X A − B-messbar ist, d. h. wenn gilt ∀B ∈ B : X −1 (B) ∈ A. Dann schreibt man X : (Ω, A) 7→ (S, B). Da die meisten in der Realität vorkommenden Abbildungen messbar sind, wird im Folgenden die Messbarkeit nicht mehr betrachtet. Definition 9 (Verteilung einer Zufallsvariable) Sei (Ω, A, P ) ein Wahrscheinlichkeitsraum, (S, B) ein messbarer Raum und X : Ω 7→ S eine Zufallsvariable. Dann ist L(X) : B 7→ [0, 1], B → P (X −1 (B)) ein Wahrscheinlichkeitsmaß auf (S, B). Dieses heißt Verteilung von X. Man schreibt P (X ∈ B) := L(X)(B) und P (X = x) := L(X)({x}). 24 6. Stochastische Grundlagen Definition 10 (Unabhängigkeit) Die Zufallsvariablen Xi : (Ω, A) 7→ (Si , Bi ), i = 1, 2, . . . , n sind unabhängig, falls gilt P (X1 ∈ B1 , X2 ∈ B2 , . . . , Xn ∈ Bn ) = n Y i=1 P (Xi ∈ Bi ), ∀Bi ∈ Bi . Gilt zusätzlich L(X1 ) = L(X2 ) = · · · = L(Xn ), so bezeichnet man X1 , X2 , . . . , Xn als unabhängig, identische verteilte Zufallsvariablen oder kurz als iid (engl: independent, identical distributed). Definition 11 (Verteilungsfunktion, Dichte) Sei X eine reellwertige Zufallsvariable. Dann ist die Verteilungsfunktion von X definiert durch F : R 7→ [0, 1], x → P (X ≤ x). Ist F differenzierbar, so heißt f = F ′ Dichte von X. Definition 12 (Produktmaß) Seien (Si , Bi , Pi ) mit i = 1, 2, . . . n Wahrscheinlichkeitsräume und Xi ∈ Si Zufallsvariablen. Dann ist die Produkt-σ-Algebra B definiert als die kleinste σ-Algebra, die alle Mengen B1 × B2 × · · · × Bn , Bi ∈ Bi enthält. Das Produktmaß P auf B ist definiert durch P (X1 ∈ B1 , X2 ∈ B2 , . . . , Xn ∈ Bn ) := n Y Pi (Xi = Bi ). i=1 Hat jedes Xi eine Dichte fi , so ist die Poduktdichte f : Rn 7→ R definiert durch f (x1 , x2 , . . . , xn ) := n Y fi (xi ) i=1 die Dichte des Produktmaßes. Satz 13 Die Zufallsvariablen X1 , X2 , . . . , Xn sind genau dann unabhängig, wenn der Vektor (X1 , X2 , . . . , Xn ) nach dem Produktmaß verteilt ist. Definition 14 (Quantil) Sei X eine Zufallsvariable mit Verteilungsfunktion F . Dann ist die Quantilfunktion F −1 definiert durch F −1 : (0, 1) 7→ R, p → inf{x ∈ R : F (x) ≥ p}. Der Wert F −1 (p) wird als p-Quantil von F bzw. X bezeichnet. 25 6. Stochastische Grundlagen Definition 15 (Erwartungswert) Für eine stetige, reellwertige Zufallsvariable X mit Dichte f ist der Erwartungswert E(X) definiert durch Z ∞ E(X) := −∞ x · f (x)dx. Für eine diskrete, reellwertige Zufallsvariable X : Ω 7→ S ⊂ R ist der Erwartungswert E(X) definiert durch X X E(X) := X(ω)P (ω) = x · P (X = x). ω∈Ω x∈S Definition 16 (Varianz, Standardabweichung) Sei X eine Zufallsvariable, so dass der Erwartungswert E(X) existiert, dann bezeichnet V ar(X) := E(X − E(X))2 = E(X 2 ) − (E(X))2 die Varianz von X. Die Standardabweichung σ ist definiert durch p σ := V ar(X). Satz 17 Seien α, β ∈ R und X und Y reellwertige Zufallsvariablen. Der Erwartungswert ist linear, d. h. es gilt E(αX + βY ) = αE(X) + βE(Y ), wenn die rechte Seite definiert ist. Für die Varianz gilt V ar(αX) = α2 V ar(X) und, falls X und Y unabhängig sind, V ar(X + Y ) = V ar(X) + V ar(Y ). Zentraler Grenzwertsatz Seien in diesem Abschnitt X1,n , X2,n , . . . Xn,n n ∈ N unabhängige Zufallsvariablen 2 mit E(Xi,n ) = 0 (sonst ersetze Xi,n durch Xi,n − EXi,n ) und σi,n = E(Xi,n )2 ∈ (0, ∞). Dann definiere τn2 := E n X i=1 26 !2 Xi,n . 6. Stochastische Grundlagen Die Lindeberg-Bedingung ist ∀ε > 0 : lim E n→∞ Xi,n τn 2 1n Xi,n >εo τn ! = 0. Satz 18 (Zentraler Grenzwertsatz) Ist Φ die Verteilungsfunktion der Normalverteilung, so gilt unter Lindebergbedingung ! n 1 X ∀x ∈ R : P Xi,n ≤ x → Φ(x), n → ∞. τn i=1 Bemerkung 19 Sind X1 , X2 , . . . iid Zufallsvariablen mit µ = E(Xi ) und σ 2 := (Xi − µ)2 ∈ (0, ∞), so erfüllen Xi − µ die Lindebergbedingung und es folgt ! ! √ n n 1X ∀x ∈ R : P Xi − µ ≤ x → Φ(x), n → ∞. σ n i=1 6.2. Konkrete Wahrscheinlichkeitsverteilungen Hier an dieser Stelle werden die für meine Arbeit wichtigen Wahrscheinlichkeitsverteilungen behandelt. Dabei ist anzumerken, dass es noch viele weitere Wahrscheinlichkeitsverteilungen gibt, die aber an dieser Stelle nicht erwähnt werden. 6.2.1. Diskrete Verteilungen Binomialverteilung Die Binomialverteilung Bn,p beschreibt die Anzahl der Erfolge beim n-maligen Münzwurf mit der Erfolgswahrscheinlichkeit p. n k Zähldichte: P (X = k) = Bn,p (k) = p (1 − p)n−k k Träger: TX = {0, 1, . . . , n} Erwartungswert: E(X) = np Varianz: V ar(X) = np(1 − p) 27 6. Stochastische Grundlagen Diskrete Gleichverteilung Die diskrete Gleichverteilung GS ordnet jedem Element der Menge S = {x1 , x2 , . . . , xn } die gleiche Wahrscheinlichkeit zu. Erwartungswert und Varianz sind nur für S ⊂ R definiert. Zähldichte: P (X = xk ) = Träger: TX = S 1 n n Erwartungswert: 1X E(X) = xk n k=1 Hypergeometrische Verteilung Die hypergeometrische Verteilung Hypn,r,s mit Parametern n, r und s beschreibt das n-malige Ziehen ohne Zurücklegen aus einer Urne mit r roten und s schwarzen Kugeln. s r k n−k r+s n Zähldichte: P (X = xk ) = Träger: TX = {max(0, n − s), . . . , min(r, n)} n·r E(X) = r+s Erwartungswert: 6.2.2. Stetige Verteilungen Stetige Gleichverteilung Die stetige Gleichverteilung Ra,b ist die Gleichverteilung auf dem Intervall [a, b]. Dichte: Verteilungsfunktion: Träger: Erwartungswert: Varianz: 1[a,b] (x) b − a 0 für x < a x−a F (x) = b−a für a ≤ x < b 1 für b ≤ x f (x) = TX = [a, b] a+b E(X) = 2 1 V ar(X) = (b − a)2 12 28 6. Stochastische Grundlagen Normalverteilung Die Normalverteilung Nµ,σ2 hängt von dem Mittelwert µ und der Varianz σ 2 ab. Die Normalverteilung N0,1 wird als Standardnormalverteilung bezeichnet. 1 Dichte: f (x) = √ Träger: Erwartungswert: Varianz: TX = R E(X) = µ V ar(X) = σ 2 2πσ 2 e− (x−µ)2 2σ 2 χ2 -Verteilung Die χ2 -Verteilung χ2k mit k Freiheitsgraden ist die Verteilung der Summe von k quadrierten standartnormalverteilten Zufallsvariablen. k Dichte: Träger: Erwartungswert: Varianz: x x 2 −1 e− 2 f (x) = 1[0,∞)(x) · k k 22Γ 2 TX = [0, ∞) E(X) = n V ar(X) = 2n 29 7. Parameterschätzung 7.1. Punktschätzung Die in diesem Kapitel beschriebende Punktschätzung ist im Wesentlichen beschrieben nach Cramer (2003) S. 65f und Fahrmeir et al. (2004) S. 364ff. Bei der Punktschätzung soll ein spezieller Wert, der für ein betrachtetes Merkmal charakteristisch ist, für die Grundgesamtheit geschätzt werden. Definition 20 (Punktschätzung) Sei X ∈ S ein Merkmal, dessen Verteilung Q aus einer Familie Q von Wahrscheinlichkeitsmaßen über S stammt. Sei T : Q 7→ K eine Abbildung, die jedem Q ∈ Q einen Kennwert T (Q) zuordnet. Seien X1 , X2 , . . . , Xn iid eine Stichprobe. Eine Punktschätzung ist eine Abbildung Tˆn : S n 7→ K. Für ein Stichprobenergebnis x1 , x2 , . . . , xn ist Tˆn (x1 , x2 , . . . , xn ) ein Schätzwert für T (Q). Ist die Abbildung T bijektiv, so nennt man T eine Parametrisierung von Q. Dann bezeichnet man Θ := K als Parameterraum und bezeichnet zu jedem ϑ ∈ Θ mit Qϑ die eindeutig bestimmte Verteilung Qϑ ∈ Q mit T (Qϑ ) = ϑ. Den Schätzer bezeichnet man als ϑˆn := Tˆn . Bemerkung 21 Der Kennwert kann z. B. der Erwartungswert, die Varianz oder einfach ein Parameter einer Wahrscheinlichkeitsverteilung sein. Nicht jeder Schätzer ist sinnvoll. Um die Qualität des Schätzers beurteilen zu können, sind Kriterien zu definieren, welcher ein Schätzer sinnvollerweise erfüllen sollte. Zu diesen Kriterien zählt die Erwartungstreue und die Konsistenz eines Schätzers. 7.1.1. Gütekriterien Die beschriebenen Gütekriterien sind nachzulesen in Cramer (2003) S. 65ff und Fahrmeir et al. (2004) S. 367ff. 30 7. Parameterschätzung 7.1.1.1. Erwartungstreue Definition 22 (Erwartungstreue) Ein Schätzer Tˆn heißt erwartungstreu, falls für jedes Q ∈ Q gilt: E Tˆn = T (Q) In der Regel ist es jedoch nicht notwendig, dass ein Schätzer Tˆn erwartungstreu ist. Die meisten Ergebnisse der mathematischen Statistik gelten erst asymptotisch, also wenn der Stichprobenumfang ins unendliche wächst. Daher reicht es aus, wenn die Erwartungstreue im Grenzwert gilt. Definition 23 (Asymptotische Erwartungstreue) Ein Schätzer Tˆn heißt asymptotisch erwartungstreu, falls für jedes Q ∈ Q gilt: lim E Tˆn = T (Q) n→∞ Damit der Schätzer Tˆn numerisch berechenbar ist, darf Tˆn natürlich nicht von dem unbekannten Wert T (Q) abhängen! Bei zwei oder mehr erwartungstreuen Schätzern ist derjenige, mit der kleineren Varianz zu bevorzugen. Ist ein Schätzer nicht erwartungstreu, führt die Punktschätzung zu verzerrten Schätzungen. In der Mathematik spricht man bei Verzerrungen auch von Bias. Definition 24 (Bias) Für einen Schätzer Tˆn ist der Bias definiert durch ˆ Bias Tn := E Tˆn − T (Q). 7.1.1.2. Konsistenz Definition 25 (Mittlere quadratische Abweichung) Für einen Schätzer Tˆn heißt 2 ˆ ˆ mqA Tn = E Tn − T (Q) mittlere quadratische Abweichung. Definition 26 (Konsistenz) Ein asymptotisch erwartungstreuer Schätzer Tˆn heißt konsistent, falls für jedes Q ∈ Q gilt: lim mqA Tˆn = 0. n→∞ 31 7. Parameterschätzung Satz 27 Für einen erwartungstreuer Schätzer Tˆn gilt ˆ mqA Tn = V ar Tˆn . Für einen asymptotischen erwartungstreuen Schätzer gilt lim mqA Tˆn = lim V ar Tˆn . n→∞ n→∞ Beweis. Für erwartungstreue Schätzer gilt E Tˆn = T (Q) und somit 2 2 mqA Tˆn = E Tˆn − T (Q) = E Tˆn − E Tˆn = V ar Tˆn . Für asymptotisch erwartungstreue Schätzer gilt lim E Tˆn = T (Q) und somit n→∞ lim mqA Tˆn n→∞ 2 = lim E Tˆn − T (Q) n→∞ 2 =E lim Tˆn − lim E Tˆn n→∞ n→∞ 2 =E lim Tˆn − E Tˆn n→∞ 2 = lim E Tˆn − E Tˆn n→∞ = lim V ar Tˆn . n→∞ Korollar 28 Ein asymptotisch erwartungstreuer Schätzer ist konsistent, wenn die Varianz gegen Null konvergiert. Beweis. Sei Tˆn ein asymptotisch erwartungstreuer Schätzer. Nach Satz 27 gilt lim V ar Tˆn = 0 ⇔ lim mqA Tˆn = 0 n→∞ n→∞ Beispiel 29 Das arithmetische Mittel ist ein erwartungstreuer, konsistenter Schätzer für den Mittelwert. Beweis. Sei X1 , X2 , . . . , Xn eine iid Stichprobe mit L(X1 ) = L(X2 ) . . . = L(Xn ) =: L(X). 32 7. Parameterschätzung Dann gilt die Erwartungstreue wegen: n E Tˆn = E = 1X Xi n i=1 ! n 1X E(Xi ) n i=1 n 1X = E(X) = E(X) = m(L(X)) n i=1 Weiter gilt die Konsistenz wegen: n lim V ar Tˆn = lim V ar n→∞ n→∞ 1X Xi n i=1 ! ! 2 n X 1 = lim V ar Xi n→∞ n i=1 2 X n 1 = lim V ar (Xi ) n→∞ n i=1 1 · V ar (X) = 0 n→∞ n = lim 7.1.2. Konstruktion von Schätzfunktionen Bisher wurde der Punktschätzer und seine wünschenswerten Eigenschaften beschrieben. Im folgenden Abschnitt soll die Herkunft einer Schätzfunktion geklärt werden. Hierfür sollen zwei Methoden, zum einen die Momentenmethode und zum anderen die Maximum-Likelihood-Methode, wie man eine Schätzfunktion für einen unbekannten Parameter ϑ findet, erklärt werden. Beide Methoden stützen sich zum Großteil auf die Werke von Hansen (1977) S. 157f, Fahrmeir et al. (2004) S. 376ff und Hartung (1982) S. 126f. 7.1.2.1. Momentenmethode Die Momentenmethode ist eine der ältesten Schätztechniken. Die Momentenmethode ist in der indirekten Statistik ein Schätzverfahren, mit dem die Parameter einer theoretischen Verteilung einer Grundgesamtheit geschätzt werden können. Hierbei werden die Parameter in Abhängigkeit von den Momenten der Verteilung ausgedrückt. Den Momentschätzer erhält man, in dem man die empirischen Momente anstelle der Momente in die Gleichung einsetzt. Anschließend erhält man eine Schätzung des entsprechenden Parameters der theoretischen Verteilung, indem man die Werte der Stichprobe in den Momentschätzer einsetzt. In der Anwendung ist die Momentenmethode sehr einfach, die daraus resultierenden Schätzer sind jedoch nicht immer erwartungstreu. 33 7. Parameterschätzung Definition 30 (Moment) Das r-te Moment µr mit r = 0, 1, 2, . . . der Zufallsvariable X ist definiert durch µr = E (X r ) . Definition 31 (Empirischer Moment) Den Schätzer n 1X r mˆn,r = X n i=1 i für das Moment µr bezeichnet man als empirisches Moment. Definition 32 (Momentschätzer) Hängt der unbekannten Parameter ϑ durch den funktionalen Zusammenhang ϑ = h(µ1 , µ2 , . . . , µk ) von den Momenten µi ab, so bezeichnet man ϑˆnn = h(mˆn,1 , mˆn,2, . . . , mˆn,k ) als Momentschätzer. Beispiel 33 Im Folgenden soll die Varianz geschätzt werden. V ar (X) =E (X − EX)2 =E X 2 − 2XEX + (EX)2 =E X 2 − 2 (EX)2 + (EX)2 =E X 2 − (EX)2 =µ2 − µ21 Somit ist der Momentschätzer für die Varianz n ϑˆnn 1X 2 X − = n i=1 i n 1X Xi n i=1 !2 7.1.2.2. Die Maximum-Likelihood-Methode Die Maximum-Likelihood-Methode ist eines der bekanntesten und am häufigsten verwendeten Verfahren zur möglichst genauen Schätzung einer Verteilung auf der Grundlage der Stichprobenwerte. Maximum-Likelihood-Methode für diskrete Wahrscheinlichkeitsverteilungen Bei der diskreten Maximum-Likelihood-Methode versucht man seinen Schätzer so zu konstruieren, dass die Wahrscheinlichkeit, des zu schätzenden Kennwertes, möglichst maximal ist. Definition 34 (Maximum-Likelihood-Schätzer (ML-Schätzer)) Sei Q = {Qϑ : ϑ ∈ Θ} eine parametrisierte Familie von diskreten Wahrscheinlichkeitsmaßen. Ein Schätzer ϑˆn : S n 7→ Θ heißt Maximum-Likelihood-Schätzer, wenn 34 7. Parameterschätzung für jede Stichprobe X1 , X2 , . . . , Xn gilt: n Qϑˆn (X1 ,X2 ,...,Xn ) (X1 , X2 , . . . , Xn ) = max(Qϑ )n (X1 , X2 , . . . , Xn ). ϑ∈Θ Das bedeutet, ein Schätzer ist genau dann ein ML-Schätzer, wenn für jedes Stichprobenergebnis x1 , x2 , . . . , xn die Wahrscheinlichkeit dieses Ergebnisses maximal für die geschätzte Verteilung ist. Für eine iid Stichprobe X1 , X2 , . . . , Xn , deren Verteilung Qϑ von einem unbekannten Parameter ϑ abhängt, kann mit dem Maximum-Likelihood-Prinzip der ML-Schätzer berechnet werden. Dazu definiert man die Likelihood-Funktion L : Θ 7→ [0, 1], die für jeden Parameter ϑ die Wahrscheinlichkeit des Eintretens der Stichprobe unter der Verteilung Qϑ berechnet. Die Likelihood-Funktion L(ϑ) errechnet sich wie folgt über das Produktmaß: L(ϑ) =L(X1 , X2 , . . . , Xn )(X1 , X2 , . . . , Xn ) =(Qϑ )n (X1 , X2 , . . . , Xn ) n Y = Qϑ (Xi ) i=1 Um einen ML-Schätzer zu erhalten ist die Likelihood-Funktion in Abhängigkeit von ϑ zu maximieren. Dieses erfolgt, indem man die Nullstelle der ersten Ableitung von L(ϑ) bestimmt. Um zu überprüfen, ob es sich tatsächlich um ein Maximum handelt, ist noch die zweite Ableitung zu bilden. Wenn sich jedoch aus Plausibilitätsüberlegungen direkt das Maximum bestimmen lässt verzichtet man in der Regel auf diesen Rechenschritt. Da das Ableiten von L(ϑ) sehr kompliziert und aufwändig werden kann, wird häufig auch die logarithmierte Likelihood-Funktion l(ϑ) = n X ln(Qϑ (Xi )) i=1 verwendet, da sie ihr Maximum an derselben Stelle wie die nicht-logarithmierte Likelihood-Funktion besitzt. Beispiel 35 (ML-Schätzer für B1,p -Verteilung) Seien X1 , X2 . . . , Xn eine iid-Stichprobe mit L(Xi ) = B1,p . Dann ist n 1X ϑˆn (X1 , X2 , . . . , Xn ) = Xi n i=1 der ML-Schätzer für ϑ = p. 35 7. Parameterschätzung Beweis. Die Likelihood-Funktion L ist gegeben durch L(p) = n Y B1,p (Xi ) i=1 = n Y (pXi + (1 − p)(1 − Xi )) i=1 Pn =p i=1 Pn Xi · (1 − p) Pn i=1 (1−Xi ) = p i=1 Xi · (1 − p)n− = ps · (1 − p)n−s Pn i=1 wobei in der letzten Umformung die Substitution s := Xi Pn i=1 Xi verwendet wurde. Für s = 0 hat L(p) = (1 − p)n offenbar ein Maximum bei p = 0, für s = n hat L(p) = pn ein Maximum bei p = 1. Daher sei im Folgenden 1 ≤ s ≤ n − 1. Für die erste Ableitung von L ergibt sich L′ (p) = sps−1 (1 − p)n−s − ps (n − s)(1 − p)n−s−1 = ps−1 (1 − p)n−s−1 (s(1 − p) − (n − s)p) = ps−1 (1 − p)n−s−1 (s − np). Daher folgt L′ (p) = 0 ⇔ ps−1 (1 − p)n−s−1(s − np) = 0 ⇔ (p = 0 ∧ s ≥ 2) ∨ (p = 1 ∧ s ≤ n − 2) ∨ s = np. Wegen L(0) = L(1) = 0 hat L das Maximum für s = np, also bei n s 1X p= = Xi . n n i=1 Maximum-Likelihood-Methode für stetige Wahrscheinlichkeitsverteilungen Definition 36 (Maximum-Likelihood-Schätzer (ML-Schätzer)) Sei Q = {Qϑ : ϑ ∈ Θ} eine parametrisierte Familie von stetigen Wahrscheinlichkeitsmaßen Qϑ mit der Dichte fϑ . Ein Schätzer ϑˆn : S n 7→ Θ heißt MaximumLikelihood-Schätzer, wenn für jede iid Stichprobe X1 , X2 , . . . , Xn gilt: n Y fϑˆn (X1 ,X2 ,...,Xn ) (Xi ) = max ϑ∈Θ i=1 36 n Y i=1 fϑ (Xi ) 7. Parameterschätzung Für stetige Wahrscheinlichkeitsverteilungen ergibt sich die Likelihood-Funktion wie folgt aus der Produktdichte: L(ϑ) = n Y fϑ (Xi ) (7.1) i=1 Die Maximierung der Likelihood-Funktion für stetige Verteilungen erfolgt analog zum diskreten Fall. Als logarithmierte Likelihood-Funktion für stetige Verteilungen ergibt sich l(ϑ) = n X ln fϑ (Xi ). i=1 7.2. Intervallschätzung Während die Punktschätzung einen konkreten Wert für einen unbekannten Kennwert T (Q) liefert, welcher häufig nicht der Realität entspricht, bestimmt das Konfidenzintervall einen Bereich, in dem sich der unbekannte Wert T (Q) mit einer zuvor festgelegten Wahrscheinlichkeit befindet. Das Konfidenzintervall, auch Vertrauensintervall genannt, sagt somit etwas über die Genauigkeit der Schätzung aus. Wie schon die Punktschätzung hängt auch das Konfidenzintervall von der vorausgesetzten Verteilungsannahme ab. Die nachstehend beschriebende Intervallschätzung stützt sich im Wesentlichen auf Cramer (2003) S. 70ff, Fahrmeir et al. (2004) S. 385ff und Hartung (1982) S. 129ff. Definition 37 (Konfidenzintervall) Sei X ∈ S ein Merkmal, dessen Verteilung Q aus einer Familie Q von Wahrscheinlichkeitsmaßen über S stammt. Seien T : Q 7→ K ⊂ R eine Abbildung, die jedem Q ∈ Q einen Kennwert T (Q) zuordnet. Seien X1 , X2 , . . . , Xn eine iid Stichprobe. Es gebe Abbildungen Ûn : S n 7→ K ∪{−∞} und Ôn : S n 7→ K ∪ {∞} mit ∀(x1 , x2 , . . . , xn ) ∈ S n : Ûn (x1 , x2 , . . . , xn ) ≤ Ôn (x1 , x2 , . . . , xn ). Gilt für eine Wahrscheinlichkeit (1 − α) P (Ûn ≤ T (Q) ≤ Ôn ) ≥ 1 − α, so ist [Ûn , Ôn ] ein (1 − α)-Intervallschätzer für T (Q). Für ein Stichprobenergebnis (x1 , x2 , . . . , xn ) heißt [u, o] := [Ûn (x1 , x2 , . . . , xn ), Ôn (x1 , x2 , . . . , xn )] (1 − α)-Konfidenzintervall für T (Q). 37 7. Parameterschätzung Für eine Realisation (x1 , x2 , . . . , xn ) liegt der zu schätzende Wert T (Q) mit einer Wahrscheinlichkeit von 1 − α in dem Intervall [u, o]. Somit ist u eine untere und o eine obere Schranke für den zu schätzenden Wert. Definition 38 (Einseitiges Konfidenzintervall) Ist konstant Ûn := −∞, bzw. Ôn := ∞ definiert, so heißt [−∞, Ôn ] bzw. [Ûn , ∞] einseitiger Intervallschätzer. Das zugehörige Konfidenzintervall [−∞, o] bzw. [u, ∞] heißt einseitiges Konfidenzintervall. Bemerkung 39 Das a priori festgelegte Signifikanzniveau α sowie das Konfidenzniveau 1 − α beschreibt den Informationsgehalt eines Ereignisses bzw einer Messung. Übliche Werte für das Signifikanzniveau α ist α = 0, 1 sowie α = 0, 05 oder α = 0, 01. Je geringer das Signifikanzniveau ist, desto höher ist der Informationsgehalt. In der Praxis gibt es zwei Möglichkeiten, ein Konfidenzintervall zu ermitteln: Zum einen das approximative Konfidenzintervall und zum anderen das exakte Konfidenzintervall. Das exakte Konfidenzintervall ist jedoch nur für spezielle Verteilungen zu bestimmen. Das Verfahren des approximativen Konfidenzintervalls findet seine Anwendung bei großen Stichproben. Dieses Verfahren benutzt den Zentralen Grenzwertsatz für die Schätzung des Intervalls. Da der Zentrale Grenzwertsatz nur für große Stichprobenumfänge geeignet ist, wird bei kleinen Stichprobengrößen – falls möglich – das exakte Konfidenzintervall bestimmt. 7.2.1. Intervallschätzer für den Erwartungswert Sei X1 , X2 , . . . , Xn eine iid Stichprobe mit L(Xi ) = L(X) = Q. Ist T (Q) := E(X) = µ, d. h. der Mittelwert der Verteilung Q zu Schätzen, so lässt sich bei bekannter Varianz σ 2 = V ar(X) ein Konfidenzintervall für E(X) konstruieren. P Es ist T̂n (X1 , X2 , . . . , Xn ) := ni=1 Xi ein Schätzer für E(X). Nach dem zentralen Grenzwertsatz ist dann für große Stichprobenumfänge √ n P (T̂n (X1 , X2 , . . . , Xn ) − µ) ≤ x ≈ Φ(x) σ √ n ⇒P x≤ (T̂n (X1 , X2 , . . . , Xn ) − µ) ≤ y ≈ Φ(y) − Φ(x) σ Verwendet man nun für x den Wert u α2 und für y den Wer u1− α2 , so ist P √ n u α2 ≤ (T̂n (X1 , X2 , . . . , Xn ) − µ) ≤ u1− α2 σ 38 ≈ 1 − α. 7. Parameterschätzung Mit u α2 = −u1− α2 und den Äquivalenzen √ n (T̂n (X1 , X2 , . . . , Xn ) − µ) ≤ u1− α2 u α2 ≤ σ σ σ ⇔ − √ u1− α2 ≤ T̂n (X1 , X2 , . . . , Xn ) − µ ≤ √ u1− α2 n n σ σ ⇔ T̂n (X1 , X2 , . . . , Xn ) − √ u1− α2 ≤ µ ≤ T̂n (X1 , X2 , . . . , Xn ) + √ u1− α2 n n folgt σ σ P T̂n (X1 , X2 , . . . , Xn ) − √ u1− α2 ≤ µ ≤ T̂n (X1 , X2 , . . . , Xn ) + √ u1− α2 ≈ 1 − α. n n Somit ist σ σ [Ûn , Ôn ] = T̂n (X1 , X2 , . . . , Xn ) − √ u1− α2 , T̂n (X1 , X2 , . . . , Xn ) + √ u1− α2 n n ein approximatives Konfidenzintervall für den Mittelwert µ. Ist die Varianz σ 2 nicht bekannt, so wird sie mittels des erwartungstreuen Schätzers v u n u 1 X t σ̂ := (Xi − T̂n (X1 , X2 , . . . , Xn ))2 n − 1 i=1 geschätzt. Für das approximative Konfidenzintervall ergibt sich: σ̂ σ̂ [Ûn , Ôn ] = T̂n (X1 , X2 , . . . , Xn ) − √ u1− α2 , T̂n (X1 , X2 , . . . , Xn ) + √ u1− α2 (7.2) n n 39 8. Hypothesentest Im Wesentlichen stütze ich mich im folgenden Kapitel hauptsächlich auf Vogel (1997) S. 223ff, Cramer (2003) S. 83ff, Hartung (1982) S. 133ff und Witting (1978) S. 102ff. 8.1. Grundidee statistischer Tests Der statistische Test, häufig auch einfach als Hypothesentest bezeichnet, ist ein Verfahren der Inferenzstatistik, welcher auf einer Stichprobe X1 , X2 , . . . , Xn basierend eine Aussage trifft, ob eine formulierte Hypothese für eine Grundgesamtheit anzunehmen oder abzulehnen ist. Er ist neben dem Schätzen von Kennwerten (Parametern) theoretischer Verteilungen für eine Grundgesamtheit in der empirischen Sozialforschung von zentralem Interesse. Zu Beginn eines statistischen Tests muss das Testproblem formuliert werden. Hierbei wird die Hypothese, welche auf ihre Gültigkeit zu prüfen ist, als Alternativhypothese HA und die ihr gegenübergestellte, die gegenteilige Aussage, als Nullhypothese H0 bezeichnet. Wichtig hierbei ist, dass sich die Aussagen der Alternativhypothese und Nullhypothesen gegenseitig ausschließen. Da die untersuchte Stichprobe zufälligen Einflüssen ausgesetzt ist, führt die Methode nicht notwendigerweise zur richtigen Entscheidung und Fehlentscheidungen können auftreten, weshalb eine absolut gültige Aussage nicht möglich ist. Demnach können folgende Ausgänge eines statistischen Tests eintreten: Ergebnis des Testverfahrens H0 richtig HA richtig In der Grundgesamtheit ist richtig Nullhypothese H0 Alternativhypothese HA korrekte Entscheidung Fehler 2. Art Fehler 1. Art korrekte Entscheidung Wie in der Abbildung gezeigt können 2 Arten von Fehlentscheidungen auftreten. Definition 40 (Fehler 1. Art, Fehler 2. Art) Bei einem statistischen Testproblem H0 gegen HA und einem geeigneten statistischen Test spricht man von einem • Fehler 1. Art (α-Fehler), wenn H0 verworfen wird, obwohl H0 wahr ist, • Fehler 2. Art (β-Fehler), wenn H0 beibehalten wird, obwohl HA wahr ist. 40 8. Hypothesentest Der Fehler 1. Art wird in der Realität als schwerwiegender angesehen als der Fehler 2. Art. Unter dem Fehler 1. Art versteht man das Annehmen einer Hypothese, obwohl sie falsch ist und bei einem Fehler 2. Art lehnt man eine Hypothese ab, obwohl sie eigentlich wahr ist. Hieraus folgt die Ungleichbehandlung des Fehlers 1. und 2. Art. Um schwerwiegende Fehler zu vermeiden, werden statistische Tests so konstruiert, dass die Wahrscheinlichkeit für das Auftreten des Fehlers 1. Art durch eine kleine obere Schranke kontrolliert wird. Diese obere Schranke wird auch als Signifikanzniveau α bezeichnet. Übliche Werte hierfür sind α = 0, 1; 0, 05; 0, 01. Die Verwerfung der H0 -Hypothese ist somit durch das Signifikanzniveau α kontrolliert. Die Wahrscheinlichkeit für das Auftreten des Fehlers 2. Art wird jedoch nicht kontrolliert. Definition 41 (Signifikanztest) Ein statistischer Test heißt Signifikanztest zum Signifikanzniveau α mit 0 < α < 1, falls gilt P (HA annehmen |H0 wahr ) ≤ α d. h. P (Fehler 1. Art) ≤ α. Es ist jedoch zu sagen, dass die Fehlerwahrscheinlichkeit für den Fehler 2. Art wächst, je kleiner α gewählt wird. Aus diesem Grund ist bei der Wahl des statistischen Testverfahrens darauf zu achten, daß die Fehlerwahrscheinlichkeit 2. Art bei vorgegebener Fehlerwahrscheinlichkeit 1. Art möglichst gering ist. 8.2. Binomialtest Grundlage des Binomialtest ist eine iid Stichprobe X1 , X2 , . . . , Xn mit zwei Merkmalsausprägungen, welche mit 0 und 1 bezeichnet werden. Jedes Merkmal Xi ist dann B1,p -verteilt. Zu einer vorgegebenen Wahrscheinlichkeit p0 können nun folgende Hypothesenpaare überprüft werden. Für das erste Hypothesenpaar gilt: H0 : Die Erfolgswahrscheinlichkeit von Xi ist größer oder gleich p0 (i. Z. p ≥ p0 ). HA : Die Erfolgswahrscheinlichkeit von Xi ist kleiner als p0 (i. Z. p < p0 ). Oder umgekehrt für das zweite Hypothesenpaar: H0 : Die Erfolgswahrscheinlichkeit von Xi ist kleiner oder gleich p0 (i. Z. p ≤ p0 ). HA : Die Erfolgswahrscheinlichkeit von Xi ist größer als p0 (i. Z. p > p0 ). 8.2.1. Exakter Binomialtest Die Idee des exakten Binomialtests ist, unter Annahme der Nullhypothese die Wahrscheinlichkeit eines Ergebnisses zu bestimmen, welches die Alternativhypothese mindestens so sehr bestätigt wie das vorliegende Ergebnis E := x1 , x2 , . . . , xn . P Zu einer Stichprobe X1 , X2 , . . . , Xn sei Y := ni=1 Xi die Anzahl der Erfolge. Sei e die Anzahl der Erfolge in E. 41 8. Hypothesentest Die Wahrscheinlichkeit für ein Ergebnis mit Y = k Erfolgen ist unter Annahme der Nullhypothese n k P (Y = k) = Bn,p0 (k) = p0 (1 − p0 )n−k . k Für das erste Hypothesenpaar bestätigt jedes Ergebnis mit Y = k ≤ e Erfolgen die Alternativhypothese mindestens so sehr wie E. Die Gesamtwahrscheinlichkeit für irgend ein Ergebnis mit Y = k ≤ e Erfolgen unter Annahme der Nullhypothese ist e e X X n k P (Y ≤ e) = Bn,p0 (k) = p0 (1 − p0 )n−k . k k=0 k=0 Die Nullhypothese wird zu einem Signifikanzniveau α verworfen, falls P (Y ≤ e) < α ist. Mit bu,α wird der kleinste Wert für e bezeichnet, so dass die Nullhypothese nicht mehr verworfen werden kann, d. h. bu,α ist diejenige Zahl, für die gilt P (Y ≤ bu,α − 1) ≤ α < P (Y ≤ bu,α ) bu,α −1 bu,α X n X n k k n−k ⇔ p0 (1 − p0 ) ≤α< p0 (1 − p0 )n−k . k k k=0 k=0 (8.1) Die Nullhypothese kann somit genau für Ergebnisse mit e < bu,α Erfolgen abgelehnt werden, bu,α wird daher als kritische untere Schranke bezeichnet. Für das zweite Hypothesenpaar bestätigt jedes Ergebnis mit Y = k ≥ e Erfolgen die Alternativhypothese mindestens so sehr wie E. Die Nullhypothese kann zu einem Signifikanzniveau α verworfen werden, wenn gilt P (Y ≥ e) = n X k=e n X n k Bn,p0 (k) = p (1 − p0 )n−k < α. k 0 k=e Mit bo,1−α wird der größte Wert für e bezeichnet, so dass die Nullhypothese nicht mehr verworfen werden kann, d. h. bo,1−α ist diejenige Zahl für die gilt ⇔ n X k=bo,1−α P (Y ≥ bo,1−α + 1) ≤ α < P (Y ≤ bo,1−α ) n X n k n k n−k p0 (1 − p0 ) ≤α< p0 (1 − p0 )n−k . k k +1 k=b o,1−α Die Nullhypothese kann somit genau für Ergebnisse mit e > bo,1−α Erfolgen abgelehnt werden, bo,1−α wird daher als kritische obere Schranke bezeichnet. 42 8. Hypothesentest Diese Darstellung der oberen Schranke lässt sich umformen zu P (Y ≥ bo,1−α + 1) ≤ α < P (Y ≤ bo,1−α ) n n X X n k n k n−k ⇔ p0 (1 − p0 ) ≤α< p0 (1 − p0 )n−k k k k=b +1 k=b o,1−α o,1−α bo,1−α −1 X n X n k k n−k ⇔ 1− p0 (1 − p0 ) ≤α<1− p0 (1 − p0 )n−k k k k=0 k=0 bo,1−α bo,1−α −1 X n X n k ⇔ pk0 (1 − p0 )n−k − 1 ≥ −α > p (1 − p0 )n−k − 1 k k 0 k=0 k=0 bo,1−α bo,1−α −1 X X n n k ⇔ p0 (1 − p0 )n−k < 1 − α ≤ pk0 (1 − p0 )n−k . k k k=0 k=0 bo,1−α Zusammenfassend gilt für die Entscheidungsvorschrift H0 p ≥ p0 p ≤ p0 HA p < p0 p > p0 H0 wird abgelehnt, falls e < bu,α e > bo,1−α Tabelle 8.1.: Entscheidungsregeln für den exakten Binomialtest Bemerkung 42 Ein Problem dieses Tests sehe ich darin, dass die Wahrscheinlichkeit p0 nicht fest vorgegeben ist, sondern geschätzt wird. Dieses bringt eine zusätzliche Testungenauigkeit. 8.3. Vergleich zweier relativer Häufigkeiten Der im Folgenden beschriebene Test, welcher sich im Wesentlichen auf Cramer (2003) S. 89 stützt, vergleicht die Erfolgswahrscheinlichkeit von B1,p -verteilten Merkmalen. Hierzu seien X1 , X2 , . . . , Xn verteilt nach B1,p1 und Y1 , Y2 , . . . , Ym verteilt nach B1,p2 stochastisch unabhängige iid Stichproben. Dazu definiert man n d := m 1X 1 X Xi − Yj , n i=1 m j=1 1 p := n+m n X Xi + i=1 j=1 und die Prüfstatistik V := d p(1 − p) 1 n 43 + m X 1 m . Yj ! 8. Hypothesentest Für die Entscheidungsregeln ergibt sich mit dem Quantil u1−α der Standardnormalverteilung: H0 p1 ≤ p2 p1 ≥ p2 HA p1 > p2 p1 < p2 H0 wird abgelehnt, falls V > u1−α V < −u1−α Tabelle 8.2.: Entscheidungsregeln zum Vergleich zweier Wahrscheinlichkeiten Dieses ist plausibel, da V umso größer wird, je größer die Differenz d zwischen p1 und p2 ist. Daher ist ein großer Wert für V ein Indikator dafür, dass tatsächlich p1 > p2 ist. Entsprechend ist bei kleinen Werten V wahrscheinlich p1 < p2 . 8.4. χ2-Anpassungstest Der im Folgenden beschriebende χ2 -Anpassungstest stützt sich hauptsächlich auf Cramer (2003) S. 99f. Der χ2 -Anpassungstest dient zur Überprüfung der Verteilungseigenschaften einer statistischen Grundgesamtheit, d. h. der Test überprüft, ob die Daten einer bestimmten Verteilung entsprechen. Die Kenntnis der Wahrscheinlichkeitsverteilung ist notwendig für die Durchführung eines Hypothesentests. Bei dem χ2 Anpassungstest wird ein Merkmal x betrachtet, dessen Wahrscheinlichkeitsverteilung in der Grundgesamtheit unbekannt ist. Hierbei wird folgende Nullhypothese aufgestellt: H0 : Das Merkmal X hat die Wahrscheinlichkeitsverteilung Q. Zur Durchführung des Tests ist es notwendig, die Daten zu kategorisieren. Dazu wird eine endliche disjunkte Überdeckung (Mj )j=1,2,...,m des Grundraums definiert. Die q Daten werden somit zu m Klassen zusammengefasst, die Anzahl der Elemente der j-ten Klasse wird mit qj bezeichnet. Die unter Nullhypothese erwartete Anzahl von Elementen in der j-ten Klasse ist rj = Q(Mj ) · q. Daraus resultiert die χ2 -Prüfstatistik χ2 = q · m X (qj − rj )2 . r j j=1 Diese ist offenbar sehr klein, falls qj und rj ungefähr gleich sind. Nach dem Satz von Fischer (Satz 52) ist sie annähernd χ2 -verteilt mit m − 1 Freiheitsgraden. Zu einem Signifikanzniveau α wird die Nullhypothese abgelehnt, falls χ2 > χ2m−1;1−α ist. 44 9. Verteilungsfreie Testverfahren 9.1. Tabellenanalyse und Unabhängigkeitstest Für eine Tabellenanalyse ist es nicht notwendig, die statistische Verteilung der Daten zu kennen. Die Analyse von Daten mit Hilfe von Tabellen beruht auf der Untersuchung der absoluten bzw. relativen Häufigkeitsverteilung eines Merkmals. Hierzu definiert Cramer (2003) S. 33 die absoluten und relativen Häufigkeiten wie folgt: Definition 43 (Absolute Häufigkeit, Relative Häufigkeit) Sei X eine diskrete Variable mit den Realisationsmöglichkeiten x1 , x2 , . . . , xj . Die Anzahl des Vorkommens von xi in einer Stichprobe X1 , X2 , . . . , Xq heißt absolute Häufigkeit qi . Formal ist qi definiert durch qi := q X 1{xi } (Xj ). j=1 Für den Vergleich unterschiedlicher Datensätze wird ein normiertes Maß, die relative Häufigkeit verwendet. Die relative Häufigkeit fi von xi ist fi := qi . q Sind die Zufallsvariablen X1 , X2 , . . . , Xq unabhängig, so ist für einen großen Stichprobenumfang fi ≈ P (X = xi ). Bei Fragen, die Mehrfachantworten zulassen, wird die Antwort durch eine Teilmenge X der Realisationsmöglichkeiten {x1 , x2 , . . . , xj } repräsentiert. Ist X1 , X2 , . . . , Xq eine solche Stichprobe, dann gibt es verschiedene Möglichkeiten, die Begriffe relative Häufigkeit und absolute Häufigkeit zu übertragen. Definition 44 (Gewichtete und ungewichtete absolute und relative Häufigkeit) Sei X1 , X2 , . . . , Xq eine Stichprobe mit Xi ⊂ {x1 , x2 , . . . , xj }. • Bei der gewichteten absoluten Häufigkeit wird jedes Xk gleich gewichtet, d. h. man definiert die gewichtete absolute Häufigkeit q g := q und qig := q X 1Xj (xi ) j=1 |Xj | 45 , i = 1, 2, . . . , j. 9. Verteilungsfreie Testverfahren • Bei der ungewichteten absoluten Häufigkeit wird jedes Element der Xk gleich gewichtet, d. h. man definiert die ungewichtete absolute Häufigkeit u q := q X j=1 qiu := q X |Xj |, 1Xj (xi ), i = 1, 2, . . . , j. j=1 Die gewichteten bzw. ungewichteten relativen Häufigkeiten werden entsprechend definiert durch qu qg fig := ig und fiu := iu , i = 1, 2, . . . , j. q q Bemerkung 45 Falls die Realisationsmöglichkeiten x1 , x2 , . . . , xj kategorisiert werden, so werden sie in disjunkte Klassen x′1 , x′2 , . . . , x′k ⊂ {x1 , x2 , . . . , xj } aufgeteilt. Die (gewichteten oder ungewichteten) absoluten und relativen Häufigkeiten der Klassen ergeben sich dann durch q ′ := q und X qi′ := ql xl ∈x′i bzw. analog für q ′g , qi′g , q ′u und qi′u . Die relativen Häufigkeiten der Klassen ergeben sich entsprechend durch fi′ := qi′ q′ bzw. analog für f ′g , fi′g , f ′u und fi′u . Die Tabellenanalyse eignet sich gut, um nominale Merkmale zu analysieren. Im Allgemeinen wird von m × n-Kontingenztabellen gesprochen. Die einfachste Art von Häufigkeitstabellen, welche aber in der empirischen Sozialforschung häufig verwendet werden, sind die 2 × 2-Tabellen (Vierfeldertabellen). Diese ermöglichen die Betrachtung von zwei dichotomen Merkmalen X und Y . x(1) x(2) .. . x(m) Summe y(1) q11 q21 .. . qm1 q•1 y(2) q12 q22 qm2 q•2 ... ... ... .. . ... ... y(n) q1n q2n .. . qmn q•n Summe q1• q2• .. . qm• q x(1) x(2) .. . x(m) Summe (a) absolute Häufigkeiten y(1) f11 f21 .. . fm1 f•1 y(2) f12 f22 fm2 f•2 ... ... ... .. . ... ... y(n) f1n f2n .. . fmn f•n Summe f1• f2• .. . fm• 1 (b) relative Häufigkeiten Tabelle 9.1.: Kontingenztafeln Die Werte qi• bzw. fi• mit i = 1, 2, . . . , m und q•j bzw. f•j mit j = 1, 2, . . . , n werden als Zeilensumme bzw. Spaltensumme bezeichnet. 46 9. Verteilungsfreie Testverfahren D.h für die Zeilensumme gilt qi• = fi• = n X j=1 n X qij , i = 1, 2, . . . , m bzw. fij , i = 1, 2, . . . , m qij , j = 1, 2, . . . , n bzw. fij , j = 1, 2, . . . , n. j=1 und für die Spaltensumme q•j = f•j = m X i=1 m X i=1 Die Zeilensumme und Spaltensumme wird nach Cramer (2003) S. 34 für Kontingenztafeln mit absoluten Häufigkeiten als Randhäufigkeit bzw. für Kontingenztafeln mit relativen Häufigkeiten als Randverteilung bezeichnet. Für die Summe der Randhäufigkeiten bzw. Randverteilung gilt: m X i=1 m X qi• = q n X und j=1 n X fi• = 1 und i=1 q•j = q bzw. f•j = 1. j=1 Die Wahrscheinlichkeit der Elementarereignisse des Merkmaltupels (X, Y ) wird bezeichnet mit pij = P (X = x(i), Y = y(j)), i = 1, 2, . . . , m; j = 1, 2, . . . , n. Des Weiteren ist pi• := n X pij = P (X = x(i)), j=1 p•j := m X pij = P (Y = y(j)). i=1 Nach Definition 43 wird für große Stichproben pij ≈ fij sein. Bemerkung 46 Die relativen Häufigkeiten sind Maximum-Likelihood-Schätzer für die Wahrscheinlichkeiten. Genauer: • fij ist ML-Schätzer für pij • fi• ist ML-Schätzer für pi• • f•j ist ML-Schätzer für p•j 47 9. Verteilungsfreie Testverfahren Im Falle der Unabhängigkeit der Variablen X und Y ist insbesondere fi• · f•j ein ML-Schätzer für pij . Beweis. Es ist 1(x(i),y(j)) (X, Y ) eine B1,p -verteilte Zufallsvariable mit p = P (X = x(i), Y = y(j)) = pij . Nach Beispiel 35 ist somit ein ML-Schätzer ϑˆq für pij gegeben durch q qij 1X ϑˆq ((X1 , Y1), . . . , (Xq , Yq )) = 1(x(i),y(j)) (Xk , Yk ) = = fij . q q k=1 Der Beweis für fi• und f•j verläuft analog. Im Falle der Unabhängigkeit ist somit fi• · f•j ein ML-Schätzer für pi• · p•j = P (X = x(i)) · P (Y = y(j)) = P (X = x(i), Y = y(j)) = pij . 9.1.1. Spaltenprozentuierung Die Spaltenprozentuierung, welche im Wesentlichen aus Diaz-Bone (2006) S. 66 erarbeitet wurde, ist die einfachste Methode, mit der die Beziehungen zweier Variablen X und Y zueinander untersucht werden kann. Satz 47 Für die Variablen X und Y gilt X und Y sind unabhängig ⇔ ∀j = 1, 2, . . . , n : p1j p2j pmj = = ··· = p1• p2• pm• Beweis. Zur Rückrichtung: Sei p1j p2j pmj = = ··· = p1• p2• pm• Aus pij = P (X = x(i), Y = y(j)) und pi• = P (X = x(i)) folgt ∀i, k ∈ {1, 2, . . . , n} : P (X = x(i), Y = y(j)) P (X = x(k), Y = y(j)) = . P (X = x(i)) P (X = x(k)) 48 9. Verteilungsfreie Testverfahren Somit gilt P (X = x(i))P (Y = y(j)) = P (X = x(i)) n X P (X = x(k), Y = y(j)) k=1 = P (X = x(i)) n X P (X = x(k)) P (X = x(k), Y = y(j)) P (X = x(k)) P (X = x(k)) P (X = x(i), Y = y(j)) P (X = x(i)) k=1 = P (X = x(i)) n X k=1 n P (X = x(i), Y = y(j)) X P (X = x(k)) = P (X = x(i)) P (X = x(i)) k=1 = P (X = x(i), Y = y(j)) und daher die Unabhängigkeit. Zur Hinrichtung: Sind umgekehrt X und Y unabhängig, so gilt für j = 1, 2, . . . n und beliebige i, k pij P (X = x(i), Y = y(j)) P (X = x(k), Y = y(j)) pij = = P (Y = y(j)) = = pi• P (X = x(i)) P (X = x(k)) pk• Da fij fi• ≈ pij pi• ist, werden die Variablen X und Y als unabhängig voneinander ange- nommen, falls f1j f1• ≈ f2j f2• ≈ ··· ≈ fmj fm• gilt. Bemerkung 48 Die statistische Unabhängigkeit ist eine symmetrische Eigenschaft, das heißt, wenn X und Y unabhängig sind, so sind auch umgekehrt Y und X voneinander unabhängig. Daher ist es gleich ob man eine Spaltenprozentuierung oder eine Reihenprozentuierung durchführt, denn man erhält für beide Verfahren das selbe Ergebnis. 9.1.2. Fisher-Test Der nachstehend beschriebene Fischer-Test stützt sich im Wesentlichen auf Hartung (1982) S. 414 und Rüger (2002) S. 232ff. Der Fisher-Test testet zwei dichotome Variablen X und Y auf Abhängigkeit. Er wird im Allgemeinen nur für sehr kleine Stichprobengrößen verwendet, da der Rechenaufwand für größere Stichproben sehr hoch ist. Umfangreichere Stichproben werden daher in der Regel mit Hilfe des Yates-Tests oder des allgemeinen χ2 Unabhängigkeitstests untersucht. Der Fisher-Test ist nur eine Sonderform des χ2 Test. Der Fisher-Test lässt sich nur auf dichotome Variablen, also auf 2 × 2-Tabellen anwenden. Die Grundidee des Fisher-Test ist die Überprüfung eines vorliegenden Testergebnisses unter der Annahme, dass die Variablen unabhängig sind. Hierbei werden zwei Hypothesen definiert. 49 9. Verteilungsfreie Testverfahren Nullhypothese H0 : Die Variablen X und Y sind unabhängig, d. h. ∀i, j : pij = pi• · p•j . Alternativhypothese HA : Die Variablen X und Y sind abhängig, d. h. ∃i, j : pij 6= pi• · p•j . Anschließend wird die Wahrscheinlichkeit des Stichprobenergebnisses oder eines extremeren Ergebnisses unter Annahme der Nullhypothese berechnet. Mit Hilfe der hypergeometrischen Verteilung, die für diskrete Variablen definiert ist, lässt sich die Wahrscheinlichkeit berechnen, mit der bei gegebenen univariaten Randverteilungen eine bestimmte Häufigkeitsverteilung in der Vierfeldertabelle auftritt. Liegt diese unter dem a-priori festgelegtem Signifikanzniveau, so wird die Alternativhypothese angenommen. Bei festgelegten Randverteilungen der Kontingenztabelle ist die gesamte Tabelle durch Festlegung eines Wertes bestimmt. Die Wahrscheinlichkeit des Auftretens einer Tabelle ist durch die hypergeometrische Verteilung gegeben, d. h. q11 + q21 q12 + q22 y(1) y(2) q11 q12 für die Tabelle T := x(1) q11 q12 pT := q11 + q12 + q21 + q22 x(2) q21 q22 q11 + q12 Sei S die Tabelle des Stichprobenergebnisses. Dann wird die Menge T der Tabellen bestimmt, die die Alternativhypothese mindestens so sehr bestätigen wie S. Es ist T := {T : pT ≤ pS }. Gilt für die Wahrscheinlichkeit p, dass eine Tabelle aus T trotz Zutreffen der Nullhypothese auftritt ist nun X p= pT ≤ α, T ∈T so kann die Nullhypothese verworfen und die Alternativhypothese angenommen werden. Beispiel 49 15 Jugendliche (5 Jungen, 10 Mädchen) wurden befragt, ob sie einen Nebenjob besitzen. Dabei ist folgende Kontingenztabelle entstanden: x(1) x(2) y(1) y(2) 1 4 7 3 Hierbei steht die Variable X für das Geschlecht. Sie hat die Merkmalsausprägungen x(1) = männlich und x(2) = weiblich. Die Variable Y hat die Merkmalsausprägungen y(1) = arbeitet und y(2) = arbeitet nicht. Zu einem Signifikanzniveau α = 0, 05 soll nun getestet werden, ob die Variablen X und Y abhängig voneinander sind. Die Ermittlung aller möglichen Tabellen unter vorgegebener Randverteilung und deren Eintrittswahrscheinlichkeit ergibt: 50 9. Verteilungsfreie Testverfahren y(1) y(2) x(1) 0 5 x(2) 8 2 y(1) y(2) x(1) 1 4 x(2) 7 3 y(1) y(2) x(1) 2 3 x(2) 6 4 0.007 0.093 0.326 y(1) y(2) x(1) 3 2 x(2) 5 5 y(1) y(2) x(1) 4 1 x(2) 4 6 y(1) y(2) x(1) 5 0 x(2) 3 7 0.392 0.163 0.019 Nun müssen alle Wahrscheinlichkeiten aufsummiert werden, die kleiner oder gleich sind als unser eingetretenes Ereignis. Für dieses Beispiel bedeutet das konkret: p = 0, 007 + 0, 093 + 0, 019 = 0, 119. Es ist also 0, 119 ≥ 0, 05, damit ist p ≥ α. Somit muss die Alternativhypothese verworfen werden. Der Fisher-Test lässt sich jedoch für große Stichprobenumfänge nicht anwenden. Für mittelgroße Stichproben verwendet man den Yates-Test. 9.1.3. Yates-Test Auch der Yates-Test, welcher hier im Wesentlichen nach Hartung (1982) S. 414 beschrieben wird, wird zur Unabhängigkeitsanalyse dichotomer Merkmale verwendet. Er wird für Untersuchungsumfänge bis ungefähr 60 Stichproben angewandt. Dafür wird die χ2Y ates -Teststatistik berechnet: χ2Y ates |q11 q22 − q12 q21 | − = q1• q2• q•1 q•2 q 2 2 Diese Teststatistik ist annähernd χ21 -verteilt. Daher kann die Abhängigkeit der Variablen auf einem Signifikanzniveau α angenommen, d. h. die Unabhängigkeitshypothese H0 verworfen werden, wenn χ2Y ates > χ21;1−α gilt. Dabei ist χ21;1−α das 1−α-Quantil der χ2 -Verteilung mit einem Freiheitsgrad. Bemerkung 50 Die Verteilungsfunktion der χ2 -Verteilung ist nicht explizit ausrechenbar, sie bzw. ihre Quantile sind vertafelt und dort entsprechend abzulesen. 9.1.4. χ2 -Unabhängigkeitstest für 2 × 2-Tabellen Der folgende χ2 -Unabhängigkeitstest ist im Wesentlichen in Anlehnung an Cramer (2003) S. 105ff, Hartung (1982) S. 118f und Rüger (2002) S. 220ff beschrieben. 51 9. Verteilungsfreie Testverfahren Für groß werdende Stichprobenumfänge q spielt der lineare Summand 2q aus dem Zähler der χ2Y ates -Teststatistik eine zunehmend kleinere Rolle. Daher wird bei großen Stichprobenumfängen die χ2 -Statistik berechnet durch: χ2 = (q11 q22 − q12 q21 )2 q1• q2• q•1 q•2 (9.1) Wie beim Yates-Test ist diese annähernd χ21 -verteilt. Daher wird auch hier die Nullhypothese verworfen, falls χ2 > χ21;1−α gilt. Die Richtung der Abhängigkeit Um Aussagen über die Richtung der Abhängigkeit machen zu können, werden die Hypothesen wie folgt verändert: p21 p11 ≤ , p1• p2• p11 p21 Fall 2 : H0 : ≥ , p1• p2• Fall 1 : H0 : p11 p21 > p1• p2• p11 p21 HA : < p1• p2• HA : Die Nullhypothese kann nach Cramer (2003) S. 107 verworfen werden, wenn Fall 1 : χ2 ≥ χ21,1−2α und q11 · q22 > q12 · q21 Fall 2 : χ2 ≥ χ21,1−2α und q11 · q22 < q12 · q21 Bemerkung 51 Man beachte, dass die Nullhypothese wegen χ21,1−α ≥ χ21,1−2α insbesondere verworfen werden kann, wenn Fall 1 : χ2 ≥ χ21,1−α und q11 · q22 > q12 · q21 Fall 2 : χ2 ≥ χ21,1−α und q11 · q22 < q12 · q21 Somit wird zuerst ein gewöhnlicher χ2 -Unabhängigkeitstest durchgeführt und im Fall der Abhängigkeit eine weitere Bedingung für die Richtung getestet. 9.1.5. χ2 -Unabhängigkeitstest für m × n-Tabellen Folgende Verallgemeinerung des χ2 -Unabhängigkeitstest stützt sich im Wesentlichen auf Cramer (2003) S. 199f und Hartung (1982) S. 435. Die χ2 -Statistik aus der Gleichung (9.1) lässt sich darstellen als 2 X 2 X (fij − eij )2 χ =q· . eij i=1 j=1 2 Hierbei sind fij die relativen Häufigkeiten und eij := fi• f•j . 52 9. Verteilungsfreie Testverfahren Falls die Variablen unabhängig sind, ist eij := fi• f•j ≈ pi• p•j = P (X = x(i))P (Y = y(i)) unabh. = P (X = x(i), Y = y(i)) = pij ≈ fij eine Approximation der relativen Häufigkeit. Es lässt sich sogar zeigen, das eij dann der Maximum-Likelihood-Schätzer für fij ist. Es ist plausibel, dass fij um so mehr von eij abweicht, also (fij −eij )2 umso größer ist, je abhängiger die Variablen sind. Die Division durch eij skaliert diese Abweichung. Daher ist χ2 nach dieser Darstellung ein plausibles Maß für die Abhängigkeit der Variablen. Diese Darstellung der χ2 -Statistik lässt sich für m×n-Tabellen verallgemeinern zu χ2 = q · m X n X (fij − eij )2 . e ij i=1 j=1 Satz 52 (Satz von Fischer59 ) Seien X1 , X2 , . . . , Xq eine iid Stichprobe der Merkmale {a1 , . . . , ar } mit L(Xk ) = L(X). Seien ek ML-Schätzer für P (X = k). Sei qk = |{j : Xj = ak }| , k = 1, . . . , r. Dann konvergiert die Verteilung der Testgröße χ˜2 = r X (qk − qek )2 qek k=1 für wachsenden Stichprobenumfang gegen eine χ2 -Verteilung mit r − 1 Freiheitsgraden. Nach dem Satz von Fischer ist die Teststatistik χ2 somit χ2(m−1)(n−1) -verteilt. Denn eij sind im Falle der Unabhängigkeit Maximum-Likelihood-Schätzer für pij und es gilt: 59 Vgl. Küchler (2006) S. 259. 53 9. Verteilungsfreie Testverfahren m X n X (fij − eij )2 χ =q eij i=1 j=1 2 qij m X n − e X ij q =q eij i=1 j=1 2 =q m X n X 1 q2 (qij − qeij )2 i=1 j=1 =q = 1 qeij q m X n 1 X (qij − qeij )2 q i=1 j=1 m n XX i=1 j=1 qeij (qij − qeij )2 qeij Nun ergibt sich die Anzahl der Freiheitsgrade im Satz von Fisher gerade dadurch, dass die r −1 Größen q1 , q2 , . . . qr−1 die Werte q1 , q2 , . . . qr−1 , qr vollständig definieren. Für unseren χ2 -Test werden die Werte qij , i = 1, 2, . . . , m; j = 1, 2, . . . , n eindeutig durch die Kenntnis der Werte für qij , i = 1, 2, . . . , m−1; j = 1, 2, . . . , n−1 festgelegt. Somit konvergiert die Teststatistik χ2 gegen eine χ2 -Verteilung mit (m − 1)(n − 1) Freiheitsgraden. Daher wird für m × n-Tabellen die Unabhängigkeitshypothese H0 bei einem Signifikanzniveau α verworfen, wenn χ2 > χ2(m−1)(n−1);1−α ist. Die Richtung der Abhängigkeit Die in Bemerkung 51 dargestellte Idee für das Testen einer Richtung lässt sich auf m × n-Tabellen mit Ordinale Merkmalen übertragen. Dabei wird zuerst mittels des χ2 -Unabhängigkeitstests die Abhängigkeit der Variablen festgestellt und anschließend eine weitere Bedingung für die Richtung geprüft. Im 2 × 2-Fall lautet die Bedingung ⇔ ⇔ ⇔ ⇔ q11 · q22 > q12 · q21 f12 f21 f11 f22 · > q2 · · q2 · f1• f2• f1• f2• f11 f2• − f21 f1• − f11 f21 · > · f1• f2• f1• f2• f11 f11 f21 f21 f11 f21 − · > − · f1• f1• f2• f2• f1• f2• f11 f21 > f1• f2• bzw. analog q11 · q22 < q12 · q21 ⇔ 54 f11 f21 < . f1• f2• 9. Verteilungsfreie Testverfahren Diese Überlegung lässt sich auf m × 2 übertragen. Dann lauten die Hypothesen pi1 pj1 ≤ , pi• pj• pj1 pi1 Fall 2 : H0 : ∃i < j : ≥ , pi• pj• Fall 1 : H0 : ∃i < j : pi1 pj1 > pi• pj• pi1 pj1 HA : ∀i < j : < pi• pj• HA : ∀i < j : Mit der obigen Äquivalenz kann analog zum 2 × 2-Fall in Bemerkung 51 die Nullhypothese abgelehnt werden, wenn qi1 qj1 > qi• qj• qj1 qi1 und ∀i < j : < qi• qj• Fall 1 : χ2 ≥ χ21,1−α und ∀i < j : 2 Fall 2 : χ ≥ χ21,1−α (9.2) Diese Überlegungen können auf beliebige m × n-Tabellen übertragen werden. Die allgemeine Idee kann auf zwei äquivalente Weisen plausibel gemacht werden: • Werden die Merkmale y(1) < y(2) < · · · < y(n) in zwei Mengen {y(i) : i ≤ k} und {y(i) : i > k} zerlegt und die Realisationen zusammengefasst, so ergibt sich eine m × 2-Tabelle mit k qi1 := k X qil , k qi2 := l=1 m X qil , i = 1, 2, . . . , m l=k+1 Zwischen den Variablen der m × n-Tabelle gilt genau dann eine gerichtete Abhängigkeit, wenn für jedes k = 1, . . . , m−1 und die Zerlegung {y(i) : i ≤ k} und {y(i) : i > k} in der so entstandenen m×2-Tabelle gerichtete Abhängigkeit gilt, d. h. wenn für alle k = 1, 2, . . . , m − 1 gilt: ∀i < j : k k qj1 qi1 > qi• qj• bzw. ∀i < j : k k qj1 qi1 < . qi• qj• (9.3) • Die Variable nimmt für x(i) dann kleinere Werte als für x(j) an, wenn für jedes k = 1, 2, . . . , m − 1 gilt P (Y ≤ y(k)|X = x(i)) > P (Y ≤ y(k)|X = x(j)). (9.4) Dieses ist äquivalent zu P (Y ≤ y(k)|X = x(i)) > P (Y ≤ y(k)|X = x(j)) ⇔ ⇔ k X l=1 k X l=1 P (Y = y(l)|X = x(i)) > k X P (Y = y(l)|X = x(j)) l=1 k X pjl pil > pi• pj• l=1 (9.5) 55 9. Verteilungsfreie Testverfahren Es existiert genau dann eine gerichtete Abhängigkeit, wenn für x(i) > x(j) auch P (Y ≤ y(k)|X = x(i)) > P (Y ≤ y(k)|X = x(j)) bzw. P (Y ≤ y(k)|X = x(i)) < P (Y ≤ y(k)|X = x(j)) gilt. Für großen Stichprobenumfang gilt qil fil pil = ≈ qi• fi• pi• p q jl jl ≈ pj• . Wird dieses in die obige Darstellung (9.5) eingesetzt, und analog ist qj• so ergibt sich die Bedingung (9.3). Somit ergibt sich für allgemeine m × n-Tabellen: Die Hypothesen sind Fall 1: Die Alternativhypothese ist „Je größer X desto größer Y “, d. h. H0 : HA : ∃i < j∃k : P (Y ≤ y(k)|X = x(i)) ≤ P (Y ≤ y(k)|X = x(j)), ∀i < j∀k : P (Y ≤ y(k)|X = x(i)) > P (Y ≤ y(k)|X = x(j)). Fall 2: Die Alternativhypothese ist „Je größer X desto kleiner Y “, d. h. H0 : HA : ∃i < j∃k : P (Y ≤ y(k)|X = x(i)) ≥ P (Y ≤ y(k)|X = x(j)), ∀i < j∀k : P (Y ≤ y(k)|X = x(i)) < P (Y ≤ y(k)|X = x(j)). Aus obigen Überlegungen folgt die Entscheidungsregel: Lehne H0 ab, wenn 2 Fall 1 : χ ≥ χ21,1−α Fall 2 : χ2 ≥ χ21,1−α k k X X qil qjl und ∀i < j∀k : > qi• qj• l=1 l=1 k k X X qil qjl < und ∀i < j∀k : qi• qj• l=1 (9.6) l=1 Bemerkung 53 Für diesen Test lässt sich – im Gegensatz zum Test für 2×2-Tabellen – kein explizites Signifikanzniveau angeben. Bei 2 × 2-Tabellen enthält eine signifikante Abhängigkeit automatisch eine Richtung, d. h. der Wert f11 ist deutlich größer oder deutlich kleiner als f21 . Die Wahrscheinlichkeit, dass ein solches Ergebnis unter Abhängigkeit in die andere Richtung eintritt, ist gering. Beim allgemeinen Test hingegen testet der χ2 -Test nur, ob mindestens ein Wert abhängig ist. Dieses impliziert jedoch nicht, dass in anderen Feldern die Unterschiede groß sind. So wird in dem Beispiel in den unten dargestellten Tabellen die Hypothese „Je größer X desto größer Y “ angenommen, obwohl die Hypothese falsch ist. Jedoch ist dieses Resultat für die relativen Häufigkeiten nicht unwahrscheinlich. p x(1) x(2) x(3) y(1) y(2) 0.8 0.2 0.3 0.7 0.3 0.7 f x(1) x(2) x(3) y(1) y(2) 0.8 0.2 0.31 0.69 0.3 0.7 Daher ist die Richtung der Abhängigkeit nur dann „signifikant“, wenn die Unterschiede hinreichend groß sind. 56 9. Verteilungsfreie Testverfahren 9.2. Wilcoxon-Rangsummentest Der im Folgenden beschriebende Test stützt sich im Wesentlichen auf Cramer (2003) S. 103f und Hartung (1982) S. 513ff. Mit dem Wilcoxon-Rangsummentest60 werden zwei iid Stichproben X1 , X2 , . . . , Xn und Y1 , Y2 , . . . , Ym vergleichbarer, ordinaler Merkmale X und Y miteinander verglichen. Neben der Voraussetzung, dass die Merkmale X und Y ordinal sind, muss auch die Verteilungsfunktion dieser Merkmale stetig sein, da dann die Wahrscheinlichkeit, dass Merkmale mehrfach vorkommen, Null ist. Definition 54 Seinen X und Y vergleichbare ordinale Merkmale. Man sagt X nimmt tendenziell kleinere Werte an als Y (i. Z. X <t Y ), wenn gilt 1 P (X < Y ) > . 2 Anschaulich bedeutet dieses, falls aus der Stichprobe ein x und y gezogen wird, so ist wahrscheinlich x < y. Analog wird X ≤t Y , X ≥t Y und X >t Y definiert. Es können nun die folgenden Hypothesen untersucht werden: H0 : Das Merkmal X nimmt tendenziell kleinere oder gleiche Werte wie das Merkmal Y an (X ≤t Y ). HA : Das Merkmal X nimmt tendenziell größere Werte als das Merkmal Y an (X >t Y ). Oder umgekehrt kann untersucht werden: H0 : Das Merkmal X nimmt tendenziell größere oder gleiche Werte wie das Merkmal Y an (X ≥t Y ). HA : Das Merkmal X nimmt tendenziell kleinere Werte als das Merkmal Y an (X >t Y ). Eine zentrale Kenngröße für diesen Test ist der Rang eines Wertes in einer Stichprobe. Definition 55 (Rang, Rangwert) Seien X1 , X2 , . . . , Xn die Stichprobe eines ordinalen Merkmals. Dann bezeichnet X(i) mit i = 1, 2, . . . , n in einem geordneten Datensatz X(1) ≤ X(2) ≤ · · · ≤ X(n) den i-ten Rangwert. Der Rang R(Xi ) ist die Position den i-ten Beobachtung in dem geordneten Datensatz. Kommt der Wert Xi in dem Datensatz nur einmal vor, so ist R(Xi ) = j ⇔ Xi = X(j) . 60 Man bezeichnet den approximativen Rangsummentest auch als U-Test von Mann-Whitney 57 9. Verteilungsfreie Testverfahren Falls der Wert Xi mehrfach im Datensatz vorkommt, so ist X(j−1) < X(j) = X(j+1) = · · · = X(j+s) < X(j+s+1) . | {z } =Xi Der Rang R(Xi ) ist dann definiert durch j+s 1 X R(Xi ) = k. s + 1 k=j Für den Wilcoxon-Rangsummentest werden die beiden Stichproben Xi und Yj mit i = 1, 2, . . . , n und j = 1, 2, . . . , m zusammengefasst zu einer Menge Z := {X1 , X2 , . . . , Xn , Y1 , Y2, . . . , Ym }. Anschließend werden die Rangsummen berechnet durch WX := n X RZ (Xi ), WY := m X RZ (Yj ). j=1 i=1 Da die Summe WX + WY = 12 (n + m)(n + m + 1) konstant ist, genügt es, die Rangsumme WX zu berechnen. 9.2.1. Exakter Rangsummentest Für Stichproben X1 , X2 , . . . , Xn und Y1 , Y2 , . . . , Ym wird Wn,m := WX definiert. Des Weiteren ist pn,m (w) := P (Wn,m = w) die Wahrscheinlichkeit unter Annahme der Nullhypothese, dass Wn,m = w ist. Lemma 56 Für pn,m gilt die Rekursion pn,m(w) = pn−1,m (w − n − m) · n m + pn,m−1 (w) · . n+m n+m Beweis. Durch Aufspalten der Wahrscheinlichkeit P (Wn,m = w) in die beiden Fälle, dass das größte Element der Menge Z ein Xi bzw. ein Yj (i. Z. max(Z) = X bzw. max(Z) = Y ) ist, ergibt sich: 58 9. Verteilungsfreie Testverfahren pn,m (w) = P (Wn,m = w) = P (Wn,m = w| max(Z) = X) · P (max(Z) = X) + P (Wn,m = w| max(Z) = Y ) · P (max(Z) = Y ) m n = P (Wn−1,m = w − n − m) · + P (Wn,m−1 = w) · n+m n+m n m = pn−1,m (w − n − m) · + pn,m−1 (w) . n+m n+m • Falls H0 : X ≤t Y und HA : X >t Y , so ist die kritische Schranke cu,α die kleinste Zahl, für die P (Wn,m ≤ cu,α ) > α gilt. Das heißt cu,α ist die eindeutig bestimmte Zahl, für die gilt: cu,α −1 X w=0 pn,m (w) ≤ α < cu,α X pn,m (w). w=0 • Falls H0 : X ≥t Y und HA : X <t Y , so ist die kritische Schranke co,α die größte Zahl, für die P (Wn,m ≥ co,α ) > α gilt. Das heißt co,α ist die eindeutig bestimmte Zahl, für die gilt: X X pn,m (w) ≤ α < pn,m (w). w≥co,α +1 w≥co,α Es ergeben sich die folgenden Entscheidungsvorschriften: H0 X ≥t Y X ≤t Y H0 wird abgelehnt, falls WX < cu,α WX > co,α HA X <t Y X >t Y Tabelle 9.2.: Entscheidungsregeln für den exakten Wilcoxon-Rangsummentest 9.2.2. Approximativer Rangsummentest Für diesen Test wird eine Kenngröße U später eingeführt. Dazu wird jedem Merkmal Xi ∈ Z die Anzahl Ni := |{Yj : Yj > Xi }| der Yj , die größer als Xi sind, zugeordnet. Dann wird definiert n X U := Ni . i=1 Lemma 57 Es gilt die Gleichung U = nm + n(n + 1) − WX . 2 59 9. Verteilungsfreie Testverfahren Beweis. O.B.d.A. lässt sich X1 < X2 < · · · < Xn voraussetzen. Dann gibt es insgesamt n + m − R(Xi ) Elemente in Z, die größer sind als Xi . Davon sind n − i Elemente aus X1 , X2 , . . . , Xn . Die übrigen (n + m − R(Xi )) − (n − i) Elemente sind aus Y1 , Y2, . . . , Ym . Somit gilt Ni = (n + m − R(Xi )) − (n − i) = m + i − R(Xi ) n X n(n + 1) ⇒U= Ni = nm + − WX . 2 i=1 Für den Erwartungswert und die Varianz von U gilt E(U) = nm , 2 V ar(U) = nm(n + m + 1) . 12 Als Prüfstatistik definiert man die Normierung von U: U − nm U − E(U) 2 =q U∗ = p nm(n+m+1) V ar(U) 12 Obwohl U eine Summe von abhängigen Zufallsvariablen ist – der zentrale Grenzwertsatz also nicht angewendet werden kann – lässt sich U ∗ für große Stichproben dennoch durch die Standardnormalverteilung approximieren. Als kritische Schranke, die nötig ist um eine Entscheidung bzgl. der Hypothesen treffen zu können, verwendet man daher das Quantil der Standardnormalverteilung u1−α . Nach der Testdurchführung ist H0 entweder unter einem bestimmten Signifikanzniveau anzunehmen oder abzulehnen. Für die Entscheidungsvorschrift gilt: H0 X ≥t Y X ≤t Y H0 wird abgelehnt, falls U ∗ > u1−α U ∗ < −u1−α HA X <t Y X >t Y Tabelle 9.3.: Entscheidungsregeln für den approximativen Rangsummentest 60 10. Regressionsanalyse Die im folgenden Beschriebende multiple Regressionsanalyse stützt sich im Wesentlichen auf Lang (2005) S. 2 ff, Schulze (2003) S. 168ff und 235ff und Steland (2003) 272f. Die Regressionsanalyse ist ein Analyseverfahren, mit dessen Hilfe sich Beziehungen zwischen einer abhängigen Variable Y (Response-Variable) und einer oder mehreren unabhängiger metrischen Variablen X1 , X2 , . . . , Xn (Prädiktor-Variablen oder auch Regressoren) feststellen lassen. Die Variablen X1 , X2 , . . . , Xn sind untereinander unabhängig. Möchte man die Abhängigkeit der Variable Y von einer einzigen Variablen X1 bestimmen, so spricht man von einer einfachen Regression, falls die Abhängigkeit von Y zu mehreren Variablen X1 , X2 , . . . , Xn geprüft werden soll, so spricht man von einer multiplen Regression. Des Weiteren wird zwischen einer linearen und nicht-linearen Regression unterschieden. Eine lineare Regression wird durchgeführt, falls ein linearer Zusammenhang zwischen den Variablen Y und Xi mit i = 1, 2, . . . , n angenommen wird, während eine bei einer nicht-linearen Regression ein nicht-linearer Zusammenhang angenommen wird. Liegt kein metrisches, sondern nur ein nominales oder ordinales Skalenniveau vor, so ist eine kategoriale Regression durchzuführen. Wie auch bei der Regressionsanalyse für metrisches Skalenniveau kann auch die kategoriale Regression zwischen einer einfachen und multiplen sowie der linearen und nicht-linearen Regression unterschieden werden. Der wesentliche Unterschied der kategorialen Regression zu einer „normalen“ Regression zeigt sich darin, dass bei der kategorialen Regression eine endliche Anzahl von Kategorien vorliegt, während die unabhängigen Variablen bei der normalen Regression beliebige reelle Werte annehmen können. Bei der kategorialen Regression werden daher den einzelnen Kategorien Werte zugeordnet, d.h sie werden kodiert, was bei einer normalen Regression nicht notwendig ist. Neben der einfachen Kodierung der Kategorien mittels bloßer Durchnummerierung sind z. B. die Dummykodierung oder die Effizienzkodierung weitere Möglichkeiten, die Kategorien zu kodieren. Da ich für die Auswertung meiner Daten nur die multiple kategoriale Regression verwende, möchte ich mich in dieser Arbeit auf diesen Regressionstypen beschränken. Andere Regressionstypen lassen sich in den Standardwerken der Statistik nachlesen. 61 10. Regressionsanalyse 10.1. Multiple kategoriale Regression61 Seien X1 , X2 , . . . , Xn nominal oder ordinal skalierte Variablen und Ỹ eine von den Merkmalen X1 , X2 , . . . , Xn abhängige, dichotome Variable. Die p Beobachtungen y˜i , xi1 , xi2 , . . . , xin , i = 1, 2, . . . , p lassen sich anhand gleicher Kovariablenvektoren (xi1 , xi2 , . . . , xin ) zu g Gruppen zusammenfassen. Die Anzahl der Beobachtungen der j-ten Gruppe heißt nj , die Anzahl der Erfolge innerhalb der j-ten Gruppe heißt yj . So ergibt sich die Darstellung Gruppe 1 .. . Gruppe j .. . Gruppe g n1 .. . nj . .. ng y1 .. . y := yj . .. yg x11 . . . x1n .. .. . . A := xj1 . . . xjn . .. .. . xg1 . . . xgn Die yj lassen sich nun als Realisationen der unabhängigen Zufallsvariablen Yj auffassen. Da Ỹ B1,p -verteilt ist, ist Yj verteilt nach Bnj ,pj . Dabei ist pj = P (Ỹ = 1|X1 = xj1 , X2 = xj2 , . . . , Xn = xjn ) die Wahrscheinlichkeit für einen Erfolg von Ỹ bei Eintreten des Kovariablenvektors (xj1 , xj2 , . . . , xjn ). Zur Schätzung des Parametervektors p = (p1 , p2 , . . . , pg ) ist das Maximum der Likelihood-Funktion g g Y Y nj yj pj (1 − pj )nj −yj Bnj ,pj (yj ) = L(p) = yj j=1 j=1 zu bestimmen Für das Regressionsmodell wird angenommen, dass zwischen den Wahrscheinlichkeiten pj und dem Kovariablenvektor (xj1 , xj2 , . . . , xjn ) ein funktionaler Zusammenhang pj = f ((xj1 , xj2 , . . . , xjn )) besteht. Eine Möglichkeit ist der lineare Zusammenhang pj = β0 + β1 xj1 + β2 xj2 + · · · + βn xjn , j = 1, 2, . . . , g. Hierbei ist das Problem, dass pj beliebige Werte annehmen kann. Um sicherzustellen, dass die Wahrscheinlichkeiten pj nur Werte in [0, 1] annehmen können, müssen Bedingungen an die βi gestellt werden. Dieses führt bei der Optimierung der Likelihood-Funktion zu erheblichen Schwierigkeiten. Daher definiert man eine streng monoton wachsende Funktion F : R 7→ [0, 1] und setzt ηj := β0 + β1 xj1 + β2 xj2 + · · · + βn xjn , 61 und pj = F (ηj ), j = 1, 2, . . . , g. Im Falle einer dichotomen abhängigen Variable Y spricht man auch von binäre multiple Regression. 62 10. Regressionsanalyse Dadurch ist für beliebige Werte von βi sichergestellt, dass pj ∈ [0, 1] gilt. Man bezeichnet ηj als linearen Prädiktor und F als Responsefunktion. Möglichkeiten für die Responsefunktion F sind: ex F (x) = 1 + ex oder F (x) = Φ(x) = Z x ∞ 1 −t2 √ e 2 dt 2π Im Fall der ersten Responsefunktion wird vom Logitmodell gesprochen, im Fall der zweiten vom Probitmodell. Der Parameter p = (p1 , p2 , . . . , pg ) der Likelihood-Funktion kann somit als Funktion von β := (β0 , β1 , . . . , βn ) durch p(β) = (F (η1 ), F (η2 ), . . . , F (ηg )) ausgedrückt werden. Dadurch ergibt sich die von β abhängige Likelihood-Funktion L(p(β)). Diese ist nun in Abhängigkeit von β zu maximieren. Durch Logarithmieren ergibt sich die Loglikelihood-Funktion l(p(β)) l(p(β)) = ln L(p(β)) ! g Y nj yj = ln pj (1 − pj )nj −yj y j j=1 g X nj pj ln + yj ln + nj ln(1 − pj ) . = y 1 − p j j j=1 Zur Bestimmung des Maximums muss die Nullstelle des Gradienten bestimmt werden. Für die partiellen Ableitungen ergibt sich nach der Kettenregel 1 − pj (1 − pj ) + pj −nj yj − nj pj ∂l = yj · · + = 2 ∂pj pj (1 − pj ) 1 − pj pj (1 − pj ) ∂pj ∂pj ∂ηj ∂pj = = xji ∂βi ∂ηj ∂βi ∂ηj und somit g g X ∂l ∂pj X yj − nj pj ∂pj ∂l = = xji , ∂βi ∂pj ∂βi p (1 − pj ) ∂ηj j=1 j=1 j wobei xj0 := 1 für j = 1, . . . , g definiert wird. Damit die Loglikelihood-Funktion ein Maximum hat, muss somit gelten: ∀i = 1, . . . , n : g X yj − nj pj ∂pj xji = 0. p (1 − pj ) ∂ηj j=1 j 63 10. Regressionsanalyse Im Fall des Logitmodells ergibt sich F (x) = ex (1 + ex ) − ex · ex ex ex ′ ⇒ F (x) = = 1 + ex (1 + ex )2 (1 + ex )2 und somit ∂pj eηj . = ∂ηj (1 + eηj )2 Dort muss für ein Maximum der Loglikelihood-Funktion gelten ∀i = 1, . . . , n : g X j=1 xji · (yj − nj pj )eηj = 0. pj (1 − pj ) (1 + eηj )2 Dieses Gleichungssystem ist jedoch zu kompliziert, um algebraisch gelöst zu werden. In der Praxis verwendet man daher numerische Methoden, z. B. das NewtonVerfahren. Dabei ist für das Logit- und des Probitmodells die Existenz einer eindeutigen Lösung gesichert, falls für jedes j = 1, . . . , g die Ungleichung 0 < yj < nj erfüllt ist. Ein Problem der binären Regression besteht darin, dass durch die Kodierung der Merkmale mit natürlichen Zahlen eine metrische Struktur impliziert wird. Im Falle nominaler Merkmale sollte jedoch weder eine ordinale, noch eine metrische Struktur vorausgesetzt werden. Dieses Problem kann durch die Dummy- oder Effekt-Kodierung umgangen werden. Sei dazu Xi eine Variable mit l Kategorien. Dann wird Xi durch die l − 1 Variablen Xik , k = 1, . . . , l − 1 ersetzt. Die Variable Xik repräsentiert nun, ob die Variable Xi in die k-te Kategorie fällt. Eine Variable für die l-te Kategorie wird nicht benötigt, da Xi genau dann in der l-ten Kategorie ist, wenn sie in keiner der übrigen ist. Diese Kategorie wird als Referenzkategorie bezeichnet. Formal ist Xik definiert durch 1 falls Xi = k k Dummy-Kodierung: Xi := 0 sonst. 1 falls Xi = k k −1 falls Xi = l Effekt-Kodierung: Xi := 0 sonst. Wird der Parameter vor Xik mit βik bezeichnet, so hat β die Form β = β11 , . . . , β1l1 −1 , . . . , βn1 , . . . , βnln−1 , wobei li die Anzahl der Kategorien des Merkmals Xi ist. Im Anschluss der Regressionsanalyse muss der geschätzten Parameter β interpretiert werden. Bei der Dummy-Kodierung bedeutet das Vorliegen eines positiven Parameters βik eine Erhöhung der Wahrscheinlichkeit gegenüber der Referenzkategorie von Xi , während ein negativer Parameter βik eine Verringerung der Wahrscheinlichkeit gegenüber der Referenzkategorie bedeutet. 64 10. Regressionsanalyse Bei der Effekt-Kodierung berechnet sich der Koeffizient βili der Referenzkategorie durch βili = −βi1 − βi2 − · · · − βili −1 , i = 1, 2, . . . , n. Bei der Effekt-Kodierung lassen sich die Parameter βik nicht nur mit der Referenzkategorie, sondern auch direkt miteinander vergleichen. Des Weiteren lassen sich die Parameter βik nicht nur innerhalb eines Merkmals Xi , sondern auch über verschiedene Merkmale hinweg vergleichen. Treten für ein Merkmal Xi betragsmäßig große Werte βik auf, so ist die Abhängigkeit des Merkmals Y von Xi groß, für betragsmäßig kleine Werte βik klein. 65 Teil II. Praktische Anwendung 66 11. Aufbau der Untersuchung 11.1. Konkretisierung des Forschungsthemas Um das Forschungsthema „Das Verbraucherverhalten von Jugendlichen der achten Klasse“ zu konkretisieren ist mindestens eine Theorie, welche aus verschiedenen Hypothesen besteht, zu formulieren. Im Folgenden werden die Theorien, welche in dieser Arbeit untersucht werden sollen, formuliert. Hierbei sind die Theorien und Hypothesen nach den bereits beschriebenden Regeln entwickelt worden (siehe Seite 11ff). 11.1.1. Erste Theorie Die erste von mir aufgestellte Theorie lautet: Das Verhältnis der Schüler zu ihrem Taschengeld unterscheidet sich je nach Schulform. Da angenommen wird, dass das Verhältnis eines Schülers zu seinem Geld in der Regel von den ihm zur Verfügung stehenden finanziellen Mitteln, also von seiner Taschengeldhöhe abhängt, soll zunächst geprüft werden, wie viel Taschengeld den Schülern im Durchschnitt zur Verfügung steht. Im Folgenden soll dies getrennt für die einzelnen Schulformen betrachtet werden. Hierzu wird folgende Hypothese formuliert: • Die Taschengeldhöhe unterscheidet sich je nach Schulform. Je höher die Schulform, desto niedriger ist das Taschengeld der Jugendlichen. Da vermutet wird, dass Gymnasiasten weniger Taschengeld erhalten als Hauptschüler oder Realschüler, vermute ich auch, dass Gymnasiasten häufiger als Hauptschüler kein Taschengeld erhalten. Hierzu soll folgende Hypothese überprüft werden: • Die Wahrscheinlichkeit, dass ein Gymnasiast kein Taschengeld erhält, ist größer, als die Wahrscheinlichkeit, dass ein Hauptschüler kein Taschengeld erhält. Da ich annehme, dass sich das Verhältnis der Schüler zu ihrem Geld durch ihr Geldleih- und Geldsparverhalten ausdrückt, muss dieses Verhalten mit Hilfe des Fragebogens getestet werden. Um zu testen, ob das Verhältnis der Schüler zum Geld von der Schulform abhängig ist, sind folgende Hypothesen zu untersuchen: • Das Geldleihverhalten unterscheidet sich je nach Schulform. Je höher die Schulform der Jugendlichen, desto seltener leihen sie sich Geld. • Das Sparverhalten unterscheidet sich je nach Schulform. Je höher die Schulform der Jugendlichen, desto häufiger sparen sie. 67 11. Aufbau der Untersuchung Falls durch das Testen der Theorie diese bestätigt wird, sind die Daten angemessen zu interpretieren. Hier stellt sich dann die Frage “Welche Schüler haben ein besseres Verhältnis zum Geld?“ Hier ist zunächst zu definieren, was man unter einem guten Verhältnis zum Geld versteht oder wodurch sich ein gutes Verhältnis zum Geld ausdrückt. Meiner Definition nach zeigt ein Schüler ein gutes Verhältnis zum Geld, falls • er regelmäßig Geld spart und • er sich selten oder sogar nie Geld leiht. Für die Auswertung wird demnach einem Schüler, der regelmäßig etwas von seinem Geld spart und sich selten bzw. nie Geld leiht ein besseres Verhältnis zum Geld zugeordnet. Einem Schüler wird ein durchschnittliches Verhältnis zu seinem Geld zugeordnet, falls nur eines dieser Merkmale zutrifft, d. h. er entweder regelmäßig spart oder sich selten oder sogar nie Geld leiht. Demnach wir einem Schüler ein schlechtes Verhältnis zugeordnet, falls er selten oder nie Geld spart, sich jedoch regelmäßig Geld leiht. Gutes Durchschnittl. Durchschnittl. Schlechtes Verhältnis Verhältnis Verhältnis Verhältnis Sparverhalten regelmäßig selten / nie + − + − − + − + Leihverhalten regelmäßig selten / nie − + + − − + + − Tabelle 11.1.: Interpretationsregeln für das Verhältnis zum Geld 11.1.2. Zweite Theorie Die zweite Theorie, welche untersucht werden soll, zielt direkt auf das Verbraucherverhalten, hier speziell auf das Einkaufsverhalten der Jugendlichen. Die Theorie, die ich diesbezüglich aufstelle, lautet: Das Einkaufsverhalten der Jugendlichen unterscheidet sich je nach Schulform. Die Theorie ist dadurch entstanden, dass vermutet wird, das sich das Verhältnis zum Geld der Jugendlichen je nach Schulform unterscheidet. Da aber das Geld und somit auch das persönliche Verhältnis einer Person direkt in Verbindung mit dem Einkaufsverhalten steht, liegt es nahe, dass sich auch das Einkaufsverhalten der Jugendlichen je nach Schulform unterscheidet. Das Einkaufsverhalten kann durch das konkrete Verhalten der Jugendlichen, wenn sie sich ein bestimmtes Produkt kaufen möchten, beschrieben werden. Dabei wird betrachtet, ob Jugendliche, die in die Stadt gehen um ein bestimmtes Produkt zu kaufen, auch nur dieses Produkt kaufen, oder ob sie in der Stadt ihr Ziel verfehlen und ein völlig anderes Produkt, dass ihre Aufmerksamkeit angezogen hat, erwerben. Des Weiteren können Aussagen über das Einkaufsverhalten getroffen werden, indem betrachtet wird, inwiefern Jugendliche in verschiedene Geschäfte gehen um Preise zu vergleichen und sich anschließend für das preisgünstigste Produkt entscheiden. 68 11. Aufbau der Untersuchung Ebenso ist für das Einkaufsverhalten von Bedeutung, ob und wo sich Jugendliche Informationen über ein bestimmtes Produkt beschaffen. Unter dem Gesichtspunkt des Verbraucherverhalten ist auch von besonderem Interesse, in welchen Geschäften die Schüler der achten Klasse bevorzugt einkaufen. Hierbei ist sowohl die Unterscheidung nach der Schulform als auch nach der Taschengeldhöhe von Bedeutung. Um Aussagen über die Informationsquellen der Schüler unterschiedlicher Schulformen zu gewinnen wird folgende Hypothese untersucht: • Schüler unterschiedlicher Schulformen nutzen verschiedene Informationsquellen, wenn sie sich über ein bestimmtes Produkt informieren. Je höher die Schulform, desto bessere Informationsquellen werden genutzt. Hierzu ist zunächst zu definieren, was eine „gute“, „durchschnittliche“ und „schlechte“ Informationsquelle ist. Unter einer guten Informationsquelle verstehe ich eine objektive, neutrale und ausführliche Informationsquelle wie z. B. eine Fachzeitschrift. Demnach ist der Informationsgehalt bei einer guten Informationsquelle sehr hoch. Eine schlechte Informationsquelle hingegen ist sehr interessengesteuert. Damit ist gemeint, dass die Informationsquelle nicht informieren möchte, sondern ihre Interessen durchsetzten möchte, z. B. der gute Absatz eines Produktes. Die Fernsehwerbung zum Beispiel bezeichne ich als eine solche interessengesteuerte Informationsquelle. Demnach bezeichne ich als eine Informationsquelle, die nur gering interessengesteuert ist und eine gewisses Maß an Objektivität gewährleistet, als durchschnittliche Informationsquelle. Für die Untersuchung der Theorie sind unter dem Aspekt des Preisvergleichs folgende Hypothesen zu untersuchen: • Ob ein Schüler Preise vergleicht, wenn er sich ein bestimmtes Produkt kaufen möchte, hängt von der Schulform ab. Je höher die Schulform der Jugendlichen, desto wahrscheinlicher ist es, dass sich ein Jugendlicher über den Preis eines Produktes in verschiedenen Geschäften informiert, wenn er es kaufen möchte. Um herauszufinden, welche Schüler (Gymnasiasten, Hauptschüler oder Realschüler) im Einkaufsverhalten zielstrebiger sind und sich somit von den äußeren Reizen, wie z. B. Werbung, Preise etc. weniger beeinflussen lassen, soll folgende Hypothese überprüft werden: • Die Schulform hat einen Einfluss darauf, ob ein Schüler ein zielstrebiges Einkaufsverhalten hat oder ob er sich von vielen äußeren Reizen beeinflussen lässt. Je höher die Schulform, desto zielstrebiger ist der Schüler in seinem Einkaufsverhalten. Da ich vermute, dass sich das Einkaufsverhalten und das Verhältnis zum Geld je nach Schulform unterscheidet, gehe ich davon aus, dass sich dieses Verhalten auch in den bevorzugten Geschäften, in denen Schüler einkaufen, widerspiegelt. Ich vermute daher, dass Schüler, die ein gutes Verhältnis zu ihrem Geld haben, hauptsächlich in günstigeren Geschäften einkaufen, während Schüler, die ein lockeres Verhältnis zu ihrem Geld haben, auch häufiger in teureren Geschäften einkaufen. • Die Geschäfte, in denen Schüler einkaufen, unterscheiden sich je nach Schulform. 69 11. Aufbau der Untersuchung Wie in der ersten Theorie müssen die Ergebnisse anschließend angemessen interpretiert werden. Hierbei orientiere ich mich am ökonomischen Prinzip der Nutzenmaximierung, welches besagt, das der Verbraucher versucht, „[...]die vorhandenen Mittel (das heißt das ihm zur Verfügung stehende Geld) so zu verwenden, daß sie ihm [...] den höchsten Nutzen“ 62 bringt. Stark vereinfacht lässt sich sagen, dass einem Schüler ein gutes Einkaufsverhalten zugeordnet wird, wenn • er sich vor dem Kauf eines Produktes über dieses informiert, wobei sich die Art Informationsquellen nach ihrer Qualität unterschieden lässt. Hier wird z. B. den Informationsquellen Internet oder Fachzeitschriften eine höhere Qualität zugeordnet als dem öffentlich-rechtlichen und privaten Fernsehen. • er sich vor dem Kauf eines Produktes in verschiedenen Geschäften über die Preise informiert und das Produkt dann im preisgünstigstem Geschäft kauft. • er in seinem Einkaufsverhalten sehr zielstrebig ist, d. h. selten oder nie Spontankäufe tätigt, und sich von seinem eigentlichem Kaufziel nicht durch äußere Reize ablenken lässt. Dementsprechend gilt für ein schlechtes Verbraucherverhalten die gegenteiligen Verhaltensweisen. Einem Schüler wird ein schlechtes Verbraucherverhalten zugeordnet wenn • er sich vor dem Kauf eines Produktes nicht über dieses informiert. • er vor dem Kauf eines Produktes nicht in verschiedene Geschäfte geht um Preise zu vergleichen und das gewünschte Produkt dementsprechend in dem ersten Geschäft kauft. • er in seinem Einkaufsverhalten nicht sehr zielstrebig ist, d. h. sich von äußeren Reizen ablenken lässt und deshalb häufig ein anderes Produkt kauft, wenn er in die Stadt geht, als er eigentlich kaufen wollte. Die in der nachstehenden Tabelle dargestellten Interpretationsregeln wurden folgendermaßen entwickelt: • Die Merkmale der Tabelle werden wie folgt gewichtet: – „informiert sich“ mit 40% – „vergleicht Preise“ mit 40% – „tätigt Spontankäufe“ mit 20% • Jeder Merkmalsausprägung wird eine Punktzahl von 0 bis 10 zugeordnet, wobei 0 schlechte und 10 optimale Verhaltensweisen entsprechen. Diese Wertung ist der Tabelle zu entnehmen. • Der in der letzten Spalte aufgeführte Wert ist die gewichtete Summe der Punkte. Informiert sich ein Schüler z. B. bei schlechten (4 Punkte), vergleicht Preise (10 Punkte) und tätigt selten Spontankäufe (5 Punkte) so ergibt sich für dieses Verhalten ein Wert von 4 · 0, 4 + 10 · 0, 4 + 5 · 0, 2 = 6, 6. 62 May (2003) S. 6. 70 11. Aufbau der Untersuchung • Die Zeilen der 24 möglichen Kombinationen werden danach absteigend nach der Größe des errechneten Wertes sortiert. Anschließend werden die Schranken für die Verhaltensweisen festgelegt. In meinem Fall wird den Werten bis einschließlich 4 ein schlechtes, den Werten größer 4 bis einschließlich 7 ein angemessenes und den Werten größer 7 ein gutes Einkaufsverhältnis zugeordnet. Punkte Gutes Einkaufsverhalt Angemessenes Einkaufsverhalten schlechtes Einkaufsverhalten gut 10 + + − + − − − − + − − + − − + − − − − − − − − − informiert sich mittel schlecht 7 4 − − − − + − − − + − − + + − − + − − − − − + − − − − + − − − − − + − − + + − − + − − − + − − − − nie 0 − − − − − − − − − + − − + − − + − − − − + − + + Schüler vergleicht Preise ja nein 10 0 + − + − + − + − + − + − + − + − − + + − + − − + + − − + − + + − − + − + − + − + − + − + − + − + tätigt Spontankäufe nie selten häufig 10 5 0 + − − − + − + − − − − + − + − + − − − − + − + − + − − + − − − − + − + − − + − + − − − − + − − + − + − + − − − − + − + − + − − − − + − + − − − + P 10 9 8,8 8 7,8 7,6 6,8 6,6 6 6 5,6 5 5 4,8 4 4 3,8 3,6 2,8 2,6 2 1,6 1 0 Anmerkung: Die Unterteilung der Spalte „informiert sich“ in gut, mittel, schlecht, resultiert aus der Qualität der Informationsquellen. Die Spalte nie bedeutet, dass sich der Schüler nicht informiert. Tabelle 11.2.: Interpretationsregeln zum Einkaufsverhalten der Schüler 11.1.3. Dritte Theorie Die dritten Theorie, die untersucht werden soll, lautet: Das Fernsehkonsumverhalten unterscheidet sich je nach Schulform. Für diese Theorie ist es notwendig, dass Fernsehkonsumverhalten der Jugendlichen zu analysieren. Die Untersuchung des Mediennutzungsverhalten ist unter dem Gesichtspunkt des Verbraucherverhaltens von Nöten, da davon ausgegangen wird, dass das Medium Fernsehen einen Einfluss auf das Verbraucherverhalten, speziell auf das Einkaufsverhalten der Jugendlichen, hat. Hierbei wird davon ausgegangen, dass das 71 11. Aufbau der Untersuchung Fernsehen ihren Einfluss durch das Werbeprogramm auf die Jugendlichen ausübt. Da der Werbebranche dieser hohe Einfluss auf Jugendliche bekannt ist, sind diese eine stark umworbene Zielgruppe. Für eine Untersuchung zum Verbraucherverhalten ist es daher notwendig zu analysieren, wie viel Werbung auf Jugendliche im Durchschnitt einwirkt. Aus diesem Grund ist es unerlässlich, die Fernsehnutzungsdauer zu betrachten. Die hierzu aufgestellt Hypothese lautet: • Die Fernsehnutzungsdauer unterscheidet sich je nach Schulform. Je höher die Schulform, desto geringer ist die Fernsehnutzungsdauer der Schüler. Da das Werbeprogramm der Medien abhängig von der Tageszeit ist, ist es von Bedeutung herauszufinden, um welche Uhrzeiten Jugendliche bevorzugt Fernsehen schauen. Es wird davon ausgegangen, dass das Werbeprogramm vormittags hauptsächlich die Zielgruppe der Hausfrauen anspricht, während am Nachmittag und im Vorabendprogramm häufig Jugendliche angesprochen werden. Meine hierzu formulierte Hypothese lautet: • Die Uhrzeiten, zu denen Jugendliche Fernsehen schauen, unterscheiden sich je nach Schulform. • Die Uhrzeiten, zu denen Jugendliche Fernsehen schauen, unterscheiden sich zwischen dem Wochenende (Samstag und Sonntag) und der Arbeitswoche (Montag bis Freitag). Um zu analysieren, wie viel Werbung auf Jugendliche einwirkt, ist es notwendig zu betrachten, welche Fernsehkanäle von den Jugendlichen bevorzugt geguckt werden. Hierzu wird davon ausgegangen, dass die Fernsehkanäle unterschiedlich viele Werbeminuten ausstrahlen. Die formulierten Hypothesen lauten folgendermaßen: • Je höher die Schulform, desto mehr Jugendliche schauen öffentlich-rechtliche Fernsehsender. • Gymnasiasten sind täglich weniger Werbeminuten ausgesetzt als Realschüler oder Hauptschüler. Nachdem die genannten Hypothesen analysiert wurden bleibt noch zu klären, was ein gutes und was ein schlechtes Fernsehkonsumverhalten ist. Meine Unterteilung in gutes bzw. schlechtes Fersehkonsumverhalten stützt sich auf folgende subjektive Annahmen: Einerseits wird davon ausgegangen, daß ein hoher Fersehkonsum und intensive Nutzung privater Sender mit einer verstärkten Konfrontation mit Fersehwerbung einhergehen. Andererseits unterstelle ich, dass ein hoher Konsum von Werbespots dem Gedanken des rationalen Verbraucherverhaltens entgegen wirkt. Für die Entwicklung dieser Interpretationsregeln werden die Merkmale, welche für die Interpretation von Bedeutung sind, wie folgt von mir gewichtet: • „Fernsehnutzungsdauer in Stunden“ mit 50% • „Schüler schaut vormittags Fernsehen“ mit 25% • „Schüler schaut öffentlich-rechtliche Fernsehsender“ mit 25% Die folgenden Interpretationsregeln wurden nach der gleichen Methode wie Tabelle 11.2 entwickelt. 72 Punkte Gutes Fernsehnutzungsverhalten 73 schlechtes Fernsehnutzungsverhalten Schüler vormittags nein 10 + + + + − + − + + − − + − + − − + − − − schaut Fernsehen ja 0 − − − − + − + − − + + − + − + + − + + + Schüler schaut öffentlichrechtliche Fernsehsender ja nein 10 0 + − + − + − − + + − − + + − + − − + + − − + + − − + − + + − − + − + + − − + − + Tabelle 11.3.: Interpretationsregeln zum Fernsehnutzungsverhalten der Schüler P 10 9,5 8 7,5 7,5 7 7 6,5 5,5 5,5 5 5 4,5 4 4 3 2,5 2,5 1,5 0 11. Aufbau der Untersuchung Durchschnittlich Fernsehnutzungsverhalten Fernsehnutzungsdauer in Stunden 0−1 1−2 2−3 3−5 >5 10 6 6 3 0 + − − − − − + − − − − − + − − + − − − − + − − − − − + − − − − + − − − − − − + − − − + − − − − + − − + − − − − − − − − + − + − − − − − − + − − − − + − − − + − − − − − − + − − − − + − − − + − − − − − + 11. Aufbau der Untersuchung 11.2. Zur Repräsentativität der Untersuchung Um Rückschlüsse von der Stichprobe auf die Grundgesamtheit zu ziehen ist es notwendig, dass die Stichprobe ein verkleinertes Abbild der Grundgesamtheit darstellt. Da es sich bei meiner Untersuchung um das Verbraucherverhalten von Jugendlichen der achten Klasse, handelt ist die Stichprobe aus allen Jugendlichen der achten Klasse zu entnehmen. Hierbei ist noch zu erwähnen, dass sich die Untersuchung auf die Stadt Siegen beschränkt. Um an ein verkleinertes Abbild der Grundgesamtheit der Jugendlichen der achten Klasse innerhalb Siegen zu gelangen ist es notwendig, die Anteile der Jugendlichen in den achten Klassen innerhalb der Grundgesamtheit mit den gleichen Anteilen in der Stichprobe zu verteilen. Hierzu ist es zunächst notwendig, Informationen über die Grundgesamtheit zu ermitteln. Nach Aussagen des „Landesamt für Datenverarbeitung und Statistik NRW“ 63 befinden sich insgesamt 7923 Schüler64 in der Sekundarstufe I. Davon gehen 1719 Schüler zur Hauptschule, 2060 Schüler zur Realschule, 2582 Schüler zum Gymnasium und 1562 Schüler zur Gesamtschule. Von den 7923 Schüler befinden sich 1403 Schüler in der achten Klasse. Von den Schülern der achten Klasse befinden sich 334 Schüler (23,8%) auf der Hauptschule, 376 Schüler (26,8%) auf der Realschule, 433 Schüler (30,8%) auf dem Gymnasium und 260 Schüler(18,5%) auf der Gesamtschule. Um eine gute Repräsentativität zu gewährleisten müssten diese Prozente innerhalb der Stichprobe eingehalten werden. Dies ist jedoch aufgrund meiner Möglichkeiten und aufgrund meiner Abhängigkeit von den Schulen nicht einzuhalten. Nachdem die Schulen angeschrieben wurden und ihre Zustimmung gegeben haben, ergab sich für meine Stichprobe folgende Verteilung. Insgesamt konnten 167 Gymnasiasten, 62 Hauptschüler und 160 Realschüler an der Befragung teilnehmen. Bei einer Gesamtmenge von 389 Schülern ergibt dieses für die Befragung, dass 42,9% Gymnasiasten, 15,9% Hauptschüler und 41,1% Realschüler befragt werden konnten. Auf die Befragung der Gesamtschulen musste leider verzichtet werden, da die Schulleitung ihr Einverstädnis zu dieser Befragung nicht gab. Für die Auswahl meiner Stichprobe wurde das Modell der mehrstufigen Zufallsstichprobe (siehe Seite 15) angewandt. Auf der 1. Stufe wurden die zufällig ausgewählten Schulen im Raum Siegen angeschrieben. Hierbei handelte es sich um die folgenden Schulen: 1. Gesamtschulen • Bertha-von-Suttner-Gesamtschule (Zustimmung nicht erhalten) • Gesamtschule Siegen-Eiserfeld (Zustimmung nicht erhalten) 2. Gymnasien • Fürst-Johann-Moritz-Gymnasium (Zustimmung erhalten) • Gymnasium Auf der Morgenröthe (Zustimmung erhalten) • Gymnasium Am Löhrtor (Zustimmung nicht erhalten) 63 64 Landesamt für Datenverarbeitung und Statistik NRW (2006). Im folgenden benutze ich das Wort „Schüler“ für beide Geschlechtertypen. 74 11. Aufbau der Untersuchung • Peter-Paul-Rubens-Gymnasium (Zustimmung erhalten) 3. Hauptschulen • Hauptschule Eiserfeld (Zustimmung nicht erhalten) • Geschwister-Scholl-Schule (Zustimmung erhalten) • Haardter-Berg-Schule (Zustimmung erhalten) 4. Realschule • Realschule am Häusling (Zustimmung erhalten) • Realschule am Schiessberg (Zustimmung nicht erhalten) • Realschule/Aufbaurealschule am Oberen Schloß (Zustimmung erhalten) Auf der 2. Stufe wurden mir nun von den Schulen jeweils 2 bis 3 Klassen für die Befragung angeboten. Auf der 3. Stufe werden in der Regel aus diesen Klassen zufällig ein oder mehrere Schüler gewählt. Für meine Untersuchung wurden immer alle Schüler einer Klasse in die Befragung einbezogen, daher bezeichnet man diese Form der Stichprobe auch als Klumpenstichprobe. Da eine zufallsgesteuerte Auswahl der Stichprobe durchgeführt wurde, wird davon ausgegangen, dass das Auftreten der relativen Merkmalshäufigkeit der Stichprobe der relativen Merkmalshäufigkeit der Grundgesamtheit entspricht. Es wird davon ausgegangen, dass durch dieses Auswahlverfahren die Repräsentativität von sich aus gegeben ist. Ein wesentliches Problem für die Repräsentativität meiner Untersuchung sehe ich in den fehlenden Untersuchungsdaten bzgl. der Gesamtschule. Durch diesen Umstand lässt sich kein exaktes verkleinertes Abbild der Grundgesamtheit für die Stichprobe erhalten. 11.3. Die Entwicklung des Fragebogens Im folgenden Abschnitt wird beschrieben, wie der Fragebogen (siehe Anhang C) entwickelt wurde. Der Fragebogen ist unter Beachtung der bereits beschriebenden Regeln und Empfehlungen von Seite 17 konstruiert worden. Nachdem das Forschungsthema konkretisiert wurde ist der Fragebogen zu konstruieren. Hierbei sind die vorher formulierten Hypothesen von Bedeutung. Der Fragebogen ist so zu formulieren, dass dieser die zur Analyse der Theorie benötigten Merkmale abfragt. Hierbei hat der Fragebogen in seiner Entwicklung bis zur Endfassung mehrere Phasen durchlaufen. Die erste Phase der Fragebogenentwicklung fand im Rahmen eines Seminars zur „Wirtschaftsdidaktik“ statt. Nachdem den Studenten das Vorhaben beschrieben wurde, bekamen sie die Aufgabe sich in die Zielgruppe, 14-jährige Jugendliche zu versetzen. Zur Analyse der Zielgruppe gehörte z. B. das Erforschen der Interessen von 14-jährigen Jugendlichen. Im nächsten Schritt bekamen sie die Aufgabe sich eigene Hypothesen zu diesem Thema zu überlegen. Anschließend sollten sie versuchen, dazu passende Fragen zu erstellen. Als Hilfsmittel wurde ihnen dazu eine Liste mit den 75 11. Aufbau der Untersuchung Empfehlungen zur Frageformulierung, ähnlich wie im Kapitel 4.2 beschrieben, an die Hand gegeben. Eine Liste der von den Studenten formulierten Fragen mit den möglichen Antworten befindet sich im Anhang A. In der zweiten Phase der Fragebogenentwicklung wurde von mir ein erster Fragebogen konstruiert. Hierfür wurden aus dem Fragenkatalog von Seite A die für die Studie relevanten Fragen herausgefiltert. Diese wurden zum Teil umformuliert und ergänzt, so dass sie den Empfehlungen der Frageformulierungen entsprachen. Außerdem mussten die Fragen zum Teil der Zielgruppe angepasst werden. Dieser Fragebogenprototyp wurde nach Gesprächen in einem Doktorandenseminar der Wirtschaftsdidaktik und der Erziehungswissenschaft mehrfach überarbeitet und verbessert. Im Anschluss daran wurde noch der Fragebogenbegleittext formuliert. Dabei entstand der in Anhang B dargestellte Fragebogen. In der dritten Phase wurde der Vortest durchgeführt. Der Testdurchlauf sollte dazu dienen, den Fragebogen sinnvoll zu überarbeiten und übersehende Fehler zu korrigieren. Der Fragebogen wurde hierbei während meines fünf wöchigen Unterrichtspraktikums am Peter-Paul-Rubens-Gymnasium in allen achten Klassen getestet. Während die Schüler den Fragebogen ausfüllten notierte ich mir die von den Schülern gestellten Fragen. Hierbei traten besonders häufig Probleme bei der Frage 3, 10, 12, 14, 15, 18 auf. Bei der Frage 3 war den Schülern nicht ganz klar, auf welchen Zeitraum sich das Taschengeld bezieht. Um dieses Problem zu beheben, wurde in der Korrekturphase die Frage 3 und 4 zusammengefasst. Bei der Frage 14 ist das Problem aufgetreten, dass ein Zeitraum bei den Ankreuzmöglichkeiten gänzlich fehlte. Der fehlende Zeitraum „0-1 Stunde“ wurde in der anschließenden Korrektur eingefügt. Bei den Fragen 10, 12 und 15 fehlten nach Schüleransicht weitere Antwortmöglichkeiten. In der Korrekturphase wurden daher noch einige Antwortmöglichkeiten hinzugefügt. Das nächste Problem ergab sich bei der Frage 18. Mit dieser konnten sich einige Schüler nicht identifizieren, da die Ankreuzmöglichkeit „SMS“ nicht vorhanden war. Des Weiteren haben mich die Schüler auf einige Rechtschreibfehler aufmerksam gemacht. In einem anschließenden Gespräch mit den Schülern bzgl. des Fragebogens haben sie mir viele, teilweise gute Verbesserungsvorschläge genannt, die in der Korrekturphase zum Teil mit eingearbeitet werden konnten. Durch diese Verbesserung und Hinzufügen weiterer Fragen entstand der für meine Untersuchung eigentliche Fragebogen, welcher in Anhang C nachzulesen ist. 76 12. Durchführung der Untersuchung Die Durchführung der Untersuchung fand an insgesamt 6 Tagen statt. Datum 17.08.2006 18.08.2006 28.08.2006 29.08.2006 30.08.2006 04.10.2006 18.11.2006 Schule Hauptschule Schießberg Gymnasium auf der Morgenröthe Haardter Berg Schule Realschule am Oberen Schloß Peter-Paul-Rubens-Gymnasium Realschule am Häusling Fürst-Johan-Moritz-Gymnasium Anzahl der Klassen 2 2 2 3 2 3 2 Tabelle 12.1.: Umfragetermine Da die Gleichheit der Untersuchungsbedingungen für eine empirische Untersuchung von großer Bedeutung ist, führte ich die Umfrage persönlich in den Klassen durch. Aufgrund meiner Anwesenheit in den Klassen an den oben genannten Tagen konnte ich versuchen, die Untersuchungsbedingungen relativ gleich zu halten. Um dieses zu gewährleisten, las ich z. B. den Fragebogeneinleitungstext mit den Schülern gemeinsam und wies auf bestimmte Schwierigkeiten hin. Ein weiterer Vorteil, dass ich die Umfrage persönlich durchführte, liegt darin, dass ich den Schülern jederzeit für Fragen bzgl. des Fragebogens zur Verfügung stand. Ein wesentliches Problem bei der Einhaltung der gleichen Untersuchungsbedingungen sehe ich darin, dass ich die Schulen alle an verschiedenen Tagen und zu unterschiedlichen Uhrzeiten besuchte. Hierbei konnte es passieren, dass ich z. B. einmal die Umfrage morgens, direkt nach Schulbeginn und ein anderes mal die Umfrage erst in der sechsten Stunde, kurz vor Unterrichtsende durchführte. Des Weiteren konnte es passieren, dass ich eine Schule an einem Montag und eine andere Schule an einem Freitag befragt habe. Dies führt zu unterschiedlichen Untersuchungsbedingungen, da die Konzentration, Leistungsfähigkeit, Aufnahmevermögen und Interesse der Schüler je nach Wochentag und Uhrzeit schwankt. Durch diese unterschiedlichen Untersuchungsbedingungen könnte die Repräsentativität der Untersuchung verletzt sein. 77 13. Untersuchung der ersten Theorie In diesem Kapitel soll nun meine erste Theorie „Das Verhältnis der Schüler zu ihrem Taschengeld unterscheidet sich je nach Schulform“ untersucht werden. 13.1. Unterscheidet sich die durchschnittliche Taschengeldhöhe nach Schulform? Um Aussagen über das Verhältnis der Jugendlichen zu ihrem Geld treffen zu können, ist die Kenntnis der Taschengeldhöhe der Jugendlichen von zentraler Bedeutung. Hierbei hat die Untersuchung meiner Stichprobe folgendes ergeben: Taschengeld Schüleranzahl ja 342 nein 28 keine Angabe 18 P 388 Tabelle 13.1.: Anzahl der Schüler die Taschengeld erhalten65 Unter der Annahme, dass die Schüler Taschengeld erhalten, wird die durchschnittliche Taschengeldhöhe aller Schüler und nach Schulformen getrennt betrachtet.66 Schulform Hauptschule Realschule Gymnasium Gesamt Anzahl der Schüler Durchschnittliche Taschengeldhöhe 52 28,73 138 26,95 152 20,81 342 24,44 Tabelle 13.2.: Durchschnittliche Taschengeldhöhe sortiert nach Schulformen67 Wie der Tabelle entnommen werden kann, nimmt innerhalb meiner Stichprobe die durchschnittliche Taschengeldhöhe mit der Höhe der Schulform ab. 65 1 Schüler ohne Angaben. Die genaue Häufigkeitsverteilung des Taschengeldes ist im Anhang nachzulesen. 67 47 Schüler ohne Angaben. 66 78 13. Untersuchung der ersten Theorie Das durchschnittliche Taschengeld der Grundgesamtheit wird mittels des erwartungstreuen, konsistenten Schätzer aus Beispiel 29 geschätzt. Die sich für die Grundgesamtheit ergebenen Durchschnittswerte sind identisch mit den Durchschnittswerten der Stichprobe, welche in der Tabelle 13.2 abgelesen werden können. Unter der Annahme, dass die Schüler Taschengeld erhalten, ergibt sich das (1 − α)Konfidenzintervall für den Mittelwert nach der Formel (7.2) wie folgt: T̂342 (X1 , X2 , . . . , X342 ) = 24, 44, v u 342 u 1 X t σ̂ = (Xi − T̂342 (X1 , X2 , . . . , X342 ))2 = 19, 9873. 341 i=1 Zu einem Signifikanzniveau von α = 0, 05 ergibt sich das folgende Intervall 19, 9873 19, 9873 · 1, 9600; 24, 44 + √ · 1, 9600] = [22, 3217; 26, 5583] [24, 44 − √ 342 342 Der Mittelwert des Taschengeldes aller Schüler, die Taschengeld erhalten, liegt in dem 0, 95-Konfidenzintervall [22,3217;26,5583]. Daher ist es interessant die folgende Theorie zu testen. Die durchschnittliche Taschengeldhöhe unterscheidet sich je nach Schulform. Um eine Aussage über diese Hypothese zu tätigen, ist folgendes zu testen: 1. Jugendliche der Hauptschule erhalten durchschnittlich mehr Taschengeld, als Jugendliche der Realschule und des Gymnasiums. 2. Jugendliche der Realschule erhalten durchschnittlich weniger Taschengeld als Hauptschüler aber mehr als Gymnasiasten. 3. Jugendliche vom Gymnasium erhalten durchschnittlich weniger Taschengeld als Hauptschüler oder Realschüler. Um einen Hypothesentest durchführen zu können ist eine Kenntnis über die Wahrscheinlichkeitsverteilung des zu untersuchenden Merkmals, in meinem Fall die Taschengeldhöhe, notwendig. Zu diesem Zweck wurden von mir einige Wahrscheinlichkeitsverteilungen mit Hilfe des χ2 -Anpassungstest auf ihre Zugehörigkeit zum Merkmal Taschengeldhöhe getestet. Jedoch konnte ich keine passende Verteilung finden. Für das Testen einiger Verteilungen möchte ich den χ2 -Anpassungstest exemplarisch für die Normalverteilung vorstellen. 79 13. Untersuchung der ersten Theorie 13.1.1. Versuch der Anpassung einer Normalverteilung Zur Untersuchung, ob die Daten einer Normalverteilung entsprechen, werden zuerst mittels der Maximum-Likelihood-Methode die konkreten Parameter der Normalverteilung geschätzt. Anschließend wird mit Hilfe des χ2 -Anpassungstest getestet, ob die Daten dieser Verteilung entsprechen. 13.1.1.1. Maximum-Likelihood-Schätzung des Mittelwerts und der Varianz einer Normalverteilung Für die Dichte einer normalverteilten Zufallsvariable gilt f (x) = p 1 1 2 · e− 2σ2 (x−µ) . 2µσ 2 Nach (7.1) errechnet sich die Likelihood-Funktion wie folgt: 2 L(µ, σ ) = n Y i=1 √ 1 2πσ 2 − ·e 1 (xi −µ)2 2σ 2 = √ 1 2πσ 2 n 1 · e− 2σ2 Pn 2 i−1 (xi −µ) Um das Maximum zu bestimmen ist L(µ, σ 2 ) abzuleiten. Da die Likelihood-Funktion an der selben Stelle ihr Maximum besitzt wie die logarithmierte Likelihood-Funktion kann das Maximum der logarithmierten Likelihood-Funktion bestimmt werden. l(µ, σ 2 ) = ln L(µ, σ 2 ) 1 Pn n 2 = ln (2πσ 2 )− 2 · e− 2σ2 i=1 (xi −µ) 1 Pn − n 2 = ln 2πσ 2 2 + ln e− 2σ2 i=1 (xi −µ) n n 1 X 2 = − ln 2µσ − 2 (xi − µ)2 2 2σ i=1 Damit die logarithmische Likelihood-Funktion ein Extrempunkt hat muss l′ (µ, σ 2 ), also die partiellen Ableitungen von l nach µ und nach σ 2 , eine Nullstelle haben. Es ist n n ∂ 1 X 1 X l(µ, σ 2 ) = 0 − 2 2 (xi − µ)(−1) = 2 (xi − µ), ∂µ 2σ i=1 σ i=1 n ∂ n 1 1 X 2 l(µ, σ ) = − + (xi − µ)2 . ∂(σ 2 ) 2 σ 2 2σ 4 i=1 Zur Bestimmung der Nullstelle muss nun das Tupel (µ, σ 2 ) gefunden werden, für die beide partielle Ableitungen Null ergeben. 80 13. Untersuchung der ersten Theorie Für die Nullstelle der ersten partielle Ableitung ergibt sich: ∂ l(µ, σ 2 ) = 0 ∂µ n 1 X ⇔ 2 (xi − µ) = 0 σ i=1 ⇔ ⇔ n X i=1 n X i=1 (xi − µ) = 0 xi − nµ = 0 n 1X ⇔µ= xi n i=1 Der Schätzer für µ ist somit n 1X µˆn (x1 , x2 , . . . , xn ) = xi . n i=1 Für die Nullstelle der zweiten partiellen Ableitung ergibt sich: ∂ l(µ, σ 2 ) = 0 2 ∂(σ ) n 1 X n 1 ⇔ − + (xi − µ)2 = 0 2 σ 2 2σ 4 i=1 n n 1X ⇔ σ2 = (xi − µ)2 2 2 i=1 n 1X ⇔σ = (xi − µ)2 n i=1 2 n 1X ⇔σ = (xi − µˆn (x1 , x2 , . . . , xn ))2 n i=1 2 Der Schätzer für σ 2 ist somit n 1X (xi − µˆn (x1 , x2 , . . . , xn ))2 . σˆn2 (x1 , x2 , . . . , xn ) = n i=1 Der Schätzer µˆn , σˆn2 ist der Maximum-Likelihood-Schätzer für die Normalverteilung mit unbekanntem Mittelwert und unbekannter Varianz. Der Schätzer µˆn , σˆn2 liefert für meine Grundgesamtheit den Mittelwert µˆn des Taschengeldes und die Varianz σˆ2 . n 81 13. Untersuchung der ersten Theorie 3 µˆn (x1 , x2 , . . . , xn ) = 1 X 42xi = 24, 44 342 i=1 342 1 X σˆn2 (x1 , x2 , . . . , xn ) = (xi − 24, 44)2 = 398, 27 342 i=1 Falls das Merkmal Taschengeldhöhe normalverteilt wäre, würde es der N24,44;398,27 Verteilung entsprechen. 13.1.1.2. χ2 -Anpassungstest Für den Anpassungstest werden folgende Hypothesen formuliert: H0 : Das Merkmal Taschengeld ist normalverteilt nach N24,44;398,27 . HA : Das Merkmal Taschengeld ist nicht normalverteilt nach N24,44;398,27 . Nun werden n Beobachtungen in m verschiedene Kategorien eingeteilt. Anschließend wird die erwartete Häufigkeit unter der Annahme, das die Normalverteilung zutrifft, berechnet. Daraus wird nun die Prüfgröße χ2 ermittelt. Klassen Häufigkeiten Erwartete Häufigkeit χ2j 0-10 51 42,5148781 1,69346114 10-20 164 60,6378344 176,189295 20-30 69 67,6324541 0,02765214 30-40 25 58,9907365 19,5856203 40-50 17 40,2364381 13,4189824 50-60 3 21,4607180 15,8800889 60-70 2 8,9499133 5,39684503 70-80 3 2,9180693 0,00230037 80-90 2 0,7437536 2,12187857 90-100 1 0,1481744 4,8969789 100-110 0 0,0230715 0,02307149 110-120 1 0,0028072 354,227706 120-130 0 0,0002669 0,00026687 130-140 1 0,0000198 50455,0073 140-150 3 0,0000011 7829329,27 P 342 7880377,74 Tabelle 13.3.: Klasseneinteilung Anpassungstest68 und die berechneten Werte für den χ2 - Für das χ2 -Quantil zu einem Signifikanzniveau von α = 0, 05 mit 14 Freiheitsgraden ergibt sich χ214;0,95 = 6, 5706. H0 wird abgelehnt falls χ2 > χ2m−1;1−α erfüllt ist. In meinem Fall ist χ2 = 342·7880377, 74 = 2695089187, 08 > 6, 5706 = χ214;0,95 , d. h. die Nullhypothese wird abgelehnt. Das Merkmal Taschengeld ist nicht normalverteilt. 68 47 Schüler haben die Frage bzgl. des Taschengeldes nicht beantwortet. 82 13. Untersuchung der ersten Theorie Man sieht das die Werte in den Flanken nicht der Normalverteilung entsprechen. Diese Abweichung von der Normalverteilung in den Flanken hat eine sehr hohe Gewichtung ,da die erwarteten Häufigkeiten dort sehr klein sind. Daraus resultiert der besonders große Wert für die χ2 -Prüfstatistik. Außerdem erkennt man auch im Zentrum der Normalverteilung eine deutliche Abweichung (z. B. χ22 = 176, 189295). Allein an dieser Stelle ist die Abweichung schon zu groß, was zur Verwerfung der Nullhypothese führt. 13.1.2. Wilcoxon-Rangsummentest Um trotz der fehlenden Kenntnis eine Aussage bzgl. der oben genannten Hypothese tätigen zu können, greift man zu verteilungsfreien Tests. Hier bietet sich der Rangsummentest von Wilcoxon bzw.der U-Test von Mann-Whitney an. Da mir eine recht große Stichprobe vorliegt, wird der approximativen Rangsummentest angewandt. Da der Rangsummentest ein Zweistichprobentest ist und außerdem keine Aussagen über die durchschnittliche Taschengeldhöhe macht, müssen die Hypothesen umformuliert werden. 1. Jugendliche des Gymnasiums erhalten tendenziell weniger Taschengeld als Jugendliche der Hauptschule. 2. Jugendliche des Gymnasiums erhalten tendenziell weniger Taschengeld als Jugendliche der Realschule. 3. Jugendliche der Realschule erhalten tendenziell weniger Taschengeld als Jugendliche der Hauptschule. Somit ist zu jeder Hypothese ein Rangsummentest durchzuführen. Mir ist bewusst, dass die Verteilungsfunktion des Merkmals Taschengeld nicht stetig ist, was man daran erkennen kann, dass die Wahrscheinlichkeit, dass eine Merkmalsausprägung mehrfach auftritt, nicht Null ist. Dennoch wird im Folgenden die Verteilungsfunktion des Merkmals Taschengeld annähernd stetig verteilt angenommen. Nach Hartung69 69 Vgl. Hartung (1982) S. 515. 83 13. Untersuchung der ersten Theorie wird im Falle von Bindungen (mehrere Messwerte sind gleich) den Werten das arithmetische Mittel der in Frage kommenden Ränge zugewiesen. Erstes Hypothesenpaar Die Alternativ- und Nullhypothese ist hier folgendermaßen formuliert. HA : Jugendliche des Gymnasiums erhalten tendenziell weniger Taschengeld als Jugendliche der Hauptschule (d. h. X <t Y ). H0 : Jugendliche des Gymnasiums erhalten tendenziell gleich viel oder mehr Taschengeld als Jugendliche der Hauptschule (d. h. X ≥t Y ). Um den Rangsummentest durchzuführen zu können, muss nun für jedes Element der Stichprobenvereinigung X1 , X2 , . . . , Xn , Y1 , Y2 , . . . , Yn der Rang berechnet werden. Im Folgenden wird die Rangsumme der beiden Stichproben berechnet. WX = 162 X R(Xi ) = 17238, 5 i=1 WY = 58 X R(Yi ) = 7071, 5 i=1 Mit Hilfe dieser Werte berechnet man nun U und anschließend die Prüfgröße U*. 162(162 + 1) − 17238, 5 = 5360, 5 2 5360, 5 − 162·58 2 U∗ = q = 1, 5926 U = 162 · 58 + 162·58·162+58+1 12 Für das Quantil der Standardnormalverteilung gilt u1−α = 1, 2816 mit α = 0, 1. H0 wird abgelehnt, falls U ∗ > u1−α gilt. In meinem Fall ist U ∗ = 1, 5926 > 1, 2816 = u1−α . Somit kann die Nullhypothese abgelehnt werden und die Alternativhypothese trifft mit einer 90-prozentigen Wahrscheinlichkeit zu. D.h. mit 90-prozentiger Wahrscheinlichkeit erhalten Jugendliche des Gymnasiums tendenziell weniger Taschengeld als Jugendliche der Hauptschule. Analog zum ersten Hypothesenpaar werden die Hypothesenpaare 2 und 3 geprüft. Zweites Hypothesenpaar Die Alternativ- und Nullhypothese sind hier folgendermaßen formuliert: HA : Jugendliche des Gymnasiums erhalten tendenziell weniger Taschengeld als Jugendliche der Realschule. (d. h. X <t Y ). H0 : Jugendliche des Gymnasiums erhalten tendenziell gleich viel oder mehr Taschengeld als Jugendliche der Realschule. (d. h. X ≥t Y ). 84 13. Untersuchung der ersten Theorie Für die Rangsummen und für U und U ∗ ergibt sich WX = WY = 162 X i=1 151 X R(Xi ) = 23735, 5 R(Yi ) = 25405, 5 i=1 162(162 + 1) − 23735, 5 = 13929, 5 2 13929, 5 − 162·151 ∗ 2 U =q = 2, 1230 U = 162 · 151 + 162·151·(162+151+1) 12 Das Quantil der Standardnormalverteilung zu einem Signifikanzniveau α = 0, 1 ist u1−α = 1, 2816. Damit gilt U ∗ = 2, 1230 > 1, 2816 = u1−α . Die Nullhypothese kann somit abgelehnt werden und die Alternativhypothese kann mit einer 90-prozentigen Wahrscheinlichkeit angenommen werden. Hier kann die Nullhypothese sogar zu einem Signifikanzniveau von α = 0, 05 abgelehnt werden, denn das Quantil der Standardabweichung zu einem Signifikanzniveau von α = 0, 05 ist u1−α = 1, 6449. Damit ist U ∗ = 2, 1230 >= 1, 6449 = u1−α und die Nullhypothese kann abgelehnt werden. Die Alternativhypothese kann sogar mit einer 95-prozentigen Wahrscheinlichkeit angenommen werden. D.h. mit 95-prozentiger Wahrscheinlichkeit erhalten Jugendliche des Gymnasiums weniger Taschengeld als Jugendliche der Realschule. Drittes Hypothesenpaar Die Hypothesen werden hier folgendermaßen formuliert: HA : Jugendliche der Realschule erhalten tendenziell weniger Taschengeld als Jugendliche der Hauptschule. (d. h. X <t Y ). H0 : Jugendliche der Realschule erhalten tendenziell gleich viel oder mehr Taschengeld als Jugendliche der Hauptschule. (d. h. X ≥t Y ). Für die Rangsummen und für U und U ∗ ergibt sich WX = WY = 151 X i=1 58 X R(Xi ) = 15912, 5 R(Yi ) = 7020, 5 i=1 151(151 + 1) − 15912, 5 = 4321, 5 2 4321, 5 − 151·58 2 U∗ = q = −0, 1469 U = 151 · 58 + 151·58·(151+58+1) 12 Das Quantil der Standardnormalverteilung ist mit α = 0, 1 wie in der Hypothese 1 und 2 bestimmt durch u1−α = 1, 2816. 85 13. Untersuchung der ersten Theorie Jetzt ist U ∗ = −0, 1469 < 1, 2816 = u1−α und damit kann die Nullhypothese mit einem Signifikanzniveau von 10% nicht abgelehnt werden. Hier kann keine signifikante Aussage getroffen werden. 13.2. Ist die Wahrscheinlichkeit, dass ein Gymnasiast kein Taschengeld erhält, höher als das ein Hauptschüler kein Taschengeld erhält? Unter dem Gesichtspunkt, dass Gymnasiasten tendenziell weniger Taschengeld erhalten, ist zu vermuten, dass die Wahrscheinlichkeit, dass ein Gymnasiast kein Taschengeld bekommt, größer ist, als dass ein Hauptschüler kein Taschengeld erhält. Somit lautet meine Hypothese: Die Wahrscheinlichkeit, dass ein Schüler des Gymnasiums kein Taschengeld erhält, ist höher als die Wahrscheinlichkeit, dass ein Schüler der Hauptschule kein Taschengeld erhält. In der vorliegenden Stichprobe ist die Anzahl der Schüler, die kein Taschengeld erhalten, folgendermaßen nach Schulform aufgeteilt: Schulform Gymnasium Realschule Hauptschule Gesamt Gesamtanzahl der Schüler 162 151 58 371 Anzahl der Schüler ohne Taschengeld 10 13 5 28 Anzahl der Schüler ohne Taschengeld in % 6,1728 8,6093 8,6207 7,5472 Tabelle 13.4.: Anzahl der Schüler die kein Taschengeld erhalten Wie man der Tabelle entnehmen kann, bekommen innerhalb der Stichprobe 8,6207% der Hauptschüler und 6,1728% der Gymnasiasten kein Taschengeld. Dieses widerspricht meiner eigentlichen Hypothese. Daher ist zu prüfen, ob die Wahrscheinlichkeit, dass ein Hauptschüler kein Taschengeld bekommt größer ist, als das ein Gymnasiast kein Taschengeld bekommt. 13.2.1. Vergleich zweier relativer Häufigkeiten Mit Hilfe dieses Test lassen sich die relativen Häufigkeiten zweier binomialverteilter Merkmale X und Y der iid Stichproben X1 , X2 , · · · , Xn und Y1 , Y2, · · · , Ym miteinander vergleichen. In meinem Fall möchte ich die relative Häufigkeit der Gymnasiasten, die kein Taschengeld erhalten mit der relativen Häufigkeit der Hauptschüler, die kein Taschengeld erhalten, vergleichen. Die Hypothesen werden ähnlich wie bei dem exakten Binomialtest formuliert: H0 : pGym ≥ pHaupt , HA : pGym < pHaupt 86 13. Untersuchung der ersten Theorie Für die relativen Häufigkeiten ergibt sich aus Tabelle 13.5 162 fGym 1 X 10 = Xi = , 162 i=1 162 58 fHaupt 1 X 5 = Yj = . 58 j=1 58 Für die Differenz der relativen Häufigkeiten d ergibt sich nun d= 10 5 115 − =− = −0, 0245. 162 58 4698 Für die Prüfstatistik V ergibt sich daraus V =q 3 (1 44 −0, 0245 − 3 )( 1 44 162 + 1 ) 58 = −0, 6352. Für das Quantil der Standardnormalverteilung u1−α zu einem Signifikanzniveau α = 0, 1 ergibt sich u0,9 = 1, 2816. Aus den Entscheidungsregeln für diesen Test wird H0 abgelehnt, falls V < −u1−α ist. Für meinen Fall gilt V = −0, 6352 > −1, 2816 = −u0,9 . Daher kann die Nullhypothese zum angegebenen Signifikanzniveau nicht abgelehnt werden. 13.2.2. Exakter Binomialtest Zum Testen der eben genannten Hypothese ist die Durchführung eines Binomialtest möglich, da die Stichprobe nur zwei Merkmalsausprägungen annehmen kann. Zum einen die Ausprägung, dass der Schüler Taschengeld erhält und zum anderen, dass der Schüler kein Taschengeld erhält. P Erhält Taschengeld Erhält kein Taschengeld Gymnasium 152 10 162 Hauptschule 53 5 58 P 205 15 220 Tabelle 13.5.: Vierfeldertafel zum Taschengeld Für den Test wird folgende Alternativ- und Nullhypothese formuliert: H0 : Die Wahrscheinlichkeit, dass ein Schüler vom Gymnasium kein Taschengeld erhält ist größer oder gleich der Wahrscheinlichkeit, dass ein Hauptschüler kein Taschengeld erhält. HA : Die Wahrscheinlichkeit, dass ein Schüler vom Gymnasium kein Taschengeld erhält ist kleiner als die Wahrscheinlichkeit, dass ein Schüler der Hauptschule kein Taschengeld erhält. Da hier die unbekannte Wahrscheinlichkeit p (Wahrscheinlichkeit dass ein Gymnasiast kein Taschengeld erhält) mit einer vorgegebenen Wahrscheinlichkeit p0 (Wahrscheinlichkeit, dass ein Hauptschüler kein Taschengeld erhält) verglichen wird, ist zunächst p0 festzulegen, sei daher p0 = 0,0862. Somit ist zu testen: 87 13. Untersuchung der ersten Theorie H0 : p ≥ 0, 0862 HA : p < 0, 0862 Zu dem Signifikanzniveau α = 0, 1 ergibt sich die kritische Schranke bu;0,1 (0, 0862) rechnerisch wie folgt: 8 9 X X 162 162 k 162−k 0, 0862 (1 − 0, 0862) ≤ 0, 1 < 0, 0862k (1 − 0, 0862)162−k k k k=0 k=0 ⇔ 0, 0551 ≤ 0, 1 < 0, 1006 Somit ist ist bu;0,1 (0, 0862) = 9. Die Nullhypothese wird abgelehnt, falls e < bu;α (p0 ) gilt. Speziell für mein Testergebnis gilt e = 10 > 9 = bu;0,1 (0, 0862) und somit kann H0 nicht abgelehnt werden. Aus diesem Testergebnis und dem Ergebnis des Vergleichs der relativen Häufigkeit lässt sich H0 nicht ablehnen. Anhand der Daten meiner Stichprobe lässt sich zwar vermuten, dass ein Zusammenhang zwischen der Schulform und der Tatsache, ob ein Schüler Taschengeld erhält oder nicht, besteht. Doch mit Hilfe der durchgeführten Tests lässt sich keine eindeutige Aussage bzgl. dieser Hypothese machen. 13.3. Leihen sich Gymnasiasten und Hauptschüler seltener Geld als Realschüler? Neben der Kenntnisse bzgl. des Taschengeldes ist für die Theorie von großer Bedeutung, ob Jugendliche mit ihrem Taschengeld auskommen oder ob sie sich zusätzliches Geld leihen. Unter dem Gesichtspunkt der Theorie ist es auch von großem Interesse, ob Jugendliche einen Teil ihres zur Verfügung stehenden Geldes sparen. Zu Beginn soll nun das Geldleih- und Geldsparverhalten getrennt nach Schulform betrachtet werden. Gymnasiasten Realschüler Hauptschüler P Mehrmals pro Monat 14 21 8 43 Geld leihen P Einmal Seltener als einmal Nie pro Monat pro Monat 18 62 72 166 20 68 50 159 5 21 28 62 43 151 150 387 Tabelle 13.6.: Absolute Häufigkeiten Geldleihverhaltens70 Da für das Verbraucherverhalten von Bedeutung ist, ob die Schüler in der Regel mit ihrem Geld auskommen oder sich regelmäßig Geld leihen müssen, fasse ich die erste und zweite Spalte der Tabelle zu einer Tabelle zusammen, da sich in diesen Fällen die Schüler regelmäßig Geld leihen. 70 2 Personen ohne Angabe. 88 13. Untersuchung der ersten Theorie Gymnasiasten Realschüler Hauptschüler P Geld leihen Seltener als einmal pro Monat 62 68 21 151 Mindestens einmal pro Monat 32 41 13 86 Nie P 72 166 50 159 28 62 150 387 Tabelle 13.7.: Absolute Häufigkeiten des Geldleihverhaltens klassifiziert In Prozent bedeuten diese Werte, dass sich 19,28% der Gymnasiasten, 25,79% der Realschüler und 20,97% der Hauptschüler mindestens einmal pro Monat zusätzlich zu ihrem Taschengeld noch Geld leihen. Diese Datenverteilung hatte ich nicht vermutet. Meine Vermutung ging eher in die Richtung, dass sich Gymnasiasten, aufgrund des tendenziell niedrigeren Taschengeldes häufiger Geld leihen. Nach den Daten meiner Stichprobe entsteht nun aber die Frage, ob sich Gymnasiasten und Hauptschüler signifikant seltener Geld leihen als Realschüler. 13.3.1. Exakter Binomialtest Für den exakten Binomialtest können Merkmale nur auf zwei Merkmalsausprägungen getestet werden. Dieses ist hier zum einen die Merkmalsausprägung, die Schüler leihen sich mindestens einmal pro Monat Geld und zum andernen, die Schüler leihen sich weniger als einmal im Monat Geld, wobei diese Merkmalsausprägung alle Schüler beinhaltet, die sich seltener als einmal pro Monat Geld leihen und diejenigen die sich nie Geld leihen. Die Hypothesen werden formuliert als: H0 : Gymnasiasten bzw. Hauptschüler leihen sich mindestens so häufig Geld wie Realschüler. HA : Gymnasiasten bzw. Hauptschüler leihen sich seltener Geld als Realschüler. Zunächst soll der Test mit den Gymnasiasten durchgeführt werden. Hierbei ist zunächst eine Wahrscheinlichkeit p0 zu wählen, die mit der Wahrscheinlichkeit p, dass sich ein Gymnasiast Geld leiht, verglichen werden kann. Hierbei ist p0 die geschätzte Wahrscheinlichkeit, dass sich ein Realschüler Geld leiht und damit ist p0 = 0, 2579. Somit ist zu testen: H0 : p ≥ 0, 2579 HA : p < 0, 2579 Unter einem Signifikanzniveau von α = 0, 05 ergibt sich die kritische Schranke bu;0,05 (0, 2579) rechnerisch wie folgt: 33 X 166 k=0 k k 0, 2579 (1 − 0, 2579) 166−k 34 X 166 0, 2579k (1 − 0, 2579)166−k ≤ 0, 05 < k k=0 ⇔ 0, 0464 ≤ 0, 05 < 0, 0676 Somit ist ist bu;0,05 (0, 2579) = 34 89 13. Untersuchung der ersten Theorie Nach den in Tabelle 8.1 dargestellten Entscheidungsvorschriften für den exakten Binomialtest wird die Nullhypothese abgelehnt im Falle e < bu;α (p0 ). Die Anzahl der Treffer e, wobei die Gymnasiasten die sich mindestens einmal pro Monat Geld leihen als Treffer bezeichnet werden beträgt e = 32 und somit ist e = 32 < 34 = bu;0,05 (0, 2579). Somit wird die Nullhypothese mit einer Irrtumswahrscheinlichkeit von 5% abgelehnt und die Alternativhypothese wird angenommen, was bedetutet, dass sich Gymnasiasten signifikant seltener Geld leihen als Realschüler. Nun wird dieser Test auch für die Hauptschüler durchgeführt. Hier ist die Wahrscheinlichkeit p0 identisch zum vorhergehenden Test, d. h. p0 = 0, 2579 und es ist abermals zu testen H0 : p ≥ 0, 2579 HA = p < 0, 2579 Unter einem Signifikanzniveau von α = 0, 05 ergibt sich für die kritische Schranke bu;0,05 (0, 2579) = 10. In diesem Fall kann die Nullhypothese zum Signifikanzniveau α = 0, 05 nicht abgelehnt werden, da e = 13 > 10 = bu;0,05 (0, 2579) beträgt. Selbst zu einem Signifikanzniveau von α = 0, 1 kann die Nullhypothese nicht abgelehnt werden. Hier wäre e = 13 > 12 = bu;0,05 (0, 2579). Obwohl die Anteile der Gymnasiasten und der Hauptschüler, die sich mindestens einmal pro Monat Geld leihen, annähernd gleich sind, können dennoch nicht beide Nullhypothesen abgelehnt werden. Dieses kann im Wesentlichen daher kommen, dass die Stichprobe der Hauptschüler vergleichsweise mit der anderen Stichprobe recht klein ist. Nachdem ich nun signifikant nachgewiesen habe, dass sich Gymnasiasten seltener Geld leihen als Realschüler, stellt sich die Frage nach dem Grund. Eine Vermutung, warum sich Gymnasiasten seltener Geld leihen, liegt darin, dass eventuell mehr Gymnasiasten als Realschüler sich zusätzlich zu ihrem Taschengeld noch Geld durch einen kleinen Nebenjob (z. B. Zeitungen austragen) hinzuverdienen. Um dies überprüfen zu können ist es notwendig zu wissen, wie viele Gymnasiasten und Realschüler einen Nebenjob besitzen. Besitzen einen Job Gymnasiasten Realschüler Hauptschüler P Besitzen einen Job in % 41,5 42,3 16,3 51 52 20 123 P Besitzen keinen Job 116 167 108 160 42 62 266 389 Tabelle 13.8.: Anzahl der Schüler die einen Nebenjob besitzen Hier an dieser Stelle kann ich meine Vermutung, dass Gymnasiasten häufiger einen Nebenjob besitzen als Realschüler, verwerfen, da der Anteil der Gymnasiasten, die einen Job besitzen, annähernd gleich ist mit dem Anteil der Realschüler, die einen Job besitzen. 90 13. Untersuchung der ersten Theorie 13.4. Hängt das Sparverhalten der Jugendlichen mit der Schulform zusammen? Im Folgenden soll nun das Sparverhalten der Schüler betrachtet werden. Hierfür wird zunächst das Sparverhalten innerhalb der Stichprobe betrachtet. Gymnasiasten Realschüler Hauptschüler P Sparen jeden Monat 85 53 14 152 Sparen manchmal Sparen nie 70 95 36 201 P 11 166 12 160 12 62 35 388 Tabelle 13.9.: Absolute Häufigkeiten des Sparverhaltens71 Ähnlich wie für das Geldleihverhalten interessieren auch beim Sparverhalten besonders die Personen, die regelmäßig Geld sparen. Dieses sind in meinem Fall gerade die Schüler, die jeden Monat etwas Geld sparen. Alle anderen Schüler werden zusammengefasst zu einer Gruppe, welche selten bis nie spart. Daher ergibt sich folgendes Sparverhalten: Gymnasiasten Realschüler Hauptschüler P P Sparen regelmäßig Sparen selten bis nie 85 81 166 53 107 160 14 48 62 152 236 388 Tabelle 13.10.: Absolute Häufigkeiten des Sparverhaltens klassifiziert Nach den Tabellen zum Sparverhalten zeigt sich, dass 51,20% der Gymnasiasten, 33,13% der Realschüler und 22,58% der Hauptschüler regelmäßig sparen. Auffällig ist, dass gerade die Schülergruppe, die tendenziell am wenigsten Taschengeld erhält (Gymnasiasten), am meisten sparen und die Schülergruppe, die tendentziell am meisten Taschengeld erhält (Hauptschüler), am wenigsten sparen. Im Folgenden wird nun getestet, ob das Sparverhalten abhähgig von der Schulform ist, oder ob es vielleicht abhängig von der Höhe des Taschengeldes ist. Um die Abhängingkeit der Merkmale Sparen und Schulform zu überprüfen, wird der χ2 -Unabhängingkeitstest angewandt. 13.4.1. χ2 -Unabhängigkeitstest Um die Abhängigkeit zu testen, werden folgende Hypothesen formuliert: HA : Das Sparverhalten ist abhängig von der Schulform. H0 : Das Sparverhalten ist unabhängig von der Schulform. 71 1 Person ohne Angabe. 91 13. Untersuchung der ersten Theorie Um die χ2 -Prüfstatistik berechnen zu können, müssen die relativen und die erwarteten Häufigkeiten f und e berechnet werden. Sparen regelmäßig Sparen selten bis nie 0,2191 0,2088 0,1366 0,276 0,0361 0,1237 0,3918 0,6082 Gymnasiasten Realschüler Hauptschüler P P 0,4278 0,4124 0,1598 1 Tabelle 13.11.: Relative Häufigkeiten des Sparverhaltens Sparen regelmäßig Sparen selten bis nie 0,1676 0,2602 0,1615 0,2508 0,0626 0,0972 0,3918 0,6082 Gymnasiasten Realschüler Hauptschüler P P 0,4278 0,4124 0,1598 1 Tabelle 13.12.: Erwartete Häufigkeiten des Sparverhaltens Für die χ2 -Prüfstatistik ergibt sich 3 X 2 X (fij − eij )2 χ = 388 · = 19, 7045. eij i=1 j=1 2 (13.1) Als Quantil χ2(m−1)(n−1);1−α zu einem Signifikanzniveau α = 0, 05 ergibt sich χ22;0,95 = 0, 1026. Die Unabhängigkeitshypothese wird abgelehnt, falls χ2 > χ2(m−1)(n−1);1−α gilt. Für den durchgeführten Test ergab sich χ2 = 19, 7045 > 0, 1026 = χ22;0,95 . Somit kann die Nullhypothese zu einem Signifikanzniveau von 5% abgelehnt werden und die Alternativhypothese wird angenommen. Es besteht also eine Abhängingkeit zwischen den Merkmalen „Sparen“ und „Schulform“. Je höher die Schulform, desto häufiger wird regelmäßig gespart,d. h. konkret, dass Gymnasiasten signifikant am häufigsten und Hauptschüler signifikant am seltesten sparen. Auffällig ist hier, dass gerade die Schüler die tendenziell am wenigsten Taschengeld erhalten am meisten sparen und die Schüler die tendenziell am meisten Taschengeld erhalten am wenigsten sparen. Somit ist das Interesse groß zu testen, ob das Sparverhalten von der Taschengeldhöhe abhängig ist. Für die gezeigte Abhängigkeit zwischen dem Sparverhalten und der Schulform kann eine eindeutige Richtung angegeben werden. Hierzu ist die folgende Alternativhypothese „Je höher die Schulform, desto häufiger wird regelmäßig gespart“ zu testen. Das mathematische Testproblem lautet daher: HA : ∀i < j : pi1 pj1 > pi• pj• H0 : ∃i < j : pi1 pj1 ≤ pi• pj• Nach den Entscheidungsregeln von (9.2) wird H0 abgelehnt, falls χ2 ≥ χ21,1−α und ∀i < j : 92 qi1 qj1 > . qi• qj• 13. Untersuchung der ersten Theorie Die Gültigkeit der ersten Bedingung wurde bereits im χ2 -Test gezeigt. Aus der Tabelle 13.10 ergibt sich nun konkret q11 q21 q31 > > ⇔ 0, 512 > 0, 331 > 0, 226 (monoton fallend). q1• q2• q3• Somit kann eine Richtung angenommen werden. Daher wird H0 abgelehnt und HA : „Je höher die Schulform, desto häufiger wird regelmäßig gespart“ angenommen. 13.5. Hängt das Sparverhalten der Jugendlichen mit der Taschengeldhöhe zusammen? Im Folgenden ist relevant, ob das Sparverhalten allein von der Schulform abhängt oder ob das Sparverhalten auch mit der Taschengeldhöhe korreliert. Meine zu testende Hypothese lautet: H0 : Das Sparverhalten ist nicht abhängig von der Taschengeldhöhe. HA : Das Sparverhalten ist abhängig von der Taschengeldhöhe. Hierfür teile ich zunächst die Taschengeldhöhen nach einer Empfehlung des Jugendamts72 in drei Klassen ein. Jugendliche die ein Taschengeld von weniger als 20 Euro erhalten, werden in die Klasse „wenig“, Jugendliche, die ein Taschengeld zwischen 20 und 30 Euro erhalten, werden in die Klasse „angemessen“ und Jugendliche die ein Taschengeld von mehr als 30 Euro pro Monat erhalten werden in die Klasse „viel“ eingestuft. Unter der Annahme, dass die Jugendlichen Taschengeld erhalten und sparen, ergibt sich aus den Daten meiner Stichprobe folgende Tabelle: Gymnasium P Taschengeldhöhe viel angemessen wenig Realschule P Hauptschule P Gesamtsumme viel angemessen wenig viel angemessen wenig Sparen regelmäßig Sparen selten/nie 8 10 28 31 47 37 83 78 9 19 21 37 21 44 51 100 5 8 4 18 5 18 14 44 148 222 P 18 59 84 161 28 58 65 151 13 22 23 58 370 Tabelle 13.13.: Die Relation der Taschengeldhöhe zum Sparverhalten getrennt nach Schulformen73 72 73 Vgl. Popp (2002). 19 Schüler ohne Angaben 93 13. Untersuchung der ersten Theorie Wenn man die Tabelle 13.13 betrachtet, besonders die Daten der Realschüler und der Gymnasiasten, lässt sich vermuten, dass die Taschengeldhöhe einen Einfluss auf das Sparverhalten hat. Hier ist zu erkennen, dass gerade die Schüler mit wenig Taschengeld am meisten sparen. Um zu testen ob das Sparverhalten mit der Taschengeldhöhe zusammenhängt betrachte ich im Folgendem das Sparverhalten in Abhängigkeit zur Taschengeldhöhe, nicht nach Schulformen getrennt. P Sparen regelmäßig Sparen selten bis nie Taschengeldhöhe viel 22 37 59 angemessen 53 86 139 wenig 73 99 172 Summe 148 222 370 Tabelle 13.14.: Sparverhalten zur Taschengeldrelation Um diese beiden Merkmale auf ihre Abhängigkeit zu überprüfen, wird der χ2 Unabhängigkeitstest angewandt. 13.5.1. χ2 -Unabhängigkeitstest Aus den relativen Häufigkeiten f und den erwarteten Häufigkeiten e, welche sich aus der Tabelle 13.14 ergeben, ergibt sich für die χ2 -Prüfstatistik 2 χ = 370 3 X 2 X (fij − eij )2 eij i=1 j=1 = 0, 8108. (13.2) Zu einem Signifikanzniveau α = 0, 05 ergibt sich für das Quantil χ22;0,95 = 0, 1026. Nach den Entscheidungsvorschriften des χ2 -Unabhängigkeitstests kann die Nullhypothese von Seite 93 zu einem Signifikanzniveau von 5% abgelehnt werden, denn es gilt χ2 = 0, 8108 > 0, 1026 = χ22;0,95 . Der Test hat somit ergeben, dass das Sparverhalten der Jugendlichen abhängig von ihrer Taschengeldhöhe ist. Für die gezeigte Abhängigkeit zwischen dem Sparverhalten und der Taschengeldhöhe kann eine eindeutige Richtung angegeben werden. Hierzu ist die folgende Alternativhypothese „Je mehr Taschengeld ein Schüler erhält, desto häufiger wird selten gespart“ zu testen. Das mathematische Testproblem lautet daher: H0 : ∃i < j : pi1 pj1 ≥ , pi• pj• HA : ∀i < j : pi1 pj1 < . pi• pj• Nach den Entscheidungsregeln von (9.2) wird H0 abgelehnt, falls χ2 ≥ χ21,1−α und ∀i < j : qi1 qj1 < . qi• qj• Die erste Bedingung wurde bereits durch die Abhängigkeit gezeigt. Aus der Tabelle 13.14 ergibt sich nun konkret q11 q21 q31 < < ⇔ 0, 373 < 0, 381 < 0, 424 (monoton steigend). q1• q2• q3• 94 13. Untersuchung der ersten Theorie In diesem Fall kann eine Richtung eindeutig angenommen werden. Somit wird H0 abgelehnt dementsprechend HA angenommen. An dieser Stelle kann ich somit sagen, dass das Sparverhalten der Jugendlichen von mehreren Faktoren abhängt. Hier ist voneinander getrennt gezeigt worden, dass das Sparverhalten sowohl von der Schulform als auch von der Höhe des Taschengeldes abhängt. 13.6. Hängt das Sparverhalten der Jugendlichen stärker von der Schulform oder der Taschengeldhöhe ab? Eine Vermutung von mir ist jedoch, dass zwischen der Taschengeldhöhe und dem Sparverhalten kein kausaler Zusammenhang besteht. Eine Erklärung von mir, warum signifikant getestet werden konnte, dass das Sparverhalten von der Taschengeldhöhe abhängt, liegt darin, dass beide Variablen von der Schulform abhängig sind. Um herauszufinden, von welcher Variable das Sparverhalten nun tatsächlich abhängt wird, eine multiple kategoriale Regressionsanalyse durchgeführt. 13.6.1. Multiple Regressionsanalyse Die abhängige Variable Y repräsentiert das Sparverhalten. Als unabhängige Variablen sind X1 die Schulform und X2 die Taschengeldhöhe. Mittels der EffektKodierung und den Referenzkategorien Hauptschule für die Schulform bzw. wenig Taschengeld für die Taschengeldhöhe ergeben sich die Variablen X11 X12 X21 X22 : : : : Der Der Der Der Schüler Schüler Schüler Schüler besucht das Gymnasium. besucht die Realschule. erhält viel Taschengeld. erhält ein angemessenes Taschengeld. Durch Gruppierung der Ergebnisse in die insgesamt 9 verschiedenen Gruppen ergibt sich: Schulform Taschengeld nj yj X01 X11 X12 X21 X22 Gruppe 1 Hauptschule wenig 23 5 1 -1 -1 -1 -1 Gruppe 2 Hauptschule angemessen 22 4 1 -1 -1 0 1 Gruppe 3 Hauptschule viel 13 5 1 -1 -1 1 0 Gruppe 4 Realschule wenig 65 21 1 0 1 -1 -1 Gruppe 5 Realschule angemessen 58 21 1 0 1 0 1 Gruppe 6 Realschule viel 28 9 1 0 1 1 0 Gruppe 7 Gymnasium wenig 84 47 1 1 0 -1 -1 Gruppe 8 Gymnasium angemessen 59 28 1 1 0 0 1 Gruppe 9 Gymnasium viel 18 8 1 1 0 1 0 95 13. Untersuchung der ersten Theorie Bei der Wahl des Logitmodells ergeben sich für die Parameter βik folgende Werte: β01 = 0, 5877 β11 = 0, 6440 β12 = −0, 0865 β13 = −0, 5574 β21 = 0, 0120 β22 = −0, 0703 β23 = 0, 0583. Offenbar sind die Unterschiede der Koeffizienten β1k größer als die Differenzen der Koeffizienten β2k . Daraus lässt sich interpretieren, dass das Sparverhalten der Jugendlichen deutlicher von der Schulform als von der Taschengeldhöhe der Jugendlichen abhängt. 13.7. Unterscheidet sich das Verhältnis zum Geld der Schüler je nach Schulform? Die Abhängigkeit der verschiedenen Merkmale, welche als Indikatoren für das Verhältnis der Schüler zu ihrem Geld zählen, von der Schulform wurde bestätigt. Um eine abschließende Aussage bzgl. der ersten Theorie treffen zu können wird nun das konkrete Verhältnis der Schüler zu ihre Geld, abhängig nach Schulform, getestet. Hierzu ergibt sich aus meiner Datensammlung nach Anwendung der Interpretationsregeln aus Tabelle 11.1 folgende Tabelle Gymnasiasten Realschüler Hauptschüler P Verhältnis zum Geld P gut durchschnittlich schlecht 12 94 61 167 10 75 75 160 3 21 38 62 25 190 174 389 Tabelle 13.15.: Das Verhältnis zum Geld der Schüler in absoluten Häufigkeiten dargestellt Der Tabelle lässt sich entnehmen, dass von den Gymnasiasten 7,18% ein gutes, 56,29% ein durchschnittliches und 36,53% ein schlechtes Verhältnis zum Geld haben. Von den Realschülern weisen insgesamt 6,25% ein gutes, 46,86% ein durchschnittliches und ebenfalls 46,86% ein schlechtes Verhältnis zum Geld auf. Von den Hauptschülern zeigen 5% ein gutes, 33,87% ein durchschnittliches und 61,29% ein schlechtes Verhältnis zum Geld (vgl. Abbildung 13.1). 96 36,53% 46,86% 61,29% 56,29% 46,86% 33,87% 6 5 4 3 2 1 0 7,18% 6,25% 5,00% 13. Untersuchung der ersten Theorie Gymnasiasten Realschüler Hauptschüler gut 0 1 2 mittel 3 4schlecht 5 Abbildung 13.1.: Das Verhältnis der Schüler zum Geld getrennt nach Schulform Ein χ2 -Unabhängigkeitstest soll nun die Abhängigkeit des Verhältnisses zum Geld der Schüler von der Schulform testen. 13.7.1. χ2 -Unabhängigkeitstest H0 : Das Verhältnis der Schüler zum Geld ist unabhängig von der Schulform. HA : Das Verhältnis der Schüler zum Geld ist abhängig von der Schulform. Für die χ2 -Prüfstatistik ergibt sich χ2 = 389 3 X 3 X (fij − eij )2 eij i=1 j=1 = 11, 7460 Für das χ2 -Quantil mit 4 Freiheitsgraden zu einem Signifikanzniveau von α = 0, 05 ergibt sich χ24;0,95 = 0, 7107. Somit kann die Unabhängigkeitshypothese abgelehnt werden und die Abhängigkeit des Verhältnisses der Schüler zum Geld von der Schulform wird mit einer Irrtumswahrscheinlichkeit von 5% angenommen. Im Folgenden soll die Richtung der Abhängigkeit geprüft werden. Hierzu wird folgende Alternativhypothese aufgestellt HA : Je höher die Schulform, desto besser ist das Verhältnis der Schüler zum Geld. Um die Entscheidungsregeln (9.6) gut anwenden zu können wird die nachstehenden Tabelle formuliert. qi1 qi• 0,0719 0,0625 0,0484 qi1 qi2 + qi• qi• 0,6347 0,5313 0,3871 Nach den Entscheidungsregeln wird H0 abgelehnt und HA angenommen, da beide Spalten monoton fallend sind 0, 0719 > 0, 0625 > 0, 0484, 0, 6347 > 0, 5313 > 0, 3871. 97 13. Untersuchung der ersten Theorie Demnach zeigen Gymnasiasten häufiger ein gutes Verhältnis zum Geld als Hauptschüler. Die Hauptschüler zeigen dagegen häufiger ein schlechtes Verhältnis zum Geld als Gymnasiasten. Die Realschüler befinden sich im Mittelfeld. 13.8. Fazit zur ersten Theorie Die Untersuchung meiner ersten Theorie hat gezeigt, dass das Verhältnis zum Geld der Jugendlichen tatsächlich von der Schulform abhängt. Obwohl Jugendliche des Gymnasiums durchschnittlich weniger Taschengeld erhalten, nämlich 20,81 Euro, als Jugendliche der Hauptschule mit durchschnittlich 28,72 Euro oder Realschüler mit durchschnittlich 26,95 Euro hat sich gezeigt, dass sich Gymnasiasten signifikant seltener von ihren Eltern oder Freunden Geld leihen und regelmäßiger als Realschüler oder Hauptschüler einen Teil ihres Geldes sparen. Die Schüler der Hauptschule ist diejenige Schülergruppe, welche am meisten Taschengeld erhält, sich regelmäßig noch zusätzlich zu ihrem Taschengeld Geld leiht und am seltensten Geld spart. Nach meiner eigenen Interpretation auf Seite 68 ordne ich somit den Schülern des Gymnasiums ein besseres Verhältnis zum Geld zu als den Schülern der Realschule oder der Hauptschule. Es hat sich gezeigt, dass Hauptschüler, im Vergleich zu Schülern anderer Schulformen, einen schlechteren Umgang mit Geld bzw. ein schlechteres Verhältnis dazu haben, während sich die Realschüler im Mittelfeld befinden. Die anfänglich signifikant gezeigte Abhängigkeit des Sparverhaltens zur Taschengeldhöhe resultierte aus der Abhängigkeit des Sparverhaltens zur Schulform. Die Regressionsanalyse bestätigte, dass zwischen dem Sparverhalten und der Taschengeldhöhe nur ein sehr kleiner Zusammenhang besteht, während die Abhängigkeit zur Schulform eindeutig ist. Abschließend sind noch die Gesamtzahlen zu erwähnen. Die Untersuchung hat gezeigt, dass nur 6,43% der befragten Schüler ein gutes und 48,84% der Schüler ein durchschnittliches Verhältnis zu ihrem Geld pflegen. Es zeigt sich jedoch auch, dass 44,73% der befragten Schüler ein schlechtes Verhältnis zu ihrem Geld haben (vgl. Abbildung 13.2). Es ist noch zu erwähnen, dass der Gesamtdurchschnitt des Taschengeldes ,aller befragten Schüler, 24,44 Euro beträgt, was auch den empfehlungen des Jugendamtes entspricht74 48,84% 6,43% gutes Verhalten durchschnittliches Verhalten schlechtes Verhalten 44,73% Abbildung 13.2.: Das Verhältnis der Schüler zum Geld 74 Das Jugendamt empfiehlt für Schüler im Alter zwischen 14 und 15 Jahren, ein monatlichen Taschengeld von 23-26 Euro. 98 14. Untersuchung der zweiten Theorie Im folgenden Auswertungsabschnitt soll nun das Einkaufsverhalten von Schüler unterschiedlicher Schulformen betrachtet werden. Unter der Fragestellung: „Wie Verhalten sich Jugendliche, wenn sie ein bestimmtes Produkt kaufen möchten“ werden verschiedene Merkmale betrachtet. Welche Merkmale hierbei genau betrachtet werden sollen, ist bereits auf Seite 68 beschrieben. 14.1. Unterscheidet sich das Informationsverhalten je nach Schulform? Zunächst soll betrachtet werden, ob sich die Schüler über ein Produkt informieren, wenn sie es kaufen möchten. Da ich vermute, dass sich das Informationsverhalten der 14-jährigen Jugendlichen je nach Schulform unterscheidet, sollen die Daten meiner Stichprobe getrennt nach Schulform betrachtet werden. P Informieren sich Informieren sich nicht Gymnasiasten 162 5 167 Realschüler 149 11 160 Hauptschüler 60 2 62 P 371 18 389 Tabelle 14.1.: Absolute Daten der Schüler, die sich über ein Produkt informieren, wenn sie es kaufen möchten Die Tabelle zeigt, dass sich 97% der Gymnasiasten, 93% der Realschüler und 96% der Hauptschüler informieren, wenn sie sich ein bestimmtes Produkt kaufen möchten. Um zu untersuchen, ob das Informationsverhalten von der Schulform abhängig ist, wird der χ2 -Unabhängigkeitstest angewandt. 14.1.1. χ2 -Unabhängigkeitstest Für den χ2 -Unabhängigkeitstest werden die Hypothesen wie folgt formuliert: H0 : Das Informationsverhalten der Schüler ist unabhängig von der Schulform. HA : Das Informationsverhalten der Schüler ist abhängig von der Schulform. 99 14. Untersuchung der zweiten Theorie Aus den relativen Häufigkeiten f und den erwarteten Häufigkeiten e, welche sich aus der Tabelle 14.1 ergeben, ergibt sich für die χ2 -Prüfstatistik χ2 = 389 3 X 2 X (fij − eij )2 eij i=1 j=1 = 3, 1171. Zu einem Signifikanzniveau α = 0, 05 ergibt sich für das Quantil χ22;0,95 = 0, 1026. Nach den Entscheidungsvorschriften des χ2 -Unabhängigkeitstests kann die Nullhypothese zu einem Signifikanzniveau von α = 0, 05 abgelehnt werden, denn es gilt χ2 = 3, 1171 > 0, 1026 = χ22;0,95 . Damit wird HA mit einer Irrtumswahrscheinlichkeit von 5% angenommen, was bedeutet, dass das Informationsverhalten von der Schulform abhängig ist. Für die signifikant gezeigte Abhängigkeit lässt sich jedoch keine Richtung festlegen, da aus Tabelle 14.1 zu erkennen ist, dass Hauptschüler und Gymnasiasten annähernd das gleiche Informationsverhalten zeigen. 14.2. Unterscheiden sich die Informationsquellen je nach Schulform? Im Folgenden ist nun von Interesse, ob sich auch die Informationsquellen je nach Schulform unterscheiden oder ob die Schüler alle die gleichen Informationsquellen nutzen. Den Schülern war es gestattet, mehrere Antwortmöglichkeiten anzukreuzen. Ein erster Einblick über die genutzten Informationsquellen soll folgende Kontingenztabelle ermöglichen: Gymnasiasten Realschüler Hauptschüler P Gymnasiasten Realschüler Hauptschüler P Internet 95 81 32 198 Kino 2 7 2 11 TV 54 76 26 156 Radio 7 5 2 14 Familie 60 66 23 149 Plakate 14 17 5 36 Freunde Zeitschriften Fachhandel 114 77 47 106 76 47 40 23 8 260 176 102 Tabelle 14.2.: Genutzte Informationsquellen Um Aussagen darüber machen zu können, ob Schüler tendenziell eher „gute“ oder „schlechte“ Informationsquellen nutzen, werden die in der Tabelle genannten Quellen wie auf Seite 69 beschrieben kategorisiert. Hierbei sollen diese in die Kategorien „gute“ Informationsquellen, „durchschnittliche“ Informationsquellen und „schlechte“ Informationsquellen eingeteilt werden. Eine mögliche subjektive Kategorisierung ist hierbei: 100 14. Untersuchung der zweiten Theorie Informationsquellen durchschnittliche gute Internet Zeitschrift Fachhandel Familie Freunde schlechte TV Radio Kino Plakate Tabelle 14.3.: Qualität der Informationsquellen Ein Problem der Kategorisierung ist die Zuordnung der Informationsquellen zu ihrer entsprechenden Kategorie. Das Internet und der Fachhandel wird als gute Informationsquelle bezeichnet, da ich davon ausgehe, das der Informationsgehalt recht hoch ist. Den Fachhändler halte ich in seiner Beratung für sehr kompetent und im Internet hat der Nutzer die Möglichkeit, sich auf objektiven Informationsseiten zu informieren. Die Zeitschrift wird von mir als durchschnittliche Informationsquelle bezeichnet, da ich zum einen die reine Produktwerbung betrachten kann, welche nicht so objektiv sein wird, oder zum anderen Fachberichte bzgl. eines Produkts, in denen ich einen recht hohen Informationsgehalt vermute (z. B. in Fachzeitschriften). Eltern und Freunde wurden den durchschnittlichen Informationsquellen zugeordnet, da ich sie nicht für interessengesteuert halte aber dennoch in vielen Bereichen in ihrer Beratung mangels Produktkenntnisse, für inkompetent. Unter die schlechten Informationsquellen fallen bei mir das Fernsehen, Radio, Kino und die Plakate. Dies sind alles Informationsquellen, die sehr interessengesteuert sind und bei denen der objektive Informationsgehalt sehr niedrig ist. Aus der Kategorisierung und der Tabelle 14.2 ergibt sich die folgende Tabelle: qu Gymnasiasten Realschüler Hauptschüler Gesamt gut/in % durchschnittlich/in % schlecht/in % 142/30,21 251/53,4 77/16,38 128/26,61 248/21,56* 105/21,83* 40/23,53 95/55,88* 35/20,59* 310/27,65 594/52,99 217/19,36 Gesamt 470/41,93 481/42,91 170/15,16 1121/100 Tabelle 14.4.: Ungewichtete absolute Häufigkeiten und prozentuale Anteile zu den genutzte Informationsquellen unterschieden nach ihrer Qualität Im Folgenden soll mit Hilfe eines χ2 -Unabhängigkeitstest folgende Hypothese analysiert werden: H0 : Welche Informationsquellen ein Schüler der achten Klasse nutzt ist unabhängig von seiner Schulform. HA : Welche Informationsquellen ein Schüler der achten Klasse nutzt ist abhängig von seiner Schulform. 14.2.1. Ungewichteter χ2 -Unabhängigkeitstest Diese Art des χ2 -Tests wird angewandt, falls das zu behandelnde Merkmal X Mehrfachantworten zulässt. Es ist noch zu erwähnen, dass beim ungewichteten χ2 -Unabhängigkeitstest Schüler, die mehrere Informationsquellen angegeben haben, einen 101 14. Untersuchung der zweiten Theorie größeren Einfluss auf das Testergebnis haben, als Schüler die nur eine Informationsquelle angegeben haben. Während der Wert q bei Fragen die nur Einfachantworten zulassen, immer die Stichprobengröße repräsentiert, wird q = q u bei Fragen die Mehrfachantworten zulassen definiert als die Anzahl der gegebenen Antworten. Für die Durchführung meines Test ist demnach q u = 1121. Unter der Annahme, dass sich ein Schüler informiert, ergibt sich für die ungewichteten relativen Häufigkeiten f u und die ungewichteten erwarteten Häufigkeiten eu die folgenden Kontingenztabellen: fu Gymnasiasten Realschüler Hauptschüler P eu Gymnasiasten Realschüler Hauptschüler P gut durchschnittlich 0,1267 0,2239 0,1142 0,2212 0,0357 0,0847 0,2766 0,5298 schlecht 0,0687 0,0937 0,0312 0,1936 gut durchschnittlich 0,1159 0,2222 0,1187 0,2274 0,0419 0,0804 0,2765 0,53 schlecht 0,0812 0,0831 0,0294 0,1937 P 0,4193 0,4291 0,1516 1 P 0,4193 0,4292 0,1517 1 Tabelle 14.5.: Ungewichtete relative und erwartete Häufigkeiten zu den genutzte Informationsquellen unterschieden nach ihrer Qualität Aus den ungewichteten relativen und erwarteten Häufigkeiten f u und eu ergibt sich für die χ2 -Prüfstatistik 3 X 3 X (fiju − euij )2 χ = 1121 = 6, 6168. u e ij i=1 j=1 2 Zu einem Signifikanzniveau von α = 0, 05 ergibt sich für das χ2 -Quantil χ24;0,95 = 0, 7107. Nun ist χ2 = 6, 6168 > 0, 7107 = χ24;0,95 . Nach den Entscheidungsvorschriften für diesen Test wird H0 mit einer Irrtumswahrscheinlichkeit von 5% abgelehnt und HA wird angenommen. 14.2.2. Gewichteter χ2 -Unabhängigkeitstest Beim gewichteten χ2 -Unabhängigkeitstest wird davon ausgegangen, dass sich jeder Schüler gleich viel informiert und somit hat jeder Schüler den gleichen Einfluss auf das Testergebnis. Die gewichteten absoluten, relativen und erwarteten Häufigkeiten q g , f g und eg ergeben 102 14. Untersuchung der zweiten Theorie qg Gymnasiasten Realschüler Hauptschüler P fg Gymnasiasten Realschüler Hauptschüler P eg Gymnasiasten Realschüler Hauptschüler P gut durchschnittlich schlecht 51,2190 88,6119 20,1691 41,327 80,681 26,9920 15,9333 31,8667 10,2 108,4793 201,1596 57,3611 gut durchschnittlich 0,1396 0,2414 0,1126 0,2198 0,0434 0,0868 0,2956 0,548 schlecht 0,0551 0,0735 0,0278 0,1564 gut durchschnittlich 0,1289 0,2390 0,120 0,2225 0,0467 0,0866 0,2956 0,5481 schlecht 0,0681 0,0635 0,0247 0,1563 P 160 149 58 367 P 0,4361 0,4059 0,158 1 P 0,4360 0,4060 0,1580 1 Tabelle 14.6.: Gewichtete absolute, relative und erwartete Häufigkeiten zu den genutzten Informationsquellen, unterschieden nach ihrer Qualität Für die χ2 -Prüfstatistik ergibt sich χ2 = 367 3 X 3 X (fijg − egij )2 egij i=1 j=1 = 2, 2676. Auch mit dem gewichteten Test wird H0 abgelehnt, denn es gilt χ2 = 2, 2676 > 0, 7107 = χ24;0,95 . Nach dem Erhalt der Testergebnisse lässt sich mit einer Irrtumswahrscheinlichkeit von 5% sagen, dass eine Abhängigkeit zwischen den von den Schülern genutzten Infomationsquellen und der Schulform besteht. Bei der Betrachtung der pozentualen Werte in Tabelle 14.4 lässt sich jedoch keine eindeutige Richtung benennen, was an den mit * markierten Werten liegt. 14.3. Wofür verwenden Schüler der achten Klasse ihr Taschengeld? Im Folgenden soll betrachtet werden, ob Schüler Preise vergleichen, wenn sie sich ein bestimmtes Produkt kaufen möchten und ob sich dieses je nach Schulform unterscheidet. Anschließend soll analysiert werden, wie zielstrebig Schüler in ihrem Einkaufsverhalten sind, wenn sie ein bestimmtes Produkt kaufen möchten. Zunächst soll jedoch betrachtet werden, für welche Produkte Schüler der achten Klasse ihr Taschengeld verwenden. Hierzu haben die 205 befragten Mädchen und 184 Jungen folgende Antworten gegeben. 103 14. Untersuchung der zweiten Theorie Musik Kino Sport Schminke Kleidung Schulsachen Süßigkeiten Handy Computer Zeitschriften männlich 63 71 77 3 78 21 59 93 120 68 weiblich 99 100 38 118 141 31 71 122 20 123 P 162 171 115 121 219 52 130 215 140 191 Tabelle 14.7.: Wofür geben Jugendliche der achten Klasse ihr Taschengeld aus? Die Datenverteilung der Tabelle bestätigt meine Erwartungen, dass Jungen und Mädchen unterschiedliche Produkte erwerben. Die Tabelle zeigt, dass Mädchen ihr Taschengeld hauptsächlich für Bekleidung, Zeitschriften und ihr Handy ausgeben, während Jungen in erster Linie ihr Taschengeld für Computerspiele, gefolgt von Handy und Kleidung ausgeben. Des Weiteren lässt sich bestätigen, dass Jungen häufiger ihr Geld für Sportartikel, während Mädchen ihr Geld häufiger für Schminke ausgeben. Im Allgemeinen zeigt sich, dass das Taschengeld der Jugendlichen hauptsächlich für Kleidung, Handy und Zeitschriften ausgegeben wird. Des Weiteren wird meine Vermutung, dass Jugendliche selten Geld für Schulsachen ausgeben, bestätigt. Betrachtet man die von den Schülern gekauften Produkten getrennt nach Schulform75 , so zeigt sich zwischen den Schulformen und den gekauften Produkten kein besonderer Unterschied. Sowohl die Ausgaben für Kleidung, Zeitschriften, Sportartikel, Schminke, Handy, Musik, Kino, Süßigkeiten oder PC sind zwischen den Schulformen annähernd gleich. Der einzige etwas auffälligere Unterschied zeigt sich bei den Schulsachen. Die erhobenen Daten zeigen, dass insgesamt 9 (5,3892%) Gymnasiasten, 30 (18,75%) Realschüler und 13 (20,9677%) Hauptschüler ihre Schulsachen von ihrem Taschengeld kaufen. Der χ2 -Unabhängigkeitstest, der dieses Ergebnis mit der Taschengeldhöhe vergleicht zeigt, dass die Schülergruppe mit dem meisten Taschengeld ihre Schulsachen von ihrem Taschengeld selbst erwerben, während die Schülergruppe mit dem wenigsten Taschengeld ihre Schulsachen nicht selbstständig erwerben. Der χ2 -Test lehnt die Unabhängigkeitshypothese ab, da χ2 = 16, 2743 > 0, 1026 = χ22;0,95 11 31 und da qq1• = 0, 05390 > qq21 = 0, 1875 > qq3• = 0, 2097 gilt die oben beschriebene 2• Richtung, dass Hauptschüler häufiger ihre Schulsachen selbst kaufen als Gymnasiasten. 14.4. Vergleichen Gymnasiasten häufiger Preise als Hauptschüler Preise? Im Folgenden ist es nun unter dem Gesichtspunkt des Verbraucherverhaltens interessant zu analysieren, wie sich die Jugendlichen verhalten, wenn sie sich ein bestimm75 Die Tabelle wird aufgrund ihrer Komplexität hier nicht dargestellt. 104 14. Untersuchung der zweiten Theorie tes Produkt kaufen möchten und ob sich das Einkaufsverhalten je nach Schulform unterscheidet. Hier soll die Frage untersucht werden: Kaufen Jugendliche unabhängig vom Preis ein Produkt im ersten Geschäft oder vergleichen sie zunächst die Produktpreise in mehreren Geschäften? Letzteres Verhalten möchte ich wegen des Preisbewusstseins als gutes Einkaufsverhalten definieren, während andere Verhaltensweisen als schlecht gelten. Bei der Betrachtung der erhobenen Daten ergibt sich folgende Tabelle. Dabei werden die Daten für die folgenden Untersuchungen zu zwei Kategorien zusammengefasst. Gymnasiasten Realschüler Hauptschüler P Vergleichen Preise P ja nein 91 75 166 82 73 155 35 27 62 208 175 383 Tabelle 14.8.: Preisvergleich in absoluten Häufigkeiten76 Hierbei ist zu erwähnen, dass 6 Schüler zu dieser Frage keine Angaben gemacht haben. Die Tabelle zeigt, dass 54,82% der Gymnasiasten, 52,9% der Realschüler und 56,45% der Hauptschüler Preise vergleichen. Hier sind die Unterschiede zwischen den einzelnen Schulformen nicht besonders hoch. Meine anfängliche Hypothese von 69 „ Je höher die Schulform der Jugendlichen, desto wahrscheinlicher ist es, dass sich ein Jugendlicher über ein Produkt informiert, wenn er es kaufen möchte“ wird aufgrund der vorliegenden Datenverteilung nicht geprüft. Nachdem die Abhängigkeit der Merkmale „Schulform“ und „Preisvergleich“ gezeigt worden ist, wird die Hypothese „Hauptschüler vergleichen häufiger als Gymnasiasten und diese häufiger als Realschüler Preise“ untersucht. Der folgende Test soll prüft, ob die Merkmale „Preisvergleich“ und „Schulform“ voneinander abhängig sind. 14.4.1. χ2 -Unabhängigkeitstest H0 : Die Merkmale Preisvergleich und Schulform sind unabhängig voneinander. HA : Die Merkmale Preisvergleich und Schulform sind abhängig voneinander. Für die Prüfstatistik ergibt sich 2 χ = 383 3 X 2 X (fij − eij )2 eij i=1 j=1 = 0, 2556. (14.1) Für das Quantil ergibt sich χ22;0,95 = 0, 1026. Demnach wird H0 zu einem Signifikanzniveau von 5% abgelehnt und die Abhängigkeitshypothese kann angenommen 76 6 Schüler ohne Angaben. 105 14. Untersuchung der zweiten Theorie werden. Da die χ2 -Prüfstatistik jedoch recht klein ist und die Differenz zwischen der Prüfstatistik und dem χ2 -Quantil recht klein ist, kann von einer sehr geringen Abhängigkeit ausgegangen werden. Eine eindeutige Richtung der Abhängigkeit kann jedoch nicht angegeben werden. Nach der Betrachtung der prozentualen Verteilung erkennt man jedoch, dass Hauptschüler am häufigsten Preise vergleichen, gefolgt von den Gymnasiasten und den Realschülern. Diese Werte wiederlegen direkt meine ursprüngliche Hypothese, dass Gymnasiasten häufiger Preise vergleichen als Gymnasiasten oder Realschüler. Der Binomialtest soll nun zeigen, dass Hauptschüler häufiger als Gymnasiasten und Realschüler Preise vergleichen. 14.4.2. Exakter Binomialtest Im Folgenden sollen die Hypothesen getestet werden: 1. H0 : Die Wahrscheinlichkeit, dass ein Hauptschüler Preise vergleicht, ist maximal so groß wie die Wahrscheinlichkeit, dass ein Gymnasiast Preise vergleicht. HA : Die Wahrscheinlichkeit, dass ein Hauptschüler Preise vergleicht, ist größer als die Wahrscheinlichkeit, dass ein Gymnasiast Preise vergleicht. 2. H0 : Die Wahrscheinlichkeit, dass ein Hauptschüler Preise vergleicht, ist maximal so groß, wie die Wahrscheinlichkeit, dass ein Realschüler Preise vergleicht. HA : Die Wahrscheinlichkeit, dass ein Hauptschüler Preise vergleicht, ist größer als die Wahrscheinlichkeit, dass ein Realschüler Preise vergleicht. 3. H0 : Die Wahrscheinlichkeit, dass ein Gymnasiast Preise vergleicht, ist maximal so groß, wie die Wahrscheinlichkeit, dass ein Realschüler Preise vergleicht. HA : Die Wahrscheinlichkeit, dass ein Gymnasiast Preise vergleicht, ist größer als die Wahrscheinlichkeit, dass ein Realschüler Preise vergleicht. Erstes Hypothesenpaar Zunächst ist die Wahrscheinlichkeit p0 = 0, 5482 (Wahrscheinlichkeit das ein Gymnasiast Preise vergleicht) zu wählen. Somit ist zu testen: H0 : p ≤ 0, 5482 HA : p > 0, 5482 Unter einem Signifikanzniveau von α = 0, 05 ergibt sich die kritische Schranke bo;0,95 (0, 5482) rechnerisch wie folgt: 39 40 X X 62 62 k 62−k 0, 5482 (1 − 0, 5482) ≤ 0, 95 < 0, 5482k (1 − 0, 5482)62−k k k k=0 k=0 ⇔ 0, 9211 ≤ 0, 95 < 0, 9529 106 14. Untersuchung der zweiten Theorie Als kritische Schranke ergibt sich somit bo;0,95 (0, 5482) = 40. Nach den Entscheidungsregeln der Tabelle 8.1 wird H0 abgelehnt, falls e > bo;1−α (p0 ). Für diesen Test gilt e = 35 < 40 = bo;0,95 (0, 5482). Daher kann die Nullhypothese nicht abgelehnt werden. Somit lässt sich keine Aussage bzgl. der formulierten Hypothese treffen. Erst bei einem Signifikanzniveau von α ≈ 0, 45 könnte die Nullhypothese abgelehnt werden, dieses Signifikanzniveau ist jedoch viel zu hoch, um eine Hypothese anzunehmen. Zweites Hypothesenpaar Die Wahrscheinlichkeit p0 (Wahrscheinlichkeit das ein Realschüler Preise vergleicht) wurde gewählt als p0 = 0, 5290. Demnach sind folgende Hypothesen zu testen: H0 : p ≤ 0, 5290 HA : p > 0, 5290 Unter einem Signifikanzniveau von α = 0, 05 ergibt sich für die kritische Schranke bo;0,95 (0, 5290) = 39. Auch hier kann die Nullhypothese nicht abgelehnt werden, da e = 35 < 39 = bo;0,95 (0, 5290). Erst bei der viel zu hohen Irrtumswahrscheinlichkeit von α = 0, 33 könnte die Nullhypothese abgelehnt werden. Drittes Hypothesenpaar Für die Wahrscheinlichkeit p0 wird ebenfalls p0 = 0, 529 gewählt. Es gelten ebenfalls die Hypothesen H0 : p ≤ 0, 529 HA : p > 0, 529. Zu einem Signifikanzniveau von α = 0, 05 ergibt sich für die kritische Schranke bo;0,95 (0, 529) = 98. Wie in den ersten beiden Fällen kann auch hier die Nullhypothese nicht abgelehnt werden, da e = 91 < 98 = bo;0,95 (0, 529). Erst bei einer Irrtumswahrscheinlichkeit von α = 0, 34 könnte die Nullhypothese abgelehnt werden. Demnach kann ich über meine Hypothese, die besagt dass Hauptschüler häufiger als Gymnasiasten und diese häufiger als Realschüler Preise vergleichen, keine signifikante Aussage machen, obwohl die aus der Tabelle 14.8 berechneten prozentualen Anteile diese Aussage vermuten lassen. Der Testausgang lässt sich damit erklären, dass die prozentualen Anteile sehr nahe beieinander liegen. 14.5. Hat die Schulform einen Einfluss darauf, ob ein Schüler ein zielstrebiges Einkaufsverhalten hat? Da der Abhängigkeitestest eine geringe Abhängigkeit des Merkmals „Preisvergleich“ und „Schulform“ gezeigt hat, vermute ich auch nur eine geringe Abhängigkeit zwischen dem Merkmal „Zielstrebigkeit“ und „Schulform“, da auch diese Merkmalskombination nach meiner Interpretation einen direkten Bezug zum Einkaufsverhalten hat. Folgende Ergebnisse wurden aus den Daten der Schülerbefragung gewonnen. 107 14. Untersuchung der zweiten Theorie Gymnasiasten Realschüler Hauptschüler Gesamt häufig 38 41 14 93 in % 22,75 25,62 22,58 23,91 selten in % 109 65,27 93 58,13 39 62,9 241 61,95 nie 20 26 9 55 in % 11,98 16,25 14,52 14,14 P 167 160 62 389 Tabelle 14.9.: Wie oft gehen Schüler der achten Klasse los um etwas bestimmtes zu kaufen und kaufen dann etwas völlig anderes? Die Tabelle zeigt auf, dass sich 23,91% der befragen Schüler häufig von äußeren Reizen beeinflussen lassen und häufig Spontankäufe tätigen. Nur insgesamt 14,14% der befragten Schüler zeigen ein sehr zielstrebiges Einkaufsverhalten. Insgesamt 61,95% der befragten Schüler geben zu, dass sie sich zwischendurch von äußeren Reizen beeinflussen lassen und ein völlig anderes Produkt kaufen, als sie eigentlich erwerben wollten. Die Tabelle zeigt jedoch, dass die prozentualen Unterschiede zwischen den einzelnen Schulformen nicht so bedeutend groß sind. Falls eine minimale Abhängigkeit zwischen den beiden Merkmalen „Zielstrebigkeit“ und „Schulform“ bestehen sollte, ist es jedoch nicht möglich, eine Aussage über eine Richtung zu tätigen. Mit dem χ2 -Unabhängigkeitstest soll nun geprüft werden, ob überhaupt eine signifikante Abhängigkeit zwischen den beiden betrachteten Merkmalen besteht. 14.5.1. χ2 -Unabhängigkeitstest H0 : Ob ein Schüler in seinem Einkaufsverhalten zielstrebig ist, ist unabhängig von der Schulform, die der Schüler besucht. HA : Ob ein Schüler in seinem Einkaufsverhalten zielstrebig ist, ist abhängig von der Schulform, die der Schüler besucht. Aus der aus Tabelle 14.9 resultierenden relativen Häufigkeit f und der erwarteten Häufigkeit e ergibt sich folgende Prüfstatistik: χ2 = 389 3 X 3 X (fij − eij )2 eij i=1 j=1 = 2, 0830. Für das χ2 -Quantil mit 4 Freiheitsgraden zu einem Signifikanzniveau α = 0, 05 ergibt sich χ24;0,95 = 0, 7107. Damit wird die H0 abgelehnt, da χ2 = 2, 0830 > 0, 7107 = χ24;0,95 . Hier zeigt sich eine minimal größere Abhängigkeit zwischen den Merkmalen „Zielstrebigkeit“ und „Schulform“ als zwischen den Merkmalen „Preisvergleich“ und „Schulform“. 108 14. Untersuchung der zweiten Theorie 14.6. Welche siegener Bekleidungsgeschäfte sind am beliebtesten? Um Aussagen bezüglich der beliebtesten Geschäfte, welche Bekleidungstextilien anbieten, von Jugendlichen der achten Klasse tätigen zu können, werden die erhobenen Daten der Frage 16 des Fragebogens (siehe Anhang C) betrachtet. Hierbei ist anzumerken, dass die Schüler die Möglichkeit hatten, mehrere Geschäfte anzukreuzen. Aus der folgenden Tabelle lässt sich entnehmen, dass bei den Mädchen H&M, NewYorker und Pimky und bei den Jungen H&M, C&A und Kataloge zu den beliebtesten Geschäften, in denen Bekleidung gekauft wird, zählen. Fasst man die Anzahl der männlichen und weiblichen Antworten eines Geschäftes zusammen, so erhält man nach Sortierung der Daten eine Rangordnung zu den beliebtesten siegener Geschäften in denen Bekleidungstextilien gekauft werden können. Daraus ergibt sich, dass dass beliebteste Geschäft von Jugendlichen der achten Klasse H&M, gefolgt von C&A und NewYorker ist. Aus den insgesamt 184 männlichen und 205 weiblichen Antwortet ergab sich folgende Tabelle 77 : Geschäfte ESPRIT S-Oliver H&M Pimky Orsay Karstadt Aldi Takko Windsurfing C&A Wal Mart Mango Tschibo NewYorker Kataloge Internet männlich weiblich 38 76 60 70 111 153 2 114 5 82 57 34 23 12 27 40 40 18 95 109 25 12 5 49 15 24 61 131 65 63 32 14 Gesamt 114 130 264 116 87 91 35 67 58 204 37 54 39 192 128 46 Tabelle 14.10.: Die bei Jugendlichen der achten Klasse beliebtesten Geschäfte, in denen Bekleidung gekauft werden kann 77 Die genaue Rangordnung der beliebtesten Geschäfte kann der Tabelle 14.10 durch einfaches sortieren der Daten entnommen werden 109 14. Untersuchung der zweiten Theorie H&M C&A NewYorker S-Oliver Kataloge Pimky Esprit Karstadt Orsay Takko Windsurfing Mango Internet Tschibo Wal Mart Aldi 264 204 192 130 128 116 114 91 87 67 58 54 46 39 37 35 männlich weiblich Abbildung 14.1.: Siegener Geschäfte sortiert nach dem Grad ihrer Beliebtheit 14.7. Kaufen Schüler höherer Schulformen in preisgünstigeren Geschäften? Unter der Fragestellung des Einkaufsverhaltens und den bisherigen Testergebnissen kommt die Frage auf, ob Schüler höherer Schulform in preisgünstigeren Geschäften einkaufen als Schüler niedrigerer Schulform. Dies lässt vermuten, wenn man die vorhergehende Theorie bedenkt. Demnach haben Gymnasiasten ein signifikant besseres Verhältnis zum Geld als Hauptschüler oder Realschüler. Des Weiteren erhalten Gymnasiasten tendenziell ein geringeres Taschengeld als Hauptschüler, demnach könnte man ein preisbewusstes Einkaufsverhalten vermuten, auch wenn der χ2 -Unabhängigkeitstest bzgl. der Abhängigkeit zwischen der Schulform und Preisvergleich (siehe Gleichung (14.1)) zwar eine Abhängigkeit gezeigt, doch eine Richtung nicht bestätigt hat. Im Folgenden werden die bereits benannten Bekleidungsgeschäfte nach meinen eigenen Vorstellungen bzgl. des Preisniveaus der Geschäfte kategorisiert und nach Schulform sortiert betrachtet. Geschäfte Preisniveau niedrig mittel Aldi H&M Takko Pimky Wal-Mart Orsay Tschibo Karstadt C&A NewYorker Kataloge Internet hoch ESPRIT S-Oliver Windsurfing Mango Tabelle 14.11.: Siegener Bekleidungsgeschäfte nach ihrem Preisniveau sortiert 110 14. Untersuchung der zweiten Theorie Mit dieser Kategorisierung ergibt sich die folgende nach Schulformen getrennte Verteilung: Gymnasium Realschule Hauptschule P P niedrig mittel hoch 150 389 149 688 162 377 159 698 70 158 48 276 382 924 356 1662 Tabelle 14.12.: Welche Geschäfte bevorzugen Schüler unterschiedlicher Schulformen? Der ungewichtete χ2 -Unabhängigkeitstest soll bestätigen, dass ein Zusammenhang zwischen der Schulform und dem Preisniveau der Geschäfte in denen die Schüler ihre Kleidung kaufen, besteht. 14.7.1. Ungewichteter χ2 -Unabhängigkeitstest H0 : Die Merkmale Schulform und Preisniveau der Bekleidungsgeschäfte sind unabhängig voneinander. HA : Die Merkmale Schulform und Preisniveau der Bekleidungsgeschäfte sind abhängig voneinander. Für die Prüfstatistik χ2 ergibt sich mit den relativen Häufigkeiten f und den erwarteten Häufigkeiten e folgenden Wert: χ2 = 1662 3 X 3 X (fiju − euij )2 = 4, 3850. u e ij i=1 j=1 Zu einem Signifikanzniveau von α = 0, 05 ergibt sich für das χ2 -Quantil χ24;0,95 = 0, 7107. Nun ist χ2 = 4, 3850 > 0, 7107 = χ24;0,95 . Nach den Entscheidungsvorschriften für diesen Test wird H0 mit einer Irrtumswahrscheinlichkeit von 5% abgelehnt und HA wird angenommen. Über die Richtungshypothese HA : „Je höher die Schulform, desto häufiger wird in preisgünstigen Geschäften eingekauft“ lässt sich keine eindeutige Aussage treffen, denn in unserem Fall gilt: q11 q21 q31 = 21, 8023 < 23, 2092 < = 25, 3623 (monoton steigend) q1• q2• q3• q11 q12 q21 q22 q31 q32 + = 78, 3430 > + = 77, 2207 < + = 82, 6087 (nicht monoton) q1• q1• q2• q2• q3• q3• Ähnlich zu den Tests, welche die Abhängigkeit der Merkmale Preisvergleich bzw. Zielstrebigkeit und Schulform testet, lässt sich auch bei dem Test im ungewichteten Fall keine eindeutige Richtung nachweisen. Da die Wahrscheinlichkeit annähernd gleich groß ist, dass ein Gymnasiast in Geschäften mit einem niedrigeren Preisniveau und Geschäften mit einem hohen Preisniveau einkauft, lässt sich nicht sagen, 111 14. Untersuchung der zweiten Theorie dass Gymnasiasten häufiger in teureren als in billigeren Geschäften – oder umgekehrt – einkaufen. Analog gilt dies für die Realschule. Bei den Hauptschülern lässt sich anhand der Daten aufzeigen, dass sie häufiger in billigeren Geschäften als in teureren Geschäften einkaufen. Bei allen Schulen lässt sich jedoch eine große Tendenz zur Mitte aufzeigen, was bedeutet, dass Geschäfte der mittleren Preiskategorie bevorzugt werden. Der gewichtete χ2 -Unabhängigkeitstest bestätigt die Abhängigkeit. Die Nullhypothese wird abgelehnt, denn es gilt χ2 = 2, 8144 > 0, 7107 = χ24;0,95 . Unter der Annahme, das jeder Proband für die Auswertung gleich viel zählt (gewichteter Test), lässt sich eine Richtung ganz knapp bestimmen. Hierzu wurde folgende Alternativhypothese geprüft: „Je höher die Schulform, desto weniger kaufen die Schüler in Geschäften mit einem niedrigen Preisniveau ein“. Für die gewichteten Werte pgi1 pgi1 pgi2 und pg + pg gilt: pg i• i• i• pg21 pg31 pg11 = 0, 2013 < g = 0, 2287 < g = 0, 3070 (monoton steigend) pg1• p2• p3• g g g g p11 p12 p21 p22 pg31 pg32 + = 0, 7885 < + = 0, 8066 < + = 0, 8076 (monoton steigend) pg1• pg1• pg2• pg2• pg3• pg3• Die eben genannte Knappheit der Richtung ist an den fast identischen Werten pg22 pg2• pg31 pg3• pg32 pg3• pg21 pg2• + = 0, 8066 ≈ + = 0, 8076 zu erkennen. Durch den knappen Testausgang ist die Richtungsaussage vermutlich nicht signifikant, daher verliert sie erheblich an Bedeutung. Da ich keine eindeutige Richtung im χ2 -Test bzgl. der Abhängigkeit zwischen Schulform und Preisvergleich angeben kann (vgl. Seite 105), kann dieses Testergebnis in die Richtung interpretieren werden, dass die Höhe der Schulform etwas über das Qualitäts- und Markenbewusstsein der Schüler aussagt. Aus diesem Ergebnis folgt die Aussage „Je höher die Schulform, desto höher ist das Qualitätsund Markenbewusstsein der Schüler“. Im Folgenden soll der Binomialtest zeigen, dass Gymnasiasten seltener als Hauptschüler oder Realschüler in preisgünstigere Geschäfte gehen. 14.7.2. Exakter Binomialtest Für die Durchführung eines Binomialtest ist es notwendig die Tabelle 14.12 folgendermaßen zusammen zu fassen: P niedrig mittel bis hoch Gymnasiasten 150 538 688 Realschüler 162 536 698 70 206 276 Hauptschüler P 382 1280 1662 Tabelle 14.13.: Zusammenfassung von Tabelle 14.12 112 14. Untersuchung der zweiten Theorie Für die durchzuführenden Binomialtests werden folgende Hypothesen formuliert: 1. H0 : Die Wahrscheinlichkeit, dass ein Gymnasiast in einem preisgünstigen Geschäft einkauft, ist mindestens so groß, wie die Wahrscheinlichkeit, dass ein Realschüler in einem preisgünstigen Geschäft einkauft. HA : Die Wahrscheinlichkeit, dass ein Gymnasiast in einem preisgünstigen Geschäft einkauft ist, kleiner als die Wahrscheinlichkeit, dass ein Realschüler in einem preisgünstigen Geschäft einkauft. 2. H0 : Die Wahrscheinlichkeit, dass ein Gymnasiast in einem preisgünstigen Geschäft einkauft, ist mindestens so groß, wie die Wahrscheinlichkeit, dass ein Realschüler in einem preisgünstigen Geschäft einkauft. HA : Die Wahrscheinlichkeit, dass ein Gymnasiast in einem preisgünstigen Geschäft einkauft, ist kleiner als die Wahrscheinlichkeit, dass ein Hauptschüler in einem preisgünstigen Geschäft einkauft. 3. H0 : Die Wahrscheinlichkeit, dass ein Realschüler in einem preisgünstigen Geschäft einkauft, ist mindestens so groß, wie die Wahrscheinlichkeit, dass ein Hauptschüler in einem preisgünstigen Geschäft einkauft. HA : Die Wahrscheinlichkeit, dass ein Realschüler in einem preisgünstigen Geschäft einkauft, ist kleiner als die Wahrscheinlichkeit, dass ein Hauptschüler in einem preisgünstigen Geschäft einkauft. Erstes Hypothesenpaar Zu einer geschätzten Wahrscheinlichkeit p0 = 0, 2321 (Wahrscheinlichkeit das ein Realschüler in einem preisgünstigem Geschäft einkauft) lauten die Hypothesen HA : p < 0, 2321 H0 ≥ 0, 2321. Zu einem Signifikanzniveau von α = 0, 05 ergibt sich folgende Rechnung für die untere Schranke bu,0,05 (0, 2321): 141 X 688 k=0 k k 0, 2321 (1 − 0, 2321) 688−k 142 X 688 ≤ 0, 05 < 0, 2321k (1 − 0, 2321)688−k k k=0 ⇔ 0, 0488 ≤ 0, 05 < 0, 0589. Nach den Entscheidungsregeln für den exakten Binomialtest wird H0 abgelehnt, falls e < bu,0,05 . Für den durchgeführten Test gilt e = 150 > 142 = bu,0,05 (0, 2321). Somit kann die Nullhypothese mit einem Signifikanzniveau von 5% nicht abgelehnt werden. Selbst zu einem Signifikanzniveau von α = 0, 1 kann die Nullhypothese noch nicht abgelehnt werden. Das Testergebnis resultiert aus den geringen prozentualen unterschieden zwischen Gymnasiasten und Realschüler, die in preisgünstigen Geschäften einkaufen. 113 14. Untersuchung der zweiten Theorie Zweites Hypothesenpaar Zu einer geschätzten Wahrscheinlichkeit p0 = 0, 2536 (Wahrscheinlichkeit das ein Hauptschüler in einem preisgünstigem Geschäft einkauft) lauten die Hypothesen HA : p < 0, 2536 H0 : p ≥ 0, 2536. Analog zu der obigen Rechnung ergibt sich für die untere Schranke bu,0,05 (0, 2536) = 156. Für den Testausgang gilt e = 150 < 156 = bu,0,05 (0, 2536). Demnach kann die Nullhypothese zu einem Signifikanzniveau von 5% abgelehnt werden und die Alternativhypothese kann angenommen werden. Daher lässt sich sagen, dass Gymnasiasten seltener als Hauptschüler in preisgünstigen Geschäften einkaufen. Drittes Hypothesenpaar Wie im zweiten Hypothesenpaar ist die geschätzte Wahrscheinlichkeit p0 = 0, 2536. Somit lauten die zu testenden Hypothesen HA : p < 0, 2536 H0 : p ≥ 0, 2536. Für die untere Schranke ergibt sich bu,0,05 (0, 2536) = 158. Nach den Entscheidungsvorschriften wird die Nullhypothese zu einem Signifikanzniveau von 5% nicht abgelehnt, da e = 162 > 158 = bu,0,05 (0, 2536). 14.7.3. Unterscheidet sich das Einkaufsverhalten der Schüler je nach Schulform? Bisher wurden die Merkmale, welche als Indikator für das Einkaufsverhalten stehen, einzelnd in Abhängigkeit zur Schulform betrachtet. Im folgenden Test sollen all diese Merkmale zusammen betrachtet werden, um eine Aussage über das Einkaufsverhalten von siegener Schülern der achten Klasse machen zu können. Wie ich bereits auf Seite 70 erklärt habe, ordne ich einem Schüler, ein gutes Einkaufsverhalten zu, wenn er sich gut über ein Produkt informiert, in verschiedenen Geschäften Preise vergleicht und in seinem Einkaufsverhalten zielstrebig ist. Analog gilt dieses umgekehrt für ein schlechtes Einkaufsverhalten. Aus den Interpretationsregeln der Tabelle 11.2 ergibt sich nach Schulform sortiert folgende Verteilung des Einkaufsverhaltens: Gymnasiasten Realschüler Hauptschüler P Einkaufsverhalten gut in % angemessen in % schlecht in % 76 45,509 40 23,9521 51 30,5389 60 37,5 44 27,5 56 35 21 33,871 24 38,7097 17 27,4194 157 40,3599 108 27,7635 124 31,8766 P 167 160 62 389 Tabelle 14.14.: Das Einkaufsverhalten von Schülern der achten Klasse getrennt nach Schulform (vgl. Abbildung 14.2) 114 14. Untersuchung der zweiten Theorie 4 0 0 gut1 30,54% 35,00% 27,42% 1 23,95% 27,50% 38,71% 2 45,51% 37,50% 33,87% 3 Gymnasiasten Realschüler Hauptschüler angemessen 2 3 4schlecht 5 Abbildung 14.2.: Das Einkaufsverhalten von Schülern der achten Klasse getrennt nach Schulform Der folgende χ2 -Unabhängigkeitstest wird die Abhängigkeit der Variablen Schulform und Einkaufsverhalten bestätigen. 14.7.4. χ2 - Unabhängigkeitstest H0 : Das Einkaufsverhalten der Schüler ist nicht abhängig von der Schulform. HA : Das Einkaufsverhalten der Schüler ist abhängig von der Schulform. Nach der Bestimmung der Werte für f und e aus der Tabelle 14.14 erhält man für die χ2 -Prüfstatistik zu einem Signifikanzniveau α = 0, 05 2 χ = 389 3 X 3 X (fij − eij )2 eij i=1 j=1 = 6, 5915. Das χ2 -Quantil mit 4 Freiheitsgraden ergibt χ24;0,95 = 0, 7107. Nach den Entscheidungregeln für den χ2 -Unabhängigkeitstest wird H0 abgelehnt, denn χ2 = 6, 5915 > 0, 7107 = χ24;0,95 . Eine Richtung der Abhängigkeiteit lässt sich für die beiden Merki1 i2 i1 male nicht bestimmen, denn hier gilt nicht, dass die Spalten ppi• und ppi• + ppi• beide monoton steigend oder fallend sind. Hier gilt für die Spalten 0, 4551 > 0, 3750 > 0, 3387 und 0, 6946 > 0, 650 < 0, 7258. Somit verletzt die zweite Ungleichung die Monotoniebedingung. 14.8. Fazit zur zweiten Theorie Es ist recht schwierig ein eindeutiges Fazit zum Einkaufsverhalten von Schülern der achten Klasse zu ziehen, da die Testergebnisse einen Zusammenhang zwischen den einzelnen Merkmalen gezeigt haben, jedoch eine Aussage bezüglich einer Richtung nicht zulassen. Meine Theorie „Das Einkaufsverhalten der Jugendlichen unterscheidet sich je nach Schulform“ lässt anhand eines χ2 - Unabhängigkeitstests bestätigen, doch eine Aussage über die Richtung, wie in der ersten Theorie, ist ausgeschlossen. Daher lässt sich meine Vermutung „Je höher die Schulform, desto besser ist das Einkaufsverhalten der Schüler“ nicht signifikant bestätigen. 115 14. Untersuchung der zweiten Theorie Die durchgeführten Test haben zunächst gezeigt, wofür Schüler der achten Klasse bevorzugt ihr Taschengeld verwenden. Hier hat sich gezeigt, dass Mädchen ihr Taschengeld hauptsächlich für neue Kleidung ausgeben, während Jungen ihr Taschengeld in der Regel am häufigsten für Computerspiele ausgeben. Die Betrachtung der von den Schülern gekauften Produkten, getrennt nach der Schulform hat keinen besonderen Unterschied gezeigt. Dieses bringt zum Ausdruck, dass Schüler von Gymnasien, Realschulen oder Hauptschulen im gleichen Verhältnis Produkte wie Kleidung, Computerspiele, Musik, Schminke usw. erwerben. Ein signifikanter unterschied zeigte sich im Einkauf von Schulsachen. Hier hat der χ2 -Unabhängigkeitstest und deren Richtungstest gezeigt, dass mehr Hauptschüler ihre Schulsachen von ihrem Taschengeld kaufen müssen als Realschüler oder Gymnasiasten. Hiermit lässt sich dann bestätigen, dass die Taschengeldhöhe einen Einfluss darauf hat, ob ein Schüler seine Schulsachen selber kaufen muss oder nicht. Die Schülergruppe, welche das höchste Taschengeld erhält (Hauptschüler) muss häufiger ihr Taschengeld für Schulsachen aufwenden, als die Schülergruppe mit dem geringsten Taschengeld (Gymnasiasten). Bei der Betrachtung des Einkaufsverhaltens ist es notwendig, dreierlei zu analysieren. Zum ersten das Informationsverhalten der Schüler, dann ob ein Schüler Preise vergleicht, wenn er sich ein bestimmtes Produkt kauft und als drittes die Zielstrebigkeit im Einkaufsverhalten. Die Betrachtung des Informationsverhaltens zeigte, dass sich fast alle Schüler informieren wenn sie sich ein bestimmtes Produkt kaufen. Hier haben meine Daten ergeben, dass sich 97% der Gymnasiasten, 93% der Realschüler und 96% der Hauptschüler sich über ein Produkt informieren, bevor sie es kaufen möchten. Eine Richtung bzgl. der Höhe der Schulform und des Informationsverhaltens ließ sich jedoch nicht angeben. Auch die Betrachtung der Qualität der genutzten Informationsquellen ließ keine Aussage bezüglich der Richtung zu. Die Analyse der Merkmale „Preisvergleich“ und „Schulform“ bestätigte die Abhängigkeit des Merkmals „Preisvergleich“ von der Schulform signifikant. Die Datenbetrachtung hat meine anfängliche Hypothese „Je höher die Schulform der Jugendlichen, desto wahrscheinlicher ist es, dass sich ein Jugendlicher über ein Produkt informiert bevor er es kauft“ widerlegt, da sich zeigte, dass 54,82% der Gymnasiasten, 52,90% der Realschüler und 56,45% der Hauptschüler Preise vergleichen. Aber auch die Hypothese „Die Wahrscheinlichkeit, dass ein Hauptschüler Preise vergleicht ist größer als die Wahrscheinlichkeit dass ein Gymnasiast oder ein Realschüler Preise vergleicht“ konnte nicht zu einem angemessenen Signifikanzniveau bestätigt werden. Neben dem Merkmal „Preisvergleich“ konnte betrachtet werden, welche die beliebtesten Bekleidungsgeschäfte in Siegen sind und welche Schüler eher in preisgünstigeren Geschäften einkaufen. Hierzu zeigte sich, dass H&M, C&A und NewYorker die beliebtesten siegener Bekleidungsgeschäfte sind. Diesen Geschäften wurde ein mittleres bis niedriges Preisniveau zugeordnet. Die Betrachtung des Merkmals „Preisniveau der Geschäfte“ zum Merkmal „Schulform“ ergab eine Abhängigkeit. Eine Aussage bzgl. der Richtung ist jedoch kaum möglich. Auch wenn der gewichtete Test eine knappe Richtung bestätigte, wird diese wegen der Knappheit als nicht signifikant angenommen. Die Durchführung eines Binomialtest lässt jedoch zumindest die Aussage zu, dass ein Gymnasiast seltener als ein Hauptschüler in einem preisgünstigem 116 14. Untersuchung der zweiten Theorie Geschäft einkauft. Dieses Ergebnis kann so interpretiert werden, dass Gymnasiasten ein höheres Qualitätsbewusstsein besitzen als Hauptschüler. Das Testen der Merkmale „Zielstrebigkeit“ und „Schulform“ hat die Abhängigkeit dieser Merkmale bestätigt. Ähnlich wie im Test bzgl. des Preisvergleichs ließ sich auch hier keine Richtung zuordnen. Demnach lässt sich nicht sagen, dass Gymnasiasten ein zielstrebigeres Verhalten haben als Hauptschüler oder Realschüler. Die Datenbetrachtung hierzu zeigte sogar, dass Gymnasiasten und Hauptschüler ein fast identisches Verhalten haben. Da die einzelnen Tests keine Richtung aufzeigen, verwundert es nicht, dass der in Abschnitt 14.7.3 dargestellte zusammenfassende Test ebenfalls keine Richtung aufweist. 117 15. Untersuchung der dritten Theorie In diesem Kapitel soll nun meine dritte Theorie „Das Fernsehkonsumverhalten unterscheidet sich je nach Schulform.“, welche ab Seite 71 beschrieben ist, untersucht werden. Hierbei soll zunächst betrachtet werden, wie lange die Jugendlichen täglich Fernsehen schauen. Im Anschluss daran soll analysiert werden, zu welchen Uhrzeiten bzw. Tageszeiten am meisten Fernsehen geschaut wird und zum Abschluss soll betrachtet werden, wie viele Werbeminuten auf die Jugendlichen täglich einwirken. 15.1. Unterscheidet sich die tägliche Fernsehnutzungsdauer der Jugendlichen je nach Schulform? Um das Fernsehkonsumverhalten von Jugendlichen der achten Klasse zu untersuchen, ist es notwendig, die tägliche Fernsehnutzungsdauer dieser zu betrachten. Hierzu liegt nach der Untersuchung folgende Datenverteilung vor: Gymnasiasten Realschüler Hauptschüler P Fernsehnutzungsdauer in Stunden 0–1 1–2 2–3 3–5 5 27 62 42 28 5 14 40 45 41 17 5 12 22 14 9 46 114 109 83 31 P 164 157 62 383 Tabelle 15.1.: Fernsehnutzungsdauer der Jugendlichen in Stunden78 Wenn man die durchschnittliche Fernsehnutzungsdauer jeder Spalte bestimmt und die letzte Spalte > 5 mit 5 Stunden bewertet, lässt sich der Mittelwert für die Fernsehnutzungsdauer aller Schüler mit Hilfe eines erwartungstreuen und konsistenten Schätzers (siehe Beispiel 29) bestimmen. Für die durchschnittliche Fernsehnutzungsdauer ergibt sich demnach: 383 1 X Xi = 2, 4896 h. 383 i=1 78 6 Personen ohne Angabe. 118 15. Untersuchung der dritten Theorie Da der Punktschätzer jedoch keine Information darüber liefert, wo der tatsächliche Wert der Fernsehnutzungsdauer der Schüler, liegt wird im Folgenden mit der Intervallschätzung ein Intervall bestimmt, in dem die tatsächliche Fernsehnutzungsdauer mit einer vorgegebenen Wahrscheinlichkeit liegt. T̂383 (X1 , X2 , . . . , X383 ) = 2, 4896 v u 383 u 1 X t σ̂ = (Xi − T̂383 (X1 , X2 , . . . , X383 ))2 = 1, 3330. 382 i=1 Zu einem Signifikanzniveau von α = 0, 05 ergibt sich das folgende Intervall 1, 3330 1, 3330 2, 4896 − √ · 1, 9600; 2, 4896 + √ · 1, 9600 = [2, 3561; 2, 6231] 383 383 Analog ergibt sich der Mittelwert und das 0,95-Konfidenzintervall für die Fernsehnutzungsdauer der Schüler verschiedener Schulformen: 164 Gymnasiasten: 1 X Xi = 2, 1250 h [u; o] = [1, 9388; 2, 3112] 164 i=1 157 Realschüler: 1 X Xi = 2, 7293 h [u; o] = [2, 5174; 2, 9412] 157 i=1 62 Hauptschüler: 1 X Xi = 2, 8468 h 62 i=1 [u; o] = [2, 5090; 3, 1846] Den Ergebnissen lässt sich entnehmen, dass Hauptschüler durchschnittlich am längsten und Gymnasiasten durchschnittlich am wenigsten Fernsehen schauen. Der Gesamtdurchschnitt der Fernsehnutzungsdauer beträgt 2,4896 Stunden täglich. 15.1.1. χ2 -Unabhängigkeitstest Der folgende Test soll die Abhängigkeit der Merkmale „Fernsehnutzungsdauer“ und „Schulform“ prüfen. Anschließend prüft der Richtungstest die Hypothese „Je höher die Schulform der Jugendliche, desto geringer ist die Fernsehnutzungsdauer dieser“. Die Hypothesen für den χ2 -Unabhängigkeitstest lauten: H0 : Die Fernsehnutzungsdauer der Jugendlichen ist unabhängig von der Schulform. HA : Die Fernsehnutzungsdauer der Jugendlichen ist abhängig von der Schulform. Mit den relativen Häufigkeiten f und den erwarteten Häufigkeiten e, die sich aus Tabelle 15.1 errechnet lassen ergibt sich für die χ2 -Prüfstatistik und für das Quantil χ28;0,95 zu einem Signifikanzniveau von α = 0, 05 χ2 = 25, 9164, χ28;0,95 = 2, 7326. 119 15. Untersuchung der dritten Theorie Somit ergibt sich χ2 = 25, 9164 > 2, 7326 = χ28;0,95 und die Nullhypothese kann mit einer Irrtumswahrscheinlichkeit von 5% abglehnt werden. Damit gilt die Abhängigkeit der beiden Merkmale. Für den Richtungstest wird folgende Alternativhypothese formuliert „Je höher die Schulform, desto geringer ist die Fernsehnutzungsdauer.“ Hierzu ergibt sich aus der Tabelle 15.1 die folgende Tabelle: Gymnasiasten Realschüler Hauptschüler P1 qij j=1 qi• 0,1646 0,0892 0,0806 P2 qij j=1 qi• 0,5427 0,3439 0,2742 P3 qij j=1 qi• 0,7988 0,6306 0,6290 P4 qij j=1 qi• 0,9695 0,8917 0,8548 Tabelle 15.2.: Richtungstest Da alle Spalten monoton fallend sind, kann eine eindeutige Richtung angenommen werden. Somit wird die Alternativhypothese angenommen. 15.2. Unterscheiden sich die Uhrzeiten, zu denen Jugendliche Fernsehen schauen je nach Schulform? Hierzu sollen zunächst die genauen Fernsehnutzungsuhrzeiten am Wochenende und in der Arbeitswoche betrachtet werden. Gym. Real. Haupt. P Gym. Real. Haupt. P vor 6 2 9 3 14 6–8 4 8 3 15 Fernsehnutzungszeiten von Montag bis Freitag 8–10 10–12 12–14 14–16 16–18 18–20 nach 20 3 0 8 47 47 97 123 3 3 26 59 63 104 112 0 1 7 38 19 31 34 6 4 41 144 129 232 269 P 331 387 136 854 Tabelle 15.3.: Fernsehnutzungszeiten von Montags bis Freitags vor 6 5 8 5 18 6–8 6 8 2 16 Fernsehnutzungszeiten am Wochenende 8–10 10–12 12–14 14–16 16–18 18-20 17 27 22 22 31 80 28 47 31 39 46 94 6 17 12 17 20 28 51 91 65 78 97 202 nach 20 152 135 43 330 P 362 436 150 948 Tabelle 15.4.: Fernsehnutzungszeiten am Wochenende Im Allgemeinen lässt sich erkennen, dass sowohl an Arbeitstagen als auch am Wochenende eine Tendenz zu späteren Fernsehnutzungsuhrzeiten besteht. 120 15. Untersuchung der dritten Theorie Der Tabelle lässt sich entnehmen, dass innerhalb der Woche relativ wenige Schüler vormittags (zwischen vor 6–14Uhr) Fernsehen schauen. Dieses liegt daran, dass zu diesen Uhrzeiten in der Regel alle Schüler in der Schule sind. Dass dennoch zu den Uhrzeiten ein paar Werte zu verzeichnen sind, liegt daran, dass die Befragung relativ kurz nach den Ferien durchgeführt wurde und somit von den Schülern auch das Vormittagsprogramm in Anspruch genommen wurde. Am Wochenende zeigt sich, dass weniger Schüler das Nachmittagsprogramm nutzen als innerhalb der Woche. Dies könnte daran liegen, dass Schüler am Wochenende häufig anderen Beschäftigungen (z. B. Hobbys, Freunde treffen) nachgehen. Im Folgenden werden nun die genannten Uhrzeiten klassifiziert. Hierbei werden die Uhrzeiten von vor 6 bis 12 Uhr in die Klassen vormittags, die Zeiten ab 12 bis 18 Uhr in nachmittags und die Zeiten ab 18 Uhr in abends eingeteilt. Dazu ergeben sich folgende gewichtete Tabellen: Gymnasiasten Realschüler Hauptschüler P vormittags 4,33 9,67 3,83 17,83 Montag - Freitag nachmittags abends 47,33 109,33 52,17 96,17 24,33 32,83 123,83 238,33 P 161 158 61 380 Tabelle 15.5.: Gewichtete Klassifizierung der Fernsehnutzungszeiten von Montag bis Freitag79 Gymnasiasten Realschüler Hauptschüler P vormittags 20,33 29,17 12 61,4999 Wochenende nachmittags abends 22,33 121,33 30,5 92,17 15,5 31,5 68,3333 244,9999 P 164 151,83 59 374,8332 Tabelle 15.6.: Gewichtete Klassifizierung der Fernsehnutzungszeiten am Wochenende80 Die genannten fehlenden Daten können in vielen Fällen daher resultieren, dass manche Schüler während der Woche oder am Wochenende kein Fernsehen schauen. Der Vergleich dieser beiden Tabellen zeigt, dass während der Woche seltener vormittags Fernsehen geschaut wird, während am Wochenende das Fernsehen von einigen Schülern auch vormittags genutzt wird. 15.2.1. Gewichteter χ2 -Unabhängigkeitstest Die folgenden gewichteten χ2 - Unabhängigkeitstests mit ihrem Richtungstest testen die Hypothese: 79 80 9 Personen ohne Angaben. 14 Personen ohne Angaben. 121 15. Untersuchung der dritten Theorie H0 : Die Tageszeiten, zu denen Jugendliche Fernsehen schauen, sind sowohl während der Arbeitswoche als auch am Wochenende unabhängig von der Schulform. HA : Die Tageszeiten, zu denen Jugendliche Fernsehen schauen, sind sowohl während der Arbeitswoche als auch am Wochenende abhängig von der Schulform. Im Folgenden soll der gewichtete Unabhängigkeitstest durchgeführt werden, da hier eine Frage untersucht wird, die Mehrfachantworten zulässt, ist es für die Auswertung wichtig, dass jeder Schüler den gleichen Einfluss auf das Testergebnis hat, demnach hat ein Schüler, der drei oder zwei Antwortalternativen angegeben hat den gleichen Einfluss auf das Testergebnis als ein Schüler, der nur eine Antwortalternative ausgewählt hat. Für die χ2 -Prüfstatistik bzgl. der Tageszeiten während der Arbeitswoche (vgl. Tabelle 15.5) und das Quantil χ24;0,95 zu einem Signifikanzniveau von α = 0, 05 mit 4 Freiheitsgraden ergibt sich χ2 = 5, 4439, χ24;0,95 = 0, 7107. Für die χ2 -Prüfstatistik bzgl. der Tageszeiten am Wochenende (vgl. Tabelle 15.6) und das Quantil χ24;0,95 zu einem Signifikanzniveau von α = 0, 05 mit 4 Freiheitsgraden ergibt sich χ2 = 10, 8460, χ24;0,95 = 0, 7107. Demnach werden in beiden Fällen die Unabhängigkeitshypothesen H0 abgelehnt. Denn es gilt im ersten Fall χ2 = 5, 4439 > 0, 7107 = χ24;0,95 und im zweiten Fall χ2 = 10, 8460 > 0, 7107 = χ24;0,95 . Daher wird HA zu einer Irrtumswahrscheinlichkeit von 5% angenommen. Für die folgenden Richtungstests wird nachstehende Alternativhypothese formuliert: HA : Je höher die Schulform, desto weniger Schüler schauen vormittags Fernsehen. Um diese Hypothese bestätigen zu können muss nach den Entscheidungsregeln folgende Monotonie gelten: q11 q21 q31 < < q1• q2• q3• und q11 q12 q21 q22 q31 q32 + < + < + . q1• q1• q2• q2• q3• q3• Für den ersten Fall, die Tageszeiten während der Arbeitswoche, gilt 2, 6913 < 6, 1177 < 6, 2841 und 32, 0907 < 39, 1345 < 46, 1743. Für den zweiten Fall, die Tageszeiten am Wochenende, gilt 12, 3982 < 19, 1886 < 20, 3390 und 26, 0159 < 39, 2544 < 46, 6102. In beiden Fällen sind jeweils die Folge der Werten, der beide Ungleichungketten, monoton steigend. Daher kann die Alternativhypothese angenommen werden. Demnach gilt, sowohl während der Arbeitswoche als auch am Wochenende die Richtung, 122 15. Untersuchung der dritten Theorie je höher die Schulform, desto weniger Schüler schauen vormittags Fernsehen. Daher gilt umgekehrt: Je höher die Schulform, desto mehr Schüler schauen abends Fernsehen. Beim Auszählen der Daten ist mir aufgefallen, dass einige Schüler sowohl am Wochenende als auch während der Arbeitswoche gesagt haben, dass sie sowohl vormittags, nachmittags als auch abends Fernsehen schauen. 15.3. Schauen Schüler höherer Schulformen häufiger öffentlich-rechtliche Fernsehsender als Schüler niedrigerer Schulformen? Bei der Betrachtung der von Jugendlichen geschauten Fernsehsender fällt besonders auf, dass die öffentlich-rechtliche Sender nur selten von ihnen geschaut werden. Es werden hauptsächlich die privaten Sender geschaut. Bei diesen werden von den Jugendlichen hauptsächlich die Sender RTL, Pro7 und SAT1 und die Musiksender VIVA und MTV bevorzugt. Im Folgenden wird nun mit Hilfe eines χ2 Unabhängigkeitstest und dem Richtungstest geprüft, ob mehr Schüler einer höheren Schulform die öffentlich-rechtlichen Fernsehsender nutzen als Schüler einer niedrigen Schulform. 15.3.1. χ2 -Unabhängigkeitstest Die Abhängigkteits- und Unabhängigkeitshypothesen wurden formuliert als: H0 : Ob ein Schüler die öffentlich-rechtlichen Fernsehsender nutzt ist unabhängig von der Schulform des Schülers. HA : Ob ein Schüler die öffentlich-rechtlichen Fernsehsender nutzt ist abhängig von der Schulform des Schüler. Folgende Datenverteilung ergab die Schülerbefragung: Gymnasiasten Realschüler Hauptschüler P Fernsehsender öffentlich-rechtliche private 17 146 15 142 2 60 34 348 P 163 157 62 382 Tabelle 15.7.: Anzahl der Schüler, die die öffentlich-rechtlichen Fernsehsender nutzen81 81 7 Personen ohne Angaben. 123 15. Untersuchung der dritten Theorie Die Berechnung der χ2 -Prüfstatistik und des χ2 -Quantils χ22;0,95 zu einem Signifikanzniveau α = 0, 05 ergibt χ2 = 3, 0150 χ22;0,95 = 0, 1026. Da χ2 = 3, 0150 > 0, 1026 = 0, 1026 kann H0 zu einem Signifikanzniveau von 5% abgelehnt werden. Die Abhängigkeit der beiden Merkmale wird daher angenommen. Die Alternativhypothese für den Richtungstest wird formuliert als: HA : Je höher die Schulform, desto mehr Schüler nutzen die öffentlich-rechtlichen Fernsehsender. i1 Sind die Werte qqi• mit i = 1, 2, 3, welche aus Tabelle 15.7 berechnet werden können i2 mit i1 , 2, 3 automatisch monoton steigend, monoton fallen und somit die Werte qqi• i1 wird die formulierte Alternativhypothese bestätigt. Die Berechnung der Werte qqi• qi2 und qi• ergibt: 10, 4294 > 9, 5541 > 3, 2238 monoton fallend 89, 5706 > 90, 4459 > 96, 7742 monoton steigend. Somit kann HA angenommen werden. 15.4. Sind Schüler einer höheren Schulform täglich weniger Werbeminuten ausgesetzt als Schüler einer niedrigeren Schulform? Da sich gezeigt hat, das Schüler einer höheren Schulform täglich weniger Fernsehen schauen als Schüler einer niedrigere Schulform und da sich gezeigt hat, dass die Höhe der Schulform einen Einfluss darauf hat, ob Schüler die öffentlich-rechtlichen Fernsehsender nutzen, vermute ich, dass Schüler einer höheren Schulform täglich weniger Werbeminuten ausgesetzt sind als Schüler einer niedrigeren Schulform. Um die Werbeminuten, denen die Jugendlichen täglich ausgesetzt sind, berechnen zu können, ist es zunächst notwendig, herauszufinden, wie viele Minuten die einzelnen Fernsehsender täglich ausstrahlen. Informationen darüber konnten jedoch nicht gefunden werden. Der Rundfunkstaatsvertrag82 besagt jedoch, dass die öffentlich-rechtlichen Fernsehsender nur von Montag bis Samstag von 17–20 Uhr Werbung ausstrahlen dürfen. Des Weiteren besagt der Vertrag, dass diese Sender täglich nicht mehr als 20 Minuten ausstrahlen dürfen. Den privaten Fersehsendern dagegen ist es laut Vertrag erlaubt 12 Minuten Werbung pro Stunde auszustrahlen. Mit Hilfe dieser Angaben, der von den Schüler genutzten Fernsehprogramme und die täglichen durchschnittlichen Fernsehnutzungsdauer wurden die ungefähren Werbeminuten, die ein Schüler täglich aufnimmt, berechnet. Daher wird den öffentlich-rechtlichen Fernsehsendern 20/24 = 0, 8333 Werbeminuten pro Stunde und den privaten Fernsehsendern 12 Werbeminuten pro Stunde zugeordnet. Hat ein Schüler z. B. angegeben, dass er täglich 2–3 Stunden, am Liebsten die Programme RTL, VIVA und ARD schaut, wurden 82 LKF – Landesanstalt für Kommunikation Baden-Würtemberg (1991). 124 15. Untersuchung der dritten Theorie die durchschnittlichen Werbeminuten wie folgt berechnet: 2 · 12 min + 1 · 0, 8333 min · 2, 5 = 20, 6944 min 3 Nachdem eine solche Rechnung für jeden einzelnen Schüler durchgeführt wurde, wird der Mittelwert der von den Schülern täglich aufgenommenen Werbeminuten mittels eines erwartungstreuen und konstisten Schätzer (siehe Beispiel 29) bestimmt. Hierbei ergab sich für den geschätzten Mittelwert: 383 1 X Xi = 29, 4507. 383 i=1 Da im Folgenden die Werbeminuten von Schülern unterschiedlicher Schulformen verglichen werden, ist es notwendig, die Mittelwerte der auf die Schüler täglich einwirkenden Werbeminuten für jede einzelne Schulform zu berechnen. 163 Gymnasiasten: 1 X Xi = 25, 4177 163 i=1 157 Realschüler: 1 X Xi = 32, 5366 157 i=1 157 Hauptschüler: 1 X Xi = 32, 3044 62 i=1 Da der Punktschätzer jedoch keine Information darüber liefert, wo der tatsächliche Wert für die von den Schülern konsumierten Werbeminuten liegt wird im Folgenden mit der Intervallschätzung ein Intervall bestimmt, in dem die tatsächlich konsumierten Werbeminuten mit einer vorgegebenen Wahrscheinlichkeit liegen. Das 0,95-Konfidenzintervall für den Mittelwert der konsumierten Werbeminuten aller Schüler ergibt sich nach Gleichung (7.2) wie folgt: T̂383 (X1 , X2 , . . . , X383 ) = 29, 4507, v u 383 u 1 X t σ̂ = (Xi − T̂n (X1 , X2 , . . . , X383 ))2 = 15, 7553. 382 i=1 Zu einem Signifikanzniveau von α = 0, 05 ergibt sich das folgende Intervall 15, 7553 15, 7553 29, 4507 − √ · 1, 9600; 29, 4507 + √ · 1, 9600 = [27, 8728; 31, 0286] 383 383 Analog ergeben sich die 0,95-Konfidenzintervalle zu den von den Schülern konsu- 125 15. Untersuchung der dritten Theorie mierten Werbeminuten für die unterschiedlichen Schulformen: Gymnasiasten: [23, 1140; 27, 7214] Realschüler: [26, 8736; 38, 1996] Hauptschüler: [28, 4196; 36, 1892] Dem Punktschätzer zu Folge konsumieren Gymnasiasten täglich 25,4177 Minuten, Realschüler 32,5366 Minuten und Hauptschüler 32,3044 Minuten Werbung. Demnach lässt sich sagen, dass Gymnasiasten täglich weniger Werbeminuten ausgesetzt sind als Realschüler oder Hauptschüler. Eine Aussage bzgl. der Realschüler und Hauptschüler ist meiner Meinung nach nicht möglich, da die durchschnittlichen Werbeminuten beider Schularten annähernd gleich sind. 15.5. Haben Schüler einer höheren Schulform ein besseres Fernsehnutzungsverhalten als Schüler einer niedrigeren Schulform? Nach dem sich die vorhergehenden Hypothesen signifikant bestätigt haben, stellt sich zum Abschluss der Theorie die Frage, ob Schüler einer höheren Schulform ein besseres Fernsehnutzungsverhalten haben, als Schüler einer niedrigen Schulform. Mit Hilfe der Interpretationsregeln, welche in Tabelle 11.3 formuliert wurden, wird im Folgenden dargestellt, wie viele Schüler jeder Schulform ein gutes, durchschnittliches und schlechtes Fernsehnutzungsverhalten haben. Gymnasiasten Realschüler Hauptschüler P Fernsehnutzungsverhalten gut durchschnittlich schlecht 31 75 55 18 59 79 5 24 33 54 158 167 P 161 156 62 379 34,16% 50,64% 53,23% 46,58% 37,82% 38,71% 6 5 4 3 2 1 0 19,25% 11,54% 8,06% Tabelle 15.8.: Fernsehnutzungsverhalten von Schülern der achten Klasse83 (vgl. Abbildung 15.1) Gymnasiasten Realschüler Hauptschüler gut durchschnittl. schlecht 0 1 2 3 4 5 Abbildung 15.1.: Fernsehnutzungsverhalten von Schülern der achten Klasse 83 10 Personen ohne Angaben. 126 15. Untersuchung der dritten Theorie Die Datenverteilung zeigt, dass 14,25% der befragen Schüler ein gutes, 41,69% ein durchschnittliches und 44,06% ein schlechtes Fernsehnutzungsverhalten haben. 15.5.1. χ2 -Unabhängigkeitstest Da sich beim Testen der Theorie gezeigt hat, dass Schüler einer höheren Schulform eine geringere Fernsehnutzungsdauer haben, seltener als Schüler anderer Schulformen vormittags Fernsehen schauen, häufiger als Schüler anderer Schulformen die öffentlich-rechtlichen Fernsehsender nutzen und dementsprechend täglich weniger Werbeminuten konsumieren, wird folgende Hypothese aufgestellt: HA : Je höher die Schulform, desto besser ist das Fernsehnutzungsverhalten der Schüler. Um eine Aussage bzgl. dieser Hypothese tätigen zu können ist es zunächst notwendig, eine Abhängigkeit zwischen den Merkmalen „Fernsehnutzungsverhalten“ und „Schulform“ festzustellen. Die Berechnung der χ2 -Prüfstatistik und des χ2 -Quantils ergaben die Werte χ2 = 13, 2129, χ24;0,95 = 0, 7107. Nach den Entscheidungsregeln wird hier die Unabhängigkeit mit einem Signifikanzniveau von 5% abgelehnt. Nachdem die Abhängigkeit gezeigt ist, kann der Richtungstest durchgeführt werden. Um eine Aussage bzgl. der Richtung treffen zu können wird nachstehenden Tabelle aufgestellt. Gymnasium Realschule Hauptschule qi1 qi• 0,1925 0,1154 0,0806 qi1 qi2 + qi• qi• 0,6584 0,4936 0,4677 Tabelle 15.9.: Richtungstest zum Fernsehnutzungsverhalten Da beide Spalten monoton fallend sind, kann nach den formulierten Entscheidungsregeln (9.6) die Hypothese: „Je höher die Schulform, desto besser ist das Fernsehnutzungsverhalten“ angenommen werden. 15.6. Fazit zur dritten Theorie Die Untersuchung der dritten Theorie hat eindeutig gezeigt, dass Schüler einer höheren Schulform ein besseres Fernsehnutzungsverhalten haben als Schüler einer niedrigeren Schulform haben. Insgesamt lässt sich sagen, dass von den befragten Schülern nur 14,25% ein gutes und 41,69% ein durchschnittliches Fernsehkonsumverhalten haben, dementsprechend haben 44,06% aller befragten Schüler ein schlechtes Fersehkonsumverhalten (vgl. Abbildung 15.2). Durchschnittliche schauen die Schüler täglich 2,4896 Stunden Fernsehen84 . Wenn man diese Daten nach Schulformen getrennt betrachtet zeigt sich, dass 19,25% der befragten Gymnasiasten, 11,54% der 84 Fast identlisch Ergebnisse lassen sich in einer Untersuchung von Fischer (2000) S. 30ff bestätigen. 127 15. Untersuchung der dritten Theorie Realschüler und nur 8,65% der Hauptschüler ein gutes Fernsehnutzungverhalten haben. Demgegenüber haben 34,16% der Gymnasiasten, 50,64% der Realschüler und 53,23% ein schlechtes Fernsehnutzungsverhalten. Der hohe Anteil an Schülern mit einem schlechten Fernsehnutzungsverhalten resultiert aus der hohen Gewichtung des Merkmals „Fernsehnutzngsdauer“ bei den Interpretationsregeln. Dennoch halte ich diese Gewichtung für sinnvoll, da ich davon ausgehe, dass ein Schüler mit einer hohen Fernsehnutzungsdauer auch ein schlechteres Fernsehkonsumverhalten hat. Bei der Betrachtung der Fernsehnutzngdauer hat sich gezeigt, dass Gymnasiasten im Durchschnitt täglich 2,1250 Stunden, Realschüler 2,7293 Stunden und Hauptschüler 2,8468 Stunden Fernsehen schauen. Betrachtet man zusätzlich noch die Fersehsender, welche Jugendliche der achten Klasse bevorzugt schauen, fällt auf, dass nur sehr wenige Schüler85 die öffentlich-rechtlichen Fernsehsender nutzen. Hierbei haben meine Tests gezeigt, dass häufiger Schüler einer höheren Schulform die öffentlichrechtlichen Sender schauen, als Schüler einer niedrigeren Schulform. Die Ergebnisse bzgl. der Fernsehnutzungdauer und der von Schülern bevorzugten Fernsehsender führten zu dem Ergebnis, dass Gymnasiasten täglich weniger Werbeminuten konsumieren als Realschüler oder Hauptschüler. 41,69% 14,25% 44,06% gutes Fernsehkonsumverhalten durchschnittliches Fernsehkonsumverhalten schlechtes Fernsehkonsumverhalten Abbildung 15.2.: Das Fernsehkonsumverhalten der Schüler 85 Insgesamt nur 34 Schüler (8,38%) 128 16. Resumee Die Auswertung der empirischen Untersuchung „Das Verbraucherverhalten von Jugendlichen der achten Klasse“, an der insgesamt 389 siegener Schülerinnen und Schüler verschiedener Schulformen teilnahmen, wurde unter dem Gesichtspunkt, ob das Verbraucherverhalten von Jugendlichen schulformspezifisch ist, betrachtet. Da ich vermute, dass sich das individuelle Verbraucherverhalten unter anderem konstituiert durch das Verhältnis zum Geld, das Einkaufsverhalten und das Medienverhalten wurden im Wesentlichen folgende drei Theorien untersucht: 1. Das Verhältnis der Jugendlichen zum Geld unterscheidet sich je nach Schulform. 2. Das Einkaufsverhalten der Jugendlichen unterscheidet sich je nach Schulform. 3. Das Fernsehkonsumverhalten unterscheidet sich je nach Schulform. Die Untersuchung der ersten Theorie zeigte, dass Schüler einer höheren Schulform ein besseres Verhältnis zum Geld haben, als Schüler einer niedrigeren Schulform. Obwohl die Taschengeldhöhe mit steigender Schulform abnimmt, leihen sich Schüler höherer Schulformen seltener Geld und sparen regelmäßiger. Jedoch haben insgesamt nur 6,43% der befragten Schüler ein gutes Verhältnis zum Geld, 44,73% hingegen ein schlechtes. Die Auswertung der zweiten Theorie zeigte, dass sich das Einkaufsverhalten der Schüler je nach Schulform unterscheidet. Jedoch lässt sich keine Aussage über eine Richtung treffen. Es stellte sich heraus, dass sich fast alle Schüler über ein Produkt informieren, wenn sie es kaufen möchten. Dabei verwenden fast 30% der Schüler mehrheitlich gute Informationsquellen, auf interessengesteuerte Quellen stützen sich nur 15%. Rund 55% der Schüler holen häufig die Meinung der Eltern oder Freunde ein. Jedoch lässt sich nicht bestätigen, dass Schüler höherer Schulformen ein besseres Informationsverhalten haben. Zwar informieren sie sich häufiger bei guten Informationsquellen, jedoch nicht unbedingt seltener bei schlechten Informationsquellen. Insgesamt vergleichen 54,30% der Schüler vor dem Kauf eines Produktes Preise, dabei besteht nur eine geringe Abhängigkeit von der Schulform. Für die Zielstrebigkeit der Schüler lässt sich ebenfalls keine Tendenz in Abhängigkeit von der Schulform feststellen. Daher lässt sich vermuten, dass die Schulform keinen großen Einfluss auf das Einkaufsverhalten hat. Ob das Einkaufsverhalten von anderen Merkmalen – z. B. der Taschengeldhöhe oder dem Fernsehnutzungsverhalten – abhängt, wäre noch näher zu untersuchen. Die Untersuchung der dritten Theorie zeigte eindeutig, dass Schüler einer höheren Schulform ein besseres Fernsehnutzungsverhalten haben als Schüler einer niedrigeren 129 16. Resumee Schulform. Denn Schüler einer höheren Schulform schauen täglich durchschnittlich weniger Stunden Fernsehen. Des Weiteren sind Gymnasiasten täglich weniger Werbeminuten ausgesetzt als Schüler anderer Schulformen. Dieses liegt daran, dass sie im Durchschnitt weniger Fernsehen schauen und häufiger öffentlich-rechtliche Sender, bei denen der Werbeanteil geringer ist als bei privaten Sendern. Insgesamt haben nur 14,24% der befragten Schüler ein gutes Fernsehkonsumverhalten, mit 44,06% hat jedoch fast die Hälfte ein schlechtes. Dieses Ergebnis ist im Hinblick auf die aktuelle „Shell-Jugendstudie 2006“ nicht verwunderlich. „Jugendliche aus den sozial privilegierten Elternhäusern besuchen aussichtsreichere Schulformen und durchlaufen in der Regel hochwertige berufliche Ausbildungen einschließlich Hochschulgängen. Jugendliche aus der Unterschicht hingegen finden sich häufiger an Hauptschulen und Sonderschulen. Dabei erzielen sie auch im anschließenden beruflichen Ausbildungsweg nicht die Resultate, die ihrem möglichen Potenzial entsprechen.“ 86 Nach der Shell-Studie lässt sich, die Schulform als ein Indikator für die Schichtzugehörigkeit verstehen. Auch die Veröffentlichung des siegener Soziologen Rainer Geißler „Die Sozialstruktur Deutschlands“ bestärkt mich in meinem Eindruck, dass Hauptschüler zu einem höheren Anteil der Unterschicht angehören, wo tendenziell von einem niedrigeren Bildungsstand der Eltern und eng begrenzten finanziellen Ressourcen ausgegangen werden kann, während Gymnasiasten häufig aus einem umfassender gebildeten und wohlhabenderen Elternhaus stammen. Hinsichtlich der Realschule kann man davon ausgehen, dass sich dort beide Bevölkerungsschichten treffen. Vor diesem Hintergrund ist anzunehmen, dass das Verbraucherverhalten der Jugendlichen zum Teil aus ihrer Schichtzugehörigkeit resultiert. Viele Beobachtungen zeigen, dass sich Schüler sehr stark an ihrem Elternhaus und ihrem sozialen Umfeld orientieren und von diesen viele Werte und Vorstellungen übernehmen. Im bereits erwähnten Buch von Rainer Geißler sind die verschiedenen Wertvorstellungen der Schichten nachzulesen. Hinzu kommt, dass die begrenzten finanziellen Mittel der Unterschicht häufig gerade ausreichen, um die Lebensunterhaltskosten zu decken. Eine Zukunftsplanung ist unter diesen Bedingungen nur schwer möglich. Da die Jugendlichen tagtäglich mit den Verhaltensweisen und Vorstellungen ihrer Eltern konfroniert sind, werden diese häufig übernommen, was das von mir analysierte Verhalten der Hauptschüler zumindest teilweise erklären könnte. Die beobachteten besseren Ergebnisse der Gymnasialschüler erkläre ich mir durch deren im Durchschnitt höheren Bildungsmotivation. Diese führe ich darauf zurück,dass die Berufstätigkeit der Eltern nicht nur zur Sicherung des Lebensunterhalts dient, sonder auch Spielräume zur Selbstverwirklichung eröffnen. Aufgrund seltenerer finanzieller Probleme der Mittelschicht hat diese die Möglichkeit, sich ökonomisch für die Zukunft abzusichern, wodurch möglicherweise das vergleichsweise höhere Sparverhalten von Gymnasiasten zu erklären wäre. Des Weiteren werden die Verhaltensweisen der Jugendlichen gerade in der Pubertät oft durch die Peergroup verstärkt. Da sich Jugendliche häufig in schulformhomogenen Gruppen befinden, übertragen sich die für die jeweilige Schulform typischen Verhaltensweisen auch auf Jugendliche, deren Familien die jeweils „schichtspezifischen“ Werte nicht so sehr vertreten. Neben 86 Hurrelmann/Albert/Schneekloth (2006). 130 16. Resumee der Familie und der Peergroup haben heute die Medien zunehmend einen größeren Einfluss auf die Jugendlichen. So macht das Fernsehen einen wesentlichen Teil der Freizeitgestaltung von Jugendlichen aus. Eine Begründung hierfür ist, dass heutzutage Kinder und Jugendliche rund zwei Drittel ihrer Freizeit im Haus verbringen87 , während der Anteil der Freizeitaktivitäten, die im Freien stattfinden, immer weiter sinkt. Dieses liegt zum einen daran, dass es innerhalb der Stadt für Jugendliche wenig Möglichkeiten zur Freizeitgestaltung außer Haus gibt. Zum anderen könnten Jugendliche aufgrund der rückläufigen Geburtenraten weniger gleichaltrige Freunde zur Freizeitgestaltung in der direkten Nachbarschaft haben. Als zusätzlicher Faktor ist zu berücksichtigen, dass eingeschränkte finanzielle Möglichkeiten der Eltern, es Jugendlichen nicht erlauben, an kostenpflichtigen Freizeitaktivitäten teilzunehmen, was zu einem erhöhten Fernsehkonsum beitragen kann. Im Hinblick auf den Schulunterricht, welcher wirtschaftliche Kompetenzen vermitteln soll, ist es meiner Meinung nach notwendig sich an die Lebenspraxis und Lebenssituation der Schüler zu orientieren. Neben der reinen Wissensvermittlung ist es aus meiner Sicht notwendig den Schülern eine Hilfestellung bei der Zukunftsorientierung zu bieten. Hierfür sollen sie motiviert werden ihre Möglichkeiten und Chancen besser zu nutzen und darüber hinaus auszuweiten. Eine weitere Möglichkeit Jugendliche zu bestärken und zu unterstützen kann ich mir, durch von der Schule durchgeführte kompentatorische Maßnahmen für Jugendliche mit schlechteren Voraussetzungen, z.B. geringere finanzielle Mittel, vorstellen. Solche kompensatorische Maßnahmen könnten z. B. durch die Ausweitung der Ganztageseinrichtungen mit kostenlosen Jugendförderprogrammen und Freizeitangeboten, verwirklicht werden. 87 Vgl. Fischer (2000) S. 30. 131 Teil III. Anhang 132 A. Die Sammlung der Fragen aus dem Seminar 1. Wann bekommst du dein Taschengeld? • wöchentlich • monatlich • ich bekomme kein Taschengeld 2. Wofür gibst du dein Geld aus? • Kleidung • Schulsachen • CD’s, DVD’s • Snacks • Handy • Schminke 3. Welchen Fernsehkanal schaust du am liebsten? • Pro 7 • RTL • ARD/ZDF/WDR • Kabel • Sat 1 4. Welche Werbung hat besondere Anziehung auf dich? • Klingeltöne • Kosmetik • Autos • Lebensmittel • Sportartikel • CD´s, DVD´s • Alkohol, Tabak 5. Durch welche Medien informierst du dich über ein Produkt? • Computer/Internet • Radio • Fernsehen • Freunde/ Familie • Plakate • Kino • Zeitschriften 6. Wie hoch ist dein Taschengeld? 7. Gehst du arbeiten? • ja • nein 8. Hast du ein Handy? • ja • nein 9. Hast du schon mal unabsichtig ein Klingelton-Abo gekauft? • ja • nein 10. Hast du schon mal kurzzeitig dein Konto überzogen? • ja • nein 133 A. Die Sammlung der Fragen aus dem Seminar 11. Bittest du deine Eltern öfter um eine Taschengelderhöhung oder einen Vorschuss? • ja • nein 12. Was ist deine lieblings TV-Sendung? 13. Welche Schule besuchst du? • Hauptschule • Realschule • Gymnasium 14. Wie viel Geld gibst du für Klamotten aus? • alles • viel • kaum etwas • nichts 15. Geschlecht? • männlich • die Hälfte • weiblich 16. Bekommst du von deinen Eltern oder Großeltern Geld, wenn du . . . ? • den Müll rausträgst • staubsaugst • das Auto wäschst • spülst • putzt • bügelst 17. Wo kaufst du am liebsten Klamotten? • Esprit • S-Oliver • H&M • C&A • Orsay • Karstadt • Wal Mart • Aldi • Windsurfing • Kataloge • Takko • Kik • Pimky • Lidl • Mango 18. Verdienst du dir Geld hinzu um dein Taschengeld aufzubessern? • ja • nein 19. Hast du schon einmal etwas gekauft und dich hinterher darüber geärgert? • nie • selten • oft • sehr oft 20. Wenn ich etwas kaufe, dann ist mir die Marke wichtig. • stimme nicht zu • stimme eher nicht zu • stimme eher zu • stimme voll zu 21. Informierst du dich über ein Produkt das du kaufen möchtest? • nie • selten • oft • sehr oft 22. Mit wem gehst du normalerweise einkaufen? • allein • mit Freunden 134 • mit den Eltern A. Die Sammlung der Fragen aus dem Seminar 23. Hast du am Ende des Monats noch Taschengeld übrig? • immer • oft • selten • manchmal • nie 135 B. Fragebogenprototyp 136 B. Fragebogenprototyp 137 C. Fragebogen 138 C. Fragebogen 139 C. Fragebogen 140 Literaturverzeichnis Atteslander, Peter: Methoden der empirischen Sozialforschung. 9. Auflage. Berlin: Walter de Gruyter, 2000, ISBN 3–11–016835–9 Behnen/Neuhaus: Grundkurs Stochastik. 1. Auflage. Stuttgart: Teubner, 1984, ISBN 3–519–02069–6 Bundesministerium für Bildung und Forschung: Zur Entwicklung nationaler Bildungsstandards. 4. Auflage. Berlin, 2003 Cramer, Erhard: Statistik für Lehramtsstudierende. Siegen, 2003 Diaz-Bone, Rainer: Statistik für Soziologen. 1. Auflage. Konstanz: UTB, 2006, ISBN 3–8252–2782–0 Diekmann, Andreas: Empirische Sozialforschung. 13. Auflage. Reinbeck bei Hamburg: Rowohlt Taschenbuch Verlag, 2005, ISBN 3–499–55551–4 Fahrmeir et al.: Statistik. 4. Auflage. Berlin, Heidelberg: Springer, 2004, ISBN 3–540–21232–9 Fischer, Gabriele: Fernsehmotive und Fernsehkonsum von Kindern. 2. Auflage. München: Reinhard Fischer, 2000, ISBN 3–88927–268 Friedrichs: Methoden empirischer Sozialforschung. 10. Auflage. Opladen: VS-Verlag, 1982, ISBN 3–53122028–4 Hansen: Methodenlehre der Statistik. 2. Auflage. München: Vahlen, 1977, ISBN 3–8006–0639–9 Hartung, Joachim: Statistik. 1. Auflage. Frechen: Oldenbourg, 1982, ISBN 3–486–26791–4 Henze, Norbert: Stochastik für Einsteiger. 4. Auflage. Wiesbaden: Vieweg, 2003, ISBN 3–528–36894–2 Hurrelmann, Prof. Dr. Klaus/Albert, Prof. Dr. Mathias/Schneekloth, Ulrich: 15. Shell-Jugenstudie – Jugend 2006. 2006 hURL: www.shell.com/static/de-de/downloads/2006/pdf/zusammenfassung_ jugendstudie2006.pdfi – Zugriff am 27. Oktober 2006 Küchler, Uwe: Elementare Wahrscheinlichkeitstheorie. Berlin, 2006 Kromrey, Helmut: Empirischen Sozialforschung. 11. Auflage. Stuttgart: Lucius & Lucius, 2006, ISBN 3–8252–1040–5 Landesamt für Datenverarbeitung und Statistik NRW: Die Verteilung der siegener Schüler auf die verschiedenen Schulformen. 2006 hURL: http://www.landesdatenbank-nrw.dei – Zugriff am 17. Juli 2006 141 Literaturverzeichnis Lang, Stefan: Kategoriale Regression. München, 2005 LKF – Landesanstalt für Kommunikation Baden-Würtemberg: Landesvertrag über den Rundfunk im vereinten Deutschland. Stuttgart, 1991 May, Hermann: Wirtschaftsbürger Taschenbuch. 6. Auflage. München: Oldenbourg, 2003, ISBN 3–486–27237–3 Mayer, Prof. Dr. Horst O.: Interview und schriftliche Befragung. München: R. Oldenbourg, 2002, ISBN 3–486–25910–5 Ministerium für Schule, Jugend und Kinder des Landes Nordrhein-Westfalen: Rahmenvorgabe für die ökonomische Bildung in der Sekundarstufe I. 1. Auflage. Frechen: Ritterbach, 2004, ISBN 3–89314–207–X Popp, Hemlut: Die Taschengeldfrage. 2002 hURL: http://www.jugendamt.nuernberg.de/downloads/taschengeld.pdfi – Zugriff am 08. Oktober 2006 Rüger, Bernhard: Test und Schätztheorie. München: Oldenbourg, 2002, ISBN 3–486–25130–9 Schulze: Beschreibende Statistik. 5. Auflage. München: R. Oldenbourg, 2003, ISBN 3–486–27347–7 Steland, Ansgar: Mathematische Grundlagen der empirischen Forschung. 1. Auflage. Berlin: Springer, 2003, ISBN 3–540–03700–4 Vogel, Friedrich: Beschreibende und schließende Statistik. 10. Auflage. München: Oldenbourg, 1997, ISBN 3–486–24360–8 Witting, Hermann: Matematische Statistik. 3. Auflage. Stuttgart: Teubner, 1978, ISBN 3–519–22036–9 142 Ich versichere, dass ich die schriftliche Hausarbeit – einschließlich beigefügter Zeichnungen, Kartenskizzen und Darstellungen – selbständig verfasst und keine anderen als die angegebenen Quellen und Hilfsmittel benutzt habe. Alle Stellen der Arbeit, die dem Wortlaut oder dem Sinne nach anderen Werken entnommen sind, habe ich in jedem Fall unter Angabe der Quelle deutlich als Entlehnung kenntlich gemacht. 143