Statistik für die Erziehungswissenschaft Lösungen zu allen Übungsteilen aus dem Reader WS 2006/07 Philipps-Universität Marburg Prof. Dr. Udo Kuckartz WS 2004/05 Lösungen Folie 1 Kapitel 1 - Lösungen I 1. Was steht am Anfang jedes Forschungsprojektes? Problemwahl, Forschungsfrage 2. Was ist empirische Sozialforschung? Systematische (= nach Regeln) Erfassung und Deutung sozialer Tatbestände (= beobachtbares, menschliches Verhalten, von Menschen geschaffene Gegenstände sowie durch Sprache vermittelte Meinungen, Informationen über Erfahrungen, Einstellungen, Werturteile, Absichten u.a.m.). empirisch = erfahrungsgemäß, bzw. theoretisch formulierte Annahmen, die an spezifischen Wirklichkeiten überprüft werden 3. Wodurch unterscheidet sich empirische Forschung von Alltagsbeobachtungen? Wissenschaft geht systematisch und methodisch kontrolliert vor. Wissenschaftliche Aussagen erheben den Anspruch, objektiv und replizierbar zu sein. Philipps-Universität Marburg Prof. Dr. Udo Kuckartz WS 2004/05 Lösungen Folie 2 Kapitel 1 - Lösungen II 4. Für welche Form der Definition gilt die folgende Aussage: „Solche Definitionen können weder wahr noch falsch sein.“ a) Nominaldefinition b) Realdefinition 5. Was ist eine Hypothese? a) eine Behauptung, die sich auf subjektiver Erfahrung begründet b) eine allgemeine Aussage über Zusammenhänge zweier Variablen c) eine wissenschaftliche Aussage mit Anspruch auf Richtigkeit Philipps-Universität Marburg Prof. Dr. Udo Kuckartz WS 2004/05 Lösungen Folie 3 Kapitel 1 - Lösungen III 6. Erläutern sie den Unterschied zwischen einer unabhängigen und einer abhängigen Variable! Eine unabhängige Variable kann im Design der Forschungsfrage durch den Versuchsleiter beeinflusst werden. Die abhängige Variable wird in Abhängigkeit von der unabhängigen Variable untersucht und mit dieser in Zusammenhang gebracht. 6b. In einem Experiment wird untersucht, inwiefern sich überhöhter Kaffeegenuss auf die Nervosität auswirkt. Was ist in diesem Setting die unabhängige, was die abhängige Variable? unabhängige Variable: Kaffeegenuss abhängige Variable: Nervosität Philipps-Universität Marburg Prof. Dr. Udo Kuckartz WS 2004/05 Lösungen Folie 4 Kapitel 1 - Lösungen IV 7. Was bedeutet „Falsifikationsprinzip“? a) Aussagen werden überprüft und bewahrheitet. b) Aussagen werden überprüft und gegebenenfalls widerlegt, können aber nicht bewahrheitet werden. c) Aussagen werden überprüft und unabhängig von dem Ergebnis als wahr angenommen. Philipps-Universität Marburg Prof. Dr. Udo Kuckartz WS 2004/05 Lösungen Folie 5 Kapitel 2 – Lösungen I 1. Formulieren Sie zwei, mit den Mitteln der Statistik überprüfbare Hypothesen! Je häufiger die Menschen Actionfilme gucken, desto aggressiver sind sie. Frauen wählen das Studienfach Pädagogik häufiger als Männer. 2. Angenommen, Sie haben ein neues Instrument (Fragebogen) entwickelt. Was müssen Sie vor der Hauptuntersuchung unbedingt durchführen? Vortest 3. Nennen Sie ein Beispiel für problembezogene pädagogische Forschung! Medienkonsum in Bezug auf die Herkunft Philipps-Universität Marburg Prof. Dr. Udo Kuckartz WS 2004/05 Lösungen Folie 6 Kapitel 2 – Lösungen II 4. Welche schriftlichen, für die Öffentlichkeit bestimmten Ergebnisse werden im Verlauf eines Forschungsprojektes üblicherweise produziert? Forschungsbericht 5. Nennen Sie Beispiele für Daten der Bildungsstatistik! Pisa - Studie Shell - Jugendstudie Philipps-Universität Marburg Prof. Dr. Udo Kuckartz WS 2004/05 Lösungen Folie 7 Kapitel 2 – Lösungen III 6. Bringen Sie die folgenden Bestandteile des Forschungsprozesses in die richtige Reihenfolge: Vercodung der Daten, Auswahlplan, Ergebnisbewertung, Pretest! Auswahlplan, Pretest, Vercodung der Daten, Ergebnisbewertung 7. Bringen Sie die Phasen des Forschungsprozesses in die richtige Reihenfolge! A) Analysephase B) Definitionsphase C) Disseminationsphase D) Durchführungsphase Reihenfolge: BDAC Philipps-Universität Marburg Prof. Dr. Udo Kuckartz WS 2004/05 Lösungen Folie 8 Kapitel 3 - Lösungen I 1. Nennen Sie mindestens drei verschiedene Forschungsdesigns! Querschnittuntersuchungen Längsschnittuntersuchungen prospektive / retrospektive Studien experimentelle Untersuchungen quasiexperimentelle Untersuchungen 2. Wie viele Messzeitpunkte hat eine Längsschnittstudie mindestens? Sie muss mindestens zwei Messzeitpunkte haben. 3. Was ist der Unterschied zwischen einer Panelstudie und einer Trendanalyse und was ihre Gemeinsamkeit? Eine Panelstudie befragt die gleichen Personen zu unterschiedlichen Zeitpunkten und eine Trendanalyse befragt unterschiedliche Personen zu unterschiedlichen Zeitpunkten. Bei beiden Designs handelt es sich um Längsschnittuntersuchungen. Philipps-Universität Marburg Prof. Dr. Udo Kuckartz WS 2004/05 Lösungen Folie 9 Kapitel 3 - Lösungen II 4. In einer experimentellen Untersuchung wird gewöhnlich eine Gruppe von Probanden gebildet, die nicht dem Treatment ausgesetzt werden. Wie bezeichnet man diese Gruppe? a) Doppel-Blind-Gruppe b) Versuchsgruppe c) Kontrollgruppe 5. Beschreiben Sie den Aufbau eines Doppel-Blind-Versuchs! Weder das wissenschaftliche Personal, das die Versuche durchführt, noch die Versuchspersonen wissen, wer zur Versuchs- und wer zur Kontrollgruppe gehört. Philipps-Universität Marburg Prof. Dr. Udo Kuckartz WS 2004/05 Lösungen Folie 10 Kapitel 3 - Lösungen III 6. Versuchen sie, mindestens zwei Indikatoren zu benennen für: - Verwahrlosung: Wohnungssituation, Bindungsverhalten - Medieneinsatz in Seminaren: Beamereinsatz, Flipchartbenutzung - Aufmerksamkeit von StudentInnen: Gesichtausdruck, Beteiligung - gesunde Lebensweise: regelmäßige sportliche Betätigung, Essverhalten 7. Betrachten sie die folgende Aussage: „Im weitesten Sinne ist Messen die Zuordnung von Zahlen zu Objekten / Ereignissen anhand bestimmter Regeln.“ Welcher Begriff dieser Aussage beschreibt das empirische Relativ? a) Objekte / Ereignisse b) bestimmte Regeln c) Zahlen Philipps-Universität Marburg Prof. Dr. Udo Kuckartz WS 2004/05 Lösungen Folie 11 Kapitel 3 - Lösungen IV 8. Welches Gütekriterium wird durch die folgende Definition beschrieben: „??? bezeichnet die Gültigkeit eines Messinstruments. Dies ist der Fall, wenn die Indikatoren tatsächlich den Sachverhalt messen, der mit dem definierten Begriff bezeichnet worden ist.“ a) Validität b) Objektivität c) Relativität 9. Was versteht man unter Reliabilität? Reliabilität ist die Reproduzierbarkeit von Ergebnissen unter den gleichen intersubjektiven Bedingungen, also insbesondere die Forderung, dass andere Forscher bei Anwendung desselben Erhebungsinstruments in Interaktion mit demselben Untersuchungsgegenstand zu demselben Ergebnis gelangen. Philipps-Universität Marburg Prof. Dr. Udo Kuckartz WS 2004/05 Lösungen Folie 12 Kapitel 3 - Lösungen V 10. Welche Aussagen sind aufgrund des Skalenniveaus der Daten möglich bei: Bsp: Nominalskalenniveau: Gleichheit / Verschiedenheit (= / ≠) Ordinalskalenniveau: Relationen (= / ≠; < / >) Intervallskalenniveau: Gleichheit von Differenzen (= / ≠; < / >; + / -) Verhältnisskalenniveau: Verhältnisaussagen (= / ≠; < / >; + / -; doppelt so groß, halb so groß o.ä.) 11. Nennen Sie je zwei Beispiele für nominale, ordinale und intervallskalierte Merkmale! nominal: Geschlecht, Religionszugehörigkeit ordinal: BAT Gehaltsgruppen, Militärrang intervall: Temperatur (Celsius), Zeugnisnoten Philipps-Universität Marburg Prof. Dr. Udo Kuckartz WS 2004/05 Lösungen Folie 13 Kapitel 3 - Lösungen VI 12. Um welches Skalenniveau handelt es sich bei den folgenden Daten: (Auszüge aus Fragebögen zum Ankreuzen)? a) Raucher/Nichtraucher b) Ich mag Statistik sehr gerne / gerne / teils-teils / nicht so / gar nicht Skalenniveau: intervall c) Ich mag am liebsten bis am wenigsten (bringen sie die Aussagen in eine Reihenfolge) Bücher lesen / Fahrrad fahren / segeln / Radio hören / Kino / Theater / Fernsehen Skalenniveau: ordinal Philipps-Universität Marburg Prof. Dr. Udo Kuckartz Skalenniveau: nominal WS 2004/05 Lösungen Folie 14 Kapitel 4 – Lösungen I 1. Man hat 25 Studenten nach der Anzahl der von ihnen gelesenen Zeitschriften/Periodika befragt und folgende Daten ermittelt: 1,1,1,1,1,1, 2,2,2, 3,3,3,3,3,3, 4,4, 5,5,5,5, 8, 9,9, 10 Erstellen Sie eine Häufigkeitstabelle nach folgendem Muster: Zeitschriften/Periodika Gültig 1 2 3 4 5 8 9 10 Gesamt Philipps-Universität Marburg Häufigkeit 6 3 6 2 4 1 2 1 25 Prozent 24,0 12,0 24,0 8,0 16,0 4,0 8,0 4,0 100,0 Prof. Dr. Udo Kuckartz Gültige Prozente 24,0 12,0 24,0 8,0 16,0 4,0 8,0 4,0 100,0 Kumulierte Prozente 24,0 36,0 60,0 68,0 84,0 88,0 96,0 100,0 WS 2004/05 Lösungen Folie 15 Kapitel 4 – Lösungen II 2. Kreuzen Sie an: wahr a) Die relative Häufigkeit ist immer größer als die absolute. falsch x b) Rundungsfehler heben sich beim Aufsummieren der relativen Häufigkeiten gegenseitig auf und es ergeben sich immer 100%. x c) Wenn bei einer intervallskalierten Variable der kleinste Wert 10 und der größte 120 ist, beträgt bei 10 Kategorien die Kategorienbreite 12. x d) Es macht keinen Sinn, Kategorien bei nominal oder ordinalskalierten Variablen zu bilden. x e) Häufigkeitsverteilungen machen keinen Sinn bei nominalskalierten Variablen. x f) Mit Balkendiagrammen lassen sich leichter mehr Kategorien darstellen als mit einem Astdiagramm. Philipps-Universität Marburg Prof. Dr. Udo Kuckartz WS 2004/05 Lösungen x x Folie 16 Kapitel 4 – Lösungen III Zeichnen Sie zu folgender Häufigkeitsverteilung, welche die Anzahl der abonnierten Zeitschrift von 25 Studierenden wiedergibt, ein vertikales Balkendiagramm! Häufigkeit Kategorie Häufigkeit 1 6 2 3 3 6 4 2 5 4 8 1 9 2 10 1 4. Zeitschriften/Periodika Zeitschriften/Periodika 10 7 6 8 5 6 4 3 4 2 1 0 1 2 3 4 5 8 9 10 Kategorien Häufigkeit 3. 2 Std.abw. = 2,71 Mittel = 3,8 N = 25,00 0 2,0 4,0 6,0 8,0 10,0 Kategorien Erstellen Sie zu den gleichen Daten ein so genanntes Histogramm! Philipps-Universität Marburg Prof. Dr. Udo Kuckartz WS 2004/05 Lösungen Folie 17 Kapitel 4 – Lösungen IV 5. Wodurch unterscheidet sich das Histogramm vom Balkendiagramm? Der wesentliche Unterschied ist die Einteilung der x-Achse: Während bei einem Balkendiagramm meist nur die vorkommenden Kategorien abgetragen werden, deckt die Einteilung beim Histogramm die gesamte Breite zwischen der minimalsten und maximalsten Kategorie mit gleichen Abständen ab. Ein Histogramm gibt detaillierte Informationen über die Verteilung der erhobenen Variablen. Aus einem Balkendiagramm können detaillierte Informationen über die Häufigkeiten abgelesen werden. Bei einem Histogramm werden zwecks Übersicht oftmals Kategorien zusammengefasst. Im obigen Histogramm entstanden aus den Kategorien 1-2, 3-4, 5-6, 7-8 und 9-10 fünf neue Kategorien, wobei die jeweiligen Balkenhöhen/Häufigkeiten addiert wurden. Philipps-Universität Marburg Prof. Dr. Udo Kuckartz WS 2004/05 Lösungen Folie 18 Kapitel 4 – Lösungen V 6. Bilden Sie Kategorien über die folgenden Daten: Körpergröße 1,22 m, 1,27m, 1,38m, 1,45m, 1,67m, 1,90m Es sollen 4 bzw. 2 Kategorien gebildet werden und dazu jeweils die Häufigkeiten der Kategorie in der Tabelle aufgeführt werden. Kategorie Kategorienmitte Häufigkeit 1,22-1,38 1,30 3 Kategorie Kategorienmitte Häufigkeit 1,39-1,55 1,47 1 1,22-1,55 1,38 4 1,56-1,72 1,73-1,90 1,64 1,81 1 1 1,56-1,90 1,72 2 Lösungen Folie 19 Philipps-Universität Marburg Prof. Dr. Udo Kuckartz WS 2004/05 Kapitel 5 – Lösungen I 1. Kreuzen Sie an, welches Maß der zentralen Tendenz mit den Daten des jeweiligen Skalenniveaus berechnet werden darf! Skalenniveaus Nominalskala Ordinalskala Intervallskala Modalwert / Modus Zulässig Zulässig zulässig Median NICHT zulässig Zulässig Zulässig Mittelwert NICHT zulässig NICHT zulässig zulässig Maße der zentralen Tendenz Philipps-Universität Marburg Prof. Dr. Udo Kuckartz WS 2004/05 Lösungen Folie 20 Kapitel 5 – Lösungen II 2. Ordnen Sie die Aussagen einem Maß der zentralen Tendenz zu! a) Modus b) Median c) Mittelwert a) Der Wert liegt genau in der Mitte aller Werte und teilt somit alle Daten in zwei Hälften. 50% der Werte liegen unterhalb des Wertes, 50% der Werte liegen oberhalb dieses Wertes. a b c Der Wert gibt die numerische Mitte aller Einzelwerte an. Es müssen nicht notwendigerweise 50% der Daten unter- bzw. oberhalb dieses Wertes liegen. a b c Der Wert gibt an, welcher Wert am häufigsten in den Daten vorkommt. a b c b) c) Philipps-Universität Marburg Prof. Dr. Udo Kuckartz WS 2004/05 Lösungen Folie 21 Kapitel 5 – Lösungen III 3. Was sagt der Wert des arithmetischen Mittels (Mittelwert) aus, wenn ich von der Normalverteilung ausgehe? Ausgehend von der Normalverteilung liegen 50% der Testpersonen über, und 50% unter dem arithmetischen Mittel (Mittelwert). In diesem Fall entspricht der Mittelwert dem Median (s. Aufgabe 2, Kapitel 5). 4. Bei einem kognitiven Test für Kleinkinder (Zusammenlegen eines Puzzles in einer bestimmten Zeit) seien die Werte normalverteilt, der Mittelwert betrage 120 Sekunden, die Standardabweichung sei 10 Sek. Wie viele Messwerte liegen dann zwischen 110 und 130 Sekunden? a) etwa 95% b) etwa 68% c) etwa 50% d) etwa 33% 5. Eine Verteilung, bei der der Modus rechts vom arithmetischen Mittel liegt, bezeichnet man als ... a) symmetrisch b) bimodal c) rechtssteil d) glockenförmig Philipps-Universität Marburg Prof. Dr. Udo Kuckartz WS 2004/05 Lösungen Folie 22 Kapitel 5 – Lösungen IV 6. Die folgenden Daten geben an, wie viele richtige Antworten in einem Test gegeben wurden. Berechnen Sie die Varianz und die Standardabweichung! X 18 20 22 24 17 18 20 21 21 x-xquer -2,11 -0,11 1,89 3,89 -3,11 -2,11 -0,11 0,89 0,89 Philipps-Universität Marburg (x-xquer)² 4,45 0,01 3,75 15,13 9,67 4,45 0,01 0,79 0,79 = 39,05 N= 9 X 20,11 2 S = 4,34 S = 2,08 Prof. Dr. Udo Kuckartz WS 2004/05 Lösungen Folie 23 Kapitel 5 – Lösungen V 6a) Welche Aussagen kann man anhand der berechneten Daten machen? Unter Annahme der Normalverteilung der Daten kann man sagen: Zwischen 18,03 und 22,19 liegen 68% der Werte. Zwischen 15,95 und 24,27 liegen 95% der Werte. Philipps-Universität Marburg Prof. Dr. Udo Kuckartz WS 2004/05 Lösungen Folie 24 Kapitel 5 – Lösungen VI 7. Folgende Häufigkeitstabelle gibt die Anzahl der abonnierten Zeitschrift im Monat von 25 Studierenden wieder. Anzahl der Häufigkeit Bestimmen Sie Zeitschriften den Modus (Modalwert) = 1 und 3 1 6 den Median =3 2 3 1 1 1 1 1 1 2 2 2 3 3 3 3 3 3 4 4 5 5 5 5 8 9 9 10 3 6 4 2 das arithmetische Mittel = 94/25 = 3,76 5 4 die Summe aller Abwei8 1 chungen vom Mittelwert =0 9 2 die Spannweite (Range) = 10-1 = 9 10 1 die AD-Streuung = 52,8 / 25 = 2,11 die Varianz Philipps-Universität Marburg = 7,06 (n=25) die Standardabweichung = 2,66 (n=25) Prof. Dr. Udo Kuckartz Lösungen WS 2004/05 Folie 25 Kapitel 5 – Lösungen VII 8. Andreas hat im Untertest I eines Intelligenztests den Punktwert 70 erreicht und im Untertest II den Punktwert 8. Das Testmanual weist folgende Normwerte für die beiden Untertests auf, für beide Untertests liegt Normalverteilung vor: Norm für Untertest I: arithm. Mittel = 65, Standardabweichung = 5 Norm für Untertest II: arithm. Mittel = 6, Standardabweichung = 1 a) Hat Andreas in Untertest I oder in Untertest II besser abgeschnitten? Die Standardisierung mit z-Transformation ergibt folgende Werte: z(I) = (70-65)/5 = 1 z(II) = (8-6)/1 = 2 Aus z(II) > z(I) folgt, dass Andreas im Untertest II besser abgeschnitten hat. Philipps-Universität Marburg Prof. Dr. Udo Kuckartz WS 2004/05 Lösungen Folie 26 Kapitel 5 – Lösungen VIII 8b) Wie hoch ist die Wahrscheinlichkeit für die in den beiden Untertests erreichten und alle kleineren Punktwerte? Benutzen Sie zur Lösung die Tabelle der Normalverteilung! p(z 2) = 0,9772 p(z 1) = 0,8413 Philipps-Universität Marburg Prof. Dr. Udo Kuckartz WS 2004/05 Lösungen Folie 27 Kapitel 6 - Lösungen I 1. Wie wahrscheinlich ist es, dass a) beim Münzwurf 4 mal hintereinander Zahl kommt? n= 4 k= 4 p= 0,5 P=0,0625 p= 0,5 P=0,1641 p= 0,5 P=0,3750 b) beim Münzwurf bei 7 Würfen 5 mal Kopf zu werfen? n= 7 k= 5 c) bei 4 Münzwürfen 2 mal Zahl zu werfen? n= 4 k= 2 d) beim Würfeln von 6 Würfen 3mal hintereinander eine 6 zu bekommen? n= 6 k= 3 p= 1/6 0,15 P=0,0415 e) beim Würfeln von 5 Würfen 4mal hintereinander eine 1 zu bekommen? n= 5 k= 4 p= 1/6 0,15 P=0,0022 Benutzen Sie zur Lösung die Tabelle der Binomialverteilung! Philipps-Universität Marburg Prof. Dr. Udo Kuckartz WS 2004/05 Lösungen Folie 28 Kapitel 6 - Lösungen II 2. Was ist der Unterschied zwischen der Normalverteilung und der Standardnormalverteilung? Die Normalverteilung geht davon aus, dass der Mittelwert genau die Mitte der Daten abbildet (also 50% der Daten unter- bzw. oberhalb des Mittelwertes liegen). Bei der Standardnormalverteilung ist dieser Mittelwert genau auf den Wert x (quer) = 0 festgelegt, die Standardabweichung auf den Wert s = 1. Mit der zTransformation kann jeder beliebige Wert in einen Wert der Standardnormalverteilung „übersetzt“ (transformiert) werden. 3. Was bildet die folgende Grafik ab? Eine Normalverteilung oder eine Standardnormalverteilung? Begründen Sie ihre Antwort! Da auf der Grafik der Mittelwert nicht mit dem Wert 0 gekennzeichnet ist, handelt es sich lediglich um eine beliebige Normalverteilung. Die Regel, 68% der Werte liegen zwischen -1 bis 1 Standardabweichung (bzw. 95,5% der Werte zwischen -2 bis 2 Standardabweichungen) gilt für alle Normalverteilungen. Philipps-Universität Marburg Prof. Dr. Udo Kuckartz WS 2004/05 Lösungen Folie 29 Kapitel 6 - Lösungen III 4. Was ist ein Elementarereignis? Ein Elementarereignis ist ein bestimmtes Ereignis, das bei einem Zufallsexperiment auftreten kann, z.B. beim Würfeln eine 1 zu würfeln ist ein Elementarereignis. 5. Was ist der Ereignisraum eines Zufallsexperiments? Der Ereignisraum eines Zufallsexperiments umfasst alle möglichen Elementarereignisse, die während des Experiments eintreten können. Beispielsweise ist das Elementarereignis, eine 1 zu würfeln nur eins von sechs möglichen Elementarereignissen. Es wäre auch möglich eine 2, 3 usw. zu würfeln. Philipps-Universität Marburg Prof. Dr. Udo Kuckartz WS 2004/05 Lösungen Folie 30 Kapitel 6 - Lösungen IV 7. Andreas hat im Untertest I eines Intelligenztests den Punktwert 70 erreicht und im Untertest II den Punktwert 8. Das Testmanual weist folgende Normwerte für die beiden Untertests auf, für beide Untertests liegt Normalverteilung vor: Norm für Untertest I: arithm. Mittel = 65 Standardabweichung = 5 Norm für Untertest II: arithm. Mittel = 6 Standardabweichung = 1 a) Hat Andreas in Untertest I oder in Untertest II besser abgeschnitten? Die Standardisierung mit z-Transformation ergibt folgende Werte: z(I) = (70-65)/5 = 1 z(II) = (8-6)/1 = 2 Aus z(II) > z(I) folgt, dass Andreas im Untertest II besser abgeschnitten hat. b) Wie hoch ist die Wahrscheinlichkeit für die in den beiden Untertests erreichten und alle kleineren Punktwerte? Benutzen Sie zur Lösung die Tabelle der Normalverteilung. P (z 2) = 0,9772 p (z 1) = 0,8413 Philipps-Universität Marburg Prof. Dr. Udo Kuckartz WS 2004/05 Lösungen Folie 31 Kapitel 7 - Lösungen I 1. Formulieren Sie eine Alternativ- und eine Nullhypothese mit folgenden Variablen: a) Geschlecht und Computernutzung (ungerichtet) H 0: Männer und Frauen unterscheiden sich nicht in ihrer Häufigkeit, den Computer zu nutzen. H1: Männer und Frauen unterscheiden sich in ihrer Häufigkeit, den Computer zu nutzen. b) Schulabschluss und Umweltbewusstsein (gerichtet) H0: Menschen mit einem hohen Schulabschluss verhalten sich genauso oder weniger umweltbewusst wie Menschen mit einem niedrigen Schulabschluss. H1: Menschen mit einem hohen Schulabschluss verhalten sich umweltbewusster wie Menschen mit einem niedrigen Schulabschluss. Philipps-Universität Marburg Prof. Dr. Udo Kuckartz WS 2004/05 Lösungen Folie 32 Kapitel 7 - Lösungen II 2. Was ist der Unterschied zwischen einer gerichteten und einer ungerichteten Hypothese? Eine gerichtete Hypothese gibt bereits die Richtung des Unterschieds/Zusammenhangs an, z.B. Männer wählen eher Pädagogik als Studienfach als Frauen. Ungerichtete Hypothesen geben keine Richtung des Unterschieds/Zusammenhangs an, z.B. Männer und Frauen unterscheiden sich in ihrer Entscheidung, Pädagogik als Studienfach zu wählen. Philipps-Universität Marburg Prof. Dr. Udo Kuckartz WS 2004/05 Lösungen Folie 33 Kapitel 7 - Lösungen III 3. Wie ist die Nullhypothese grundsätzlich formuliert? Es ist immer die Hypothese, die von keinem Unterschied/Zusammenhang zwischen den untersuchten Variablen ausgeht oder (bei gerichteten Hypothesen) von keinem Unterschied/Zusammenhang UND der anderen Richtung des Unterschieds/Zusammenhangs als die Alternativhypothese. Philipps-Universität Marburg Prof. Dr. Udo Kuckartz WS 2004/05 Lösungen Folie 34 Kapitel 7 - Lösungen IV 4. Was ist die Irrtumswahrscheinlichkeit? 5. a) die Wahrscheinlichkeit, mit einer Entscheidung für die Alternativhypothese (aufgrund der Stichprobe) zu irren, da in der Population die Nullhypothese gilt. b) die Wahrscheinlichkeit, mit einer Entscheidung für die Nullhypothese zu irren, da in der Population die Alternativhypothese gilt. c) die Wahrscheinlichkeit, dass die Nullhypothese zutrifft (in der Population). d) die Wahrscheinlichkeit, dass die Alternativhypothese zutrifft (in der Population). Warum ist die Nullhypothese so wichtig? Bevor die Ergebnisse einer Untersuchung vorliegen, gilt immer die Nullhypothese. Sie ist somit die Forschungsbasis. Im Verlauf der Studie kann auch lediglich die Wahrscheinlichkeit minimiert werden, dass die Nullhypothese zutrifft und somit die Alternativhypothese gilt. Philipps-Universität Marburg Prof. Dr. Udo Kuckartz WS 2004/05 Lösungen Folie 35 Kapitel 7 - Lösungen V 6. In der Forschung können Fehler begangen werden, die möglichst vermieden werden sollten. Einen α-Fehler begeht man, wenn man sich aufgrund der Stichprobe für die H0 entscheidet, obwohl in der Population die H1 gilt. man sich aufgrund der Population für eine zu große Stichprobe entscheidet. man sich aufgrund der Stichprobe für die H1 entscheidet, obwohl in der Population die H0 gilt. man sich aufgrund der Stichprobe für eine zu große Population entscheidet. 6a) Die Irrtumswahrscheinlichkeit ist somit die Wahrscheinlichkeit, einen α-Fehler zu begehen. wahr falsch Philipps-Universität Marburg Prof. Dr. Udo Kuckartz WS 2004/05 Lösungen Folie 36 Kapitel 7 - Lösungen VI 7. Welche Signifikanzniveaus werden in der Statistik üblicherweise verwendet? a) das 5%- und das 1%-Niveau b) das 95%- und das 99%-Niveau c) das 0,5%- und das 0,1%-Niveau 8. Was sagen die %-Zahlen des Signifikanzniveaus aus? sie geben die Irrtumswahrscheinlichkeit an. sie geben den Anteil der Leute an, die in der Studie falsche Antworten gegeben haben. sie geben den Prozentsatz an, zu dem das Ergebnis signifikant (=bedeutend) ist. Philipps-Universität Marburg Prof. Dr. Udo Kuckartz WS 2004/05 Lösungen Folie 37 Kapitel 8 - Lösungen I 1. Der T-Test dient (richtige Lösung bitte ankreuzen): a) zum Testen eines Stichprobenmittelwertes auf Abweichungen von der Grundgesamtheit. b) zum Testen von Unterschieden von Stichprobenmittelwerten. c) zum Testen der Güte von Getränken (Tee, Kaffee etc.). 2. Lesen Sie die Werte in der Tabelle ab! Welcher t-Wert ist zu überschreiten für: df=12 5% Niveau einseitige Fragestellung Das einseitige 5% Niveau entspricht der Wahrscheinlichkeit (Fläche unter der t-Kurve): p = 1- = 1-0.05 = 0.95 t (df=12, p=0.95) = 1,782 Philipps-Universität Marburg Prof. Dr. Udo Kuckartz WS 2004/05 Lösungen Folie 38 Kapitel 8 – Lösungen II 2. Fortsetzung df=12 5% Niveau zweiseitige Fragestellung Das zweiseitige 5% Niveau entspricht p = 1-/2 = 1-0.025 = 0.975 t (df=12, p=0.975) = 2,179 df=20 1% Niveau einseitige Fragestellung t (df=20, p=0.99) = 2,528 df=29 1% Niveau zweiseitige Fragestellung t (df=29, p=0.995) = 2,756 Philipps-Universität Marburg Prof. Dr. Udo Kuckartz WS 2004/05 Lösungen Folie 39 Kapitel 8 – Lösungen III 3. In der Studentenstudie 2000 ergaben sich folgende Altersmittelwerte von Männern und Frauen: Gruppenstatistike n Alt er Geschlecht weiblic h männlich N 100 19 Mittelwert 21,94 22,42 St andardab weichung 4,64 2,81 St andardfe hler des Mittelwertes ,46 ,65 Mit einem t-Test wurde überprüft, ob sich Männer und Frauen bezüglich ihres Alters unterscheiden. a) Formulieren Sie eine geeignete ungerichtete Alternativhypothese! H0: Männliche und weibliche Besucher der Statistik-VL unterscheiden sich in ihrem Durchschnittsalter. H1: Männliche und weibliche Besucher der Statistik-VL unterscheiden sich nicht in ihrem Durchschnittsalter. Philipps-Universität Marburg Prof. Dr. Udo Kuckartz WS 2004/05 Lösungen Folie 40 Kapitel 8 – Lösungen IV 3. b) Formulieren Sie eine geeignete gerichtete Alternativhypothese! H1: Männliche Besucher der Statistik-VL sind durchschnittlich älter als weibliche. c) Es ergab sich eine 2-seituge Irrtumswahrscheinlichkeit von p= 0,664. Spricht die Irrtumswahrscheinlichkeit von p=0,664 für oder gegen die Alternativhypothese? Was bedeutet das inhaltlich? Das spricht eindeutig für die Nullhypothese, weil die Irrtumswahrscheinlichkeit 66,4% größer als 5% ist. Also unterscheiden sich die Studenten nicht signifikant von den Studentinnen, welche die Statistik-VL besuchen, hinsichtlich ihres Alters. d) Wie groß darf grundsätzlich die Irrtumswahrscheinlichkeit p höchstens sein, damit Sie ein hochsignifikantes Ergebnis erhalten? p muss kleiner als 1% sein. Philipps-Universität Marburg Prof. Dr. Udo Kuckartz WS 2004/05 Lösungen Folie 41 Kapitel 8 – Lösungen V 4. Sie haben in einer Studie mit zwei Gruppen zu je 21 Probanden eine Prüfgröße t von 2,2 ermittelt. Nun schlagen Sie in der Tabelle nach und entnehmen dieser für df=40 auf dem 5% Niveau einen Wert von 1,68. Entscheiden Sie sich a) bei einseitiger Fragestellung für die Alternativhypothese oder für die Nullhypothese? Für die Alternativhypothese, weil der empirisch in der Studie gewonnene Wert von 2,2 größer ist als der zugehörige kritische t-Wert von 1,68. b) bei zweiseitiger Fragestellung für die Alternativhypothese oder für die Nullhypothese? Für den t-Wert ergibt sich bei 2-seitiger Fragestellung statt 1,68 der neue Wert t (df=40, p=0.975) = 2,021 => Auch für die Alternativhypothese, weil der empirisch in der Studie gewonnene Wert von 2,2 immer noch höher ist als 2,021. Philipps-Universität Marburg Prof. Dr. Udo Kuckartz WS 2004/05 Lösungen Folie 42 Kapitel 8 – Lösungen VI 4. c) Was bedeutet das Ergebnis inhaltlich? (bitte für beide Fälle formulieren) Bei einer Entscheidung für die Alternativhypothese liegt ein auf dem 5%Niveau signifikanter Unterschied der beiden Gruppen vor. Bei einer Entscheidung für die Nullhypothese lässt sich ein signifikanter Unterschied zwischen den Gruppen nicht feststellen. 5. Bringen Sie die Schritte des t-Testes in die richtige Reihenfolge a) Mittelwerte und Varianzen der beiden Variablen berechnen b) Kritischen t-Wert für (, df) ermitteln c) Prüfgröße t berechnen d) Vergleich der Prüfgröße t mit dem Tabellenwert: wenn t < t,df, dann Beibehaltung der H0 e) Standardfehler der Differenz berechnen f) Anzahl der Freiheitsgrade ermitteln Reihenfolge:____a) e) c) f) b) d)______________ Philipps-Universität Marburg Prof. Dr. Udo Kuckartz WS 2004/05 Lösungen Folie 43 Kapitel 9 - Lösungen I 1. Mit Daten auf welchem Skalenniveau kann man den Chi-Quadrat-Test durchführen? Der Chi-Quadrat-Test kann mit Daten ab Nominalskalen-Niveau (also auch mit ordinal- und intervallskalierten Daten) durchgeführt werden. 2. In einer Vorlesung der Pädagogik mit 105 Teilnehmenden ermitteln Sie folgende Verteilung der Geschlechter: weiblich männlich Gesamt Häufigkeit Erwartet 52,5 80 52,5 25 105 Untersuchen Sie mittels eines Chi-Quadrat-Testes, ob diese Teilnehmerzusammensetzung mit der Annahme einer Gleichverteilung der Geschlechter (50:50) vereinbar ist! Wählen Sie das 5% Signifikanzniveau, berechnen Sie die erwarteten Häufigkeiten und Chi-Quadrat! Philipps-Universität Marburg Prof. Dr. Udo Kuckartz WS 2004/05 Lösungen Folie 44 Kapitel 9 - Lösungen II 2. Lösungsweg bitte hier aufschreiben: Chi-Quadrat (empirisch) = [ (80-52,5)² + (25-52,5)² ] : 52,5 = [ 27,5² + 27,5² ] : 52,5 = 1512,5 : 52,5 = 28,8 > Chi-Quadrat (df=1, 0.95) = 3,84 => signifikantes Ergebnis; die Teilnehmerzusammensetzung ist nicht mit einer Gleichverteilung vereinbar 3. Angenommen Sie hätten für eine Vierfeldertafel den empirischen ChiQuadrat-Wert berechnet. Dieser sei größer als der Chi-Quadrat-Wert, den Sie für das 5% Niveau und die entsprechende Zahl von Freiheitsgraden in der Tabelle ablesen. Wie entscheiden Sie sich? a) für die Nullhypothese b) für die Alternativhypothese Philipps-Universität Marburg Prof. Dr. Udo Kuckartz WS 2004/05 Lösungen Folie 45 Kapitel 9 - Lösungen III 4. Berechnen Sie Chi-Quadrat! Wahlpflichtfach Studienrichtung 1 2 3 4 Summe 1 20 (15) 30 (22,5) 0 (18,75) 25 (18,75) 75 2 20 (15) 0 (22,5) 30 (18,75) 25 (18,75) 75 3 0 (10) 30 (15) 20 (12,5) 0 (12,5) 50 Summe 40 50 50 200 60 in Klammern sind die Erwartungswerte angegeben c2 = (20-15)2 + (30-22,5)2 + (0-18,75)2 +....+ (0-12,5)2 = 99,87 15 22.5 18,75 12,5 Philipps-Universität Marburg Prof. Dr. Udo Kuckartz WS 2004/05 Lösungen Folie 46 Kapitel 9 - Lösungen IV 5. Berechnen Sie wieder Chi-Quadrat und führen Sie den statistischen Entscheidungsprozess durch! Wahlpflichtfach Studienrichtung 1 2 3 4 Summe 1 40 (30) 25 (25) 2 (4) 33 (41) 100 2 10 (12) 15 (10) 2 (1,6) 13 (16,4) 40 3 10 (18) 10 (15) 4 (2,4) 36 (24,6) 60 Summe 60 8 82 200 Chi-Quadrat (empirisch) = Philipps-Universität Marburg 50 k c² (fb(j) fe(j) )² j 1 fe(j) Prof. Dr. Udo Kuckartz = 21,057 WS 2004/05 Lösungen Folie 47 Kapitel 9 - Lösungen V 6. Sind die Tabellen aus Aufgabe 4 und 5 gleich gut für einen Chi-Quadrat-Test geeignet? Dürfen die Ergebnisse für Aussagen über Zusammenhänge herangezogen werden? Die Tabelle aus Aufgabe 5 kann nicht für Aussagen über Zusammenhänge zwischen den Variablen Studienrichtung und Wahlpflichtfach herangezogen werden, da mehr als 20% der Tabellenfelder eine erwartete Häufigkeit kleiner 5 haben. Die Tabelle ist somit weniger geeignet für einen Chi-Quadrat-Test. Philipps-Universität Marburg Prof. Dr. Udo Kuckartz WS 2004/05 Lösungen Folie 48 Kapitel 10 - Lösungen I 1. 200 Studenten wurden nach ihrem Geschlecht (männlich, weiblich) und ihrem Familienstand gefragt, also danach, ob sie alleine leben (Single) oder nicht (Non-single). Ein unvollständiger Auszug der Daten sieht so aus: Single Non-Single Spaltensummen Männlich 20 60 80 weiblich 40 80 120 Zeilensummen 60 140 200 a) Ergänzen Sie die Tabelle an den entsprechenden Stellen! b) Berechnen Sie Chi-Quadrat! Chi-Quadrat = 1,587 Philipps-Universität Marburg Prof. Dr. Udo Kuckartz WS 2004/05 Lösungen Folie 49 Kapitel 10 - Lösungen II 1. Fortsetzung c) Berechnen Sie den Phi-Koeffizienten! Phi-Koeffizient = - 0,089 d) Was bedeutet das Ergebnis des Phi-Koeffizienten inhaltlich? Der Phi-Koeffizient gibt den Grad des Zusammenhangs an. In diesem Fall ist der Wert nahe 0 und der Zusammenhang ist damit nicht erwähnenswert. Ein Phi-Koeffizient von 0,3 gibt beispielsweise einen mittleren, ein Wert von 0,6 einen großen Zusammenhang an. Philipps-Universität Marburg Prof. Dr. Udo Kuckartz WS 2004/05 Lösungen Folie 50 Kapitel 10 - Lösungen III 2. Die folgende Tabelle ist von Aufgabe 4, Kapitel 8 übernommen. Berechnen Sie nun den Phi-Koeffizienten und interpretieren Sie das Ergebnis. Wahlpflichtfach Studienrichtung 1 2 3 4 Summe 1 20 30 0 25 75 2 20 0 30 25 75 3 0 30 20 0 50 Summe 40 60 50 50 200 Chi-Quadrat (emprisch) = 21,0595 Phi-Koeffizient = 0,071 Der Zusammenhang zwischen der Studienrichtung und dem Wahlpflichtfach, die von den Testpersonen angeben wurden, ist gering. Da der Wert nahe an 0 liegt, ist ein Zusammenhang fast nicht vorhanden. Philipps-Universität Marburg Prof. Dr. Udo Kuckartz WS 2004/05 Lösungen Folie 51 Kapitel 10 - Lösungen IV 3. Die Teilnehmer/innen der Statistikvorlesung 2000 wurden danach befragt, a) ob sie planen, eventuell ein oder mehrere Semester im Ausland zu studieren b) in welcher Region sie Abitur gemacht haben. Der Chi-Quadrat-Test ergab folgende Tabellen. Beschreiben und interpretieren Sie die Ergebnisse! Auslandssemester * Region (des Abiturs) Kreuztabelle Auslandssemes ter nein / eher nicht eher ja / bestimmt Erwartete Erwartete Anzahl Anzahl Anzahl Anzahl Region (des Abiturs ) Marburg und nahe Umgebung weitere Umgebung von Marburg Hessen anderes Bundes land Gesamt Philipps-Universität Marburg Gesamt Anzahl 31 23,7 7 14,3 38 13 10,6 4 6,4 17 8 10,6 9 6,4 17 24 31,1 26 18,9 50 76 76,0 46 46,0 122 Prof. Dr. Udo Kuckartz WS 2004/05 Lösungen Folie 52 Kapitel 10 - Lösungen V 3. Fortsetzung Chi-Quadrat-Tests W ert Chi-Quadrat nach Pearson As ymptotische Signifikanz (2-seit ig) df 13,501 Symm etri sche Ma ße 3 ,004 Cramer-V W ert ,333 Näherung sweise Signifik anz ,004 Der Chi-Quadrat-Test lieferte eine Irrtumswahrscheinlichkeit von 0,4% und war damit auf dem 1%-Niveau signifikant. Demnach wird die Ho (Es besteht kein Zusammenhang zwischen den Variablen) verworfen und die Entscheidung fällt für die Alternativhypothese H1: Es besteht ein signifikanter Zusammenhang zwischen der Region, in der die Studierenden ihr Abitur gemacht haben und der Planung, ein oder mehrere Semester im Ausland zu studieren. Philipps-Universität Marburg Prof. Dr. Udo Kuckartz WS 2004/05 Lösungen Folie 53 Kapitel 10 - Lösungen VI 3. Fortsetzung II Aus der Verteilungstabelle ist zu entnehmen, dass die Studierenden, die in der näheren und weiteren Umgebung von Marburg Abitur machten (n=38+17=55), weniger Interesse haben, im Ausland zu studieren als diejenigen aus Hessen und anderen Bundesländern (n=17+50=67). Der standardisierte Koeffizient Cramers V von 0,333 lässt auf einen mittelgroßen Zusammenhang zwischen Region des Abiturs und Planung eines Auslandssemester schließen. Es ist zu vermuten, dass die Studierenden, die nicht aus der Umgebung Marburgs kommen, und deshalb schon einmal zu Studienbeginn den Schritt in ein neues Lebens- und Studierumfeld gegangen sind, weniger Schwierigkeiten haben, sich ein Semester im Ausland vorzustellen. Darüber hinaus sind vermutlich die regionalen Bezüge und Bindungen zur Familie, zum Elternhaus, zu Freunden und zur Region bei den Studierenden aus der Umgebung Marburgs größer. Der „Schritt ins Ausland“ stellt dadurch sicherlich eine größere Hemmschwelle dar. Philipps-Universität Marburg Prof. Dr. Udo Kuckartz WS 2004/05 Lösungen Folie 54 Kapitel 11 - Lösungen I 1. In der Studienanfängerstudie 2002/03 wurde gefragt „Wir oft üben Sie die folgenden Freizeitbeschäftigungen aus?“ (Skala 1 (nie) bis 5 (sehr oft)). Die folgende Korrelationsmatrix gibt die bivariaten Korrelationen für vier Beschäftigungen wieder. Korrel ationen Fernsehen Beschäftigung mit Computer Korrelation Signifik anz Korrelation Signifik anz Sport t reiben Korrelation Signifik anz Künstlerisc he A ktivitäten Korrelation Signifik anz Beschäftig ung mit Künstlerisc he Fernsehen Computer Sport t reiben Ak tivitäten nac h Pears on 1 ,414** -,192* -,234** (2-s eitig) , ,000 ,014 ,003 nac h Pears on ,414** 1 -,111 -,140 (2-s eitig) ,000 , ,155 ,072 nac h Pears on (2-s eitig) nac h Pears on (2-s eitig) -,192* ,014 -,234** ,003 -,111 ,155 -,140 ,072 1 , ,017 ,826 ,017 ,826 1 , **. Die Korrelation ist auf dem Niveau von 0,01 (2-seitig) signifikant. *. Die Korrelation ist auf dem Niveau von 0,05 (2-seitig) signifikant. Lösung Aufgabe 1 a) und b) siehe Tabelle Philipps-Universität Marburg Prof. Dr. Udo Kuckartz WS 2004/05 Lösungen Folie 55 Kapitel 11 - Lösungen II 1. c) welche der folgenden Aussagen ist richtig? a) Seltenes Sporttreiben geht mit seltenem Fernsehen einher. b) Häufiges Sporttreiben geht mit seltenem Fernsehen einher. c) Zwischen der Häufigkeit des Sporttreibens und des Fernsehens gibt es keinen Zusammenhang. d) Versuchen Sie die Matrix inhaltlich zu interpretieren, beachten Sie dabei die Höhe der Korrelationen, die Vorzeichen sowie die Signifikanzen! siehe nächste Folie Philipps-Universität Marburg Prof. Dr. Udo Kuckartz WS 2004/05 Lösungen Folie 56 Kapitel 11 – Lösungen III 1. d) Die größte, auf dem 1%-Niveau signifikante, Korrelation besteht zwischen „Fernsehen“ und „Beschäftigung mit dem Computer“ mit r = .414. Studierende, die häufig fernsehen, beschäftigen sich auch häufig mit dem Computer. Alle Korrelationen liegen unter r = .5, wobei zwischen „Fernsehen“ und „Künstlerischen Aktivitäten“ die höchste negative Korrelation mit r = -.234 besteht. Ein weiterer negativer Zusammenhang auf dem 5% Signifikanzniveau mit r =-.192 besteht zwischen „Sport treiben“ und „Fernsehen“. Interessant ist, dass dieser negative Zusammenhang nicht auf „Sport treiben“ und die „Beschäftigung mit dem Computer“ übertragen werden kann. Zwischen „Beschäftigung mit dem Computer“ und „Sport treiben“ und „Beschäftigung mit dem Computer“ und „Künstlerische Aktivitäten“ sowie zwischen „Sport treiben“ und „Künstlerische Aktivitäten“ besteht jeweils kein Zusammenhang. Bei den negativen Zusammenhängen können „je mehr, desto weniger“ – und bei den positiven Zusammenhänge „je mehr, desto mehr“ – Aussagen getroffen werden. Philipps-Universität Marburg Prof. Dr. Udo Kuckartz WS 2004/05 Lösungen Folie 57 Kapitel 11 - Lösungen IV 2. Die Korrelationsanalyse mit dem Korrelationskoeffizienten r (Pearson) besteht aus 7 Schritten (Entscheidung für oder gegen H1 soll getroffen werden können). Schreiben sie diese Schritte in der richtigen Reihenfolge auf! a) Mittelwerte von x und y bestimmen b) Standardabweichung von x und y bestimmen c) Kovarianz bestimmen d) Korrelationskoeffizient r bestimmen e) Prüfgröße t bestimmen. f) Vergleich der Prüfgröße mit dem kritischen t-Wert der Tabelle g) Entscheidung Nullhypothese oder Alternativhypothese Philipps-Universität Marburg Prof. Dr. Udo Kuckartz WS 2004/05 Lösungen Folie 58 Kapitel 11 - Lösungen V 3. Berechnen Sie die Kovarianz zwischen den Merkmalen x (Anzahl der richtigen Lösungen in Test A) und y (Anzahl der richtigen Lösungen in Test B)! X 18 20 22 24 x 21 Y 27 30 33 32 x-xquer -3 -1 1 3 y 30,5 y-yquer -3,5 -0,5 2,5 1,5 x-xquer *y-yquer 10,5 0,5 2,5 4,5 Summe = 18 cov(x,y) = 18/4 = 4,5 Philipps-Universität Marburg Prof. Dr. Udo Kuckartz WS 2004/05 Lösungen Folie 59 Kapitel 12 - Lösungen I 1. Was ist der Unterschied zwischen den Korrelationskoeffizienten nach Spearman und nach Pearson? Spearmans rho wird ab ordinalskalierten Daten eingesetzt, Pearsons r ab intervallskalierten Daten. 2. Schreiben Sie alle Korrelationskoeffizienten auf, die sie kennen! Spearmans rho, Pearsons r, Cramers V, Phi-Koeffizient, Kontingenzkoeffizient C 3. Wann spricht man von einer geringen, einer mittleren bzw. hohen Korrelation? 0,1 - geringe Korrelation 0,3 - mittlere Korrelation 0,5 - hohe Korrelation Mit dem Signifikanzwert hängen sie durch das Bilden der Prüfgröße t zusammen. Je höher die Korrelation, umso eher besteht die Chance ein signifikantes Ergebnis zu erzielen. Philipps-Universität Marburg Prof. Dr. Udo Kuckartz WS 2004/05 Lösungen Folie 60 Kapitel 12 - Lösungen II 4. Die StudentInnen der Vorlesung „Einführung in die sozialwissenschaftliche Statistik“ wurden nach ihrer persönlichen Einschätzung zu verschiedenen Berufsgruppen befragt. Hier sind die Rangreihenfolgen von zwei der befragten Personen: Rangplatzdiff.² 3 2 9 8 5 10 4 6 Rangplatzdiff . 2 9 6 6 1 5 8 0 7 12 11 1 0 4 2 9 0 16 4 81 Berufsgruppe Person 1 Person 2 Arzt Dipl.-Päd. Dipl.-Pol. Dipl.-Psych. Soz.Päd. (FH) Dipl.-Soz. Erzieher Lehrer Gr/Mittelstufe Lehrer Oberst Pfarrer Anwalt Soz.Arbeiter 1 11 3 2 4 5 12 6 7 8 9 10 Philipps-Universität Marburg Prof. Dr. Udo Kuckartz WS 2004/05 4 81 36 36 1 25 64 0 Lösungen Folie 61 Kapitel 12 - Lösungen III 4. Fortsetzung: Berechnen Sie den Rangkorrelationskoeffizienten nach Spearman! n 6 rho 1 di2 i 1 n (n² 1) 1 6 348 2088 1 1 1,22 = - 0,22 12 (144 1) 1716 Und interpretieren Sie das Ergebnis! Es liegt eine geringe, negative Korrelation vor. Das heißt, dass die Berufe, die von Person 1 höher eingeschätzt wurden von Person 2 eher niedriger eingeschätzt wurden und umgekehrt (welcher Beruf bei Person 2 einen hohen Stellenwert hatte, der hat bei Person 1 einen niedrigeren). Philipps-Universität Marburg Prof. Dr. Udo Kuckartz WS 2004/05 Lösungen Folie 62 Kapitel 12 - Lösungen IV 5. In historischen Statistiken lässt sich nachverfolgen, dass die Zahl der in einem Jahr gezählten Störche und die Zahl der Geburten miteinander korrelieren. Ist damit bewiesen, dass die Klapperstörche die Kinder bringen? Falls nein, warum nicht? Korrelationen können niemals Aussagen über Kausalitäten, also über Ursache und Wirkungen treffen. Mit Korrelationen kann man lediglich die Höhe eines Zusammenhangs zwischen zwei Variablen feststellen. Die Abnahme der Geburten sowie die Abnahme der Störche ist z.B. auf die steigende Umweltbelastung zurückzuführen, die sich auf beide Variablen negativ auswirkt. Philipps-Universität Marburg Prof. Dr. Udo Kuckartz WS 2004/05 Lösungen Folie 63 Kapitel 12 - Lösungen V 6. Empirische Studien zeigen immer wieder, dass Frauen ein geringeres Umweltwissen als Männer besitzen. Was könnte die Ursache sein? Hier können verschiedene Gründe angeführt werden, die aber alle noch empirisch überprüft werden müssten. Möglichkeiten: Drittvariable Bildung: Männer haben im Bevölkerungsdurchschnitt eine höhere Bildung, also auch ein höheres Umweltwissen. Die Art des Testes könnte eine Rolle spielen: Häufig wird Umweltwissen mit naturwissenschaftlichen Items erfragt/operationalisiert, hier schneiden Männer üblicherweise besser ab. Philipps-Universität Marburg Prof. Dr. Udo Kuckartz WS 2004/05 Lösungen Folie 64 Kapitel 12 - Lösungen VI 7. Tragen Sie ein, welcher Korrelationskoeffizient in Abhängigkeit vom Skalenniveau der Daten berechnet werden darf! Skalenniveaus Nominalskala Ordinalskala Intervallskala Phi-Koeffizient Zulässig Zulässig Zulässig Cramers V Zulässig Zulässig Zulässig Kontingenzkoeffizient Zulässig Zulässig Zulässig Spearman’s Rho NICHT zulässig Zulässig Zulässig Pearson’s r NICHT zulässig NICHT zulässig Zulässig KorrelationsKoeffizienten Philipps-Universität Marburg Prof. Dr. Udo Kuckartz WS 2004/05 Lösungen Folie 65 Kapitel 12 - Lösungen VII 8. Was wäre der adäquate Korrelationskoeffizient? Merkmal X nominalskaliert intervallskaliert intervallskaliert Philipps-Universität Marburg Merkmal Y nominalskaliert intervallskaliert ordinalskaliert Prof. Dr. Udo Kuckartz Korrelationskoeffizient Cramer’s V Pearsons r Rangkorrelation Spearman WS 2004/05 Lösungen Folie 66 Kapitel 13 - Lösungen I 1. Cronbachs Koeffizient Alpha ist ein Maß: a) für die Trennschärfe von Items b) für den Zusammenhang zweier Items c) für die Reliabilität einer Skala 2. Eine Skala ist: a) ein Messinstrument b) eine Sammlung von Variablen c) ein Koeffizient für den Zusammenhang zweier intervallskalierter Variablen 3. Wie kann man eine Skala gegebenenfalls verbessern? Items mit niedriger Trennschärfe aus der Skala entfernen. Evtl. Items neu formulieren. Evtl. Items hinzunehmen. Philipps-Universität Marburg Prof. Dr. Udo Kuckartz WS 2004/05 Lösungen Folie 67 Kapitel 13 - Lösungen II 4. Zur Messung des räumlichen Vorstellungsvermögens von Studierenden wurden zwei Skalen entwickelt. Skala A weist einen Reliabilitätskoeffizient Alpha=.52 auf, Skala B einen Koeffizienten Alpha = .77. Welche Skala ist besser geeignet? a) Skala A b) Skala B c) beide gleich gut d) beide sind nicht geeignet 5. Wie wird bei der Likert-Skala der Gesamtpunktwert der Probanden berechnet? a) durch Ordnen der Items nach Schwierigkeit und Zuordnung der Personen zu dieser Rangskala b) durch Summierung der Messwerte der einzelnen Items c) durch Bildung des Mittelwertes der trennschärfsten Items Philipps-Universität Marburg Prof. Dr. Udo Kuckartz WS 2004/05 Lösungen Folie 68 Kapitel 14 - Lösungen I 1. Was bedeutet die Signifikanz des F-Wertes bei der Varianzanalyse? a) Die Wahrscheinlichkeit für das zufällige Zustandekommen des Ergebnisses b) Die Wahrscheinlichkeit für die Geltung der H1 c) Die Wahrscheinlichkeit für die Wirkung des Treatments 2. Geben sie die sechs Schritte der Varianzanalyse an: a) Bestimmung der QS total (Gesamtsumme der Abweichungsquadrate) b) Bestimmung der QS treatment und der Treatment-Varianz c) Bestimmung der QS fehler und der Varianz des Fehlers d) Bildung der Prüßgröße F e) Wahl des Signifikanzniveaus, Vergleich des empirischen F-Wertes mit dem kritischen F-Wert der Tabelle f) Entscheidung für Null- und Alternativhypothese Philipps-Universität Marburg Prof. Dr. Udo Kuckartz WS 2004/05 Lösungen Folie 69 Kapitel 14 - Lösungen II 3. Die Varianzanalyse will: a) den Zusammenhang zwischen zwei nominalskalierten Daten untersuchen. b) die Varianz einer abhängigen Variablen durch unabhängige Variable(n) erklären. c) den Mittelwert einer Stichprobe mit dem Mittelwert der Grundgesamtheit vergleichen. d) die Varianz einer Variablen bestimmen. 4. Welches Skalenniveau muss die abhängige Variable bei der Varianzanalyse besitzen? a) spielt keine Rolle b) Nominalskalenniveau c) Intervallskalenniveau d) Ordinalskalenniveau Philipps-Universität Marburg Prof. Dr. Udo Kuckartz WS 2004/05 Lösungen Folie 70 Kapitel 14 - Lösungen III 5. Es wurde eine einfaktorielle Varianzanalyse durchgeführt mit der abhängigen Variable Umweltbewusstsein und der unabhängigen Variable Bildung. Das Umweltbewusstsein wurde mittels einer aus 14 Items bestehenden Skala gemessen: Je höher der Skalenwert ist, desto höher ist das Umweltbewusstsein. Es wurden drei Stufen des Bildungsniveaus unterschieden: niedrig, mittel und hoch. Interpretieren Sie die folgenden, von SPSS berechneten Ergebnisse dieser Analyse. Hat Bildung einen Einfluss auf das Umweltbewusstsein? Wenn ja, in welcher Weise? Deskriptive Statistik Gesamtskala Umweltbewus stsein N niedrig mittel hoch Gesamt 636 631 647 1914 Mittelwert 50,0267 51,5087 52,0927 51,2137 Philipps-Universität Marburg Standardab weichung 6,6825 6,8310 6,8825 6,8516 Standardf ehler ,2650 ,2719 ,2706 ,1566 Prof. Dr. Udo Kuckartz 95%-Konfidenzintervall für den Mittelwert Untergrenze Obergrenze 49,5064 50,5471 50,9747 52,0427 51,5614 52,6241 50,9065 51,5208 WS 2004/05 Minimum 24,00 27,00 29,00 24,00 Lösungen Maximum 70,00 68,00 70,00 70,00 Folie 71 Kapitel 14 - Lösungen IV 5. Fortsetzung ANOVA Gesamtskala Umweltbewus stsein Quadrats umme Zwischen den Gruppen 1450,918 Innerhalb der Gruppen 88354, 684 Gesamt 89805, 601 df 2 1911 1913 Mittel der Quadrate 725,459 46,235 F 15,691 Signifik anz ,000 Das Ergebnis ist signifikant (F=15,69, p=.000), d.h. die Gruppen unterscheiden sich: Bildung hat einen Effekt auf das Umweltbewusstsein. Dieses steigt mit dem Bildungsniveau an, die erste Gruppe „Bildung niedrig“ weist durchschnittlich das geringste Umweltbewusstsein auf (Skalenmittelwert = 50,0), die Gruppe mit dem höchsten Bildungsniveau zeigt sich im Mittel am umweltbewusstesten (Skalenmittelwert 52,1). Mit zwei Skalenpunkten sind die Unterschiede allerdings nicht sehr groß. Philipps-Universität Marburg Prof. Dr. Udo Kuckartz WS 2004/05 Lösungen Folie 72 Kapitel 14 - Lösungen V 6. Berechnen einer Varianzanalyse: Je 10 Schüler werden zufällig auf drei verschiedene Lernmethoden des Englischunterrichts verteilt. Nach 10 Unterrichtsstunden wird ein Englisch-Test geschrieben. Die Fehler, die die SchülerInnen gemacht haben, sind in der unten stehenden Tabelle wiedergegeben. Berechnen Sie eine Varianzanalyse! Unterschieden sich die Gruppen signifikant? Gruppe 1 22 24 23 21 25 25 21 21 24 24 Mittelwert A1=23 Philipps-Universität Marburg Gruppe 2 24 26 20 26 27 26 25 26 23 27 Mittelwert A2=25 Prof. Dr. Udo Kuckartz Gruppe 3 22 27 29 25 26 28 23 24 30 26 Mittelwert A1=26 WS 2004/05 Lösungen Folie 73 Kapitel 14 - Lösungen VI 6. Fortsetzung Gesamtmittelwert= 24,66 Berechnen Sie zunächst die Fehlerquadratsumme QS Fehler= 126 und die Fehlervarianz (df hier= 27) = 126/27= 4,66 Berechnen Sie nun die Treatmentquadratsummer QS Treat=10*(2324,66)²+10*(25-24,66)²+10*(26-24,66)² = 46,66 und die Treatmentvarianz (df hier = 2)= 46,66/2=23,33 Bilden Sie nun die Prüfgröße F= Treatment var ianz Fehler var ianz = 23,33 / 4,66= 5 Der kritische F-Wert für 2 Zählerfreiheitsgrade, 27 Nennerfreiheitsgrade und 5% Irrtumswahrscheinlichkeit lautet 3,35. Treffen Sie die Entscheidung Nullhypothese versus Alternativhypothese! Da der kritische F-Wert der Tabelle unter dem berechneten F-Wert bleibt, wird die H0 verworfen und die H1 angenommen. Philipps-Universität Marburg Prof. Dr. Udo Kuckartz WS 2004/05 Lösungen Folie 74