Lösungen Reader - Uni

Werbung
Statistik für die Erziehungswissenschaft
Lösungen zu allen Übungsteilen aus dem
Reader
WS 2006/07
Philipps-Universität Marburg
Prof. Dr. Udo Kuckartz
WS 2004/05
Lösungen
Folie 1
Kapitel 1 - Lösungen I
1.
Was steht am Anfang jedes Forschungsprojektes?
Problemwahl, Forschungsfrage
2.
Was ist empirische Sozialforschung?
Systematische (= nach Regeln) Erfassung und Deutung sozialer
Tatbestände (= beobachtbares, menschliches Verhalten, von Menschen
geschaffene Gegenstände sowie durch Sprache vermittelte Meinungen,
Informationen über Erfahrungen, Einstellungen, Werturteile, Absichten
u.a.m.).
empirisch = erfahrungsgemäß, bzw. theoretisch formulierte Annahmen,
die an spezifischen Wirklichkeiten überprüft werden
3.
Wodurch unterscheidet sich empirische Forschung von
Alltagsbeobachtungen?
Wissenschaft geht systematisch und methodisch kontrolliert vor.
Wissenschaftliche Aussagen erheben den Anspruch, objektiv und
replizierbar zu sein.
Philipps-Universität Marburg
Prof. Dr. Udo Kuckartz
WS 2004/05
Lösungen
Folie 2
Kapitel 1 - Lösungen II
4.
Für welche Form der Definition gilt die folgende Aussage: „Solche
Definitionen können weder wahr noch falsch sein.“
 a) Nominaldefinition
 b) Realdefinition
5.
Was ist eine Hypothese?
 a) eine Behauptung, die sich auf subjektiver Erfahrung
begründet
 b) eine allgemeine Aussage über Zusammenhänge
zweier Variablen
 c) eine wissenschaftliche Aussage mit Anspruch auf
Richtigkeit
Philipps-Universität Marburg
Prof. Dr. Udo Kuckartz
WS 2004/05
Lösungen
Folie 3
Kapitel 1 - Lösungen III
6.
Erläutern sie den Unterschied zwischen einer unabhängigen und
einer abhängigen Variable!
Eine unabhängige Variable kann im Design der Forschungsfrage
durch den Versuchsleiter beeinflusst werden. Die abhängige
Variable wird in Abhängigkeit von der unabhängigen Variable
untersucht und mit dieser in Zusammenhang gebracht.
6b. In einem Experiment wird untersucht, inwiefern sich überhöhter
Kaffeegenuss auf die Nervosität auswirkt. Was ist in diesem
Setting die unabhängige, was die abhängige Variable?
unabhängige Variable: Kaffeegenuss
abhängige Variable: Nervosität
Philipps-Universität Marburg
Prof. Dr. Udo Kuckartz
WS 2004/05
Lösungen
Folie 4
Kapitel 1 - Lösungen IV
7.
Was bedeutet „Falsifikationsprinzip“?
 a) Aussagen werden überprüft und bewahrheitet.
 b) Aussagen werden überprüft und gegebenenfalls widerlegt,
können aber nicht bewahrheitet werden.
 c) Aussagen werden überprüft und unabhängig von dem
Ergebnis als wahr angenommen.
Philipps-Universität Marburg
Prof. Dr. Udo Kuckartz
WS 2004/05
Lösungen
Folie 5
Kapitel 2 – Lösungen I
1.
Formulieren Sie zwei, mit den Mitteln der Statistik überprüfbare
Hypothesen!
Je häufiger die Menschen Actionfilme gucken, desto aggressiver
sind sie.
Frauen wählen das Studienfach Pädagogik häufiger als Männer.
2.
Angenommen, Sie haben ein neues Instrument (Fragebogen)
entwickelt. Was müssen Sie vor der Hauptuntersuchung
unbedingt durchführen?
Vortest
3.
Nennen Sie ein Beispiel für problembezogene pädagogische
Forschung!
Medienkonsum in Bezug auf die Herkunft
Philipps-Universität Marburg
Prof. Dr. Udo Kuckartz
WS 2004/05
Lösungen
Folie 6
Kapitel 2 – Lösungen II
4. Welche schriftlichen, für die Öffentlichkeit bestimmten
Ergebnisse werden im Verlauf eines
Forschungsprojektes üblicherweise produziert?
Forschungsbericht
5. Nennen Sie Beispiele für Daten der Bildungsstatistik!
Pisa - Studie
Shell - Jugendstudie
Philipps-Universität Marburg
Prof. Dr. Udo Kuckartz
WS 2004/05
Lösungen
Folie 7
Kapitel 2 – Lösungen III
6.
Bringen Sie die folgenden Bestandteile des Forschungsprozesses in die
richtige Reihenfolge: Vercodung der Daten, Auswahlplan,
Ergebnisbewertung, Pretest!
Auswahlplan, Pretest, Vercodung der Daten, Ergebnisbewertung
7.
Bringen Sie die Phasen des Forschungsprozesses in die richtige
Reihenfolge!
A) Analysephase
B) Definitionsphase
C) Disseminationsphase
D) Durchführungsphase
Reihenfolge: BDAC
Philipps-Universität Marburg
Prof. Dr. Udo Kuckartz
WS 2004/05
Lösungen
Folie 8
Kapitel 3 - Lösungen I
1.
Nennen Sie mindestens drei verschiedene Forschungsdesigns!
Querschnittuntersuchungen
Längsschnittuntersuchungen
prospektive / retrospektive Studien
experimentelle Untersuchungen
quasiexperimentelle Untersuchungen
2.
Wie viele Messzeitpunkte hat eine Längsschnittstudie mindestens?
Sie muss mindestens zwei Messzeitpunkte haben.
3.
Was ist der Unterschied zwischen einer Panelstudie und einer
Trendanalyse und was ihre Gemeinsamkeit?
Eine Panelstudie befragt die gleichen Personen zu unterschiedlichen
Zeitpunkten und eine Trendanalyse befragt unterschiedliche Personen
zu unterschiedlichen Zeitpunkten.
Bei beiden Designs handelt es sich um Längsschnittuntersuchungen.
Philipps-Universität Marburg
Prof. Dr. Udo Kuckartz
WS 2004/05
Lösungen
Folie 9
Kapitel 3 - Lösungen II
4.
In einer experimentellen Untersuchung wird gewöhnlich eine
Gruppe von Probanden gebildet, die nicht dem Treatment
ausgesetzt werden. Wie bezeichnet man diese Gruppe?
 a) Doppel-Blind-Gruppe
 b) Versuchsgruppe
 c) Kontrollgruppe
5.
Beschreiben Sie den Aufbau eines Doppel-Blind-Versuchs!
Weder das wissenschaftliche Personal, das die Versuche
durchführt, noch die Versuchspersonen wissen, wer zur
Versuchs- und wer zur Kontrollgruppe gehört.
Philipps-Universität Marburg
Prof. Dr. Udo Kuckartz
WS 2004/05
Lösungen
Folie 10
Kapitel 3 - Lösungen III
6.
Versuchen sie, mindestens zwei Indikatoren zu benennen für:
- Verwahrlosung: Wohnungssituation, Bindungsverhalten
- Medieneinsatz in Seminaren: Beamereinsatz, Flipchartbenutzung
- Aufmerksamkeit von StudentInnen: Gesichtausdruck, Beteiligung
- gesunde Lebensweise: regelmäßige sportliche Betätigung,
Essverhalten
7.
Betrachten sie die folgende Aussage: „Im weitesten Sinne ist Messen die
Zuordnung von Zahlen zu Objekten / Ereignissen anhand bestimmter
Regeln.“
Welcher Begriff dieser Aussage beschreibt das empirische Relativ?
 a) Objekte / Ereignisse
 b) bestimmte Regeln
 c) Zahlen
Philipps-Universität Marburg
Prof. Dr. Udo Kuckartz
WS 2004/05
Lösungen
Folie 11
Kapitel 3 - Lösungen IV
8.
Welches Gütekriterium wird durch die folgende Definition
beschrieben: „??? bezeichnet die Gültigkeit eines
Messinstruments. Dies ist der Fall, wenn die Indikatoren
tatsächlich den Sachverhalt messen, der mit dem definierten
Begriff bezeichnet worden ist.“
 a) Validität
 b) Objektivität
 c) Relativität
9.
Was versteht man unter Reliabilität?
Reliabilität ist die Reproduzierbarkeit von Ergebnissen unter den
gleichen intersubjektiven Bedingungen, also insbesondere die
Forderung, dass andere Forscher bei Anwendung desselben
Erhebungsinstruments in Interaktion mit demselben
Untersuchungsgegenstand zu demselben Ergebnis gelangen.
Philipps-Universität Marburg
Prof. Dr. Udo Kuckartz
WS 2004/05
Lösungen
Folie 12
Kapitel 3 - Lösungen V
10.
Welche Aussagen sind aufgrund des Skalenniveaus der Daten möglich
bei:
Bsp: Nominalskalenniveau: Gleichheit / Verschiedenheit (= / ≠)
Ordinalskalenniveau: Relationen (= / ≠; < / >)
Intervallskalenniveau: Gleichheit von Differenzen (= / ≠; < / >; + / -)
Verhältnisskalenniveau: Verhältnisaussagen (= / ≠; < / >; + / -; doppelt so
groß, halb so groß o.ä.)
11.
Nennen Sie je zwei Beispiele für nominale, ordinale und intervallskalierte
Merkmale!
nominal: Geschlecht, Religionszugehörigkeit
ordinal: BAT Gehaltsgruppen, Militärrang
intervall: Temperatur (Celsius), Zeugnisnoten
Philipps-Universität Marburg
Prof. Dr. Udo Kuckartz
WS 2004/05
Lösungen
Folie 13
Kapitel 3 - Lösungen VI
12. Um welches Skalenniveau handelt es sich bei den folgenden
Daten: (Auszüge aus Fragebögen zum Ankreuzen)?
a)
Raucher/Nichtraucher
b)
Ich mag Statistik
sehr gerne / gerne / teils-teils / nicht so / gar nicht
Skalenniveau: intervall
c)
Ich mag am liebsten bis am wenigsten (bringen sie die Aussagen
in eine Reihenfolge)
Bücher lesen / Fahrrad fahren / segeln / Radio hören / Kino /
Theater / Fernsehen
Skalenniveau: ordinal
Philipps-Universität Marburg
Prof. Dr. Udo Kuckartz
Skalenniveau: nominal
WS 2004/05
Lösungen
Folie 14
Kapitel 4 – Lösungen I
1.
Man hat 25 Studenten nach der Anzahl der von ihnen gelesenen
Zeitschriften/Periodika befragt und folgende Daten ermittelt:
1,1,1,1,1,1, 2,2,2, 3,3,3,3,3,3, 4,4, 5,5,5,5, 8, 9,9, 10
Erstellen Sie eine Häufigkeitstabelle nach folgendem Muster:
Zeitschriften/Periodika
Gültig
1
2
3
4
5
8
9
10
Gesamt
Philipps-Universität Marburg
Häufigkeit
6
3
6
2
4
1
2
1
25
Prozent
24,0
12,0
24,0
8,0
16,0
4,0
8,0
4,0
100,0
Prof. Dr. Udo Kuckartz
Gültige
Prozente
24,0
12,0
24,0
8,0
16,0
4,0
8,0
4,0
100,0
Kumulierte
Prozente
24,0
36,0
60,0
68,0
84,0
88,0
96,0
100,0
WS 2004/05
Lösungen
Folie 15
Kapitel 4 – Lösungen II
2. Kreuzen Sie an:
wahr
a) Die relative Häufigkeit ist immer größer als die absolute.
falsch
x
b) Rundungsfehler heben sich beim Aufsummieren der relativen Häufigkeiten
gegenseitig auf und es ergeben sich immer 100%.
x
c) Wenn bei einer intervallskalierten Variable der kleinste Wert 10 und der größte 120
ist, beträgt bei 10 Kategorien die Kategorienbreite 12.
x
d) Es macht keinen Sinn, Kategorien bei nominal oder ordinalskalierten Variablen zu
bilden.
x
e) Häufigkeitsverteilungen machen keinen Sinn bei nominalskalierten Variablen.
x
f) Mit Balkendiagrammen lassen sich leichter mehr Kategorien darstellen als mit einem
Astdiagramm.
Philipps-Universität Marburg
Prof. Dr. Udo Kuckartz
WS 2004/05
Lösungen
x

x

Folie 16
Kapitel 4 – Lösungen III
Zeichnen Sie zu folgender Häufigkeitsverteilung, welche die Anzahl der
abonnierten Zeitschrift von 25 Studierenden wiedergibt, ein vertikales
Balkendiagramm!
Häufigkeit
Kategorie Häufigkeit
1
6
2
3
3
6
4
2
5
4
8
1
9
2
10
1
4.
Zeitschriften/Periodika
Zeitschriften/Periodika
10
7
6
8
5
6
4
3
4
2
1
0
1
2
3
4
5
8
9
10
Kategorien
Häufigkeit
3.
2
Std.abw. = 2,71
Mittel = 3,8
N = 25,00
0
2,0
4,0
6,0
8,0
10,0
Kategorien
Erstellen Sie zu den gleichen Daten ein so genanntes Histogramm!
Philipps-Universität Marburg
Prof. Dr. Udo Kuckartz
WS 2004/05
Lösungen
Folie 17
Kapitel 4 – Lösungen IV
5. Wodurch unterscheidet sich das Histogramm vom
Balkendiagramm?
Der wesentliche Unterschied ist die Einteilung der x-Achse:
Während bei einem Balkendiagramm meist nur die vorkommenden
Kategorien abgetragen werden, deckt die Einteilung beim
Histogramm die gesamte Breite zwischen der minimalsten und
maximalsten Kategorie mit gleichen Abständen ab. Ein
Histogramm gibt detaillierte Informationen über die Verteilung der
erhobenen Variablen. Aus einem Balkendiagramm können
detaillierte Informationen über die Häufigkeiten abgelesen werden.
Bei einem Histogramm werden zwecks Übersicht oftmals
Kategorien zusammengefasst. Im obigen Histogramm entstanden
aus den Kategorien 1-2, 3-4, 5-6, 7-8 und 9-10 fünf neue
Kategorien, wobei die jeweiligen Balkenhöhen/Häufigkeiten addiert
wurden.
Philipps-Universität Marburg
Prof. Dr. Udo Kuckartz
WS 2004/05
Lösungen
Folie 18
Kapitel 4 – Lösungen V
6. Bilden Sie Kategorien über die folgenden Daten:
Körpergröße 1,22 m, 1,27m, 1,38m, 1,45m, 1,67m,
1,90m
Es sollen 4 bzw. 2 Kategorien gebildet werden und
dazu jeweils die Häufigkeiten der Kategorie in der
Tabelle aufgeführt werden.
Kategorie Kategorienmitte Häufigkeit
1,22-1,38
1,30
3
Kategorie Kategorienmitte Häufigkeit
1,39-1,55
1,47
1
1,22-1,55
1,38
4
1,56-1,72
1,73-1,90
1,64
1,81
1
1
1,56-1,90
1,72
2
Lösungen
Folie 19
Philipps-Universität Marburg
Prof. Dr. Udo Kuckartz
WS 2004/05
Kapitel 5 – Lösungen I
1.
Kreuzen Sie an, welches Maß der zentralen Tendenz mit den Daten des
jeweiligen Skalenniveaus berechnet werden darf!
Skalenniveaus
Nominalskala
Ordinalskala
Intervallskala
Modalwert / Modus
Zulässig
Zulässig
zulässig
Median
NICHT zulässig
Zulässig
Zulässig
Mittelwert
NICHT zulässig
NICHT zulässig
zulässig
Maße
der zentralen
Tendenz
Philipps-Universität Marburg
Prof. Dr. Udo Kuckartz
WS 2004/05
Lösungen
Folie 20
Kapitel 5 – Lösungen II
2.
Ordnen Sie die Aussagen einem Maß der zentralen Tendenz zu!
a) Modus
b) Median
c) Mittelwert
a)
Der Wert liegt genau in der Mitte aller Werte und teilt somit alle
Daten in zwei Hälften. 50% der Werte liegen unterhalb des
Wertes, 50% der Werte liegen oberhalb dieses Wertes.
a
b
c
Der Wert gibt die numerische Mitte aller Einzelwerte an. Es
müssen nicht notwendigerweise 50% der Daten unter- bzw.
oberhalb dieses Wertes liegen.
a
b
c
Der Wert gibt an, welcher Wert am häufigsten in den Daten
vorkommt.
a
b
c
b)
c)
Philipps-Universität Marburg
Prof. Dr. Udo Kuckartz
WS 2004/05
Lösungen
Folie 21
Kapitel 5 – Lösungen III
3.
Was sagt der Wert des arithmetischen Mittels (Mittelwert) aus, wenn ich
von der Normalverteilung ausgehe?
Ausgehend von der Normalverteilung liegen 50% der Testpersonen über,
und 50% unter dem arithmetischen Mittel (Mittelwert). In diesem Fall
entspricht der Mittelwert dem Median (s. Aufgabe 2, Kapitel 5).
4.
Bei einem kognitiven Test für Kleinkinder (Zusammenlegen eines Puzzles
in einer bestimmten Zeit) seien die Werte normalverteilt, der Mittelwert
betrage 120 Sekunden, die Standardabweichung sei 10 Sek. Wie viele
Messwerte liegen dann zwischen 110 und 130 Sekunden?
 a) etwa 95%
 b) etwa 68%
 c) etwa 50%
 d) etwa 33%
5.
Eine Verteilung, bei der der Modus rechts vom arithmetischen Mittel liegt,
bezeichnet man als ...
 a) symmetrisch
 b) bimodal
 c) rechtssteil
 d) glockenförmig
Philipps-Universität Marburg
Prof. Dr. Udo Kuckartz
WS 2004/05
Lösungen
Folie 22
Kapitel 5 – Lösungen IV
6.
Die folgenden Daten geben an, wie viele richtige Antworten in
einem Test gegeben wurden. Berechnen Sie die Varianz und die
Standardabweichung!
X
18
20
22
24
17
18
20
21
21
x-xquer
-2,11
-0,11
1,89
3,89
-3,11
-2,11
-0,11
0,89
0,89
Philipps-Universität Marburg
(x-xquer)²
4,45
0,01
3,75
15,13
9,67
4,45
0,01
0,79
0,79
= 39,05
N= 9
X  20,11
2
S = 4,34
S = 2,08

Prof. Dr. Udo Kuckartz
WS 2004/05
Lösungen
Folie 23
Kapitel 5 – Lösungen V
6a) Welche Aussagen kann man anhand der berechneten Daten
machen?
Unter Annahme der Normalverteilung der Daten kann man sagen:
Zwischen 18,03 und 22,19 liegen 68% der Werte. Zwischen 15,95
und 24,27 liegen 95% der Werte.
Philipps-Universität Marburg
Prof. Dr. Udo Kuckartz
WS 2004/05
Lösungen
Folie 24
Kapitel 5 – Lösungen VI
7. Folgende Häufigkeitstabelle gibt die Anzahl der abonnierten Zeitschrift im
Monat von 25 Studierenden wieder.
Anzahl der Häufigkeit Bestimmen Sie
Zeitschriften
den Modus (Modalwert)
= 1 und 3
1
6
den Median
=3
2
3
1 1 1 1 1 1 2 2 2 3 3 3 3 3 3 4 4 5 5 5 5 8 9 9 10
3
6
4
2
das arithmetische Mittel
= 94/25 = 3,76
5
4
die Summe aller Abwei8
1
chungen vom Mittelwert
=0
9
2
die Spannweite (Range)
= 10-1 = 9
10
1
die AD-Streuung
= 52,8 / 25 = 2,11
die Varianz
Philipps-Universität Marburg
= 7,06 (n=25)
die Standardabweichung
= 2,66 (n=25)
Prof. Dr. Udo Kuckartz
Lösungen
WS 2004/05
Folie 25
Kapitel 5 – Lösungen VII
8. Andreas hat im Untertest I eines Intelligenztests den Punktwert 70 erreicht
und im Untertest II den Punktwert 8. Das Testmanual weist folgende
Normwerte für die beiden Untertests auf, für beide Untertests liegt
Normalverteilung vor:
Norm für Untertest I: arithm. Mittel = 65, Standardabweichung = 5
Norm für Untertest II: arithm. Mittel = 6, Standardabweichung = 1
a) Hat Andreas in Untertest I oder in Untertest II besser abgeschnitten?
Die Standardisierung mit z-Transformation ergibt folgende Werte:
z(I) = (70-65)/5 = 1
z(II) = (8-6)/1 = 2
Aus z(II) > z(I) folgt, dass Andreas im Untertest II besser abgeschnitten hat.
Philipps-Universität Marburg
Prof. Dr. Udo Kuckartz
WS 2004/05
Lösungen
Folie 26
Kapitel 5 – Lösungen VIII
8b)
Wie hoch ist die Wahrscheinlichkeit für die in den
beiden Untertests erreichten und alle kleineren
Punktwerte? Benutzen Sie zur Lösung die Tabelle
der Normalverteilung!
p(z  2) = 0,9772
p(z  1) = 0,8413
Philipps-Universität Marburg
Prof. Dr. Udo Kuckartz
WS 2004/05
Lösungen
Folie 27
Kapitel 6 - Lösungen I
1.
Wie wahrscheinlich ist es, dass
a) beim Münzwurf 4 mal hintereinander Zahl kommt?
n= 4
k= 4
p= 0,5

P=0,0625
p= 0,5

P=0,1641
p= 0,5

P=0,3750
b) beim Münzwurf bei 7 Würfen 5 mal Kopf zu werfen?
n= 7
k= 5
c) bei 4 Münzwürfen 2 mal Zahl zu werfen?
n= 4
k= 2
d) beim Würfeln von 6 Würfen 3mal hintereinander eine 6 zu bekommen?
n= 6
k= 3
p= 1/6  0,15
P=0,0415

e) beim Würfeln von 5 Würfen 4mal hintereinander eine 1 zu bekommen?
n= 5
k= 4
p= 1/6  0,15

P=0,0022
Benutzen Sie zur Lösung die Tabelle der Binomialverteilung!
Philipps-Universität Marburg
Prof. Dr. Udo Kuckartz
WS 2004/05
Lösungen
Folie 28
Kapitel 6 - Lösungen II
2.
Was ist der Unterschied zwischen der Normalverteilung und der
Standardnormalverteilung?
Die Normalverteilung geht davon aus, dass der Mittelwert genau die Mitte der
Daten abbildet (also 50% der Daten unter- bzw. oberhalb des Mittelwertes liegen).
Bei der Standardnormalverteilung ist dieser Mittelwert genau auf den Wert x
(quer) = 0 festgelegt, die Standardabweichung auf den Wert s = 1. Mit der zTransformation kann jeder beliebige Wert in einen Wert der
Standardnormalverteilung „übersetzt“ (transformiert) werden.
3.
Was bildet die folgende Grafik ab? Eine Normalverteilung oder eine
Standardnormalverteilung? Begründen Sie ihre Antwort!
Da auf der Grafik der Mittelwert nicht mit dem
Wert 0 gekennzeichnet ist, handelt es sich
lediglich um eine beliebige Normalverteilung.
Die Regel, 68% der Werte liegen zwischen -1
bis 1 Standardabweichung (bzw. 95,5% der
Werte zwischen -2 bis 2 Standardabweichungen) gilt für alle Normalverteilungen.
Philipps-Universität Marburg
Prof. Dr. Udo Kuckartz
WS 2004/05
Lösungen
Folie 29
Kapitel 6 - Lösungen III
4.
Was ist ein Elementarereignis?
Ein Elementarereignis ist ein bestimmtes Ereignis, das
bei einem Zufallsexperiment auftreten kann, z.B. beim
Würfeln eine 1 zu würfeln ist ein Elementarereignis.
5.
Was ist der Ereignisraum eines Zufallsexperiments?
Der Ereignisraum eines Zufallsexperiments umfasst
alle möglichen Elementarereignisse, die während des
Experiments eintreten können. Beispielsweise ist das
Elementarereignis, eine 1 zu würfeln nur eins von
sechs möglichen Elementarereignissen. Es wäre auch
möglich eine 2, 3 usw. zu würfeln.
Philipps-Universität Marburg
Prof. Dr. Udo Kuckartz
WS 2004/05
Lösungen
Folie 30
Kapitel 6 - Lösungen IV
7.
Andreas hat im Untertest I eines Intelligenztests den Punktwert 70 erreicht und im
Untertest II den Punktwert 8. Das Testmanual weist folgende Normwerte für die
beiden Untertests auf, für beide Untertests liegt Normalverteilung vor:
Norm für Untertest I: arithm. Mittel = 65
Standardabweichung = 5
Norm für Untertest II: arithm. Mittel = 6
Standardabweichung = 1
a) Hat Andreas in Untertest I oder in Untertest II besser abgeschnitten?
Die Standardisierung mit z-Transformation ergibt folgende Werte:
z(I) = (70-65)/5 = 1
z(II) = (8-6)/1 = 2
Aus z(II) > z(I) folgt, dass Andreas im Untertest II besser abgeschnitten hat.
b) Wie hoch ist die Wahrscheinlichkeit für die in den beiden Untertests erreichten
und alle kleineren Punktwerte? Benutzen Sie zur Lösung die Tabelle der
Normalverteilung.
P (z  2) = 0,9772
p (z  1) = 0,8413
Philipps-Universität Marburg
Prof. Dr. Udo Kuckartz
WS 2004/05
Lösungen
Folie 31
Kapitel 7 - Lösungen I
1.
Formulieren Sie eine Alternativ- und eine Nullhypothese mit folgenden Variablen:
a) Geschlecht und Computernutzung (ungerichtet)
H 0:
Männer und Frauen unterscheiden sich nicht in ihrer Häufigkeit, den Computer zu
nutzen.
H1: Männer und Frauen unterscheiden sich in ihrer Häufigkeit, den Computer zu
nutzen.
b) Schulabschluss und Umweltbewusstsein (gerichtet)
H0: Menschen mit einem hohen Schulabschluss verhalten sich genauso oder
weniger umweltbewusst wie Menschen mit einem niedrigen Schulabschluss.
H1: Menschen mit einem hohen Schulabschluss verhalten sich umweltbewusster
wie Menschen mit einem niedrigen Schulabschluss.
Philipps-Universität Marburg
Prof. Dr. Udo Kuckartz
WS 2004/05
Lösungen
Folie 32
Kapitel 7 - Lösungen II
2. Was ist der Unterschied zwischen einer gerichteten und
einer ungerichteten Hypothese?
Eine gerichtete Hypothese gibt bereits die Richtung des
Unterschieds/Zusammenhangs an, z.B. Männer wählen
eher Pädagogik als Studienfach als Frauen.
Ungerichtete Hypothesen geben keine Richtung des
Unterschieds/Zusammenhangs an, z.B. Männer und
Frauen unterscheiden sich in ihrer Entscheidung,
Pädagogik als Studienfach zu wählen.
Philipps-Universität Marburg
Prof. Dr. Udo Kuckartz
WS 2004/05
Lösungen
Folie 33
Kapitel 7 - Lösungen III
3.
Wie ist die Nullhypothese grundsätzlich formuliert?
Es ist immer die Hypothese, die von keinem
Unterschied/Zusammenhang zwischen den
untersuchten Variablen ausgeht oder (bei
gerichteten Hypothesen) von keinem
Unterschied/Zusammenhang UND der anderen
Richtung des Unterschieds/Zusammenhangs als die
Alternativhypothese.
Philipps-Universität Marburg
Prof. Dr. Udo Kuckartz
WS 2004/05
Lösungen
Folie 34
Kapitel 7 - Lösungen IV
4.
Was ist die Irrtumswahrscheinlichkeit?




5.
a) die Wahrscheinlichkeit, mit einer Entscheidung für die Alternativhypothese
(aufgrund der Stichprobe) zu irren, da in der Population die Nullhypothese gilt.
b) die Wahrscheinlichkeit, mit einer Entscheidung für die Nullhypothese zu
irren, da in der Population die Alternativhypothese gilt.
c) die Wahrscheinlichkeit, dass die Nullhypothese zutrifft (in der Population).
d) die Wahrscheinlichkeit, dass die Alternativhypothese zutrifft (in der
Population).
Warum ist die Nullhypothese so wichtig?
Bevor die Ergebnisse einer Untersuchung vorliegen, gilt immer die Nullhypothese.
Sie ist somit die Forschungsbasis. Im Verlauf der Studie kann auch lediglich die
Wahrscheinlichkeit minimiert werden, dass die Nullhypothese zutrifft und somit die
Alternativhypothese gilt.
Philipps-Universität Marburg
Prof. Dr. Udo Kuckartz
WS 2004/05
Lösungen
Folie 35
Kapitel 7 - Lösungen V
6.
In der Forschung können Fehler begangen werden, die möglichst
vermieden werden sollten.
Einen α-Fehler begeht man, wenn
 man sich aufgrund der Stichprobe für die H0 entscheidet,
obwohl in der Population die H1 gilt.
 man sich aufgrund der Population für eine zu große
Stichprobe entscheidet.
 man sich aufgrund der Stichprobe für die H1 entscheidet,
obwohl in der Population die H0 gilt.
 man sich aufgrund der Stichprobe für eine zu große
Population entscheidet.
6a)
Die Irrtumswahrscheinlichkeit ist somit die Wahrscheinlichkeit,
einen α-Fehler zu begehen.
wahr 
falsch 
Philipps-Universität Marburg
Prof. Dr. Udo Kuckartz
WS 2004/05
Lösungen
Folie 36
Kapitel 7 - Lösungen VI
7.
Welche Signifikanzniveaus werden in der Statistik
üblicherweise verwendet?
 a) das 5%- und das 1%-Niveau
 b) das 95%- und das 99%-Niveau
 c) das 0,5%- und das 0,1%-Niveau
8.
Was sagen die %-Zahlen des Signifikanzniveaus aus?
 sie geben die Irrtumswahrscheinlichkeit an.
 sie geben den Anteil der Leute an, die in der Studie
falsche Antworten gegeben haben.
 sie geben den Prozentsatz an, zu dem das Ergebnis
signifikant (=bedeutend) ist.
Philipps-Universität Marburg
Prof. Dr. Udo Kuckartz
WS 2004/05
Lösungen
Folie 37
Kapitel 8 - Lösungen I
1.
Der T-Test dient (richtige Lösung bitte ankreuzen):
 a) zum Testen eines Stichprobenmittelwertes auf Abweichungen von
der Grundgesamtheit.
 b) zum Testen von Unterschieden von Stichprobenmittelwerten.
 c) zum Testen der Güte von Getränken (Tee, Kaffee etc.).
2.
Lesen Sie die Werte in der Tabelle ab!
Welcher t-Wert ist zu überschreiten für:
df=12 5% Niveau einseitige Fragestellung
Das einseitige 5% Niveau entspricht der Wahrscheinlichkeit (Fläche
unter der t-Kurve):
p = 1- = 1-0.05 = 0.95
t (df=12, p=0.95) = 1,782
Philipps-Universität Marburg
Prof. Dr. Udo Kuckartz
WS 2004/05
Lösungen
Folie 38
Kapitel 8 – Lösungen II
2.
Fortsetzung
df=12 5% Niveau zweiseitige Fragestellung
Das zweiseitige 5% Niveau entspricht
p = 1-/2 = 1-0.025 = 0.975
t (df=12, p=0.975) = 2,179
df=20 1% Niveau einseitige Fragestellung
t (df=20, p=0.99) = 2,528
df=29 1% Niveau zweiseitige Fragestellung
t (df=29, p=0.995) = 2,756
Philipps-Universität Marburg
Prof. Dr. Udo Kuckartz
WS 2004/05
Lösungen
Folie 39
Kapitel 8 – Lösungen III
3.
In der Studentenstudie 2000 ergaben sich folgende Altersmittelwerte
von Männern und Frauen:
Gruppenstatistike n
Alt er
Geschlecht
weiblic h
männlich
N
100
19
Mittelwert
21,94
22,42
St andardab
weichung
4,64
2,81
St andardfe
hler des
Mittelwertes
,46
,65
Mit einem t-Test wurde überprüft, ob sich Männer und Frauen bezüglich ihres
Alters unterscheiden.
a) Formulieren Sie eine geeignete ungerichtete Alternativhypothese!
H0: Männliche und weibliche Besucher der Statistik-VL unterscheiden sich in
ihrem Durchschnittsalter.
H1: Männliche und weibliche Besucher der Statistik-VL unterscheiden sich nicht
in ihrem Durchschnittsalter.
Philipps-Universität Marburg
Prof. Dr. Udo Kuckartz
WS 2004/05
Lösungen
Folie 40
Kapitel 8 – Lösungen IV
3.
b) Formulieren Sie eine geeignete gerichtete Alternativhypothese!
H1: Männliche Besucher der Statistik-VL sind durchschnittlich älter als
weibliche.
c) Es ergab sich eine 2-seituge Irrtumswahrscheinlichkeit von p= 0,664.
Spricht die Irrtumswahrscheinlichkeit von p=0,664 für oder gegen die
Alternativhypothese? Was bedeutet das inhaltlich?
Das spricht eindeutig für die Nullhypothese, weil die
Irrtumswahrscheinlichkeit 66,4% größer als 5% ist. Also
unterscheiden sich die Studenten nicht signifikant von den
Studentinnen, welche die Statistik-VL besuchen, hinsichtlich ihres
Alters.
d) Wie groß darf grundsätzlich die Irrtumswahrscheinlichkeit p höchstens
sein, damit Sie ein hochsignifikantes Ergebnis erhalten?
p muss kleiner als 1% sein.
Philipps-Universität Marburg
Prof. Dr. Udo Kuckartz
WS 2004/05
Lösungen
Folie 41
Kapitel 8 – Lösungen V
4.
Sie haben in einer Studie mit zwei Gruppen zu je 21 Probanden eine Prüfgröße t
von 2,2 ermittelt. Nun schlagen Sie in der Tabelle nach und entnehmen dieser für
df=40 auf dem 5% Niveau einen Wert von 1,68. Entscheiden Sie sich
a) bei einseitiger Fragestellung für die Alternativhypothese oder für die
Nullhypothese?
Für die Alternativhypothese, weil der empirisch in der Studie gewonnene Wert von
2,2 größer ist als der zugehörige kritische t-Wert von 1,68.
b) bei zweiseitiger Fragestellung für die Alternativhypothese oder für die
Nullhypothese?
Für den t-Wert ergibt sich bei 2-seitiger Fragestellung statt 1,68 der neue Wert
t (df=40, p=0.975) = 2,021
=> Auch für die Alternativhypothese, weil der empirisch in der Studie gewonnene
Wert von 2,2 immer noch höher ist als 2,021.
Philipps-Universität Marburg
Prof. Dr. Udo Kuckartz
WS 2004/05
Lösungen
Folie 42
Kapitel 8 – Lösungen VI
4.
c) Was bedeutet das Ergebnis inhaltlich? (bitte für beide Fälle
formulieren)
Bei einer Entscheidung für die Alternativhypothese liegt ein auf dem 5%Niveau signifikanter Unterschied der beiden Gruppen vor.
Bei einer Entscheidung für die Nullhypothese lässt sich ein signifikanter
Unterschied zwischen den Gruppen nicht feststellen.
5.
Bringen Sie die Schritte des t-Testes in die richtige Reihenfolge
a) Mittelwerte und Varianzen der beiden Variablen berechnen
b) Kritischen t-Wert für (, df) ermitteln
c) Prüfgröße t berechnen
d) Vergleich der Prüfgröße t mit dem Tabellenwert:
wenn t < t,df, dann Beibehaltung der H0
e) Standardfehler der Differenz berechnen
f) Anzahl der Freiheitsgrade ermitteln
Reihenfolge:____a) e) c) f) b) d)______________
Philipps-Universität Marburg
Prof. Dr. Udo Kuckartz
WS 2004/05
Lösungen
Folie 43
Kapitel 9 - Lösungen I
1.
Mit Daten auf welchem Skalenniveau kann man den Chi-Quadrat-Test
durchführen?
Der Chi-Quadrat-Test kann mit Daten ab Nominalskalen-Niveau (also
auch mit ordinal- und intervallskalierten Daten) durchgeführt werden.
2.
In einer Vorlesung der Pädagogik mit 105 Teilnehmenden ermitteln Sie
folgende Verteilung der Geschlechter:
weiblich
männlich
Gesamt
Häufigkeit Erwartet
52,5
80
52,5
25
105
Untersuchen Sie mittels eines Chi-Quadrat-Testes, ob diese
Teilnehmerzusammensetzung mit der Annahme einer Gleichverteilung der
Geschlechter (50:50) vereinbar ist! Wählen Sie das 5% Signifikanzniveau,
berechnen Sie die erwarteten Häufigkeiten und Chi-Quadrat!
Philipps-Universität Marburg
Prof. Dr. Udo Kuckartz
WS 2004/05
Lösungen
Folie 44
Kapitel 9 - Lösungen II
2.
Lösungsweg bitte hier aufschreiben:
Chi-Quadrat (empirisch) = [ (80-52,5)² + (25-52,5)² ] : 52,5
= [ 27,5² + 27,5² ] : 52,5
= 1512,5 : 52,5
= 28,8
> Chi-Quadrat (df=1, 0.95) = 3,84
=> signifikantes Ergebnis; die Teilnehmerzusammensetzung ist nicht mit
einer Gleichverteilung vereinbar
3.
Angenommen Sie hätten für eine Vierfeldertafel den empirischen ChiQuadrat-Wert berechnet. Dieser sei größer als der Chi-Quadrat-Wert, den
Sie für das 5% Niveau und die entsprechende Zahl von Freiheitsgraden in
der Tabelle ablesen. Wie entscheiden Sie sich?
 a) für die Nullhypothese
 b) für die Alternativhypothese
Philipps-Universität Marburg
Prof. Dr. Udo Kuckartz
WS 2004/05
Lösungen
Folie 45
Kapitel 9 - Lösungen III
4.
Berechnen Sie Chi-Quadrat!
Wahlpflichtfach
Studienrichtung
1
2
3
4
Summe
1
20 (15)
30 (22,5)
0 (18,75)
25 (18,75)
75
2
20 (15)
0 (22,5)
30 (18,75)
25 (18,75)
75
3
0 (10)
30 (15)
20 (12,5)
0 (12,5)
50
Summe
40
50
50
200
60
in Klammern sind die Erwartungswerte angegeben
c2 = (20-15)2 + (30-22,5)2 + (0-18,75)2 +....+ (0-12,5)2 = 99,87
15
22.5
18,75
12,5
Philipps-Universität Marburg
Prof. Dr. Udo Kuckartz
WS 2004/05
Lösungen
Folie 46
Kapitel 9 - Lösungen IV
5.
Berechnen Sie wieder Chi-Quadrat und führen Sie den
statistischen Entscheidungsprozess durch!
Wahlpflichtfach
Studienrichtung
1
2
3
4
Summe
1
40 (30)
25 (25)
2 (4)
33 (41)
100
2
10 (12)
15 (10)
2 (1,6)
13 (16,4)
40
3
10 (18)
10 (15)
4 (2,4)
36 (24,6)
60
Summe
60
8
82
200
Chi-Quadrat (empirisch) =
Philipps-Universität Marburg
50
k
c²  
(fb(j)  fe(j) )²
j 1
fe(j)
Prof. Dr. Udo Kuckartz
= 21,057
WS 2004/05
Lösungen
Folie 47
Kapitel 9 - Lösungen V
6. Sind die Tabellen aus Aufgabe 4 und 5 gleich gut für
einen Chi-Quadrat-Test geeignet? Dürfen die
Ergebnisse für Aussagen über Zusammenhänge
herangezogen werden?
Die Tabelle aus Aufgabe 5 kann nicht für Aussagen
über Zusammenhänge zwischen den Variablen
Studienrichtung und Wahlpflichtfach herangezogen
werden, da mehr als 20% der Tabellenfelder eine
erwartete Häufigkeit kleiner 5 haben. Die Tabelle ist
somit weniger geeignet für einen Chi-Quadrat-Test.
Philipps-Universität Marburg
Prof. Dr. Udo Kuckartz
WS 2004/05
Lösungen
Folie 48
Kapitel 10 - Lösungen I
1.
200 Studenten wurden nach ihrem Geschlecht (männlich, weiblich) und
ihrem Familienstand gefragt, also danach, ob sie alleine leben (Single)
oder nicht (Non-single). Ein unvollständiger Auszug der Daten sieht so
aus:
Single
Non-Single
Spaltensummen
Männlich
20
60
80
weiblich
40
80
120
Zeilensummen
60
140
200
a) Ergänzen Sie die Tabelle an den entsprechenden
Stellen!
b) Berechnen Sie Chi-Quadrat!
Chi-Quadrat = 1,587
Philipps-Universität Marburg
Prof. Dr. Udo Kuckartz
WS 2004/05
Lösungen
Folie 49
Kapitel 10 - Lösungen II
1.
Fortsetzung
c) Berechnen Sie den Phi-Koeffizienten!
Phi-Koeffizient = - 0,089
d) Was bedeutet das Ergebnis des Phi-Koeffizienten inhaltlich?
Der Phi-Koeffizient gibt den Grad des Zusammenhangs an. In diesem
Fall ist der Wert nahe 0 und der Zusammenhang ist damit nicht
erwähnenswert.
Ein Phi-Koeffizient von 0,3 gibt beispielsweise einen mittleren, ein
Wert von 0,6 einen großen Zusammenhang an.
Philipps-Universität Marburg
Prof. Dr. Udo Kuckartz
WS 2004/05
Lösungen
Folie 50
Kapitel 10 - Lösungen III
2.
Die folgende Tabelle ist von Aufgabe 4, Kapitel 8 übernommen.
Berechnen Sie nun den Phi-Koeffizienten und interpretieren Sie das
Ergebnis.
Wahlpflichtfach
Studienrichtung
1
2
3
4
Summe
1
20
30
0
25
75
2
20
0
30
25
75
3
0
30
20
0
50
Summe
40
60
50
50
200
Chi-Quadrat (emprisch) = 21,0595
Phi-Koeffizient = 0,071
Der Zusammenhang zwischen der Studienrichtung und dem
Wahlpflichtfach, die von den Testpersonen angeben wurden, ist
gering. Da der Wert nahe an 0 liegt, ist ein Zusammenhang fast nicht
vorhanden.
Philipps-Universität Marburg
Prof. Dr. Udo Kuckartz
WS 2004/05
Lösungen
Folie 51
Kapitel 10 - Lösungen IV
3.
Die Teilnehmer/innen der Statistikvorlesung 2000 wurden danach befragt,
a) ob sie planen, eventuell ein oder mehrere Semester im Ausland zu
studieren
b) in welcher Region sie Abitur gemacht haben.
Der Chi-Quadrat-Test ergab folgende Tabellen. Beschreiben und
interpretieren Sie die Ergebnisse!
Auslandssemester * Region (des Abiturs) Kreuztabelle
Auslandssemes ter
nein / eher nicht
eher ja / bestimmt
Erwartete
Erwartete
Anzahl
Anzahl
Anzahl
Anzahl
Region
(des
Abiturs )
Marburg und nahe
Umgebung
weitere Umgebung
von Marburg
Hessen
anderes
Bundes land
Gesamt
Philipps-Universität Marburg
Gesamt
Anzahl
31
23,7
7
14,3
38
13
10,6
4
6,4
17
8
10,6
9
6,4
17
24
31,1
26
18,9
50
76
76,0
46
46,0
122
Prof. Dr. Udo Kuckartz
WS 2004/05
Lösungen
Folie 52
Kapitel 10 - Lösungen V
3.
Fortsetzung
Chi-Quadrat-Tests
W ert
Chi-Quadrat nach
Pearson
As ymptotische
Signifikanz
(2-seit ig)
df
13,501
Symm etri sche Ma ße
3
,004
Cramer-V
W ert
,333
Näherung
sweise
Signifik anz
,004
Der Chi-Quadrat-Test lieferte eine Irrtumswahrscheinlichkeit von 0,4%
und war damit auf dem 1%-Niveau signifikant.
Demnach wird die Ho (Es besteht kein Zusammenhang zwischen den
Variablen) verworfen und die Entscheidung fällt für die
Alternativhypothese H1: Es besteht ein signifikanter Zusammenhang
zwischen der Region, in der die Studierenden ihr Abitur gemacht haben
und der Planung, ein oder mehrere Semester im Ausland zu studieren.
Philipps-Universität Marburg
Prof. Dr. Udo Kuckartz
WS 2004/05
Lösungen
Folie 53
Kapitel 10 - Lösungen VI
3. Fortsetzung II
Aus der Verteilungstabelle ist zu entnehmen, dass die Studierenden, die in
der näheren und weiteren Umgebung von Marburg Abitur machten
(n=38+17=55), weniger Interesse haben, im Ausland zu studieren als
diejenigen aus Hessen und anderen Bundesländern (n=17+50=67).
Der standardisierte Koeffizient Cramers V von 0,333 lässt auf einen
mittelgroßen Zusammenhang zwischen Region des Abiturs und Planung
eines Auslandssemester schließen.
Es ist zu vermuten, dass die Studierenden, die nicht aus der Umgebung
Marburgs kommen, und deshalb schon einmal zu Studienbeginn den Schritt
in ein neues Lebens- und Studierumfeld gegangen sind, weniger
Schwierigkeiten haben, sich ein Semester im Ausland vorzustellen.
Darüber hinaus sind vermutlich die regionalen Bezüge und Bindungen zur
Familie, zum Elternhaus, zu Freunden und zur Region bei den
Studierenden aus der Umgebung Marburgs größer. Der „Schritt ins
Ausland“ stellt dadurch sicherlich eine größere Hemmschwelle dar.
Philipps-Universität Marburg
Prof. Dr. Udo Kuckartz
WS 2004/05
Lösungen
Folie 54
Kapitel 11 - Lösungen I
1.
In der Studienanfängerstudie 2002/03 wurde gefragt „Wir oft üben
Sie die folgenden Freizeitbeschäftigungen aus?“ (Skala 1 (nie) bis
5 (sehr oft)). Die folgende Korrelationsmatrix gibt die bivariaten
Korrelationen für vier Beschäftigungen wieder.
Korrel ationen
Fernsehen
Beschäftigung mit
Computer
Korrelation
Signifik anz
Korrelation
Signifik anz
Sport t reiben
Korrelation
Signifik anz
Künstlerisc he A ktivitäten Korrelation
Signifik anz
Beschäftig
ung mit
Künstlerisc he
Fernsehen
Computer
Sport t reiben
Ak tivitäten
nac h Pears on
1
,414**
-,192*
-,234**
(2-s eitig)
,
,000
,014
,003
nac h Pears on
,414**
1
-,111
-,140
(2-s eitig)
,000
,
,155
,072
nac h Pears on
(2-s eitig)
nac h Pears on
(2-s eitig)
-,192*
,014
-,234**
,003
-,111
,155
-,140
,072
1
,
,017
,826
,017
,826
1
,
**. Die Korrelation ist auf dem Niveau von 0,01 (2-seitig) signifikant.
*. Die Korrelation ist auf dem Niveau von 0,05 (2-seitig) signifikant.
Lösung Aufgabe 1 a) und b) siehe Tabelle
Philipps-Universität Marburg
Prof. Dr. Udo Kuckartz
WS 2004/05
Lösungen
Folie 55
Kapitel 11 - Lösungen II
1. c) welche der folgenden Aussagen ist richtig?
 a) Seltenes Sporttreiben geht mit seltenem
Fernsehen einher.
 b) Häufiges Sporttreiben geht mit seltenem
Fernsehen einher.
 c) Zwischen der Häufigkeit des Sporttreibens
und des Fernsehens gibt es keinen Zusammenhang.
d) Versuchen Sie die Matrix inhaltlich zu interpretieren,
beachten Sie dabei die Höhe der Korrelationen, die
Vorzeichen sowie die Signifikanzen!
siehe nächste Folie
Philipps-Universität Marburg
Prof. Dr. Udo Kuckartz
WS 2004/05
Lösungen
Folie 56
Kapitel 11 – Lösungen III
1. d)
Die größte, auf dem 1%-Niveau signifikante, Korrelation besteht zwischen
„Fernsehen“ und „Beschäftigung mit dem Computer“ mit r = .414. Studierende, die
häufig fernsehen, beschäftigen sich auch häufig mit dem Computer.
Alle Korrelationen liegen unter r = .5, wobei zwischen „Fernsehen“ und
„Künstlerischen Aktivitäten“ die höchste negative Korrelation mit r = -.234 besteht.
Ein weiterer negativer Zusammenhang auf dem 5% Signifikanzniveau mit
r =-.192 besteht zwischen „Sport treiben“ und „Fernsehen“.
Interessant ist, dass dieser negative Zusammenhang nicht auf „Sport treiben“ und
die „Beschäftigung mit dem Computer“ übertragen werden kann.
Zwischen „Beschäftigung mit dem Computer“ und „Sport treiben“ und „Beschäftigung
mit dem Computer“ und „Künstlerische Aktivitäten“ sowie zwischen „Sport treiben“
und „Künstlerische Aktivitäten“ besteht jeweils kein Zusammenhang.
Bei den negativen Zusammenhängen können „je mehr, desto weniger“ – und bei den
positiven Zusammenhänge „je mehr, desto mehr“ – Aussagen getroffen werden.
Philipps-Universität Marburg
Prof. Dr. Udo Kuckartz
WS 2004/05
Lösungen
Folie 57
Kapitel 11 - Lösungen IV
2.
Die Korrelationsanalyse mit dem Korrelationskoeffizienten r
(Pearson) besteht aus 7 Schritten (Entscheidung für oder gegen
H1 soll getroffen werden können). Schreiben sie diese Schritte in
der richtigen Reihenfolge auf!
a) Mittelwerte von x und y bestimmen
b) Standardabweichung von x und y bestimmen
c) Kovarianz bestimmen
d) Korrelationskoeffizient r bestimmen
e) Prüfgröße t bestimmen.
f) Vergleich der Prüfgröße mit dem kritischen t-Wert der Tabelle
g) Entscheidung Nullhypothese oder Alternativhypothese
Philipps-Universität Marburg
Prof. Dr. Udo Kuckartz
WS 2004/05
Lösungen
Folie 58
Kapitel 11 - Lösungen V
3. Berechnen Sie die Kovarianz zwischen den Merkmalen
x (Anzahl der richtigen Lösungen in Test A) und y
(Anzahl der richtigen Lösungen in Test B)!
X
18
20
22
24
x  21
Y
27
30
33
32
x-xquer
-3
-1
1
3
y  30,5
y-yquer
-3,5
-0,5
2,5
1,5
x-xquer *y-yquer
10,5
0,5
2,5
4,5
Summe = 18
cov(x,y) = 18/4 = 4,5
Philipps-Universität Marburg
Prof. Dr. Udo Kuckartz
WS 2004/05
Lösungen
Folie 59
Kapitel 12 - Lösungen I
1.
Was ist der Unterschied zwischen den Korrelationskoeffizienten nach
Spearman und nach Pearson?
Spearmans rho wird ab ordinalskalierten Daten eingesetzt, Pearsons r ab
intervallskalierten Daten.
2.
Schreiben Sie alle Korrelationskoeffizienten auf, die sie kennen!
Spearmans rho, Pearsons r, Cramers V, Phi-Koeffizient,
Kontingenzkoeffizient C
3.
Wann spricht man von einer geringen, einer mittleren bzw. hohen
Korrelation?
0,1 -  geringe Korrelation
0,3 -  mittlere Korrelation
0,5 -  hohe Korrelation
Mit dem Signifikanzwert hängen sie durch das Bilden der Prüfgröße t
zusammen. Je höher die Korrelation, umso eher besteht die Chance ein
signifikantes Ergebnis zu erzielen.
Philipps-Universität Marburg
Prof. Dr. Udo Kuckartz
WS 2004/05
Lösungen
Folie 60
Kapitel 12 - Lösungen II
4.
Die StudentInnen der Vorlesung „Einführung in die
sozialwissenschaftliche Statistik“ wurden nach ihrer persönlichen
Einschätzung zu verschiedenen Berufsgruppen befragt. Hier sind die
Rangreihenfolgen von zwei der befragten Personen:
Rangplatzdiff.²
3
2
9
8
5
10
4
6
Rangplatzdiff
.
2
9
6
6
1
5
8
0
7
12
11
1
0
4
2
9
0
16
4
81
Berufsgruppe
Person 1
Person 2
Arzt
Dipl.-Päd.
Dipl.-Pol.
Dipl.-Psych.
Soz.Päd. (FH)
Dipl.-Soz.
Erzieher
Lehrer
Gr/Mittelstufe
Lehrer Oberst
Pfarrer
Anwalt
Soz.Arbeiter
1
11
3
2
4
5
12
6
7
8
9
10
Philipps-Universität Marburg
Prof. Dr. Udo Kuckartz
WS 2004/05
4
81
36
36
1
25
64
0
Lösungen
Folie 61
Kapitel 12 - Lösungen III
4.
Fortsetzung:
Berechnen Sie den Rangkorrelationskoeffizienten nach Spearman!
n
6
rho  1 

di2
i 1
n  (n²  1)
 1
6  348
2088
 1
 1  1,22 = - 0,22
12  (144  1)
1716
Und interpretieren Sie das Ergebnis!
Es liegt eine geringe, negative Korrelation vor. Das heißt, dass
die Berufe, die von Person 1 höher eingeschätzt wurden von
Person 2 eher niedriger eingeschätzt wurden und umgekehrt
(welcher Beruf bei Person 2 einen hohen Stellenwert hatte, der
hat bei Person 1 einen niedrigeren).
Philipps-Universität Marburg
Prof. Dr. Udo Kuckartz
WS 2004/05
Lösungen
Folie 62
Kapitel 12 - Lösungen IV
5.
In historischen Statistiken lässt sich nachverfolgen, dass die Zahl
der in einem Jahr gezählten Störche und die Zahl der Geburten
miteinander korrelieren. Ist damit bewiesen, dass die
Klapperstörche die Kinder bringen? Falls nein, warum nicht?
Korrelationen können niemals Aussagen über Kausalitäten, also über
Ursache und Wirkungen treffen. Mit Korrelationen kann man lediglich die
Höhe eines Zusammenhangs zwischen zwei Variablen feststellen.
Die Abnahme der Geburten sowie die Abnahme der Störche ist z.B. auf
die steigende Umweltbelastung zurückzuführen, die sich auf beide
Variablen negativ auswirkt.
Philipps-Universität Marburg
Prof. Dr. Udo Kuckartz
WS 2004/05
Lösungen
Folie 63
Kapitel 12 - Lösungen V
6.
Empirische Studien zeigen immer wieder, dass Frauen ein
geringeres Umweltwissen als Männer besitzen. Was könnte die
Ursache sein?
Hier können verschiedene Gründe angeführt werden, die aber
alle noch empirisch überprüft werden müssten.
Möglichkeiten:
Drittvariable Bildung: Männer haben im Bevölkerungsdurchschnitt eine
höhere Bildung, also auch ein höheres Umweltwissen.
Die Art des Testes könnte eine Rolle spielen: Häufig wird Umweltwissen
mit naturwissenschaftlichen Items erfragt/operationalisiert, hier
schneiden Männer üblicherweise besser ab.
Philipps-Universität Marburg
Prof. Dr. Udo Kuckartz
WS 2004/05
Lösungen
Folie 64
Kapitel 12 - Lösungen VI
7.
Tragen Sie ein, welcher Korrelationskoeffizient in Abhängigkeit vom
Skalenniveau der Daten berechnet werden darf!
Skalenniveaus
Nominalskala
Ordinalskala
Intervallskala
Phi-Koeffizient
Zulässig
Zulässig
Zulässig
Cramers V
Zulässig
Zulässig
Zulässig
Kontingenzkoeffizient
Zulässig
Zulässig
Zulässig
Spearman’s Rho
NICHT zulässig
Zulässig
Zulässig
Pearson’s r
NICHT zulässig
NICHT zulässig
Zulässig
KorrelationsKoeffizienten
Philipps-Universität Marburg
Prof. Dr. Udo Kuckartz
WS 2004/05
Lösungen
Folie 65
Kapitel 12 - Lösungen VII
8. Was wäre der adäquate Korrelationskoeffizient?
Merkmal X
nominalskaliert
intervallskaliert
intervallskaliert
Philipps-Universität Marburg
Merkmal Y
nominalskaliert
intervallskaliert
ordinalskaliert
Prof. Dr. Udo Kuckartz
Korrelationskoeffizient
Cramer’s V
Pearsons r
Rangkorrelation Spearman
WS 2004/05
Lösungen
Folie 66
Kapitel 13 - Lösungen I
1.
Cronbachs Koeffizient Alpha ist ein Maß:
 a) für die Trennschärfe von Items
 b) für den Zusammenhang zweier Items
 c) für die Reliabilität einer Skala
2.
Eine Skala ist:
 a) ein Messinstrument
 b) eine Sammlung von Variablen
 c) ein Koeffizient für den Zusammenhang zweier
intervallskalierter Variablen
3.
Wie kann man eine Skala gegebenenfalls verbessern?
Items mit niedriger Trennschärfe aus der Skala entfernen.
Evtl. Items neu formulieren.
Evtl. Items hinzunehmen.
Philipps-Universität Marburg
Prof. Dr. Udo Kuckartz
WS 2004/05
Lösungen
Folie 67
Kapitel 13 - Lösungen II
4.
Zur Messung des räumlichen Vorstellungsvermögens von
Studierenden wurden zwei Skalen entwickelt. Skala A weist einen
Reliabilitätskoeffizient Alpha=.52 auf, Skala B einen Koeffizienten
Alpha = .77.
Welche Skala ist besser geeignet?
 a) Skala A
 b) Skala B
 c) beide gleich gut
 d) beide sind nicht geeignet
5.
Wie wird bei der Likert-Skala der Gesamtpunktwert der Probanden
berechnet?
 a) durch Ordnen der Items nach Schwierigkeit und
Zuordnung der Personen zu dieser Rangskala
 b) durch Summierung der Messwerte der einzelnen Items
 c) durch Bildung des Mittelwertes der trennschärfsten Items
Philipps-Universität Marburg
Prof. Dr. Udo Kuckartz
WS 2004/05
Lösungen
Folie 68
Kapitel 14 - Lösungen I
1.
Was bedeutet die Signifikanz des F-Wertes bei der Varianzanalyse?
 a) Die Wahrscheinlichkeit für das zufällige Zustandekommen des
Ergebnisses
 b) Die Wahrscheinlichkeit für die Geltung der H1
 c) Die Wahrscheinlichkeit für die Wirkung des Treatments
2.
Geben sie die sechs Schritte der Varianzanalyse an:
a) Bestimmung der QS total (Gesamtsumme der Abweichungsquadrate)
b) Bestimmung der QS treatment und der Treatment-Varianz
c) Bestimmung der QS fehler und der Varianz des Fehlers
d) Bildung der Prüßgröße F
e) Wahl des Signifikanzniveaus, Vergleich des empirischen F-Wertes mit
dem kritischen F-Wert der Tabelle
f) Entscheidung für Null- und Alternativhypothese
Philipps-Universität Marburg
Prof. Dr. Udo Kuckartz
WS 2004/05
Lösungen
Folie 69
Kapitel 14 - Lösungen II
3.
Die Varianzanalyse will:
 a) den Zusammenhang zwischen zwei nominalskalierten Daten
untersuchen.
 b) die Varianz einer abhängigen Variablen durch unabhängige
Variable(n) erklären.
 c) den Mittelwert einer Stichprobe mit dem Mittelwert der
Grundgesamtheit vergleichen.
 d) die Varianz einer Variablen bestimmen.
4.
Welches Skalenniveau muss die abhängige Variable bei der
Varianzanalyse besitzen?
 a) spielt keine Rolle
 b) Nominalskalenniveau
 c) Intervallskalenniveau
 d) Ordinalskalenniveau
Philipps-Universität Marburg
Prof. Dr. Udo Kuckartz
WS 2004/05
Lösungen
Folie 70
Kapitel 14 - Lösungen III
5.
Es wurde eine einfaktorielle Varianzanalyse durchgeführt mit der
abhängigen Variable Umweltbewusstsein und der unabhängigen Variable
Bildung. Das Umweltbewusstsein wurde mittels einer aus 14 Items
bestehenden Skala gemessen: Je höher der Skalenwert ist, desto höher
ist das Umweltbewusstsein. Es wurden drei Stufen des Bildungsniveaus
unterschieden: niedrig, mittel und hoch. Interpretieren Sie die folgenden,
von SPSS berechneten Ergebnisse dieser Analyse. Hat Bildung einen
Einfluss auf das Umweltbewusstsein? Wenn ja, in welcher Weise?
Deskriptive Statistik
Gesamtskala Umweltbewus stsein
N
niedrig
mittel
hoch
Gesamt
636
631
647
1914
Mittelwert
50,0267
51,5087
52,0927
51,2137
Philipps-Universität Marburg
Standardab
weichung
6,6825
6,8310
6,8825
6,8516
Standardf
ehler
,2650
,2719
,2706
,1566
Prof. Dr. Udo Kuckartz
95%-Konfidenzintervall für
den Mittelwert
Untergrenze
Obergrenze
49,5064
50,5471
50,9747
52,0427
51,5614
52,6241
50,9065
51,5208
WS 2004/05
Minimum
24,00
27,00
29,00
24,00
Lösungen
Maximum
70,00
68,00
70,00
70,00
Folie 71
Kapitel 14 - Lösungen IV
5.
Fortsetzung
ANOVA
Gesamtskala Umweltbewus stsein
Quadrats
umme
Zwischen den Gruppen 1450,918
Innerhalb der Gruppen 88354, 684
Gesamt
89805, 601
df
2
1911
1913
Mittel der
Quadrate
725,459
46,235
F
15,691
Signifik anz
,000
Das Ergebnis ist signifikant (F=15,69, p=.000), d.h. die Gruppen
unterscheiden sich: Bildung hat einen Effekt auf das
Umweltbewusstsein. Dieses steigt mit dem Bildungsniveau an,
die erste Gruppe „Bildung niedrig“ weist durchschnittlich das
geringste Umweltbewusstsein auf (Skalenmittelwert = 50,0), die
Gruppe mit dem höchsten Bildungsniveau zeigt sich im Mittel
am umweltbewusstesten (Skalenmittelwert 52,1). Mit zwei
Skalenpunkten sind die Unterschiede allerdings nicht sehr groß.
Philipps-Universität Marburg
Prof. Dr. Udo Kuckartz
WS 2004/05
Lösungen
Folie 72
Kapitel 14 - Lösungen V
6.
Berechnen einer Varianzanalyse: Je 10 Schüler werden zufällig auf drei
verschiedene Lernmethoden des Englischunterrichts verteilt. Nach 10
Unterrichtsstunden wird ein Englisch-Test geschrieben. Die Fehler, die
die SchülerInnen gemacht haben, sind in der unten stehenden Tabelle
wiedergegeben. Berechnen Sie eine Varianzanalyse! Unterschieden sich
die Gruppen signifikant?
Gruppe 1
22
24
23
21
25
25
21
21
24
24
Mittelwert A1=23
Philipps-Universität Marburg
Gruppe 2
24
26
20
26
27
26
25
26
23
27
Mittelwert A2=25
Prof. Dr. Udo Kuckartz
Gruppe 3
22
27
29
25
26
28
23
24
30
26
Mittelwert A1=26
WS 2004/05
Lösungen
Folie 73
Kapitel 14 - Lösungen VI
6.
Fortsetzung
Gesamtmittelwert= 24,66
Berechnen Sie zunächst die Fehlerquadratsumme QS Fehler= 126
und die Fehlervarianz (df hier= 27) = 126/27= 4,66
Berechnen Sie nun die Treatmentquadratsummer QS Treat=10*(2324,66)²+10*(25-24,66)²+10*(26-24,66)² = 46,66
und die Treatmentvarianz (df hier = 2)= 46,66/2=23,33
Bilden Sie nun die Prüfgröße F=
Treatment var ianz
Fehler var ianz
= 23,33 / 4,66= 5
Der kritische F-Wert für 2 Zählerfreiheitsgrade, 27 Nennerfreiheitsgrade
und 5% Irrtumswahrscheinlichkeit lautet 3,35.
Treffen Sie die Entscheidung Nullhypothese versus Alternativhypothese!
Da der kritische F-Wert der Tabelle unter dem berechneten F-Wert bleibt,
wird die H0 verworfen und die H1 angenommen.
Philipps-Universität Marburg
Prof. Dr. Udo Kuckartz
WS 2004/05
Lösungen
Folie 74
Herunterladen