Block_Tapping_WiSe_0..

Werbung
Eine (sehr) einfache, erste Anleitung
zur Datenauswertung bzw. Hypothesenprüfung
(bitte unbedingt durch Hilfefunktion/Lehrbuch ergänzen)
Zunächst müssen, sofern nicht vorhanden, die Daten eingegeben werden. Dazu
kann es sinnvoll und nützlich sein, einen sog. Codierplan zu erstellen, der festlegt,
welche Variable, an welcher Stelle in der Liste stehen sollen und welcher Datentyp
Und welches Wertelabel verwendet werden soll. Auf der nächsten Seite ist ein
Beispiel für einen solchen Codierplan wiedergegeben.
Wichtig ist die Möglichkeit zu beachten, zwischen Datenansicht und Variablenansicht
wechseln zu können■. Die Datenansicht zeigt die eingegebenen Daten, die VariablenAnsicht die Spezifikation.
In der Variablenansicht kann bspw. der Name der Variablen, das Variablenlabel
(der hier eingetragene Name erscheint auf allen Ergebnisdarstellungen!!) und die
Wertelabels eingetragen werden (sie definieren, was die eingegebenen Werte
bedeuten sollen; in dem Beispiel 0 = keine Angabe, 1 = Mädchen; 2 = Junge).
Wichtig ist noch die Unterscheidung des Variablentyps, bspw. in Numerisch (dann
können Zahlen eingegeben werden) oder String (dann kann jedes Zeichen, auch
Buchstaben, eingegeben werden).
Was die Auswertung betrifft, so soll hier vor allem auf die
Bedeutung einer Beschäftigung (man sollte besser von einem
Studieren sprechen) mit den Daten aufmerksam gemacht werden.
Man muss die Daten angucken (was komisch klingen mag). Dazu
sind oft Graphiken hilfreich und wichtig. Dann muss man darüber
(manchmal etwas länger) nachdenken, was man da eigentlich
sieht oder sehen kann. Dann erst sollte begonnen werden, das,
was man sieht, durch eine Auswertung in eine Form zu bringen,
die die Größe oder die Bedeutung dessen, was man gesehen hat,
auch bewertbar macht.
In sehr grober Form folgt die Auswertung also dem Schema:
Ich sehe mehr kluge Mädchen als Jungen, der Effekt ist etwa so
und so groß.
Die nächste Abbildung zeigt eine mögliche Schrittfolge.
Im Folgenden werden dann (ein wenig) Theorie und (ein wenig)
Praxis über die Abarbeitung dieser Schritte erläutert.
Erster, stets wichtiger Schritt:
Daten, Datenstruktur anschauen!
Optionen:
• Balkendiagramme
(um die Verteilung von Werten einer
Variablen anzuschauen)
• Streudiagramme
(um die Beziehung zwischen zwei
Variablen anzuschauen)
Bei kategorialen Daten:
Kreuztabelle
Bei metrischen numerischen Daten:
Korrelationsanalyse
(Vorsicht: prüfen ob linearer Zusammenhang!)
Teilmengen bilden
und vergleichen
(alt/jung; männlich/weiblich; groß/klein)
Neue Variablen
berechnen
Was soll untersucht, analysiert werden? Eine Frage könnte lauten: „Erhöht sich
die Merkleistung mit der Übungsdauer, mit der ein Musikinstrument geübt wird?“
Merkleistung im Block-Tapping-Test
Dabei würde der folgende Zusammenhang unterstellt:
Je länger geübt wird, desto
größer die Merkleistung oder
je größer die Merkleistung, desto
länger wird geübt
Übungsdauer in Stunden pro Woche
Für eine erste Prüfung würde man die ermittelten Werte in einem sog.
Scatterplot betrachten [wird später erläutert und vorgeführt]. Ein Scatterplott
von Werte könnte dann so aussehen:
Scatterplot (Tabelle1 10v*20c)
Übungszeit = 0+1*x
22
20
18
16
14
12
10
Übungszeit
8
6
4
2
0
0
2
4
6
8
10
12
14
16
18
20
22
Merkleistung
Wären die Ergebnisse so, dann wäre die genannte Vermutung empirisch belegt
Doch leider – oder zum Glück – sind die Dinge in der Realität selten so klar
und einfach. Realistischer ist bspw. der folgende Befund:
Scatterplot (Tabelle1 10v*20c)
Übungszeit = 2,3211+0,3932*x
20
18
16
14
12
10
Übungszeit
8
6
4
2
0
0
2
4
6
8
10
12
14
16
18
20
22
Merkleistung
Die Frage ist nun, wie groß ist hier der Zusammenhang, mit welchem
Maß kann dieser bestimmt und bewertet werden?
Dazu wird die Korrelation zwischen der Verteilung von zwei Variablen berechnet.
Das Prinzip zeigte sich bereits der letzten Graphik, es fragt – einfach gesprochen –
nach den Abständen der Punkte von einer „idealen“ Graden zwischen den Punkten.
Diese werden wie folgt ermittelt:
- Es wird eine „ideale“ Gerade (Ŷ) zwischen den Punkten berechnet
(es wird nach den kleinsten Quadraten der Abstände gesucht)
- Die Abstände zwischen dieser Geraden und den Punkten werden berechnet
Diese Grade könnte etwa wie folgt liegen (siehe Graphik)
Ŷ
Dann wird der Mittelwert aller Werte berechnet und ebenfalls eingetragen (dünne
Linie). Im Anschluss werden für jeden Punkt (Stern) drei Werte berechnet (hier
veranschaulicht an dem hervorgehobenen ‚schwarzen‘ Stern):
3) Die Gesamtabweichung des Stichprobenwertes vom Mittelwert, der in zwei
weitere Abschnitte unterteilt werden kann, in 1) dem Abstand eines Wertes zwischen
Regressionsgraden und dem Mittelwert, der sich durch die Regressionsgrade erklärt
und daher als „erklärte Abweichung“ bezeichnet wird und 2) dem Abstand zwischen
dem Wert und der Regressionsgraden, der aus anderen Einflüssen resultiert und
der als Residuum bezeichnet wird.
2
3
Ŷ
1
y
Mit Hilfe dieser drei Werte werden nun die folgenden Kenngrößen berechnet:
Gesamtabweichung = Erklärte Abweichung + Residuum
(yx – Mittelwert) = (ŷx – Mittelwert) + (yx – ŷx)
Indem die daraus resultierenden Zahlen in Relation gesetzt werden, ergibt sich
der Prozentsatz der durch die Regressionsgraden aufgeklärten Abweichung
Im Unterschied zu der Gesamtabweichung einer einzelnen Beobachtung wird
die Summe der quadrierten Gesamtabweichungen aller Beobachtungen als
Gesamtstreuung bezeichnet:
Gesamtstreuung = Erklärte Streuung + nicht erklärte Streuung (Residuum)
∑(yx – Mittelwert)² = ∑ (ŷx – Mittelwert)² + ∑ (yx – ŷx)²
Woraus sich nun die beiden relevanten Größen des sog. Bestimmtheitsmaßes
errechnen lassen:
Bestimmtheitsmaß R² = Erklärte Streuung/Gesamtstreuung
R² = ∑ (ŷx – Mittelwert)² / ∑(yx – Mittelwert)²
oder
R² = 1- nicht erklärte Streuung/ Gesamtstreuung
Der sog. Korrelationskoeffizient r ist „einfach“ die Wurzel aus R²: r = √ R²
Einzelwerte für Variable B
Einzelwerte für Variable A
Kein Zusammenhang zwischen A und B
Einzelwerte für Variable B
Einzelwerte für Variable A
Ein starker positiver Zusammenhang zwischen A und B
Einzelwerte für Variable B
Einzelwerte für Variable A
Ein starker negativer Zusammenhang zwischen A und B
Positiver korrelativer Zusammenhang: „Je mehr, desto mehr“
Negativer korrelativer Zusammenhang: „Je mehr, desto weniger“
Ein einfaches Rechenbeispiel:
Gedächtnisspannenwert
8
6
13
2
5
17
5
Musikübungsdauer
6
5
11
4
4
15
4
Scatterplot (Tabelle1 10v*10c)
Übungsdauer = 0,561+0,8049*x
16
Der Scatterplot dazu sieht
wie folgt aus:
14
12
10
8
Übungsdauer
Die Berechnungen von R und R²
ergeben:
6
4
2
0
0
2
4
6
8
10
Spannenwert
N=7
Konstante
Übungsdauer
Regression Zusammenf. für abh. Variable: Spannenwert (Tabelle1)
R= ,97396420 R²= ,94860627 korr. R²= ,93832753
F(1,5)=92,288 p<,00021 Stdf. der Schätzung: 1,2984
BETA
Stdf.
B
Stdf.
t(5)
p-Niveau
von BETA
von B
-0,250000 0,989099 -0,252755 0,810520
0,973964 0,101384 1,178571 0,122683 9,606671 0,000207
12
14
16
18
A
A
Leistungen in Klasse B
A
A
A
Böse Falle Null:
Missing Value:
Für eine Person
liegen keine Angaben zu
der Leistung in Klasse B vor
A
A
A
A
A
A
0
A
Leistungen in Klasse A
106
104
GEOMETRY
102
100
98
96
94
92
92
94
96
98
100
102
104
106
2
DRAWING
DRAWING:GEOMETRY: r = 0,9032; p = 0.0000;
r = 0,8159
Beachten Sie den Korrelationsquotienten!
120
100
GEOMETRY
80
60
40
"Übeltäter": der Ausreißer
20
0
-20
92
94
96
98
100
102
104
106
2
DRAWING
DRAWING:GEOMETRY: r = -0,0787; p = 0,4879;
r= 0,0062
Beachten Sie den Korrelationsquotienten!
Was ist hier zu tun? Wie so oft gibt es mehrere Möglichkeiten:
• Die Werte für einen missing value ausfiltern (die Null ausfiltern)
• Die Werte für einen missing value unter „Variablenansicht“ in der Dialogbox
„Fehlende Werte“ eintragen. Das Programm verwendet dann bei Berechnungen
die dort eingetragenen Werte nicht.
Dieses Verfahren eignet sich jedoch nicht, wenn für jede Variable etwa nur Ja oder Nein
Werte vorliegen, wie bspw. für die Frage nach dem Wohnort Stadt/Land und dem
Geschlecht Junge/Mädchen. Will man also der Frage nachgehen, ob sich hinsichtlich
des Wohnortes Stadt/Land Jungen von Mädchen unterscheiden, kann als ein
mögliches Verfahren zur Prüfung dieser Frage die Kreuztabellierung genutzt werden.
Wie der Name bereits verrät, werden in einer Tabelle „über Kreuz“ die Anteile der
Mädchen in Stadt und auf dem Land dem Anteil der Jungen gegenübergestellt. Wichtig
ist dabei der Vergleich zwischen den in dieser Tabelle ausgewiesenen erwarteten und
den realen Werten.
Dazu ein einfaches Beispiel: Insgesamt wären 100 Jugendliche befragt worden, ob
sie auf dem Land oder in der Stadt wohnen. Nehmen wir an, von den Befragten wären
genau 50 Jungen und 50 Mädchen gewesen. Dann könnte sich bspw. das folgende Bild
ergeben:
Wichtiger Hinweis: Dies hier sind nur sehr, sehr einfache Erläuterungen und
Erklärungen! Bitte nutzen Sie weiterführende Literatur wie bspw.:
Backhaus, Erichson, Plinke & Weiber (2003) Multivariate Analysemethoden.
Berlin, Heidelberg, New York, Hongkong, London, Mailand, Paris, Tokio: Springer
100
Jugendliche
100
Jugendliche
50
Jungen
25
Land
50
Jungen
50 Mädchen
25
Stadt
25
Land
25
Stadt
10
Land
50 Mädchen
40
Stadt
40
Land
10
Stadt
Im linken Ergebnis zeigt sich die Annahme der Gleichverteilung; es gäbe keinen Unterschied,
gleich viel Mädchen und Jungen leben in der Stadt und auf dem Land. Anders das Ergebnis auf der
rechten Seite. In diesem Fall zeigt sich deutlich, dass mehr Mädchen auf dem Land
umgekehrt mehr Jungen in der Stadt wohnen.
Die Kreuztabelle fügt die Art dieser beiden Darstellungen zusammen und erstellt ein
Bild über die Verteilung, wie sie unter der Bedingung „Gleichverteilung“ zu erwarten
Wäre, dem sie die tatsächlich vorliegende Verteilung gegenüber stellt. Dabei werden
unterschiedliche Gruppenaufteilungen (nicht wie hier gleiche Anteile J/M, Stadt/Land)
rechnerisch angepasst.
Im Folgenden werden die Bearbeitungsschritte mit SPSS zum Verfahren „Kreuztabelle“
erläutert. Dazu wird SPSS gestartet, und eine Datei aufgerufen. Es erscheint dann diese
Oberfläche. Jetzt soll die Frage geprüft werden, ob die Schulformen gleich stark von
Jungen und Mädchen besucht werden.
Dazu wird in der obersten Zeile unter „Analysieren“ der Unterpunkt „Deskriptive
Statistiken“ und dort der Unterpunkt „Kreuztabellen ..“ aufgerufen:
Danach erscheint folgende Maske:
Jetzt wird unter „Zeilen“ die Variable „Geschlecht“ und unter „Spalten“ die Variable
„Besuchte Schule“ markiert. Wichtig ist jetzt der Aufruf des Unterprogramms „Zellen“,
wo zumindest unter „Häufigkeiten“ „Beobachtet“ und „Erwartet“ angeklickt werden muss.
(andere Optionen ruhig einmal ausprobieren, bspw. die Möglichkeit, Prozentwerte!)
Alles auf „Weiter“ bzw. „OK“ und es erscheint das folgende Resultat:
Geschlecht * Besuchte Schule Kreuztabelle
Bes uchte Schule
Ges chlecht
Mädchen
Junge
Ges amt
Anzahl
Erwartete Anzahl
Anzahl
Erwartete Anzahl
Anzahl
Erwartete Anzahl
Keine
Angaben
1
,6
0
,4
1
1,0
Grundschule
25
26,9
19
17,1
44
44,0
Reals chule
6
6,7
5
4,3
11
11,0
Gymnas ium
31
26,3
12
16,7
43
43,0
Ges amts
chule
14
16,5
13
10,5
27
27,0
Ges amt
77
77,0
49
49,0
126
126,0
Es zeigt sich zunächst, dass insgesamt 126 SchülerInnen befragt wurden. Davon
waren 77 Mädchen und 49 Jungen (was das Programm rechnerisch „ausgleicht“).
Bezogen auf die Grundschule und die Realschule liegen die erwarteten Werte in
etwa in der Größenordnung der (realisierten) Anzahl.
Im Gymnasium und der Realschule trifft dies nicht zu. Im Gymnasium sind mehr
Mädchen als erwartet; in der Gesamtschule mehr Jungen als erwartet.
Doch was kann man machen, wenn numerische Werte vorliegen, die, wie bspw. bei
der Körpergröße, nicht einfach in groß und klein unterteilt werden können?
Dafür ist folgendes Verfahren möglich (es gibt weitere in SPSS!): Man generiert eine
neue Variable, die die Ursprungswerte in zwei (oder mehr) Bereiche unterteilt.
Und zwar wie folgt:
Zunächst ist es immer richtig, sich die Verteilung der Werte graphisch anzuschauen!
Dazu wird unter „Graphiken“ der Unterpunkt „Balken“ gewählt, und dort „Einfach“ und
„Auswertung über Kategorien einer Variable“ angeklickt. Es erscheint das folgende
Fenster (rechts): In die Rubrik „Kategorienachse“ wird der zu betrachtende Wert
eingefügt und „OK“ gegeben. Das Resultat ist links zu sehen.
Die Werte liegen zwischen 1 und 25,67 und es scheint zulässig, nach der Mitte zu
suchen, um die Werte in zwei Bereich zu unterteilen. Anders wäre dies, wenn bspw.
so eine Verteilung vorliegen würde:
100
90
80
70
60
50
40
30
20
10
0
Hier würde die Suche einer Mitte die erkennbare Gruppierung in drei Bereiche zerstören.
Doch zurück zu dem zuvor gewählten Beispiel „Gedächtnisspanne“: Hier errechnen wir
als Grenze zwischen „wenig“ und „viel“ den Median. Dies geht ganz einfach: Unter dem
Bereich „Analysieren“ findet sich der Unterpunkt „Deskriptive Statistik“, darunter der
Unterpunkt „Häufigkeiten“. Dort wird die entsprechende Variable gewählt und unter
„Statistik“, „Lagemaße“ der „Median“ angeklickt. Alles auf „OK“ und der Wert erscheint.
Im vorliegenden Fall hat der Median den Wert 14,00. Jetzt wird unter „Transformieren“,
der Unterpunkt „Umkodieren“ und weiter „In andere Variable“ gewählt. Es erscheint dann
das folgende Menü:
Dort wird zunächst die zu unterteilende Variable angeklickt („s_score“), so dass sie
in das mittlere Fenster wandert. Jetzt ist es wichtig, unter „Ausgabevariable“ den
Namen der neuen Variable festzulegen. Vorschlag: „score_groß_klein“. Also eingeben,
auf „Zuweisen“ klicken (!) und dann die Taste „Alte und neue Werte“ anklicken.
Dann erscheint folgendes Menü:
Hier müssen nun unter „Bereich“ in dem gewählten Beispiel einmal 0 bis 14,00
eingegeben werden, danach auf der rechten Seite unter „Wert“ eine 1 und dann muss
„Hinzufügen“ angeklickt werden, erst dann erscheint die Zuweisung in der Rubrik
„Alt Neu“! Als nächstes wird wie dargestellt der Bereich 14,01 bis 100 (ist egal, wir
wissen, der größte Wert war nur 25,47) und diesem Bereich der neue Wert 2 gegeben.
Wichtig ist zu behalten: 1 ist der „kleine Wertebereich“, 2 der „große Wertebereich“. Auf
„Weiter“ und „OK“ gedrückt, und die neue Variable erscheint ganz links (!) als neue
Variable in der Liste. Damit haben wir aus eine numerischen eine kategoriale
Variable „gemacht“
und können nun
weiter mit
Kreuztabellen arbeiten.
Toll! Oder?
So wie gezeigt
können Werte
natürlich auch in
drei oder vier
Bereiche unterteilt werden.
Um bei metrischen numerischen Daten einen Zusammenhang zu prüfen, hilft die
oben erläuterte Korrelationsanalyse. Wichtig nochmals: der Zusammenhang muss
linear sein, sonst entstehen unsinnige Ergebnisse. Die folgenden Abbildungen
sollen in Ergänzung der schon gegebenen Erläuterungen dieses Problem veranschaulichen (es sei erwähnt, dass es Tests gibt, die die Zulässigkeit prüfen) .
Nehmen wir an, die Daten würden in etwa wie unter A verteilt vorliegen, dann würde
die Korrelationsanalyse eine Regressionsgerade berechnen, in etwa so wie durch
die gestrichelte Linie dargestellt. Da die Berechnungen „dumm und stumpf“ erfolgen,
käme ein Zusammenhangswert heraus, der die Verhältnisse aber völlig falsch
darstellt. Genauso würde es sich im Fall B verhalten. Erst unter der
Bedingung C wäre die Berechnung des Korrelationskoeffizienten zulässig und
vernünftig, bspw. um den Grad des Zusammenhangs zwischen verschiedenen
Faktoren zu prüfen, um Aussagen über einen stärkeren oder schwächeren
Zusammenhang treffen zu können (Sporttreiben hat einen größeren Einfluss auf
Mathe als auf Deutsch) etc.
A
B
C
Zur Praxis mit Hilfe von SPSS: Zunächst wird
also ein Streudiagramm erstellt. Das
geht so: Unter „Graphiken“ das
Unterprogramm „Streu- Punktdiagramm“
anklicken. Dann „Einfaches Streudiagramm“
und „Definieren“. X und Y-Achse definieren, fertig.
Interessant ist die Option „Markierungen
festlegen durch“: Wird hier, wie gezeigt,
„Geschlecht“ eingetragen, lässt schon grob sehen,
wie Jungen/Mädchen in der Menge verteilt
sind!
Um jetzt für den Fall „Deutschnote/Mathenote“ den Zusammenhang zu berechnen
unter „Korrelation“, dann „Bivariat“, die Variablen „Deutschnote“ und „Mathenote“
anklicken, alles auf „OK“ und das folgende Ergebnis kommt (in dem hier gewählten
Beispiel). Die Korrelation beträgt 0,505.
Um jetzt bspw. zu prüfen, ob dieser Zusammenhang bei Mädchen größer ist als bei
Jungen wird abschließend der letzte hier vorzustellende Schritt erläutert: das
Unterteilen eines Datensatzes in Teilmengen (siehe nächste Folie).
Korrelationen
Deuts chnote
Mathenote
Korrelation nach Pears on
Signifikanz (2-s eitig)
N
Korrelation nach Pears on
Signifikanz (2-s eitig)
N
Deuts chnote
1
Mathenote
,505**
,000
111
111
,505**
1
,000
111
111
**. Die Korrelation is t auf dem Niveau von 0,01 (2-s eitig)
s ignifikant.
Dazu wird unter „Daten“ das Unterprogramm „Fälle auswählen“ angeklickt. Dann
erscheint diese Oberfläche:
Jetzt gibt es, wie zu sehen
ist, mehrere Möglichkeiten.
Hier wird eine vorgestellt:
„Falls Bedingung zutrifft“.
Also auf diese Schaltfläche
Klicken und eine Untermenü
öffnet sich mit weiteren
Möglichkeiten.
Doch zuvor ein sehr
wichtiger Hinweis.
unter „Ausgabe“ kann
festgelegt werden, ob der
geänderte Datensatz bspw.
„gefiltert“ oder „gelöscht“
werden soll: Vorsicht vor „löschen“, die Daten sind dann weg!! Tipp: Vollständige Daten
aufrufen, dann, wie gleich zu zeigen, nur die Mädchen auswählen, „löschen“ setzen,
dann aber die Datei unter einem neuen Namen speichern (!!!), etwa so „XYZ_mädchen“.
Entsprechend mit den Jungen oder was auch immer. Wenn Sie „filtern“ wählen dann
nicht vergessen: Bevor Sie eine neue Gruppe festlegen, wieder auf „Alle Fälle“ klicken!
Doch weiter im Text. Unter „Falls“ können Sie jetzt bspw. wie gezeigt festlegen, dass
nur die Daten verwendet werden, bei denen unter „gender“ mit einer „1“ eingegeben
wurde. Wenn Sie nicht mehr wissen sollten, was „1“ bedeutet: Variablenansicht,
Wertelabels nachschauen. Wenn Sie Wertebereiche festlegen wollen geht auch dies
ganz einfach etwa so:
In diesem Fall werden
alle Fälle gewählt,
bei denen die Werte
Alter kleiner/gleich
(<=) 8 und (&) größer
als (>) 4 sind.
Wenn Sie sehr genau den bisherigen Text studiert haben ist Ihnen sicher aufgefallen,
dass bislang nur die Werte der erfolgreichen Durchführungen bei jeder untersuchten
Gedächtnisspanne im Datensatz enthalten sind. Weiter oben habe ich aber schon kurz
einen Wert „Gesamtmaß Gedächtnisspanne“ benutzt. Wie kommt ein solcher Wert
zustande, was sagt er aus, wie lässt er sich, wie lassen sich andere Werte herstellen?
Im Prinzip müssen für einen Gesamtwert irgendwie die Werte aller Einzelspannen
zusammengefügt werden.
Um dies zu tun bietet
SPSS unter „Transformieren“
das Unterprogramm
„Berechnen“.
Beim Anklicken zeigt
sich die folgende
Oberfläche:
Unter „Zielvariable“ wird
der Name der neu zu
berechnenden Variablen
festgelegt.
Im Feld „Numerischer Ausdruck“ kann jetzt die Formel eingegeben werden, die den
neuen Wert berechnen soll.
Ein ganz einfaches (aber dummes) Beispiel dafür könnte so aussehen. Sie wollten
eine „Gesamtnote“ berechnen, und würden dazu eingeben „Deutschnote + Mathenote +
Musiknote + Sportnote“. Wenn Sie schon jetzt „OK“ geben, erhalten Sie eine neue
Variable „Gesamtnote“ (wird immer ganz rechts an den Datensatz angehängt), in der
für jede Person, sprich für jede Zeile, die Werte „Deutsch, Mathe, Musik und Sport“
aufaddiert enthalten sind. Jetzt wollen Sie ja aber eine Gesamtnote haben, die im
Spektrum „1 bis 6“ liegt. Also müssen Sie das Ganze noch durch 4 teilen, weil Sie ja
4 Werte aufaddiert haben. Das geht, wie immer, auf verschiedenen Wegen. Der
einfachste ist, in das Feld „Numerischer Ausdruck“, anders als zuvor, folgende
Anweisung zu schreiben: (Anführungszeichen weglassen!!)
„(Deutschnote + Mathenote + Musiknote + Sportnote)/4“. Ein anderer Weg: Sie gehen
wie oben vor, und rufen, wenn diese neue Variable berechnet ist, noch mal „Berechnen“
auf, geben jetzt als Zielvariable einen neuen Namen oder den alten an (dann werden die
bestehenden Werte überschrieben) und geben in die Befehlszeile ein: „Gesamtnote/4“,
wieder auf „OK“ und fertig.
Im Hilfeprogramm finden Sie eine Reihe von weiteren Beispielen.
Auf der folgenden Seite sind jetzt die Werte angegeben und erklärt, die ich Ihnen, wenn
ich alle Datensätze habe, zusätzlich berechne (können Sie natürlich auch gerne selbst
ausprobieren) und an den Gesamtdatensatz anhängen werde.
Bei Fragen: Anrufen, „Anmailen“, Vorbeischauen.
Erläuterung der vier neu errechneten und eingefügten Werte:
- s_score
Diesen Wert habe ich berechnet, um ein Gesamtmaß für die erreichten
Gedächtnisspannenwerte zu erhalten. Dazu habe ich den Wert für die Spanne 1
durch 3 geteilt und mit 1 multiplizierte, den Wert für die Spanne 2 durch 3 geteilt
und mit 2 multipliziert, den Wert für die Spanne 3 durch 3 geteilt und mit 3
multipliziert etc.:
((spanne_01 / 3) * 1) + ((spanne_02 / 3) * 2) + ((spanne_03 / 3) * 3) + ((spanne_04 / 3) * 4) +
((spanne_05 / 3) * 5) + ((spanne_06 / 3) * 6) + ((spanne_07 / 3) * 7) + ((spanne_08 / 3) * 8)
So ergibt sich ein Wertebereich für den s_score, der zwischen 0,3 und 36 liegen kann.
- sb_score
Hier habe ich den Median der s_score Werte genommen, um zwei Bereiche zu
erhalten: 1, wenn der s_score kleiner als der Median ist (kleiner Gedächt.-Spannen
Wert) und 2, wenn er größer Median (im Label schreibe ich den Medianwert auf) ist.
- day_score
Ist ganz einfach die Tageszeit in Minuten: Std. mal 60 + Minuten.
- t-score
Time, hier als Gesamtwert für das Üben eines Instrumentes: Wert Dauer mal Üben
Balkendiagramm
Weitere Erläuterungen
Kreuztabelle
noten
6
2,00
3,00
5,00
5
Anzahl
4
3
2
Verarbeitete Fälle
gender * noten
Gültig
N
Prozent
10
100,0%
Fälle
Fehlend
N
Prozent
0
,0%
1
Ges amt
N
Prozent
10
100,0%
0
1,00
2,00
gender
gender * noten Kreuztabelle
2,00
gender
1,00
2,00
Ges amt
Anzahl
Erwartete Anzahl
Anzahl
Erwartete Anzahl
Anzahl
Erwartete Anzahl
6
4,8
0
1,2
6
6,0
noten
3,00
2
1,6
0
,4
2
2,0
5,00
0
1,6
2
,4
2
2,0
Ges amt
8
8,0
2
2,0
10
10,0
Gender
1,00
1,00
1,00
1,00
1,00
1,00
1,00
1,00
2,00
2,00
Note
2,00
2,00
2,00
2,00
3,00
2,00
3,00
2,00
5,00
5,00
class * survival Kreuztabelle
clas s
Firs t Class
Second Clas s
Third Clas s
Crew
Ges amt
Anzahl
Erwartete Anzahl
Anzahl
Erwartete Anzahl
Anzahl
Erwartete Anzahl
Anzahl
Erwartete Anzahl
Anzahl
Erwartete Anzahl
s urvival
Survival
Mis sing
203
122
105,0
220,0
118
167
92,1
192,9
178
528
228,1
477,9
212
673
285,9
599,1
711
1490
711,0
1490,0
Ges amt
325
325,0
285
285,0
706
706,0
885
885,0
2201
2201,0
Wie berechnet SPSS die erwarteten Werte in einer Kreuztabelle?
Dazu wählen Sie bitte die Datei „Titanic.sav“ aus. Die Datei enthält die Daten von
2201 Passagieren, die sich an Bord der Titanic befanden. Die zu klärende Frage
lautet hier: War die Überlebenswahrscheinlichkeit nach dem Untergang des Schiffes
von der Klasse abhängig?
Dazu erstellen wir wie oben beschrieben eine Kreuztabelle mit „survival“ in der Spalte
und „class“ in den Zeilen, „beobachtet“ und „erwartet“ werden aktiviert. Es ergibt sich
folgende Tabelle:
class * survival Kreuztabelle
clas s
Firs t Class
Second Clas s
Third Clas s
Crew
Ges amt
Anzahl
Erwartete Anzahl
Anzahl
Erwartete Anzahl
Anzahl
Erwartete Anzahl
Anzahl
Erwartete Anzahl
Anzahl
Erwartete Anzahl
s urvival
Survival
Mis sing
203
122
105,0
220,0
118
167
92,1
192,9
178
528
228,1
477,9
212
673
285,9
599,1
711
1490
711,0
1490,0
Ges amt
325
325,0
285
285,0
706
706,0
885
885,0
2201
2201,0
class * survival Kreuztabelle
clas s
Firs t Class
Second Clas s
Third Clas s
Crew
Ges amt
Anzahl
Erwartete Anzahl
Anzahl
Erwartete Anzahl
Anzahl
Erwartete Anzahl
Anzahl
Erwartete Anzahl
Anzahl
Erwartete Anzahl
s urvival
Survival
Mis sing
203
122
105,0
220,0
118
167
92,1
192,9
178
528
228,1
477,9
212
673
285,9
599,1
711
1490
711,0
1490,0
Ges amt
325
325,0
285
285,0
706
706,0
885
885,0
2201
2201,0
Berechnet werden die Zahlen „Erwartet“ wie folgt:
In der ersten Zeile wurden 203 Gerettete beobachtet. Die Gesamtzahl der Passagiere
in der ersten Klasse betrug 325. Ingesamt wurden 711 Personen gerettet, an Bord
waren insgesamt 2201 Personen. Die Rechnung lautet jetzt:
711 mal 325 = 231075, geteilt durch 2201 macht 104,98 (~ 105)
Sie können diese Berechnung selbstverständlich auch als Dreisatz formulieren:
von 2201 (Gesamt)
überlebten 711
von 325 (erste Klasse) überlebten X
class * survival Kreuztabelle
clas s
Firs t Class
Second Clas s
Third Clas s
Crew
Ges amt
Anzahl
Erwartete Anzahl
Anzahl
Erwartete Anzahl
Anzahl
Erwartete Anzahl
Anzahl
Erwartete Anzahl
Anzahl
Erwartete Anzahl
s urvival
Survival
Mis sing
203
122
105,0
220,0
118
167
92,1
192,9
178
528
228,1
477,9
212
673
285,9
599,1
711
1490
711,0
1490,0
Ges amt
325
325,0
285
285,0
706
706,0
885
885,0
2201
2201,0
Jetzt können Sie die Anzahl der (beobachteten) Anzahl von Personen mit der
„Erwarteten Anzahl“ vergleichen. In der ersten Klasse sehen Sie dabei, dass 203
Personen gerettet wurden, erwartet wurden jedoch „nur“ 105. Es sind somit deutlich
mehr Personen der ersten Klasse gerettet worden, als zu erwarten gewesen wäre.
Vergleichen Sie dies mit den Passagieren der dritten Klasse: Dort wurden 178
Passagiere gerettet, während ~ 286 zu erwarten gewesen wären. Kurz: die Überlebenswahrscheinlichkeit in der ersten Klasse war deutlich größer als die in der
“preiswerteren” dritten Klasse.
Wenn Sie jetzt wissen möchten, welche Personengruppe die höchste Überlebenswahrscheinlichkeit an Bord hatte, dann bietet die Kreuztabelle eine sehr schöne,
einfache Form, um diese Frage zu beantworten. Dazu müssen Sie wie zuvor in der
Dialogbox „Kreuztabelle“ wieder „class“ in die Zeile und „survival“ in die Spalten
setzen. „Age“ setzen Sie jetzt in die „Schicht 1 von 2“ und drücken „Weiter“. Jetzt
verschieben Sie „gender“ in die „zweite Schicht“.
Zusätzlich müssen Sie jetzt noch im Feld „Zellen“ „Häufigkeiten“ „Beobachtet“ und
„Erwartet“, sowie unter „Prozentwerte“ alle drei Rubriken „Zeilenweise“, „Spaltenweise“
und „Gesamt“ setzen (siehe untere Abbildung).
Wenn Sie jetzt auf „OK“ gehen, sehen Sie das auf der nächsten Seite in zwei
Spalten aufgeteiltes Resultat. Sie werden schnell erkennen können, dass die Kinder in
der ersten und zweiten Klasse zu 100% überlebten, die Frauen in der ersten Klasse
zu 97,2% und die Männer der zweiten Klasse mit 8,3% die schlechteste Überlebenschance hatten.
class * survival * age * gender Kreuztabelle
gender
Male
age
Adult
clas s
Firs t Class
Second Clas s
Third Clas s
Crew
Ges amt
Children
clas s
Firs t Class
Second Clas s
Third Clas s
Ges amt
Female
Adult
clas s
Firs t Class
Anzahl
Erwartete Anzahl
% von clas s
% von s urvival
% der Ges amtzahl
Anzahl
Erwartete Anzahl
% von clas s
% von s urvival
% der Ges amtzahl
Anzahl
Erwartete Anzahl
% von clas s
% von s urvival
% der Ges amtzahl
Anzahl
Erwartete Anzahl
% von clas s
% von s urvival
% der Ges amtzahl
Anzahl
Erwartete Anzahl
% von clas s
% von s urvival
% der Ges amtzahl
Anzahl
Erwartete Anzahl
% von clas s
% von s urvival
% der Ges amtzahl
Anzahl
Erwartete Anzahl
% von clas s
% von s urvival
% der Ges amtzahl
Anzahl
Erwartete Anzahl
% von clas s
% von s urvival
% der Ges amtzahl
Anzahl
Erwartete Anzahl
% von clas s
% von s urvival
% der Ges amtzahl
Anzahl
Erwartete Anzahl
% von clas s
% von s urvival
s urvival
Survival
Mis sing
57
118
35,5
139,5
32,6%
67,4%
16,9%
8,9%
3,4%
7,1%
14
154
34,1
133,9
8,3%
91,7%
4,1%
11,6%
,8%
9,2%
75
387
93,7
368,3
16,2%
83,8%
22,2%
29,1%
4,5%
23,2%
192
670
174,8
687,2
22,3%
77,7%
56,8%
50,4%
11,5%
40,2%
338
1329
338,0
1329,0
20,3%
79,7%
100,0%
100,0%
20,3%
79,7%
5
0
2,3
2,7
100,0%
,0%
17,2%
,0%
7,8%
,0%
11
0
5,0
6,0
100,0%
,0%
37,9%
,0%
17,2%
,0%
13
35
21,8
26,3
27,1%
72,9%
44,8%
100,0%
20,3%
54,7%
29
35
29,0
35,0
45,3%
54,7%
100,0%
100,0%
45,3%
54,7%
140
4
107,1
36,9
97,2%
2,8%
44,3%
3,7%
Ges amt
Ges amt
175
175,0
100,0%
10,5%
10,5%
168
168,0
100,0%
10,1%
10,1%
462
462,0
100,0%
27,7%
27,7%
862
862,0
100,0%
51,7%
51,7%
1667
1667,0
100,0%
100,0%
100,0%
5
5,0
100,0%
7,8%
7,8%
11
11,0
100,0%
17,2%
17,2%
48
48,0
100,0%
75,0%
75,0%
64
64,0
100,0%
100,0%
100,0%
144
144,0
100,0%
33,9%
Female
Adult
clas s
Firs t Class
Second Clas s
Third Clas s
Crew
Ges amt
Children
clas s
Firs t Class
Second Clas s
Third Clas s
Ges amt
% von clas s
% von s urvival
% der Ges amtzahl
Anzahl
Erwartete Anzahl
% von clas s
% von s urvival
% der Ges amtzahl
Anzahl
Erwartete Anzahl
% von clas s
% von s urvival
% der Ges amtzahl
Anzahl
Erwartete Anzahl
% von clas s
% von s urvival
% der Ges amtzahl
Anzahl
Erwartete Anzahl
% von clas s
% von s urvival
% der Ges amtzahl
Anzahl
Erwartete Anzahl
% von clas s
% von s urvival
% der Ges amtzahl
Anzahl
Erwartete Anzahl
% von clas s
% von s urvival
% der Ges amtzahl
Anzahl
Erwartete Anzahl
% von clas s
% von s urvival
% der Ges amtzahl
Anzahl
Erwartete Anzahl
% von clas s
% von s urvival
% der Ges amtzahl
Anzahl
Erwartete Anzahl
% von clas s
% von s urvival
% der Ges amtzahl
Anzahl
Erwartete Anzahl
% von clas s
% von s urvival
% der Ges amtzahl
27,1%
44,8%
20,3%
29
29,0
45,3%
100,0%
45,3%
140
107,1
97,2%
44,3%
32,9%
80
69,1
86,0%
25,3%
18,8%
76
122,7
46,1%
24,1%
17,9%
20
17,1
87,0%
6,3%
4,7%
316
316,0
74,4%
100,0%
74,4%
1
,6
100,0%
3,6%
2,2%
13
8,1
100,0%
46,4%
28,9%
14
19,3
45,2%
50,0%
31,1%
28
28,0
62,2%
100,0%
62,2%
72,9%
100,0%
54,7%
35
35,0
54,7%
100,0%
54,7%
4
36,9
2,8%
3,7%
,9%
13
23,9
14,0%
11,9%
3,1%
89
42,3
53,9%
81,7%
20,9%
3
5,9
13,0%
2,8%
,7%
109
109,0
25,6%
100,0%
25,6%
0
,4
,0%
,0%
,0%
0
4,9
,0%
,0%
,0%
17
11,7
54,8%
100,0%
37,8%
17
17,0
37,8%
100,0%
37,8%
100,0%
75,0%
75,0%
64
64,0
100,0%
100,0%
100,0%
144
144,0
100,0%
33,9%
33,9%
93
93,0
100,0%
21,9%
21,9%
165
165,0
100,0%
38,8%
38,8%
23
23,0
100,0%
5,4%
5,4%
425
425,0
100,0%
100,0%
100,0%
1
1,0
100,0%
2,2%
2,2%
13
13,0
100,0%
28,9%
28,9%
31
31,0
100,0%
68,9%
68,9%
45
45,0
100,0%
100,0%
100,0%
Der „Chi-Quadrat-Test“ zur Überprüfung der Unabhängigkeit von zwei Variablen
Mit diesem Test kann die Unabhängigkeit von zwei Variablen, und damit indirekt auch
die Größe des Zusammenhangs zwischen zwei Variablen geprüft werden.
Von Bedeutung ist dieser Test bspw. wenn der Frage nachgegangen werden soll,
ob – um bei dem Beispiel der Titanic zu bleiben – das Alter oder das Geschlecht
eine größere Rolle bei der Frage des Überlebens gespielt hat.
Dazu rufen wir wieder die Dialogbox „Kreuztabelle“ auf und setzen wieder, wie auf der
nächsten Folie ersichtlich, „class“ in die Zeile und „survival“ in die Spalte.
Jetzt klicken wir das Fenster „Statistik“ an und erhalten die folgende Dialogbox.
Chi-Quadrat =
∑
(„Wert beobachtet“ – „Wert erwartet“)2
„Wert erwartet“
Hier wird jetzt das Feld „“Chi-Quadrat“ aktiviert und schließlich „OK“ gegeben.
Als Ergebnis erhalten wir die schon bekannte Kreuztabelle mit den beobachteten und
erwarteten Werte und eine Tabelle, die neben anderen Werten den des
Chi-Quadrat-Tests zeigt.
Chi-Quadrat-Tests
class * survival Kreuztabelle
clas s
Firs t Class
Second Clas s
Third Clas s
Crew
Ges amt
Anzahl
Erwartete Anzahl
Anzahl
Erwartete Anzahl
Anzahl
Erwartete Anzahl
Anzahl
Erwartete Anzahl
Anzahl
Erwartete Anzahl
s urvival
Survival
Mis sing
203
122
105,0
220,0
118
167
92,1
192,9
178
528
228,1
477,9
212
673
285,9
599,1
711
1490
711,0
1490,0
Wert
Ges amt
325
325,0
285
285,0
706
706,0
885
885,0
2201
2201,0
Chi-Quadrat nach
Pears on
Likelihood-Quotient
Zus ammenhang
linear-mit-linear
Anzahl der gültigen Fälle
190,401
Asymptotis ch
e Signifikanz
(2-s eitig)
df
a
3
,000
180,901
3
,000
162,042
1
,000
2201
a. 0 Zellen (,0%) haben eine erwartete Häufigkeit kleiner 5. Die
minimale erwartete Häufigkeit is t 92,06.
Bevor die Bedeutung dieses Wertes erläutert wird, berechnen Sie bitte den
Chi-Quadrat-Test für die Variablen „Überleben“ und „Alter“
Wechseln Sie also im Feld „Zeilen“ die Variable „class“ durch die Variable „age“ aus:
Jetzt erhalten Sie die folgenden Tabellen und Werte:
age * survival Kreuztabelle
age
Adult
Children
Ges amt
Anzahl
Erwartete Anzahl
Anzahl
Erwartete Anzahl
Anzahl
Erwartete Anzahl
s urvival
Survival
Mis sing
654
1438
675,8
1416,2
57
52
35,2
73,8
711
1490
711,0
1490,0
Ges amt
2092
2092,0
109
109,0
2201
2201,0
Chi-Quadrat-Tests
Wert
Chi-Quadrat nach
Pears on
Kontinuitätskorrektura
Likelihood-Quotient
Exakter Test nach Fis her
Zus ammenhang
linear-mit-linear
Anzahl der gültigen Fälle
Asymptotis ch
e Signifikanz
(2-s eitig)
df
b
20,956
1
,000
20,005
19,561
1
1
,000
,000
20,946
1
Exakte
Signifikanz
(2-s eitig)
Exakte
Signifikanz
(1-s eitig)
,000
,000
,000
2201
a. Wird nur für eine 2x2-Tabelle berechnet
b. 0 Zellen (,0%) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete Häufigkeit
is t 35,21.
Damit haben wir für die Variablen „Überleben/Klasse“
einen Chi-Quadrat-Test Wert von
und für die Variablen „Überleben/Alter“ einen Wert von
Was sagen diese Werte aus?
190,401
20,956
class * survival Kreuztabelle
clas s
Firs t Class
Second Clas s
Third Clas s
Crew
Ges amt
Anzahl
Erwartete Anzahl
Anzahl
Erwartete Anzahl
Anzahl
Erwartete Anzahl
Anzahl
Erwartete Anzahl
Anzahl
Erwartete Anzahl
Anschließend wird
dieser Wert quadriert,
(um nur positive Werte
zu erhalten) und durch
die „erwarteten Werte“
dividiert.
Diese Werte werden
schließlich aufaddiert
und wir erhalten den
Wert des
Chi-Quadrat-Tests!
s urvival
Survival
Mis sing
203
122
105,0
220,0
118
167
92,1
192,9
178
528
228,1
477,9
212
673
285,9
599,1
711
1490
711,0
1490,0
Um diese Frage zu beantworten soll
erläutert werden, wie die Werte
errechnet werden. Aus der Kreuztabelle
werden die Werte für „Beobachtet“
und „Erwartet“ jeder Zeile wie in der
unteren Tabelle zu sehen voneinander
abgezogen.
Ges amt
325
325,0
285
285,0
706
706,0
885
885,0
2201
2201,0
Beobachtet
B
Erwartet
E
B-E
(B-E) ²
(B-E)² /E
203
105
98
9604
91,46
122
220
-98
9604
43,65
118
92
26
676
7,34
167
193
-26
676
3,50
178
228
-50
2500
10,01
528
478
50
2500
5,23
212
286
-74
5476
19,15
673
599
74
5476
9,14
∑ 189,48
Einige Lehrbücher berechnen den Wert so:
Um diese Frage zu beantworten soll
erläutert werden, wie die Werte
errechnet werden. Aus der Kreuztabelle
werden die Werte für „Beobachtet“
und „Erwartet“ jeder Zeile wie in der
unteren Tabelle zu sehen voneinander
abgezogen.
class * survival Kreuztabelle
clas s
Firs t Class
Second Clas s
Third Clas s
Crew
Ges amt
Anzahl
Erwartete Anzahl
Anzahl
Erwartete Anzahl
Anzahl
Erwartete Anzahl
Anzahl
Erwartete Anzahl
Anzahl
Erwartete Anzahl
s urvival
Survival
Mis sing
203
122
105,0
220,0
118
167
92,1
192,9
178
528
228,1
477,9
212
673
285,9
599,1
711
1490
711,0
1490,0
Anschließend wird
die Wurzel aus
dem Wert E gezogen,
denn B-E durch
die Wurzel E
geteilt und
schließlich wird
das Ganze
quadriert (um nur
positive Werte
zu erhalten). Diese
Werte werden
schließlich aufaddiert
und wir erhalten den
Wert des
Chi-Quadrat-Tests!
Ges amt
325
325,0
285
285,0
706
706,0
885
885,0
2201
2201,0
Beobachtet
B
Erwartet
E
203
105
122
B-E
SQRT(E)
B-E/SQRT(E)
(B-E/SQRT (E))²
98
10,24
9,57
91,58
220
-98
14,83
-6,60
43,56
118
92
26
9,59
2,71
7,34
167
193
-26
13,89
-1,87
3,49
178
228
-50
15,09
-3,31
10,95
528
478
50
21,86
2,28
5,19
212
286
-74
16,91
-4,37
19,09
673
599
74
24,47
3,02
9,12
∑ 190,32
Um einen Aspekt zu verstehen, der diesem Wert entnommen werden kann,
verdeutlichen wir uns einmal den Fall, bei dem der beobachtetet Wert nahezu dem
erwarteten Wert entspricht:
Beobachtet B
Erwartet E
B-E
SQRT(E)
B-E/SQRT(E)
(B-E/SQRT (E))²
243
242
1
15,58
0,064
0,00411
Anschließend den Wert, der einer maximal möglichen Abweichung entspricht:
Beobachtet B
Erwartet E
B-E
SQRT(E)
B-E/SQRT(E)
(B-E/SQRT (E))²
1
243
-242
15,58
-15,53
241,18
Dieser Vergleich zeigt (hoffentlich) deutlich (einen der) hier zugrunde liegenden
Aspekte: Je höher der Chi-Quadrat-Test Wert, desto größer der Zusammenhang
zwischen den betrachteten Variablen.
Zurück zu der gestellten Frage ergibt sich folglich, dass die Variablen „Klasse“
mit dem Chi-Quadrat-Test Wert von 190,401 einen höheren Zusammenhang
zwischen dieser Variablen und dem Überleben aufweist, als die Variable „Alter“
mit einem Wert von nur 20,956.
Kurz: Mit Hilfe des Chi-Quadrat-Test Wertes kann die Stärke des Zusammenhang zwischen verschiedenen Variablen vergleichend beurteilt werden.
Folgende Hypothese soll geprüft werden:
H0 Person A besitzt keine hellseherischen Fähigkeiten
H1 Person A verfügt über hellseherische Fähigkeiten
Unter welchen Bedingungen kann H0 bestätigt/verworfen werden?
Unter welchen Bedingungen kann H1 bestätigt/verworfen werden?
Es gibt Konventionen, die als Grundlage der Entscheidung
genutzt werden können/sollten: Das Signifikanzniveau.
Irrtumswahrscheinlichkeit Bedeutung
Symbolisierung
p > 0,05
nicht signifikant
ns
p <= 0,05
signifikant
*
p <= 0,01
sehr signifikant
**
p <= 0,001
höchst signifikant
***
Wie groß ist die Wahrscheinlichkeit dreimal „Kopf“ zu erhalten,
wenn drei mal eine Münze geworfen wird?
Dazu müssen wir uns die Möglichkeiten vor Augen führen:
(K = Kopf; W = Wappen)
WWW, WWK, WKW, KWW, WKK, KWK, KKW und KKK
Wir haben folglich 8 Möglichkeiten, davon erfüllt eine
unsere Bedingung.
Die Wahrscheinlichkeit p ist demnach 1/8 oder 0,125.
Wahrscheinlichkeit p bei drei Würfen
Wie groß ist die Wahrscheinlichkeit viermal „Kopf“ zu erhalten,
wenn vier mal eine Münze geworfen wird?
Dazu erneut die Möglichkeiten: (K = Kopf; W = Wappen)
WWWW
WWWK
WWKW
WKWW
KWWW
KKKK
KKKW
KKWK
KWKK
WKKK
WWKK
WKKW
KKWW
KWWK
KWKW
WKWK
Wir haben folglich 16 Möglichkeiten, davon erfüllt eine
unsere Bedingung.
Die Wahrscheinlichkeit p ist demnach 1/16 oder 0,0625.
Signifikanzstufen
Irrtumswahrscheinlichkeit Bedeutung
Symbolisierung
p > 0,05
nicht signifikant
ns
p <= 0,05
signifikant
*
p <= 0,01
sehr signifikant
**
p <= 0,001
höchst signifikant
***
„Ein Wert von p = 0.05 besagt unter der Annahme,
dass kein Effekt existiert, dass – vereinfacht ausgedrückt, puristische Methodiker mögen mit der
Stirn runzeln – bei dieser Stichprobengröße ein
mindestens so großer Effekt nur in 5% aller
vergleichbar angelegter Studien beobachtet werden
kann.“
Rost 2007, 81
Irrtumswahrscheinlichkeit:
Ein p = 0,03 bedeutet:
Die Wahrscheinlichkeit, dass unter der Annahme,
die Nullhypothese sei richtig, das gegebene
Untersuchungsergebnis oder ein noch extremeres
auftritt, beträgt 0,03.
Signifikanzstufen
p <= 0,05 signifikant
p <= 0,01 sehr signifikant
p <= 0,001 höchst signifikant
*
**
***
Ergebnis einer hypothetischen Studie, in der die Ausbildung von
Paaren verglichen wird (aus: Sedlmeier & Renkewitz 2008, 370):
Partner
Partnerin
Studium
Realschule
Gymnasium
Realschule
Realschule
Gymnasium
Vorzeichentest nach Fischer
Vorzeichen
+
+
+
+
=
+
+
+
Es finden sich
somit 7 positive
Vorzeichen.
Ist das Ergebnis
auf dem 5%
Niveau
signifikant?
Wie hoch ist die
Wahrscheinlichkeit
für 0, 1, 2 etc.
positive Vorzeichen?
Wahrscheinlichkeiten für die einzelnen Ergebnisse in Prozentwerten
26
24,6
24
22
20,5
20,5
20
18
Wahrscheinlichkeit = 5,5 %
16
14
11,7
12
11,7
10
8
6
4,4
4,4
4
2
0
1
1
0,1
0
0,1
1
2
3
4
5
6
7
8
9
10
Eine Alternative:
ROC Kurven
Klassifikationsgüte
(Receiver Operating Characteristic)
Richtig Positive
Sensitivität t =
(relative Anzahl richtiger Treffer)
Richtig Positive + Falsch Negative
Richtig Negative
Spezifität =
(relative Anzahl falscher Alarme)
Richtig Negative + Falsch Positive
erfolgreich
„richtig positiven“
„falsch negative“
nicht-erfolgreich
Kriterium
Wenn Sie keinen nehmen, haben Sie keinen Ungeeigneten
„falsch positiven“
„richtig negative“
abgelehnt
angenommen
Wenn Sie alle nehmen, lehnen Sie keinen Geeigneten ab
Prediktor
erfolgreich
„falsch negative“
50
50
nicht-erfolgreich
Kriterium
„richtig positiven“
50
50
„falsch positiven“
„richtig negative“
abgelehnt
Prediktor
angenommen
erfolgreich
„falsch negative“
2
48
nicht-erfolgreich
Kriterium
„richtig positiven“
100
„falsch positiven“
„richtig negative“
abgelehnt
Prediktor
angenommen
ROC - Kurve
Sensitivität t (hits)
Sensitivität t (hits)
ROC - Kurve
1 – Spezifität (falsche Alarme)
Sensitivität = 50/(50 + 50) = 0,5
Spezifität = 50/(50 + 50) = 0,5
1 – Spezifität (falsche Alarme)
Sensitivität = 2/(2 + 48) = 0,04
Spezifität = 100/(100 + 0) = 1
Wohnort/Gedächtnisspanne
Geschlecht/Gedächtnisspanne
erfolgreich
„falsch negative“
1
nicht-erfolgreich
Kriterium
„richtig positiven“
99
99
1
„falsch positiven“
„richtig negative“
abgelehnt
Prediktor
angenommen
erfolgreich
2
„falsch negative“
99
nicht-erfolgreich
Kriterium
„richtig positiven“
99
„richtig negative“
abgelehnt
Prediktor
„falsch positiven“
angenommen
ROC - Kurve
Sensitivität t (hits)
Sensitivität t (hits)
ROC - Kurve
1 - Spezifität
Sensitivität = 99/(99 + 1) = 0,99
Spezifität = 99/(99 + 1) = 0,99
1 - Spezifität
Sensitivität = 2/(2 + 99) = 0,08
Spezifität = 99/(99 + 0) = 1
„class“
„age“
Die abzugebende Arbeit muss
• fünf Seiten ohne die Abbildungen/Tabellen umfassen,
• in den Fragestellungen die Aspekte Lernen und Diagnostik
enthalten.
• Alle Abbildungen/Tabellen müssen sinnvoll, verständlich und
inhaltlich richtig sein.
• Alle Abbildungen/Tabellen müssen durchnummeriert sein und
eine Erläuterung aufweisen
• Literaturbezüge sind erforderlich und folglich auch ein
Literaturverzeichnis
• Die Ergebnisse müssen in einem zusammenfassende
Abschluss bewertet werden
• Die Arbeit muss lesbar, verständlich und formal richtig sein.
Exkurs:
Vergabe von Noten – Grundannahmen & Verfahrensschritte
Literatur zum Thema:
Gerster, H. D. (1982). Schülerfehler bei schriftlichen
Rechenverfahren – Diagnose und Therapie. Freiburg i. B.: Herder.
Henze, G. & Nauck, J. (1985). Testen und Beurteilen.
Grundfragen pädagogischer Diagnostik. Bad Heilbrunn: Klinkhardt.
Weinert, F. E. (Hrsg.) (2002). Leistungsmessungen in der Schule.
Weinheim, Basel: Beltz.
Grüning, B.; Kaiser, G.; Kreitz, R.; Rauschenberger, H. & Rinninsland, K. (1999).
Leistung und Kontrolle. Weinheim: Juventa.
Wagner, M. (2002). Ziffernzensuren oder verbale Beurteilung? Weinheim: Beltz.
Herunterladen