Analytische Statistik II

Werbung
Analytische Statistik II
Statistik mit R
Heike Zinsmeister
24.11.2011
Testen
•  Anpassungstests (goodness of fit)
–  Weicht eine gegebene Verteilung signifikant von
einer bekannten Verteilung ab?
–  Weicht der Mittelwert oder die
Standardabweichung einer gegebenen Stichprobe
signifikant von einem anderweitig gegebenen
Mittelwert oder Standardabweichung signifikant
ab?
•  Unterschiedstests
–  Weicht eine gegebene Verteilung signifikant von
einer anderen ebenfalls gegebenen Verteilung ab?
1
Wiederholung: Anpassungstests
• 
Test auf Normalverteilung
– 
• 
eine abhängige Variable auf Verhältnisniveau
•  Shapiro-Wilk-Test, shapiro.test()
•  Alternative graphische Einschätzung: q-q-Plot, qqnorm()
Test, ob zwei Ausprägungen einer Variable gleichverteilt
sind
– 
eine abh. Variable auf Nominal/Kategorialniveau
•  absolute Häufigkeiten: Chi-Quadrat-Test, chisq.test
(Vektor, p=c
(Vektor_d_erw_Wahrscheinlichkeiten))
•  relative Häufigkeiten: Proportionstest, prop.test()
2
Anpassungstest: Fall 1
•  eine abhängige Variable auf
Verhältnisniveau
•  Normalverteilung?
•  Prüfstatistik
shapiro.test(TEMPUS_ASPEKT)
Shapiro-Wilk normality test
data: TEMPUS_ASPEKT
W = 0.9942, p-value = 0.9132
p>0.05
H1 darf nicht angenommen werden
H0 gilt: Daten sind normalverteilt
3
Quantile-Quantile-Plot
qqnorm(TEMPUS_ASPEKT)
qqline(TEMPUS_ASPEKT)
•  Unsere Beispieldaten:
4
Unterschiedstest
•  Fall 1
–  Daten
•  eine unabhängige Variable auf Nominalniveau
•  eine abhängige Variable auf Verhältnisniveau
•  unabhängige Stichproben
–  Frage
•  Unterscheiden sich zwei Verteilungen generell (nicht nur
bzgl. Mittelwert / Standard-abweichung)?
–  Test
•  Ermittelt die größte Differenz beider Verteilungsfunktionen
–  Methode: Zweistichproben-Kolmogorov-Smirnov-Test,
ks.test()
5
Zweistichproben-Kolmogorov-Smirnov-Test
• 
Ablaufschema
1.  Formulieren der Hypothese
2.  Tabellierung der beobachteten Häufigkeiten;
graphische Betrachtung
3.  Berechnung der kumulativen
Verteilungsfunktionen für beide Stichproben
4.  Berechnung der maximalen absoluten Differenz
D der beiden Verteilungsfunktionen
5.  Ermittlung der Irrtumswahrscheinlichkeit p
6
Zweistichproben-Kolmogorov-Smirnov-Test
• 
Experiment
–  Heckenwortdaten (sort of, kind of,..)
• 
Frage
–  Unterscheiden sich die Anzahlen von
Heckenwörtern, die Männer und Frauen im
Diskurs verwenden signifikant?
• 
Daten
–  2-minütige Aufnahmen von 30 Männern und 30
Frauen
7
Zweistichproben-Kolmogorov-Smirnov-Test
• 
• 
H0: Die Verteilungen der
Variablenausprägungen der Variable
HEDGES variiert nicht in Abhängigkeit von
der Variable GESCHLECHT; D=0.
H1: Die Verteilungen der
Variablenausprägungen der Variable
HEDGES variiert in Abhängigkeit von der
Variable GESCHLECHT; D>0.
8
Zweistichproben-Kolmogorov-Smirnov-Test
• 
Stripchart
# Datei: /Users/cluser/_sflwr/_inputfiles/
g_data_chapters_1-5/04-1-2-1_hedges.txt
Hedges<-read.table(file=file.choose(), header=T, sep="\t")
attach(Hedges)
stripchart(HEDGES~GESCHLECHT, method="jitter", xlim=c(0,
25), xlab="Anzahl an Hedges", ylab="Geschlecht")
9
rug(jitter(HEDGES), side=1)
Zweistichproben-Kolmogorov-Smirnov-Test
• 
Histogramme
par(mfrow=c(1,2))hist(HEDGES[GESCHLECHT=="M"], xlim=c(0,
25), ylim=c(0, 10), ylab="Haeufigkeit", main="")hist
(HEDGES[GESCHLECHT=="W"], xlim=c(0, 25), ylim=c(0, 10),
ylab="Haeufigkeit", main="")
10
Zweistichproben-Kolmogorov-Smirnov-Test
• 
Berechnung der kumulativen
Verteilungsfunktionen für beide Stichproben
–  sortieren der Werte des Vektors GESCHLECHT
nach den Werten des Vektors HEDGES
–  sortieren der Werte des Vektors HEDGES
GESCHLECHT<-GESCHLECHT[order(HEDGES)]
HEDGES<-HEDGES[order(HEDGES)]
11
Zweistichproben-Kolmogorov-Smirnov-Test
• 
Berechnung der maximalen absoluten
Differenz D der beiden Verteilungsfunktionen
–  Prozenttabelle
10 % der vert.dists<-prop.table(table(HEDGES,
Männer habenGESCHLECHT), margin=2); vert.dists
GESCHLECHT
genau 5
M
W
Heckenwörter HEDGES
3 0.03333333 0.00000000
geäußert
4 0.10000000 0.00000000
5 0.10000000 0.00000000
6 0.13333333 0.00000000
8 0.06666667 0.00000000
9 0.06666667 0.03333333
10 0.00000000 0.03333333
11 0.06666667 0.03333333 ... (bis f=19)
12
Zweistichproben-Kolmogorov-Smirnov-Test
• 
Berechnung der maximalen absoluten
Differenz D der beiden Verteilungsfunktionen
–  zeilenweise kumulative Prozentzahlen
–  Differenzbildung
differenzen<-cumsum(vert.dists[,1])-cumsum(vert.dists[,2])
max(abs(differenzen))
[1] 0. 4666667
13
Zweistichproben-Kolmogorov-Smirnov-Test
• 
Maximale Differenz
40% der Männer
verwenden
Heckenwörter in
(so geringen)
Anzahlen, die bei
den Frauen gar
nicht vertreten
sind.
D= 0,4667
plot(cumsum(vert.dists[,1]), type="b", col="black", xlab="Anzahlen an
Heckenwoertern", ylab="Kumulative Haeufigkeit in %", xlim=c(0, 16)); grid()
lines(cumsum(vert.dists[,2]), type="b", col="darkgrey")text(2.5, 0.9,
labels="Maenner", col="black")text(14, 0.1, labels="Frauen", col="darkgrey")
lines(c(8, 8), c(cumsum(vert.dists[,1])[8], cumsum(vert.dists[,2])[8]),
14
lty=2)
(Gries 2008: 168)
Zweistichproben-Kolmogorov-Smirnov-Test
• 
Der Test in Kurzfassung
–  ks.test(Vektor1, Vektor2, alternative =c("twosided", "greater", "less") # Default: "two-sided
ks.test(HEDGES[GESCHLECHT=="M"], HEDGES[GESCHLECHT=="W"])
bei diskreten
Werten sind
data: HEDGES[GESCHLECHT == "M"] and HEDGES[GESCHLECHT ==
"W"]
Mehrfachvorko
D = 0.4667, p-value = 0.002908
mmen möglich
alternative hypothesis: two-sided
= "tie"
Two-sample Kolmogorov-Smirnov test
Warning message:
In ks.test(HEDGES[GESCHLECHT == "M"], HEDGES[GESCHLECHT == "W"]) :
kann bei Bindungen nicht die korrekten p-Werte berechnen
15
Zweistichproben-Kolmogorov-Smirnov-Test
• 
Interpretation
"Gemäß einem Kolmogorov-SmirnovUnterschiedstest gibt es einen signifikanten
Unterschied in der Verteilung der Anzahlen von
Heckenwörtern zwischen Männern und Frauen:
Frauen verwenden im Schnitt etwas mehr
Heckenwörter und verhalten sich insgesamt
homogener als Männer, deren
Heckenwörterhäufigkeiten im Schnitt geringer
sind, aber sehr viel stärker streuen und aus zwei
Gruppen -- "Geringhedger" und "Vielhedger" -zu bestehen scheinen (D=0,4667, pzweiseitig<
0.01).
(Gries 2008: 168)
16
Einschub
•  Einstichproben Kolmogorov-Smirnov-Test als
alternativer Test auf Normalverteilung (oder andere
Standardverteilungen)
ks.test(HEDGES, "pnorm", mean(HEDGES), sd(HEDGES))
One-sample Kolmogorov-Smirnov test
data: HEDGES
D = 0.159, p-value = 0.09629
alternative hypothesis: two-sided
•  hier: Nullhypothese, dass HEDGES normalverteilt ist,
kann nicht verworfen werden, da p> 0.05.
17
Unterschiedstest
•  Fall 2
–  Daten
•  eine unabhängige Variable auf Nominal- oder
Kategorialniveau
•  eine abhängige Variable auf Nominal- oder
Kategorialniveau
•  unabhängige Stichproben
–  Frage
•  Haben die Ausprägungen der unabhängigen Variable
einen Einfluss auf die beobachteten Häufigkeiten der
abhängigen Variable?
–  Test
•  Chi-Quadrat-Unterschiedstest, chisq.test(table
(X,Y),correct=T/F)
18
Chi-Quadrat-Unterschiedstest
•  Ablaufschema
–  Formulieren der Hypothese
–  Tabellierung der beobachteten Häufigkeiten; graphische
Betrachtung
–  Ermittlung der Häufigkeiten, die nach H0 zu erwarten wären
–  Testen der Voraussetzungen
–  Berechnung der Abweichungsmaße für alle beobachteten
Häufigkeiten
–  Summierung der Abweichungsmaße zur Ermittlung der
Prüfstatistik χ2
–  Ermittlung der Freiheitsgrade df und der
Irrtumswahrscheinlichkeit p.
19
Chi-Quadrat-Unterschiedstest
•  Voraussetzungen
–  Alle Beobachtungen sind voneinander
unabhängig.
–  80% der erwarteten Häufigkeiten sind größer oder
gleich 5
–  Alle erwarteten Häufigkeiten sind größer 1
20
Chi-Quadrat-Unterschiedstest
•  Experiment
–  die uns bekannten Verb-Partikel-Objekt-Daten
–  abhängige Variable: KONSTRUKTION
•  Verb-Partikel-Direktes_Objekt
•  Verb-Direktes_Objekt-Partikel
–  unabhängige Variable: BEKANNTHEIT
•  Referent des direkten Objekts ist bekannt
•  Referent des direkten Objekts ist unbekannt
–  unabhängige Stichproben, da die Kategorisierung
der einzelne Objekte nichts mit der
Kategorisierung anderer Objekte zu tun hat
21
Chi-Quadrat-Unterschiedstest
•  Hypothesen
–  H0: Die Häufigkeiten der Variablenausprägungen
der Variabel KONSTRUKTION variiert nicht in
Abhängigkeit von der Variable BEKANNTHEIT
–  H1: Die Häufigkeiten der Variablenausprägungen
der Variabel KONSTRUKTION variiert in
Abhängigkeit von der Variable BEKANNTHEIT
22
Chi-Quadrat-Unterschiedstest
•  Tabellierung der beobachteten Häufigkeiten
•  Experiment
–  Beschreibungen von Bildern (Peters 2001)
–  einschließlich Vorerwähntheit im Diskurs
Referent des
DO bekannt
Referent des
DO unbekannt
Zeilensummen
V DO Part
85
65
150
V PART DO
100
147
247
Spaltensumm
en
185
212
397
23
Chi-Quadrat-Unterschiedstest
•  Graphische Betrachtung
# Aufräumen, damit Variablen nicht schon belegt sind
rm(list=ls(all=T))
# Datei: /Users/cluser/_sflwr/_inputfiles/
g_data_chapters_1-5/04-1-2-2_vpcs.txt
VPCs<- read.table(file=file.choose(), header=T,sep="\t"); attach
(VPCs); str(VPCs)
The following object(s) are masked from VPCs ( position 3 ) :
BEKANNTHEIT FALL KONSTRUKTION
'data.frame': 397 obs.
$ FALL
: int 1
$ BEKANNTHEIT : Factor
1 1 1 1 1 ...
$ KONSTRUKTION: Factor
1 1 1 1 1 1 ...
of 3 variables:
2 3 4 5 6 7 8 9 10 ...
w/ 2 levels "bekannt","unbekannt": 1 1 1 1 1
w/ 2 levels "V_DO_Part","V_Part_DO": 1 1 1 1
24
Chi-Quadrat-Unterschiedstest
•  Graphische Betrachtung
Ist der
Unterschied
signifikant?
plot(KONSTRUKTION~BEKANNTHEIT)
25
Chi-Quadrat-Unterschiedstest
•  Ermitteln der erwarteten Werte
•  Erster Versuch: Gleichverteilung
–  scheitert an Ungleichverteilung der Variablen ansich
Referent des
DO bekannt
Referent des
DO unbekannt
Zeilensummen
V DO Part
100
85
100
65
200
150
V PART DO
100
100
147
200
247
Spaltensumm
en
200
185
200
212
400
397
26
Chi-Quadrat-Unterschiedstest
•  Ermitteln der erwarteten Werte
•  Zweiter Versuch
–  Berücksichtigung der Randsummen
–  Wahrscheinlichkeiten/Prozentwerte
–  unabhängiges gemeinsames Auftreten p(A,B)=p(A)*p(B)
Referent des
DO bekannt
Referent des
DO unbekannt
Zeilensummen
V DO Part
150/397= 37,78%
V PART DO
247/397= 62,22%
Spaltensumm
185/397= 46,60% 212/397= 53,40%
en
397 = 100%
27
Chi-Quadrat-Unterschiedstest
•  Ermitteln der erwarteten Werte
n erwarteterZellenwert
€
Zeilensumme Spaltensumme
=
⋅
⋅n
n
n
Zeilensumme ⋅ Spaltensumme
=
n
Referent des
DO bekannt
V DO Part
Referent des
DO unbekannt
(150*185)/ 397 =
69,9
150
V PART DO
Spaltensumm
en
Zeilensummen
247
185
212
397
28
Chi-Quadrat-Unterschiedstest
•  Ermitteln der erwarteten Werte
n erwarteterZellenwert
€
Zeilensumme Spaltensumme
=
⋅
⋅n
n
n
Zeilensumme ⋅ Spaltensumme
=
n
Referent des
DO bekannt
Referent des
DO unbekannt
Zeilensummen
V DO Part
(150*185)/ 397 =
69,9
(150*212)/ 397=
80,1
150
V PART DO
(247*185)/397=
115,1
(247*212)/397=
131,9
247
Spaltensumm
en
185
212
397
29
Chi-Quadrat-Unterschiedstest
•  Hypothesen
–  Gleichverteilung bedeutet hier nicht: "Die Häufigkeiten in
den Tabellenzellen sind gleich groß"
–  sondern: "Die Häufigkeiten in den unterschiedlichen
Bedingungen sind gleich der Verhältnisse der
Randsummen."
•  69,9/80,1 ≈ 115,1/131,9 ≈ 185/212 ≈0,8768
•  69,9/115,1 ≈ 80,1/131,9 ≈150/247 ≈ 0,6073
R-DO bekannt
R-DO unbekannt
Zeilensummen
V DO Part
69,9
80,1
150
V PART DO
115,1
131,9
247
Spaltensummen
185
212
397
30
Chi-Quadrat-Unterschiedstest
•  Hypothesen
–  H0: χ2 = 0
–  H1: χ2 > 0
•  Voraussetzungen?
–  Es besteht Unabhängigkeit, da angenommen wird,
dass jeder Versuchsperson nur einen Satz
formuliert hat
31
Chi-Quadrat-Unterschiedstest
•  Abweichungen ermitteln
Chi − Quadrat = χ = ∑
2
€
(beobachtet − erwartet )
n
i=1
erwartet
R-DO bekannt
R-DO unbekannt
V DO Part
3,26
2,85
V PART DO
1,98
1,73
Spaltensummen
2
Zeilensummen
χ2 = 9,82
•  Freiheitsgrade
df =(Zeilenzahl-1) *(Spaltenzahl-1)=(2-1)*(2-1)=1
32
Einschub: Freiheitsgrade
•  Werden die erwarteten Häufigkeiten aus
beobachteten ermittelt gilt:
df =(Zeilenzahl-1) *(Spaltenzahl-1)
•  Werden sie aus einer bekannten Verteilung
errechnet:
df =(Zeilenzahl*Spaltenzahl)-1
33
Chi-Quadrat-Unterschiedstest
•  Interpretation
•  Kritische χ2-Werte für pzweiseitig
df=1
df=2
df=3
p=0,05
3,841
5,991
7,815
p=0,01
6,635
9,21
11,345
p=0,001
10,827
13,815
16,266
•  mit χ2 =9,82 gilt 0,001 < p <0,01
•  das Ergebnis ist signifikant, aber nicht hoch
signifikant
34
Chi-Quadrat-Unterschiedstest
•  der eigentliche Test in R
chisq.test(table(KONSTRUKTION, BEKANNTHEIT),
correct=F)
Pearson's Chi-squared test
data: table(KONSTRUKTION, BEKANNTHEIT)
X-squared = 9.8191, df = 1, p-value = 0.001727
•  correct = Kontinuitätskorrektur, relevant bei
kleinen n.
35
Chi-Quadrat-Unterschiedstest
•  die volle Information erhält man durch
Zuweisung des Tests auf eine Variable
test<- chisq.test(table(KONSTRUKTION,
BEKANNTHEIT), correct=F); str(test)
List of 8
$ statistic: Named num 9.82
..- attr(*, "names")= chr "X-squared"
$ parameter: Named num 1
..- attr(*, "names")= chr "df"
usw.
•  direktes Ansprechen von Teilinformationen
chisq.test(table(KONSTRUKTION, BEKANNTHEIT),
correct=F)$statistics
36
Chi-Quadrat-Unterschiedstest
•  Wie ermittelt man die Effektstärke?
•  Problem
–  Chi-Quadrat-Wert ist abhängig von der
Stichprobengröße
•  Lösung
–  Korrelationskoeffizient
χ2
φ bzw. CI =
n ⋅ (min[ Zeilenzahl,Spaltenzahl] −1)
€
•  φ: bei k×2/m×2-Tabellen
•  Cramers V: bei k×m-Tabellen mit k,m>2
•  Grenzwerte: 0= Nullkorrelation, 1=perfekte
Korrelation
37
Chi-Quadrat-Unterschiedstest
•  Bestimmung der Effektstärke über den
Korrelationskoeffizienten φ
χ2
φ bzw. CI =
n ⋅ (min[ Zeilenzahl,Spaltenzahl] −1)
data <- table(KONSTRUKTION, BEKANNTHEIT)
€
sqrt(chisq.test(data, correct=F)$statistic/ sum
(data)*(min(dim(data))-1))
X-squared
0.1572683
•  Interpretation: Zusammenhang eher zufällig
38
Chi-Quadrat-Unterschiedstest
Für 2×2-Tabellen: Bestimmung der Effektstärke über die
Odds Ratio
•  Die Odds eines Ereignisses E (mit zwei
Ausprägungen)
pE
odds =
1− pE
•  Vergleiche
–  Wahrscheinlichkeit P: Häufigkeit eines Ereignisses in Bezug
€
auf die Gesamtheit
aller Ereignisse
–  Odds O:Wahrscheinlichkeit eines Ereignisses in Bezug auf
Wahrscheinlichkeit seines Nicht-Eintretens
•  Odds Ratio zweier Ereignisse O1/O2
39
Einschub odds ratio
•  Beispiel: Regentage vs. Sonnentage
–  p(Regentag) = 1-p(Sonnentag)
–  Sei
•  p(Regentag_August) = 3/4= 0.75
•  p(Regentag_Juli) = 2/7 = 0.2857143
–  dann gilt
•  O(Regentag_August) = 0.75/0.25 = 3:1
•  O(Regentag_Juli)= (2/7)/1-(2/7)= 2:5
–  Eine Wahrscheinlichkeit von 0,75 oder 75% entspricht den
odds von 3:1 ("3 zu 1")
–  Auf dreimal das Ereignis kommt jeweils einmal das NichtEreignis
3/1
–  odds ratio(Regentag_August/Regentag_Juli) = 2 /5 = 7.5
–  O(Regentag_August) ist 7,5 mal größer als O(Regen_Juli)
€
40
Einschub odds ratio
•  Grenzwerte
–  Wahrscheinlichkeit
•  zwischen 0 und 1
–  Odds
•  zwischen 0 und ∞
•  O=1 entspricht p=0.5
–  Odds ratio
•  zwischen 0 und ∞
•  O1/O2 = 1 bedeutet, dass zwischen den Ereignissen kein
Unterschied besteht
41
Chi-Quadrat-Unterschiedstest
Referent des
DO bekannt
Referent des
DO unbekannt
Zeilensummen
V DO Part
85
65
150
V PART DO
100
147
247
Spaltensumm
en
185
212
397
•  Odds ratio = 85 /65 = 1.9223
100 /147
•  Die Konstruktion V DO PART ist 1,9223 mal
wahrscheinlicher, wenn der Referent des
DOs€bekannt ist, als wenn er es nicht ist.
42
Chi-Quadrat-Unterschiedstest
•  Zusammenfassung
"Unbekannte Objekte werden bevorzugt in der VerbPartikel-Konstruktion eingesetzt, in der die Partikel
direkt dem Verb folgt; sie dispräferieren die VerbPartikel-Konstruktion, in der die Partikel dem direkten
Objekt folgt. Demgegenüber werden bekannte
Objekte vorzugsweise in die Verb-Partikel-Konstruktion eingesetzt, in der die Partikel dem direkten
Objekt folgt; bekannte Objekte in der anderen
Konstruktion werden dispräferiert. Diese Präferenz ist
gemäß einem Chi-Quadrat-Unterschiedstest
signifikant (χ2=9,82;df=1;pzweiseitig<0,001), aber der
Effekt ist schwach(φ=0,157, odds ratio=1,9223)."
(nach Gries 2008:180)
43
Chi-Quadrat-Unterschiedstest
•  Von welchen Ausprägungen stammen signifikante
Unterschiede?
–  Quadrierung der Pearson Residuals
–  χ2=3,841; df=1; pzweiseitig<0,05
chisq.test(table(KONSTRUKTION, BEKANNTHEIT),
correct=F)$residuals^2
BEKANNTHEIT
KONSTRUKTION bekannt unbekannt
V_DO_Part 3.262307 2.846825
V_Part_DO 1.981158 1.728841
alle Werte kleiner als
χ2=3,841
44
Chi-Quadrat-Unterschiedstest
•  Waren die einzelnen Werte größer oder kleiner als
erwartet?
–  Residuals ohne Quadrierung
chisq.test(table(KONSTRUKTION, BEKANNTHEIT),
correct=F)$residuals
BEKANNTHEIT
KONSTRUKTION
bekannt unbekannt
V_DO_Part 1.806186 -1.687254
V_Part_DO -1.407536 1.314854
45
Chi-Quadrat-Unterschiedstest
•  Waren die einzelnen Werte größer oder kleiner als
erwartet?
Höhe ist proportional
zu Residuals;
Breite proportional zu
Wurzel der zu
erwartenden
Häufigkeit; Fläche ist
proportional zu
Differenz zwischen
beobachteter und
erwarteter Häufigkeit
assocplot(table(KONSTRUKTION, BEKANNTHEIT), col=c("black",
"darkgrey"))
46
Chi-Quadrat-Unterschiedstest
•  Bei zu kleinen Werten für die erwarteten
Häufigkeiten
–  bei chisq.test() Argument
simulate.p.value=TRUE oder
–  Fisher's exact test verwenden: fisher.test()
47
Unterschiedstest
•  Fall 3
–  Daten
•  eine abhängige Variable auf Nominal- oder
Kategorialniveau
•  abhängige Stichproben
–  Frage
•  Haben die geänderten Bedingungen bei einer
Versuchwiederholung Einfluss auf die
Variablenverteilung?
–  Methode
•  McNemar-Test; mcnemar.test()
48
McNemar-Test
• 
Ablaufschema
1. 
2. 
3. 
4. 
Formulierung der Hypothesen
Testen der Voraussetzungen
Tabellierung der beobachteten Häufigkeiten
Ermitteln der Häufigkeiten, die gemäß Ho zu
erwarten wären
5.  Berechnung der Abweichungsmaße der
beobachteten Häufigkeiten
6.  Summierung der Abweichungsmaße zur
Ermittlung der Prüfstatistik χ2
7.  Ermittlung der Freiheitsgrade df und der
Irrtumswahrscheinlichkeit p
49
McNemar-Test
• 
Hypothesen
–  H0: Häufigkeiten der Urteile in beiden
Untersuchungen sind gleich groß; χ2=0
–  H1: Häufigkeiten der Urteile in beiden
Untersuchungen sind nicht gleich groß; χ2>0
50
McNemar-Test
•  Voraussetzungen
–  die Untersuchungseinheiten sind paarweise von
einander abhängig
–  die erwarteten Häufigkeiten müssen größer 5 sein
51
McNemar-Test
•  Experiment
–  Hat metalinguistisches Wissen Einfluss auf
Akzeptabilitätsurteile?
•  linguistische Laien beurteilen 100 Sätze:
"akzeptabel"/ "inakzeptabel"
•  Linguistische Schulung
•  Wiederholung der Satzbeurteilung
52
McNemar-Test
• 
Daten
#Datei: ... PFAD.../04-1-2-3_akzurteile.txt
rm(list=ls(all=T))
AkzVorherNachher <-read.table(file=file.choose(),
header=T, sep="\t")
attach(AkzVorherNachher); str(AkzVorherNachher)
'data.frame':
100 obs. of 3 variables:
$ SATZ
: int 1 2 3 4 5 6 7 8 9 10 ...
$ VORHER : Factor w/ 2 levels
"akzeptabel","inakzeptabel": 1 1 1 1 1 1 1 1 1 1 ...
$ NACHHER: Factor w/ 2 levels
"akzeptabel","inakzeptabel": 1 1 1 1 1 1 1 1 1 1 ...
53
McNemar-Test
• 
Daten
addmargins(table(VORHER,NACHHER))
NACHHER
VORHER
akzeptabel inakzeptabel Sum
akzeptabel
31
39 70
inakzeptabel
13
17 30
Sum
44
56 100
• 
McNemar berücksicht nur Änderungsfälle
54
McNemar-Test
• 
Test in R:
mcnemar.test(table(VORHER, NACHHER),
correct=F)
McNemar's Chi-squared test
data: table(VORHER, NACHHER)
McNemar's chi-squared = 13, df = 1, p-value
= 0.000311544
55
McNemar-Test
• 
Interpretation:
"Die Art, wie Versuchspersonen nach der
Schulung zum Zweck der Akzeptabilitätsurteile
ihre Meinung änderten (52 von 100
Versuchspersonen), ist gemäß einem McNemarTest signifikant anders als vom Zufall erwartet: in
der zweiten Untersuchung wurde deutlich
weniger "akzeptabel" als Bewertung abgegeben
(χ2=13; df=1; pzweiseitig<0,001)."
(Gries 2008: 185)
56
Zugehörige Unterlagen
Herunterladen