Analytische Statistik II Statistik mit R Heike Zinsmeister 24.11.2011 Testen • Anpassungstests (goodness of fit) – Weicht eine gegebene Verteilung signifikant von einer bekannten Verteilung ab? – Weicht der Mittelwert oder die Standardabweichung einer gegebenen Stichprobe signifikant von einem anderweitig gegebenen Mittelwert oder Standardabweichung signifikant ab? • Unterschiedstests – Weicht eine gegebene Verteilung signifikant von einer anderen ebenfalls gegebenen Verteilung ab? 1 Wiederholung: Anpassungstests • Test auf Normalverteilung – • eine abhängige Variable auf Verhältnisniveau • Shapiro-Wilk-Test, shapiro.test() • Alternative graphische Einschätzung: q-q-Plot, qqnorm() Test, ob zwei Ausprägungen einer Variable gleichverteilt sind – eine abh. Variable auf Nominal/Kategorialniveau • absolute Häufigkeiten: Chi-Quadrat-Test, chisq.test (Vektor, p=c (Vektor_d_erw_Wahrscheinlichkeiten)) • relative Häufigkeiten: Proportionstest, prop.test() 2 Anpassungstest: Fall 1 • eine abhängige Variable auf Verhältnisniveau • Normalverteilung? • Prüfstatistik shapiro.test(TEMPUS_ASPEKT) Shapiro-Wilk normality test data: TEMPUS_ASPEKT W = 0.9942, p-value = 0.9132 p>0.05 H1 darf nicht angenommen werden H0 gilt: Daten sind normalverteilt 3 Quantile-Quantile-Plot qqnorm(TEMPUS_ASPEKT) qqline(TEMPUS_ASPEKT) • Unsere Beispieldaten: 4 Unterschiedstest • Fall 1 – Daten • eine unabhängige Variable auf Nominalniveau • eine abhängige Variable auf Verhältnisniveau • unabhängige Stichproben – Frage • Unterscheiden sich zwei Verteilungen generell (nicht nur bzgl. Mittelwert / Standard-abweichung)? – Test • Ermittelt die größte Differenz beider Verteilungsfunktionen – Methode: Zweistichproben-Kolmogorov-Smirnov-Test, ks.test() 5 Zweistichproben-Kolmogorov-Smirnov-Test • Ablaufschema 1. Formulieren der Hypothese 2. Tabellierung der beobachteten Häufigkeiten; graphische Betrachtung 3. Berechnung der kumulativen Verteilungsfunktionen für beide Stichproben 4. Berechnung der maximalen absoluten Differenz D der beiden Verteilungsfunktionen 5. Ermittlung der Irrtumswahrscheinlichkeit p 6 Zweistichproben-Kolmogorov-Smirnov-Test • Experiment – Heckenwortdaten (sort of, kind of,..) • Frage – Unterscheiden sich die Anzahlen von Heckenwörtern, die Männer und Frauen im Diskurs verwenden signifikant? • Daten – 2-minütige Aufnahmen von 30 Männern und 30 Frauen 7 Zweistichproben-Kolmogorov-Smirnov-Test • • H0: Die Verteilungen der Variablenausprägungen der Variable HEDGES variiert nicht in Abhängigkeit von der Variable GESCHLECHT; D=0. H1: Die Verteilungen der Variablenausprägungen der Variable HEDGES variiert in Abhängigkeit von der Variable GESCHLECHT; D>0. 8 Zweistichproben-Kolmogorov-Smirnov-Test • Stripchart # Datei: /Users/cluser/_sflwr/_inputfiles/ g_data_chapters_1-5/04-1-2-1_hedges.txt Hedges<-read.table(file=file.choose(), header=T, sep="\t") attach(Hedges) stripchart(HEDGES~GESCHLECHT, method="jitter", xlim=c(0, 25), xlab="Anzahl an Hedges", ylab="Geschlecht") 9 rug(jitter(HEDGES), side=1) Zweistichproben-Kolmogorov-Smirnov-Test • Histogramme par(mfrow=c(1,2))hist(HEDGES[GESCHLECHT=="M"], xlim=c(0, 25), ylim=c(0, 10), ylab="Haeufigkeit", main="")hist (HEDGES[GESCHLECHT=="W"], xlim=c(0, 25), ylim=c(0, 10), ylab="Haeufigkeit", main="") 10 Zweistichproben-Kolmogorov-Smirnov-Test • Berechnung der kumulativen Verteilungsfunktionen für beide Stichproben – sortieren der Werte des Vektors GESCHLECHT nach den Werten des Vektors HEDGES – sortieren der Werte des Vektors HEDGES GESCHLECHT<-GESCHLECHT[order(HEDGES)] HEDGES<-HEDGES[order(HEDGES)] 11 Zweistichproben-Kolmogorov-Smirnov-Test • Berechnung der maximalen absoluten Differenz D der beiden Verteilungsfunktionen – Prozenttabelle 10 % der vert.dists<-prop.table(table(HEDGES, Männer habenGESCHLECHT), margin=2); vert.dists GESCHLECHT genau 5 M W Heckenwörter HEDGES 3 0.03333333 0.00000000 geäußert 4 0.10000000 0.00000000 5 0.10000000 0.00000000 6 0.13333333 0.00000000 8 0.06666667 0.00000000 9 0.06666667 0.03333333 10 0.00000000 0.03333333 11 0.06666667 0.03333333 ... (bis f=19) 12 Zweistichproben-Kolmogorov-Smirnov-Test • Berechnung der maximalen absoluten Differenz D der beiden Verteilungsfunktionen – zeilenweise kumulative Prozentzahlen – Differenzbildung differenzen<-cumsum(vert.dists[,1])-cumsum(vert.dists[,2]) max(abs(differenzen)) [1] 0. 4666667 13 Zweistichproben-Kolmogorov-Smirnov-Test • Maximale Differenz 40% der Männer verwenden Heckenwörter in (so geringen) Anzahlen, die bei den Frauen gar nicht vertreten sind. D= 0,4667 plot(cumsum(vert.dists[,1]), type="b", col="black", xlab="Anzahlen an Heckenwoertern", ylab="Kumulative Haeufigkeit in %", xlim=c(0, 16)); grid() lines(cumsum(vert.dists[,2]), type="b", col="darkgrey")text(2.5, 0.9, labels="Maenner", col="black")text(14, 0.1, labels="Frauen", col="darkgrey") lines(c(8, 8), c(cumsum(vert.dists[,1])[8], cumsum(vert.dists[,2])[8]), 14 lty=2) (Gries 2008: 168) Zweistichproben-Kolmogorov-Smirnov-Test • Der Test in Kurzfassung – ks.test(Vektor1, Vektor2, alternative =c("twosided", "greater", "less") # Default: "two-sided ks.test(HEDGES[GESCHLECHT=="M"], HEDGES[GESCHLECHT=="W"]) bei diskreten Werten sind data: HEDGES[GESCHLECHT == "M"] and HEDGES[GESCHLECHT == "W"] Mehrfachvorko D = 0.4667, p-value = 0.002908 mmen möglich alternative hypothesis: two-sided = "tie" Two-sample Kolmogorov-Smirnov test Warning message: In ks.test(HEDGES[GESCHLECHT == "M"], HEDGES[GESCHLECHT == "W"]) : kann bei Bindungen nicht die korrekten p-Werte berechnen 15 Zweistichproben-Kolmogorov-Smirnov-Test • Interpretation "Gemäß einem Kolmogorov-SmirnovUnterschiedstest gibt es einen signifikanten Unterschied in der Verteilung der Anzahlen von Heckenwörtern zwischen Männern und Frauen: Frauen verwenden im Schnitt etwas mehr Heckenwörter und verhalten sich insgesamt homogener als Männer, deren Heckenwörterhäufigkeiten im Schnitt geringer sind, aber sehr viel stärker streuen und aus zwei Gruppen -- "Geringhedger" und "Vielhedger" -zu bestehen scheinen (D=0,4667, pzweiseitig< 0.01). (Gries 2008: 168) 16 Einschub • Einstichproben Kolmogorov-Smirnov-Test als alternativer Test auf Normalverteilung (oder andere Standardverteilungen) ks.test(HEDGES, "pnorm", mean(HEDGES), sd(HEDGES)) One-sample Kolmogorov-Smirnov test data: HEDGES D = 0.159, p-value = 0.09629 alternative hypothesis: two-sided • hier: Nullhypothese, dass HEDGES normalverteilt ist, kann nicht verworfen werden, da p> 0.05. 17 Unterschiedstest • Fall 2 – Daten • eine unabhängige Variable auf Nominal- oder Kategorialniveau • eine abhängige Variable auf Nominal- oder Kategorialniveau • unabhängige Stichproben – Frage • Haben die Ausprägungen der unabhängigen Variable einen Einfluss auf die beobachteten Häufigkeiten der abhängigen Variable? – Test • Chi-Quadrat-Unterschiedstest, chisq.test(table (X,Y),correct=T/F) 18 Chi-Quadrat-Unterschiedstest • Ablaufschema – Formulieren der Hypothese – Tabellierung der beobachteten Häufigkeiten; graphische Betrachtung – Ermittlung der Häufigkeiten, die nach H0 zu erwarten wären – Testen der Voraussetzungen – Berechnung der Abweichungsmaße für alle beobachteten Häufigkeiten – Summierung der Abweichungsmaße zur Ermittlung der Prüfstatistik χ2 – Ermittlung der Freiheitsgrade df und der Irrtumswahrscheinlichkeit p. 19 Chi-Quadrat-Unterschiedstest • Voraussetzungen – Alle Beobachtungen sind voneinander unabhängig. – 80% der erwarteten Häufigkeiten sind größer oder gleich 5 – Alle erwarteten Häufigkeiten sind größer 1 20 Chi-Quadrat-Unterschiedstest • Experiment – die uns bekannten Verb-Partikel-Objekt-Daten – abhängige Variable: KONSTRUKTION • Verb-Partikel-Direktes_Objekt • Verb-Direktes_Objekt-Partikel – unabhängige Variable: BEKANNTHEIT • Referent des direkten Objekts ist bekannt • Referent des direkten Objekts ist unbekannt – unabhängige Stichproben, da die Kategorisierung der einzelne Objekte nichts mit der Kategorisierung anderer Objekte zu tun hat 21 Chi-Quadrat-Unterschiedstest • Hypothesen – H0: Die Häufigkeiten der Variablenausprägungen der Variabel KONSTRUKTION variiert nicht in Abhängigkeit von der Variable BEKANNTHEIT – H1: Die Häufigkeiten der Variablenausprägungen der Variabel KONSTRUKTION variiert in Abhängigkeit von der Variable BEKANNTHEIT 22 Chi-Quadrat-Unterschiedstest • Tabellierung der beobachteten Häufigkeiten • Experiment – Beschreibungen von Bildern (Peters 2001) – einschließlich Vorerwähntheit im Diskurs Referent des DO bekannt Referent des DO unbekannt Zeilensummen V DO Part 85 65 150 V PART DO 100 147 247 Spaltensumm en 185 212 397 23 Chi-Quadrat-Unterschiedstest • Graphische Betrachtung # Aufräumen, damit Variablen nicht schon belegt sind rm(list=ls(all=T)) # Datei: /Users/cluser/_sflwr/_inputfiles/ g_data_chapters_1-5/04-1-2-2_vpcs.txt VPCs<- read.table(file=file.choose(), header=T,sep="\t"); attach (VPCs); str(VPCs) The following object(s) are masked from VPCs ( position 3 ) : BEKANNTHEIT FALL KONSTRUKTION 'data.frame': 397 obs. $ FALL : int 1 $ BEKANNTHEIT : Factor 1 1 1 1 1 ... $ KONSTRUKTION: Factor 1 1 1 1 1 1 ... of 3 variables: 2 3 4 5 6 7 8 9 10 ... w/ 2 levels "bekannt","unbekannt": 1 1 1 1 1 w/ 2 levels "V_DO_Part","V_Part_DO": 1 1 1 1 24 Chi-Quadrat-Unterschiedstest • Graphische Betrachtung Ist der Unterschied signifikant? plot(KONSTRUKTION~BEKANNTHEIT) 25 Chi-Quadrat-Unterschiedstest • Ermitteln der erwarteten Werte • Erster Versuch: Gleichverteilung – scheitert an Ungleichverteilung der Variablen ansich Referent des DO bekannt Referent des DO unbekannt Zeilensummen V DO Part 100 85 100 65 200 150 V PART DO 100 100 147 200 247 Spaltensumm en 200 185 200 212 400 397 26 Chi-Quadrat-Unterschiedstest • Ermitteln der erwarteten Werte • Zweiter Versuch – Berücksichtigung der Randsummen – Wahrscheinlichkeiten/Prozentwerte – unabhängiges gemeinsames Auftreten p(A,B)=p(A)*p(B) Referent des DO bekannt Referent des DO unbekannt Zeilensummen V DO Part 150/397= 37,78% V PART DO 247/397= 62,22% Spaltensumm 185/397= 46,60% 212/397= 53,40% en 397 = 100% 27 Chi-Quadrat-Unterschiedstest • Ermitteln der erwarteten Werte n erwarteterZellenwert € Zeilensumme Spaltensumme = ⋅ ⋅n n n Zeilensumme ⋅ Spaltensumme = n Referent des DO bekannt V DO Part Referent des DO unbekannt (150*185)/ 397 = 69,9 150 V PART DO Spaltensumm en Zeilensummen 247 185 212 397 28 Chi-Quadrat-Unterschiedstest • Ermitteln der erwarteten Werte n erwarteterZellenwert € Zeilensumme Spaltensumme = ⋅ ⋅n n n Zeilensumme ⋅ Spaltensumme = n Referent des DO bekannt Referent des DO unbekannt Zeilensummen V DO Part (150*185)/ 397 = 69,9 (150*212)/ 397= 80,1 150 V PART DO (247*185)/397= 115,1 (247*212)/397= 131,9 247 Spaltensumm en 185 212 397 29 Chi-Quadrat-Unterschiedstest • Hypothesen – Gleichverteilung bedeutet hier nicht: "Die Häufigkeiten in den Tabellenzellen sind gleich groß" – sondern: "Die Häufigkeiten in den unterschiedlichen Bedingungen sind gleich der Verhältnisse der Randsummen." • 69,9/80,1 ≈ 115,1/131,9 ≈ 185/212 ≈0,8768 • 69,9/115,1 ≈ 80,1/131,9 ≈150/247 ≈ 0,6073 R-DO bekannt R-DO unbekannt Zeilensummen V DO Part 69,9 80,1 150 V PART DO 115,1 131,9 247 Spaltensummen 185 212 397 30 Chi-Quadrat-Unterschiedstest • Hypothesen – H0: χ2 = 0 – H1: χ2 > 0 • Voraussetzungen? – Es besteht Unabhängigkeit, da angenommen wird, dass jeder Versuchsperson nur einen Satz formuliert hat 31 Chi-Quadrat-Unterschiedstest • Abweichungen ermitteln Chi − Quadrat = χ = ∑ 2 € (beobachtet − erwartet ) n i=1 erwartet R-DO bekannt R-DO unbekannt V DO Part 3,26 2,85 V PART DO 1,98 1,73 Spaltensummen 2 Zeilensummen χ2 = 9,82 • Freiheitsgrade df =(Zeilenzahl-1) *(Spaltenzahl-1)=(2-1)*(2-1)=1 32 Einschub: Freiheitsgrade • Werden die erwarteten Häufigkeiten aus beobachteten ermittelt gilt: df =(Zeilenzahl-1) *(Spaltenzahl-1) • Werden sie aus einer bekannten Verteilung errechnet: df =(Zeilenzahl*Spaltenzahl)-1 33 Chi-Quadrat-Unterschiedstest • Interpretation • Kritische χ2-Werte für pzweiseitig df=1 df=2 df=3 p=0,05 3,841 5,991 7,815 p=0,01 6,635 9,21 11,345 p=0,001 10,827 13,815 16,266 • mit χ2 =9,82 gilt 0,001 < p <0,01 • das Ergebnis ist signifikant, aber nicht hoch signifikant 34 Chi-Quadrat-Unterschiedstest • der eigentliche Test in R chisq.test(table(KONSTRUKTION, BEKANNTHEIT), correct=F) Pearson's Chi-squared test data: table(KONSTRUKTION, BEKANNTHEIT) X-squared = 9.8191, df = 1, p-value = 0.001727 • correct = Kontinuitätskorrektur, relevant bei kleinen n. 35 Chi-Quadrat-Unterschiedstest • die volle Information erhält man durch Zuweisung des Tests auf eine Variable test<- chisq.test(table(KONSTRUKTION, BEKANNTHEIT), correct=F); str(test) List of 8 $ statistic: Named num 9.82 ..- attr(*, "names")= chr "X-squared" $ parameter: Named num 1 ..- attr(*, "names")= chr "df" usw. • direktes Ansprechen von Teilinformationen chisq.test(table(KONSTRUKTION, BEKANNTHEIT), correct=F)$statistics 36 Chi-Quadrat-Unterschiedstest • Wie ermittelt man die Effektstärke? • Problem – Chi-Quadrat-Wert ist abhängig von der Stichprobengröße • Lösung – Korrelationskoeffizient χ2 φ bzw. CI = n ⋅ (min[ Zeilenzahl,Spaltenzahl] −1) € • φ: bei k×2/m×2-Tabellen • Cramers V: bei k×m-Tabellen mit k,m>2 • Grenzwerte: 0= Nullkorrelation, 1=perfekte Korrelation 37 Chi-Quadrat-Unterschiedstest • Bestimmung der Effektstärke über den Korrelationskoeffizienten φ χ2 φ bzw. CI = n ⋅ (min[ Zeilenzahl,Spaltenzahl] −1) data <- table(KONSTRUKTION, BEKANNTHEIT) € sqrt(chisq.test(data, correct=F)$statistic/ sum (data)*(min(dim(data))-1)) X-squared 0.1572683 • Interpretation: Zusammenhang eher zufällig 38 Chi-Quadrat-Unterschiedstest Für 2×2-Tabellen: Bestimmung der Effektstärke über die Odds Ratio • Die Odds eines Ereignisses E (mit zwei Ausprägungen) pE odds = 1− pE • Vergleiche – Wahrscheinlichkeit P: Häufigkeit eines Ereignisses in Bezug € auf die Gesamtheit aller Ereignisse – Odds O:Wahrscheinlichkeit eines Ereignisses in Bezug auf Wahrscheinlichkeit seines Nicht-Eintretens • Odds Ratio zweier Ereignisse O1/O2 39 Einschub odds ratio • Beispiel: Regentage vs. Sonnentage – p(Regentag) = 1-p(Sonnentag) – Sei • p(Regentag_August) = 3/4= 0.75 • p(Regentag_Juli) = 2/7 = 0.2857143 – dann gilt • O(Regentag_August) = 0.75/0.25 = 3:1 • O(Regentag_Juli)= (2/7)/1-(2/7)= 2:5 – Eine Wahrscheinlichkeit von 0,75 oder 75% entspricht den odds von 3:1 ("3 zu 1") – Auf dreimal das Ereignis kommt jeweils einmal das NichtEreignis 3/1 – odds ratio(Regentag_August/Regentag_Juli) = 2 /5 = 7.5 – O(Regentag_August) ist 7,5 mal größer als O(Regen_Juli) € 40 Einschub odds ratio • Grenzwerte – Wahrscheinlichkeit • zwischen 0 und 1 – Odds • zwischen 0 und ∞ • O=1 entspricht p=0.5 – Odds ratio • zwischen 0 und ∞ • O1/O2 = 1 bedeutet, dass zwischen den Ereignissen kein Unterschied besteht 41 Chi-Quadrat-Unterschiedstest Referent des DO bekannt Referent des DO unbekannt Zeilensummen V DO Part 85 65 150 V PART DO 100 147 247 Spaltensumm en 185 212 397 • Odds ratio = 85 /65 = 1.9223 100 /147 • Die Konstruktion V DO PART ist 1,9223 mal wahrscheinlicher, wenn der Referent des DOs€bekannt ist, als wenn er es nicht ist. 42 Chi-Quadrat-Unterschiedstest • Zusammenfassung "Unbekannte Objekte werden bevorzugt in der VerbPartikel-Konstruktion eingesetzt, in der die Partikel direkt dem Verb folgt; sie dispräferieren die VerbPartikel-Konstruktion, in der die Partikel dem direkten Objekt folgt. Demgegenüber werden bekannte Objekte vorzugsweise in die Verb-Partikel-Konstruktion eingesetzt, in der die Partikel dem direkten Objekt folgt; bekannte Objekte in der anderen Konstruktion werden dispräferiert. Diese Präferenz ist gemäß einem Chi-Quadrat-Unterschiedstest signifikant (χ2=9,82;df=1;pzweiseitig<0,001), aber der Effekt ist schwach(φ=0,157, odds ratio=1,9223)." (nach Gries 2008:180) 43 Chi-Quadrat-Unterschiedstest • Von welchen Ausprägungen stammen signifikante Unterschiede? – Quadrierung der Pearson Residuals – χ2=3,841; df=1; pzweiseitig<0,05 chisq.test(table(KONSTRUKTION, BEKANNTHEIT), correct=F)$residuals^2 BEKANNTHEIT KONSTRUKTION bekannt unbekannt V_DO_Part 3.262307 2.846825 V_Part_DO 1.981158 1.728841 alle Werte kleiner als χ2=3,841 44 Chi-Quadrat-Unterschiedstest • Waren die einzelnen Werte größer oder kleiner als erwartet? – Residuals ohne Quadrierung chisq.test(table(KONSTRUKTION, BEKANNTHEIT), correct=F)$residuals BEKANNTHEIT KONSTRUKTION bekannt unbekannt V_DO_Part 1.806186 -1.687254 V_Part_DO -1.407536 1.314854 45 Chi-Quadrat-Unterschiedstest • Waren die einzelnen Werte größer oder kleiner als erwartet? Höhe ist proportional zu Residuals; Breite proportional zu Wurzel der zu erwartenden Häufigkeit; Fläche ist proportional zu Differenz zwischen beobachteter und erwarteter Häufigkeit assocplot(table(KONSTRUKTION, BEKANNTHEIT), col=c("black", "darkgrey")) 46 Chi-Quadrat-Unterschiedstest • Bei zu kleinen Werten für die erwarteten Häufigkeiten – bei chisq.test() Argument simulate.p.value=TRUE oder – Fisher's exact test verwenden: fisher.test() 47 Unterschiedstest • Fall 3 – Daten • eine abhängige Variable auf Nominal- oder Kategorialniveau • abhängige Stichproben – Frage • Haben die geänderten Bedingungen bei einer Versuchwiederholung Einfluss auf die Variablenverteilung? – Methode • McNemar-Test; mcnemar.test() 48 McNemar-Test • Ablaufschema 1. 2. 3. 4. Formulierung der Hypothesen Testen der Voraussetzungen Tabellierung der beobachteten Häufigkeiten Ermitteln der Häufigkeiten, die gemäß Ho zu erwarten wären 5. Berechnung der Abweichungsmaße der beobachteten Häufigkeiten 6. Summierung der Abweichungsmaße zur Ermittlung der Prüfstatistik χ2 7. Ermittlung der Freiheitsgrade df und der Irrtumswahrscheinlichkeit p 49 McNemar-Test • Hypothesen – H0: Häufigkeiten der Urteile in beiden Untersuchungen sind gleich groß; χ2=0 – H1: Häufigkeiten der Urteile in beiden Untersuchungen sind nicht gleich groß; χ2>0 50 McNemar-Test • Voraussetzungen – die Untersuchungseinheiten sind paarweise von einander abhängig – die erwarteten Häufigkeiten müssen größer 5 sein 51 McNemar-Test • Experiment – Hat metalinguistisches Wissen Einfluss auf Akzeptabilitätsurteile? • linguistische Laien beurteilen 100 Sätze: "akzeptabel"/ "inakzeptabel" • Linguistische Schulung • Wiederholung der Satzbeurteilung 52 McNemar-Test • Daten #Datei: ... PFAD.../04-1-2-3_akzurteile.txt rm(list=ls(all=T)) AkzVorherNachher <-read.table(file=file.choose(), header=T, sep="\t") attach(AkzVorherNachher); str(AkzVorherNachher) 'data.frame': 100 obs. of 3 variables: $ SATZ : int 1 2 3 4 5 6 7 8 9 10 ... $ VORHER : Factor w/ 2 levels "akzeptabel","inakzeptabel": 1 1 1 1 1 1 1 1 1 1 ... $ NACHHER: Factor w/ 2 levels "akzeptabel","inakzeptabel": 1 1 1 1 1 1 1 1 1 1 ... 53 McNemar-Test • Daten addmargins(table(VORHER,NACHHER)) NACHHER VORHER akzeptabel inakzeptabel Sum akzeptabel 31 39 70 inakzeptabel 13 17 30 Sum 44 56 100 • McNemar berücksicht nur Änderungsfälle 54 McNemar-Test • Test in R: mcnemar.test(table(VORHER, NACHHER), correct=F) McNemar's Chi-squared test data: table(VORHER, NACHHER) McNemar's chi-squared = 13, df = 1, p-value = 0.000311544 55 McNemar-Test • Interpretation: "Die Art, wie Versuchspersonen nach der Schulung zum Zweck der Akzeptabilitätsurteile ihre Meinung änderten (52 von 100 Versuchspersonen), ist gemäß einem McNemarTest signifikant anders als vom Zufall erwartet: in der zweiten Untersuchung wurde deutlich weniger "akzeptabel" als Bewertung abgegeben (χ2=13; df=1; pzweiseitig<0,001)." (Gries 2008: 185) 56