1 4 TESTEN VON HYPOTHESEN I Lernziele: 1. Mit dem 1-Stichproben-t-Test entscheiden können, ob der Mittelwert einer normalverteilten Zufallsvariablen X von einem vorgegebenen Sollwert abweicht bzw. diesen unter- oder überschreitet. 2. Signifikante und nichtsignifikante Testergebnisse interpretieren können. 3. Die Normalverteilungsannahme mit dem Shapiro-Wilk-Test überprüfen können. 4. Mit dem Normal-QQ-Plot die Annahme normalverteilter Stichprobenwerte beurteilen können. 5. Mit dem Grubbs-Test einen Ausreißer in einer normalverteilten Zufallsstichprobe identifizieren können. 6. Mit dem Binomialtest prüfen können, ob eine unbekannte Wahrscheinlichkeit von einem vorgegebenen Sollwert abweicht bzw. diesen über- oder unterschreitet. 7. Mit dem χ2-Test prüfen können, ob die beobachteten Häufigkeiten einer mehrstufig skalierten Zufallsvariablen von einem vorgegebenen Verhältnis abweichen. Lernziel 4.1: Mit dem 1-Stichproben-t-Test entscheiden können, ob der Mittelwert einer normalverteilten Zufallsvariablen X von einem vorgegebenen Sollwert abweicht bzw. diesen unter- oder überschreitet. Ablaufschema: • Beobachtungsdaten und Modell: Es liegen n Beobachtungswerte x1, x2,…, xn mit dem arithmetischen Mittel x vor. Jedes xi ist die Realisierung einer N(µ, σ2)-verteilten Zufallsvariablen Xi (i=1,2,…,n), mit denen das Stichprobenmittel X sowie die Stichprobenvarianz S2 gebildet werden. • Hypothesen und Testgröße: Der Vergleich des Parameters µ mit einem vorgegebenen Sollwert µ0 erfolgt nach einer der folgenden Testvarianten: - H0: µ = µ0 gegen H1 : µ ≠ µ0 (Variante II, 2-seitiger Test) - H0: µ ≤ µ0 gegen H1 : µ > µ0 (Variante Ia, 1-seitiger Test auf Überschreitung) W. Timischl: Angewandte Statistik, Testen_I_15_Text24.09.15 2 - H0: µ ≥ µ0 gegen H1 : µ < µ0 (Variante Ib, 1-seitiger Test auf Unterschreitung) Als Testgröße wird das studentisierte Stichprobenmittel X − µ0 S/ n TG = verwendet, das bei Gültigkeit von H0 (d.h. für µ=µ0) t-verteilt mit dem Freiheitsgrad f=n-1 ist. Ersetzt man X durch das arithmetische Mittel x und S durch die empirische Standardabweichung s, erhält man die Realisierung TGs der Testgröße. • Entscheidung: Entscheidungssituation beim 2-seitigen Test: Testentscheidung mit dem P-Wert: Bei vorgegebenem Signifikanzniveau α wird H0 abgelehnt, wenn der P-Wert kleiner als α ist. Die Berechnung des P-Wertes erfolgt für die Testvariante Ia mit der Formel P=1 - Fn-1(TGs), für die Variante Ib mit der Formel P= Fn-1 (TGs), bzw. für die zweiseitige Testvariante II mit P= 2 Fn-1(-|TGs|). Fn-1 bezeichnet die Verteilungsfunktion der tn-1 -Verteilung • Planung des Stichprobenumfangs Um auf dem Niveau α mit der Sicherheit 1- β eine Entscheidung für H1 herbeizuführen, wenn µ von µ0 um ∆ ≠ 0 im Sinne der Alternativhypothese abweicht, kann im Falle der 1-seitigen Testvarianten Ia und Ib der erforderliche Mindeststichprobenumfang näherungsweise aus n≈ σ2 ∆2 (z 1−α + z1− β ) W. Timischl: Angewandte Statistik, Testen_I_15_Text24.09.15 2 3 bestimmt werden. Im Falle der 2-seitigen Testvariante II ist α durch α/2 zu ersetzen. Bei Anwendung dieser Formeln muss ein Schätzwert für σ zur Verfügung stehen. Die Formeln stimmen mit den entsprechenden Formeln beim Gauß-Test überein, ergeben aber auf Grund der Näherungen nur Richtwerte für den erforderlichen Mindeststichprobenumfang. • Gütefunktion des t-Tests: Fehlerrisken beim Alternativtest: Fehler 1. Art (α-Fehler, irrtümliche Ablehnung der Nullhypothese) Fehler 2. Art (β-Fehler, falsche Nullhypothese wird beibehalten) Die Wahrscheinlichkeiten für einen Fehler 1. und 2. Art werden in der Gütefunktion G zusammengefasst. Diese gibt - in Abhängigkeit vom unbekannten Erwartungswert µ - die Wahrscheinlichkeit G(µ) = P(Ablehnung von H0 | µ) an, dass der Test auf Grund einer Zufallsstichprobe zu einer Entscheidung gegen H0 führt. Durch die Testentscheidung (mit dem P-Wert) wird sicher gestellt, dass die Wahrscheinlichkeit eines Fehlers 1. Art höchstens gleich dem vorgegebenen α ist. Wenn z.B. das 1-seitige Testproblem H0: µ ≤ µ0 gegen H1 : µ > µ0 vorliegt und H0 zutrifft, gilt also G(µ) ≤ α. Trifft dagegen H1 : µ > µ0 zu, so ist die Güte des Tests umso besser, je näher G(µ) bei 1 liegt, oder anders ausgedrückt, je kleiner die Wahrscheinlichkeit β(µ) = 1-G(µ) eines Fehlers zweiter Art ist. Die Gütefunktion ist streng monoton wachsend, geht für µ → −∞ asymptotisch gegen 0, für µ → +∞ asymptotisch gegen 1 und nimmt an der Stelle µ=µ0 den Wert a an. Für µ ≤ µ0 ist also G(µ)≤α. Für µ >µ0 gilt G(µ)>α und G(µ) wird in diesem Fall als Trennschärfe oder Power an der µ bezeichnet. W. Timischl: Angewandte Statistik, Testen_I_15_Text24.09.15 4 Abb. 4.1: Gütefunktionen des 1- seitigen t-Tests H0: µ ≤ µ0 gegen H1 : µ > µ0 für die Stichprobenumfänge n=5, 10, 20 (obere Grafik) und des 2-seitigen t-Tests H0: µ = µ0 gegen H1 : µ ≠ µ0 für die Stichprobenumfänge n=10 und n=50 (untere Grafik). Horizontal ist die auf σ bezogene Abweichung δ=(µ-µ0)/σ des Mittelwerts vom Sollwert µ0 aufgetragen, vertikal kann man die entsprechenden Gütefunktionswerte G*(δ)=G((µ-µ0)/σ) ablesen. Beispiel 4.1: In einem Experiment wurde die Selbstentladung von wiederaufladbaren NiMH-Gerätezellen mit einer Kapazität (in mAh) von 2000 überprüft. Laut Hersteller soll die Kapazität X nach 12 Monaten 85% des Anfangswertes, also µ0=1700, betragen. a) Es ist zu zeigen, dass das Experiment mit 30 Zellen durchgeführt werden müsste, damit der t-Test auf 5%igem Niveau eine Sollwertabweichung in der Höhe von ∆=60 mit einer Sicherheit von 90% feststellen kann. Dabei möge die Annahme zutreffen, dass die Kapazität X normalverteilt sei und für σ der Schätzwert σˆ = 100 zur Verfügung steht. b) Die Ausführung des Experimentes hat die folgenden Messwerte ergeben: 1590, 1620, 1670, 1790, 1670, 1580, 1470, 1690, 1680, 1890, W. Timischl: Angewandte Statistik, Testen_I_15_Text24.09.15 5 1560, 1610, 1670, 1450, 1690, 1710, 1670, 1810, 1580, 1560, 1680, 1730, 1680, 1550, 1760, 1750, 1530, 1540, 1690, 1730. Es ist mit dem 2-seitigen t-Test zu zeigen, dass das arithmetische Mittel der Prüfstichprobe signifikant (α=5%) vom Sollwert µ0=1700 abweicht. Lösung mit R: > > > > > # a) Planung des Stichprobenumfangs mu0 <- 1700; sigma <- 100; Delta <- 60 alpha <- 0.05; qa <- qnorm(1-alpha/2); beta <- 0.1; qb <- qnorm(1-beta) ns <- sigma^2/Delta^2*(qa+qb)^2 print(cbind(mu0, Delta, sigma, qa, qb, ns)) mu0 Delta sigma qa qb ns [1,] 1700 60 100 1.959964 1.281552 29.18729 > # Lösung mit R-Funktion power.t.test() > power.t.test(delta=Delta, sd=sigma, sig.level=0.05, power=0.9, + type="one.sample") One-sample t test power calculation n delta sd sig.level power alternative = = = = = = 31.17169 60 100 0.05 0.9 two.sided > > > + + > > # # b) 2-seitiger t-Test x <- c(1590, 1620, 1670, 1790, 1670, 1580, 1470, 1690, 1680, 1890, 1560, 1610, 1670, 1450, 1690, 1710, 1670, 1810, 1580, 1560, 1680, 1730, 1680, 1550, 1760, 1750, 1530, 1540, 1690, 1730) n <- length(x); xquer <- mean(x); s <- sd(x); mu0 <- 1700 print(cbind(n, xquer, s)) n xquer s [1,] 30 1653.333 100.1837 > alpha <- 0.05; q <- qt(1-alpha/2, n-1) > tgs <- (xquer-mu0)*sqrt(n)/s; P <- 2*pt(-abs(tgs), n-1) > print(cbind(alpha, q, tgs, P)) alpha q tgs P [1,] 0.05 2.04523 -2.551351 0.01626606 > # Lösung mit R-Funktion t.test() > t.test(x, mu=mu0, alternative="two.sided", type="one.sample", + conf.level=alpha) One Sample t-test data: x t = -2.5514, df = 29, p-value = 0.01627 alternative hypothesis: true mean is not equal to 1700 5 percent confidence interval: 1652.176 1654.490 sample estimates: mean of x 1653.333 > > > > # c) Berechnung der Power, # um Abweichung xquer-mu0 als signifikant zu erkennen # c1) mit der R-Funktion power.t.test() power.t.test(n, delta=xquer-mu0, sd=s, sig.level=0.05, type="one.sample") One-sample t test power calculation n = 30 delta = 46.66667 W. Timischl: Angewandte Statistik, Testen_I_15_Text24.09.15 6 sd sig.level power alternative = = = = 100.1837 0.05 0.693638 two.sided > # c2) durch Simulation mit selbstdefinierter Funktion > # --------------------------------------------------------------> # Funktionsprogramm-Eingabeparameter: > # n=Umfang der Zufallsstichproben > # B=Anzahl der Zufallsstichproben aus Grundgesamtheit > # mu, sigma= Mittelwert bzw. Standardabweichung der Grundesamtheit > # alpha=Testniveau > # Rückgabeparameter: > # power=berechnete Güte (Power) > t2.power=function(n,B,mu,sigma,alpha){ + Ps = replicate(B,t.test(rnorm(n,mu,sigma),mu=mu0)$p.value) + A <- sum(Ps < alpha); power <- A/B + return(power)} > # --------------------------------------------------------------> t2.power(n,10000,xquer,s,0.05) # Funktionsaufruf [1] 0.6939 Lernziel 4.2: Signifikante und nichtsignifikante Testergebnisse interpretieren können. • Schlussweise der Signifikanzprüfung am Beispiel des 1-seitigen tTests auf Überschreitung: Wenn H0 gilt, dann ist |TG| > z1-α/2 unwahrscheinlich. Aus einer Zufallsstichprobe ergibt sich ein TGs mit |TGs| > z1-α/2. Daher: H0 gilt nicht (genauer: ist unwahrscheinlich). Dieses Schema erinnert an die Beweisführung „reductio ad absurdum“ (Widerspruchsbeweis): Um eine Aussage A indirekt zu beweisen, wird die Annahme gemacht, die Aussage ist falsch, und aus der Negation der Aussage etwas abgeleitet, was offensichtlich falsch ist. Es folgt, dass A richtig ist. • Signifikante und nichtsignifikante Testergebnisse W. Timischl: Angewandte Statistik, Testen_I_15_Text24.09.15 7 Abb. 4.2: Schema der Entscheidungsfindung beim Signifikanztest. Vorgegeben sind die Fehlerschranken α (z.B. 5%) und β (z.B. 10%). Ist der P-Wert kleiner als α, wird H0 abgelehnt, also für H1 entschieden. Andernfalls, d.h. für P ≥ α wird eine Poweranalyse (oder die Berechnung des Mindest-n) angeschlossen. Wenn die Power größer oder gleich 1-β ist (oder der Mindest-n ≥ dem Umfang der verwendeten Zufallsstichprobe ist), wird H0 angenommen. Lernziel 4.3: Die Normalverteilungsannahme mit dem Shapiro-Wilk-Test prüfen können. Der Shapiro-Wilk-Test wurde speziell zur Überprüfung der Annahme (=Nullhypothese) entwickelt, dass eine metrische Zufallsvariable X normalverteilt ist. Die Nullhypothese wird auf dem Niveau α abgelehnt, wenn der P-Wert kleiner als α ist. Theoretischer Hintergrund: Die Teststatistik W des Shapiro-Wilk-Tests ist als Quotient von zwei Schätzfunktionen für die Varianz σ2 der hypothetischen Normalverteilung konstruiert. Die eine Schätzfunktion (im Nenner) ist die Stichprobenvarianz, die andere (im Zähler) hängt mit dem Anstieg der Orientierungsgeraden im QQ-Plot zusammen. Die Berechnung der Teststatistik ist aufwendig und praktisch nur mit einschlägiger Software zu bewältigen. Beispiel 4.2: Es soll gezeigt werden, dass die angegebenen Stichprobewerte mit der Annahme einer normalverteilten Grundgesamtheit X vereinbar sind. Lösung mit R: > + + > > > x <- c(4.81, 5.16, 4.50, 4.85, 5.15, 5.21, 4.68, 4.80, 4.61, 5.17, 4.82, 4.98, 5.06, 5.01, 5.12, 5.62, 4.95, 5.16, 5.20, 4.94, 4.72, 5.32, 5.23, 4.85, 5.56, 4.51, 5.02, 4.72, 4.78, 5.27) # Hypothesen: # H0: X ist normalverteil gegen H1: X ist nicht normalverteilt shapiro.test(x) Shapiro-Wilk normality test data: x W = 0.9756, p-value = 0.7014 Wegen p-value = 70.14% ≥ 5% kann H0 (Stichprobenwerte nicht in Widerspruch zur Normalverteilungsannahme) nicht abgelehnt werden. W. Timischl: Angewandte Statistik, Testen_I_15_Text24.09.15 8 Lernziel 4.4: Mit dem Normal-QQ-Plot die Annahme normalverteilter Stichprobenwerte beurteilen können. Mit dem Normal-Quantil-Quantil-Diagramm (kurz Normal-QQ-Plot) kann man an Hand der Werte x1, x2, …, xn einer Zufallsstichprobe von X auf grafischem Wege beurteilen, ob die Daten gegen die Annahme „X ist normalverteilt“ sprechen (vgl. die Abb. rechts). Theoretische Grundlage: • Wenn X N(µ, σ2) – verteilt ist, besteht zwischen dem p-Quantil xp von X und dem entsprechenden Quantil zp der N(0, 1)-verteilten Zufallsvariablen Z=(X-µ)/σ der lineare Zusammenhang xp = σ zp + µ. Die Punkte P(zp, xp) mit den für verschiedene Werte von p (0 < p < 1) berechneten Quantilen von Z und X als Koordinaten) liegen im (Z, X)-Koordinatensystem auf einer Geraden mit dem Anstieg σ und dem y-Achsenabschnitt µ. W. Timischl: Angewandte Statistik, Testen_I_15_Text24.09.15 9 Abb. 4.3: Normal-QQ-Plots für zwei Zufallsstichproben (jeweils vom Umfang n=30). Die QQ-Plots enthalten auch die Orientierungsgeraden durch die den unteren und oberen Quartilen entsprechenden Punkte. Links sind die Dichtekurven der Grundgesamtheiten dargestellt, aus denen die Stichproben generiert wurden (oben: Normalverteilung mit µ=5 und σ=0.25, unten: logarithmische Normalverteilung mit µ=-0.2 und σ=1). Man erkennt, dass im oberen QQ-Plot die Punkte angenähert entlang der Orientierungsgeraden angeordnet sind; die Abweichung von der Normalverteilung zeigt sich im unteren QQ-Plot in den (vor allem an den Enden) von der Orientierungsgeraden wegdriftenden Punkten. Bei kleineren Stichprobenumfängen kann es auch bei normalverteilter Grundgesamtheit zu deutlichen Abweichungen von der Orientierungsgeraden kommen. • Mit den unteren Quartilen z0.25 und x0.25 sowie den oberen Quartilen z0.75 und x0.75 von Z bzw. X können die Geradenparameter ausgedrückt werden durch: σ= x0.75 − x0.25 x z − x 0.75 z 0.25 , µ = 0.25 0.75 z 0.75 − z 0.25 z 0.75 − z 0.25 • Die (nach aufsteigender Größe angeordneten) Stichprobenwerte x(i) werden als (empirische) Quantile von X gedeutet, die entsprechenden „Unterschreitungswahrscheinlichkeiten“ pi ermittelt und dazu die Quantile zpi=φ-1(pi) der N(0, 1)-Verteilung berechnet. • Die R-Funktion qqnorm() aus dem Paket ''extRemes'' (Extreme Value Analysis) verwendet zur Erstellung von Normal-QQ-Plots für die pi die Schätzwerte pi*=(i-0.5)/n. Diese Funktion stellt zusätzlich simultane (d.h. für alle pi zugleich geltende) 95%ige Konfidenzintervalle zur Verfügung. • Auf der Grundlage eines derartigen Normal-QQ-Plots wird die Überprüfung der Normalverteilungsannahme folgendermaßen vorgenommen: Zwischen den p-Quantilen xp einer normalverteilten Grundgesamtheit X und den p-Quantilen der standardisiserten Größe Z=(X-µ)/σ besteht ein linearer Zusammenhang, den wir in der (Z, X)-Ebene durch die Gerade g dargestellt haben. Hat man eine Zufallsstichprobe x1, x2, …, xn aus X und zeichnet damit ein Normal-QQ-Plot, so werden die Punkte (zpi, xi) mehr oder weniger von der (unbekannten) Geraden g abweichen. Sind die Abweichungen so groß, dass man in das mit den xi bestimmte 95%ige Konfidenzband keine Gerade einzeichnen kann, dann entscheiden wir uns gegen die Normalverteilungsannahme. Bei W. Timischl: Angewandte Statistik, Testen_I_15_Text24.09.15 10 diesem Entscheidungsverfahren hat man ein Risiko von 5%, irrtümlich gegen die Normalverteilungsannahme zu entscheiden. Beispiel 4.3: Dem Normal-QQ-Plot von Abb. 4.4 liegt die folgende Zufallsstichprobe von n=30 Realisierungen der mit µ=5 und σ=0.25 normalverteilten Zufallsvariablen X zugrunde: 4.50, 4.51, 4.61, 4.68, 4.72, 4.72,, 4.78, 4.80, 4.81, 4.82, 4.85, 4.85, 4.94, 4.95, 4.98, 5.01, 5.02, 5.06, 5.12, 5.15, 5.16, 5.16, 5.17, 5.20, 5.21, 5.23, 5.27, 5.32, 5.56, 5.62. Man erzeuge das Normal-QQ-Plot mit R; ferner berechne man die Koordinaten des ersten Punktes P1=(φ-1(p1), x(1)) und die Parameter der Orientierungsgeraden durch (z025, Q1) und (z075, Q3). Lösung mit R: > x <- c(4.81, 5.16, 4.50, 4.85, 5.15, 5.21, 4.68, 4.80, 4.61, 5.17, + 4.82, 4.98, 5.06, 5.01, 5.12, 5.62, 4.95, 5.16, 5.20, 4.94, + 4.72, 5.32, 5.23, 4.85, 5.56, 4.51, 5.02, 4.72, 4.78, 5.27) > # Normal-QQ-Plot > library(extRemes) > qqnorm(x, xlab = "N(0,1)-Quantile", ylab = "empirische Quantile") > qqline(x, probs = c(0.25, 0.75)) > # Berechnung der Koordinaten von P1: > sort(x); n <- length(x) [1] 4.50 4.51 4.61 4.68 4.72 4.72 4.78 4.80 4.81 4.82 4.85 4.85 4.94 4.95 4.98 [16] 5.01 5.02 5.06 5.12 5.15 5.16 5.16 5.17 5.20 5.21 5.23 5.27 5.32 5.56 5.62 > p1 <- (1-0.5)/30; (zp1 <- qnorm(p1)) # z-Koordinate zu x(1) [1] -2.128045 > # Orientierungsgerade durch (z025, Q1) und (z075, Q3) > x025 <- quantile(x, 0.25); x025 <- x025[[1]] > x075 <- quantile(x, 0.75); x075 <- x075[[1]] > print(cbind(x025, x075)) x025 x075 [1,] 4.8025 5.1675 > z025 <- qnorm(0.25); z075 <- qnorm(0.75) > print(cbind(z025, z075)) z025 z075 [1,] -0.6744898 0.6744898 > points(c(z025,z075),c(x025,x075), pch=3, lwd=2,cex=1.2) > b1 <- (x075-x025)/(z075-z025); b0 <- (x025*z075-x075*z025)/(z075-z025) > b1 <- b1[[1]]; b0 <- b0[[1]]; print(cbind(b1, b0)) b1 b0 [1,] 0.2705749 4.985 W. Timischl: Angewandte Statistik, Testen_I_15_Text24.09.15 5.2 5.0 4.6 4.8 empirische Quantile 5.4 5.6 11 -2 -1 0 1 2 N(0,1)-Quantile Lernziel 4.5*: Mit dem Grubbs-Test einen Ausreißer in einer normalverteilten Zufallsstichprobe identifizieren können. Theoretischer Grundlage: • X ~ N(µ, σ2) P(X < µ-4σ)+P(X > µ+4σ)= 0.0063% Tritt ein Wert außerhalb des 4-fachen Sigma-Bereichs auf, so steht er im Verdacht, dass er keine Realisierung von X ist, sondern z.B. durch einen Datenfehler oder einen Störeinfluss bei der Messung zustande gekommen ist. • Mutmaßliche Ausreißer sollten jedenfalls dokumentiert und nur dann aus der Stichprobe entfernt werden, wenn es dafür einen sachlogischen Grund gibt. • Zur Identifizierung eines Stichprobenwerts als Ausreißer gibt es einfache Kriterien - z.B. die Unter- bzw. Überschreitung der mit dem Interquartilabstand IQR gebildeten robusten Grenzen Q1-1.5 IQR bzw. Q3+1.5 IQR (Boxplot!) - oder spezielle Testverfahren. Grubbs-Test zur Identifizierung eines einzelnen Ausreißers: W. Timischl: Angewandte Statistik, Testen_I_15_Text24.09.15 12 • Voraussetzung: X ~ N(µ, σ2); Überprüfung mit einem Normal-QQ-Plot • Testentscheidung: H0: „Der Wert mit dem größten Abstand vom arithmetischen Mittel ist kein Ausreißer“ wird auf dem Testniveau α abgelehnt, wenn Gs = max xi − x i =1,..., n s > g n ,α = n −1 n c2 n − 2 + c2 gilt; dabei ist c das α/(2n)-Quantil der t-Verteilung mit f=n-2 Freiheitsgraden. Beispiel 4.4: Durch einen Eingabefehler möge der zehnte Wert x10=5.17 der Stichprobe im vorangehenden Beispiel auf 1.17 verfälscht. Man zeige, dass dieser Wert mit dem Grubbs-Test auf 5%igem Niveau als Ausreißer identifiziert werden kann. Lösung mit R: > > + + > > > > > options(digits=4) x <- c(4.81, 5.16, 4.50, 4.85, 5.15, 5.21, 4.68, 4.80, 4.61, 1.17, 4.82, 4.98, 5.06, 5.01, 5.12, 5.62, 4.95, 5.16, 5.20, 4.94, 4.72, 5.32, 5.23, 4.85, 5.56, 4.51, 5.02, 4.72, 4.78, 5.27) # Grubbs-Test: # H0: extremer Wert ist Ausreißer, wenn Gs > Gkrit n <- length(x) # Stichprobenumfang mw <- mean(x); s <- sd(x) # Schätzung der Verteilungsparameter print(cbind(mw, s)) mw s [1,] 4.859 0.7494 > Gs <- max(abs(x-mw))/s; Gs # Realisierung der Testgroesse [1] 4.923 > alpha <- 0.05; c <- qt(alpha/2/n, n-2); c [1] -3.479 > Gcrit <- (n-1)/sqrt(n)*sqrt(c^2/(n-2+c^2)); Gcrit # kritischer Wert [1] 2.908 Lernziel 4.6: Mit dem Binomialtest prüfen können, ob eine unbekannte Wahrscheinlichkeit von einem vorgegebenen Sollwert abweicht bzw. diesen über- oder unterschreitet. Ablaufschema: • Beobachtungsdaten und Modell: Es liegen n Beobachtungen vor, die in zwei Klassen eingeteilt werden können. Die Zugehörigkeit der i-ten Beobachtung zur Klasse 1 sei durch eine Bernoulli-Variable Xi beschrieben, die den Wert 1 annimmt, wenn die Beobachtung zur Klasse 1 gehört und den Wert 0, wenn dies nicht der Fall ist. Jede der unabhängigen W. Timischl: Angewandte Statistik, Testen_I_15_Text24.09.15 13 und identisch verteilten Bernoulli-Variablen X1, X2, …, Xn nimmt mit der Wahrscheinlichkeit p den Wert 1 an. Konkret wurden h Beobachtungen in der Klasse 1 gezählt. • Hypothesen und Testgröße: Der Vergleich des Parameters p mit einem vorgegebenen Sollwert p0 erfolgt nach einer der folgenden Testvarianten: - H0: p =p0 gegen H1 : p ≠ p0 (Variante II, 2-seitiger Test) - H0: p ≤ p0 gegen H1 : p > p0 (Variante Ia, 1-seitiger Test auf Überschreitung) - H0: p ≥ p0 gegen H1 : p < p0 (Variante Ib, 1-seitiger Test auf Unterschreitung) Testgröße: Anzahl TG=H= nX der Beobachtungen in der Klasse 1; TG ~ Bn,p0 für p=p0. Normalverteilungsapproximation (Voraussetzung: np0(1-p0)>9): H − np 0 TG* = ~ N (0,1) für H 0 : p = p 0 np 0 (1 − p 0 ) Für die konkrete Beobachtungsreihe ist H=h. • Entscheidung: Testentscheidung mit dem P-Wert: Bei vorgegebenem Signifikanzniveau α wird H0 abgelehnt, wenn der P-Wert kleiner als α ist. Exakter Binomialtest: Testvariante Ia: P=1 - FB(h-1) Testvariante Ib: P= FB(h) Testvariante II: Die Bestimmung des P-Werts für das 2-seitige Testproblem ist komplizierter. Betrachtet man z.B. den Fall h > np0, sind jedenfalls die Testgrößenwerte h+1, h+2, …, n extremer als die beobachtete Realisierung h. Für jeden extremen Wert xr gilt Bn,p0(xr) <= Bn,p0(h). Die Wahrscheinlichkeit dass die Testgröße einen Wert gleich oder größer als h annimmt, ist durch P(H >= h) =Bn,p0(h)+Bn,p0(h+1)+… + Bn,p0(n) gegeben. Bei der Berechnung des P-Werts sind aber auch extreme Testgrößenwerte links von np0 zu berücksichtigen. Wir bezeichnen einen links von np0 liegenden Wert xl als extrem, wenn wie bei den rechts liegenden Werten Bn,p0(x_l) <= Bn,p0(h) gilt. Diese Überlegung führt dazu, den P-Wert des 2-seitigen Binomialtests folgendermaßen zu bestimmen: Wir berechnen die W. Timischl: Angewandte Statistik, Testen_I_15_Text24.09.15 14 Wahrscheinlichkeiten P(H=x)=Bn, p0(x), dass die Testgröße H bei Gültigkeit von H0 : p=p0 die möglichen Werte x = 0, 1, …, n annimmt. Die Summe der Binomialwahrscheinlichkeiten mit der Eigenschaft Bn,p0(x) <= Bn,p0(h) ist der gesuchte $P$-Wert. Approximativer Binomialtest (mit Stetigkeitskorrektur) Testvariante Ia: P≈ 1-FN(h-0.5) Testvariante Ib: P≈ FN(h+0.5) Testvariante II: P≈ 2FN(np_0-d+0.5) FN ist die Verteilungsfunktion der N(µ, σ2)-Verteilung mit µ=np0 und σ02=np0(1-p0); d=|h-np0| ist die Abweichung der beobachteten Anzahl vom Mittelwert1. • Planung des Stichprobenumfangs Um auf dem Niveau α mit der Sicherheit 1- β eine Entscheidung für H1 herbeizuführen, wenn p von p0 um ∆ ≠ 0 im Sinne der Alternativhypothese abweicht, kann im Falle der 1-seitigen Testvarianten Ia und Ib das erforderliche Mindest-n näherungsweise aus n≈ (z (2 arcsin + z1− β ) 2 1−α p − 2 arcsin p0 ) 2 ; Bestimmt werden; im Falle der 2-seitigen Testvariante II ist z1-α durch z1-α/2 zu ersetzen2. Beispiel 4.5: Mit einer neuen Behandlungsmethode will man die Erfolgsrate p (d.h. die Wahrscheinlichkeit, dass bei einer mit der neuen Methode behandelten Person eine Verbesserung eintritt) von mehr als p0=0.7 erreichen. In einer Studie mit 100 Probanden ist die neue Methode bei h=80 Personen erfolgreich, der beobachtete Stichprobenanteil h/n=0.8 überschreitet also den Sollwert p0=0.7. 1 Den P-Wert des exakten Binomialtests erhält man in R mit der Funktion binom.test(), den P-Wert des approximativen Binomialtests (mit und ohne Stetigkeitskorrektur) mit prop.test(). 2 Der Näherung liegt die sogenannte Arcus-Sinus-Transformation zugrunde, mit der der Stichprobenanteil H/n (die Anzahl H ist Bn, p-verteilt) in die Zufallsvariable Y = 2 arcsin H / n . Wie man zeigen kann, nähert sich mit wachsendem n die Verteilung von Y* einer Normalverteilung mit * dem Mittelwert µY * = 2 arcsin p und der konstanten Varianz σ 2 Y*=1/n. Die Näherung ist in der R- Funktion pwr.p.test() im Paket "pwr" implementiert, mit der der erforderliche Mindeststichprobenumfang geplant und Gütefunktionswerte berechnet werden können. W. Timischl: Angewandte Statistik, Testen_I_15_Text24.09.15 15 Es ist a) zu zeigen, dass die Überschreitung auf 5%igem Niveau signifikant ist, und b) der erforderliche Mindeststichprobenumfang zu berechnen, damit der (approximative) Binomialtest mit 90%iger Sicherheit ein auf 5%igem Testniveau signifikantes Ergebnis liefert, wenn der Sollwert um den Betrag ∆=0.1 überschritten wird. Lösung mit R: > > > > > p0 <- 0.7; n <- 100; h <- 80; p <- h/n; alpha <- 0.05 # a) Hypothesen H0: p=p0 gegen H1: p>p0 # a1) Berechnung des P-Werts direkt aus der Definition Pexact <- 1-pbinom(h-1, n, p0) print(cbind(alpha, p0, n, p, Pexact), digits=4) alpha p0 n p Pexact [1,] 0.05 0.7 100 0.8 0.01646 > # a2) P-Wert-Berechnung mit der R-Funktion binom.test() > binom.test(h, n, p=p0, alternative="greater") Exact binomial test data: h and n number of successes = 80, number of trials = 100, p-value = 0.01646 alternative hypothesis: true probability of success is greater than 0.7 95 percent confidence interval: 0.7227998 1.0000000 sample estimates: probability of success 0.8 > > > > # a3) näherungsweise P-Wert-Berechnung durch Simulation B <- 10000; omega <- c(0,1); pp <- c(1-p0,p0) Hglh <- replicate(B, sum(sample(omega,n,replace=T, prob=pp))>=h) Ps <- sum(Hglh)/B; print(cbind(B, Ps)) B Ps [1,] 10000 0.0167 > # a4) näherungsweise P-Wert-Berechnung mit prop.test() > n*p0*(1-p0)>9 # Voraussetzung für Approximation [1] TRUE > prop.test(h, n, p=p0, alternative="greater") 1-sample proportions test with continuity correction data: h out of n, null probability p0 X-squared = 4.2976, df = 1, p-value = 0.01908 alternative hypothesis: true p is greater than 0.7 95 percent confidence interval: 0.7212471 1.0000000 sample estimates: p 0.8 > > > > > > > > # # b) Mindest-n # b1) näherungsweise mit Faustformel beta <- 0.1; za <- qnorm(1-alpha); zb <- qnorm(1-beta) Delta <- 0.1; p <- p0+Delta ns <- (za+zb)^2/(2*asin(sqrt(p))-2*asin(sqrt(p0)))^2 ns <- ceiling(ns) print(cbind(alpha, beta, p0, p, ns)) alpha beta p0 p ns [1,] 0.05 0.1 0.7 0.8 160 > # b2) näherungsweise mit der R-Funktion pwr.p.test() > library(pwr) > ES <- 2*asin(sqrt(p))-2*asin(sqrt(p0)) W. Timischl: Angewandte Statistik, Testen_I_15_Text24.09.15 16 > pwr.p.test(h = ES, sig.level = 0.05, power = 0.9, + alternative = "greater") proportion power calculation for binomial distribution (arcsine transformation) h n sig.level power alternative > > > > = = = = = 0.2319843 159.1299 0.05 0.9 greater # # ERGÄNZUNG: Berechnung des P-Werts für den 2-seitigen Binomialtest # mit R-Funktion binom.test() binom.test(h, n, p=p0) Exact binomial test data: h and n number of successes = 80, number of trials = 100, p-value = 0.02896 alternative hypothesis: true probability of success is not equal to 0.7 95 percent confidence interval: 0.7081573 0.8733444 sample estimates: probability of success 0.8 > > > + > # direkt aus Definition des P-Werts Bh <- dbinom(h, n, p0); Pc <- 0 for (x in 0:n) {Bx <- dbinom(x, n, p0) if (Bx>Bh) {Pc <- Pc+Bx}} P <- 1-Pc; print(cbind(Bh, P), digits=4) Bh P [1,] 0.007576 0.02896 Lernziel 4.7*: Mit dem χ2-Test prüfen können, ob die beobachteten Häufigkeiten einer mehrstufig skalierten Zufallsvariablen von einem vorgegebenen Verhältnis abweichen. • Beobachtungsdaten und Modell: Es liegen n Beobachtungen einer k-stufig skalierten Variablen vor, d.h. einer (nicht notwendigerweise quantitativen) Variablen mit k>1 Ausprägungen (Klassen) a1, a2,…, ak. Die Ausprägung ai wird an oi Untersuchungseinheiten beobachtet. Jede Beobachtung ist das Ergebnis eines Zufallsexperimentes, das n-mal wiederholt wird. Dabei ist pi die Wahrscheinlichkeit, dass eine Wiederholung mit der Ausprägung ai auftritt. Für die Anzahl Oi der Wiederholungen mit der Ausprägung ai ist der Mittelwert Ei=E(Oi)=npi zu erwarten. • Hypothesen und Testgröße: Die Wahrscheinlichkeiten pi (i=1,2,…, k) werden zweiseitig an Hand der Hypothesen H0: pi = p0i (i=1,2, ..., k) gegen H1: pi ≠ p0i für wenigstens ein i W. Timischl: Angewandte Statistik, Testen_I_15_Text24.09.15 17 mit vorgegebenen Sollwerten p0i verglichen. Die Testentscheidung stützt sich auf die Chiquadrat-Summe (Goodness of Fit-Statistik) k (Oi − Ei )2 i =1 Ei TG= GF = ∑ k (Oi − np0i )2 i =1 np0i =∑ als Testgröße, die asymptotisch χ2-verteilt ist mit k-1 Freiheitsgraden. Ersetzt man die Oi durch die beobachteten Häufigkeiten oi, erhält man die Realisierung TGs der Testgröße. • Entscheidung: Bei vorgegebenem Signifikanzniveau α wird H0 abgelehnt, wenn der P-Wert kleiner als α ist. Mit der Verteilungsfunktion Fk-1 der χ2k-1-Verteilung erhält man aus P=1-Fk-1(TGs) eine Näherung für den P-Wert3. Der Ablehnungsbereich ist näherungsweise durch das mit dem (1-α)-Quantil χ2k-1,α der χ2k-1-Verteilung gebildeten Intervall TG = GF > χ2k-1,α gegeben. Die Näherung ist ausreichend genau, wenn alle erwarteten Häufigkeiten Ei>5 sind Beispiel 4.6: Bei einem seiner Kreuzungsversuche mit Erbsen erhielt Mendel 315 runde gelbe Samen, 108 runde grüne, 101 kantige gelbe und 32 kantige grüne. Sprechen die Beobachtungswerte gegen das theoretische Aufspaltungsverhältnis 9 : 3 : 3 : 1 der Phänotypen? (a=5%) Lösung mit R: > > > > > > options(digits=4) klassen <- c("rund/gelb", "rund/grün", "kantig/gelb", "kantig/grün") observed <- c(315, 108, 101, 32) prob <- c(9, 3, 3, 1)/16 tabelle <- data.frame(klassen, observed, prob) tabelle klassen observed prob 1 rund/gelb 315 0.5625 2 rund/grün 108 0.1875 3 kantig/gelb 101 0.1875 4 kantig/grün 32 0.0625 > # Prüfung auf Abweichung von einem vorgegebenen Verhältnis > # H0: Wahrscheinlichkeiten verhalten sich gemäß dem theoretischen Augfspaltungsverhältnis > # H1: dies ist nicht der Fall > chisq.test(observed, p=prob) 3 Die Berechnung des (approximativen) P-Werts bei der Prüfung von Anzahlen auf ein vorgegebenes Verhältnis erfolgt in R mit der Funktion chisq.test(). W. Timischl: Angewandte Statistik, Testen_I_15_Text24.09.15 18 Chi-squared test for given probabilities data: observed X-squared = 0.47, df = 3, p-value = 0.9254 Wegen p-value = 92,54% ≥ 5% kann H0 (beobachtete Anzahlen entsprechen dem Aufspaltungsverhältnis 9:3:3:1) auf dem 5%-Niveau nicht abgelehnt werden. ÜBUNGSBEISPIELE 1. Es sei X eine N(µ, σ2)-verteilte Zufallsvariable mit der Varianz σ2=4. Man prüfe die Hypothesen H0: µ=15 gegen H1: µ ≠ 15 mit dem 2-seitigen Gauß-Test auf der Grundlage der Beobachtungsreihe 15.6, 17.3, 15.0, 13.7, 11.1, 15.2, 14.7, 13.4, 14.4, 11.9, 10.4, 14.5 und argumentiere die Testentscheidung sowohl mit dem P-Wert als auch mit dem Ablehnungsbereich. Als Signifikanzniveau sei α=5% vereinbart. 2. An Hand einer Stichprobe mit dem Umfang n=10 und dem arithmetischen Mittel x =0.827 soll mit dem Gauß-Test geprüft werden, ob der Mittelwert eines N(µ, σ2)-verteilten Untersuchungsmerkmals X den Sollwert µ0=0.8 überschreitet. Dabei sei σ=0.05 und α=1%. Ist die Überschreitung signifikant? Man bestimme ferner die Wahrscheinlichkeit einer Testentscheidung für H1, wenn die Überschreitung ∆=0.027 beträgt. 3. Es soll die Abweichung einer Messgröße X von einem vorgegebenen Sollwert µ0=1.5 geprüft werden. Da X als normalverteilt angenommen werden kann und überdies ein genauer Schätzwert für die Standardabweichung, nämlich σˆ =0.3, bekannt ist, wird die Prüfung mit dem 2-seitigen Gauß-Test vorgenommen und dabei das Signifikanzniveau α=5% vereinbart. Wie groß ist der Stichprobenumfang zu planen, damit man mit dem Test eine kritische Abweichung von 10% des Sollwerts mit 80%iger Sicherheit als signifikant erkennen kann. 4. Von einer Messstelle wurden die folgenden Werte der Variablen X (SO2Konzentration der Luft in mg/m3) gemeldet: 32, 41, 33, 35, 34. a) Weicht die mittlere SO2-Konzentration signifikant vom Wert µ0=30 ab? Als Testniveau sei α=5%$ vereinbart. b) Welcher Mindeststichprobenumfang müsste geplant werden, um mit dem Test eine Abweichung vom Referenzwert m0 um 5% (des Referenzwertes) mit einer Sicherheit von 95% erkennen zu können? 5. Bei einer Untersuchung der Cd-Belastung von Forellen in einem Fließgewässer wurden n=10 Forellen gefangen und der Cd-Gehalt X (in µg/g Frischgewicht) bestimmt. Die Auswertung ergab den Mittelwert x =62 und die Standardabweichung s=7. a) Kann aus den Angaben geschlossen werden, dass der mittlere Cd-Gehalt signifikant (α=5%) über dem vorgegebenen Referenzwert µ0=60 liegt? b) Wie groß ist die Wahrscheinlichkeit, dass man mit dem Test eine Überschreitung des Referenzwerts in der Höhe der beobachteten Überschreitung als signifikant erkennt? W. Timischl: Angewandte Statistik, Testen_I_15_Text24.09.15 19 6. Bei der Inbetriebnahme einer Anlage zur Abfüllung einer Lösung in Flaschen mit der Nennfüllmenge von 0.5l wurden in einem Probebetrieb die folgenden Füllmengen X (in l) gemessen: 0.491, 0.488, 0.493, 0.538, 0.493, 0.478, 0.506, 0.459, 0.471, 0.480. a) Kann man aus den Daten schließen, dass die Nennfüllmenge nicht erreicht wird? Das Testniveau sei mit α=0.01 festgelegt. b) Ist der Stichprobenumfang ausreichend groß, um eine Unterschreitung in der Höhe von 10ml mit einer Sicherheit von 90% feststellen zu können? 7. Die Verpackung einer bestimmten Zigarettensorte weist einen mittleren Nikotingehalt von 15 mg pro Zigarette aus. Es wird eine Zufallsstichprobe von 100 Zigaretten getestet. Dabei ergaben sich ein mittlerer Nikotingehalt von 16.5 mg und eine Standardabweichung von 4 mg. Kann aus dem Ergebnis der Stichprobe auf 1%igem Signifikanzniveau der Schluss gezogen werden, dass der tatsächliche Nikotingehalt im Mittel über 15 mg liegt? (Überschreitung sign.) 8. Es sei X eine normalverteilte Umweltmessgröße mit dem (unbekannten) Mittelwert μ und der Standardabweichung σ=10. Mit Hilfe einer Stichprobe soll geprüft werden, ob eine Überschreitung des Grenzwertes K vorliegt, wobei das αRisiko mit 5% vorgegeben ist und eine kritische Überschreitung von 6.5 mit 90%iger Sicherheit erkannt werden soll. Welcher Stichprobenumfang ist zu planen? (21) 9. Von einer Messstelle wurden die folgenden Werte der Variablen X (SO2Konzentration der Luft in mg/m3) gemeldet: 32, 41, 33, 35, 34. a) Weicht die mittlere SO2-Konzentration signifikant vom Wert µo=30 ab? (α=5%) b) Welcher Mindeststichprobenumfang müsste in 6 geplant werden, um mit dem Test eine Abweichung vom Referenzwert µo um 5% (des Referenzwertes) mit einer Sicherheit von 95% erkennen zu können? (sign. Abweichung; 73) 10. Es sei X eine normalverteilte Messgröße mit der Varianz 0,25; für X ist der Nennwert 1,75 vorgegeben. Zur Prüfung auf eine allfällige Abweichung vom Nennwert wird der t-Test eingesetzt; als Testniveau ist 5% vorgesehen. Wie groß muss der Stichprobenumfang geplant werden, um eine kritische Abweichung um 0,15 Einheiten mit 90%iger Sicherheit erkennen zu können? (117) 11. Die Messung der Ozonkonzentration während der Sommermonate ergab für eine Großstadt die in der folgenden Tabelle enthaltenen Werte (Angaben in 10-2 ppm). a. Stehen die Daten in Widerspruch zur angenommenen Normalverteilung der Messgröße? b. Liegt die mittlere Ozonkonzentration signifikant über dem Referenzwert µo=5? (α = 5%) c. Wie groß ist die Wahrscheinlichkeit, die beobachtete Überschreitung des Referenzwertes mit dem auf 5%igem Niveau geführten t-Test als signifikant zu erkennen? d. Welcher Mindeststichprobenumfang müsste geplant werden, um mit dem Test eine Überschreitung von µo um 10% mit einer Sicherheit von 90% erkennen zu können? W. Timischl: Angewandte Statistik, Testen_I_15_Text24.09.15 20 2.5 3.0 5.6 4.7 6.5 6.7 1.7 5.3 4.6 7.4 5.4 4.1 5.1 5.6 5.4 6.1 7.6 6.2 6.0 5.5 5.8 8.2 3.1 5.8 2.6 12. In einer Studie wurde u.a. das Ges. Eiweiß i.S. am Beginn und am Ende einer Behandlung bestimmt. Bei 40 Probanden war eine Veränderung zu beobachten: 27 Probanden, bei denen der Eiweißwert vorher im Normbereich lag, wiesen nachher einen Wert außerhalb des Normbereichs auf; bei 13 Probanden lag der Eiweißwert vorher außerhalb und nachher im Normbereich. a) Man prüfe auf 5%igem Niveau, ob der Anteil der Probanden, bei denen der Eiweißwert vorher außerhalb und nachher innerhalb des Normbereichs lag, signifikant von 0.5 abweicht. b) Welcher Stichprobenumfang müsste geplant werden, damit der approximative) Binomialtest mit 90%iger Sicherheit ein signifikantes (a=5%) Ergebnis liefert, wenn p=p0+0.15 ist? 13. Im Rahmen einer Untersuchung des Ernährungsstatus von Schulkindern wurde u.a. das Gesamtcholesterin erfasst. In einer Stichprobe aus den Kindern der Volksschule einer bestimmten Region war der Cholesterinwert bei 45 von 75 Kindern im Normbereich. a) Man prüfe auf 5%igem Niveau, ob der Anteil der Schulkinder im Normbereich signifikant über 50% liegt. b) Man bestimme die Wahrscheinlichkeit (Power), mit dem Test eine Überschreitung von p0 um ∆=0.1 als signifikant zu erkennen. 14. Von einer Abfüllanlage sei bekannt, dass die abgefüllten Einheiten nur mit 5%iger Wahrscheinlichkeit nicht eine vorgegebene Mindestmenge aufweisen. Nach einer Neueinstellung der Anlage wurden im Probelauf 150 Packungen zufällig ausgewählt und dabei festgestellt, dass in 4 Fällen die Mindestmenge nicht erreicht wurde. Die Frage ist, ob dieses Ergebnis eine signifikante Unterschreitung des Sollwertes p0=5% anzeigt (α=5%). 15. Für eine Blumenzwiebelsorte wird eine Keimfähigkeit von mindestens 75% garantiert. In einer Stichprobe von n=60 keimten 35 Zwiebeln. a) Liegt eine signifikante Abweichung vom garantierten Ergebnis vor? Man prüfe diese Frage auf dem Signifikanzniveau α=5%. b) Welche Fallzahl ist notwendig, um eine Unterschreitung des garantierten Anteils um 0.1 mit einer Sicherheit von 90% feststellen zu können? (Unterschreitung sign.; 214) 16. In einer Studie über die Behandlung von akuten Herzinfarktpatienten wurde einer Standardtherapie mit einer neuen Therapie verglichen. Es wurden 160 Patienten mit der neuen Therapie behandelt, von denen 20 innerhalb von 4 Wochen verstarben. Bei Anwendung der Standardtherapie muss eine Sterbewahrscheinlichkeit von po =0,2 angenommen werden. Man prüfe mit dem Binomialtest, ob die neue Therapie ein signifikant unter po =0,2 liegendes Sterberisiko ergibt (α=5%). (Unterschr. sign.) 17. In sogenannten Fall-Kontroll-Studien werden Vierfeldertafeln verwendet, um die Verteilung eines (zweistufigen) Risikofaktors (Raucher/Nichtraucher) in einer W. Timischl: Angewandte Statistik, Testen_I_15_Text24.09.15 21 Testgruppe und einer Kontrollgruppe darzustellen. Die Tabelle zeigt die (hypothetische) Vierfeldertafel einer Fall-Kontroll-Studie. Raucher Nichtraucher Testgruppe 87 60 Kontrolle 78 45 a) Man prüfe für die Testgruppe, ob der Anteil der Raucher signifikant über p0=0,5 liegt. (α=5%)? (Überschr. sign.) b) Welcher Mindeststichprobenumfang müsste geplant werden, um mit dem Binomialtest eine Überschreitung von p0 =0,5 um 0,05 Einheiten mit einer Sicherheit von 80% erkennen zu können? (700) 18. Bei seinen Kreuzungsversuchen mit Erbsen untersuchte Mendel unter anderem die Nachkommen von bezüglich zweier Merkmale mischerbigen Pflanzen. Bei den Merkmalen handelte es sich um die Samenform mit den Allelen A (runde Form) und a (kantige Form) sowie um die Samenfarbe mit den Allelen B (gelbe Färbung) und b (grüne Färbung). 15 Stammpflanzen des Genotyps AaBb gaben insgesamt 529 Samen, aus denen sich Pflanzen der Genotypen AABB, AAbb, aaBB, aabb, AABb, aaBb, AaBB, Aabb sowie AaBb mit den Häufigkeiten 38, 35, 28, 30, 65, 68, 60, 67 bzw. 138 entwickelten. Nach der Mendel'schen Theorie müssten sich die neun Genotypen im Verhältnis 1:1:1:1:2:2:2:2:4 aufspalten. Kann die Theorie auf dem Testniveau α = 5% durch dieses Beobachtungsergebnis falsifiziert werden? (nein) 19. Ein symmetrischer Würfel sollte beim Ausspielen mit gleicher Wahrscheinlichkeit eine der sechs Augenzahlen zeigen. Zur Überprüfung wurde ein Würfel 1000 mal ausgespielt und dabei die folgenden Häufigkeiten der Augenzahlen erhalten: Augenzahl/Häufigkeit: 1/172, 2/179, 3/173, 4/163, 5/171, 6/142. Man prüfe mit dem χ2-Test, ob die Häufigkeiten, mit denen die Augenzahlen auftreten, signifikant von der Gleichverteilung, d.h. vom Verhältnis 1:1:1:1:1:1 abweichen. Als Signifikanzniveau wähle man α=5%. 20. Es soll gezeigt werden, dass die Stichprobewerte 210, 199, 195, 210, 217, 226, 220, 221, 182 mit der Annahme einer normalverteilten Grundgesamtheit X vereinbar sind. Man führe den Nachweis auf 5%igem Testniveau. 21. Von einer Pflanze erhielt Mendel (1866) insgesamt 62 Samen von denen 44 gelb und 18 grün gefärbt waren. Man zeige, dass das Verhältnis 44:18 der beobachteten Anzahlen nicht "signifikant" vom theoretischen Aufspaltungsverhältnis 3:1 abweicht ( = 5%)? 22. In einer Studie mit 5 Probanden wurde eine bestimmte Zielgröße X am Studienbeginn (Xb) und – nach erfolgter Behandlung - am Studienende (Xe) gemessen. Xb 57 73 44 27 32 Xe 59 74 46 26 35 a) Man erfasse die Wirkung der Behandlung durch die Differenz Y= Xe - Xb und prüfe, ob der Mittelwert von Y signifikant von Null abweicht (α=5%). (nein) W. Timischl: Angewandte Statistik, Testen_I_15_Text24.09.15 22 b) Was kann über die Versuchsplanung in a) gesagt werden? Welcher Mindeststichprobenumfang müsste geplant werden, um mit dem Test eine Abweichung von Null in der Höhe von 50% des Mittelwerts von Y mit einer Sicherheit von 90% als signifikant erkennen zu können? (50) 23. Die folgende Tabelle enthält Produktivitätsdaten von 60 Kohorten von je 15 weiblichen Tsetsefliegen. Als Produktivitätsmaß wird die Anzahl Y der Puparien verwendet, die in einer Kohorte bis zum 78ten Lebenstag abgelegt werden. a) Man vergleiche den Mittelwert von Y mit dem Wert 55; liegt eine signifikante Abweichung vor? Liegt die Standardabweichung signifikant über dem Wert 10? (jeweils 5%-Testniveau) (Mittelwert: Abw. nicht sign., Standardabweichung: Überschr. sign.) b) Welcher Stichprobenumfang müsste geplant werden, um eine Abweichung des Mittelwerts (vom Referenzwert) in der beobachteten Höhe mit 90%iger Sicherheit erkennen zu können? (162) c) Man stelle fest, ob die Werte der Variablen Y im Einklang mit der Annahme „H0: Y ist normalverteilt“ stehen (α = 5%). Nr. 1 2 3 4 5 6 7 8 9 10 Y Nr. 72 11 81 12 55 13 55 14 50 15 53 16 70 17 79 18 42 19 69 20 Y Nr. 54 21 57 22 69 23 62 24 73 25 58 26 46 27 50 28 27 29 68 30 Y Nr. 67 31 59 32 49 33 51 34 65 35 56 36 58 37 67 38 66 39 74 40 Y Nr. 51 41 69 42 64 43 68 44 73 45 81 46 54 47 65 48 58 49 61 50 Y Nr. 59 51 65 52 60 53 43 54 52 55 57 56 37 57 39 58 49 59 51 60 Y 58 58 60 66 75 41 40 51 37 38 24. Mit einem statistischen Test soll geprüft werden, ob die Alternativhypothese H1 (z.B. Messgröße überschreitet im Mittel einen vorgegebenen Grenzwert) zutrifft, also die Nullhypothese H0 abgelehnt werden kann. Als Testniveau sei 5% vorgegeben, d.h. für die Wahrscheinlichkeit einer irrtümlichen Entscheidung gegen H0 soll gelten: P(Entscheidung für H1|H0) = 5%. Der Versuch wurde mit der Power P(Entscheidung für H1|H1) = 90% geplant. Wie groß ist die posteriori Wahrscheinlichkeit P(H1|Entscheidung für H1), wenn die a-priori Wahrscheinlichkeit dafür, dass H1 zutrifft, gleich 5% ist? (48,6%) 25. Zur Entscheidung, ob ein neues Medikament besser sei als ein herkömmliches, wird ein statistischer Test verwendet. Der Test erlaubt es, die bessere Wirkung (Hypothese H1) des neuen Medikamentes mit einer Wahrscheinlichkeit von 80% zu erkennen; ist das neue Medikament nicht besser (Hypothese H0), zeigt dies der Test mit einer Wahrscheinlichkeit von 95% an. Es möge die Annahme gelten, dass unter zehn neu entwickelten Medikamenten eines besser ist. Man berechne die Wahrscheinlichkeit, dass bei Entscheidung „neues Medikament ist besser“ dies tatsächlich zutrifft. Wie groß ist diese Wahrscheinlichkeit, wenn die a prioriWahrscheinlichkeit P(H1) nur 5% beträgt? (64%, 45,7%) 26. Es sei X ein normalverteiltes Merkmal; zur Festlegung der Operationscharakteristik wird ein Lieferantenrisiko von 10% an der Gutgrenze W. Timischl: Angewandte Statistik, Testen_I_15_Text24.09.15 23 AQL=1% und ein Abnehmerrisiko von 10% an der Schlechtgrenze LQL = 2% vereinbart. Man bestimme die Kennwerte n und k des entsprechenden Prüfplans bei bekannter und unbekannter Varianz! (84, 2.19; 286, 2.19) 27. Man bestimme die Wahrscheinlichkeit für die Zurückweisung eines Prüfloses bei der Prüfung auf fehlerhafte Einheiten, wenn die Fehlerrate 5% beträgt und mit einer Stichprobe vom Umfang n=48 und der Annahmezahl c=0 geprüft wird. Welche Wahrscheinlichkeit ergibt sich für n=48 und c=2? (91,5%; 43,3%) 28. Zur Untersuchung der Frage, welchen Anteil die Skelettmasse an der Körpermasse bei Vögeln bzw. Säugetieren hat, wurden für verschiedene Vögel und Säugetiere die Skelettmasse Y und die Körpermasse X (alle Angaben in kg) bestimmt. Jemand behauptet, dass die Skelettmasse 5% der Körpermasse ausmacht. Stehen die folgenden Daten in Widerspruch zu dieser Aussage? Man nehme eine Überprüfung auf 5%igem Niveau für Vögel und Säugetiere vor. (Vögel: ja, Säugetiere: ja) Vögel Y X 1,995 40,667 0,072 1,225 0,0054 0,163 0,203 2,504 0,043 0,701 0,027 0,416 0,186 2,379 0,0058 0,124 0,028 0,427 0,00174 0,031 0,00182 0,029 0,00102 0,02 0,024 0,383 0,00618 0,144 0,00184 0,038 0,00297 0,069 0,00183 0,045 0,00076 0,013 0,00128 0,023 0,00049 0,0087 0,00062 0,0126 Säugetiere Y X 0,193 3,35 0,227 3,915 0,0003 0,0063 0,039 0,79 0,027 0,82 0,244 4,836 0,002 0,03 0,015 0,275 0,02 0,365 0,0025 0,03 0,0076 0,115 1,146 22,7 0,748 11,95 0,25 3,395 0,107 2,46 0,224 4,26 0,233 4,21 0,0173 0,35 0,27 4,45 0,448 6,725 0,135 1,56 W. Timischl: Angewandte Statistik, Testen_I_15_Text24.09.15