Text

Werbung
1
4 TESTEN VON HYPOTHESEN I
Lernziele:
1. Mit dem 1-Stichproben-t-Test entscheiden können, ob der Mittelwert
einer normalverteilten Zufallsvariablen X von einem vorgegebenen
Sollwert abweicht bzw. diesen unter- oder überschreitet.
2. Signifikante und nichtsignifikante Testergebnisse interpretieren
können.
3. Die Normalverteilungsannahme mit dem Shapiro-Wilk-Test
überprüfen können.
4. Mit dem Normal-QQ-Plot die Annahme normalverteilter
Stichprobenwerte beurteilen können.
5. Mit dem Grubbs-Test einen Ausreißer in einer normalverteilten
Zufallsstichprobe identifizieren können.
6. Mit dem Binomialtest prüfen können, ob eine unbekannte
Wahrscheinlichkeit von einem vorgegebenen Sollwert abweicht bzw.
diesen über- oder unterschreitet.
7. Mit dem χ2-Test prüfen können, ob die beobachteten Häufigkeiten
einer mehrstufig skalierten Zufallsvariablen von einem vorgegebenen
Verhältnis abweichen.
Lernziel 4.1:
Mit dem 1-Stichproben-t-Test entscheiden können, ob der Mittelwert
einer normalverteilten Zufallsvariablen X von einem vorgegebenen
Sollwert abweicht bzw. diesen unter- oder überschreitet.
Ablaufschema:
• Beobachtungsdaten und Modell:
Es liegen n Beobachtungswerte x1, x2,…, xn mit dem
arithmetischen Mittel x vor. Jedes xi ist die Realisierung einer
N(µ, σ2)-verteilten Zufallsvariablen Xi (i=1,2,…,n), mit denen das
Stichprobenmittel X sowie die Stichprobenvarianz S2 gebildet
werden.
• Hypothesen und Testgröße:
Der Vergleich des Parameters µ mit einem vorgegebenen Sollwert
µ0 erfolgt nach einer der folgenden Testvarianten:
- H0: µ = µ0 gegen H1 : µ ≠ µ0 (Variante II, 2-seitiger Test)
- H0: µ ≤ µ0 gegen H1 : µ > µ0 (Variante Ia, 1-seitiger Test auf
Überschreitung)
W. Timischl: Angewandte Statistik, Testen_I_15_Text24.09.15
2
- H0: µ ≥ µ0 gegen H1 : µ < µ0 (Variante Ib, 1-seitiger Test auf
Unterschreitung)
Als Testgröße wird das studentisierte Stichprobenmittel
X − µ0
S/ n
TG =
verwendet, das bei Gültigkeit von H0 (d.h. für µ=µ0) t-verteilt mit
dem Freiheitsgrad f=n-1 ist. Ersetzt man X durch das
arithmetische Mittel x und S durch die empirische
Standardabweichung s, erhält man die Realisierung TGs der
Testgröße.
• Entscheidung:
Entscheidungssituation beim 2-seitigen Test:
Testentscheidung mit dem P-Wert:
Bei vorgegebenem Signifikanzniveau α wird H0 abgelehnt, wenn
der P-Wert kleiner als α ist. Die Berechnung des P-Wertes erfolgt
für die Testvariante Ia mit der Formel P=1 - Fn-1(TGs),
für die Variante Ib mit der Formel P= Fn-1 (TGs), bzw.
für die zweiseitige Testvariante II mit P= 2 Fn-1(-|TGs|).
Fn-1 bezeichnet die Verteilungsfunktion der tn-1 -Verteilung
• Planung des Stichprobenumfangs
Um auf dem Niveau α mit der Sicherheit 1- β eine Entscheidung
für H1 herbeizuführen, wenn µ von µ0 um ∆ ≠ 0 im Sinne der
Alternativhypothese abweicht, kann im Falle der 1-seitigen
Testvarianten Ia und Ib der erforderliche
Mindeststichprobenumfang näherungsweise aus
n≈
σ2
∆2
(z
1−α
+ z1− β )
W. Timischl: Angewandte Statistik, Testen_I_15_Text24.09.15
2
3
bestimmt werden. Im Falle der 2-seitigen Testvariante II ist α durch
α/2 zu ersetzen. Bei Anwendung dieser Formeln muss ein
Schätzwert für σ zur Verfügung stehen. Die Formeln stimmen mit
den entsprechenden Formeln beim Gauß-Test überein, ergeben
aber auf Grund der Näherungen nur Richtwerte für den
erforderlichen Mindeststichprobenumfang.
• Gütefunktion des t-Tests:
Fehlerrisken beim Alternativtest:
Fehler 1. Art (α-Fehler, irrtümliche Ablehnung der Nullhypothese)
Fehler 2. Art (β-Fehler, falsche Nullhypothese wird beibehalten)
Die Wahrscheinlichkeiten für einen Fehler 1. und 2. Art werden in
der Gütefunktion G zusammengefasst. Diese gibt - in
Abhängigkeit vom unbekannten Erwartungswert µ - die
Wahrscheinlichkeit
G(µ) = P(Ablehnung von H0 | µ)
an, dass der Test auf Grund einer Zufallsstichprobe zu einer
Entscheidung gegen H0 führt.
Durch die Testentscheidung (mit dem P-Wert) wird sicher gestellt,
dass die Wahrscheinlichkeit eines Fehlers 1. Art höchstens gleich
dem vorgegebenen α ist. Wenn z.B. das 1-seitige Testproblem
H0: µ ≤ µ0 gegen H1 : µ > µ0 vorliegt und H0 zutrifft,
gilt also G(µ) ≤ α. Trifft dagegen H1 : µ > µ0 zu, so ist die Güte des
Tests umso besser, je näher G(µ) bei 1 liegt, oder anders
ausgedrückt, je kleiner die Wahrscheinlichkeit β(µ) = 1-G(µ) eines
Fehlers zweiter Art ist.
Die Gütefunktion ist streng monoton wachsend, geht für µ → −∞
asymptotisch gegen 0, für µ → +∞ asymptotisch gegen 1 und
nimmt an der Stelle µ=µ0 den Wert a an. Für µ ≤ µ0 ist also G(µ)≤α.
Für µ >µ0 gilt G(µ)>α und G(µ) wird in diesem Fall als
Trennschärfe oder Power an der µ bezeichnet.
W. Timischl: Angewandte Statistik, Testen_I_15_Text24.09.15
4
Abb. 4.1:
Gütefunktionen des 1- seitigen t-Tests H0: µ ≤ µ0 gegen H1 : µ > µ0 für die
Stichprobenumfänge n=5, 10, 20 (obere Grafik) und des 2-seitigen t-Tests H0:
µ = µ0 gegen H1 : µ ≠ µ0 für die Stichprobenumfänge n=10 und n=50 (untere
Grafik). Horizontal ist die auf σ bezogene Abweichung δ=(µ-µ0)/σ des
Mittelwerts vom Sollwert µ0 aufgetragen, vertikal kann man die
entsprechenden Gütefunktionswerte G*(δ)=G((µ-µ0)/σ) ablesen.
Beispiel 4.1:
In einem Experiment wurde die Selbstentladung von wiederaufladbaren
NiMH-Gerätezellen mit einer Kapazität (in mAh) von 2000 überprüft.
Laut Hersteller soll die Kapazität X nach 12 Monaten 85% des
Anfangswertes, also µ0=1700, betragen.
a) Es ist zu zeigen, dass das Experiment mit 30 Zellen durchgeführt
werden müsste, damit der t-Test auf 5%igem Niveau eine
Sollwertabweichung in der Höhe von ∆=60 mit einer Sicherheit von
90% feststellen kann. Dabei möge die Annahme zutreffen, dass die
Kapazität X normalverteilt sei und für σ der Schätzwert σˆ = 100 zur
Verfügung steht.
b) Die Ausführung des Experimentes hat die folgenden Messwerte
ergeben:
1590, 1620, 1670, 1790, 1670, 1580, 1470, 1690, 1680, 1890,
W. Timischl: Angewandte Statistik, Testen_I_15_Text24.09.15
5
1560, 1610, 1670, 1450, 1690, 1710, 1670, 1810, 1580, 1560,
1680, 1730, 1680, 1550, 1760, 1750, 1530, 1540, 1690, 1730.
Es ist mit dem 2-seitigen t-Test zu zeigen, dass das arithmetische
Mittel der Prüfstichprobe signifikant (α=5%) vom Sollwert µ0=1700
abweicht.
Lösung mit R:
>
>
>
>
>
# a) Planung des Stichprobenumfangs
mu0 <- 1700; sigma <- 100; Delta <- 60
alpha <- 0.05; qa <- qnorm(1-alpha/2); beta <- 0.1; qb <- qnorm(1-beta)
ns <- sigma^2/Delta^2*(qa+qb)^2
print(cbind(mu0, Delta, sigma, qa, qb, ns))
mu0 Delta sigma
qa
qb
ns
[1,] 1700
60
100 1.959964 1.281552 29.18729
> # Lösung mit R-Funktion power.t.test()
> power.t.test(delta=Delta, sd=sigma, sig.level=0.05, power=0.9,
+
type="one.sample")
One-sample t test power calculation
n
delta
sd
sig.level
power
alternative
=
=
=
=
=
=
31.17169
60
100
0.05
0.9
two.sided
>
>
>
+
+
>
>
#
# b) 2-seitiger t-Test
x <- c(1590, 1620, 1670, 1790, 1670, 1580, 1470, 1690, 1680, 1890,
1560, 1610, 1670, 1450, 1690, 1710, 1670, 1810, 1580, 1560,
1680, 1730, 1680, 1550, 1760, 1750, 1530, 1540, 1690, 1730)
n <- length(x); xquer <- mean(x); s <- sd(x); mu0 <- 1700
print(cbind(n, xquer, s))
n
xquer
s
[1,] 30 1653.333 100.1837
> alpha <- 0.05; q <- qt(1-alpha/2, n-1)
> tgs <- (xquer-mu0)*sqrt(n)/s; P <- 2*pt(-abs(tgs), n-1)
> print(cbind(alpha, q, tgs, P))
alpha
q
tgs
P
[1,] 0.05 2.04523 -2.551351 0.01626606
> # Lösung mit R-Funktion t.test()
> t.test(x, mu=mu0, alternative="two.sided", type="one.sample",
+
conf.level=alpha)
One Sample t-test
data: x
t = -2.5514, df = 29, p-value = 0.01627
alternative hypothesis: true mean is not equal to 1700
5 percent confidence interval:
1652.176 1654.490
sample estimates:
mean of x
1653.333
>
>
>
>
# c) Berechnung der Power,
# um Abweichung xquer-mu0 als signifikant zu erkennen
# c1) mit der R-Funktion power.t.test()
power.t.test(n, delta=xquer-mu0, sd=s, sig.level=0.05, type="one.sample")
One-sample t test power calculation
n = 30
delta = 46.66667
W. Timischl: Angewandte Statistik, Testen_I_15_Text24.09.15
6
sd
sig.level
power
alternative
=
=
=
=
100.1837
0.05
0.693638
two.sided
> # c2) durch Simulation mit selbstdefinierter Funktion
> # --------------------------------------------------------------> # Funktionsprogramm-Eingabeparameter:
> # n=Umfang der Zufallsstichproben
> # B=Anzahl der Zufallsstichproben aus Grundgesamtheit
> # mu, sigma= Mittelwert bzw. Standardabweichung der Grundesamtheit
> # alpha=Testniveau
> # Rückgabeparameter:
> # power=berechnete Güte (Power)
> t2.power=function(n,B,mu,sigma,alpha){
+
Ps = replicate(B,t.test(rnorm(n,mu,sigma),mu=mu0)$p.value)
+
A <- sum(Ps < alpha); power <- A/B
+
return(power)}
> # --------------------------------------------------------------> t2.power(n,10000,xquer,s,0.05) # Funktionsaufruf
[1] 0.6939
Lernziel 4.2:
Signifikante und nichtsignifikante Testergebnisse interpretieren können.
• Schlussweise der Signifikanzprüfung am Beispiel des 1-seitigen tTests auf Überschreitung:
Wenn H0 gilt, dann ist |TG| > z1-α/2 unwahrscheinlich.
Aus einer Zufallsstichprobe ergibt sich ein TGs mit |TGs| > z1-α/2.
Daher: H0 gilt nicht (genauer: ist unwahrscheinlich).
Dieses Schema erinnert an die Beweisführung „reductio ad
absurdum“ (Widerspruchsbeweis): Um eine Aussage A
indirekt zu beweisen, wird die Annahme gemacht, die Aussage ist
falsch, und aus der Negation der Aussage etwas abgeleitet, was
offensichtlich falsch ist. Es folgt, dass A richtig ist.
• Signifikante und nichtsignifikante Testergebnisse
W. Timischl: Angewandte Statistik, Testen_I_15_Text24.09.15
7
Abb. 4.2:
Schema der Entscheidungsfindung beim Signifikanztest. Vorgegeben sind die
Fehlerschranken α (z.B. 5%) und β (z.B. 10%). Ist der P-Wert kleiner als α,
wird H0 abgelehnt, also für H1 entschieden. Andernfalls, d.h. für P ≥ α wird
eine Poweranalyse (oder die Berechnung des Mindest-n) angeschlossen.
Wenn die Power größer oder gleich 1-β ist (oder der Mindest-n ≥ dem Umfang
der verwendeten Zufallsstichprobe ist), wird H0 angenommen.
Lernziel 4.3:
Die Normalverteilungsannahme mit dem Shapiro-Wilk-Test prüfen
können.
Der Shapiro-Wilk-Test wurde speziell zur Überprüfung der Annahme
(=Nullhypothese) entwickelt, dass eine metrische Zufallsvariable X
normalverteilt ist. Die Nullhypothese wird auf dem Niveau α abgelehnt,
wenn der P-Wert kleiner als α ist.
Theoretischer Hintergrund:
Die Teststatistik W des Shapiro-Wilk-Tests ist als Quotient von zwei
Schätzfunktionen für die Varianz σ2 der hypothetischen
Normalverteilung konstruiert. Die eine Schätzfunktion (im Nenner) ist
die Stichprobenvarianz, die andere (im Zähler) hängt mit dem Anstieg
der Orientierungsgeraden im QQ-Plot zusammen. Die Berechnung der
Teststatistik ist aufwendig und praktisch nur mit einschlägiger Software
zu bewältigen.
Beispiel 4.2:
Es soll gezeigt werden, dass die angegebenen Stichprobewerte mit der
Annahme einer normalverteilten Grundgesamtheit X vereinbar sind.
Lösung mit R:
>
+
+
>
>
>
x <- c(4.81, 5.16, 4.50, 4.85, 5.15, 5.21, 4.68, 4.80, 4.61, 5.17,
4.82, 4.98, 5.06, 5.01, 5.12, 5.62, 4.95, 5.16, 5.20, 4.94,
4.72, 5.32, 5.23, 4.85, 5.56, 4.51, 5.02, 4.72, 4.78, 5.27)
# Hypothesen:
# H0: X ist normalverteil gegen H1: X ist nicht normalverteilt
shapiro.test(x)
Shapiro-Wilk normality test
data: x
W = 0.9756, p-value = 0.7014
Wegen p-value = 70.14% ≥ 5% kann H0 (Stichprobenwerte nicht in
Widerspruch zur Normalverteilungsannahme) nicht abgelehnt werden.
W. Timischl: Angewandte Statistik, Testen_I_15_Text24.09.15
8
Lernziel 4.4:
Mit dem Normal-QQ-Plot die Annahme normalverteilter
Stichprobenwerte beurteilen können.
Mit dem Normal-Quantil-Quantil-Diagramm (kurz Normal-QQ-Plot) kann
man an Hand der Werte x1, x2, …, xn einer Zufallsstichprobe von X auf
grafischem Wege beurteilen, ob die Daten gegen die Annahme „X ist
normalverteilt“ sprechen (vgl. die Abb. rechts).
Theoretische Grundlage:
• Wenn X N(µ, σ2) – verteilt ist, besteht zwischen dem p-Quantil xp
von X und dem entsprechenden Quantil zp der N(0, 1)-verteilten
Zufallsvariablen Z=(X-µ)/σ der lineare Zusammenhang
xp = σ zp + µ. Die Punkte P(zp, xp) mit den für verschiedene Werte
von p (0 < p < 1) berechneten Quantilen von Z und X als
Koordinaten) liegen im (Z, X)-Koordinatensystem auf einer
Geraden mit dem Anstieg σ und dem y-Achsenabschnitt µ.
W. Timischl: Angewandte Statistik, Testen_I_15_Text24.09.15
9
Abb. 4.3:
Normal-QQ-Plots für zwei Zufallsstichproben (jeweils vom Umfang n=30). Die
QQ-Plots enthalten auch die Orientierungsgeraden durch die den unteren und
oberen Quartilen entsprechenden Punkte. Links sind die Dichtekurven der
Grundgesamtheiten dargestellt, aus denen die Stichproben generiert wurden
(oben: Normalverteilung mit µ=5 und σ=0.25, unten: logarithmische
Normalverteilung mit µ=-0.2 und σ=1). Man erkennt, dass im oberen QQ-Plot
die Punkte angenähert entlang der Orientierungsgeraden angeordnet sind; die
Abweichung von der Normalverteilung zeigt sich im unteren QQ-Plot in den
(vor allem an den Enden) von der Orientierungsgeraden wegdriftenden
Punkten. Bei kleineren Stichprobenumfängen kann es auch bei
normalverteilter Grundgesamtheit zu deutlichen Abweichungen von der
Orientierungsgeraden kommen.
• Mit den unteren Quartilen z0.25 und x0.25 sowie den oberen Quartilen
z0.75 und x0.75 von Z bzw. X können die Geradenparameter
ausgedrückt werden durch:
σ=
x0.75 − x0.25
x z − x 0.75 z 0.25
, µ = 0.25 0.75
z 0.75 − z 0.25
z 0.75 − z 0.25
• Die (nach aufsteigender Größe angeordneten) Stichprobenwerte
x(i) werden als (empirische) Quantile von X gedeutet, die
entsprechenden „Unterschreitungswahrscheinlichkeiten“ pi ermittelt
und dazu die Quantile zpi=φ-1(pi) der N(0, 1)-Verteilung berechnet.
• Die R-Funktion qqnorm() aus dem Paket ''extRemes'' (Extreme
Value Analysis) verwendet zur Erstellung von Normal-QQ-Plots für
die pi die Schätzwerte pi*=(i-0.5)/n. Diese Funktion stellt zusätzlich
simultane (d.h. für alle pi zugleich geltende) 95%ige
Konfidenzintervalle zur Verfügung.
• Auf der Grundlage eines derartigen Normal-QQ-Plots wird die
Überprüfung der Normalverteilungsannahme folgendermaßen
vorgenommen:
Zwischen den p-Quantilen xp einer normalverteilten
Grundgesamtheit X und den p-Quantilen der standardisiserten
Größe Z=(X-µ)/σ besteht ein linearer Zusammenhang, den wir in
der (Z, X)-Ebene durch die Gerade g dargestellt haben. Hat man
eine Zufallsstichprobe x1, x2, …, xn aus X und zeichnet damit ein
Normal-QQ-Plot, so werden die Punkte (zpi, xi) mehr oder weniger
von der (unbekannten) Geraden g abweichen. Sind die
Abweichungen so groß, dass man in das mit den xi bestimmte
95%ige Konfidenzband keine Gerade einzeichnen kann, dann
entscheiden wir uns gegen die Normalverteilungsannahme. Bei
W. Timischl: Angewandte Statistik, Testen_I_15_Text24.09.15
10
diesem Entscheidungsverfahren hat man ein Risiko von 5%,
irrtümlich gegen die Normalverteilungsannahme zu entscheiden.
Beispiel 4.3:
Dem Normal-QQ-Plot von Abb. 4.4 liegt die folgende Zufallsstichprobe
von n=30 Realisierungen der mit µ=5 und σ=0.25 normalverteilten
Zufallsvariablen X zugrunde:
4.50, 4.51, 4.61, 4.68, 4.72, 4.72,, 4.78, 4.80, 4.81, 4.82,
4.85, 4.85, 4.94, 4.95, 4.98, 5.01, 5.02, 5.06, 5.12, 5.15,
5.16, 5.16, 5.17, 5.20, 5.21, 5.23, 5.27, 5.32, 5.56, 5.62.
Man erzeuge das Normal-QQ-Plot mit R; ferner berechne man die
Koordinaten des ersten Punktes P1=(φ-1(p1), x(1)) und die Parameter der
Orientierungsgeraden durch (z025, Q1) und (z075, Q3).
Lösung mit R:
> x <- c(4.81, 5.16, 4.50, 4.85, 5.15, 5.21, 4.68, 4.80, 4.61, 5.17,
+
4.82, 4.98, 5.06, 5.01, 5.12, 5.62, 4.95, 5.16, 5.20, 4.94,
+
4.72, 5.32, 5.23, 4.85, 5.56, 4.51, 5.02, 4.72, 4.78, 5.27)
> # Normal-QQ-Plot
> library(extRemes)
> qqnorm(x, xlab = "N(0,1)-Quantile", ylab = "empirische Quantile")
> qqline(x, probs = c(0.25, 0.75))
> # Berechnung der Koordinaten von P1:
> sort(x); n <- length(x)
[1] 4.50 4.51 4.61 4.68 4.72 4.72 4.78 4.80 4.81 4.82 4.85 4.85 4.94 4.95 4.98
[16] 5.01 5.02 5.06 5.12 5.15 5.16 5.16 5.17 5.20 5.21 5.23 5.27 5.32 5.56 5.62
> p1 <- (1-0.5)/30; (zp1 <- qnorm(p1)) # z-Koordinate zu x(1)
[1] -2.128045
> # Orientierungsgerade durch (z025, Q1) und (z075, Q3)
> x025 <- quantile(x, 0.25); x025 <- x025[[1]]
> x075 <- quantile(x, 0.75); x075 <- x075[[1]]
> print(cbind(x025, x075))
x025
x075
[1,] 4.8025 5.1675
> z025 <- qnorm(0.25); z075 <- qnorm(0.75)
> print(cbind(z025, z075))
z025
z075
[1,] -0.6744898 0.6744898
> points(c(z025,z075),c(x025,x075), pch=3, lwd=2,cex=1.2)
> b1 <- (x075-x025)/(z075-z025); b0 <- (x025*z075-x075*z025)/(z075-z025)
> b1 <- b1[[1]]; b0 <- b0[[1]]; print(cbind(b1, b0))
b1
b0
[1,] 0.2705749 4.985
W. Timischl: Angewandte Statistik, Testen_I_15_Text24.09.15
5.2
5.0
4.6
4.8
empirische Quantile
5.4
5.6
11
-2
-1
0
1
2
N(0,1)-Quantile
Lernziel 4.5*:
Mit dem Grubbs-Test einen Ausreißer in einer normalverteilten
Zufallsstichprobe identifizieren können.
Theoretischer Grundlage:
• X ~ N(µ, σ2)
P(X < µ-4σ)+P(X > µ+4σ)= 0.0063%
Tritt ein Wert außerhalb des 4-fachen Sigma-Bereichs auf, so steht
er im Verdacht, dass er keine Realisierung von X ist, sondern z.B.
durch einen Datenfehler oder einen Störeinfluss bei der Messung
zustande gekommen ist.
• Mutmaßliche Ausreißer sollten jedenfalls dokumentiert und nur
dann aus der Stichprobe entfernt werden, wenn es dafür einen
sachlogischen Grund gibt.
• Zur Identifizierung eines Stichprobenwerts als Ausreißer gibt es
einfache Kriterien - z.B. die Unter- bzw. Überschreitung der mit
dem Interquartilabstand IQR gebildeten robusten Grenzen
Q1-1.5 IQR bzw. Q3+1.5 IQR (Boxplot!) - oder spezielle
Testverfahren.
Grubbs-Test zur Identifizierung eines einzelnen Ausreißers:
W. Timischl: Angewandte Statistik, Testen_I_15_Text24.09.15
12
• Voraussetzung: X ~ N(µ, σ2);
Überprüfung mit einem Normal-QQ-Plot
• Testentscheidung:
H0: „Der Wert mit dem größten Abstand vom arithmetischen Mittel
ist kein Ausreißer“ wird auf dem Testniveau α abgelehnt, wenn
Gs =
max xi − x
i =1,..., n
s
> g n ,α =
n −1
n
c2
n − 2 + c2
gilt; dabei ist c das α/(2n)-Quantil der t-Verteilung mit f=n-2
Freiheitsgraden.
Beispiel 4.4:
Durch einen Eingabefehler möge der zehnte Wert x10=5.17 der
Stichprobe im vorangehenden Beispiel auf 1.17 verfälscht. Man zeige,
dass dieser Wert mit dem Grubbs-Test auf 5%igem Niveau als Ausreißer
identifiziert werden kann.
Lösung mit R:
>
>
+
+
>
>
>
>
>
options(digits=4)
x <- c(4.81, 5.16, 4.50, 4.85, 5.15, 5.21, 4.68, 4.80, 4.61, 1.17,
4.82, 4.98, 5.06, 5.01, 5.12, 5.62, 4.95, 5.16, 5.20, 4.94,
4.72, 5.32, 5.23, 4.85, 5.56, 4.51, 5.02, 4.72, 4.78, 5.27)
# Grubbs-Test:
# H0: extremer Wert ist Ausreißer, wenn Gs > Gkrit
n <- length(x) # Stichprobenumfang
mw <- mean(x); s <- sd(x) # Schätzung der Verteilungsparameter
print(cbind(mw, s))
mw
s
[1,] 4.859 0.7494
> Gs <- max(abs(x-mw))/s; Gs # Realisierung der Testgroesse
[1] 4.923
> alpha <- 0.05; c <- qt(alpha/2/n, n-2); c
[1] -3.479
> Gcrit <- (n-1)/sqrt(n)*sqrt(c^2/(n-2+c^2)); Gcrit # kritischer Wert
[1] 2.908
Lernziel 4.6:
Mit dem Binomialtest prüfen können, ob eine unbekannte
Wahrscheinlichkeit von einem vorgegebenen Sollwert abweicht
bzw. diesen über- oder unterschreitet.
Ablaufschema:
• Beobachtungsdaten und Modell:
Es liegen n Beobachtungen vor, die in zwei Klassen eingeteilt
werden können. Die Zugehörigkeit der i-ten Beobachtung zur
Klasse 1 sei durch eine Bernoulli-Variable Xi beschrieben, die den
Wert 1 annimmt, wenn die Beobachtung zur Klasse 1 gehört und
den Wert 0, wenn dies nicht der Fall ist. Jede der unabhängigen
W. Timischl: Angewandte Statistik, Testen_I_15_Text24.09.15
13
und identisch verteilten Bernoulli-Variablen X1, X2, …, Xn nimmt mit
der Wahrscheinlichkeit p den Wert 1 an. Konkret wurden h
Beobachtungen in der Klasse 1 gezählt.
• Hypothesen und Testgröße:
Der Vergleich des Parameters p mit einem vorgegebenen Sollwert
p0 erfolgt nach einer der folgenden Testvarianten:
- H0: p =p0 gegen H1 : p ≠ p0 (Variante II, 2-seitiger Test)
- H0: p ≤ p0 gegen H1 : p > p0 (Variante Ia, 1-seitiger Test auf
Überschreitung)
- H0: p ≥ p0 gegen H1 : p < p0 (Variante Ib, 1-seitiger Test auf
Unterschreitung)
Testgröße: Anzahl TG=H= nX der Beobachtungen in der Klasse 1;
TG ~ Bn,p0 für p=p0.
Normalverteilungsapproximation (Voraussetzung: np0(1-p0)>9):
H − np 0
TG* =
~ N (0,1) für H 0 : p = p 0
np 0 (1 − p 0 )
Für die konkrete Beobachtungsreihe ist H=h.
• Entscheidung:
Testentscheidung mit dem P-Wert:
Bei vorgegebenem Signifikanzniveau α wird H0 abgelehnt, wenn
der P-Wert kleiner als α ist.
Exakter Binomialtest:
Testvariante Ia: P=1 - FB(h-1)
Testvariante Ib: P= FB(h)
Testvariante II:
Die Bestimmung des P-Werts für das 2-seitige Testproblem ist
komplizierter. Betrachtet man z.B. den Fall h > np0, sind jedenfalls
die Testgrößenwerte h+1, h+2, …, n extremer als die beobachtete
Realisierung h. Für jeden extremen Wert xr gilt Bn,p0(xr) <= Bn,p0(h).
Die Wahrscheinlichkeit dass die Testgröße einen Wert gleich oder
größer als h annimmt, ist durch P(H >= h) =Bn,p0(h)+Bn,p0(h+1)+… +
Bn,p0(n) gegeben. Bei der Berechnung des P-Werts sind aber auch
extreme Testgrößenwerte links von np0 zu berücksichtigen. Wir
bezeichnen einen links von np0 liegenden Wert xl als extrem, wenn
wie bei den rechts liegenden Werten Bn,p0(x_l) <= Bn,p0(h) gilt.
Diese Überlegung führt dazu, den P-Wert des 2-seitigen
Binomialtests folgendermaßen zu bestimmen: Wir berechnen die
W. Timischl: Angewandte Statistik, Testen_I_15_Text24.09.15
14
Wahrscheinlichkeiten P(H=x)=Bn, p0(x), dass die Testgröße H bei
Gültigkeit von H0 : p=p0 die möglichen Werte x = 0, 1, …, n
annimmt. Die Summe der Binomialwahrscheinlichkeiten mit der
Eigenschaft Bn,p0(x) <= Bn,p0(h) ist der gesuchte $P$-Wert.
Approximativer Binomialtest (mit Stetigkeitskorrektur)
Testvariante Ia: P≈ 1-FN(h-0.5)
Testvariante Ib: P≈ FN(h+0.5)
Testvariante II: P≈ 2FN(np_0-d+0.5)
FN ist die Verteilungsfunktion der N(µ, σ2)-Verteilung mit µ=np0
und σ02=np0(1-p0); d=|h-np0| ist die Abweichung der beobachteten
Anzahl vom Mittelwert1.
• Planung des Stichprobenumfangs
Um auf dem Niveau α mit der Sicherheit 1- β eine Entscheidung
für H1 herbeizuführen, wenn p von p0 um ∆ ≠ 0 im Sinne der
Alternativhypothese abweicht, kann im Falle der 1-seitigen
Testvarianten Ia und Ib das erforderliche Mindest-n
näherungsweise aus
n≈
(z
(2 arcsin
+ z1− β )
2
1−α
p − 2 arcsin p0
)
2
;
Bestimmt werden; im Falle der 2-seitigen Testvariante II ist z1-α
durch z1-α/2 zu ersetzen2.
Beispiel 4.5:
Mit einer neuen Behandlungsmethode will man die Erfolgsrate
p (d.h. die Wahrscheinlichkeit, dass bei einer mit der neuen Methode
behandelten Person eine Verbesserung eintritt) von mehr als p0=0.7
erreichen. In einer Studie mit 100 Probanden ist die neue Methode bei
h=80 Personen erfolgreich, der beobachtete Stichprobenanteil h/n=0.8
überschreitet also den Sollwert p0=0.7.
1
Den P-Wert des exakten Binomialtests erhält man in R mit der Funktion binom.test(), den P-Wert des
approximativen Binomialtests (mit und ohne Stetigkeitskorrektur) mit prop.test().
2
Der Näherung liegt die sogenannte Arcus-Sinus-Transformation zugrunde, mit der der
Stichprobenanteil H/n (die Anzahl H ist Bn, p-verteilt) in die Zufallsvariable Y = 2 arcsin H / n .
Wie man zeigen kann, nähert sich mit wachsendem n die Verteilung von Y* einer Normalverteilung mit
*
dem Mittelwert
µY * = 2 arcsin p
und der konstanten Varianz σ
2
Y*=1/n.
Die Näherung ist in der R-
Funktion pwr.p.test() im Paket "pwr" implementiert, mit der der erforderliche
Mindeststichprobenumfang geplant und Gütefunktionswerte berechnet werden können.
W. Timischl: Angewandte Statistik, Testen_I_15_Text24.09.15
15
Es ist a) zu zeigen, dass die Überschreitung auf 5%igem Niveau
signifikant ist, und b) der erforderliche Mindeststichprobenumfang zu
berechnen, damit der (approximative) Binomialtest mit 90%iger
Sicherheit ein auf 5%igem Testniveau signifikantes Ergebnis liefert,
wenn der Sollwert um den Betrag ∆=0.1 überschritten wird.
Lösung mit R:
>
>
>
>
>
p0 <- 0.7; n <- 100; h <- 80; p <- h/n; alpha <- 0.05
# a) Hypothesen H0: p=p0 gegen H1: p>p0
# a1) Berechnung des P-Werts direkt aus der Definition
Pexact <- 1-pbinom(h-1, n, p0)
print(cbind(alpha, p0, n, p, Pexact), digits=4)
alpha p0
n
p Pexact
[1,] 0.05 0.7 100 0.8 0.01646
> # a2) P-Wert-Berechnung mit der R-Funktion binom.test()
> binom.test(h, n, p=p0, alternative="greater")
Exact binomial test
data: h and n
number of successes = 80, number of trials = 100, p-value = 0.01646
alternative hypothesis: true probability of success is greater than 0.7
95 percent confidence interval:
0.7227998 1.0000000
sample estimates:
probability of success
0.8
>
>
>
>
# a3) näherungsweise P-Wert-Berechnung durch Simulation
B <- 10000; omega <- c(0,1); pp <- c(1-p0,p0)
Hglh <- replicate(B, sum(sample(omega,n,replace=T, prob=pp))>=h)
Ps <- sum(Hglh)/B; print(cbind(B, Ps))
B
Ps
[1,] 10000 0.0167
> # a4) näherungsweise P-Wert-Berechnung mit prop.test()
> n*p0*(1-p0)>9 # Voraussetzung für Approximation
[1] TRUE
> prop.test(h, n, p=p0, alternative="greater")
1-sample proportions test with continuity correction
data: h out of n, null probability p0
X-squared = 4.2976, df = 1, p-value = 0.01908
alternative hypothesis: true p is greater than 0.7
95 percent confidence interval:
0.7212471 1.0000000
sample estimates:
p
0.8
>
>
>
>
>
>
>
>
#
# b) Mindest-n
# b1) näherungsweise mit Faustformel
beta <- 0.1; za <- qnorm(1-alpha); zb <- qnorm(1-beta)
Delta <- 0.1; p <- p0+Delta
ns <- (za+zb)^2/(2*asin(sqrt(p))-2*asin(sqrt(p0)))^2
ns <- ceiling(ns)
print(cbind(alpha, beta, p0, p, ns))
alpha beta p0
p ns
[1,] 0.05 0.1 0.7 0.8 160
> # b2) näherungsweise mit der R-Funktion pwr.p.test()
> library(pwr)
> ES <- 2*asin(sqrt(p))-2*asin(sqrt(p0))
W. Timischl: Angewandte Statistik, Testen_I_15_Text24.09.15
16
> pwr.p.test(h = ES, sig.level = 0.05, power = 0.9,
+
alternative = "greater")
proportion power calculation for binomial distribution (arcsine transformation)
h
n
sig.level
power
alternative
>
>
>
>
=
=
=
=
=
0.2319843
159.1299
0.05
0.9
greater
#
# ERGÄNZUNG: Berechnung des P-Werts für den 2-seitigen Binomialtest
# mit R-Funktion binom.test()
binom.test(h, n, p=p0)
Exact binomial test
data: h and n
number of successes = 80, number of trials = 100, p-value = 0.02896
alternative hypothesis: true probability of success is not equal to 0.7
95 percent confidence interval:
0.7081573 0.8733444
sample estimates:
probability of success
0.8
>
>
>
+
>
# direkt aus Definition des P-Werts
Bh <- dbinom(h, n, p0); Pc <- 0
for (x in 0:n) {Bx <- dbinom(x, n, p0)
if (Bx>Bh) {Pc <- Pc+Bx}}
P <- 1-Pc; print(cbind(Bh, P), digits=4)
Bh
P
[1,] 0.007576 0.02896
Lernziel 4.7*:
Mit dem χ2-Test prüfen können, ob die beobachteten Häufigkeiten einer
mehrstufig skalierten Zufallsvariablen von einem vorgegebenen
Verhältnis abweichen.
• Beobachtungsdaten und Modell:
Es liegen n Beobachtungen einer k-stufig skalierten Variablen vor,
d.h. einer (nicht notwendigerweise quantitativen) Variablen mit k>1
Ausprägungen (Klassen) a1, a2,…, ak. Die Ausprägung ai wird an oi
Untersuchungseinheiten beobachtet. Jede Beobachtung ist das
Ergebnis eines Zufallsexperimentes, das n-mal wiederholt wird.
Dabei ist pi die Wahrscheinlichkeit, dass eine Wiederholung mit der
Ausprägung ai auftritt. Für die Anzahl Oi der Wiederholungen mit
der Ausprägung ai ist der Mittelwert Ei=E(Oi)=npi zu erwarten.
• Hypothesen und Testgröße:
Die Wahrscheinlichkeiten pi (i=1,2,…, k) werden zweiseitig an
Hand der Hypothesen
H0: pi = p0i (i=1,2, ..., k) gegen H1: pi ≠ p0i für wenigstens ein i
W. Timischl: Angewandte Statistik, Testen_I_15_Text24.09.15
17
mit vorgegebenen Sollwerten p0i verglichen. Die Testentscheidung
stützt sich auf die Chiquadrat-Summe (Goodness of Fit-Statistik)
k
(Oi − Ei )2
i =1
Ei
TG= GF = ∑
k
(Oi − np0i )2
i =1
np0i
=∑
als Testgröße, die asymptotisch χ2-verteilt ist mit k-1
Freiheitsgraden. Ersetzt man die Oi durch die beobachteten
Häufigkeiten oi, erhält man die Realisierung TGs der Testgröße.
• Entscheidung:
Bei vorgegebenem Signifikanzniveau α wird H0 abgelehnt, wenn
der P-Wert kleiner als α ist. Mit der Verteilungsfunktion Fk-1 der
χ2k-1-Verteilung erhält man aus P=1-Fk-1(TGs) eine Näherung für
den P-Wert3.
Der Ablehnungsbereich ist näherungsweise durch das mit dem
(1-α)-Quantil χ2k-1,α der χ2k-1-Verteilung gebildeten Intervall
TG = GF > χ2k-1,α gegeben. Die Näherung ist ausreichend genau,
wenn alle erwarteten Häufigkeiten Ei>5 sind
Beispiel 4.6:
Bei einem seiner Kreuzungsversuche mit Erbsen erhielt Mendel 315
runde gelbe Samen, 108 runde grüne, 101 kantige gelbe und 32 kantige
grüne. Sprechen die Beobachtungswerte gegen das theoretische
Aufspaltungsverhältnis 9 : 3 : 3 : 1 der Phänotypen? (a=5%)
Lösung mit R:
>
>
>
>
>
>
options(digits=4)
klassen <- c("rund/gelb", "rund/grün", "kantig/gelb", "kantig/grün")
observed <- c(315, 108, 101, 32)
prob <- c(9, 3, 3, 1)/16
tabelle <- data.frame(klassen, observed, prob)
tabelle
klassen observed
prob
1
rund/gelb
315 0.5625
2
rund/grün
108 0.1875
3 kantig/gelb
101 0.1875
4 kantig/grün
32 0.0625
> # Prüfung auf Abweichung von einem vorgegebenen Verhältnis
> # H0: Wahrscheinlichkeiten verhalten sich gemäß dem theoretischen
Augfspaltungsverhältnis
> # H1: dies ist nicht der Fall
> chisq.test(observed, p=prob)
3
Die Berechnung des (approximativen) P-Werts bei der Prüfung von Anzahlen auf ein vorgegebenes
Verhältnis erfolgt in R mit der Funktion chisq.test().
W. Timischl: Angewandte Statistik, Testen_I_15_Text24.09.15
18
Chi-squared test for given probabilities
data: observed
X-squared = 0.47, df = 3, p-value = 0.9254
Wegen p-value = 92,54% ≥ 5% kann H0 (beobachtete Anzahlen
entsprechen dem Aufspaltungsverhältnis 9:3:3:1) auf dem 5%-Niveau
nicht abgelehnt werden.
ÜBUNGSBEISPIELE
1. Es sei X eine N(µ, σ2)-verteilte Zufallsvariable mit der Varianz σ2=4. Man prüfe die
Hypothesen H0: µ=15 gegen H1: µ ≠ 15 mit dem 2-seitigen Gauß-Test auf der
Grundlage der Beobachtungsreihe
15.6, 17.3, 15.0, 13.7, 11.1, 15.2, 14.7, 13.4, 14.4, 11.9, 10.4, 14.5
und argumentiere die Testentscheidung sowohl mit dem P-Wert als auch mit dem
Ablehnungsbereich. Als Signifikanzniveau sei α=5% vereinbart.
2. An Hand einer Stichprobe mit dem Umfang n=10 und dem arithmetischen Mittel
x =0.827 soll mit dem Gauß-Test geprüft werden, ob der Mittelwert eines
N(µ, σ2)-verteilten Untersuchungsmerkmals X den Sollwert µ0=0.8 überschreitet.
Dabei sei σ=0.05 und α=1%. Ist die Überschreitung signifikant? Man bestimme
ferner die Wahrscheinlichkeit einer Testentscheidung für H1, wenn die
Überschreitung ∆=0.027 beträgt.
3. Es soll die Abweichung einer Messgröße X von einem vorgegebenen Sollwert
µ0=1.5 geprüft werden. Da X als normalverteilt angenommen werden kann und
überdies ein genauer Schätzwert für die Standardabweichung, nämlich σˆ =0.3,
bekannt ist, wird die Prüfung mit dem 2-seitigen Gauß-Test vorgenommen und
dabei das Signifikanzniveau α=5% vereinbart. Wie groß ist der
Stichprobenumfang zu planen, damit man mit dem Test eine kritische
Abweichung von 10% des Sollwerts mit 80%iger Sicherheit als signifikant
erkennen kann.
4. Von einer Messstelle wurden die folgenden Werte der Variablen X (SO2Konzentration der Luft in mg/m3) gemeldet: 32, 41, 33, 35, 34. a) Weicht die
mittlere SO2-Konzentration signifikant vom Wert µ0=30 ab? Als Testniveau sei
α=5%$ vereinbart. b) Welcher Mindeststichprobenumfang müsste geplant
werden, um mit dem Test eine Abweichung vom Referenzwert m0 um 5% (des
Referenzwertes) mit einer Sicherheit von 95% erkennen zu können?
5. Bei einer Untersuchung der Cd-Belastung von Forellen in einem Fließgewässer
wurden n=10 Forellen gefangen und der Cd-Gehalt X (in µg/g Frischgewicht)
bestimmt. Die Auswertung ergab den Mittelwert x =62 und die
Standardabweichung s=7. a) Kann aus den Angaben geschlossen werden, dass
der mittlere Cd-Gehalt signifikant (α=5%) über dem vorgegebenen Referenzwert
µ0=60 liegt? b) Wie groß ist die Wahrscheinlichkeit, dass man mit dem Test eine
Überschreitung des Referenzwerts in der Höhe der beobachteten Überschreitung
als signifikant erkennt?
W. Timischl: Angewandte Statistik, Testen_I_15_Text24.09.15
19
6. Bei der Inbetriebnahme einer Anlage zur Abfüllung einer Lösung in Flaschen mit
der Nennfüllmenge von 0.5l wurden in einem Probebetrieb die folgenden
Füllmengen X (in l) gemessen:
0.491, 0.488, 0.493, 0.538, 0.493, 0.478, 0.506, 0.459, 0.471, 0.480.
a) Kann man aus den Daten schließen, dass die Nennfüllmenge nicht erreicht
wird? Das Testniveau sei mit α=0.01 festgelegt. b) Ist der Stichprobenumfang
ausreichend groß, um eine Unterschreitung in der Höhe von 10ml mit einer
Sicherheit von 90% feststellen zu können?
7. Die Verpackung einer bestimmten Zigarettensorte weist einen mittleren
Nikotingehalt von 15 mg pro Zigarette aus. Es wird eine Zufallsstichprobe von 100
Zigaretten getestet. Dabei ergaben sich ein mittlerer Nikotingehalt von 16.5 mg
und eine Standardabweichung von 4 mg. Kann aus dem Ergebnis der Stichprobe
auf 1%igem Signifikanzniveau der Schluss gezogen werden, dass der
tatsächliche Nikotingehalt im Mittel über 15 mg liegt? (Überschreitung sign.)
8. Es sei X eine normalverteilte Umweltmessgröße mit dem (unbekannten)
Mittelwert μ und der Standardabweichung σ=10. Mit Hilfe einer Stichprobe soll
geprüft werden, ob eine Überschreitung des Grenzwertes K vorliegt, wobei das αRisiko mit 5% vorgegeben ist und eine kritische Überschreitung von 6.5 mit
90%iger Sicherheit erkannt werden soll. Welcher Stichprobenumfang ist zu
planen? (21)
9. Von einer Messstelle wurden die folgenden Werte der Variablen X (SO2Konzentration der Luft in mg/m3) gemeldet: 32, 41, 33, 35, 34.
a) Weicht die mittlere SO2-Konzentration signifikant vom Wert µo=30 ab? (α=5%)
b) Welcher Mindeststichprobenumfang müsste in 6 geplant werden, um mit dem
Test eine Abweichung vom Referenzwert µo um 5% (des Referenzwertes) mit
einer Sicherheit von 95% erkennen zu können? (sign. Abweichung; 73)
10. Es sei X eine normalverteilte Messgröße mit der Varianz 0,25; für X ist der
Nennwert 1,75 vorgegeben. Zur Prüfung auf eine allfällige Abweichung vom
Nennwert wird der t-Test eingesetzt; als Testniveau ist 5% vorgesehen. Wie groß
muss der Stichprobenumfang geplant werden, um eine kritische Abweichung um
0,15 Einheiten mit 90%iger Sicherheit erkennen zu können? (117)
11. Die Messung der Ozonkonzentration während der Sommermonate ergab für eine
Großstadt die in der folgenden Tabelle enthaltenen Werte (Angaben in 10-2 ppm).
a. Stehen die Daten in Widerspruch zur angenommenen Normalverteilung
der Messgröße?
b. Liegt die mittlere Ozonkonzentration signifikant über dem Referenzwert
µo=5? (α = 5%)
c. Wie groß ist die Wahrscheinlichkeit, die beobachtete Überschreitung des
Referenzwertes mit dem auf 5%igem Niveau geführten t-Test als
signifikant zu erkennen?
d. Welcher Mindeststichprobenumfang müsste geplant werden, um mit dem
Test eine Überschreitung von µo um 10% mit einer Sicherheit von 90%
erkennen zu können?
W. Timischl: Angewandte Statistik, Testen_I_15_Text24.09.15
20
2.5
3.0
5.6
4.7
6.5
6.7
1.7
5.3
4.6
7.4
5.4
4.1
5.1
5.6
5.4
6.1
7.6
6.2
6.0
5.5
5.8
8.2
3.1
5.8
2.6
12. In einer Studie wurde u.a. das Ges. Eiweiß i.S. am Beginn und am Ende einer
Behandlung bestimmt. Bei 40 Probanden war eine Veränderung zu beobachten:
27 Probanden, bei denen der Eiweißwert vorher im Normbereich lag, wiesen
nachher einen Wert außerhalb des Normbereichs auf; bei 13 Probanden lag der
Eiweißwert vorher außerhalb und nachher im Normbereich.
a) Man prüfe auf 5%igem Niveau, ob der Anteil der Probanden, bei denen der
Eiweißwert vorher außerhalb und nachher innerhalb des Normbereichs lag,
signifikant von 0.5 abweicht.
b) Welcher Stichprobenumfang müsste geplant werden, damit der approximative)
Binomialtest mit 90%iger Sicherheit ein signifikantes (a=5%) Ergebnis liefert,
wenn p=p0+0.15 ist?
13. Im Rahmen einer Untersuchung des Ernährungsstatus von Schulkindern wurde
u.a. das Gesamtcholesterin erfasst. In einer Stichprobe aus den Kindern der
Volksschule einer bestimmten Region war der Cholesterinwert bei 45 von 75
Kindern im Normbereich.
a) Man prüfe auf 5%igem Niveau, ob der Anteil der Schulkinder im Normbereich
signifikant über 50% liegt.
b) Man bestimme die Wahrscheinlichkeit (Power), mit dem Test eine
Überschreitung von p0 um ∆=0.1 als signifikant zu erkennen.
14. Von einer Abfüllanlage sei bekannt, dass die abgefüllten Einheiten nur mit 5%iger
Wahrscheinlichkeit nicht eine vorgegebene Mindestmenge aufweisen. Nach einer
Neueinstellung der Anlage wurden im Probelauf 150 Packungen zufällig
ausgewählt und dabei festgestellt, dass in 4 Fällen die Mindestmenge nicht
erreicht wurde. Die Frage ist, ob dieses Ergebnis eine signifikante
Unterschreitung des Sollwertes p0=5% anzeigt (α=5%).
15. Für eine Blumenzwiebelsorte wird eine Keimfähigkeit von mindestens 75%
garantiert. In einer Stichprobe von n=60 keimten 35 Zwiebeln. a) Liegt eine
signifikante Abweichung vom garantierten Ergebnis vor? Man prüfe diese Frage
auf dem Signifikanzniveau α=5%. b) Welche Fallzahl ist notwendig, um eine
Unterschreitung des garantierten Anteils um 0.1 mit einer Sicherheit von 90%
feststellen zu können? (Unterschreitung sign.; 214)
16. In einer Studie über die Behandlung von akuten Herzinfarktpatienten wurde einer
Standardtherapie mit einer neuen Therapie verglichen. Es wurden 160 Patienten
mit der neuen Therapie behandelt, von denen 20 innerhalb von 4 Wochen
verstarben. Bei Anwendung der Standardtherapie muss eine
Sterbewahrscheinlichkeit von po =0,2 angenommen werden. Man prüfe mit dem
Binomialtest, ob die neue Therapie ein signifikant unter po =0,2 liegendes
Sterberisiko ergibt (α=5%). (Unterschr. sign.)
17. In sogenannten Fall-Kontroll-Studien werden Vierfeldertafeln verwendet, um die
Verteilung eines (zweistufigen) Risikofaktors (Raucher/Nichtraucher) in einer
W. Timischl: Angewandte Statistik, Testen_I_15_Text24.09.15
21
Testgruppe und einer Kontrollgruppe darzustellen. Die Tabelle zeigt die
(hypothetische) Vierfeldertafel einer Fall-Kontroll-Studie.
Raucher
Nichtraucher
Testgruppe
87
60
Kontrolle
78
45
a) Man prüfe für die Testgruppe, ob der Anteil der Raucher signifikant über
p0=0,5 liegt. (α=5%)? (Überschr. sign.)
b) Welcher Mindeststichprobenumfang müsste geplant werden, um mit dem
Binomialtest eine Überschreitung von p0 =0,5 um 0,05 Einheiten mit einer
Sicherheit von 80% erkennen zu können? (700)
18. Bei seinen Kreuzungsversuchen mit Erbsen untersuchte Mendel unter anderem
die Nachkommen von bezüglich zweier Merkmale mischerbigen Pflanzen. Bei
den Merkmalen handelte es sich um die Samenform mit den Allelen A (runde
Form) und a (kantige Form) sowie um die Samenfarbe mit den Allelen B (gelbe
Färbung) und b (grüne Färbung). 15 Stammpflanzen des Genotyps AaBb gaben
insgesamt 529 Samen, aus denen sich Pflanzen der Genotypen AABB, AAbb,
aaBB, aabb, AABb, aaBb, AaBB, Aabb sowie AaBb mit den Häufigkeiten 38, 35,
28, 30, 65, 68, 60, 67 bzw. 138 entwickelten. Nach der Mendel'schen Theorie
müssten sich die neun Genotypen im Verhältnis 1:1:1:1:2:2:2:2:4 aufspalten.
Kann die Theorie auf dem Testniveau α = 5% durch dieses
Beobachtungsergebnis falsifiziert werden? (nein)
19. Ein symmetrischer Würfel sollte beim Ausspielen mit gleicher Wahrscheinlichkeit
eine der sechs Augenzahlen zeigen. Zur Überprüfung wurde ein Würfel 1000 mal
ausgespielt und dabei die folgenden Häufigkeiten der Augenzahlen erhalten:
Augenzahl/Häufigkeit: 1/172, 2/179, 3/173, 4/163, 5/171, 6/142.
Man prüfe mit dem χ2-Test, ob die Häufigkeiten, mit denen die Augenzahlen
auftreten, signifikant von der Gleichverteilung, d.h. vom Verhältnis 1:1:1:1:1:1
abweichen. Als Signifikanzniveau wähle man α=5%.
20. Es soll gezeigt werden, dass die Stichprobewerte 210, 199, 195, 210, 217, 226,
220, 221, 182 mit der Annahme einer normalverteilten Grundgesamtheit X
vereinbar sind. Man führe den Nachweis auf 5%igem Testniveau.
21. Von einer Pflanze erhielt Mendel (1866) insgesamt 62 Samen von denen 44 gelb
und 18 grün gefärbt waren. Man zeige, dass das Verhältnis 44:18 der
beobachteten Anzahlen nicht "signifikant" vom theoretischen
Aufspaltungsverhältnis 3:1 abweicht ( = 5%)?
22. In einer Studie mit 5 Probanden wurde eine bestimmte Zielgröße X am
Studienbeginn (Xb) und – nach erfolgter Behandlung - am Studienende (Xe)
gemessen.
Xb 57 73 44 27 32
Xe 59 74 46 26 35
a) Man erfasse die Wirkung der Behandlung durch die Differenz Y= Xe - Xb und
prüfe, ob der Mittelwert von Y signifikant von Null abweicht (α=5%). (nein)
W. Timischl: Angewandte Statistik, Testen_I_15_Text24.09.15
22
b) Was kann über die Versuchsplanung in a) gesagt werden? Welcher
Mindeststichprobenumfang müsste geplant werden, um mit dem Test eine
Abweichung von Null in der Höhe von 50% des Mittelwerts von Y mit einer
Sicherheit von 90% als signifikant erkennen zu können? (50)
23. Die folgende Tabelle enthält Produktivitätsdaten von 60 Kohorten von je 15
weiblichen Tsetsefliegen. Als Produktivitätsmaß wird die Anzahl Y der Puparien
verwendet, die in einer Kohorte bis zum 78ten Lebenstag abgelegt werden.
a) Man vergleiche den Mittelwert von Y mit dem Wert 55; liegt eine signifikante
Abweichung vor? Liegt die Standardabweichung signifikant über dem Wert
10? (jeweils 5%-Testniveau) (Mittelwert: Abw. nicht sign.,
Standardabweichung: Überschr. sign.)
b) Welcher Stichprobenumfang müsste geplant werden, um eine Abweichung
des Mittelwerts (vom Referenzwert) in der beobachteten Höhe mit 90%iger
Sicherheit erkennen zu können? (162)
c) Man stelle fest, ob die Werte der Variablen Y im Einklang mit der Annahme
„H0: Y ist normalverteilt“ stehen (α = 5%).
Nr.
1
2
3
4
5
6
7
8
9
10
Y
Nr.
72
11
81
12
55
13
55
14
50
15
53
16
70
17
79
18
42
19
69
20
Y
Nr.
54
21
57
22
69
23
62
24
73
25
58
26
46
27
50
28
27
29
68
30
Y
Nr.
67
31
59
32
49
33
51
34
65
35
56
36
58
37
67
38
66
39
74
40
Y
Nr.
51
41
69
42
64
43
68
44
73
45
81
46
54
47
65
48
58
49
61
50
Y
Nr.
59
51
65
52
60
53
43
54
52
55
57
56
37
57
39
58
49
59
51
60
Y
58
58
60
66
75
41
40
51
37
38
24. Mit einem statistischen Test soll geprüft werden, ob die Alternativhypothese H1
(z.B. Messgröße überschreitet im Mittel einen vorgegebenen Grenzwert) zutrifft,
also die Nullhypothese H0 abgelehnt werden kann. Als Testniveau sei 5%
vorgegeben, d.h. für die Wahrscheinlichkeit einer irrtümlichen Entscheidung
gegen H0 soll gelten: P(Entscheidung für H1|H0) = 5%. Der Versuch wurde mit
der Power P(Entscheidung für H1|H1) = 90% geplant. Wie groß ist die posteriori
Wahrscheinlichkeit P(H1|Entscheidung für H1), wenn die a-priori
Wahrscheinlichkeit dafür, dass H1 zutrifft, gleich 5% ist? (48,6%)
25. Zur Entscheidung, ob ein neues Medikament besser sei als ein herkömmliches,
wird ein statistischer Test verwendet. Der Test erlaubt es, die bessere Wirkung
(Hypothese H1) des neuen Medikamentes mit einer Wahrscheinlichkeit von 80%
zu erkennen; ist das neue Medikament nicht besser (Hypothese H0), zeigt dies
der Test mit einer Wahrscheinlichkeit von 95% an. Es möge die Annahme gelten,
dass unter zehn neu entwickelten Medikamenten eines besser ist. Man berechne
die Wahrscheinlichkeit, dass bei Entscheidung „neues Medikament ist besser“
dies tatsächlich zutrifft. Wie groß ist diese Wahrscheinlichkeit, wenn die a prioriWahrscheinlichkeit P(H1) nur 5% beträgt? (64%, 45,7%)
26. Es sei X ein normalverteiltes Merkmal; zur Festlegung der
Operationscharakteristik wird ein Lieferantenrisiko von 10% an der Gutgrenze
W. Timischl: Angewandte Statistik, Testen_I_15_Text24.09.15
23
AQL=1% und ein Abnehmerrisiko von 10% an der Schlechtgrenze LQL = 2%
vereinbart. Man bestimme die Kennwerte n und k des entsprechenden Prüfplans
bei bekannter und unbekannter Varianz! (84, 2.19; 286, 2.19)
27. Man bestimme die Wahrscheinlichkeit für die Zurückweisung eines Prüfloses bei
der Prüfung auf fehlerhafte Einheiten, wenn die Fehlerrate 5% beträgt und mit
einer Stichprobe vom Umfang n=48 und der Annahmezahl c=0 geprüft wird.
Welche Wahrscheinlichkeit ergibt sich für n=48 und c=2? (91,5%; 43,3%)
28. Zur Untersuchung der Frage, welchen Anteil die Skelettmasse an der
Körpermasse bei Vögeln bzw. Säugetieren hat, wurden für verschiedene Vögel
und Säugetiere die Skelettmasse Y und die Körpermasse X (alle Angaben in kg)
bestimmt. Jemand behauptet, dass die Skelettmasse 5% der Körpermasse
ausmacht. Stehen die folgenden Daten in Widerspruch zu dieser Aussage? Man
nehme eine Überprüfung auf 5%igem Niveau für Vögel und Säugetiere vor.
(Vögel: ja, Säugetiere: ja)
Vögel
Y
X
1,995
40,667
0,072
1,225
0,0054
0,163
0,203
2,504
0,043
0,701
0,027
0,416
0,186
2,379
0,0058
0,124
0,028
0,427
0,00174
0,031
0,00182
0,029
0,00102
0,02
0,024
0,383
0,00618
0,144
0,00184
0,038
0,00297
0,069
0,00183
0,045
0,00076
0,013
0,00128
0,023
0,00049
0,0087
0,00062
0,0126
Säugetiere
Y
X
0,193
3,35
0,227
3,915
0,0003
0,0063
0,039
0,79
0,027
0,82
0,244
4,836
0,002
0,03
0,015
0,275
0,02
0,365
0,0025
0,03
0,0076
0,115
1,146
22,7
0,748
11,95
0,25
3,395
0,107
2,46
0,224
4,26
0,233
4,21
0,0173
0,35
0,27
4,45
0,448
6,725
0,135
1,56
W. Timischl: Angewandte Statistik, Testen_I_15_Text24.09.15
Herunterladen