4 einführung in das testen von unterschieds

Werbung
1
4 EINFÜHRUNG IN DAS TESTEN VON UNTERSCHIEDSHYPOTHESEN I: 1-STICHPROBENVERGLEICHE
Inhalt:
4.1 Prinzip des Alternativtests und Binomialtest
4.2 1-Stichproben t-Test
4.3 Chiquadrat-Anpassungstest und Shapiro-Wilk Test
4.4 Elemente der Qualitätssicherung
4.5 Anhang: Überblick über 1-Stichprobenvergleiche
4.6 Übungsbeispiele
4.7 Repetitorium: Begriffe und Methoden
Lernziele:
- Die Entscheidungsalternativen und das Prinzip der
Entscheidungsfindung bei Alternativtests kennen;
- signifikante und nichtsignifikante Ergebnisse interpretieren können;
- eine signifikante Abweichung einer Wahrscheinlichkeit von einem
vorgegebenen Wert feststellen können;
- eine signifikante Abweichung eines Mittelwerts von einem
vorgegebenen Wert feststellen können;
- Anteile auf eine signifikante Abweichung von einem vorgegebenen
Verhältnis prüfen können;
- die Vereinbarkeit von Häufigkeitsverteilungen mit diskreten
Wahrscheinlichkeitsverteilungen prüfen können;
- Normalitätsprüfung mit dem χ2-Test durchführen können;
- Annahmewahrscheinlichkeiten bei Prüfung auf fehlerhafte
Einheiten berechnen und Prüfanweisungen bestimmen können;
- Die Kennwerte von Prüfplänen für quantitative Merkmale
berechnen können;
- Qualitätsregelkarten zur Überwachung des Mittelwerts und der
Standardabweichung eines stetigen Merkmals erstellen und
interpretieren können;
- Operationscharakteristiken zu Prüfplänen bestimmen können.
W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc
29.11.11
2
4.1 PRINZIP DES ALTERNATIVTESTS UND BINOMIALTEST
Wie prüft man, ob eine Wahrscheinlichkeit von einem vorgegebenen
Wert abweicht?
Problemstellung:
Von der Wahrscheinlichkeit p eines Ereignisses liegt eine Vermutung
H1 (Alternativhypothese) vor, z.B. in der Form H1: p ≠ p0;
die Menge der p, für die H1 nicht zutrifft, bildet die Nullhypothese
H0: p = p0; mit einem Test soll eine Entscheidung zwischen H0 und H1
herbeigeführt werden.
Beispiel 4.1:
In einer Laborzucht von Tsetsefliegen (Glossina p. palpalis) werden 2354
Puparien beobachtet, aus denen 1241 Weibchen schlüpfen. Ein
Schätzwert für die Wahrscheinlichkeit p, dass ein weibliches Insekt
schlüpft, ist der Anteil y=1241/2354 = 0,527. Weicht der Anteil der
weiblichen Insekten „signifikant“ von 0,5 ab?
Schema der Problemlösung:
• Statistisches Modell:
Entstehung der 2354 Insekten wird durch ein Bernoulli-Experiment mit
n = 2354 Wiederholungen simuliert; jede Wiederholung liefert mit der
Wahrscheinlichkeit p das Ereignis E (weibliches Insekt). Es sei Y die
relative Häufigkeit von E bei n Wiederholungen. Die Anzahl nY der
Wiederholungen mit dem Ausgang E ist Bn,p –verteilt. Für n > 20 und
10 ≤ np ≤ n -10 gilt die Approximation: Bn,p ≅ N(np, np(1-p)).
• Formulierung der Entscheidungsalternativen:
H0 : p = 1/2 (Geschlechterverhältnis ist 1:1, die beobachtete
Abweichung in der Stichprobe ist zufälliger Natur)
H1: p ≠ 1/2 (es liegt eine Abweichung vom Geschlechterverhältnis
1:1 vor)
Fall I: 2-seitiger Test auf Abweichung
Wahrer
Sachverhalt
H0 ist richtig
(p = p0=1/2)
Entscheidung für H0
(gegen H1)
richtige Entscheidung!
H1 ist richtig
(p ≠ p0=1/2)
richtige Entscheidung!
Fehler! (2. Art, β-Fehler)
Forderung:
P(E gegen H1| |p-p0|>∆) ≤β !
W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc
Entscheidung für H1
(gegen H0)
Fehler! (1. Art, α-Fehler)
Forderung:
P(E für H1|p=p0) ≤ α !
29.11.11
3
Entscheidungsfindung bei 2-seitigen Hypothesen (auf Testniveau α):
Testgröße:
p = p0 =1/ 2 →TG(Y) =
Y − p0
∝ N(0,1)
p0 (1− p0 ) / n
Zufallsstichprobe
Realisation y von Y: y = TG(y)= 1241/2354 =
0,527
Einsetzen in die Testgröße ergibt TGs = 2,64. Man beachte,
dass Testgrößenwerte um die Null zu erwarten sind, wenn H0 gilt;
„größere“ Abweichungen von Null sprechen für die
Alternativhypothese.
Entscheidungsregel:
H0 ablehnen, wenn |TGs| > z1-α/2. Wegen |TGs|=|2,64| > z1-α/2=1.96
(α=5%) wird im Beispiel H0 abgelehnt. Die Entscheidungsregel ist in
der folgenden Grafik veranschaulicht.
Dichte
0.2
- |TGs|
|TGs|
α/2
α/2
TG
-1
H0 ablehnen
0
zα/2
1
H0 ablehnen
z1−α/2
Bei „extremen“ Abweichungen des Testgrößenwerts von Null (also
Abweichungen, die betragsmäßig größer als z1-α/2 sind), wird für H1
entschieden. Entscheidet man so, ist sicher gestellt, dass die
Wahrscheinlichkeit einer irrtümlichen Ablehnung von H0 stets kleiner
als das Testniveau α bleibt. Denn die Wahrscheinlichkeit P, dass bei
Gültigkeit von H0 die Testgröße TG einen Wert annimmt, der mehr
von Null abweicht als der beobachtete Testgrößenwert, ist gleich den
„Ausläuferflächen“ unter der N(0,1)-Dichtekurve links und rechts
von -|TGs| = - 2,64 bzw. |TGs|=2,64. Diese Ausläuferflächen sind aber
in Summe kleiner als α, solange |TG| > z1-α/2 bleibt. Man kann die
Testentscheidung daher auch so formulieren:
W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc
29.11.11
4
P<α
H0 ablehnen, d.h. Entscheidung für H1. Im konkreten Fall
wird der P-Wert wie folgt berechnet:
P-Wert = P(TG < -2,64 oder TG > 2,64) =
P(TG < -2,64) + P(TG > 2,64) = Φ(-2,64) + 1- Φ(2,64) =
0,0083 = 0,83%. Der P-Wert ist kleiner als 5%, daher ist H0
abzulehnen!
Die Wahrscheinlichkeit P wird in diesem Zusammenhang P-Wert (pvalue) genannt. Einschlägige Computerprogramme geben in der
Regel für die Testentscheidung den P-Wert an.
Ergänzung 1: Test auf Überschreitung
Würde in Beispiel 4.1 die Frage lauten, ob der Anteil y=1241/2354 =
0,527 der weiblichen Insekten den Wert 0,5 „signifikant“ überschreitet,
hat man es mit einem „1-seitigen Test auf Überschreitung“ mit den
Hypothesen H0 : p ≤ p0 versus H1 : p > p0 zu tun.
Zur Testentscheidung wird wieder der Wert TGs =TG(y) =2,64 der
Testgröße berechnet. Man beachte, dass nunmehr „große“ Werte von
TGs eine Entscheidung für H1 nahe legen. Es gilt nunmehr die
Entscheidungsregel: H0 ablehnen, wenn TGs > z1-α ist. Wieder ist mit
dieser Entscheidungsregel (siehe auch die nachfolgende Abbildung)
sicher gestellt, dass das Risiko für eine irrtümliche Ablehnung von H0
kleiner als α bleibt.
Dichte
0.2
TGs
-3
-2
-1
0
α
TG
1
H0 ablehnen
z1−α
Die Wahrscheinlichkeit P = P(TG >TGs) ist bei Gültigkeit von H0 gleich
der „Ausläuferfläche“ unter der N(0,1)-Dichtekurve rechts von TGs =
2,64. Diese Ausläuferfläche ist kleiner als α, solange TG > z1-α bleibt.
Man kann die Testentscheidung daher auch so formulieren:
H0 ablehnen.
P<α
W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc
29.11.11
5
Im konkreten Fall ist mit α=5% das Quantil z1-α = z0,95 = 1,64; wegen TGs
= 2,64 > 1,64 folgt, dass H0 abzulehnen ist. Zur selben Entscheidung
kommt man mit dem P-Wert, der in diesem Fall als P = P(TG >TGs)
= 1-P(TG ≤ TGs) = 1- Φ(2,64) = 0,00415 = 0,415% berechnet wird.
Wegen P<5% ist H0 abzulehnen!
Ergänzung 2: Test auf Unterschreitung
Der Vollständigkeit sei erwähnt, dass mit 1-seitigen Hypothesen nicht nur
auf „Überschreitung“ eines Referenzwertes geprüft werden kann,
sondern auch auf „Unterschreitung“.
Die Hypothesen lauten in diesem Fall: H0 : p ≥ p0 versus H1 : p < p0 .
Obwohl in Beispiel 4.1 die Fragestellung, ob der Anteil y=1241/2354 =
0,527 der weiblichen Insekten den Wert 0,5 „signifikant“ unterschreitet,
keinen Sinn macht, wollen wir an Hand dieses Beispiels den Test auf
Unterschreitung formal durchführen.
Wir berechnen wieder den Wert TGs =TG(y )= 2,64 der Testgröße.
Nunmehr sind es „kleine“ Werte von TGs, die eine Entscheidung für H1
nahe legen. Die Entscheidungsregel lautet: H0 ablehnen, wenn TGs < zα
gilt. Mit dieser Entscheidungsregel ist sicher gestellt, dass das Risiko für
eine irrtümliche Ablehnung von H0 kleiner als α bleibt. Der P-Wert ist jetzt
die Wahrscheinlichkeit P =P(TG<TGs), die gleich den „Ausläuferfläche“
unter der N(0,1)-Dichtekurve links von TGs = 2,64 ist. Diese
Ausläuferfläche ist kleiner als α, solange TG < zα bleibt. Mit Hilfe des PH0 ablehnen“
Werts kann die Testentscheidung in der Form „P < α
formuliert werden. Im konkreten Fall ist mit α=5% das Quantil zα = z0,05 =
-1,64 und der P-Wert P=P(TG < TGs) = Φ(2,64) = 0,996 = 99,6%. Wegen
TGs = 2,64 > -1,64 (bzw. P = 99,6% > 5%) kann H0 nicht abgelehnt
werden!
Ergänzung 3: Gütefunktion
Bei der Darstellung Entscheidungsalternativen wurden folgende
Fehlerrisken unterschieden:
a) Fehler 1. Art (α-Fehler) = irrtümliche Ablehnung von H0
(Testentscheidung so, dass P(Fehler 1. Art) < α
b) Fehler 2. Art (β-Fehler) = irrtümliche Nichtablehung von H0 (u.a. von p
abhängig)
Beide Fehlerrisken werden in der sog. Gütefunktion (power) G
zusammengefasst:
G(p) = P(Ablehnung von H0 | p)
= Wahrscheinlichkeit, auf Grund einer Zufallsstichprobe gegen H0 zu
entscheiden
W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc
29.11.11
6
Es gilt: G(p) ≤ α, wenn H0 zutrifft; wenn H1 zutrifft ist die Güte umso
besser, je näher G(p) bei 1 liegt (d.h. je kleiner das β-Risiko
β(p) = 1-G(p) ist).
Beispiel 4.2a:
Wir betrachten den Binomialtest auf Überschreitung des Referenzwertes p0 = 0.5,
d.h. wir prüfen H0: p ≤ 0.5 versus H1: p > 0.5. Die Werte der Gütefunktion G können,
wenn die Verteilung der Testgröße TG durch die Standardnormalverteilung
approximiert wird, wie folgt berechnet werden:
G ( p ) = P(Ablehnung von H 0 | p ) = P(TG (Y ) > z1−α | p ) =


Y − p0
P
> z1−α | p  = P Y > p0 + z1−α
 p (1 − p ) / n

0
0


(
)
p0 (1 − p0 ) / n | p =

− ( p − p0 ) + z1−α p0 (1 − p0 ) / n
Y−p
P
>
|
 p(1 − p ) / n
p
(
1
−
p
)
/
n


p =


 − ( p − p0 ) + z1−α p0 (1 − p0 ) / n 

1 − Φ


p
(
1
−
p
)
/
n


Speziell erhält man damit für p0 = 0.5, α = 0.05, n=2354 und p=y= 1241/2354 = 0.527
den Wert G(0.527) = 83.56%, d.h. wir haben eine Sicherheit (Power) von mehr als
83%, die beobachtete Überschreitung des Referenzwertes mit dem Binomialtest auf
5%igem Testniveau als signifikant zu erkennen. Die folgende Grafik wurde mit
enthält den Verlauf der Gütefunktion des eben besprochenen Binomialtests auf
Überschreitung für die Stichprobenumfänge n =50, 100 und 1000.
1.0
Gütefunktionen des Binomialtests mit H1: p>0.5
Testniveau=5%, Stichprobenumfang n= 50, 100 bzw. 1000
n=100
n=50
0.6
0.4
0.2
G(p)=P(Ablehnung von H0|p)
0.8
n=1000
0.0
(0.5, 0.05)
W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc
29.11.11
7
Es ist deutlich zu erkennen, dass die Power für jedes p>0.5 mit wachsendem n
zunimmt.
Ergänzung 4: Mindeststichprobenumfang
Die Fehlerrisken α und β, die kritische Abweichung ∆ =|p - p0| und der
Stichprobenumfang n sind voneinander abhängig. Dies ermöglicht es,
bei vorgegebenen Werten von α, ß und ∆ den Stichprobenumfang zu
bestimmen.
Planung des Stichprobenumfangs:
Notwendiger Stichprobenumfang n, um auf Niveau α mit der Sicherheit
1-ß eine Entscheidung für H1 herbeizuführen, wenn p von p0 um ∆ ≠ 0 im
Sinne der Alternativhypothese abweicht:
 1 
2
n ≈  2 (z1−α / 2 + z1−β ) (Fall I),
 4∆ 
 1 
2
n ≈  2 (z1−α + z1−β )
(Fälle IIa, b)
 4∆ 
Beispiel 4.2b:
Von der Gültigkeit der Formel für den Fall IIa kann man sich im Anschluss an die in
Beispiel 2.4a hergeleitete Gütefunktion G für den (approximativen) Binomialtest mit
den Hypothesen H0: p ≤ p0 versus H1: p > p0 wie folgt überzeugen.
Wir denken uns α, 1-ß und ∆=p-p0>0 vorgegeben und haben n so zu bestimmen,
dass G(p)=G(p0+∆) = 1-ß ist. Dies ergibt:
 − ∆ + z1−α p0 (1 − p0 ) / n 
 = 1− β ⇔
G ( p0 + ∆ ) = 1 − Φ
 ( p + ∆)(1 − p − ∆) / n 
0
0


 − ∆ + z1−α p0 (1 − p0 ) / n 
− ∆ + z1−α p0 (1 − p0 ) / n
=β ⇔
Φ
= − z1− β ⇔
 ( p + ∆)(1 − p − ∆) / n 
(
p
+
∆
)(
1
−
p
−
∆
)
/
n
0
0
0
0


(
n∆2 = z1−α
p0 (1 − p0 ) + z1− β ( p0 + ∆)(1 − p0 − ∆ )
)
2
Mit den (groben) Abschätzungen
p0 (1 − p0 ) ≤ 1 / 4 und
( p0 + ∆ )(1 − p0 − ∆ ) ≤ 1 / 4
ergibt sich schließlich die oben angeführte Näherungsformel für den Fall IIa.
Beispiel 4.3:
Mit einer neuen Behandlungsmethode will man eine Erfolgsrate p
(Wahrscheinlichkeit, dass bei einer mit der neuen Methode behandelten Person eine
W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc
29.11.11
8
Verbesserung eintritt) von mehr als p0=0,7 erreichen. In einer Studie mit 100
Probanden ist die neue Methode bei 75 Personen erfolgreich.
a) Man zeige, dass dieses Ergebnis keine (auf dem 5%-Niveau) signifikante
Überschreitung der angestrebten Erfolgswahrscheinlich-keit p0=0,7 anzeigt.
b) Welcher Stichprobenumfang n muss geplant werden, um auf 5%igem
Signifikanzniveau eine Überschreitung des Sollwertes p0=0,7 um die
(beobachtete) Abweichung ∆=0,05 mit einer Sicherheit von 80% erkennen zu
können?
Lösung:
a) H0: p≤po vs. H1: p>po, α=5%; TGs=(0,75-0,7)/√[0,7(1-0,7)/100]=1,09 ≤ z0,95 = (Tabelle)= 1,65
kann nicht abgelehnt werden, d.h. Überschreitung ∆=0,05 ist nichtsignifikant.
H0
Lösung mit R (R-Console):
> prop.test(75, 100, p=0.7, alternative="greater")
1-sample proportions test with continuity correction
data: 75 out of 100, null probability 0.7
X-squared = 0.9643, df = 1, p-value = 0.1631
alternative hypothesis: true p is greater than 0.7
95 percent confidence interval:
0.66751 1.00000
sample estimates:
p
0.75
Wegen p-value=0.1631>=0.05 kann H0 nicht abgelehnt werden!
b) ∆=0,05; z1-α= z0,95 =1,65; 1-ß=0,8; z1-ß = z0,8 =(Tabelle)=0,84;
2
2
n≈(Fälle IIa,b)≈ [1/(4⋅0,05 )](1,65+0,84) = 620.
Lösung mit R (R-Console):
> delta <- 0.05
> alpha <- 0.05
> power <- 0.8
> n <- 1/4/delta^2*(qnorm(1-alpha)+qnorm(power))^2
>n
[1] 618.2557
Was bedeutet ein nicht-signifikantes Ergebnis?
W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc
29.11.11
9
4.2 EINSTICHPROBEN t - TEST
Wie prüft man, ob der Mittelwert einer normalverteilten Zufallsvariablen
von einem vorgegebenen Sollwert abweicht?
Ablaufschema:
• Daten:
Mittelwert, Varianz s2.
Beobachtungswerte x1, x2, ... , xn
• Modell:
xi ist Realisation von Xi ∝ N(µ, σ2), (i =1,2, ... ,n).
• Hypothesen:
Fall I:
Fall IIa:
Fall IIb:
H0 : µ = µ0 vs. H1 : µ ≠ µ0
H0 : µ ≤ µ0 vs. H1 : µ > µ0
H0 : µ ≥ µ0 vs. H1 : µ < µ0
• Testgröße:
TG =
X − µ0
S/ n
≅ t n−1 unter µ = µ0
• Entscheidung mit Quantilen:
H0 auf Testniveau α ablehnen, wenn |TGs| > tn-1,1-α/2 (Fall I),
TGs > tn-1,1-α (Fall IIa) bzw. TGs < tn-1,α (Fall IIb)
• Entscheidung mit P-Wert:
H0 auf Signifikanzniveau α ablehnen, wenn P < α wobei
P=P(TG ≤ -|TGs| oder TG ≥ |TGs|) (Fall I) bzw.
P=P(TG ≥ |TGs|) (Fall IIa) bzw. P=P(TG ≤ -|TGs|) (Fall IIb).
• Planung des Stichprobenumfanges:
Um auf dem Niveau α mit der Sicherheit 1-β eine Entscheidung für H1
herbeizuführen, wenn µ von µ0 um ∆ ≠ 0 im Sinne der
Alternativhypothese abweicht, ist das dafür notwendige n
näherungsweise (etwa ab n=20)
n≈
n≈
σ2
∆
2
σ2
∆2
(z
(z
1−α
+ z1− β )
2
1−α / 2
+ z1− β )
2
(Fall I)
(Fall IIa, b)
W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc
29.11.11
10
• Gütefunktion:
Gütefunktion des t-Tests H0 : µ = µ0 versus H1: µ ≠ µ0 für n =6 und
n = 20 (horizontal ist die Effektgröße δ =(µ - µ0)/σ aufgetragen)
1,0
n=20
0,9
0,8
n=6
Power
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0,0
-2,0
-1,0
0,0
1,0
2,0
Effektgröße
Beispiel 4.4:
Die Wirkung eines Präparates auf den systolischen Blutdruck wurde durch
Blutdruckmessungen an 6 Probanden vor und nach Gabe des Präparates ermittelt.
Es ergaben sich die folgenden Werte für die Blutdruckänderung X (Differenz aus
Endwert minus Anfangswert):
-12, -5, -15, 10, -10, 5.
a) Man zeige, dass die mittlere Blutdruckänderung (auf dem 5%-Niveau) keine
signifikante Abweichung von null anzeigt.
b) Welcher Stichprobenumfang muss geplant werden, um auf 5%igem
Signifikanzniveau eine Abweichung vom Sollwert 0 in der Höhe der beobachteten
Abweichung von null mit einer Sicherheit von mindestens 90% erkennen zu
können?
Lösung:
a) µ = mittlere Blutdruckänderung, H0: µ=0 vs. H1: µ≠0, α=5%;
Stichprobe: n=6; x =-4,5; s=9,975; Testgröße TGs=-4,5⋅√(6)/9,975=-1,105;
Testentscheidung: |TGs|=1,105<t5,0,975=(Tabelle)= 2,571 H0 nicht ablehnen, d.h. mittlere
Blutdruckänderung weicht nichtsignifikant von null ab.
Lösung mit R (R-Console):
> x <- c(-12, -5, -15, 10, -10, 5)
> t.test(x, mu=0, alternative="two.sided")
One Sample t-test
data: x
t = -1.105, df = 5, p-value = 0.3195
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
-14.968088 5.968088
sample estimates:
mean of x
W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc
29.11.11
11
-4.5
b) ∆=4,5; z1-α/2= z0,975 =1,96; 1-ß=0,9; z1-ß = z0,9 =(Tabelle)=1,28; σ2≈s2=99,5;
2
2
n≈(Fall I)≈ [99,5/4,5 ](1,96+1,28) = 51,6
n=52.
Lösung mit R (R-Console):
> x <- c(-12, -5, -15, 10, -10, 5)
> delta <- abs(mean(x)-0)
> alpha=0.05
> power <- 0.9
> n <- (sd(x)/delta)^2*(qnorm(1-alpha/2)+qnorm(power))^2
>n
[1] 51.62907
4.3 χ2 – ANPASSUNGSTEST UND SHAPIRO-WILK TEST
Wie prüft man, ob die beobachteten Häufigkeiten einer mehrstufig
skalierten Zufallsvariablen von einem vorgegebenen Verhältnis
abweichen?
Ablaufschema:
• Daten:
Es liegen n Beobachtungen einer k-stufig skalierten Variablen vor, zur
Stufe (Klasse) ai gehören oi Beobachtungen.
• Modell:
pi = Wahrscheinlichkeit, dass ein Beobachtungsergebnis zur Klasse ai
gehört; Ei = npi = zu erwartende Häufigkeit von Beobachtungswerten
in der Klasse ai, Oi = beobachtete Häufigkeit von Variablenwerten in
der Klasse ai.
• Hypothesen und Testgröße:
H0: pi = p0i (i=1,2, ..., k) vs. H1: pi ≠ p0i für wenigstens ein i
Testgröße (Chiquadratsumme, Goodness-of-fit-Statistik):
k
TG= GF =
∑
i =1
(Oi − Ei )2
Ei
≅ χ k2−1 unter H 0
Hinweis: Die Testgröße ist unter H0 asymptotisch χ 2 − verteilt mit k-1
Freiheitsgraden; die Approximation ist ausreichend genau, wenn nicht
mehr als 20% der erwarteten Häufigkeiten kleiner als 5 sind und keine
kleiner als 1 ist.
• Entscheidung mit Quantilen:
H0 auf Testniveau α ablehnen, wenn TGs > χ2k-1,1-α
W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc
29.11.11
12
• Entscheidung mit P-Wert:
H0 auf Signifikanzniveau α ablehnen, wenn P < α
P=P(TG ≥ |TGs|).
wobei
Beispiel 4.5:
Bei einem seiner Kreuzungsversuche mit Erbsen erhielt Mendel 315 runde gelbe
Samen, 108 runde grüne, 101 kantige gelbe und 32 kantige grüne. Sprechen die
Beobachtungswerte gegen das theoretische Aufspaltungsverhältnis 9 : 3 : 3 : 1 der
Phänotypen? (α=5%)
Lösung:
H0: p1=9/16 (rund/gelb), p2=3/16 (rund/grün), p3=3/16 (kantig/gelb), p4=1/16 (kantig/grün); α=5%;
Stichprobe: n=556; O1=315, O2=108, O3=101, O4=32; E1=556⋅9/16=312,75; E2= E3=104,25; E4=34,75;
2
2
2
GF=(315-312,75) /312,75+(108-104,25) /104,25+(101-104,25) /104,25+(322
2
34,75) /34,75=0,47≤χ 3,0,95=(Tabelle)=7,815
H0 kann nicht abgelehnt werden.
Lösung mit R (R-Console):
> options(digits=4)
> klassen <- c("rund/gelb", "rund/grün", "kantig/gelb", "kantig/grün")
> observed <- c(315, 108, 101, 32)
> prob <- c(9, 3, 3, 1)/16
> tabelle <- data.frame(klassen, observed, prob)
> tabelle
klassen observed prob
1 rund/gelb
315 0.5625
2 rund/grün
108 0.1875
3 kantig/gelb
101 0.1875
4 kantig/grün
32 0.0625
>#
> # Prüfung auf Abweichung von einem vorgegebenen Verhältnis
> # H0: Wahrscheinlichkeiten verhalten sich gemäß dem theoretischen Augfspaltungsverhältnis
> # H1: dies ist nicht der Fall
> chisq.test(observed, p=prob)
Chi-squared test for given probabilities
data: observed
X-squared = 0.47, df = 3, p-value = 0.9254
Wegen p-value = 92,54% >= 5% kann H0 (beobachtete Anzahlen entsprechen dem
Aufspaltungsverhältnis 9:3:3:1) auf dem 5%-Niveau nicht abgelehnt werden.
Wie prüft man, ob eine mehrstufig skalierte Zufallsvariable von einer
vorgegebenen Verteilung mit unbekannten Parametern abweicht?
Ablaufschema:
Wie im vorangehenden Fall mit der Ergänzung, dass zu Bestimmung der
erwarteten Häufigkeiten die/der Verteilungsparameter zu schätzen sind
und sich für jeden geschätzten Parameter sich die Anzahl der
Freiheitsgrade der χ 2 − Verteilung um 1 vermindert. Die Nullhypothese
lautet: Die Zufallsvariable folgt der vorgegebenen Verteilung.
W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc
29.11.11
13
Beispiel 4.6:
Rutherford und Geiger studierten die Emission von α-Teilchen, indem sie die Anzahl
X der in Zeitintervallen der Länge 7,5s emittierten α-Teilchen zählten. Die
Auswertung von 2608 Zeitintervallen ergab die in der folgenden Tabelle
zusammengefassten beobachteten Häufigkeiten Oj. Man zeige, dass die
Häufigkeitsverteilung von X nicht signifikant von einer Poissonverteilung abweicht (α
= 5%).
Lösung:
n= 2608 (Gesamtstichprobenumfang),
λ̂ =
3,8673 (Schätzung als Mittelwert der Bebachtungswerte
von X). Damit ergeben sich die der Tabelle beigefügten erwarteten Häufigkeiten Ej =
nPλˆ ( x) . Fasst
man den zuletzt angegebenen Wertebereich X>10 mit X=10 zusammen (die entsprechende
beobachtete und erwartete Häufigkeit ergibt sich durch Addition), hat man k=11 Klassen. Als
2
2
Chiquadratsumme GF= 12,9135; wegen GF< χ k-1-1,1-α = χ 9,0.95 = 16,92 stehen die
Beobachtungsdaten nicht in Widerspruch zur Annahme H0: X ist poissonverteilt.
Klasse
1
2
3
4
5
6
7
8
9
10
11
X
0
1
2
3
4
5
6
7
8
9
10
>10
O
57
203
383
525
532
408
273
139
45
27
16
0
2608
E
54,54
210,94
407,89
525,81
508,37
393,21
253,44
140,02
67,69
29,09
11,25
5,75
2608,00
2
(O-E) /E
0,1106
0,2988
1,5184
0,0013
1,0982
0,5564
1,5089
0,0075
7,6052
0,1496
0,0585
12,9135
Lösung mit R (R-Console):
> options(digits=4)
> # Daten
> x <- seq(from=0, to=10, by=1)
> observed <- c(57, 203, 383, 525, 532, 408, 273, 139, 45, 27, 16)
> n <- sum(observed)
> # Schätzung von lambda (Mittelwert)
> lambda <- x %*% observed/n # %*% ist Operator für das Skalarprodukt zweier Vektoren
> lambda
[,1]
[1,] 3.867
> # Berechnung der unter "H0: X ist Poisson-verteilt" erwarteten Häufigkeiten
> p_poisson <- dpois(x, lambda)
> p_poisson[11] <- p_poisson[11] + 1-sum(p_poisson)
> expected <- p_poisson * n
> tabelle <- data.frame(x, observed, p_poisson, expected)
> tabelle
x observed p_poisson expected
1 0
57 0.020914 54.54
2 1
203 0.080882 210.94
3 2
383 0.156398 407.89
4 3
525 0.201615 525.81
5 4
532 0.194928 508.37
W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc
29.11.11
14
6 5
408 0.150770 393.21
7 6
273 0.097180 253.44
8 7
139 0.053689 140.02
9 8
45 0.025954 67.69
10 9
27 0.011153 29.09
11 10
16 0.006517 17.00
>#
> # Chiquadrat-Test auf Abweichung von der Poissonverteilung
> # H0: X ist Poisson-verteilt vs. H1: dies gilt nicht
> chi2sum <- sum((observed-expected)^2/expected)
> chi2sum
[1] 12.91
> p_value <- 1- pchisq(chi2sum, 9)
> # pchisq(q,df) = Wahrscheinlichkeit, dass eine mit df FG chiquadratverteilte ZV den Wert q unterschreitet.
> p_value
[1] 0.1666
wegen p_value = 16,66% >= 5% kann H0 (Beobachtungsdaten nicht in Widerspruch zur Poissonverteilung)
nicht abgelehnt werden.
Wie prüft man, ob eine stetige Zufallsvariable von einer Normalverteilung
abweicht?
Chiquadrat-Anpassungstest
Grundsätzlich kann die Prüfung, ob die Variation einer Messgröße von
der Normalverteilung abweicht, wie die Prüfung auf ein vorgegebenes
Verhältnis mit der Ergänzung durchgeführt werden, dass zuerst der
Mittelwert und die Standardabweichung der Normalverteilung – aus den
Messdaten - zu schätzen sind, eine Klasseneinteilung der
Merkmalsachse vorzunehmen ist und die erwarteten Häufigkeiten als
Klassenhäufigkeiten zu bestimmen sind. Die Anzahl der Freiheitsgrade
der χ 2 − Verteilung ist k–3, wobei k wieder die Anzahl der Klassen
bezeichnet. Die Nullhypothese lautet: Die Zufallsvariable ist
normalverteilt. Die Nullhypothese wird auf dem Testniveau α abgelehnt,
wenn die mit den beobachteten und erwarteten Klassenhäufigkeiten
gebildete Chiquadratsumme GF größer als das (1-α)-Quantil der χ 2 Verteilung mit k-3 Freiheitsgraden ist. Die Anwendung des ChiquadratAnpassungstests zur Überprüfung der Normalverteilungsannahme setzt
entsprechend große Stichproben (n≥60, k≥7) voraus.
Shapiro-Wilk Test
Hat man eine entsprechende Statistik-Software zur Verfügung, wird an
Stelle des Chiquadrat-Anpassungstests ein auch bei kleinen Stichproben
anwendbarer exakter Test empfohlen, z.B. der im Basis-Package von R
vorgesehene Shapiro-Wilk Test. Die Nullhypothese (die
Stichprobenwerte stammen aus einer normalverteilten Grundgesamtheit)
wird beibehalten, wenn der P-Wert gleich oder größer als das
angenommene Testniveau α bleibt.
W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc
29.11.11
15
Beispiel 4.7:
Man prüfe auf 5%igem Signifikanzniveau, ob die durch die Stichprobenwerte 27, 25,
23, 27, 23, 25, 25, 22, 25, 23, 26, 23, 24, 26, 26 gegebene Variation von X
(Spaltöffnungslänge in mm) bei diploiden Biscutella laevigata mit dem Modell einer
Normalverteilung vereinbar ist.
Lösung mit R (R-Console):
> x <- c(27, 25, 23, 27, 23, 25, 25, 22, 25, 23, 26, 23, 24, 26, 26)
> # Hypothesen: H0: X ist normalverteil vs. H1: X ist nicht normalverteilt
> shapiro.test(x)
Shapiro-Wilk normality test
data: x
W = 0.9207, p-value = 0.1977
Wegen p_value = 19,77% >= 5% kann H0 (Stichprobenwerte nicht in Widerspruch zur
Normalverteilungsannahme) nicht abgelehnt werden.
4.4 ELEMENTE DER QUALITÄTSSICHERUNG
4.4.1 STATISTISCHE PROZESSREGELUNG
In der statistischen Prozesslenkung (SPC Statistical Process Controll)
erfolgt eine laufende Überwachung eines Fertigungsprozesses
hinsichtlich eines Qualitätsmerkmals X. Zu diesem Zweck werden
regelmäßig Stichproben aus dem Prozesses entnommen und mit Hilfe
von Kennzahlen beurteilt, ob eine „Störung“ des Prozess vorliegt. Zur
Dokumentation des Prozessverlaufs werden sogenannte
Qualitätsregelkarten verwendet.
Wir betrachten den Einsatz von Qualitätsregelkarten zur Klärung der
Frage, ob ein Prozess „beherrscht“ ist. Für einen beherrschten Prozess
bleibt die Verteilung des Qualitätsmerkmals X im Laufe des Prozesses
unverändert. Wenn X – wie wir annehmen wollen - normalverteilt ist,
bedeutet dies, dass die Werte von X mit einer festen Fehlervarianz σ2
zufällig um einen festen Mittelwert (dem Fertigungsmittelwert) µ streuen.
Große oder systematische in eine Richtung gehende Abweichungen vom
Mittelwert deuten eine (unerwünschte) Änderung des Mittelwertes
und/oder der Standardabweichung an, die z.B. durch Störungen in der
Fertigungsanlage bedingt sein können.
Zur Überwachung des Mittelwerts µ findet die x -Karte, zur Überwachung
der Standardabweichung σ die s-Karte Anwendung. Mit diesen Karten
wird grundsätzlich nach folgendem Schema gearbeitet:
W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc
29.11.11
16
• Man entnimmt zum Zeitpunkt t1 eine Zufallstichprobe vom Umfang
n (z.B. n=5) und bestimmt damit den Stichprobenmittelwert x1 bzw.
die Standardabweichung s1.
• Liegt der Stichprobenmittelwert x1 (die Standardabweichung s1 )
außerhalb des mit der unteren und oberen Eingriffsgrenze
gebildeten Intervalls [UEG, OEG], wird der Prozessverlauf als
gestört angesehen und eingegriffen.
• Liegt der Stichprobenmittelwert x1 (die Standardabweichung s1 ) im
Intervall [UEG, OEG], wird der Prozessverlauf als ungestört
interpretiert und die Überwachung mit der Entnahme einer
neuerlichen Stichprobe zum Zeitpunkt t2 fortgesetzt.
Zusätzlich zur unteren und oberen Eingriffsgrenze enthalten die x - und
s-Karte auch noch eine untere und eine obere Warngrenze (UWG,
OWG). Ein x - oder s- Wert außerhalb der Warngrenzen (aber noch
innerhalb der Eingriffsgrenzen) ist im Allgemeinen Anlass zu erhöhter
Aufmerksamkeit, die sich z.B. in einer Verkürzung der Zeitpunkte
zwischen den Stichprobenentnahmen ausdrückt.
Die Eingriffsgrenzen der Mittelwertkarte ( x -Karte) werden aus der
Forderung P( X < UEG) = P( X > OEG) = 0,5% bestimmt; daraus ergibt
sich
UEG = µˆ − z 0 ,995σˆ / n , OEG = µˆ + z 0 ,995σˆ / n ;
analog werden die Warngrenzen aus der Forderung P( X < UWG) =
P( X > OWG) = 2,5%, d.h.
UWG = µˆ − z 0 ,975σˆ / n , OWG = µˆ + z 0, 975σˆ / n .
In diesen Formeln sind µ̂ und σˆ Schätzwerte für den Fertigungsmittelwert µ und die Fertigungsstreuung σ, die im Allgemeinen aus einem
Vorlauf mit einer großen Anzahl von Stichprobenwerten bestimmt
werden. Zu diesem Zweck werden Zu diesem Zweck werden dem
Fertigungsprozess in 20 bis 30 aufeinanderfolgenden Zeitpunkten
Stichproben (jeweils vom Umfang n) entnommen. Den Schätzwert µ̂
gewinnt man durch Mittelung der Stichprobenmittelwerte über die
Erhebungszeitpunkte; analog wird σ2 durch den Mittelwert der Stichprobenvarianzen geschätzt, die Quadratwurzel dieses Mittelwerts ist
schließlich der gesuchte Schätzwert σˆ für σ.
W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc
29.11.11
17
Neben den Eingriffs- und Warngrenzen ist in der x -Karte auch der
Schätzwert µ̂ für den Fertigungsmittelwert (als Mittellinie MLµ = µ̂
parallel zur Zeitachse) eingezeichnet.
Anmerkung:
Die Wahl der Eingriffsgrenzen (analoges gilt für die Warngrenzen)
entspricht der Festlegung des Ablehnungsbereiches beim zweiseitigen
Vergleich eines Mittelwerts µ mit dem vorgegebenen Sollwert µ̂ . Die
entsprechenden Alternativen lauten: H 0 : µ = µˆ (der Prozess verläuft
hinsichtlich des Fertigungsmittelwerts ungestört) vs. H 1 : µ ≠ µˆ (der
Prozess ist gestört). Die Nullhypothese wird auf dem Testniveau α = 1%
abgelehnt, wenn TGs = ( x − µˆ ) /(σˆ n ) > z1−α / 2 = z 0.995 , d.h.
x < UEG = µˆ − z 0.995σˆ / n oder x > OEG = µˆ + z 0.995σˆ / n gilt. Dabei
wurden die Schätzwerte µ̂ und σ̂ gleich den entsprechenden
Parametern µ bzw. σ der Verteilung von X gesetzt.
Die Eingriffsgrenzen der s-Karte werden aus der Forderung P(S2 <
UEG2) = P(S2 > OEG2) = 0,5% bestimmt; daraus ergibt sich
UEG = σˆ
χ n2−1, 0.005
n −1
, OEG = σˆ
χ n2−1, 0.995
n −1
.
analog werden die Warngrenzen aus der Forderung P(S2 < UWG2) =
P(S2 > OWG2) = 2,5% bestimmt, d.h.
UWG = σˆ
χ n2−1, 0.025
n −1
, OWG = σˆ
χ n2−1, 0.975
n −1
.
Für die Mittellinie der s-Karte ergibt sich die Lage
n
Γ 
2
2 .
MLs = E[ S ] = k nσˆ mit k n =
n − 1  n − 1
Γ

 2 
Beispiel 3.18:
Zur Erstellung einer x - und s-Karte zur Überwachung des Fertigungsmittelwerts
bzw. der Streuung des Durchmessers eines Produktes (Nennmaß 4,5mm) werden
aus einem Vorlauf 20 Stichproben vom Umfang n=5 in aufeinanderfolgenden
Zeitpunkten der Fertigung entnommen und die gemessenen Durchmesser
zusammen mit den Mittelwerten und Varianzen dokumentiert.
W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc
29.11.11
18
Daten:
Zeitpunkt
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Proben-Durchmesser
Mittelwert Varianz
4,46 4,50 4,59 4,35 4,65
4,510 0,0136
4,91 4,32 4,39 4,59 4,88
4,618 0,0739
5,36 4,32 5,34 4,47 4,64
4,826 0,2417
4,97 5,00 4,24 4,92 4,95
4,816 0,1045
4,50 4,69 4,45 4,34 4,42
4,480 0,0172
4,20 4,35 4,44 3,98 4,56
4,306 0,0505
4,61 4,44 4,58 4,31 4,17
4,422 0,0342
4,45 4,38 4,55 4,39 4,24
4,402 0,0128
4,18 4,43 4,72 4,44 4,20
4,394 0,0483
4,45 4,37 4,30 3,51 4,31
4,188 0,1472
3,96 4,69 4,20 4,01 3,91
4,154 0,1018
4,52 4,21 4,58 4,33 4,84
4,496 0,0588
4,77 4,50 4,35 4,51 4,27
4,480 0,0366
4,30 4,37 4,51 4,60 4,27
4,410 0,0198
4,31 4,29 4,10 4,18 4,24
4,224 0,0073
4,26 4,65 4,54 4,88 4,68
4,602 0,0516
4,17 4,22 4,62 4,22 4,59
4,364 0,0489
4,76 4,31 4,08 4,17 4,63
4,390 0,0864
4,82 4,76 4,49 4,10 4,72
4,578 0,0870
4,52 4,82 4,42 4,40 4,24
4,480 0,0462
Lösung:
Die Mittelwerte und Varianzen der zu den vorgegebenen Zeitpunkten entnommenen
Zufallsstichproben sind bereits der Datenmatrix beigefügt, ebenso der
Gesamtmittelwert 4,457 (Mittelwert der Einzelmittelwerte) und die Gesamtvarianz
0,0644 (Mittelwert der Einzelvarianzen); die entsprechende GesamtStandardabweichung ist 0,2538.
Bestimmung der Mittelwertkarte:
ML = 4,457; z0,995 = 2,576; UEG = 4,457– 2,576×0,2538/√5 = 4,165; OEG = 4,749;
z0,975 = 1,960; UWG = 4,457– 1,96×0,2538/√5 = 4,235; OWG = 4,680.
5,000
OEG
4,800
OWG
4,600
ML
4,400
UWG
4,200
UEG
4,000
0
2
4
6
8
10
12
14
16
18
20
Bestimmung der s-Karte:
k5 = (1/√2 )Γ(5/2)/Γ(2) = (1/√2 )⋅ (3/2)(√π)/2 = 0,940; ML = 0,940×0,2538 = 0,2386;
χ24,0.005 = 0,207; χ24,0.995 = 14,86; UEG = 0,2538 √(0,207/4) = 0,0577; OEG = 4892;
W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc
29.11.11
19
χ24,0.025 = 0,4844; χ24,0.975 = 11,143; UWG = 0,2538 √(0,0,4844/4) = 0,0883; OWG =
4236;
0,6
OEG
0,4
OWG
0,2
ML
UWG
UEG
0
0
2
4
6
8
10
12
14
16
18
20
Interpretation:
In der Mittelwertkarte werden die Eingriffsgrenzen zu zwei Zeitpunkten
über- bzw. unterschritten. In diesen Fällen nimmt man an, dass diese
Werte nicht mehr als zufällig zu betrachten sind, d.h. auf eine
systematische Änderung des Fertigungsmittelwertes hinweisen; der
Vorlauf wäre abzubrechen und die ursprüngliche Lage des Mittelwertes
herzustellen. Wirken nur noch zufällige Ursachen, heißt der Prozess
stabil. Analog wird bei Über-/Unterschreitung der Eingriffsgrenzen in der
s-Karte angenommen, dass eine systematische Veränderung der
Fertigungsstreuung stattgefunden hat. Die s-Karte gibt ferner über die
Größe der Streuung Auskunft Ist die Streuung zu groß, wird der Prozess
als „nicht fähig“ bezeichnet; zur Beurteilung der Prozessfähigkeit
existieren eigene Kennwerte.
Lösung mit R:
R-Script:
# Qualitätsregelkarten: Mittelwert- und s-Karte
library(qcc) # Laden des packages „qcc“
options(digits=4)
durchmesser <- c(
4.46, 4.50, 4.59, 4.35, 4.65,
4.91, 4.32, 4.39, 4.59, 4.88,
5.36, 4.32, 5.34, 4.47, 4.64,
4.97, 5.00, 4.24, 4.92, 4.95,
4.50, 4.69, 4.45, 4.34, 4.42,
4.20, 4.35, 4.44, 3.98, 4.56,
4.61, 4.44, 4.58, 4.31, 4.17,
4.45, 4.38, 4.55, 4.39, 4.24,
4.18, 4.43, 4.72, 4.44, 4.20,
4.45, 4.37, 4.30, 3.51, 4.31,
3.96, 4.69, 4.20, 4.01, 3.91,
4.52, 4.21, 4.58, 4.33, 4.84,
W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc
29.11.11
20
4.77, 4.50, 4.35, 4.51, 4.27,
4.30, 4.37, 4.51, 4.60, 4.27,
4.31, 4.29, 4.10, 4.18, 4.24,
4.26, 4.65, 4.54, 4.88, 4.68,
4.17, 4.22, 4.62, 4.22, 4.59,
4.76, 4.31, 4.08, 4.17, 4.63,
4.82, 4.76, 4.49, 4.10, 4.72,
4.52, 4.82, 4.42, 4.40, 4.24)
daten <- matrix(durchmesser, ncol=5, nrow=20, byrow=T)
daten
x_quer_karte <- qcc(daten, type="xbar", std.dev="RMSDF",
confidence.level=0.99, plot=F)
plot(x_quer_karte,title="Mittelwertkarte", xlab="Stichprobennummer",
ylab="Stichprobenmittelwert")
s_karte <- qcc(daten, type="S", std.dev="RMSDF",
confidence.level=0.99, plot=F)
plot(s_karte,title="s-Karte", xlab="Stichprobennummer",
ylab="Stichproben-STD")
R-Grafiken:
s-Karte
4.8
0.5
Mittelwertkarte
UCL
0.4
0.3
4.6
4.5
Stichproben-STD
0.2
CL
0.1
4.3
4.4
CL
4.2
Stichprobenmittelwert
4.7
UCL
LCL
1
3
5
7
9
11
13
15
17
19
Stichprobennummer
Number of groups = 20
Center = 4.457
LCL = 4.164
StdDev = 0.2546
UCL = 4.75
Number beyond limits = 3
Number violating runs = 0
LCL
1
3
5
7
9
11
13
15
17
19
Stichprobennummer
Number of groups = 20
Center = 0.2346
LCL = 0.05791
StdDev = 0.2546
UCL = 0.4907
Number beyond limits = 1
Number violating runs = 0
4.4.2 ANNAHMESTICHPROBENPRÜFUNG
Die Annahmestichprobenprüfung wird zur Eingangsprüfung oder
Endkontrolle von Prüflosen (=Zusammenfassung von unter
vergleichbaren Bedingungen hergestellten Einheiten) verwendet. Die
Überprüfung erfolgt mit einer so genannten Stichprobenanweisung, die
über den Umfang der Prüfstichprobe sowie über die Entscheidung für die
Annahme oder die Zurückweisung des Prüfloses Auskunft gibt.
W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc
29.11.11
21
Wie bestimmt man die Annahmewahrscheinlichkeit bei der Prüfung auf
fehlerhafte Einheiten?
Bei der Prüfung auf fehlerhafte Einheiten (Attributprüfung) werden die
Untersuchungseinheiten qualitativ mit einer zweistufigen Variablen
klassifiziert, die die Werte „gut“ oder “schlecht“ annimmt (Gut/Schlechtprüfung).
Es sei N der Umfang des Prüfloses, a die Anzahl der schlechten
Einheiten im Prüflos (Ausschusszahl), p = a/N der Fehleranteil (bzw.
Ausschussanteil) und n der Umfang der Prüfstichprobe. Wir setzen
voraus, dass die Stichprobennahme zufällig aus dem Prüflos erfolgt und
eine zerstörende Überprüfung der Einheiten erfolgt, d.h. die
Zufallsauswahl entspricht dem Modell der „Zufallsziehung ohne
Zurücklegen“. Dann folgt die Anzahl X der schlechten Einheiten in der
Prüfstichprobe einer hypergeometrischen Verteilung.
Wenn c als maximal zulässige Anzahl von Ausschusseinheiten
festgelegt ist, wird das Prüflos im Falle X ≤ c angenommen und im Falle
X > c abgelehnt. Die Stichprobenanweisung ist also durch den Umfang n
der Prüfstichprobe und die Annahmezahl c festgelegt und wird daher
auch kurz als (n,c)-Plan bezeichnet. Die Wahrscheinlichkeit Pa, dass
nach dieser Entscheidungsregel das Prüflos angenommen wird, ist in
Abhängigkeit vom Ausschussanteil p=a/N (a=0, 1, 2, …, N) durch
c
Pa ( p | n, c) =
∑H
c
N ,n , p
( x) =
x =0
∑
x =0
 a  N − a 
 

 x  n − x  mit a = Np
N
 
n
gegeben. Bezeichnet D={p|p=a/N und a=0, 1, …, N} die Menge der
möglichen Ausschussanteile, so heißt die auf D definierte Funktion
f: D [0,1] mit der Gleichung f(p)=Pa(p|n, c) die Operationscharakteristik
der Stichprobenanweisung (n, c). Der Graph der Operationscharakteristik heißt Annahmekennlinie oder OC-Kurve.
Unter der Voraussetzung n/N < 0,1 und N > 60 können die
Verteilungsfunktionswerte HN,n,p(x) mit ausreichender Genauigkeit durch
die entsprechenden Werte der Binomialverteilung Bn,p approximiert
werden; die Formel für die Annahmewahrscheinlichkeit vereinfacht sich
damit auf:
c
c
 n x
  p (1 − p)n−x
x
W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc
x=0
x=0  
Pa ( p | n, c) =
∑
∑
Bn, p ( x) =
29.11.11
22
Auf der Grundlage dieser Approximation kann zu einem vorgegebenen
Wert γ der Annahmewahrscheinlichkeit Pa(p|n,c) der entsprechende
Ausschussanteil pγ explizit mit Hilfe der Formel
pγ =
(c + 1) F2( c +1), 2( n −c ),1−γ
n − c + (c + 1) F2( c +1), 2( n −c ),1−γ
=
c +1
c + 1 + (n − c ) F2( n −c ), 2( c +1),γ
berechnet werden.
Beispiel 4.8:
Bei einem Fertigungsprozess werden Lose von N=150 Stück mit Hilfe eines
einfachen (n,c)-Planes mit Stichproben vom Umfang n=20 und der Annahmezahl c=1
geprüft. Man zeichne die entsprechende OC-Kurve. Zum Vergleich zeichne man
auch die OC-Kurve für (n, c) = (30,1).
Lösung:
Für n=20 und c=1ergeben sich als Funktionswerte der Operationscharakteristik
 a 150 − a   a 150 − a 

  
 
−
0
20
1
20
1



 für a = 1,2,...,130





+
 150
150
 
  
1
  20 
 20 
Pa (a / N | n, c) =
H150,20,a / 150 ( x) = 
 a 150 − a 
x =0
 1  20 − 1 
131
=
für a = 131

150
 150
 
  20 
 20 

und Pa(a/N|n,c)=0 für a=132, 133,…, 150.
∑
Für n=30 und c=1 ist
1
Pa (a / N | n, c) =
∑
x =0
 a 150 − a   a 150 − a 
  

 
−
0
30
1
30
1









+
für a = 1,2,...,120
 150
150
 
  
  30 
 30 
H150,30,a / 150 ( x) = 
−
a
150
a

 




 1  30 − 1 
131
=
für a = 121

150
 150
 
  30 
 30 

W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc
29.11.11
23
und Pa(a/N|n,c)=0 für a=122, 123,…, 150.
Darstellung (Excel-Grafik) der OC-Kurven:
1
OC-Kurven zu (n,c)-Prüf plänen mit
n=20 bzw. n=30 und c=1
PRP
10,8
ti
e
k
h 0,6
icl
in
e
h
c
sr 0,4
h
a
w
e
m0,2
h
a
n
n
A
n=20, c=1
n=30, c=1
CRP
0
0,0
p1-
0,1
p
0,2
0,3
Fehleranteil p
Lösung mit R (R-Console):
> # Laden des package “AcceptanceSampling” aus Unterverzeichnis library
> library(AcceptanceSampling)
> # Bestimmung der Annahmewahrscheinlichkeiten – Prüfplan (n,c)=(20,1)
> PPhyper20 <- OC2c(20, 1, type="hypergeom", N=150, pd=(0:150)/150)
> summary(PPhyper20, full=T)
Acceptance Sampling Plan (hypergeom with N=150)
Sample 1
Sample size(s)
20
Acc. Number(s)
1
Rej. Number(s)
2
Detailed acceptance probabilities:
Pop. Defectives Pop. Prop. defective P(accept)
0
0.000000000 1.000000e+00
1
0.006666667 1.000000e+00
2
0.013333333 9.829978e-01
3
0.020000000 9.531290e-01
usw.
> PPhyper20@pd[1:5]
[1] 0.000000000 0.006666667 0.013333333 0.020000000 0.026666667
> PPhyper20@paccept[1:5]
[1] 1.0000000 1.0000000 0.9829978 0.9531290 0.9138119
> # Bestimmung der Annahmewahrscheinlichkeiten – Prüfplan (n,c)=(30,1)
> PPhyper30 <- OC2c(30, 1, type="hypergeom", N=150, pd=(0:150)/150)
> summary(PPhyper30, full=T)
Acceptance Sampling Plan (hypergeom with N=150)
Sample 1
Sample size(s)
30
Acc. Number(s)
1
Rej. Number(s)
2
Detailed acceptance probabilities:
Pop. Defectives Pop. Prop. defective P(accept)
0
0.000000000 1.000000e+00
W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc
29.11.11
24
1
2
3
0.006666667 1.000000e+00
0.013333333 9.610738e-01
0.020000000 8.979503e-01
usw.
> # Erstellen der Grafik mit den OC-Kurven
> plot(PPhyper20@pd, PPhyper20@paccept, xlab="Ausschussanteil p",
+ ylab="Annahmewahrscheinlichkeit Pa",
+ main="OC-Kurven zu (n,c)-Prüfplänen \n mit n=20 bzw. 30 und c=1 ",
+ xlim=c(0, 0.5))
> grid(lty=1)
> lines(PPhyper20@pd, PPhyper20@paccept)
> lines(PPhyper30@pd, PPhyper30@paccept, col="red")
> text(0.12, 0.30, pos=4, "n=20")
> text(0.02, 0.30, col="red", pos=4, expression("n=30"))
> segments(x0=0.02,y0=0.9, x1=0.04, y1=0.9, lwd=3)
> segments(x0=0.03,y0=0.88, x1=0.03, y1=0.92, lwd=3)
> text(0.04, 0.9, pos=4, "PRP")
> segments(x0=0.162,y0=0.1, x1=0.182, y1=0.1, lwd=3)
> segments(x0=0.172,y0=0.08, x1=0.172, y1=0.12, lwd=3)
> text(0.19,0.1, pos=4, "CRP")
R-Grafik:
1.0
OC-Kurven zu (n,c)-Prüfplänen
mit n=20 bzw. 30 und c=1
0.6
0.4
n=30
n=20
0.2
Annahmewahrscheinlichkeit Pa
0.8
PRP
0.0
CRP
0.0
0.1
0.2
0.3
0.4
0.5
Ausschussanteil p
Man erkennt:
• Die OC-Kurven verlaufen monoton fallend vom Wert 1 bei p=0 auf
den Wert 0 bei p=1; mit wachsendem n wird der Kurvenverlauf steiler.
• Sehr gute Lose (p ≤ p1-α) sollen mit einer (hohen) Wahrscheinlichkeit
Pa(p|n,c) ≥ 1-α angenommen und mit einer kleinen Wahrscheinlichkeit
1- Pa(p|n,c) < α (irrtümlich) zurückgewiesen werden; α ist z.B. 10%
oder 5% und heißt das Lieferantenrisiko; p1-α wird Annahmegrenze
(kurz AQL, acceptable quality level) genannt. Der Punkt (p1-α, 1-α)
auf der OC-Kurve heißt auch Producer Risk Point (PRP).
W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc
29.11.11
25
• Sehr schlechte Lose (p ≥ pβ) sollen mit einer (kleinen)
Wahrscheinlichkeit Pa(p|n,c) ≤ β (irrtümlich) angenommen und mit
einer großen Wahrscheinlichkeit 1- Pa(p|n,c) > 1-β zurückgewiesen
werden; β ist wie α z.B. 10% oder 5% und heißt das Abnehmerrisiko;
pβ wird Ablehngrenze (kurz LQL, limiting quality level) genannt. Der
Punkt (pβ, β) auf der OC-Kurve wird auch Consumer Risk Point
(CRP) genannt.
Beispiel 4.9:
Für einen Fertigungsprozess ist geplant, Lose von N=7000 Stück mit Hilfe eines
einfachen (n,c)-Planes mit Stichproben vom Umfang n=60 und der Annahmezahl c=4
zu prüfen. Können mit diesem Plan die Vorgaben Pa(p|n,c)≥1-α=90% für p≤5% und
Pa(p|n,c)≤ß=5% für p≥15% erfüllt werden?
Lösung:
Wegen n/N<0.1 und N>60 kann die Annahmewahrscheinlichkeit in Abhängigkeit vom
Ausschussanteil p vereinfacht mit Hilfe der Binomialverteilung (statt der
hypergeometrischen Verteilung) bestimmt werden. Wir bestimmen zum
vorgegebenen AQL=5% und vorgegebenen LQL=15% die entsprechenden
Annahmewahrscheinlichkeiten Pa(AQL|60,4) bzw. Pa(LQL|60,4) und erhalten dafür
4
Pa (0.05 | 60,4) =
∑
x =0
4
Pa (0.15 | 60,4) =
∑
x =0
 60 
 0.05 x (1 − 0.05) 60− x = 81.97%,
 x
 60 
 0.15 x (1 − 0.15) 60− x = 4.24%.
 x
Wegen Pa(AQL|60,4)=81.97%<90% ist die erforderliche Mindestannahmewahrscheinlichkeit im Punkt PRP nicht erfüllt. Dagegen wird wegen
Pa(LQL|60,4)=4.24%<5% im Punkt CRP die vorgegebene Maximalwahrscheinlichkeit
nicht überschritten.
Lösung mit R (R-Console):
> library(AcceptanceSampling)
> PPbinom <- OC2c(60, 4, type="binom")
> assess(PPbinom, PRP=c(0.05, 0.9), CRP=c(0.15, 0.05))
Acceptance Sampling Plan (binomial)
Sample 1
Sample size(s)
60
Acc. Number(s)
4
Rej. Number(s)
5
Plan CANNOT meet desired risk point(s):
PRP
CRP
Quality RP P(accept) Plan P(accept)
0.05
0.90 0.81966494
0.15
0.05 0.04237205
W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc
29.11.11
26
Wie hängt die OC mit der Gütefunktion des entsprechenden statistischen
Tests zusammen?
Die Entscheidung mit einem (n,c)-Plan bei der Prüfung auf fehlerhafte
Einheiten erinnert an die Entscheidungssituation beim Binomialtest und
kann wie folgt dargestellt werden:
Gutes Los:
Ausschussrate p≤po
(Ereignis H0)
Schlechtes Los:
Ausschussrate p>po
(Ereignis H1)
Annahme:
Entscheidung für H0
(Ereignis T0 =’X≤c’)
Richtige Entscheidung:
P = P(T0|H0)
Fehler! (2. Art, β-Fehler)
P= P(T0|H1)
Abnehmerrisiko
Rückweisung:
Entscheidung für H1
(Ereignis T1=’X>c’)
Fehler! (1. Art, α-Fehler)
P = P(T1|H0)
Lieferantenrisiko
Richtige Entscheidung:
P= P(T1|H1)
Bei der einseitigen Prüfung der Fehlerwahrscheinlichkeit p auf allfällige
Überschreitung eines vorgegebenen Sollwertes po lautet die
Alternativhypothese H1: p>po und folglich die Nullhypothese H0: p≤po. Ist
für den Konsumenten die Schlechtgrenze pβ, d.h. diese
Fehlerwahrscheinlichkeit gerade noch akzeptabel (weil dann Lose mit
dem geringen Abnehmerrisiko β angenommen werden), wird der
Lieferant seine Fertigung so einrichten, dass po = p1-α = pβ -∆ (∆ >0), d.h.
Fehlerwahrscheinlichkeit p die Gutgrenze p1-α nicht überschreitet
(H0:p≤p1-α); dabei ist die Gutgrenze (bzw. ∆) so gewählt, dass die
Wahrscheinlichkeit für die Ablehnung von H0 größer als 1-α bleibt, wenn
H0 (gutes Los) gilt, und kleiner als β bleibt, wenn p > pβ (sehr schlechtes
Los) gilt.
Die Gütefunktion G wurde als Wahrscheinlichkeit für die Ablehnung von
H0 (gutes Los) in Abhängigkeit vom Parameter p eingeführt. Die
Operationscharakteristik OC ist gleich der Wahrscheinlichkeit Pa für die
Annahme des Loses in Abhängigkeit von p. Die beiden
Wahrscheinlichkeiten sind zueinander komplementär, d.h. Pa = 1 – G.
Wie wählt man eine geeignete Stichprobenanweisung aus, d.h. den
Umfang n sowie die Annahmezahl c?
Zur Bestimmung der Parameter n und c werden die Gleichungen
Pa(p1-α|n,c) = 1-α und Pa(pβ|n,c) = β herangezogen, die in geometrischer
Deutung verlangen, dass die Punkte (p1-α,1-α) und (pβ,β) auf der OC
liegen. Diese Vorgaben entsprechen den Forderungen, dass das Prüflos
W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc
29.11.11
27
bis zum (kleinen) Fehleranteil p1-α, zumindest mit der (hohen)
Wahrscheinlichkeit 1-α und ab dem (hohen) Fehleranteil pβ höchstens
mit der (kleinen) Wahrscheinlichkeit β angenommen wird. Eine
Auflösung des Gleichungssystems Pa(p1-α|n,c) = 1-α, Pa(pβ|n,c) = β ist
nur auf numerischem Wege möglich. Um ganzzahlige Lösungswerte für
n und c zu finden, müssen die Gleichungen i. Allg. als Ungleichungen
Pa(p1-α|n,c) ≥ 1-α, Pa(pβ|n,c) ≤ β betrachtet werden.
Beispiel 4.10:
Man bestimme die Stichprobenanweisung, wenn Lieferanten und Abnehmer
vereinbart haben: Die Annahmewahrscheinlichkeit soll bis zu einem Fehleranteil von
2% zumindest 90% und ab einem Fehleranteil von 8% höchstens 10% betragen. Der
Umfang des Prüfloses sei N=5000.
Lösung:
Es ist 1-α = 0,9, p1-α = 0,02 (Lieferantenforderung) und β = 0,1, pβ = 0,08. Zur Lösung
der Ungleichungen Pa(0,02|n,c) ≥ 0,9, Pa(0,08|n,c) ≤ 0,01 geben wir für c die Werte 0,
1, 2 und 3 vor und schreiben die entsprechenden Annahmewahrscheinlichkeiten an:
 n
c = 0 : Pa ( p | n,0) =  (1 − p) n = (1 − p) n
 0
 n
 n
c = 1 : Pa ( p | n,1) =  (1 − p) n +  (1 − p) n−1 p
0
 1
 n
n
 n
c = 2 : Pa ( p | n,2) =  (1 − p) n +  (1 − p) n −1 p +  (1 − p) n − 2 p 2
 0
1
 2
 n
 n
 n
 n
c = 3 : Pa ( p | n,3) =  (1 − p) n +  (1 − p) n−1 p +  (1 − p) n − 2 p 2 +  (1 − p) n −3 p
0
 1
 2
 3
Dabei wurde die Annahme gemacht, dass für das gesuchte n gilt n/N<0,1, so dass
mit ausreichender Genauigkeit die Binomialverteilungsapproximation angewendet
werden kann. Durch systematischen Einsetzen von Werten für n erkennt man, dass
Pa(0,02|n,0) ≥ 0,9 für n<6 und Pa(0,08|n,0) ≤ 0,01 für n>55 gilt, d.h. für c=0 besitzen
die Ungleichungen keine Lösung; dies gilt ebenso für c=1 und c=2. Im Falle c=3
findet man, dass Pa(0,02|n,3) ≥ 0,9 für n<88 und Pa(0,08|n,3) ≤ 0,01 für n>81; beide
Ungleichungen sind also für 81<n<88 erfüllt. Aus wirtschaftlichen Gründen
entscheidet man sich für das kleinste n, d.h. n=82. Die gesuchte Anweisung ist daher
(n,c)=(82,3). Wegen n/N=82/5000=0,0164<0,1 ist die Approximation der
hypergeometrischen Verteilung durch die Binomialverteilung gerechtfertigt.
Wir rechnen als Kontrolle für die durch n=82 und c=3 festegelegte OC die
tatsächlichen Werte für die Gutgrenze p1-α sowie die Schlechtgrenze pβ nach. Es ist
mit γ = 1-α = 0,9 und F2(n-c),2(c+1),1-α = F158,8,0.9 = 2,311
p1−α = p 0,9 =
c +1
4
=
= 0,0214 > 0,02
c + 1 + ( n − c ) F2 ( n −c ), 2( c +1),γ 4 + 79 ⋅ 2,311
W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc
29.11.11
28
Analog ergibt sich mit γ = β = 0,1 und F2(n-c),2(c+1),β = F158,8,0.1 = 0,585 für die
Schlechtgrenze pβ = 0,0797<0,08.
Lösung mit R (R-Console):
> library(AcceptanceSampling)
> find.plan(PRP=c(0.02, 0.9), CRP=c(0.08, 0.1), type="binom")
$n
[1] 82
$c
[1] 3
$r
[1] 4
> # Überprüfung, ob der (82, 3)-Prüfplan die Bedingungen erfüllt:
> assess(OC2c(82, 3, type="binom"),PRP=c(0.02, 0.9), CRP=c(0.08, 0.1))
Acceptance Sampling Plan (binomial)
Sample 1
Sample size(s)
82
Acc. Number(s)
3
Rej. Number(s)
4
Plan CAN meet desired risk point(s):
PRP
CRP
Quality RP P(accept) Plan P(accept)
0.02
0.9
0.9175469
0.08
0.1
0.0981495
Wie bestimmt man einen Prüfplan und die entsprechende
Operationscharakteristik für ein quantitatives Merkmal?
Wir betrachten nun den Fall, dass die zu kontrollierende Eigenschaft der
Einheiten des Prüfloses durch ein metrisches Merkmal X (z.B. eine
Länge oder Konzentration) beschrieben ist. Wir setzen X als
normalverteilt mit den Parametern µ und σ2 voraus und nehmen an, dass
der Fertigungsmittelwert µ unbekannt, die Fertigungsstreuung σ2 der
Einfachheit halber aber bekannt ist.
Soll X nur mit einer kleinen Wahrscheinlichkeit p eine vorgegebene
obere Toleranzgrenze To überschreiten, liegt ein einseitiges Kriterium
„nach oben“ vor; die folgenden Ausführungen beschränken sich auf
diesen Fall, d.h. auf eine Prüfung auf Überschreitung. Wegen P(X ≤ To) =
1 – P(X > To) = 1- p, ist To das (1-p)-Quantil der Verteilung von X. Es
folgt, dass die standardisierte Größe (To -µ)/σ gleich dem (1-p)-Quantil
z1-p der Standardnormalverteilung ist, d.h. der Fertigungsmittelwert kann
in der Form µ = To -σz1-p dargestellt werden. Die Wahrscheinlichkeit p ist
der zu erwartende Anteil von schlechten Einheiten (mit X> To).
W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc
29.11.11
29
Zur Schätzung des Fertigungsmittelwerts µ wird dem Prüflos (vom
Umfang N) eine Zufallsstichprobe vom Umfang n<N entnommen und
daraus der Stichprobenmittelwert X bestimmt. Damit wird nun die
folgende Prüfvorschrift formuliert:
Das Los wird angenommen, wenn X ≤ To - kσ gilt. Die Konstante k ist
der sogenannte Annahmefaktor und neben der Größe n der
Prüfstichprobe die zweite Kennzahl des Prüfplans für ein metrisches
Merkmal.
Für die Annahmewahrscheinlichkeit ergibt sich in Abhängigkeit vom
Fertigungsmittelwert µ die Formel
 X − µ To − kσ − µ 
Paµ (µ | n, k ) = P( X ≤ To − kσ ) = P
≤
=
σ / n 
σ / n
 T − µ
 
= Φ  o
− k  n 
 
 σ
bzw. in Abhängigkeit vom Fehleranteil p, wenn µ = To -σz1-p substituiert
wird, die Formel:
(
Pa ( p | n, k ) = Φ [z1− p − k ] n
)
Den Graphen der Funktion Paµ: µ
Paµ (µ |n,k) bzw. Pa: p
Pa(p |n,k)
bezeichnet man wieder als Annahmekennlinie oder Operationscharakteristik (OC-Kurve) des verwendeten Prüfplans. Aus der
Monotonie von Φ folgt, dass die Annahmewahrscheinlichkeit mit
wachsendem µ bzw. p streng monoton abnimmt.
Beispiel 4.11:
Bei der Fertigung eines Produktes ist die Prüfung eines Längenmerkmals X auf
allfällige Überschreitung einer oberen Toleranzgrenze von To =100mm vorgesehen.
Das Merkmal kann als normalverteilt angenommen werden mit dem (unbekannten)
Mittelwert µ und der (bekannten) Varianz σ2= 2mm2. Die Beurteilung soll mit dem
Prüfplan n=40 (Umfang der Prüfstichprobe) und k=1.45 (Annahmefaktor) erfolgen.
Man stelle die Annahmewahrscheinlichkeit Paµ für Mittelwerte µ von 95mm bis
101mm dar und ebenso die Annahmewahrscheinlichkeit Pa in Abhängigkeit vom
Ausschussanteil p im Produktionslos. Erfüllt der Prüfplan die Kriterien, dass bis zu
einem Ausschussanteil von 5% die Annahmewahrscheinlichkeit ≥ 95% ist und ab
einem Ausschussanteil von 7.5% die Annahmewahrscheinlichkeit ≤ 10% bleibt?
Lösung mit R (R-Console):
> library(AcceptanceSampling)
> To_X <- 100
> sigma_X <- 2
> mu_X <- seq(94, 100, 0.05)
W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc
29.11.11
30
> p_X <- 1-pnorm((To_X-mu_X)/sigma_X) # Ausschussanteil in Abhängigkeit vom Mittelwert
> PP1_X <- OCvar(n=40, k=1.45, pd=p_X) # Annahmewahrscheinlichkeit Pa
> PP1_X
Acceptance Sampling Plan (normal)
Standard deviation assumed to be known
Sample 1
Sample size 40.00
Constant k
1.45
>#
> # OC-Kurve: Annahmewahrscheinlichkeit in Abhängigkeit vom Mittelwert mu_X
> plot(mu_X, PP1_X@paccept, type="l", xlab="Mittelwert mu_X",
+ ylab="Annahmewahrscheinlichkeit Pa(mu_X)", main="OC-Kurve für Messmerkmal X mit STD=2
+ (obere Toleranzgrenze=100, n=40, k=1.45)", xlim=c(94, 100))
>#
> # OC-Kurve: Annahmewahrscheinlichkeit in Abhängigkeit vom Ausschussanteil p_X
> pu <- 1-pnorm((To_X-94)/sigma_X) # Ausschussanteil zu mu_X=95
> po <- 1-pnorm((To_X-100)/sigma_X) # Ausschussanteil zu mu_X=100
> print(cbind(pu, po))
pu
po
[1,] 0.001349898 0.5
> plot(p_X, PP1_X@paccept, type="l", xlab="Ausschussanteil p_X",
+ ylab="Annahmewahrscheinlichkeit Pa(p_X)", main="OC-Kurve für Messmerkmal X mit STD=2
+ (obere Toleranzgrenze=100, n=40, k=1.45)", xlim=c(0.0014,0.5))
OC-Kurve für Messmerkmal X mit STD=2
(obere Toleranzgrenze=100, n=40, k=1.45)
0.8
0.6
0.4
Annahmewahrscheinlichkeit Pa(p_X)
0.0
0.2
0.8
0.6
0.4
0.2
0.0
Annahmewahrscheinlichkeit Pa(mu_X)
1.0
1.0
OC-Kurve für Messmerkmal X mit STD=2
(obere Toleranzgrenze=100, n=40, k=1.45)
94
95
96
97
98
99
100
Mittelwert mu_X
0.0
0.1
0.2
0.3
0.4
Ausschussanteil p_X
> # Überprüfung ob Prüfplan den vorgegebenen RPs (risk points PRP, CRP) entspricht
> assess(PP1_X, PRP=c(0.05, 0.95), CRP=c(0.1, 0.075))
Acceptance Sampling Plan (normal)
Standard deviation assumed to be known
Sample 1
Sample size 40.00
Constant k
1.45
Plan CANNOT meet desired risk point(s):
PRP
CRP
Quality RP P(accept) Plan P(accept)
0.05
0.950
0.8910932
0.10
0.075
0.1433562
W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc
29.11.11
0.5
31
Wie bestimmt man die Kennzahlen n und k des Prüfplans für ein
quantitatives Merkmal?
Die Kennzahlen n und k können durch Vorgabe von 2 Punkten der
Operationscharakteristik bestimmt werden. Wir verlangen wie schon bei
der Attributprüfung, dass
• sehr gute Lose (p≤ p1−α) mindestens mit der an der Annahmegrenze
AQL=p1−α vorgegebenen hohen Wahrscheinlichkeit 1-α und
• sehr schlechte Lose (p≥ pβ) höchstens mit der an der Ablehngrenze
LQL=pβ vorgegebenen kleinen Wahrscheinlichkeit β angenommen
werden.
Für die Annahmewahrscheinlichkeit folgen daraus die Bedingungen
(
P ( LQL | n, k ) = Φ ([z
)
− k ] n ) = β ⇔ [z
Pa ( AQL | n, k ) = Φ [z1− AQL − k ] n = 1 − α ⇔ [z1− AQL − k ] n = z1−α ,
a
1− LQL
1− LQL
− k ] n = z β = − z1− β ,
aus denen die Kennzahlenwerte
2
 z + z1−β 
z z
+ z1− β z1− AQL
 , k = 1−α 1− LQL
n =  1−α

z1−α + z1− β
 z1− AQL − z1− LQL 
bestimmt werden können. Dabei ist n i. Allg. nicht ganzzahlig und durch
die nächst größere ganze Zahl zu ersetzen; wir bezeichnen diese Zahl
mit nσ.
Annmerkungen:
• In der Regel ist die Fertigungsstreuung σ nicht bekannt und ebenso
wie der Fertigungsmittelwert aus der Prüfstichprobe zu schätzen. Es
sei s der Schätzwert für σ. Der Umfang ns der Prüfstichprobe ergibt
sich nun näherungsweise aus ns = (1+ k2/2)nσ; diese Formel liefert für
ns ≥ 10 brauchbare Näherungswerte.
• Entsprechende Überlegungen gelten für den Fall der einseitigen
Abgrenzung des Toleranzbereichs durch einen unteren Grenzwert Tu.
Beispiel 4.12:
Es sei X ein normalverteiltes Merkmal; zur Festlegung der Operationscharakteristik
wird ein Lieferantenrisiko von 5% an der Annahmegrenze AQL=5% und ein
Abnehmerrisiko von 7.5% an der Ablehngrenze LQL = 10% vereinbart. Man
bestimme die Kennwerte n und k des entsprechenden Prüfplans (bei bekannter
W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc
29.11.11
32
Varianz) und stelle die entsprechende Operationscharakteristik (mit σ2= 2mm2, To
=100mm) in Abhängigkeit vom Ausschussanteil p dar.
Lösung:
Es ist 1-α = 0.95, AQL=p1-α = 0.05 (Lieferantenforderung) und β = 0.075 bei LQL= pβ
= 0.10. Die zur Bestimmung von n und k benötigten Quantile der
Standardnormalverteilung sind: z1-α = z0.95 = 1.64485; z1-AQL = z0.95 = 1.64485; z1-β =
z0.925 =1.28155; z1-LQL = z0.925 = 1.43953. Damit ergibt sich n = 72.08
nσ = 73 und k
= 1,45112. Bei unbekannter Fertigungsvarianz erhöht sich der Umfang der
Prüfstichprobe auf ns = 150!
Lösung mit R (R-Console):
> library(AcceptanceSampling)
> xx <- find.plan(PRP=c(0.05, 0.95), CRP=c(0.1, 0.075), type="normal", s.type="known")
> xx
$n
[1] 73
$k
[1] 1.452338
$s.type
[1] "known"
> # Darstellung der Operationscharakteristik
> To_X <- 100
> sigma_X <- 2
> mu_X <- seq(94, 100, 0.05)
> p_X <- 1-pnorm((To_X-mu_X)/sigma_X)
> PP2_X <- OCvar(n=73, k=1.452, pd=p_X)
> assess(PP2_X, PRP=c(0.05, 0.95), CRP=c(0.1, 0.075))
Acceptance Sampling Plan (normal)
Standard deviation assumed to be known
Sample 1
Sample size 73.000
Constant k 1.452
Plan CAN meet desired risk point(s):
PRP
CRP
Quality RP P(accept) Plan P(accept)
0.05
0.950 0.95029720
0.10
0.075 0.07265319
plot(p_X, PP2_X@paccept, type="l", xlab="Ausschussanteil p_X",
ylab="Annahmewahrscheinlichkeit Pa(p_X)", main="OC-Kurve für Messmerkmal X mit STD=2
(obere Toleranzgrenze=100, n=73, k=1.452)", xlim=c(0,0.2), lwd=2)
> segments(-0.03, 0.95, 0.05, 0.95, lty=3)
> segments(0.05, -0.03, 0.05, 0.95, lty=3)
> points(0.05, 0.95, type="p")
> text(0.06,0.95, "PRP")
> segments(-0.03, 0.075, 0.1, 0.075, lty=3)
> segments(0.1,-0.03, 0.1, 0.075, lty=3)
> points(0.1, 0.075, type="p")
> text(0.11,0.1, "CRP")
W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc
29.11.11
33
1.0
OC-Kurve für Messmerkmal X mit STD=2
(obere Toleranzgrenze=100, n=73, k=1.452)
0.8
0.6
0.4
0.2
Annahmewahrscheinlichkeit Pa(p_X)
PRP
0.0
CRP
0.00
0.05
0.10
0.15
0.20
Ausschussanteil p_X
4.5 ANHANG: ÜBERBLICK ÜBER 1-STICHPROBENVERGLEICHE
EINSTICHPROBENVERGLEICHE
Untersuchungsmerkmal ist
2-stufig skaliert
Untersuchungsmerkmal ist
mehrstufig skaliert
Vergleich eines
Mittelwerts mit
vorgegebenem
Sollwert
Vergleich einer
Wahrscheinlichkeit
mit vorgegebenem
Sollwert
Vergleich von
Wahrscheinlichkeiten
auf vorgegebenes
Verhältnis
Einstichproben
t-Test
Binomialtest
ChiquadratAnpassungstest
Untersuchungsmerkmal ist metrisch
Überprüfung mit
Shapiro-WilkTest
Untersuchungsmerkmal ist
normalverteilt
W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc
29.11.11
34
4.6 ÜBUNGSBEISPIELE
Einfache Übungsbeispiele
1. Für eine Blumenzwiebelsorte wird eine Keimfähigkeit von mindestens 75%
garantiert. In einer Stichprobe von n=60 keimten 35 Zwiebeln. a) Liegt eine
signifikante Abweichung vom garantierten Ergebnis vor? Man prüfe diese Frage
auf dem Signifikanzniveau α=5%. b) Welche Fallzahl ist notwendig, um eine
Unterschreitung des garantierten Anteils um 0.1 mit einer Sicherheit von 90%
feststellen zu können? (Unterschreitung sign.; 214)
2. Die Verpackung einer bestimmten Zigarettensorte weist einen mittleren
Nikotingehalt von 15 mg pro Zigarette aus. Es wird eine Zufallsstichprobe von 100
Zigaretten getestet. Dabei ergab sich ein mittlerer Nikotingehalt von 16.5 mg und
eine Standardabweichung von 4 mg. Kann aus dem Ergebnis der Stichprobe auf
1%igem Signifikanzniveau der Schluss gezogen werden, dass der tatsächliche
Nikotingehalt im Mittel über 15 mg liegt? (Überschreitung sign.)
3. Es sei X eine normalverteilte Umweltmessgröße mit dem (unbekannten)
Mittelwert µ und der Standardabweichung σ=10. Mit Hilfe einer Stichprobe soll
geprüft werden, ob eine Überschreitung des Grenzwertes K vorliegt, wobei das αRisiko mit 5% vorgegeben ist und eine kritische Überschreitung von 6.5 mit
90%iger Sicherheit erkannt werden soll. Welcher Stichprobenumfang ist zu
planen? (21)
4. Von einer Messstelle wurden die folgenden Werte der Variablen X (SO2Konzentration der Luft in mg/m3) gemeldet: 32, 41, 33, 35, 34.
a) Weicht die mittlere SO2-Konzentration signifikant vom Wert µo=30 ab? (α=5%)
b) Welcher Mindeststichprobenumfang müsste in 6 geplant werden, um mit dem
Test eine Abweichung vom Referenzwert µo um 5% (des Referenzwertes) mit
einer Sicherheit von 95% erkennen zu können? (sign. Abweichung; 73)
5. Es sei X eine normalverteilte Messgröße mit der Varianz 0,25; für X ist der
Nennwert 1,75 vorgegeben. Zur Prüfung auf eine allfällige Abweichung vom
Nennwert wird der t-Test eingesetzt; als Testniveau ist 5% vorgesehen. Wie groß
muss der Stichprobenumfang geplant werden, um eine kritische Abweichung um
0,15 Einheiten mit 90%iger Sicherheit erkennen zu können? (117)
6. Bei einer Untersuchung der Cd-Belastung von Forellen in einem Fließgewässer
wurden 10 Forellen gefangen und der Cd-Gehalt (in mg/g Frischgewicht)
bestimmt. Die Auswertung ergab den Mittelwert 0,062 und die
Standardabweichung 0,007. Kann aus den Angaben geschlossen werden, dass
der mittlere Cd-Gehalt signifikant (α=5%) über dem Referenzwert 0,06 liegt?
Welcher Umfang der Zufallsstichproben müsste geplant werden, um mit dem Test
eine Abweichung vom Referenzwert in der Höhe der beobachteten Abweichung
mit 90%iger Sicherheit als signifikant zu erkennen? (Abw. n. sign., 130)
7. Die Messung der Ozonkonzentration während der Sommermonate ergab für eine
Großstadt die in der folgenden Tabelle enthaltenen Werte (Angaben in 10-2 ppm).
a) Liegt die mittlere Ozonkonzentration signifikant über dem Wert µo=5?
b) Welcher Mindeststichprobenumfang müsste geplant werden, um mit dem Test
W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc
29.11.11
35
eine Überschreitung von µo um 10% mit einer Sicherheit von 90% erkennen zu
können? (α = 5%) (Überschreitung n. sign.; 93)
2.5
3.0
5.6
4.7
6.5
6.7
1.7
5.3
4.6
7.4
5.4
4.1
5.1
5.6
5.4
6.1
7.6
6.2
6.0
5.5
5.8
8.2
3.1
5.8
2.6
8. In einer Studie über die Behandlung von akuten Herzinfarktpatienten wurde einer
Standardtherapie mit einer neuen Therapie verglichen. Es wurden 160 Patienten
mit der neuen Therapie behandelt, von denen 20 innerhalb von 4 Wochen
verstarben. Bei Anwendung der Standardtherapie muss eine
Sterbewahrscheinlichkeit von po =0,2 angenommen werden. Man prüfe mit dem
Binomialtest, ob die neue Therapie ein signifikant unter po =0,2 liegendes
Sterberisiko ergibt (α=5%). (Unterschr. sign.)
9. In einer Studie wurde u.a. das Ges. Eiweiß i.S. am Beginn und am Ende
bestimmt. Bei 31 Probanden war eine Veränderung zu beobachten: bei 20
Probanden lag der Eiweißwert vorher im Normbereich und nachher außerhalb
des Normbereichs lag, bei 11 Probanden lag der Eiweißwert vorher außerhalb
und nachher im Normbereich. a) Weicht der Anteil y der Probanden, bei denen
der Eiweißwert vorher außerhalb und nachher innerhalb des Normbereichs liegt,
signifikant von 0,5 ab? Als Signifikanzniveau sei α = 5% vereinbart. b) Ist der
Versuch so geplant, dass die beobachtete Abweichung |y-0,5| mit 90%iger
Sicherheit mit dem Test als signifikant zu erkennen wäre? (Abw. n. sign.; nein)
10. Im Rahmen einer Untersuchung des Ernährungsstatus von Schulkindern aus
Oberösterreich und der Steiermark wurde u.a. das Gesamtcholesterin (in mg/dl)
stichprobenartig erfasst.
Gesamtcholesterin
<170 (optimal)
>=170 (Risiko)
Oberösterreich
93
52
Steiermark
42
29
a) Man prüfe für jedes Bundesland auf 5%igem Niveau, ob der Anteil von
Schulkindern in der optimalen Kategorie signifikant über p0 = 0,5 liegt. (OÖ:
Überschreitung sign., St: nicht sign.)
b) Welcher Stichprobenumfang müsste geplant werden, um mit dem Binomialtest
auf dem Niveau α = 5% eine Überschreitung des Referenzwertes p0 = 0,5 um
0,1 mit 90%iger Sicherheit erkennen zu können? (214)
11. In sogenannten Fall-Kontroll-Studien werden Vierfeldertafeln verwendet, um die
Verteilung eines (zweistufigen) Risikofaktors (Raucher/Nichtraucher) in einer
Testgruppe und einer Kontrollgruppe darzustellen. Die Tabelle zeigt die
(hypothetische) Vierfeldertafel einer Fall-Kontroll-Studie.
Raucher
Nichtraucher
Testgruppe
87
60
W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc
Kontrolle
78
45
29.11.11
36
a) Man prüfe für die Testgruppe, ob der Anteil der Raucher signifikant über
p0=0,5 liegt. (α=5%)? (Überschr. sign.)
b) Welcher Mindeststichprobenumfang müsste geplant werden, um mit dem
Binomialtest eine Überschreitung von p0 =0,5 um 0,05 Einheiten mit einer
Sicherheit von 80% erkennen zu können? (700)
12. Bei seinen Kreuzungsversuchen mit Erbsen untersuchte Mendel unter anderem
die Nachkommen von bezüglich zweier Merkmale mischerbigen Pflanzen. Bei
den Merkmalen handelte es sich um die Samenform mit den Allelen A (runde
Form) und a (kantige Form) sowie um die Samenfarbe mit den Allelen B (gelbe
Färbung) und b (grüne Färbung). 15 Stammpflanzen des Genotyps AaBb gaben
insgesamt 529 Samen, aus denen sich Pflanzen der Genotypen AABB, AAbb,
aaBB, aabb, AABb, aaBb, AaBB, Aabb sowie AaBb mit den Häufigkeiten 38, 35,
28, 30, 65, 68, 60, 67 bzw. 138 entwickelten. Nach der Mendel'schen Theorie
müssten sich die neun Genotypen im Verhältnis 1:1:1:1:2:2:2:2:4 aufspalten.
Kann die Theorie auf dem Testniveau α = 5% durch dieses
Beobachtungsergebnis falsifiziert werden? (nein)
13. Von einer Pflanze erhielt Mendel (1866) insgesamt 62 Samen von denen 44 gelb
und 18 grün gefärbt waren. Man zeige, dass das Verhältnis 44:18 der
beobachteten Anzahlen nicht "signifikant" vom theoretischen
Aufspaltungsverhältnis 3:1 abweicht (α = 5%)?
14. In einer Studie mit 5 Probanden wurde eine bestimmte Zielgröße X am
Studienbeginn (Xb) und – nach erfolgter Behandlung - am Studienende (Xe)
gemessen.
Xb 57 73 44 27 32
Xe 59 74 46 26 35
a) Man erfasse die Wirkung der Behandlung durch die Differenz Y= Xe - Xb und
prüfe, ob der Mittelwert von Y signifikant von Null abweicht (α=5%). (nein)
b) Was kann über die Versuchsplanung in a) gesagt werden? Welcher
Mindeststichprobenumfang müsste geplant werden, um mit dem Test eine
Abweichung von Null in der Höhe von 50% des Mittelwerts von Y mit einer
Sicherheit von 90% als signifikant erkennen zu können? (50)
Anspruchsvollere Übungsbeispiele:
15. Mit einem statistischen Test soll geprüft werden, ob die Alternativhypothese H1
(z.B. Messgröße überschreitet im Mittel einen vorgegebenen Grenzwert) zutrifft,
also die Nullhypothese H0 abgelehnt werden kann. Als Testniveau sei 5%
vorgegeben, d.h. für die Wahrscheinlichkeit einer irrtümlichen Entscheidung
gegen H0 soll gelten: P(Entscheidung für H1|H0) = 5%. Der Versuch wurde mit
der Power P(Entscheidung für H1|H1) = 90% geplant. Wie groß ist die posteriori
Wahrscheinlichkeit P(H1|Entscheidung für H1), wenn die a-priori
Wahrscheinlichkeit dafür, dass H1 zutrifft, gleich 5% ist? (48,6%)
16. Zur Entscheidung, ob ein neues Medikament besser sei als ein herkömmliches,
wird ein statistischer Test verwendet. Der Test erlaubt es, die bessere Wirkung
(Hypothese H1) des neuen Medikamentes mit einer Wahrscheinlichkeit von 80%
zu erkennen; ist das neue Medikament nicht besser (Hypothese H0), zeigt dies
W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc
29.11.11
37
der Test mit einer Wahrscheinlichkeit von 95% an. Es möge die Annahme gelten,
dass unter zehn neu entwickelten Medikamenten eines besser ist. Man berechne
die Wahrscheinlichkeit, dass bei Entscheidung „neues Medikament ist besser“
dies tatsächlich zutrifft. Wie groß ist diese Wahrscheinlichkeit, wenn die a prioriWahrscheinlichkeit P(H1) nur 5% beträgt? (64%, 45,7%)
17. Die folgende Tabelle enthält Produktivitätsdaten von 60 Kohorten von je 15
weiblichen Tsetsefliegen. Als Produktivitätsmaß wird die Anzahl Y der Puparien
verwendet, die in einer Kohorte bis zum 78ten Lebenstag abgelegt werden.
a) Man vergleiche den Mittelwert von Y mit dem Wert 55; liegt eine signifikante
Abweichung vor? Liegt die Standardabweichung signifikant über dem Wert
10? (jeweils 5%-Testniveau) (Mittelwert: Abw. nicht sign.,
Standardabweichung: Überschr. sign.)
b) Welcher Stichprobenumfang müsste geplant werden, um eine Abweichung
des Mittelwerts (vom Referenzwert) in der beobachteten Höhe mit 90%iger
Sicherheit erkennen zu können? (162)
c) Man stelle fest, ob die Werte der Variablen Y im Einklang mit der Annahme
„H0: Y ist normalverteilt“ stehen (α = 5%).
Nr.
1
2
3
4
5
6
7
8
9
10
Y
Nr.
72
11
81
12
55
13
55
14
50
15
53
16
70
17
79
18
42
19
69
20
Y
Nr.
54
21
57
22
69
23
62
24
73
25
58
26
46
27
50
28
27
29
68
30
Y
Nr.
67
31
59
32
49
33
51
34
65
35
56
36
58
37
67
38
66
39
74
40
Y
Nr.
51
41
69
42
64
43
68
44
73
45
81
46
54
47
65
48
58
49
61
50
Y
Nr.
59
51
65
52
60
53
43
54
52
55
57
56
37
57
39
58
49
59
51
60
Y
58
58
60
66
75
41
40
51
37
38
18. Es sei X ein normalverteiltes Merkmal; zur Festlegung der
Operationscharakteristik wird ein Lieferantenrisiko von 10% an der Gutgrenze
AQL=1% und ein Abnehmerrisiko von 10% an der Schlechtgrenze LQL = 2%
vereinbart. Man bestimme die Kennwerte n und k des entsprechenden Prüfplans
bei bekannter und unbekannter Varianz! (84, 2.19; 286, 2.19)
19. Man bestimme die Wahrscheinlichkeit für die Zurückweisung eines Prüfloses bei
der Prüfung auf fehlerhafte Einheiten, wenn die Fehlerrate 5% beträgt und mit
einer Stichprobe vom Umfang n=48 und der Annahmezahl c=0 geprüft wird.
Welche Wahrscheinlichkeit ergibt sich für n=48 und c=2? (91,5%; 43,3%)
20. Zur Untersuchung der Frage, welchen Anteil die Skelettmasse an der
Körpermasse bei Vögeln bzw. Säugetieren hat, wurden für verschiedene Vögel
und Säugetiere die Skelettmasse Y und die Körpermasse X (alle Angaben in kg)
bestimmt. Jemand behauptet, dass die Skelettmasse 5% der Körpermasse
ausmacht. Stehen die folgenden Daten in Widerspruch zu dieser Aussage? Man
nehme eine Überprüfung auf 5%igem Niveau für Vögel und Säugetiere vor.
(Vögel: ja, Säugetiere: ja)
W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc
29.11.11
38
Vögel
Y
1,995
0,072
0,0054
0,203
0,043
0,027
0,186
0,0058
0,028
0,00174
0,00182
0,00102
0,024
0,00618
0,00184
0,00297
0,00183
0,00076
0,00128
0,00049
0,00062
Säugetiere
X
40,667
1,225
0,163
2,504
0,701
0,416
2,379
0,124
0,427
0,031
0,029
0,02
0,383
0,144
0,038
0,069
0,045
0,013
0,023
0,0087
0,0126
Y
0,193
0,227
0,0003
0,039
0,027
0,244
0,002
0,015
0,02
0,0025
0,0076
1,146
0,748
0,25
0,107
0,224
0,233
0,0173
0,27
0,448
0,135
X
3,35
3,915
0,0063
0,79
0,82
4,836
0,03
0,275
0,365
0,03
0,115
22,7
11,95
3,395
2,46
4,26
4,21
0,35
4,45
6,725
1,56
4.7 REPETITORIUM: BEGRIFFE UND METHODEN
1. Sie wollen prüfen, ob der Mittelwert µ einer normalverteilten Zufallsvariablen
einen vorgegebenen Grenzwert µο überschreitet; das Signifikanzniveau sei
α. Begründen Sie, warum Sie beim einseitigen Test mit den Hypothesen
H0: µ ≤ µ0, H1: µ > µ0 einen signifikanten Ausgang erhalten können, nicht aber
beim 2-seitigen Test mit den Hypothesen H0: µ = µ0, H1: µ ≠ µ0.
Antwort:
Ein Testausgang wird als signifikant bezeichnet, wenn im Test eine Entscheidung
gegen die Nullhypothese erfolgt. Eine Überschreitung ist beim zweiseitigen Test
signifikant, wenn TGs > tn-1,1-α/2 gilt; die Wahrscheinlichkeit dafür ist durch P2 =
P(TGs > tn-1,1-α/2) gegeben. Beim 1-seitigen Test auf Überschreitung ist die
Nullhypothese abzulehnen, wenn TGs > tn-1,1-α gilt; die entsprechende
Wahrscheinlichkeit ist P1=P(TGs > tn-1,1-α). Wegen tn-1,1-α/2 > tn-1,1-α ist P2 < P1
(Hinweis: die Wahrscheinlichkeiten sind gleich den „Ausläuferflächen“ der
Verteilungsfunktion der Testgröße über den Intervallen TG > tn-1,1-α/2 bzw.
TG > tn-1,1-α).
2. Welche Vorraussetzungen sind bei Anwendung des Binomialtests zu beachten,
wenn Sie von der Normalverteilungsapproximation Gebrauch machen?
Antwort:
Hypothesen: H0: p = p0, H1: p ≠ p0
W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc
29.11.11
39
(bzw. H0: p ≤ p0, H1: p > p0 oder H0: p ≥ p0, H1: p < p0)
Voraussetzungen: n > 20 und 10 ≤ n p0 ≤ n –10
3. Was versteht man unter Testgüte (Power)?
Antwort:
Die Testgüte ist die Wahrscheinlichkeit einer Entscheidung für die Alternativhypothese (d.h. Ablehnung der Nullhypothese); diese Wahrscheinlichkeit hängt
vom Parameter ab, über den im Alternativtest eine Entscheidung herbeigeführt
werden soll. Man betrachte z.B. das Hypothesenpaar H0: µ = µ0, H1: µ ≠ µ0; für die
durch die Alternativhypothese festgelegten Parameterwerte µ ≠ µ0 ist die
Testgüte jedenfalls größer als das Signifikanzniveau α. Die Tests werden i. Allg.
so ausgelegt, dass die Testgüte für Parameterwerte, die um eine relevante
Abweichung ∆ vom Referenzwert µ0 abweichen, also für Parameterwerte
außerhalb des Intervalls (µ0- ∆, µ0 +∆), möglichst groß (jedenfalls größer als
80%) ist.
4. Jemand wendet den Binomialtest an, um eine Entscheidung zwischen den
Hypothesen H0: p ≥ p0 und H1: p < p0 herbeizuführen. Als Signifikanzniveau wird
5% festgelegt. Ist die Wahrscheinlichkeit eines nicht-signifikanten Ausgangs mit
diesem Signifikanzniveau größer als bei einem Test auf 1%igen Niveau?
Antwort:
Der Ausgang ist nicht-siginfikant, wenn die Nullhypothese nicht abgelehnt werden
kann. Beim 1-seitigen Binomialtest auf Unterschreitung eines Referenzwertes ist
dies der Fall, wenn TGs ≥ zα gilt. Wegen z0,05 = - 1,64 > z0,01 = -2,33 ist die
Frage zu verneinen, weil der „Ablehnungsbereich“ bei kleinerem
Signifikanzniveau kleiner ist.
5. Sie wollen für einen Spielwürfel überprüfen, ob die diskrete Zufallsvariable
„Anzahl von geraden Zahlen beim 10maligen Ausspielen eines Würfels“ einer
Binomialverteilung folgt. Wie gehen Sie dabei vor?
Antwort:
Wir gehen von einem „fairen“ Würfel aus, d.h. einem Würfel, bei dem jeder
Ausgang (Augenzahl 1, 2, 3, 5, 5 oder 6) mit der gleicher Wahrscheinlichkeit 1/6
eintritt. Dann ist die Wahrscheinlichkeit, beim einmaligen Ausspielen des Würfels
eine gerade Augenzahl zu erhalten, gleich p=1/2. Die Zufallsvariable X = „Anzahl
der Ausgänge mit gerader Augenzahl beim 10-maligen Ausspielen des Würfels,
Bn,p-verteilt mit den Parametern p=1/2 und n=10. Die möglichen Werte von X sind
x=0, 1, ...., 10; diese treten mit den Wahrscheinlichkeiten Bn,p(0), Bn,p(1), ...,
Bn,p(10) auf.
Ob dieses Verteilungsmodell zutrifft, kann im Rahmen eines Anpassungstests
überprüft werden. Die Nullhypothese lautet: H0: „X ist Bn,p-verteilt“ , die
Alternativhypothese H1: „X ist nicht Bn,p-verteilt“. Die erforderlichen beobachteten
Häufigkeiten O von X=x werden durch N-maliges Wiederholen der Versuchsreihe
„10-maliges Ausspielen des Würfels“ gewonnen, z.B. mit N=100. Die erwarteten
Häufigkeiten E von X=x sind durch NBn,p(0), NBn,p(1), ..., NBn,p(10) gegeben. Um
„schwach besetzte“ Häufigkeitsklassen zu vermeiden (sie den entsprechenden
Hinweis in der Formelsammlung), werden die Häufigkeitsklassen zu z.B. 5
W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc
29.11.11
40
Klassen aggregiert. Damit wird die GF-Statistik gebildet; liegt diese über dem
2
95%-Quantil der χ 4 -Verteilung, wird H0 auf 5%igem Testniveau abgelehnt,
andernfalls beibehalten.
W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc
29.11.11
Herunterladen