1 4 EINFÜHRUNG IN DAS TESTEN VON UNTERSCHIEDSHYPOTHESEN I: 1-STICHPROBENVERGLEICHE Inhalt: 4.1 Prinzip des Alternativtests und Binomialtest 4.2 1-Stichproben t-Test 4.3 Chiquadrat-Anpassungstest und Shapiro-Wilk Test 4.4 Elemente der Qualitätssicherung 4.5 Anhang: Überblick über 1-Stichprobenvergleiche 4.6 Übungsbeispiele 4.7 Repetitorium: Begriffe und Methoden Lernziele: - Die Entscheidungsalternativen und das Prinzip der Entscheidungsfindung bei Alternativtests kennen; - signifikante und nichtsignifikante Ergebnisse interpretieren können; - eine signifikante Abweichung einer Wahrscheinlichkeit von einem vorgegebenen Wert feststellen können; - eine signifikante Abweichung eines Mittelwerts von einem vorgegebenen Wert feststellen können; - Anteile auf eine signifikante Abweichung von einem vorgegebenen Verhältnis prüfen können; - die Vereinbarkeit von Häufigkeitsverteilungen mit diskreten Wahrscheinlichkeitsverteilungen prüfen können; - Normalitätsprüfung mit dem χ2-Test durchführen können; - Annahmewahrscheinlichkeiten bei Prüfung auf fehlerhafte Einheiten berechnen und Prüfanweisungen bestimmen können; - Die Kennwerte von Prüfplänen für quantitative Merkmale berechnen können; - Qualitätsregelkarten zur Überwachung des Mittelwerts und der Standardabweichung eines stetigen Merkmals erstellen und interpretieren können; - Operationscharakteristiken zu Prüfplänen bestimmen können. W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc 29.11.11 2 4.1 PRINZIP DES ALTERNATIVTESTS UND BINOMIALTEST Wie prüft man, ob eine Wahrscheinlichkeit von einem vorgegebenen Wert abweicht? Problemstellung: Von der Wahrscheinlichkeit p eines Ereignisses liegt eine Vermutung H1 (Alternativhypothese) vor, z.B. in der Form H1: p ≠ p0; die Menge der p, für die H1 nicht zutrifft, bildet die Nullhypothese H0: p = p0; mit einem Test soll eine Entscheidung zwischen H0 und H1 herbeigeführt werden. Beispiel 4.1: In einer Laborzucht von Tsetsefliegen (Glossina p. palpalis) werden 2354 Puparien beobachtet, aus denen 1241 Weibchen schlüpfen. Ein Schätzwert für die Wahrscheinlichkeit p, dass ein weibliches Insekt schlüpft, ist der Anteil y=1241/2354 = 0,527. Weicht der Anteil der weiblichen Insekten „signifikant“ von 0,5 ab? Schema der Problemlösung: • Statistisches Modell: Entstehung der 2354 Insekten wird durch ein Bernoulli-Experiment mit n = 2354 Wiederholungen simuliert; jede Wiederholung liefert mit der Wahrscheinlichkeit p das Ereignis E (weibliches Insekt). Es sei Y die relative Häufigkeit von E bei n Wiederholungen. Die Anzahl nY der Wiederholungen mit dem Ausgang E ist Bn,p –verteilt. Für n > 20 und 10 ≤ np ≤ n -10 gilt die Approximation: Bn,p ≅ N(np, np(1-p)). • Formulierung der Entscheidungsalternativen: H0 : p = 1/2 (Geschlechterverhältnis ist 1:1, die beobachtete Abweichung in der Stichprobe ist zufälliger Natur) H1: p ≠ 1/2 (es liegt eine Abweichung vom Geschlechterverhältnis 1:1 vor) Fall I: 2-seitiger Test auf Abweichung Wahrer Sachverhalt H0 ist richtig (p = p0=1/2) Entscheidung für H0 (gegen H1) richtige Entscheidung! H1 ist richtig (p ≠ p0=1/2) richtige Entscheidung! Fehler! (2. Art, β-Fehler) Forderung: P(E gegen H1| |p-p0|>∆) ≤β ! W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc Entscheidung für H1 (gegen H0) Fehler! (1. Art, α-Fehler) Forderung: P(E für H1|p=p0) ≤ α ! 29.11.11 3 Entscheidungsfindung bei 2-seitigen Hypothesen (auf Testniveau α): Testgröße: p = p0 =1/ 2 →TG(Y) = Y − p0 ∝ N(0,1) p0 (1− p0 ) / n Zufallsstichprobe Realisation y von Y: y = TG(y)= 1241/2354 = 0,527 Einsetzen in die Testgröße ergibt TGs = 2,64. Man beachte, dass Testgrößenwerte um die Null zu erwarten sind, wenn H0 gilt; „größere“ Abweichungen von Null sprechen für die Alternativhypothese. Entscheidungsregel: H0 ablehnen, wenn |TGs| > z1-α/2. Wegen |TGs|=|2,64| > z1-α/2=1.96 (α=5%) wird im Beispiel H0 abgelehnt. Die Entscheidungsregel ist in der folgenden Grafik veranschaulicht. Dichte 0.2 - |TGs| |TGs| α/2 α/2 TG -1 H0 ablehnen 0 zα/2 1 H0 ablehnen z1−α/2 Bei „extremen“ Abweichungen des Testgrößenwerts von Null (also Abweichungen, die betragsmäßig größer als z1-α/2 sind), wird für H1 entschieden. Entscheidet man so, ist sicher gestellt, dass die Wahrscheinlichkeit einer irrtümlichen Ablehnung von H0 stets kleiner als das Testniveau α bleibt. Denn die Wahrscheinlichkeit P, dass bei Gültigkeit von H0 die Testgröße TG einen Wert annimmt, der mehr von Null abweicht als der beobachtete Testgrößenwert, ist gleich den „Ausläuferflächen“ unter der N(0,1)-Dichtekurve links und rechts von -|TGs| = - 2,64 bzw. |TGs|=2,64. Diese Ausläuferflächen sind aber in Summe kleiner als α, solange |TG| > z1-α/2 bleibt. Man kann die Testentscheidung daher auch so formulieren: W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc 29.11.11 4 P<α H0 ablehnen, d.h. Entscheidung für H1. Im konkreten Fall wird der P-Wert wie folgt berechnet: P-Wert = P(TG < -2,64 oder TG > 2,64) = P(TG < -2,64) + P(TG > 2,64) = Φ(-2,64) + 1- Φ(2,64) = 0,0083 = 0,83%. Der P-Wert ist kleiner als 5%, daher ist H0 abzulehnen! Die Wahrscheinlichkeit P wird in diesem Zusammenhang P-Wert (pvalue) genannt. Einschlägige Computerprogramme geben in der Regel für die Testentscheidung den P-Wert an. Ergänzung 1: Test auf Überschreitung Würde in Beispiel 4.1 die Frage lauten, ob der Anteil y=1241/2354 = 0,527 der weiblichen Insekten den Wert 0,5 „signifikant“ überschreitet, hat man es mit einem „1-seitigen Test auf Überschreitung“ mit den Hypothesen H0 : p ≤ p0 versus H1 : p > p0 zu tun. Zur Testentscheidung wird wieder der Wert TGs =TG(y) =2,64 der Testgröße berechnet. Man beachte, dass nunmehr „große“ Werte von TGs eine Entscheidung für H1 nahe legen. Es gilt nunmehr die Entscheidungsregel: H0 ablehnen, wenn TGs > z1-α ist. Wieder ist mit dieser Entscheidungsregel (siehe auch die nachfolgende Abbildung) sicher gestellt, dass das Risiko für eine irrtümliche Ablehnung von H0 kleiner als α bleibt. Dichte 0.2 TGs -3 -2 -1 0 α TG 1 H0 ablehnen z1−α Die Wahrscheinlichkeit P = P(TG >TGs) ist bei Gültigkeit von H0 gleich der „Ausläuferfläche“ unter der N(0,1)-Dichtekurve rechts von TGs = 2,64. Diese Ausläuferfläche ist kleiner als α, solange TG > z1-α bleibt. Man kann die Testentscheidung daher auch so formulieren: H0 ablehnen. P<α W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc 29.11.11 5 Im konkreten Fall ist mit α=5% das Quantil z1-α = z0,95 = 1,64; wegen TGs = 2,64 > 1,64 folgt, dass H0 abzulehnen ist. Zur selben Entscheidung kommt man mit dem P-Wert, der in diesem Fall als P = P(TG >TGs) = 1-P(TG ≤ TGs) = 1- Φ(2,64) = 0,00415 = 0,415% berechnet wird. Wegen P<5% ist H0 abzulehnen! Ergänzung 2: Test auf Unterschreitung Der Vollständigkeit sei erwähnt, dass mit 1-seitigen Hypothesen nicht nur auf „Überschreitung“ eines Referenzwertes geprüft werden kann, sondern auch auf „Unterschreitung“. Die Hypothesen lauten in diesem Fall: H0 : p ≥ p0 versus H1 : p < p0 . Obwohl in Beispiel 4.1 die Fragestellung, ob der Anteil y=1241/2354 = 0,527 der weiblichen Insekten den Wert 0,5 „signifikant“ unterschreitet, keinen Sinn macht, wollen wir an Hand dieses Beispiels den Test auf Unterschreitung formal durchführen. Wir berechnen wieder den Wert TGs =TG(y )= 2,64 der Testgröße. Nunmehr sind es „kleine“ Werte von TGs, die eine Entscheidung für H1 nahe legen. Die Entscheidungsregel lautet: H0 ablehnen, wenn TGs < zα gilt. Mit dieser Entscheidungsregel ist sicher gestellt, dass das Risiko für eine irrtümliche Ablehnung von H0 kleiner als α bleibt. Der P-Wert ist jetzt die Wahrscheinlichkeit P =P(TG<TGs), die gleich den „Ausläuferfläche“ unter der N(0,1)-Dichtekurve links von TGs = 2,64 ist. Diese Ausläuferfläche ist kleiner als α, solange TG < zα bleibt. Mit Hilfe des PH0 ablehnen“ Werts kann die Testentscheidung in der Form „P < α formuliert werden. Im konkreten Fall ist mit α=5% das Quantil zα = z0,05 = -1,64 und der P-Wert P=P(TG < TGs) = Φ(2,64) = 0,996 = 99,6%. Wegen TGs = 2,64 > -1,64 (bzw. P = 99,6% > 5%) kann H0 nicht abgelehnt werden! Ergänzung 3: Gütefunktion Bei der Darstellung Entscheidungsalternativen wurden folgende Fehlerrisken unterschieden: a) Fehler 1. Art (α-Fehler) = irrtümliche Ablehnung von H0 (Testentscheidung so, dass P(Fehler 1. Art) < α b) Fehler 2. Art (β-Fehler) = irrtümliche Nichtablehung von H0 (u.a. von p abhängig) Beide Fehlerrisken werden in der sog. Gütefunktion (power) G zusammengefasst: G(p) = P(Ablehnung von H0 | p) = Wahrscheinlichkeit, auf Grund einer Zufallsstichprobe gegen H0 zu entscheiden W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc 29.11.11 6 Es gilt: G(p) ≤ α, wenn H0 zutrifft; wenn H1 zutrifft ist die Güte umso besser, je näher G(p) bei 1 liegt (d.h. je kleiner das β-Risiko β(p) = 1-G(p) ist). Beispiel 4.2a: Wir betrachten den Binomialtest auf Überschreitung des Referenzwertes p0 = 0.5, d.h. wir prüfen H0: p ≤ 0.5 versus H1: p > 0.5. Die Werte der Gütefunktion G können, wenn die Verteilung der Testgröße TG durch die Standardnormalverteilung approximiert wird, wie folgt berechnet werden: G ( p ) = P(Ablehnung von H 0 | p ) = P(TG (Y ) > z1−α | p ) = Y − p0 P > z1−α | p = P Y > p0 + z1−α p (1 − p ) / n 0 0 ( ) p0 (1 − p0 ) / n | p = − ( p − p0 ) + z1−α p0 (1 − p0 ) / n Y−p P > | p(1 − p ) / n p ( 1 − p ) / n p = − ( p − p0 ) + z1−α p0 (1 − p0 ) / n 1 − Φ p ( 1 − p ) / n Speziell erhält man damit für p0 = 0.5, α = 0.05, n=2354 und p=y= 1241/2354 = 0.527 den Wert G(0.527) = 83.56%, d.h. wir haben eine Sicherheit (Power) von mehr als 83%, die beobachtete Überschreitung des Referenzwertes mit dem Binomialtest auf 5%igem Testniveau als signifikant zu erkennen. Die folgende Grafik wurde mit enthält den Verlauf der Gütefunktion des eben besprochenen Binomialtests auf Überschreitung für die Stichprobenumfänge n =50, 100 und 1000. 1.0 Gütefunktionen des Binomialtests mit H1: p>0.5 Testniveau=5%, Stichprobenumfang n= 50, 100 bzw. 1000 n=100 n=50 0.6 0.4 0.2 G(p)=P(Ablehnung von H0|p) 0.8 n=1000 0.0 (0.5, 0.05) W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc 29.11.11 7 Es ist deutlich zu erkennen, dass die Power für jedes p>0.5 mit wachsendem n zunimmt. Ergänzung 4: Mindeststichprobenumfang Die Fehlerrisken α und β, die kritische Abweichung ∆ =|p - p0| und der Stichprobenumfang n sind voneinander abhängig. Dies ermöglicht es, bei vorgegebenen Werten von α, ß und ∆ den Stichprobenumfang zu bestimmen. Planung des Stichprobenumfangs: Notwendiger Stichprobenumfang n, um auf Niveau α mit der Sicherheit 1-ß eine Entscheidung für H1 herbeizuführen, wenn p von p0 um ∆ ≠ 0 im Sinne der Alternativhypothese abweicht: 1 2 n ≈ 2 (z1−α / 2 + z1−β ) (Fall I), 4∆ 1 2 n ≈ 2 (z1−α + z1−β ) (Fälle IIa, b) 4∆ Beispiel 4.2b: Von der Gültigkeit der Formel für den Fall IIa kann man sich im Anschluss an die in Beispiel 2.4a hergeleitete Gütefunktion G für den (approximativen) Binomialtest mit den Hypothesen H0: p ≤ p0 versus H1: p > p0 wie folgt überzeugen. Wir denken uns α, 1-ß und ∆=p-p0>0 vorgegeben und haben n so zu bestimmen, dass G(p)=G(p0+∆) = 1-ß ist. Dies ergibt: − ∆ + z1−α p0 (1 − p0 ) / n = 1− β ⇔ G ( p0 + ∆ ) = 1 − Φ ( p + ∆)(1 − p − ∆) / n 0 0 − ∆ + z1−α p0 (1 − p0 ) / n − ∆ + z1−α p0 (1 − p0 ) / n =β ⇔ Φ = − z1− β ⇔ ( p + ∆)(1 − p − ∆) / n ( p + ∆ )( 1 − p − ∆ ) / n 0 0 0 0 ( n∆2 = z1−α p0 (1 − p0 ) + z1− β ( p0 + ∆)(1 − p0 − ∆ ) ) 2 Mit den (groben) Abschätzungen p0 (1 − p0 ) ≤ 1 / 4 und ( p0 + ∆ )(1 − p0 − ∆ ) ≤ 1 / 4 ergibt sich schließlich die oben angeführte Näherungsformel für den Fall IIa. Beispiel 4.3: Mit einer neuen Behandlungsmethode will man eine Erfolgsrate p (Wahrscheinlichkeit, dass bei einer mit der neuen Methode behandelten Person eine W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc 29.11.11 8 Verbesserung eintritt) von mehr als p0=0,7 erreichen. In einer Studie mit 100 Probanden ist die neue Methode bei 75 Personen erfolgreich. a) Man zeige, dass dieses Ergebnis keine (auf dem 5%-Niveau) signifikante Überschreitung der angestrebten Erfolgswahrscheinlich-keit p0=0,7 anzeigt. b) Welcher Stichprobenumfang n muss geplant werden, um auf 5%igem Signifikanzniveau eine Überschreitung des Sollwertes p0=0,7 um die (beobachtete) Abweichung ∆=0,05 mit einer Sicherheit von 80% erkennen zu können? Lösung: a) H0: p≤po vs. H1: p>po, α=5%; TGs=(0,75-0,7)/√[0,7(1-0,7)/100]=1,09 ≤ z0,95 = (Tabelle)= 1,65 kann nicht abgelehnt werden, d.h. Überschreitung ∆=0,05 ist nichtsignifikant. H0 Lösung mit R (R-Console): > prop.test(75, 100, p=0.7, alternative="greater") 1-sample proportions test with continuity correction data: 75 out of 100, null probability 0.7 X-squared = 0.9643, df = 1, p-value = 0.1631 alternative hypothesis: true p is greater than 0.7 95 percent confidence interval: 0.66751 1.00000 sample estimates: p 0.75 Wegen p-value=0.1631>=0.05 kann H0 nicht abgelehnt werden! b) ∆=0,05; z1-α= z0,95 =1,65; 1-ß=0,8; z1-ß = z0,8 =(Tabelle)=0,84; 2 2 n≈(Fälle IIa,b)≈ [1/(4⋅0,05 )](1,65+0,84) = 620. Lösung mit R (R-Console): > delta <- 0.05 > alpha <- 0.05 > power <- 0.8 > n <- 1/4/delta^2*(qnorm(1-alpha)+qnorm(power))^2 >n [1] 618.2557 Was bedeutet ein nicht-signifikantes Ergebnis? W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc 29.11.11 9 4.2 EINSTICHPROBEN t - TEST Wie prüft man, ob der Mittelwert einer normalverteilten Zufallsvariablen von einem vorgegebenen Sollwert abweicht? Ablaufschema: • Daten: Mittelwert, Varianz s2. Beobachtungswerte x1, x2, ... , xn • Modell: xi ist Realisation von Xi ∝ N(µ, σ2), (i =1,2, ... ,n). • Hypothesen: Fall I: Fall IIa: Fall IIb: H0 : µ = µ0 vs. H1 : µ ≠ µ0 H0 : µ ≤ µ0 vs. H1 : µ > µ0 H0 : µ ≥ µ0 vs. H1 : µ < µ0 • Testgröße: TG = X − µ0 S/ n ≅ t n−1 unter µ = µ0 • Entscheidung mit Quantilen: H0 auf Testniveau α ablehnen, wenn |TGs| > tn-1,1-α/2 (Fall I), TGs > tn-1,1-α (Fall IIa) bzw. TGs < tn-1,α (Fall IIb) • Entscheidung mit P-Wert: H0 auf Signifikanzniveau α ablehnen, wenn P < α wobei P=P(TG ≤ -|TGs| oder TG ≥ |TGs|) (Fall I) bzw. P=P(TG ≥ |TGs|) (Fall IIa) bzw. P=P(TG ≤ -|TGs|) (Fall IIb). • Planung des Stichprobenumfanges: Um auf dem Niveau α mit der Sicherheit 1-β eine Entscheidung für H1 herbeizuführen, wenn µ von µ0 um ∆ ≠ 0 im Sinne der Alternativhypothese abweicht, ist das dafür notwendige n näherungsweise (etwa ab n=20) n≈ n≈ σ2 ∆ 2 σ2 ∆2 (z (z 1−α + z1− β ) 2 1−α / 2 + z1− β ) 2 (Fall I) (Fall IIa, b) W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc 29.11.11 10 • Gütefunktion: Gütefunktion des t-Tests H0 : µ = µ0 versus H1: µ ≠ µ0 für n =6 und n = 20 (horizontal ist die Effektgröße δ =(µ - µ0)/σ aufgetragen) 1,0 n=20 0,9 0,8 n=6 Power 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0,0 -2,0 -1,0 0,0 1,0 2,0 Effektgröße Beispiel 4.4: Die Wirkung eines Präparates auf den systolischen Blutdruck wurde durch Blutdruckmessungen an 6 Probanden vor und nach Gabe des Präparates ermittelt. Es ergaben sich die folgenden Werte für die Blutdruckänderung X (Differenz aus Endwert minus Anfangswert): -12, -5, -15, 10, -10, 5. a) Man zeige, dass die mittlere Blutdruckänderung (auf dem 5%-Niveau) keine signifikante Abweichung von null anzeigt. b) Welcher Stichprobenumfang muss geplant werden, um auf 5%igem Signifikanzniveau eine Abweichung vom Sollwert 0 in der Höhe der beobachteten Abweichung von null mit einer Sicherheit von mindestens 90% erkennen zu können? Lösung: a) µ = mittlere Blutdruckänderung, H0: µ=0 vs. H1: µ≠0, α=5%; Stichprobe: n=6; x =-4,5; s=9,975; Testgröße TGs=-4,5⋅√(6)/9,975=-1,105; Testentscheidung: |TGs|=1,105<t5,0,975=(Tabelle)= 2,571 H0 nicht ablehnen, d.h. mittlere Blutdruckänderung weicht nichtsignifikant von null ab. Lösung mit R (R-Console): > x <- c(-12, -5, -15, 10, -10, 5) > t.test(x, mu=0, alternative="two.sided") One Sample t-test data: x t = -1.105, df = 5, p-value = 0.3195 alternative hypothesis: true mean is not equal to 0 95 percent confidence interval: -14.968088 5.968088 sample estimates: mean of x W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc 29.11.11 11 -4.5 b) ∆=4,5; z1-α/2= z0,975 =1,96; 1-ß=0,9; z1-ß = z0,9 =(Tabelle)=1,28; σ2≈s2=99,5; 2 2 n≈(Fall I)≈ [99,5/4,5 ](1,96+1,28) = 51,6 n=52. Lösung mit R (R-Console): > x <- c(-12, -5, -15, 10, -10, 5) > delta <- abs(mean(x)-0) > alpha=0.05 > power <- 0.9 > n <- (sd(x)/delta)^2*(qnorm(1-alpha/2)+qnorm(power))^2 >n [1] 51.62907 4.3 χ2 – ANPASSUNGSTEST UND SHAPIRO-WILK TEST Wie prüft man, ob die beobachteten Häufigkeiten einer mehrstufig skalierten Zufallsvariablen von einem vorgegebenen Verhältnis abweichen? Ablaufschema: • Daten: Es liegen n Beobachtungen einer k-stufig skalierten Variablen vor, zur Stufe (Klasse) ai gehören oi Beobachtungen. • Modell: pi = Wahrscheinlichkeit, dass ein Beobachtungsergebnis zur Klasse ai gehört; Ei = npi = zu erwartende Häufigkeit von Beobachtungswerten in der Klasse ai, Oi = beobachtete Häufigkeit von Variablenwerten in der Klasse ai. • Hypothesen und Testgröße: H0: pi = p0i (i=1,2, ..., k) vs. H1: pi ≠ p0i für wenigstens ein i Testgröße (Chiquadratsumme, Goodness-of-fit-Statistik): k TG= GF = ∑ i =1 (Oi − Ei )2 Ei ≅ χ k2−1 unter H 0 Hinweis: Die Testgröße ist unter H0 asymptotisch χ 2 − verteilt mit k-1 Freiheitsgraden; die Approximation ist ausreichend genau, wenn nicht mehr als 20% der erwarteten Häufigkeiten kleiner als 5 sind und keine kleiner als 1 ist. • Entscheidung mit Quantilen: H0 auf Testniveau α ablehnen, wenn TGs > χ2k-1,1-α W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc 29.11.11 12 • Entscheidung mit P-Wert: H0 auf Signifikanzniveau α ablehnen, wenn P < α P=P(TG ≥ |TGs|). wobei Beispiel 4.5: Bei einem seiner Kreuzungsversuche mit Erbsen erhielt Mendel 315 runde gelbe Samen, 108 runde grüne, 101 kantige gelbe und 32 kantige grüne. Sprechen die Beobachtungswerte gegen das theoretische Aufspaltungsverhältnis 9 : 3 : 3 : 1 der Phänotypen? (α=5%) Lösung: H0: p1=9/16 (rund/gelb), p2=3/16 (rund/grün), p3=3/16 (kantig/gelb), p4=1/16 (kantig/grün); α=5%; Stichprobe: n=556; O1=315, O2=108, O3=101, O4=32; E1=556⋅9/16=312,75; E2= E3=104,25; E4=34,75; 2 2 2 GF=(315-312,75) /312,75+(108-104,25) /104,25+(101-104,25) /104,25+(322 2 34,75) /34,75=0,47≤χ 3,0,95=(Tabelle)=7,815 H0 kann nicht abgelehnt werden. Lösung mit R (R-Console): > options(digits=4) > klassen <- c("rund/gelb", "rund/grün", "kantig/gelb", "kantig/grün") > observed <- c(315, 108, 101, 32) > prob <- c(9, 3, 3, 1)/16 > tabelle <- data.frame(klassen, observed, prob) > tabelle klassen observed prob 1 rund/gelb 315 0.5625 2 rund/grün 108 0.1875 3 kantig/gelb 101 0.1875 4 kantig/grün 32 0.0625 ># > # Prüfung auf Abweichung von einem vorgegebenen Verhältnis > # H0: Wahrscheinlichkeiten verhalten sich gemäß dem theoretischen Augfspaltungsverhältnis > # H1: dies ist nicht der Fall > chisq.test(observed, p=prob) Chi-squared test for given probabilities data: observed X-squared = 0.47, df = 3, p-value = 0.9254 Wegen p-value = 92,54% >= 5% kann H0 (beobachtete Anzahlen entsprechen dem Aufspaltungsverhältnis 9:3:3:1) auf dem 5%-Niveau nicht abgelehnt werden. Wie prüft man, ob eine mehrstufig skalierte Zufallsvariable von einer vorgegebenen Verteilung mit unbekannten Parametern abweicht? Ablaufschema: Wie im vorangehenden Fall mit der Ergänzung, dass zu Bestimmung der erwarteten Häufigkeiten die/der Verteilungsparameter zu schätzen sind und sich für jeden geschätzten Parameter sich die Anzahl der Freiheitsgrade der χ 2 − Verteilung um 1 vermindert. Die Nullhypothese lautet: Die Zufallsvariable folgt der vorgegebenen Verteilung. W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc 29.11.11 13 Beispiel 4.6: Rutherford und Geiger studierten die Emission von α-Teilchen, indem sie die Anzahl X der in Zeitintervallen der Länge 7,5s emittierten α-Teilchen zählten. Die Auswertung von 2608 Zeitintervallen ergab die in der folgenden Tabelle zusammengefassten beobachteten Häufigkeiten Oj. Man zeige, dass die Häufigkeitsverteilung von X nicht signifikant von einer Poissonverteilung abweicht (α = 5%). Lösung: n= 2608 (Gesamtstichprobenumfang), λ̂ = 3,8673 (Schätzung als Mittelwert der Bebachtungswerte von X). Damit ergeben sich die der Tabelle beigefügten erwarteten Häufigkeiten Ej = nPλˆ ( x) . Fasst man den zuletzt angegebenen Wertebereich X>10 mit X=10 zusammen (die entsprechende beobachtete und erwartete Häufigkeit ergibt sich durch Addition), hat man k=11 Klassen. Als 2 2 Chiquadratsumme GF= 12,9135; wegen GF< χ k-1-1,1-α = χ 9,0.95 = 16,92 stehen die Beobachtungsdaten nicht in Widerspruch zur Annahme H0: X ist poissonverteilt. Klasse 1 2 3 4 5 6 7 8 9 10 11 X 0 1 2 3 4 5 6 7 8 9 10 >10 O 57 203 383 525 532 408 273 139 45 27 16 0 2608 E 54,54 210,94 407,89 525,81 508,37 393,21 253,44 140,02 67,69 29,09 11,25 5,75 2608,00 2 (O-E) /E 0,1106 0,2988 1,5184 0,0013 1,0982 0,5564 1,5089 0,0075 7,6052 0,1496 0,0585 12,9135 Lösung mit R (R-Console): > options(digits=4) > # Daten > x <- seq(from=0, to=10, by=1) > observed <- c(57, 203, 383, 525, 532, 408, 273, 139, 45, 27, 16) > n <- sum(observed) > # Schätzung von lambda (Mittelwert) > lambda <- x %*% observed/n # %*% ist Operator für das Skalarprodukt zweier Vektoren > lambda [,1] [1,] 3.867 > # Berechnung der unter "H0: X ist Poisson-verteilt" erwarteten Häufigkeiten > p_poisson <- dpois(x, lambda) > p_poisson[11] <- p_poisson[11] + 1-sum(p_poisson) > expected <- p_poisson * n > tabelle <- data.frame(x, observed, p_poisson, expected) > tabelle x observed p_poisson expected 1 0 57 0.020914 54.54 2 1 203 0.080882 210.94 3 2 383 0.156398 407.89 4 3 525 0.201615 525.81 5 4 532 0.194928 508.37 W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc 29.11.11 14 6 5 408 0.150770 393.21 7 6 273 0.097180 253.44 8 7 139 0.053689 140.02 9 8 45 0.025954 67.69 10 9 27 0.011153 29.09 11 10 16 0.006517 17.00 ># > # Chiquadrat-Test auf Abweichung von der Poissonverteilung > # H0: X ist Poisson-verteilt vs. H1: dies gilt nicht > chi2sum <- sum((observed-expected)^2/expected) > chi2sum [1] 12.91 > p_value <- 1- pchisq(chi2sum, 9) > # pchisq(q,df) = Wahrscheinlichkeit, dass eine mit df FG chiquadratverteilte ZV den Wert q unterschreitet. > p_value [1] 0.1666 wegen p_value = 16,66% >= 5% kann H0 (Beobachtungsdaten nicht in Widerspruch zur Poissonverteilung) nicht abgelehnt werden. Wie prüft man, ob eine stetige Zufallsvariable von einer Normalverteilung abweicht? Chiquadrat-Anpassungstest Grundsätzlich kann die Prüfung, ob die Variation einer Messgröße von der Normalverteilung abweicht, wie die Prüfung auf ein vorgegebenes Verhältnis mit der Ergänzung durchgeführt werden, dass zuerst der Mittelwert und die Standardabweichung der Normalverteilung – aus den Messdaten - zu schätzen sind, eine Klasseneinteilung der Merkmalsachse vorzunehmen ist und die erwarteten Häufigkeiten als Klassenhäufigkeiten zu bestimmen sind. Die Anzahl der Freiheitsgrade der χ 2 − Verteilung ist k–3, wobei k wieder die Anzahl der Klassen bezeichnet. Die Nullhypothese lautet: Die Zufallsvariable ist normalverteilt. Die Nullhypothese wird auf dem Testniveau α abgelehnt, wenn die mit den beobachteten und erwarteten Klassenhäufigkeiten gebildete Chiquadratsumme GF größer als das (1-α)-Quantil der χ 2 Verteilung mit k-3 Freiheitsgraden ist. Die Anwendung des ChiquadratAnpassungstests zur Überprüfung der Normalverteilungsannahme setzt entsprechend große Stichproben (n≥60, k≥7) voraus. Shapiro-Wilk Test Hat man eine entsprechende Statistik-Software zur Verfügung, wird an Stelle des Chiquadrat-Anpassungstests ein auch bei kleinen Stichproben anwendbarer exakter Test empfohlen, z.B. der im Basis-Package von R vorgesehene Shapiro-Wilk Test. Die Nullhypothese (die Stichprobenwerte stammen aus einer normalverteilten Grundgesamtheit) wird beibehalten, wenn der P-Wert gleich oder größer als das angenommene Testniveau α bleibt. W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc 29.11.11 15 Beispiel 4.7: Man prüfe auf 5%igem Signifikanzniveau, ob die durch die Stichprobenwerte 27, 25, 23, 27, 23, 25, 25, 22, 25, 23, 26, 23, 24, 26, 26 gegebene Variation von X (Spaltöffnungslänge in mm) bei diploiden Biscutella laevigata mit dem Modell einer Normalverteilung vereinbar ist. Lösung mit R (R-Console): > x <- c(27, 25, 23, 27, 23, 25, 25, 22, 25, 23, 26, 23, 24, 26, 26) > # Hypothesen: H0: X ist normalverteil vs. H1: X ist nicht normalverteilt > shapiro.test(x) Shapiro-Wilk normality test data: x W = 0.9207, p-value = 0.1977 Wegen p_value = 19,77% >= 5% kann H0 (Stichprobenwerte nicht in Widerspruch zur Normalverteilungsannahme) nicht abgelehnt werden. 4.4 ELEMENTE DER QUALITÄTSSICHERUNG 4.4.1 STATISTISCHE PROZESSREGELUNG In der statistischen Prozesslenkung (SPC Statistical Process Controll) erfolgt eine laufende Überwachung eines Fertigungsprozesses hinsichtlich eines Qualitätsmerkmals X. Zu diesem Zweck werden regelmäßig Stichproben aus dem Prozesses entnommen und mit Hilfe von Kennzahlen beurteilt, ob eine „Störung“ des Prozess vorliegt. Zur Dokumentation des Prozessverlaufs werden sogenannte Qualitätsregelkarten verwendet. Wir betrachten den Einsatz von Qualitätsregelkarten zur Klärung der Frage, ob ein Prozess „beherrscht“ ist. Für einen beherrschten Prozess bleibt die Verteilung des Qualitätsmerkmals X im Laufe des Prozesses unverändert. Wenn X – wie wir annehmen wollen - normalverteilt ist, bedeutet dies, dass die Werte von X mit einer festen Fehlervarianz σ2 zufällig um einen festen Mittelwert (dem Fertigungsmittelwert) µ streuen. Große oder systematische in eine Richtung gehende Abweichungen vom Mittelwert deuten eine (unerwünschte) Änderung des Mittelwertes und/oder der Standardabweichung an, die z.B. durch Störungen in der Fertigungsanlage bedingt sein können. Zur Überwachung des Mittelwerts µ findet die x -Karte, zur Überwachung der Standardabweichung σ die s-Karte Anwendung. Mit diesen Karten wird grundsätzlich nach folgendem Schema gearbeitet: W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc 29.11.11 16 • Man entnimmt zum Zeitpunkt t1 eine Zufallstichprobe vom Umfang n (z.B. n=5) und bestimmt damit den Stichprobenmittelwert x1 bzw. die Standardabweichung s1. • Liegt der Stichprobenmittelwert x1 (die Standardabweichung s1 ) außerhalb des mit der unteren und oberen Eingriffsgrenze gebildeten Intervalls [UEG, OEG], wird der Prozessverlauf als gestört angesehen und eingegriffen. • Liegt der Stichprobenmittelwert x1 (die Standardabweichung s1 ) im Intervall [UEG, OEG], wird der Prozessverlauf als ungestört interpretiert und die Überwachung mit der Entnahme einer neuerlichen Stichprobe zum Zeitpunkt t2 fortgesetzt. Zusätzlich zur unteren und oberen Eingriffsgrenze enthalten die x - und s-Karte auch noch eine untere und eine obere Warngrenze (UWG, OWG). Ein x - oder s- Wert außerhalb der Warngrenzen (aber noch innerhalb der Eingriffsgrenzen) ist im Allgemeinen Anlass zu erhöhter Aufmerksamkeit, die sich z.B. in einer Verkürzung der Zeitpunkte zwischen den Stichprobenentnahmen ausdrückt. Die Eingriffsgrenzen der Mittelwertkarte ( x -Karte) werden aus der Forderung P( X < UEG) = P( X > OEG) = 0,5% bestimmt; daraus ergibt sich UEG = µˆ − z 0 ,995σˆ / n , OEG = µˆ + z 0 ,995σˆ / n ; analog werden die Warngrenzen aus der Forderung P( X < UWG) = P( X > OWG) = 2,5%, d.h. UWG = µˆ − z 0 ,975σˆ / n , OWG = µˆ + z 0, 975σˆ / n . In diesen Formeln sind µ̂ und σˆ Schätzwerte für den Fertigungsmittelwert µ und die Fertigungsstreuung σ, die im Allgemeinen aus einem Vorlauf mit einer großen Anzahl von Stichprobenwerten bestimmt werden. Zu diesem Zweck werden Zu diesem Zweck werden dem Fertigungsprozess in 20 bis 30 aufeinanderfolgenden Zeitpunkten Stichproben (jeweils vom Umfang n) entnommen. Den Schätzwert µ̂ gewinnt man durch Mittelung der Stichprobenmittelwerte über die Erhebungszeitpunkte; analog wird σ2 durch den Mittelwert der Stichprobenvarianzen geschätzt, die Quadratwurzel dieses Mittelwerts ist schließlich der gesuchte Schätzwert σˆ für σ. W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc 29.11.11 17 Neben den Eingriffs- und Warngrenzen ist in der x -Karte auch der Schätzwert µ̂ für den Fertigungsmittelwert (als Mittellinie MLµ = µ̂ parallel zur Zeitachse) eingezeichnet. Anmerkung: Die Wahl der Eingriffsgrenzen (analoges gilt für die Warngrenzen) entspricht der Festlegung des Ablehnungsbereiches beim zweiseitigen Vergleich eines Mittelwerts µ mit dem vorgegebenen Sollwert µ̂ . Die entsprechenden Alternativen lauten: H 0 : µ = µˆ (der Prozess verläuft hinsichtlich des Fertigungsmittelwerts ungestört) vs. H 1 : µ ≠ µˆ (der Prozess ist gestört). Die Nullhypothese wird auf dem Testniveau α = 1% abgelehnt, wenn TGs = ( x − µˆ ) /(σˆ n ) > z1−α / 2 = z 0.995 , d.h. x < UEG = µˆ − z 0.995σˆ / n oder x > OEG = µˆ + z 0.995σˆ / n gilt. Dabei wurden die Schätzwerte µ̂ und σ̂ gleich den entsprechenden Parametern µ bzw. σ der Verteilung von X gesetzt. Die Eingriffsgrenzen der s-Karte werden aus der Forderung P(S2 < UEG2) = P(S2 > OEG2) = 0,5% bestimmt; daraus ergibt sich UEG = σˆ χ n2−1, 0.005 n −1 , OEG = σˆ χ n2−1, 0.995 n −1 . analog werden die Warngrenzen aus der Forderung P(S2 < UWG2) = P(S2 > OWG2) = 2,5% bestimmt, d.h. UWG = σˆ χ n2−1, 0.025 n −1 , OWG = σˆ χ n2−1, 0.975 n −1 . Für die Mittellinie der s-Karte ergibt sich die Lage n Γ 2 2 . MLs = E[ S ] = k nσˆ mit k n = n − 1 n − 1 Γ 2 Beispiel 3.18: Zur Erstellung einer x - und s-Karte zur Überwachung des Fertigungsmittelwerts bzw. der Streuung des Durchmessers eines Produktes (Nennmaß 4,5mm) werden aus einem Vorlauf 20 Stichproben vom Umfang n=5 in aufeinanderfolgenden Zeitpunkten der Fertigung entnommen und die gemessenen Durchmesser zusammen mit den Mittelwerten und Varianzen dokumentiert. W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc 29.11.11 18 Daten: Zeitpunkt 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Proben-Durchmesser Mittelwert Varianz 4,46 4,50 4,59 4,35 4,65 4,510 0,0136 4,91 4,32 4,39 4,59 4,88 4,618 0,0739 5,36 4,32 5,34 4,47 4,64 4,826 0,2417 4,97 5,00 4,24 4,92 4,95 4,816 0,1045 4,50 4,69 4,45 4,34 4,42 4,480 0,0172 4,20 4,35 4,44 3,98 4,56 4,306 0,0505 4,61 4,44 4,58 4,31 4,17 4,422 0,0342 4,45 4,38 4,55 4,39 4,24 4,402 0,0128 4,18 4,43 4,72 4,44 4,20 4,394 0,0483 4,45 4,37 4,30 3,51 4,31 4,188 0,1472 3,96 4,69 4,20 4,01 3,91 4,154 0,1018 4,52 4,21 4,58 4,33 4,84 4,496 0,0588 4,77 4,50 4,35 4,51 4,27 4,480 0,0366 4,30 4,37 4,51 4,60 4,27 4,410 0,0198 4,31 4,29 4,10 4,18 4,24 4,224 0,0073 4,26 4,65 4,54 4,88 4,68 4,602 0,0516 4,17 4,22 4,62 4,22 4,59 4,364 0,0489 4,76 4,31 4,08 4,17 4,63 4,390 0,0864 4,82 4,76 4,49 4,10 4,72 4,578 0,0870 4,52 4,82 4,42 4,40 4,24 4,480 0,0462 Lösung: Die Mittelwerte und Varianzen der zu den vorgegebenen Zeitpunkten entnommenen Zufallsstichproben sind bereits der Datenmatrix beigefügt, ebenso der Gesamtmittelwert 4,457 (Mittelwert der Einzelmittelwerte) und die Gesamtvarianz 0,0644 (Mittelwert der Einzelvarianzen); die entsprechende GesamtStandardabweichung ist 0,2538. Bestimmung der Mittelwertkarte: ML = 4,457; z0,995 = 2,576; UEG = 4,457– 2,576×0,2538/√5 = 4,165; OEG = 4,749; z0,975 = 1,960; UWG = 4,457– 1,96×0,2538/√5 = 4,235; OWG = 4,680. 5,000 OEG 4,800 OWG 4,600 ML 4,400 UWG 4,200 UEG 4,000 0 2 4 6 8 10 12 14 16 18 20 Bestimmung der s-Karte: k5 = (1/√2 )Γ(5/2)/Γ(2) = (1/√2 )⋅ (3/2)(√π)/2 = 0,940; ML = 0,940×0,2538 = 0,2386; χ24,0.005 = 0,207; χ24,0.995 = 14,86; UEG = 0,2538 √(0,207/4) = 0,0577; OEG = 4892; W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc 29.11.11 19 χ24,0.025 = 0,4844; χ24,0.975 = 11,143; UWG = 0,2538 √(0,0,4844/4) = 0,0883; OWG = 4236; 0,6 OEG 0,4 OWG 0,2 ML UWG UEG 0 0 2 4 6 8 10 12 14 16 18 20 Interpretation: In der Mittelwertkarte werden die Eingriffsgrenzen zu zwei Zeitpunkten über- bzw. unterschritten. In diesen Fällen nimmt man an, dass diese Werte nicht mehr als zufällig zu betrachten sind, d.h. auf eine systematische Änderung des Fertigungsmittelwertes hinweisen; der Vorlauf wäre abzubrechen und die ursprüngliche Lage des Mittelwertes herzustellen. Wirken nur noch zufällige Ursachen, heißt der Prozess stabil. Analog wird bei Über-/Unterschreitung der Eingriffsgrenzen in der s-Karte angenommen, dass eine systematische Veränderung der Fertigungsstreuung stattgefunden hat. Die s-Karte gibt ferner über die Größe der Streuung Auskunft Ist die Streuung zu groß, wird der Prozess als „nicht fähig“ bezeichnet; zur Beurteilung der Prozessfähigkeit existieren eigene Kennwerte. Lösung mit R: R-Script: # Qualitätsregelkarten: Mittelwert- und s-Karte library(qcc) # Laden des packages „qcc“ options(digits=4) durchmesser <- c( 4.46, 4.50, 4.59, 4.35, 4.65, 4.91, 4.32, 4.39, 4.59, 4.88, 5.36, 4.32, 5.34, 4.47, 4.64, 4.97, 5.00, 4.24, 4.92, 4.95, 4.50, 4.69, 4.45, 4.34, 4.42, 4.20, 4.35, 4.44, 3.98, 4.56, 4.61, 4.44, 4.58, 4.31, 4.17, 4.45, 4.38, 4.55, 4.39, 4.24, 4.18, 4.43, 4.72, 4.44, 4.20, 4.45, 4.37, 4.30, 3.51, 4.31, 3.96, 4.69, 4.20, 4.01, 3.91, 4.52, 4.21, 4.58, 4.33, 4.84, W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc 29.11.11 20 4.77, 4.50, 4.35, 4.51, 4.27, 4.30, 4.37, 4.51, 4.60, 4.27, 4.31, 4.29, 4.10, 4.18, 4.24, 4.26, 4.65, 4.54, 4.88, 4.68, 4.17, 4.22, 4.62, 4.22, 4.59, 4.76, 4.31, 4.08, 4.17, 4.63, 4.82, 4.76, 4.49, 4.10, 4.72, 4.52, 4.82, 4.42, 4.40, 4.24) daten <- matrix(durchmesser, ncol=5, nrow=20, byrow=T) daten x_quer_karte <- qcc(daten, type="xbar", std.dev="RMSDF", confidence.level=0.99, plot=F) plot(x_quer_karte,title="Mittelwertkarte", xlab="Stichprobennummer", ylab="Stichprobenmittelwert") s_karte <- qcc(daten, type="S", std.dev="RMSDF", confidence.level=0.99, plot=F) plot(s_karte,title="s-Karte", xlab="Stichprobennummer", ylab="Stichproben-STD") R-Grafiken: s-Karte 4.8 0.5 Mittelwertkarte UCL 0.4 0.3 4.6 4.5 Stichproben-STD 0.2 CL 0.1 4.3 4.4 CL 4.2 Stichprobenmittelwert 4.7 UCL LCL 1 3 5 7 9 11 13 15 17 19 Stichprobennummer Number of groups = 20 Center = 4.457 LCL = 4.164 StdDev = 0.2546 UCL = 4.75 Number beyond limits = 3 Number violating runs = 0 LCL 1 3 5 7 9 11 13 15 17 19 Stichprobennummer Number of groups = 20 Center = 0.2346 LCL = 0.05791 StdDev = 0.2546 UCL = 0.4907 Number beyond limits = 1 Number violating runs = 0 4.4.2 ANNAHMESTICHPROBENPRÜFUNG Die Annahmestichprobenprüfung wird zur Eingangsprüfung oder Endkontrolle von Prüflosen (=Zusammenfassung von unter vergleichbaren Bedingungen hergestellten Einheiten) verwendet. Die Überprüfung erfolgt mit einer so genannten Stichprobenanweisung, die über den Umfang der Prüfstichprobe sowie über die Entscheidung für die Annahme oder die Zurückweisung des Prüfloses Auskunft gibt. W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc 29.11.11 21 Wie bestimmt man die Annahmewahrscheinlichkeit bei der Prüfung auf fehlerhafte Einheiten? Bei der Prüfung auf fehlerhafte Einheiten (Attributprüfung) werden die Untersuchungseinheiten qualitativ mit einer zweistufigen Variablen klassifiziert, die die Werte „gut“ oder “schlecht“ annimmt (Gut/Schlechtprüfung). Es sei N der Umfang des Prüfloses, a die Anzahl der schlechten Einheiten im Prüflos (Ausschusszahl), p = a/N der Fehleranteil (bzw. Ausschussanteil) und n der Umfang der Prüfstichprobe. Wir setzen voraus, dass die Stichprobennahme zufällig aus dem Prüflos erfolgt und eine zerstörende Überprüfung der Einheiten erfolgt, d.h. die Zufallsauswahl entspricht dem Modell der „Zufallsziehung ohne Zurücklegen“. Dann folgt die Anzahl X der schlechten Einheiten in der Prüfstichprobe einer hypergeometrischen Verteilung. Wenn c als maximal zulässige Anzahl von Ausschusseinheiten festgelegt ist, wird das Prüflos im Falle X ≤ c angenommen und im Falle X > c abgelehnt. Die Stichprobenanweisung ist also durch den Umfang n der Prüfstichprobe und die Annahmezahl c festgelegt und wird daher auch kurz als (n,c)-Plan bezeichnet. Die Wahrscheinlichkeit Pa, dass nach dieser Entscheidungsregel das Prüflos angenommen wird, ist in Abhängigkeit vom Ausschussanteil p=a/N (a=0, 1, 2, …, N) durch c Pa ( p | n, c) = ∑H c N ,n , p ( x) = x =0 ∑ x =0 a N − a x n − x mit a = Np N n gegeben. Bezeichnet D={p|p=a/N und a=0, 1, …, N} die Menge der möglichen Ausschussanteile, so heißt die auf D definierte Funktion f: D [0,1] mit der Gleichung f(p)=Pa(p|n, c) die Operationscharakteristik der Stichprobenanweisung (n, c). Der Graph der Operationscharakteristik heißt Annahmekennlinie oder OC-Kurve. Unter der Voraussetzung n/N < 0,1 und N > 60 können die Verteilungsfunktionswerte HN,n,p(x) mit ausreichender Genauigkeit durch die entsprechenden Werte der Binomialverteilung Bn,p approximiert werden; die Formel für die Annahmewahrscheinlichkeit vereinfacht sich damit auf: c c n x p (1 − p)n−x x W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc x=0 x=0 Pa ( p | n, c) = ∑ ∑ Bn, p ( x) = 29.11.11 22 Auf der Grundlage dieser Approximation kann zu einem vorgegebenen Wert γ der Annahmewahrscheinlichkeit Pa(p|n,c) der entsprechende Ausschussanteil pγ explizit mit Hilfe der Formel pγ = (c + 1) F2( c +1), 2( n −c ),1−γ n − c + (c + 1) F2( c +1), 2( n −c ),1−γ = c +1 c + 1 + (n − c ) F2( n −c ), 2( c +1),γ berechnet werden. Beispiel 4.8: Bei einem Fertigungsprozess werden Lose von N=150 Stück mit Hilfe eines einfachen (n,c)-Planes mit Stichproben vom Umfang n=20 und der Annahmezahl c=1 geprüft. Man zeichne die entsprechende OC-Kurve. Zum Vergleich zeichne man auch die OC-Kurve für (n, c) = (30,1). Lösung: Für n=20 und c=1ergeben sich als Funktionswerte der Operationscharakteristik a 150 − a a 150 − a − 0 20 1 20 1 für a = 1,2,...,130 + 150 150 1 20 20 Pa (a / N | n, c) = H150,20,a / 150 ( x) = a 150 − a x =0 1 20 − 1 131 = für a = 131 150 150 20 20 und Pa(a/N|n,c)=0 für a=132, 133,…, 150. ∑ Für n=30 und c=1 ist 1 Pa (a / N | n, c) = ∑ x =0 a 150 − a a 150 − a − 0 30 1 30 1 + für a = 1,2,...,120 150 150 30 30 H150,30,a / 150 ( x) = − a 150 a 1 30 − 1 131 = für a = 121 150 150 30 30 W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc 29.11.11 23 und Pa(a/N|n,c)=0 für a=122, 123,…, 150. Darstellung (Excel-Grafik) der OC-Kurven: 1 OC-Kurven zu (n,c)-Prüf plänen mit n=20 bzw. n=30 und c=1 PRP 10,8 ti e k h 0,6 icl in e h c sr 0,4 h a w e m0,2 h a n n A n=20, c=1 n=30, c=1 CRP 0 0,0 p1- 0,1 p 0,2 0,3 Fehleranteil p Lösung mit R (R-Console): > # Laden des package “AcceptanceSampling” aus Unterverzeichnis library > library(AcceptanceSampling) > # Bestimmung der Annahmewahrscheinlichkeiten – Prüfplan (n,c)=(20,1) > PPhyper20 <- OC2c(20, 1, type="hypergeom", N=150, pd=(0:150)/150) > summary(PPhyper20, full=T) Acceptance Sampling Plan (hypergeom with N=150) Sample 1 Sample size(s) 20 Acc. Number(s) 1 Rej. Number(s) 2 Detailed acceptance probabilities: Pop. Defectives Pop. Prop. defective P(accept) 0 0.000000000 1.000000e+00 1 0.006666667 1.000000e+00 2 0.013333333 9.829978e-01 3 0.020000000 9.531290e-01 usw. > PPhyper20@pd[1:5] [1] 0.000000000 0.006666667 0.013333333 0.020000000 0.026666667 > PPhyper20@paccept[1:5] [1] 1.0000000 1.0000000 0.9829978 0.9531290 0.9138119 > # Bestimmung der Annahmewahrscheinlichkeiten – Prüfplan (n,c)=(30,1) > PPhyper30 <- OC2c(30, 1, type="hypergeom", N=150, pd=(0:150)/150) > summary(PPhyper30, full=T) Acceptance Sampling Plan (hypergeom with N=150) Sample 1 Sample size(s) 30 Acc. Number(s) 1 Rej. Number(s) 2 Detailed acceptance probabilities: Pop. Defectives Pop. Prop. defective P(accept) 0 0.000000000 1.000000e+00 W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc 29.11.11 24 1 2 3 0.006666667 1.000000e+00 0.013333333 9.610738e-01 0.020000000 8.979503e-01 usw. > # Erstellen der Grafik mit den OC-Kurven > plot(PPhyper20@pd, PPhyper20@paccept, xlab="Ausschussanteil p", + ylab="Annahmewahrscheinlichkeit Pa", + main="OC-Kurven zu (n,c)-Prüfplänen \n mit n=20 bzw. 30 und c=1 ", + xlim=c(0, 0.5)) > grid(lty=1) > lines(PPhyper20@pd, PPhyper20@paccept) > lines(PPhyper30@pd, PPhyper30@paccept, col="red") > text(0.12, 0.30, pos=4, "n=20") > text(0.02, 0.30, col="red", pos=4, expression("n=30")) > segments(x0=0.02,y0=0.9, x1=0.04, y1=0.9, lwd=3) > segments(x0=0.03,y0=0.88, x1=0.03, y1=0.92, lwd=3) > text(0.04, 0.9, pos=4, "PRP") > segments(x0=0.162,y0=0.1, x1=0.182, y1=0.1, lwd=3) > segments(x0=0.172,y0=0.08, x1=0.172, y1=0.12, lwd=3) > text(0.19,0.1, pos=4, "CRP") R-Grafik: 1.0 OC-Kurven zu (n,c)-Prüfplänen mit n=20 bzw. 30 und c=1 0.6 0.4 n=30 n=20 0.2 Annahmewahrscheinlichkeit Pa 0.8 PRP 0.0 CRP 0.0 0.1 0.2 0.3 0.4 0.5 Ausschussanteil p Man erkennt: • Die OC-Kurven verlaufen monoton fallend vom Wert 1 bei p=0 auf den Wert 0 bei p=1; mit wachsendem n wird der Kurvenverlauf steiler. • Sehr gute Lose (p ≤ p1-α) sollen mit einer (hohen) Wahrscheinlichkeit Pa(p|n,c) ≥ 1-α angenommen und mit einer kleinen Wahrscheinlichkeit 1- Pa(p|n,c) < α (irrtümlich) zurückgewiesen werden; α ist z.B. 10% oder 5% und heißt das Lieferantenrisiko; p1-α wird Annahmegrenze (kurz AQL, acceptable quality level) genannt. Der Punkt (p1-α, 1-α) auf der OC-Kurve heißt auch Producer Risk Point (PRP). W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc 29.11.11 25 • Sehr schlechte Lose (p ≥ pβ) sollen mit einer (kleinen) Wahrscheinlichkeit Pa(p|n,c) ≤ β (irrtümlich) angenommen und mit einer großen Wahrscheinlichkeit 1- Pa(p|n,c) > 1-β zurückgewiesen werden; β ist wie α z.B. 10% oder 5% und heißt das Abnehmerrisiko; pβ wird Ablehngrenze (kurz LQL, limiting quality level) genannt. Der Punkt (pβ, β) auf der OC-Kurve wird auch Consumer Risk Point (CRP) genannt. Beispiel 4.9: Für einen Fertigungsprozess ist geplant, Lose von N=7000 Stück mit Hilfe eines einfachen (n,c)-Planes mit Stichproben vom Umfang n=60 und der Annahmezahl c=4 zu prüfen. Können mit diesem Plan die Vorgaben Pa(p|n,c)≥1-α=90% für p≤5% und Pa(p|n,c)≤ß=5% für p≥15% erfüllt werden? Lösung: Wegen n/N<0.1 und N>60 kann die Annahmewahrscheinlichkeit in Abhängigkeit vom Ausschussanteil p vereinfacht mit Hilfe der Binomialverteilung (statt der hypergeometrischen Verteilung) bestimmt werden. Wir bestimmen zum vorgegebenen AQL=5% und vorgegebenen LQL=15% die entsprechenden Annahmewahrscheinlichkeiten Pa(AQL|60,4) bzw. Pa(LQL|60,4) und erhalten dafür 4 Pa (0.05 | 60,4) = ∑ x =0 4 Pa (0.15 | 60,4) = ∑ x =0 60 0.05 x (1 − 0.05) 60− x = 81.97%, x 60 0.15 x (1 − 0.15) 60− x = 4.24%. x Wegen Pa(AQL|60,4)=81.97%<90% ist die erforderliche Mindestannahmewahrscheinlichkeit im Punkt PRP nicht erfüllt. Dagegen wird wegen Pa(LQL|60,4)=4.24%<5% im Punkt CRP die vorgegebene Maximalwahrscheinlichkeit nicht überschritten. Lösung mit R (R-Console): > library(AcceptanceSampling) > PPbinom <- OC2c(60, 4, type="binom") > assess(PPbinom, PRP=c(0.05, 0.9), CRP=c(0.15, 0.05)) Acceptance Sampling Plan (binomial) Sample 1 Sample size(s) 60 Acc. Number(s) 4 Rej. Number(s) 5 Plan CANNOT meet desired risk point(s): PRP CRP Quality RP P(accept) Plan P(accept) 0.05 0.90 0.81966494 0.15 0.05 0.04237205 W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc 29.11.11 26 Wie hängt die OC mit der Gütefunktion des entsprechenden statistischen Tests zusammen? Die Entscheidung mit einem (n,c)-Plan bei der Prüfung auf fehlerhafte Einheiten erinnert an die Entscheidungssituation beim Binomialtest und kann wie folgt dargestellt werden: Gutes Los: Ausschussrate p≤po (Ereignis H0) Schlechtes Los: Ausschussrate p>po (Ereignis H1) Annahme: Entscheidung für H0 (Ereignis T0 =’X≤c’) Richtige Entscheidung: P = P(T0|H0) Fehler! (2. Art, β-Fehler) P= P(T0|H1) Abnehmerrisiko Rückweisung: Entscheidung für H1 (Ereignis T1=’X>c’) Fehler! (1. Art, α-Fehler) P = P(T1|H0) Lieferantenrisiko Richtige Entscheidung: P= P(T1|H1) Bei der einseitigen Prüfung der Fehlerwahrscheinlichkeit p auf allfällige Überschreitung eines vorgegebenen Sollwertes po lautet die Alternativhypothese H1: p>po und folglich die Nullhypothese H0: p≤po. Ist für den Konsumenten die Schlechtgrenze pβ, d.h. diese Fehlerwahrscheinlichkeit gerade noch akzeptabel (weil dann Lose mit dem geringen Abnehmerrisiko β angenommen werden), wird der Lieferant seine Fertigung so einrichten, dass po = p1-α = pβ -∆ (∆ >0), d.h. Fehlerwahrscheinlichkeit p die Gutgrenze p1-α nicht überschreitet (H0:p≤p1-α); dabei ist die Gutgrenze (bzw. ∆) so gewählt, dass die Wahrscheinlichkeit für die Ablehnung von H0 größer als 1-α bleibt, wenn H0 (gutes Los) gilt, und kleiner als β bleibt, wenn p > pβ (sehr schlechtes Los) gilt. Die Gütefunktion G wurde als Wahrscheinlichkeit für die Ablehnung von H0 (gutes Los) in Abhängigkeit vom Parameter p eingeführt. Die Operationscharakteristik OC ist gleich der Wahrscheinlichkeit Pa für die Annahme des Loses in Abhängigkeit von p. Die beiden Wahrscheinlichkeiten sind zueinander komplementär, d.h. Pa = 1 – G. Wie wählt man eine geeignete Stichprobenanweisung aus, d.h. den Umfang n sowie die Annahmezahl c? Zur Bestimmung der Parameter n und c werden die Gleichungen Pa(p1-α|n,c) = 1-α und Pa(pβ|n,c) = β herangezogen, die in geometrischer Deutung verlangen, dass die Punkte (p1-α,1-α) und (pβ,β) auf der OC liegen. Diese Vorgaben entsprechen den Forderungen, dass das Prüflos W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc 29.11.11 27 bis zum (kleinen) Fehleranteil p1-α, zumindest mit der (hohen) Wahrscheinlichkeit 1-α und ab dem (hohen) Fehleranteil pβ höchstens mit der (kleinen) Wahrscheinlichkeit β angenommen wird. Eine Auflösung des Gleichungssystems Pa(p1-α|n,c) = 1-α, Pa(pβ|n,c) = β ist nur auf numerischem Wege möglich. Um ganzzahlige Lösungswerte für n und c zu finden, müssen die Gleichungen i. Allg. als Ungleichungen Pa(p1-α|n,c) ≥ 1-α, Pa(pβ|n,c) ≤ β betrachtet werden. Beispiel 4.10: Man bestimme die Stichprobenanweisung, wenn Lieferanten und Abnehmer vereinbart haben: Die Annahmewahrscheinlichkeit soll bis zu einem Fehleranteil von 2% zumindest 90% und ab einem Fehleranteil von 8% höchstens 10% betragen. Der Umfang des Prüfloses sei N=5000. Lösung: Es ist 1-α = 0,9, p1-α = 0,02 (Lieferantenforderung) und β = 0,1, pβ = 0,08. Zur Lösung der Ungleichungen Pa(0,02|n,c) ≥ 0,9, Pa(0,08|n,c) ≤ 0,01 geben wir für c die Werte 0, 1, 2 und 3 vor und schreiben die entsprechenden Annahmewahrscheinlichkeiten an: n c = 0 : Pa ( p | n,0) = (1 − p) n = (1 − p) n 0 n n c = 1 : Pa ( p | n,1) = (1 − p) n + (1 − p) n−1 p 0 1 n n n c = 2 : Pa ( p | n,2) = (1 − p) n + (1 − p) n −1 p + (1 − p) n − 2 p 2 0 1 2 n n n n c = 3 : Pa ( p | n,3) = (1 − p) n + (1 − p) n−1 p + (1 − p) n − 2 p 2 + (1 − p) n −3 p 0 1 2 3 Dabei wurde die Annahme gemacht, dass für das gesuchte n gilt n/N<0,1, so dass mit ausreichender Genauigkeit die Binomialverteilungsapproximation angewendet werden kann. Durch systematischen Einsetzen von Werten für n erkennt man, dass Pa(0,02|n,0) ≥ 0,9 für n<6 und Pa(0,08|n,0) ≤ 0,01 für n>55 gilt, d.h. für c=0 besitzen die Ungleichungen keine Lösung; dies gilt ebenso für c=1 und c=2. Im Falle c=3 findet man, dass Pa(0,02|n,3) ≥ 0,9 für n<88 und Pa(0,08|n,3) ≤ 0,01 für n>81; beide Ungleichungen sind also für 81<n<88 erfüllt. Aus wirtschaftlichen Gründen entscheidet man sich für das kleinste n, d.h. n=82. Die gesuchte Anweisung ist daher (n,c)=(82,3). Wegen n/N=82/5000=0,0164<0,1 ist die Approximation der hypergeometrischen Verteilung durch die Binomialverteilung gerechtfertigt. Wir rechnen als Kontrolle für die durch n=82 und c=3 festegelegte OC die tatsächlichen Werte für die Gutgrenze p1-α sowie die Schlechtgrenze pβ nach. Es ist mit γ = 1-α = 0,9 und F2(n-c),2(c+1),1-α = F158,8,0.9 = 2,311 p1−α = p 0,9 = c +1 4 = = 0,0214 > 0,02 c + 1 + ( n − c ) F2 ( n −c ), 2( c +1),γ 4 + 79 ⋅ 2,311 W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc 29.11.11 28 Analog ergibt sich mit γ = β = 0,1 und F2(n-c),2(c+1),β = F158,8,0.1 = 0,585 für die Schlechtgrenze pβ = 0,0797<0,08. Lösung mit R (R-Console): > library(AcceptanceSampling) > find.plan(PRP=c(0.02, 0.9), CRP=c(0.08, 0.1), type="binom") $n [1] 82 $c [1] 3 $r [1] 4 > # Überprüfung, ob der (82, 3)-Prüfplan die Bedingungen erfüllt: > assess(OC2c(82, 3, type="binom"),PRP=c(0.02, 0.9), CRP=c(0.08, 0.1)) Acceptance Sampling Plan (binomial) Sample 1 Sample size(s) 82 Acc. Number(s) 3 Rej. Number(s) 4 Plan CAN meet desired risk point(s): PRP CRP Quality RP P(accept) Plan P(accept) 0.02 0.9 0.9175469 0.08 0.1 0.0981495 Wie bestimmt man einen Prüfplan und die entsprechende Operationscharakteristik für ein quantitatives Merkmal? Wir betrachten nun den Fall, dass die zu kontrollierende Eigenschaft der Einheiten des Prüfloses durch ein metrisches Merkmal X (z.B. eine Länge oder Konzentration) beschrieben ist. Wir setzen X als normalverteilt mit den Parametern µ und σ2 voraus und nehmen an, dass der Fertigungsmittelwert µ unbekannt, die Fertigungsstreuung σ2 der Einfachheit halber aber bekannt ist. Soll X nur mit einer kleinen Wahrscheinlichkeit p eine vorgegebene obere Toleranzgrenze To überschreiten, liegt ein einseitiges Kriterium „nach oben“ vor; die folgenden Ausführungen beschränken sich auf diesen Fall, d.h. auf eine Prüfung auf Überschreitung. Wegen P(X ≤ To) = 1 – P(X > To) = 1- p, ist To das (1-p)-Quantil der Verteilung von X. Es folgt, dass die standardisierte Größe (To -µ)/σ gleich dem (1-p)-Quantil z1-p der Standardnormalverteilung ist, d.h. der Fertigungsmittelwert kann in der Form µ = To -σz1-p dargestellt werden. Die Wahrscheinlichkeit p ist der zu erwartende Anteil von schlechten Einheiten (mit X> To). W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc 29.11.11 29 Zur Schätzung des Fertigungsmittelwerts µ wird dem Prüflos (vom Umfang N) eine Zufallsstichprobe vom Umfang n<N entnommen und daraus der Stichprobenmittelwert X bestimmt. Damit wird nun die folgende Prüfvorschrift formuliert: Das Los wird angenommen, wenn X ≤ To - kσ gilt. Die Konstante k ist der sogenannte Annahmefaktor und neben der Größe n der Prüfstichprobe die zweite Kennzahl des Prüfplans für ein metrisches Merkmal. Für die Annahmewahrscheinlichkeit ergibt sich in Abhängigkeit vom Fertigungsmittelwert µ die Formel X − µ To − kσ − µ Paµ (µ | n, k ) = P( X ≤ To − kσ ) = P ≤ = σ / n σ / n T − µ = Φ o − k n σ bzw. in Abhängigkeit vom Fehleranteil p, wenn µ = To -σz1-p substituiert wird, die Formel: ( Pa ( p | n, k ) = Φ [z1− p − k ] n ) Den Graphen der Funktion Paµ: µ Paµ (µ |n,k) bzw. Pa: p Pa(p |n,k) bezeichnet man wieder als Annahmekennlinie oder Operationscharakteristik (OC-Kurve) des verwendeten Prüfplans. Aus der Monotonie von Φ folgt, dass die Annahmewahrscheinlichkeit mit wachsendem µ bzw. p streng monoton abnimmt. Beispiel 4.11: Bei der Fertigung eines Produktes ist die Prüfung eines Längenmerkmals X auf allfällige Überschreitung einer oberen Toleranzgrenze von To =100mm vorgesehen. Das Merkmal kann als normalverteilt angenommen werden mit dem (unbekannten) Mittelwert µ und der (bekannten) Varianz σ2= 2mm2. Die Beurteilung soll mit dem Prüfplan n=40 (Umfang der Prüfstichprobe) und k=1.45 (Annahmefaktor) erfolgen. Man stelle die Annahmewahrscheinlichkeit Paµ für Mittelwerte µ von 95mm bis 101mm dar und ebenso die Annahmewahrscheinlichkeit Pa in Abhängigkeit vom Ausschussanteil p im Produktionslos. Erfüllt der Prüfplan die Kriterien, dass bis zu einem Ausschussanteil von 5% die Annahmewahrscheinlichkeit ≥ 95% ist und ab einem Ausschussanteil von 7.5% die Annahmewahrscheinlichkeit ≤ 10% bleibt? Lösung mit R (R-Console): > library(AcceptanceSampling) > To_X <- 100 > sigma_X <- 2 > mu_X <- seq(94, 100, 0.05) W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc 29.11.11 30 > p_X <- 1-pnorm((To_X-mu_X)/sigma_X) # Ausschussanteil in Abhängigkeit vom Mittelwert > PP1_X <- OCvar(n=40, k=1.45, pd=p_X) # Annahmewahrscheinlichkeit Pa > PP1_X Acceptance Sampling Plan (normal) Standard deviation assumed to be known Sample 1 Sample size 40.00 Constant k 1.45 ># > # OC-Kurve: Annahmewahrscheinlichkeit in Abhängigkeit vom Mittelwert mu_X > plot(mu_X, PP1_X@paccept, type="l", xlab="Mittelwert mu_X", + ylab="Annahmewahrscheinlichkeit Pa(mu_X)", main="OC-Kurve für Messmerkmal X mit STD=2 + (obere Toleranzgrenze=100, n=40, k=1.45)", xlim=c(94, 100)) ># > # OC-Kurve: Annahmewahrscheinlichkeit in Abhängigkeit vom Ausschussanteil p_X > pu <- 1-pnorm((To_X-94)/sigma_X) # Ausschussanteil zu mu_X=95 > po <- 1-pnorm((To_X-100)/sigma_X) # Ausschussanteil zu mu_X=100 > print(cbind(pu, po)) pu po [1,] 0.001349898 0.5 > plot(p_X, PP1_X@paccept, type="l", xlab="Ausschussanteil p_X", + ylab="Annahmewahrscheinlichkeit Pa(p_X)", main="OC-Kurve für Messmerkmal X mit STD=2 + (obere Toleranzgrenze=100, n=40, k=1.45)", xlim=c(0.0014,0.5)) OC-Kurve für Messmerkmal X mit STD=2 (obere Toleranzgrenze=100, n=40, k=1.45) 0.8 0.6 0.4 Annahmewahrscheinlichkeit Pa(p_X) 0.0 0.2 0.8 0.6 0.4 0.2 0.0 Annahmewahrscheinlichkeit Pa(mu_X) 1.0 1.0 OC-Kurve für Messmerkmal X mit STD=2 (obere Toleranzgrenze=100, n=40, k=1.45) 94 95 96 97 98 99 100 Mittelwert mu_X 0.0 0.1 0.2 0.3 0.4 Ausschussanteil p_X > # Überprüfung ob Prüfplan den vorgegebenen RPs (risk points PRP, CRP) entspricht > assess(PP1_X, PRP=c(0.05, 0.95), CRP=c(0.1, 0.075)) Acceptance Sampling Plan (normal) Standard deviation assumed to be known Sample 1 Sample size 40.00 Constant k 1.45 Plan CANNOT meet desired risk point(s): PRP CRP Quality RP P(accept) Plan P(accept) 0.05 0.950 0.8910932 0.10 0.075 0.1433562 W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc 29.11.11 0.5 31 Wie bestimmt man die Kennzahlen n und k des Prüfplans für ein quantitatives Merkmal? Die Kennzahlen n und k können durch Vorgabe von 2 Punkten der Operationscharakteristik bestimmt werden. Wir verlangen wie schon bei der Attributprüfung, dass • sehr gute Lose (p≤ p1−α) mindestens mit der an der Annahmegrenze AQL=p1−α vorgegebenen hohen Wahrscheinlichkeit 1-α und • sehr schlechte Lose (p≥ pβ) höchstens mit der an der Ablehngrenze LQL=pβ vorgegebenen kleinen Wahrscheinlichkeit β angenommen werden. Für die Annahmewahrscheinlichkeit folgen daraus die Bedingungen ( P ( LQL | n, k ) = Φ ([z ) − k ] n ) = β ⇔ [z Pa ( AQL | n, k ) = Φ [z1− AQL − k ] n = 1 − α ⇔ [z1− AQL − k ] n = z1−α , a 1− LQL 1− LQL − k ] n = z β = − z1− β , aus denen die Kennzahlenwerte 2 z + z1−β z z + z1− β z1− AQL , k = 1−α 1− LQL n = 1−α z1−α + z1− β z1− AQL − z1− LQL bestimmt werden können. Dabei ist n i. Allg. nicht ganzzahlig und durch die nächst größere ganze Zahl zu ersetzen; wir bezeichnen diese Zahl mit nσ. Annmerkungen: • In der Regel ist die Fertigungsstreuung σ nicht bekannt und ebenso wie der Fertigungsmittelwert aus der Prüfstichprobe zu schätzen. Es sei s der Schätzwert für σ. Der Umfang ns der Prüfstichprobe ergibt sich nun näherungsweise aus ns = (1+ k2/2)nσ; diese Formel liefert für ns ≥ 10 brauchbare Näherungswerte. • Entsprechende Überlegungen gelten für den Fall der einseitigen Abgrenzung des Toleranzbereichs durch einen unteren Grenzwert Tu. Beispiel 4.12: Es sei X ein normalverteiltes Merkmal; zur Festlegung der Operationscharakteristik wird ein Lieferantenrisiko von 5% an der Annahmegrenze AQL=5% und ein Abnehmerrisiko von 7.5% an der Ablehngrenze LQL = 10% vereinbart. Man bestimme die Kennwerte n und k des entsprechenden Prüfplans (bei bekannter W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc 29.11.11 32 Varianz) und stelle die entsprechende Operationscharakteristik (mit σ2= 2mm2, To =100mm) in Abhängigkeit vom Ausschussanteil p dar. Lösung: Es ist 1-α = 0.95, AQL=p1-α = 0.05 (Lieferantenforderung) und β = 0.075 bei LQL= pβ = 0.10. Die zur Bestimmung von n und k benötigten Quantile der Standardnormalverteilung sind: z1-α = z0.95 = 1.64485; z1-AQL = z0.95 = 1.64485; z1-β = z0.925 =1.28155; z1-LQL = z0.925 = 1.43953. Damit ergibt sich n = 72.08 nσ = 73 und k = 1,45112. Bei unbekannter Fertigungsvarianz erhöht sich der Umfang der Prüfstichprobe auf ns = 150! Lösung mit R (R-Console): > library(AcceptanceSampling) > xx <- find.plan(PRP=c(0.05, 0.95), CRP=c(0.1, 0.075), type="normal", s.type="known") > xx $n [1] 73 $k [1] 1.452338 $s.type [1] "known" > # Darstellung der Operationscharakteristik > To_X <- 100 > sigma_X <- 2 > mu_X <- seq(94, 100, 0.05) > p_X <- 1-pnorm((To_X-mu_X)/sigma_X) > PP2_X <- OCvar(n=73, k=1.452, pd=p_X) > assess(PP2_X, PRP=c(0.05, 0.95), CRP=c(0.1, 0.075)) Acceptance Sampling Plan (normal) Standard deviation assumed to be known Sample 1 Sample size 73.000 Constant k 1.452 Plan CAN meet desired risk point(s): PRP CRP Quality RP P(accept) Plan P(accept) 0.05 0.950 0.95029720 0.10 0.075 0.07265319 plot(p_X, PP2_X@paccept, type="l", xlab="Ausschussanteil p_X", ylab="Annahmewahrscheinlichkeit Pa(p_X)", main="OC-Kurve für Messmerkmal X mit STD=2 (obere Toleranzgrenze=100, n=73, k=1.452)", xlim=c(0,0.2), lwd=2) > segments(-0.03, 0.95, 0.05, 0.95, lty=3) > segments(0.05, -0.03, 0.05, 0.95, lty=3) > points(0.05, 0.95, type="p") > text(0.06,0.95, "PRP") > segments(-0.03, 0.075, 0.1, 0.075, lty=3) > segments(0.1,-0.03, 0.1, 0.075, lty=3) > points(0.1, 0.075, type="p") > text(0.11,0.1, "CRP") W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc 29.11.11 33 1.0 OC-Kurve für Messmerkmal X mit STD=2 (obere Toleranzgrenze=100, n=73, k=1.452) 0.8 0.6 0.4 0.2 Annahmewahrscheinlichkeit Pa(p_X) PRP 0.0 CRP 0.00 0.05 0.10 0.15 0.20 Ausschussanteil p_X 4.5 ANHANG: ÜBERBLICK ÜBER 1-STICHPROBENVERGLEICHE EINSTICHPROBENVERGLEICHE Untersuchungsmerkmal ist 2-stufig skaliert Untersuchungsmerkmal ist mehrstufig skaliert Vergleich eines Mittelwerts mit vorgegebenem Sollwert Vergleich einer Wahrscheinlichkeit mit vorgegebenem Sollwert Vergleich von Wahrscheinlichkeiten auf vorgegebenes Verhältnis Einstichproben t-Test Binomialtest ChiquadratAnpassungstest Untersuchungsmerkmal ist metrisch Überprüfung mit Shapiro-WilkTest Untersuchungsmerkmal ist normalverteilt W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc 29.11.11 34 4.6 ÜBUNGSBEISPIELE Einfache Übungsbeispiele 1. Für eine Blumenzwiebelsorte wird eine Keimfähigkeit von mindestens 75% garantiert. In einer Stichprobe von n=60 keimten 35 Zwiebeln. a) Liegt eine signifikante Abweichung vom garantierten Ergebnis vor? Man prüfe diese Frage auf dem Signifikanzniveau α=5%. b) Welche Fallzahl ist notwendig, um eine Unterschreitung des garantierten Anteils um 0.1 mit einer Sicherheit von 90% feststellen zu können? (Unterschreitung sign.; 214) 2. Die Verpackung einer bestimmten Zigarettensorte weist einen mittleren Nikotingehalt von 15 mg pro Zigarette aus. Es wird eine Zufallsstichprobe von 100 Zigaretten getestet. Dabei ergab sich ein mittlerer Nikotingehalt von 16.5 mg und eine Standardabweichung von 4 mg. Kann aus dem Ergebnis der Stichprobe auf 1%igem Signifikanzniveau der Schluss gezogen werden, dass der tatsächliche Nikotingehalt im Mittel über 15 mg liegt? (Überschreitung sign.) 3. Es sei X eine normalverteilte Umweltmessgröße mit dem (unbekannten) Mittelwert µ und der Standardabweichung σ=10. Mit Hilfe einer Stichprobe soll geprüft werden, ob eine Überschreitung des Grenzwertes K vorliegt, wobei das αRisiko mit 5% vorgegeben ist und eine kritische Überschreitung von 6.5 mit 90%iger Sicherheit erkannt werden soll. Welcher Stichprobenumfang ist zu planen? (21) 4. Von einer Messstelle wurden die folgenden Werte der Variablen X (SO2Konzentration der Luft in mg/m3) gemeldet: 32, 41, 33, 35, 34. a) Weicht die mittlere SO2-Konzentration signifikant vom Wert µo=30 ab? (α=5%) b) Welcher Mindeststichprobenumfang müsste in 6 geplant werden, um mit dem Test eine Abweichung vom Referenzwert µo um 5% (des Referenzwertes) mit einer Sicherheit von 95% erkennen zu können? (sign. Abweichung; 73) 5. Es sei X eine normalverteilte Messgröße mit der Varianz 0,25; für X ist der Nennwert 1,75 vorgegeben. Zur Prüfung auf eine allfällige Abweichung vom Nennwert wird der t-Test eingesetzt; als Testniveau ist 5% vorgesehen. Wie groß muss der Stichprobenumfang geplant werden, um eine kritische Abweichung um 0,15 Einheiten mit 90%iger Sicherheit erkennen zu können? (117) 6. Bei einer Untersuchung der Cd-Belastung von Forellen in einem Fließgewässer wurden 10 Forellen gefangen und der Cd-Gehalt (in mg/g Frischgewicht) bestimmt. Die Auswertung ergab den Mittelwert 0,062 und die Standardabweichung 0,007. Kann aus den Angaben geschlossen werden, dass der mittlere Cd-Gehalt signifikant (α=5%) über dem Referenzwert 0,06 liegt? Welcher Umfang der Zufallsstichproben müsste geplant werden, um mit dem Test eine Abweichung vom Referenzwert in der Höhe der beobachteten Abweichung mit 90%iger Sicherheit als signifikant zu erkennen? (Abw. n. sign., 130) 7. Die Messung der Ozonkonzentration während der Sommermonate ergab für eine Großstadt die in der folgenden Tabelle enthaltenen Werte (Angaben in 10-2 ppm). a) Liegt die mittlere Ozonkonzentration signifikant über dem Wert µo=5? b) Welcher Mindeststichprobenumfang müsste geplant werden, um mit dem Test W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc 29.11.11 35 eine Überschreitung von µo um 10% mit einer Sicherheit von 90% erkennen zu können? (α = 5%) (Überschreitung n. sign.; 93) 2.5 3.0 5.6 4.7 6.5 6.7 1.7 5.3 4.6 7.4 5.4 4.1 5.1 5.6 5.4 6.1 7.6 6.2 6.0 5.5 5.8 8.2 3.1 5.8 2.6 8. In einer Studie über die Behandlung von akuten Herzinfarktpatienten wurde einer Standardtherapie mit einer neuen Therapie verglichen. Es wurden 160 Patienten mit der neuen Therapie behandelt, von denen 20 innerhalb von 4 Wochen verstarben. Bei Anwendung der Standardtherapie muss eine Sterbewahrscheinlichkeit von po =0,2 angenommen werden. Man prüfe mit dem Binomialtest, ob die neue Therapie ein signifikant unter po =0,2 liegendes Sterberisiko ergibt (α=5%). (Unterschr. sign.) 9. In einer Studie wurde u.a. das Ges. Eiweiß i.S. am Beginn und am Ende bestimmt. Bei 31 Probanden war eine Veränderung zu beobachten: bei 20 Probanden lag der Eiweißwert vorher im Normbereich und nachher außerhalb des Normbereichs lag, bei 11 Probanden lag der Eiweißwert vorher außerhalb und nachher im Normbereich. a) Weicht der Anteil y der Probanden, bei denen der Eiweißwert vorher außerhalb und nachher innerhalb des Normbereichs liegt, signifikant von 0,5 ab? Als Signifikanzniveau sei α = 5% vereinbart. b) Ist der Versuch so geplant, dass die beobachtete Abweichung |y-0,5| mit 90%iger Sicherheit mit dem Test als signifikant zu erkennen wäre? (Abw. n. sign.; nein) 10. Im Rahmen einer Untersuchung des Ernährungsstatus von Schulkindern aus Oberösterreich und der Steiermark wurde u.a. das Gesamtcholesterin (in mg/dl) stichprobenartig erfasst. Gesamtcholesterin <170 (optimal) >=170 (Risiko) Oberösterreich 93 52 Steiermark 42 29 a) Man prüfe für jedes Bundesland auf 5%igem Niveau, ob der Anteil von Schulkindern in der optimalen Kategorie signifikant über p0 = 0,5 liegt. (OÖ: Überschreitung sign., St: nicht sign.) b) Welcher Stichprobenumfang müsste geplant werden, um mit dem Binomialtest auf dem Niveau α = 5% eine Überschreitung des Referenzwertes p0 = 0,5 um 0,1 mit 90%iger Sicherheit erkennen zu können? (214) 11. In sogenannten Fall-Kontroll-Studien werden Vierfeldertafeln verwendet, um die Verteilung eines (zweistufigen) Risikofaktors (Raucher/Nichtraucher) in einer Testgruppe und einer Kontrollgruppe darzustellen. Die Tabelle zeigt die (hypothetische) Vierfeldertafel einer Fall-Kontroll-Studie. Raucher Nichtraucher Testgruppe 87 60 W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc Kontrolle 78 45 29.11.11 36 a) Man prüfe für die Testgruppe, ob der Anteil der Raucher signifikant über p0=0,5 liegt. (α=5%)? (Überschr. sign.) b) Welcher Mindeststichprobenumfang müsste geplant werden, um mit dem Binomialtest eine Überschreitung von p0 =0,5 um 0,05 Einheiten mit einer Sicherheit von 80% erkennen zu können? (700) 12. Bei seinen Kreuzungsversuchen mit Erbsen untersuchte Mendel unter anderem die Nachkommen von bezüglich zweier Merkmale mischerbigen Pflanzen. Bei den Merkmalen handelte es sich um die Samenform mit den Allelen A (runde Form) und a (kantige Form) sowie um die Samenfarbe mit den Allelen B (gelbe Färbung) und b (grüne Färbung). 15 Stammpflanzen des Genotyps AaBb gaben insgesamt 529 Samen, aus denen sich Pflanzen der Genotypen AABB, AAbb, aaBB, aabb, AABb, aaBb, AaBB, Aabb sowie AaBb mit den Häufigkeiten 38, 35, 28, 30, 65, 68, 60, 67 bzw. 138 entwickelten. Nach der Mendel'schen Theorie müssten sich die neun Genotypen im Verhältnis 1:1:1:1:2:2:2:2:4 aufspalten. Kann die Theorie auf dem Testniveau α = 5% durch dieses Beobachtungsergebnis falsifiziert werden? (nein) 13. Von einer Pflanze erhielt Mendel (1866) insgesamt 62 Samen von denen 44 gelb und 18 grün gefärbt waren. Man zeige, dass das Verhältnis 44:18 der beobachteten Anzahlen nicht "signifikant" vom theoretischen Aufspaltungsverhältnis 3:1 abweicht (α = 5%)? 14. In einer Studie mit 5 Probanden wurde eine bestimmte Zielgröße X am Studienbeginn (Xb) und – nach erfolgter Behandlung - am Studienende (Xe) gemessen. Xb 57 73 44 27 32 Xe 59 74 46 26 35 a) Man erfasse die Wirkung der Behandlung durch die Differenz Y= Xe - Xb und prüfe, ob der Mittelwert von Y signifikant von Null abweicht (α=5%). (nein) b) Was kann über die Versuchsplanung in a) gesagt werden? Welcher Mindeststichprobenumfang müsste geplant werden, um mit dem Test eine Abweichung von Null in der Höhe von 50% des Mittelwerts von Y mit einer Sicherheit von 90% als signifikant erkennen zu können? (50) Anspruchsvollere Übungsbeispiele: 15. Mit einem statistischen Test soll geprüft werden, ob die Alternativhypothese H1 (z.B. Messgröße überschreitet im Mittel einen vorgegebenen Grenzwert) zutrifft, also die Nullhypothese H0 abgelehnt werden kann. Als Testniveau sei 5% vorgegeben, d.h. für die Wahrscheinlichkeit einer irrtümlichen Entscheidung gegen H0 soll gelten: P(Entscheidung für H1|H0) = 5%. Der Versuch wurde mit der Power P(Entscheidung für H1|H1) = 90% geplant. Wie groß ist die posteriori Wahrscheinlichkeit P(H1|Entscheidung für H1), wenn die a-priori Wahrscheinlichkeit dafür, dass H1 zutrifft, gleich 5% ist? (48,6%) 16. Zur Entscheidung, ob ein neues Medikament besser sei als ein herkömmliches, wird ein statistischer Test verwendet. Der Test erlaubt es, die bessere Wirkung (Hypothese H1) des neuen Medikamentes mit einer Wahrscheinlichkeit von 80% zu erkennen; ist das neue Medikament nicht besser (Hypothese H0), zeigt dies W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc 29.11.11 37 der Test mit einer Wahrscheinlichkeit von 95% an. Es möge die Annahme gelten, dass unter zehn neu entwickelten Medikamenten eines besser ist. Man berechne die Wahrscheinlichkeit, dass bei Entscheidung „neues Medikament ist besser“ dies tatsächlich zutrifft. Wie groß ist diese Wahrscheinlichkeit, wenn die a prioriWahrscheinlichkeit P(H1) nur 5% beträgt? (64%, 45,7%) 17. Die folgende Tabelle enthält Produktivitätsdaten von 60 Kohorten von je 15 weiblichen Tsetsefliegen. Als Produktivitätsmaß wird die Anzahl Y der Puparien verwendet, die in einer Kohorte bis zum 78ten Lebenstag abgelegt werden. a) Man vergleiche den Mittelwert von Y mit dem Wert 55; liegt eine signifikante Abweichung vor? Liegt die Standardabweichung signifikant über dem Wert 10? (jeweils 5%-Testniveau) (Mittelwert: Abw. nicht sign., Standardabweichung: Überschr. sign.) b) Welcher Stichprobenumfang müsste geplant werden, um eine Abweichung des Mittelwerts (vom Referenzwert) in der beobachteten Höhe mit 90%iger Sicherheit erkennen zu können? (162) c) Man stelle fest, ob die Werte der Variablen Y im Einklang mit der Annahme „H0: Y ist normalverteilt“ stehen (α = 5%). Nr. 1 2 3 4 5 6 7 8 9 10 Y Nr. 72 11 81 12 55 13 55 14 50 15 53 16 70 17 79 18 42 19 69 20 Y Nr. 54 21 57 22 69 23 62 24 73 25 58 26 46 27 50 28 27 29 68 30 Y Nr. 67 31 59 32 49 33 51 34 65 35 56 36 58 37 67 38 66 39 74 40 Y Nr. 51 41 69 42 64 43 68 44 73 45 81 46 54 47 65 48 58 49 61 50 Y Nr. 59 51 65 52 60 53 43 54 52 55 57 56 37 57 39 58 49 59 51 60 Y 58 58 60 66 75 41 40 51 37 38 18. Es sei X ein normalverteiltes Merkmal; zur Festlegung der Operationscharakteristik wird ein Lieferantenrisiko von 10% an der Gutgrenze AQL=1% und ein Abnehmerrisiko von 10% an der Schlechtgrenze LQL = 2% vereinbart. Man bestimme die Kennwerte n und k des entsprechenden Prüfplans bei bekannter und unbekannter Varianz! (84, 2.19; 286, 2.19) 19. Man bestimme die Wahrscheinlichkeit für die Zurückweisung eines Prüfloses bei der Prüfung auf fehlerhafte Einheiten, wenn die Fehlerrate 5% beträgt und mit einer Stichprobe vom Umfang n=48 und der Annahmezahl c=0 geprüft wird. Welche Wahrscheinlichkeit ergibt sich für n=48 und c=2? (91,5%; 43,3%) 20. Zur Untersuchung der Frage, welchen Anteil die Skelettmasse an der Körpermasse bei Vögeln bzw. Säugetieren hat, wurden für verschiedene Vögel und Säugetiere die Skelettmasse Y und die Körpermasse X (alle Angaben in kg) bestimmt. Jemand behauptet, dass die Skelettmasse 5% der Körpermasse ausmacht. Stehen die folgenden Daten in Widerspruch zu dieser Aussage? Man nehme eine Überprüfung auf 5%igem Niveau für Vögel und Säugetiere vor. (Vögel: ja, Säugetiere: ja) W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc 29.11.11 38 Vögel Y 1,995 0,072 0,0054 0,203 0,043 0,027 0,186 0,0058 0,028 0,00174 0,00182 0,00102 0,024 0,00618 0,00184 0,00297 0,00183 0,00076 0,00128 0,00049 0,00062 Säugetiere X 40,667 1,225 0,163 2,504 0,701 0,416 2,379 0,124 0,427 0,031 0,029 0,02 0,383 0,144 0,038 0,069 0,045 0,013 0,023 0,0087 0,0126 Y 0,193 0,227 0,0003 0,039 0,027 0,244 0,002 0,015 0,02 0,0025 0,0076 1,146 0,748 0,25 0,107 0,224 0,233 0,0173 0,27 0,448 0,135 X 3,35 3,915 0,0063 0,79 0,82 4,836 0,03 0,275 0,365 0,03 0,115 22,7 11,95 3,395 2,46 4,26 4,21 0,35 4,45 6,725 1,56 4.7 REPETITORIUM: BEGRIFFE UND METHODEN 1. Sie wollen prüfen, ob der Mittelwert µ einer normalverteilten Zufallsvariablen einen vorgegebenen Grenzwert µο überschreitet; das Signifikanzniveau sei α. Begründen Sie, warum Sie beim einseitigen Test mit den Hypothesen H0: µ ≤ µ0, H1: µ > µ0 einen signifikanten Ausgang erhalten können, nicht aber beim 2-seitigen Test mit den Hypothesen H0: µ = µ0, H1: µ ≠ µ0. Antwort: Ein Testausgang wird als signifikant bezeichnet, wenn im Test eine Entscheidung gegen die Nullhypothese erfolgt. Eine Überschreitung ist beim zweiseitigen Test signifikant, wenn TGs > tn-1,1-α/2 gilt; die Wahrscheinlichkeit dafür ist durch P2 = P(TGs > tn-1,1-α/2) gegeben. Beim 1-seitigen Test auf Überschreitung ist die Nullhypothese abzulehnen, wenn TGs > tn-1,1-α gilt; die entsprechende Wahrscheinlichkeit ist P1=P(TGs > tn-1,1-α). Wegen tn-1,1-α/2 > tn-1,1-α ist P2 < P1 (Hinweis: die Wahrscheinlichkeiten sind gleich den „Ausläuferflächen“ der Verteilungsfunktion der Testgröße über den Intervallen TG > tn-1,1-α/2 bzw. TG > tn-1,1-α). 2. Welche Vorraussetzungen sind bei Anwendung des Binomialtests zu beachten, wenn Sie von der Normalverteilungsapproximation Gebrauch machen? Antwort: Hypothesen: H0: p = p0, H1: p ≠ p0 W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc 29.11.11 39 (bzw. H0: p ≤ p0, H1: p > p0 oder H0: p ≥ p0, H1: p < p0) Voraussetzungen: n > 20 und 10 ≤ n p0 ≤ n –10 3. Was versteht man unter Testgüte (Power)? Antwort: Die Testgüte ist die Wahrscheinlichkeit einer Entscheidung für die Alternativhypothese (d.h. Ablehnung der Nullhypothese); diese Wahrscheinlichkeit hängt vom Parameter ab, über den im Alternativtest eine Entscheidung herbeigeführt werden soll. Man betrachte z.B. das Hypothesenpaar H0: µ = µ0, H1: µ ≠ µ0; für die durch die Alternativhypothese festgelegten Parameterwerte µ ≠ µ0 ist die Testgüte jedenfalls größer als das Signifikanzniveau α. Die Tests werden i. Allg. so ausgelegt, dass die Testgüte für Parameterwerte, die um eine relevante Abweichung ∆ vom Referenzwert µ0 abweichen, also für Parameterwerte außerhalb des Intervalls (µ0- ∆, µ0 +∆), möglichst groß (jedenfalls größer als 80%) ist. 4. Jemand wendet den Binomialtest an, um eine Entscheidung zwischen den Hypothesen H0: p ≥ p0 und H1: p < p0 herbeizuführen. Als Signifikanzniveau wird 5% festgelegt. Ist die Wahrscheinlichkeit eines nicht-signifikanten Ausgangs mit diesem Signifikanzniveau größer als bei einem Test auf 1%igen Niveau? Antwort: Der Ausgang ist nicht-siginfikant, wenn die Nullhypothese nicht abgelehnt werden kann. Beim 1-seitigen Binomialtest auf Unterschreitung eines Referenzwertes ist dies der Fall, wenn TGs ≥ zα gilt. Wegen z0,05 = - 1,64 > z0,01 = -2,33 ist die Frage zu verneinen, weil der „Ablehnungsbereich“ bei kleinerem Signifikanzniveau kleiner ist. 5. Sie wollen für einen Spielwürfel überprüfen, ob die diskrete Zufallsvariable „Anzahl von geraden Zahlen beim 10maligen Ausspielen eines Würfels“ einer Binomialverteilung folgt. Wie gehen Sie dabei vor? Antwort: Wir gehen von einem „fairen“ Würfel aus, d.h. einem Würfel, bei dem jeder Ausgang (Augenzahl 1, 2, 3, 5, 5 oder 6) mit der gleicher Wahrscheinlichkeit 1/6 eintritt. Dann ist die Wahrscheinlichkeit, beim einmaligen Ausspielen des Würfels eine gerade Augenzahl zu erhalten, gleich p=1/2. Die Zufallsvariable X = „Anzahl der Ausgänge mit gerader Augenzahl beim 10-maligen Ausspielen des Würfels, Bn,p-verteilt mit den Parametern p=1/2 und n=10. Die möglichen Werte von X sind x=0, 1, ...., 10; diese treten mit den Wahrscheinlichkeiten Bn,p(0), Bn,p(1), ..., Bn,p(10) auf. Ob dieses Verteilungsmodell zutrifft, kann im Rahmen eines Anpassungstests überprüft werden. Die Nullhypothese lautet: H0: „X ist Bn,p-verteilt“ , die Alternativhypothese H1: „X ist nicht Bn,p-verteilt“. Die erforderlichen beobachteten Häufigkeiten O von X=x werden durch N-maliges Wiederholen der Versuchsreihe „10-maliges Ausspielen des Würfels“ gewonnen, z.B. mit N=100. Die erwarteten Häufigkeiten E von X=x sind durch NBn,p(0), NBn,p(1), ..., NBn,p(10) gegeben. Um „schwach besetzte“ Häufigkeitsklassen zu vermeiden (sie den entsprechenden Hinweis in der Formelsammlung), werden die Häufigkeitsklassen zu z.B. 5 W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc 29.11.11 40 Klassen aggregiert. Damit wird die GF-Statistik gebildet; liegt diese über dem 2 95%-Quantil der χ 4 -Verteilung, wird H0 auf 5%igem Testniveau abgelehnt, andernfalls beibehalten. W. Timischl: Angewandte Statistik, Testen_I_11_Text.doc 29.11.11