In diesem Abschnitt wird die Stichprobenverteilung der Varianz aus einer Gesamtheit untersucht. Da die Varianz immer eine nicht-negative Größe ist, kann also die Verteilung der Stichproben-Varianzen nicht normalverteilt sein. Die Längen (in Millimetern) von 32 serienmäßig hergestellten Bolzen einer Lieferung sind in der folgenden Datenreihe dargestellt. Die Längen der Bolzen sind normalverteilt. 2,8 3,8 4,9 6,2 2,8 4,2 5,2 6,3 2,9 4,4 5,2 3,1 4,6 5,5 3,2 4,6 5,6 xi 3,5 4,6 5,6 3,6 4,6 5,7 3,7 4,7 5,7 3,8 4,8 6,1 3,8 4,9 6,1 Es wurden alle möglichen Stichproben vom Umfang N = 5 mit Zurücklegen aus dieser Gesamtheit entnommen. Dabei wurde für jede Stichprobe die Varianz berechnet. Einige der Ergebnisse sind in der folgenden Tabelle bzw. Abb. angezeigt. 0,0 0,0 0,0 si² . . . . . . . 0,0 3,675 3,675 3,675 1048576 Varianzen 1 s² = f(x) Einige Stichproben vom Umfang N = 5 aus der Gesamtheit N (xi – x)² N–1 i s² = 0,72 s² = 2, 49 3,1 6,1 3,2 6,1 4,6 6,1 4,6 s² = 3,675 4,6 6,1 4,2 6,3 6,3 6,3 2,8 1 2 3 4 5 6 7 x 2,8 15 f(s²) f(x) 0.6 0.5 Stichproben der Größen: N=5 0.3 0.25 0.2 0.4 Χ² = (N – 1) S ² ² 0.3 0.15 0.2 0.1 0.1 0.05 s² x 2 3 4 5 6 1 7 2 3 4 f v ( χ ²) ν = N –1 Die Verteilung von StichprobenVarianzen aus einer normalverteilten Gesamtheit entspricht einer NichtNormalverteilung. ν = 4 0.2 0.15 0.1 0.05 2 0 4 6 8 χ² Theorem Sei S ² die Varianz einer Stichprobe der Größe N aus einer normalverteilten Grundgesamtheit mit der Varianz ² , so folgt die Variable Χ2 = ( N − 1) S 2 σ 2 einer Chi-Quadrat-Verteilung mit ν = N – 1 Freiheitsgeraden. Chi-Qudrat-Verteilung Die Verteilung der stetigen Zufallsvariable Χ ² mit der Dichtefunktion: ( f χ2 )= ν 1 2ν 2 Γ (ν 2 ) (χ 2 )2 −1 e − χ2 2 für χ2 > 0 mit ν > 0 heißt Chi-Qudrat-Verteilung mit ν Freiheitsgeraden. Ihre Verteilungsfunktion ist: Fν (χ ) 2 = P (Χ 2 ≤ χ 2 ) χ2 = 0 1 2ν 2 Γ (ν 2 ) ν u 2 −1 e − u 2 du 16 ! " # Im Anhang befindet sich eine Tabelle mit den Werten der Verteilungsfunktion F ν ( χ ² ) der Chi-Quadrat-Verteilung für beliebige χ ² ≥ 0. f ν Dichtefunktionen verschiedener Chi-Quadrat-Verteilungen (χ²) ν = 1 ν = 5 ν = 9 χ² $ Die Verteilung der Längen der Bolzen in der Lieferung des vorigen Beispiels (Bsp. 5) entspricht einer Normalverteilung mit einer Varianz von 1,12. Wie groß ist die Wahrscheinlichkeit, dass man eine Stichprobe vom Umfang N = 5 (mit Zurücklegen), aus der Lieferung erhält, deren Varianz für die Länge der Bolzen kleiner als 0,2 [mm] ist? %& # χ 02 = ( N − 1 ) s 02 σ 2 = ( 5 − 1) ⋅ 0 , 2 1 , 12 Anzahl der Freiheitsgeraden: = 0 , 714 ν=N–1 = 5–1=4 Also ist die Wahrscheinlichkeit: ( P S 2 ≤ 0,2 ) = P ( Χ2 ≤ 0 , 714 ) = F4 ( 0 , 714 ) ≈ 0 , 05 ' ( Sei p der Anteilswert einer beliebigen Eigenschaft A einer Grundgesamtheit. Und sei X die Anzahl der Elemente mit Eigenschaft A in einer Stichprobe vom Umfang N aus ∧ einer Gesamtheit. Dann gibt P den Anteilswert in einer Stichprobe an. ∧ P = X N Wegen der Unabhängigkeit der einzelnen Züge liegt ein N-faches Bernouli-Experiment vor. Somit ist X binomialverteilt. Folglich ist die Stichproben-Verteilung von Anteilswerten auch binomialverteilt. 17 ) Eine Universität hat 4 Studenten (Grundgesamtheitsgröße: NG = 4 ). Die Noten der 4 Studenten sind jeweils A ; B ; C bzw. D . Geben Sie den Anteilswert (die Wahrscheinlichkeit) für die Note „A“ bzw. für die Note „kein A“ in der Grundgesamtheit an. Es sollen Stichproben vom Umfang N = 2 mit Zurücklegen entnommen werden. Geben Sie alle möglichen Stichproben an. Geben Sie für jede Stichprobe an, wie oft man 0-mal, 1-mal bzw. 2-mal die Note „A“ erhält. Und berechnen Sie die jeweiligen Anteilswerte dafür. %& # Gesamtheit: { A ; B; C ; D } ; NG = 4 p=P(A)=¼ A : „Note A“ ; q = P (A ) = ¾ Alle möglichen verschiedenen Stichproben vom Umfang N = 2 lauten: A {A;A} {B;A} {C;A} {D;A} A B C D B {A;B} {B;B} {C;B} {D;B} C {A;C} {B;C} {C;C} {D;C} D {A;D} {B;D} {C;D} {D;D} ∧ P = X N X=0;1;2 x x x x = = = = 2 1 1 1 x x x x = = = = 1 0 0 0 x x x x = = = = 1 0 0 0 x x x x = = = = 1 0 0 0 ∧ = 1 p ∧ p ∧ p ∧ ∧ = ½ p = ½ p = ½ p ∧ p ∧ ∧ p = ½ ∧ p ∧ = 0 p = 0 p = 0 ∧ ∧ p = ½ ∧ p ∧ = 0 p = 0 p = 0 ∧ ∧ p = ½ = 0 = 0 = 0 ' * + Ergänzen Sie aus dem vorigen Beispiel die erste Tabelle für die Wahrscheinlichkeitsverteilung der Treffer für die Note „A“ in den Stichproben. Und ergänzen Sie die zweite Tabelle für die Wahrscheinlichkeitsverteilung der Anteilswerte der Stichproben. Zeichnen Sie die Wahrscheinlichkeitsverteilung für beide Verteilungen. %& # ∧ X=k P(X=k) 0 9 16 1 P 0 ½ ∧ f( P ) 18 P( X = k ) Stichproben-Verteilung der Treffer X für die Note A f(p) 9 16 9 16 6 16 6 16 X=k 1 16 01 12 Stichproben-Verteilung der Anteilswerte für die Note A 1 16 01 2 ½2 1 p ' * + Zeigen Sie, dass die Wahrscheinlichkeitsverteilung der Stichproben der X-Werte für die Note „A“ und folglich die Verteilung der Stichproben-Anteilswerte für die Note „A“ einer Binomial-Verteilung mit dem Anteilswert für die Note „A“ aus der Gesamtheit gehorchen. %& # Stichproben-Verteilung des Anteilswertes Sei p der Anteilswert einer beliebigen Eigenschaft A einer Grundgesamtheit und sei ∧ X der Anteilswert für die Anzahl X von Treffer für das Eintreten einer Eigenschaft P = N (eines Ereignisses) A in Stichproben der Größe N aus der Grundgesamtheit. Dann gehorchen die Stichproben-Verteilung von X sowie die von den Anteilswerten einer Binomialverteilung mit p = P ( A ). Da die Stichproben-Verteilung von X einer Binomilaverteilung mit p gehorcht, gelten folgende Formeln für den Erwartungswert bzw. die Standardabweichung: µ = Np bzw. σ = N pq Für sehr große N kann die Binomial-Verteilung durch die Normal-Vertetilung angenähert werden. 19 Approximation der Stichproben-Verteilung von Anteilswerten durch die NormalVerteilung Sei p der Anteilswert einer beliebigen Eigenschaft A einer Grundgesamtheit und sei ∧ X der Anteilswert für die Anzahl X von Treffern für das Eintreten einer P = N Eigenschaft A in Stichproben der Größe N aus der Grundgesamtheit. Für große N und p-Werte die sich deutlich von 0 und 1 unterscheiden gehorcht dann in guter Näherung die standardisierte Zufallsvariable ∧ Z = N ⋅P − N ⋅ p N⋅ p⋅q einer Normal-Verteilung. ! " # Die Näherung ist zulässig, wenn die Bedingung: N p q > 9 erfüllt ist. Für Werte von p , die sich nicht sehr von ½ unterscheiden, ist die Näherung auch zulässig, wenn die Bedingungen: N p ≥ 5 UND N q ≥ 5 erfüllt sind. ' * In einer großen Serienproduktion von Chips sind von den 5000 hergestellten Chips 1000 defekt. Es soll eine Stichprobe vom Umfang 100 (ohne Zurücklegen) gezogen werden. Wegen der großen Gesamtheit kann die Entnahme als Ziehen mit Zurücklegen betrachtet werden. Wie groß ist die Wahrscheinlichkeit, dass in der Stichprobe weniger als 30% der Chips defekt sind? %& # 20