Inhaltsverzeichnis 1 Vorbemerkungen 1 2 Zufallsexperimente - grundlegende Begriffe und Eigenschaften 2 3 Wahrscheinlichkeitsaxiome 4 4 Laplace-Experimente 6 5 Hilfsmittel aus der Kombinatorik 7 6 Bedingte Wahrscheinlichkeiten und Unabhängigkeit von Ereignissen 10 7 Zufallsvariable und Verteilungsfunktion 16 8 Diskrete Zufallsvariablen 18 9 Stetige Zufallsvariable 28 10 Funktionen von einer oder mehreren Zufallsvariablen 39 11 Grenzwertsätze 46 12 Parameterschätzungen und Schätzfunktionen 49 13 Konfidenzintervalle 51 11 Grenzwertsätze Bei vielen in der Praxis vorkommenden Zufallsvariablen kann man davon ausgehen, dass sie additiv aus vielen unabhängigen nichtdominierenden Einzeleinflüssen zusammengesetzt sind. In diesem Zusammenhang interessiert die Wahrscheinlichkeitsverteilung der Summe Zn = X1 + X2 + . . . + Xn . Gilt E(Xi ) = µ und V ar(Xi ) = σ 2 für alle i = 1, 2, . . . , n, so gilt E(Zn ) = nµ und V ar(Zn ) = nσ 2 . Für n −→ ∞ sind dies unendliche Größen (falls µ 6= 0 bzw. σ 6= 0). Man betrachtet daher die standardisierte Zufallsvariable Zn − nµ Zn − E(Zn ) √ , = Yn = p σ n V ar(Zn ) womit dann E(Yn ) = 0 und V ar(Yn ) = 1 gilt. Der folgende zentrale Grenzwertsatz besagt, dass Yn näherungsweise normalverteilt ist. Die Normalverteilung spielt daher in der Statistik eine besondere Rolle. 11.1 Satz (Zentraler Grenzwertsatz) Die Zufallsvariablen X1 , X2 , . . . , Xn seien für jedes n ∈ N unabhängig mit derselben Verteilung, d. h. insbesondere E(Xi ) = µ und V ar(Xi ) = σ 2 für alle i. Dann gilt für die Verteilungsfunktion der sogenannten standardisierten Summen Pn Xi − nµ Zn − nµ √ Yn = i=1 √ = σ n σ n 1 lim P (Yn ≤ x) = Φ(x) = √ n→∞ 2π Z x e− u2 2 du −∞ 11.2 Bemerkung Pn Für große n (Faustregel n ≥ 30) ist Yn ungefähr N (0, 1)-verteilt, die Summe Zn = i=1 Xi ungefähr P 2 n N (nµ, nσ 2 )-verteilt und das arithmetische Mittel X = n1 i=1 Xi ungefähr N (µ, σn )-verteilt. 11.3 Beispiel Ein Autohaus hat ermittelt, dass bei einer Standardabweichung von σ = 1, 6 durchschnittlich alle 2, 4 Werktage ein PKW des Typs Fiasko verkauft wird. Mit welcher Wahrscheinlichkeit werden im Laufe eines Quartals (75 Werktage) mindestens 35 Fiaskos verkauft? Sei Xi , i = 1, P2,n . . . , n, die zufällige Zeitspanne zwischen dem Verkauf des (i−1)-ten und des i-ten Fiaskos. Dann ist Zn = i=1 Xi die zufällige Zeitspanne bis zum Verkauf des n-ten Fiaskos. Gesucht ist also P (Z35 ≤ 75). Wir gehen davon aus, dass die Xi unabhängig sind. Es gilt E(Z35 ) = 35·2, 4 = 84 und V ar(Z35 ) = 35·1, 62 = 89, 6. Wegen n = 35 können wir nach Bemerkung 11.2 annehmen, dass Z35 näherungsweise N (84; 89, 6)-verteilt ist. Somit ist 75 − 84 P (Z35 ≤ 75) = Φ( √ ) ≈ Φ(−0, 95) ≈ 0, 171 89, 6 Für grobe Abschätzungen ohne große Vorinformationen dient die folgende Tschebyscheffsche Ungleichung. 46 11.4 Satz (Tschebyscheffsche Ungleichung) Sei X Zufallsvariable mit E(X) = µ und V ar(X) = σ 2 . Dann lässt sich für jedes c > 0 die Wahrscheinlichkeit für die Abweichung vom Erwartungswert abschätzen durch P (|X − µ| ≥ c) ≤ σ2 c2 denn: Für eine stetige Zufallsvariable X mit der Dichte f (x) gilt: V ar(X) = σ2 Z ∞ = (x − µ)2 f (x) dx {z } −∞ | ≥0 ≥ Z (x − µ)2 f (x) dx {x:|x−µ|≥c} | {z } ≥c2 ≥ c2 Z f (x) dx {x:|x−µ|≥c} = c2 P (|X − µ| ≥ c) Der Beweis für den diskreten Fall geht analog. 11.5 Beispiel Der Nennwert der Kapazität von Kondensatoren sei 300µF . Die tatsächlichen Kapazitäten X streuen jedoch mit einer Standardabweichung von σ = 12µF um den Nennwert. Eine obere Schranke für die Wahrscheinlichkeit, dass die Kapazität um mindestens 5% vom Nennwert abweicht ist 122 P (|X − 300| ≥ 15) ≤ 2 = 0, 64 . 15 Wissen wir, dass die Kapazität N (300, 122 )-verteilt ist, so erhalten wir für die Wahrscheinlichkeit einer Abweichung von mindestens 5% P (|X − 300| ≥ 15) = 1 − P (−15 ≤ X − 300 ≤ 15) 15 X − 300 15 ≤ ≤ ) = 1 − P (− 12 12 12 = 1 − (Φ(1, 25) − Φ(−1, 25)) = 2 − 2Φ(1, 25) ≈ 0, 2113 Man sieht, dass die zusätzliche Kenntnis der Wahrscheinlichkeitsverteilung mit erheblichem Informationsgewinn verbunden ist. Wegen des folgenden schwachen Gesetzes der großen Zahlen liegt für große n das arithmetische Mittel (aus Messungen, Stichproben) in der Nähe des Erwartungswertes. Man nimmt daher das arithmetische Mittel auch als Schätzwert für den Erwartungswert. 11.6 Satz (Schwaches Gesetz der großen Zahlen) Die Zufallsvariablen X1 , X2 , . . . , Xn seien alle untereinander unabhängig mit gleichem Erwartungswert µ und gleicher Varianz σ 2 . Dann gilt für jedes ε > 0 n 0 ≤ P (| 1X σ2 Xi − µ| ≥ ε) ≤ n i=1 n · ε2 47 und damit n lim P (| n→∞ 1X Xi − µ| ≥ ε) = 0 n i=1 11.7 Beispiel Jemand geht an 250 Tagen stets zu einem zufällig gewählten Zeitpunkt zur Bushaltestelle. Die zufällige Wartezeit Xi am i-ten Tag bis zum Eintreffen des nächsten Busses habe den Erwartungswert µ = 3 Minuten und eine Varianz von σ 2 = 1, 5 Minuten2 . Gesucht ist eine untere Schranke für die Wahrscheinlichkeit, dass die mittlere Wartezeit zwischen 2, 5 und 3, 5 Minuten liegt. 250 P (| 1 X Xi − 3| < 0, 5) = 250 i=1 250 1 − P (| ≥ 1− 48 1 X Xi − 3| ≥ 0, 5) 250 i=1 1, 5 = 0, 976 250 · 0, 52 12 Parameterschätzungen und Schätzfunktionen Für unbekannte Parameter, z. B. Erwartungswert, Varianz, Erfolgswahrscheinlichkeit etc., sollen ausgehend von einer konkreten Stichprobe Schätzwerte konstruiert werden. Dies geschieht mit Hilfe von Schätzfunktionen. Ist θ ein unbekannter Parameter, {X1 , X2 , . . . , Xn } eine mathematische Stichprobe und {x1 , x2 , . . . , xn } eine konkrete Realisierung einer solchen Stichprobe, so bezeichnen wir mit θ̂ = θ̂(X1 , X2 , . . . , Xn ) die zufällige Schätzfunktion und mit θ̂ = θ̂(x1 , x2 , . . . , xn ) den auf der Grundlage der konkreten Stichprobe berechneten Schätzwert. Von einer Schätzfunktion erwartet man, daß ihre Realisierungen im Mittel um den Erwartungswert streuen und nicht einseitige Abweichungen nach oben oder unten aufweisen. Das führt zu folgender Definition. 12.1 Definition Eine Schätzfunktion θ̂ für den Parameter θ heißt erwartungstreu, wenn E(θ̂(X1 , X2 , . . . , Xn )) = θ gilt. Sie heißt asymptotisch erwartungstreu, wenn lim E(θ̂(X1 , X2 , . . . , Xn )) = θ n→∞ Wir geben im folgenden eine tabellarische Übersicht. Unbekannter Schätzfunktion Parameter für unbekannten Parameter 1 n Pn Erwartungswert E(X) X= Varianz V ar(X) S2 = Erfolgswahrscheinlichkeit p bei einem Bernoulli-Experiment P̂ = X n , wobei X die zufällige Anzahl der Erfolge bei n-facher Ausführung eines Bernoulli-Exp. bez. 1 n−1 i=1 Xi Pn i=1 (Xi − X)2 Schätzwert für unbekannten Parameter (aus konkreter Stichprobe) Mittelwert der konkreten Stichprobe Pn x1 , x2 , . . . , xn x = n1 i=1 xi Varianz der konkreten Stichprobe x1 , x2 , . . . , xn Pn 1 2 s2 = n−1 i=1 (xi − x) Relative Häufigkeit für Erfolg bei n-facher Ausführung eines BernoulliExp. p̂ = nk mit k Anzahl der Erfolge 12.2 Beispiel Mit drei verschiedenen Würfeln wird je 50 mal gewürfelt. Die Verteilung der Augenzahlen und die Schätzwerte für die jeweiligen Erwartungswerte sind in der folgenden Tabelle angegeben. 1 2 3 4 5 6 Schätzwert Würfel 1 6 7 7 6 10 14 x = 3, 98 Laplace Würfel Würfel 2 14 10 5 2 9 10 x = 3, 24 E(X) = 3, 5 Würfel 3 9 7 13 7 7 7 x = 3, 34 Geht es um die Frage, ob eine 6 gewürfelt wurde oder nicht, so haben wir folgende Zusammenhänge. 6 keine 6 Schätzwert Würfel 1 14 36 p̂ = 14 Laplace Würfel 50 = 0, 28 Würfel 2 10 40 p̂ = 10 = 0, 2 p = 16 = 0, 16 50 7 Würfel 3 7 43 p̂ = 43 = 0, 14 49 12.3 Bemerkung X, S 2 und P̂ sind erwartungstreu, S = tungstreu. √ S 2 als Schätzfunktion für die Standardabweichung ist nicht erwar- In der folgenden Tabelle sind die Schätzwerte für die Parameter spezieller Wahrscheinlichkeitsverteilungen, die insbesonders für technische Anwendungen wichtig sind zusammengestellt. Verteilung/Dichte Schätzwert Bemerkungen Binomialverteilung Parameter k: Anzahl der Erfolge bei n i k (n−i) pi = i p (1 − p) p̂ = n n-facher Durchführung i = 0, 1, . . . , n eines Bernoulli-Experimentes Poisson-Verteilung Erwartungswert x: Mittelwert der i pi = λi! e−λ , λ̂ = x Stichprobe i=0,1,. . . Exponentialverteilung Parameter λ x: Mittelwert der f (x) = λe−λx , λ̂ = x1 Stichprobe x≥0 Normalverteilung Erwartungswert x: Mittelwert der µ̂ = x Stichprobe f (x) = √ 1 e− 2πσ (x−µ)2 2σ 2 s2 : Varianz der Stichprobe Varianz σ̂ 2 = s2 12.4 Beispiel Die Lebensdauer T eines elektronischen Bauteils sei exponentialverteilt mit dem unbekannten Parameter λ. Es liege folgende Stichprobe vom Umfang 8 vor. Bauteil i 1 2 3 4 5 6 7 8 Lebensdauer ti 950 980 1150 770 1230 1210 990 1120 in Stunden Der Mittelwert für die Lebensdauer beträgt 8 t= der Schätzwert für λ somit λ̂ = 1X ti = 1050 , 8 i=1 1 1 ≈ 9, 52381̇0−4 . = 1050 t 12.5 Beispiel Wir geben eine Schätzung für den Ausschußanteil p bei der Serienproduktion von Glühlampen. Bei Stichproben vom Umfang n = 300 waren k = 6 defekt. Somit ist p̂ = k 6 = = 0, 02 = 2% . n 300 50 13 Konfidenzintervalle Schätzungen für die Parameter und Werte von Wahrscheinlichkeitsverteilungen entstehen in der Regel aus Stichproben. Ein Schätzwert kann daher (insbesondere bei zu kleinem Stichprobenumfang) erheblich vom tatsächlichen Wert abweichen. Man konstruiert daher sogenannte Intervallschätzungen, d. h. es werden Intervalle bestimmt, bei denen man mit einer gewissen Wahrscheinlichkeit davon ausgehen kann, daß sie den tatsächlichen Parameterwert enthalten. Wir interessieren uns z. B. für einen bestimmten Parameter θ der Wahrscheinlichkeitsverteilung einer Zufallsvariablen X. Ziel ist es, auf der Grundlage einer Stichprobe {X1 , X2 , . . . , Xn } zufällige Grenzen Gu und Go zu konstruieren, so daß θ ∈ [Gu , Go ] mit einer vorgegebenen Wahrscheinlichkeit 1 − α. 13.1 Definition (Konfidenzintervall) Ein Intervall [Gu , Go ] mit der Eigenschaft P (Gu ≤ θ ≤ Go ) = 1 − α heißt zufälliges Konfidenz- oder Vertrauensintervall für den Parameter θ zum Konfidenzniveau 1 − α. Gu und Go heißen untere und obere Konfidenz- oder Vertrauensgrenze. L = Go − Gu ist die Länge des Konfidenzintervalls. Mit α bezeichnet man die Irrtumswahrscheinlichkeit und mit (1 − α) die Sicherheitswahrscheinlichkeit. 13.2 Beispiel Ist für den mittleren Durchmesser θ von Kugeln [Gu , Go ] = [100, 103] zum Konfidenzniveau 0.9, so bedeutet dies: Der wahre Wert von θ liegt mit einer Sicherheitswahrscheinlichkeit von 90% im Intervall [100, 103]. Konfidenzintervalle lassen sich folgendermaßen interpretieren. Konstruiert man viele solcher Intervalle (durch voneinander unabhängige, unter gleichen Voraussetzungen erhobene Stichproben), so enthalten durchschnittlich 90% der so konstruierten Intervalle den wahren Wert von θ. Konfidenzintervalle werden mit Hilfe zufälliger Stichproben konstruiert. Die jeweilige Wahrscheinlichkeitsverteilung muß bekannt sein. Wir betrachten im folgenden konkrete Fragestellungen, wobei sich 1. bis 4. auf normalverteilte und 5. auf binomialverteilte Zufallsvariablen beziehen. a) Konfidenzintervall für den Erwartungswert bei bekannter Varianz (normalverteilten Zufallsvariable) Die Zufallvariablen X1 , X2 , . . . , Xn seien alle N (µ, σ 2 )- verteilt mit bekanntem σ und unbekanntem µ. Das Ziel ist die Bestimmung eines Konfidenzintervalls für den Erwartungswert µ zum Konfidenzniveau 1 − α bei vorgegebenem α, d. h. eines Intervalls, in dem mit einer Sicherheitswahrscheinlichkeit von 1 − α der tatsächliche Parameter µ enthalten ist. Pn √ 2 Das arithmetische Mittel X = n1 i=1 Xi ist N (µ, σn )-verteilt d. h. (vgl. Satz 9.6) U = X−µ n ist σ · N (0, 1)-verteilt. qε und q1−ε seien das ε- und das (1 − ε)-Quantil der Standardnormalverteilung, d. h. es gilt Φ(qε ) = ε und Φ(q1−ε ) = 1 − ε. Wegen der Symmetrie der Dichte der Standardnormalverteilung gilt q1−ε = −qε . Wir setzen für das folgende zweckmäßigerweise uε = −qε = q1−ε für 0 < ε < 1/2. Für ε = α/2 gilt nun: P (−u α2 ≤ U ≤ u α2 ) = Φ(u α2 ) − Φ(−u α2 ) = 1 − α Durch Ersetzen von U erhält man: P (−u α2 ≤ X −µ √ · n ≤ u α2 ) σ σ σ = P (X − u α2 · √ ≤ µ ≤ X + u α2 · √ ) n n = 1−α 51 Also ist σ σ [X − u α2 · √ , X + u α2 · √ ] n n ein Konfidenzintervall für den Parameter µ zum Konfidenzniveau 1 − α. Die Länge des Konfidenzintervalls beträgt: σ 2u α2 · √ n Wegen des Faktors √1n muß also zur Halbierung der Länge des Konfidenzintervalls der Stichprobenumfang n vervierfacht werden. 13.3 Beispiel (Zahlenwerte Quantile) α = 0, 1 : u0,05 α = 0, 05 : u0,025 α = 0, 01 : u0,005 = q0,95 = q0,975 = q0,995 ≈ 1, 64 Irrtumswahrscheinlichkeit: ≈ 1, 96 ≈ 2, 58 10% 5% 1% 13.4 Beispiel (Schmelzpunkt unbekannte Legierung) Die Messungen des Schmelzpunktes einer unbekannten Legierung in ◦ C ergaben folgende Werte: 464, 4 469, 7 469, 2 469, 5 461, 8 468, 7 469, 5 463, 9 Die Varianz σ 2 = 6, 25 sei bekannt. Der Schätzwert für µ für die konkrete Stichprobe vom Umfang 8 beträgt x ≈ 467, 09. Für die Bestimmung des Konfidenzintervalls zum Konfidenzniveau 0, 95 ergibt sich: α = 0, 05, u α2 = u0,025 ≈ 1, 96, d. h. √ 6, 25 √ ≈ 465, 36 8 √ 6, 25 σ α √ ≈ 468, 82 ≈ 467, 09 + 1, 96 · √ go = x + u 2 · n 8 σ gu = x − u · √ ≈ 467, 09 − 1, 96 · n α 2 Insgesamt erhalten wir somit das Konfidenzintervall [465, 36; 468, 82] mit einer Sicherheitswahrscheinlichkeit von 95%. 13.5 Bemerkung In der Praxis kennt man üblicherweise auch die Varianz nicht und muß sich mit einem entsprechenden √ Schätzwert behelfen, d. h. wir betrachten τn−1 = X−µ n, wobei S n 1 X S = (Xi − X)2 n − 1 i=1 2 eine Schätzfunktion für die Varianz ist. Für die folgenden Überlegungen benötigen wir zunächst noch weitere Verteilungen, die bisher noch nicht behandelt wurden. 52 • Chi-Quadrat-Verteilung Eine Zufallsvariable χ2n genügt einer Chi-Quadrat-Verteilung (χ2 -Verteilung) mit n Freiheitsgraden, wenn sie die Gestalt χ2n = X12 + X22 + · · · + Xn2 hat, wobei X1 , X2 , . . . , Xn unabhängige N (0, 1)-verteilte Zufallsgrößen sind. 13.6 Bemerkung i) Die Dichte der χ2 -Verteilung ist definiert durch n−2 x Kn · x 2 · e − 2 fχ2n (x) = 0 wobei 1 n Kn = n · Γ( ) mit Γ(α) = 2 22 Z ∞ falls x > 0 sonst e−t · tα−1 dt , α > 0 . 0 Für n ∈ N ist speziell: Γ(n + 1) = n! ii) Die Quantile der χ2 -Verteilung sind für verschiedene Werte von n tabelliert. iii) E(χ2n ) = n, da V ar(Xi ) = 1 = E(Xi2 ) − (E(Xi ))2 , | {z } =0 also E(Xi2 ) = 1 für alle i = 1, 2, . . . , n. • t-Verteilung von Student Diese Verteilung stammt von dem Mathematiker Gosset, wurde von ihm aber unter dem Pseudonym Student veröffentlicht. Eine Zufallsvariable τn genügt einer t-Verteilung (Student-Verteilung), wenn sie von der Form X τn = q χ2n n ist. Dabei sind X und χ2n unabhängige Zufallsvariablen, X ist N (0, 1)-verteilt und χ2n ist χ2 verteilt mit n Freiheitsgraden. 13.7 Bemerkung i) Die Dichte der t-Verteilung ist gegeben durch: fτn (t) = Γ( n+1 1 t2 n+1 2 ) ·√ · (1 + ) 2 n Γ( 2 ) n n·π ii) Die Quantile der t-Verteilung sind in Abhängigkeit von n tabelliert. 2 iii) E(τn ) = 0 für n ≥ 2 und V ar(τn ) = n−2 für n ≥ 3 iv) Für n → ∞ konvergiert die t-Verteilung gegen die N (0, 1)-Verteilung. Faustregel: Für n > 100 kann man die Standardnormalverteilung statt der t-Verteilung benutzen. v) Die Dichte der t-Verteilung ist symmetrisch zur y-Achse. 13.8 Satz Die oben definierte Zufallsvariable τn−1 = (ohne Beweis) X−µ √ n S 53 genügt einer t-Verteilung mit n − 1 Freiheitsgraden. b) Konfidenzintervall für den Erwartungswert bei unbekannter Varianz √ n. Wir gehen genauso vor wie im Fall der bekannten Varianz. Sei nun τn−1 = X−µ S Setze tn−1, α2 = q1− α2 mit dem (1 − α2 )-Quantil q1− α2 . Dann ist −tn−1, α2 = q α2 Somit: X − µ√ n ≤ tn−1, α2 ) = S S S · √ ≤ µ ≤ X + tn−1, α2 √ ) = n n P (−tn−1, α2 ≤ ⇐⇒ P (X − tn−1, α2 Also ist 1−α 1−α S S [X − tn−1, α2 √ , X + tn−1, α2 √ ] n n ein Konfidenzintervall für den Parameter µ zum Konfidenzniveau 1 − α. Für n > 100 (vgl. Bemerkung 13.7) kann man u α2 statt tn−1, α2 verwenden. 13.9 Beispiel (Fortsetzung von Beispiel 13.4) x = s2 t7;0,025 467, 09 8 1X = (xi − x)2 ≈ 10, 12 =⇒ s ≈ 3, 18 7 i=1 = q0,975 = 2, 365 d. h. das Konfidenzintervall ist [464, 44; 469, 74] mit einer Sicherheitswahrscheinlichkeit von 95%. Das Konfidenzintervall ist durch die Schätzung der Varianz breiter. c) Einseitige Konfidenzintervalle Manchmal möchte man wissen, ob der Erwartungswert einen bestimmten Wert nicht unter- oder überschreitet (z. B. Mindestlebensdauer einer Glühlampe). Die Aufgabe ist in solchen Fällen die Bestimmung einer unteren bzw. oberen Schranke für E(X), d. h. eines Konfidenzintervalls der Form [Gu , ∞) bzw. (−∞, Go ]. Unteres (nach unten beschränktes) einseitiges Konfidenzintervall für den Erwartungswert bei unbekannter Varianz mit Konfidenzniveau 1 − α ist S [X − tn−1,α √ ; ∞) . n Oberes (nach oben beschränktes) einseitiges Konfidenzintervall für den Erwartungswert bei unbekannter Varianz mit Konfidenzniveau 1 − α ist S (−∞; X + tn−1,α √ ] . n 13.10 Beispiel (Fortsetzung von Beispiel 13.4) Bestimme unteres einseitiges Konfidenzintervall mit 95% Sicherheitswahrscheinlichkeit. x ≈ 467, 09 s ≈ 3, 18 t7;0,05 = q0,95 = 1, 895 Also ist [464, 96; ∞) ein unteres einseitiges Konfidenzintervall mit 95% Sicherheitswahrscheinlichkeit. 54 d) Konfidenzintervall für die Varianz einer N (µ, σ 2 )- verteilten Zufallsvariablen 2 Sei X N (µ, σ 2 )-verteilt. Dann ist χ2n−1 = (n−1)S eine χ2 -verteilte Zufallsvariable mit n − 1 Freiheitsσ2 2 2 graden (ohne Beweis). Seien χn−1, α bzw. χn−1,1− α das α2 - bzw. (1 − α2 )-Quantil der χ2 - Verteilung. 2 2 Dann gilt (n − 1)S 2 P (χ2n−1, α2 ≤ ≤ χ2n−1,1− α2 ) = 1 − α σ2 Umformung der Ungleichung im Argument von P ergibt: (n − 1)S 2 (n − 1)S 2 und ≤ χ2n−1,1− α2 σ2 σ2 (n − 1)S 2 (n − 1)S 2 σ2 ≤ und ≤ σ2 χ2n−1, α χ2n−1,1− α χ2n−1, α2 ≤ ⇐⇒ 2 Also P( 2 (n − 1)S 2 (n − 1)S 2 2 ≤ σ ≤ )=1−α χ2n−1,1− α χ2n−1, α 2 2 Also ist das Konfidenzintervall zum Konfidenzniveau 1 − α für die Varianz: " # (n − 1)S 2 (n − 1)S 2 ; χ2n−1,1− α χ2n−1, α 2 2 Für die Standardabweichung erhält man: "s # s (n − 1)s2 (n − 1)s2 ; χ2n−1,1− α χ2n−1, α 2 2 e) Konfidenzintervall für die Erfolgswahrscheinlichkeit Hierbei geht es um den Parameter p bei Bernoulli-Experimenten. Die Schätzfunktion ist P̂ = X n , wobei X die Anzahl der Erfolge bei n-facher Durchführung eines Bernoulli-Experimentes bezeichnet. X ist binomialverteilt mit den Parametern n und p und (vgl. Kap. 8) E(X) = np, V ar(X) = np(1 − p). Im folgenden setzen wir eine umfangreiche Stichprobe voraus. Wegen des zentralen Grenzwertsatzes ist X näherungsweise N (np, np(1 − p))-verteilt, d. h. U = √X−np ist näherungsweise N (0, 1)-verteilt. np(1−p) Mit der Schätzfunktion P̂ = X n ist also U = √nP̂ −np np(1−p) ungefähr N (0, 1)-verteilt. Wir bestimmen ein Konfidenzintervalls für U mit Konfidenzniveau 1 − α. Sei u α2 = q1− α2 das (1 − α2 )- Quantil von Φ. Dann ist P (−u α2 ≤ U ≤ u α2 ) ≈ 1 − α ⇐⇒ n(P̂ − p) P (−u α2 ≤ p ≤ u α2 ) ≈ 1 − α np(1 − p) Wir bringen die Ungleichung im Argument von P in die Form Gu ≤ p ≤ Go . Zur Abkürzung schreiben wir im folgenden u statt u α2 . 1.Fall: P̂ − p ≥ 0 Dann ist die erste Ungleichung automatisch erfüllt. Die zweite Ungleichung ist äquivalent zu ⇐⇒ ⇐⇒ p2 (1 + (P̂ − p)2 ≤ P̂ 2 − 2pP̂ + p2 ≤ u2 u2 ) − p(2P̂ + ) + P̂ 2 n n 55 u2 · p(1 − p) n u2 u2 · p − ·p2 n n ≤ 0 Die linke Seite beschreibt eine nach oben geöffnete Parabel, d. h. die Ungleichung ist für diejenigen p-Werte erfüllt, die zwischen den Nullstellen der linken Seite der Ungleichung liegen. Wir bestimmen daher diese Nullstellen. p2 − p u2 n u2 n 2P̂ + | 1+ {z n+u = 2P̂n+u 2 ⇐⇒ p1,2 = ⇐⇒ p1,2 = ⇐⇒ p1,2 = } 2 + P̂ 2 2 = 0 1 + un | {z } 2 nP̂ = n+u 2 s 1 2P̂ n + u2 1 (2P̂ n + u2 )2 nP̂ 2 · ± · − 2 n + u2 4 (n + u2 )2 n + u2 ( ) r 4 u2 u 1 P̂ n + − n2 P̂ 2 − nP̂ 2 u2 ± P̂ 2 n2 + P̂ nu2 + n + u2 2 4 ( ) r u2 u2 1 P̂ n + ± u nP̂ (1 − P̂ ) + n + u2 2 4 2. Fall: P̂ − p < 0 Analoge Betrachtungen wie im 1. Fall führen auf dieselben Werte für p. Insgesamt erhält man also als (ungefähres) Konfidenzintervall [P− , P+ ] für die Erfolgswahrscheinlichkeit p zum Konfidenzniveau 1 − α mit s u2α u2α 1 P± = P̂ n + 2 ± u α2 nP̂ (1 − P̂ ) + 2 n + u2α 2 4 2 Für großes n (n ≥ 1000) kann man näherungsweise mit P±∗ = P̂ ± uα √2 n q P̂ (1 − P̂ ) rechnen. 13.11 Beispiel Ein Würfel zeigt bei 1000 Würfen 188 mal die 6. Gesucht ist ein Konfidenzintervall für die Wahrscheinlichkeit eine 6 zu würfeln zum Konfidenzniveau von 80% (d. h. 1 − α = 0, 8; α = 0, 2). 188 Es gilt p̂ = 1000 = 0, 188, u0,1 = q0,9 = 1, 28 d. h. [p− , p+ ] = [0, 17270; 0, 20432] bzw. [p∗− , p∗+ ] = [0, 17219; 0, 20381] 13.12 Bemerkung Bei einem homogenen Würfel ist p = 0, 16. Bei einem Konfidenzniveau von 99% (d. h. 1 − α = 0, 99; α = 0, 01) erhält man mit u0,005 = q0,995 = 2, 58 [p− , p+ ] = [0, 15822; 0, 22190] bzw. [p∗− , p∗+ ] = [0, 15612; 0, 21988] Bei einem Konfidenzniveau von 99% würde man nicht behaupten, daß der Würfel unfair ist. 13.13 Bemerkung Auch hier können wieder untere bzw. obere Konfidenzintervalle [P− , 1], [0, P+ ] bzw. [P−∗ , 1], [0, P+∗ ] bestimmt werden. Für ein Konfidenzniveau von 1 − α ist dann aber wieder uα zu nehmen. 56