2.2. Schätzen von Vertrauensintervallen 2.2.1. Schwankungsintervall Beispiel: X = Betrag von Geldüberweisungen, normalverteilt, µ = 5000 €, σ = 1000 € Zufallsstichprobe mit n = 100, Schätzer für µ: X Gesucht: Intervall, in dem X Prof. Dr. H. G. Strohe mit 95%iger Sicherheit liegt Statistik II II. 30 2.2.1. Schwankungsintervall Allgemeiner: X ~ N(µ, σ²) und Wahrscheinlichkeit α gegeben. Schätzer für µ, X ~ N( µ , σ ² ) denn n σ = 2 x σ2 ........ Aufgabe: d so bestimmen, dass P( µ − d ≤ X ≤ µ + d ) = 1 − α Prof. Dr. H. G. Strohe Statistik II II. 31 2.2.1. Schwankungsintervall Lösung: Standardisierung: Z= X −µ σ ~ N(0;1) (Warum so??) n ⎞ ⎛ ⎜ d ⎟ X − µ d ⎟ = 1−α P⎜ − < ≤ σ σ ⎟ ⎜ σ ⎜ ⎟ n n n⎠ ⎝ Prof. Dr. H. G. Strohe Statistik II II. 32 2.2.1. Schwankungsintervall P( − z < ( X − µ ) n ≤ z) = 1 − α σ ⎞ ⎛ ⎜X −µ ⎟ α ≤ z⎟ =1− P⎜ 2 ⎜ σ ⎟ ⎜ ⎟ ⎝ n ⎠ (z = d n ) σ Also: z als 1-α/2-Quantil in Tafel bei 1-α/2 ablesen: dann : d = z1−α / 2 σ n P( µ − d ≤ X ≤ µ + d ) = 1 − ........ Grenzen des Schwankungsintervalls unabhängig vom Zufallsversuch "Stichprobe". Prof. Dr. H. G. Strohe Statistik II II. 33 2.2.1. Schwankungsintervall Beispiel: α = 5% = 0.05 1- α/2 = 0.975 z = z1 - α/2 = 1.96 Nach Tafel d = z1−α / 2 σ n = 1.96 · 1000 / 10 = 196 Schwankungsintervall (4804; 5196] Interpretation? Stimmt näherungsweise auch bei Abweichen von Normalverteilung. (Wann? Warum??) Prof. Dr. H. G. Strohe Statistik II II. 34 2.2.2. Konfidenzintervall, Konfidenzniveau Jetzt umgekehrte Fragestellung: Schätzungen B^ 0 B-d B B+d (wahr, fest) B (wahr, fest) Konfidenzintervalle Schwankungsintervall Unterschied zwischen Konfidenz- und Schwankungsintervall Prof. Dr. H. G. Strohe Statistik II II. 35 2.2.2. Konfidenzintervall, Konfidenzniveau Grenzen des Konfidenzintervalls (Vertrauensgrenzen) hängen von Zufallsstichprobe ab, | sie sind Zufallsvariablen Interpretation: Mit Wahrscheinlichkeit 1-α überdeckt ein Intervall [Πˆ − d, Πˆ + d) den wahren Parameter π Prof. Dr. H. G. Strohe Statistik II II. 36 2.2.3. Intervallschätzung des Erwartungswertes (=Durchschnitt in der Grundgesamtheit) α - Irrtumswahrscheinlichkeit 1- α - statistische Sicherheit oder Konfidenzniveau a) bei bekannter Varianz X ~ N(µ; σ²), µ unbekannt (aber fest) Irrtumswahrscheinlichkeit α vorgegeben Gesucht: Konfidenzintervall für µ = E(X) Prof. Dr. H. G. Strohe Statistik II II. 37 2.2.3. Intervallschätzung des Erwartungswertes Lösung: 1. Zufallsstichprobe vom Umfang n ziehen: X1, . . ., Xn 2. Punktschätzung für Erwartungswert ?? (Wdh.) 3. Konfidenzintervall P( X − d ≤ µ < X + d ) = 1 − α Prof. Dr. H. G. Strohe Statistik II II. 38 2.2.3. Intervallschätzung des Erwartungswertes Gesucht d; d = zσ x σ x2 = ?? σ σ ⎞ ⎛ P⎜ X-z ≤µ<X +z ⎟ =1−α n n⎠ ⎝ Standardisierung: X −µ ⎛ ⎞ P⎜ -z ≤ n < +z⎟ = 1−α σ ⎝ ⎠ Prof. Dr. H. G. Strohe Statistik II II. 39 2.2.3. Intervallschätzung des Erwartungswertes also z = z1−α 2 : ⎛ ⎞ ⎜ X-µ ⎟ α < z α ⎟ = 1− P⎜ 1− ⎟ 2 ⎜ σ 2⎟ ⎜ ⎝ n ⎠ (s. 1.3.3) Quantil aus Tafel ablesen und oben einsetzen Prof. Dr. H. G. Strohe Statistik II II. 40 2.2.3. Intervallschätzung des Erwartungswertes Verfahren kurz: α -> -> z1−α (1-α/2-Quantil der Standard-Normalv.) 2 d = z1−α / 2σ x -> Intervall [ X − d; X + d ) ( X aus Stichprobe) Gilt bei großen n näherungsweise auch für nicht normalverteilte Variable. Warum?? Bei kleinen Grundgesamtheiten und ohne Zurücklegen Korrekturfaktor für d: ?? (s. 2.1.2) Prof. Dr. H. G. Strohe Statistik II II. 41 2.2.3. Intervallschätzung des Erwartungswertes Beispiel: X: Höhe von Überweisungsaufträgen, σ = 400 €, Gesucht: Konfidenzintervall für unbekanntes µ α = 0.01 (festgelegt) Zufallsstichprobe (in €) : 2000, 2000, 1500, 1200, Prof. Dr. H. G. Strohe 2700, 1500, 1700, 1100, 2500, 1600, 1800, 1200, Statistik II 1200, 1400, 1100, 1100 II. 42 2.2.3. Intervallschätzung des Erwartungswertes noch Beispiel: x = 1600 € α 1− 2 = 0,995 z1-α/2 = z0,995 = ........ d = z0,995 σ n (99,5%-Quantil) = 2,58 ⋅ 400 / 4 = 258 € Konfidenzintervall: [1342; 1858) Interpretation? Prof. Dr. H. G. Strohe Statistik II II. 43 2.2.3. Intervallschätzung des Erwartungswertes b) bei unbekannter Varianz (realistischer) Wir hatten: σ ⎛ P⎜ X − z1−α ≤ 2 n ⎝ µ < X − z1−α 2 σ ⎞ ⎟ =1−α n⎠ ist äquivalent zu: α ⎛ X −µ ⎞ P⎜ ≤ z1−α ⎟ = 1 − 2 2⎠ ⎝σ / n Prof. Dr. H. G. Strohe Statistik II II. 44 2.2.3. Intervallschätzung des Erwartungswertes Jetzt Schätzung von σ2 durch Stichprobenvarianz S2: S S ⎞ ⎛ P⎜ X-t ≤ µ < X +t ⎟ = 1−α n n⎠ ⎝ t unbekannt X und S Zufallsvariablen Umformen zu: ⎞ ⎛ ⎟ ⎜X −µ α < t ⎟ =1− P⎜ 2 ⎟ ⎜ S ⎟ ⎜ ⎠ ⎝ n Prof. Dr. H. G. Strohe Statistik II II. 45 2.2.3. Intervallschätzung des Erwartungswertes Neue Zufallsvariable, T= ( X − µ) ⋅ n S ist nicht normalverteilt. hat t-Verteilung, von W.S. Gosset 1905, Pseudonym Student Eigenschaften: - Symmetrisch, E(T) = 0 - Flacher als Standardnormalverteilung Prof. Dr. H. G. Strohe Statistik II II. 46 2.2.3. Intervallschätzung des Erwartungswertes - Parameter: :, F und Freiheitsgrade FG = n - 1 - Für große n durch Standardnormalverteilung approximierbar - Prof. Dr. H. G. Strohe Statistik II II. 47 2.2.3. Intervallschätzung des Erwartungswertes Vorgehen: 1. Vorgabe von α 2. Berechnen von 1 − α 2 3. Ablesen des Quantils t1n−−α1 aus der t-Tafel 2 Prof. Dr. H. G. Strohe Statistik II II. 48 2.2.3. Intervallschätzung des Erwartungswertes 4. Ziehen der Zufallsstichprobe 5. Punktschätzungen X für µ und S für σ aus Stichprobe s n 6. Berechnen von d = t1n−−α1 2 7. Konfidenzintervall [ x - d, x + d) Bei kleinen Grundgesamtheiten und ohne Zurücklegen Korrekturfaktor für d: ?? Prof. Dr. H. G. Strohe Statistik II II. 49 2.2.3. Intervallschätzung des Erwartungswertes Beispiel: X wie vorher, α = 1 % Gleiche Stichprobenrealisationen x = 1600 €; n = 16; Berechnen: s= ∑ ( xi − x )² = 495 (n − 1) 1 - α/2 = ........... t150.995 = 2.947 (99,5%-Quantil) Prof. Dr. H. G. Strohe Statistik II II. 50 2.2.3. Intervallschätzung des Erwartungswertes (noch Beispiel) d = 2.947 • 495 /4 = 364.7 Konfidenzintervall [1235,3; ............) Warum größer als vorher? Stichprobenvarianz zufällig größer als σ; Quantil t gesetzmäßig größer als z. Warum?? Prof. Dr. H. G. Strohe Statistik II II. 51 2.2.3. Intervallschätzung des Erwartungswertes Stichprobenumfang bei Intervallschätzungen Bekannt: Streuung σ Verlangt: Fehler kleiner als d Irrtumswahrscheinlichkeit höchstens α Gesucht: n aus d = z 1- α 2 σ n z12-α / 2 ⋅ σ² folgt : n = ......2 Prof. Dr. H. G. Strohe Statistik II II. 52 2.2.4. Intervallschätzung von Anteilen oder Wahrscheinlichkeiten Bisher: Punktschätzung H (ML-Schätzer für Parameter p der Zweipunkt- und Binomialverteilung) pˆ = n H ist binomialverteilt, exakte Intervallschätzung mit Binomialverteilung möglich. Hier einfacher: (Wdh.) pˆ = ∑ Xi n Prof. Dr. H. G. Strohe X i ∈ {0,1} Statistik II II. 53 2.2.4. Intervallschätzung von Anteilen oder Wahrscheinlichkeiten d.h. Stichprobendurchschnitt, assymptotisch normalverteilt. Warum? Wdh: Für np(1-p)>?? ann Verteilung von p̂ durch Normalverteilung angenähert werden Schon bewiesen: E( pˆ ) = ....... Var( pˆ ) = σ pˆ ² = p (1 - p ) n Einsetzen in Konfidenzintervall für Durchschnitt: Prof. Dr. H. G. Strohe Statistik II II. 54 2.2.4. Intervallschätzung von Anteilen oder Wahrscheinlichkeiten P ( X-z1−α σ x ≤ µ < X + z1−α σ x ) = 1 - α Wir hatten: 2 (σ x 2 = Var( x ) = 2 2 σ ) n Das wird jetzt: P ( pˆ -z1−α σ pˆ ≤ p < pˆ + z1−α σ pˆ ) = 1 - α 2 2 (σ pˆ 2 = Var( pˆ ) = ⎛ P⎜⎜ pˆ − z1−α 2 ⎝ p (1-p) ) n p............ ≤ p < pˆ + z1−α 2 n Prof. Dr. H. G. Strohe p............ ⎞ ⎟ = 1−α ⎟ n ⎠ Statistik II II. 55 2.2.4. Intervallschätzung von Anteilen oder Wahrscheinlichkeiten Bestimmung des (1-α/2)-Quantils der Standardnormalverteilung mit ⎛ ⎜ P⎜ ⎜ ⎜ ⎝ ⎞ ⎟ α pˆ − p < z1−α / 2 ⎟ = 1 − ⎟ 2 p (1 − p ) ⎟ n ⎠ „Fehler“: d = z1−α/ 2 ⋅ p( 1 − p) n Problem? Sicher gilt: p (1 − p ) ≤ .......... Prof. Dr. H. G. Strohe Warum? Statistik II II. 56 2.2.4. Intervallschätzung von Anteilen oder Wahrscheinlichkeiten Praktische Näherung pˆ ( 1 − pˆ ) n d ≈ z1−α/ 2 ⋅ Vorgehen kurz: 1. Festlegen von α 2. Berechnen von 1−α 2 3. Ablesen von z1-α/2 aus Standardnormalverteilung (wenn npˆ (1 − pˆ ) > 9 ) 4. Ziehen der Zufallstichprobe 5. Punktschätzung pˆ = H Prof. Dr. H. G. Strohe n für p Statistik II II. 57 2.2.4. Intervallschätzung von Anteilen oder Wahrscheinlichkeiten 6. Abschätzen von d = z1−α ⋅ 2 p (1 − p ) n [ pˆ − d , pˆ + d ) 7. Berechnen des Konfidenzintervalls mit P( pˆ − d ≤ p < pˆ + d ) = 1 − α Prof. Dr. H. G. Strohe Statistik II II. 58 2.2.4. Intervallschätzung von Anteilen oder Wahrscheinlichkeiten Beispiel (Marktforschung): Das neue Album von Marianne ist da! Wie viel Prozent der Hausfrauen kennen sie? 95% Sicherheit gewünscht Zufallsstichprobe von n = 200 ergibt h = 40. Punktschätzung: p̂ = 40/ 200 Prof. Dr. H. G. Strohe Statistik II II. 59 2.2.4. Intervallschätzung von Anteilen oder Wahrscheinlichkeiten noch Beispiel: α = 0,05 1− α 2 = 0,975; d ≈ 1,96 ⋅ 0,2 ⋅ z0,975 = .............. 0,8 = 1,96 ⋅ 0,028 = 0,055 200 Intervallschätzung: [0.145, .........) d.h.? Prof. Dr. H. G. Strohe Statistik II II. 60 2.2.4. Intervallschätzung von Anteilen oder Wahrscheinlichkeiten Notwendiger Stichprobenumfang Forderung: Fehler geringer als d. Sicherheitswahrscheinlichkeit mindestens 1 - α Wir hatten d = z1−α ⋅ 2 Also jetzt p (1 − p ) n z12−α / 2 ⋅ p (1 − p ) n= .........² Prof. Dr. H. G. Strohe Statistik II II. 61 2.2.4. Intervallschätzung von Anteilen oder Wahrscheinlichkeiten Problem: p und p̂ unbekannt - sicher: p(1-p) ≤ 0,25 - oder Abschätzungen, z.B. p < 0,1 oder p > 0,9 => Prof. Dr. H. G. Strohe p(1-p) < 0,09 Statistik II II. 62 2.2.4. Intervallschätzung von Anteilen oder Wahrscheinlichkeiten Beispiel: Wählerbefragung zum Anteil der Grünen. Abschätzung: Sicher unter 10%. α=5%, d = ± 1 Prozentpunkt gefordert. n = 1,96 2 ⋅ 0,09 0,0001 = 3457,44 Interpretation und Anwendung? Prof. Dr. H. G. Strohe Statistik II II. 63