– 107 – Kapitel 6 : Punkt – und Intervallschätzer §1 Punktschätzungen 1.1 In der Statistik wollen wir Rückschlüsse auf das Wahrscheinlichkeitsgesetz ziehen, nach dem ein von uns beobachtetes Zufallsexperiment abläuft. Hierzu beobachten wir unabhängige Wiederholungen einer Zufallsvariablen X , d.h. iid. Zufallsvariable X1, X2, . . ., Xn , die gemäß F, dem Zufallsgesetz von X , verteilt sind. : = (X1, X2, . . ., Xn) bezeichnet man als Stichprobe aus F der Länge n und die hierfür beobachteten Werte : = (x1, x2, . . ., xn) als Daten. Mit Hilfe der Daten wollen wir dann gewisse Parameter θ schätzen, d.h. gewisse unbe- kannte reelle Zahlen, die das spezielle Gesetz F charakterisieren. Wäre z.B. X =d N(µ, σ2), wobei µ ∈ IR und 0 < σ2 < ∞, dann sind µ und σ2 solche Parameter. 1.2 Das Grundanliegen des Schätzens besteht nun darin, daß man für jeden der Parameter θ eine „geeignete“ Statistik T: IRn → IR sucht, so daß der den Daten = (x1, x2, . . ., xn) zugeordnete Wert T() (be- kannte reelle Zahl) gerade das „Wesentliche“ von θ numerisch widerspiegelt. Jeder solche Wert T() heißt Schätzwert von θ und wird mit be- zeichnet. Man kann einen Schätzwert von θ intuitiv erhalten oder mit Hilfe von konkreten Methoden. Die zugehörige Schätzprozedur T() heißt Schätzer von θ . Zwei „wünschenswerte“ Eigenschaften eines Schätzers T() von θ sind: – 108 – 1) Erwartungstreue (oder Unverzerrtheit) : E(T()) = θ . Bzw. mindestens asymptotische Erwartungstreue: lim→ = θ , („im Mittel“ schätzt den Parameter θ richtig). 2) Asymptotisches Verschwinden der Varianz : lim→ = 0 . (Im Falle der Erwartungstreue bedeutet dies, daß die „mittlere quadratische Abweichung“ − für wachsenden Stichprobenumfang gegen Null strebt.) Sind beide Eigenschaften erfüllt, dann gilt sogar (wegen der Tschebyscheffschen Ungleichung) die (schwache) Konsistenz: konvergiert stochastisch gegen θ , d.h. − ≥ ≤ → 0 ∀ >0. Beispiel 1.3 : X besitze einen Erwartungswert µ = E(X) und eine Varianz σ2 = Var(X). Da man µ als Mittelwert der Verteilung F von X verstehen kann, liegt es nahe, µ mit Hilfe des Stichprobenmittelwerts = d.h. = = & & ∑()& ( zu schätzen, & ∙ - ∙ . = µ, ∑()& ( ist ein Schätzer für µ. 1) ist erwartungstreu: = & ∑()& (( ) = da X1, X2, . . ., Xn iid. – 109 – 2) → 0 : = ∑()& ( = & ∙ - ∙ 0 = / & 1/ 0, → da X1, X2, . . ., Xn iid. P ⇒ n → E(X), →∞ dies ist gerade das schwache Gesetz der großen Zahlen. ist also ein konsistenter Schätzer von µ . Beispiel 1.4 : X wie in Beispiel 1.3. Es liegt nahe, σ2 = Var (X) durch die Stichprobenvarianz S2 = ∑()&( − zu schätzen. Da jedoch & E(S2) = 2& 0 , ist dieser Schätzer für σ2 verzerrt, aber immer noch asymptotisch erwartungstreu. ()& ()& 1 1 (3 ) = 5( − = 5 ( − - ∙ = & 1 5( − . − - ∙ − . = ()& - ∙ ( − - ∙ = Bemerkung 1.5 : & ∙ - ∙ 0 − 1/ = 2& Aus diesem Grund definiert man die unverzerrte Stichprobenvarianz : 36 ∶= 2& 3 = Offensichtlich ist 36 erwartungstreu für σ 2: & 2& 0 . ∑()&( − . (36 ) = 0 . In der Praxis wird fast ausschließlich mit 36 gearbeitet und meistens wird 36 als Stichprobenvarianz bezeichnet und als S2 geschrieben. – 110 – §2 Die χ2– und die t – Verteilung; Quantile Für das Weitere benötigen wir noch zwei neue Verteilungen. 2.1 Es seien X1, X2, . . ., Xn =d N(0,1) iid. Dann ist Y:= ∑ n j=1 d X 2j = χ 2n gemäß einer χ2 – Verteilung mit n Freiheitsgraden (d.h. χ 2n ) verteilt. χ 2n hat die Dichte: 0 x<0 1 f(x) = ( 2 ) Γ( n2 ) n ⇒ ∫ ∞ 0 x n −1 2 e − 12 x x≥0 , wobei Γ(a) = ∫ ∞ 0 x a −1e −x dx , für a > 0. f ( x )dx = 1. Weiter gilt: Γ(n) = (n – 1)! für alle n ∈ IN , und deshalb ist χ 22 = Exp( 12 ). xn;β mit ∫ x n ;β 0 Γ(n+½) = ()! ! ∙ /9 ∙ √; für alle n ∈ IN 0 . f ( x )dx = β, 0 < β < 1, heißt β – Quantil von χ 2n . Das Quantil ist die Umkehrfunktion der Verteilungsfunktion. 2.2 Es seien X0, X1, . . ., Xn =d N(0,1) iid. Dann ist X0 Z:= d = tn n 1 n ∑X gemäß einer Studentschen t – Verteilung 2 j j=1 mit n Freiheitsgraden (d.h. gemäß tn) verteilt. – 111 – Allgemein: Y =d N(0,1) und V =d < seien unabhängig ⇒ tn hat die Dichte: f(x) = n +1 1 Γ( n2+1 ) 2 − (1 + xn ) 2 n nπ Γ( 2 ) , x ∈ IR . ⇒ = ? > @ 9 ∫ ∞ −∞ d = tn . f ( x )dx = 1. f(x) ist symmetrisch um die y – Achse. tn;β mit 2.3 ∫ t n ;β −∞ f ( x )dx = β, 0 < β < 1, ist das β – Quantil von tn. Für die Standard – Normalverteilung N(0, 1) bezeichnet man das β – Quantil mit zβ , 0 < β < 1 : 2.4 / F G 2D C / B √A 2 & E = β . Für n ≥ 20 ist die zentrale Region der tn – Verteilung einer N(0, 1) – Dichte ähnlich. Im Grenzfall (n → ∞) fällt diese Dichte mit φ(x) zusammen. (Für die Anwendung unterscheiden sich die üblichen Wahrscheinlichkeiten von t120 und Φ nicht mehr.) – 112 – Bemerkung 2.5 : Gegeben sei die Stichprobe: X1, . . ., Xn =d N(µ,σ2) iid. ∶= Betrachte den Stichprobenmittelwert die unverzerrte Stichprobenvarianz (i) =d H ., 1/ und deshalb J2K 1 & 36 ∶= ∑()& ( und ∑ − . 2& ()& ( & d √- = N(0,1) (siehe Kapitel 5, Beispiel 2.5 c), Bemerkung). (ii) Ist σ2 unbekannt, so muß es durch 36 geschätzt werden. Man kann zeigen, daß in diesem Fall (2&)LM/ 1/ unabhängig ist. Wegen 2.2 ergibt sich, daß J2K LM √- = NOP √ Q / M > ? ∙ (9O?)R 9O? Q/ = <2& und von d J2K 1 √- =d tn – 1 . Den Verlust des einen Freiheitsgrades kann man sich folgendermaßen plausibel machen: Zur Berechnung von 36 muß aus den Daten geschätzt werden. Bei bekanntem sind dann aber nur noch (n – 1) der Variablen X1, X2, . . ., Xn frei wählbar. §3 Konfidenzintervall für den Erwartungswert µ einer Normalverteilung bei bekannter und bei unbekannter Varianz σ2 X1, . . ., Xn =d N(µ,σ2) iid. sei eine normalverteilte Stichprobe. 3.1 σ2 = σ 02 bekannt : Wir wollen den Erwartungswert µ schätzen und gleichzeitig einen Hinweis auf die Genauigkeit und die Vertrauenswürdigkeit des Schätzwertes erhalten. – 113 – Es liegt nahe, den Mittelwert µ durch den Stichprobenmittelwert zu schätzen. Weiter wählt man eine Größe C so, daß das Intervall S − T, + TV zufällige µ mit hoher Wahrscheinlichkeit überdeckt, d.h. daß dann der Schätzfehler − . ≤ C. Hierzu gibt man sich eine Wahrscheinlichkeit γ nahe bei 1 vor (typische Werte sind: γ = 0,9; γ = 0,95; γ = 0,99 ) und bestimmt C so, daß S − T, + TV ∋ . ≥ γ . Da σ0 = X0Y die Standardabweichung unserer Normalverteilung ist, wählt man C = b⋅σ0 für eine geeignete Konstante b > 0. Wir wissen, daß J2K 1Z d √- = N(0, 1). Deshalb ergibt sich: S − [ ∙ 0Y , + [ ∙ 0Y V ∋ . ⇔ − . ≤ b⋅σ0 ⇔ und deshalb S − [ ∙ 0Y , + [ ∙ 0Y V ∋ . = P( – b⋅ n ≤ X −µ σ0 \ J2K 1Z √- \ ≤ b⋅ n n ≤ b⋅ n ) = = Φ (b⋅ n ) – Φ (– b⋅ n ) = Φ (b⋅ n ) – (1 – Φ (b⋅ n )), da φ(x) symmetrisch um die y – Achse ist : = 2⋅ Φ (b⋅ n ) – 1 =! γ ⇔ Φ (b⋅ n ) = &]^ ⇔ b⋅ n = _?`a ⇔ b = / & √ ∙ _?`a / – 114 – Als Ergebnis erhält man Iγ = b − 1Z √ ∙ _?`a , + / 1Z √ ∙ _?`a c = : ± / 1Z √ ∙ _?`a / ist das gesuchte γ – Konfidenzintervall (bzw. γ⋅100% – KI) für µ . γ heißt Konfidenzniveau. 3.2 σ2 unbekannt : In diesem Fall müssen wir σ durch Su = > d.h. wir wählen C = b⋅Su . Nach Bemerkung 2.5 wissen wir, daß Deshalb ergibt sich nun : & 2& J2K LM ∑()&( − schätzen, d √- = tn – 1 . S − [ ∙ 36 , + [ ∙ 36 V ∋ . ⇔ − . ≤ b⋅Su und deshalb S − [ ∙ 36 , + [ ∙ 36 V ∋ . = P( – b⋅ n ≤ ⇔ \ J2K LM √- \ ≤ b⋅ n X −µ n ≤ b⋅ n ) = Su = tn – 1(b⋅ n ) – tn – 1(– b⋅ n ) = tn – 1(b⋅ n ) – (1 – tn – 1(b⋅ n )), da f(x) symmetrisch um die y – Achse ist : = 2⋅ tn – 1(b⋅ n ) – 1 =! γ ⇔ tn – 1(b⋅ n ) = b = & √ ∙ e2&; ?`a . / &]^ ⇔ b⋅ n = e2&; ?`a / ⇔ – 115 – Als Ergebnis erhält man Iγ = b − LM √ ∙ e2&; ?`a , + / LM √ ∙ e2&; ?`a c = ± / ist das gesuchte γ – Konfidenzintervall für µ . LM √ ∙ e2&; ?`a / Beispiel 3.3 : Wir haben die Körperlängen von n = 6 Exemplaren der Drosophila melanogaster in Rheinhessen gemessen und einen Stichprobenmittelwert = 2,5 (mm) sowie eine Standardabweichung su = 0,30 (mm) errechnet. In einer Zeitschrift haben wir gelesen, daß der „richtige“ Wert 2,3 (mm) ist. Ist dies mit unserem Ergebnis vereinbar? Zur Beantwortung dieser Frage nehmen wir an, daß die Körperlängen N(µ, σ2) – verteilt sind, und konstruieren das 95% – Konfidenzintervall für µ: γ = 0,95 ⇒ ⇒ I0,95 = 2,5 ± Y,gY √h 1+ γ 2 = 0,975; (n – 1) = 5; t5; 0,975 = 2,571 ⋅2,571 = 2,5 ± 0,31 = [2,19; 2,81] ∋ 2,3 ; d.h. die Angabe in der Zeitschrift ist mit unseren Beobachtungen auf einem Konfidenzniveau von 95% vereinbar.