5.9.1. Beispiel: Erwartungstreue Schätzung von Erwartungswert und Varianz von i.i.d. Zufallsvariablen. Eine zufällige reelle Größe G werde N mal unabhängig gemessen 1. Zu einer quantitativen Beurteilung von G ist es naheliegend zunächst den Mittelwert“ und die Größe der Schwankungen“ der Messungen von ” ” G zu schätzen 2. In einer mathematisch präziseren Formulierung seien X1 , . . . , XN i.i.d. Zufallsvariablen mit Erwartungswert µ und Varianz σ 2 3. Die Verteilung der Zufallsvariablen X1 , . . . , XN sei unbekannt, zu schätzen seien µ und σ 2 4. Als Schätzer von µ und σ 2 seien 5 µ e := N 1 X Xk N k=1 N f2 := und σ 1 X (Xk − µ e)2 N −1 (12) k=1 definiert. Da E[e µ] = 6 N N 1 X 1 X E[Xk ] = µ=µ N N k=1 k=1 und f2 ] = E[σ = 6 N 1 X E[Xk2 ] − 2E[Xk µ e] + E[e µ2 ] N −1 k=1 1 N −1 N X 7 (σ 2 + µ2 ) − 8 2(σ 2 N −1 + µ2 ) + 9 (σ 2 N −1 + µ2 ) k=1 N = 1 X (1 − N −1 )σ 2 = σ 2 , N −1 k=1 1In einer konkreten Anwendung könnte G die Lebensdauer eines speziellen Gebrauchsgegenstandes, z.B. eines Autoreifens oder einer Kinderschaukel, oder die Hitzebeständigkeit einer Keramik sein. 2Dieses umgangssprachlich beschriebene Ziel muß jetzt mathematisch formuliert werden. 3Insbesondere sei angenommen, daß E[X 2 ] < ∞. 1 4Als statistisches Modell könnte hier (RN , B(RN ), (P ) Rλ λ∈Λ ) benutzt werden, wobei Λ die Menge aller Wahrscheinlichkeitsmaße λ auf (R, B(R)) mit R λ(dx) |x|2 < ∞ und Pλ die gemeinsame Verteilung von unabhängigen, reellwertigen Zufallsvariablen Y1 , . . . , YN , deren Verteilungen PY1 , . . . , PYN alle gleich λ ∈ Λ sind, ist. Zu schätzen ist nicht, wie dies in den bisher behandelten Schätzproblemen üblich war, der wahre Parameter“ λ und R damit ein Wahrscheinlichkeitsmaß ” auf (R, B(R)), sondern der wahre Erwartungswert“ Eλ = R λ(dx) x, bzw. die wahre Varianz“ R ” ” Vλ = R λ(dx) (x − Eλ )2 , d.h., zwei spezielle Funktionale von λ sind zu bestimmen. Mit einer derart komplexen Formulierung, die notwendig wird, weil außer ihrer Quadratintegrabilität keinerlei Bedingungen an die Zufallsvariablen X1 , . . . , XN gestellt werden, wird im folgenden nicht gearbeitet. 5Als empirischer Mittelwert ist µ e ein naheliegender Schätzer für µ. Ebenso ist der Mittelwert der quadrierten Schwankungen der Zufallsvariablen X1 , . . . , XN um den geschätzten ErwartungsP P wert µ e ein erster Kandidat als Schätzer für σ2 . Da N µ e) = N e = 0, sind die k=1 (Xk −P k=1 Xk − N µ N Zufallsvariablen X1 − µ e, . . . , XN − µ e nicht unabhängig, d.h., k=1 (Xk − µ e)2 besitzt nur N − 1 Freiheitsgrade. Dadurch wird die Normierung mit (N − 1)−1 anstelle von N −1 verständlich. 6Wegen der Linearität des Erwartungswerts, vgl. Abschnitt 5.2.2. 1 2 f2 erwartungstreue Schätzer. sind µ e und σ 7Da σ2 = Var(X ) = E[X 2 ] − E[X ]2 = E[X 2 ] − µ2 , k = 1, . . . , N . k k k k 8 Da E[Xk µ e] = N 1 X 1 1 E[Xk2 ] + E[Xk Xl ] = N l=1 N N X E[Xk ]E[Xl ] l=1,...,N l6=k N −1 2 1 2 1 (Var(Xk ) + E[Xk ]2 ) + µ = σ + µ2 , k = 1, . . . , N, N N N wobei die Überlegung in Fußnote 7 und die Unabhängigkeit der Zufallsvariablen X1 , . . . , XN benutzt wurden. 9 Aus Fußnote 7 und mit der Unabhängigkeit der Zufallsvariablen X1 , . . . , XN ergibt sich ! N N X X 1 X 1 E[e µ2 ] = 2 E[Xk ]E[Xl ] E[Xk Xl ] = 2 E[Xk2 ] + N k,l=1 N k,l=1,...,N k=1 = l6=k ´ 1` 2 σ + µ2 + (N − 1)µ2 = N −1 σ2 + µ2 . = N 17. Januar 2008