3 Induktive Statistik Oft ist die Wahrscheinlichkeitsverteilung einer Zufallsvariablen X zwar vom Typ her bekannt (z.B. Normalverteilung), enthält jedoch noch unbekannte statistische Parameter (z.B. µ und σ 2 ). In Abschnitt 3.1 wollen wir diese Parameter in Form von Zahlen unter Verwendung einer Stichprobe schätzen. Da der Schätzwert einem Punkt auf der Zahlengeraden entspricht, nennt man diese Art der Parameterschätzung auch Punktschätzung . Alternativ kann man Intervalle schätzen, in dem die unbekannten Parameter mit einer vorgegebenen Wahrscheinlichkeit vermutet werden. Man nennt diese Intervalle Konfidenz- oder Vertrauensintervalle und spricht von einer Intervalloder Bereichsschätzung . Dazu mehr in Abschnitt 3.2. Eine dritte Aufgabe der induktiven Statistik besteht darin, mit Hilfe einer Stichprobe zu kontrollieren, ob eine Grundgesamtheit mit großer Wahrscheinlichkeit vorgegebene statistische Parameter einhält. Dazu definiert man Intervalle, die die vorgegebenen Parameter enthalten, und prüft, ob die durch Punktschätzung gewonnenen empirischen Werte in den jeweiligen Intervallen liegen. Man spricht von Parametertests , siehe Abschnitt 3.3. 3.1 Punktschätzungen für die unbekannten Parameter einer Wahrscheinlichkeitsverteilung Literatur: [Papula Bd. 3, Kap. III.3.2], [Benning, Kap. 4.2] Bsp 1 Ist der Erwartungswert µ einer Zufallsgröße X der gesuchte Parameter, dann lässt sich dieser durch den Mittelwert n µ̂ = x = 1X xi n i=1 der Stichprobe x1 , . . . , xn schätzen. Dieser Mittelwert ist eine Realisierung der Stichprobenfunktion n 1X X= Xi n i=1 der stochastisch unabhängigen Zufallsgrößen X1 , . . . , Xn . Def 2 Schätzfunktionen für einen unbekannten statistischen Parameter θ sind spezielle Stichprobenfunktionen, Θ = g(X1 , . . . , Xn ), die für jede konkrete Stichprobe x1 , . . . , xn einen Schätzwert θ̂ = g(x1 , . . . , xn ) für den Parameter θ liefern. Dabei sind X1 , . . . , Xn unabhängige Zufallsvariable, die alle die gleiche Verteilungsfunktion besitzen. 3.1 – 1 Bsp 3 Für die Varianz verwendet man die Schätzfunktion n S2 = 1X (Xi − µ)2 , n i=1 falls der Erwartungswert µ bekannt ist, und n S2 = 1 X (Xi − X)2 , n−1 i=1 falls der Erwartungswert µ unbekannt ist. In der Hausaufgabe sollen Sie unter1 suchen, warum der Faktor n−1 statt n1 in der letzten Formel gewählt werden sollte. Def 4 Eine Schätzfunktion heißt erwartungstreu (unverzerrt), wenn der Erwartungswert der Schätzfunktion gleich dem gesuchten Parameter der Grundgesamtheit ist. konsistent (übereinstimmend, passend), wenn die Schätzfunktion mit Wahrscheinlichkeit Eins mit zunehmenden Stichprobenumfang n gegen den gesuchten Parameter der Grundgesamtheit strebt. effizient (wirksam), wenn es bei gleichem Stichprobenumfang n keine andere erwartungstreue Schätzfunktion mit kleinerer Varianz gibt. erschöpfend (hinreichend), wenn keine andere Schätzfunktion aus den Stichprobenwerten weitergehende Informationen über den gesuchten Parameter liefert. robust, wenn die Wahrscheinlichkeitsverteilung der Schätzfunktion unempfindlich gegenüber kleinen Änderungen der Verteilung der Stichprobe ist. Bsp 5 Die Schätzfunktion n 1X X= Xi n i=1 für den Erwartungswert µ ist erwartungstreu, denn ! n n 1X 1X 1 Xi = E(Xi ) = · nµ = µ. E(X) = E n n n i=1 i=1 Bsp 6 Die Schätzfunktion n S2 = 1X (Xi − µ)2 n i=1 für die Varianz σ 2 ist erwartungstreu, denn ! n n X 1 1X 1 2 2 E(S ) = E (Xi − µ) = E[(Xi − µ)2 ] = · nσ 2 = σ 2 . n n n i=1 i=1 3.1 – 2 Ü 7 Zeigen Sie, dass bei unbekannter Varianz die Schätzfunktion n 1 X (Xi − X)2 S = n−1 2 i=1 erwartungstreu ist, während dies für die Schätzfunktion n S2 = 1X (Xi − X)2 n i=1 nicht gilt. Letztere ist nur in der Grenze n → ∞ erwartungstreu, man sagt asymptotisch erwartungtreu. Bem 8 Schätzfunktionen kann man u.a. nach der Maximum-Likelihood-Methode (Methode der maximalen Mutmaßlichkeit ) konstruieren. Betrachten wir den einfachsten Fall einer stetigen Zufallsgröße X mit der Dichtefunktion f (x; θ), bei der nur ein Parameter θ unbekannt ist. Man wählt denjenigen Parameterwert θ̂, der die Dichtefunktion L(x1 , . . . , xn ; θ) = n Y f (xi ; θ) i=1 für die gegebene Stichprobe x1 , . . . , xn maximiert, siehe auch [Papula Bd. 3, Kap. 3.3] und [Benning, Kap. 4.2.5]. 3.1 – 3