Grundlegende Eigenschaften von Punktschätzern

Werbung
(c) Projekt Neue Statistik 2003 - Lernmodul: Grundlegende Eigenschaften von Punktschätzern
Grundlegende Eigenschaften von Punktschätzern
Worum geht es in diesem Modul?
Schätzer als Zufallsvariablen
Vorbereitung einer Simulation
Verteilung von P-Dach
Empirische Lage- und Streuungsparameter zur Beschreibung von p-Dach
Theoretische Lage- und Streuungsparameter zur Beschreibung von P-Dach
Vergleich der Ergebnisse
Worum geht es in diesem Modul?
Aufbauend auf den Erfahrungen mit Punktschätzern aus dem Einführungsmodul (s. )
soll in diesem Modul gezeigt werden, dass auch Schätzer selbst Zufallsvariablen sind.
Um einen intuitiven Zugang zu ermöglichen, wird dies zunächst anhand einer
Simulation plausibel gemacht. Im Anschluss daran werden exemplarisch der
Erwartungswert und die Varianz von
hergeleitet und mit den in der Simulation
ermittelten Werten verglichen.
Schätzer als Zufallsvariablen
Die im Einführungsmodul (s. ) angestellten Simulationen verdeutlichen, dass bei
wiederholter Schätzung ein und desselben Parameters unter identischen Bedingungen
die Schätzwerte streuen. Es liegt daher nahe, die Schätzwerte als wiederholte
Realisierungen ein und derselben Zufallsvariablen, des Schätzers bzw. der
Schätzfunktion, zu modellieren. Der Schätzfunktion kann also eine
Wahrscheinlichkeitsverteilung zugeordnet werden. Wie bei anderen Zufallsvariablen
auch, lassen sich die Eigenschaften des Schätzers aus seiner
Wahrscheinlichkeitsverteilung ableiten.
Wir betrachten Stichproben vom Umfang . Jeweils
einzelne Ziehungen ergeben
eine Stichprobe, aus der wir über die Schätzfunktion einen Schätzwert bestimmen
können. Die einzelnen Ziehungen sind unabhängig voneinander - das war bei unserer
Simulation der Fall und wird auch im Folgenden vorausgesetzt. Führen wir
unabhängige Ziehungen durch, so erhalten wir
Page 1
Stichproben vom Umfang
. Es sind
(c) Projekt Neue Statistik 2003 - Lernmodul: Grundlegende Eigenschaften von Punktschätzern
dann nicht nur die Realisierungen innerhalb einer Stichprobe unabhängig voneinander,
sondern auch die Stichproben selbst. Daraus folgt unmittelbar, dass auch die
Schätzwerte, die sich aus den unabhängigen Stichproben ergeben, unabhängig
voneinander sind.
Vorbereitung einer Simulation
Um einen Eindruck von der Wahrscheinlichkeitsverteilung des bisher verwendeten
Schätzers
zu bekommen, wollen wir an das im Einführungsmodul (s. ) begonnene
Simulationsexperiment anknüpfen. Zur Erinnerung: Es wurde das Wahlverhalten bei
einer endlichen Grundgesamtheit (
Personen) untersucht, die anhand
einer Urne mit 10000 Kugeln (2500 schwarze Kugeln und 7500 weiße Kugeln),
veranschaulicht wurde. Die Wahrscheinlichkeit, bei der zufälligen Entnahme eine
schwarze Kugel zu ziehen, beträgt also
. Bei der zufälligen Entnahme von
Kugeln aus der Urne misst
die Anzahl der schwarzen Kugeln in der
Stichprobe.
Bei der Ziehung mit Zurücklegen wäre
binomialverteilt (vgl. ). Wird - wie in
unserem Beispiel - eine Ziehung ohne Zurücklegen betrachtet, so ist
Page 2
immerhin
(c) Projekt Neue Statistik 2003 - Lernmodul: Grundlegende Eigenschaften von Punktschätzern
näherungsweise (vgl. Exkurs ) binomialverteilt, wenn der Stichprobenumfang
gegenüber dem Umfang der Grundgesamtheit
ist.
klein
Für unsere Simulationen verwenden wir ein einfaches Urnenmodell. Erfolgt die
Ziehung mit Zurücklegen, d.h. wird nach jeder Ziehung die gezogene Kugel in die Urne
zurückgelegt, dann bleibt das Verhältnis der Anzahl der schwarzen Kugeln zur Anzahl
der weißen Kugeln in der Urne konstant und die Ergebnisse der Ziehungen sind - wie
gefordert - unabhängig. Die Anzahl schwarzer Kugeln in der Stichprobe folgt dann
einer Binomialverteilung.
Übertragen wir das eben beschriebene Modell auf unser Wahl-Beispiel, würde eine
Ziehung mit Zurücklegen aber bedeuten, dass ein und dieselbe Person evtl. zweimal
oder sogar noch öfter in unsere Stichprobe gelangen könnte. Das ist in vielen Fällen
jedoch unerwünscht. Hierbei handelt es sich übrigens um ein Problem, welches z.B. bei
Befragungen über das Internet eine große Rolle spielt.
Bei der Ziehung ohne Zurücklegen wird dieses Problem vermieden, allerdings sind die
Beobachtungen dann nicht mehr unabhängig. Bezogen auf die Urne würde sich die
Wahrscheinlichkeit eine Kugel mit einer bestimmten Farbe zu ziehen, mit jeder Ziehung
verändern. Die Wahrscheinlichkeit, bei der -ten Ziehung eine weiße (oder schwarze)
Kugel zu ziehen, ist abhängig von den
vorherigen Ziehungen. Das
Binomialmodell (vgl. ) kann dieses Verhalten nicht (exakt) abbilden.
Die Graphik veranschaulicht die Abhängigkeit beim Ziehen ohne Zurücklegen anhand
einer Urne mit 4 Kugeln.
Beim Ziehen ohne Zurücklegen ist die Wahrscheinlichkeit für das Ereignis "schwarze Kugel gezogen" nicht konstant - die einzelnen
Ziehungen sind nicht unabhängig.
In unserem Fall enthält die Urne aber sehr viele - nämlich 10000 - Kugeln. D.h., dass
Page 3
(c) Projekt Neue Statistik 2003 - Lernmodul: Grundlegende Eigenschaften von Punktschätzern
bei der Ziehung einiger weniger Kugeln die beschriebenen Effekte nur sehr gering sind
- wir können sie dann evtl. vernachlässigen. Haben wir z.B. 100 Kugeln gezogen, so
kann sich dadurch die Wahrscheinlichkeit, bei der 101. Ziehung eine schwarze Kugel zu
ziehen, im extremsten Fall auf 0.2424 verringern (oder auf 0.2525 erhöhen). Und selbst
dies wäre nur genau dann der Fall, wenn wir vorher 100 schwarze (bzw. 100 weiße)
Kugeln gezogen hätten; wie wir jedoch aus der Wahrscheinlichkeitsrechnung (s. Modul
Diskrete Verteilungsmodelle) wissen, ist die Wahrscheinlichkeit für das Eintreten dieses
Ereignisses extrem gering.
Verteilung von P-Dach
Weil
eine Zufallsvariable ist, ist auch die relative Häufigkeit schwarzer Kugeln in
der Stichprobe (also der Schätzer
) eine Zufallsvariable. Deren
Wahrscheinlichkeitsverteilung lässt sich über eine Simulation gut veranschaulichen. Um
eine genauere Approximation zu erreichen, werden dabei nicht wie in den
vorangegangenen Simulationen 1000 Stichproben, sondern deutlich mehr, z.B.
Stichproben vom Umfang
, gezogen. Es ergibt sich folgendes
Stabdiagramm:
Das Stabdiagramm zeigt die in der Simulation ermittelte absolute Häufigkeitsverteilung
für ; es ähnelt der Wahrscheinlichkeitsfunktion der Binomialverteilung. Tatsächlich
zeigt sich eine starke Übereinstimmung mit den theoretisch erwarteten Häufigkeiten (als
orange Punkte im Diagramm dargestellt), die sich aus der Wahrscheinlichkeitsfunktion
der Binomialverteilung ergeben.
Theoretische Überlegungen zur Verteilung von p^
Weil
binomialverteilt ist
und
lediglich skaliert ist ( ist schließlich eine Konstante), lässt sich die
Wahrscheinlichkeitsfunktion von
leicht konstruieren.
In der
: Flashanimation ' Animation Wahrscheinlichkeits-Funktion von p-Dach ' siehe
Online-Version
wird dieser Sachverhalt erläutert.
Empirische Lage- und Streuungsparameter zur Beschreibung von p-Dach
Basierend auf den durch die Simulation gewonnen
wir für
Schätzwerten können
jetzt einen Mittelwert, die (empirische) Varianz und die (empirische)
Standardabweichung berechnen. Dafür können wir auf die bereits bekannten Formeln
(vgl. ) zurückgreifen:
Page 4
(c) Projekt Neue Statistik 2003 - Lernmodul: Grundlegende Eigenschaften von Punktschätzern
Mittelwert:
Varianz:
Standardabweichung:
Berechnen Sie mithilfe des Statistiklabors Mittelwert, Varianz und Standardabweichung
unseres Schätzers
unter Rückgriff auf den in der Simulationen gewonnen Datensatz.
Vergleichen Sie anschließend den Mittelwert
wahren Parameterwert
unserer 10000 Schätzungen mit dem
.
Labordatei öffnen ( b12.zmpf )
Theoretische Lage- und Streuungsparameter zur Beschreibung von P-Dach
Die im Statistiklabor berechneten Werte ( b19.spf ) geben uns einen Eindruck von den
Eigenschaften unseres Schätzers. Allerdings ist die Verallgemeinerungsfähigkeit der
Ergebnisse (trotz der hohen Anzahl von
Wiederholungen der
Schätzung) begrenzt. Wir wollen daher versuchen, losgelöst von konkreten Stichproben
allgemeine Aussagen über
zu machen. Anhand des uns bekannten
Verteilungsmodells von
[es gilt:
,
,
], können wir nämlich auch den Erwartungswert und die
theoretische Varianz von
bestimmen. Unter Rückgriff auf unsere Kenntnisse aus
dem Kapitel Wahrscheinlichkeitsrechnung (vgl. )erhalten wir folgende Ergebnisse:
Erwartungswert:
Varianz:
Page 5
(c) Projekt Neue Statistik 2003 - Lernmodul: Grundlegende Eigenschaften von Punktschätzern
Standardabweichung:
Bestimmen Sie (z.B. mithilfe des Statistiktaschenrechners) , und . Um einen Vergleich
zu den empirisch ermittelten Größen zu bekommen, wählen wir für und die Werte, die
auch in der Simulation verwendet wurden (,
).
Eine Tageszeitung möchte die Zuverlässigkeit ihres Zustelldienstes überprüfen und
befragt dazu einige zufällig ausgewählte Abonnenten. Lösen Sie die Aufgabe mit Hilfe
des Statistiklabors!
Labordatei öffnen ( b8e.zmpf )
Vergleich der Ergebnisse
Ein Vergleich der von uns anhand der Simulationsdaten berechneten Werte mit den
theoretisch hergeleiteten ergibt nach Einsetzen:
Stichprobenumfang:
Theorie
Empirie (k=10000 Stichproben)
Erwartungswert/Mittelwert
Varianz
Standardabweichung
Wie sich zeigt, ergibt sich eine gute Übereinstimmung.
In diesem Modul haben wir die Eigenschaften von Schätzern am Beispiel des Schätzers
für den Anteilswert bei Binomialverteilung untersucht. Wir haben festgestellt, dass
Schätzer selbst Zufallsvariablen mit bestimmten Eigenschaften (z.B. Verteilung,
Erwartungswert und Varianz) sind. Um diese Eigenschaften zu untersuchen, haben wir
zwei Wege beschritten. Zum einen haben wir Kennzahlen, die den Schätzer beschreiben
(wie Mittelwert und empirische Varianz) über ein Simulationsexperiment bestimmt.
Dieser Weg kann, wenn ausreichend viele Stichproben vorhanden sind, schon recht
genaue Ergebnisse liefern.
Kennt man die Verteilung der Zufallsvariablen
- wie in unserem Falle - und ist
zusätzlich die Voraussetzung der Unabhängigkeit erfüllt, so besteht weiterhin die
Möglichkeit, die Verteilung des Schätzers, Erwartungswert, Varianz, etc. auch anhand
theoretischer Überlegungen, also gänzlich unabhängig von empirischen Daten, zu
Page 6
(c) Projekt Neue Statistik 2003 - Lernmodul: Grundlegende Eigenschaften von Punktschätzern
bestimmen. Auch diesen Weg haben wir exemplarisch für
beschritten. Die
erforderlichen Überlegungen waren im Falle von relativ simpel, können aber bei
bestimmten Schätzern (von denen einige noch vorgestellt werden) ziemlich kompliziert
werden, so dass eine Überprüfung der empirisch ermittelten Werte in diesen Fällen für
uns nicht möglich sein wird.
(c) Projekt Neue Statistik 2003, Freie Universität Berlin, Center für Digitale Systeme
Kontakt: http://www.neuestatistik.de
Page 7
Herunterladen