(c) Projekt Neue Statistik 2003 - Lernmodul: Grundlegende Eigenschaften von Punktschätzern Grundlegende Eigenschaften von Punktschätzern Worum geht es in diesem Modul? Schätzer als Zufallsvariablen Vorbereitung einer Simulation Verteilung von P-Dach Empirische Lage- und Streuungsparameter zur Beschreibung von p-Dach Theoretische Lage- und Streuungsparameter zur Beschreibung von P-Dach Vergleich der Ergebnisse Worum geht es in diesem Modul? Aufbauend auf den Erfahrungen mit Punktschätzern aus dem Einführungsmodul (s. ) soll in diesem Modul gezeigt werden, dass auch Schätzer selbst Zufallsvariablen sind. Um einen intuitiven Zugang zu ermöglichen, wird dies zunächst anhand einer Simulation plausibel gemacht. Im Anschluss daran werden exemplarisch der Erwartungswert und die Varianz von hergeleitet und mit den in der Simulation ermittelten Werten verglichen. Schätzer als Zufallsvariablen Die im Einführungsmodul (s. ) angestellten Simulationen verdeutlichen, dass bei wiederholter Schätzung ein und desselben Parameters unter identischen Bedingungen die Schätzwerte streuen. Es liegt daher nahe, die Schätzwerte als wiederholte Realisierungen ein und derselben Zufallsvariablen, des Schätzers bzw. der Schätzfunktion, zu modellieren. Der Schätzfunktion kann also eine Wahrscheinlichkeitsverteilung zugeordnet werden. Wie bei anderen Zufallsvariablen auch, lassen sich die Eigenschaften des Schätzers aus seiner Wahrscheinlichkeitsverteilung ableiten. Wir betrachten Stichproben vom Umfang . Jeweils einzelne Ziehungen ergeben eine Stichprobe, aus der wir über die Schätzfunktion einen Schätzwert bestimmen können. Die einzelnen Ziehungen sind unabhängig voneinander - das war bei unserer Simulation der Fall und wird auch im Folgenden vorausgesetzt. Führen wir unabhängige Ziehungen durch, so erhalten wir Page 1 Stichproben vom Umfang . Es sind (c) Projekt Neue Statistik 2003 - Lernmodul: Grundlegende Eigenschaften von Punktschätzern dann nicht nur die Realisierungen innerhalb einer Stichprobe unabhängig voneinander, sondern auch die Stichproben selbst. Daraus folgt unmittelbar, dass auch die Schätzwerte, die sich aus den unabhängigen Stichproben ergeben, unabhängig voneinander sind. Vorbereitung einer Simulation Um einen Eindruck von der Wahrscheinlichkeitsverteilung des bisher verwendeten Schätzers zu bekommen, wollen wir an das im Einführungsmodul (s. ) begonnene Simulationsexperiment anknüpfen. Zur Erinnerung: Es wurde das Wahlverhalten bei einer endlichen Grundgesamtheit ( Personen) untersucht, die anhand einer Urne mit 10000 Kugeln (2500 schwarze Kugeln und 7500 weiße Kugeln), veranschaulicht wurde. Die Wahrscheinlichkeit, bei der zufälligen Entnahme eine schwarze Kugel zu ziehen, beträgt also . Bei der zufälligen Entnahme von Kugeln aus der Urne misst die Anzahl der schwarzen Kugeln in der Stichprobe. Bei der Ziehung mit Zurücklegen wäre binomialverteilt (vgl. ). Wird - wie in unserem Beispiel - eine Ziehung ohne Zurücklegen betrachtet, so ist Page 2 immerhin (c) Projekt Neue Statistik 2003 - Lernmodul: Grundlegende Eigenschaften von Punktschätzern näherungsweise (vgl. Exkurs ) binomialverteilt, wenn der Stichprobenumfang gegenüber dem Umfang der Grundgesamtheit ist. klein Für unsere Simulationen verwenden wir ein einfaches Urnenmodell. Erfolgt die Ziehung mit Zurücklegen, d.h. wird nach jeder Ziehung die gezogene Kugel in die Urne zurückgelegt, dann bleibt das Verhältnis der Anzahl der schwarzen Kugeln zur Anzahl der weißen Kugeln in der Urne konstant und die Ergebnisse der Ziehungen sind - wie gefordert - unabhängig. Die Anzahl schwarzer Kugeln in der Stichprobe folgt dann einer Binomialverteilung. Übertragen wir das eben beschriebene Modell auf unser Wahl-Beispiel, würde eine Ziehung mit Zurücklegen aber bedeuten, dass ein und dieselbe Person evtl. zweimal oder sogar noch öfter in unsere Stichprobe gelangen könnte. Das ist in vielen Fällen jedoch unerwünscht. Hierbei handelt es sich übrigens um ein Problem, welches z.B. bei Befragungen über das Internet eine große Rolle spielt. Bei der Ziehung ohne Zurücklegen wird dieses Problem vermieden, allerdings sind die Beobachtungen dann nicht mehr unabhängig. Bezogen auf die Urne würde sich die Wahrscheinlichkeit eine Kugel mit einer bestimmten Farbe zu ziehen, mit jeder Ziehung verändern. Die Wahrscheinlichkeit, bei der -ten Ziehung eine weiße (oder schwarze) Kugel zu ziehen, ist abhängig von den vorherigen Ziehungen. Das Binomialmodell (vgl. ) kann dieses Verhalten nicht (exakt) abbilden. Die Graphik veranschaulicht die Abhängigkeit beim Ziehen ohne Zurücklegen anhand einer Urne mit 4 Kugeln. Beim Ziehen ohne Zurücklegen ist die Wahrscheinlichkeit für das Ereignis "schwarze Kugel gezogen" nicht konstant - die einzelnen Ziehungen sind nicht unabhängig. In unserem Fall enthält die Urne aber sehr viele - nämlich 10000 - Kugeln. D.h., dass Page 3 (c) Projekt Neue Statistik 2003 - Lernmodul: Grundlegende Eigenschaften von Punktschätzern bei der Ziehung einiger weniger Kugeln die beschriebenen Effekte nur sehr gering sind - wir können sie dann evtl. vernachlässigen. Haben wir z.B. 100 Kugeln gezogen, so kann sich dadurch die Wahrscheinlichkeit, bei der 101. Ziehung eine schwarze Kugel zu ziehen, im extremsten Fall auf 0.2424 verringern (oder auf 0.2525 erhöhen). Und selbst dies wäre nur genau dann der Fall, wenn wir vorher 100 schwarze (bzw. 100 weiße) Kugeln gezogen hätten; wie wir jedoch aus der Wahrscheinlichkeitsrechnung (s. Modul Diskrete Verteilungsmodelle) wissen, ist die Wahrscheinlichkeit für das Eintreten dieses Ereignisses extrem gering. Verteilung von P-Dach Weil eine Zufallsvariable ist, ist auch die relative Häufigkeit schwarzer Kugeln in der Stichprobe (also der Schätzer ) eine Zufallsvariable. Deren Wahrscheinlichkeitsverteilung lässt sich über eine Simulation gut veranschaulichen. Um eine genauere Approximation zu erreichen, werden dabei nicht wie in den vorangegangenen Simulationen 1000 Stichproben, sondern deutlich mehr, z.B. Stichproben vom Umfang , gezogen. Es ergibt sich folgendes Stabdiagramm: Das Stabdiagramm zeigt die in der Simulation ermittelte absolute Häufigkeitsverteilung für ; es ähnelt der Wahrscheinlichkeitsfunktion der Binomialverteilung. Tatsächlich zeigt sich eine starke Übereinstimmung mit den theoretisch erwarteten Häufigkeiten (als orange Punkte im Diagramm dargestellt), die sich aus der Wahrscheinlichkeitsfunktion der Binomialverteilung ergeben. Theoretische Überlegungen zur Verteilung von p^ Weil binomialverteilt ist und lediglich skaliert ist ( ist schließlich eine Konstante), lässt sich die Wahrscheinlichkeitsfunktion von leicht konstruieren. In der : Flashanimation ' Animation Wahrscheinlichkeits-Funktion von p-Dach ' siehe Online-Version wird dieser Sachverhalt erläutert. Empirische Lage- und Streuungsparameter zur Beschreibung von p-Dach Basierend auf den durch die Simulation gewonnen wir für Schätzwerten können jetzt einen Mittelwert, die (empirische) Varianz und die (empirische) Standardabweichung berechnen. Dafür können wir auf die bereits bekannten Formeln (vgl. ) zurückgreifen: Page 4 (c) Projekt Neue Statistik 2003 - Lernmodul: Grundlegende Eigenschaften von Punktschätzern Mittelwert: Varianz: Standardabweichung: Berechnen Sie mithilfe des Statistiklabors Mittelwert, Varianz und Standardabweichung unseres Schätzers unter Rückgriff auf den in der Simulationen gewonnen Datensatz. Vergleichen Sie anschließend den Mittelwert wahren Parameterwert unserer 10000 Schätzungen mit dem . Labordatei öffnen ( b12.zmpf ) Theoretische Lage- und Streuungsparameter zur Beschreibung von P-Dach Die im Statistiklabor berechneten Werte ( b19.spf ) geben uns einen Eindruck von den Eigenschaften unseres Schätzers. Allerdings ist die Verallgemeinerungsfähigkeit der Ergebnisse (trotz der hohen Anzahl von Wiederholungen der Schätzung) begrenzt. Wir wollen daher versuchen, losgelöst von konkreten Stichproben allgemeine Aussagen über zu machen. Anhand des uns bekannten Verteilungsmodells von [es gilt: , , ], können wir nämlich auch den Erwartungswert und die theoretische Varianz von bestimmen. Unter Rückgriff auf unsere Kenntnisse aus dem Kapitel Wahrscheinlichkeitsrechnung (vgl. )erhalten wir folgende Ergebnisse: Erwartungswert: Varianz: Page 5 (c) Projekt Neue Statistik 2003 - Lernmodul: Grundlegende Eigenschaften von Punktschätzern Standardabweichung: Bestimmen Sie (z.B. mithilfe des Statistiktaschenrechners) , und . Um einen Vergleich zu den empirisch ermittelten Größen zu bekommen, wählen wir für und die Werte, die auch in der Simulation verwendet wurden (, ). Eine Tageszeitung möchte die Zuverlässigkeit ihres Zustelldienstes überprüfen und befragt dazu einige zufällig ausgewählte Abonnenten. Lösen Sie die Aufgabe mit Hilfe des Statistiklabors! Labordatei öffnen ( b8e.zmpf ) Vergleich der Ergebnisse Ein Vergleich der von uns anhand der Simulationsdaten berechneten Werte mit den theoretisch hergeleiteten ergibt nach Einsetzen: Stichprobenumfang: Theorie Empirie (k=10000 Stichproben) Erwartungswert/Mittelwert Varianz Standardabweichung Wie sich zeigt, ergibt sich eine gute Übereinstimmung. In diesem Modul haben wir die Eigenschaften von Schätzern am Beispiel des Schätzers für den Anteilswert bei Binomialverteilung untersucht. Wir haben festgestellt, dass Schätzer selbst Zufallsvariablen mit bestimmten Eigenschaften (z.B. Verteilung, Erwartungswert und Varianz) sind. Um diese Eigenschaften zu untersuchen, haben wir zwei Wege beschritten. Zum einen haben wir Kennzahlen, die den Schätzer beschreiben (wie Mittelwert und empirische Varianz) über ein Simulationsexperiment bestimmt. Dieser Weg kann, wenn ausreichend viele Stichproben vorhanden sind, schon recht genaue Ergebnisse liefern. Kennt man die Verteilung der Zufallsvariablen - wie in unserem Falle - und ist zusätzlich die Voraussetzung der Unabhängigkeit erfüllt, so besteht weiterhin die Möglichkeit, die Verteilung des Schätzers, Erwartungswert, Varianz, etc. auch anhand theoretischer Überlegungen, also gänzlich unabhängig von empirischen Daten, zu Page 6 (c) Projekt Neue Statistik 2003 - Lernmodul: Grundlegende Eigenschaften von Punktschätzern bestimmen. Auch diesen Weg haben wir exemplarisch für beschritten. Die erforderlichen Überlegungen waren im Falle von relativ simpel, können aber bei bestimmten Schätzern (von denen einige noch vorgestellt werden) ziemlich kompliziert werden, so dass eine Überprüfung der empirisch ermittelten Werte in diesen Fällen für uns nicht möglich sein wird. (c) Projekt Neue Statistik 2003, Freie Universität Berlin, Center für Digitale Systeme Kontakt: http://www.neuestatistik.de Page 7