Statistik II Statistische Tests Statistik II - 12.5.2006 1 Test auf Anteilswert: Binomialtest • Sei eine Stichprobe unabhängig, identisch verteilter ZV (i.i.d.). • Teile diese Stichprobe in zwei Teilmengen (2 Klassen) für die gilt: • Betrachte nun die Stärke der ersten Klasse: Statistik II - 12.5.2006 2 • Die Summe n- unabhängiger Bernoulli Variablen ist binomialverteilt und das arithmetische Mittel ist ein Anteil (relative Häufigkeit) . • Damit: wobei • Als Teststatistik bietet sich daher an. • Die Quantile der Binomialverteilung können anhand von Tabellen bestimmt werden. Statistik II - 12.5.2006 3 • Wir betrachten nun das Testproblem • • Für wird verworfen, falls wird • Für nahe 0 bzw. 1, wähle größer als . Statistik II - 12.5.2006 kleiner bzw. 4 • Einseitige Tests: lehne lehne ab, falls ab, falls Statistik II - 12.5.2006 5 n wird groß • Mit Hilfe eines ZGW kann gezeigt werden: • Mit • Damit kann bei großen Stichproben als Prüfgröße verwendet werden und der kritische Wert anhand der Standardnormalverteilung bestimmt werden. Statistik II - 12.5.2006 6 • Siehe Skript Tabelle 9.4, S.54 für das Testschema • Beispiel Schira S.483 Statistik II - 12.5.2006 7 Test auf Varianz • Sei eine Stichprobe unabhängig, identisch und normal verteilter ZV. • Wir möchten überprüfen, ob die Varianz der Grundgesamtheit nicht von einem bestimmten Wert abweicht: • Wir wissen, dass die Zufallsvariable verteilt ist, deshalb ist sie als Prüfgröße geeignet. • Damit kennen wir die Verteilung und können die Quantile anhand der Tabellen bestimmen. Statistik II - 12.5.2006 8 • Da die Verteilung nicht symmetrisch ist, müssen auch hier bei zweiseitigen Testproblemen zwei kritische Werte bestimmt werden: Quelle: Schira Statistik II - 12.5.2006 9 • wird verworfen, falls: • Der Erwartungswert enthalten. ist nicht in der Teststatistik Statistik II - 12.5.2006 10 P-Wert / P-Value • Bisher: gegebenes Signifikanzniveau • Manchmal stellt man sich aber die Frage: bis zu welchem Signifikanzniveau würde gerade nicht verworfen? • Die Überschreitungswahrscheinlichkeit (sog. P-Wert, empirisches Signifikanzniveau) entspricht gerade einem Signifikanzniveau, bei dem die Prüfgröße auf den kritischen Wert fällt. • Es ist das maximale Signifikanzniveau, zu dem gerade nicht verworfen werden kann. Statistik II - 12.5.2006 11 • Damit gilt bei gegebenem Falls dann lehne : zum Niveau ab. • Grosse P-Werte sprechen also dafür, dass die Empirie mit der Hypothese vereinbar sind. • Kleine P-Werte hingegen sagen, dass das Auftreten der beobachteten Realisation der Teststatistik unwahrscheinlich ist, wenn stimmt. • Computerprogramme geben in der Regel den P-Wert an. • Gefahr, dass man nachträglich das Signifikanzniveau ändert, damit die gewünschte Testentscheidung erzeugt wird. Statistik II - 12.5.2006 12 • Beispiele: Wie bestimmt man den P-Wert? Quelle:Schira Statistik II - 12.5.2006 13 Gütefunktion/Machtfunktion • Die Wahrscheinlichkeit für einen Fehler erster Art ist d.h. • Die Wahrscheinlichkeit für einen Fehler 2.Art ist , , d.h. • i.d.R. gilt nicht • wir wollen und minimieren. Statistik II - 12.5.2006 14 • Tatsächlich sind und Funktionen von • Die Gütefunktion eines Tests über den Parameter ist als die folgende Ablehnwahrscheinlichkeit definiert: • Sie stellt damit Gegenwahrscheinlichkeit des Fehlers 2. Art dar. • Wir betrachten im folgenden den Test auf bekannter Varianz. Die Prüfgröße lautet: Statistik II - 12.5.2006 bei 15 • Sei • Sei und sei der kritische Wert von , sodass . Dann folgt : Statistik II - 12.5.2006 16 Graphische Darstellung Quelle: Schira Statistik II - 12.5.2006 17 • Es folgt weiterhin wegen der Symmetrie: • Die Gütefunktion entspricht hier also der Verteilungsfunktion der Normalverteilung • Es gilt ferner: • Die Gütefunktion wird immer „steiler“, wenn n groß wird. Statistik II - 12.5.2006 18 • Definition: Ein Signifikanztest zum Niveau heißt unverfälscht, wenn gilt: d.h. die WS, abzulehnen, wenn falsch ist, muss immer mindestens so groß sein wie die WS, abzulehnen, obwohl sie richtig ist. Statistik II - 12.5.2006 19