Statistik II Weitere Statistische Tests Statistik II - 26.5.2006 1 Test auf Verteilung: Anpassungstests • Ist ein theoretisches Modell geeignet, beobachtete Resultate zu erklären? • Hierzu wird eine theoretische Verteilungsfunktion mit der Wahrscheinlichkeitsverteilung der Grundgesamtheit verglichen. Die Nullhypothese lautet: • ist zum Beispiel die Verteilungsfunktion der Normalverteilung, der Binomialverteilung etc… Statistik II - 26.5.2006 2 Test auf Normalverteilung / Jarque-Bera Test • Der Anpassungstest im Fall der Normalverteilung beruht auf Eigenschaften der Normalverteilung. (Schiefe) (Wölbung) mit Statistik II - 26.5.2006 3 • Es gilt für die Schätzer der höheren Momente: • Damit gilt im Fall der Normalverteilung für die standardisierten ZV: • sind unabhängig. Statistik II - 26.5.2006 4 • Damit gilt auch: • Und damit: • JB ist also eine geeignete Teststatistik für unser Problem und die Nullhypothese wird abgelehnt, falls die Prüfgröße zu groß wird: verwerfen. Statistik II - 26.5.2006 5 Beispiel: Matlab Funktion jbtest Statistik II - 26.5.2006 6 Statistik II - 26.5.2006 7 Statistik II - 26.5.2006 8 -Anpassungstest • Allgemeinere Formulierung, da nicht nur NV • Diskrete oder stetige ZV • Die theoretische Verteilung kann entweder vollständig bekannt sein oder von noch zu schätzenden Parametern abhängen. • Die Prüfgröße beruht auf dem Vergleich von tatsächlich beobachteten Häufigkeiten mit den unter zu erwartenden Häufigkeiten. Statistik II - 26.5.2006 9 • Zum Einstieg ein Beispiel (Quelle: Schira, S.513): Die Gleichverteilung mit einer zweiwertigen Variablen Statistik II - 26.5.2006 10 Es gilt: So dass die Nullhypothese mit diesem Test bei einem Signifikanzniveau von fünf Prozent nicht verworfen werden kann. • Warum ist die Prüfgröße verteilt? s. Beweis Statistik II - 26.5.2006 11 • Nehmen wir an, wir hätten eine m-wertige Variable und n Beobachtungen: • Die Prüfgröße ist jetzt asymptotisch chi-Quadrat verteilt mit m-1 Freiheitsgraden und sieht wie folgt aus: •Notation Skript: Statistik II - 26.5.2006 12 Stetige Verteilungen: • In diesem Fall muss man zur Durchführung des Test die Merkmalsachse in aneinandergrenzende Intervalle unterteilen. Dichtefunktion der Verteilung Statistik II - 26.5.2006 13 • Die auf • Die auf entfallende Wahrscheinlichkeit: entfallende Häufigkeit: • Es ist besser, möglichst viele Intervalle zu bilden. Stichwort: Fehler 2.Art • Bilde die Intervalle in den Bereichen breiter, wo es nur wenige Beobachtungen gibt. • Notation Skript: Statistik II - 26.5.2006 14 • Bekannte Verteilung mit unbekannten Parametern z.B. Binomialverteilung, Poissonverteilung • In diesem Fall müssen die Parameter der Verteilung mit den Daten geschätzt werden, was die Anzahl der Freiheitsgrade gerade um die Anzahl der geschätzten Parameter (k) verringert. • Mit Hilfe der geschätzten Parameter können die Wahrscheinlichkeiten geschätzt werden: Statistik II - 26.5.2006 15 • Damit lässt sich auch die erwartete Häufigkeit einer Klasse schätzen: • Die Prüfgröße lautet dann wie folgt: Statistik II - 26.5.2006 16