Gauss-Modell Kap. 24 Signifikanztests Kap. 26 Meßergebni s exact value bias chance error wobei bias außer acht gelassen wird Der SD zeigt die Genauigkeit einer einzelnen Messung an Der SE zeigt die Genauigkeit dieser von mehreren (vielen) Messungen an Achtung bei fonds oder pattern over time Nullhypothese: Annahme, dass eine beobachtete Schwankung lediglich auf Zufallsschwankungen zurückzuführen ist Alternativhypothese: Annahme, dass die beobachtete Abweichung einen zufallsunabhängigen Grund hat („echt ist“) Teststatistik: Größe, die die Differenz zwischen Daten und den unter der Nullhypothese erwarteten Werten misst. z beobachtet er Wert erwarteter Wert SE Beobachtetes Signifikanzniveau: Wahrscheinlichkeit dafür, ein mindestens so extremes wie das beobachtete Ergebnis zu erhalten T-Test Grundstruktur eines Signifikanztests: Schachtelmodell für die Daten unter der Nullhypothese Teststatistik, um Abweichungen zwischen Daten und erwarteten Werten zu messen Ermittlung des beobachteten Signifikanzniveaus Modifikation des z-Tests für kleine Stichproben: Korrekturfaktor für SD: * SD Anzahl der Messungen Anzahl der Messungen 1 * SD Verwendung der t-Verteilung mit n-1 Freiheitsgraden Fehler 1. Art/Fehler 2. Art Realität Urteil nicht schuldig schuldig nicht schuldig o.k. Fehler 1. Art schuldig Fehler 2. Art o.k. Fehler 1. Art: Wahrscheinlichkeit Nullhypothese verwerfen, obwohl diese richtig ist Fehler 2. Art: Wahrscheinlichkeit Nullhypothese nicht verwerfen, obwohl Alternativhypothese richtig ist Wenn möglich mit Binomialverteilung! Weitere Tests für das arithmetische Mittel Kap. 27 Definieren einer Trennwand, d.h. Test zum Signifikanzniveau von x% SE einer Differenz: Der SE einer Differenz zweier unabhängiger Quantitäten (Mengen) ist: a 2 b 2 ,wobeia SEder1.Größe undb SEder2.Größe ist. Vergleich von 2 sample averages: z beobachtet e Differenz erwartete Differenz Differenz der SE Notwendig für Berechnung: beide Stichprobengrößen beide Mittelwerte beide SD’s 2-Test Voraussetzung: unabhängige Zufallsstichproben Auch anwendbar bei Ziehen ohne Zurücklegen, wenn ein nicht zu großer Anteil gezogen wird Beurteilung der Anpassungsgüte. (Wie gut stimmen Modell und Daten überein?; prüft die Verteilung) 2 beobachtet e Häufigkeit erwartete 2 Häufigkeit erwartete Häufigkeit oder 2 O E 2 E Approximation des p-Wertes durch 2-Verteilung möglich. Falls keine Parameter geschätzt werden: Anzahl der Freiheitsg rade Anzahl der Summanden 1 Für abhängige Experimente können die ²-Statistik sowie die Freiheitsgrade aufaddiert werden. Bei 10 m x n Kontingenztafeln kann auf Unabhängigkeit getestet werden. Falls keine Parameter geschätzt werden, gibt es m 1* n 1 Freiheitsgrade Signifikanztests genauer betrachtet Kap. 29 Nullhypothese: Unabhängigkeit Alternativhypothese: Abhängigkeit Wann ist ein Resultat signifikant? Im Wesentlichen handelt es sich um Konventionen, also besser p-Wert und Testverfahren angeben Data Snooping: multiples Testen Hypothesen und Alternativen nach Angehen der Stichprobe Aussuchen eines Tests, der das (subjektiv) beste Resultat bringt einseitiger oder zweiseitiger Test je nach Formulierung der Alternativhypothese Achtung! p-Wert abhängig von der Stichprobengröße: zu klein: selbst Relevantes ist nicht signifikant zu groß: irrelevantes ist signifikant Signifikanztest prüft nur, ob es sich um eine zufällige Schwankung handelt oder nicht. Prüft nicht die Güte des Modells oder die Wichtigkeit des Unterschieds. Macht nur Sinn, wenn Wahrscheinlichkeitsmodell zugrunde liegt Daher Vorsicht bei: Grundgesamtheit sample of convenience Test von McNemar Situation: Umfrage über Einstellungen, dh. es interessieren nur Wechsler technisch: Ziehen aus der Schachtel 0 1 nachher vorher relevant nicht relevant relevant 49 1 50 nicht relevant 6 44 50 55 45 100 Zeichentest Benutzung der Binomialverteilung bzw. der Normalapproximation (bei großer Anzahl von Wechslern) Situation: Median unbekannt bei n Ziehungen mit Zurücklegen Nullhypothese: m=m0 wobei m0 ein fester Wert ist, der mit einer Wahrscheinlichkeit von 0 gezogen wird. Alternative: mm0 (zweiseitig) bzw. m<m0, m>m0 (einseitig) Technik: Ersetze jede Ziehung durch 0, falls Ziehung < m0 1, falls Ziehung > m0 dh. n-faches Ziehen aus 0 1 binomialverteilt mit p=0,5 falls m=m0 weglasen, wenn es nicht zu oft vorkommt Wilcoxon-Test Situation: n-Ziehungen aus Schachtel A und m-Ziehungen aus Schachtel B Frage: A=B? Problem: Anzahl der Ziehungen gering; keine Informationen über A, B nicht nomialverteilt Wilcoxon-Tabelle! Nullhypothese: A=B Alternativhypothese: Werte von B sind um einen konstanten Faktor AB (zweiseitig) oder A>B, A<B (einseitig) (t-/z-Test) Technik: ordnen der Werte nach der Größe und Vergabe von Rangzahlen vorher Benennung: kleinere Stichprobe: n-Werte, größere Stichprobe: m-Werte Berechnen der Wilcoxon-Statistik Wxy R A 0,5n * (n 1) a in Tabelle Tabellenbenutzung: k1=n; k2=m nm EW W xy ist symmetrisch um 2 SE(W xy ) Binomialverteilung nm(n m 1) 12 Normalapproximation anwendbar, wenn: n10 und m10 n4 und m4 und n+m30 Methoden für Parameterschätzung: 1. Häufigkeitseintrag: führt zu nichts 2. Momentanmethode: führt zum gleichen Ergebnis wie Maximum-Likelihood-Methode Man setzt: Stichprobenparameter = Modellparameter (Stichprobenmittel = erwartetes Mittel) 3. Maximum-Likelihood-Prinzip Technik: a. Aufstellen der Likelihood-Funktion b. Logarithmieren c. Ableiten und Nullsetzen k 1 * k * x n i 1 i p Poissonverteilung (Grenzfall der Binomialverteilung für seltenere Ereignisse) Überprüfung der Anpassungsgüte mit 2-Test. Anzahl der Freiheitsgrade wird für jeden der geschätzten Parameter um 1 reduziert. Man kann dabei auch einige Werte zusammenfassen. Dies ist jedoch mit Vorsicht zu geniessen. λ i k * x Wk(i) i! i 1 i Erwartungswert der Summe: ; SE der Summe: λ , aber welches Über Maximum-Likelihood-Methode berechnen: L()=... nach Logarithmieren und Ableiten: Anpassungsgüte ermitteln durch 2-Test mit Reduzierung der Freiheitsgrade