Normalverteilung Standardnormalverteilung Normalverteilung N(μ, σ2) mit μ ∈ , σ2 > 0 Dichte : f ( x) = Gaußsche Glockenkurve 1 2 πσ 2 e − Berechnung von Wahrscheinlichkeiten ‚zu Fuß’ nicht möglich ( x −μ ) 2 b 1 2 P (a < X ≤ b) = e 2 σ dx 2 a 2 πσ ( x −μ )2 2 σ2 = Φ ( μ ,σ2 ) (b) − Φ ( μ ,σ2 ) (a ) Eigenschaften der Dichte: - Maximum in μ - symmetrisch zu μ - Wendepunkte in μ ± σ μ−σ μ Dichte a b Computerprogramme enthalten die Verteilungsfunktion für beliebige μ, σ 2 ‚Zu Fuß‘: tabelliert ist nur Standardnormalverteilung Φ ( x ) = Φ 0,1 ( x ) μ+σ Berechnung von Φ 2 durch Transformation μ ,σ Form der Dichte in Abhängigkeit von den Parametern - Je größer der Abstand von μ, desto seltener liegen die Werte - Je kleiner σ, desto enger ist die Kurve x−μ Φ ( μ ,σ 2 ) ( x ) = Φ σ Erwartungswert: E X = μ Varianz: Var X = σ² WS 2016/17 NV 1 Prof. Dr. J. Schütze, FB GW WS 2016/17 Verteilungsfunktion Intervallwahrscheinlichkeiten Standardnormalverteilung Φ(x) (Ausschnitt aus Verteilungstabelle) 0,00 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,00 ,5000 ,5040 ,5080 ,5120 ,5160 ,5199 ,5239 ,5279 ,5319 ,5359 0,10 ,5398 ,5438 ,5478 ,5517 ,5557 ,5596 ,5636 ,5675 ,5714 ,5753 0,20 ,5793 ,5832 ,5871 ,5910 ,5948 ,5987 ,6026 ,6064 ,6103 ,6141 0,30 ,6179 ,6217 ,6255 ,6293 ,6331 ,6368 ,6406 ,6443 ,6480 ,6517 0,40 ,6554 ,6591 ,6628 ,6664 ,6700 ,6736 ,6772 ,6808 ,6844 ,6879 0,50 ,6915 ,6950 ,6985 ,7019 ,7054 ,7088 ,7123 ,7157 ,7190 ,7224 0,60 ,7257 ,7291 ,7324 ,7357 ,7389 ,7422 ,7454 ,7486 ,7517 ,7549 0,70 ,7580 ,7611 ,7642 ,7673 ,7704 ,7734 ,7764 ,7794 ,7823 ,7852 0,80 ,7881 ,7910 ,7939 ,7967 ,7995 ,8023 ,8051 ,8078 ,8106 ,8133 Normalverteilung N(μ, σ2) Berechnung von Intervallwahrscheinlichkeiten 2 für X ~ N (μ, σ ) 1 0.9 0.8 0.7 b−μ a−μ P (a < X ≤ b) = Φ −Φ σ σ Φ ( x) 0.4 0.3 0.2 0.1 0 -3 -2 -1 −x 0 1 2 3 x Ablesebeispiele: Φ (0,1) ( 0.43) = Φ ( 0.43 ) = 0.6664 Φ −1 (0.5) = 0 (Umkehrfunktion, 50%-Quantil) Wegen Symmetrie der Dichte zu Null enthalten Tabellen nur die Funktionswerte für x ≥ 0. Für x < 0 erfolgt eine Berechnung nach folgender Beziehung: Φ ( − x ) = 1 − Φ ( x ) WS 2016/17 Φ ( −0.8) = 1 − Φ (0.8) = 1 − 0.7881 = 0.2119 Prof. Dr. J. Schütze, FB GW als Fläche unter der Dichte tabelliert 0.6 0.5 Ablesebeispiel: NV 2 Prof. Dr. J. Schütze, FB GW b−μ P ( X ≤ b) = Φ σ a −μ P(a < X ) = 1 − Φ σ Dabei kann ≤ durch < und umgekehrt ersetzt werden. NV 3 WS 2016/17 Prof. Dr. J. Schütze, FB GW ►2.1 NV 4 Quantile der Normalverteilung Das α-Quantil z α der Standardnormalverteilung ist der Schwellwert, für den gilt, dass unterhalb von zα α·100% und oberhalb (1-α)·100% der Werte der Zufallsgröße X liegen: Konfidenzintervall für Parameter der Normalverteilung 1 0.9 0.8 0.6 0.5 α -2 -1 zα 0 1 2 → P ( − z1−α /2 < α α zα z0.95 = 1.64, z0.975 = 1.96. z0.99 = 2.33 NV 5 Prof. Dr. J. Schütze, FB GW Konfidenzintervall für Parameter der Normalverteilung s , x + tn−1,1−α / 2 x − tn−1,1−α / 2 n tn−1,q WS 2016/17 Einseitig oben offen s s , ∞ x − tn−1,1−α n n Konfidenzintervall KI für Parameter μ zur Sicherheit 1 - α σ σ z1−α / 2 < μ < X + z1− α / 2 X − n n WS 2016/17 Prof. Dr. J. Schütze, FB GW NV-KI Zweiseitig n −1 s, χ 2n −1, 1−α / 2 Einseitig unten offen s χ 2n −1, α / 2 n −1 Einseitig oben offen Einseitig unten offen n −1 ∞ s , χ 2n −1, 1−α 0, n −1 s χ 2n −1, α χ 2n−1,q Quantile der χ²-Verteilung der Ordnung q mit n-1 Freiheitsgraden s −∞, x + tn−1,1−α n Quantile der Ordnung q der t-Verteilung mit n-1 Freiheitsgraden Prof. Dr. J. Schütze, FB GW 6 KI für Parameter σ Einseitig unten offen σ − ∞, x + z1−α n KI für Erwartungswert μ bei unbekannter Standardabweichung σ zum Konfidenzniveau 1 - α Zweiseitig z1−α /2 Quantil der Standardnormalverteilung N(0,1) Konfidenzintervall für Parameter der Normalverteilung KI für Erwartungswert μ bei bekannter Standardabweichung σ zum Konfidenzniveau 1 - α: Einseitig oben offen σ , ∞ x − z1−α n X −μ < z1−α /2 ) = 1 − α σ/ n Umstellen der Ungleichungskette führt zu z1− α Die Quantile der Normalverteilung erhält man z.B. mit MATLAB oder Excel bzw. aus einer Verteilungstabelle für Φ ( z.B. Formelsammlung), α im Inneren der Tabelle nachschlagen, Quantil zα entsprechend auf dem Rand ablesen σ σ , x + z1−α / 2 x − z1−α / 2 n n X −μ ~ N (0,1) σ/ n 3 f ( x) Symmetrie der Dichte bewirkt Symmetrie der Quantile zα = − z1−α Zweiseitig Transformation in Standardnormalverteilung 1 n X i , X i ~ N (μ , σ 2 ) n i =1 0.1 0 -3 WS 2016/17 σ2 X ~ N μ, n 0.2 ‚Berechnung‘ mit Umkehrfunktion: zα = Φ −1 (α) Spezielle Quantile: somit X = 0.4 0.3 α = P ( X < zα ) = Φ ( zα ), 0 < α < 1 Ausgangspunkt: Verteilung der Stichprobenfunktion X Φ ( x) 0.7 ►2.2 NV-KI 7 WS 2016/17 Prof. Dr. J. Schütze, FB GW NV-KI 8 Statistische Tests für Parameter der Normalverteilung Statistische Tests für unbekannte Parameter Ablauf eines statistischen Parametertest (am Bsp. für Erwartungswert bei NV) Ablehnbereich bei Risiko α für H 0 : μ = μ 0 Ja-Nein-Entscheidung darüber, ob der unbekannte Parameter einer Verteilung gleich einem gegebenen konkreten Referenzwert ist z.B. Test, ob der unbekannte Erwartungswert μ einer Grundgesamtheit gleich μ0 ist, Entscheidung wird anhand einer zufälligen Stichprobe getroffen daher nur mit vorgegebener Sicherheit bzw. Risiko/Irrtumswahrscheinlichkeit H 0 : μ = μ0 Nullhypothese H1 : μ ≠ μ0 Alternativhypothese α Irrtumswahrscheinlichkeit X − μ0 T= σ/ n Dichte der Testgröße T, wenn Nullhypothese gilt Testgröße mit bekannter Verteilung, wenn H0 stimmt T > z1−α / 2 Fällt der aus der Stichprobe berechnete Wert der Testgröße in den Ablehnbereich, passiert das unter der Nullhypothese nur mit Wahrscheinlichkeit α. 1-α hier ist bei Gültigkeit von H 0 T standardnormalverteilt Ablehnung Ablehnung Ablehnbereich von H 0 bei Risiko α, z1−α / 2 Quantil der Standardnormalverteilung der Ordnung 1 − α / 2 WS 2016/17 Prof. Dr. J. Schütze, FB GW NV-Tests wenn Nullhypothese wahr ist, liegt T in diesem Intervall mit Wkt. 1- α 9 Statistische Tests für unbekannte Parameter WS 2016/17 Risiko α: Irrtumswahrscheinlichkeit für Ablehnung der Nullhypothese, obwohl sie richtig ist Lehnt man in diesem Fall die Nullhypothese ab, ist demnach die Irrtumswahrscheinlichkeit gleich α. Prof. Dr. J. Schütze, FB GW NV-Tests 10 Statistische Tests für unbekannte Parameter Tests über Mittelwerte normalverteilter Zufallsgrößen (1) Einseitige und zweiseitige Tests Einstichprobentest Gauß-Test Vergleich μ mit Referenzwert μ 0 ; σ 2 bekannt Zweiseitiger Test Nullhypothese: μ = μ0 gegen Alternativhypothese: μ ≠ μ0 Nullhypothese H 0 : μ = μ0 H 0 : μ ≥ μ0 H 0 : μ ≤ μ0 Einseitige Tests oder Nullhypothese: μ ≤ μ0 gegen Alternativhypothese: μ > μ0 Nullhypothese: μ ≥ μ0 gegen Alternativhypothese: μ < μ0 Alternativhypothese Testgröße Ablehnkriterium H1 : μ < μ0 X − μ0 σ/ n ~ N(0, 1) T < − z1− α H1 : μ ≠ μ0 H1 : μ > μ0 T= T > z1− α / 2 T > z1− α Die Irrtumswahrscheinlichkeit α besagt, dass man bei 100 Tests mit der Ablehnung der Nullhypothese nach diesem Verfahren in etwa 100α Fällen einen Fehler macht. ►2.3 WS 2016/17 Prof. Dr. J. Schütze, FB GW NV-Tests 11 WS 2016/17 Prof. Dr. J. Schütze, FB GW NV-Tests 12 Statistische Tests für unbekannte Parameter Statistische Tests für unbekannte Parameter Fehlermöglichkeiten bei der Testentscheidung Tests über Mittelwerte normalverteilter Zufallsgrößen (2) H0 abgelehnt Fehler 1. Art α H0 richtig H0 falsch Einstichprobentest T-Test H0 nicht abgelehnt Vergleich μmit μ0 ; σ 2 unbekannt richtige Entscheidung richtige Entscheidung Fehler 2. Art β Nullhypothese H 0 : μ = μ0 H 0 : μ ≥ μ0 H 0 : μ ≤ μ0 Es gibt also zwei mögliche Fehlentscheidungen. Das Risiko der Entscheidung gegen H0, obwohl H0 stimmt (Fehler 1. Art), ist über die Festlegung des Ablehnbereichs durch α begrenzt. Alternativhypothese H1 : μ ≠ μ0 H1 : μ < μ0 Testgröße T = X − μ0 Ablehnkriterium T > t n − 1,1− α / 2 s/ n T < − t n − 1,1− α ~ t n −1 H1 : μ > μ0 T > t n − 1,1− α Das Risiko der Beibehaltung von H0, obwohl H0 falsch ist (Fehler 2. Art) ergibt sich dann automatisch. Nur durch Vergrößern von n kann β bei gleichem α verkleinert werden ! Berechnung des erforderlichen Stichprobenumfangs: Versuchsplanung WS 2016/17 Prof. Dr. J. Schütze, FB GW NV-Tests 13 Statistische Tests für unbekannte Parameter 14 Zweistichprobentest für verbundene Stichproben Einstichprobentest: Der Erwartungswert einer Grundgesamtheit wird mit einem vorgegebenen Referenzwert μ0 verglichen Zweistichprobentest: Die Erwartungswerte μ1 und μ2 von zwei Grundgesamtheiten werden verglichen. Bei Zweistichprobentests unterscheidet man noch zwischen verbundenen (gepaarten) und nicht verbundenen (nicht gepaarten) Stichproben. WS 2016/17 NV-Tests Tests über Mittelwerte normalverteilter Zufallsgrößen (3) bisher nicht verbunden: Prof. Dr. J. Schütze, FB GW Statistische Tests für unbekannte Parameter Mittelwertvergleiche bei zwei normalverteilten Zufallsgrößen verbunden: WS 2016/17 die Stichprobenwerte liegen in Paaren vor, die jeweils an den gleichen Objekten gemessen wurden (z.B. vor und nach einer Behandlung) die Stichproben wurden in disjunkten Grundgesamtheiten erhoben (z.B. Gesunde und Kranke) Prof. Dr. J. Schütze, FB GW NV-Tests 15 Vergleich μ D = μ x − μ y mit 0; σ 2D unbekannt, X , Y verbunden, D = X − Y Nullhypothese Alternativhypothese H0 : μD = 0 H0 : μD ≥ 0 H0 : μD ≤ 0 H1 : μ D ≠ 0 H1 : μ D < 0 H1 : μ D > 0 Testgröße T = d sD n ~ t n −1 Ablehnkriterium T > t n −1,1−α / 2 T < − t n −1,1−α T > t n −1,1−α d i = xi − y i , d arithmetisches Mittel s D empirische Standardabweichung der Differenzen d i s 2D = WS 2016/17 1 n (di − d )2 n − 1 i =1 Prof. Dr. J. Schütze, FB GW NV-Tests 16 Statistische Tests für unbekannte Parameter Statistische Tests für unbekannte Parameter Tests über Mittelwerte normalverteilter Zufallsgrößen (5) Tests über Mittelwerte normalverteilter Zufallsgrößen (4) Zweistichprobentest Welch-Test Zweistichprobentest Doppelter T-Test Vergleich μ x mit μ y ; σ 2x , σ 2y unbekannt, verschieden; X , Y nicht verbunden Vergleich μ x mit μ y ; σ 2x , σ 2y unbekannt, aber gleich; X , Y nicht verbunden Nullhypothese H0 : μx = μy H0 : μx ≥ μy H0 : μx ≤ μy Alternativhypothese H1 : μ x ≠ μ y Testgröße H1 : μ x < μ y X −Y T = sg H1 : μ x > μ y ~ tn x Nullhypothese Ablehnkriterium nxn y nx + n y T > tn x + n y − 2 ,1−α / 2 T < − t n x + n y − 2,1−α H1 : μ x < μ y H0 : μx ≤ μ y T > t n x + n y − 2 ,1−α +ny −2 Alternativhypothese H1 : μ x ≠ μ y H0 : μx = μy H0 : μx ≥ μ y H1 : μ x > μ y Testgröße T = (X −Y ) / Ablehnkriterium 2 sx nx + 2 sy ny T > t f ,1−α / 2 T < − t f ,1−α T > t f ,1−α ~ tf t f , q Quantil der Ordnung q der t-Verteilung mit f Freiheitsgraden, wobei tm , q Quantil der Ordnung q der t-Verteilung mit m Freiheitsgraden (m ganzzahlig) ( n − 1) s x2 + ( n y − 1) s 2y gemeinsame (gepoolte) Varianz s g2 = x nx + n y − 2 WS 2016/17 Prof. Dr. J. Schütze, FB GW NV-Tests 17 Statistische Tests für unbekannte Parameter Tests über Varianz normalverteilter Zufallsgrößen Zweistichprobentests Vergleich σ 2x mit σ 2y Nullhypothese Alternativhypothese Testgröße H 0 : σ2x = σ2y H1 : σ2x ≠ σ2y 2 2 2 x 2 y 2 x 2 y H0 : σ ≥ σ H0 : σ ≤ σ 2 x 2 y 2 x 2 y H1 : σ < σ H1 : σ > σ T = sx / s y H0 ~ Fnx −1,n y −1 Ablehnbereich T > Fnx −1,ny −1,1−α / 2 oder T < Fnx −1, ny −1,α / 2 T < Fnx −1,n y −1,α T > Fnx −1,n y −1,1−α Fm , n , q : Quantil der F-Verteilung mit m , n Freiheitsgraden der Ordnung q Dieser Test zum Vergleich von Varianzen wird auch als Vortest genutzt für die Wahl des passenden Tests zum Mittelwertvergleich, d.h. Entscheidung zwischen doppeltem T-Test (bei gleichen Varianzen) Welch-Test (bei verschiedenen Varianzen). ►2.5 WS 2016/17 Prof. Dr. J. Schütze, FB GW NV-Tests 19 f = ( s x2 / n x + s 2y / n y ) 2 2 x 2 ( s / n x ) /( n x − 1) + ( s 2y / n y ) 2 /( n y − 1) (abrunden!) ►2.4 WS 2016/17 Prof. Dr. J. Schütze, FB GW NV-Tests 18