Normalverteilung Standardnormalverteilung

Werbung
Normalverteilung
Standardnormalverteilung
Normalverteilung N(μ, σ2) mit μ ∈ , σ2 > 0
Dichte :
f ( x) =
Gaußsche Glockenkurve
1
2 πσ
2
e
−
Berechnung von Wahrscheinlichkeiten ‚zu Fuß’ nicht möglich
( x −μ ) 2
b
1
2
P (a < X ≤ b) = 
e 2 σ dx
2
a
2 πσ
( x −μ )2
2 σ2
= Φ ( μ ,σ2 ) (b) − Φ ( μ ,σ2 ) (a )
Eigenschaften der Dichte:
- Maximum in μ
- symmetrisch zu μ
- Wendepunkte in μ ± σ
μ−σ
μ
Dichte
a
b
Computerprogramme enthalten die Verteilungsfunktion für beliebige μ, σ 2
‚Zu Fuß‘: tabelliert ist nur Standardnormalverteilung Φ ( x ) = Φ 0,1 ( x )
μ+σ
Berechnung von Φ 2 durch Transformation
μ ,σ
Form der Dichte in Abhängigkeit von den Parametern
- Je größer der Abstand von μ, desto seltener liegen die Werte
- Je kleiner σ, desto enger ist die Kurve
 x−μ
Φ ( μ ,σ 2 ) ( x ) = Φ 

 σ 
Erwartungswert: E X = μ
Varianz:
Var X = σ²
WS 2016/17
NV 1
Prof. Dr. J. Schütze, FB GW
WS 2016/17
Verteilungsfunktion
Intervallwahrscheinlichkeiten
Standardnormalverteilung Φ(x) (Ausschnitt aus Verteilungstabelle)
0,00
0,00
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
0,09
0,00
,5000
,5040
,5080
,5120
,5160
,5199
,5239
,5279
,5319
,5359
0,10
,5398
,5438
,5478
,5517
,5557
,5596
,5636
,5675
,5714
,5753
0,20
,5793
,5832
,5871
,5910
,5948
,5987
,6026
,6064
,6103
,6141
0,30
,6179
,6217
,6255
,6293
,6331
,6368
,6406
,6443
,6480
,6517
0,40
,6554
,6591
,6628
,6664
,6700
,6736
,6772
,6808
,6844
,6879
0,50
,6915
,6950
,6985
,7019
,7054
,7088
,7123
,7157
,7190
,7224
0,60
,7257
,7291
,7324
,7357
,7389
,7422
,7454
,7486
,7517
,7549
0,70
,7580
,7611
,7642
,7673
,7704
,7734
,7764
,7794
,7823
,7852
0,80
,7881
,7910
,7939
,7967
,7995
,8023
,8051
,8078
,8106
,8133
Normalverteilung N(μ, σ2)
Berechnung von Intervallwahrscheinlichkeiten
2
für X ~ N (μ, σ )
1
0.9
0.8
0.7
b−μ
a−μ
P (a < X ≤ b) = Φ 
−Φ

σ


 σ 
Φ ( x)
0.4
0.3
0.2
0.1
0
-3
-2
-1
−x
0
1
2
3
x
Ablesebeispiele: Φ (0,1) ( 0.43) = Φ ( 0.43 ) = 0.6664
Φ −1 (0.5) = 0 (Umkehrfunktion, 50%-Quantil)
Wegen Symmetrie der Dichte zu Null enthalten Tabellen nur die Funktionswerte für x ≥ 0.
Für x < 0 erfolgt eine Berechnung nach folgender Beziehung: Φ ( − x ) = 1 − Φ ( x )
WS 2016/17
Φ ( −0.8) = 1 − Φ (0.8) = 1 − 0.7881 = 0.2119
Prof. Dr. J. Schütze, FB GW
als Fläche unter der Dichte
tabelliert
0.6
0.5
Ablesebeispiel:
NV 2
Prof. Dr. J. Schütze, FB GW
b−μ
P ( X ≤ b) = Φ 

 σ 
a −μ
P(a < X ) = 1 − Φ 

 σ 
Dabei kann ≤ durch < und umgekehrt ersetzt werden.
NV 3
WS 2016/17
Prof. Dr. J. Schütze, FB GW
►2.1
NV 4
Quantile der Normalverteilung
Das α-Quantil z α der Standardnormalverteilung
ist der Schwellwert, für den gilt, dass unterhalb von zα
α·100% und oberhalb (1-α)·100% der Werte der
Zufallsgröße X liegen:
Konfidenzintervall für Parameter der Normalverteilung
1
0.9
0.8
0.6
0.5
α
-2
-1
zα
0
1
2
→ P ( − z1−α /2 <
α
α
zα
z0.95 = 1.64, z0.975 = 1.96. z0.99 = 2.33
NV 5
Prof. Dr. J. Schütze, FB GW
Konfidenzintervall für Parameter der Normalverteilung
s

, x + tn−1,1−α / 2
 x − tn−1,1−α / 2
n

tn−1,q
WS 2016/17
Einseitig
oben offen
s  
s

, ∞
  x − tn−1,1−α
n 
n

Konfidenzintervall KI für Parameter μ zur Sicherheit 1 - α
σ
σ


z1−α / 2 < μ < X +
z1− α / 2 
X −
n
n


WS 2016/17
Prof. Dr. J. Schütze, FB GW
NV-KI
Zweiseitig

n −1
s,

 χ 2n −1, 1−α / 2

Einseitig
unten offen

s

χ 2n −1, α / 2 
n −1
Einseitig oben
offen
Einseitig unten
offen


n −1
∞
s
,


 χ 2n −1, 1−α




 0,


n −1 
s
χ 2n −1, α 
χ 2n−1,q Quantile der χ²-Verteilung der Ordnung q mit n-1 Freiheitsgraden
s 

 −∞, x + tn−1,1−α

n

Quantile der Ordnung q der t-Verteilung mit n-1 Freiheitsgraden
Prof. Dr. J. Schütze, FB GW
6
KI für Parameter σ
Einseitig
unten offen
σ 

 − ∞, x + z1−α

n

KI für Erwartungswert μ bei unbekannter Standardabweichung σ
zum Konfidenzniveau 1 - α
Zweiseitig
z1−α /2 Quantil der Standardnormalverteilung N(0,1)
Konfidenzintervall für Parameter der Normalverteilung
KI für Erwartungswert μ bei bekannter Standardabweichung σ
zum Konfidenzniveau 1 - α:
Einseitig
oben offen
σ


, ∞
 x − z1−α
n


X −μ
< z1−α /2 ) = 1 − α
σ/ n
Umstellen der Ungleichungskette führt zu
z1− α
Die Quantile der Normalverteilung erhält man z.B. mit MATLAB oder Excel bzw.
aus einer Verteilungstabelle für Φ ( z.B. Formelsammlung),
α im Inneren der Tabelle nachschlagen, Quantil zα entsprechend auf dem Rand ablesen
σ
σ 

, x + z1−α / 2
 x − z1−α / 2

n
n

X −μ
~ N (0,1)
σ/ n
3
f ( x)
Symmetrie der Dichte bewirkt Symmetrie der Quantile
zα = − z1−α
Zweiseitig
Transformation in Standardnormalverteilung
1 n
 X i , X i ~ N (μ , σ 2 )
n i =1
0.1
0
-3
WS 2016/17
 σ2 
X ~ N  μ, 
 n 
0.2
‚Berechnung‘ mit Umkehrfunktion:
zα = Φ −1 (α)
Spezielle Quantile:
somit
X =
0.4
0.3
α = P ( X < zα ) = Φ ( zα ), 0 < α < 1
Ausgangspunkt: Verteilung der Stichprobenfunktion X
Φ ( x)
0.7
►2.2
NV-KI
7
WS 2016/17
Prof. Dr. J. Schütze, FB GW
NV-KI
8
Statistische Tests für Parameter der Normalverteilung
Statistische Tests für unbekannte Parameter
Ablauf eines statistischen Parametertest (am Bsp. für Erwartungswert bei NV)
Ablehnbereich bei Risiko α für H 0 : μ = μ 0
Ja-Nein-Entscheidung darüber, ob der unbekannte Parameter einer Verteilung
gleich einem gegebenen konkreten Referenzwert ist
z.B. Test, ob der unbekannte Erwartungswert μ einer Grundgesamtheit gleich μ0 ist,
Entscheidung wird anhand einer zufälligen Stichprobe getroffen
daher nur mit vorgegebener Sicherheit bzw. Risiko/Irrtumswahrscheinlichkeit
H 0 : μ = μ0
Nullhypothese
H1 : μ ≠ μ0
Alternativhypothese
α
Irrtumswahrscheinlichkeit
X − μ0
T=
σ/ n
Dichte der Testgröße T,
wenn Nullhypothese gilt
Testgröße mit bekannter Verteilung, wenn H0 stimmt
T > z1−α / 2
Fällt der aus der Stichprobe
berechnete Wert der Testgröße
in den Ablehnbereich, passiert das
unter der Nullhypothese nur mit
Wahrscheinlichkeit α.
1-α
hier ist bei Gültigkeit von H 0 T standardnormalverteilt
Ablehnung
Ablehnung
Ablehnbereich von H 0 bei Risiko α,
z1−α / 2 Quantil der Standardnormalverteilung der Ordnung 1 − α / 2
WS 2016/17
Prof. Dr. J. Schütze, FB GW
NV-Tests
wenn Nullhypothese wahr ist, liegt T in
diesem Intervall mit Wkt. 1- α
9
Statistische Tests für unbekannte Parameter
WS 2016/17
Risiko α:
Irrtumswahrscheinlichkeit für
Ablehnung der Nullhypothese,
obwohl sie richtig ist
Lehnt man in diesem Fall die
Nullhypothese ab, ist demnach
die Irrtumswahrscheinlichkeit
gleich α.
Prof. Dr. J. Schütze, FB GW
NV-Tests
10
Statistische Tests für unbekannte Parameter
Tests über Mittelwerte normalverteilter Zufallsgrößen (1)
Einseitige und zweiseitige Tests
Einstichprobentest Gauß-Test
Vergleich μ mit Referenzwert μ 0 ; σ 2 bekannt
Zweiseitiger Test
Nullhypothese: μ = μ0 gegen Alternativhypothese: μ ≠ μ0
Nullhypothese
H 0 : μ = μ0
H 0 : μ ≥ μ0
H 0 : μ ≤ μ0
Einseitige Tests
oder
Nullhypothese: μ ≤ μ0 gegen Alternativhypothese: μ > μ0
Nullhypothese: μ ≥ μ0 gegen Alternativhypothese: μ < μ0
Alternativhypothese
Testgröße
Ablehnkriterium
H1 : μ < μ0
X − μ0
σ/ n
~ N(0, 1)
T < − z1− α
H1 : μ ≠ μ0
H1 : μ > μ0
T=
T > z1− α / 2
T > z1− α
Die Irrtumswahrscheinlichkeit α besagt, dass man bei 100 Tests mit der
Ablehnung der Nullhypothese nach diesem Verfahren in etwa 100α Fällen einen
Fehler macht.
►2.3
WS 2016/17
Prof. Dr. J. Schütze, FB GW
NV-Tests
11
WS 2016/17
Prof. Dr. J. Schütze, FB GW
NV-Tests
12
Statistische Tests für unbekannte Parameter
Statistische Tests für unbekannte Parameter
Fehlermöglichkeiten bei der Testentscheidung
Tests über Mittelwerte normalverteilter Zufallsgrößen (2)
H0 abgelehnt
Fehler 1. Art
α
H0 richtig
H0 falsch
Einstichprobentest T-Test
H0 nicht abgelehnt
Vergleich μmit μ0 ; σ 2 unbekannt
richtige Entscheidung
richtige Entscheidung
Fehler 2. Art
β
Nullhypothese
H 0 : μ = μ0
H 0 : μ ≥ μ0
H 0 : μ ≤ μ0
Es gibt also zwei mögliche Fehlentscheidungen.
Das Risiko der Entscheidung gegen H0, obwohl H0 stimmt (Fehler 1. Art),
ist über die Festlegung des Ablehnbereichs durch α begrenzt.
Alternativhypothese
H1 : μ ≠ μ0
H1 : μ < μ0
Testgröße
T =
X − μ0
Ablehnkriterium
T > t n − 1,1− α / 2
s/ n
T < − t n − 1,1− α
~ t n −1
H1 : μ > μ0
T > t n − 1,1− α
Das Risiko der Beibehaltung von H0, obwohl H0 falsch ist (Fehler 2. Art)
ergibt sich dann automatisch.
Nur durch Vergrößern von n kann β bei gleichem α verkleinert werden !
Berechnung des erforderlichen Stichprobenumfangs: Versuchsplanung
WS 2016/17
Prof. Dr. J. Schütze, FB GW
NV-Tests
13
Statistische Tests für unbekannte Parameter
14
Zweistichprobentest für verbundene Stichproben
Einstichprobentest:
Der Erwartungswert einer Grundgesamtheit wird mit einem
vorgegebenen Referenzwert μ0 verglichen
Zweistichprobentest:
Die Erwartungswerte μ1 und μ2 von zwei Grundgesamtheiten
werden verglichen.
Bei Zweistichprobentests unterscheidet man noch zwischen verbundenen (gepaarten)
und nicht verbundenen (nicht gepaarten) Stichproben.
WS 2016/17
NV-Tests
Tests über Mittelwerte normalverteilter Zufallsgrößen (3)
bisher
nicht verbunden:
Prof. Dr. J. Schütze, FB GW
Statistische Tests für unbekannte Parameter
Mittelwertvergleiche bei zwei normalverteilten Zufallsgrößen
verbunden:
WS 2016/17
die Stichprobenwerte liegen in Paaren vor, die jeweils an
den gleichen Objekten gemessen wurden
(z.B. vor und nach einer Behandlung)
die Stichproben wurden in disjunkten Grundgesamtheiten erhoben
(z.B. Gesunde und Kranke)
Prof. Dr. J. Schütze, FB GW
NV-Tests
15
Vergleich μ D = μ x − μ y mit 0; σ 2D unbekannt, X , Y verbunden, D = X − Y
Nullhypothese
Alternativhypothese
H0 : μD = 0
H0 : μD ≥ 0
H0 : μD ≤ 0
H1 : μ D ≠ 0
H1 : μ D < 0
H1 : μ D > 0
Testgröße
T =
d
sD
n
~ t n −1
Ablehnkriterium
T > t n −1,1−α / 2
T < − t n −1,1−α
T > t n −1,1−α
d i = xi − y i ,
d arithmetisches Mittel
s D empirische Standardabweichung der Differenzen d i
s 2D =
WS 2016/17
1 n
 (di − d )2
n − 1 i =1
Prof. Dr. J. Schütze, FB GW
NV-Tests
16
Statistische Tests für unbekannte Parameter
Statistische Tests für unbekannte Parameter
Tests über Mittelwerte normalverteilter Zufallsgrößen (5)
Tests über Mittelwerte normalverteilter Zufallsgrößen (4)
Zweistichprobentest Welch-Test
Zweistichprobentest Doppelter T-Test
Vergleich μ x mit μ y ; σ 2x , σ 2y unbekannt, verschieden; X , Y nicht verbunden
Vergleich μ x mit μ y ; σ 2x , σ 2y unbekannt, aber gleich; X , Y nicht verbunden
Nullhypothese
H0 : μx = μy
H0 : μx ≥ μy
H0 : μx ≤ μy
Alternativhypothese
H1 : μ x ≠ μ y
Testgröße
H1 : μ x < μ y
X −Y
T =
sg
H1 : μ x > μ y
~ tn
x
Nullhypothese
Ablehnkriterium
nxn y
nx + n y
T > tn
x
+ n y − 2 ,1−α / 2
T < − t n x + n y − 2,1−α
H1 : μ x < μ y
H0 : μx ≤ μ y
T > t n x + n y − 2 ,1−α
+ny −2
Alternativhypothese
H1 : μ x ≠ μ y
H0 : μx = μy
H0 : μx ≥ μ y
H1 : μ x > μ y
Testgröße
T = (X −Y ) /
Ablehnkriterium
2
sx
nx
+
2
sy
ny
T > t f ,1−α / 2
T < − t f ,1−α
T > t f ,1−α
~ tf
t f , q Quantil der Ordnung q der t-Verteilung mit f Freiheitsgraden, wobei
tm , q Quantil der Ordnung q der t-Verteilung mit m Freiheitsgraden (m ganzzahlig)
( n − 1) s x2 + ( n y − 1) s 2y
gemeinsame (gepoolte) Varianz s g2 = x
nx + n y − 2
WS 2016/17
Prof. Dr. J. Schütze, FB GW
NV-Tests
17
Statistische Tests für unbekannte Parameter
Tests über Varianz normalverteilter Zufallsgrößen
Zweistichprobentests
Vergleich σ 2x mit σ 2y
Nullhypothese Alternativhypothese Testgröße
H 0 : σ2x = σ2y
H1 : σ2x ≠ σ2y
2
2
2
x
2
y
2
x
2
y
H0 : σ ≥ σ
H0 : σ ≤ σ
2
x
2
y
2
x
2
y
H1 : σ < σ
H1 : σ > σ
T = sx / s y
H0
~ Fnx −1,n y −1
Ablehnbereich
T > Fnx −1,ny −1,1−α / 2 oder T < Fnx −1, ny −1,α / 2
T < Fnx −1,n y −1,α
T > Fnx −1,n y −1,1−α
Fm , n , q : Quantil der F-Verteilung mit m , n Freiheitsgraden der Ordnung q
Dieser Test zum Vergleich von Varianzen wird auch als Vortest genutzt für die Wahl
des passenden Tests zum Mittelwertvergleich, d.h. Entscheidung zwischen
doppeltem T-Test (bei gleichen Varianzen)
Welch-Test (bei verschiedenen Varianzen).
►2.5
WS 2016/17
Prof. Dr. J. Schütze, FB GW
NV-Tests
19
f =
( s x2 / n x + s 2y / n y ) 2
2
x
2
( s / n x ) /( n x − 1) + ( s 2y / n y ) 2 /( n y − 1)
(abrunden!)
►2.4
WS 2016/17
Prof. Dr. J. Schütze, FB GW
NV-Tests
18
Herunterladen