*n)Y( X Y µ= µ⇒

Werbung
Asymptotische Normalverteilung
nach dem zentralen Grenzwertsatz
• Erwartungswert einer Summe von n
Zufallsvariablen Xi mit jeweils den
Erwartungswert µx
n
Yn = ∑ Xi ⇒ µ(Yn ) = n * µ X
i =1
Asymptotische Normalverteilung
nach dem zentralen Grenzwertsatz
• Varianz einer Summe von n voneinander
unabhängigen Zufallsvariablen Xi mit jeweils
der Varianz σ2
X
n
Yn = ∑ X i ⇒ σ 2 ( Yn ) = n * σ 2X
i =1
Asymptotische Normalverteilung
nach dem zentralen Grenzwertsatz
• Ist der Stichprobenumfang n hinreichend
groß, dann ist die Summe Yn der n
Zufallsvariablen Xn annähernd Normalverteilt:
n
Yn = ∑ X i ⇒ f ( Yn ) ≈ N(n * µ X ;n * σ 2X )
i =1
mit f(Yn) = Wahrscheinlichkeitsdichte
der Summe Yn
Asymptotische Normalverteilung
nach dem zentralen Grenzwertsatz
• Wird die Summe Yn standardisiert, dann
resultiert die z-transformierte Summe Zn als:
n
Z
n
=
∑
i=1
X
i
− n * µ
n * σ
X
2
X
Zn = standardisierte Summe von n identisch
verteilten, statistisch unabhängigen
Zufallsvariablen Xi
Asymptotische Normalverteilung
nach dem zentralen Grenzwertsatz
• Zn ist standardnormalverteilt, wenn der
Stichprobenumfang n gegen unendlich geht:
– Mit f(Zn) = Wahrscheinlichkeitsdichte der
Variablen Zn
ϕ(z) = Dichte der Standardnormal–
verteilung
• gilt:
Asymptotische Normalverteilung
nach dem zentralen Grenzwertsatz
n
∑ Xi − n * µ X
Zn = i =1
n * σ 2X
⇒ lim (f ( Z n )) = ϕ( z )
n→∞
Asymptotische Normalverteilung
nach dem zentralen Grenzwertsatz
• Der Erwartungswert des Mittelwerts von n
Zufallsvariablen kann berechnet werden als
die durchschnittliche Summe der
Zufallsvariablen:
n
−•

1 
1
Yn = 0 + *  ∑ Xi  = 0 + * (n * µ X ) =
n  i =1 
n
1
0 + * (n * µ X ) = µ X
n
Asymptotische Normalverteilung
nach dem zentralen Grenzwertsatz
• Die Varianz des Mittelwerts n Zufallsvariablen
beträgt:
−
1
 1
σ 2 ( Yn ) = σ 2  * Yn  = 2 * σ 2 (Yn ) =
n
 n
2
σ
= 2 * (n * σ 2X ) = X
n
n
1
Asymptotische Normalverteilung
nach dem zentralen Grenzwertsatz
• Für den Erwartungswert der Kennwerteverteilung eines Stichprobenmittelwerts in
einfachen Zufallsauswahlen gilt:
•
n
−
 1
1 

µ − = µ( X) = * µ ∑ X i  = * (n * µ X ) = µ X
n  i =1  n
X
−
µ − = µ( X) = Erwartungswert der Zufallsvariablen
X
Stichprobenmittelwert
Asymptotische Normalverteilung
nach dem zentralen Grenzwertsatz
• Die Varianz der Kennwerteverteilung des
Stichprobenmittelwerts bei einfachen
Zufallsauswahlen mit Zurücklegen:
n
−


1
2
2
2
σ - = σ ( X) = 2 * σ  Xi  =
X
n
 i =1 
∑
2
σ
2
X
σ
=
*
(
n
*
)
X
2
n
n
1
Asymptotische Normalverteilung
nach dem zentralen Grenzwertsatz
• Die Standardabweichung der Kennwertverteilung beträgt:
• Mit Zurücklegen:
2
−
σX σX
σ( X) =
=
n
n
• Ohne Zurücklegen:
−
σX
N−n
*
σ(X) =
N −1
n
Asymptotische Normalverteilung
nach dem zentralen Grenzwertsatz
• Die Kennwertverteilung des Stichprobenmittelwerts ist asymptotisch normalverteilt:
•
 1
f ( X ) = f  *
n
−
−

∑ X i 
i=1

n
f( X) = Kennwerteverteilung der Zufallsvariablen
„Stichprobenmittelwert“.
Asymptotische Normalverteilung
nach dem zentralen Grenzwertsatz
• Es gilt:
– Mit Zurücklegen:

f ( X ) ≈ N  µ

– Ohne Zurücklegen:
−
X
σ 2X
;
n




2


σ
X N − n

f (X) ≈ N µX; *
n N − 1 

_
Asymptotische Normalverteilung
nach dem zentralen Grenzwertsatz
• Zentrale Bedeutung der Kennwertverteilungen:
– stellen Verbindung zwischen empirischen
Stichprobenkennwerten und
unbekanntenPopulationsparamter her.
Überführung einer Binomialverteilung
in eine Standardnormalverteilung
• Den Realisationen der Binomialverteilung
werden Intervalle der Standardnormalverteilung zugeordnet:
n  n1
P(a≤ n1 ≤ b)= ∑   * π1 * (1− π1)n−n1
n1 =an1
b
 b + 0,5 − 50* 0,5   a − 0,5 − (n * π1 ) 

 − φ
≈ φ
  n * π * (1 − π ) 
50
*
0
,
5
*
(
1
0
,
5
)
−
1
1 

 
Überführung einer Binomialverteilung
in eine Standardnormalverteilung
• Erklärungen zur Formel:
– P(a≤n1≤b) = Wahrscheinlichkeit, dass die
Häufigkeit n1 der Ausprägung 1 zwischen a
und b liegt.
– Φ = Wert der Verteilungsfunktion der
Standardnormalverteilung
– 0,5 = Anpassungswert, um den diskreten
Ausprägungen einer binomialverteilten ZV
Intervalle der kontinuierlichen
Normalverteilung zuordnen zu können.
Überführung einer Binomialverteilung
in eine Standardnormalverteilung
• Anwendungsbeispiel: Die Wahrscheinlichkeit,
dass eine binomialverteilte ZV X mit den
Parametern n = 50 ; π1= 0,5 ; n1 = 25 auftritt:
 25 + 0,5 − 50 * 0,5 
 25 − 0,5 − 50 * 0,5 
 − Φ

P( 25) ≈ Φ



 50 * 0,5 * (1 − 0,5) 
 50 * 0,5 * (1 − 0,5) 
= Φ(0,141)
− Φ( −0,141)
= 0,1121
Von der hypergeometrischen- in eine
Standardnormalverteilung
• Die hypergeometrische Verteilung nähert sich
asymptotisch der Normalverteilung an. Es gilt:
P(a ≤ n 1


≤ b) ≈ φ 





− φ





b + 0 , 5 − 50 * 0 , 5

N − n 
50 * 0 , 5 * ( 1 − 0 , 5 ) *

N − 1 


a − 0 ,5 − ( n * π 1 )

N − n 
n * π 1 * (1 − π 1 ) *

N − 1 
Zentraler Grenzwertsatz für
Stichprobenanteile
• Bei hinreichend großen Stichprobenumfang
gilt:
• Mit Zurücklegen:
π1 * (1 − π1 ) 

f (p1 ) ≈ N π1 ;

n


• Ohne Zurücklegen:
π 1 * (1 − π 1 ) N − n 

f (p 1 ) ≈ N  π 1 ;
*

n
N −1

Quantilwertberechnung
z =
p 1 − µ (p 1 )
σ (p 1 )
2
=
p1 − π1
π 1 * (1 − π 1 )
n
Wobei z = Quantilwert der
Standardnormalverteilung
Verwandte der Normalverteilung
• Zur Varianz:
– Der zentrale Grenzwertsatz gilt prinzipiell
auch für Varianzen
– Varianzen sind daher asymptotisch
normalverteilt
– Die Annäherung an eine Normalverteilung
findet sehr langsam statt.
Chiquadratverteilung
1
• Wenn ein Merkmal in der Population
normalverteilt ist, folgt die Kennwerteverteilung der Stichprobenvarianz einer
Chiquadratverteilung.
• Der Parameter dieser Verteilung ergibt
sich aus der Anzahl der Summanden.
• Wenn Z1, Z2,...,Zn voneinander
unabhängige standardnormalverteilte ZV
sind, gilt:
Chiquadratverteilung
2
2
2
2
2
2
2
χdf
=
χ
=
+
+
+
+
+
Z
Z
...
Z
...
Z
n
1
2
i
n
=n
• wobei χ2 = Chiquadratverteilung mit n
n Freiheitsgraden
df = Anzahl der Freiheitsgrade (Zahl
der voneinander unabhängigen
quadrierten standardnormalverteilten Summanden.)
Herunterladen