Asymptotische Normalverteilung nach dem zentralen Grenzwertsatz • Erwartungswert einer Summe von n Zufallsvariablen Xi mit jeweils den Erwartungswert µx n Yn = ∑ Xi ⇒ µ(Yn ) = n * µ X i =1 Asymptotische Normalverteilung nach dem zentralen Grenzwertsatz • Varianz einer Summe von n voneinander unabhängigen Zufallsvariablen Xi mit jeweils der Varianz σ2 X n Yn = ∑ X i ⇒ σ 2 ( Yn ) = n * σ 2X i =1 Asymptotische Normalverteilung nach dem zentralen Grenzwertsatz • Ist der Stichprobenumfang n hinreichend groß, dann ist die Summe Yn der n Zufallsvariablen Xn annähernd Normalverteilt: n Yn = ∑ X i ⇒ f ( Yn ) ≈ N(n * µ X ;n * σ 2X ) i =1 mit f(Yn) = Wahrscheinlichkeitsdichte der Summe Yn Asymptotische Normalverteilung nach dem zentralen Grenzwertsatz • Wird die Summe Yn standardisiert, dann resultiert die z-transformierte Summe Zn als: n Z n = ∑ i=1 X i − n * µ n * σ X 2 X Zn = standardisierte Summe von n identisch verteilten, statistisch unabhängigen Zufallsvariablen Xi Asymptotische Normalverteilung nach dem zentralen Grenzwertsatz • Zn ist standardnormalverteilt, wenn der Stichprobenumfang n gegen unendlich geht: – Mit f(Zn) = Wahrscheinlichkeitsdichte der Variablen Zn ϕ(z) = Dichte der Standardnormal– verteilung • gilt: Asymptotische Normalverteilung nach dem zentralen Grenzwertsatz n ∑ Xi − n * µ X Zn = i =1 n * σ 2X ⇒ lim (f ( Z n )) = ϕ( z ) n→∞ Asymptotische Normalverteilung nach dem zentralen Grenzwertsatz • Der Erwartungswert des Mittelwerts von n Zufallsvariablen kann berechnet werden als die durchschnittliche Summe der Zufallsvariablen: n −• 1 1 Yn = 0 + * ∑ Xi = 0 + * (n * µ X ) = n i =1 n 1 0 + * (n * µ X ) = µ X n Asymptotische Normalverteilung nach dem zentralen Grenzwertsatz • Die Varianz des Mittelwerts n Zufallsvariablen beträgt: − 1 1 σ 2 ( Yn ) = σ 2 * Yn = 2 * σ 2 (Yn ) = n n 2 σ = 2 * (n * σ 2X ) = X n n 1 Asymptotische Normalverteilung nach dem zentralen Grenzwertsatz • Für den Erwartungswert der Kennwerteverteilung eines Stichprobenmittelwerts in einfachen Zufallsauswahlen gilt: • n − 1 1 µ − = µ( X) = * µ ∑ X i = * (n * µ X ) = µ X n i =1 n X − µ − = µ( X) = Erwartungswert der Zufallsvariablen X Stichprobenmittelwert Asymptotische Normalverteilung nach dem zentralen Grenzwertsatz • Die Varianz der Kennwerteverteilung des Stichprobenmittelwerts bei einfachen Zufallsauswahlen mit Zurücklegen: n − 1 2 2 2 σ - = σ ( X) = 2 * σ Xi = X n i =1 ∑ 2 σ 2 X σ = * ( n * ) X 2 n n 1 Asymptotische Normalverteilung nach dem zentralen Grenzwertsatz • Die Standardabweichung der Kennwertverteilung beträgt: • Mit Zurücklegen: 2 − σX σX σ( X) = = n n • Ohne Zurücklegen: − σX N−n * σ(X) = N −1 n Asymptotische Normalverteilung nach dem zentralen Grenzwertsatz • Die Kennwertverteilung des Stichprobenmittelwerts ist asymptotisch normalverteilt: • 1 f ( X ) = f * n − − ∑ X i i=1 n f( X) = Kennwerteverteilung der Zufallsvariablen „Stichprobenmittelwert“. Asymptotische Normalverteilung nach dem zentralen Grenzwertsatz • Es gilt: – Mit Zurücklegen: f ( X ) ≈ N µ – Ohne Zurücklegen: − X σ 2X ; n 2 σ X N − n f (X) ≈ N µX; * n N − 1 _ Asymptotische Normalverteilung nach dem zentralen Grenzwertsatz • Zentrale Bedeutung der Kennwertverteilungen: – stellen Verbindung zwischen empirischen Stichprobenkennwerten und unbekanntenPopulationsparamter her. Überführung einer Binomialverteilung in eine Standardnormalverteilung • Den Realisationen der Binomialverteilung werden Intervalle der Standardnormalverteilung zugeordnet: n n1 P(a≤ n1 ≤ b)= ∑ * π1 * (1− π1)n−n1 n1 =an1 b b + 0,5 − 50* 0,5 a − 0,5 − (n * π1 ) − φ ≈ φ n * π * (1 − π ) 50 * 0 , 5 * ( 1 0 , 5 ) − 1 1 Überführung einer Binomialverteilung in eine Standardnormalverteilung • Erklärungen zur Formel: – P(a≤n1≤b) = Wahrscheinlichkeit, dass die Häufigkeit n1 der Ausprägung 1 zwischen a und b liegt. – Φ = Wert der Verteilungsfunktion der Standardnormalverteilung – 0,5 = Anpassungswert, um den diskreten Ausprägungen einer binomialverteilten ZV Intervalle der kontinuierlichen Normalverteilung zuordnen zu können. Überführung einer Binomialverteilung in eine Standardnormalverteilung • Anwendungsbeispiel: Die Wahrscheinlichkeit, dass eine binomialverteilte ZV X mit den Parametern n = 50 ; π1= 0,5 ; n1 = 25 auftritt: 25 + 0,5 − 50 * 0,5 25 − 0,5 − 50 * 0,5 − Φ P( 25) ≈ Φ 50 * 0,5 * (1 − 0,5) 50 * 0,5 * (1 − 0,5) = Φ(0,141) − Φ( −0,141) = 0,1121 Von der hypergeometrischen- in eine Standardnormalverteilung • Die hypergeometrische Verteilung nähert sich asymptotisch der Normalverteilung an. Es gilt: P(a ≤ n 1 ≤ b) ≈ φ − φ b + 0 , 5 − 50 * 0 , 5 N − n 50 * 0 , 5 * ( 1 − 0 , 5 ) * N − 1 a − 0 ,5 − ( n * π 1 ) N − n n * π 1 * (1 − π 1 ) * N − 1 Zentraler Grenzwertsatz für Stichprobenanteile • Bei hinreichend großen Stichprobenumfang gilt: • Mit Zurücklegen: π1 * (1 − π1 ) f (p1 ) ≈ N π1 ; n • Ohne Zurücklegen: π 1 * (1 − π 1 ) N − n f (p 1 ) ≈ N π 1 ; * n N −1 Quantilwertberechnung z = p 1 − µ (p 1 ) σ (p 1 ) 2 = p1 − π1 π 1 * (1 − π 1 ) n Wobei z = Quantilwert der Standardnormalverteilung Verwandte der Normalverteilung • Zur Varianz: – Der zentrale Grenzwertsatz gilt prinzipiell auch für Varianzen – Varianzen sind daher asymptotisch normalverteilt – Die Annäherung an eine Normalverteilung findet sehr langsam statt. Chiquadratverteilung 1 • Wenn ein Merkmal in der Population normalverteilt ist, folgt die Kennwerteverteilung der Stichprobenvarianz einer Chiquadratverteilung. • Der Parameter dieser Verteilung ergibt sich aus der Anzahl der Summanden. • Wenn Z1, Z2,...,Zn voneinander unabhängige standardnormalverteilte ZV sind, gilt: Chiquadratverteilung 2 2 2 2 2 2 2 χdf = χ = + + + + + Z Z ... Z ... Z n 1 2 i n =n • wobei χ2 = Chiquadratverteilung mit n n Freiheitsgraden df = Anzahl der Freiheitsgrade (Zahl der voneinander unabhängigen quadrierten standardnormalverteilten Summanden.)