Spezielle stetige Verteilungen Bibliografie

Werbung
Spezielle stetige Verteilungen
”Rechteckverteilung oder stetige
Gleichverteilung
”Exponentialverteilung
”Normalverteilung
”Approximationen
”Chi-Quadrat-Verteilung
”Studentverteilung
”Fisherverteilung
Prof. Mohr / Dr. Ricabal
Spezielle stetige Verteilungen
1
Bibliografie
” Bleymüller / Gehlert / Gülicher
Verlag Vahlen
Statistik für Wirtschaftswissenschaftler
” Bleymüller / Gehlert
Verlag Vahlen
Statistische Formeln, Tabellen und Programme
” PowerPointPräsentationen (Prof. Mohr/ Dr. Ricabal)
” Vorlesungsskript für Statistik I (Dr. Pu Chen)
” Vorlesungsskript für Statistik II (Prof. Mohr, Private
Hanseuniversität Rostock)
” http://www.wiwi.uni-rostock.de/vwl/statistik/download/ba/
Prof. Mohr / Dr. Ricabal
Spezielle stetige Verteilungen
2
Dichtefunktion der
stetigen Gleichverteilung
Die Dichtefunktion einer Rechtecksverteilung bzw. einer stetigen
Gleichverteilung ist über einem (stetigen) Intervall [a, b] konstant, d. h.
f(x)
⎧k a ≤ x ≤ b
1
f ( x / a ; b) = ⎨
mit k =
b-a
⎩ 0 sonst
k
∫
∞
∫
a
−∞
b x
a
Beweis:
a
b
∞
−∞
a
b
f ( x )dx = 1 ⇔ ∫ f ( x )dx + ∫ f ( x )dx + ∫ f ( x )dx = 1
b
∞
b
a
b
a
0dx + ∫ kdx + ∫ 0dx = 1 ⇔ ∫ kdx = 1
−∞
kx a = 1 ⇔ k (b − a ) = 1 ⇒ k =
b
1
b−a
Beispiel: Glückrad mit a=0° und b=360°
Prof. Mohr / Dr. Ricabal
Spezielle stetige Verteilungen
3
Stetige Gleichverteilung
Verteilungsfunktion:
⎧0
⎪x − a
F( x / a; b) = ⎨
⎪b − a
⎩1
F(x)
1
x<a
0,5
a≤x≤b
x>b
a
b x
a+b
2
∞
Erwartungswert: E(X) = ∫−∞ x ⋅ f ( x )dx =
Varianz:
E(X)
Var (X) = E[X − E (X)] =
2
(b − a )2
12
Aufgabe:
Beweisen Sie, dass die vorigen Formeln gelten. Nutzen Sie
dabei als Beispiel die Berechnung von k in der vorigen Folie.
Prof. Mohr / Dr. Ricabal
Spezielle stetige Verteilungen
4
Beispiel: Stetige Gleichverteilung
Eine Person, die selten die Straßenbahn einer Großstadt benutzt,
weiß nur, dass diese alle 10 Minuten fährt. Sei X die Wartezeit (in
Minuten). Wie groß ist die Wahrscheinlichkeit, dass die Person
zwischen 4 uns 7 Minuten warten muss? Wie lange muss die Person
durchschnittlich warten? Es gilt: X ~ G (a = 0; b = 10)
7
∞
W (4 ≤ X ≤ 7) = ∫ f ( x )dx =F(7) − F(4)
E(X) = ∫ x ⋅ f ( x )dx =
7 4
3
= − =
= 0,3
10 10 10
=
−∞
4
0 + 10
= 5 Minuten
2
⎧1
⎪
0 ≤ x ≤ 10
f ( x / 0;10) = ⎨10
⎪⎩ 0 sonst
F(x)
1
⎧0 x < 0
⎪x
F( x / 0;10) = ⎨
0 ≤ x ≤ 10
⎪10
x > 10
⎩1
Prof. Mohr / Dr. Ricabal
a+b
2
0
4
Spezielle stetige Verteilungen
7 10
5
Exponentialverteilung
Eine stetige Zufallsvariable X ist exponentialverteilt mit dem
Parameter λ > 0, wenn sie folgende Dichtefunktion besitzt:
⎧ 0
f E ( x / λ) = ⎨
− λx
⎩λ ⋅ e
für x < 0
für x ≥ 0
λ
f(x)
Verteilungsfunktion:
⎧ 0
FE ( x / λ) = W (X ≤ x ) = ⎨
− λx
⎩1 − e
für x < 0
für x ≥ 0
1
x
F(x)
W (X > x ) = 1 − W (X ≤ x ) = 1 − F( x ) = e − λx
x
Erwartungswert, Varianz und Standardabweichung
E(X) =
1
λ
; Var (X) =
Prof. Mohr / Dr. Ricabal
1
λ2
und σ(X) =
1
⇒ E (X) = σ(X)
λ
Spezielle stetige Verteilungen
6
x
Bemerkung zur Exponentialverteilung
Die Exponentialverteilung spielt eine wichtige Rolle zur
Beschreibung von:
”
”
Lebensdauer insbesondere bei Objekten, die wenig altern,
für den Zeitraum zwischen zwei aufeinander folgenden Ereignissen
einer Poissonverteilung.
Ist die Anzahl von Ereignissen pro Zeiteinheit poissonverteilt mit
dem Parameter µ (durchschnittliche Anzahl von Ereignissen pro
Zeiteinheit), dann ist die Zeit zwischen zwei aufeinander folgenden
Ereignissen exponentialverteilt mit dem Parameter λ = µ (d. h mit
dem durchschnittliche Zeit von 1/λ = 1/µ Zeiteinheiten).
Beispiele:
” Dauer von Telefongesprächen
” Abstand der Kundenankünfte an einem Bankschalter
” Lebensdauer von Glühlampen oder Aggregaten
Prof. Mohr / Dr. Ricabal
Spezielle stetige Verteilungen
7
Beispiel: Exponentialverteilung
In einer Versicherung treten im Durchschnitt 4 Großunfälle pro Jahr
nach der Poissonverteilung auf. Wie groß ist die Wahrscheinlichkeit
dafür, dass die Zeit zwischen zwei aufeinander folgenden
Großunfällen:
a) Höchstens 1 Jahr beträgt?
b) Zwischen einem halben und einem Jahr liegt?
c) Wie groß ist die mittlere Zeitspanne?
Sei X die Zeitspanne [in Jahre] zwischen zwei Großunfällen.
Es gilt: X ~ E (λ = 4)
1
a ) W(X ≤ 1) = ∫ f ( x )dx = FE (1 / 4) = 1 − e − 4⋅1 = 1 − 0,0183 = 0,9817
−∞
b) W(0,5 ≤ X ≤ 1) = FE (1 / 4) − FE (0,5 / 4) = (1 − e −4⋅1 ) − (1 − e −4⋅0,5 )
= e − 2 − e − 4 = 0,1353 − 0,183 = 0,1170
c) E(X) =
1 1
= Jahr
λ 4
Prof. Mohr / Dr. Ricabal
Spezielle stetige Verteilungen
8
Asymmetrie der Exponentialverteilung
Bei einer symmetrischen Verteilung liegen die Werte je zur
Hälfte links und rechts des Erwartungswerts (Me = µ).
Für die Exponentialverteilung gilt:
W(X ≤ E(X)) = W(X ≤ 1/λ) = F(1/λ) = 1 - e-λ·(1/ λ) = 1 - e-1 = 0,6321
”63,21% der Werte einer Exponentialverteilung liegen links
von E(X). Sie ist eine asymmetrische Verteilung.
”Da mehr als die Hälfte der Werte links des
Erwartungswerts liegt, ist die Verteilung linkssteil bzw.
rechtsschief (Me < µ).
”Die Rechtsschiefe der Exponentialverteilung ist
unabhängig von der Größe des Parameters λ.
Prof. Mohr / Dr. Ricabal
Spezielle stetige Verteilungen
9
Beispiel: Exponentialverteilung
Die Reparaturzeit von Maschinen eines bestimmten Typs sei eine
exponentialverteilte Zufallsgröße mit dem Parameter
λ = 0,25 h-1. Welche der folgenden Aussagen sind zutreffend?
a) Die zu erwartende Reparaturzeit einer zufällig ausgewählten
Maschine beträgt 4 h.
b) Die Wahrscheinlichkeit, dass die Reparaturzeit über dem
Erwartungswert für die Reparaturzeit liegt, ist unabhängig vom
Parameter λ.
c) Mehr als 50 % der Reparaturen dauern länger als 3 Stunden.
d) Nach höchstens sechs Stunden ist die Reparatur der Maschine mit
90 % Sicherheit beendet.
Prof. Mohr / Dr. Ricabal
Spezielle stetige Verteilungen
10
Beispiel: Lösung Teil a) bis d)
a) E(X) = 1/ λ = 1/(0,25 h-1) = 4 h
⇒ Richtig.
b) W(X > E(X)) = 1 - W(X ≤ E(X)) = 1 - FE(E(X)) = 1 - FE(1/ λ)
= 1 - (1 - e– λ ·(1/ λ)) = 1 - (1 - e–1) = e–1 = 0,3679
⇒ Richtig, unabhängig vom Wert λ dauert eine Reparatur in etwa
37 % aller Fälle länger als im Durchschnitt.
c) W(X > 3) = 1 - W(X ≤ 3) = 1 - FE(3) = 1 - (1 - e–0,25 · 3)
= e–0,75 = 0,472
⇒ Falsch, über 3 h nehmen nur 47,2 % der Reparaturen in
Anspruch, d.h. 53 % der Reparaturen sind in höchstens 3 h
erledigt.
d) W(X ≤ x) =0,9 =1 - e–0,25 · x ⇒ e–0,25 · x =0,1
⇒ ln(0,1) =–0,25 · x ⇒ x =9,21
oder:
–0,25
·
6
–1,5
W(X ≤ 6) = FE(6) = 1 - e
= 1 - e = 1 - 0,223 = 0,777
⇒ Falsch, mit 90 % Sicherheit ist einer Reparatur erst nach 9,21 h
erledigt, nach 6 h sind nur 77,7 % aller Reparaturen erledigt.
Prof. Mohr / Dr. Ricabal
Spezielle stetige Verteilungen
11
Gedächtnislosigkeit
der Exponentialverteilung
Sei X ~ E(λ). Seien A = (X > t0 +t) und B = (X >t0) zwei Ereignisse,
die mit Hilfe von X dargestellt werden. Zu berechnen ist die bedingte
Wahrscheinlichkeit W(A|B). Es gilt:
W (X > x ) = 1 − W (X ≤ x ) = 1 − F( x ) = e − λx
W (A | B) =
=
e
−λ( t +t 0 )
e
− λt 0
W (A ∩ B) W (X > t + t 0 )
=
W (B)
W (X > t 0 )
A
B
0
t0
t0+ t
X
= e − λ ( t + t 0 ) − ( − λt 0 ) = e − λ ( t + t 0 − t 0 ) = e − λt = W ( X > t )
Beispiel:
Die Wahrscheinlichkeit dafür, dass eine Glühbirne eine Lebensdauer t
überschreitet, hängt nicht von der Zeit t0, die sie schon überlebt hat,
sondern nur von der Dauer t ab. Die Verteilung „vergisst“ einfach, was
vorher passiert ist.
Prof. Mohr / Dr. Ricabal
Spezielle stetige Verteilungen
12
Wichtigkeit der Normalverteilung
Die Nomalverteilung ist sowohl in der Theorie als auch in der Praxis
die wichtigste statistische Verteilung. Einige Gründe dafür sind:
” Viele empirische Beobachtungen, insbesondere bei Massendaten,
genügen approximativ einer Normalverteilung (z. B. Körpergröße
und Gewichte erwachsener Personen, Laufleistung von Autoreifen,
etc). Es wirken dabei viele Faktoren mit relativen geringem Einfluss
unabhängig von einander.
” Die Normalverteilung kann zur Approximation diskreter
Verteilungen verwendet werden (Binomial-, Hypergeometrische-,
Poission-Verteilung).
” Der Mittelwert ⎯x einer Stichprobe vom Umfang n ist für
hinreichend großen n approximativ normalverteilt (Zentraler
Grenzwertsatz), unabhängig von der Ausgangverteilung.
” Aus der Normalverteilung lassen sich andere wichtige Verteilungen
herleiten: z. B. die t-Verteilung, F-Verteilung und die χ2-Verteilung.
Prof. Mohr / Dr. Ricabal
Spezielle stetige Verteilungen
13
Normalverteilung
Eine Zufallsvariable X heißt normalverteilt mit den
Parametern µ und σ2 mit σ > 0, wenn die
Dichtefunktion folgender Gleichung genügt:
f n ( x / µ; σ 2 ) =
1
2πσ 2
⋅e
1 ⎛ x −µ ⎞
− ⎜
⎟
2⎝ σ ⎠
Für X~N(µ; σ2) gilt:
1
Erwartungswert: E(X) = µ
2
für alle - ∞ < x < ∞
f(x)
2πσ2
Varianz: Var(X) = σ2
Standardabweichung: σ(X) = σ
Prof. Mohr / Dr. Ricabal
Spezielle stetige Verteilungen
x
µ
14
Normalverteilungsfunktion
Die Verteilungsfunktion einer normalverteilten Zufallsvariable hat
die Gestalt:
x
Fn ( x / µ; σ ) = W (X ≤ x ) = ∫ f n ( v / µ; σ ) ⋅ dv =
2
x
2
−∞
∫
−∞
Sie stellt die Fläche unter der
Dichtefunktion dar, die links von x liegt.
1
2πσ 2
⋅e
1 ⎛ v −µ ⎞
− ⎜
⎟
2⎝ σ ⎠
2
⋅ dv
F(x)
1
0,5
0
x
µ
Prof. Mohr / Dr. Ricabal
Spezielle stetige Verteilungen
15
Kurvendiskussion für die Dichte
1
f n ( x / µ; σ 2 ) =
⋅e
2πσ 2
1 ⎛ x −µ ⎞
− ⎜
⎟
2⎝ σ ⎠
2
”
Symmetrisch um µ: f ( x − µ) = f ( x + µ)
”
Maximum an der Stelle x = µ mit f (µ) =
”
Wendepunkte an den Stellen
x1 = µ - σ und x2 = µ + σ mit
f (µ ± σ) =
”
1
2πσ
2
e
−
1
2
1
1
2πσ2
f(x)
2πσ2
Glockenform
x
µ
Prof. Mohr / Dr. Ricabal
Spezielle stetige Verteilungen
16
Wirkung der Änderung von µ
Eine Änderung von µ bewirkt eine Lageverschiebung
entlang der x-Achse
X1~N(2; 1)
0.0
0.0
0.1
0.1
0.2
0.2
0.3
0.3
0.4
0.4
X1~N(0; 1)
-4
-2
0
2
4
-2
0
x
2
4
6
x
Prof. Mohr / Dr. Ricabal
Spezielle stetige Verteilungen
17
Wirkung der Änderung von σ
0.4
Eine Änderung von σ bewirkt eine Formänderung
(Wölbung flacher oder höher)
f (µ) =
1
2πσ2
0.2
0.3
X1~N(0; 1)
0.0
0.1
X2~N(0; 22)
-4
Prof. Mohr / Dr. Ricabal
-2
0
x
2
4
Spezielle stetige Verteilungen
18
Standardisierung
Sei X eine normalverteilte Zufallsvariable mit den Parametern µ
und σ2. Die lineare Transformation Z = (X – µ)/σ
heißt Standardisierung. Es kann bewiesen werden, dass Z auch
einer Normalverteilung mit E(Z) = 0 und Var (Z) = 1 genügt.
Es gilt dann:
Dichtefunktion:
1
− z2
1
f N (z) =
⋅e 2
2π
Verteilungsfunktion:
z
FN (z) =
∫
−∞
1
− v2
1
⋅ e 2 ⋅ dv
2π
W ( Z ≤ −z) = W ( Z ≥ z) = 1 − W ( Z < z) = 1 − W( Z ≤ z)
Prof. Mohr / Dr. Ricabal
FN (−z) = 1 − FN (z)
Spezielle stetige Verteilungen
19
Ablesen aus der
Standardnormalverteilung - Tabellen
Zu bestimmen sind:
a) W(Z ≤ 1,645) ⇒ FN (1,645) = 0,9500
(Tabelle 12, Seite 125)
b) z , für die W(Z ≤ z) = FN(z) = 0,975 gilt. ⇒ z = 1,96 (Tabelle 12,
Seite 126)
c) W(-1,96 ≤ Z ≤ 1,96) = FN(1,96) - FN(-1,96)
= FN(1,96) – [1- FN(1,96) ] =2 FN(1,96) -1
= 2.0,975 – 1 = 0,95
(Tabelle 12, Seite 126)
oder direkt aus der Tabelle 14
W(-1,96 ≤ Z ≤ 1,96) = 0,95
d) W(-z ≤ Z ≤ z) = 0,90 ⇒ z =
Prof. Mohr / Dr. Ricabal
(Tabelle 14, Seite 131)
1,64 + 1,65
= 1,645 (Tabelle 14, Seite 131)
2
Spezielle stetige Verteilungen
20
Berechnung von Wahrscheinlichkeiten
einer Normalverteilung
Zur Berechnung von entsprechenden Wahrscheinlichkeiten liegt die
Verteilungsfunktion der Standardnormalverteilung tabellarisch vor.
Jede beliebige Normalverteilung lässt sich in die
Standardnormalverteilung umrechnen.
X ~ N(µ; σ 2 ) ⇒ Z =
W (X ≤ a ) = W (
X−µ
~ N(0;1)
σ
X −µ a −µ
a −µ
a −µ
≤
) = W(Z ≤
) = FN (
)
σ
σ
σ
σ
a −µ X −µ b−µ
)
≤
≤
σ
σ
σ
a −µ
b−µ
b−µ
a −µ
= W(
≤Z≤
) = FN (
) − FN (
)
σ
σ
σ
σ
W (a ≤ X ≤ b ) = W (
Prof. Mohr / Dr. Ricabal
Spezielle stetige Verteilungen
21
Beispiel a): Normalverteilung
Das Gewicht von Schokoladetafel ist approximativ normalverteilt mit
µ = 100 [g] und σ2 = 25 [g2], d. h. X ~ N(100; 25). Man berechne:
112,6 − 100
)
5
a) W (X ≤ 112,6) = Fn (112,6 / 100; 25) = FN (
= FN (2,52) = 0,9941
(Tabelle 12, Seite 127)
Prof. Mohr / Dr. Ricabal
Spezielle stetige Verteilungen
22
Beispiel b): Normalverteilung
Das Gewicht von Schokoladetafeln ist approximativ normalverteilt
mit µ = 100 [g] und σ2 = 25 [g2]. Man berechne:
b)
92 − 100
)
5
= FN (−1,6) = 1 − FN (1,6) = 1 − 0,9452 = 0,0548
W (X ≤ 92) = Fn (92 / 100; 25) = FN (
(Tabelle 12, Seite 125)
Prof. Mohr / Dr. Ricabal
Spezielle stetige Verteilungen
23
Beispiel b): Normalverteilung
Das Gewicht von Schokoladetafeln ist approximativ normalverteilt
mit µ = 100 [g] und σ2 = 25 [g2]. Man berechne:
c)
W (90 ≤ X ≤ 106) = Fn (106 / 100; 25) − Fn (90 / 100; 25)
106 − 100
90 − 100
) − FN (
) = FN (1,2) − FN (−2)
5
5
= FN (1,2) − [1 − FN (2)] = 0,8849 − [1 − 0,9772] = 0,8621
= FN (
(Tabelle 12, Seite 124 und 126)
Prof. Mohr / Dr. Ricabal
Spezielle stetige Verteilungen
24
Approximationen
Die Normalverteilung kann unter bestimmten Bedingungen als
Approximation von einigen anderen Verteilungen genutzt werden.
X~H(N; n; M)
X~B(n; θ)
θ = M/N
X~P(µ)
µ≥9
n ≥ 30
n θ (1- θ) ≥ 9
0,1 ≤ θ ≤ 0,9
n ≥ 30
n/N < 0,05
µ=nθ
σ2 = n θ (1- θ)
µ=nθ
σ2 = n θ (1 – θ) (N-n)/N-1)
Prof. Mohr / Dr. Ricabal
σ2 = µ
X~N(µ;
σ2)
Spezielle stetige Verteilungen
25
Yates Korrektur
Wenn eine diskrete durch eine stetige Verteilung (hier die
Normalverteilung) approximiert werden soll, ist eine
Stetigkeitskorrektur vorzunehmen:
Fdiskret ( x ) ≈ Fn ( x + 0,5 / µ; σ 2 ) = FN (
⇨ FB ( x / n; θ) ≈ FN (
x + 0,5 − µ
)
σ
⇨ FH ( x / N; n; M ) ≈ FN (
⇨ FP ( x / µ) ≈ FN (
Prof. Mohr / Dr. Ricabal
mit
x + 0,5 − µ
)
σ
Yates-Korrektur
µ = nθ und σ = nθ(1 - θ)
M
N-n
x + 0,5 − µ
) mit θ = ; µ = nθ; σ 2 = nθ(1 - θ)
N
N -1
σ
x + 0,5 − µ
)
σ
mit σ 2 = µ ⇒ σ = µ
Spezielle stetige Verteilungen
26
Beispiel: Approximation der Hypergeom.
Verteilung durch die Normalverteilung
Von 2000 Studierenden eines Fachbereiches bestreiten 600 ihr
Studium vollständig aus eigenen Mitteln. Wie groß ist die
Wahrscheinlichkeit, dass unter 30 zufällig und ohne Zurücklegen
ausgewählten Studenten 9 bis 12 zu dieser Gruppe gehören?
(1) Exakter Ansatz: Hypergeometrische Verteilung mit den
Parametern N = 2000, M = 600 und n = 30
(2) Approximation der Hypergeometrischen Verteilung durch die
Normalverteilung.
Approximationsregeln:
n ≥ 30; n < 0,05 N = 400;
θ = M/N = 600/2000 = 0,3; 0,1 ≤ θ ≤ 0,9
(Fortsetzung in der nächste Folie)
Prof. Mohr / Dr. Ricabal
Spezielle stetige Verteilungen
27
Beispiel: Approximation der Hypergeom.
Verteilung durch die Normalverteilung
(1) Exakter Ansatz: Hypergeometrische Verteilung mit den
Parametern N = 2000, M = 600 und n = 30
W (9 ≤ X ≤ 12) = 0,48644 (genaue berechnung mit R)
(2) Approximation der Hypergeometrischen Verteilung durch die
Normalverteilung. θ = 600/2000 = 0,3; µ = n·θ = 30·0,3 = 9;
σ2 = n·θ·(1 – θ) (N-n)/(N-1)= 30·0,3·0,7·1970/1999= 6,21
W (9 ≤ X ≤ 12) = FH (12 / N; n; M ) − FH (8 / N; n; M )
12 + 0,5 − 9
8 + 0,5 − 9
) − FN (
) = FN (1,406) − FN (−0,201)
2,49
2,49
= FN (1,406) − [1 − FN (0,201)] = 0,9201 − (1 − 0,5797) = 0,4998
≈ FN (
(Tabelle 12, S. 126 bzw. S. 122 )
Prof. Mohr / Dr. Ricabal
Spezielle stetige Verteilungen
28
Beispiel: Approximation der Binomialverteilung
durch die Normalverteilung
In einer Klinik sollen in einem bestimmten Monat 80 Säuglinge zur
Welt kommen. Unter der Annahme, dass der Anteil weiblicher
Geburten an allen Geburten langfristig bei 0,49 liegt, berechne man
die Wahrscheinlichkeit dafür, dass sich unter den 80 Säuglingen 35
bis 40 Mädchen befinden.
(1) Exakter Ansatz: Binomialverteilung mit den Parametern
n=80 und θ=0,49
(2) Approximation durch die Normalverteilung
Regel: n·θ·(1-θ) = 80·0,49·(1 - 0,49) = 19,992 ≥ 9
Parameter:
µ = n·θ = 80·0,49 = 39,2 und σ² = n·θ·(1-θ)= 19,992.
Prof. Mohr / Dr. Ricabal
Spezielle stetige Verteilungen
29
Beispiel: Approximation der Binomialverteilung
durch die Normalverteilung
(1) Exakter Ansatz: Binomialverteilung mit den Parametern
n = 80 und θ = 0,49. (Genaue Berechnung mit R)
W(35 ≤ X ≤ 40) = 0.05757102 + 0.06914167 + 0.07899811
+0.08588701 + 0.08886650 + 0.08751607 = 0,4679804
(2) Approximation durch die Normalverteilung
Parameter: µ=n·θ=80 · 0,49= 39,2 und σ²=n · θ · (1-θ)= 19,992
W (35 ≤ X ≤ 40) = FB (40 | n; θ) − FB (34 | n; θ)
40,5 − µ
34,5 − µ
) − FN (
)
σ
σ
= FN (0,291) − FN (−1,051) = 0,6145 − (1 − 0,8534) = 0,4679
≈ Fn (40,5 | µ; σ 2 ) − Fn (34,5 | µ; σ 2 ) = FN (
(Tabelle 12, S. 122 bzw. S. 124 )
Prof. Mohr / Dr. Ricabal
Spezielle stetige Verteilungen
30
Drei Sigma Regel
Wie groß ist der Anteil der Realisierungen einer normalverteilten
Zufallsgröße in den zentralen Schwankungsintervallen
[µ - k·σ , µ + k·σ] für k = 1, 2, 3?
” W(µ - σ ≤ X ≤ µ + σ) = W(-1 ≤ Z ≤ 1) = 0,6827*
* (Tabelle 14, S. 131)
” W(µ – 2·σ ≤ X ≤ µ + 2·σ) = W(-2 ≤ Z ≤ 2) = 0,9545*
” W(µ – 3·σ ≤ X ≤ µ + 3·σ) = W(-3 ≤ Z ≤ 3) = 0,9973*
Im einfachen zentralen Schwankungsintervall liegen 68,27 %,
im doppelten ca. 95,45 % und im dreifachen fast alle möglichen
Realisierungen (99,73%) einer normalverteilten Zufallsvariablen.
Dies gilt unabhängig von den beiden Parametern der
Normalverteilung. Es ist als („3-σ-Regel“) bekannt.
Prof. Mohr / Dr. Ricabal
Spezielle stetige Verteilungen
31
Drei Sigma Regel. Grafische Darstellung
” W(µ - σ < X < µ + σ)
= W(-1 ≤ Z ≤ 1) = 0,6827
” W(µ – 2·σ < X < µ + 2·σ)
= W(-2 ≤ Z ≤ 2) = 0,9545
-4
-2
0
68,27 %
2
4
x
” W(µ – 3·σ < X <µ + 3·σ)
= W(-3 ≤ Z ≤ 3) = 0,9973
95,45 %
99,73 %
Prof. Mohr / Dr. Ricabal
Spezielle stetige Verteilungen
32
Chi-Quadrat-Verteilung
Die Formel der Chi-Quadrat-Verteilung geht auf den Astronomen
F. R. Helmert (1875) zurück; den Namen aber gab ihr erst der
bekannte englische Statistiker Karl Pearson im Jahre 1900.
Die Chi-Quadrat-Verteilung entspricht dem folgenden
stochastischen Modell: Sind Z1, Z2, … ,Zν unabhängig
standardnormalverteilte Zufallsvariable (d. h. normalverteilte
Zufallsvariablen mit E(Zi) = 0 und Var (Zi) = 1 für i = 1, 2, … , ν),
so besitzt
ν
χ 2 = Z12 + Z 22 + L + Zν2 = ∑ Z 2i
i =1
eine Chi-Quadrat-Verteilung mit ν Freiheitsgrad. ν ist der
Parameter der Verteilung.
Prof. Mohr / Dr. Ricabal
Spezielle stetige Verteilungen
33
Dichtefunktion der χ²-Verteilung
Die Dichtefunktion der Chi-Quadrat-Verteilung lautet:
χ
ν
⎧
( −1)
−
1
2 2
2
e
(
)
χ
⎪
⎪
f ch (χ 2 / ν) = ⎨ 2ν / 2 Γ( ν )
2
⎪
⎪⎩
0
für χ 2 ≥ 0
sonst
Anmerkung:
Mit Γ(ν) wird die
Gammafunktion
bezeichnet.
0
5
x
Prof. Mohr / Dr. Ricabal
10
15
0.00
0.00
0.05
dchisq(x, 3)
0.10 0.15
dchisq(x, 5)
0.05
0.10
0.20
0.15
0.25
2
0
Spezielle stetige Verteilungen
5
10
x
15
34
Erwartungswert und Varianz
der χ²-Verteilung
Die Chi-Quadrat-Verteilung besitzt den Erwartungswert
E(χ²) = ν und die Varianz Var(χ²) = 2ν
Mit wachsendem ν näher sich die Chi-Quadrat-Verteilung einer
Normalverteilung mit dem Parameter µ = ν und σ² = 2ν. Die Variable
Z=
χ2 − ν
2ν
ist also näherungsweise standardnormalverteilt.
Eine bessere Approximation liefert jedoch die Größe
sie ist ebenfalls asymptotisch normalverteilt mit
und σ² = 1. Die standardisierte Zufallsgröße
2χ 2
µ = 2ν − 1
Z = 2χ 2 − 2ν − 1
ist somit annähernd standardnormalverteilt.
χ²- Werte zu gegebenen Werten von F(χ² / ν ) sind tabelliert (Tab. 15)
Prof. Mohr / Dr. Ricabal
Spezielle stetige Verteilungen
35
Studentverteilung
Die Studentverteilung (auch t-Verteilung genannt) verdankt ihren
Namen dem englischen Statistiker W. S. Gosset, der 1908 unter dem
Pseudonym „Student“ einen Artikel mit ihrer Ableitung
veröffentlichte.
Betrachtet man die beiden voneinander unabhängigen
Zufallsvariablen Z und U, wobei Z standardnormalverteilt und
U chi-quadratverteilt mit ν Freiheitsgraden ist, dann genügt die
Zufallsvariable
T=
Z
U
ν
einer Studentverteilung mit ν Freiheitsgraden. Die Freiheitsgrade ν
ist der Parameter der Verteilung.
Prof. Mohr / Dr. Ricabal
Spezielle stetige Verteilungen
36
Dichtefunktion der t-Verteilung
Die Dichtefunktion der t-Verteilung lautet
ν +1
)
1
2
f s ( t / ν) =
⋅
ν +1
ν
t
νπ ⋅ Γ( ) (1 + ² ) 2
2
ν
Γ(
für - ∞ ≤ t ≤ ∞
-3
-2
-1
0
x
1
2
Prof. Mohr / Dr. Ricabal
3
dt(x, 100)
0.2
0.3
0.1
0.0
dt(x, 1)
0.05 0.10 0.15 0.20 0.25 0.30
dt(x, 3)
0.05 0.10 0.15 0.20 0.25 0.30 0.35
0.4
Beispiele: Dichtefunktion für verschiedene Freiheitsgrade.
-3
-2
-1
0
x
1
2
3
-3
Spezielle stetige Verteilungen
-2
-1
0
x
1
2
3
37
Erwartungswert und Varianz
der Studentverteilung
Erwartungswert: E(T) = 0
Varianz: Var(T) = ν/(ν – 2)
für ν > 1
für ν > 2
Für ν = 1 existiert kein Erwartungswert und für ν ≤ 2 keine
Varianz.
Für ν → ∞ geht die Studentverteilung in die Srtandardnormalverteilung über.
Ab ν ≥ 30 kann die Studentverteilung in guter Näherung
durch die Standardnormalverteilung approximiert
werden.
Werte von t zu gegebenen zweiseitigen symmetrischen
Flächenanteilen sind tabelliert (Tabelle 17).
Prof. Mohr / Dr. Ricabal
Spezielle stetige Verteilungen
38
F-Verteilung
Sind U1 und U2 allegemein zwei voneinander
unabhängige Zufallsvariable, die Chi-QuadratVerteilungen mit ν1 bzw. ν2 Freiheitsgarden besitzen,
dann genügt, wie R. A. Fischer gezeigt hat, der Quotient
U1
ν
F= 1
U2
ν2
einer sogenannten F-Verteilung mit ν1 und ν2
Freiheitsgraden. Die Anzahl der Freiheitsgrade sind die
Parameter der Verteilung
Prof. Mohr / Dr. Ricabal
Spezielle stetige Verteilungen
39
Dichtefunktion der F-Verteilung
Die Dichtefunktion der F-Verteilung lautet:
füt f > 0
0.0
0.1
0.2
df(x, 9, 6)
0.3 0.4 0.5
0.6
df(x, 6, 9)
0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7
0.7
ν1
ν1 + ν 2
ν1
⎧
−1
⎪ Γ( 2 ) ⎛ ν1 ⎞ 2
f2
⎜
⎟
⋅
⎪
ν1 + ν 2
f F (f / ν1 ; ν 2 ) = ⎨ Γ( ν1 ) ⋅ Γ( ν 2 ) ⎜⎝ ν 2 ⎟⎠
ν1
2
+
(
1
f
)
⎪ 2
2
ν2
⎪
0
für f ≤ 0
⎩
0
5
10
15
0
x
Prof. Mohr / Dr. Ricabal
5
10
15
x
Spezielle stetige Verteilungen
40
Erwartungswert und Varianz
der F-verteilung
Für ν2 > 2 ergibt sich der Erwartungswert
E(F) = ν2 / (ν2 – 2)
und für ν2 > 4 erhält man die Varianz
Var(F) = [2 ν22 (ν1 + ν2 – 2) ] / [ν1(ν2 – 2)² (ν2 – 4)]
Für unterschiedliche Freiheitsgrade ν1 und ν2 sind die
Prozentpunkte der F-Verteilung tabelliert
(Tabellen 18 und 19).
Prof. Mohr / Dr. Ricabal
Spezielle stetige Verteilungen
41
Herunterladen