Eindimensionale Zufallsvariablen Bibliografie

Werbung
Eindimensionale Zufallsvariablen
” Grundbegriffe
” Verteilungstypen
ƒ Diskrete Zufallsvariablen
ƒ Stetige Zufallsvariablen
” Spezielle Maßzahlen für eindimensionale
Zufallsvariablen
ƒ Erwartungswert
ƒ Varianz
ƒ Standardabweichung
” Schwankungsintervalle
Prof. Mohr / Dr. Ricabal
Zufallsvariablen
1
Bibliografie
” Bleymüller / Gehlert / Gülicher
Verlag Vahlen
Statistik für Wirtschaftswissenschaftler
” Bleymüller / Gehlert
Verlag Vahlen
Statistische Formeln, Tabellen und Programme
” PowerPointPräsentationen (Prof. Mohr/ Dr. Ricabal)
” Vorlesungsskript für Statistik I (Dr. Pu Chen)
” Vorlesungsskript für Statistik II (Prof. Mohr, Private
Hanseuniversität Rostock)
” http://www.wiwi.uni-rostock.de/vwl/statistik/download/ba/
Prof. Mohr / Dr. Ricabal
Zufallsvariablen
2
Grundlagen
Häufig interessiert man sich bei einem
Zufallsexperiment nicht so sehr für die einzelnen
Elementarereignisse, sondern für gewisse reelle
Merkmalswerte, die diesen Ereignissen zugeordnet
sind. Mit den reellen Zahlen lässt sich meist
bequemer rechnen.
Beispiel:
” Werfen mit 3 Würfeln: Augensumme
” Lotto: Anzahl der richtigen getippten Zahlen
Prof. Mohr / Dr. Ricabal
Zufallsvariablen
3
Zufallsvariable
Eine Abbildung (Funktion) X, die jedem Elementarereignis w ∊ Ω eine
reelle Zahl X(w) zuordnet, heißt Zufallsvariable.
X :Ω → R
w → X( w)
Somit ist X eine Größe, die beim Auftreten eines zufälligen
Elementarereignisses einen davon abhängigen reellen Wert X(w)
annimmt. X ist also eine Variable, die vom Zufall abhängt.
Mittels einer Zufallsvariable kann jedem Ereignis eine gewisse Menge von
reellen Zahlen zugeordnet werden. Ferner kann man für die durch die
Zufallsvariable erzeugten Ereignisse Wahrscheinlichkeit angeben.
Sei A ein Ereignis. Dann lautet die über X berechnete Wahrscheinlichkeit:
WX (A) = W ({w | X −1 ( w ) ∈ A})
Prof. Mohr / Dr. Ricabal
Zufallsvariablen
4
Beispiel: Zufallsvariable
Beispiel: Sei X die Anzahl der Ausprägung „Zahl“ bei drei Würfen einer Münze
Elementarereignisse
1. Darstellung
2. Darstellung X(wi)
0
w1 = (W, W, W) = (0, 0, 0)
w2 = (Z, W, W) = (1, 0, 0)
1
w3 = (W, Z, W) = (0, 1, 0)
1
w4 = (W, W, Z) = (0, 0, 1)
1
= (1, 1, 0)
2
w5 = (Z, Z, W)
w6 = (Z, W, Z)
= (1, 0, 1)
2
w7 = (W, Z, Z)
= (0, 1, 1)
2
= (1, 1, 1)
3
w8 = (Z, Z, Z)
→ W(X=0) = 1/8
}
}
→ W(X=1) = 3/8
→ W(X=2) = 3/8
→ W(X=3) = 1/8
A = Augenzahl ≤ 1 bzw. X ≤ 1
WX (A) = W ({w | X( w ) ≤ 1}) = W (X = 0 ∨ X = 1) = W (X = 0) + W (X = 1)
1 3 4 1
= + = =
8 8 8 2
Prof. Mohr / Dr. Ricabal
Zufallsvariablen
5
Verteilungsfunktion
¾ Die Verteilungsfunktion ist für alle reelle Zahlen x
definiert.
¾ Die Verteilungsfunktion an der Stelle x gibt die
Wahrscheinlichkeit an, dass die Zufallsvariable X
einen Wert von höchstens x annimmt bzw. x nicht
überschreitet.
FX : R → [0,1]
x → FX ( x ) = W (X ≤ x )
Prof. Mohr / Dr. Ricabal
Zufallsvariablen
6
Beispiel: Verteilungsfunktion
Beispiel: Sei X die Anzahl der Ausprägung „Zahl“ bei drei Würfen einer Münze
x
W(X = x)
0
1/8
1
3/8
2
3/8
FX(x)
3
1/8
1
FX ( x) = W (X ≤ x) für alle x ∈ R
x
1/2
FX(x) = W(X ≤ x)
-∞ < x < 0
0
0≤x<1
1/8
1≤x<2
1/8+3/8=4/8=1/2
2≤x<3
1/8+3/8+3/8=7/8
0
1
2
3
x
FX (−1) = W (X ≤ −1) = 0
x≥3
1/8+3/8+3/8+1/8=1
1
FX (0) = W (X ≤ 0) = W (X = 0) =
8
FX (0,5) = W (X ≤ 0,5) = W (X = 0) =
1
8
1 3 3 1
FX (3,5) = W (X ≤ 3,5) = W (X = 0) + W (X = 1) + W (X = 2) + W (X = 3) = + + + = 1
8 8 8 8
Prof. Mohr / Dr. Ricabal
Zufallsvariablen
7
Eigenschaften der Verteilungsfunktion
”
Monotonie FX (a ) ≤ FX (b) für a ≤ b
”
Rechtsseitigstetigkeit
lim F( x + h) = FX ( x)
h→0
”
Grenzverhalten
FX ( x) = 0
”
lim
x → −∞
und
lim
FX ( x) = 1
x→∞
Es gilt: W (a < X ≤ b) = W (X ≤ b) − W (X ≤ a ) = FX (b) − FX (a )
Beispiel:
a
b
W (1 < X ≤ 3) = W (X ≤ 3) − W (X ≤ 1) = FX (3) − FX (1) = 1 −
Prof. Mohr / Dr. Ricabal
Zufallsvariablen
1 1
=
2 2
8
Diskrete Zufallsvariable
Eine Zufallsvariable X heißt diskret, wenn die Menge der Werte,
die X mit positiver Wahrscheinlichkeit annehmen kann, d. h.
D(X) = {x ∈ ℜ | W (X = x ) > 0}
abzählbar ist. Diese Menge D(X) bezeichnet man als Träger, die
Werte x ∊ D(X) als Massenpunkte. Es kann endlich oder
abzählbar unendlich viele Massenpunkte geben.
Die Funktion fX(x) , die jedem Element x des Trägers die
Wahrscheinlichkeit W(X = x) zuordnet, heißt
Wahrscheinlichkeitsfunktion. Für alle andere x ist f(x) = 0.
⎧W (X = x ) für x ∈ D(X)
f X (x) = ⎨
sonst
⎩0
Es gelten folgende Eigenschaften: 0 ≤ f X ( x) ≤ 1 und
Prof. Mohr / Dr. Ricabal
∑f
X
( x) = 1
Zufallsvariablen
9
Beispiel: Diskrete Zufallsvariable
Sei X die Anzahl der Ausprägung „Zahl“ bei drei Würfen
einer Münze. Es gilt:
x
0
fX(x) = W(X = x) 1/8
1
3/8
2
3/8
3
1/8
fX(x) = 0 für alle andere x
fX(x)
1/2
3/8
0 ≤ f X ( x ) ≤ 1 und
1/4
∑f
1/8
0
∀x
1
Prof. Mohr / Dr. Ricabal
2
3
X
1 3 3 1
(x) = + + + = 1
8 8 8 8
x
Zufallsvariablen
10
Beispiel: Abzählbar unendlich viele Werte
Ein Würfel wird solange geworfen, bis zum ersten Mal eine 6 erscheint.
X bezeichnet die Anzahl der Misserfolge (vor der ersten 6).
Die möglichen Werte von X bilden den Träger D(X)={0, 1, 2, …}.
Diese Menge ist dann abzählbar unendlich.
Da die entsprechenden Würfe unabhängige Ereignisse darstellen, gilt:
fX(x)
1
5 1 5
f (1) = ⋅ =
≈ 0,17 ;
≈ 0,14 ;
6
6 6 36
5 5 1 25
f ( 2) = ⋅ ⋅ =
≈ 0,12 ;
6 6 6 216
5 5 5 1 125
f (3) = ⋅ ⋅ ⋅ =
≈ 0,10 ;
6 6 6 6 1296
f ( 0) =
0,20
0,15
0,10
0,05
⎧⎛ 5 ⎞ x 1
⎪
f ( x ) = ⎨⎜⎝ 6 ⎟⎠ ⋅ 6 für x ∈ D(X)
⎪o
für x ∉ D(X)
⎩
Prof. Mohr / Dr. Ricabal
0
1
3
2
Zufallsvariablen
x
11
Beispiel: Verteilungsfunktion der
geometrischen Verteilung
Ein Würfel wird solange geworfen, bis zum ersten Mal eine 6 erscheint.
X bezeichnet die Anzahl der Misserfolge (vor der ersten 6). Es gilt:
⎧⎛ 5 ⎞ x 1
⎪
f ( x ) = ⎨⎜⎝ 6 ⎟⎠ ⋅ 6
⎪0
⎩
für x = 0, 1, 2, L
x
0
fX(x) 0,17
…
…
sonst
FX(x)
Für die Verteilungsfunktion gilt:
x
x<0 0≤x<1 1≤x<2 2≤x<3 3≤x<4
FX(x) 0
0,17 0,31 0,45 0,55
1
…
…
Diese ist eine spezielle diskrete
Verteilung und heißt geometrische
Verteilung, denn die f(x) bildet eine
geometrische Folge.
Prof. Mohr / Dr. Ricabal
1
2
3
0,14 0,12 0,10
Zufallsvariablen
0,75
0,50
0,25
0
1
3
2
12
x
Stetige Zufallsvariablen
Eine Zufallsvariable X heißt stetig, wenn die Menge aller möglichen
Werte der Zufallsvariable eine Menge bilden, die überabzählbar
viele Werte enthält. D. h. die Menge der möglichen Werte besteht
aus einem Intervall reeller Zahlen oder aus allen reellen Zahlen.
Die Verteilungsfunktion lässt sich wie folgt darstellen:
x
FX ( x ) = W (X ≤ x ) = ∫ f X (u )du
fX(x) heißt Dichtefunktion.
−∞
f X (x) =
d
FX ( x )
dx
für alle Differenzierbarkeitsstellen von FX(x)
b
∞
f X ( x ) ≥ 0 und
∫f
X
( x )dx = 1
−∞
W (a < X ≤ b) = FX (b) − FX (a ) = ∫ f ( x )dx
a
Es gilt i. a. nicht, dass f(x) ≤ 1 ist. Ferner lassen sich die Werte von
f(x) nicht als Wahrscheinlichkeiten interpretieren.
Prof. Mohr / Dr. Ricabal
Zufallsvariablen
13
Beispiel: Stetige Zufallsvariablen
Sei X eine Zufallsvariable mit folgender Dichtefunktion
x
für x < 0
⎧0
⎪1
2
f X ( x ) = ⎨ ( x − 3) 0 ≤ x ≤ 3
⎪9
für x > 3
⎩0
1
0,75
F( x ) = ∫ f (u )du
−∞
0
0
x
3
für 0 ≤ x ≤ 3
∞
1
F( x ) = ∫ 0du + ∫ ( u − 3) 2 du + ∫ 0du = 1 für x > 3
9
0
0
−∞
fX(x)
0,25
1
−∞
x
1
1
F( x ) = ∫ 0du + ∫ ( u − 3) 2 du =
( x − 3) 3
9
27
0
0
−∞
0,50
0
x
F( x ) = ∫ 0du = 0 für x < 0
2
F(0) = −1 + 1 = 0; F(1) = −
Prof. Mohr / Dr. Ricabal
3
x
für x < 0
⎧0
⎪1
3
F( x ) = ⎨ ( x − 3) + 1 0 ≤ x ≤ 3
⎪ 27
für x > 3
⎩1
8
19
1
26
+1 =
≈ 0,70; F(2) = − + 1 =
≈ 0,96; F(3) = 0 + 1 = 1
27
27
27
27
Zufallsvariablen
14
Spezielle Maßzahlen für
eindimensionale Zufallsvariablen
”
”
”
Symmetriestelle:
xsym heißt Symmetriestelle von f(x), wenn gilt:
f(xsym - h) = f(xsym + h)
Modus:
xmod heißt Modus von f(x), wenn in xmod ein relatives
Maximum von f(x) liegt.
Quantil bzw. Perzentil:
xα heißt Quantil zum Niveau α mit (0< α<1), wenn gilt:
ƒ
ƒ
F(xα) = α im stetigen Fall
xα = min{x∊D(X)|F(x) ≥ α } im diskreten Fall
Für = 0,5; 0,25 und 0,75 erhält man Median, unteres
(erstes) bzw. oberes (drittes) Quartil
Prof. Mohr / Dr. Ricabal
Zufallsvariablen
15
Beispiel: Spezielle Maßzahlen für
eindimensionale Zufallsvariablen
X: Die Anzahl der Ausprägung „Zahl“ bei drei Würfen einer Münze.
x
0
fX(x) = W(X = x) 1/8
1
3/8
2
3/8
Symmetriestelle: xsym= 1,5
Modus: xmod = 1 bzw. 2
Median: x0,50 = 1
3
1/8
fX(x)
1/2
3/8
1/4
1/8
FX(x)
0
1
2
3
x
x
x<0 0≤x<1 1≤x<2 2≤x<3
FX(x) 0
0,125 0,5 0,875
1/2
0
1
1
2
Prof. Mohr / Dr. Ricabal
3
x
Erstes Quartil: x0,25= 1
Drittes Quartil: x0,75 = 2
0,95-Quantil: x0,95 = 3
Zufallsvariablen
16
3≤x
1
Beispiel: Spezielle Maßzahlen für
eindimensionale Zufallsvariablen
Ein Würfel wird solange geworfen, bis zum ersten Mal eine 6 erscheint.
X bezeichnet die Anzahl der Misserfolge (vor der ersten 6).
x
0
fX(x) 0,17
1
2
3
0,14 0,12 0,10
fX(x)
…
…
x
x<0 0≤x<1 1≤x<2 2≤x<3 3≤x<4
FX(x) 0
0,17 0,31 0,42 0,52
FX(x)
0,20
1
0,15
0,75
0,10
0,50
0,05
0,25
0
1
2
3
x
0
Keine Symmetriestelle
Modus: xmod = 0
Median: x0,50 = 3
Prof. Mohr / Dr. Ricabal
1
3
2
…
…
x
Erstes Quartil: x0,25= 1
Drittes Quartil: x0,75 = 7
0,95-Quantil: x0,95 = 16
Zufallsvariablen
17
Beispiel: Spezielle Maßzahlen für
eindimensionale Zufallsvariablen
Sei X eine Zufallsvariable mit folgender Dichtefunktion
für x < 0
⎧0
⎪1
2
f ( x ) = ⎨ ( x − 3) 0 ≤ x ≤ 3
⎪9
für x > 3
⎩0
für x < 0
⎧ 0
⎪1
3
F( x ) = ⎨ ( x − 3) + 1 0 ≤ x ≤ 3
⎪ 27
für x > 3
⎩ 1
Keine Symmetriestelle
Modus: xmod = 0
Median: x0,50 = 0,62
Prof. Mohr / Dr. Ricabal
1
0,75
fX(x)
0,50
0,25
0
F( x 0,5 ) = 0,5 ⇔
1
2
3
x
1
( x 0,5 − 3) 3 + 1 = 0,5
27
1
( x 0,5 − 3)3 = 0,5 − 1 ⇔ ( x 0,5 − 3) 3 = −0,5 ⋅ 27
27
( x 0,5 − 3) = 3 − 0,5 ⋅ 27 ⇔ x 0,5 ≈ 0,62
Zufallsvariablen
18
Die wichtigsten Verteilungsmaßzahlen
Erwartungswert:
⎧
⎪∑ x ⋅ f X ( x ) im diskreten Fall
⎪
µ = E ( X ) = ⎨ ∀∞x
⎪ x ⋅ f X ( x )dx im stetigen Fall
∫
⎩⎪ − ∞
”
”
Interpretation!
Varianz:
⎧
2
⎪∑ ( x − µ) ⋅ f X ( x ) im diskreten Fall
⎪
σ 2 = Var (X ) = E ( x − µ) 2 = ⎨ ∀∞x
⎪ ( x − µ) 2 ⋅ f X ( x ) im stetigen Fall
⎪⎩ −∫∞
” Standardabweichung:
Bemerkung:
Nicht für alle Zufallsvariablen
existieren die jeweiligen Maßzahlen.
σ = Var(X) = σ 2
Prof. Mohr / Dr. Ricabal
Zufallsvariablen
19
Rechenregel zu den Verteilungsmaßzahlen
Wie im Rahmen der deskriptiven Statistik gelten für lineare
Transformationen:
E (a + b ⋅ X ) = a + b ⋅ E ( X )
Var (a + b ⋅ X) = b 2 ⋅ Var (X)
Var (X) = E (X ) − [E (X)]
2
2
Die letzte Formel kann bei
der Berechnung der Varianz
einfacher durchzuführen sein
mit
⎧
2
⎪∑ x ⋅ f X ( x )
⎪
E (X 2 ) = ⎨ ∀∞x
⎪ x 2 ⋅ f X ( x )dx
⎪⎩ −∫∞
Prof. Mohr / Dr. Ricabal
im diskreten Fall
im stetigen Fall
Zufallsvariablen
20
Beispiel: Erwartungswert und Varianz
im diskreten Fall
Sei X die Anzahl der Ausprägung „Zahl“ bei drei Würfen einer Münze
x
0
fX(x) = W(X = x) 1/8
1
3/8
2
3/8
3
1/8
1
3
3
1 12 3
µ = E(X) = ∑ x ⋅ f X ( x ) = 0 ⋅ + 1⋅ + 2 ⋅ + 3 ⋅ =
= = 1,5
8
8
8
8 8 2
∀x
2
⎛ 3 ⎞ 12 9 3
Var(X) = E(X ) − [E(X)] = 3 − ⎜ ⎟ = − = = 0,75
4 4 4
⎝2⎠
1
3
3
1
E (X 2 ) = ∑ x 2 ⋅ f X ( x ) = 0 2 ⋅ + 12 ⋅ + 2 2 ⋅ + 32 ⋅
8
8
8
8
∀x
1
3
3
1 24
= 0 ⋅ + 1⋅ + 4 ⋅ + 9 ⋅ =
=3
Interpretation?
8
8
8
8 8
2
2
Prof. Mohr / Dr. Ricabal
Zufallsvariablen
21
Beispiel: Erwartungswert und Varianz
im stetigen Fall
Sei X eine Zufallsvariable mit folgender Dichtefunktion
∞
E (X ) =
∫ x ⋅f
X
( x )dx
−∞
⎧1
⎪⎪ ⋅ x für 1 ≤ x ≤ 3
f (x) = ⎨ 4
⎪
sonst
⎩⎪0
1
3
3
∞
=
1
1 x3
∫−∞x ⋅ 0 dx + ∫1 x ⋅ 4 ⋅ x dx + ∫3 x ⋅ 0 dx = 4 ⋅ 3
1
=
27 1 26 13
− =
=
= 2,167 *
12 12 12 6
169 180 − 169 11
⎛ 13 ⎞
2
Var (X ) = E(X 2 ) − [E (X)] = 5 − ⎜ ⎟ = 5 −
=
=
≈ 0,306 *
36
36
36
⎝6⎠
2
∞
E(X 2 ) =
2
∫ x ⋅ f X (x )dx =
−∞
1
3
1
1
= ⋅ (34 − 14 ) = ⋅ 80 = 5
16
16
Prof. Mohr / Dr. Ricabal
∞
1 x4
2
2 1
2
x
⋅
0
dx
+
x
⋅
⋅
x
dx
+
x
⋅
0
dx
=
⋅
∫
∫1 4
∫3
4 4
−∞
3
1
*Interpretation?
Zufallsvariablen
22
Zentrierung
Sei X eine Zufallsvariable mit dem Erwartungswert µ und die
Varianz σ2. Die spezielle lineare Transformation
Y = X −µ
bezeichnet man als Zentrierung. Für die neue Zufallsvariable Y gilt:
E(Y) = E(X – µ) = E(X) - µ = µ - µ = 0
Var(Y) = Var (X – µ) = Var (X) = σ2
Durch die Zentrierung ereicht man eine Verschiebung der Lage der
Verteilung auf der Ursprung. Die Varianz bleibt aber gleich.
Prof. Mohr / Dr. Ricabal
Zufallsvariablen
23
Normierung
Sei X eine Zufallsvariable mit dem Erwartungswert µ und die
Varianz σ2. Die spezielle lineare Transformation
Y=
X
σ
bezeichnet man als Normierung. Für die neue Zufallsvariable Y gilt:
X
1
1
µ
E(Y) = E( ) = E(X) = ⋅ µ =
σ
σ
σ
σ
X
1
1
Var (Y) = Var ( ) = 2 Var (X) = 2 ⋅ σ 2 = 1
σ
σ
σ
Durch diese Transformation erreicht man eine neue
dimensionslose Zufallsvariable mit Varianz gleich Einz.
Prof. Mohr / Dr. Ricabal
Zufallsvariablen
24
Standardisierung
Sei X eine Zufallsvariable mit dem Erwartungswert µ und die
Varianz σ2. Die spezielle lineare Transformation
Z=
X −µ
σ
bezeichnet man als Standardisierung bzw. Z-Transformation.
Für die neue Zufallsvariable Z gilt:
X −µ
1
) = E ( X − µ) = 0
σ
σ
X −µ
1
1
Var ( Z) = Var (
) = 2 Var (X − µ) = 2 ⋅ σ 2 = 1
σ
σ
σ
E ( Z) = E (
Die Standardisierung wird für die wichtigste stetige Zufallsvariable,
die Normalverteilung, und für viele statistische Verfahren eingesetzt.
Prof. Mohr / Dr. Ricabal
Zufallsvariablen
25
Schwankungsintervall
”
”
Wenn die Realisationen x der Zufallsvariablen X in einen
Intervall (a, b) mit a < b liegen, spricht man von einen
Schwankungsintervall (d. h. {x | a < x < b).
Ein k-faches zentrales Schwankungsintervall ist gegeben
durch
a = µ – kσ und b = µ + kσ, d. h. {x | µ – kσ < x < µ + kσ}
Ist die Verteilung der Zufallsvariable X bekannt, lässt sich die
zugehörige Wahrscheinlichkeit für W(µ – kσ < X < µ + kσ) genau
berechnen.
Ist die Verteilung unbekannt, dann kann man mittels der
Tschebysscheffschen Ungleichung die Wahrscheinlichkeit
abschätzen.
W (µ – kσ < X < µ + kσ) ≥ 1 Prof. Mohr / Dr. Ricabal
1
k2
µ-kσ
Zufallsvariablen
µ
µ+kσ
26
Beispiel: Schwankungsintervall
Es wird die Wahrscheinlichkeit einer Standardnormalverteilung im
einfachen, 2-fachen und 3-fachen zentralen Schwankungsintervall
abgeschätzt. Es ist bekannt, dass E(Z) = 0 und Var(Z) = 1 sind. Dann gilt:
W (0 – 1⋅1 < Z < 0 + 1.1) ≥ 1 W (0 – 2 ⋅1 < Z < 0 + 2.1) ≥ 1 W (0 – 3 ⋅1 < Z < 0 + 3.1) ≥ 1 -
1
=0
12
1 3
= = 0,75
22 4
1 8
= = 0,8889
32 9
Exakte Wahrscheinlichkeiten durch die Nutzung der bekannten
Verteilungsfunktion.
W (0 – 1 ⋅1 < Z < 0 + 1.1) = 0,6827
Es sind echt grobe
Schätzungen!
W (0 – 3 ⋅1 < Z < 0 + 3.1) = 0,9973
W (0 – 2 ⋅1 < Z < 0 + 2.1) = 0,9545
Prof. Mohr / Dr. Ricabal
Zufallsvariablen
27
Drei Sigma Regel. Grafische Darstellung
” W(µ - σ < X < µ + σ)
= W(-1 ≤ Z ≤ 1) = 0,6827
” W(µ – 2·σ < X < µ + 2·σ)
= W(-2 ≤ Z ≤ 2) = 0,9545
-4
-2
0
68,27 %
2
4
x
” W(µ – 3·σ < X <µ + 3·σ)
= W(-3 ≤ Z ≤ 3) = 0,9973
94,45 %
99,73 %
Prof. Mohr / Dr. Ricabal
Zufallsvariablen
28
Herunterladen