Bemerkung - Fakultät Statistik (TU Dortmund)

Werbung
TU Dortmund
Wintersemester 2010/2011 - Statistik für Ökonomen
Bemerkung
a) Funktionen von Zufallsvariablen sind wieder Zufallsvariablen.
Betrachte etwa zweimaligen Würfelwurf (vgl. Beispiel 8.2 b)) und
definiere Zufallsvariablen: X1 = Augenzahl Wurf 1“;
”
X2 = Augenzahl Wurf 2“. Dann sind
”
Z1 = min {X1 , X2 }
Z2 = max {X1 , X2 }
Z3 = X1 + X2
ebenfalls Zufallsvariablen
b) Im Folgenden von Interesse: Wie lassen sich Wahrscheinlichkeiten angeben, dass Zufallsvariable X Wert xi annimmt?
Zunächst lediglich Betrachtung diskreter Zufallsvariablen.
Dr. Hendrik Hansen
199
TU Dortmund
Wintersemester 2010/2011 - Statistik für Ökonomen
Definition 9.2
Sei X diskrete Zufallsvariable mit möglichen Realisationen
x1 , x2 , ..., xk . Dann heißt die Funktion f (·), die angibt, mit welcher
Wahrscheinlichkeit X die Realisation xi annimmt,
f (xi ) = P (X = xi ),
i = 1, . . . , k,
Wahrscheinlichkeitsfunktion von X.
Dr. Hendrik Hansen
200
TU Dortmund
Wintersemester 2010/2011 - Statistik für Ökonomen
Beispiel 9.2
(Zweimaliges Würfeln, vgl. Beispiel 8.2 b))
◮
Definiere X =Augensumme beider Würfe
◮
8.2 b) bzw. 8.4: Zweimaliges Würfeln entspricht Laplace
Experiment mit |Ω| = 36 →
X(ω) = xi
X=2
X=3
X=4
..
.
X = 12
Dr. Hendrik Hansen
{zugehörige ω}
{(1, 1)}
{(1, 2), (2, 1)}
{(1, 3), (2, 2), (3, 1)}
..
.
⇒
⇒
⇒
⇒
{(6, 6)}
⇒ P (X = 12) = 1/36
P (X
P (X
P (X
P (X
..
.
= xi )
= 2) = 1/36
= 3) = 2/36
= 4) = 3/36
201
TU Dortmund
Wintersemester 2010/2011 - Statistik für Ökonomen
Beispiel 9.2 (Fortsetzung)
Realisation xi
P (X = xi )
2
1/36
3
2/36
4
3/36
5
4/36
6
5/36
Realisation xi
P (X = xi )
8
5/36
9
4/36
10
3/36
11
2/36
12
1/36
⇒
P
7
6/36
P (X = xi ) = 1 (klar, da sich eine Augensumme zwischen
i
Dr. Hendrik Hansen
2 und 12 auf jeden Fall realisieren wird!)
202
TU Dortmund
Wintersemester 2010/2011 - Statistik für Ökonomen
3/36
0
1/36
2/36
P(X = xi)
4/36
5/36
6/36
Beispiel 9.2 (Fortsetzung)
2
3
4
5
6
7
8
9
10
11
12
xi
Dr. Hendrik Hansen
203
TU Dortmund
Wintersemester 2010/2011 - Statistik für Ökonomen
Beispiel 9.2 (Fortsetzung)
◮
Frage: Wie wahrscheinlich überschreitet Zufallsvariable einen
bestimmten Wert nicht?
◮
Hier etwa: Mit welcher Wahrscheinlichkeit ist Augensumme
≤ 3?
P(X ≤ 3) = P({(1, 1)} ∪ {(1, 2), (2, 1)})
= P({(1, 1)}) + P({(1, 2), (2, 1)})
+P({(1, 1)} ∩ {(1, 2), (2, 1)})
= P({(1, 1)}) + P({(1, 2), (2, 1)}) + P(∅)
=
1
2
+
+0
36 36
= P(X = 2) + P(X = 3)
Dr. Hendrik Hansen
204
TU Dortmund
Wintersemester 2010/2011 - Statistik für Ökonomen
Definition 9.3
Für eine Zufallsvariable X heißt die Funktion F (·), die angibt, mit
welcher Wahrscheinlichkeit X einen Wert x nicht überschreitet,
F (x) = P (X ≤ x),
x ∈ R,
Verteilungsfunktion von X.
Bemerkung
Für eine diskrete Zufallsvariable X gilt
X
F (x) =
f (xi ), x ∈ R
xi ≤x
(vergleiche Definition 2.2: F (x) theoretisches Gegenstück“ zu
”
empirischer Verteilungsfunktion Fn (x))
Dr. Hendrik Hansen
205
TU Dortmund
Wintersemester 2010/2011 - Statistik für Ökonomen
Beispiel 9.3
(Zweimaliges Würfeln, vgl. Beispiel 9.2)
Weiterhin sei X =Augensumme beider Würfe
◮
In Bsp. 9.2 berechnet: F (3) = P(X = 2) + P(X = 3) =
3
36
◮
Bem. nach Def. 9.3:
6
,
F (4) = P(X = 2) + P(X = 3) + P(X = 4) = 36
F (5) = P(X = 2)+P(X = 3)+P(X = 4)+P(X = 5) =
10
36 , ...
x∈
F (x)
(−∞, 2)
0
[2, 3)
1/36
[3, 4)
3/36
[4, 5)
6/36
[5, 6)
10/36
[6, 7)
15/36
x∈
F (x)
[7, 8)
21/36
[8, 9)
26/36
[9, 10)
30/36
[10, 11)
33/36
[11, 12)
35/36
[12, ∞)
1
Dr. Hendrik Hansen
206
TU Dortmund
Wintersemester 2010/2011 - Statistik für Ökonomen
1
Beispiel 9.3 (Fortsetzung)
●
●
5/6
●
●
1/2
●
●
1/3
P(X ≤ x)
2/3
●
1/6
●
●
●
0
●
−1
0
1
2
3
4
5
6
7
8
9
10
11
12
13
x
→ F (x) Treppenfunktion; Sprungstellen x = 2, 3, ..., 12, Sprunghöhen den Werten der Wahrscheinlichkeitsfunktion entsprechend
(1/36, 2/36, 3/36, ..., 1/36)
Dr. Hendrik Hansen
207
TU Dortmund
Wintersemester 2010/2011 - Statistik für Ökonomen
Bemerkung
Betrachte nun stetige Zufallsvariable X; Hier Definition der
Wahrscheinlichkeitsfunktion durch f (xi ) = P(X = xi ) analog zu
Definition 9.2 nicht sinnvoll
◮
Grund: X stetig → Sämtliche xi ∈ R können sich realisieren
(zumindest auf Intervall, vergleiche Definition 9.1)
◮
Stetigkeit in Praxis jedoch Idealisierung, da Messungen
diskret
◮
Sei etwa X = Körpergewicht (in kg) einer zufällig
ausgewählten Person i → P(X = 82, 514367842312) ???
→ deswegen:
P(X = x) = 0 für alle x ∈ R
Dr. Hendrik Hansen
208
TU Dortmund
Wintersemester 2010/2011 - Statistik für Ökonomen
Definition 9.4
Sei X stetige Zufallsvariable mit möglichen Realisationen im
Intervall (a, b), a = −∞ und/oder b = ∞ erlaubt, und
differenzierbarer Verteilungsfunktion F (x). Dann heißt die erste
Ableitung
f (x) = F ′ (x),
x ∈ R,
Dichtefunktion (kurz Dichte) von X.
Dr. Hendrik Hansen
209
TU Dortmund
Wintersemester 2010/2011 - Statistik für Ökonomen
Bemerkung 1
a) Zusammenhang zwischen Verteilungs- und Dichtefunktion
Zx
f (x) = F ′ (x) (vgl. Def. 9.4) und F (x) =
f (t) dt
−∞
b) Interpretation der Dichtefunktion
schraffiert:
Ra
f (t) dt = F (a) = P(X ≤ a)
−∞
→ gesamter Flächeninhalt unter der Dichte=1
Dr. Hendrik Hansen
210
TU Dortmund
Wintersemester 2010/2011 - Statistik für Ökonomen
Bemerkung 2
a) Eigenschaften der Verteilungsfunktion ( Gegenstück“ zur
”
Bemerkung nach Beispiel 2.3): Sei X beliebige Zufallsvariable
mit Verteilungsfunktion F (x). Dann gilt
◮
F (x) ist monoton nicht fallend
◮
0 ≤ F (x) ≤ 1 für alle x ∈ R
◮
lim F (x) = 0 und
x→−∞
◮
Dr. Hendrik Hansen
lim F (x) = 1
x→∞
P (a < X ≤ b) = F (b) − F (a)
211
TU Dortmund
Wintersemester 2010/2011 - Statistik für Ökonomen
Bemerkung 2 (Fortsetzung)
b) Eigenschaften der Wahrscheinlichkeits-/Dichtefunktion:
Sei f (x) die der Zufallsvariablen X aus a) zugehörige
Wahrscheinlichkeits-/Dichtefunktion. Dann gilt
◮
◮
f (x) ≥ 0
lim f (x) = lim f (x) = 0
x→−∞
◮
P
x→∞
f (xi ) = 1 falls X diskret (I Indexmenge, z.B.
i∈I
I = {1, ..., n}), bzw.
R∞
f (x) dx = 1 falls X stetig
−∞
◮
F (b) − F (a) =
Rb
f (x) dx,
falls X stetig
a
Dr. Hendrik Hansen
212
TU Dortmund
Wintersemester 2010/2011 - Statistik für Ökonomen
Beispiel 9.4
a) Gleich-/Rechteckverteilung (einfachste stetige Verteilung)
◮
X gleichverteilt auf Intervall [a, b] →
(
1
x ∈ [a, b]
f (x) = b−a
0
sonst
→ Werte auf Intervall gleichmäßig“ verteilt
”
Dr. Hendrik Hansen
213
TU Dortmund
Wintersemester 2010/2011 - Statistik für Ökonomen
Beispiel 9.4 (Fortsetzung)
0.00
0.01
0.02
f(x)
0.03
0.04
0.05
b) Sei X = Verspätung der S1 an der Haltestelle Universität
”
Dortmund“; Annahme: X auf Intervall [0, 20] gleichverteilt
(
1
x ∈ [0, 20]
→ f (x) = 20
0 sonst
−5
0
5
10
15
20
25
Verspätung x in Minuten
Dr. Hendrik Hansen
214
TU Dortmund
Wintersemester 2010/2011 - Statistik für Ökonomen
Beispiel 9.4 (Fortsetzung)
b) (Fortsetzung)
◮
Frage: Mit welcher Wahrscheinlichkeit beträgt S1-Verspätung
zwischen fünf und zehn Minuten?
P (5 < X ≤ 10) = F (10) − F (5)
(vgl. Bem. 2 a) nach Def. 9.4) → Berechnung von F (x) :
F (x)
=
Zx
f (t) dt =
0
→ Insgesamt: F (x)
=


0,
x
,
 20

1,
Dr. Hendrik Hansen
Zx
0
x
x
1 1
dt =
t =
20
20 0
20
x<0
0 ≤ x ≤ 20
x > 20
215
TU Dortmund
Wintersemester 2010/2011 - Statistik für Ökonomen
Beispiel 9.4 (Fortsetzung)
b) (Fortsetzung)
P (5 < X ≤ 10) = F (10) − F (5) =
10
20
−
5
20
= 0, 25
F(x)
0
0.25=F(5)
0.5=F(10)
0.75
1
→ P(S1 fünf bis zehn Minuten zu spät)=25 %
−5
0
5
10
15
20
25
Verspätung x in Minuten
Dr. Hendrik Hansen
216
TU Dortmund
Wintersemester 2010/2011 - Statistik für Ökonomen
Definition 9.5
Gilt für zwei Zufallsvariablen X und Y und alle x, y ∈ R
P (X ≤ x, Y ≤ y) = P (X ≤ x) · P (Y ≤ y) = FX (x) · FY (y),
so heißen X und Y stochastisch unabhängig.
Beispiel 9.5
(zweimaliges Würfeln, vgl. u.a. Beispiel 9.2)
X =Augenzahl erster Wurf
Y =Augenzahl zweiter Wurf
Dr. Hendrik Hansen
217
TU Dortmund
Wintersemester 2010/2011 - Statistik für Ökonomen
Beispiel 9.5 (Fortsetzung)
P (X ≤ 3, Y ≤ 5) = P (X ≤ 3 und Y ≤ 5)
= P ( {(1, 1), (1, 2), ..., (1, 6), (2, 1), ..., (3, 6)}
|
{z
}
A mit |A|=18
und {(1, 1), ..., (1, 5), (2, 1), ..., (6, 5)} )
{z
}
|
B mit |B|=30
= P (A ∩ B)
= P ({(1, 1), (1, 2), ..., (1, 5), (2, 1), ..., (3, 5)})
{z
}
|
C mit |C|=15
=
Dr. Hendrik Hansen
15
5
=
36
12
218
TU Dortmund
Wintersemester 2010/2011 - Statistik für Ökonomen
Beispiel 9.5 (Fortsetzung)
Außerdem gilt:
P (X ≤ 3) = P (A) =
1
18
=
36
2
P (Y ≤ 5) = P(B) =
30
5
=
36
6
Und somit
P (X ≤ 3) · P (Y ≤ 5) =
5
1 5
· =
= P (X ≤ 3, Y ≤ 5)
2 6
12
Für alle (x, y) ∈ R nachweisbar → X und Y stochastisch
unabhängig
Dr. Hendrik Hansen
219
TU Dortmund
Wintersemester 2010/2011 - Statistik für Ökonomen
Bemerkung
Fazit/Zusammenfassung Kapitel 9
◮
Zufallsvariablen zur vereinfachten Berechnung von
Wahrscheinlichkeiten; Quantifizierung von Ereignissen
◮
Diskrete Zufallsvariablen besitzen Wahrscheinlichkeits- und
Verteilungsfunktion
◮
stetige Zufallsvariablen besitzen Dichte und
Verteilungsfunktion
Dr. Hendrik Hansen
220
TU Dortmund
Wintersemester 2010/2011 - Statistik für Ökonomen
Kapitel 10: Erwartungswert, Varianz und Kovarianz
von Zufallsvariablen
Motivation Erwartungswert: Welchen Wert nimmt
Zufallsvariable durchschnittlich an?
Populärstes Lagemaß aus Teil A: Arithmetisches Mittel
◮
Ausgangslage: Metrisch skaliertes Merkmal X mit möglichen
Ausprägungen a1 , ..., ak , die mit relativen Häufigkeiten
h(a1 ), ..., h(ak ) auftreten. Es gilt (vergleiche Definition 3.1
und Beispiel 3.2 a))
a
x̄ =
k
X
ai · h(ai )
i=1
→ Idee: Ersetze relative Häufigkeiten durch bekannte
Wahrscheinlichkeiten
Dr. Hendrik Hansen
221
TU Dortmund
Wintersemester 2010/2011 - Statistik für Ökonomen
Definition 10.1
a) Sei X diskrete Zufallsvariable mit möglichen Realisationen
x1 , ..., xn und f (xi ) = P(X = xi ) Wahrscheinlichkeitsfunktion. Dann heißt
X
E (X) =
xi · f (xi )
i∈I
Erwartungswert von X (I =Indexmenge).
b) Sei X stetige Zufallsvariable mit Dichte f (x). Dann heißt
E (X) =
Z∞
x · f (x) dx
−∞
Erwartungswert von X.
Dr. Hendrik Hansen
222
TU Dortmund
Wintersemester 2010/2011 - Statistik für Ökonomen
Beispiel 10.1
a) X = Augensumme zweimaliges Würfeln“, vgl. u.a. Bsp. 9.2
”
E (X) =
X
xi · f (xi ) =
xi · f (xi )
i=1
i∈I
= 2·
11
X
1
2
3
1
+3·
+4·
+ . . . + 12 ·
=7
36
36
36
36
b) X = Anzahl Kopf bei zweimaligem Münzwurf“, vgl. Bsp. 9.1
”
E (X) =
X
i∈I
= 0·
Dr. Hendrik Hansen
xi · f (xi ) =
3
X
xi · f (xi )
i=1
2
1
1
+1· +2· =1
4
4
4
223
TU Dortmund
Wintersemester 2010/2011 - Statistik für Ökonomen
Beispiel 10.1 (Fortsetzung)
c) X = Verspätung der S1“, vgl. Bsp. 9.4
”
E (X) =
Z∞
−∞
x · f (x) dx =
Z20
0
1 2 20
1
= 10
dx =
x
x·
20
40 0
Bemerkung
a) Ist Wahrscheinlichkeitsfunktion/Dichte einer Zufallsvariablen
X symmetrisch um x⋆ , dann gilt E (X) = x⋆
b) Der Erwartungswert einer diskreten Zufallsvariablen X muss
nicht unbedingt mögliche Realisation xi von X sein
c) Der Erwartungswert muss nicht notwendigerweise existieren,
d. h. E (X) = ∞ ist möglich
Dr. Hendrik Hansen
224
Herunterladen