Document

Werbung
2. Zufallsvariable, Verteilungsfunktion, Erwartungswert, momentenerzeugende Funktion
Ziel des Kapitels:
• Mathematische Präzisierung der Konzepte
Zufallsvariable
Verteilungsfunktion
Dichtefunktion
Erwartungswerte und Momente
Momentenerzeugende Funktion
8
Dazu zunächst:
• Wiederholung der Begriffe
Zufallsvorgang
Ergebnis und Ergebnismenge
Ereignis
Wahrscheinlichkeit
(vgl. Wilfling (2011), Kapitel 2)
9
2.1 Grundlegende Begriffe
Definition 2.1: (Zufallsvorgang, Zufallsexperiment)
Unter einem Zufallsvorgang verstehen wir einen Vorgang, bei
dem
(a) im Voraus feststeht, welche möglichen Ausgänge dieser theoretisch haben kann,
(b) der sich einstellende, tatsächliche Ausgang im Voraus jedoch
unbekannt ist.
Zufallsvorgänge, die geplant sind und kontrolliert ablaufen, heißen
Zufallsexperimente.
10
Beispiele für Zufallsexperimente:
• Ziehung der Lottozahlen
• Roulette, Münzwurf, Würfelwurf
• ’Technische Versuche’
(Härtetest von Stahlproben etc.)
In der VWL:
• Oft keine Zufallsexperimente
(historische Daten, Bedingungen nicht kontrollierbar)
• Moderne VWL-Disziplin: Experimentelle Ökonomik
11
Definition 2.2: (Ergebnis, Ergebnismenge)
Die Menge aller möglichen Ausgänge eines Zufallsvorgangs heißt
Ergebnismenge und wird mit Ω bezeichnet. Ein einzelnes Element ω ∈ Ω heißt Ergebnis.
Beispiele:
• Zufallsvorgang ’Werfen eines Würfels’:
Ω = {1, 2, 3, 4, 5, 6}
• Zufallsvorgang ’Werfen einer Münze solange, bis Kopf erscheint’:
Ω = {K, ZK, ZZK, ZZZK, ZZZZK, . . .}
• Zufallsvorgang ’Bestimmung des morgigen Wechselkurses
zwischen Euro und US-$’:
Ω = [0, ∞)
12
Offensichtlich:
• Die Anzahl der Elemente von Ω kann endlich, abzählbar unendlich oder nicht abzählbar unendlich sein
Jetzt:
• Mengentheoretische Definition des Begriffes ’Ereignis’
Definition 2.3: (Ereignis)
Unter einem Ereignis verstehen wir
Ergebnissen eines Zufallsvorgangs,
Teilmenge der Ergebnismenge Ω.
tritt ein’, wenn der Zufallsvorgang
eine Zusammenfassung von
d.h.
ein Ereignis ist eine
Man sagt ’Das Ereignis A
ein ω ∈ A als Ergebnis hat.
13
Bemerkungen:
• Notation von Ereignissen: A, B, C, . . . oder A1, A2, . . .
• A = Ω heißt das sichere Ereignis
(denn für jedes Ergebnis ω gilt: ω ∈ A)
• A = ∅ (leere Menge) heißt das unmögliche Ereignis
(denn für jedes ω gilt: ω ∈
/ A)
• Falls das Ereignis A eine Teilmenge des Ereignisses B ist
(A ⊂ B), so sagt man: ’Das Eintreten von A impliziert das
Eintreten von B’
(denn für jedes ω ∈ A folgt ω ∈ B)
Offensichtlich:
• Ereignisse sind Mengen
−→ Anwendung von Mengenoperationen auf Ereignisse
14
Ereignisverknüpfungen (Mengenoperationen):
• Durchschnittsereignis (-menge):
n
T
i=1
Ai tritt ein, wenn alle Ai eintreten
• Vereinigungsereignis (-menge):
n
S
i=1
Ai tritt ein, wenn mindestens ein Ai eintritt
• Differenzereignis (-menge):
C = A\B tritt ein, wenn A eintritt, aber B nicht
• Komplementärereignis:
C = Ω\A ≡ A tritt ein, wenn A nicht eintritt
• Die Ereignisse A und B heißen unvereinbar oder disjunkt,
wenn A ∩ B = ∅
(beide Ereignisse können nicht gleichzeitig eintreten)
15
Jetzt:
• Jedem Ereignis A soll eine Zahl P (A) zugeordnet werden,
welche die Wahrscheinlichkeit für das Eintreten von A repräsentiert
• Formal:
P : A −→ P (A)
Frage:
• Welche Eigenschaften sollte die Zuordnung (Mengenfunktion) P besitzen?
16
Definition 2.4: (Kolmogorov’sche Axiome)
Die folgenden 3 Mindestanforderungen an P werden als Kolmogorov’sche Axiome bezeichnet:
• Nichtnegativität: Für alle A soll gelten: P (A) ≥ 0
• Normierung: P (Ω) = 1
• Additivität: Für zwei disjunkte Ereignisse A und B (d.h. für
A ∩ B = ∅) soll gelten:
P (A ∪ B) = P (A) + P (B)
17
Es ist leicht zu zeigen:
• Die 3 Kolmogorov’schen Axiome implizieren bestimmte Eigenschaften und Rechenregeln für Wahrscheinlichkeiten
Satz 2.5: (Eigenschaften von Wahrscheinlichkeiten)
Aus den Kolmogorov’schen Axiomen ergeben sich folgende Eigenschaften für die Wahrscheinlichkeit beliebiger Ereignisse:
• Wahrscheinlichkeit des Komplimentärereignisses:
P (A) = 1 − P (A)
• Wahrscheinlichkeit des unmöglichen Ereignisses:
P (∅) = 0
• Wertebereich der Wahrscheinlichkeit:
0 ≤ P (A) ≤ 1
18
Weiterhin:
• Allgemeine Rechenregeln für Wahrscheinlichkeiten, die aus
den Kolmogorov’schen Axiomen folgen
Satz 2.6: (Rechenregeln für Wahrscheinlichkeiten)
Aus den Kolmogorov’schen Axiomen ergeben sich die folgenden
Rechenregeln für die Wahrscheinlichkeit von beliebigen Ereignissen A, B, C:
• Additionssatz für Wahrscheinlichkeiten:
P (A ∪ B) = P (A) + P (B) − P (A ∩ B)
(Wahrscheinlichkeit, dass A oder B eintritt)
19
• Additionssatz für 3 Ereignisse:
P (A ∪ B ∪ C) = P (A) + P (B) + P (C)
−P (A ∩ B) − P (B ∩ C)
−P (A ∩ C) + P (A ∩ B ∩ C)
(Wahrscheinlichkeit, dass A oder B oder C eintritt)
• Wahrscheinlichkeit des Differenzereignisses:
P (A\B) = P (A ∩ B)
= P (A) − P (A ∩ B)
20
Man beachte:
• Wenn das Ereignis B das Ereignis A impliziert (d.h.
wenn B ⊂ A gilt), dann folgt
P (A\B) = P (A) − P (B)
21
2.2 Zufallsvariable, Verteilungs- und Dichtefkt
Häufige Situation in der Praxis:
• Es interessiert weniger das konkrete Ergebnis ω ∈ Ω eines
Zufallsexperimentes, sondern eine Zahl, die von ω abhängt
Beispiele:
• Gewinn in Euro im Roulette
• Gewinn einer Aktie an der Börse
• Monatsgehalt einer zufällig ausgewählten Person
Intuitive Bedeutung einer Zufallsvariablen:
• Vorschrift, die das ’abstrakte’ ω in eine Zahl übersetzt
22
Definition 2.7: (Zufallsvariable [kurz: ZV])
Unter einer Zufallsvariablen versteht man formal eine (mathematische) Funktion
X : Ω −→ R
ω −→ X(ω).
Bemerkungen:
• Eine Zufallsvariable ordnet jedem Ergebnis ω ∈ Ω eine reelle
Zahl zu
• Intuition:
Eine Zufallsvariable X charakterisiert eine Zahl, deren Wert
man noch nicht kennt
23
• Nach der Durchführung des Zufallsexperimentes realisiert sich
die Zufallsvariable X im Wert x
• x heißt die Realisation oder Realisierung der ZV X nach
Durchführung des zugehörigen Zufallsexperimentes
• In dieser VL:
Zufallsvariablen werden immer mit Großbuchstaben, Realisationen immer mit Kleinbuchstaben bezeichnet
• Die Zufallsvariable X beschreibt die Situation ex ante, d.h. vor
der tatsächlichen Durchführung des Zufallsexperimentes
• Die Realisation x beschreibt die Situation ex post, d.h. nach
der Durchführung des Zufallsexperimentes
24
Beispiel 1:
• Betrachte den 1-maligen Münzwurf (Z=Zahl, K=Kopf). Die
ZV X bezeichne die ’Anzahl der Köpfe’ bei diesem Zufallsexperiment
• Es gilt:
Ω = {K, Z}
Die ZV X kann 2 Werte annehmen:
X(Z) = 0,
X(K) = 1
25
Beispiel 2:
• Betrachte den 3-maligen Münzwurf. Die ZV X bezeichne
erneut die ’Anzahl der Köpfe’
• Es gilt:
Ω = {(K,
K,
K)}, (K,
K,
Z)}, . . . , (Z,
Z,
Z)}}
|
{z
|
{z
|
{z
=ω1
=ω2
=ω8
Die Zufallsvariable X ist definiert durch
X(ω) = Anzahl der K in ω
• Offensichtlich:
X ordnet verschiedenen ω dieselbe Zahl zu, z.B.
X((K, K, Z)) = X((K, Z, K)) = X((Z, K, K)) = 2
26
Beispiel 3:
• Aus einer Personengruppe wird zufällig 1 Person ausgewählt.
Die ZV X soll den Erwerbsstatus der ausgewählten Person
bezeichnen
• Es gilt:
Ω = {’erwerbstätig’
{z
}, |’nicht erwerbstätig’
{z
}}
|
=ω1
=ω2
• Die ZV X kann codiert werden durch
X(ω1) = 1,
X(ω2) = 0
27
Beispiel 4:
• Das Zufallsexperiment bestehe in der Messung des morgigen
Kurses einer bestimmten Aktie. Die ZV X bezeichne diesen
Aktienkurs
• Es gilt Ω = [0, ∞), d.h. X ist definiert durch
X(ω) = ω
Zwischenfazit:
• Die ZV X kann verschiedene Werte annehmen und zwar mit
bestimmten Wskt’en
28
Frage:
• Wie kann man diese Wskt’en bestimmen und mit diesen rechnen?
Zunächst vereinfachte Schreibweise: (a, b, x ∈ R)
• P (X = a) ≡ P ({ω|X(ω) = a})
• P (a < X < b) ≡ P ({ω|a < X(ω) < b})
• P (X ≤ x) ≡ P ({ω|X(ω) ≤ x})
Lösung:
• Die Berechnung solcher Wskt’en kann über die sogenannte
Verteilungsfunktion der ZV’en X erfolgen
29
Intuition:
• Die Verteilungsfunktion der ZV’en X charakterisiert die Wahrscheinlichkeiten, mit denen sich die potenziellen Realisationen x auf der reellen Zahlenachse verteilen
(die sogenannte Verteilung der ZV’en X)
Definition 2.8: (Verteilungsfunktion [kurz: VF])
Gegeben sei die Zufallsvariable X. Unter der Verteilungsfunktion der ZV’en X (in Zeichen: FX ) versteht man die folgende
Abbildung:
FX : R −→ [0, 1]
x −→ FX (x) = P ({ω|X(ω) ≤ x}) = P (X ≤ x).
30
Beispiel:
• Betrachte den 3-fachen Münzwurf.
’Anzahl Kopf’.
Die ZV X messe die
• Zunächst gilt:
Ω = {(K,
K,
K)}, (K,
K,
Z)}, . . . , (Z,
Z,
Z)}}
|
|
|
{z
{z
{z
= ω1
= ω2
= ω8
• Für die Wskt’en der ZV X errechnet sich:
P (X = 0) = P ({(Z, Z, Z)}) = 1/8
P (X = 1) = P ({(Z, Z, K), (Z, K, Z), (K, Z, Z)}) = 3/8
P (X = 2) = P ({(Z, K, K), (K, Z, K), (K, K, Z)}) = 3/8
P (X = 3) = P ({(K, K, K)}) = 1/8
31
• Daraus ergibt sich die VF:
FX (x) =



 0.000

 0.125


0.5

 0.875





1
für x < 0
für 0 ≤ x < 1
für 1 ≤ x < 2
für 2 ≤ x < 3
für x ≥ 3
Bemerkungen:
• Es genügt (fast immer), lediglich die VF FX der ZV X zu
kennen
• Oft ist es in praxi gar nicht möglich, den Grundraum Ω oder
die explizite Abbildung X : Ω −→ R anzugeben
(jedoch kann man meistens die VF FX aus sachlogischen
Überlegungen heraus angeben)
32
Allgemeingültige Eigenschaften von FX :
• FX (x) ist monoton wachsend
• Es gilt stets:
lim FX (x) = 0
x→−∞
und
lim FX (x) = 1
x→+∞
• FX ist rechtsseitig stetig, d.h.
lim
F (z) = FX (x)
z→x X
z>x
33
Fazit:
• VF FX (x) der ZV’en X gibt Antwort auf die Frage
’Wie hoch ist die Wahrscheinlichkeit, dass X höchstens den
Wert x annimmt?’
Jetzt:
• Antwort auf die Frage
’Welchen Wert wird die ZV’e X mit einer vorgegebenen
Wahrscheinlichkeit p ∈ (0, 1) nicht überschreiten?’
−→ Quantilfunktion der ZV’en X
34
Definition 2.9: (Quantilfunktion)
Gegeben sei die ZV X mit VF FX . Für jeden reellen Wert p ∈
(0, 1) versteht man unter der Quantilfunktion von X (in Zeichen:
QX (p)) die folgende Abbildung:
QX : (0, 1) −→ R
p
−→ QX (p) = min{x|FX (x) ≥ p}.
Der Wert der Quantilfunktion xp = QX (p) heißt p − Quantil der
ZV’en X.
Bemerkungen:
• Das p-Quantil xp ist die kleinste Zahl x ∈ R mit der Eigenschaft, dass FX (x) den Wert p erreicht oder überschreitet
• Interpretiert man p ∈ (0, 1) als eine Wahrscheinlichkeit, so ist
das p-Quantil xp die kleinste Realisation der ZV’en X, die X
mit Wskt. p nicht überschreitet
35
Spezielle Quantile:
• Median: p = 0.5
• Quartile: p = 0.25, 0.5, 0.75
• Quintile: p = 0.2, 0.4, 0.6, 0.8
• Dezile: p = 0.1, 0.2, . . . , 0.9
Jetzt:
• Typisierung von ZV’en
(diskrete vs. stetige ZV’en)
36
Grund:
• Unterschiedliche mathematische Methoden zur Behandlung
von ZV’en
Bei diskreten ZV’en:
• Endliche und unendliche Summen
Bei stetigen ZV’en:
• Differential- und Integralrechnung
Bemerkungen:
• Es gibt auch ZV’en, die gleichzeitig teilweise diskret und teilweise stetig sind
• Solche ZV’en werden hier nicht behandelt
37
Definition 2.10: (Diskrete Zufallsvariable)
Die ZV X heißt diskret, wenn sie entweder
(a) nur endlich viele Realisationen x1, x2, . . . , xJ oder
(b) abzählbar unendlich viele Realisationen x1, x2, . . .
mit streng positiver Wahrscheinlichkeit annehmen kann, d.h. falls
für alle j = 1, . . . , J, . . . gilt
P (X = xj ) > 0
und
J,...
X
P (X = xj ) = 1.
j=1
38
Typische diskrete Merkmale sind:
• Zählmerkmale (’X = Anzahl von . . .’)
• Codierte qualitative Merkmale
Weitere Definitionen:
Definition 2.11: (Träger einer diskreten Zufallsvariablen)
Die Menge aller Realisationen, die eine diskrete ZV X mit streng
positiver Wskt. annehmen kann, heißt Träger von X (in Zeichen:
TX ):
TX = {x1, . . . , xJ }
bzw.
TX = {x1, x2, . . .}.
39
Definition 2.12: (Wahrscheinlichkeitsfunktion)
Für eine diskrete ZV X heißt die Funktion
fX (x) = P (X = x)
die Wahrscheinlichkeitsfunktion von X.
Bemerkungen:
• Die Wahrscheinlichkeitsfunktion fX der ZV X nimmt nur für
die Elemente des Trägers TX positive Werte an. Für Werte
außerhalb des Trägers, d.h. für x ∈
/ TX , gilt fX (x) = 0:
fX (x) =
(
P (X = xj ) > 0
0
für x = xj ∈ TX
für x ∈
/ TX
40
• Die Wahrscheinlichkeitsfkt. fX hat die Eigenschaften
fX (x) ≥ 0 für alle x
X
fX (xj ) = 1
xj ∈TX
• Für eine beliebige Menge A ⊂ R berechnet sich die Wskt. des
Ereignisses {ω|X(ω) ∈ A} = {X ∈ A} durch
P (X ∈ A) =
X
fX (xj )
xj ∈A
41
Beispiel:
• Betrachte 3-fachen Münzwurf und X = ’Anzahl Kopf’
(vgl. Folien 31, 32)
• Offensichtlich: X ist diskret mit dem Träger
TX = {0, 1, 2, 3}
• Die Wahrscheinlichkeitsfunktion ist gegeben durch
fX (x) =

 P (X = 0) = 0.125





 P (X = 1) = 0.375
P (X = 2) = 0.375

 P (X = 3) = 0.125





0
für x = 0
für x = 1
für x = 2
für x = 3
für x ∈
/ TX
42
• Die Verteilungsfunktion ist gegeben durch
FX (x) =


0.000





 0.125
0.5



 0.875



1
für x < 0
für 0 ≤ x < 1
für 1 ≤ x < 2
für 2 ≤ x < 3
für x ≥ 3
Offensichtlich:
• Für die Verteilungsfunktion gilt
FX (x) = P (X ≤ x) =
X
{xj ∈TX |xj ≤x}
=P (X=xj )
z }| {
fX (xj )
43
Fazit:
• Die VF einer diskreten ZV’en X ist eine Treppenfunktion
mit Sprüngen an den Stellen xj ∈ TX . Die Sprunghöhe an
der Stelle xj beträgt
FX (xj ) − x→x
lim F (x) = P (X = xj ) = fX (xj ),
j
x<xj
d.h. die Sprunghöhe ist der Wert der Wskt.-Funktion
(Beziehung: Verteilungs- und Wahrscheinlichkeitsfunktion)
44
Jetzt:
• Definition von stetigen Zufallsvariablen
Intuition:
• Im Gegensatz zu diskreten ZV’en können stetige ZV’e überabzählbar viele Realisationen (z.B. jede reelle Zahl in einem
Intervall) annehmen
Tatsächlich:
• Definition stetiger ZV’en komplizierter (technischer)
45
Definition 2.13: (Stetige ZV, Dichtefunktion)
Eine ZV X heißt stetig, wenn sich ihre Verteilungsfunktion FX
als Integral einer Funktion fX : R −→ [0, ∞) schreiben lässt,
d.h. wenn
FX (x) =
Z x
−∞
fX (t)dt
für alle x ∈ R.
Die Funktion fX (x) heißt Dichtefunktion [kurz: Dichte] von X.
Bemerkungen:
• Die VF FX einer stetigen ZV’en X ist (eine) Stammfunktion
der Dichtefunktion fX
• FX (x) = P (X ≤ x) ist gleich dem Flächeninhalt unter der
Dichtefunktion fX von −∞ bis zur Stelle x
46
Verteilungsfunktion FX und Dichte fX
fX(t)
P(X ≤ x) = FX(x)
x
t
47
Eigenschaften der Dichtefunktion fX :
1. Die Dichte fX ist niemals negativ, d.h.
fX (x) ≥ 0
für alle x ∈ R
2. Die Fläche unter der Dichte ist gleich 1, d.h.
Z +∞
−∞
fX (x)dx = 1
3. Wenn FX (x) differenzierbar ist, gilt
0 (x) ≡ dF (x)/dx
fX (x) = FX
X
48
Beispiel: (Gleichverteilung über [0, 10])
• Gegeben sei die ZV X mit Dichtefunktion
fX (x) =
(
0
0.1
, für x ∈
/ [0, 10]
, für x ∈ [0, 10]
• Berechnung der VF FX :
Für x < 0 gilt:
FX (x) =
Z x
−∞
fX (t) dt =
Z x
−∞
0 dt = 0
49
Für x ∈ [0, 10] gilt:
FX (x) =
Z x
=
Z 0
−∞
fX (t) dt
0 dt +
| −∞
{z
=0
}
Z x
0
0.1 dt
= [0.1 · t]x0
= 0.1 · x − 0.1 · 0
= 0.1 · x
50
Für x > 10 gilt:
FX (x) =
Z x
=
Z 0
−∞
fX (t) dt
0 dt +
{z
| −∞
=0
= 1
}
Z 10
|0
0.1 dt +
{z
=1
}
Z ∞
0 dt
| 10{z }
=0
51
Jetzt:
• Wskt.’en für Intervalle, d.h. (für a, b ∈ R, a < b)
P (X ∈ (a, b]) = P (a < X ≤ b)
• Es gilt:
P (a < X ≤ b) = P ({ω|a < X(ω) ≤ b})
= P ({ω|X(ω) > a} ∩ {ω|X(ω) ≤ b})
= 1 − P ({ω|X(ω) > a} ∩ {ω|X(ω) ≤ b})
= 1 − P ({ω|X(ω) > a} ∪ {ω|X(ω) ≤ b})
= 1 − P ({ω|X(ω) ≤ a} ∪ {ω|X(ω) > b})
52
= 1 − [P (X ≤ a) + P (X > b)]
= 1 − [FX (a) + (1 − P (X ≤ b))]
= 1 − [FX (a) + 1 − FX (b)]
= FX (b) − FX (a)
=
Z b
=
Z b
−∞
a
fX (t) dt −
Z a
−∞
fX (t) dt
fX (t) dt
53
Intervall-Wahrscheinlichkeit mit den Grenzen a und b
fX(x)
P(a < X ≤ b)
a
b
x
54
Wichtiges Ergebnis für stetige ZV X:
P (X = a) = 0
für alle a ∈ R
Begründung:
P (X = a) = lim P (a < X ≤ b) = lim
b→a
=
Z a
a
Z b
b→a a
fX (x) dx
fX (x)dx = 0
Fazit:
• Die Wskt., dass eine stetige ZV X einen einzelnen Wert annimmt, ist immer Null!!
55
Punkt-Wahrscheinlichkeit
fX(x)
a
b3
b2
b1
x
56
Vorsicht:
• Das bedeutet nicht, dass dieses Ereignis unmöglich ist
Konsequenz:
• Da bei stetigen ZV’en für alle a ∈ R stets P (X = a) = 0 gilt,
folgt für stetige ZV stets
P (a < X < b) = P (a ≤ X < b) = P (a ≤ X ≤ b)
= P (a < X ≤ b) = FX (b) − FX (a)
(Ob Intervalle offen oder geschlossen sind, spielt für die
Wskt.-Bestimmung bei stetigen ZV keine Rolle)
57
2.3 Erwartungswerte, Momente und momentenerzeugende Funktionen
Bekannt aus WRUSS:
• Der Erwartungswert einer ZV’en X ist eine Maßzahl für die
Lage der Verteilung (Lagemaß)
Definition 2.14: (Erwartungswert)
Der Erwartungswert der ZV’en X [in Zeichen: E(X)] ist definiert
als
E(X) =

X

xj · P (X = xj )




 {xj ∈TX }






Z +∞
−∞
x · fX (x) dx
, falls X diskret ist
.
, falls X stetig ist
58
Bemerkungen:
• Der Erwartungswert der ZV’en X entspricht also (in etwa)
der Summe aller möglichen Realisationen jeweils gewichtet
mit der Wskt. ihres Eintretens
• Anstelle von E(X) schreibt man häufig µX
• Es gibt ZV’en, die keinen Erwartungswert besitzen
(vgl. Übung)
59
Beispiel 1: (Diskrete ZV)
• Man betrachte den 2-maligen Würfelwurf. Die ZV X stehe
für die (betragliche) Differenz der Augenzahlen. Man berechne den Erwartungswert von X
• Zunächst ergibt sich als Träger der Zufallsvariablen
TX = {0, 1, 2, 3, 4, 5}
60
• Die Wahrscheinlichkeitsfunktion ist gegeben durch
fX (x) =


 P (X = 0) = 6/36



P (X = 1) = 10/36



 P (X = 2) = 8/36


P (X = 3) = 6/36


 P (X = 4) = 4/36





P (X = 5) = 2/36



0
für x = 0
für x = 1
für x = 2
für x = 3
für x = 4
für x = 5
/ TX
für x ∈
• Als Erwartungswert ergibt sich
6
10
8
6
4
2
E(X) = 0 ·
+1·
+2·
+3·
+4·
+5·
36
36
36
36
36
36
=
70
= 1.9444
36
61
Beispiel 2: (Stetige ZV)
• Es sei X eine stetige ZV mit der Dichte

 x
, für 1 ≤ x ≤ 3
fX (x) =
4
 0
, sonst
• Zur Berechnung des Erwartungswertes spaltet man das Integral auf:
E(X) =
=
Z +∞
−∞
Z 1
x · fX (x) dx
Z 3
Z
+∞
x
0 dx +
0 dx
x · dx +
4
−∞
3
1
62
=
•
”
1 1 3 3
dx =
·
·x
4 3
1 4
1
Z 3 2
x
’
1
27 1
=
·
−
4
3
3
“
26
= 2.1667
=
12
Häufige Situation:
• Kenne ZV X mit Wskt.- oder Dichtefunktion fX
• Suche den Erwartungswert der transformierten ZV
Y = g(X)
63
Satz 2.15: (Erwartungswert einer Transformierten)
Gegeben sei die ZV X mit Wskt.- oder Dichtefunktion fX . Für
eine beliebige (Baire)Funktion g : R −→ R berechnet sich der
Erwartungswert der transformierten ZV Y = g(X) als
E(Y ) = E[g(X)]
=

X

g(xj ) · P (X = xj )




 {xj ∈TX }






Z +∞
−∞
g(x) · fX (x) dx
, falls X diskret ist
.
, falls X stetig ist
64
Bemerkungen:
• Alle Funktionen, die in unserer Veranstaltung auftauchen,
sind Baire-Funktionen
• Für den Spezialfall g(x) = x (die Identitätsfunktion) fällt der
Satz 2.15 mit der Definition 2.14 zusammen
Zunächst:
• Erste wichtige Rechenregeln für Erwartungswerte
65
Satz 2.16: (Regeln für E-Werte)
Es seien X eine beliebige ZV (diskret oder stetig), c, c1, c2 ∈ R
konstante Zahlen und g, g1, g2 : R −→ R Funktionen. Dann gelten
die folgenden Aussagen:
1. E(c) = c.
2. E[c · g(X)] = c · E[g(X)].
3. E[c1 · g1(X) + c2 · g2(X)] = c1 · E[g1(X)] + c2 · E[g2(X)].
4. Falls g1(x) ≤ g2(x) für alle x ∈ R gilt, so folgt:
E[g1(X)] ≤ E[g2(X)].
Beweis: Übungsaufgabe
66
Jetzt:
• Betrachte die ZV X (diskret oder stetig) und die explizite
Funktion g(x) = [x − E(X)]2
−→ Varianz und Standardabweichung der ZV’en X
Definition 2.17: (Varianz, Standardabweichung)
Für eine beliebige stetige oder diskrete ZV X ist die Varianz
von X [in Zeichen: Var(X)] definiert als die erwartete quadrierte
Abweichung der ZV von ihrem Erwartungswert E(X), d.h.
Var(X) = E[(X − E(X))2].
Unter der Standardabweichung von X [in Zeichen: SD(X)] versteht man die (positive) Wurzel aus der Varianz, d.h.
q
SD(X) = + Var(X).
67
Bemerkungen:
• Mit g(X) = [X − E(X)]2 und Satz 2.15 (Folie 64) berechnet
sich die Varianz von X explizit als
Var(X) = E[g(X)]
=

X


[xj − E(X)]2 · P (X = xj )



 {xj ∈TX }






Z +∞
−∞
[x − E(X)]2 · fX (x) dx
, für diskretes X
, für stetiges X
• Es gibt ZV’en, die keine endliche Varianz besitzen
(vgl. Übung)
68
Beispiel: (Diskrete ZV)
• Betrachte erneut den 2-maligen Würfelwurf mit der ZV X
als (betraglicher) Differenz der Augenzahlen (vgl. Beispiel 1,
Folie 35). Für die Varianz gilt:
Var(X) = (0 − 70/36)2 · 6/36 + (1 − 70/36)2 · 10/36
+ (2 − 70/36)2 · 8/36 + (3 − 70/36)2 · 6/36
+ (4 − 70/36)2 · 4/36 + (5 − 70/36)2 · 2/36
= 2.05247
Man beachte:
• Die Varianz ist per definitionem ein Erwartungswert
−→ Rechenregeln für Erwartungswerte anwendbar
69
Satz 2.18: (Rechenregeln für Varianzen)
Es seien X eine beliebige ZV (diskret oder stetig) sowie a, b ∈ R
reelle Zahlen. Es gilt
1. Var(X) = E(X 2) − [E(X)]2.
2. Var(a + b · X) = b2 · Var(X).
Beweis: Übungsaufgabe
Jetzt:
• Zwei wichtige Ungleichungen im Zusammenhang mit Erwartungswerten und transformierten ZV’en
70
Satz 2.19: (Allgemeine Chebyshey-Ungleichung)
Es seien X eine beliebige ZV sowie g : R −→ R+ eine nichtnegative Funktion. Dann gilt für jedes k > 0
E [g(X)]
P [g(X) ≥ k] ≤
.
k
Jetzt Spezialfall:
• Betrachte
g(x) = [x − E(X)]2
und
k = r2 · Var(X)
• Hierfür liefert der Satz 2.19
n
2
P [X − E(X)]
≥ r2 · Var(X)
o
(r > 0)
Var(X)
1
≤ 2
= 2
r · Var(X)
r
71
• Nun gilt
n
P [X − E(X)]
2
≥ r2 · Var(X)
o
= P {|X − E(X)| ≥ r · SD(X)}
= 1 − P {|X − E(X)| < r · SD(X)}
• Daraus folgt
1
P {|X − E(X)| < r · SD(X)} ≥ 1 − 2
r
(spezielle Chebyshev-Ungleichung)
72
Bemerkung:
• Die spezielle Chebyshev-Ungleichung gibt die Mindestwahrscheinlichkeit an, mit der eine beliebige ZV in das folgende
(offene oder geschlossene) Intervall fällt:
[E(X) − r · SD(X), E(X) + r · SD(X)]
• Z.B. gilt für r = 3:
8
1
P {|X − E(X)| < 3 · SD(X)} ≥ 1 − 2 =
3
9
was äquivalent ist zu
P {E(X) − 3 · SD(X) < X < E(X) + 3 · SD(X)} ≥ 0.8889
bzw.
P {X ∈ (E(X) − 3 · SD(X), E(X) + 3 · SD(X))} ≥ 0.8889
73
Satz 2.20: (Jensen-Ungleichung)
Es seien X eine beliebige ZV sowie g : R −→ R eine konvexe
(bzw. eine konkave) Funktion, d.h. für alle x gelte g 00(x) ≥ 0
(bzw. g 00(x) ≤ 0). Dann folgt
E [g(X)] ≥ g(E[X]) bzw. E [g(X)] ≤ g(E[X]).
Bemerkung:
• Es ist wichtig zu beachten, dass im Allgemeinen
E [g(X)] 6= g(E[X])
74
Beispiel:
• Betrachte die ZV X und die Funktion g(x) = x2
• Es gilt: g 00(x) = 2 ≥ 0 für alle x, d.h. g ist konvex
• Mit der Jensen-Ungleichung folgt
E
E[X])
[g(X)] ≥ g(
| {z }
| {z }
=E(X 2)
d.h.
=[E(X)]2
E(X 2) − [E(X)]2 ≥ 0
• Mit dem Satz 2.18 folgt also
Var(X) = E(X 2) − [E(X)]2 ≥ 0
(die Varianz einer ZV’en kann niemals negativ sein)
75
Jetzt:
• Betrachte die beliebige ZV X mit E-Wert E(X) = µX , eine
natürliche Zahl n ∈ N sowie die Funktionen
g1(x) = xn
g2(x) = [x − µX ]n
Definition 2.21: (Momente, zentrale Momente)
0 ) ist definiert
(a) Das n-te Moment der ZV’en X (in Zeichen: µn
als
µ0n ≡ E[g1(X)] = E(X n).
(b) Das n-te zentrale Moment um den Erwartungswert (in Zeichen: µn) ist definiert als
µn ≡ E[g2(X)] = E[(X − µX )n].
76
Beziehungen:
• µ01 = E(X) = µX
(das 1. Moment entspricht dem E-Wert)
• µ1 = E[X − µX ] = E(X) − µX = 0
(das 1. zentrale Moment ist immer 0)
• µ2 = E[(X − µX )2] = Var(X)
(das 2. zentrale Moment entspricht der Varianz)
77
Bemerkungen:
• Speziell die ersten 4 Momente einer ZV’en X sind Bausteine
für wichtige Kenngrößen der Verteilung
(Erwartungswert, Varianz, Schiefe, Kurtosis)
• Die Momente einer ZV’en X spielen eine zentrale Rolle in
der theoretischen und angewandten Statistik
• In einigen Fällen kann aus der Kenntnis aller Momente der
ZV’en X die vollständige Verteilung (d.h. die Wahrscheinlichkeits- bzw. die Dichtefunktion) hergeleitet werden
78
Frage:
• Gibt es eine mathematische Funktion, die eine Darstellung
aller Momente einer Verteilung liefert ?
Definition 2.22: (Momentenerzeugende Funktion)
Es sei X eine ZV mit Wskts- bzw. Dichtefunktion fX (x).h Für
i
t·X
eine reelle Zahl t ∈ R betrachte man den Erwartungswert E e
.
Falls dieser E-Wert für alle t aus einem Intervall −h < t < h, h > 0,
existiert, so definiert man die momentenerzeugende Funktion von
X (in Zeichen: mX (t)) als diesen E-Wert, d.h.
mX (t) = E
h
i
t·X
.
e
79
Bemerkungen:
• Die momentenerzeugende Funktion mX (t) wird als Funktion
in t aufgefasst
• Es gibt ZV’en X, für die mX (t) nicht existiert
• Falls mX (t) existiert, so berechnet sich die Funktion aufgrund
des Satzes 2.15 (Folie 64) als
mX (t) = E
=
h
et·X
i

X

et·xj · P (X = xj )




 {xj ∈TX }






Z +∞
−∞
et·x · fX (x) dx
, falls X diskret
, falls X stetig
80
Frage:
• Warum heißt mX (t) momentenerzeugende Funktion ?
Antwort:
• Man betrachte die n-te Ableitung von mX (t) nach t:

X

(xj )n · et·xj · P (X = xj )




 {xj ∈TX }
dn
mX (t) =
n

dt





Z +∞
−∞
xn · et·x · fX (x) dx
, falls X diskret
, falls X stetig
81
• Für die n-te Ableitung an der Stelle t = 0 gilt

X

(xj )n · P (X = xj )



 {x ∈T }

j
X
dn
mX (0) =
n

dt





Z +∞
−∞
xn · fX (x) dx
, falls X diskret
, falls X stetig
= E(X n) = µ0n
(vgl. Definition 2.21(a), Folie 76)
82
Beispiel:
• Es sei X eine stetige ZV mit Dichtefunktion
fX (x) =
(
0
λ · e−λ·x
, falls x < 0
, falls x ≥ 0
(Exponentialverteilung mit Parameter λ > 0)
• Es gilt
h
i
mX (t) = E et·X =
=
für t < λ
Z +∞
0
Z +∞
−∞
et·x · fX (x) dx
λ · e(t−λ)·x dx =
λ
λ−t
83
• Es folgt
m0X (t) =
und somit
λ
(λ − t)2
m0X (0) = E(X) =
1
λ
sowie
sowie
m00X (t) =
2λ
(λ − t)3
2
m00X (0) = E(X 2) = 2
λ
Jetzt:
• Zentrales Resultat über momentenerzeugende Funktionen
84
Satz 2.23: (Identifikationseigenschaft)
Es seien X und Y zwei ZV’en mit Wskts- bzw. Dichtefunktionen fX (·) und fY (·). Angenommen, die beiden momentenerzeugenden Funktionen mX (t) und mY (t) existieren und es gilt
mX (t) = mY (t) für alle t im Intervall −h < t < h, h > 0. Dann
haben die beiden ZV’en identische Verteilungsfunktionen, d.h. es
gilt FX (x) = FY (x) für alle x.
Bemerkung:
• Der Satz 2.23 besagt, dass zu einer gegebenen momentenerzeugenden Funktion mX (t) eine eindeutige Verteilungsfunktion FX (x) gehört
−→ Wenn mX (t) für die ZV X bekannt ist, dann kann man
(zumindest theoretisch) die Verteilung von X bestimmen
• Diese Eigenschaft werden wir in Kapitel 4 benutzen
85
Beispiel:
• Angenommen, die ZV X hat die momentenerzeugende Funktion
1
mX (t) =
für − 1 < t < 1
1−t
• Dann muss die Dichtefunktion von X gegeben sein durch
fX (x) =
(
0
e−x
, falls x < 0
, falls x ≥ 0
(Exponentialverteilung mit Parameter λ = 1)
86
2.4 Spezielle Verteilungen
Bisher:
• Analyse allgemeiner mathematischer Eigenschaften beliebiger
Verteilungen
• Unterscheidung zwischen diskreten und stetigen Verteilungen
• Betrachtung
der Verteilungsfunktion FX (x)
der Wskt- bzw. Dichtefunktion fX (x)
von Erwartungswerten E[g(X)]
der momentenerzeugenden Funktion mX (t)
87
Zentrale Erkenntnis:
• Die Verteilung einer ZV’en X ist (im wesentlichen) durch
fX (x) oder FX (x) bestimmt
• Mit fX (x) lässt sich FX (x) bestimmen
(vgl. Folie 46)
• Aus FX (x) lässt sich (im wesentlichen) fX (x) bestimmen
(vgl. Folie 48)
Frage:
• Wieviele verschiedene Verteilungen gibt es?
88
Antwort:
• Unendlich viele
Jedoch:
• In der Praxis haben sich einige wichtige parametrische Verteilungsfamilien als ’gute’ Modelle für real auftretende Zufallsereignisse herauskristallisiert
• Diese Verteilungsfamilien werden in allen Statistik-Lehrbüchern ausführlich beschrieben
(z.B. in Mosler & Schmid (2008), Mood et al. (1974))
89
• Zentrale diskrete Verteilungsfamilien
Bernoulli-Verteilung
Binomial-Verteilung
Geometrische Verteilung
Poisson-Verteilung
• Zentrale stetige Verteilungsfamilien
Gleichverteilung
Exponentialverteilung
Normalverteilung
90
Bemerkung:
• Die wichtigste parametrische Verteilungsfamilie überhaupt ist
die Normalverteilung
Definition 2.24: (Normalverteilung)
Die stetige ZV X heißt normalverteilt mit Parametern µ ∈ R
und σ 2 > 0 [in Zeichen: X ∼ N (µ, σ 2)], falls X die folgende
Dichtefunktion besitzt:
fX (x) = √

‘
x−µ 2
1
−2 σ
1
·e
2π · σ
,
x ∈ R.
91
Dichtefunktionen der Normalverteilung
fX(x)
N(5,1)
N(0,1)
N(5,3)
N(5,5)
0
5
x
92
Bemerkungen:
• Die Normalverteilung N (0, 1) heißt Standardnormalverteilung.
Ihre Dichte wird oft mit ϕ(x) bezeichnet
• Die Kenntnis aller Eigenschaften sowie das Rechnen mit normalverteilten ZV’en ist zwingende Voraussetzung für diese
Veranstaltung
(vgl. Wilfling (2011), Kapitel 3.4)
93
Herunterladen