Funktionen von Zufallsvariablen

Werbung
WR 1
W. Merz
Kapitel 11
Funktionen von Zufallsvariablen
Vorlesung Wahrscheinlichkeitsrechnung I vom 3/4. Juni 2009
W. Merz
Lehrstuhl für Angewandte Mathematik 1
FAU
11.1
WR 1
Marginalverteilungen
W. Merz
Definition
Die Verteilung P Xk der k -ten Komponente eines Zufallsvektors
X = (X1 , X2 , . . . , Xn ) heißt die k -te Marginalverteilung oder k -te
Randverteilung von P X .
Mit der Funktion Zk (x1 , x2 , . . . , xn ) = xk lässt sich die k -te
Komponente als Komposition Xk = Zk ◦ X darstellen.
X
(Ω, A, P)
-
(Rn , Bn , P X )
HH
HH
Xk = Zk ◦ X
H
HH
Zk
H
HH
j
H
?
(R, B, P Zk )
P Xk (B) = P Zk (B) = P X (Zk ∈ B) =
R
1(Zk ∈B) (x)f (x)dx
11.2
Marginalverteilungen
Fall n = 3 und k = 2 mit x = (x1 , x2 , x3 ):
WR 1
W. Merz
(Z2 ∈ B) = {x = (x1 , x2 , x3 ) ; x2 ∈ B} = R × B × R
Wegen x ∈ (Z2 ∈ B) ⇔ x2 ∈ B ist 1(Z2 ∈B) (x) = 1B (x2 )
Satz von Fubini:
Z
1(Z2 ∈B) (x1 , x2 , x3 )f (x1 , x2 , x3 )d(x1 , x2 , x3 )
Z
=
1B (x2 )
f (x1 , x2 , x3 )d(x1 , x3 ) dx2
2
R
ZR Z
Z
=
1B (x2 )
f (x1 , x2 , x3 )dx1 dx3 dx2
R R
Z R
=:
1B (x2 )f2 (x2 )dx2
R3
Z
R
11.3
WR 1
Marginalverteilungen
W. Merz
Mit der Funktion
Z Z
f2 (x2 ) =
f (x1 , x2 , x3 ) dx1 dx3
R
R
gilt also
Xk
P (B) =
Z
1B (x2 )f2 (x2 )dx2
d.h. also, f2 (x2 ) ist Dichte der Verteilung P Xk .
11.4
Marginalverteilungen
WR 1
W. Merz
Theorem
Besitzt der n-dimensionale Zufallsvektor X eine absolutstetige
Verteilung mit der Dichte f (x1 , x2 , . . . , xn ), so besitzt die k -te
Marginalverteilung die Dichte
Z
Z
fk (xk ) =
...
f (x1 , x2 , . . . , xn )dx1 . . . dxk −1 dxk +1 . . . dxn
R
R
| {z }
(n−1)-mal
Bezeichnung
fk (xk ) heißt die k -te Marginaldichte oder k -te Randdichte von f .
11.5
WR 1
Marginalverteilungen
W. Merz
Exercise
f (x1 , x2 ) =
e−x2
0
falls x1 > 0 und x2 > x1
sonst
x2
6
e−x2
- x1
11.6
WR 1
1. Marginaldichte
W. Merz
f1 (x1 ) =
R
f (x1 , x2 )dx2
x2
6
e−x2
x1
x1 ≤ 0
⇒
f (x1 , x2 ) = 0
⇒ f1 (x1 ) = 0
x1 > 0 , x2 ≤ x1 ⇒ f (x1 , x2 ) = 0
R∞
R∞
f1 (x1 ) = x1 f (x1 , x2 )dx2 = x1 e−x2 dx2 = e−x1
11.7
WR 1
2. Marginaldichte
W. Merz
f2 (x2 ) =
R
f (x1 , x2 )dx1
6
e−x2
x2
- x1
x2 ≤ 0
⇒
f (x1 , x2 ) = 0
⇒ f2 (x2 ) = 0
x2 > 0 , x1 ≥ x2 oder x1 ≤ 0 ⇒ f (x1 , x2 ) = 0
Rx
Rx
f2 (x2 ) = 0 2 f (x1 , x2 )dx1 = 0 2 e−x2 dx1 = x2 e−x2
11.8
Stochastische Unabhängigkeit
WR 1
W. Merz
Definition
Zufallsvariable X1 , X2 , . . . , Xn auf einem Wahrscheinlichkeitsraum (Ω, A, P) heißen stochastisch unabhängig, wenn für
beliebige Borelsche Mengen B1 , B2 , . . . , Bn aus R gilt
P (X1 ∈ B1 ) ∩ (X2 ∈ B2 ) ∩ . . . ∩ (Xn ∈ Bn )
= P(X1 ∈ B1 ) · P(X2 ∈ B2 ) · . . . · P(Xn ∈ Bn )
Theorem
Sei X = (X1 , X2 , . . . , Xn ) ein Zufallsvektor, dessen Verteilung
P X die Dichte f besitzt. Dann gilt:
Die Komponenten X1 , X2 , . . . , Xn sind genau dann stochastisch
unabhängig, wenn es Dichten fk : R −→ R gibt, so dass für fast
alle Vektoren x = (x1 , x2 , . . . , xn ) ∈ Rn gilt
f (x1 , x2 , . . . , xn ) = f1 (x1 )f2 (x2 ) · · · fn (xn )
Die fk sind dabei die Marginaldichten von f .
11.9
WR 1
Stochastische Unabhängigkeit
W. Merz
Die Dichte sei von der Form f (x1 , x2 , x3 ) = g1 (x1 )g2 (x2 )g3 (x3 )
mit (eindimensionalen) Dichten gk (xk ).
Dann sind die gk (xk ) bereits die Marginaldichten:
Beispiel k = 2:
Z Z
f2 (x2 ) =
g1 (x1 )g2 (x2 )g3 (x3 ) dx1 dx3
R R
Z
Z
= g2 (x2 ) g1 (x1 )dx1 g3 (x3 )dx3
} | R {z
}
| R {z
=1
=1
= g2 (x2 )
11.10
WR 1
Sprachgebrauch
W. Merz
Die Formulierung „Die Zufallsvariablen X1 und X2 sind
stochastisch unabhängig.
X1 ist N (0, 1)-verteilt und X2 exponentiell verteilt mit Parameter
2“ heißt:
Der Zufallsvektor X = (X1 , X2 ) besitzt die Verteilung P X mit
den folgenden Eigenschaften:
1. Die 1. Marginalverteilung P X1 ist die N (0, 1)-Verteilung mit
der Dichte
f1 (x1 ) =
2
√1 e −(1/2)x1
2π
2. Die 2. Marginalverteilung P X2 ist die Exponentialverteilung
mit dem Parameter λ = 2 und der Dichte
f2 (x2 ) = 2e−2x2 für x2 > 0 und f2 (x2 ) = 0 für x2 ≤ 0
3. P X besitzt die Dichte f (x1 , x2 ) = f1 (x1 )f2 (x2 )
11.11
Stochastische Unabhängigkeit
WR 1
W. Merz
X1 und X2 seien stochastisch unabhängige Zufallsvariable.
Sind dann auch
p
Y1 = X12 und Y2 = X2
stochastisch unabhängig?
Y1 (ω) = G1 (X1 (ω)) und Y2 (ω) = G2 (X2 (ω))
√
mit G1 (x) = x 2 und G2 (y ) = y .
Theorem
Sind X1 und X2 stochastisch unabhängige Zufallsvariable und
sind Gi : R −→ R für i = 1, 2 B-B-messbare Funktionen, so
sind die Zufallsvariablen Y1 = G1 ◦ X1 und Y2 = G2 ◦ X2
ebenfalls stochastisch unabhängig.
11.12
WR 1
Stochastische Unabhängigkeit
W. Merz
Beweis.
Sind B1 und B2 Borelsch, dann auch die Mengen
Ai = (Gi ∈ Bi ).
Wie beim Kompositionssatz ist
(Yi ∈ Bi ) = (Xi ∈ Ai ) = (Xi ∈ (Gi ∈ Bi )).
P[(Y1 ∈ B1 ) ∩ (Y2 ∈ B2 )]
= P[(X1 ∈ A1 ) ∩ (X2 ∈ A2 )]
= P(X1 ∈ A1 ) · P(X2 ∈ A2 )
= P(Y1 ∈ B1 ) · P(Y2 ∈ B2 )
11.13
WR 1
Der Transformationssatz für Dichten
W. Merz
Beispiel für die Problemstellung:
X1 und X2 seien stochastisch unabhängige und mit Parameter
λ exponentiell verteilte Zufallsvariable. Welche Verteilung
besitzt der Zufallsvektor Y = (Y1 , Y2 ) mit Y1 = X1 + X2 und
Y2 = X1 /X2 ?
Y1 (ω) = G1 (X1 (ω), X2 (ω)) mit G1 (x1 , x2 ) = x1 + x2
Y2 (ω) = G2 (X1 (ω), X2 (ω)) mit G2 (x1 , x2 ) = x1 /x2
X
(Ω, A, P)
-
(R2 , B2 , P X )
H
HH
H
Y =G◦X
H
HH
G
H
HH
j
H
?
(R , B2 , P )
2
11.14
Der Transformationssatz für Dichten
WR 1
W. Merz
Nach dem Kompositionssatz muss die Verteilung P G in dem
Schema
G
(R2 , B2 , P X ) −→ (R2 , B2 , P G )
bestimmt werden, wobei G : R2 −→ R2 die durch
G:
y1
y2
= x1 + x2
= x1 /x2
definierte Abbildung ist.
11.15
WR 1
Der Transformationssatz für Dichten
W. Merz
Die Verteilung P X besitzt die Dichte f (x1 , x2 ) = f1 (x1 )f2 (x2 ),
wobei die Marginaldichten die der Exponentialverteilung mit
Parameter λ sind:
λe−λt für t > 0
fi (t) =
0
für t ≤ 0
Dichte von P X :
f (x1 , x2 ) =
λ2 e−λ(x1 +x2 )
0
falls x1 > 0
sonst
und x2 > 0
11.16
WR 1
Allgemeine Problemstellung
W. Merz
Berechnung der Verteilung eines Zufallsvektors Y = G ◦ X
bzw. die Berechnung der Verteilung des Zufallsvektors G in
dem Schema
G
(Rn , Bn , P X ) −→ (Rn , Bn , P G )
(Gleiche Dimension auf beiden Seiten: m = n)
Als bekannt werden dabei vorausgesetzt:
1. Die Dichte f (x) = f (x1 , x2 , . . . , xn ) der Verteilung P X
2. Die Abbildung G : Rn −→ Rn :
y1
y2
yn
= G1 (x1 , x2 , . . . , xn )
= G2 (x1 , x2 , . . . , xn )
..
.
= Gn (x1 , x2 , . . . , xn )
11.17
WR 1
Lösungsweg
W. Merz
Die Verteilung P G ist definiert durch
P G (B) = P X (G ∈ B) =
R
1(G∈B) (x)f (x)dx
Falls die Verteilung P G eine Dichte g(y ) besitzt, ist
P G (B) =
R
1B (y )g(y )dy
Es wird also eine Funktion g(y ) gesucht, die für beliebige
n-dimensionale Borelsche Mengen B die Gleichung
R
1B (y )g(y )dy =
R
1(G∈B) (x)f (x)dx
R
f (x)dx
oder
R
B
g(y )dy =
(G∈B)
erfüllt.
11.18
WR 1
Der Parametrisierungssatz
W. Merz
In der Analysis hat man es meist mit der umgekehrten
Situation zu tun: Die Funktion g(y ) ist bekannt und soll auf
einer Menge B integriert werden.
Dazu sucht man eine Parametrisierung G : IB −→ B der Menge
B. Insbesondere ist IB = (G ∈ B).
Der Parametrisierungssatz besagt, dass unter bestimmten
Voraussetzungen
Z
Z
g(y )dy =
f (x)dx
B
IB
mit der Funktion
f (x) = g(G(x))|JG (x)|
wobei JG (x) die Jacobische oder Funktionaldeterminante der
Abbildung G ist.
11.19
WR 1
Der Parametrisierungssatz
JG (x) ist die Funktionaldeterminante von G:
 ∂G
∂G1
∂G1
1
∂x (x)
∂x2 (x) . . .
∂xn (x)
 ∂G12
∂G2
∂G2
 ∂x1 (x) ∂x2 (x) . . . ∂xn (x)
JG (x) = det 
..
..
..
..

.

.
.
.
∂Gn
∂Gn
∂Gn
∂x1 (x)
∂x2 (x) . . .
∂xn (x)
W. Merz






11.20
WR 1
Der Transformationssatz
W. Merz
In unserer Situation ist die Dichte f (x) bekannt, gesucht wird
g(y ).
Wenn immer die Funktionen f und g in der Relation
f (x) = g(G(x))|JG (x)|
zueinander stehen, gilt nach dem Parametrisierungssatz
Z
Z
g(y )dy =
f (x)dx
B
(G∈B)
Um g zu bestimmen, muss man also nur die obige Gleichung
nach g auflösen.
11.21
Der Transformationssatz
WR 1
W. Merz
Auflösen der Gleichung f (x) = g(G(x))|JG (x)| nach g(y ).
1. Schritt:
g(G(x)) = f (x) |JG1(x)|
2. Schritt: Wir setzen y := G(x), d.h.
y1
y2
yn
= G1 (x1 , x2 , . . . , xn )
= G2 (x1 , x2 , . . . , xn )
..
.
= Gn (x1 , x2 , . . . , xn )
Dann muss auf der rechten Seite der Vektor x als Funktion von
y dargestellt werden: x = x(y ) = G∗ (y ).
D.h. man muss das Gleichungssystem nach den Variablen xk
auflösen.
11.22
Der Transformationssatz
WR 1
W. Merz
Eine Parametrisierung ist eine bijektive Abbildung von (G ∈ B)
auf B, also geht das:
x1
x2
xn
= G1∗ (y1 , y2 , . . . , yn )
= G2∗ (y1 , y2 , . . . , yn )
..
.
= Gn∗ (y1 , y2 , . . . , yn )
Kurz: x = G∗ (y )
Bezeichnung
Die Abbildung G∗ : B −→ (G ∈ B) heißt die Umkehrabbildung
zu G.
11.23
WR 1
Der Transformationssatz
W. Merz
Ergebnis:
g(y ) = f (G∗ (y ))
1
|JG (G∗ (y ))|
Jetzt müssen nur noch die Voraussetzungen präzisiert werden,
unter denen diese Formel gültig ist.
11.24
Der Transformationssatz
WR 1
W. Merz
Theorem
Es gebe eine offene zusammenhängende Menge M ⊂ Rn so,
dass für die Dichte f (x) der Verteilung P X und den
Zufallsvektor G : Rn −→ Rn die nachstehenden Bedingungen
erfüllt sind:
• Für x ∈
/ M ist f (x) = 0
• Die Komponenten Gj (x) von G sind auf M stetig partiell
differenzierbar und es ist JG (x) 6= 0 für alle x ∈ M.
• Ist M ∗ = G(M) = {y ∈ Rn ; y = G(x) mit x ∈ M} das Bild
der Menge M unter G, so ist die Abbildung G : M −→ M ∗
bijektiv mit der Umkehrabbildung G∗ : M ∗ −→ M.
Dann besitzt die Verteilung P G des Zufallsvektors G die Dichte
f (G∗ (y )) |JG (G1∗ (y ))| falls y ∈ M ∗
g(y ) =
0
sonst
11.25
Der Transformationssatz
WR 1
W. Merz
Exercise
X1 und X2 seien stochastisch unabhängige und mit Parameter
λ exponentiell verteilte Zufallsvariable. Welche Verteilung
besitzt der Zufallsvektor Y = (Y1 , Y2 ) mit Y1 = X1 + X2 und
Y2 = X1 /X2 ?
1. Verteilung P X : Die Dichte ist von der Form
f (x1 , x2 ) = f1 (x1 )f2 (x2 ), wobei die Marginaldichten die der
Exponentialverteilung mit Parameter λ sind.
2 −λ(x +x )
1
2
λ e
falls x1 > 0 und x2 > 0
f (x1 , x2 ) =
0
sonst
2. Die Menge
M = {(x1 , x2 ) ; f (x1 , x2 ) > 0} = {(x1 , x2 ) ; x1 > 0, x2 > 0}
ist offen und zusammenhängend.
11.26
WR 1
Beispiel
W. Merz
3. Dem Zufallsvektor Y entspricht die Abbildung G mit
y1 = G1 (x1 , x2 )
y2 = G2 (x1 , x2 )
= x1 + x2
x1
=
x2
G ist auf der Menge M wohldefiniert und differenzierbar.
4. Die Funktionaldeterminante ist
1
1
JG (x) = 1 − x1
x2
x22
x1 + x2
=−
x22
Für x ∈ M ist JG (x) 6= 0.
11.27
WR 1
Beispiel
W. Merz
5. Umkehrabbildung G∗ :
y2 = x1 /x2 ⇒ x1 = x2 y2
Einsetzen in y1 = x1 + x2 ergibt y1 = x2 (1 + y2 ) und damit
x1
=
x2
=
y1 y2
1 + y2
y1
1 + y2
6. Bildmenge M ∗ ist offensichtlich
M ∗ = {(y1 , y2 ) ∈ R2 ; y1 > 0, y2 > 0} = M
11.28
WR 1
Beispiel
W. Merz
7. Einsetzen von G∗ (y ) für x. Für y ∈ M ∗ ist G∗ (y ) ∈ M.
Mit x1 + x2 = y1 und x22 = y12 /(1 + y2 )2 erhält man
f (x) = λ2 e−λ(x1 +x2 )
⇒
f (G∗ (y )) = λ2 e−λy1
und
JG (x) = −
x1 + x2
x22
⇒
JG (G∗ (y )) = −
(1 + y2 )2
y1
8. Dichte des Zufallsvektors G bzw. Y
g(y1 , y2 )
1
= f (G∗ (y ))
|JG (G∗ (y ))|

1
 y1 λ2 e−λy1 (1+y2 )2 falls y1 > 0
=
und y2 > 0

0
sonst
11.29
WR 1
Beispiel
W. Merz
9. Es ist g(y1 , y2 ) = g1 (y1 )g2 (y2 ) mit den Dichten
y1 λ2 e−λy1 falls y1 > 0
g1 (y1 ) =
0
sonst
und
g2 (y2 ) =
1
(1+y2 )2
0
falls y2 > 0
sonst
d.h. die Zufallsvariablen Y1 und Y2 sind stochastisch
unabhängig.
11.30
Verteilung von Zufallsvariablen
WR 1
W. Merz
Exercise
X1 und X2 seien stochastisch unabhängige und im Intervall
(0, 1) uniform verteilte Zufallsvariable. Welche Verteilung
besitzt dann die Zufallsvariable Y = X1 X2 ?
Es ist Y = G1 (X1 , X2 ) mit G1 (x1 , x2 ) = x1 x2 ,
d.h. man muss die Verteilung einer Abbildung G1 : R2 −→ R1
berechnen.
Auf diese Situation ist der Transformationssatz für Dichten nicht
direkt anwendbar, da eine solche Funktion nicht umkehrbar
eindeutig auf einer offenen Menge M ⊂ R2 sein kann.
11.31
Vorgehensweise
WR 1
W. Merz
(X1 , X2 ) - (R2 , B , P X )
(Ω, A, P)
2
HH
H
H
G1
Y = G1 (X1 , X2 ) HH
HH
j ?
(R, B, P G1 )
Auf G1 : R2 −→ R kann der Transformationssatz nicht
angewandt werden.
11.32
WR 1
Vorgehensweise
(X1 , X2 ) - (R2 , B , P X )
(Ω, A, P)
2
HH
H
H
G1
Y = G1 (X1 , X2 ) HH
HH
j ?
(R, B, P G1 )
W. Merz
(G1 , G2 ) - (R2 , B , P G )
2
Auf G1 : R2 −→ R kann der Transformationssatz nicht
angewandt werden.
Erweitere G1 zu einem Zufallsvektor G = (G1 , G2 ) und
berechne P G
11.32
Vorgehensweise
WR 1
W. Merz
(X1 , X2 ) - (R2 , B , P X )
(G1 , G2 ) - (R2 , B , P G )
(Ω, A, P)
2
2
HH
H
H
G1
Y = G1 (X1 , X2 ) HH
Z1
HH
j ?
G1
(R, B, P )
Auf G1 : R2 −→ R kann der Transformationssatz nicht
angewandt werden.
Erweitere G1 zu einem Zufallsvektor G = (G1 , G2 ) und
berechne P G
Berechne die erste Marginalverteilung P G1
11.32
Vorgehensweise
• Ergänze die Funktion y1 = G1 (x1 , x2 ) durch eine passende
zweite Funktion y2 = G2 (x1 , x2 ) zu einer Abbildung
G = (G1 , G2 ), die die Voraussetzungen des
Transformationssatzes erfüllt.
• Berechne die Dichte g(y1 , y2 ) von P G .
• Berechne die erste Marginaldichte
Z
g1 (y1 ) = g(y1 , y2 )dy2
WR 1
W. Merz
11.33
WR 1
Fortsetzung des Beispiels
W. Merz
Wegen der Unabhängigkeit der beiden Variablen X1 und X2
besitzt P X die Dichte f (x1 , x2 ) = f1 (x1 )f2 (x2 ), wobei die
Marginaldichten fi (t) jeweils die Dichten der U(0, 1)-Verteilung
sind:
fi (t) = 1, falls 0 < t < 1 und fi (t) = 0 sonst.
Mit
M = {x = (x1 , x2 ) ∈ R2 ; 0 < x1 < 1 , 0 < x2 < 1 }
ist also
f (x) =
1
0
x ∈M
sonst
11.34
WR 1
Ergänzung
W. Merz
G1 wird durch G2 (x1 , x2 ) = x2 ergänzt:
G:
y1
y2
= x1 x2
= x2
Die Funktionaldeterminante
x
JG (x) = 2
0
x1 = x2
1 ist auf M von Null verschieden.
11.35
WR 1
Umkehrfunktion
G:
y1
y2
W. Merz
= x1 x2
= x2
⇒
G∗ :
x1
x2
y1
y2
=
= y2
Bildmenge M ∗ :
Aus 0 < x2 < 1 folgt 0 < y2 < 1.
Aus 0 < x1 < 1 folgt 0 < y1 /y2 < 1 oder 0 < y1 und y1 < y2
M ∗ = {y = (y1 , y2 ) ; 0 < y1 < y2 < 1}
Für y ∈ M ∗ ist G∗ (y ) ∈ M und daher f (G∗ (y )) = 1.
JG (G∗ (y )) = y2
11.36
WR 1
Dichten
W. Merz
Dichte von P G :
g(y1 , y2 ) =
1 · y12
0
für 0 < y1 < y2 < 1
sonst
1. Marginaldichte:
Für y1 ≤ R0 und y1 ≥ 1 ist g(y1 , y2 ) = 0 und damit auch
g1 (y1 ) = g(y1 , y2 )dy2 = 0.
Für 0 < y1 < 1 erhält man
Z
1
g1 (y1 ) =
y1
1
dy2 = − log y1 .
y2
11.37
Affin lineare Transformationen
WR 1
W. Merz
Yi = ai1 X1 + ai2 X2 + · · · + ain Xn + bi
für i = 1, 2, . . . , n entspricht y = G(x) mit
yi = Gi (x1 , x2 , . . . , xn ) = ai1 x1 + ai2 x2 + · · · + ain xn + bi
∂Gi
(x) = aik
∂xk
11.38
Vektorschreibweise

y1
 y2

y = .
 ..
WR 1
W. Merz








x =

yn
x1
x2
..
.








b=

xn



A=

a11
a21
..
.
a12
a22
..
.
an1
an2
b1
b2
..
.





bn
. . . a1n
. . . a2n
..
..
.
.
. . . ann





ergibt:
y = G(x) = Ax + b
∂Gi
(x) = A
∂xk
JG (x) = det(A)
11.39
WR 1
Transformationssatz
W. Merz
Wenn die Matrix A nichtsingulär ist, ist det(A) 6= 0 und
y = Ax + b auf dem ganzen Rn umkehrbar mit
x = G∗ (y ) = A−1 (y − b)
Mit M = M ∗ = Rn erhält man die Dichte
g(y ) =
1
f (A−1 (y − b))
|det(A)|
11.40
WR 1
Faltungen
W. Merz
Berechnung der Verteilung der Summe Y = X1 + X2 zweier
Zufallsvariabler.
Ergänzung der Funktion y1 = G1 (x1 , x2 ) = x1 + x2 durch
y2 = G2 (x1 , x2 ) = x2 ergibt die affin lineare Abbildung
1 1
x1
G(x) =
0 1
x2
mit der Umkehrabbildung
1 −1
y1
y1 − y2
∗
G (y ) =
=
0 1
y2
y2
Wegen det(A) = 1 besitzt der Zufallsvektor G die Dichte
g(y1 , y2 ) = f (y1 − y2 , y2 )
11.41
WR 1
Faltungen
W. Merz
Dichte des Zufallsvektors G
g(y1 , y2 ) = f (y1 − y2 , y2 )
Die Dichte der Verteilung der Zufallsvariable Y ist die erste
Marginaldichte von g:
Z
g1 (y1 ) =
f (y1 − y2 , y2 )dy2
R
Spezialfall: X1 , X2 stochastisch unabhängig,
f (x1 , x2 ) = f1 (x1 )f2 (x2 ).
Z
g1 (t) = (f1 ∗ f2 )(t) =
f1 (t − s)f2 (s)ds
R
Das Integral heißt Faltungsintegral und f1 ∗ f2 die
Faltungsdichte von f1 und f2 .
11.42
WR 1
Beispiel
W. Merz
Die Zufallsvariablen X1 und X2 seien stochastisch unabhängig
und exponentiell verteilt mit Parameter λ, d.h.
λe−λx für x > 0
f1 (x) = f2 (x) =
0
für x ≤ 0
f2 (s) = 0 für s ≤ 0:
Z
Z
g1 (t) =
f1 (t − s)f2 (s)ds =
R
∞
f1 (t − s)λe−λs ds
0
Aus t ≤ 0 und s ≥ 0 folgt t − s ≤ 0 und damit f1 (t − s) = 0:
g1 (t) = 0
für t ≤ 0
11.43
WR 1
Beispiel
W. Merz
Ist t > 0, so ist f1 (t − s) = 0 für s ≥ t:
Z ∞
g1 (t) =
f1 (t − s)λe−λs ds
0
t
Z
=
λe
−λ(t−s)
λe
−λs
ds = λ
0
2 −λt
2
Z
t
e−λt eλs e−λs ds
0
Z
= λ e
t
1ds = λ2 te−λt
0
11.44
WR 1
Berechnungsmethoden
W. Merz
Exercise
Bestimme die Verteilung der Zufallsvariablen Y = X12 + X22 ,
wenn X1 und X2 stochastisch unabhängige und
N (0, 1)-verteilte Zufallsvariable auf einem
Wahrscheinlichkeitsraum (Ω, A, P) sind.
(Ω, A, P)
X = (X1 , X2 ) (R2 , B2 , P X )
HH
H
HH
H
Y
G(x1 , x2 )
HH
HH
j ?
H
(R, B, .)
11.45
WR 1
Berechnungsmethoden
W. Merz
Zu bestimmen ist die Verteilung der Zufallsvariablen
G(x1 , x2 ) = x12 + x22
auf dem Wahrscheinlichkeitsraum (R2 , B2 , P X ), wobei die
Verteilung P X die Dichte
f (x1 , x2 ) = f1 (x1 )f2 (x2 ) = ϕ(x1 )ϕ(x2 ) =
1 − 1 (x12 +x22 )
e 2
2π
besitzt.
11.46
WR 1
Verteilungsfunktion
W. Merz
F G (t) = P G (−∞, t] = P X (G ≤ t)
(G ≤ t) = {(x1 , x2 ) ; x12 + x22 ≤ t} =
∅
B√t
für t < 0
für t ≥ 0
wobei Br die Kreisscheibe mit Radius r ist.
11.47
WR 1
Verteilungsfunktion
W. Merz
Für t < 0 ist (G ≤ t) = {(x1 , x2 ) ; x12 + x22 ≤ t} = ∅ und daher
F G (t) = 0.
Für t ≥ 0 erhält man
F G (t)
Z
= P X (B√t ) = 1B√t (x1 , x2 )f (x1 , x2 )d(x1 , x2 )
Z
1 − 1 (x12 +x22 )
=
e 2
d(x1 , x2 )
B√t 2π
!
Z √t Z 2π
1 − 1 r2
=
r e 2 dϕ dr
2π
0
0
1
= 1 − e− 2 (
1
= 1 − e− 2 t
√
t)2
Die Verteilung von G und somit die von Y ist daher die
Exponentialverteilung mit dem Parameter λ = 1/2.
11.48
Faltung
WR 1
W. Merz
Die Zufallsvariablen Yi = Xi2 sind stochastisch unabhängig.
Sind g1 und g2 die Dichten der Verteilungen dieser
Zufallsvariablen, besitzt die Verteilung von Y = Y1 + Y2 die
Faltungsdichte
Z
f Y (t) = g1 ∗ g2 (t) = g1 (t − x) g2 (x) dx
11.49
WR 1
Berechnung der Dichten
Yi
F (t) = P(Yi ≤ t) =
W. Merz
P(Xi2
≤ t)
Für t < 0 ist (Xi2 ≤ t) = ∅, weil die Zufallsvariable Xi (ω)2 nur
nichtnegative Werte annehmen kann, und daher F Yi (t) = 0.
Ist t ≥ 0, so gilt
(Xi2 ≤ t)
= {ω ; Xi2 (ω) ≤ t}
√
√
= {ω ; − t ≤ Xi (ω) ≤ t}
√
√
= (− t ≤ Xi ≤ t)
11.50
WR 1
Berechnung der Dichten
W. Merz
Also
√
√
√ √
√ √
F Yi (t) = P(− t ≤ Xi ≤ t) = P(Xi ∈ [− t, t]) = P Xi [− t, t]
P Xi ist die N (0, 1)-Verteilung mit der stetig differenzierbaren
Verteilungsfunktion
Z
t
Φ(t) =
t
ϕ(x)dx =
−∞
Daher
Z
−∞
1 2
1
√ e− 2 x dx
2π
√ √
√
√
F Yi (t) = P Xi [− t, t] = Φ( t) − Φ(− t)
11.51
Berechnung der Dichten
WR 1
W. Merz
Die Dichte gi erhält man durch Ableiten der Verteilungsfunktion
F Yi .
Für t < 0 ist gi (t) = 0
und für t ≥ 0 nach der Kettenregel
gi (t) =
√
√
√ 1
d √
d
1
Φ( t) − Φ(− t) = ϕ( t) √ − ϕ(− t) √
dt
dt
2 t
−2 t
ϕ(−x) = ϕ(x), daher
√
√
1
1
1 1
gi (t) = √ (ϕ( t) + ϕ( t)) = √ √ e− 2 t
2 t
t 2π
11.52
WR 1
Faltungsdichte
W. Merz
f Y (t) = g1 ∗ g2 (t) =
Z
g1 (t − x) g2 (x)dx
Wie beim Beispiel zum Faltungsintegral: Für t ≤ 0 ist f Y (t) = 0
Für t > 0 ist
f Y (t)
Z
=
=
t
1
1
1
1
1 1
√ e− 2 (t−x) √ √ e− 2 x dx
x
t
−
x
2π
2π
0
Z
1 −1t 1 t
1
2
p
dx
e
2
π 0
(t − x)x
√
11.53
WR 1
Faltungsdichte
W. Merz
Die Variablensubstitution y = 2t x − 1 mit der Umkehrfunktion
2
x = 2t (y + 1) und dy
dx = t liefert
Z
t
Z
1
p
dx =
(t − x)x
1
1
dy
1 − y2
π
π
= arcsin(1) − arcsin(−1) = − (− ) = π
2
2
0
−1
p
so dass
1 −1t
e 2
2
d.h. die Dichte der Exponentialverteilung mit λ = 1/2.
f Y (t) =
11.54
WR 1
Transformationssatz
W. Merz
Erweiterung des Transformationssatzes auf nicht eindeutig
umkehrbare Abbildungen G.
Ergänzung von x12 + x22 durch eine zweite Funktion:
G:
y1
y2
= G1 (x1 , x2 ) = x12 + x22
= G2 (x1 , x2 ) =
x22
1. Die Funktionaldeterminante
2x1
JG (x1 , x2 ) = det
0
2x2
2x2
= 4x1 x2
verschwindet auf der Menge
N = (x1 , x2 ) ∈ R2 ; x1 = 0 oder x2 = 0
Vermutlich kein Problem, weil N eine Nullmenge ist
(Achsenkreuz).
11.55
WR 1
Transformationssatz
W. Merz
Alle Punkte (x1 , x2 ) 6∈ N werden durch
y1
y2
= G1 (x1 , x2 ) = x12 + x22
= G2 (x1 , x2 ) = x22
wegen x12 > 0 und x22 > 0 in die Menge
M ∗ = (y1 , y2 ) ∈ R2 ; 0 < y2 < y1
abgebildet.
11.56
WR 1
Transformationssatz
y1
y2
W. Merz
= G1 (x1 , x2 ) = x12 + x22
= G2 (x1 , x2 ) = x22
G ist nicht eindeutig umkehrbar, denn zu jedem (y1 , y2 ) ∈ M ∗
gibt es vier verschiedene Urbildpunkte
√
√
x11 = y1 − y2
x12 = − y1 − y2
√
√
x21 = y2
x22 = y2
√
x13 = − y1 − y2
√
x23 = − y2
√
x14 = y1 − y2
√
x24 = − y2
je einen in einem der vier offenen Quadranten M1 , M2 , M3 und
M4 des R2
11.57
WR 1
Transformationssatz
W. Merz
11.58
Transformationssatz
WR 1
W. Merz
G : Mi −→ M ∗ besitzt eine Umkehrfunktion Gi∗ : M ∗ −→ Mi , die
durch die entsprechende Gleichung
√
x1 = ± y1 − y2
√
x2 = ± y2
gegeben ist.
Für diese eingeschränkte Abbildung sind alle Voraussetzungen
des Transformationssatzes erfüllt.
11.59
WR 1
Transformationssatz
W. Merz
B ⊂ M ∗ Borelsche Menge.
(G ∈ B) = I1 + I2 + I3 + I4
mit
Ik = (G ∈ B) ∩ Mk = {(x1 , x2 ) ∈ Mk ; G(x1 , x2 ) ∈ B}
Daher ist
P G (B) = P X (G ∈ B) =
4
X
P X (Ik )
k =1
11.60
WR 1
Transformationssatz
W. Merz
Da durch G und Gk∗ die Menge Ik eineindeutig auf B abgebildet
wird und umgekehrt, ist
Z
Z
P X (Ik ) =
f (x)dx =
gk (y )dy
Ik
B
mit
gk (y ) = f (Gk∗ (y ))
P G (B) =
R P4
B
1
|JG (Gk∗ (y ))|
k =1
gk (y )dy
Unabhängig vom Quadranten gilt stets x12 + x22 = y1 , so dass
f (Gk∗ (y )) =
1 − 1 y1
e 2
2π
11.61
WR 1
Transformationssatz
|JG (Gk∗ (y ))|
W. Merz
√
√
= |4 · (± y1 − y2 )(± y2 )|
q
√
√
= 4 y1 − y2 y2 = 4 y1 y2 − y22
Damit
1
1
gk (y1 , y2 ) = e− 2 y1
8π
q
y1 y2 − y22
und
P G (B) =
Z X
4
B k =1
Z
Z
4g1 (y )dy =
gk (y )dy =
B
g(y )dy
B
11.62
WR 1
Transformationssatz
mit
g(y1 , y2 ) =
W. Merz
1 − 1 y1 1
1
q
e 2
2
π y y − y2
1 2
2
Das Urbild einer Menge B, die zu M ∗ disjunkt ist, ist entweder
leer oder in der Nullmenge N enthalten, so dass für eine
derartige Menge
Z
G
P (B) = P(G ∈ B) =
f (x)dx = 0
(G∈B)
Setzt man g(y ) = 0 auf M ∗ und wie oben auf M ∗ , so gilt stets
Z
P G (B) =
g(y )dy
B
11.63
WR 1
1. Marginaldichte
W. Merz
Z
g1 (y1 ) =
g(y1 , y2 )dy2
Ist y1 ≤ 0, so ist (y1 , y2 ) ∈ M ∗ . Für solche Punkte ist der
Integrand g(y1 , y2 ) und damit auch g1 (y1 ) gleich Null.
Ist y1 > 0, liegt (y1 , y2 ) in M ∗ , wenn 0 < y2 < y1 .
Z y1
g(y1 , y2 )dy2
g1 (y1 ) =
0
Z
1 − 1 y1 1 y1
1
2
q
=
e
dy2
2
π 0
y1 y2 − y22
Wie schon berechnet, hat das letzte Integral den Wert π.
Ergebnis: Dichte der Exponentialverteilung mit λ = 1/2.
11.64
Herunterladen