StatII(Kap5c)

5.6 Zwei- und mehrdimensionale Zufallsvariablen
Wir betrachten jetzt den Fall, dass mehrere Zufallsvariablen gleichzeitig analysiert
werden. Allgemein ist eine n-dimensionale Zufallsvariable durch das n-Tupel
(X1, X2, …, Xn)
gegeben. Wir beschränken uns hier aber auf den Fall der zweidimensionalen Zufallsvariablen,
(X, Y)
da die Konzepte mehrdimensionaler Verteilung anhand von bivariaten Verteilungen anschaulich illustriert werden können.
Zwei- und mehrdimensionalen Verteilungen können diskrete oder stetige Zufallsvariablen zugrunde liegen. Wir unterscheiden hier zwischen der
• gemeinsame Wahrscheinlichkeitsverteilung
(gemeinsame Wahrscheinlichkeits- bzw. Dichtefunktion)
und den
• Randverteilungen
(Randwahrscheinlichkeits- bzw. Randdichtefunktion).
Wie bei den eindimensionalen Verteilungen sind der Erwartungswert und die Varianz Parameter der Randverteilungen. Parameter der gemeinsamen Wahrscheinlichkeitsverteilungen sind die Kovarianz und der Korrelationskoeffizient.
Beispiel 5.18:
• Ein Würfel wird zweimal hintereinander geworfen. Die Zufallsvariable X bezeichnet die Augenzahl beim ersten Würfel, die Zufallvariable Y die Augenzahl
beim zweiten Würfel. Dann ist (X, Y) eine zweidimensionale Zufallsvariable,
deren Wertebereich aus allen geordneten Paaren (xj, yk) besteht, die sich aus
den natürlichen Zahlen 1 bis 6 zusammensetzen.
• Eine Versicherungsgesellschaft will überprüfen, ob es einen Zusammenhang
zwischen der Unfallhäufigkeit (X) und dem Geschlecht (Y) gibt. Hierzu wird die
zweidimensionale Zufallsvariable (X, Y) analysiert.
• In der Volkswirtschaftlichen Gesamtrechnung werden der Konsum (C) und das
Einkommen (Y) je Periode erfasst. Die zweidimensionale Zufallsvariable (C, Y)
gibt dann die potenziellen Kombinationen aus Konsum und Einkommen je Periode wieder.
♦
A. Gemeinsame Wahrscheinlichkeitsfunktion
und Randwahrscheinlichkeitsfunktionen
Die gemeinsame Wahrscheinlichkeitsfunktion f(x,y) der zweidimensionalen
Zufallsvariablen (X,Y) ordnet den geordneten Paaren (xj,yk) Wahrscheinlichkeiten
pjk zu:
P X  x j, Y  y j  p jk für x  x j,y  yk


f
x
,
y

(5.24)
0
sonst



Die Randwahrscheinlichkeitsfunktionen
c
(5.25)
und
(5.26)
f X x   P( X  x )   f x,y k 
k 1
r
 
f Y  y   P( Y  y )   f x j,y
j1
geben die eindimensionalen Wahrscheinlichkeitsfunktionen der beiden Zufallsvariablen X und Y an.
Die Randwahrscheinlichkeitsfunktion von X, f1(x), wird durch Summation über alle
c Spalten ermittelt. Die Randwahrscheinlichkeitsfunktion von Y, f2(y), wird durch
Summation über alle r Zeilen bestimmt.
Tabelle 5.1: Gemeinsame Wahrscheinlichkeiten und Randwahrscheinlichkeiten
Y
X
y1
y2

x1
p11
p12

x2
p 21
p 22




xr
p r1
c

yc
k 1
c
p1c
p1 
p 2c
p 2 

pr2


j1
p1 
r
 p j1
j1
r
p 2   p j2
j1
pr 
p rc
 p 2k
k 1
c
 p rk
k 1
c
r
  p jk   p j
r
j1k 1
 pc   p jc
j1

c
Gemeinsame Wahrscheinlichkeiten: f(xj,yk) = pjk = P(X=xj,Y=yk)
c
Randwahrscheinlichkeiten von X:
f X x j  p j   p jk
Randwahrscheinlichkeiten von Y:
f Y  y k   pk   p jk
k 1
r
j1
j1
 p k  1
k 1
 
k 1
c

r
r
 p1k
Beispiel 5.19:
Eine Versicherungsgesellschaft will überprüfen, ob ein Zusammenhang zwischen
der Unfallhäufigkeit (X) und dem Geschlecht (Y) besteht. Es wurden hierfür folgende Wahrscheinlichkeiten ermittelt:
Y (Geschlecht)
X (Unfallhäufigkeit)
y1 (männlich)
y2 (weiblich)
x1 (keinmal)
0,20
0,30
x 2 (ein- oder zweimal)
0,15
0,20
x 3 (mehr als zweimal)
0,10
0,05
Mit diesen Informationen lässt sich eine Tabelle der zweidimensionalen Verteilung
von (X,Y) erstellen. Die Randwahrscheinlichkeiten pj• und p•k ergeben sich darin
durch Summation der gemeinsamen Wahrscheinlichkeiten pjk.
Y (Geschlecht)
X (Unfallhäufigkeit)
x1 (keinmal)
x 2 (ein- oder zweimal)
x 3 (mehr als zweimal)
3

j1
2
y1 (männlich)
p11  0,20
p 21  0,15
p31  0,10

y2 (weiblich)
p12  0,30
p 22  0,20
p32  0,05
3
3
j1
j1
p 1   p j1  0,2 p 2   p j2  0,3
p1 
k 1
2
 p1k
k 1
 0,20  0,30
 0,50
p 2 
2
 p 2k
k 1
 0,15  0,20
 0,35
p3 
2
 p3k
k 1
 0,10  0,05
 0,15
3
2
  p jk
 0,2  0,3
j1k 1
 0,15  0,1
 0,2  0,05
 0,15  0,2  0,1
 0,45
 0,55
 0,05  1
♦
Stochastische Unabhängigkeit
Die beiden diskreten Zufallsvariablen X und Y sind voneinander unabhängig, wenn
sich die gemeinsame Wahrscheinlichkeitsfunktion als Produkt der Randwahrscheinlichkeitsfunktionen darstellen lässt:
(5.27a)
f x, y  f X x   f Y y
 stochastische Unabhängigkeit
Bei stochastischer Unabhängigkeit lassen sich alle gemeinsamen Wahrscheinlichkeiten pjk aus dem Produkt der Randwahrscheinlichkeiten pj• und p•k darstellen:
(5.27b)
p jk  p j  pk
für alle j=1,2,…,r und k=1,2,…,c
 stochastische Unabhängigkeit
Beispiel 5.20:
Sind die Zufallsvariablen Unfallhäufigkeit und Geschlecht unabhängig voneinander?
Zur Beantwortung dieser Frage berechnen wir die Produkte der Randwahrscheinlichkeiten:
Y (Geschlecht)
X (Unfallhäufigkeit)
y1 (männlich)
p1  p1
x1 (keinmal)
x 2 (ein- oder zweimal)
x 3 (mehr als zweimal)
pk
y2 (weiblich)
p j
p1  p 2
 0,5  0,45
 0,225
p11  0,20
p 2  p1
 0,5  0,55
 0,275
p12  0,30
p 2  p  2
 0,35  0,45
 0,1575
p21  0,15
 0,35  0,55
 0,1925
p22  0,20
p3  p1
p3  p 2
 0,15  0,45
 0,0675
p31  0,10
 0,15  0,55
 0,0825
p32  0,05
p1  0,45
p2  0,55
z.B.
p1  0,50
p1  p1  0,225
 p11  0,20
p 2  0,35
p3  0,15
1
Beide Merkmale sind abhängig, da die berechneten Produkte der Randwahrscheinlichkeiten pj•·p•k nicht mit den gemeinsamen Wahrscheinlichkeiten pjk übereinstimmen.
♦
B. Gemeinsame Dichtefunktion und Randdichtefunktionen
Die beiden Zufallsvariablen X und Y sind gemeinsam stetig verteilt, wenn es eine
gemeinsame Dichtefunktion f(x,y) mit den Eigenschaften
f x, y   0
und
 

 f x, y   dx  dy  1
 
gibt, so dass die gemeinsame Intervallwahrscheinlichkeit P(aXb,cYd) durch
b d
(5.28)
gegeben ist.
P( a  X  b, c  Y  d )    f x, y   dx  dy
a c
Beispiel 5.21:
Gegeben ist die gemeinsame Dichtefunktion der zweidimensionalen Zufallsvariablen (X,Y),
xy
f( x, y )  
0

für 0  x  1, 0  y  1
,
sonst
die sich in einem dreidimensionalen Koordinatensystem darstellen lässt:
f ( x , y)
x
2.
1.5
1.
0.5
0
0
1.
0.8
0.6
0.4
0.2
0.4
0.2
0.6
0.8
y1.
0
Gesucht ist die Wahrscheinlichkeit, dass die Zufallsvariable X in dem Intervall zwischen 0,5 und 1 und die Zufallsvariable Y gleichzeitig in dem Intervall zwischen 0,4
und 0,6 liegt.
Um die gesuchte Wahrscheinlichkeit P(0,5X1;0,4Y0,6) zu berechnen, ist ein
Doppelintegral zu lösen:
0,6 1
P( 0,5  X  1; 0,4  Y  0,6 )    x  y   dx  dy
.
0,4 0,5
Hierzu integrieren wir zuerst über x,
0,6  1
0,6  1



x  y  dx dy    x 2  xy 01,5  dy
P( 0,5  X  1; 0,4  Y  0,6 )  




0,4  0,5
0,4  2

0,6



  0,5  12  1  y  0,5  0,52  0,5  y dy
0,4
0,6
0,6
  0,5  y  0,125  0,5 y  dy   0,5y  0,375 dy,
0,4
0,4
und anschließend über y:
0,6 1
0,6
0,4 0,5
0,4
P( 0,5  X  1; 0,4  Y  0,6 )  
 0,5  0,5  y 2  0,375  y
 x  y  dx dy   0,5 y  0,375 dy
0,6
0,6
 0,25 y 2  0,375y
0,4
0,4

 0,25  0,62  0,375  0,6  0,25  0,42  0,375  0,4
 0,090  0,225  0,190  0,125 .

Die gesuchte Wahrscheinlichkeit beträgt also 0,125. Mit einer Wahrscheinlichkeit
von 12,5 % liegt die Zufallsvariable X zwischen 0,5 und 1 und die Zufallsvariable Y
gleichzeitig zwischen 0,4 und 0,6.
♦
Aus der gemeinsamen Dichtefunktion f(x,y) lassen sich die Randdichtefunktionen durch Integration bestimmen:

(5.29a)
und
(5.29b)
f X( x )   f( x, y )  dy


f Y( y )   f( x, y )  dx .

Bei stochastischer Unabhängigkeit der beiden stetigen Zufallsvariablen X und Y
ist gemeinsame Dichtefunktion f(x,y) durch das Produkt der Randdichtefunktionen
fX(x) und fY(y) gegeben:
(5.30)
f x, y  f X x   f Y y
 stochastische Unabhängigkeit.
Beispiel 5.22:
Wie lauten die Randdichtefunktionen der Zufallsvariablen X und Y, deren gemeinsame Dichtefunktion durch
xy
f( x, y )  
0

für 0  x  1, 0  y  1
sonst
gegeben ist?
• Randdichtefunktion von X:
1
f X x    x  y  dy  xy 
0
1 21
1
y 0  x  1   12  0  x  0,5
2
2
• Randdichtefunktion von Y:
1
f Y( y )   x  y  dx 
0
1 2
1 1
x  xy 0  12  y  1  0  0,5  y
2
2
♦
C. Parameter der gemeinsamen Wahrscheinlichkeitsverteilung
der zweidimensionalen Zufallsvariablen (X, Y)
● Kovarianz
Die Kovarianz der beiden Zufallsvariablen X und Y ist ein Maß der Verbundstreuung:
CovX, Y  xy  EX  EX  Y  EY
.
Sie misst die Richtung eines linearen Zusammenhangs zwischen zwei Zufallsvariablen X und Y.
(5.31a)
Für diskrete Zufallsvariablen X und Y berechnet sich die Kovarianz aus
(5.32a)
r
c


CovX, Y    xy    x j  EX   y k  EY   f( x j, y k )
j1 k 1
und bei stetigen Zufallsvariablen aus
 
(5.32b)
CovX, Y    xy  
.
 x  EX  y  EY   f x, y   dx  dy
 
Verschiebungssatz:
(5.31b)
Cov(X,Y) = E(X·Y) – E(X)·E(Y)
Beispiel 5.23:
Für die zukünftigen Konjunkturaussichten wird von einem Wirtschaftsforschungsinstitut folgendes Szenario entwickelt:
Umweltzustand
Beschreibung
Eintrittswahrscheinlichkeit
1
keine wesentliche Änderung des ökonomischen
Umfelds
0,5
2
Rezession
0,3
3
Hochkonjunktur
0,2
Die möglichen Rahmenbedingungen beeinflussen die Ertragssituation von Unter
nehmen und damit die Kursentwicklung ihrer Aktien. Abhängig von der Rahmen
bedingung erwarten die Investoren als Renditen für zwei Aktien X und Y:
Umweltzustand
Rendite X
Rendite Y
1
3,5 %
5,0 %
2
4,0 %
-1,0 %
3
2,0 %
7,0 %
Aus den angegebenen Größen lässt sich folgende zweidimensionale Wahrscheinlichkeitstabelle erstellen:
Y (Rendite Y)
X
Rendite X)
y1 (  1 % ) y2 ( 5 % )
y3 ( 7 % )
x1 ( 2 % )
p11  0
p12  0
p13  0,2
x 2 ( 3,5 % )
p 21  0
p 22  0,5
p 23  0
p31  0,3
p32  0
p33  0
x3 ( 4 % )
p k 
3
 p jk
j1
p1  0  0 p2  0 
p3  0,2
 0,3
0,5  0
00
 0,3
 0,5
 0,2
p j 
3
 p jk
k 1
p1  0  0  0,2
 0,2
p 2  0  0,5  0
 0,5
p3  0,3  0  0
 0,3
3 3
  p jk
 00
j1k 1
 0,2  0  0,5  0
 0,3  0  0  1
Zunächst bestimmen wir die erwarteten Renditen der beiden Aktien:
3
E(X)   x j  p j  0,02  0,2  0,035  0,5  0,04  0,3  0,0335
j1
3
E(Y)   y k  pk   0,01  0,3  0,05  0,5  0,07  0,2  0,0360 .
k 1
Die Kovarianz errechnet sich mit der Formel für den diskreten Fall:
3 3


Cov(X,Y)   xy    x j  EX   y k  EY   p jk
j1k 1
 0  0  (0,02  0,0335)  (0,07  0,036)  0,2
 0  (0,035  0,0335)  (0,05  0,036)  0,5  0
 (0,04  0,0335)  (  0,01  0,036)  0,3  0  0
 0,000171 .
Da die Kovarianz negativ ist, besteht zwischen den Renditen der beiden Aktien ein
negativer linearer Zusammenhang. Mit einer höheren Rendite der einen Aktie geht
also tendenziell eine niedrigere Rendite der anderen Aktie einher.

● Korrelationskoeffizient
Die Kovarianz gibt keine Auskunft über die Stärke des Zusammenhangs zwischen
zwei Zufallsvariablen X und Y, weil sie unbeschränkt ist. Aus diesem Grund wird
der Korrelationskoeffizient zur Messung der Stärke eines bivariaten Zusammenhangs verwendet:
 xy
Corr
(
X
,
Y
)



(5.33)
xy
x   y
Das Vorzeichen des Korrelationskoeffizienten wird nur von der Kovarianz bestimmt,
da der Nenner stets positiv ist. Der Korrelationskoeffizient gibt zunächst einmal wie
die Kovarianz die Richtung einer linearen Abhängigkeit an.
Zusätzlich misst der Korrelationskoeffizient xy die Stärke des linearen Zusammenhangs zwischen den Zufallsvariablen X und Y, da er im Unterschied zur Kovarianz
xy auf das Intervall zwischen -1 und 1 normiert ist. Je näher der Korrelationskoeffizient an den Extremwerten -1 oder +1 liegt, desto stärker ist der lineare Zusammenhang ausgeprägt.
Beispiel 5.24:
Wir wollen jetzt die Stärke des Zusammenhangs zwischen den Renditen X und Y
der beiden Aktien messen, die eine Kovarianz von -0,000171 aufweisen.
Hierzu sind die Varianzen der beiden Zufallsvariablen X und Y zu berechnen, aus
denen sich ihre Standardabweichungen ergeben.
Varianz von X:


3
2
2
 x  EX  EX    x j   x 2  p j
j1
 0,02  0,03352  0,2  0,035  0,03352  0,5  0,04  0,03352  0,3
 0,00005025
Standardabweichung von X:
Varianz von Y:
 x  0,00005025  0,0071


3
2
2
 y  EY  EY    y k   y 2  p k
k 1
  0,01  0,0362  0,3  0,05  0,0362  0,5  0,07  0,0362  0,2
 0,000964 .
 y  0,000964  0,0310
 xy
 0,000171
Corr
(
X
,
Y
)




 0,7769
Korrelationskoeffizient:
xy
 x   y 0,0071  0,0310
Standardabweichung von Y:
Bei einem Korrelationskoeffizient von rd. -0,8 besteht ein enger negativer Zusammenhang zwischen den Renditen der beiden Aktien.

D. Erwartungswert und Varianz einer Linearkombination von Zufallsvariablen
Gegeben: n Zufallsvariablen: X1, X2, …, Xn
Linearkombination der Zufallsvariablen X1, X2, …, Xn:
(5.34)
n
Z   a i Xi  a1X1  a 2X 2    a n X n
i 1
● Erwartungswert einer Linearkombination von Zufallsvariablen
(5.35)
 n
  n

E( Z )  E  a i Xi     a i  E( Xi )
 i 1
  i 1

 a1  E( X1 )  a 2  E( X 2 )    a n  E( X n ))
● Varianz einer Linearkombination von Zufallsvariablen
- bei stochastischer Unabhängigkeit:
 n
  n 2




V
(
Z
)

V
a
X

a

V
(
X
)
(5.36)
i 
  i i   i
 i 1
  i 1

 a i2  V( X1 )  a i2  V( X 2 )    a i2  V( X n ))
- bei stochastischer Abhängigkeit zweier Zufallsvariablen X und Y:
(5.37)
V(a  X  b  Y)  a 2  V(X)  b 2  V(Y)  2  a  b  Cov(X, Y)
Beispiel 5.25:
Die Portfoliotheorie zeigt auf, wie optimale Wertpapierportfolios strukturiert sein
müssen. Alternative Ertrags-Risiko-Kombinationen, die durch den Erwartungswert
und die Varianz der Renditen gemessen werden, lassen sich unter Berücksichtigung der Präferenzen eines Anlegers bewerten.
Für den Anleger wird es im Allgemeinen vorteilhaft sein, gleichzeitig unterschiedliche risikobehaftete Wertpapiere zu halten. Hierbei kommt es nicht nur auf die
erwartete Rendite, sondern auch auf eine günstige Korrelationsstruktur an, die das
Risiko der Wertpapieranlage verringert.
Wir setzen die Bespiele 5.23 und 5.24 fort, in denen wir die erwarteten Renditen
und die Varianzen für zwei Aktien separat betrachtet haben:
E(X)  x  0,0335
V( X )  2x  0,00005025
und
und
E(Y)   y  0,0360
V( Y )  2y  0,000964 .
Für die Kovarianz haben wir den Wert
Cov(X,Y)  xy  0,000171 .
erhalten und der Korrelationskoeffizient beträgt
Corr( X, Y )  xy  0,7769 .
Wir wollen nun die Ertrags-Risiko-Struktur von zwei Aktienportfolios betrachten.
Aktienportfolio 1: 100% Aktie X, 0% Aktie Y
Aktienportfolio 2: 80% Aktie X, 20% Aktie Y
● Ertrags-Risiko-Struktur des Aktienportfolios 1
Erwartete Rendite des Portfolios 1:
E( Z )  a  E( X )  b  E( Y )
mit a=1 und b=0
E( Z )  1  E( X )  0  E( Y )  1  0,0335  0  0,0360  0,0335
Risiko des Portfolios 1:
V( Z)  a 2  V(X)  b 2  V(Y)  2  a  b  Cov(X, Y)
V( Z)  12  V(X)  02  V(Y)  2  1  0  Cov(X, Y)
 1  0,00005025  0,00005025

 x  V( X )  0,00005025  0,0071
mit a=1 und b=0
● Ertrags-Risiko-Struktur des Aktienportfolios 2
Erwartete Rendite des Portfolios 2:
E( Z )  a  E( X )  b  E( Y )
mit a=0,8 und b=0,2
E( Z )  0,8  E( X )  0,2  E( Y )  0,8  0,0335  0,2  0,0360  0,034
Risiko des Portfolios 2:
V( Z)  a 2  V(X)  b 2  V(Y)  2  a  b  Cov(X, Y)
mit a=0,8 und b=0,2
V( Z)  0,82  V(X)  0,22  V(Y)  2  0,8  0,2  Cov(X, Y)
 0,64  0,00005025  0,04  0,000964  2  0,8  0,2 ( 0,000171 )
 0,00003216  0,00003856  0,00005472  0,000016

 y  V( Y )  0,000016  0,004
Das Aktienportfolio 2, das aus einer Mischung der beiden Aktien X und Y im Verhältnis 4:1 (80%:20%) besteht, hat eine bessere Ertrags-Risiko-Struktur als das
Aktienportfolio 1, das allein aus der Aktie X besteht.
♦