5.6 Zwei- und mehrdimensionale Zufallsvariablen Wir betrachten jetzt den Fall, dass mehrere Zufallsvariablen gleichzeitig analysiert werden. Allgemein ist eine n-dimensionale Zufallsvariable durch das n-Tupel (X1, X2, …, Xn) gegeben. Wir beschränken uns hier aber auf den Fall der zweidimensionalen Zufallsvariablen, (X, Y) da die Konzepte mehrdimensionaler Verteilung anhand von bivariaten Verteilungen anschaulich illustriert werden können. Zwei- und mehrdimensionalen Verteilungen können diskrete oder stetige Zufallsvariablen zugrunde liegen. Wir unterscheiden hier zwischen der • gemeinsame Wahrscheinlichkeitsverteilung (gemeinsame Wahrscheinlichkeits- bzw. Dichtefunktion) und den • Randverteilungen (Randwahrscheinlichkeits- bzw. Randdichtefunktion). Wie bei den eindimensionalen Verteilungen sind der Erwartungswert und die Varianz Parameter der Randverteilungen. Parameter der gemeinsamen Wahrscheinlichkeitsverteilungen sind die Kovarianz und der Korrelationskoeffizient. Beispiel 5.18: • Ein Würfel wird zweimal hintereinander geworfen. Die Zufallsvariable X bezeichnet die Augenzahl beim ersten Würfel, die Zufallvariable Y die Augenzahl beim zweiten Würfel. Dann ist (X, Y) eine zweidimensionale Zufallsvariable, deren Wertebereich aus allen geordneten Paaren (xj, yk) besteht, die sich aus den natürlichen Zahlen 1 bis 6 zusammensetzen. • Eine Versicherungsgesellschaft will überprüfen, ob es einen Zusammenhang zwischen der Unfallhäufigkeit (X) und dem Geschlecht (Y) gibt. Hierzu wird die zweidimensionale Zufallsvariable (X, Y) analysiert. • In der Volkswirtschaftlichen Gesamtrechnung werden der Konsum (C) und das Einkommen (Y) je Periode erfasst. Die zweidimensionale Zufallsvariable (C, Y) gibt dann die potenziellen Kombinationen aus Konsum und Einkommen je Periode wieder. ♦ A. Gemeinsame Wahrscheinlichkeitsfunktion und Randwahrscheinlichkeitsfunktionen Die gemeinsame Wahrscheinlichkeitsfunktion f(x,y) der zweidimensionalen Zufallsvariablen (X,Y) ordnet den geordneten Paaren (xj,yk) Wahrscheinlichkeiten pjk zu: P X x j, Y y j p jk für x x j,y yk f x , y (5.24) 0 sonst Die Randwahrscheinlichkeitsfunktionen c (5.25) und (5.26) f X x P( X x ) f x,y k k 1 r f Y y P( Y y ) f x j,y j1 geben die eindimensionalen Wahrscheinlichkeitsfunktionen der beiden Zufallsvariablen X und Y an. Die Randwahrscheinlichkeitsfunktion von X, f1(x), wird durch Summation über alle c Spalten ermittelt. Die Randwahrscheinlichkeitsfunktion von Y, f2(y), wird durch Summation über alle r Zeilen bestimmt. Tabelle 5.1: Gemeinsame Wahrscheinlichkeiten und Randwahrscheinlichkeiten Y X y1 y2 x1 p11 p12 x2 p 21 p 22 xr p r1 c yc k 1 c p1c p1 p 2c p 2 pr2 j1 p1 r p j1 j1 r p 2 p j2 j1 pr p rc p 2k k 1 c p rk k 1 c r p jk p j r j1k 1 pc p jc j1 c Gemeinsame Wahrscheinlichkeiten: f(xj,yk) = pjk = P(X=xj,Y=yk) c Randwahrscheinlichkeiten von X: f X x j p j p jk Randwahrscheinlichkeiten von Y: f Y y k pk p jk k 1 r j1 j1 p k 1 k 1 k 1 c r r p1k Beispiel 5.19: Eine Versicherungsgesellschaft will überprüfen, ob ein Zusammenhang zwischen der Unfallhäufigkeit (X) und dem Geschlecht (Y) besteht. Es wurden hierfür folgende Wahrscheinlichkeiten ermittelt: Y (Geschlecht) X (Unfallhäufigkeit) y1 (männlich) y2 (weiblich) x1 (keinmal) 0,20 0,30 x 2 (ein- oder zweimal) 0,15 0,20 x 3 (mehr als zweimal) 0,10 0,05 Mit diesen Informationen lässt sich eine Tabelle der zweidimensionalen Verteilung von (X,Y) erstellen. Die Randwahrscheinlichkeiten pj• und p•k ergeben sich darin durch Summation der gemeinsamen Wahrscheinlichkeiten pjk. Y (Geschlecht) X (Unfallhäufigkeit) x1 (keinmal) x 2 (ein- oder zweimal) x 3 (mehr als zweimal) 3 j1 2 y1 (männlich) p11 0,20 p 21 0,15 p31 0,10 y2 (weiblich) p12 0,30 p 22 0,20 p32 0,05 3 3 j1 j1 p 1 p j1 0,2 p 2 p j2 0,3 p1 k 1 2 p1k k 1 0,20 0,30 0,50 p 2 2 p 2k k 1 0,15 0,20 0,35 p3 2 p3k k 1 0,10 0,05 0,15 3 2 p jk 0,2 0,3 j1k 1 0,15 0,1 0,2 0,05 0,15 0,2 0,1 0,45 0,55 0,05 1 ♦ Stochastische Unabhängigkeit Die beiden diskreten Zufallsvariablen X und Y sind voneinander unabhängig, wenn sich die gemeinsame Wahrscheinlichkeitsfunktion als Produkt der Randwahrscheinlichkeitsfunktionen darstellen lässt: (5.27a) f x, y f X x f Y y stochastische Unabhängigkeit Bei stochastischer Unabhängigkeit lassen sich alle gemeinsamen Wahrscheinlichkeiten pjk aus dem Produkt der Randwahrscheinlichkeiten pj• und p•k darstellen: (5.27b) p jk p j pk für alle j=1,2,…,r und k=1,2,…,c stochastische Unabhängigkeit Beispiel 5.20: Sind die Zufallsvariablen Unfallhäufigkeit und Geschlecht unabhängig voneinander? Zur Beantwortung dieser Frage berechnen wir die Produkte der Randwahrscheinlichkeiten: Y (Geschlecht) X (Unfallhäufigkeit) y1 (männlich) p1 p1 x1 (keinmal) x 2 (ein- oder zweimal) x 3 (mehr als zweimal) pk y2 (weiblich) p j p1 p 2 0,5 0,45 0,225 p11 0,20 p 2 p1 0,5 0,55 0,275 p12 0,30 p 2 p 2 0,35 0,45 0,1575 p21 0,15 0,35 0,55 0,1925 p22 0,20 p3 p1 p3 p 2 0,15 0,45 0,0675 p31 0,10 0,15 0,55 0,0825 p32 0,05 p1 0,45 p2 0,55 z.B. p1 0,50 p1 p1 0,225 p11 0,20 p 2 0,35 p3 0,15 1 Beide Merkmale sind abhängig, da die berechneten Produkte der Randwahrscheinlichkeiten pj•·p•k nicht mit den gemeinsamen Wahrscheinlichkeiten pjk übereinstimmen. ♦ B. Gemeinsame Dichtefunktion und Randdichtefunktionen Die beiden Zufallsvariablen X und Y sind gemeinsam stetig verteilt, wenn es eine gemeinsame Dichtefunktion f(x,y) mit den Eigenschaften f x, y 0 und f x, y dx dy 1 gibt, so dass die gemeinsame Intervallwahrscheinlichkeit P(aXb,cYd) durch b d (5.28) gegeben ist. P( a X b, c Y d ) f x, y dx dy a c Beispiel 5.21: Gegeben ist die gemeinsame Dichtefunktion der zweidimensionalen Zufallsvariablen (X,Y), xy f( x, y ) 0 für 0 x 1, 0 y 1 , sonst die sich in einem dreidimensionalen Koordinatensystem darstellen lässt: f ( x , y) x 2. 1.5 1. 0.5 0 0 1. 0.8 0.6 0.4 0.2 0.4 0.2 0.6 0.8 y1. 0 Gesucht ist die Wahrscheinlichkeit, dass die Zufallsvariable X in dem Intervall zwischen 0,5 und 1 und die Zufallsvariable Y gleichzeitig in dem Intervall zwischen 0,4 und 0,6 liegt. Um die gesuchte Wahrscheinlichkeit P(0,5X1;0,4Y0,6) zu berechnen, ist ein Doppelintegral zu lösen: 0,6 1 P( 0,5 X 1; 0,4 Y 0,6 ) x y dx dy . 0,4 0,5 Hierzu integrieren wir zuerst über x, 0,6 1 0,6 1 x y dx dy x 2 xy 01,5 dy P( 0,5 X 1; 0,4 Y 0,6 ) 0,4 0,5 0,4 2 0,6 0,5 12 1 y 0,5 0,52 0,5 y dy 0,4 0,6 0,6 0,5 y 0,125 0,5 y dy 0,5y 0,375 dy, 0,4 0,4 und anschließend über y: 0,6 1 0,6 0,4 0,5 0,4 P( 0,5 X 1; 0,4 Y 0,6 ) 0,5 0,5 y 2 0,375 y x y dx dy 0,5 y 0,375 dy 0,6 0,6 0,25 y 2 0,375y 0,4 0,4 0,25 0,62 0,375 0,6 0,25 0,42 0,375 0,4 0,090 0,225 0,190 0,125 . Die gesuchte Wahrscheinlichkeit beträgt also 0,125. Mit einer Wahrscheinlichkeit von 12,5 % liegt die Zufallsvariable X zwischen 0,5 und 1 und die Zufallsvariable Y gleichzeitig zwischen 0,4 und 0,6. ♦ Aus der gemeinsamen Dichtefunktion f(x,y) lassen sich die Randdichtefunktionen durch Integration bestimmen: (5.29a) und (5.29b) f X( x ) f( x, y ) dy f Y( y ) f( x, y ) dx . Bei stochastischer Unabhängigkeit der beiden stetigen Zufallsvariablen X und Y ist gemeinsame Dichtefunktion f(x,y) durch das Produkt der Randdichtefunktionen fX(x) und fY(y) gegeben: (5.30) f x, y f X x f Y y stochastische Unabhängigkeit. Beispiel 5.22: Wie lauten die Randdichtefunktionen der Zufallsvariablen X und Y, deren gemeinsame Dichtefunktion durch xy f( x, y ) 0 für 0 x 1, 0 y 1 sonst gegeben ist? • Randdichtefunktion von X: 1 f X x x y dy xy 0 1 21 1 y 0 x 1 12 0 x 0,5 2 2 • Randdichtefunktion von Y: 1 f Y( y ) x y dx 0 1 2 1 1 x xy 0 12 y 1 0 0,5 y 2 2 ♦ C. Parameter der gemeinsamen Wahrscheinlichkeitsverteilung der zweidimensionalen Zufallsvariablen (X, Y) ● Kovarianz Die Kovarianz der beiden Zufallsvariablen X und Y ist ein Maß der Verbundstreuung: CovX, Y xy EX EX Y EY . Sie misst die Richtung eines linearen Zusammenhangs zwischen zwei Zufallsvariablen X und Y. (5.31a) Für diskrete Zufallsvariablen X und Y berechnet sich die Kovarianz aus (5.32a) r c CovX, Y xy x j EX y k EY f( x j, y k ) j1 k 1 und bei stetigen Zufallsvariablen aus (5.32b) CovX, Y xy . x EX y EY f x, y dx dy Verschiebungssatz: (5.31b) Cov(X,Y) = E(X·Y) – E(X)·E(Y) Beispiel 5.23: Für die zukünftigen Konjunkturaussichten wird von einem Wirtschaftsforschungsinstitut folgendes Szenario entwickelt: Umweltzustand Beschreibung Eintrittswahrscheinlichkeit 1 keine wesentliche Änderung des ökonomischen Umfelds 0,5 2 Rezession 0,3 3 Hochkonjunktur 0,2 Die möglichen Rahmenbedingungen beeinflussen die Ertragssituation von Unter nehmen und damit die Kursentwicklung ihrer Aktien. Abhängig von der Rahmen bedingung erwarten die Investoren als Renditen für zwei Aktien X und Y: Umweltzustand Rendite X Rendite Y 1 3,5 % 5,0 % 2 4,0 % -1,0 % 3 2,0 % 7,0 % Aus den angegebenen Größen lässt sich folgende zweidimensionale Wahrscheinlichkeitstabelle erstellen: Y (Rendite Y) X Rendite X) y1 ( 1 % ) y2 ( 5 % ) y3 ( 7 % ) x1 ( 2 % ) p11 0 p12 0 p13 0,2 x 2 ( 3,5 % ) p 21 0 p 22 0,5 p 23 0 p31 0,3 p32 0 p33 0 x3 ( 4 % ) p k 3 p jk j1 p1 0 0 p2 0 p3 0,2 0,3 0,5 0 00 0,3 0,5 0,2 p j 3 p jk k 1 p1 0 0 0,2 0,2 p 2 0 0,5 0 0,5 p3 0,3 0 0 0,3 3 3 p jk 00 j1k 1 0,2 0 0,5 0 0,3 0 0 1 Zunächst bestimmen wir die erwarteten Renditen der beiden Aktien: 3 E(X) x j p j 0,02 0,2 0,035 0,5 0,04 0,3 0,0335 j1 3 E(Y) y k pk 0,01 0,3 0,05 0,5 0,07 0,2 0,0360 . k 1 Die Kovarianz errechnet sich mit der Formel für den diskreten Fall: 3 3 Cov(X,Y) xy x j EX y k EY p jk j1k 1 0 0 (0,02 0,0335) (0,07 0,036) 0,2 0 (0,035 0,0335) (0,05 0,036) 0,5 0 (0,04 0,0335) ( 0,01 0,036) 0,3 0 0 0,000171 . Da die Kovarianz negativ ist, besteht zwischen den Renditen der beiden Aktien ein negativer linearer Zusammenhang. Mit einer höheren Rendite der einen Aktie geht also tendenziell eine niedrigere Rendite der anderen Aktie einher. ● Korrelationskoeffizient Die Kovarianz gibt keine Auskunft über die Stärke des Zusammenhangs zwischen zwei Zufallsvariablen X und Y, weil sie unbeschränkt ist. Aus diesem Grund wird der Korrelationskoeffizient zur Messung der Stärke eines bivariaten Zusammenhangs verwendet: xy Corr ( X , Y ) (5.33) xy x y Das Vorzeichen des Korrelationskoeffizienten wird nur von der Kovarianz bestimmt, da der Nenner stets positiv ist. Der Korrelationskoeffizient gibt zunächst einmal wie die Kovarianz die Richtung einer linearen Abhängigkeit an. Zusätzlich misst der Korrelationskoeffizient xy die Stärke des linearen Zusammenhangs zwischen den Zufallsvariablen X und Y, da er im Unterschied zur Kovarianz xy auf das Intervall zwischen -1 und 1 normiert ist. Je näher der Korrelationskoeffizient an den Extremwerten -1 oder +1 liegt, desto stärker ist der lineare Zusammenhang ausgeprägt. Beispiel 5.24: Wir wollen jetzt die Stärke des Zusammenhangs zwischen den Renditen X und Y der beiden Aktien messen, die eine Kovarianz von -0,000171 aufweisen. Hierzu sind die Varianzen der beiden Zufallsvariablen X und Y zu berechnen, aus denen sich ihre Standardabweichungen ergeben. Varianz von X: 3 2 2 x EX EX x j x 2 p j j1 0,02 0,03352 0,2 0,035 0,03352 0,5 0,04 0,03352 0,3 0,00005025 Standardabweichung von X: Varianz von Y: x 0,00005025 0,0071 3 2 2 y EY EY y k y 2 p k k 1 0,01 0,0362 0,3 0,05 0,0362 0,5 0,07 0,0362 0,2 0,000964 . y 0,000964 0,0310 xy 0,000171 Corr ( X , Y ) 0,7769 Korrelationskoeffizient: xy x y 0,0071 0,0310 Standardabweichung von Y: Bei einem Korrelationskoeffizient von rd. -0,8 besteht ein enger negativer Zusammenhang zwischen den Renditen der beiden Aktien. D. Erwartungswert und Varianz einer Linearkombination von Zufallsvariablen Gegeben: n Zufallsvariablen: X1, X2, …, Xn Linearkombination der Zufallsvariablen X1, X2, …, Xn: (5.34) n Z a i Xi a1X1 a 2X 2 a n X n i 1 ● Erwartungswert einer Linearkombination von Zufallsvariablen (5.35) n n E( Z ) E a i Xi a i E( Xi ) i 1 i 1 a1 E( X1 ) a 2 E( X 2 ) a n E( X n )) ● Varianz einer Linearkombination von Zufallsvariablen - bei stochastischer Unabhängigkeit: n n 2 V ( Z ) V a X a V ( X ) (5.36) i i i i i 1 i 1 a i2 V( X1 ) a i2 V( X 2 ) a i2 V( X n )) - bei stochastischer Abhängigkeit zweier Zufallsvariablen X und Y: (5.37) V(a X b Y) a 2 V(X) b 2 V(Y) 2 a b Cov(X, Y) Beispiel 5.25: Die Portfoliotheorie zeigt auf, wie optimale Wertpapierportfolios strukturiert sein müssen. Alternative Ertrags-Risiko-Kombinationen, die durch den Erwartungswert und die Varianz der Renditen gemessen werden, lassen sich unter Berücksichtigung der Präferenzen eines Anlegers bewerten. Für den Anleger wird es im Allgemeinen vorteilhaft sein, gleichzeitig unterschiedliche risikobehaftete Wertpapiere zu halten. Hierbei kommt es nicht nur auf die erwartete Rendite, sondern auch auf eine günstige Korrelationsstruktur an, die das Risiko der Wertpapieranlage verringert. Wir setzen die Bespiele 5.23 und 5.24 fort, in denen wir die erwarteten Renditen und die Varianzen für zwei Aktien separat betrachtet haben: E(X) x 0,0335 V( X ) 2x 0,00005025 und und E(Y) y 0,0360 V( Y ) 2y 0,000964 . Für die Kovarianz haben wir den Wert Cov(X,Y) xy 0,000171 . erhalten und der Korrelationskoeffizient beträgt Corr( X, Y ) xy 0,7769 . Wir wollen nun die Ertrags-Risiko-Struktur von zwei Aktienportfolios betrachten. Aktienportfolio 1: 100% Aktie X, 0% Aktie Y Aktienportfolio 2: 80% Aktie X, 20% Aktie Y ● Ertrags-Risiko-Struktur des Aktienportfolios 1 Erwartete Rendite des Portfolios 1: E( Z ) a E( X ) b E( Y ) mit a=1 und b=0 E( Z ) 1 E( X ) 0 E( Y ) 1 0,0335 0 0,0360 0,0335 Risiko des Portfolios 1: V( Z) a 2 V(X) b 2 V(Y) 2 a b Cov(X, Y) V( Z) 12 V(X) 02 V(Y) 2 1 0 Cov(X, Y) 1 0,00005025 0,00005025 x V( X ) 0,00005025 0,0071 mit a=1 und b=0 ● Ertrags-Risiko-Struktur des Aktienportfolios 2 Erwartete Rendite des Portfolios 2: E( Z ) a E( X ) b E( Y ) mit a=0,8 und b=0,2 E( Z ) 0,8 E( X ) 0,2 E( Y ) 0,8 0,0335 0,2 0,0360 0,034 Risiko des Portfolios 2: V( Z) a 2 V(X) b 2 V(Y) 2 a b Cov(X, Y) mit a=0,8 und b=0,2 V( Z) 0,82 V(X) 0,22 V(Y) 2 0,8 0,2 Cov(X, Y) 0,64 0,00005025 0,04 0,000964 2 0,8 0,2 ( 0,000171 ) 0,00003216 0,00003856 0,00005472 0,000016 y V( Y ) 0,000016 0,004 Das Aktienportfolio 2, das aus einer Mischung der beiden Aktien X und Y im Verhältnis 4:1 (80%:20%) besteht, hat eine bessere Ertrags-Risiko-Struktur als das Aktienportfolio 1, das allein aus der Aktie X besteht. ♦