Lehrstuhl für Wirtschaftspolitik Übung 1: Wiederholung Wahrscheinlichkeitstheorie Ü1.1 Zufallsvariablen Eine Zufallsvariable ist eine Variable, deren numerischer Wert solange unbekannt ist, bis er beobachtet wird. Der Wert einer Zufallsvariable kann in einem Experiment erzeugt werden, ist allerdings nicht vorhersagbar. Die einzelnen Wert einer Zufallsvariablen X werden als Realisationen oder Ausprägungen x bezeichnet. SS 11 1 Lehrstuhl für Wirtschaftspolitik Diskrete Zufallsvariablen können nur eine begrenzte Anzahl von Werten annehmen (z.B. Würfel, Münzwurf). Einen speziellen Fall diskreter Zufallsvariablen stellen dabei die binären Variablen dar. Sie können immer nur einen Wert von zwei möglichen Ausprägungen annehmen (z.B. Geschlecht). Stetige Zufallsvariablen können jeden realen Wert annehmen, der in einem Intervall realer Zahlen liegt (z.B. Einkommen, Größe, Geschwindigkeit) Anzahl möglicher Ausprägungen nicht mehr zählbar SS 11 2 Lehrstuhl für Wirtschaftspolitik Ü1.2 Die Wahrscheinlichkeitsverteilung einer Zufallsvariable Durch wiederholte Experimente können jeder möglichen Ausprägung einer Zufallsvariable eine Eintrittswahrscheinlichkeit zugeordnet werden. Diese Zuordnungen werden als Wahrscheinlichkeitsfunktion oder auch als Dichtefunktion bezeichnet (englisch: probability density function, kurz: pdf). SS 11 3 Lehrstuhl für Wirtschaftspolitik Für eine diskrete Zufallsvariable X ist der Wert der Wahrscheinlichkeitsfunktion f(x) die Wahrscheinlichkeit, dass die Variable X den Wert x annimmt, f(x) = P(X=x). Da f(x) eine Wahrscheinlichkeit ist, gilt 0 f (x) 1 und, gegeben, dass X insgesamt n Werte x1,…, xn annehmen kann: f(x1) + f(x2) + ... + f(xn) = 1. Die Dichtefunktionen diskreter Zufallsvariablen können anschaulich in Tabellenform oder grafisch dargestellt werden (siehe Tabelle Ü1.1). SS 11 4 Lehrstuhl für Wirtschaftspolitik Die Wahrscheinlichkeit, dass eine diskrete Zufallsvariable einen Wert im Intervall [a, b] annimmt, wird folgendermaßen beschrieben: P( a X b ) b f(x) xa SS 11 f( x )1 i i (Ü1.2.1) 5 Lehrstuhl für Wirtschaftspolitik Beispiel: X sei die Anzahl von Quartalen, die ein Student während eines Jahres jobbt. Die fünf möglichen Ausprägungen sind also x = 0, 1, 2, 3, 4. Die dazugehörigen Wahrscheinlichkeiten seien 0,05; 0,50; 0,10; 0,10 und 0,25 (siehe Tabelle Ü1.1). SS 11 6 Lehrstuhl für Wirtschaftspolitik x f(x) F(x) 0 0,05 0,05 1 0,50 0,55 2 0,10 0,65 3 0,10 0,75 4 0,25 1,00 Tabelle Ü1.1: Beispiel Dichte- und Verteilungsfunktion Quelle: Hill, Griffiths, Lim (2008), S. 482 SS 11 7 Lehrstuhl für Wirtschaftspolitik Die Wahrscheinlichkeit, dass ein Student 3 oder 4 Quartale im Jahr arbeitet, ist somit: P(3 X 4) = 0,10 + 0,25 = 0,35. Eine alternative Darstellung von Wahrscheinlichkeiten ist die (kumulative) Verteilungsfunktion F(x) einer Zufallsvariable X (cumulative density function, cdf). Sie gibt die Wahrscheinlichkeit an, dass X kleiner oder gleich einem bestimmten Wert x ist: F(x) = P(X x) SS 11 (Ü1.2.2) 8 Lehrstuhl für Wirtschaftspolitik Beispiel: Die Wahrscheinlichkeit, dass ein Student mehr als zwei Quartale im Jahr arbeitet, ist P(X > 2) = 1 – P(X 2) = 1 – 0,65 = 0,35. Da eine stetige Zufallsvariable X jeden Wert innerhalb eines Intervalls annehmen kann, ist die Wahrscheinlichkeit, dass sie einen ganz bestimmten Wert annimmt Null. Es wird deshalb die Wahrscheinlichkeitsdichte für einen bestimmten Wertebereich [a, b] angegeben. Die Fläche unterhalb der Kurve der Dichtefunktion f(x) von a bis b entspricht der dazugehörigen Wahrscheinlichkeitsdichte. SS 11 9 Lehrstuhl für Wirtschaftspolitik Die Wahrscheinlichkeit, dass eine stetige Zufallsvariable einen Wert im Intervall [a, b] annimmt, wird somit folgendermaßen beschrieben: b a P( a X b ) f ( x )dx F ( b ) F ( a ), f ( x )dx 1 (Ü1.2.3) SS 11 10 Lehrstuhl für Wirtschaftspolitik Beispiel Fig. B.2: Gegeben sei, dass P(X 20) = 0,294 und P(X 40)= 0,649. Die Wahrscheinlichkeit, dass X einen Wert zwischen 20 und 40 annimmt, entspricht demnach: 40 P( 20 X 40) f ( x )dx F( 40) F( 20) 0,6490,294 0,355. 20 SS 11 11 Lehrstuhl für Wirtschaftspolitik Quelle: Hill, Griffiths, Lim (2008), S. 483 SS 11 12 Lehrstuhl für Wirtschaftspolitik Ü1.3 Eigenschaften von Wahrscheinlichkeitsverteilungen Ü1.3.1 Der Erwartungswert einer Zufallsvariable Der Mittelwert einer Zufallsvariable X wird Erwartungswert genannt. Er ist der durchschnittliche Wert der Zufallsvariable bei einer unendlichen Anzahl von Wiederholungen des Experiments. Der Erwartungswert wird üblicherweise mit E(X) oder auch X symbolisiert. SS 11 13 Lehrstuhl für Wirtschaftspolitik Wenn X eine diskrete Zufallsvariable ist, die die Werte x1, x2,..., xn mit einer Wahrscheinlichkeit f(x1), f(x2),...f(xn) annimmt, ist der Erwartungswert von X: E( X ) x1 f ( x1 ) x2 f ( x2 ) ... xn f ( xn ) n xi f ( xi ) i1 x f ( x ) (Ü1.4.1) x SS 11 14 Lehrstuhl für Wirtschaftspolitik Die Interpretation gilt auch für stetige Zufallsvariablen. Die Berechnung erfolgt jedoch auch hier mit Hilfe des Integrals: E( X ) x f ( x )dx (Ü1.4.2) Der Erwartungswert kann stark durch Ausreißer nach oben oder unten beeinflusst werden. Zwei weitere populäre Maßzahlen für das Zentrum der Verteilung, die diesen Nachteil nicht haben, sind: - Median: Der Wert m von X, der die Verteilung in zwei Hälften teilt, so dass P(X > m) = P(X < m) = 0,5. SS 11 15 Lehrstuhl für Wirtschaftspolitik - Modus: Die Ausprägung von X mit der höchsten Eintrittswahrscheinlichkeit. Ü1.3.2 Der Erwartungswert von Funktionen einer Zufallsvariable Wenn X eine diskrete Zufallsvariable und g(X) eine Funktion von X ist, dann gilt: E[ g( X )] g( x ) f ( x ) x SS 11 (Ü1.4.3) 16 Lehrstuhl für Wirtschaftspolitik Für stetige Zufallsvariablen wird die Summe durch das Integral ersetzt. Achtung! Im Allgemeinen gilt: E[ g( X )] g[ E( X )] Wenn X eine diskrete Zufallsvariable ist, g(X) = g1(X) + g2(X) und g1(X) und g2(X) sind Funktionen von X, dann gilt SS 11 17 Lehrstuhl für Wirtschaftspolitik E[ g( X )] [ g1 ( x ) g 2 ( x )] f ( x ) x g1 ( x ) f ( x ) g 2 ( x ) f ( x ) x x (Ü1.4.4) E[ g1 ( x )] E[ g 2 ( x )] D.h., der Erwartungswert einer Summe von Funktionen von Zufallsvariablen bzw. der Erwartungswert einer Summe von Zufallsvariablen entspricht immer der Summe der Erwartungswerte. SS 11 18 Lehrstuhl für Wirtschaftspolitik Ü1.3.3 Die Varianz einer Zufallsvariable Die Varianz beschreibt Wahrscheinlichkeitsverteilung. die Sie Streuung wird einer berechnet als durchschnittliche quadrierte Differenz aller Ausprägungen vom Mittelwert E(X) und wird üblicherweise mit 2 dargestellt: var( X ) E [ X E( X )] E [ X ] [ E( X )] 2 2 2 2 (Ü1.4.5) SS 11 19 Lehrstuhl für Wirtschaftspolitik n Diskrete ZV: var( X ) ( xi E( X ))2 f ( xi ) i 1 g( X ) E [ g( X )] (Ü1.4.6) Stetige ZV: var( X ) ( x E( X ))2 f ( x )dx (Ü1.4.7) Je höher die Varianz, desto „breiter“ ist die Verteilung. SS 11 20 Lehrstuhl für Wirtschaftspolitik Wenn a und c konstant sind und Z = a + cX, dann ist Z eine Zufallsvariable mit einer Varianz von: var(a cX ) E[(a cX ) E( a cX )] c var(X ) 2 2 (Ü1.4.8) Ableitung: var(a cX ) E[(a cX ) E( a cX )]2 E[(a cX )2 2( a cX )E( a cX ) ( E( a cX ))2 ] E[ a2 2acX c2 X 2 2( a cX )(a cE( X ))( a cE( X ))2 ] ... c2 [ E( X 2 ) ( E( X ))2 ] c2 var(X ) SS 11 21 Lehrstuhl für Wirtschaftspolitik Addition einer Konstanten beeinflusst die Varianz der ZV nicht Multiplikation mit einer Konstanten modifiziert die Varianz um das Quadrat der Konstanten. Die Wurzel der Varianz ist die Standardabweichung, , die auch als Streuungsmaß von Wahrscheinlichkeitsverteilungen genutzt wird. Sie hat den Vorteil, dass sie in derselben Einheit gemessen wird wie die Zufallsvariable. SS 11 22 Lehrstuhl für Wirtschaftspolitik Zwei weitere Maße zur Charakterisierung einer Verteilung sind: Schiefe: beschreibt die „Neigungsstärke“ bzw. den Symmetriegrad der Verteilung. Symmetrische Verteilungen haben eine Schiefe von 0. Kurtosis: beschreibt die „Spitzigkeit“. Je größer die Kurtosis, desto mehr Ausprägungen sind um den Mittelwert konzentriert. Die Benchmark ist ein Wert von 3, die Kurtosis der Normalverteilung. SS 11 23 Lehrstuhl für Wirtschaftspolitik Ü1.3.4 Erwartungswerte mehrerer Zufallsvariablen Wenn X und Y Zufallsvariablen sind mit gemeinsamer Wahrscheinlichkeitsfunktion f(x, y), und g(X, Y) ist eine Funktion von X und Y, dann gilt: E [ g( X ,Y )] g( x , y ) f ( x , y ) x y (Ü1.4.9) SS 11 24 Lehrstuhl für Wirtschaftspolitik Daraus folgt: E(X + Y) = E(X) + E(Y) (Ü1.4.10) Ableitung: E( X Y ) ( x y ) f ( x, y ) x f ( x, y ) y f ( x, y ) x y x y x y x f ( x, y ) y f ( x, y ) x f ( x ) y f ( y ) x y y x x y E( X ) E( Y ) Analog kann man zeigen, dass für eine durch a und b gewichtete Summe zweier Zufallsvariablen X und Y gilt: E[aX + bY] = aE(X) + bE(Y) SS 11 (Ü1.4.11) 25 Lehrstuhl für Wirtschaftspolitik Wenn X und Y Zufallsvariablen sind, dann gilt auch für Funktionen von X und Y: E[g(X) + f(Y)] = E[g(X)] + E[f(Y)] (Ü1.4.12) Eine besondere Anwendung davon ist die Kovarianz zwischen den Zufallsvariablen X und Y. Es sei: g(X, Y) = (X – E(X))(Y – E(Y)) SS 11 (Ü1.4.13) 26 Lehrstuhl für Wirtschaftspolitik Die Kovarianz zwischen X und Y wird dann definiert als: cov(X, Y) =XY = E[(X – E(X))(Y – E(Y))] = E(XY) – E(X)E(Y) = E(XY) - XY (Ü1.4.14) D.h., die Kovarianz ist der Erwartungswert des Produkts von X minus Erwartungswert und Y minus Erwartungswert. Am Vorzeichen der Kovarianz lässt sich ablesen, ob im Durchschnitt die beiden Zufallsvariablen positiv oder negativ zusammenhängen. SS 11 27 Lehrstuhl für Wirtschaftspolitik cov(X, Y) > 0: wenn x größer ist als der Durchschnitt, dann tendiert y auch dazu, größer als der Durchschnitt zu sein. Wenn x kleiner ist als der Durchschnitt, dann tendiert auch y dazu, kleiner zu sein als der Durchschnitt; cov(X, Y) < 0: wenn x größer ist als der Durchschnitt, dann tendiert y dazu, kleiner zu sein als der Durchschnitt. Die Höhe der Kovarianz kann allerdings nicht interpretiert werden, da sie z.B. mit der Einheit der betrachteten Variablen schwankt. SS 11 28 Lehrstuhl für Wirtschaftspolitik Dieser Mangel kann behoben werden, indem die Kovarianz über die Einzel-Standardabweichungen „standardisiert“ wird Korrelation, : XY var( X ) var( Y ) X Y cov( X ,Y ) SS 11 (Ü1.4.15) 29 Lehrstuhl für Wirtschaftspolitik Der Korrelationskoeffizient, , misst den Grad des linearen Zusammenhangs zwischen zwei Zufallsvariablen. Im Gegensatz zur Kovarianz liegen die Werte für zwischen –1 und +1. Dadurch werden die Zusammenhänge zwischen Zufallsvariablen vergleichbar. Bei perfekt positiv linearem Zusammenhang nimmt den Wert + 1 an, bei perfekt negativ linearem Zusammenhang – 1. Je größer der absolute Wert von , umso stärker ist der Zusammenhang. SS 11 30 Lehrstuhl für Wirtschaftspolitik Für statistisch unabhängige Variablen gilt: = 0. ABER: Zwei Zufallsvariablen mit = 0 müssen nicht automatisch statistisch unabhängig voneinander sein. Wenn X, Y und Z Zufallsvariablen und a, b und c Konstanten sind, dann gilt: var[aX bY cZ ] a 2 var[ X ] b 2 var[Y ] c 2 var[Z ] 2ab cov[ X ,Y ] 2ac cov[ X , Z ] 2bc cov[Y , Z ] (Ü1.4.16) SS 11 31 Lehrstuhl für Wirtschaftspolitik Wenn X, Y und Z statistisch unabhängige oder unkorrelierte Zufallsvariablen sind, dann sind ihre Kovarianzen gleich null, so dass: var[aX bY cZ ] a var[X ] b var[Y ] c var[Z ] 2 2 2 Wenn X, Y und Z statistisch unabhängige oder unkorrelierte Zufallsvariablen sind und wenn a = b = c =1, dann gilt: var[ X Y Z ] var[ X ] var[Y ] var[Z ] SS 11 32 Lehrstuhl für Wirtschaftspolitik Die Varianz einer Summe entspricht nur dann der Summe der Varianzen, wenn die Zufallsvariablen statistisch unabhängig oder unkorreliert sind. Ü1.4 Beispiele wichtiger Verteilungen Bisher: allgemeine Diskussion von Zufallsvariablen und ihren Verteilungen. In der Realität haben sich jedoch bestimmte Verteilungen als nützlich erwiesen. Für uns sind die folgenden vor allem für Hypothesentests wichtig. SS 11 33 Lehrstuhl für Wirtschaftspolitik Ü1.4.1 Die Normalverteilung Wenn Zufallsvariablen Dichtefunktion normalverteilt glockenförmig und sind, verläuft symmetrisch um ihre den Erwartungswert der Verteilung. Die Lage der Normalverteilung wird durch den Erwartungswert und ihre Varianz 2 beschrieben. Aufgrund ihrer Symmetrie ist die Schiefe = 0, ihre Kurtosis beträgt 3. Die Kurzform zur Charakterisierung der Verteilung der Zufallsvariable X ist: X N(,2) SS 11 (Ü1.5.1) 34 Lehrstuhl für Wirtschaftspolitik Die Dichtefunktion ist über den gesamten realen Wertebereich definiert und lautet: ( x )2 f(x) exp , x 2 2 2 2 1 Problem der Normalverteilung: Die Fläche (Ü1.5.2) unter der Dichtefunktion lässt sich nicht einfach berechnen, nur abschätzen. Außerdem ist die Vergleichbarkeit von zwei normalverteilten SS 11 35 Lehrstuhl für Wirtschaftspolitik Variablen dadurch eingeschränkt, dass sie sich sowohl in ihrer Lage als auch in ihrer Streuung unterscheiden können. Lösung: Transformation der normalverteilten Zufallsvariable X in die standardnormalverteilte Zufallsvariable Z mit = 0 und Varianz 2 = 1: Z X N(0, 1) SS 11 (Ü1.5.3) 36 Lehrstuhl für Wirtschaftspolitik Quelle: Hill, Griffiths, Lim (2008), S. 494 SS 11 37 Lehrstuhl für Wirtschaftspolitik Da die (kumulative) Verteilungsfunktion von standardnormalverteilten Variablen so häufig verwendet wird, wurde ein eigenes Zeichen dafür eingeführt: ( z ) P( Z z ) Aufgrund der Symmetrie liegt die eine Hälfte der Wahrscheinlichkeitsmasse rechts, die andere Hälfte links von 0, und es gilt: P(Z > a) = P(Z < -a). SS 11 38 Lehrstuhl für Wirtschaftspolitik Die Zufallsvariable Z liegt innerhalb einer Standardabweichung, , um den Erwartungswert mit einer Wahrscheinlichkeit von ca. 68 % (2 : ca. 95 %, 3 : ca. 99 %). Wenn X N(,2) und a und b sind Konstanten, dann gilt: a X b P[ a X b ] P b a b a P Z SS 11 (Ü1.5.4) 39 Lehrstuhl für Wirtschaftspolitik Beispiel: Gegeben sei X N(3, 9). Beschreibe mit Hilfe der Table 1: P(4 X 6). Da 43 9 = 0,33 und 6 3 9 = 1, ergibt sich P( 4 X 6 ) P( 0,33 Z 1 ) ( 1 ) ( 0,33 ) 0,8413 0,6293 0,2120 SS 11 40 Lehrstuhl für Wirtschaftspolitik Quelle: Hill, Griffiths, Lim (2008), S. 572 SS 11 41 Lehrstuhl für Wirtschaftspolitik Wichtig! Jede lineare Funktion einer normalverteilten Zufallsvariable ist normalverteilt: Wenn X1 N(1, 12 ), X2 N(2, 22 ), X3 N(3, 32 ) und c1, c2, c3 Konstanten sind, dann gilt: Z c1 X 1 c 2 X 2 c 3 X 3 N[E(Z), var(Z)] (Ü1.5.5) mit E(Z) = c1 E(X1) + c2 E(X2) + c3 E(X3) = c1 1 + c2 2 + c3 3 (Ü1.5.6) SS 11 42 Lehrstuhl für Wirtschaftspolitik Wenn X1, X2 und X3 statistisch unabhängig voneinander sind, dann ist: var( Z ) c12 var( X 1 ) c 22 var( X 2 ) c32 var( X 3 ) (Ü1.5.7) Wenn X1, X2 und X3 nicht statistisch unabhängig voneinander sind, dann gilt var(Z ) c12 var(X1 ) c22 var(X2 ) c32 var(X3 ) 2c1c2 cov(X1 , X2 ) 2c1c3 cov(X1 , X3 ) 2c2c3 cov(X2 , X3 ) (Ü1.5.8) SS 11 43 Lehrstuhl für Wirtschaftspolitik Ü1.4.2 Die Chi-Quadrat-Verteilung Chi-Quadrat-Zufallsvariablen entstehen, wenn standard- normalverteilte Zufallsvariablen quadriert werden. Es seien Z1, Z2,..., Zm m unabhängige N(0, 1) Zufallsvariablen. Dann gilt: V Z Z ... Z 2 1 2 2 2 m 2 (m) (Ü1.5.9) Dies bedeutet, dass die Zufallsvariable V Chi-Quadrat-verteilt ist mit m Freiheitsgraden, wobei die Höhe der Freiheitsgrade die SS 11 44 Lehrstuhl für Wirtschaftspolitik Anzahl der unabhängigen N(0, 1)-verteilten und quadrierten Zufallsvariablen Z angibt. Der Wert m bestimmt die gesamte Verteilung, insbesondere den Erwartungswert und die Varianz (s. Figure B.6): E ( V ) E ( (2m ) ) m var( V ) var( (2m ) ) 2 m (Ü1.5.10) Die Chi-Quadrat-Verteilung konvergiert mit steigendem m zur Normalverteilung. SS 11 45 Lehrstuhl für Wirtschaftspolitik Quelle: Hill, Griffiths, Lim (2008), S. 496 SS 11 46 Lehrstuhl für Wirtschaftspolitik Ü1.4.3 Die t-Verteilung Eine t-verteilte Zufallsvariable entsteht durch die Division einer standardnormalverteilten Zufallsvariable Z N(0, 1) durch die Wurzel einer von Z unabhängigen (!) Chi-Quadrat-verteilten 2 Variable V ( m ) , die wiederum durch ihre Anzahl von Freiheitsgraden dividiert wurde: t Z V / m t(m) SS 11 (Ü1.5.11) 47 Lehrstuhl für Wirtschaftspolitik Die t-Verteilung ist symmetrisch und wird durch ihre Freiheitsgrade m bestimmt: E( t( m ) ) 0 m var( t( m ) ) (m2) Die t-Verteilung hat (Ü1.5.12) dickere Ränder als die Standardnormalverteilung (s. Figure B.7). Sie konvergiert allerdings zur Standardnormalverteilung, wenn m . SS 11 48 Lehrstuhl für Wirtschaftspolitik Quelle: Hill, Griffiths, Lim (2008), S. 497 SS 11 49 Lehrstuhl für Wirtschaftspolitik Ü1.4.4 Die F-Verteilung Eine F-verteilte Zufallsvariable entsteht durch die Division zweier voneinander Zufallsvariablen, unabhängiger, die jeweils Chi-Quadrat-verteilter durch die Anzahl ihrer Freiheitsgrade dividiert wurden: V1 / m1 F V2 / m 2 F( m1 ,m2 ) (Ü1.5.13) Die Werte m1 und m2 bestimmen auch hier die Verteilung. Eine F-Verteilung ist über den Wertebereich von 0 bis definiert. SS 11 50