Platzhalter für Bild, Bild auf Titelfolie hinter das Logo einsetzen Mathematische Grundlagen Prof. Dr. Marc Gürtler/ Dipl.-Wirt.-Inf. Sabrina Vössing Mathematische Grundlagen • Erwartungswert • Varianz • Kovarianz • Korrelation • lineare Regression • Logarithmen • Normalverteilung • Starkes Gesetz der großen Zahlen • Tschebyscheffsche Ungleichung Prof. Dr. Marc Gürtler/ Dipl.-Wirt.-Inf. Sabrina Vössing | Mathematische Grundlagen| Seite 2 Erwartungswert Beispiel: 2 Wertpapierrenditen in 3 verschiedenen Zuständen s(1) s(2) s(3) p(j) 20 % 30 % 50 % r 1( j ) −6 % 13 % 10 % r (2 j ) 8% −12 % 7% Der Erwartungswert einer diskreten Zufallsvariable (ZV) berechnet sich als: J E(X) = ∑ p ⋅ X ( j) j =1 ( j) 3 Hier: E(r) = ∑ p( j) ⋅ r ( j) j =1 Also: E(r1 ) = 0,2 ⋅ ( −6%) + 0,3 ⋅ 13% + 0,5 ⋅ 10% = 7,7% E(r2 ) = 0,2 ⋅ (8%) + 0,3 ⋅ −12% + 0,5 ⋅ 7% = 1,5% Prof. Dr. Marc Gürtler/ Dipl.-Wirt.-Inf. Sabrina Vössing | Mathematische Grundlagen| Seite 3 Graphische Interpretation: Der Erwartungswert „hält alles in der Waage“. Prof. Dr. Marc Gürtler/ Dipl.-Wirt.-Inf. Sabrina Vössing | Mathematische Grundlagen| Seite 4 Es gilt: E(X + Y) = E(X) + E(Y) E(a + b ⋅ X) = a + b ⋅ E(X) E(X ⋅ Y) 2 = E(X) ⋅ E(Y) + Cov(X,Y) E(X ) = E(X ⋅ X) E2 (X) = E(X) ⋅ E(X) Bei n linear unabhängigen und identisch verteilten Beobachtungen, nimmt man als empirische Schätzung für den Erwartungswert das arithmetische Mittel der Beobachtungen. Voraussetzung: R1 ,R2 ,...,RT seien unabhängig und identisch verteilte Zufallsvariablen Die Schätzfunktion M für den Erwartungswert der Zufallsvariablen lautet: 1 T M = ∑ Rt T t =1 (ebenfalls eine Zufallsvariable!) Prof. Dr. Marc Gürtler/ Dipl.-Wirt.-Inf. Sabrina Vössing | Mathematische Grundlagen| Seite 5 Die Schätzfunktion ist erwartungstreu, da ihr Erwartungswert mit dem wahren Parameter übereinstimmt: 1 ⎛1 T ⎞ 1 T E(M) = E ⎜ ⋅ ∑ R t ⎟ = ⋅ ∑ E(R t ) = ⋅ T ⋅ μ = μ T ⎝ T t =1 ⎠ T t =1 Für eine konkrete Stichprobe Punktschätzwert μ̂ : rˆ1,rˆ2, ...,rˆT liefert die Schätzfunktion Meinen 1 T μˆ = ⋅ ∑ rˆt T t =1 Beispiel: t r1,t μˆ = 1 2 3 4 5 -3,6% 8,9% 13,4% -7,1% 12,5% 1 ⋅ ( −3,6 + 8,9 + 13,4 − 7,1 + 12,5) = 4,82% 5 Prof. Dr. Marc Gürtler/ Dipl.-Wirt.-Inf. Sabrina Vössing | Mathematische Grundlagen| Seite 6 Varianz (Streuungskomponente) Die Varianz einer Zufallsvariablen X ist der Erwartungswert der quadrierten Abweichung (X − E(X))2 vom Erwartungswert: Es gilt: Var(X) = E[(X − E(X))2 ] N = ∑ p(i) ⋅ (X − E(X))2 (i) i =1 2 Var(X) = E(X ) − E2 (X) Var(X ( + Y)) = Var(X) ( ) + Var(Y) ( ) + 2 ⋅ Cov(X,Y) ( , ) Var(X − Y) = Var(X) + Var(Y) − 2 ⋅ Cov(X,Y) Var(a + b ⋅ X) = b2 ⋅ Var(X) V ( ⋅ X + b ⋅ Y) = a2 ⋅ Var(X) Var(a V (X) + b2 ⋅ Var(Y) V (Y) + 2 ⋅ a ⋅ b ⋅ C Cov(X,Y) (X Y) Var( − X) = Var(X) Prof. Dr. Marc Gürtler/ Dipl.-Wirt.-Inf. Sabrina Vössing | Mathematische Grundlagen| Seite 7 Beispiel: p(j) s(1) s(2) s(3) 20 % 30 % 50 % r 1( j ) −6 % 13 % 10 % r (2 j ) 8% −12 % 7% Var(r1 ) = 0,2 ⋅ ( −0,06 − 0,077)2 + 0,3 ⋅ (0,13 − 0,077)2 + 0,5 ⋅ (0,10 − 0,077)2 = 0,004861 0 004861 Var(r2 ) = 0,2 ⋅ (8% − 1,5%)2 + 0,3 ⋅ ( −12% − 1,5%)2 + 0,5 ⋅ (7% − 1,5%)2 = 0,007825 Prof. Dr. Marc Gürtler/ Dipl.-Wirt.-Inf. Sabrina Vössing | Mathematische Grundlagen| Seite 8 Die positive Quadratwurzel aus der Varianz wird als Standardabweichung σ oder auch als Volatilität bezeichnet: σ(X) := Var(X). Bei T linear unabhängigen und identisch verteilten Beobachtungen, nimmt man als 2 empirische Schätzung für die Varianz die Schätzfunktion V : T 1 V = ⋅ ∑ (R t − M)2 T − 1 t =1 2 Die Schätzfunktion ist erwartungstreu: T 1 ( )= ⋅ E(( ∑ ((R t − M))2 ) E(V T −1 t =1 2 T 1 = ⋅ E( ∑ ((R t − μ ) − (M − μ))2 ) T −1 t =1 T 1 = ⋅ E( ∑ ((R t − μ )2 − 2 ⋅ (R t − μ ) ⋅ (M − μ ) + (M − μ)2 )) T −1 t =1 Prof. Dr. Marc Gürtler/ Dipl.-Wirt.-Inf. Sabrina Vössing | Mathematische Grundlagen| Seite 9 1 ⎛ T ⎞ = ⋅ E ⎜ ∑ (R t − μ )2 − 2 ⋅ T ⋅ (M − μ )2 + T ⋅ (M − μ )2 ⎟ T − 1 ⎝ t =1 ⎠ ⎞ 1 ⎛ ⎛ T ⎞ = ⋅ ⎜ E ⎜ ∑ (R t − μ )2 ⎟ − E(T ⋅ (M − μ )2 ) ⎟ T − 1 ⎝ ⎝ t =1 ⎠ ⎠ ⎞ 1 ⎛ ⎛ T ⎞ = ⋅ ⎜ E ⎜ ∑ (R t − μ )2 ⎟ − (T ⋅ Var(M)) ⎟ T − 1 ⎝ ⎝ t =1 ⎠ ⎠ T 1 ⎛ ⎛ T 1 ⎛ ⎞⎞ 2⎞ = ⋅ ⎜ E ⎜ ∑ (R t − μ ) ⎟ − ⎜ T ⋅ 2 Var( ∑ R t ) ⎟ ⎟ T − 1 ⎝ ⎝ t =1 t =1 ⎠ ⎝ T ⎠⎠ 1 ⎛ ⎛ T ⎛1 T ⎞⎞ 2⎞ = ⋅ ⎜ E ⎜ ∑ (R t − μ ) ⎟ − ⎜ ⋅ ∑ Var(R t ) ⎟ ⎟ (*) T − 1 ⎠ ⎝ T t =1 ⎠⎠ ⎝ ⎝ t =1 1 ⎛ Var(R) ⎞ ⋅ ⎜ T ⋅ Var(R) − T ⋅ ⎟ (*) T − 1 T ⎝ ⎠ = ( ) = σ2 = Var(R) (*): Die Rt sind identisch und unabhängig verteilt. Prof. Dr. Marc Gürtler/ Dipl.-Wirt.-Inf. Sabrina Vössing | Mathematische Grundlagen| Seite 10 Für eine konkrete Stichprobe rˆ1,rˆ2 ,...,rˆT liefert die Schätzfunktion einen T 1 σˆ = ⋅ ∑ (rˆt − μˆ )2 T − 1 t =1 Punktschätzer: Beispiel: 2 t r1,t 1 2 3 4 5 -3,60% 8,90% 13,40% -7,10% 12,50% μˆ = 4,82% 1 ⋅ (( −0,036 − 0,0482)2 + (0,089 − 0,0482)2 + (0,134 − 0,0482)2 4 + ( −0,071 − 0,0482)2 + (0,125 − 0,0482)2 ) = 0,0090557 0 0090557 σˆ 2 = Prof. Dr. Marc Gürtler/ Dipl.-Wirt.-Inf. Sabrina Vössing | Mathematische Grundlagen| Seite 11 Kovarianz Die Kovarianz zweier Zufallsvariablen X und Y ist definiert als: Cov(X,Y) = E[(X − E(X)) ⋅ (Y − E(Y)] N = ∑ p(i) ⋅ (X(i) − E(X)) ⋅ (Y (i) − E(Y)) i =1 Cov(X,Y) = E(X ⋅ Y) − E(X) ⋅ E(Y) Es gilt: Cov(a, X) =0 ( + b ⋅ X,c , + d ⋅ Y)) = b ⋅ d ⋅ Cov(X,Y) ( , ) Cov(a Cov(X + Y,Z) = Cov(X,Z) + Cov(Y,Z) Cov(X − Y,Z) = Cov(X,Z) − Cov(Y,Z) Cov(X, X) = Var(X) Cov(X,Y) = Cov(Y, X) Prof. Dr. Marc Gürtler/ Dipl.-Wirt.-Inf. Sabrina Vössing | Mathematische Grundlagen| Seite 12 X und Y heißenunkorreliert ⇔ Cov(X, Y) = 0 X und Y sind stochastisch unabhängig ⇒ X und Y sind unkorreliert Beispiel: p(j) s(1) s(2) s(3) 20 % 30 % 50 % r 1( j ) −6 % 13 % 10 % r (2 j ) 8% −12 % 7% Cov(r1 ,r 2 ) = 0,2 ⋅ ( −0,06 − 0,077) ⋅ (0,08 − 0,015) + 0,3 ⋅ (0,13 − 0,077) ⋅ ( −0,12 − 0,015) + 0,5 ⋅ (0,10 − 0,077) ⋅ (0,07 − 0,015) = −0,003295 Prof. Dr. Marc Gürtler/ Dipl.-Wirt.-Inf. Sabrina Vössing | Mathematische Grundlagen| Seite 13 Bei T linear unabhängigen und identisch verteilten Beobachtungen, nimmt man als 2 empirische Schätzung für die Kovarianz die Schätzfunktion C : T 1 C = ⋅ ∑ (X t − M(X)) ⋅ (Y t − M(Y)) mit X t , Y t i.i.d. T − 1 t =1 2 p distributed unabhängig g g und identisch verteilt i.i.d. − identical independent Für konkrete Stichproben rˆ1,1,rˆ1,2 ,...,rˆ1,T rˆ2,1,rˆ2,2 ,...,rˆ2,T 2 liefert die Schätzfunktion C einen Punktschätzwert σˆ r ,,r 1 2 T 1 = ⋅ ∑ (rˆ1,t − μˆ(rˆ1,t )) ⋅ (rˆ2,t −μˆ(rˆ2,t )) T − 1 t =1 Beispiel: t 1 2 3 4 5 r1,t r2,t -3,6% 3 6% 8 9% 8,9% 13 4% 13,4% -7,1% 7 1% 12 5% 12,5% 10,2% 16,7% -5,9% 8,2% 1,5% μˆ 1 = 4,82% μˆ 2 = 6,14% Prof. Dr. Marc Gürtler/ Dipl.-Wirt.-Inf. Sabrina Vössing | Mathematische Grundlagen| Seite 14 σˆ 1,2 = 1 ⋅ (( −0,036 − 0,0482) ⋅ (0,102 − 0,0614) 4 + (0,089 (0 089 − 0 0,0482) 0482) ⋅ (0 (0,167 167 − 0 0,0614) 0614) + (0,134 − 0,0482) ⋅ ( −0,059 − 0,0614) + ( −0,071 − 0,0482) ⋅ (0,082 − 0,0614) + (0,125 (0 125 − 0 0,0482) 0482) ⋅ (0 (0,015 015 − 0 0,0614)) 0614)) = −0,00386485 Korrelation Der Korrelationskoeffizient ρ gibt die Stärke der linearen Abhängigkeit zwischen zwei Zufallsvariablen an. Er berechnet sich als: ρ(X,Y) = Cov(X,Y) Var(X) ⋅ Var(Y) = σ X,Y σ X ⋅ σY Prof. Dr. Marc Gürtler/ Dipl.-Wirt.-Inf. Sabrina Vössing | Mathematische Grundlagen| Seite 15 Es gilt: − 1 ≤ ρ(X,Y) ≤ 1 Ist ρ(X,Y) = 1,sobesteht einperfekter positiver linearer Zusammenhang zwischen Xund Y, etwa :Y = m ⋅ X + n mit m > 0. 0 Ist ρ(X,Y) = −1,sobesteht einperfekter negativer linearer Zusammenhang zwischen Xund Y, etwa :Y = m ⋅ X + n mit m < 0. , ) = 0,sobesteht , keinlinearer Zusammenhang g zwischen Xund Y,, Ist ρ((X,Y) eskannaber beispielsweise durchaus einperfekter quadratischer Zusammenhang 2 zwischen Xund Y bestehen,etwa :Y = X . | ρ(X,Y) |= 1⇔ X = a ⋅ Y + b fast sicher (mit Wahrscheinlichkeit1) a > 0 ⇔ ρ(X,Y) (X Y) > 0 a < 0 ⇔ ρ(X,Y) < 0 a = 0 ⇔ ρ(X,Y) = 0 Prof. Dr. Marc Gürtler/ Dipl.-Wirt.-Inf. Sabrina Vössing | Mathematische Grundlagen| Seite 16 Beispiel: t 1 2 3 4 5 r1,t r2,t 2t -3,6% 8,9% 13,4% -7,1% 12,5% 10 2% 10,2% 16 7% 16,7% -5 5,9% 9% 8 2% 8,2% 1 5% 1,5% σˆ 1 = 0,0090557 = 0,095161441 σˆ 2 = 0,0074683 0 0074683 = 0 0,086419326 086419326 σˆ 1,2 = −0,00386485 ⇒ ρ1,2 = −0,00386485 ≈ −0,47 0 47 0,095161441⋅ 0,086419326 Die lineare Regressionsanalyse Modell: Y = α + β ⋅ X + ε Y - abhängige ZV mit ε ∼ N(0, σ2 ) − "Störterm" X - unabhängige ZV α, β - zu schätzende Parameter Schätzung der Regressionsfunktion: Ermittlung der Parameter α und β über die Methode der kleinsten Quadrate (Least-Squares-Schätzung) Prof. Dr. Marc Gürtler/ Dipl.-Wirt.-Inf. Sabrina Vössing | Mathematische Grundlagen| Seite 17 Also: Suche nach α und β , sodass mit der Regressionsfunktion der Zusammenhang zwischen X und Y möglichst „gut“ beschrieben wird. ⇒ T ∑ (ε ) 2 t =1 t → min! α,β Anschaulich kann man sich vorstellen, dass man X und Y als Koordinaten von Punkten auffassen und in ein Koordinatensystem einzeichnen kann. Dann sucht man die Gerade, Gerade die diese Punktwolke am besten annähert (Regressionsgerade). (Regressionsgerade) Y Regressionsgerade β 1 Einheit α X Prof. Dr. Marc Gürtler/ Dipl.-Wirt.-Inf. Sabrina Vössing | Mathematische Grundlagen| Seite 18 Es ergibt sich nach Durchführung der linearen Regression: 1 T 1 T α = ∑ Yt − β ⋅ ⋅ ∑ Xt = μ Y − β ⋅ μ X T t =1 T t =1 β= Cov(X,Y) a( ) Var(X) Regressionskoeffizient Natürlicher Logarithmus ln(x) ist Umkehrfunktion von e y x Es gilt: ln(a) = b ⇔ a = eb ln(x ⋅ y) = ln(x) + ln(y) ln(x : y) = ln(x) − ln(y) ex ln(x) 1 1 ln(ab ) = b ⋅ ln(a) f(x) = ln(x) ⇒ f '(x) = 1 für alle x ≠ 0 x Prof. Dr. Marc Gürtler/ Dipl.-Wirt.-Inf. Sabrina Vössing | Mathematische Grundlagen| Seite 19 x Normalverteilung Dichte der Normalverteilung: f(x) = 1 2πσ Erwartungswert 2 e − ( x −μ )2 2 σ2 Varianz X ∼ N((μ, σ2 ) Standardnormalverteilung: σ Y ∼ N(0,1) N(0 1) μ Prof. Dr. Marc Gürtler/ Dipl.-Wirt.-Inf. Sabrina Vössing | Mathematische Grundlagen| Seite 20 Mit der Standardisierungsformel: Y = normalverteilte ZV X ∼ N(μ X , σ2X ) X − μX transformiert man eine σX in eine Standardnormalverteilung Y ∼ N(0,1). Transformation σX 1 μX I t X eine Ist i beliebige b li bi ZV ZV, h heißt ißt F(x) F( ) := prob(X b(X < x)) 0 die Verteilungsfunktion von X. gilt: Es g - F(x) ( ) ist monoton steigend: g x1 ≤ x 2 ⇒ F(x ( 1 ) ≤ F(x ( 2) - F( −∞ ) = 0 F( +∞ ) = 1. Die Verteilungsfunktion der Standardnormalverteilung wird in der Literatur häufig mit Φ(x) bezeichnet In der Vorlesung mit N(x) bezeichnet. N(x). Es gilt :N( − x) = 1 − N(x). Prof. Dr. Marc Gürtler/ Dipl.-Wirt.-Inf. Sabrina Vössing | Mathematische Grundlagen| Seite 21 Starkes Gesetz der großen Zahlen Sei X1 , X2 ,... eine Folge von reellwertigen, unabhängigen Zufallsvariablen mit 1 n 2 E(Xi ) = μ und Var(Xi ) = σ < ∞ , dann konvergiert ∑ (Xi − E(Xi )) n i=1 fast sicher gegen 0. Fast sicher heißt dabei mit einer Wahrscheinlichkeit von Eins. Notation: fs − lim Eine Folge (Xi )i=1,2,... von ZV konvergiert mit Wahrscheinlichkeit Eins gegen X0 , wenn gilt: prob(lim Xi = X0 ) = 1. i→∞ ( ) Das heißt: prob lim Xn = μ = 1. n →∞ Prof. Dr. Marc Gürtler/ Dipl.-Wirt.-Inf. Sabrina Vössing | Mathematische Grundlagen| Seite 22 Tschebyscheffsche Ungleichung Diese Ungleichung braucht keine spezielle Verteilung als Voraussetzung. Die Zufallsvariable X muss lediglich eine endliche Varianz besitzen. Dann gilt für jedes ε > 0 : prob(| p (| X − E(X) ( ) |≥ ε ) ≤ Var(X) . ε2 Prof. Dr. Marc Gürtler/ Dipl.-Wirt.-Inf. Sabrina Vössing | Mathematische Grundlagen| Seite 23