Mathematische Grundlagen

Werbung
Platzhalter für Bild, Bild auf Titelfolie hinter das Logo einsetzen
Mathematische Grundlagen
Prof. Dr. Marc Gürtler/ Dipl.-Wirt.-Inf. Sabrina Vössing
Mathematische Grundlagen
• Erwartungswert
• Varianz
• Kovarianz
• Korrelation
• lineare Regression
• Logarithmen
• Normalverteilung
• Starkes Gesetz der großen Zahlen
• Tschebyscheffsche Ungleichung
Prof. Dr. Marc Gürtler/ Dipl.-Wirt.-Inf. Sabrina Vössing | Mathematische Grundlagen| Seite 2
Erwartungswert
Beispiel: 2 Wertpapierrenditen in 3 verschiedenen Zuständen
s(1)
s(2)
s(3)
p(j)
20 %
30 %
50 %
r 1( j )
−6 %
13 %
10 %
r (2 j )
8%
−12 %
7%
Der Erwartungswert einer diskreten Zufallsvariable (ZV) berechnet sich als:
J
E(X) = ∑ p ⋅ X
( j)
j =1
( j)
3
Hier: E(r) = ∑ p( j) ⋅ r ( j)
j =1
Also:
E(r1 ) = 0,2 ⋅ ( −6%) + 0,3 ⋅ 13% + 0,5 ⋅ 10%
= 7,7%
E(r2 ) = 0,2 ⋅ (8%) + 0,3 ⋅ −12% + 0,5 ⋅ 7%
= 1,5%
Prof. Dr. Marc Gürtler/ Dipl.-Wirt.-Inf. Sabrina Vössing | Mathematische Grundlagen| Seite 3
Graphische Interpretation:
Der Erwartungswert „hält alles in der Waage“.
Prof. Dr. Marc Gürtler/ Dipl.-Wirt.-Inf. Sabrina Vössing | Mathematische Grundlagen| Seite 4
Es gilt: E(X + Y)
= E(X) + E(Y)
E(a + b ⋅ X) = a + b ⋅ E(X)
E(X ⋅ Y)
2
= E(X) ⋅ E(Y) + Cov(X,Y)
E(X )
= E(X ⋅ X)
E2 (X)
= E(X) ⋅ E(X)
Bei n linear unabhängigen und identisch verteilten Beobachtungen, nimmt man als
empirische Schätzung für den Erwartungswert das arithmetische Mittel der Beobachtungen.
Voraussetzung: R1 ,R2 ,...,RT seien unabhängig und identisch verteilte Zufallsvariablen
Die Schätzfunktion M für den Erwartungswert der Zufallsvariablen lautet:
1 T
M = ∑ Rt
T t =1
(ebenfalls eine Zufallsvariable!)
Prof. Dr. Marc Gürtler/ Dipl.-Wirt.-Inf. Sabrina Vössing | Mathematische Grundlagen| Seite 5
Die Schätzfunktion ist erwartungstreu, da ihr Erwartungswert mit dem wahren
Parameter übereinstimmt:
1
⎛1 T
⎞ 1 T
E(M) = E ⎜ ⋅ ∑ R t ⎟ = ⋅ ∑ E(R t ) = ⋅ T ⋅ μ = μ
T
⎝ T t =1 ⎠ T t =1
Für eine konkrete Stichprobe
Punktschätzwert μ̂ :
rˆ1,rˆ2, ...,rˆT liefert die Schätzfunktion
Meinen
1 T
μˆ = ⋅ ∑ rˆt
T t =1
Beispiel:
t
r1,t
μˆ =
1
2
3
4
5
-3,6%
8,9%
13,4%
-7,1%
12,5%
1
⋅ ( −3,6 + 8,9 + 13,4 − 7,1 + 12,5) = 4,82%
5
Prof. Dr. Marc Gürtler/ Dipl.-Wirt.-Inf. Sabrina Vössing | Mathematische Grundlagen| Seite 6
Varianz
(Streuungskomponente)
Die Varianz einer Zufallsvariablen X ist der Erwartungswert der quadrierten
Abweichung (X − E(X))2 vom Erwartungswert:
Es gilt:
Var(X) = E[(X − E(X))2 ]
N
= ∑ p(i) ⋅ (X − E(X))2
(i)
i =1
2
Var(X)
= E(X ) − E2 (X)
Var(X
( + Y))
= Var(X)
( ) + Var(Y)
( ) + 2 ⋅ Cov(X,Y)
( , )
Var(X − Y)
= Var(X) + Var(Y) − 2 ⋅ Cov(X,Y)
Var(a + b ⋅ X)
= b2 ⋅ Var(X)
V ( ⋅ X + b ⋅ Y) = a2 ⋅ Var(X)
Var(a
V (X) + b2 ⋅ Var(Y)
V (Y) + 2 ⋅ a ⋅ b ⋅ C
Cov(X,Y)
(X Y)
Var( − X)
= Var(X)
Prof. Dr. Marc Gürtler/ Dipl.-Wirt.-Inf. Sabrina Vössing | Mathematische Grundlagen| Seite 7
Beispiel:
p(j)
s(1)
s(2)
s(3)
20 %
30 %
50 %
r 1( j )
−6 %
13 %
10 %
r (2 j )
8%
−12 %
7%
Var(r1 ) = 0,2 ⋅ ( −0,06 − 0,077)2 + 0,3 ⋅ (0,13 − 0,077)2 + 0,5 ⋅ (0,10 − 0,077)2
= 0,004861
0 004861
Var(r2 ) = 0,2 ⋅ (8% − 1,5%)2 + 0,3 ⋅ ( −12% − 1,5%)2 + 0,5 ⋅ (7% − 1,5%)2
= 0,007825
Prof. Dr. Marc Gürtler/ Dipl.-Wirt.-Inf. Sabrina Vössing | Mathematische Grundlagen| Seite 8
Die positive Quadratwurzel aus der Varianz wird als Standardabweichung σ
oder auch als Volatilität bezeichnet: σ(X) := Var(X).
Bei T linear unabhängigen und identisch verteilten Beobachtungen, nimmt man als
2
empirische Schätzung für die Varianz die Schätzfunktion V :
T
1
V =
⋅ ∑ (R t − M)2
T − 1 t =1
2
Die Schätzfunktion ist erwartungstreu:
T
1
( )=
⋅ E(( ∑ ((R t − M))2 )
E(V
T −1
t =1
2
T
1
=
⋅ E( ∑ ((R t − μ ) − (M − μ))2 )
T −1
t =1
T
1
=
⋅ E( ∑ ((R t − μ )2 − 2 ⋅ (R t − μ ) ⋅ (M − μ ) + (M − μ)2 ))
T −1
t =1
Prof. Dr. Marc Gürtler/ Dipl.-Wirt.-Inf. Sabrina Vössing | Mathematische Grundlagen| Seite 9
1
⎛ T
⎞
=
⋅ E ⎜ ∑ (R t − μ )2 − 2 ⋅ T ⋅ (M − μ )2 + T ⋅ (M − μ )2 ⎟
T − 1 ⎝ t =1
⎠
⎞
1 ⎛ ⎛ T
⎞
=
⋅ ⎜ E ⎜ ∑ (R t − μ )2 ⎟ − E(T ⋅ (M − μ )2 ) ⎟
T − 1 ⎝ ⎝ t =1
⎠
⎠
⎞
1 ⎛ ⎛ T
⎞
=
⋅ ⎜ E ⎜ ∑ (R t − μ )2 ⎟ − (T ⋅ Var(M)) ⎟
T − 1 ⎝ ⎝ t =1
⎠
⎠
T
1 ⎛ ⎛ T
1
⎛
⎞⎞
2⎞
=
⋅ ⎜ E ⎜ ∑ (R t − μ ) ⎟ − ⎜ T ⋅ 2 Var( ∑ R t ) ⎟ ⎟
T − 1 ⎝ ⎝ t =1
t =1
⎠ ⎝ T
⎠⎠
1 ⎛ ⎛ T
⎛1 T
⎞⎞
2⎞
=
⋅ ⎜ E ⎜ ∑ (R t − μ ) ⎟ − ⎜ ⋅ ∑ Var(R t ) ⎟ ⎟
(*) T − 1
⎠ ⎝ T t =1
⎠⎠
⎝ ⎝ t =1
1 ⎛
Var(R) ⎞
⋅ ⎜ T ⋅ Var(R) − T ⋅
⎟
(*) T − 1
T
⎝
⎠
=
( ) = σ2
= Var(R)
(*): Die Rt sind identisch und unabhängig verteilt.
Prof. Dr. Marc Gürtler/ Dipl.-Wirt.-Inf. Sabrina Vössing | Mathematische Grundlagen| Seite 10
Für eine konkrete Stichprobe rˆ1,rˆ2 ,...,rˆT liefert die Schätzfunktion einen
T
1
σˆ =
⋅ ∑ (rˆt − μˆ )2
T − 1 t =1
Punktschätzer:
Beispiel:
2
t
r1,t
1
2
3
4
5
-3,60% 8,90% 13,40% -7,10% 12,50%
μˆ = 4,82%
1
⋅ (( −0,036 − 0,0482)2 + (0,089 − 0,0482)2 + (0,134 − 0,0482)2
4
+ ( −0,071 − 0,0482)2 + (0,125 − 0,0482)2 )
= 0,0090557
0 0090557
σˆ 2 =
Prof. Dr. Marc Gürtler/ Dipl.-Wirt.-Inf. Sabrina Vössing | Mathematische Grundlagen| Seite 11
Kovarianz
Die Kovarianz zweier Zufallsvariablen X und Y ist definiert als:
Cov(X,Y) = E[(X − E(X)) ⋅ (Y − E(Y)]
N
= ∑ p(i) ⋅ (X(i) − E(X)) ⋅ (Y (i) − E(Y))
i =1
Cov(X,Y) = E(X ⋅ Y) − E(X) ⋅ E(Y)
Es gilt:
Cov(a, X)
=0
( + b ⋅ X,c
, + d ⋅ Y)) = b ⋅ d ⋅ Cov(X,Y)
( , )
Cov(a
Cov(X + Y,Z)
= Cov(X,Z) + Cov(Y,Z)
Cov(X − Y,Z)
= Cov(X,Z) − Cov(Y,Z)
Cov(X, X)
= Var(X)
Cov(X,Y)
= Cov(Y, X)
Prof. Dr. Marc Gürtler/ Dipl.-Wirt.-Inf. Sabrina Vössing | Mathematische Grundlagen| Seite 12
X und Y heißenunkorreliert ⇔ Cov(X, Y) = 0
X und Y sind stochastisch unabhängig ⇒ X und Y sind unkorreliert
Beispiel:
p(j)
s(1)
s(2)
s(3)
20 %
30 %
50 %
r 1( j )
−6 %
13 %
10 %
r (2 j )
8%
−12 %
7%
Cov(r1 ,r 2 ) = 0,2 ⋅ ( −0,06 − 0,077) ⋅ (0,08 − 0,015)
+ 0,3 ⋅ (0,13 − 0,077) ⋅ ( −0,12 − 0,015)
+ 0,5 ⋅ (0,10 − 0,077) ⋅ (0,07 − 0,015)
= −0,003295
Prof. Dr. Marc Gürtler/ Dipl.-Wirt.-Inf. Sabrina Vössing | Mathematische Grundlagen| Seite 13
Bei T linear unabhängigen und identisch verteilten Beobachtungen, nimmt man als
2
empirische Schätzung für die Kovarianz die Schätzfunktion C :
T
1
C =
⋅ ∑ (X t − M(X)) ⋅ (Y t − M(Y)) mit X t , Y t i.i.d.
T − 1 t =1
2
p
distributed unabhängig
g g und identisch verteilt
i.i.d. − identical independent
Für konkrete Stichproben rˆ1,1,rˆ1,2 ,...,rˆ1,T rˆ2,1,rˆ2,2 ,...,rˆ2,T
2
liefert die Schätzfunktion C einen Punktschätzwert
σˆ r ,,r
1
2
T
1
=
⋅ ∑ (rˆ1,t − μˆ(rˆ1,t )) ⋅ (rˆ2,t −μˆ(rˆ2,t ))
T − 1 t =1
Beispiel:
t
1
2
3
4
5
r1,t
r2,t
-3,6%
3 6%
8 9%
8,9%
13 4%
13,4%
-7,1%
7 1%
12 5%
12,5%
10,2%
16,7%
-5,9%
8,2%
1,5%
μˆ 1 = 4,82%
μˆ 2 = 6,14%
Prof. Dr. Marc Gürtler/ Dipl.-Wirt.-Inf. Sabrina Vössing | Mathematische Grundlagen| Seite 14
σˆ 1,2 =
1
⋅ (( −0,036 − 0,0482) ⋅ (0,102 − 0,0614)
4
+ (0,089
(0 089 − 0
0,0482)
0482) ⋅ (0
(0,167
167 − 0
0,0614)
0614)
+ (0,134 − 0,0482) ⋅ ( −0,059 − 0,0614)
+ ( −0,071 − 0,0482) ⋅ (0,082 − 0,0614)
+ (0,125
(0 125 − 0
0,0482)
0482) ⋅ (0
(0,015
015 − 0
0,0614))
0614))
= −0,00386485
Korrelation
Der Korrelationskoeffizient ρ gibt die Stärke der linearen Abhängigkeit zwischen zwei
Zufallsvariablen an. Er berechnet sich als:
ρ(X,Y) =
Cov(X,Y)
Var(X) ⋅ Var(Y)
=
σ X,Y
σ X ⋅ σY
Prof. Dr. Marc Gürtler/ Dipl.-Wirt.-Inf. Sabrina Vössing | Mathematische Grundlagen| Seite 15
Es gilt:
− 1 ≤ ρ(X,Y) ≤ 1
Ist ρ(X,Y) = 1,sobesteht einperfekter positiver linearer Zusammenhang zwischen Xund Y,
etwa :Y = m ⋅ X + n mit m > 0.
0
Ist ρ(X,Y) = −1,sobesteht einperfekter negativer linearer Zusammenhang zwischen Xund Y,
etwa :Y = m ⋅ X + n mit m < 0.
, ) = 0,sobesteht
,
keinlinearer Zusammenhang
g zwischen Xund Y,,
Ist ρ((X,Y)
eskannaber beispielsweise durchaus einperfekter quadratischer Zusammenhang
2
zwischen Xund Y bestehen,etwa :Y = X .
| ρ(X,Y) |= 1⇔ X = a ⋅ Y + b fast sicher (mit Wahrscheinlichkeit1)
a > 0 ⇔ ρ(X,Y)
(X Y) > 0
a < 0 ⇔ ρ(X,Y) < 0
a = 0 ⇔ ρ(X,Y) = 0
Prof. Dr. Marc Gürtler/ Dipl.-Wirt.-Inf. Sabrina Vössing | Mathematische Grundlagen| Seite 16
Beispiel:
t
1
2
3
4
5
r1,t
r2,t
2t
-3,6%
8,9%
13,4%
-7,1%
12,5%
10 2%
10,2%
16 7%
16,7%
-5
5,9%
9%
8 2%
8,2%
1 5%
1,5%
σˆ 1 = 0,0090557 = 0,095161441
σˆ 2 = 0,0074683
0 0074683 = 0
0,086419326
086419326
σˆ 1,2 = −0,00386485
⇒
ρ1,2 =
−0,00386485
≈ −0,47
0 47
0,095161441⋅ 0,086419326
Die lineare Regressionsanalyse
Modell: Y = α + β ⋅ X + ε
Y - abhängige ZV
mit ε ∼ N(0, σ2 ) − "Störterm"
X - unabhängige ZV
α, β - zu schätzende Parameter
Schätzung der Regressionsfunktion: Ermittlung der Parameter α und β über die Methode
der kleinsten Quadrate (Least-Squares-Schätzung)
Prof. Dr. Marc Gürtler/ Dipl.-Wirt.-Inf. Sabrina Vössing | Mathematische Grundlagen| Seite 17
Also: Suche nach α und β , sodass mit der Regressionsfunktion der Zusammenhang
zwischen X und Y möglichst „gut“ beschrieben wird.
⇒
T
∑ (ε )
2
t =1
t
→ min!
α,β
Anschaulich kann man sich vorstellen, dass man X und Y als Koordinaten von
Punkten auffassen und in ein Koordinatensystem einzeichnen kann. Dann sucht man
die Gerade,
Gerade die diese Punktwolke am besten annähert (Regressionsgerade).
(Regressionsgerade)
Y
Regressionsgerade
β
1 Einheit
α
X
Prof. Dr. Marc Gürtler/ Dipl.-Wirt.-Inf. Sabrina Vössing | Mathematische Grundlagen| Seite 18
Es ergibt sich nach Durchführung der linearen Regression:
1 T
1 T
α = ∑ Yt − β ⋅ ⋅ ∑ Xt = μ Y − β ⋅ μ X
T t =1
T t =1
β=
Cov(X,Y)
a( )
Var(X)
Regressionskoeffizient
Natürlicher Logarithmus
ln(x) ist Umkehrfunktion von e
y
x
Es gilt: ln(a) = b ⇔ a = eb
ln(x ⋅ y) = ln(x) + ln(y)
ln(x : y) = ln(x) − ln(y)
ex
ln(x)
1
1
ln(ab ) = b ⋅ ln(a)
f(x) = ln(x)
⇒
f '(x) =
1
für alle x ≠ 0
x
Prof. Dr. Marc Gürtler/ Dipl.-Wirt.-Inf. Sabrina Vössing | Mathematische Grundlagen| Seite 19
x
Normalverteilung
Dichte der Normalverteilung:
f(x) =
1
2πσ
Erwartungswert
2
e
− ( x −μ )2
2 σ2
Varianz
X ∼ N((μ, σ2 )
Standardnormalverteilung:
σ
Y ∼ N(0,1)
N(0 1)
μ
Prof. Dr. Marc Gürtler/ Dipl.-Wirt.-Inf. Sabrina Vössing | Mathematische Grundlagen| Seite 20
Mit der Standardisierungsformel: Y =
normalverteilte ZV
X ∼ N(μ X , σ2X )
X − μX
transformiert man eine
σX
in eine Standardnormalverteilung Y ∼ N(0,1).
Transformation
σX
1
μX
I t X eine
Ist
i beliebige
b li bi ZV
ZV, h
heißt
ißt F(x)
F( ) := prob(X
b(X < x))
0
die Verteilungsfunktion von X.
gilt:
Es g
- F(x)
( ) ist monoton steigend:
g
x1 ≤ x 2 ⇒ F(x
( 1 ) ≤ F(x
( 2)
- F( −∞ ) = 0
F( +∞ ) = 1.
Die Verteilungsfunktion der Standardnormalverteilung wird in der Literatur häufig mit Φ(x)
bezeichnet In der Vorlesung mit N(x)
bezeichnet.
N(x).
Es gilt :N( − x) = 1 − N(x).
Prof. Dr. Marc Gürtler/ Dipl.-Wirt.-Inf. Sabrina Vössing | Mathematische Grundlagen| Seite 21
Starkes Gesetz der großen Zahlen
Sei X1 , X2 ,... eine Folge von reellwertigen, unabhängigen Zufallsvariablen mit
1 n
2
E(Xi ) = μ und Var(Xi ) = σ < ∞ , dann konvergiert ∑ (Xi − E(Xi ))
n i=1
fast sicher gegen 0.
Fast sicher heißt dabei mit einer Wahrscheinlichkeit von Eins.
Notation: fs − lim
Eine Folge (Xi )i=1,2,... von ZV konvergiert mit Wahrscheinlichkeit Eins gegen X0 , wenn gilt:
prob(lim Xi = X0 ) = 1.
i→∞
(
)
Das heißt: prob lim Xn = μ = 1.
n →∞
Prof. Dr. Marc Gürtler/ Dipl.-Wirt.-Inf. Sabrina Vössing | Mathematische Grundlagen| Seite 22
Tschebyscheffsche Ungleichung
Diese Ungleichung braucht keine spezielle Verteilung als Voraussetzung. Die
Zufallsvariable X muss lediglich eine endliche Varianz besitzen.
Dann gilt für jedes ε > 0 :
prob(|
p
(| X − E(X)
( ) |≥ ε ) ≤
Var(X)
.
ε2
Prof. Dr. Marc Gürtler/ Dipl.-Wirt.-Inf. Sabrina Vössing | Mathematische Grundlagen| Seite 23
Herunterladen