Vorlesung Gesamtbanksteuerung Mathematische Grundlagen II Dr. Klaus Lukas Carsten Neundorf Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009 1 • Was sollen Sie heute lernen? Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009 2 Agenda • • • • • • • Wiederholung stetige Renditen deskriptive Statistik Verteilungsparameter Erwartsungswert und Varianz Wahrscheinlichkeitsverteilung Konvidenzniveau Testfunktion Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009 3 Stetige Rendite Sind Ss und St zwei Kurswerte eines Wertpapiers oder auch Indexes, so ergibt sich die stetige Rendite als natürlicher Logarithmus des Zuwachsverhältnisses: St rs ,t = ln = ln St − ln S s Ss Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009 4 Die Datenreihen Im Verlaufe der Vorlesung sollen die eingeführten Konzepte jeweils auch auf Echtdaten angewandt werden. Hierfür betrachten wir folgende Indizes: Rentenindex REX Aktienindex DAX Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009 5 Agenda • • • • • • • Wiederholung stetige Renditen deskriptive Statistik Verteilungsparameter Erwartsungswert und Varianz Wahrscheinlichkeitsverteilung Konvidenzniveau Testfunktion Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009 6 Ziele der deskriptiven Statistik Die deskriptive Statistik zielt darauf ab, eine unüberschaubare Datenmenge durch möglichst wenige jedoch noch aussagekräftige Zahlen zu charakterisieren. Im Extremfall mittels lediglich einer Zahl. Weiterhin bietet es sich an, die Daten erstmal graphisch darzustellen. Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009 7 -0,1 Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009 Jan 09 Jan 08 -0,2 -0,3 -0,4 0,3 0,2 0,1 0 -0,2 -0,3 8 Jan 09 Jan 08 Jan 07 Jan 06 Jan 05 Jan 04 Jan 03 Jan 02 Jan 01 Jan 00 Jan 99 Jan 98 Jan 97 Jan 96 Jan 95 Jan 94 -0,1 Jan 07 Renditen Renten Jan 06 Jan 05 Jan 04 Jan 03 Jan 02 Jan 01 Jan 00 Jan 99 Jan 98 Jan 97 Jan 96 Jan 95 Jan 94 Graphische Zeitreihenanalyse Renditen Aktien 0,3 0,2 0,1 0 Grundbegriffe der Statistik • Grundgesamtheit G • Merkmale X •stetige und diskrete Merkmale •Stichprobe und Umfang der Stichprobe n •Ausprägungen des Merkmales x •absolute und relative Häufigkeit •Häufigkeitsfunktion h(x) •Verteilungsfunktion F(x) Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009 9 Häufigkeitsverteilung Renditeverteilung Aktien und Renten 90 80 70 60 50 40 30 20 10 Häufigkeitsverteilung Aktienrenditen Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009 7, 0% 10 ,0 % 13 ,0 % 16 ,0 % 19 ,0 % -2 9, 0% -2 6, 0% -2 3, 0% -2 0, 0% -1 7, 0% -1 4, 0% -1 1, 0% -8 ,0 % -5 ,0 % -2 ,0 % 1, 0% 4, 0% 0 Häufigkeitsverteilung Renten 10 Agenda • • • • • • Wiederholung stetige Renditen deskriptive Statistik Verteilungsparameter Wahrscheinlichkeitsverteilung Konvidenzniveau Testfunktion Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009 11 Lageparameter Der bekannteste Lageparameter ist der Durchschnittswert oder auch das arithmetische Mittel 1 n x = * ∑ xi n i =1 Da jedem Merkmalswert das Gewicht 1/n zugeordnet wird, kann es vorkommen, dass der Mittelwert mit keinem beobachteten Wert übereinstimmt. Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009 12 Lageparameter Ein weiterer Lageparameter, der auch in den Beobachtungswerten enthalten ist, ist der Median. Er ist durch die Eigenschaft definiert, dass mindestens 50% aller Werte kleiner oder gleich sind und mindestens 50% aller Werte auch größer oder gleich sind. Um den Median zu ermitteln, müssen zuerst alle Ausprägungen der Grösse nach sortiert werden. Anschließend errechnet sich der Median wie folgt: x Med = x n 2 +1 Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009 13 Lageparameter Will man nicht den „mittleren“ Wert haben, sondern den p-größten, so kann man die Formel wie folgt abwandeln: q p = x p*n +1 Dies wird das p-Quantil genannt. p ist hierbei immer als %-Zahl anzusehen. Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009 14 Streuungsparameter Unser Ziel ist es, mit möglichst wenigen Kennzahlen eine große Datenmenge zu beschreiben. Am Beispiel der Renditeverteilung der Aktien und der Renten sehen wir aber, dass der Mittelwert die Daten nicht ausreichend beschreibt, da er für beide Datenreihen nahezu identisch bei 0,2% liegt, aber die größten und kleinsten Werte der Aktien deutlich mehr von der Mitte abweichen als die Werte der Renten. Deshalb wird nun ein Maß für die „Streuung“ eingeführt. Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009 15 Streuungsparameter Ein mögliches Maß für diese Streuung ist die mittlere quadratische Abweichung s2, auch empirische Varianz bezeichnet. Als Formel ausgedrückt. n 1 s 2 = ∑ ( xi − x ) 2 n i =1 Hieraus wird dann die Standardabweichung s abgeleitet, indem aus s2 die Wurzel gezogen wird. s = s2 = Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009 1 n 2 ( x − x ) ∑ i n i =1 16 Variationskoeffizient Führt man die beiden Kennzahlen Standardabweichung und Mittelwert zusammen, so erhält man den sogenannten Variationskoeffizient V. s V = x Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009 17 Agenda • • • • • • Wiederholung stetige Renditen deskriptive Statistik Verteilungsparameter Wahrscheinlichkeitsverteilung Konvidenzniveau Testfunktion Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009 18 Wahrscheinlichkeit und Zufallsereignis Bisher haben wir untersucht, wie man gegebene Datenmenge mit wenigen Kennzahlen möglichst einfach beschreiben kann. Ein weiterer Aspekt der Stochastik ist die Beantwortung der Frage, welche Ergebnisse sind in der Zukunft möglich und wie wahrscheinlich sind sie. Damit haben wir schon einen wesentlichen Begriff unbewusst verwendet, die Wahrscheinlichkeit. Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009 19 Wahrscheinlichkeit und Zufallsereignis Die Wahrscheinlichkeit mathematisch exakt zu definieren, ist nicht ganz einfach. Dazu müssen erst noch zwei weitere Begriffe eingeführt werden. Als Zufallsvorgang wird ein Geschehen bezeichnet, bei dem aus einer gegebenen Situation heraus mehrere sich gegenseitig ausschließende Folgesituationen möglich sind und es unsicher ist, welche eintritt. Alle möglichen Folgesituationen werden als Ergebnismenge bezeichnet, eine konkrete Folgesituation als Elementarereignis. Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009 20 Wahrscheinlichkeit und Zufallsereignis Mit der Wahrscheinlichkeit eines Ereignisses A, kurz p(A), wollen wir die Chance für das Eintreten des Ereignisses beschreiben. Mathematisch muss gelten: 1. p ( A) ≥ 0 für jedes Ereignis A 2. p ( sicheres Ereignis ) = 1 3. p ( A1 ∪ A2 ∪ A3 ∪ ) = p ( A1 ) + p ( A2 ) + p ( A3 ) + Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009 21 Wahrscheinlichkeit und Zufallsereignis Wir definieren p ( A) = Anzahl der für A günstigen Fälle Anzahl aller mögllichen Fälle und als Gegenwahrscheinlichkeit q(A) q ( A) = 1 − p ( A) die Wahrscheinlichkeit, dass A nicht eintritt. Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009 22 diskrete Zufallsvariable Ordnet man den Ergebnissen eines Zufallsvorgangs Zahlen (Realisationen) zu, so erhält man eine Zufallsvariable. Ein Beispiel: zweimal Würfel. Die möglichen Ergebnisse bestehen aus den 36 Zahlenpaaren ω=(i,j), 1≤i,j≤6. Für die Variable X=„Summe der Augenzahlen“ erhält man zu jedem Ergebnis (i,j) den Wert x=i+j. X wird dann zu einer Zufallsvariable mit der Ergebnismenge {2,3,…,12}. Es interessieren dann Ergebnisse wie {X=4}=„Die Augenzahl ist 4“ Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009 23 diskrete Zufallsvariable Dies lässt sich durch die ursprünglichen Ergebnisse (i,j) ausdrücken. Es gilt {X=4}={(1,3),(2,2),(3,1)} Um die Wahrscheinlichkeit dieses Ereignisses zu berechnen, führt man dies auch wieder auf die ursprünglichen Ergebnisse zurück. P( X = 4) = P(1,3) + P(2,2) + P(3,1) = Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009 3 1 = 36 12 24 Diskrete Zufallsvariable Eine Zufallsvariable X heißt diskret, falls sie nur endlich oder abzählbar unendlich viele Werte x1,x2, …,xk,… annehmen kann. Die Wahrscheinlichkeitsverteilung von X ist gegeben durch die Wahrscheinlichkeiten: P ( X = xi ) = p i , i = 1,2, , k , Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009 25 Wahrscheinlichkeitsfunktion Die Wahrscheinlichkeitsfunktion f(x) einer diskreten Zufallsvariablen X ist für x∈ℜ definiert als P( X = xi ) = pi f ( x) = 0, x = xi ∈ {x1 , x2 , , xk , } sonst Durch die Wahrscheinlichkeitsverteilung bzw. –funktion ist auch die Verteilungsfunktion F(x)=P(X≤x) gegeben. F ( x) = P( X ≤ x) = ∑ f (x ) i:xi ≤ x Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009 i 26 Lageparameter diskreter Zufallsvariablen Ebenso, wie bei der Analyse von Kennzahlen, können auch für diskrete Zufallsvariable Erwartungswert, Varianz und Standardabweichung berechnet werden. Der Erwartungswert errechnet sich mit Hilfe der Wahrscheinlichkeitsverteilung wie folgt: E ( X ) = x1 p1 + + xk pk + = ∑ xi pi i ≥1 und mit Hilfe der Wahrscheinlichkeitsfunktion f(x) E ( X ) = x1 f ( x1 ) + + xk f ( xk ) + = ∑ xi f ( xi ) i ≥1 Statt E(X) findet auch das Symbol µ Verwendung. Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009 27 Lageparameter diskreter Zufallsvariablen Die Varianz einer diskreten Zufallsvariable ist σ 2 = Var ( X ) = ( x1 − µ ) 2 p1 + + ( xk − µ ) 2 pk + = ∑ ( xi − µ ) 2 f ( xi ) i ≥1 Die Standardabweichung ist σ = Var ( X ) Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009 28 Lageparameter diskreter Zufallsvariablen Erwartungswert 18,00% eine Standardabweichung 16,00% 14,00% 12,00% 10,00% 8,00% 6,00% 4,00% 2,00% 0,00% 2 3 4 Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009 5 6 7 8 9 10 11 12 29 Agenda • • • • • • Wiederholung stetige Renditen deskriptive Statistik Verteilungsparameter Diskrete Zufallsvariablen Stetige Zufallsvariablen Testfunktion Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009 30 stetige Zufallsvariablen 50,00% 45,00% 40,00% 35,00% 30,00% 25,00% 20,00% 15,00% 10,00% 5,00% 0,00% -5,0% -4,0% -3,0% -2,0% -1,0% 0,0% 1,0% 2,0% Häufigkeitsverteilung Renten 3,0% 4,0% 5,0% In den bisherigen Untersuchungen haben Zufallsvariablen untersucht, die eine feste Zahl von Wahrscheinlichkeiten haben. Die Wahrscheinlichkeit, dass ein Ereignis zwischen zwei Werten liegt, kann man dann an der Fläche der Balken ablesen. Teilt man die Balken feiner ein, kann man das immer noch an der Fläche der Balken ablesen. Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009 31 stetige Zufallsvariablen 18,00% 16,00% 14,00% 12,00% 10,00% 8,00% 6,00% 4,00% 2,00% -5 ,0 0% -4 ,5 0% -4 ,0 0 -3 % ,5 0% -3 ,0 0 -2 % ,5 0% -2 ,0 0 -1 % ,5 0% -1 ,0 0 -0 % ,5 0% 0, 00 % 0, 50 % 1, 00 % 1, 50 % 2, 00 % 2, 50 % 3, 00 % 3, 50 % 4, 00 % 4, 50 % 5, 00 % 0,00% Führt man diesen Prozess fort und lässt die Breite immer mehr gegen null gehen, so nähert sich die Fläche dem Integral unter der Funktion an. Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009 32 stetige Zufallsvariablen Diese Überlegungen führen zur folgenden Definition von stetigen Zufallsvariablen, wobei gleichzeitg die Dichtefunktion f(x) definiert wird: Eine Zufallsvariable X heißt stetig, wenn es eine Funktion f(x)≥0 gibt, so dass für jedes Intervall [a,b] b P(a ≤ X ≤ b) = ∫ f ( x) dx a gilt. Die Funktion f(x) heißt Wahrscheinlichkeitsdichte von X oder einfach nur Dichte. Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009 33 stetige Zufallsvariablen Noch ein paar Eigenschaften: P ( a ≤ X ≤ b) = P (a < X ≤ b) = P ( a ≤ X < b) = P (a < X < b) und P ( X = x) = 0 für alle x ∈ ℜ ∞ ∫ f ( x)dx = 1 −∞ Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009 34 stetige Zufallsvariablen Aus der Definition von Dichten erhält man für die Verteilungsfunktion F(x)=P(X≤x)=P(-∞<X ≤x) x F ( x) = P( X ≤ x) = ∫ f (t )dt −∞ d.h. F(x) ist die Stammfunktion der Dichte. Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009 35 Lageparameter stetiger Zufallsvariablen Der Erwartungswert E(X) einer stetigen Zufallsvariable X mit Dichte f(x) ist µ = E( X ) = ∞ ∫ xf ( x) dx −∞ Die Varianz Var(X) einer stetigen Zufallsvariable X mit Dichte f(x) ist ∞ σ 2 = Var ( X ) = ∫ ( x − µ ) 2 f ( x) dx. −∞ σ = Var ( X ) wird Standardabweichung genannt. Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009 36 Median und Quantile Für 0<p<1 ist das p-Quantil xp die Zahl auf der xAchse, für die F(xp)=p gilt. Der Median xmed ist das 50%-Quantil, es gilt als F(xmed)=1/2. Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009 37 Die Normalverteilung Eine Zufallsvariable X heißt normalverteilt mit Parametern µ∈ℜ und σ2>0, kurz X∼N(µ, σ2), wenn sie die Dichte f ( x) = (x − µ)2 exp − 2σ 2 2πσ 1 , x ∈ ℜ besitzt. Es gilt Var(X)=σ2 E(X)=µ, Speziell für µ=0, σ2=1 erhält man die Standardnormalverteilung N(0,1) mit der Dichte f ( x) = Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009 1 exp − x 2 2π 2 1 38 Die Normalverteilung Welche Eigenschaften hat diese Verteilung? 1. Sie ist symmetrisch zu µ, d.h. es gilt f(µ-x)=f(µ+x) 2. Die Normalvertielung hat Glockenform mit dem Maximum an der Stelle µ und den Wendepunkten bei µ±σ. 3. Je größer σ, desto schneller fällt die Kurve gegen 0. Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009 39 Die Normalverteilung Die Verteilungsfunktion lässt sich nicht analytisch berechnen und durch bekannte Funktionen in geschlossener Form schreiben. Deshalb muss F(x) durch numerische Verfahren berechnet werden. Entsprechende Tabellen sind in den Kalkulationsprogrammen enthalten. Wichtige Quantile für Standardnormalverteilung sind ebenfalls in den Programmen vorberechnet und in Tabellen hinterlegt. Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009 40 Die Normalverteilung Zentrale Schwankungsintervalle Für k=1 ist P(µ-σ≤X ≤ µ+σ)=68,27% Für k=2 ist P(µ-2σ≤X ≤ µ+2σ)=95,45% Für k=3 ist P(µ-3σ≤X ≤ µ+3σ)=99,73% Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009 41