Derivative Finanzinstrumente Klaus Schindler Vorlesung an der Universität des Saarlandes c Sommersemester 2016 Version 16.2 Inhaltsverzeichnis Inhaltsverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1. 1.1. 1.2. 1.2.1. 1.3. 1.3.1. 1.3.2. Derivative Finanzinstrumente Sprechweisen . . . . . . . . . . . Zinsen . . . . . . . . . . . . . . Anleihen . . . . . . . . . . . . . Derivative Finanzinstrumente . Terminkontrakte und Futures . Optionen . . . . . . . . . . . . . 2. 2.1. 2.2. 2.3. 2.3.1. 2.3.2. Arbitragebeziehungen Arbitragefreiheit . . . . . Terminkontrakte . . . . . Optionen . . . . . . . . . Put-Call-Parität . . . . . Konvexitätseigenschaften 3. 3.1. 3.2. 3.3. 3.4. 3.5. 3.6. 3.7. 3.8. 3.9. 3.10. Wahrscheinlichkeitsrechnung Zufall und Ereignisse . . . . . . . . . . σ-Algebren . . . . . . . . . . . . . . . . Wahrscheinlichkeitsmaße . . . . . . . . Zufallsvariablen und Messbarkeit . . . . Verteilung von Zufallsgrößen . . . . . . Approximationen der Normalverteilung Momente einer Zufallsgröße . . . . . . . Bedingte Wahrscheinlichkeit . . . . . . Kovarianz, Korrelation . . . . . . . . . Bedingte Erwartung . . . . . . . . . . . 4. 4.1. 4.1.1. 4.1.2. 4.1.3. 4.1.4. 4.1.5. 4.2. Stochastische Prozesse I Zeitdiskrete stochastische Prozesse . . . . Arithmetische Binomialprozesse . . . . . Arithmetische Trinomialprozesse . . . . . Geometrische Binomialprozesse . . . . . . Allgemeine Irrfahrten . . . . . . . . . . . Binomialprozesse mit zustandsabhängigen σ-Algebren und Information . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Zuwächsen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 . . . . . . 5 5 6 6 8 8 11 . . . . . 17 18 19 22 23 24 . . . . . . . . . . 27 27 28 29 30 34 40 41 44 48 49 . . . . . . . 61 62 63 65 67 69 70 71 4.3. Martingal-Prozesse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 5. 5.1. 5.2. 5.3. 5.4. 5.5. Stochastische Prozesse II Der Wiener-Prozess . . . . . . . . . . . . Stochastische Integration . . . . . . . . . Stochastische Differentialrechnung . . . . Der Aktienkurs als stochastischer Prozess Stochastische Differentiation . . . . . . . 79 79 82 85 89 90 6. BLACK/SCHOLES-Optionsmodell 7. Eine analytische Lösung für europäische Optionen 101 8. 8.1. 8.2. 8.3. Das Binomialmodell für europäische Optionen Aktien ohne Erträge . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Aktien mit stetigen Erträgen . . . . . . . . . . . . . . . . . . . . . . . . . . . . Aktien mit diskreten Erträgen . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 105 108 109 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 9. Amerikanische Optionen 113 Die vorzeitige Ausübung amerikanischer Calls . . . . . . . . . . . . . . . . . . . . . . 116 Put-Call-Parität für amerikanische Optionen . . . . . . . . . . . . . . . . . . . . . . . 118 10. Das Trinomialmodell für amerikanische Optionen 121 11. Optionsmanagement (Portfolio-Insurance) 125 Literaturverzeichnis 131 Anhang 134 A. A.1. A.2. A.3. Integrationstheorie Funktionen von endlicher Variation . . . . . . . . . . . . . . . . . . . . . . . . Riemann-Stieltjes-Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Der Satz von Radon-Nikodym . . . . . . . . . . . . . . . . . . . . . . . . . . . 135 135 136 138 B. B.1. Der Satz von Girsanov 139 Martingal-Darstellungssatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140 C. Portfolio-Strategien 143 D. Der Satz von Taylor 149 K APITEL 1 Derivative Finanzinstrumente Wir stellen in diesem Kapitel zunächst die wichtigsten Finanzinstrumente, die im Rahmen dieser Vorlesung benötigt werden, vor. Zur Vermeidung von Schwierigkeiten gehen wir nur in Ausnahmefällen auf Handelsusancen ein, obwohl diese den Preis eines Finanzinstrumentes entscheidend beeinflussen können. In der Regel vermeiden wir diese Probleme durch Normierungen oder zum Teil unrealistische Vereinbarungen, wie z.B. fehlende Transaktionskosten. Auch in der Praxis finden solche Vereinfachungen statt. Viele derivative Finanzinstrumente sind stark normiert, z.B. in Bezugsgröße, Laufzeit, Terminkurs, Ausübungskurs usw.. Dies vereinfacht den Handel, erhöht damit die Fungibilität und erleichtert die Bewertung der Finanzinstrumente. Für den Kunden maßgeschneiderte, nicht normierte Finanzinstrumente werden als OTC-Derivate (OTC=over the counter) bezeichnet und meist nicht an Terminbörsen gehandelt. Ihre Bewertung erfordert wegen der von der Norm abweichenden Eigenschaften eine geeignete Anpassung der Standardmodelle. 1.1. Sprechweisen Ein Portfolio (Portefeuille) ist die Zusammenfassung mehrerer Finanzinstrumente eines Investors zu einem Gesamtwert. Ein einzelnes Finanzinstrument innerhalb eines Portfolios wird als Position bezeichnet. Hierbei unterscheidet man zwischen einer long und einer short position. Im ersten Fall besteht die Position aus einem gekauften, im zweiten Fall aus einem verkauften Objekt (z.B. einer verkauften Anleihe oder verkauften Option). Als short selling werden short Positionen bezeichnet, bei denen man sich - unter Einschaltung einer Bank oder eines Brokers - Objekte, die einem nicht gehören, ausleiht und verkauft. Der short seller verpflichtet sich damit gleichzeitig, dem Besitzer der Objekte während der Leihzeit alle anfallenden Erträge und am Ende - durch einen Rückkauf an der Börse - die Objekte zu erstatten. Das Schließen einer Position bedeutet, dass man die Wertentwicklung des Portfolios unabhängig von dieser Position macht. Dies kann durch Verkauf dieser Position oder durch den Abschluss eines genauen Gegengeschäftes geschehen. Als spot price (Marktpreis) bezeichnen wir den Preis, zu dem ein Objekt gegen sofortige Zahlung und sofortige Auslieferung gehandelt wird1 . 1 Dies steht im Gegensatz zum sog. future price in Bemerkung 1.5 iii). Derivative Finanzinstrumente 1. Derivative Finanzinstrumente Kapitel 1 Anleihen 1.2. Zinsen Definition 1.1 Zinsen sind das Entgelt für die zeitweilige Überlassung einer Wertsumme2 . Üblicherweise werden Zinsen zu diskreten Zeitpunkten - den Zinszuschlagsterminen (ZZT) - gutgeschrieben und dann weiterverzinst (Zinseszins). In einer Zinsperiode (=Abstand benachbarter ZZTe) wächst ein Anfangskapital KAnf bei einem Periodenzinssatz ip damit auf KEnd = KAnf · (1 + ip ) Ist speziell ein nomineller Jahreszinssatz i bei ℓ ZZTen pro Jahr gegeben, d.h. liegt ein i Periodenzinssatz ip = vor, wächst ein Anfangskapital KAnf in einem Jahr insbesondere auf ℓ i ℓ KEnd = KAnf · (1 + )ℓ . Im Grenzübergang ℓ −→ ∞, wo jeder Augenblick ein ZZT ist, spricht man von stetiger Verzinsung. Dabei wächst das Anfangskapital in einem Jahr auf KEnd = KAnf · ei . i wird in diesem Fall als stetiger (Jahres-)Zins oder short rate bezeichnet. ❐ Da stetige Zinsen starke Rechenvorteile aufweisen (keine gemischte Zinsrechnung), wird dies bei Finanzderivaten in Zukunft vorausgesetzt. 1.2.1. Anleihen Als erstes Finanzinstrument betrachten wir Anleihen. Sie stellen wegen der vorab festgelegten Laufzeit im Prinzip ein einfaches Beispiel für ein Termingeschäft dar. Definition 1.2 Der Besitzer einer Anleihe (Bond) erhält zu einem zukünftigen Zeitpunkt t⋆ (Fälligkeitszeitpunkt) einen vorher vereinbarten Betrag R, der als Nominal-, Nenn- oder Rückzahlungswert der Anleihe bezeichnet wird. Werden außerdem zu diskreten Zeitpunkten t1 , . . . , tn vor t⋆ zusätzliche Couponzahlungen in Höhe C geleistet, spricht man von einer Couponanleihe, andernfalls von einer Nullcouponanleihe (Zerobond). ❐ Bemerkung 1.3 i) Der Wert At einer Anleihe zum (aktuellen) Zeitpunkt t berechnet sich als Summe aller mit dem Marktzins diskontierten zukünftigen Erträge, die mit der Anleihe verbunden 2 Diese Wertsumme muss nicht zwingend Geldform haben. Man betrachte als Beispiel etwa den Mietzins. 6 c Klaus Schindler SS 2016 Kapitel 1 1.2. Zinsen sind. Geht man von n Couponzahlungen C zu den Zeitpunkten t1 , . . . , tn , einem Nominalwert R zum Fälligkeitszeitpunkt t⋆ und einem (konstanten) stetigen Marktzins i aus, ergibt sich3 −i·(t⋆ −t) At = R · e + n X ℓ=1 C · e−i·(tℓ −t) . (1.1) Hierbei ist deutlich zwischen dem aktuellen (stetigen) Marktzinssatz i und dem nominellen (stetigen) Zinssatz inom der Anleihe zu unterscheiden. Letzterer bezieht sich immer auf den Nominalwert der Anleihe, d.h. der stetige nominelle Periodenzinssatz der Anleihe ist4 inom = ln 1 + C R und wird sich daher u.U. deutlich vom aktuellen Marktzinssatz i unterscheiden. Je nach dem, ob der Kurs der Anleihe unter, über oder gleich dem Rückzahlungswert ist, nennt man die Anleihe unter pari, über pari oder pari 5 . Anders ausgedrückt bedeutet dies, dass die Rendite (= effektiver Zinssatz) einer „sicheren“ Anleihe, bei der alle Zahlungen mit Wahrscheinlichkeit 1 eintreten, gleich dem aktuellen Marktzinssatz ist. Da die Couponzahlungen C und der Rückzahlungswert R bekannt sind, stellt Gleichung (1.1) eine umkehrbar eindeutige Beziehung zwischen dem Marktzins und dem Kurs einer Anleihe her, man spricht daher auch von Kursrechnung. Der Handel mit Anleihen ist daher ein Handel mit Zinssätzen. Gleichung (1.1) zeigt außerdem, dass ein Steigen des Marktzinses zu einem Absinken der Anleihekurse und umgekehrt ein Sinken des Marktzinses zu einem Anstieg der Anleihekurse führt. Im Falle eines Zerobonds wird Gleichung (1.1) besonders einfach. Wegen C = 0 ist der Wert des Zerobonds gleich dem diskontierten Rückzahlungswert ⋆ −t) At = R · e−i·(t (1.2) . Äquivalent hierzu gilt folgende Gleichung für den Marktzins i= ln(At ) − ln(R) t − t⋆ Im Folgenden bezeichnen wir mit At den Kurs eines Zerobonds mit Rückzahlungswert ⋆ 1. Für konstante stetige Zinsen gilt gemäß Gleichung (1.2) die Beziehung At = e−i·(t −t) , 3 Hierbei gehen wir stillschweigend davon aus, dass Zinssatz und Laufzeit die gleiche Zeiteinheit verwenden. Z.B. könnte i ein stetiger Jahreszinssatz sein und die Laufzeit in Jahren gemessen werden. 4 Hierbei wurde vorausgesetzt, dass die Couponzahlungen in regelmäßigem Abstand erfolgen. Ein direkter Vergleich von inom und i macht außerdem nur Sinn, wenn dieser Abstand gleich der bei i verwendeten Zeiteinheit ist. 5 Unter den in der letzten Fußnote erwähnten Voraussetzungen gilt, dass der Anleihekurs genau dann unter pari ist (At < R), wenn inom < i gilt. c Klaus Schindler SS 2016 7 Derivative Finanzinstrumente Grundlagen Derivative Finanzinstrumente 1. Derivative Finanzinstrumente Kapitel 1 Terminkontrakte d.h. At ist der stetige Abzinsungsfaktor für den Zeitraum t⋆ −t. Im Fall zeitabhängiger deterministischer Zinsen i = i(t) gilt analog At = exp − Z t t⋆ (1.3) i(s)ds . In differentieller Form lautet Gleichung (1.3) dA dt = A · i(t) bzw. dA A = i(t) · dt Im Folgenden werden wir, wenn nicht anders erwähnt, von einem konstanten stetigen Zinssatz i und dem Zinsfaktor ei ausgehen. Bei nichtkonstanten Zinsen muss als Abzinsungsfaktor der Preis At eines Zerobond mit dem Nominalwert 1 verwendet werden. ii) Der Kauf bzw. Verkauf einer Anleihe stellt nichts anderes, als das Verleihen bzw. die Aufnahme von Geld zum aktuellen Zinssatz dar. Im Gegensatz zu Zerobonds, bei denen der Verkäufer sich verpflichtet, die gesamten Schulden inklusive Zinsen auf einen Schlag am Ende der Laufzeit zu Zahlen, erfolgen bei Couponanleihen zwischenzeitliche (nominelle!) Zinszahlungen, die vorab durch die Coupons festgelegt sind. Hierdurch wird das Ausfallrisiko verringert6 . Hier weisen Anleihen eine gewisse Ähnlichkeit zu Terminkontrakten, bei denen man zwischen Forwards und Futures (siehe Definition 1.4) unterscheidet, auf. Forward-Kontrakte ähneln Zerobonds, da bei ihnen alle durch den Kontrakt entstandenen Zahlungsverpflichtungen erst am Ende der Laufzeit erfüllt werden. Futures, bei denen während der Laufzeit Marginzahlungen anfallen, besitzen ein reduziertes Ausfallrisiko und ähneln daher Couponanleihen. ❐ 1.3. Derivative Finanzinstrumente Wir definieren nun die wichtigsten derivativen Finanzinstrumente. Die Bezeichnung Finanzderivat rührt daher, dass ihr Wert vom Wert anderer, an der Börse gehandelter Instrumente abhängt. Die dem Derivat zu Grunde liegenden Instrumente bezeichnen wir in Zukunft als underlying. Mathematisch gesehen sind Derivate also Funktionen, deren Inputvariablen als underlying bezeichnet werden. 1.3.1. Terminkontrakte und Futures Die im Folgenden definierten Terminkontrakte zählen zu den einfachsten unbedingten Termingeschäften. Diese müssen - im Gegensatz zu bedingten Termingeschäften wie z.B. Optionen - auf jeden Fall erfüllt werden. 6 Dies führt auch zum Unterschied zwischen effektivem Zinssatz (=Rendite) und nominellem Zinssatz. 8 c Klaus Schindler SS 2016 Kapitel 1 1.3. Derivative Finanzinstrumente Definition 1.4 Ein Terminkontrakt ist ein Vertrag zwischen zwei Parteien, bei dem sich der Käufer bzw. der Verkäufer des Kontraktes heute verpflichtet zu einem festgelegten zukünftigen Zeitpunkt t⋆ ein Objekt zu einem heute vereinbarten Preis K (Terminkurs) zu kaufen (Terminkauf ) bzw. zu verkaufen (Terminverkauf ). VK,t⋆ (St ) bezeichne den Wert dieses Terminkontraktes zum Zeitpunkt t, wobei St den spot price des underlying bezeichne. ❐ Bemerkung 1.5 i) Um sich mit Termingeschäften vertraut zu machen, ist es am einfachsten, zunächst nur den inneren Wert zu betrachten. Dieser gibt den Gewinn/Verlust an, den man bei sofortiger Fälligkeit oder Ausübung des Geschäftes machen würde. Bei einem Terminkauf ist der innere Wert zum Zeitpunkt t gleich St −K, bei einem Terminverkauf gleich K −St . Der pay-off ist speziell der innere Wert des Finanzinstrumentes am Verfallstag t⋆ . Nachfolgende Skizze gibt den pay-off eines Terminkaufs und eines Terminverkaufs in Abhängigkeit vom Preis St⋆ des Underlying an. Pay-off t⋆− K K er in uf S ka m T K Kurs St⋆ T m er in v er k a uf K − S t⋆ −K Man erkennt an den Pay-offs der unterschiedlichen Derivate sehr gut den Unterschied zwischen bedingten und unbedingten Termingeschäften (siehe hierzu etwa Beispiel 1.8 i) im Abschnitt über Optionen). ii) Der Forward Price Ft ist der Terminkurs zum Zeitpunkt t, für den der Wert des Terminkontraktes mit Fälligkeit t⋆ (siehe Satz 2.3) gleich Null ist, d.h. dass VFt ,t⋆ (St ) = 0 gilt. Bei Eröffnung eines Terminkontraktes wählt man den forward price als Terminkurs, so dass beim Kauf keine Zahlung erforderlich ist. Erst im Laufe der Zeit wird der Kontrakt einen positiven oder negativen Wert annehmen, was sich auch darin äußert, dass der forward price vom ursprünglichen forward price (=Terminkurs) abweicht. Offensichtlich gilt Ft⋆ = St⋆ zum Fälligkeitszeitpunkt t⋆ . c Klaus Schindler SS 2016 9 Derivative Finanzinstrumente Grundlagen Derivative Finanzinstrumente 1. Derivative Finanzinstrumente Kapitel 1 Terminkontrakte iii) Futures sind standardisierte Terminkontrakte mit täglichem Verlust- bzw. Gewinnausgleich (Margin), d.h. sie werden von Tag zu Tag erfüllt und nicht erst am Ende der Laufzeit. Hierdurch wird das Erfüllungsrisiko ausgeschlossen bzw. stark gemindert, weil eventuelle Verluste bei den Geschäftspartnern auf die Kursschwankungen eines Tages beschränkt werden7 . Die Größe der täglichen Margin ist gleich der Änderung des Future-Preises. Analog zum Forward Price ist der Future Price dabei der Terminkurs, für den der Wert des Futures gleich Null ist. Forward- und Future-Price stimmen am Ende der Laufzeit mit dem Preis des underlying überein. iv) Die Spekulation (d.h. nicht abgesicherte Position) auf Terminmärkten weist wesentliche Unterschiede zur Spekulation auf den Spotmärkten auf. Z.B. erfordert der Erwerb eines Terminkontraktes keine Anfangszahlung. Dies und die üblicherweise hohe Bezugsgröße versieht den Investor mit einem wesentlich höheren Leverage. v) Da der pay-off negative Werte zulässt, kann der Wert von Terminkontrakten u. U. negativ sein. Bei Optionen werden dagegen durch die Vertragsbedingungen negative Pay-offs vermieden, wodurch eine Option immer einen nichtnegativen Wert besitzt (siehe auch Bemerkung 2.8 (1)). vi) Ein Terminverkauf darf nicht mit einem „short-selling“ verwechselt werden. ❐ Zur Erläuterung des Unterschieds zwischen Forward und Future betrachten wir im folgenden Beispiel zwei fiktive Öl-Terminkontrakte. Beispiel 1.6 Wir betrachten in der folgenden Tabelle die Entwicklung des Ölpreises (in [$/Barrel]) in den Jahren t = 0 bis t = 5, den Future-Preis und die zu leistenden Margins bei jährlichem Settlement8 . Zum Vergleich ist in der letzten Spalte noch ein Terminkontrakt mit Terminkurs K = 22, 04 [$/Barrel] angegeben. Beide Kontrakte sollen zum Zeitpunkt t⋆ = 5 fällig sein. Zeitpunkt t Spotprice St Futureprice Ft 0 1 2 3 4 5 17 18 16 15 14 14 22.04 22.16 18.70 16.64 14.75 14.00 Restlaufzeit T = t⋆ − t 5 4 3 2 1 0 7 Das Verfahren wird als mark-to-market bezeichnet. 8 In der Praxis findet natürlich ein tägliches Settlement statt. 10 c Klaus Schindler SS 2016 Margin Future Forward M = Ft − Ft−1 0 +0.12 −3.46 −2.06 −1.89 −0.75 − − − − − −8.04 Kapitel 1 1.3. Derivative Finanzinstrumente Die Tabelle zeigt, wie durch die zwischenzeitlichen Margins beim Future das Ausfallrisiko im Vergleich zum Forward deutlich reduziert wird. Die Nettosumme der Marginzahlungen liefert gerade liefert gerade die Abschlusszahlung beim Forward. ❐ 1.3.2. Optionen Definition 1.7 Eine Option ist ein Vertrag, der dem Käufer das Recht gibt, ein Objekt (underlying) am Ende oder während eines festen Zeitraumes (Laufzeit) zu einem festgelegten Betrag (Ausübungspreis) zu kaufen (Kaufoption, Call) oder zu verkaufen (Verkaufsoption, Put). Ist die Option erst am Ende der Laufzeit ausübbar, sprechen wir von einer europäischen Option, bei jederzeitiger Ausübbarkeit von einer amerikanischen Option. ❐ Bemerkung 1.8 i) Um sich mit Optionen vertraut zu machen, ist es zunächst wieder am einfachsten, nur den Pay-off, also den inneren Wert der Option zum Fälligkeitszeitpunkt t⋆ zu betrachten. Bei einem gekauften Call bzw. Put mit Ausübungskurs K ist dieser gleich max{St⋆ − K, 0} bzw. max{K − St⋆ , 0} und hat damit folgendes Aussehen: Pay-off − K , } 0 ⋆ a { t S ng m x ll o C l a K Kurs St⋆ −K Pay-off K P ut n lo g m a x { S − K t⋆ ,0 } K c Klaus Schindler SS 2016 Kurs St⋆ 11 Derivative Finanzinstrumente Grundlagen Derivative Finanzinstrumente 1. Derivative Finanzinstrumente Kapitel 1 Optionen Häufig arbeitet man anstelle des pay-off auch mit der sog. Ertrags- oder Gewinnfunktion, wo man den Pay-off noch mit der gezahlten oder erhaltenen Optionsprämie verrechnet. Dies ist finanzmathematisch jedoch unkorrekt, weil hierbei Zahlungen, die zu verschiedenen Zeitpunkten anfallen, ohne Berücksichtigung der Zinswirkung addiert werden. Ein Call short, d.h. der Verkauf einer Kaufoption mit Ausübungskurs K zum Preis C0 , liefert dann folgenden Pay-off bzw. folgende Gewinnfunktion: Pay-off Call short K − m Kurs St⋆ a x { S K − t⋆ ,0 } = m i n{ K , St − ⋆ 0 } Ertrag Call t or sh C0 K Kurs St⋆ ii) Gerade zum ersten Verständnis von Portfolios, die sich aus mehreren Derivaten zusammen setzen, sind pay-off- bzw. Gewinn-Diagramme eine große Hilfe. Wir wollen dies an Hand eines gekauften Straddle demonstrieren. Dies ist eine Position, die sich aus je einem gekauften Call und Put mit gleichem Ausübungskurs K und gleicher Laufzeit zusammensetzt. Das Gewinndiagramm zeigt, dass der Besitzer eines Straddle auf steigende oder fallende Kurse setzt, da nur bei in etwa gleich bleibenden Kursen Verluste eintreten. Bezeichnen wir die Call- bzw. Putprämie mit C0 bzw. P0 , so hat das Gewinndiagramm eines Straddle folgendes Aussehen: 12 c Klaus Schindler SS 2016 Kapitel 1 1.3. Derivative Finanzinstrumente Gewinn/Verlust Straddle ✻ long Put K −P0 −C0 ✲ Kurs St⋆ long Call −(C0 + P0 ) iii) Liegt der Kurs des underlying über dem Ausübungskurs (S > K), so kann der Inhaber eines amerikanischen Call das Objekt statt zum Preis S zu dem günstigeren Preis K erwerben. Das Recht, das der amerikanische Call verbrieft, besitzt zu diesem Zeitpunkt daher mindestens den Wert S − K. Analog hierzu muss der amerikanische Put im Fall K > S mindestens den Wert K − S besitzen (siehe hierzu Bemerkung 2.8 (3) ). Aus diesem Grund wird bei einer ersten Beurteilung von Optionen häufig mit dem inneren Wert gearbeitet. Dieser innere Wert ist gleich max{S − K, 0} bei Calls und max{K − S, 0} bei Puts. Er gibt an, was man jetzt bei Ausübung der Option erhalten würde. Ist der innere Wert einer Option positiv, d.h. ist S > K bei Calls bzw. S < K bei Puts, spricht man von einer Option in-the-money. Gilt S ≈ K ist die Option at-the-money. Im Fall S < K bei Calls bzw. S > K bei Puts, liegt eine out-of-the-money Option vor. Der Betrag, um den der aktuelle Optionspreis den inneren Wert überschreitet, wird als Zeitwert bezeichnet. Schon hier sei darauf hingewiesen, dass der Preis europäischer Optionen unterhalb des inneren Wertes liegen kann (siehe dazu Kapitel 9). iv) Derivative Finanzinstrumente können zur Spekulation, aber auch zur Absicherung (Hedging) verwendet werden. v) Im Gegensatz zu Optionen (contingent claim, limited liability) verpflichten Terminkontrakte (siehe Definition 1.4) zum Kauf oder Verkauf. Optionen werden daher auch als bedingte und Terminkontrakte als unbedingte Termingeschäfte bezeichnet. In diesem Sinne ist ein europäischer Call ein „bedingter Terminkauf“, ein europäischer Put ein „bedingter Terminverkauf“. Da durch die Vertragsbedingungen bei Optionen negative Pay-offs vermieden werden, ergibt sich der Pay-off einer Kauf- bzw. Verkaufsoption, indem man alle negativen Pay-off-Werte beim Terminkauf bzw. -verkauf (Terminkurs = Ausübungskurs) durch 0 ersetzt. c Klaus Schindler SS 2016 13 Derivative Finanzinstrumente Grundlagen Derivative Finanzinstrumente 1. Derivative Finanzinstrumente Kapitel 1 Optionen vi) Neben den Standardoptionen (plain vanilla option) und deren Kombinationen werden zum Teil wesentlich komplexere Optionen am Markt gehandelt. So zum Beispiel (Kurs)wegabhängige Optionen wie - Asiatische Optionen (average rate option): der Ausübungskurs entsteht durch Mittelung über die Kurse des underlying eines bestimmten Zeitraumes - Lookback Optionen: der Ausübungskurs ist das Minimum bzw. Maximum der Kurse des underlying über einen bestimmten Zeitraum - Knockout Optionen: diese liefern eine konstante Zahlung (oder verfallen), wenn das underlying bestimmter Schranken über- oder unterschreitet Ein weiteres Beispiel für solche nicht standardisierte Optionen sind Optionen auf Optionen (compound option), bei denen das underlying selbst eine Option ist. In diesem Zusammenhang sollte beachtet werden, dass viele Finanzgeschäfte einen Optionsanteil besitzen (z.B. Wandelanleihen oder Bezugsrechte bei Aktien). vii) Die Angabe der Optionswerte bezieht sich im folgenden immer auf den Bezug eines Objektes, so dass in der Praxis bei der Optionspreisberechnung noch eine Multiplikation mit einem geeigneten Faktor erfolgen muss. viii) In den nachfolgenden Beweisen werden der Einfachheit halber meistens Aktienoptionen, bei denen das underlying eine Aktie ist, betrachtet. ❐ Variablen der Bewertung und Notationen Zeit: t = aktueller Zeitpunkt (oft auch t = 0), t⋆ = Fälligkeitszeitpunkt des Derivates. Die Laufzeit des betrachteten Geschäftes ist dann T = t⋆ − t. Preis des underlying: S bzw. St , S(t), (S, t) Ausübungskurs (Basispreis) bzw. Terminkurs: K Volatilität des underlying: σ, beschreibt das Schwankungsverhalten des underlying Bestandshaltekosten des underlying: Die Bestandshaltekosten ergeben sich als Summe aller Kosten (inklusive Opportunitätskosten), die der Besitzer des underlying tragen muss, verkleinert um eventuelle Erträge, die der Besitzer eines underlying erhält. Überwiegen im Spezialfall die Erträge die Kosten, ergeben sich daher negative Bestandshaltekosten, d.h. im Fall B < 0 liegen Erträge, im Fall B > 0 Kosten vor! 14 c Klaus Schindler SS 2016 Kapitel 1 1.3. Derivative Finanzinstrumente Wir unterscheiden diskrete Bestandshaltekosten B oder stetige Bestandshaltekosten b. So sind für ein underlying mit stetigen Lagerhaltungskosten ℓ und stetiger Dividendenrendite d (jeweils in %, bezogen auf das underlying) die stetigen Bestandshaltekosten b = i + ℓ − d. Der Zinssatz i stellt hierbei die Opportunitätskosten dar. stetiger Zinssatz: i eur am eur am Optionswerte: CK,t ⋆ und CK,t⋆ bzw. PK,t⋆ und PK,t⋆ bezeichnen die europäischen und amerikanischen Call- bzw. Putwerte mit Ausübungskurs K und Fälligkeitszeitpunkt t⋆ . Insgesamt gilt also Optionspreis = Funktion(St , K, t, t⋆, σ, i) c Klaus Schindler SS 2016 15 Derivative Finanzinstrumente Grundlagen Arbitragebeziehungen Zur Bewertung von Devisen, Zinsen, Wertpapieren, Derivaten und anderen Objekten auf Finanzmärkten sind verschiedene ökonomische Theorien entwickelt worden. Zu erwähnen sind in diesem Zusammenhang die Kaufkraftparitätstheorie für Wechselkurse, die Zinsstrukturtheorie, das CAPM (Capital-Asset-Pricing-Model) und das Black/Scholes-Modell zur Bewertung von Derivaten. Die Aussagen, die in den jeweiligen Modellen hergeleitet werden, basieren – wie alle wissenschaftlichen Modelle – auf bestimmten Denkansätzen. Eines der bekanntesten Grundaxiome, das wir im Folgenden auch stillschweigend voraussetzen, ist z.B., dass sich alle Marktteilnehmer rational verhalten. In den Gleichgewichtsmodellen (wie etwa dem CAPM) werden z.B. die Preise (bzw. Renditen) dadurch bestimmt, dass sie markträumend wirken, d.h. dass das Angebot gleich der aggregierten Nachfrage ist. In der Arbitragetheorie (wie etwa dem Black/Scholes-Modell) geht man davon aus, dass eine Arbitrage (risikoloser Gewinn) nicht möglich ist, da diese sofort1 von den Marktteilnehmern erkannt und über eine Preisanpassung eliminiert würde. In diesem und den nachfolgenden Kapiteln fordern wir diese Arbitragefreiheit und setzen zusätzlich einen perfekt funktionierenden Markt (efficient-market-Hypothese) voraus. Annahme: Der Finanzmarkt funktioniert perfekt, d.h. Soll- und Habenzinsen sind gleich. Es gibt keine Transaktionskosten, keine Steuern, keine Einschränkungen beim short-selling und keine Arbitrage. Alle Wertpapiere sind beliebig teilbar. Die unter diesen Voraussetzungen abgeleiteten Ergebnisse für Optionen und Terminkontrakte, die sich direkt aus den ökonomischen Eigenschaften dieser Finanzgeschäfte ergeben, sind ohne weitere Annahmen gültig. Spätere mathematische Optionspreismodelle müssen diesen Anforderungen genügen, andernfalls sind sie fehlerhaft. Wegen der einfacheren Darstellung gehen wir im folgenden immer davon aus, dass der Zinssatz während der Laufzeit konstant i ist. Ist dies nicht der Fall tritt an die Stelle des Diskontierungsfaktors ⋆ e−iT = e−i(t −t) der entsprechende Wert At eines Zerobonds (s. Bemerkung 1.3 i)). 1 Dies setzt den gleichen Informationsstand bei allen Marktteilnehmern und insbesondere eine unendlich große Informationsgeschwindigkeit voraus. 17 Arbitragebeziehungen K APITEL 2 ARBITRAGEBEZIEHUNGEN Kapitel 2 Terminkontrakte 2.1. Arbitragefreiheit Arbitragebeziehungen Eine zentrale Eigenschaft, die sich aus der Arbitragefreiheit ergibt ist, dass zwei Portfolios, die zu einem bestimmten Zeitpunkt den gleichen Wert haben, auch zu jedem früheren Zeitpunkt wertgleich sein müssen. Genauer gilt folgender Satz. Satz 2.1 Hat ein Portfolio in einem perfekten Markt zu einem Zeitpunkt t⋆ (mit Sicherheit) einen positiven Wert, so gilt dies auch zu jedem früheren Zeitpunkt, sofern das Portfolio nicht von außen verändert werden kann. ❑ Beweis: Bezeichne VP (t) den Wert eines Portfolios P zum Zeitpunkt t und gelte VP (t⋆ ) > 0. Dann ist zu zeigen, dass gilt: ∀t 6 t⋆ : VP (t) > 0 Wir führen den Beweis indirekt, indem wir annehmen, dass VP (t) < 0 zu einem Zeitpunkt t 6 t⋆ gilt. Kauft man Portfolio P zum Zeitpunkt t, so bedeutet dies, dass man den Betrag −VP (t) > 0 erhält. Hält man Portfolio P bis zum Zeitpunkt t⋆ und verkauft es zum Zeitpunkt t⋆ (Dies ist nur möglich, weil es nicht von außen verändert werden kann!), erhält man zusätzlich noch den Betrag VP (t⋆ ) > 0. Insgesamt hat der Kauf des Portfolios einen risikolosen Gewinn zum Zeitpunkt t⋆ in Höhe ⋆ −t) −VP (t) ei(t | {z >0 } + VP (t⋆ ) > 0 | {z } >0 erbracht, was einen Widerspruch zur Arbitragefreiheit darstellt. Bemerkung 2.2 Angewendet wird Satz 2.1 meistens in folgender Form: Für zwei Portfolios A und B, die nicht von außen verändert werden können, gelten in einem perfekten Markt folgende Aussagen: VA (t⋆ ) 6 VB (t⋆ ) =⇒ ∀t 6 t⋆ : VA (t) 6 VB (t) VA (t⋆ ) = VB (t⋆ ) =⇒ ∀t 6 t⋆ : VA (t) = VB (t) Zum Beweis bilde man ein Portfolio P bestehend aus Portfolio B long und Portfolio A short. Dann gilt VP (t⋆ ) = VB (t⋆ ) − VA (t⋆ ) > 0 und es kann Satz 2.1 angewendet werden. ❐ 18 c Klaus Schindler SS 2016 Arbitragebeziehungen Kapitel 2 2.2. Terminkontrakte Satz 2.3 Sei K der Terminkurs eines zum Zeitpunkt t⋆ fälligen Terminkaufs auf ein underlying mit dem Kurs St . Mit VK,t⋆ (St ) bezeichnen wir den Wert des Terminkaufs. a) Fallen während der Laufzeit T =t⋆ −t auf das underlying nur diskrete Bestandshaltekosten2 im Gesamtwert Bt (bezogen auf den Zeitpunkt t) an, so gilt VK,t⋆ (St ) = St − Bt − K· e−iT . (2.1) Der Forward Price Ft ist in diesem Fall gleich Ft = (St −Bt )· eiT . b) Werden stetige Bestandshaltekosten b auf das Objekt vorausgesetzt, so gilt VK,t⋆ (St ) = St · e(b−i)T −K· e−iT (2.2) Der Forward Price Ft ist in diesem Fall gleich Ft = St · ebT . ❑ Beweis: Wir wollen der Einfachheit voraussetzen, dass das underlying eine Aktie mit diskreten Dividenden mit dem Barwert Dt bzw. stetigem Dividendenertrag d (also d = i − b) ist. a) Wir betrachten zum Zeitpunkt t zwei Portfolios A und B mit folgendem Aussehen Portfolio A : Terminkauf der Aktie zum Terminkurs K, fällig zum Zeitpunkt t⋆ . Portfolio B: Kauf einer Aktie. Verkauf eines Zerobonds mit Nominalwert K und eines Zerobonds mit Barwert Dt , Fälligkeitszeitpunkt jeweils t⋆ . Da mit den Dividendenerträgen der Aktie in Portfolio B die Anleihe mit Barwert Bt zurückgezahlt wird, haben beide Portfolios zum Zeitpunkt t⋆ den gleichen Wert, nämlich St⋆ − K. Daher gilt zum Zeitpunkt t ebenfalls die Gleichheit, also VK,t⋆ (St ) = St − Dt − K· e−iT . b) Besitzt die Aktie eine stetige Dividendenrendite d kann ähnlich argumentiert werden. Wieder betrachten wir zwei Portfolios A und B zum Zeitpunkt t, wobei A wie im Beweis von Teil a) gewählt wird. Portfolio B hat folgendes Aussehen Portfolio B: Kauf von e(b−i)T Aktien. Verkauf eines Zerobonds im Nominalwert K. 2 Man beachte, dass Bt < 0 gelten kann. c Klaus Schindler SS 2016 19 Arbitragebeziehungen 2.2. Terminkontrakte ARBITRAGEBEZIEHUNGEN Kapitel 2 Terminkontrakte Arbitragebeziehungen Wird die Dividende direkt in die Aktie reinvestiert, enthält Portfolio B zum Zeitpunkt t⋆ genau eine Aktie. Unter Berücksichtigung der Anleihe hat Portfolio B zum Zeitpunkt t⋆ den Wert St⋆ − K, d.h. den gleichen Wert wie Portfolio A . Daher muss wie in Teil a) die Wertgleichheit der beiden Portfolios zum Zeitpunkt t gelten, also VK,t⋆ (St ) = e(b−i)T ·St − K· e−iT . Bemerkung 2.4 Der Beweis des letzten Satzes zeigt insbesondere, dass Terminkontrakte durch ein Portfolio mit Anleihen und Objekten dupliziert werden können. Im Gegensatz zur dynamischen Duplikation (siehe Kapitel 6) wird der Aufbau des Duplikationsportfolios zu Beginn der Laufzeit festgelegt und beibehalten, unabhängig davon, wie der spätere Kursverlauf aussieht. Entscheidend bei dieser Argumentation ist, dass kein Teil von Portfolio A oder Portfolio B von außen verändert werden kann, wie zum Beispiel bei short-Positionen in amerikanischen Calls oder Puts. ❐ Beispiel 2.5 i) Betrachte den Terminkauf einer 5-Jahres Anleihe, die zum Kurs 900 e gehandelt wird. Der Terminkurs betrage 910 e, die Laufzeit des Kontraktes ein Jahr. Couponzahlungen von 60 e fallen in 6 bzw. 12 Monaten (letztere kurz vor Fälligkeit des Kontraktes) an. Der stetige Jahreszins für 6 bzw. 12 Monate betrage 9% bzw. 10%. In diesem Fall ist 1 St = 900, K = 910, i = 0.10, T = 1, D = 60· e−0.09· 2 +60· e−0.10 = 111.65 Der Wert des Terminkaufs ist dann3 VK,t⋆ (St ) = 900 − 111.65 − 910 e−0.10 = −35.05. Der Käufer dieses Kontraktes erhält also Fall +35.05 e. Der Forward Price Ft beträgt Ft = (St −D)· eiT = 788.35 e· e0.1 = 871.26 e. ii) Betrachte einen Dollar Terminkauf. In diesem Fall liegt ein stetiger Dividendenertrag d in Höhe des amerikanischen Zinssatzes vor. Bezeichnet S den Dollarkurs, i den inländischen Zinssatz, so ist der Forward Price gleich Ft = St · e(i−d)T . Für i>d ergibt sich ein Report St < Ft (Zinsaufschlag), für i<d ergibt sich ein Deport St > Ft (Zinsabschlag)4. ❐ 3 Beim Kauf der Anleihe wird vorausgesetzt, dass keine Stückzinsen anfallen. Andernfalls ist der Wert des Terminkaufs um die entsprechend abgezinste Größe zu verringern, da K um die Stückzinsen erhöht wird. 4 Preisnotiz, nicht Mengennotiz! 20 c Klaus Schindler SS 2016 Arbitragebeziehungen Kapitel 2 2.2. Terminkontrakte Beweis: Nehmen wir an, dass der Future Kontrakt eine Laufzeit von n Tagen besitzt. K bezeichne den Forward Price am Ende des 0-ten Tages (Kontraktbeginn), Fℓ sei der Future Price am Ende des ℓ−ten Tages, ρ der stetige Tageszinssatz5 . Wir konstruieren zwei Portfolios. Portfolio A : Kauf eines Zerobonds mit Nominalwert K und eines Terminkontraktes mit Forward Price K. Fälligkeit jeweils in n Tagen. Portfolio B: Kauf von Futures derart, dass zu Beginn des ℓ−ten Tages genau e(ℓ−n)ρ Futures im Portfolio vorhanden sind (ℓ = 0, 1, . . . , n). Kauf eines Zerobonds mit Nominalwert F0 und Fälligkeit in n Tagen. Wir zeigen nun, dass beide Portfolios zum Zeitpunkt t⋆ den gleichen Wert haben. Am Ende des n-ten Tages (= Verfallszeitpunkt t⋆ ) hat Portfolio A den Wert St⋆ . Der Wert von Portfolio B zum Zeitpunkt t⋆ ergibt sich, indem wir den täglichen Gewinn (Verlust) der Futureposition bis zum n-ten Tag aufzinsen und zur Anleiheposition addieren. Der Gewinn (bzw. Verlust) der e(ℓ−n)ρ Futures am Tag ℓ ist (Fℓ − Fℓ−1 ) e(ℓ−n)ρ , aufgezinst also (Fℓ − Fℓ−1 ) e(ℓ−n)ρ · e(n−ℓ)ρ = Fℓ − Fℓ−1 . Der Gesamtgewinn(/verlust) der Futures am Ende von Tag n ist daher n X ℓ=1 (Fℓ − Fℓ−1 ) = Fn − F0 . Zusammen mit der Anleiheposition hat daher Portfolio B zum Zeitpunkt t⋆ den Wert (Fn − F0 ) + F0 = Fn = St⋆ . Da beide Portfolios zum Zeitpunkt t⋆ den gleichen Wert haben, muss dies auch für den Zeitpunkt 0 gelten. Da die Futures und der Terminkontrakt zu Beginn den Wert 0 haben, liefert die Wertgleichheit der beiden Portfolios K e−nρ = F0 e−nρ und damit K = F0 . Der Beweis des letzten Satzes zeigt, dass bei konstanten Zinsen Forward-Kontrakte mittels Future-Kontrakten mit gleichem Verfallszeitpunkt in einem dynamischen Roll-overVerfahren dupliziert werden können. Das Verfahren soll im folgenden anhand der Ölkontrakte aus Beispiel 1.6 demonstriert werden. 5 Erfolgt das Settlement nicht täglich, sondern in anderen Perioden, läuft der Beweis entsprechend. c Klaus Schindler SS 2016 21 Arbitragebeziehungen Satz 2.6 Ist der Zinssatz während der Laufzeit konstant, so sind Future und Forward Price gleich. ❑ ARBITRAGEBEZIEHUNGEN Kapitel 2 Optionen Beispiel 2.7 Daten: i = 4.2%, ℓ = 1.0%, b = 5.2%, jeweils stetig p.a., t⋆ = 5, jährliches Settlement Spotpreis St , Futurepreis Ft = St ebT . Arbitragebeziehungen t St Ft Futureanzahl ft im Jahr t 0 1 2 3 4 5 17 18 16 15 14 14 22.04 22.16 18.70 16.64 14.75 14.00 e−5i ≈ 0.81 e−4i ≈ 0.85 e−3i ≈ 0.88 e−2i ≈ 0.92 e−i ≈ 0.96 1 Restlaufzeit T =t⋆ −t 5 4 3 2 1 0 Margin total aufgezinst (Ft −Ft−1 ) · ft (Ft −Ft−1 )·ft · eiT 0 +0.12 e−4i −3.46 e−3i −2.06 e−2i −1.89 e−i −0.75 0 +0.12 e−4i e4i −3.46 e−3i e3i −2.06 e−2i e2i −1.89 e−i ei −0.75 −8.04 Zum Zeitpunkt t⋆ =5 ergibt sich als Preis für den Kauf eines Barrel Öls gerade der ursprüngliche Terminkurs K=S0 ebT =22.04 [ $/Barrel ]. Kosten für den Kauf von einem Barrel Öl: Aufgezinste Futurekosten (Margins): 14.00 $ 08.04 $ Total: 22.04 $ ❐ 2.3. Optionen Wir wollen nun mit ähnlichen Methoden Aussagen für Optionen herleiten. Die elementarsten dieser Aussagen geben wir im folgenden Satz ohne Beweis an, da sie eine einfache Übung für den Umgang mit Arbitragetabellen darstellen. Satz 2.8 (Elementareigenschaften von Optionen) Für Optionen gelten folgende elementare Relationen (1) Optionspreise sind nicht-negativ, da eine Ausübung nur stattfindet, wenn es im Interesse des Optionshalters liegt. (2) Zum Verfallszeitpunkt t⋆ besitzen (die ansonsten gleiche) amerikanische und europäische Option denselben Wert, nämlich den inneren Wert. (3) Eine amerikanische Option muss mindestens zu ihrem inneren Wert gehandelt werden. Diese Relation gilt für europäische Optionen im allgemeinen nicht6 . 6 Grund hierfür ist, dass eine europäische Option nur indirekt über ein Termingeschäft zum heutigen Zeitpunkt ausgeübt werden kann. Im Fall eines europäischen Call führt ein Terminverkauf mit Terminkurs K und Fälligkeit t⋆ zu (St ebT −K) e−iT = St e−dT −K e−iT . Der hierbei auftretende Abzinsungsfaktor kann den Optionspreis unter den inneren Wert der Option drücken (siehe hierzu Kapitel 9). 22 c Klaus Schindler SS 2016 Arbitragebeziehungen Kapitel 2 2.3. Optionen OK,t⋆2 (St⋆1 ) > Innerer Wert zum Zeitpunkt t⋆1 = OK,t⋆1 (St⋆1 ) Für europäische Optionen ist diese Aussage im allgemeinen nicht erfüllt. (5) Eine amerikanische Option hat mindestens den gleichen Wert wie die ansonsten identische europäische Option. (6) Calls bzw. Puts sind als Funktion des Ausübungskurses monoton fallend bzw. monoton wachsend. Dies gilt für amerikanische und europäische Optionen. ❑ 2.3.1. Put-Call-Parität Satz 2.9 (Put-Call-Parität für europäische Optionen) Ein Portfolio, das je einen europäischen Call long und einen europäischen Put short enthält, mit gleichem Verfallszeitpunkt t⋆ und Ausübungskurs K auf das gleiche underlying, dupliziert einen Terminkauf mit Terminkurs K und Fälligkeit t⋆ . Insbesondere folgt: a) Fallen während der Optionslaufzeit T =t⋆ −t auf das underlying Bestandshaltekosten mit dem Barwert Bt an, so gilt: CK,t⋆ (St ) − PK,t⋆ (St ) = St − K e−iT −Bt b) Fallen während der Optionslaufzeit T =t⋆ −t auf das underlying stetige Bestandshaltekosten b auf das Objekt an, so gilt: CK,t⋆ (St ) − PK,t⋆ (St ) = St e(b−i)T −K e−iT ❑ Beweis: In beiden Fällen (diskrete/stetige Bestandshaltekosten) betrachten wir folgende Portfolios: Portfolio A : 1.) Kaufe den Call 2.) Verkaufe den Put Portfolio B: 1.) Terminkauf des Objekts zum Terminkurs K, Fälligkeit t⋆ Für den Wert der Portfolios zum Zeitpunkt t⋆ gilt dann: Position 1.) 2.) Summe Portfolio A Portfolio B Wert zum Zeitpunkt t⋆ K < St⋆ K > St⋆ 0 −(K − St⋆ ) St⋆ − K 0 Wert zum Zeitpunkt t⋆ K < St⋆ K > St⋆ St⋆ − K St⋆ − K St⋆ − K Position 1.) Summe St⋆ − K c Klaus Schindler SS 2016 St⋆ − K St⋆ − K 23 Arbitragebeziehungen (4) Bezeichnen OK,t⋆1 und OK,t⋆2 den Wert zweier - bis auf die Laufzeit - gleicher amerikanischer Optionen mit t⋆1 6 t⋆2 , so gilt OK,t⋆1 6 OK,t⋆2 . Dies folgt aus der Ungleichung ARBITRAGEBEZIEHUNGEN Kapitel 2 Optionen Um Arbitragemöglichkeiten zu verhindern, müssen daher beide Portfolios zum Zeitpunkt t den gleichen Wert haben, d.h. es gilt Arbitragebeziehungen CK,t⋆ (St ) − PK,t⋆ (St ) = VK,t⋆ (St ) . Ersetzt man VK,t⋆ (St ) durch den in Satz 2.3 bestimmten Wert (siehe Formel (2.1) bzw. (2.2)), erhält man die Behauptung. Bemerkung 2.10 Man beachte, dass der Beweis des letzten Satzes nur für europäische Optionen funktioniert. Liegen amerikanische Optionen vor, muss mit einer vorzeitigen Ausübung des short gehaltenen Call gerechnet werden. ❐ 2.3.2. Konvexitätseigenschaften Satz 2.11 Der Preis O einer Option (amerikanisch oder europäisch) ist als Funktion des Ausübungskurses konvex, d.h. es gilt OλK1+(1−λ)K2 ,t⋆ (St ) 6 λOK1 ,t⋆ (St ) + (1 − λ)OK2,t⋆ (St ). ❑ Beweis: Es genügt Calls zu betrachten. Für Puts läuft der Beweis analog. Für λ ∈ [0, 1] und K1 < K2 betrachten wir folgendes Portfolio zum Zeitpunkt t: 1) Kaufe λ Calls mit Ausübungskurs K1 2) Kaufe (1−λ) Calls mit Ausübungskurs K2 3) Verkaufe 1 Call mit Ausübungskurs K := λK1 + (1−λ)K2 Dieses Portfolio besitzt zum Zeitpunkt t den Wert λCK1,t⋆ (St ) + (1−λ)CK2 ,t⋆ (St ) − CλK1 +(1−λ)K2 ,t⋆ (St ) Liquidiert man das Portfolio vollständig zu einem beliebigen Zeitpunkt t̃ (etwa im Fall der vorzeitigen Ausübung der short-Position im Fall amerikanischer Optionen), so ergibt sich für den Wert des Portfolios: Position 1) 2) 3) Summe 24 St̃ 6 K1 0 0 0 0 Wert zum Zeitpunkt t̃ K1 < St̃ 6 K K < St̃ 6 K2 λ(St̃ − K1 ) λ(St̃ − K1 ) 0 0 0 −(St̃ − K) λ(St̃ − K1 ) (1−λ)(K2 − St̃ ) c Klaus Schindler SS 2016 K2 < St̃ λ(St̃ − K1 ) (1−λ)(St̃ − K2 ) −(St̃ − K) 0 Arbitragebeziehungen Kapitel 2 2.3. Optionen λCK1 ,t⋆ (St ) + (1−λ)·CK2 ,t⋆ (St ) − CλK1 +(1−λ)K2 ,t⋆ (St ) > 0 Beispiel 2.12 Wir betrachten drei Kaufoptionen auf die SCHMERZBANK A.G. mit gleicher Laufzeit und den Ausübungskursen K1 = 190 , K = 200 , K2 = 220. Die Optionspreise seien Ausübungskurs K1 = 190 K = 200 K2 = 220 Optionspreis 30.6 e 26.0 e 14.4 e Nach dem letzten Satz muss gelten: 2 C ⋆ (St ) 3 K1 ,t + 13 CK2 ,t⋆ (St ) > C 2 K1 + 1 K2 ,t⋆ (St ) 3 3 Diese Bedingung ist verletzt und kann durch folgendes Arbitrageportfolio genutzt werden: 1) Kaufe 2 3 Calls mit Ausübungskurs K1 2) Kaufe 1 3 Calls mit Ausübungskurs K2 3) Verkaufe 1 Call mit Ausübungskurs K := 32 K1 + 31 K2 Zum jetzigen Zeitpunkt liefert dieses Portfolio den Cashflow +0.80 e. Zum Verfalls- bzw. Liquidationszeitpunkt t̃ der Optionen liefert das Portfolio folgenden Payoff: Position 1) 2) 3) Summe St̃ 6 190 0 0 0 0 Wert zum Zeitpunkt t̃ 190 < St̃ 6 200 200 < St̃ 6 220 2 2 (St̃ − 190) (St̃ − 190) 3 3 0 0 0 −(St̃ − 200) 2 1 (St̃ − 190) (220 − St̃ ) 3 3 220 < St̃ − 190) − 220) −(St̃ − 200) 0 2 (St̃ 3 1 (St̃ 3 Das Portfolio liefert für Aktienkurse St̃ zwischen 190 und 220 zusätzlich noch einen positiven Cashflow von maximal 20 3 ❐ e. Satz 2.13 Für zwei europäische Calls (bzw. Puts) mit gleicher Laufzeit, gleichem Verfallsdatum t⋆ und den Ausübungskursen K2 > K1 gilt: 0 6 CK1 ,t⋆ (St ) − CK2 ,t⋆ (St ) 6 e−iT (K2 − K1 ) c Klaus Schindler SS 2016 25 Arbitragebeziehungen Da λ(St̃ − K1 ) > 0 und (1−λ)(K2 − St̃ ) > 0 gilt, ist der Wert des Portfolios zum Zeitpunkt t̃ größer gleich Null. Damit keine Arbitrage möglich ist, muss das Portfolio auch zum Zeitpunkt t einen nichtnegativen Wert besitzen. Es gilt also ARBITRAGEBEZIEHUNGEN Kapitel 2 Optionen bzw. Arbitragebeziehungen 0 6 PK2 ,t⋆ (St ) − PK1 ,t⋆ (St ) 6 e−iT (K2 − K1 ) Sind die Optionswerte als Funktion des Ausübungskurses differenzierbar, folgt speziell −1 6 − e−iT 6 ∂C ∂K 6 0 bzw. 0 6 ∂P ∂K 6 e−iT 6 1 ❑ Beweis: Es genügt, den Beweis für Calls zu führen. Hierzu betrachten wir folgendes Arbitrageportfolio zum Zeitpunkt t: 1) Kaufe einen Call mit Ausübungskurs K2 2) Verkaufe einen Call mit Ausübungskurs K1 3) Kaufe Anleihen im Nominalwert (K2 − K1 ) fällig zum Zeitpunkt t⋆ . Zum Zeitpunkt t⋆ gilt für den Wert des Portfolios: Position 1) 2) 3) Summe Wert zum Zeitpunkt t⋆ St⋆ 6 K1 K1 < St⋆ < K2 K2 6 St⋆ 0 0 St⋆ − K2 0 −(St⋆ − K1 ) −(St⋆ − K1 ) K2 − K 1 K2 − K 1 K2 − K1 K2 − K 1 K2 − St⋆ 0 Der Wert des Portfolios zum Zeitpunkt t⋆ ist offensichtlich nicht-negativ. Folglich muss dies auch für den Wert zum Zeitpunkt t gelten, d.h. e−iT (K2 − K1 ) + CK2 ,t⋆ (St ) − CK1 ,t⋆ (St ) > 0 26 c Klaus Schindler SS 2016 K APITEL 3 Wahrscheinlichkeitsrechnung 3.1. Zufall und Ereignisse Lässt man einen Stein aus 10 m Höhe fallen, so kann mit den Newtonschen Gesetzen der Aufprallzeitpunkt berechnet werden, bevor das Experiment ausgeführt wird. Komplexe Systeme (Aktienkurs zu einem bestimmten Zeitpunkt, Tageshöchsttemperatur an einem bestimmten Ort) lassen sich dagegen nicht exakt (deterministisch) beschreiben, weil der - das System bestimmende - zukünftige Umweltzustand zufällig ist und daher nur ungenau vorausgesagt werden kann, wie sich das System zeitlich entwickelt. Die meisten der in der Natur auftretenden Systeme besitzen diese komplexe innere Struktur, hängen also vom jeweils eintretenden Umweltzustand und damit mehr oder minder stark vom Zufall ab. Sie können nicht befriedigend durch ein deterministisches Modell beschrieben werden. Zur Beschreibung dieser Systeme, die wegen ihrer Komplexität schwer oder nur ungenau gemessen werden können, muss man daher Vermutungen (Prognosen) über den zukünftigen nicht deterministischen, stochastischen Charakter unserer Umwelt abgeben. Genau genommen gibt es keine deterministischen Prozesse. Prozesse dieses Namens haben lediglich die Eigenschaft, dass der Einfluss des Zufalls im Rahmen der Messgenauigkeit des jeweiligen Experimentes vernachlässigt werden kann. Wegen dieser Unmöglichkeit, den zukünftigen Umweltzustand und alle damit verbundenen Größen exakt vorherzusagen, ist man auch nur in der Lage, eine Bandbreite bzw. Teilmenge von möglicherweise eintretenden Umweltzuständen anzugeben. Definition 3.1 Ω bezeichne im Folgenden eine Menge von möglichen Umweltzuständen ω, deren Eintritt nicht vorhersehbar ist. Ein Umweltzustand ω ∈ Ω ist dabei als Zusammenfassung aller Zustände und Konstellationen, welche die betrachteten Größen beeinflussen, zu verstehen. Die Menge Ω wird als Zustands- oder Ergebnisraum, Teilmengen von Ω werden als Ereignisse bezeichnet. Ist ein Zustand ω ∈ Ω eingetreten, so sagen wir, „Das Ereignis A ist eingetreten“, wenn ω ∈ A gilt. Im Fall ω ∈ / A sagt man, „Das Ereignis A ist nicht eingetreten“. Ein Ereignis wird als bekannt bezeichnet, wenn es eingetreten oder nicht eingetreten ist. ❐ Wahrscheinlichkeitsrechnung Kapitel 3 Ereignisse und σ-Algebren 3.2. σ-Algebren Mit dem Eintreten eines Zustandes ω sind nicht nur einzelne Ereignisse sondern auch zusammengesetzte Ereignisse bekannt1 . Sind nämlich A und B bekannte Ereignisse, so gilt dies aus mengentheoretischen Gründen z.B. auch für ∁A, A ∩ B oder A ∪ B. Ein System A von beobachtbaren Ereignissen, das diese mehr oder minder naheliegenden mengentheoretischen Eigenschaften besitzt, wird als σ-Algebra bezeichnet. Genauer definiert man: Wahrscheinlichkeitsrechnung Definition 3.2 Ein System A von Teilmengen der Menge Ω heißt eine σ-Algebra in Ω, wenn es folgende Eigenschaften erfüllt: (A1) Ω ∈ A (A2) A ∈ A =⇒ ∁A ∈ A (A3) A1 , A2 , · · · ∈ A =⇒ ∞ S i=1 Ai ∈ A Ein Paar (Ω, A), bestehend aus einem Zustandsraum Ω und einer σ-Algebra A ⊂ ℘(Ω) wird als Messraum bezeichnet. ❐ Beispiel 3.3 Wir betrachten den Zustandsraum Ω = {KKZ, KZK, ZKK, KZZ, ZZK, ZKZ, KKK, ZZZ}. Interpretiert man die Einzelelemente von Ω als Ergebnis dreier aufeinanderfolgender Münzwürfe, wobei K für Kopf, und Z für Zahl steht, so beschreibt die Teilmenge A := {KKK, KKZ, KZK, KZZ} das Ereignis, dass im ersten Wurf Kopf, die Teilmenge B := {KZK, ZZK, KZZ, ZZZ}, das Ereignis, dass im zweiten Wurf Zahl erscheint. Der Durchschnitt der beiden Ereignisse A ∩ B = {KZZ, KZK} beschreibt dann das Ereignis, dass der 1. Wurf Kopf und der 2. Wurf Zahl geliefert hat. Drei Beispiele für mögliche σ-Algebren in Ω sind: A0 = {∅, Ω} A1 = A2 = 1 ∅, Ω, {KKK, KKZ, KZK, KZZ}, {ZZZ, ZZK, ZKZ, ZKK} ℘(Ω) ❐ I.d.R. sind Ereignisse bekannt, nicht jedoch der eingetretene Zustand ω bzw. das eingetretene Elementarereignis {ω}. Dies führt u.a. zum Begriff der bedingten Wahrscheinlichkeit (siehe hierzu Abschnitt 3.8). 28 c Klaus Schindler SS 2016 Stochastik Kapitel 3 3.3. Wahrscheinlichkeitsmaße Zwar kann man i.A. nicht voraussagen, welche Ereignisse zukünftig eintreten, jedoch ist es oft möglich, eine Einschätzung abzugeben, mit welchen Ereignissen in einer gegebenen σ-Algebra eher zu rechnen ist und welche weniger plausibel sind. Dies wird präzisiert durch die Angabe von Werten zwischen 0 und 1, die man als Wahrscheinlichkeit bezeichnet. Ist A ⊂ Ω ein Ereignis, so bezeichne P(A) im Folgenden immer die (für einen Marktteilnehmer subjektive) Wahrscheinlichkeit dafür, dass das Ereignis A eintritt. Man nennt P ein Wahrscheinlichkeitsmaß. Wiederum aufgrund mengentheoretischer Überlegungen macht es Sinn, von diesem Maß gewisse Eigenschaften zu fordern. Sind z.B. A und B disjunkte Ereignisse, d.h. sind die Mengen A und B disjunkt, sollte P(A ∪B) · = P(A) + P(B) gelten. Außerdem sollte die Wahrscheinlichkeit für alle Ereignisse aus der gegebenen σ-Algebra berechnet werden können. Dies führt zu folgender Definition. Definition 3.4 Sei A eine σ-Algebra im Zustandsraum Ω. Eine Funktion P : A → [0, 1] heißt Wahrscheinlichkeitsmaß auf A, wenn gilt 1.) P(Ω) = 1 2.) P ist σ-additiv, d.h. für jede Folge paarweise disjunkter Mengen A1 , A2 , . . . gilt: P ∞ S · Ai i=1 = ∞ X P(Ai ). i=1 Das Tripel (Ω, A, P) wird als Wahrscheinlichkeitsraum bezeichnet. ❐ Beispiel 3.5 Betrachten wir Beispiel 3.3 mit der Annahme, dass bei jedem Münzwurf die Wahrscheinlichkeit für Kopf p und für Zahl q := 1−p sei. Im Fall der Unabhängigkeit der einzelnen Würfe sind die Wahrscheinlichkeiten der (einelementigen) Elementarereignisse A = {ω} bekannt. Z.B. gilt: P({KKK}) = p3 , P({KZK}) = p2 q, P({ZZZ}) = q 3 Die Wahrscheinlichkeit eines beliebigen Ereignisses A ergibt sich dann nach Eigenschaft 2.) eines Wahrscheinlichkeitsmaßes als Summe der Wahrscheinlichkeiten der in A liegenden Elementarereignisse, d.h., P(A) = X P({ω}). ω∈A Z.B. gilt P({KKK, KKZ, KZK, KZZ}) = p3 + 2p2 q + pq 2 = p was nur eine andere Formulierung dafür ist, dass die Wahrscheinlichkeit für Kopf im ersten Wurf p beträgt. P ist also ein Wahrscheinlichkeitsmaß auf der σ-Algebra A = ℘(Ω). ❐ c Klaus Schindler SS 2016 29 Wahrscheinlichkeitsrechnung 3.3. Wahrscheinlichkeitsmaße Wahrscheinlichkeitsrechnung Kapitel 3 Wahrscheinlichkeitsmaße Bemerkung 3.6 In einem Wahrscheinlichkeitsraum (Ω, A, P) gelten folgende häufig verwendete Eigenschaften (siehe auch das Übungsprogramm). i) 1) P(A∪B) + P(A∩B) = P(A) + P(B) 2) A ⊂ B =⇒ P(A) 6 P(B) 3) A ⊂ B =⇒ P(B\A) = P(B) − P(A) ii) Für eine aufsteigende Folge von Mengen Aℓ Wahrscheinlichkeitsrechnung ∞ ℓ=1 definiert man lim Aℓ := ℓ→∞ ∞ S Aℓ . ℓ=1 Das Wahrscheinlichkeitsmaß P ist „stetig“, d.h. für jede „monoton wachsende“ Folge A1 ⊂ A2 ⊂ A3 . . . von Ereignissen aus A, gilt lim P(Aℓ ) = P(lim Aℓ ) . ℓ→∞ ℓ→∞ iii) Bei der konkreten Bestimmung des Wahrscheinlichkeitsmaßes sind zwei Konzepte zu unterscheiden. Zum einen die subjektive Wahrscheinlichkeit, die angibt, wieviel man auf das Eintreten eines Ereignisses wetten würde und im Gegensatz hierzu die Laplacesche Wahrscheinlichkeit, die über die relative Häufigkeit berechnet wird. ❐ 3.4. Zufallsvariablen und Messbarkeit So elegant und allgemein das Konzept des Wahrscheinlichkeitsraumes gehalten ist2 , so wenig praktikabel erscheint es, da eine vollständige Bestimmung des gesamten Zustandsraumes Ω auf Grund seiner Komplexität i.A. unmöglich oder viel zu aufwändig wäre3 . Man wird sich daher nur auf die Daten bzw. Ereignisse konzentrieren, an denen man wirklich interessiert ist. Diese Größen, wie z.B. Aktienkurse oder Temperaturen, deren Werte direkt vom jeweiligen zufälligen zukünftigen Umweltzustand abhängen, bezeichnet man als Zufallsgrößen. Definition 3.7 Eine Abbildung auf dem Zustandsraum Ω Z:Ω→ R d mit ω 7→ Z(ω) bezeichnet man als Zufallsgröße. Im Fall d=1 spricht man von einer Zufallsvariable. Im Fall d>1 ist Z ein Vektor von Zufallsvariablen, d.h. es gilt Z = (Z1 , . . . , Zd ) und man spricht von einem d-dimensionalen Zufallsvektor. ❐ 2 Dieses grundlegende axiomatische Modell geht auf den russischen Mathematiker Kolmogoroff zurück. 3 Warum bzw. wie sollte man Informationen über die momentane Zahl der Neutrinos sammeln? 30 c Klaus Schindler SS 2016 Stochastik Kapitel 3 3.4. Zufallsvariablen und Messbarkeit Beispiel 3.8 i) Sei (Ω, A) ein Messraum. Einfachstes Beispiel einer Zufallsvariablen ist die Indikatorfunktion A : Ω → einer Menge A ⊂ Ω. Diese Funktion ist definiert durch R A (ω) := 1 falls ω ∈ A 0 falls ω 6∈ A A (ω) ✻ ✛ ω✲ ✲ A Ω Treppenfunktionen (siehe folgende Skizze für eine Treppenfunktion mit n=5 Stufen) sind Linearkombinationen von Indikatorfunktionen, also Funktionen der Form T := n X k=1 αk · Ak R mit αk ∈ , Ak ⊂Ω . α2 ✻T (ω) α5 α1 α3 ✛ A1 ✲✛ ✲✛ A3 ✲✛ A2 A4 ✲✛A5✲ ω✲ Ω α4 ii) Sei Ω := {KKZ, KZK, ZKK, KZZ, ZZK, ZKZ, KKK, ZZZ} wie in Beispiel 3.3. S0 , u und d seien vorgegebene reelle Zahlen mit 0<d<u. Wir definieren Z : Ω → durch: R Z(ω) := S0 ·u3 S0 ·u2d S0 ·ud2 S0 ·d3 falls falls falls falls ω ω ω ω = KKK ∈ {KKZ, KZK, ZKK} ∈ {KZZ, ZZK, ZKZ} = ZZZ Z ist eine Zufallsvariable4 auf dem Zustandsraum Ω. 4 Wählt man S0 als festen Vektor des ❐ Rd liefert das Beispiel einen Zufallsvektor. c Klaus Schindler SS 2016 31 Wahrscheinlichkeitsrechnung 1 Wahrscheinlichkeitsrechnung Kapitel 3 Wahrscheinlichkeitsmaße Statt alle möglichen Ereignisse zu betrachten, wird man seine Aufmerksamkeit auf die Ereignisse konzentrieren, die mit einer gegebenen Zufallsgröße Z zu tun haben. Da auf Grund des vorher schon erwähnten nicht vorhersehbaren stochastischen Charakters unserer Umwelt nur eine Bandbreite von in Frage kommenden zukünftigen Umweltzuständen angegeben werden kann (Ereignisse), ist es bei einer gegebenen ZV Z auch sinnvoller, nach dem Eintreten eines Intervalls von Werten von Z, statt nach dem Eintreten einzelner Werte zu fragen. Von Interesse sind also vor allem die Ereignisse in Ω, für die Z Werte innerhalb eines vorgegebenen Intervalls annimmt, also die Urbilder Wahrscheinlichkeitsrechnung Z −1 (]−∞, x]) = {ω∈Ω | −∞ < Z(ω) 6 x} =: {Z 6 x}. „Beherrschbar“ ist eine Zufallsgröße Z nur, wenn diese Ereignisse beobachtbar bzw. „messbar“ sind, d.h. wenn man die Eintrittswahrscheinlichkeit dieser Ereignisse berechnen kann. Mathematisch bedeutet dies, dass sie im Definitionsbereich des Wahrscheinlichkeitsmaßes liegen, also Elemente der σ-Algebra sein müssen. Diese Messbarkeit ist eine Minimalforderung, die wir in Zukunft von allen Zufallsgrößen verlangen werden. Definition 3.9 Eine Zufallsgröße Z : Ω → ∀x ∈ R d R d heißt5 messbar bzgl. der σ-Algebra A, wenn gilt: : {Z6x} ∈ A. Hierbei ist {Z 6 x} eine Kurznotation für die Menge der Umweltzustände ω∈Ω, die bei der Funktion Z = (Z1 , . . . , Zd ) zu Werten unterhalb von x = (x1 , . . . , xd ) führen, d.h.: {Z 6 x} = {ω∈Ω | Z(ω) 6 x} = {ω∈Ω | Z1 (ω) 6 x1 , . . . , Zd (ω) 6 xd }. Beispiel 3.10 i) Die Indikatorfunktion A (ω) = A :Ω→ ❐ R aus Beispiel 3.8 i) definiert durch 1 falls ω ∈ A 0 falls ω 6∈ A ist genau dann messbar bzgl. einer σ-Algebra A, wenn A ∈ A gilt. Es ist nämlich { 5 A Ω falls 16x 6 x} = ∁A falls 0 6 x < 1 ∅ falls x<0 Da die von den Intervallen in R erzeugte σ-Algebra nach dem französischen Mathematiker E.Borel benannt ist, spricht man auch von einer Borel-messbaren Funktion. Da diese σ-Algebra von rationalen Intervallen erzeugt wird, genügt es, Ereignisse {Z 6 x} mit rationalem x zu untersuchen. 32 c Klaus Schindler SS 2016 Stochastik Kapitel 3 3.4. Zufallsvariablen und Messbarkeit ii) Sei die ZV Z : Ω → Z(ω) := R definiert wie in Beispiel 3.8, d.h. gelte S0 ·u3 S0 ·u2d S0 ·ud2 S0 ·d3 falls falls falls falls ω ω ω ω = KKK ∈ {KKZ, KZK, ZKK} ∈ {KZZ, ZZK, ZKZ} = ZZZ Wahrscheinlichkeitsrechnung Für die Messbarkeit von Z sind die Mengen {ω∈Ω | Z(ω) 6 x} zu bestimmen. Beachtet man, dass wegen 0 < d < u die Relation 0 < S0 ·d3 < S0 ·ud2 < S0 ·u2 d < S0 ·u3 gilt, folgt {Z 6 x} = für {ZZZ} für {KZZ, ZZK, ZKZ, ZZZ} für {KZZ, ZZK, ZKZ, ZZZ, KKZ, KZK, ZKK} für Ω für ∅ S0 ·d3 S0 ·ud2 S0 ·u2 d S0 ·u3 6 6 6 6 x x x x x < S0 ·d3 < S0 ·ud2 < S0 ·u2 d < S0 ·u3 Damit ist Z nicht messbar bzgl. der σ-Algebra A1 = ∅, Ω, {KKK, KKZ, KZK, KZZ}, {ZZZ, ZZK, ZKZ, ZKK} aus Beispiel 3.3, jedoch (trivialerweise) messbar bzgl. der σ-Algebra ℘(Ω). ❐ Bemerkung 3.11 Am einfachsten ist die Messbarkeit einer Zufallsgröße Z dadurch zu garantieren, dass man für A die kleinste σ-Algebra wählt, die von allen Mengen der Form {Z 6 x} erzeugt wird. Man nennt sie die von Z = (Z1 , . . . , Zn ) erzeugte σ-Algebra und schreibt σ(Z) oder σ(Z1 , . . . , Zn ). A enthält nur die Ereignisse (Informationen), die durch Beobachtung der ZV Z1 , . . . , Zn zur Verfügung stehen (Informationseffizienz). In Beispiel 3.10 ii) ist dies die σ-Algebra, die von den Ereignissen {ZZZ}, {KZZ, ZZK, ZKZ, ZZZ} und {KZZ, ZZK, ZKZ, ZZZ, KKZ, KZK, ZKK} erzeugt wird. ❐ Auf folgende häufig gebrauchte Eigenschaften messbarer Funktionen sei kurz hingewiesen. Satz 3.12 ist genau dann A-messbar, wenn eine der folgenden vier äquivalenten a) f : Ω → Bedingungen erfüllt ist: R i) ∀α∈ R : {f 6 α} ∈ A c Klaus Schindler SS 2016 33 Wahrscheinlichkeitsrechnung Kapitel 3 Wahrscheinlichkeitsmaße R : {f > α} ∈ A iii) ∀α∈R : {f > α} ∈ A iv) ∀α∈R : {f < α} ∈ A b) Sind f, g : Ω → R zwei A-messbare Funktionen, so liegen die Mengen {f ii) ∀α∈ < g}, {f 6 g}, {f = g} und {f 6= g} in A. Hierbei ist {f < g} die Kurzdarstellung der Menge {ω∈Ω | f (ω) < g(ω)}. Die übrigen Mengen sind analog zu verstehen. Wahrscheinlichkeitsrechnung c) Alle „algebraisch zulässigen Verknüpfungen“ (z.B. Produkte und Linearkombinationen) messbarer Funktionen liefern wiederum messbare Funktionen. d) Ist (fk )∞ k=1 eine Folge A-messbarer Funktionen auf Ω, so ist jede der folgenden Funk6 tionen A-messbar: i) sup fk k→∞ ii) inf fk k→∞ iii) lim fk ❑ k→∞ Die Charakterisierung von Zufallsvariablen erfolgt überwiegend durch Kenngrößen (Momente) wie Erwartungswert oder Varianz, deren Wert durch Integration der Zufallsgrößen berechnet wird. Diese Integration erfolgt analog zum Riemann-Integral (siehe Bemerkung 3.20). Man definiert zunächst das Integral für Treppenfunktionen und approximiert anschließend die zu integrierende Zufallsgröße durch Treppenfunktionen. Wesentlich ist hierbei folgender Approximationssatz (zum Beweis siehe Anhang Satz A.6). Satz 3.13 Sei f eine messbare Funktion auf dem Messraum (Ω, A). Dann existiert eine Folge (Tn )∞ n=1 messbarer Treppenfunktionen, die punktweise gegen f konvergiert, d.h. für jedes ω∈Ω gilt lim Tn (ω) = f (ω). ❑ n→∞ 3.5. Verteilung von Zufallsgrößen Definition 3.14 Sei Z : Ω → d eine messbare Zufallsgröße auf dem Messraum (Ω, A). Die Eintrittswahrscheinlichkeiten aller zu Z = (Z1 , . . . , Zd ) gehörenden Ereignisse7 wird Wahrscheinlichkeitsverteilung oder (kumulative) Verteilung der Zufallsgröße Z genannt. Die gesamte Verteilung wird bereits durch die Funktion R FZ : R d → [0, 1] x 7→ FZ (x) := P({Z 6 x}) = P({Z1 6 x1 , . . . , Zd 6 xd }), 6 7 Die Funktionen sind dabei punktweise definiert, also z.B. lim fk (x) = lim fk (x). k→∞ k→∞ Dazu gehören z.B. auch Ereignisse der Form {a 6 Z 6 b}, deren Vereinigung usw. 34 c Klaus Schindler SS 2016 Stochastik Kapitel 3 3.5. Verteilung von Zufallsgrößen bestimmt, weswegen FZ als Verteilungsfunktion der Zufallsgröße Z bezeichnet8 wird. FZ (x) gibt an, wie groß die Wahrscheinlichkeit ist, dass Z Werte im d-dimensionalen Intervall (Quader) ] − ∞, x1 ] × · · · × ] − ∞, xd ] annimmt. Ist FZ differenzierbar, so wird FZ′ als Wahrscheinlichkeitsdichte oder kurz Dichte von Z bezeichnet9 . ❐ Beispiel 3.15 definiert wie in Beispiel 3.8 ii) bzw. 3.10 ii). Zur Bestimmung der Sei die ZV Z : Ω → Verteilungsfunktion sind die Werte FZ (x) = P({Z 6 x}) zu bestimmen. Wegen R P(∅) = 0 Wahrscheinlichkeitsrechnung P({ZZZ}) = q 3 P({KZZ, ZZK, ZKZ, ZZZ}) = q 3 + 3pq 2 P({KZZ, ZZK, ZKZ, ZZZ, KKZ, KZK, ZKK }) = q 3 + 3pq 2 + 3p2 q P(Ω) = q 3 + 3pq 2 + 3p2 q + p3 = 1 ist die Verteilungsfunktion FZ der Zufallsvariablen Z gegeben durch: FZ (x) = P({Z 6 x}) = 0 q3 q 3 + 3pq 2 q 3 + 3pq 2 + 3p2 q 1 für für für für für S0 ·d3 S0 ·ud2 S0 ·u2 d S0 ·u3 6 6 6 6 x x x x x < S0 ·d3 < S0 ·ud2 < S0 ·u2 d < S0 ·u3 Der Graph von FZ hat folgendes für diskrete Zufallsvariablen typische Aussehen (siehe hierzu das allgemeine Beispiel 3.17 iv) bzw. v)): FZ (x) ✻ q 3 + 3pq 2 + 3p2 q + p3 1 q 3 + 3pq 2 + 3p2 q q 3 + 3pq 2 q3 ✲x 3 2 S0 d S0 ud 2 S0 u d S0 u 3 ❐ Bemerkung 3.16 i) Verteilungsfunktionen sind typischerweise rechtsseitig stetig, mit linksseitigem Grenzwert und werden in der Literatur häufig mit dem französischen Akronym cadlàg („continue à droite limite à gauche“) bezeichnet. 8 Man spricht auch von der gemeinsamen Verteilungsfunktion der Zufallsvariablen Z1 bis Zd . 9 Besitzt Z = (Z1 , . . . , Zd ) eine Dichte, so auch die einzelnen Komponenten Zi . c Klaus Schindler SS 2016 35 Wahrscheinlichkeitsrechnung Kapitel 3 Wahrscheinlichkeitsmaße ii) Da der, das zufällige Geschehen steuernde Wahrscheinlichkeitsraum (Ω, A, P) i.a. nicht bzw. nicht vollständig bekannt ist, bieten Verteilungsfunktionen eine besonders einfache Möglichkeit, die Wahrscheinlichkeiten P({a<Z6b}) berechnen. Unter Verwendung des Riemann-Stieltjes-Integral gilt nämlich (sofern FZ stetig ist) A.5 f) P({a < Z 6 b}) = FZ (b) − FZ (a) = Z b a dFZ (x). Ist die Verteilungsfunktion FZ differenzierbar, lassen sich diese Wahrscheinlichkeiten als Riemann-Integral berechnen, da nach Satz A.5 d) des Anhangs gilt Wahrscheinlichkeitsrechnung Z b a A.5 d) dFZ (x) = Z b a FZ′ (x)dx . Ist FZ stetig differenzierbar, d.h. ist FZ′ sogar stetig, gilt für infinitesimale Änderungen dx insbesondere P({x < Z 6 x+dx}) = FZ (x+dx) − FZ (x) = FZ′ (x)dx = dFZ (x) . Die Dichte FZ′ (x) ist also ein Maß dafür, wie groß die Chance ist, dass Z einen Wert in der Nähe von x annimmt. FZ′ (x) gibt in diesem Fall nicht an, wie groß die Wahrscheinlichkeit ist, dass Z den Wert x annimmt. Für stetiges FZ′ gilt nämlich nach dem Hauptsatz der Differential- und Integralrechnung P({Z=x}) = Z x x FZ′ (t)dt = FZ (x) − FZ (x) = 0 iii) Die Verteilung FZ einer Zufallsvariable Z wird oft auch das Bildmaß von P unter Z genannt und dann mit PZ oder Z(P) bezeichnet, weil Z das Wahrscheinlichkeitsmaß P auf die reellen Zahlen „transportiert“. D.h., durch PZ (]a, b]) := P({a < Z 6 b}) = Z b a dFZ (x) wird ein Wahrscheinlichkeitsmaß auf der von den Intervallen (Quadern) erzeugten σAlgebra (Borelmengen) definiert. Alle Integrale bzgl. PZ können mit Hilfe des von der Verteilungsfunktion FZ erzeugten Riemann-Stieltjes-Integrals berechnet werden. (Die genaue Aussage findet man in Bemerkung 3.20 ii) - iv).) In diesem Sinne gestattet es der Verteilungsbegriff, die Arbeit mit mehreren unterschiedlichen Zufallsgrößen (auf evtl. verschiedenen Zustandsräumen) auf einen gemeinsamen Raum zu übertragen. Existiert eine Dichte ϕ, gilt also PZ (]a, b]) = Differentialschreibweise durch dPZ (x) = ϕ(x)dx oder dPZ (x) dx Rb a dPZ (x) = Rb a ϕ(x)dx, wird dies oft in = ϕ(x) notiert. Unter welchen Voraussetzungen für zwei beliebige Maße Q und P eine Dichtefunktion ϕ mit dQ = ϕdP existiert, wird im Satz von Radon-Nikodym (siehe Anhang Satz A.7) geklärt. 36 c Klaus Schindler SS 2016 Stochastik Kapitel 3 3.5. Verteilung von Zufallsgrößen iv) Bei gleicher Zufallsvariable X führt eine Änderung des Wahrscheinlichkeitsmaßes zu einer Änderung der Verteilung. Andererseits können unterschiedliche Zufallsgrößen die gleiche Verteilung besitzen. Hierzu betrachte man folgendes Beispiel. Definiert man bei dem Würfelexperiment in Beispiel 3.8 zwei verschiedene Zufallsvariablen X und Y durch Y (ω) := 2 falls ω ∈ {KKK, KKZ} , 0 sonst 2 falls ω ∈ {ZZZ, ZZK} , 0 sonst so produziert X mit Wahrscheinlichkeit p2 den Wert 2 und mit Wahrscheinlichkeit 1 − p2 den Wert 0. Y dagegen liefert mit Wahrscheinlichkeit q 2 den Wert 2 und mit Wahrscheinlichkeit 1 − q 2 den Wert 0. Offensichtlich hängen die Verteilungen von der „Kopfwahrscheinlichkeit“ p, also vom Wahrscheinlichkeitsmaß P ab. Damit besitzen 1 ❐ X und Y genau dann die gleiche Verteilung, wenn p = q = gilt. 2 Beispiel 3.17 i) Normalverteilungen stellen die wichtigste Klasse von Verteilungen mit Dichten dar (Man beachte hierzu auch Abschnitt 3.6.). Sie sind durch zwei Parameter µ, σ 2 charakterisiert. Die Wahrscheinlichkeitsdichten lauten ϕµ,σ2 (x) = √ 1 2πσ · e− 2 (x−µ)2 2σ 2 . x2 Die Verteilung mit Dichte ϕ0,1 (x) = √12π · e− 2 , für die also µ=0, σ 2 =1 gilt, heißt Standardnormalverteilung. Es gilt folgender Zusammenhang: ϕµ,σ2 (x) = 1 σ ϕ0,1 x−µ σ Für die Aussage „Z ist normalverteilt mit Parametern µ, σ 2 “ hat sich die Schreibweise „Z ∼ Nµ,σ2 “ oder „Z ∼ Nµ,σ “ eingebürgert. Mit N (x) bezeichnen wir im Folgenden auch den Wert der Standardnormalverteilung an der Stelle x, also N (x) = Z x −∞ ϕ0,1 (t)dt = 1 √ 2π Z x t2 −∞ e−( 2 ) dt. ii) Analog zum eindimensionalen Fall heißt der Zufallsvektor Z = (Z1 , . . . , Zd ) d-dimensional normalverteilt (oder: Z1 , . . . , Zd sind gemeinsam normalverteilt), wenn die mehrdimensionale Verteilungsfunktion FZ eine Dichte ϕ besitzt, die folgendes Aussehen hat: ϕ(x) = s det Σ−1 (2π)d · e− 2 (x−µ) Σ 1 t −1 (x−µ) Hierbei ist µ der Erwartungsvektor und Σ die sog. Varianz-Kovarianzmatrix. c Klaus Schindler SS 2016 37 Wahrscheinlichkeitsrechnung X(ω) := Wahrscheinlichkeitsrechnung Kapitel 3 Wahrscheinlichkeitsmaße iii) Eine ZV Y heißt lognormalverteilt, wenn ln(Y ) normalverteilt ist. Anders ausgedrückt: „Ist Z normalverteilt, so ist Y = eZ lognormalverteilt“. Besitzt Z eine Nµ,σ2 -Verteilung, so ist die Dichte von Y = eZ gegeben durch f (x) = 1 ·ϕ 2 (ln(x)) x µ,σ 0 für x > 0 für x 6 0 Wahrscheinlichkeitsrechnung iv) Die Verteilung einer diskreten ZV Z, die - wie etwa in Beispiel 3.7 - nur endlich viele verschiedene Werte z1 < z2 < · · · < zn annimmt10 , wird vollständig bestimmt durch die Wahrscheinlichkeiten P({Z=zk }), wegen {Z6x} = S · zk 6x {Z=zk }. Die Verteilungsfunktion weist deswegen an den Stellen z=zk Sprünge der Höhe P({Z=zk }) auf. Es gilt nämlich P({a < Z 6 b}) = X P({Z=zk }), also FZ (x) = P({Z6x}) = X P({Z=zk }) . zk 6x a<zk 6b Die folgende Skizze zeigt das prinzipielle Aussehen der Verteilungsfunktion solcher diskreter Zufallsgrößen. FZ (x) ✻ P({Z=z1 }) + P({Z=z2 }) P({Z=z1 }) z1 z2 z3 z4 Speziell gilt für die Verteilungsfunktion einer Indikatorfunktion 0 falls x < 0 F A (x) = 1 − P(A) falls 0 6 x < 1 1 falls 1 6 x 10 Dies ist automatisch erfüllt, wenn z.B. Ω endlich ist. 38 c Klaus Schindler SS 2016 ✲x z5 . . . . . . A (A ∈ A): Stochastik Kapitel 3 3.5. Verteilung von Zufallsgrößen F A (x) ✻ 1 1 − P(A) ✲x 1 v) Die einfachsten Beispiele von Zufallsgrößen, die nur endlich viele Werte annehmen, bilden Zufallsgrößen, die nur 2 bzw. 3 Werte annehmen können, z.B. ±1 oder −1, 0, +1. Sie bilden die Basis der Bi- bzw. Trinomialverfahren, mit deren Hilfe auf dem Rechner diskrete Zufallsprozesse erzeugt werden können (siehe Kapitel 5). In diesem Zusammenhang treten binomialverteilte Zufallsgrößen auf. Sind Y1 , . . . , Yn unabhängige Zufallsgrößen11 , die nur die beiden Werte 0 und 1 annehmen, mit der Verteilung P({Yk =1}) = p , P({Yk =0}) = 1−p , so ist ihre Summe Z := n P k=1 k = 1, . . . , n , Yk , d.h. die Anzahl der Einsen in der Stichprobe Y1 , . . . , Yn , binomialverteilt mit Parametern n, p, d.h. es gilt Z= n X k=1 Yk , P({Z=m}) = n m p (1−p)n−m m , FZ (x) = X n k6x k pk (1−p)n−k . Für die Aussage „Z ist binomialverteilt mit Parametern n, p“ hat sich die Schreibweise „Z ist Bn,p -verteilt“ eingebürgert. ❐ Bemerkung 3.18 Eine Bn,p -verteilte Zufallsgröße Y kann näherungsweise durch eine Nnp,np(1−p) -verteilte Zufallsgröße Z ersetzt werden, wenn n groß ist, in dem Sinn (siehe Bemerkung 3.20 v)), dass P({a < Y < b}) ≈ P({a < Z < b}) . (3.1) Eine genauere Aussage liefert der zentrale Grenzwertsatz, der allgemein für unabhängige und identisch verteilte Zufallsvariablen gilt. In der klassischen Statistik macht man sich dieses Ergebnis zunutze, um die für größere n aufwändige Berechnung von Binomialwahrscheinlichkeiten zu umgehen. Umgekehrt weist die approximative Austauschbarkeit von binomialund normalverteilten Zufallsgrößen aber auch einen Weg, auf der Normalverteilung aufbauende stetige Zufallsprozesse durch Binomialprozesse anzunähern. Diese sind auf dem Rechner leicht zu simulieren und werden bei der Modellierung des zeitlichen Verlaufs von Aktienkursen benötigt. ❐ 11 Dies soll bedeuten, dass sich die Werte der einzelnen Zufallsvariablen Yi nicht gegenseitig beeinflussen. Für eine genauere Definition siehe Abschnitt 3.8 auf Seite 44. c Klaus Schindler SS 2016 39 Wahrscheinlichkeitsrechnung 0 Wahrscheinlichkeitsrechnung Kapitel 3 Normalverteilung 3.6. Approximationen der Normalverteilung Die Berechnung der Werte der Normalverteilung N bereitet Probleme, da das Integral N (x) = 1 2π Z x −∞ t2 e−( 2 ) dt nicht exakt berechnet werden kann. Bei praktischen Anwendungen ist man daher auf Approximationen der Normalverteilung angewiesen. In der Literatur (beispielsweise [13]) findet man verschiedene Näherungsformeln. Nachfolgend wollen wir einige vorstellen12 . x2 Wahrscheinlichkeitsrechnung a) N (x) ≈ 1 − (a1 t + a2 t2 + a3 t3 ) e− 2 , t= 1 , 1 + bx mit b = 0.332672527, a1 = 0.17401209, a2 = −0.04793922, a3 = 0.373927817. Der Approximationsfehler hat unabhängig von x die Größenordnung O(10−5). x2 b) N (x) ≈ 1 − (a1 t + a2 t2 + a3 t3 + a4 t4 + a5 t5 ) e− 2 , t= 1 , 1 + bx mit b = 0.231641888, a1 = 0.127414796, a2 = −0.142248368, a3 = 0.71070687, a4 = −0.726576013, a5 = 0.530702714. Der Fehler dieser Approximation liegt unabhängig von x bei O(10−7). c) N (x) ≈ 1 − 1 2(a1 x + a2 x2 + a3 x3 + a4 x4 + a5 x5 )8 , mit a1 = 0.099792714, a2 = −0.044320135, a3 = 0.009699203, a4 = −0.000098615, a5 = 0.00581551. Der Fehler dieser Approximation liegt unabhängig von x bei O(10−5). d) Als letzte Möglichkeit wollen wir hier noch die Taylorreihendarstellung angeben: ∞ x2n+1 1 X (−1)n n n!2 (2n + 1) 2π n=0 x3 1 x5 x7 √ x− 1 + 2 − 3 1!2 3 2!2 5 3!2 7 2π N (x) = 1 2 +√ = 1 2 + +··· . Mit Hilfe dieser Reihe kann die Normalverteilung beliebig genau angenähert werden, wobei natürlich mit der Genauigkeit auch die Anzahl der benötigten Summanden und somit die Anzahl der arithmetischen Operationen steigt. Ein Vergleich aller vier Näherungsformeln ist in der Tabelle 1 enthalten. Die Taylorreihe wurde beim ersten Summanden, der betragsmäßig kleiner als 10−5 ist, abgebrochen. Die Spalte „iter“ gibt dabei die Nummer des letzten Summanden der Taylorreihe an. 12 Die Formeln gelten für x > 0. Für x < 0 ist N (x) = 1 − N (−x) anzuwenden. 40 c Klaus Schindler SS 2016 Stochastik Kapitel 3 3.7. Momente einer Zufallsgröße Methode-a 0.8413517179 0.8643435425 0.8849409364 0.9032095757 0.9192515822 0.9331983332 0.9452030611 0.9554336171 0.9640657107 0.9712768696 0.9772412821 x 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2.0 Methode-b 0.8413447362 0.8643338948 0.8849302650 0.9031994476 0.9192432862 0.9331927690 0.9452007087 0.9554345667 0.9640697332 0.9712835061 0.9772499371 Methode-c 0.8413516627 0.8643375717 0.8849298369 0.9031951398 0.9192361959 0.9331845052 0.9451929907 0.9554288709 0.9640670474 0.9712842148 0.9772538334 Methode-d 0.8413441191 0.8643341004 0.8849309179 0.9031993341 0.9192427095 0.9331930259 0.9452014728 0.9554342221 0.9640686479 0.9712839202 0.9772496294 iter 6 7 7 8 8 9 9 10 10 11 12 Tabelle 1 3.7. Momente einer Zufallsgröße Momente sind Kenngrößen von Zufallsvariablen. Die zwei wichtigsten Momente sind der Erwartungswert und die Varianz. Erwartungswert und Varianz bestimmen im Allgemeinen eine Verteilung nicht eindeutig, sie können aber einen ersten Eindruck von der Verteilung vermitteln. Da es unmöglich ist, vorab anzugeben, welchen Funktionswert eine stochastische nicht deterministische Größe annimmt („realisiert“), liegt es nahe, bei einer ZV den „mittleren“ Funktionswert anzugeben. Für eine deterministische Funktion f : → , mit dem endlichen Definitionsbereich = {x1 , . . . , xn }, ist dies die Summe der Funktionswerte, gewichtet 1 mit der relativen Häufigkeit ihres Auftretens13 D R D n n X 1 f¯ := n f (xk ) . k=1 D = [a, b] wird f¯ entsprechend durch das Integral Bei nicht-endlichem Definitionsbereich dx als relative Häufigkeit interpretiert werden kann von f definiert, wobei der „Faktor“ f¯ := 1 b−a Z b a b−a f (x)dx. Der im Mittel zu erwartende Funktionswert einer Zufallsvariablen Z wird analog definiert als Summe bzw. Integral aller möglichen Werte x, die Z annehmen kann, gewichtet mit der jeweiligen Eintrittswahrscheinlichkeit P({x < Z 6 x + dx}) = dFZ (x), also Z := 13 Z R xdFZ (x) Da bei der deterministischen Funktion f alle Funktionswerte f (xk ) gleich „wahrscheinlich“ verteilt sind, kann der Faktor n1 als Eintrittswahrscheinlichkeit und f¯ als Erwartungswert interpretiert werden. c Klaus Schindler SS 2016 41 Wahrscheinlichkeitsrechnung Approximation der Normalverteilung Wahrscheinlichkeitsrechnung Kapitel 3 Erwartungswert, Varianz Dieser Wert ist ein Maß dafür, in welchem Bereich mit den Werten von Z zu rechnen ist und stellt die unter der momentan gegebenen Wahrscheinlichkeitsinformation bestmögliche Prognose dar, die über den Ausgang des Zufallsexperimentes Z gemacht werden kann (Man beachte hierzu auch den Abschnitt 3.8 auf Seite 44 ff.). Definition 3.19 a) Der Erwartungswert definiert durch: Wahrscheinlichkeitsrechnung E[Z] = Z Rd E(Z) einer Zufallsgröße Z ist ihr mittlerer Funktionswert. Er ist xdFZ (x) b) Die Varianz var(Z) einer Zufallsgröße Z ist ein Maß dafür, wie stark Z im Mittel um ihren Erwartungswert herum variiert (streut). Man definiert sie daher als erwartete quadratische Abweichung, die Z vom eigenen Erwartungswert besitzt, d.h. E var(Z) = E |Z − (Z)| 2 Die Varianz besitzt als quadratische Größe eine andere Einheit als Z. Ein besseres Gefühl für die Größe der Variabilität von Z liefert daher die Standardabweichung s(Z), die wie (Z) in derselben Einheit wie Z gemessen wird. E s(Z) := q var(Z) . ❐ Bemerkung 3.20 i) Da der Erwartungswert einer Zufallsvariable sehr stark vom vorgegebenen Wahrscheinlichkeitsmaß abhängt, sollte im Zweifelsfall P geschrieben werden. E ii) Der Umweg über Verteilungsfunktionen wird vermieden, wenn man die klassische Integrationstheorie auf Funktionen Z : Ω → verallgemeinert, indem man den Definitionsbereich Ω in kleine Teilmengen dω zerlegt und dann Z durch Treppenfunktionen approximiert (siehe nachfolgende Skizze). Das Integral einer Treppenfunktion T ist dabei wie üblich als Summe aller durch T gegebenen „Rechteckflächen“ definiert. Diese ergibt sich als „Grundseite mal Höhe“, wobei die „Größe“ der Grundseite dω in Ermangelung eines Längenbegriffs auf Ω durch P(dω) gemessen wird. Das Maß des Rechtecks ist daher Z(ω)P (dω) (siehe nachfolgende Skizze). Formal erhält man14 : R E(Z) = Z Ω Z(ω)P (dω) = Z Ω Z(ω)dP (ω). Wesentlich bei dieser Integration ist, dass sich jede messbare Funktion als Grenzwert von messbaren Treppenfunktionen darstellen lässt (siehe Satz 3.13). 14 Wir verwenden hierbei analog zur Integralrechnung die Schreibweise dP (ω) für P (dω). 42 c Klaus Schindler SS 2016 Stochastik Kapitel 3 Z(ω) 3.7. Momente einer Zufallsgröße Z(ω)P(dω) ✻ ✠ E(Z) ✲ ω∈Ω dω Das so definierte Integral stellt eine Verallgemeinerung des Riemann-Integrals dar und besitzt z.T. deutlich „angenehmere“ Eigenschaften als dieses. Z.B. gilt (ohne auf die genauen Voraussetzungen einzugehen): lim Z n→∞ Ω fn dµ = Z lim fn dµ Ω n→∞ R iii) Nimmt die Zufallsgröße Z : Ω → d nur endlich viele Werte z1 , . . . , zn an15 , gilt nach Beispiel 3.17 iv) und Satz A.5 g) (siehe Anhang): E(Z) = Z A.5 g) Rd xdFZ (x) = n X k=1 zk P ({Z = zk }) iv) Besitzt Z die Verteilungsfunktion FZ und ist g(Z) eine Funktion der Zufallsvariablen Z, so gilt für den Erwartungswert von g(Z), sofern dieser existiert E(g(Z)) = Z +∞ −∞ g(x)dFZ (x). Insbesondere ergeben sich daraus folgende Spezialfälle: E(Z) = E(Z ) = 2 var(Z) = = = E( A) = Z +∞ −∞ Z +∞ −∞ Z xdFZ (x), x2 dFZ (x) [x − (Z)]2 dFZ (x) −∞ Z +∞ | E +∞ −∞ E 2 x dFZ (x) − 2 (Z) {z E = (Z 2 ) } E(Z ) − [E(Z)] 2 Z +∞ −∞ 2 Z | +∞ −∞ E 2 xdFZ (x) + [ (Z)] {z E = (Z) } (Varianz-Zerlegungssatz) Z | +∞ −∞ dFZ (x) {z =1 } 3.17 xdF A (x) = P(A). Die letzte Gleichung zeigt insbesondere, dass die Wahrscheinlichkeit eines Ereignisses gleich dem Erwartungswert der Indikatorfunktion des Ereignisses ist. 15 Dies ist automatisch erfüllt, wenn Ω endlich ist. c Klaus Schindler SS 2016 43 Wahrscheinlichkeitsrechnung |{z} Wahrscheinlichkeitsrechnung Kapitel 3 Bedingte Wahrscheinlichkeit v) Eine Nµ,σ2 -verteilte Zufallsgröße Z hat Mittelwert µ und Varianz σ 2 . Der 2σ-Bereich um µ enthält mit mehr als 95% Wahrscheinlichkeit Beobachtungen von Z P({µ − 2σ < Z < µ + 2σ}) ' 0, 95 . Eine Bn,p -verteilte Zufallsgröße Z hat Erwartungswert np und Varianz np(1 − p). Die Approximation (3.1) in Bemerkung 3.18 ist also so gewählt, dass die näherungsweise einander ersetzenden binomial- und normalverteilten Zufallsgrößen identische Erwartungswerte und Varianzen besitzen. Die folgende Tabelle liefert die Erwartungswerte und Varianzen der bisher behandelten Verteilungen. Wahrscheinlichkeitsrechnung Verteilung von Z E(Z) var(Z) Dichte von Z Nµ,σ2 -Normalverteilung µ σ2 ϕµ,σ2 (x) Lognormalverteilung Z = eY mit (Y ) = µ, var(Y ) = σ 2 Bn,p E e(µ+ σ2 ) 2 2 (e(σ ) −1) e(2µ+σ np N np(1 − p) 2) 1 ϕ 2 (ln(x)) x µ,σ keine E vi) Allgemeiner werden für eine ZV Z und n ∈ die Größen (sofern existent) (|Z|n ), (Z n ) bzw. [(Z − E(Z))n ] als n-tes absolutes Moment, n-tes Moment bzw. n-tes zentriertes Moment von Z bezeichnet. Insbesondere ist der Erwartungswert das erste Moment, die Varianz das zweite zentrierte Moment. Vereinfacht gesprochen ist eine Verteilung durch die Kenntnis aller Momente eindeutig bestimmt. ❐ E E 3.8. Bedingte Wahrscheinlichkeit Interessiert man sich für mehrere Ereignisse gleichzeitig (z.B. die Kurse verschiedener Aktien) so ist es von großem Interesse zu erfahren, ob ein Zusammenhang zwischen diesen besteht und wie diese Abhängigkeit gemessen werden kann. Der intuitive Begriff der Unabhängigkeit zweier Ereignisse A, B wird präzisiert durch die folgende Überlegung. Nehmen wir an, dass ein Experiment durchgeführt wird, bei dem wir uns für das Ereignis A interessieren. Der Ausgang des Experimentes sei ω, was wir jedoch nicht oder nicht vollständig erkennen können. Wahrnehmbar sind stattdessen nur die Auswirkungen des eingetretenen Zustandes auf andere messbare Zufallsgrößen, d.h. wir erfahren nur, dass ein anderes Ereignis B eingetreten ist16 , also ω ∈ B gilt. I.A. wird diese zusätzliche Information unsere Einschätzung über die Eintrittswahrscheinlichkeit des Ereignisses A verändern, da diese ab sofort relativ zu B gemessen werden muss. Sie ist 0, wenn A und B disjunkt sind und 1, wenn B ⊂ A gilt, da dann A ebenfalls eingetreten ist. Allgemein werden wir A um so wahrscheinlicher halten, je „größer“ der „Anteil“ der Menge B in der Menge A, d.h. je größer A ∩ B ist. 16 I.A. werden natürlich mehrere andere Ereignisse beobachtet. 44 c Klaus Schindler SS 2016 Stochastik Kapitel 3 3.8. Bedingte Wahrscheinlichkeit B A A∩ B P(A ∩ B) . P(B) Wir werden die Ereignisse A und B als unabhängig empfinden, wenn diese relative Wahrscheinlichkeit P(A) ist, d.h. wenn die Kenntnis über ω ∈ B unsere Einschätzung für das Eintreten von A nicht ändert. Dies führt zu folgender Definition. Definition 3.21 Ist (Ω, A, P) ein Wahrscheinlichkeitsraum und B ∈ A ein Ereignis mit P(B) > 0, so ist P(· | B) : A → [0, 1] A 7→ P(A|B) := P(A ∩ B) P(B) ein Wahrscheinlichkeitsmaß auf (Ω, A), welches bedingte Wahrscheinlichkeit unter (der Hypothese) B genannt und mit P(· | B) bezeichnet wird. a) Zwei Ereignisse A, B ∈ A heißen unabhängig, wenn gilt: P(A ∩ B) = P(A) · P(B). Im Fall P(B) > 0 ist dies genau dann erfüllt, wenn P(A|B) = P(A) gilt. Allgemeiner heißt eine Folge von Ereignissen (Ai )i∈I unabhängig, wenn für jede endliche Teilmenge J ⊂ I gilt: P T i∈J Ai = Y P(Ai ) i∈J b) Eine Folge von σ-Algebren (Ai )i∈I heißt unabhängig, wenn jede Folge von Ereignissen (Ai )i∈I mit Ai ∈ Ai für i ∈ I unabhängig ist. c) Eine Folge von Zufallsvariablen (Zi )i∈I heißt unabhängig, wenn die von ihnen erzeugte Folge von σ-Algebren σ(Zi ) unabhängig ist. ❐ i∈I c Klaus Schindler SS 2016 45 Wahrscheinlichkeitsrechnung Unsere Einschätzung für das Eintreten von A unter der Annahme, dass B mit P(B) > 0 eingetreten ist, lautet daher Wahrscheinlichkeitsrechnung Kapitel 3 Unabhängigkeit Beispiel 3.22 Betrachten wir einen zweifachen Münzwurf mit der Wahrscheinlichkeit p für Kopf K und der Wahrscheinlichkeit q := 1 − p für Zahl Z bei jedem Wurf (0 < p < 1). i) Gegeben seien die Ereignisse A := „Einmal Kopf, einmal Zahl“ und B := „Kopf beim ersten Wurf“, d.h. A = {KZ, ZK}, B = {KK, KZ}. Dann gilt Wahrscheinlichkeitsrechnung P(A) P(B) P(A) · P(B) P(A ∩ B) = = = = 2pq p2 + pq = p(p + q) = p 2p2 q pq, so dass A und B genau dann unabhängig sind, wenn 2p2 q = pq gilt. Dies ist äqui1 valent zu p = . Man erkennt hier, dass die Unabhängigkeit von Ereignissen vom 2 Wahrscheinlichkeitsmaß abhängt. Erfährt man, dass im ersten Wurf Kopf gefallen ist (B ist eingetroffen), so ist die bedingte Wahrscheinlichkeit für A P(A | B) = Ist p = q = 1 2 P(A ∩ B) P(B) = pq p folgt P(A | B) = = q. 1 , 2 was in diesem Fall nicht weiter überraschend ist, da die Wahrscheinlichkeit für Zahl im zweiten Wurf 1 2 beträgt. Geht man jedoch von einer „Kopfwahrscheinlichkeit“ p = 0, 01 aus, so ist die Eintrittswahrscheinlichkeit von A (vor dem ersten Wurf) ziemlich gering, es gilt P(A) = 0, 0198. Hier führt die Information, dass B (Kopf) im ersten Wurf eingetreten ist, für A zur bedingten Wahrscheinlichkeit P(A | B) = q = 0, 99. Dies liegt daran, dass im zweiten Wurf eine sehr hohe Wahrscheinlichkeit für Zahl und damit für A vorliegt. ii) Wir betrachten die σ-Algebren G = H = 46 ∅, Ω, {KKK, KKZ, KZK, KZZ}, {ZKK, ZKZ, ZZK, ZZZ} ∅, Ω, {KKK, ZKK, KKZ, ZKZ}, {KZK, ZZK, KZZ, ZZZ} c Klaus Schindler SS 2016 Stochastik Kapitel 3 3.8. Bedingte Wahrscheinlichkeit Bemerkung 3.23 i) Zwei Ereignisse A und B sind genau dann unabhängig, wenn die von ihnen erzeugten σ-Algebren σ(A) := {∅, Ω, A, ∁A} und σ(B) := {∅, Ω, B, ∁B} unabhängig sind. ii) Die Abhängigkeit oder Unabhängigkeit von Ereignissen, σ-Algebren oder Zufallsvariablen wird wesentlich vom betrachteten Wahrscheinlichkeitsmaß bestimmt, wie etwa Beispiel 3.22 i) zeigt. iii) Zwei Zufallsgrößen Z1 , Z2 sind nach Definition 3.21 genau dann unabhängig, wenn P({a1 < Z1 < b1 , a2 < Z2 < b2 }) = P({a1 < Z1 < b1 } ∩ {a2 < Z2 < b2 }) = P({a1 < Z1 < b1 }) · P({a2 < Z2 < b2 }), R für alle ai , bi ∈ gilt, d.h., Wahrscheinlichkeiten von Ereignissen, die vom Wert des Zufallsvektors Z=(Z1 , Z2 ) abhängen, lassen sich faktorisieren. In diesem Fall ist die gemeinsame Verteilung von Z gleich dem Produkt der eindimensionalen Verteilungen von Z1 und Z2 (Randverteilungen), d.h. es gilt FZ (x1 , x2 ) = FZ1 (x1 ) · FZ2 (x2 ) . Besitzt Z sogar eine Dichte, ist diese daher das Produkt der Dichten von Z1 und Z2 . Grob gesprochen sind also zwei Zufallsgrößen Z1 und Z2 unabhängig, wenn jedes Ereignis, das durch Z1 definiert ist, unabhängig von jedem Ereignis ist, das durch Z2 gegeben ist. Für eine genauere Aussage beachte man Satz 3.25. iv) Die häufig auftretenden bedingten Wahrscheinlichkeiten der Form P{a1 < Z1 < b1 | a2 < Z2 < b2 } spiegelt unsere Einschätzung wider, mit welchen Werten von Z1 wir eher rechnen bzw. welche wir für unplausibel halten, wenn wir schon wissen, dass eine andere Zufallsgröße Z2 bestimmte Werte angenommen hat. Unsere Meinung über die Wahrscheinlichkeiten der Werte von Z1 wird durch unsere Vorabinformation über Z2 nicht geändert, wenn Z1 gar nicht von Z2 abhängt, wenn also Z1 und Z2 unabhängig sind. ❐ c Klaus Schindler SS 2016 47 Wahrscheinlichkeitsrechnung G und H enthalten die Information, die sich bei einem dreimaligen Münzwurf durch den ersten bzw. zweiten Wurf ergeben, nämlich Kopf oder Zahl im ersten bzw. Kopf oder Zahl im zweiten Wurf. Nach dem ersten Wurf steht für alle Ereignisse aus G nicht jedoch für die Ereignisse aus H - fest, ob sie eingetreten sind oder nicht. Dies liegt an der Unabhängigkeit der beiden σ-Algebren, da bei einer Serie von Würfen die einzelnen Würfe unabhängig voneinander erfolgen und so die Wahrscheinlichkeit für eine bestimmte Wurfserie das Produkt der einzelnen Wurfwahrscheinlichkeiten ist. ❐ Wahrscheinlichkeitsrechnung Kapitel 3 Kovarianz, Korrelation Definition 3.24 Sind Z1 , . . . , ZN unabhängige Zufallsgrößen, die alle die gleiche Verteilung haben, d.h. R : P({a < Z ∀i, j∀a, b ∈ i 6 b}) = P({a < Zj 6 b}), so nennen wir sie unabhängig identisch verteilt (kurz: u.i.v.). ❐ Wahrscheinlichkeitsrechnung Ohne auf die genauen Voraussetzungen einzugehen, zitieren wir zwei intuitiv verständliche Eigenschaften unabhängiger Zufallsgrößen. Zum Beweis genügt es, Indikatorfunktionen zu betrachten, da messbare Funktionen Grenzwerte von Treppenfunktionen sind (siehe Satz 3.13). Satz 3.25 Sind Z1 , Z2 unabhängige Zufallsvariablen und g, h : R → R stetige Funktionen, so gilt: a) Die Zufallsvariablen g(Z1 ) und h(Z2 ) sind ebenfalls unabhängig. b) E g(Z )·h(Z ) h 1 2 i = E[g(Z )]·E[h(Z )]. Insbesondere gilt E[Z ·Z ] = E[Z ]·E[Z ]. 1 2 1 2 1 2 ❑ Dem folgenden Satz kommt im wahrsten Sinne des Wortes eine „zentrale“ Bedeutung innerhalb der Wahrscheinlichkeitstheorie zu. Satz 3.26 (Zentraler Grenzwertsatz) Sei X1 , X2 , X3 , . . . eine Folge u.i.v. Zufallsvariablen mit endlichem Erwartungswert µ und endlicher Standardabweichung σ > 0. Definiert man die Partialsummen Sn := X1 +· · ·+Xn , so konvergiert für n → ∞ die Verteilung von Sn − n · µ √ σ n 1 = √ σ n n X i=1 (Xi − µ) gegen die Standardnormalverteilung N0,1 . ❑ 3.9. Kovarianz, Korrelation Liegen zwei ZV nicht unabhängige Z1 , Z2 vor, ist die Frage, ob es möglich ist, den Grad der Abhängigkeit zu messen. Ein mögliches Maß für die Abhängigkeit von Z1 , Z2 ergibt sich aus folgender Überlegung: Z − (Z)beschreibt die Abweichung der Zufallsgröße Z von ihrem Prognosewert (Z). E E Daher ist Z1 − (Z1 ) E E Z2 − (Z2 ) ein Maß für das gemeinsame Abweichungsverhalten, dessen Vorzeichen angibt, ob beide tendenziell in die gleiche (+) oder in die entgegengesetzte Richtung (−) ihres jeweiligen Erwartungswertes abweichen. Definition 3.27 Wir definieren die Kovarianz cov(Z1 , Z2 ) bzw. die Korrelation corr(Z1 , Z2 ) der Zufallsvariablen Z1 und Z2 durch 48 c Klaus Schindler SS 2016 Stochastik Kapitel 3 3.10. Bedingte Erwartung cov(Z1 , Z2 ) = E (Z − E(Z ))(Z − E(Z )) corr(Z1 , Z2 ) = cov(Z1 , Z2 ) s(Z1 ) · s(Z2 ) bzw. 1 1 2 2 = E[Z 1 E E · Z2 ] − [Z1 ] · [Z2] . ❐ ii) Die Abhängigkeit von ZV kann in komplizierter Form vorliegen, die durch die Kovarianz nur eingeschränkt zu erfassen ist. Sind jedoch Z1 , Z2 speziell gemeinsam (bivariat) normalverteilt, gibt die Kovarianz in der Tat den Grad ihrer Abhängigkeit an. In diesem Fall ist Unabhängigkeit gleichbedeutend mit Korrelation gleich Null, während vollständige Abhängigkeit gleichbedeutend mit Korrelation +1 (Z1 ist groß, wenn Z2 groß ist) oder Korrelation −1 (Z1 ist groß, wenn Z2 klein ist) ist. iii) Aus der Definition folgt direkt die Bilinearität der Kovarianz: cov( n P i=1 λi Xi , Z) = n P i=1 λi · cov(Xi , Z) = cov(Z, n P i=1 λ i Xi ) . iv) Für unabhängige Zufallsgrößen Z1 , . . . , ZN gilt allgemein cov(Zi , Zj ) = 0 für i 6= j , woraus eine nützliche Rechenregel für unabhängige ZVen folgt X N var j=1 Zj = N X var(Zj ) . j=1 Für normalverteilte Zufallsvariablen gilt die Umkehrung dieser Aussage, d.h. in diesem Fall folgt aus cov(Z1 , Z2 )=0 schon die Unabhängigkeit von Z1 und Z2 . Für beliebige Zufallsvariablen ist dieser Schluss jedoch falsch. ❐ 3.10. Bedingte Erwartung Die Verwendung unterschiedlicher Informationen wird zu unterschiedlichen Einschätzungen der Zukunft, d.h. zu verschiedenen Wahrscheinlichkeitsmaßen führen. Implizit werden damit auch die Vorhersagen (Erwartungswerte) für eine vorgegebene ZV Z verändert. Der Begriff der bedingten Erwartung - eine Erweiterung des Erwartungswertbegriffs - berücksichtigt den jeweiligen Informationsstand und führt zum Begriff des Martingals. c Klaus Schindler SS 2016 49 Wahrscheinlichkeitsrechnung Bemerkung 3.28 i) Die Korrelation hat den Vorteil, immer zwischen −1 und +1 zu liegen und skaleninvariant (dimensionsunabhängig) zu sein. Wahrscheinlichkeitsrechnung Kapitel 3 Bedingte Erwartung Wie im Abschnitt 3.8 gesehen, führt eine neue Information, z.B. ein Ereignis B zu einer Veränderung des bisherigen Wahrscheinlichkeitsmaßes P und damit zu einer Neubewertung der bisherigen Meinungen und Prognosen17 . Vom Zeitpunkt des Eintretens von B sind daher alle ZV mit Hilfe dieses revidierten Maßes zu bewerten. Man spricht vom bedingten Wahrscheinlichkeitsmaß und bezeichnet es mit P(·|B). Folgerichtig tritt an die Stelle des Erwartungswertes P (Z) einer ZV Z der bedingte Erwartungswert P(·|B) (Z) und an die Stelle der Verteilungsfunktion FZ tritt die bedingte Verteilungsfunktion FZ|B . E E Definition 3.29 Sei Z : Ω → d eine Zufallsvariable und B ∈ A mit P(B) > 0. Wahrscheinlichkeitsrechnung R a) Die Verteilungsfunktion von Z bzgl. des bedingten Wahrscheinlichkeitsmaßes P(·|B) wird als bedingte Verteilungsfunktion von Z unter (der Hypothese) B bezeichnet und man schreibt FZ|B . Es gilt also FZ|B (x) := P {Z 6 x} | B = P {Z 6 x} ∩ B P(B) . b) Der Erwartungswert einer Zufallsvariable Z bzgl. des bedingten Wahrscheinlichkeitsmaßes P(·|B) wird als bedingter Erwartungswert von Z unter (der Hypothese) B bezeichnet und man schreibt [Z | B]. Es gilt also E E[Z | B] = Z Ω Z(ω)dP(ω|B) = Z Rd xdFZ|B (x). ❐ Bemerkung 3.30 Nach Bemerkung 3.20 gilt für jedes Ereignis A bei gegebenem Wahrscheinlichkeitsmaß Q E Q h A i = Q(A), also insbesondere für Q = P(·|B): E[ Wegen A |B] A∩B E = = P(·|B) ( A ) A P(A|B) = = = 17 · B = P(A|B) (3.2) folgt aber: 1 P(A ∩ B) P(B) Z 1 A∩B (ω)dP(ω) P(B) Ω Z B (ω) dP(ω) A (ω) · P(B) Ω Man kann B auch als mögliches zukünftiges Ereignis betrachten und fragen, wie sich die Einschätzung über die Wahrscheinlichkeiten verändert, falls dieses Ereignis eintritt. 50 c Klaus Schindler SS 2016 Stochastik Kapitel 3 3.10. Bedingte Erwartung Einsetzen in Gleichung (3.2) liefert E[ A |B] = Z A (ω) Ω · B (ω) P(B) dP(ω). Da sich jede messbare Funktion als Linearkombination von Indikatorfunktionen approximieren lässt, gilt diese Beziehung auch für beliebige Zufallsvariablen Z, d.h. es gilt E[Z | B] P(·|B) (Z) E = P Z· B P(B) (3.3) ist also eine Dichtefunktion von P(·|B) bzgl. P (·). In Kurzform wird dies in der fol- genden Form notiert: P(·|B) = B P(B) · P(·) oder P(dω|B) = B P(B) · P(dω). Dies bedeutet, dass der Erwartungswert einer ZV Z bzgl. des bedingten Wahrscheinlichkeitsmaßes P(·|B) gleich dem Erwartungswert von Z · B bzgl. des ursprünglichen WahrP(B) scheinlichkeitsmaßes P ist. Zieht man in Gleichung (3.3) den konstanten Faktor erhält man folgende Darstellung E[Z | B] = 1 · P(B) E P [Z · B] 1 P(B) vor, (3.4) Gleichung (3.4) zeigt, dass der bedingte Erwartungswert nichts anderes als eine gewichtete Mittelung der Funktionswerte über der Menge B und damit eine Verallgemeinerung des Erwartungswertes (über Ω) ist. [Z|B] gibt an, mit welchem Wert von Z gerechnet wird, wenn das Ereignis B eingetreten ist (bzw. eintreten würde). ❐ E Versucht man die Überlegungen aus Bemerkung 3.30 zu verallgemeinern, erweist sich die Voraussetzung P(B) > 0 als großes Hindernis, da die uns interessierenden Ereignisse der Form {Z = x} die Eintrittswahrscheinlichkeit 0 haben, wenn Z eine stetige Verteilung besitzt. Zudem wird i.A. nicht nur ein Ereignis (mit B ist z.B. auch ∁B bekannt), sondern im Extremfall eine ganze σ-Algebra I von Ereignissen (Informationen) vorliegen, z.B. die von vorgegebenen ZV Z1 , . . . , Zn erzeugte σ-Algebra σ(Z1 , . . . , Zn ). Da das Eintreten von Ereignissen vom eingetretenen Umweltzustand ω abhängt, wird man eine bedingte Erwartung als eine von ω und der gegebenen Informationsmenge I abhängige Zufallsgröße definieren, die u.a. Gleichung (3.4) genügt. Wir wollen diese allgemeine Definition der bedingten Erwartung zunächst in einem Spezialfall motivieren. Hierzu gehen wir davon aus, dass B1 , B2 , . . . eine Folge disjunkter Mengen mit P(Bi ) > 0 S und · Bi = Ω ist18 . Als Informations-σ-Algebra betrachten wir die von den Bi erzeugte σ-Algebra I := σ(B1 , B2 , . . . ). B(ω) bezeichne das - auf Grund der Disjunktheit - eindeutig bestimmte Ereignis Bj , das den Umweltzustand ω∈Ω enthält. 18 Man spricht von einer Zerlegung von Ω. Durch die Disjunktheit wird erreicht, dass jeder Umweltzustand in genau einem Ereignis Bj liegt. c Klaus Schindler SS 2016 51 Wahrscheinlichkeitsrechnung B P(B) E = Wahrscheinlichkeitsrechnung Kapitel 3 Bedingte Erwartung R Ist Z : Ω → d eine ZV, so definieren wir gemäß voriger Überlegung die bedingte Erwartung von Z bezüglich der σ-Algebra I als Zufallsgröße Y : Ω → d gegeben durch Y (ω) := R E[Z | B(ω)]. Da Y für alle ω ∈ Bi den konstanten Wert Y = X i E[Z|B ] · i E[Z|B ] annimmt, gilt offensichtlich i (3.5) Bi . Wahrscheinlichkeitsrechnung Daraus ergeben sich zwei charakteristische Eigenschaften von Y 1.) Y ist I-messbar und 2.) ∀A ∈ I : Z A Z(ω)dP(ω) = Z Y (ω)dP(ω). A Eigenschaft 1.) folgt direkt aus der Darstellung in Gleichung (3.5). Zum Nachweis von Eigenschaft 2.) betrachten wir ein beliebiges Ereignis A∈I. Wegen I = σ(B1 , B2 , . . . ) und S der Disjunktheit der Bi lässt sich A in der Form A= · Bj darstellen. Aus der paarweisen j∈J Disjunktheit der Mengen Bi ergibt sich dann Z A Y (ω)dP(ω) = = = = XZ j∈J Bj j∈J Ω j∈J Ω XZ Ω j∈J = X j∈J Gl. (3.4) = j∈J = Y (ω) Z A i Bj (ω)dP(ω) E[Z|B ] · | i E[Z|B ] · j E[Z|B ] j XZ Bj ≡ 0 für i6=j und damit: Y (ω)dP(ω) XZ X XZ Bi · Z |Ω Bi (ω) · {z Bj (ω) dP(ω) =0 für i6=j Bj (ω)dP(ω) } Bj (ω)dP(ω) Z(ω)dP(ω) {z P(Bj ) } Bj Z(ω)dP(ω) Eigenschaften 1.) und 2.) sind typisch für die bedingte Erwartung und gestatten daher, diesen Begriff für beliebige σ-Algebren I zu definieren19 . Dies führt zu folgendem Satz (bzw. Definition). 19 Entscheidend geht dabei der Satz von Radon-Nikodym ein (siehe Anhang A.7). Dieser besagt grob gesprochen, dass bei zwei R R vorgegebenen Maßen P und Q eine Dichtefunktion f mit dQ = f · dP existiert, d.h. Z(ω)dQ(ω) = Z(ω)f (ω)dP(ω). 52 c Klaus Schindler SS 2016 Stochastik Kapitel 3 3.10. Bedingte Erwartung Satz 3.31 Sei Z eine integrierbare Zufallsvariable auf (Ω, A, P) und I ⊂ A eine σ-Algebra. Dann existiert bis auf P-fast-sichere Gleichheit genau eine Zufallsvariable Y auf Ω, welche folgende zwei Bedingungen erfüllt: 1.) Y ist I-messbar A Y dP = Z A ZdP. Man bezeichnet Y als bedingte Erwartung von Z unter der Information (Hypothese) I und schreibt Y = [Z|I] oder Y = I [Z]. Wird speziell I von den Zufallsvariablen Z1 , . . . , Zn erzeugt, d.h. gilt I = σ(Z1 , . . . , Zn ), schreibt man [Z | Z1 , . . . , Zn ]. ❑ E E E Bemerkung 3.32 i) Wählt man in Eigenschaft 2.) von Satz 3.31 speziell A = Ω, so folgt E E[Z | I] = E[Z]. E[Z|I] ist daher ein unverzerrter I-messbarer Schätzer von Z. Eine ZV Z zu prognostizieren heißt also, eine andere ZV Y zu bestimmen, die 1.) I-messbar, d.h. an die gegebene Informationsmenge I in dem Sinne angepasst ist, dass sie nicht mehr als die vorhandene Information enthält und 2.) die „bestmögliche“ Approximation für Z ist, d.h. Z und Y liefern für jedes Ereignis A aus der Informationsmenge I die gleichen bedingten Erwartungswerte E[Y | A] = E[Z | A] ⇐⇒ Z A Y (ω)dP(ω) = Z A Z(ω)dP(ω) Betrachtet man speziell die Informationsmenge I0 = {∅, Ω}, d.h. liegt keine Information vor, so ist in diesem Sinn die konstante ZV Y ≡ (Z) mit E Y : ω 7→ E(Z), die beste I0 -messbare Vorhersage für Z. Es gilt in diesem Fall also (siehe hierzu auch Satz 3.35). E[Z | I ] ≡ E[Z] 0 ii) Eigenschaft 2.) der bedingten Erwartung liefert folgende äquivalente Formulierung. Eine I-messbare ZV Z0 ist genau dann gleich der bedingten Erwartung ∀I-messbaren X : Z Ω XZ0 dP = Z Ω XZdP E[Z | I], wenn (3.6) Dies folgt daraus, dass jede I-messbare ZV X mittels Linearkombinationen von Indikatorfunktionen A approximiert werden kann. c Klaus Schindler SS 2016 53 Wahrscheinlichkeitsrechnung 2.) ∀A∈I : Z Wahrscheinlichkeitsrechnung Kapitel 3 Bedingte Erwartung iii) Es sei nochmals darauf hin gewiesen, dass die bedingte Erwartung eine Zufallsgröße und daher nur bis auf Mengen vom Maß 0 eindeutig bestimmt ist. Insbesondere ist die bedingte Erwartung abhängig vom vorgegebenen Wahrscheinlichkeitsmaß, das daher zur Vermeidung von Zweideutigkeiten in manchen Situationen mit angegeben wird. Man schreibt dann z.B. P [Z | I]. Im Falle eines Maßwechsels ändert sich daher auch die bedingte Erwartung (siehe hierzu auch Satz 3.36). ❐ E Wahrscheinlichkeitsrechnung Beispiel 3.33 Wir betrachten folgendes Zufallsexperiment. Man wirft eine Münze. Fällt Zahl Z ist das Experiment beendet. Fällt dagegen Kopf K wird ein Bleistift auf eine horizontale Ebene geworfen und der Winkel α zwischen der Bleistiftspitze und Richtung Norden gemessen. Die Ergebnismenge lautet also Ω = {Z} ∪ {(K, α) | α∈[0, π]}. Wir definieren nun auf Ω die ZV Z : Ω → durch R Z(ω) := −1 falls ω = Z α falls ω = (K, α) Will man den Erwartungswert von Z berechnen, bietet sich die in Bemerkung 3.32 i) er[Z|I] bedingter Erwartungen mit einer geeignet gewählten wähnte Eigenschaft [Z] = E EE σ-Algebra I an. Bezeichnet B das Ereignis, dass Zahl beim Münzwurf fällt, wählen wir die σ-Algebra20 I := {∅, Ω, B, ∁B}. Wie zu Beginn dieses Abschnittes gesehen, gilt E[Z | I] = E[Z | B]· B E + [Z | ∁B]· ∁B Beträgt die Wahrscheinlichkeit für Zahl p, so ergibt sich wegen [ ∁B ] = P (∁B) = 1−p der Erwartungswert von Z durch E E[Z] = = = E[ B] = P (B) = p und E E[Z | I] E E[Z | B]· + E[Z | ∁B]· E[Z | B] · p + E[Z | ∁B] · (1−p) = −p + ∁B B π 2 · (1−p) Hierbei wurde verwendet, dass für den Fall des Eintretens von B der Erwartungswert von π Z gleich −1 ist und beim Wurf des Bleistiftes der Erwartungswert beträgt. ❐ 2 Der folgende Satz präzisiert, in welchem Sinn die bedingte Erwartung Vorhersage für Z bei gegebener Information I ist. 20 I ist gleich der von der Indikatorfunktion 54 B erzeugten σ-Algebra σ( c Klaus Schindler SS 2016 B ). E[Z|I] die beste Stochastik Kapitel 3 3.10. Bedingte Erwartung Satz 3.34 Sei Z eine quadratintegrierbare ZV auf dem Wahrscheinlichkeitsraum (Ω, A, P) und I ⊂ A E[Z|I] den Erwartungswert E |Z − Y | I-messbaren Zufallsvariablen auf Ω, d.h. es gilt Z E − E 2 [Z|I] = min Y I−messbar E |Z − Y | 2 2 in der Menge der ❑ Im folgenden Satz werden einige später benötigte Eigenschaften der bedingten Erwartung zusammengestellt. Sie zeigen, dass der Übergang von Z zu [Z|I] als eine Art „Glättung“ von Z bzgl. I angesehen werden kann. Mit dieser Glättung ist im Sinne unserer bisherigen Interpretationen ein Verlust an Information über Z verbunden. E Satz 3.35 Seien Z, Z1 , Z2 integrierbare Zufallsvariablen auf (Ω, A, P) und I ⊂ A eine σ-Algebra in A. Dann gelten die folgenden Aussagen P-fast sicher: E b) Gilt Z > Z P-fast sicher, so gilt E[Z |I] > E[Z |I]. c) Gilt Z > 0 P-fast sicher und E[Z|I] = 0 P-fast sicher, so folgt Z = 0. a) E[α·Z 1 E + β·Z2 |I] = α· [Z1 |I] + β· [Z2 |I] 2 1 2 1 d) Ist g(x1 , x2 ) eine stetige Funktion und X eine I-messbare ZV auf Ω, so gilt [g(Z, c)|I] E[g(Z, X)|I] = E Insbesondere folgt . c=X E[X·Z | I] = X · E[Z|I], E[X|I] = E[X|A] = X und E[1|I] = E[1|A] = 1. e) Für σ-Algebren H ⊂ I ⊂ A gilt das sog. Tower Law: E E[Z|I] H = E[Z|H] = E E[Z|H] I d) f) Sind die ZV Z und die σ-Algebra I stochastisch unabhängig, d.h. sind σ(Z) und I unabhängig, so gilt E[Z|I] = E[Z]. ❑ Da wir häufig verschiedene Wahrscheinlichkeitsmaße auf Ω betrachten, ist es nützlich zu wissen, wie sich die bedingten Erwartungen bei einem Maßwechsel verändern. Seien hierzu Q c Klaus Schindler SS 2016 55 Wahrscheinlichkeitsrechnung eine σ-Algebra. Dann minimiert Wahrscheinlichkeitsrechnung Kapitel 3 Bedingte Erwartung und P zwei Wahrscheinlichkeitsmaße. Q besitze bzgl. P die Dichte f , d.h. es gilt21 dQ = f ·dP bzw. in Integralform Z Ω Z(ω)dQ(ω) = Z Ω Z(ω)f (ω)dP(ω) (3.7) Daraus folgt (sofern Q(B) > 0): E 1 Q(B) P(B) Q(B) P(B) Q(B) Gl (3.4) Q [Z|B] = = Wahrscheinlichkeitsrechnung = Z B · · Z(ω)dQ(ω) 1 P(B) E · Z B Z(ω)f (ω)dP(ω) P [Z·f |B] Setzt man in Gleichung (3.7) speziell Z = Q(B) = Z B (ω)dQ(ω) Ω = Z Ω (3.8) B erhält man B (ω)f (ω)dP(ω) = P(B) E P [f |B], und Division liefert 1 . P [f |B] P(B) = Q(B) E Einsetzen in Gleichung (3.8) ergibt schließlich E Q [Z|B] EP [Z·f |B] EP [f |B] = . Dieses Ergebnis lässt sich wie bei der Konstruktion der bedingten Erwartung auf beliebige σ-Algebren verallgemeinern und liefert folgenden Satz. Satz 3.36 (Regel von Bayes) Seien Q und P zwei Wahrscheinlichkeitsmaße auf (Ω, A) mit dQ = f · dP und sei I eine σ-Algebra in A. Ist Z eine A-messbare Zufallsvariable, so gilt: E Q [Z|I] = E [Z·f |I] E [f |I] P ❑ P Beweis: Wir beweisen zunächst die Gleichung E Q 21 1 f I = 1 . P [f | I] E (3.9) f wird in der Literatur als Radon-Nikodym-Ableitung bezeichnet und mit 56 c Klaus Schindler SS 2016 dQ dP notiert. Stochastik Kapitel 3 3.10. Bedingte Erwartung E 1 ergibt sich aus der I-Messbarkeit von P [f | I]. Z.z. bleibt Die I-Messbarkeit von E [f P |I] die Integraleigenschaft 2.) der bedingten Erwartung. Sei hierzu A∈I beliebig. Dann gilt Ω A· E Q 1 I · f E P [f |I] dQ EP [f |I] I-messbar = Ω EQ Definition = Z Ω Z 1 ·dQ=dP f = Ω Z EP Definition = ZΩ f ·dP=dQ = Also gilt E Q 1 I · f E P [f |I] = E Q [1 Z Ω A· E Q 1 f E A · 1 f A · E A · f dP A · 1 dQ · · E P [f |I] P [f |I] P [f |I] I dQ dQ dP Wahrscheinlichkeitsrechnung Z | I] = 1 Mit Gleichung (3.9) können wir nun die gesuchte Gleichung E Q [Z|I] = E [Z·f |I] E [f |I] P P beweisen. Sei hierzu wieder A∈I beliebig. Dann gilt Z Ω A · Z dQ dQ=f ·dP = Definition = EP = = EQ EP[Zf |I] I-messbar = (3.9) = ZΩ Ω dP= f1 ·dQ Definition Z Z Ω Z Ω Z Ω Z Ω A · Z · f dP A · A · A A A E P [Z·f | I] dP E [Zf |I] · f1 dQ 1 · E E [Zf |I] · I dQ f 1 · E [Zf |I] · E I dQ f 1 · E [Zf |I] · E [f |I] dQ P Q P P Q P P E [Zf |I] Damit erfüllt EP [f |I] Eigenschaft 2.) der bedingten Erwartung von Z. Die I-Messbarkeit, P d.h. Eigenschaft 1.) der bedingten Erwartung, ergibt sich aus der Messbarkeit von und P [f |I]. E E P [Zf |I] Es liegt nun nahe, auch andere Begriffe, die vom gegebenen Wahrscheinlichkeitsmaß beeinflusst werden in Abhängigkeit von der gegebenen Informations-σ-Algebra I zu definieren. Hierzu soll zunächst die bzgl. eines einzelnen Ereignisses B bedingte Wahrscheinlichkeit P(·|B) (siehe Abschnitt 3.8) verallgemeinert werden, d.h. wir wollen die bzgl. einer σ-Algebra I bedingte Wahrscheinlichkeit P(·|I) definieren. Wie schon im Fall der bedingten Erwartung ist die bedingte Wahrscheinlichkeit eine Zufallsvariable. Da im unbedingten Fall P(A) = E[ A] c Klaus Schindler SS 2016 57 Wahrscheinlichkeitsrechnung Kapitel 3 Bedingte Erwartung gilt, liegt es nahe, die bzgl. der σ-Algebra I bedingte Wahrscheinlichkeit folgendermaßen zu definieren. Definition 3.37 Die bzgl. der σ-Algebra I bedingte Wahrscheinlichkeit P(.|I) ist definiert durch P(·|I) : A → {Z | Z ist I-messbare ZV} A 7→ P(A|I) := [ A |I] . E Wahrscheinlichkeitsrechnung Wird speziell I von den Zufallsvariablen Z1 , . . . , Zn erzeugt, d.h. gilt I = σ(Z1 , . . . , Zn ), schreibt man P(·|Z1 , . . . , Zn ). ❐ Bemerkung 3.38 i) Es sei nochmals darauf hingewiesen, dass für jedes Ereignis A ∈ A die bedingte Wahrscheinlichkeit P(A|I) = [ A |I] eine ZV ist. Da nach Eigenschaft 2.) der bedingten Erwartung E Z G E[Z|I](ω)dP(ω) = Z G Z(ω)dP(ω) = Z für alle G ∈ I gilt, heißt dies speziell für Z = Z G Z P(A|I)(ω)dP(ω) = ZG 2.) = E[ ZG = Ω Z(ω) · Ω G (ω)dP(ω) A A |I](ω)dP(ω) A (ω)dP(ω) A (ω) · G (ω)dP(ω) = P(A ∩ G) ii) Die bedingte Wahrscheinlichkeit P(A|I) weist zum Wahrscheinlichkeitsmaß P analoge Eigenschaften auf, z.B.: 1.) Für alle A ∈ A gilt: ∀ω∈Ω : 0 6 P(A|I)(ω) 6 1. 2.) Ist (Aℓ )∞ ℓ=1 eine Folge disjunkter Mengen in A, so gilt P ∞ S · Aℓ |I (ω) = ℓ=1 ∞ X ℓ=1 P(Aℓ |I)(ω) 3.) Für A, B ∈ A mit A ⊂ B gilt P(B\A|I)(ω) = P(B|I)(ω) − P(A|I)(ω) 4.) Ist (Aℓ )∞ ℓ=1 eine isotone Folge mit lim Aℓ = A, so folgt die Stetigkeitsaussage ℓ→∞ P(A|I)(ω) = P( lim Aℓ |I)(ω) = lim P(Aℓ |I)(ω) ℓ→∞ 58 ℓ→∞ c Klaus Schindler SS 2016 ❐ Stochastik Kapitel 3 3.10. Bedingte Erwartung Mit Hilfe der bedingten Wahrscheinlichkeit P(·|I) kann nun auch analog zum „klassischen“ Fall der Begriff der bedingten Verteilung bzw. der bedingten Verteilungsfunktion eingeführt werden. Im unbedingten Fall ist die Verteilungsfunktion FZ der ZV Z definiert durch FZ (x) = P({Z6x}), was folgende Definition nahe legt. FZ|I (x) = P({Z6x} | I) = E[ {Z6x} | I]. Wird speziell I von den Zufallsvariablen Z1 , . . . , Zn erzeugt, d.h. gilt I = σ(Z1 , . . . , Zn ), ❐ schreibt man FZ|Z1 ,...,Zn . Bemerkung 3.40 i) Da die bedingte Wahrscheinlichkeit P(A|I) für jedes Ereignis A eine ZV ist, stellt FZ|I eine Funktion in zwei Variablen dar. Genauer gilt FZ|I : Ω × R → [0, 1] (ω, x) 7→ FZ|I (x) (ω) = P({Z6x}|I)(ω) ii) Analog zur bedingten Wahrscheinlichkeit weist auch die bedingte Verteilungsfunktion ähnliche Eigenschaften wie die unbedingte Verteilungsfunktion auf. So lässt sich der (unbedingte) Erwartungswert [Z] als Riemann-Stieltjes-Integral bzgl. der (unbedingten) Verteilungsfunktion darstellen, denn es gilt nach Definition 3.19 (siehe Kapitel 3, Abschnitt 3.7) E E[Z] = Z R xdFZ (x). dFZ (x) ist dabei zu lesen als FZ (x+dx) − FZ (x) = P({x < Z 6 x+dx}). Die analoge Aussage gilt für die bedingte Erwartung: E[Z|I](ω) = Z R xdFZ|I (x)(ω) = Z R xP({x < Z 6 x+dx}|I)(ω). ❐ Beispiel 3.41 Wir betrachten erneut Beispiel 3.33 mit Ω = {Z} ∪ ({K} × [0, π]) = {Z} ∪ {(K, α) | α∈[0, π]} und der ZV Z : Ω → , definiert durch: Z(ω) := R −1 falls ω = Z α falls ω = (K, α) c Klaus Schindler SS 2016 59 Wahrscheinlichkeitsrechnung Definition 3.39 Die bedingte Verteilungsfunktion FZ|I der ZV Z unter der Hypothese I ist definiert durch Wahrscheinlichkeitsrechnung Kapitel 3 Bedingte Erwartung I sei die von dem Ereignis B = {Z} erzeugte σ-Algebra, d.h. I = σ( B ) = {∅, B, ∁B, Ω}. Wir bestimmen die bedingte Verteilungsfunktion FZ|I . Hierzu berechnen wir zunächst die Ereignisse {Z6x}. Es gilt {Z6x} = falls falls falls falls ∅ B B ∪ ({K} × [0, x]) Ω x < −1 −1 6 x < 0 06x<π π6x E[·|I] = E[·|B] · + E[·|∁B] · E[ |B] · + E[ |∁B] · Wie in Beispiel 3.33 gesehen, gilt Wahrscheinlichkeitsrechnung P(A|I) = E[ A |I] = = B A B P(A ∩ B) P(B) · B und daher ∁B A + ∁B P(A ∩ ∁B) P(∁B) · ∁B Damit ergibt sich schließlich FZ|I (x) = P({Z6x}|I) = = 60 P({Z6x} ∩ B) P(B) ∅ ≡0 B B + Ω x π ∁B ≡1 · B + P({Z6x} ∩ ∁B) P(∁B) · ∁B falls x < −1 falls −1 6 x < 0 falls 0 6 x < π falls π6x ❐ c Klaus Schindler SS 2016 K APITEL 4 Stochastische Prozesse I Zufallsgrößen werden meistens zu verschiedenen Zeitpunkten betrachtet. Die realisierten Werte liefern dann eine Zeitreihe. Typische Beispiele sind täglich, monatlich oder jährlich erhobene Wirtschaftsdaten (Aktienkurse, Arbeitslosenziffern, Absatzzahlen). Daher liegt es nahe, zeitliche Folgen von Zufallsgrößen zu untersuchen. bezeichne im Folgenden eine nichtleere „Zeitmenge“ reeller Zahlen und (Ω, A, P) einen Wahrscheinlichkeitsraum. T Definition 4.1 Ein stochastischer Prozess ist eine Familie (Xt )t∈T von ZV auf demselben Wahrscheinlichkeitsraum (Ω, A, P). Nehmen die Zufallsgrößen Xt Werte im d an, spricht man von einem stochastischen Prozess der Dimension d. Bei gegebenem ω∈Ω wird die Funktion R · X (ω) : T→R d mit t 7→ Xt (ω) als Realisation, Trajektorie oder Pfad des Prozesses bzw. Kursbaum bezeichnet. ❐ Bemerkung 4.2 i) Man beachte, dass für festes t die Größe Xt (·) eine Zufallsvariable ist. ii) Obwohl dies in Definition 4.1 nicht gefordert wird, sind überwiegend die Fälle von Interesse, bei denen Zusammenhänge zwischen den Größen Xt für unterschiedliche t bestehen. Beschreibt (Xt )t∈T z.B. einen Aktienkursprozess, so wird im allgemeinen das zukünftige Verhalten Xu mit u>t vom vergangenen Preisverlauf und evtl. weiteren, bis zum Zeitpunkt t eingetretenen Ereignissen, abhängen. Wir betrachten drei Typen von Indexmengen : T • T = {t , t , . . . , t • T = {t N mit N∈ und t0 < t1 < · · · < tN . Man spricht in diesem Fall von Prozessen in diskreter Zeit mit endlichem Zeithorizont 1, 0 1 i | i∈ N} N } mit t ∈R, t 0 i i < ti+1 für alle i∈ T 2 lim ti = ∞. Man erhält i→∞ in diesem Fall Prozesse in diskreter Zeit mit unendlichem Zeithorizont 2, • Ist ein Intervall der reellen Zahlen sich Prozesse in stetiger Zeit. 1 N sowie R (oft gilt T = [0, T ] mit T 6 +∞), ergeben T = {0, 1, . . . , N } vorausgesetzt werden Wegen der Bijektivität der Abbildung ℓ 7→ tℓ kann o.B.d.A. T = N vorausgesetzt werden Wegen der Bijektivität der Abbildung ℓ 7→ tℓ kann o.B.d.A. 0 Wahrscheinlichkeitsrechnung Kapitel 4 Irrfahrten iii) Ein Aktien-Portfolio wird durch einen Vektor beschrieben und ist damit ein Beispiel für einen mehrdimensionalen Prozess. Da ein d-dimensionaler Prozess aus d eindimensionalen Prozessen besteht, genügt es, reellwertige Prozesse zu betrachten. iv) Es liegt nahe, die Eigenschaften eine stochastischen Prozesses (Xt )t∈T mit den Begriffen zu beschreiben, die wir zur Charakterisierung von ZV verwendet haben, also Erwartungswert, Verteilung, Varianz, Kovarianz usw.. Im Gegensatz zu früher sind wegen der Zeitabhängigkeit stochastischer Prozesse alle Größen i.A. jedoch zeitabhängig. Ohne zu sehr in die Tiefe zu gehen, seien einige dieser Begriffe hier kurz aufgeführt. T 1) Für t1 , . . . , tn ∈ bezeichne Ft1 ,...,tn die gemeinsame Verteilungsfunktion der ZV Xt1 , . . . , Xtn , d.h. für z = (z1 , . . . , zn ) gilt FXt1 ,...,Xtn (z1 , . . . , zn ) := P({Xt1 6z1 , . . . , Xtn 6zn }) T N Die Menge {FXt1 ,...,Xtk | ti ∈ , k∈ } wird als endlichdimensionale Verteilung des Prozesses (Xt )t∈T bezeichnet. Analog zu Abschnitt 3.10 ist der Begriff der bedingten Verteilung definiert. Stochastische Prozesse I 2) Die Erwartungswertfunktion von (Xt )t∈T gibt an, welchen Wert der Prozess zu einem beliebigen Zeitpunkt t im Mittel besitzt und ist definiert durch t 7→ E[X ] t 3) Die Beziehungen zwischen den ZV des stochastischen Prozesses (Xt )t∈T wird beschrieben durch die Varianz- bzw. Autokovarianzfunktion, definiert durch t 7→ var(Xt ) bzw. (t, h) 7→ cov(Xt , Xt−h ) ❐ 4.1. Zeitdiskrete stochastische Prozesse In diesem Kapitel beschränken wir uns zunächst auf die Konstruktion zeitdiskreter stochastischer Prozesse und deren Eigenschaften. Hierbei wählen wir o.B.d.A. = 0 . Da oftmals nur die absolute Änderung (Zuwachs) (∆X)t := Xt+1 − Xt des Ausgangsprozesses (Xt )t∈T wahrgenommen wird und da offensichtlich T N Xt = X0 + t−1 X (∆X)k (4.1) k=0 gilt, kann der Prozess (Xt )t∈T mit Hilfe des Differenzenprozesses Zk := (∆X)k untersucht werden. Dieser hat häufig angenehmere Verteilungseigenschaften, als der Ausgangsprozess3 . Gleichung (4.1) bietet zudem die Möglichkeit, den stochastischen Prozess (Xt )t∈T indirekt zu 3 Für kleine Zeitdifferenzen entspricht (∆X)t dem „Differential“ des Prozesses. Dies wird in Kapitel 5 mit den Begriffen „Stochastische Differentiation“ und dem Lemma von Itô präzisiert. 62 c Klaus Schindler SS 2016 Stochastische Prozesse I Kapitel 4 4.1. Zeitdiskrete stochastische Prozesse erzeugen, indem man den Differenzenprozess (Zt )t∈T mit geeigneten Verteilungseigenschaften vorgibt. Hierdurch wird der Prozess (Xt )t∈T mit Hilfe einer stochastischen Differenzengleichung4 beschrieben. Zur Vereinfachung betrachten wir in diesem Kapitel nur einfache Irrfahrten, d.h. zeitdiskrete Prozesse mit unabhängig identisch verteilten Zuwächsen. Definition 4.3 a) Ein stochastischer Prozess in diskreter Zeit mit u.i.v. absoluten Änderungen, wird als Irrfahrt oder Random Walk bezeichnet. b) Eine Irrfahrt, bei der die absoluten Änderungen nur endlich viele Werte annehmen, heißt arithmetische Irrfahrt. Nehmen die Zuwächse nur zwei bzw. drei Werte an, spricht man von einem arihmetischen Binomial- bzw. arihmetischen Trinomialprozess. ❐ 4.1.1. Arithmetische Binomialprozesse Stochastische Prozesse I Definition 4.4 Ein stochastischer Prozess (Xt )t∈N0 , bei dem die absoluten Zuwächse Zk = (∆X)k • nur zwei Werte u > 0 bzw. −d < 0 annehmen können5 , • unabhängig identisch verteilt und • unabhängig vom Anfangswert X0 sind, wird als arithmetischer Binomialprozess 6 bzw. als einfache oder arithmetische Irrfahrt bezeichnet. Der arithmetische Binomialprozess hat daher die Form Xt = X0 + t−1 X (4.2) Zk , k=0 wobei X0 , Z1 , Z2 , . . . unabhängig sind, mit der Verteilung P({Zk = u}) = p , P({Zk = −d}) = 1−p, für alle k. ❐ Bei einem Binomialprozess kann sich der Pfad - ausgehend von einem festen Anfangswert X0 = a - nur innerhalb eines Netzes von Verbindungen der Punkte (t, Xt ) bewegen, wobei N Xt = a + n · u − m · d , wobei n, m ∈ 0 , = a + n · (u+d) − t · d für n = 0, . . . , t n+m=t 4 Die stetige Variante, die wir in Kapitel 5 untersuchen, wird als stochastische Differentialgleichung bezeichnet. 5 Die Bezeichnungen u bzw. d beziehen sich auf die englischen Worte up bzw. down. 6 Die Verwendung der Vorsilbe „bi-“ bezieht sich darauf, dass jeder Zuwachs nur „zwei“ Werte annehmen kann. Das Adjektiv „arithmetisch“ erklärt sich durch die Analogie zu (deterministischen) arithmetischen Folgen, bei denen Zuwächse immer gleich sind. Die Bezeichnung steht - analog zum deterministischen Fall - im Gegensatz zum geometrischen Prozess, dessen Logarithmus ein arithmetischer Prozess ist. c Klaus Schindler SS 2016 63 Wahrscheinlichkeitsrechnung Kapitel 4 Irrfahrten Xt = a + n·u − m·d bedeutet, dass der Prozess vom Zeitpunkt 0 bis zum Zeitpunkt t insgesamt n-mal gewachsen und m-mal gefallen ist (siehe nachfolgende Skizze im Fall t=7). Kurs X77 X66 Arithmetischer Binomialprozess Xjk = X0 + k·u + (j−k)·d t = 7, j = 1, . . . , n, k = 0, . . . , j p 1−p p 1−p p p 1−p p 1−p p 1−p p 1−p p 1−p p 1−p p X55 X44 X33 X22 X11 X0 p b 1−p p X10 X32 b p 1−p X31 1−p X21 b X20 X43 1−p X42 X54 X53 p p 1−p p 1−p 1−p 1−p Stochastische Prozesse I 2 X64 b X63 1−p 1−p p 1−p p p 1−p p 1−p 1−p p 1−p p 1−p p 1−p 1−p p X30 X41 X40 X51 X50 3 4 X62 X61 X60 1−p 5 6 X76 X75 X74 b p p X52 = Erwartungswertfunktion = mögliche Realisation 1 X65 b b p 1−p b p X73 X72 X71 X70 Zeit t 7 Beim arithmetischen Binomialprozess mit Startwert X0 ergibt sich wegen der Unabhängigkeit der absoluten Zuwächse und wegen (Zk ) = (u+d)·p − d in Abhängigkeit von t eine arithmetische Folge als Erwartungswertfunktion, nämlich E t 7→ E(X ) = E(X ) + t · [(u+d)·p − d] . t 0 Das Vorzeichen des Terms (u+d)·p − d entscheidet, ob die Irrfahrt einen Trend (Drift) nach oben oder nach unten besitzt, d.h. ob der Prozess sich im Mittel vom Startwert nach oben oder unten weg bewegt. Liegt kein Trend vor, d.h. ist (u+d)·p − d = 0, spricht man von einer symmetrischen Irrfahrt. Mit wachsender Zeit t kann Xt immer mehr verschiedene Werte annehmen, und die Variabilität wächst. Da die Zuwächse Zk in (4.2) unabhängig sind und zudem var(Zk ) = var(Z1 ) für alle k gilt, lautet die Varianzfunktion von Xt nach Bemerkung 3.28 iv) t 7→ var(Xt ) = var(X0 ) + t · var(Z1 ) , wächst also linear mit der Zeit, die Standardabweichung s(Xt ) mit der Rate Yk = bzw. umgekehrt Zk + d u+d = 1 wenn Zk = u 0 wenn Zk = −d Zk = (u+d)·Yk − d , 64 c Klaus Schindler SS 2016 √ t. Mit Stochastische Prozesse I Kapitel 4 Trinomialprozesse kann der Binomialprozess mit Hilfe der Binomialverteilung dargestellt werden. Man erhält X t = X0 + t−1 X Zk = X0 + (u+d)· k=0 t−1 X k=0 Yk − td = X0 + (u+d)·Bt − td mit der nach Beispiel 3.17 v) Bt,p -verteilten Zufallsgröße Bt = t−1 X Yk . k=0 Bei gegebener Verteilung des Anfangswertes X0 kann die Verteilung von Xt mit Hilfe der Binomialverteilung Bt,p dargestellt werden. Da −td als deterministischer Prozess unabhängig von Bt ist, liefert Bemerkung 3.20 iv) im Fall X0 =0 die Varianzfunktion var(Xt ) = var (u+d)·Bt = (u+d)2 ·var(Bt ) = t(u+d)2 ·p·(1−p). Für große t ergibt sich nach Bemerkung 3.18 Für p = 1 ,u 2 , t·(u+d)2 ·p·(1−p) . Stochastische Prozesse I Verteilung von Xt ≈ Nt[(u+d)p−d] = d = ∆x erhalten wir beispielsweise Verteilung von Xt ≈ N0 , t·(∆x)2 . 4.1.2. Arithmetische Trinomialprozesse Ein Trinomialprozess kann auch Seitwärtsbewegungen darstellen, wodurch er „natürlicher“ als der Binomialprozess wirkt, bei dem zu jedem Zeitpunkt eine Änderung stattfindet. Definition 4.5 Ein stochastischer Prozess (Xt )t∈N0 bei dem die absoluten Zuwächse Zk = (∆X)k • nur drei Werte u1 , u2 , u3 mit u1 < u2 < u3 annehmen können7 , • unabhängig identisch verteilt und • unabhängig vom Anfangswert X0 sind, wird als arithmetischer Trinomialprozess bezeichnet. Er hat daher die Form Xt = X0 + t−1 X (4.3) Zk , k=0 wobei X0 , Z1 , Z2 , . . . unabhängig sind und alle Zk die gleiche Verteilung haben P(Zk = ui) = pi (i = 1, 2, 3), mit p1 + p2 + p3 = 1. 7 ❐ „Natürlich“ wirkt z.B. u2 = 0. c Klaus Schindler SS 2016 65 Wahrscheinlichkeitsrechnung Kapitel 4 Irrfahrten Das folgende Bild beschreibt das prinzipielle Verhalten eines Trinomialbaumes. Aufwärtsbewegungen sind blau, Abwärtsbewegungen rot gekennzeichnet. Seitwärtsbewegungen (hier gleich bleibende Kurse durch u2 =0) werden mit einer grünen Linie dargestellt. 5,0 Kurs Xjkℓ X5 Arithmetischer Trinomialprozess = X0 + k·u3 + ℓ·u1 + (j − k− ℓ) ·u2 n = 5, j = 1, . . . , n, k + ℓ ≤ j p 4,0 X4 4,0 r X5 q p 3,0 X3 p 3,0 r X4 4,1 X5 3,0 r X5 p q p 2,0 Stochastische Prozesse I X2 p 2,0 r X3 q p p 2,1 X3 q 3,1 X4 2,0 r X4 p q q p r 2,1 X4 1,0 1,0 rr q pp p X2 b 1,1 X2 b 1,0 rr X3 b p p q qq p r 1,1 X3 p r X4 2,2 X4 1,1 X4 p X0 b 0,0 r X1 q 0,0 r 0,0 q r p p q q 0,1 X1 X2 0,1 r X2 q 1,2 X3 X3 p r q p q q 0,2 X3 q p r q p q rr q r p r q p X4 1,3 X4 X4 p r q p q q 0,3 X4 X5 2,2 X5 1,1 X5 2,3 X50,0 X5 1,2 X5 X5 1,3 X5 0,2 q r p r b 2,1 X5 0,1 q r 0,2 r 0,3 X3 1,2 X4 3,2 X5 1,0 q r p X4 X5 p 0,1 q r p r r 0,0 q r 0,1 r 0,2 X2 X3 p 1,0 q r 3,1 X5 2,0 q r p b X1 p r X5 1,4 X5 0,3 r X5 p q q 0,4 X4 = Erwartungswertfunktion = mögliche Realisation 1 66 2 0,4 r X5 q 0,5 X5 3 c Klaus Schindler SS 2016 4 5 Zeit Stochastische Prozesse I Kapitel 4 Geometrische Binomialprozesse Die exakte Verteilung der Xt lässt sich nicht auf die Binomialverteilung zurückführen, aber es gilt ähnlich wie für den Binomialprozess: E(X ) t = E(X ) + t · E(Z ) = E(X ) + t · (p 0 1 0 var(Xt ) = var(X0 ) + t · var(Z1 ), wobei 3 · u 3 + p2 · u 2 + p1 · u 1 ) var(Z1 ) = p3 u23 + p2 u22 + p1 u21 − (p3 u3 + p2 u2 + p1 u1 )2 und für große t ist Xt näherungsweise NE(Xt ),var(Xt ) -verteilt. Trinomialschemata, bei denen die Wahrscheinlichkeiten p3 , p1 , p2 allerdings im Sinne von Abschnitt 4.1.4 zeit- und zustandsabhängig sein dürfen, werden von manchen Autoren benutzt, um die Black-Scholes-Gleichung näherungsweise zu lösen. Hinter der Idee, reale Prozesse mittels einer „Arithmetischen Irrfahrt“ zu modellieren, steckt die Annahme, dass die absoluten Änderungen in einer Zeiteinheit unabhängig voneinander und immer von derselben Größenordnung sind. Letzteres ist gerade für wirtschaftliche Zeitreihen oft nicht erfüllt. Saisonale Schwankungen von z.B. monatlichen Absatzzahlen sind typischerweise absolut wesentlich größer, wenn der Absatz sich im Jahresmittel auf hohem Niveau bewegt. Nur die relativen (prozentualen) Änderungen sind über die Zeit stabil und hängen nicht davon ab, wie groß die Werte des Prozesses Xt gerade sind. Analog zur arithmetischen Irrfahrt stellt man daher einen Prozess (Xt )t∈N0 mit Hilfe der relativen Änderungen Rk := Xk+1 Xk dar Xt = X0 · X1 X0 · X2 X1 ··· Xt−1 Xt−2 · Xt Xt−1 = X0 · t−1 Y Rk k=0 und fordert dann geeignete Verteilungseigenschaften für die relativen Zuwächse Rk . Man spricht daher von einer geometrischen Irrfahrt, wenn die relativen Zuwächse u.i.v. sind. Definition 4.6 X Ein stochastischer Prozess (Xt )t∈N0 bei dem die relativen Zuwächse Rk := k+1 Xk • nur zwei Werte u > 1 bzw. 1 > d > 0 annehmen können, • unabhängig identisch verteilt und • unabhängig vom Anfangswert X0 sind, heißt geometrischer Binomialprozess oder geometrische Irrfahrt. Er hat daher die Form Xt = X0 · t−1 Y (4.4) Rk k=0 wobei X0 , R1 , R2 , . . . unabhängig sind, mit der Verteilung P({Rk = u}) = p, P({Rk = d}) = 1−p . c Klaus Schindler SS 2016 ❐ 67 Stochastische Prozesse I 4.1.3. Geometrische Binomialprozesse Wahrscheinlichkeitsrechnung Kapitel 4 Irrfahrten X77 Kurs p Geometrischer Binomialprozess Xjk = X0 ·uk ·d j−k (u · d = 1) t = 7, j = 1, . . . , n, k = 0, . . . , j X66 p 1−p X55 p X76 X65 p X11 p X0 p b 1−p X10 p b 1−p 1−p 1−p X21 X20 1−p X43 p X32 b 1−p 1−p p X31 p 1−p 1−p p 1−p p X52 1−p X40 1−p X51 p X50 1−p p 1−p p Stochastische Prozesse I = Erwartungswertfunktion = mögliche Realisation 2 3 4 E X64 p X53 p p p 1−p 1−p 1 b b p 1−p X41 1−p X75 b X42 1−p X30 p b p 1−p 1−p X54 p b p 1−p X33 X22 p 1−p X44 5 X63 1−p X62 X74 X73 p 1−p X61 p X60 1−p p 1−p 6 X72 X71 X70 7 Zeit Da (Rk ) = (u−d)·p + d, folgt aus (4.4) mit den Rechenregeln für unabhängige Zufallsgrößen, dass die Erwartungswertfunktion (Xt ) eine geometrisch Folge ist, d.h. mit exponentieller Rate steigt oder fällt, je nachdem ob (Rk ) > 1 oder (Rk ) < 1 ist: E E E E(X ) = E(X ) · (E(R )) = E(X ) · [(u−d)·p + d] t Wenn 0 1 t 0 t . E(R ) = 1 gilt, bleibt der Prozess im Mittel stabil. Dies ist der Fall, wenn k p= 1 1−d u−d . Für d = , d.h. für einen Prozess, der nach zwei Zeiteinheiten wieder den Ausgangszustand u erreicht haben kann, vereinfacht sich diese Beziehung zu p= 1 u+1 . Aus (4.4) folgt durch Logarithmieren ln(Xt ) = ln(X0 ) + t−1 X ln(Rk ) . k=0 Der logarithmierte geometrische Binomialprozess X̃t = ln(Xt ) ist also ein arithmetischer Binomialprozess mit Anfangswert ln(X0 ) und absoluten Zuwächsen Zk = ln(Rk ), für die gilt P({Zk = ln(u)}) = p, P({Zk = ln(d)}) = 1−p . Für große t ist X̃t annähernd normalverteilt, Xt = eX̃t also näherungsweise lognormalverteilt. 68 c Klaus Schindler SS 2016 Stochastische Prozesse I Kapitel 4 Allgemeine Irrfahrten Bemerkung 4.7 Ist (Xt )t∈T ein geometrischer Binomialprozess, so folgt wegen Zt = Xt+1 − Xt = Xt ·(Rt − 1) = Xt ·(u−1) für Rt = u Xt ·(d−1) für Rt = d dass (Xt )t∈T kein Prozess mit unabhängigen absoluten Zuwächsen ist. Vielmehr sind die absoluten Änderungen vom erreichten Kursniveau abhängig. ❐ 4.1.4. Allgemeine Irrfahrten Arithmetische Bi- und Trinomialprozesse sind einfache Beispiele allgemeiner Irrfahrten mit unabhängigen absoluten Zuwächsen, d.h. stochastischer Prozesse Xt = X0 + t−1 X Zk , t = 1, 2, . . . mit unabhängig identisch verteilten absoluten Zuwächsen Z1 , Z2 , . . . , die außerdem unabhängig von X0 sind. Die Verteilung der Zuwächse kann dabei völlig beliebig sein. Die einzelnen Zk können endlich oder abzählbar viele Werte annehmen, wie beim Bi- oder Trinomialprozess, sie können aber auch einen kontinuierlichen Wertebereich haben. Ein Beispiel für eine Irrfahrt mit komplizierterer Verteilung und kontinuierlichem Wertebereich ist die Gaußsche Irrfahrt. Diese entsteht, wenn man die Zuwächse als unabhängig und identisch Nµ,σ2 -verteilt wählt. Der Einfachheit halber starte der Prozess in 0, d.h. es sei X0 =0. Aus den Eigenschaften der Normalverteilung folgt dann, dass zu jedem Zeitpunkt t der Wert Xt des Prozesses Nµt,σ2 t -verteilt ist und dass je endlich viele Werte X1 , . . . , Xt jeweils gemeinsam normalverteilt sind. Der zentrale Grenzwertsatz für u.i.v. Zufallsgrößen zeigt, dass für große t dies approximativ für alle Irrfahrten gilt, wenn X0 = 0 und var(Z1 ) endlich ist, d.h. Verteilung von Xt ≈ Nt·E(Z1 ),t·var(Z1 ) . Irrfahrten sind Prozesse mit unabhängigen absoluten Zuwächsen und haben daher insbesondere auch die Eigenschaft, dass keine Nachwirkung besteht, d.h. die absolute Änderung Zt+1 des Prozesses von der Zeit t zur Zeit t+1 ist unabhängig von den Werten X0 , . . . , Xt des Prozesses in der Vergangenheit bis zur Zeit t. Allgemeiner ist dann für beliebige s > 0 der absolute Zuwachs des Prozesses im Zeitintervall [t, t+s] Xt+s − Xt = Zt + · · · + Zt+s−1 unabhängig von X0 , . . . , Xt . Ist die Kenntnis aller X0 , . . . , Xt gegeben, so ist folglich X̂t+1 := Xt + (Zt ) die beste Vorhersage 8 für Xt+1 . Solange ein Aktienkurs isoliert betrachtet wird, E 8 Dies ist so zu verstehen, dass für eine Prognose P die quadratische Abweichung E[(Xt+1 − P)2 ] zum tatsächlich eingetretenen Wert Xt+1 zu erwarten ist. Die Prognose P = X̂t+1 minimiert diese Abweichung. c Klaus Schindler SS 2016 69 Stochastische Prozesse I k=0 Wahrscheinlichkeitsrechnung Kapitel 4 Irrfahrten trifft diese Aussage für den Aktienkursprozess oft in guter Näherung zu9 . Prozesse mit unabhängigen Zuwächsen sind automatisch Markoff-Prozesse, d.h. Prozesse bei denen die zukünftige Entwicklung (Zuwachs) nur von Xt abhängt und nicht mehr von den weiter zurückliegenden Werten X0 , . . . , Xt−1 . Mathematisch bedeutet dies, dass die bedingte Verteilung nur von der unmittelbaren Vergangenheit abhängt, d.h. P(· | Xt , Xt−1 , . . . , X0 ) = P(· | Xt ) Man spricht von der Markoff-Eigenschaft. Für zeitdiskrete Prozesse bedeutet diese P(at+1 < Xt+1 < bt+1 | Xt = c, at−1 < Xt−1 < bt−1 , . . . , a0 < X0 < b0 ) = P(at+1 < Xt+1 < bt+1 | Xt = c) = P(at+1 − c < Zt+1 < bt+1 − c). Wenn Xt = c bekannt ist, ändern zusätzliche Informationen über die Werte von X0 , . . . , Xt−1 die Einschätzung, in welchem Bereich Xt+1 vermutlich liegen wird, nicht. Stochastische Prozesse I Bemerkung 4.8 Heuristisch betrachtet liegt die Markoff-Eigenschaft nahe an deterministischen Modellen, bei denen nach Festlegung des Startwertes der zukünftige Verlauf genau bestimmt ist. ❐ 4.1.5. Binomialprozesse mit zustandsabhängigen Zuwächsen Einfache Irrfahrten und damit auch Binomial- und Trinomialprozesse beschreiben den Verlauf eines Aktienkurses bestenfalls lokal. Sie gehen davon aus, dass die Verteilung der absoluten Zuwächse Zt = ∆Xt stets dieselbe ist - unabhängig davon, ob der Kurs mittlerweile deutlich über oder unter dem Anfangskurs X0 liegt. Geometrische Irrfahrten lassen den absoluten Zuwachs ∆Xt = (Rt − 1)·Xt vom erreichten Kursniveau Xt abhängen und sind damit keine Prozesse mit unabhängigen absoluten Zuwächsen. Will man den Aktienkursverlauf über einen größeren Bereich modellieren, sind jedoch auch diese Prozesse noch zu einfach, um den Einfluss des erreichten Kursniveaus auf die zukünftige Entwicklung zu beschreiben. Eine einfache Klasse von Prozessen, die diesen Effekt berücksichtigen, sind die Binomialprozesse mit zustandsabhängigen (und eventuell auch zeitabhängigen) absoluten Zuwächsen: Xt+1 = Xt + Zt , mit P(Zt =u) = p(Xt , t), P(Zt =−d) = 1−p(Xt , t) (4.5) Die absoluten Zuwächse sind jetzt weder unabhängig noch identisch verteilt, da die Verteilung von Zt vom erreichten Kursniveau Xt und eventuell auch von der Zeit abhängt. 9 Schon vor über hundert Jahren postulierte Bachelier (hier für den Fall E(Zk ) = 0 für alle k): „Die beste Vorhersage X̂t+1 für den Kurs Xt+1 von morgen ist der Kurs Xt von heute.“ Siehe hierzu [1]. 70 c Klaus Schindler SS 2016 Stochastische Prozesse I Kapitel 4 4.2. σ-Algebren und Information Die Funktion p ordnet jedem möglichen Wert x des Prozesses zur Zeit t eine Wahrscheinlichkeit p(x, t) zu. Stochastische Prozesse, die nach (4.5) konstruiert werden, haben immer noch die Markoff-Eigenschaft. Entsprechend lassen sich geometrische Binomialprozesse mit zustandsabhängigen relativen Zuwächsen definieren (für d < 1 < u): Xt+1 = Rt ·Xt , mit P(Rt =u) = p(Xt , t), P(Rt =d) = 1−p(Xt , t) (4.6) Prozesse der Form (4.5) und (4.6) sind in dieser Allgemeinheit in erster Linie für theoretische Untersuchungen geeignet, da es ohne weitere Annahmen schwierig ist, die Wahrscheinlichkeiten p(x, t) aus Beobachtungen des tatsächlichen Aktienkursverlaufs zu schätzen. Diese allgemeinen Binomial- und auch die analog definierten Trinomialmodelle eignen sich jedoch zur numerischen Lösung von Differentialgleichungen wie z.B. der Black-Scholes-Gleichung für amerikanische Optionen. Die Bildung des Erwartungswertes von Zufallsgrößen ist das formale Äquivalent zu dem heuristischen Begriff der Vorhersage. Um eine solche Vorhersage zum Zeitpunkt t machen zu können, benutzt man die Menge It der Informationen, die bis zu diesem Zeitpunkt angefallen ist. Fasst man die Informationsmenge It als die Menge aller Ereignisse auf, bei denen man zum Zeitpunkt t entscheiden kann, ob sie eingetreten sind oder nicht, liegt es nahe, diese Informationsmenge als σ-Algebra zu modellieren. Es entsteht damit eine Folge von immer größer werdenden σ-Algebren, weil die Informationsmenge im Laufe der Zeit anwächst und außerdem anzunehmen ist, dass Entscheidungsträger die vergangenen Daten nicht vergessen. Man spricht von einer Filtration. Definition 4.9 Eine Familie (It )t∈T von σ-Algebren in Ω heißt Filtration in A, falls folgendes gilt: 1.) ∀t ∈ T:I t ⊂ A, 2.) für alle t1 , t2 ∈ T mit t 1 6 t2 gilt It1 ⊂ It2 . Das Quadrupel (Ω, A, P, (It )t∈T ) heißt filtrierter Raum. ❐ Bemerkung 4.10 Bei der Modellierung von Preisen im Zeitablauf wird Definition 4.9 wie folgt interpretiert: i) In der Menge Ω sind die möglichen Umweltzustände zusammengefasst. Ein Umweltzustand ω ∈ Ω ist dabei als Zusammenfassung aller Zustände und Konstellationen, welche die betrachteten Preise beeinflussen, zu verstehen. ii) A enthält Teilmengen (Ereignisse) von Ω, von denen nach Ablauf der Zeit entschieden werden kann, ob sie eingetreten sind oder nicht. c Klaus Schindler SS 2016 71 Stochastische Prozesse I 4.2. σ-Algebren und Information Wahrscheinlichkeitsrechnung Kapitel 4 σ-Algebren und Information iii) P(A) sei für einen Marktteilnehmer die (subjektive) Wahrscheinlichkeit, dass das Ereignis A eintritt. Alle Marktteilnehmer seien sich dabei über die Nullmengen von P, d.h. die Ereignisse, die als unmöglich gelten10 , einig. iv) Die σ-Algebra It enthält diejenigen Mengen aus A, von denen ein Marktteilnehmer zum Zeitpunkt t entscheiden kann, ob sie eingetreten sind oder nicht. Diese sollen für alle Marktteilnehmer gleich sein. Durch Forderung 2.) der Definition wird eine Nicht-Vergesslichkeit modelliert: wenn man bereits zum Zeitpunkt t1 (6 t2 ) entscheiden kann, ob eine Teilmenge A von Ω eingetreten ist, dann weiß man dies auch noch zum S T späteren Zeitpunkt t2 . Oft fordert man, dass It = A und It = {∅, Ω} gilt, was man T t∈ T t∈ bei endlichem Zeithorizont als „Am Ende des Betrachtungszeitraumes ist sämtliche Information verfügbar“ bzw. als „Zum Startpunkt der Zeit ist über die Zukunft noch nichts bekannt“ interpretieren kann. ❐ Stochastische Prozesse I Sind (Ω, A, P) und (It )t∈T mit obiger Interpretation gegeben und bezeichnet (St )t∈T einen eindimensionalen stochastischen Prozess, bei dem man St (ω) als Preis eines Wirtschaftsgutes zum Zeitpunkt t und bei Umweltzustand ω interpretiert, so ist für einen Marktteilnehmer zum Zeitpunkt t der Wert von St bekannt, er kann daher insbesondere für alle Intervalle entscheiden, ob St in A liegt. Daher muss die Menge St−1 (A) in It liegen. Formal A⊂ heißt dies, dass St bzgl. der σ-Algebra It messbar ist. Dies ist Inhalt der nachfolgenden Definition. R Definition 4.11 Ein stochastischer Prozess (St )t∈T heißt an die Filtration (It )t∈T adaptiert, falls St für alle t ∈ eine It -messbare Funktion ist. ❐ T Bemerkung 4.12 Die von den ZV Su erzeugten σ-Algebren It := σ(Su | u 6 t) bilden die einfachste Filtration bzgl. der (St )t∈T adaptiert ist. Nach Definition der erzeugten σ-Algebra (siehe Bemerkung 3.11) wird hierdurch die kleinste Filtration definiert, bezüglich der ein vorgegebener Prozess (St )t∈T adaptiert ist. Sie wird daher auch als kanonische Filtration bezeichnet. Die kanonische Filtration kann in obigem Zusammenhang folgendermaßen interpretiert werden: zu jedem Zeitpunkt t ∈ wird über den unbekannten Umweltzustand nur die Information vewendet, die durch Beobachten des Preisprozesses (St )t∈T zustandekommt. Solche Märkte bezeichnet man als informationseffizient (Markteffizienzhypothese). ❐ T Um zukünftig Schreibarbeit zu sparen, wird die folgende Bezeichnung eingeführt. 10 Zu beachten ist, dass bei Ereignissen mit der Eintrittswahrscheinlichkeit 0 nicht ausgeschlossen ist, dass sie dennoch eintreten. 72 c Klaus Schindler SS 2016 Stochastische Prozesse I Kapitel 4 4.2. σ-Algebren und Information Bezeichnung 4.13 Ein Marktmodell M ist ein TupelM = (Ω, A, P, , (It )t∈T , (St )t∈T ), wobei T 1. (Ω, A, P) ein Wahrscheinlichkeitsraum, 2. ∅ = 6 T ⊂ R eine (Zeit-)Menge, 3. (It )t∈T eine Filtration in A und 4. (St )t∈T ein an (It )t∈T adaptierter d-dimensionaler stochastischer Prozess sei. Ferner gelte 5. S It = A und T t∈ (d) T It = {∅, Ω} sowie T t∈ 6. St (ω) > 0 für alle t ∈ T und alle ω ∈ Ω. Bemerkung 4.14 Forderung 6. aus Bezeichnung 4.13 ergibt sich aus folgender Überlegung: Um auch negative Preise (zum Beispiel von Terminkontrakten) mit obigem Marktmodell erfassen zu können, wurde nicht gefordert, dass alle Preise positiv sind. Um jedoch zu einem diskontierten Markt übergehen zu können, soll wenigstens ein stets positiver Preisprozess existieren, welcher als d-te Komponente modelliert wird11 . Dieser muss nicht notwendigerweise deterministisch sein. Entscheidend ist, dass er zu allen Zeitpunkten und bei allen Umweltzuständen positiv ist, was u.a. der Preisprozess einer Aktie oder auch der Preisprozess eines Zerobonds (Nullkuponanleihe) normalerweise erfüllt. Ebenfalls verzichtet wurde auf die Forderung der Existenz eines risikolosen Zerobonds, da diese für die folgende Theorie nicht notwendig ist. ❐ Beispiel 4.15 Als Zeitmenge wird = {0, 1, 2} betrachtet, die Menge der möglichen Umweltzustände sei Ω = {ω11 , ω12 , ω21 , ω22 }. Vorhanden seien eine Aktie sowie ein deterministischer Zerobond, deren gemeinsamer Preisprozess gegeben sei durch T S0 = (10, 10)T , S1 (ω) = 11 T (12, 11) : ω ∈ {ω21 , ω22 } , S2 (ω) = (9, 11)T : ω ∈ {ω11 , ω12 } Häufig wird auch die erste Komponente gewählt. c Klaus Schindler SS 2016 (15, 12)T : ω (13, 12)T : ω (12, 12)T : ω (8, 12)T : ω = ω22 = ω21 = ω12 = ω11 73 Stochastische Prozesse I (i) Dabei bezeichnet (St )t∈T die i-te Komponente von St , den Preisprozess des i-ten Gutes (Basistitel). Diese Preisprozesse werden als exogen vorgegeben angesehen. Weiterhin sollen für die Interpretation des Marktmodells bzw. seiner Bausteine die Ausführungen aus Bemerkung 4.10 gelten. ❑ Wahrscheinlichkeitsrechnung Kapitel 4 Martingale 1 A sei gleich ℘(Ω), P({ω}) = für alle ω ∈ Ω und zum Zeitpunkt t = 0, 1, 2 sei jeweils 4 nur die bis dahin durch die Preise verfügbare Information gegeben, d.h. I0 = {∅, Ω}, I1 = {∅, {ω11, ω12 }, {ω21 , ω22 }, Ω} und I2 = ℘(Ω). 15 12 12 11 13 12 12 12 10 10 9 11 Stochastische Prozesse I 8 12 Der Zerobond steigt also - beginnend bei 10 [GE] zum Zeitpunkt 0 - jeden Zeitpunkt um 1[GE]. Die Aktie kann ausgehend vom Wert 10 [GE] zum Zeitpunkt 0 entweder auf einen Wert von 9 [GE] fallen oder auf 12 [GE] steigen. Liegt ihr Wert zum Zeitpunkt 1 bei 9 [GE], so besteht die Möglichkeit, dass die Aktie weiter fällt (auf 8 [GE]), sie kann sich jedoch auch erholen und auf 12 [GE] zum Zeitpunkt 2 steigen. Ist die Aktie zum Zeitpunkt 1 auf 12 [GE] gestiegen, so steigt sie weiter, und zwar auf 13 [GE] oder auf 15 [GE]. ❐ 4.3. Martingal-Prozesse Der Begriff Martingal stand ursprünglich für ein faires Spiel, bei dem der zu erwartende Spielgesamtstand nach dem nächsten Spiel gerade gleich dem momentanen Spielstand ist und nicht von dem früheren Spielverlauf beeinflusst wird. Bezeichnet bei einem Spiel St den kumulierten Gewinn bzw. Verlust zum Zeitpunkt t, so ist das Spiel fair, wenn der erwartete Gesamtgewinn/Verlust zu jedem späteren Zeitpunkt gleich dem jetzigen Gesamtgewinn/Verlust ist, d.h. wenn [St2 |It1 ] = St1 für t1 6 t2 gilt (P-fast sicher). Hierbei sei vorausgesetzt, dass der stochastische Prozess (It )t∈T eine Filtration in A sei. Formal führt das zu folgender Definition. E Definition 4.16 Ein an die Filtration (It )t∈T adaptierter stochastischer Prozess (St )t∈T auf dem Wahrscheinlichkeitsraum (Ω, A, P) heißt P-Martingal, falls gilt: 74 c Klaus Schindler SS 2016 Stochastische Prozesse I 1.) E[S 2.) E[kS k] < ∞ für alle t ∈ T . t2 |It1 ] Kapitel 4 4.3. Martingal-Prozesse = St1 P-fast sicher für alle t1 , t2 ∈ T mit t1 6 t2 , ❐ t Bemerkung 4.17 i) Die Martingaleigenschaft eines Prozesses ist sowohl von der Filtration (It )t∈T als auch vom Maß P abhängig. Ändert man das zu Grunde liegende Maß oder die Filtration, so ist der Prozess im allgemeinen kein Martingal mehr. ii) Ist nur die Bedingung 1.) der Definition erfüllt, so spricht man von einem lokalen oder verallgemeinerten Martingal. iv) Bei Martingalprozessen wird nur eine Aussage über die bedingten Erwartungen und nicht wie bei Markoff-Prozessen über die bedingte Verteilung getroffen. ❐ Beispiel 4.18 i) Betrachten wir ein Glücksspiel, bei dem man pro Spielrunde 1 e setzt. Mit Wahrscheinlichkeit p gewinnt man 1 e, mit Wahrscheinlichkeit 1−p verliert man seinen Einsatz. Der Gewinn bzw. Verlust Xi des i-ten Spiels ist dann gegeben durch: Xi = +1 mit Wahrscheinlichkeit p −1 mit Wahrscheinlichkeit 1−p Der Gesamtgewinn (bzw. Gesamtverlust) Sn nach n Spielen ist daher gegeben durch Sn = n X Xi . i=1 Wir nehmen an, dass die Ergebnisse Xi der einzelnen Spiele stochastisch unabhängig sind. Betrachtet man die kanonische Filtration (It )t∈N mit I0 := {∅, Ω}, In := σ(X1 , . . . , Xn ), E so ist Sn offenbar In -messbar, woraus mit Satz 3.35 d) die Aussage [Sn |In ] = Sn folgt. Da Xj für alle j>m stochastisch unabhängig von der σ-Algebra Im ist, liefert c Klaus Schindler SS 2016 75 Stochastische Prozesse I iii) Ersetzt man das Gleichheitszeichen in Punkt 1.) der Martingaldefinition durch ein > oder 6 spricht man von einem Submartingal bzw. einem Supermartingal. Wahrscheinlichkeitsrechnung Kapitel 4 Satz 3.35 f) in diesem Fall außerdem E[S n | Im ] = = ES E[S + m = Sm + E[X |I m] j Xj | Im j=m+1 E | Im ] + m = Sm + n P n j=m+1 j = E[X ]. Dies ergibt für alle n > m j n P Xj | Im j=m+1 E[X | I P E[X ] P Martingale m] n j=m+1 j = Sm + (n−m) · (2p−1) also E[S n+1 | In ] Stochastische Prozesse I 1 2 Im Fall p = < Sn falls p < = Sn falls p = > Sn falls p > 1 2 1 2 1 2 ergibt sich die Martingaleigenschaft, d.h. ein faires Spiel. Im Fall p > 1 1 2 liegt ein für den Spieler günstiges Submartingal vor, im Fall p < ein für den Spieler 2 ungünstiges Supermartingal. ii) Ist (St )t∈T mit den gleichen Bezeichnungen wie in Definition 4.16 ein Martingal, so ist die Voraussage (Erwartungswert) für die Änderung ∆St von St im Zeitraum t bis t+∆t unter der aktuellen Information It nach den Martingaleigenschaften gleich E[∆S t | It ] = E[S t+∆t −St | It ] = E[S t+∆t E | It ] − [St | It ] = St − St = 0. Damit ist die Voraussage für die Änderung von St in einem beliebigen Zeitintervall der Länge t gleich 0. Es ist also bei Martingalen nicht möglich, die Richtung zukünftiger Änderungen vorauszusagen. Weist ein Prozess einen Trend auf, kann er m.a.W. kein Martingal sein. Insbesondere ist der Preis eines Zerobonds kein Martingal12 . iii) Sind (Ω, A, P) sowie eine Filtration (It )t∈T gegeben, so kann aus einer zeitunabhängigen (integrierbaren) Zufallsvariable X auf (Ω, A, P) in natürlicher Weise ein Martingal konstruiert werden13 . Definiert man nämlich Mt := [X|It ], so ist (Mt )t∈T ein P-Martingal bezüglich (It )t∈T . Dies folgt daraus, dass E E 1.) Mt = [X|It ] nach Definition der bedingten Erwartung automatisch It -messbar und damit (Mt )t∈T trivialerweise an (It )t∈T adaptiert ist, 12 Es sei denn, dass der Zinssatz i Null ist. 13 Später wird der Payoff des betrachteten Derivates die Rolle der ZV X übernehmen. 76 c Klaus Schindler SS 2016 Stochastische Prozesse I Kapitel 4 4.3. Martingal-Prozesse 2.) nach Definition der Filtration It1 ⊂It2 für t1 6t2 gilt und wegen des Tower Law (Satz 3.35 e)) daher E[M t2 |It1 ] = = [X|It2 ]It1 EE E[X|I t1 ] = Mt1 (P-fast sicher) 3.) mit X auch E[X|I ] = M t t für t ∈ T integrierbar ist. ❐ Definition 4.19 a) Zwei Wahrscheinlichkeitsmaße Q und P auf dem Messraum (Ω, A) heißen zueinander äquivalent, falls gilt ∀A ∈ A : P(A) = 0 ⇐⇒ Q(A) = 0. b) Sei (St )t∈T ein an die Filtration (It )t∈T adaptierter stochastischer Prozess auf dem Wahrscheinlichkeitsraum (Ω, A, P). Ein zu P äquivalentes Wahrscheinlichkeitsmaß Q heißt äquivalentes Martingalmaß zu P, falls (St )t∈T ein Q-Martingal bezüglich (It )t∈T ist. EMM bezeichne die Menge aller zu P äquivalenten Martingalmaße. ❐ Bemerkung 4.20 i) Sind P und Q äquivalente Wahrscheinlichkeitsmaße, so gilt eine Aussage genau dann P-fast sicher, wenn sie Q-fast sicher gilt. ii) Die Menge der zu P äquivalenten Martingalmaße hängt nicht nur von P, sondern auch von der gegebenen Filtration (It )t∈T und vom gegebenen Prozess (St )t∈T ab. iii) Liegt nur ein lokales Martingal vor spricht man entsprechend in Definition 4.19 von einem äquivalenten lokalen Martingalmaß. iv) Der zur Konstruktion der bedingten Erwartung erforderliche Satz von Radon-Nikodym (siehe Anhang Satz A.7) benötigt die sog. absolute Stetigkeit des Maßes Q bzgl. P (Schreibweise Q ≪ P), d.h. wenn gilt: P(A) = 0 =⇒ Q(A) = 0 c Klaus Schindler SS 2016 77 Stochastische Prozesse I Die Martingal-Eigenschaft eines Prozesses (Xt ) hängt sowohl vom Wahrscheinlichkeitsmaß als auch von der Filtration, die gegeben sind, ab (siehe Bemerkung 4.17). Eine zentrale Frage ist, ob ein Wahrscheinlichkeitsmaß Q existiert, so dass (Xt ) ein Q-Martingal bezüglich einer vorgegebenen Filtration ist. Um keine „Wahrscheinlichkeits-Information“ zu verlieren, sollte Q zum ursprünglichen Maß P äquivalent sein, d.h. die gleichen Nullmengen wie P besitzen. Die folgende Definition fasst diesen Äquivalenzbegriff genauer. Wahrscheinlichkeitsrechnung Kapitel 4 Martingale Die in Definition 4.19 eingeführte Äquivalenz zweier Maße P und Q bedeutet daher, dass P bzgl. Q und Q bzgl. P absolut stetig ist. ❐ Beispiel 4.21 Gegeben seien die Daten aus Beispiel 4.15. Dann ist (St )t=0,1,2 kein P-Martingal bezüglich (It )t=0,1,2 , da [S1 |I0 ] = (10.5, 11)T nicht P-fast sicher gleich S0 = (10, 10)T ist. (2) (2) Da Q [S1 |I0 ] = 11 6= S0 = 10 für alle Wahrscheinlichkeitsmaße Q auf (Ω, A) gilt, ist die Menge EMM leer. (1) Ferner rechnet man leicht nach, dass die erste Komponente St=0,1,2 des Prozesses (St )t=0,1,2 E E 1 1 2 1 unter dem Maß Q mit Q({ω11 }) = , Q({ω12 }) = , Q({ω21 }) = und Q({ω22 }) = ein 2 6 9 9 Q-Martingal bezüglich (It )t=0,1,2 ist. ❐ Stochastische Prozesse I 78 c Klaus Schindler SS 2016 K APITEL 5 Stochastische Prozesse II Dieser Abschnitt stellt das Handwerkszeug bereit, das für die Bewertung von Optionen benötigt wird. Dabei spielen stochastische Prozesse in stetiger Zeit, die als Lösungen stochastischer Differentialgleichungen definiert werden, eine wesentliche Rolle. Um diese Begriffe verständlich zu machen, benutzen wir Approximationen durch stochastische Prozesse in diskreter Zeit und verwenden als Grundlage die Kapitel 3 und 4. Aktienkurse sind eigentlich zeitdiskrete Prozesse, die wir durch zeitstetige Prozesse approximieren, da man mit diesen wesentlich leichter analytisch rechnen kann, wie der Itô-Kalkül in Abschnitt 5.5 zeigen wird. Zur Simulation solcher Prozesse auf dem Rechner oder zur numerischen Berechnung von Optionswerten, werden Prozesse in stetiger Zeit wieder durch Prozesse in diskreter Zeit angenähert. Wir wechseln also je nach Bedarf zwischen diskreter und stetiger Zeit. Zunächst soll auf möglichst einfache Art und Weise der Wiener-Prozess (arithmetisch Brownsche Bewegung) als erstes Beispiel für einen zeitstetigen Prozess konstruiert werden. Er stellt als Prozess gewissermaßen das Analogon zu einer normalverteilten ZV dar. Danach werden wir mittels Integration bzw. Differentiation daraus komplexere zeitstetige Prozesse konstruieren. 5.1. Der Wiener-Prozess N t Gegeben sei das feste Zeitintervall [0, t], das wir in n Teilintervalle (n∈ ) der Länge ∆t = n zerlegen. Wir betrachten nun den in 0 startenden arithmetischen Binomialprozess (X(n) τ )τ ∈T 1 mit den Parametern p=1−p= und u=d=∆x über der Zeitmenge 2 T= =t n z }| { o 0, ∆t, 2·∆t, . . . , n·∆t X(n) τ startet also in 0 und steigt (bzw. fällt) jeweils nach einer Zeitspanne von ∆t mit Wahrscheinlichkeit 21 um ∆x (bzw. −∆x). ∆x sei hierbei eine noch genauer zu bestimmende Größe. Zwischen diesen Sprüngen sei der Prozess konstant oder werde linear interpoliert. 1 Zur Zeit t = n·∆t hat der Prozess dann wegen X(n) 0 =0, u=d=∆x und p=1−p= 2 gemäß Abschnitt 4.1.1 folgenden Erwartungswert bzw. Varianz E[X (n) t ] = n · (u+d)·p − d = 0 2 2 var(X(n) = t ) = n · (u+d) ·p·(1−p) = n·(∆x) t ·(∆x)2 ∆t Wahrscheinlichkeitsrechnung Kapitel 5 Der Wiener Prozess Wir beschleunigen jetzt den Prozess, indem wir die Zahl n der Sprünge immer größer und damit die Zeitspanne ∆t= nt zwischen zwei aufeinanderfolgenden Beobachtungen, immer kleiner werden lassen (beachte: t ist fest!). Damit der Grenzprozess lim X(n) t n→∞ in vernünftigem Sinn existiert, muss lim var(X(n) t ) = lim n→∞ ∆t→0 (∆x)2 ·t ∆t existieren. Allerdings sollte dieser Grenzwert nicht Null oder unendlich sein, da der Grenzprozess ansonsten deterministisch oder unkontrollierbar und damit für uns uninteressant wäre. Die einzige Möglichkeit, einen von Null verschiedenen endlichen Grenzwert zu erhal√ ten, ist ∆x = b· ∆t (b konstant) zu wählen, so dass gilt: 2 lim var(X(n) t ) = b ·t n→∞ Da X(n) t nach Bemerkung 3.18 iii) für große n approximativ normalverteilt ist, genauer X(n) t ≈ N0,n·(∆x)2 = N0,b2 ·n·∆t = N0,b2 ·t , durch den Grenzübergang n → ∞ mit hat der Grenzprozess (xt )t>0 , den wir aus X(n) t √ ∆x = b· ∆t erhalten, folgende Eigenschaften: i) xt ist N0,b2 t -verteilt für alle t > 0. Stochastische Prozesse II ii) (xt )t>0 hat unabhängige absolute Zuwächse, d.h. für 0 6 s < t ist xt − xs unabhängig von xs (da die approximierende Irrfahrt unabhängige absolute Zuwächse hat) iii) xt ist homogen, d.h. die Verteilung vom Zuwachs xt − xs ist N0,b2 ·(t−s) -verteilt, hängt also nur von der Länge t−s des betrachteten Zeitintervalls ab (dies folgt aus (i) und (ii) und den Eigenschaften der Normalverteilung). Definition 5.1 Ein zeitstetiger Prozess (xt )t>0 mit den Eigenschaften (i) - (iii) heißt (Arithmetischer) Wiener-Prozess oder (Arithmetisch) Brownsche Bewegung mit Start in 0 (x0 =0). Den StandardWiener-Prozess, der durch die Wahl b=1 entsteht, bezeichnen wir im Folgenden mit (Wt )t>0 . ❐ Bemerkung 5.2 i) Der Standard-Wiener-Prozess hat für alle 0 6 s < t folgende Eigenschaften1 E[W ] = 0, var(W ) = t, cov(W , W ) = min{s, t} = s, corr(W , W ) = t 1 t t s s t r s t Die Aussage über die Kovarianz folgt wegen der Unabhängigkeit der Änderung Wt − Ws von Ws aus cov(Wt , Ws ) = cov((Wt − Ws ) + Ws , Ws ) = cov(Wt − Ws , Ws ) + cov(Ws , Ws ) = 0 + var(Ws ) = s. 80 c Klaus Schindler SS 2016 Stochastische Prozesse II Kapitel 5 5.1. Der Wiener-Prozess ii) Wie bei jedem stochastischen Prozess in stetiger Zeit können wir eine Realisation oder einen Pfad des Wiener-Prozesses als zufällig ausgewählte Funktion der Zeit auffassen. Man kann mit beträchtlichem Aufwand zeigen, dass die Pfade mit Wahrscheinlichkeit 1 stetig sind, d.h. der Wiener-Prozess hat keine Sprünge: P({Wt ist stetig als Funktion von t}) = 1. Wt fluktuiert extrem stark, d.h. die Pfade sind stetig, aber sehr erratisch und man kann zeigen, dass die Pfade mit Wahrscheinlichkeit 1 nirgends differenzierbar sind2 . Als Prozess mit unabhängigen absoluten Zuwächsen ist der Wiener-Prozess automatisch ein Markoff-Prozess. Dies bedeutet, dass für 0 6 s < t gilt P(Wt < b | Ws = x, Information über Wτ , τ < s) = P(Wt < b | Ws = x). Dies folgt aus Wt = Ws + (Wt − Ws ), weil der absolute Zuwachs Wt − Ws unabhängig von Ws ist (siehe auch Abschnitt 3.8 über bedingte Wahrscheinlichkeiten). Aus den Eigenschaften (i) – (iii) lässt sich die bedingte Verteilung von Wt , gegeben die Kenntnis von Ws = x, explizit angeben. Sie ist Nx,t−s . Dies ergibt sich aus der Darstellung Wt = Ws + (Wt − Ws ) = x + (Wt − Ws ), da der absolute Zuwachs (Wt − Ws ) eine N0,t−s -verteilte Größe ist. Die bedingte Wahrscheinlichkeit ist daher Z b −∞ ϕx,t−s (y)dy . ❐ Der Wiener-Prozess fluktuiert um seinen Erwartungswert 0 und wird dementsprechend durch symmetrische Irrfahrten approximiert. Geht man bei der Approximation des WienerProzesses statt von einer symmetrischen von einer beliebigen einfachen Irrfahrt mit Drift aus , so besitzt der stetige Grenzprozess einen Trend oder eine Drift, d.h. er wächst oder fällt im Mittel. Z.B. folgt mit p6= 21 und u=d=∆x E[X (n) t ] = n·(2p−1)·∆x = (2p−1)·t· ∆x ∆t (∆x)2 ∆t √ a ∆t √ erhalten a2 ∆t + b2 2 var(X(n) = 4p·(1−p)·t· t ) = n·4p·(1−p)·(∆x) Für ∆x = √ a2 ∆t + b2 · √ ∆t und p = E[X (n) t 1 2 1+ wir für alle t: 2 ] = a·t, var(X(n) t ) = b ·t Mit den gleichen Überlegungen wie vorher folgt, dass der durch ∆t → 0 entstehende Grenzprozess (xt )t>0 sich qualitativ wie der Wiener-Prozess verhält. Da er die Drift a·t besitzt, 2 √ = N ·∆t∆t = √N∆t keinen endlichen Dies ergibt sich aus der Überlegung, dass der Differenzenquotient ∆W √ ∆t Grenzwert besitzt, weil der Wienerprozess sich proportional zu ∆t und nicht wie differenzierbare Funktionen proportional zu ∆t ändert (N ist hierbei eine normalverteilte Größe). c Klaus Schindler SS 2016 81 Stochastische Prozesse II P(Wt < b | Ws = x) = Wahrscheinlichkeitsrechnung Kapitel 5 Stochastische Integration wächst oder fällt der Prozess im Mittel, je nachdem, ob a > 0 oder a < 0 gilt. Außerdem besitzt (xt )t>0 im Zeitraum t die Varianz b2 t. Man spricht daher vom allgemeinen WienerProzess mit Driftrate a und Varianzrate b2 , dies ist die Drift bzw. Varianz pro Zeiteinheit. Es gilt xt = at + bWt . Der allgemeine Wiener-Prozess ergibt sich also als Summe eines deterministischen linearen Prozesses und eines Vielfachen des Standard-Wiener-Prozesses und ist Nat,b2 t -verteilt. 5.2. Stochastische Integration Stochastische Prozesse II Wir konstruieren nun mit Hilfe des Wiener-Prozesses komplexere stochastische Prozesse, die als Modell für Aktienkurse dienen. Diese Prozesse definieren wir als Integral bzw. als Lösung von Differentialgleichungen. Da die auftretenden Funktionen Zufallsgrößen sind, benötigt man jedoch stochastische Varianten der Differential- und Integralrechnung. Hierzu führen wir das sog. Itô-Integral ein, dessen Konstruktion (wie stets bei Integralen ein Grenzwert von Summen) der des deterministischen Riemann-Stieltjes-Integrals ähnelt. Man spricht von einem stochastischen Integral, da im Unterschied zum deterministischen Fall bzgl. dem Wiener-Prozess (genauer einem Pfad des Wiener-Prozesses) integriert wird. Da der Integrand ebenfalls zufällig - d.h. ein Pfad eines stochastischen Prozesses - sein kann, muss man allerdings sehr vorsichtig bzgl. der wechselseitigen stochastischen Abhängigkeit von Integrand und Wiener-Prozess sein. Wir fordern daher im Folgenden, dass der zu integrierende Prozess (yt )t>0 nicht antizipierend ist, d.h. dass yt bis zum Zeitpunkt s keine Informationen über die zukünftigen absoluten Zuwächse Wt − Ws (t > s) des Wiener-Prozesses enthält. Insbesondere sind ys und Wt − Ws unabhängig. Für eine genauere Diskussion beachte man Bemerkung 5.4 ii). Definition 5.3 Das Itô-Integral It des Prozesses (yt )t>0 bzgl. des Wiener-Prozesses Wt ist definiert durch It := Z In = n X t 0 ys dWs = n→∞ lim In , (5.1) wobei k=1 y(k−1)∆t · (Wk∆t − W(k−1)∆t ) , ∆t = t n (5.2) Der Grenzwert ist ein Grenzwert von Zufallsgrößen im quadratischen Mittel, d.h. es gilt E (I 2 t − In ) = Z E 0 t ys dWs − In 2 n→∞ −→ 0. Der durch diese Integration entstehende stochastische Prozess It wird als Itô-Prozess bezeichnet. ❐ 82 c Klaus Schindler SS 2016 Stochastische Prozesse II Kapitel 5 5.2. Stochastische Integration Bemerkung 5.4 i) Entscheidend bei der Definition des Itô-Integrals ist, dass die Summanden von In jeweils ein Produkt von zwei unabhängigen Zufallsgrößen sind: • dem Wert y(k−1)∆t des integrierten Prozesses am linken Rand3 des „kleinen“ Zeitintervalls [(k − 1)∆t, k∆t] und • dem Zuwachs Wk∆t − W(k−1)∆t des Wiener-Prozesses in diesem Intervall. ii) Bezeichne (It )t>0 die die Informationsentwicklung beschreibende Filtration. Wie in Abschnitt 4.2 beschrieben, ist It die σ-Algebra mit der bis zur Zeit t verfügbaren Information. Sie besteht aus solchen Ereignissen, von denen bis zur Zeit t feststeht, ob sie eingetroffen sind oder nicht. Es gilt also (siehe Definition 4.9) 1. s < t =⇒ Is ⊂ It : die verfügbare Information wächst mit der Zeit 2. {Wt < b} ∈ It : Wiener-Prozess ist an die Informationsentwicklung adaptiert 3. für s < t ist Wt −Ws unabhängig von Is : der Wiener-Prozess besitzt unabhängige absolute Zuwächse (Eigenschaft ii) in Definition 5.1.) iii) Der Wert des Itô-Integrals hängt im Gegensatz zum Riemann-Stieltjes-Integral entscheidend davon ab, welcher Wert der Zufallsgröße ys in Formel (5.2) verwendet wird. Würde man dort statt (k−1)·∆t eine beliebige Stelle t(n, k) im Intervall [(k−1)·∆t, k·∆t] wählen, ergäbe sich für das Itô-Integral folgende Definition: Z 0 t ys dWs := lim n→∞ n X k=1 yt(n,k) · Wk∆t − W(k−1)∆t . Die Wirkung dieser veränderten Definition soll am Beispiel yt = Wt demonstriert werden, d.h. wir integrieren den Wiener-Prozess nach dieser veränderten Definition bzgl. sich selbst4 . Nach Definition des Itô-Integrals muss insbesondere auch Z E 0 t Ws dWs = E lim In = lim n→∞ n→∞ E[I ] n gelten5 . Mit den Rechenregeln für die Kovarianzen des Wiener-Prozesses (siehe Bemerkung 5.2 auf Seite 80) ergibt sich wegen [Ws ] = 0: E 3 Der Hauptgrund für diese Wahl ist, dass der durch das Integral beschriebene Prozess dann immer ein Martingal (siehe Definition 4.16) ist. Siehe hierzu auch Teil iii) dieser Bemerkung. 4 Man beachte Beispiel 5.5 ii) für das „richtige“ Ergebnis. R 12 R 5 2 . Wegen Ω |f |(ω)dP (ω) 6 Ω f (ω)dP (ω) c Klaus Schindler SS 2016 83 Stochastische Prozesse II Die wesentliche Eigenschaft nicht antizipierend (vorwegnehmend) zu sein bedeutet dann, dass der zu integrierende Prozess (yt )t>0 an die Filtration (It )t>0 adaptiert ist, d.h. es gilt {yt <b} ∈ It . Intuitiv bedeutet dies, dass yt keine Information über die Zukunft t + ∆t, d.h. Ereignisse aus It+∆t \It enthält. Wahrscheinlichkeitsrechnung E[I ] n = = 5.2 = E X n k=1 n X Kapitel 5 Wt(n,k) · (Wk∆t − W(k−1)∆t ) Stochastische Integration cov(Wt(n,k) , Wk∆t ) − cov(Wt(n,k) , W(k−1)∆t ) k=1 n X k=1 t(n, k) − (k−1)·∆t Für t(n, k) = (k−1)·∆t - den Fall des Itô-Integrals - erhalten wir als Ergebnis 0, für t(n, k) = k·∆t jedoch n·∆t = t. Für passend gewählte Folgen t(n, k) könnten wir jeden Wert zwischen 0 und t als Erwartungswert des stochastischen Integrals erhalten. Um Rt 0 Ws dWs also einen eindeutigen Wert zuzuweisen, müssen wir uns - im Gegensatz zur klassischen Integration - auf eine Folge t(n, k) einigen. ❐ Die folgenden Beispiele sollen die Berechnung von Itô-Integralen illustrieren und zeigen, dass sie teilweise anderen Rechenregeln als gewöhnliche Integrale folgen. Beispiel 5.5Z t dWs = Wt , denn nach Definition folgt i) Es ist 0 Z t dWs = lim n→∞ 0 n X (Wk∆t − W(k−1)∆t ) k=1 Stochastische Prozesse II | {z Wn·∆t −W0 n·∆t=t = } W =0 0 (Wt − W0 ) = Wt . Hier verhalten sich Itô- und Riemann-Stieltjes-Integral gleich (Satz A.5 f)). ii) Es gilt Z t 0 Ws dWs = 1 (Wt 2 2 (5.3) − t) Im Vergleich hierzu liefert das Riemann-Stieltjes-Integral für stetig differenzierbare Funktionen f mit f0 = f (0) = 0 die Aussage (siehe Satz A.5 d)) Z t 0 fs dfs = 1 2 f . 2 t t Das stochastische Integral (5.3) enthält dagegen noch den Zusatzterm − , da der 2 lokale Zuwachs des Wiener-Prozesses über ein Intervall der Länge ∆t von der Grö√ ßenordnung seiner Standardabweichung ∆t ist. Der entsprechende Zuwachs einer differenzierbaren Funktion f ist proportional zu ∆t, also für ∆t → 0 wesentlich kleiner. 2 2 Da sich bei Summation der Differenzen Wk∆t − W(k−1)∆t alle Terme bis auf den ersten 84 c Klaus Schindler SS 2016 Stochastische Prozesse II Kapitel 5 5.3. Stochastische Differentialrechnung und letzten wegheben und wegen n∆t = t und W0 = 0, ergibt sich Gleichung (5.3) aus folgender Rechnung: Z t 0 Ws dWs = lim n→∞ = lim n→∞ 1 2 = n X k=1 n X k=1 lim n→∞ 1 2 W 2 t = 1 2 Wk∆t 2 X n − W(k−1)∆t · Wk∆t − W(k−1)∆t 2 − W(k−1)∆t − (Wk∆t − W(k−1)∆t )2 2 2 (Wk∆t − W(k−1)∆t ) − k=1 | 1 2 lim n→∞ {z Wt2 −W02 n X 1 n k=1 } n X k=1 Wk∆t − W(k−1)∆t n· Wk∆t − W(k−1)∆t 2 2 Der Grenzwert ist nach dem Gesetz der großen Zahlen der Erwartungswert der nach 2 Eigenschaft iii) des Wiener-Prozesses u.i.v. Zufallsgrößen n· Wk∆t − W(k−1)∆t n 1 X n· Wk∆t n k=1 − W(k−1)∆t 2 E n· W = k∆t − W(k−1)∆t 2 = n·var(Wk∆t − W(k−1)∆t ) = n·∆t = t. ❐ 5.3. Stochastische Differentialrechnung In diesem Abschnitt wird das vorher definierte Ito-Integral in Differentialform dargestellt, was zur Definition der Ito-Prozesse in Form stochastischer Differentialgleichungen führt. Orientiert man sich am deterministischen Fall, fällt auf, dass fast alle komplizierteren dynamischen Vorgänge durch Gleichungen, die das momentane Änderungsverhalten des Prozesses angeben, beschrieben werden. Man empfindet dies auch als natürlich, weil alle in der Natur und Ökonomie auftretenden Prozesse so wahrgenommen werden6 . Die Angabe des Änderungsverhaltens beschreibt den Zusammenhang zwischen der Zukunft, also den Zeitpunkten t+1, t+∆t bzw. infinitesimal t+dt und der Gegenwart t eines Prozesses. Die momentane Änderung eines stochastischen oder deterministischen Prozesses Xt wird im Folgenden angegeben durch die Größe (∆X)t := Xt+1 − Xt falls Xt zeitdiskret bzw. dXt = Xt+dt − Xt := lim Xt+∆t − Xt ∆t→0 6 Z.B. werden Aktien durch die Folge ihrer Kursänderungen wahrgenommen. c Klaus Schindler SS 2016 85 Stochastische Prozesse II lim n→∞ Wahrscheinlichkeitsrechnung Kapitel 5 Stochastische DGLen falls Xt zeitstetig ist. Man nennt (∆X)t die Differenz und dXt das Differential von X zum Zeitpunkt t. Die daraus resultierenden, das Änderungsverhalten beschreibenden Gleichungen, werden als Differenzen- oder Differentialgleichungen bezeichnet. Sie liefern implizite Beschreibungen des Prozesses, indem der Zusammenhang zwischen den Werten von X in Vergangenheit und Zukunft beschrieben wird7 . Das folgende Beispiel soll diese Begriffe sowohl im deterministischen als auch im stochastischen Fall etwas näher erläutern. Auffallend, aber nicht weiter überraschend bei den folgenden sehr einfachen Prozessen ist, dass die Lösung stochastischer Gleichungen wesentlich schwieriger zu berechnen ist, als die analoge deterministische Gleichung. Beispiel 5.6 i) Durch die für alle t zu erfüllende Differenzengleichung (∆X)t = Z, Z fest (5.4) wird das Änderungsverhalten eines arithmetischen Prozesses beschrieben. In expliziter Form lautet Gleichung (5.4) Xt+1 = Xt + Z Ist Z eine reelle Zahl, ergibt8 sich die arithmetische Folge Xt = X0 + Z · t als Lösung. Ist Z eine ZV, die nur die zwei Werte u oder −d annimmt, ergibt sich der arithmetische Binomialprozess aus Kapitel 4.1.1. Die stetige Variante der Differenzengleichung (5.4) ist die Differentialgleichung Stochastische Prozesse II dXt = Zdt, Z fest (5.5) In expliziter Form lautet Gleichung (5.5) Xt+dt = Xt + Z · dt. Eine einfache Integration auf beiden Seiten von Gleichung (5.5) zeigt, dass im deterministischen Fall hierdurch analog zur zeitdiskreten Situation der Prozess Xt = X0 + Z · t beschrieben wird. ii) Durch die für alle t zu erfüllende Differenzengleichung (∆X)t Xt = Z, Z fest (5.6) 7 Spielt die weiter zurückliegende Zeit für den Prozess ebenfalls eine Rolle, treten Differenzen bzw. Ableitungen höherer Ordnung auf. So wird z.B. durch Xt+1 = 5Xt −9Xt−1 +3Xt−2 bzw. äquivalent (∆3 X)t = 2(∆2 X)t − 2(∆X)t − 2Xt ein Vorgang beschrieben, bei dem nicht nur die unmittelbare, sondern auch die bis 3 Perioden weiter zurückliegende Vergangenheit Einfluss nimmt. 8 Die Eindeutigkeit der Lösung wird erst durch Vorgabe des Startwertes X0 erreicht. 86 c Klaus Schindler SS 2016 Stochastische Prozesse II Kapitel 5 5.3. Stochastische Differentialrechnung wird das Änderungsverhalten eines geometrischen Prozesses beschrieben. In expliziter Form lautet Gleichung (5.6) Xt+1 = (1 + Z) · Xt Ist Z eine reelle Zahl, ergibt sich die geometrische Folge Xt = X0 (1 + Z)t = X0 et·ln(1+Z) . Ist Z eine ZV, die nur die zwei Werte u oder d annimmt, erhält man den geometrischen Binomialprozess aus Kapitel 4.1.3. Die stetige Variante der Differenzengleichung (5.6) ist die Differentialgleichung dXt Xt = Zdt, Z fest (5.7) Wie in Teil i) folgt im deterministischen Fall (Z ∈ ln(Xt ) − ln(X0 ) = Z t 0 dXs = Xs Z t 0 R) mittels Integration Zds = Z · t. Dies liefert den geometrischen Prozess Xt = X0 · eZ·t . ❐ dxt = a · dt + b · dWt , (5.8) obwohl Wt gar nicht differenzierbar ist. Integration von Gleichung (5.8) liefert xt = xt − x0 = Z 0 t dxt = Z 0 t ads + Z 0 t bdWs , R woraus sich unter Verwendung der in Beispiel 5.5 i) hergeleiteten Beziehung 0t dWs = Wt wieder die explizite Form xt = at + bWt ergibt. Gleichung (5.8) geht davon aus, dass der lokale Trend, dessen Größe die Driftrate a wiedergibt, und die lokale Variabilität, beschrieben durch den Parameter b, stets konstant sind. Eine wesentlich größere und zum Modellieren vieler Vorgänge in Natur und Wirtschaft besser geeignete Klasse stochastischer Prozesse erhält man, wenn a und b in (5.8) explizit von der Zeit und vom erreichten Niveau abhängen dürfen. Definition 5.7 (xt )t>0 heißt allgemeiner Itô-Prozess, wenn er folgende stochastische Gleichung erfüllt: dxt = α(xt , t)dt + β(xt , t)dWt (5.9) ❐ c Klaus Schindler SS 2016 87 Stochastische Prozesse II Beispiel 5.6 legt es nahe, den allgemeinen Wiener-Prozess mit Driftrate a und Varianzrate b2 intuitiv in differentieller Form darzustellen durch Wahrscheinlichkeitsrechnung Kapitel 5 Aktienkurs-Prozesse Bemerkung 5.8 i) Für deterministische Prozesse (xt )t>0 sind nach dem Hauptsatz der Differential- und Integralrechnung die Differentialschreibweise (5.9) und die Integralschreibweise xt − x0 = Z t 0 α(xs , s)ds + Z t 0 (5.10) β(xs , s)dWs äquivalent. Wie jedoch schon auf Seite 81 bemerkt, ist Wt und damit xt nicht differenzierbar, so dass die Verwendung der Differentiale dWt und dxt keinen Sinn ergibt. Präzise wird eine Lösung von (5.9) als ein stochastischer Prozess definiert, der die Integralgleichung (5.10) erfüllt. Die stochastische DGL (5.9), die wir wegen des eingangs geschilderten besseren Verständnisses jedoch weiterhin verwenden, ist in diesem Sinn nur eine einprägsame Kurzschreibweise der Integralgleichung (5.10). Intuitiv bedeutet Gleichung (5.9) ∆xt = xt+∆t − xt = α(xt , t)(t + ∆t − t) + β(xt , t)(Wt+∆t − Wt ) = α(xt , t)∆t + β(xt , t)∆Wt d.h. die absolute Änderung des Prozesses in einem kleinen Intervall der Länge ∆t nach der Zeit t ist α(xt , t) · ∆t zuzüglich einer zufälligen N0,β 2 (xt ,t)∆t -verteilten Fluktuation β(xt , t)(Wt+∆t − Wt ). ii) Wegen Rt t′ = Rt 0 − R t′ 0 folgt für 0 6 t′ < t aus Gleichung (5.10): xt = xt′ + Stochastische Prozesse II Z t t′ α(xs , s)ds + Z t t′ β(xs , s)dWs . Da der Zuwachs des Wiener-Prozesses zwischen t′ und t nicht von den Ereignissen bis zur Zeit t′ abhängt, folgt, dass ein Itô-Prozess die Markoff-Eigenschaft besitzt. iii) Diskrete Approximationen der DGL (5.9) und der Integralgleichung (5.10), die sich auch für Simulationen von Itô-Prozessen eignen, erhalten wir, wenn wir den Prozess zwischen 0 und t nur in regelmäßigen Abständen k∆t, (k = 0, . . . , n), n∆t = t, beobachten. W −W Mit Xk = xk∆t und Zk = k∆t √ (k−1)∆t erhält man ∆t Xk+1 − Xk = α(Xk , k) · ∆t + β(Xk , k) · Zk+1 · √ ∆t √ bzw. mit den Abkürzungen αk (x) = α(x, k)∆t, βk (x) = β(x, k) ∆t: Xn − X0 = n X αk−1 (Xk−1 ) + k=1 n X k=1 βk−1 (Xk−1 ) · Zk mit unabhängig, identisch verteilten N0,1 -Zufallsgrößen Z1 , Z2 , . . . . 88 c Klaus Schindler SS 2016 ❐ Stochastische Prozesse II Kapitel 5.4. Der 5 Aktienkurs als stochastischer Prozess 5.4. Der Aktienkurs als stochastischer Prozess Aktienkurse sind an sich stochastische Prozesse in diskreter Zeit, die wegen der eingeschränkten Messgenauigkeit auch nur diskrete Werte annehmen. Dennoch werden stochastische Prozesse in stetiger Zeit als Modelle benutzt, da sie rechnerisch nicht so aufwändig wie diskrete Modelle - z.B. der Binomial- oder Trinomialprozess - sind. Letztere sind jedoch oft anschaulicher und eignen sich besonders für Simulationen. Der allgemeine Wiener-Prozess dxt = adt + bdWt eignet sich nicht als Aktienkursmodell, da er zum einen negative Aktienkurse zulassen würde, zum anderen die lokale Variabilität größer ist, wenn der Kurs selbst sich auf hohem Niveau bewegt. Daher wird in einem allgemeinen Ansatz der Börsenkurs St einer Aktie als Itô-Prozess modelliert: dSt = α(St , t)dt + β(St , t)dWt In diesem Modell stehen die unbekannten Funktionen α(x, t) und β(x, t). Eine brauchbare, einfache Variante, in der nur noch zwei Modellparameter a und b unbekannt sind, erhält man durch folgende Überlegung: Die Rendite als prozentualer Zuwachs des eingesetzten Kapitals soll im Mittel nicht vom aktuellen Kurs bei Kauf der Aktien und schon gar nicht von der Einheit abhängen ( e, $, £, U, . . . ), in der der Aktienwert gemessen wird. Außerdem soll die mittlere, d.h. zu erwartende Rendite wie bei anderen Anlageformen proportional zur Länge des Anlagezeitraums sein. Zusammen ergibt sich die Forderung t St Da = E[S t+dt St − St ] = a · dt E[dW ] = 0, ist diese Bedingung bei gegebenem Anfangskurs S t t Stochastische Prozesse II E[dS ] erfüllt, wenn α(St , t) = a · St . Darüberhinaus wird analog angesetzt β(St , t) = b · St , was die Tatsache berücksichtigt, dass die absolute Größe der Kursfluktuationen sich proportional ändert, wenn wir den Kurs in einer anderen Einheit messen. Zusammengefasst modellieren wir den Aktienkurs St als Lösung der stochastischen DGL dSt = a · St dt + b · St · dWt (5.11) a ist die (pro Zeiteinheit) zu erwartende momentane Rendite, b die zu erwartende momentane Volatilität (Variabilität) der Aktie. Ein solcher Prozess (St )t>0 heißt geometrisch Brownsche Bewegung, da die relativen Preisänderungen eine arithmetische Brownsche Bewegung bilden, d.h. dSt = a dt + b dWt . St c Klaus Schindler SS 2016 89 Wahrscheinlichkeitsrechnung Kapitel 5 Stochastische Differentiation Mit Itôs Lemma lässt sich zeigen (siehe Beispiel 5.12 ii)), dass yt = ln(St ) normalverteilt9 , d.h. St = eyt lognormalverteilt ist. Da die arithmetisch Brownsche Bewegung yt durch einen arithmetischen Binomialprozess At approximiert werden kann und eAt ein geometrischer Binomialprozess ist, können geometrisch Brownsche Bewegungen durch geometrische Binomialprozesse approximiert werden. Bemerkung 5.9 Speziell für b = 0 liefert die geometrisch Brownsche Bewegung die Differentialgleichung dS S = adt. Diese besitzt die Lösung St = S0 eat , wobei S0 der Kurs zum Zeitpunkt 0 ist. Durch b = 0 wird St zu einer deterministischen Größe, die sich wie eine Anleihe mit der sicheren stetigen Rendite a verhält. ❐ 5.5. Stochastische Differentiation Ein entscheidendes Hilfsmittel beim Umgang mit stochastischen Differentialgleichungen ist das Lemma von Itô. Ist (St )t>0 ein Itô-Prozess der Form dSt = α(St , t) dt + β(St , t) dWt , (5.12) Stochastische Prozesse II so entsteht fast zwangsweise die Frage, welche Eigenschaften stochastische Prozesse haben, die sich im funktionalen Sinn aus St „ableiten“ lassen. Die Frage lautet also, ob und gegebenenfalls welcher stochastischen DGL „derivative“ Prozesse der Form zt = f (St , t) genügen, wobei wir davon ausgehen, dass f eine hinreichend oft differenzierbare Funktion in zwei Veränderlichen ist. Es sei nochmals darauf hingewiesen, dass aus Verständnisgründen zwar der Differentialkalkül verwendet wird, dieser jedoch für die stochastischen Größen keinen Sinn macht. Die entsprechenden Gleichungen sind daher immer in integrierter Form zu interpretieren. Zur Herleitung der stochastischen DGL für zt = f (St , t) verwenden wir die Taylordarstellung von f (Satz D.2 des Anhangs). Diese liefert für die Änderung ∆zt : ∆zt = ∆f (St , t) = ∂f ∆St ∂x + (5.13) ∂f ∆t ∂t + 1 2 ∂2f (∆St )2 ∂x2 + 2· ∂2f ∆St ∆t ∂x∂t + ∂2f (∆t)2 ∂t2 Genügt St einem allgemeinen Itô-Prozess, so gilt +··· ∆St = α(St , t)∆t + β(St , t)∆Wt . Ersetzt man ∆St in Gleichung (5.14) durch diesen Ausdruck (zunächst bei den Termen zweiter Ableitung), so folgt: ∆zt = 9 ∂f ∂f ∆S + ∆t ∂x ∂t 1 ∂2f (α∆t + β∆Wt )2 + 2 ∂x2 ∂2f ∂2f +2 (α∆t + β∆Wt )∆t + 2 (∆t)2 ∂x∂t ∂t yt startet in ln(S0 ) und ist Nat− 21 b2 t,b2 t -verteilt. 90 c Klaus Schindler SS 2016 +··· Stochastische Prozesse II Kapitel 5 Ausmultiplizieren unter Berücksichtigung von ∆Wt = 5.5. Stochastische Differentiation √ 3 ∆t und ∆Wt · ∆t = (∆t) 2 liefert10 : ∂2f 2 (α (∆t)2 + 2αβ∆Wt ∆t + β 2 (∆Wt )2 ) ∂x2 ∂2f ∂2f 2 2 +2 +··· (α(∆t) + β∆Wt ∆t) + 2 (∆t) ∂x∂t ∂t 2 3 ∂ f 2 1 (α (∆t)2 + 2αβ(∆t) 2 + β 2 ∆t 2 2 ∂x 3 ∂2f ∂2f 2 2 2 +··· (α(∆t) + β(∆t) ) + 2 (∆t) +2 ∂x∂t ∂t ∆zt = ∂f ∆St ∂x + ∂f 1 ∆t + ∂t 2 = ∂f ∆St ∂x + ∂f ∆t + ∂t Da Terme der Form (∆t)1+c mit c>0 beim Grenzübergang ∆t → 0 schneller als ∆t gegen Null konvergieren, können diese gegenüber ∆t vernachlässigt werden. Damit ergibt sich ∆zt = ∂f ∆St ∂x + ∂f ∂t + 1 ∂2f 2 β (St , t) 2 ∂x2 ∆t und mit ∆St = α(St , t)∆t + β(St , t)∆Wt folgt ∆zt = ∂f ∂f α(St , t) + ∂x ∂t + 1 ∂2f 2 β (St , t) 2 ∂x2 ∆t + ∂f ∂x β(St , t)∆Wt . Im Grenzübergang ∆t → 0 erhält man damit folgenden Satz. Satz 5.10 (Lemma von ITÔ) Sei St ein allgemeiner Itô-Prozess, d.h. gelte dSt = α(St , t)dt + β(St , t)dWt . df (St , t) = = ∂f (St , t) 1 ∂ 2 f (St , t) 2 ∂f (St , t) β (St , t)dt (5.14) dSt + dt + ∂x ∂t 2 ∂x2 ∂f (St , t) ∂f (St , t) 1 ∂ 2 f (St , t) 2 ∂f (St , t) β (St , t) dt + α(St , t) + + β (St , t)dWt 2 ∂x ∂t 2 ∂x ∂x ❑ Bemerkung 5.11 Ist St ein deterministischer Prozess, gilt β(St , t) ≡ 0 und Formel (5.14) reduziert sich zur klassischen Differentialdarstellung. ❐ Beispiel 5.12 i) Ist St = µ·t + σ·Wt ⇐⇒ dSt = µ·dt + σ·dWt eine arithmetische Brownsche Bewegung (µ, σ konstant), so ist zt := eSt eine geometrisch Brownsche Bewegung. Wendet man das Lemma von Itô auf die Funktion f (x) = ex an und beachtet, dass ∂f (x) ∂x 10 = ∂ 2 f (x) ∂x2 = ex und ∂f (x) ∂t =0 Genauer gilt nach Eigenschaft iii) des Standard-Wienerprozesses Wt auf Seite 80: E[|∆Wt| · ∆t] = (∆t) 32 c Klaus Schindler SS 2016 E[|∆W |] = t √ ∆t bzw. 91 Stochastische Prozesse II Ist f (x, t) eine 2-mal partiell differenzierbare Funktion, so wird durch f (St , t) wiederum ein allgemeiner Itô-Prozess definiert. Dieser genügt der Gleichung Wahrscheinlichkeitsrechnung Kapitel 5 Stochastische Differentiation gilt, so ergibt sich für zt die stochastische DGL: dzt = 1 ∂ 2 f (St ) 2 ∂f (St ) ·σ ·µ + ∂x 2 ∂x2 + ∂f (St ) ∂t dt + ∂f (St ) ·σ·dWt ∂x = (eSt ·µ + 21 eSt ·σ 2 + 0)dt + eSt ·σ·dWt = (µ+ 21 σ 2 )·zt dt + zt ·σdWt zt = eSt ist also eine geometrisch Brownsche Bewegung, wobei die momentane Rendite dzt den Erwartungswert µ + 21 σ 2 und die Volatilität σ besitzt. zt ii) Der Aktienkurs St genüge einem geometrischen Wiener-Prozess (geometrisch Brownsche Bewegung), d.h. dSt = µ·St dt + σ·St dWt . Es liegt also ein spezieller Itô-Prozess mit α(S, t) = µ·St , β(S, t) = σ·St vor. 1.) Wir betrachten den Logarithmus zt = ln(St ). Für f (x) = ln(x) haben wir ∂f (x) ∂x = 1 x , ∂ 2 f (x) ∂x2 =− 1 x2 und ∂f (x) ∂t = 0. Itôs Lemma liefert dann die folgende stochastische DGL für zt : Stochastische Prozesse II dzt = = ∂f (St )·µ·St ∂x 1 µSt St − + 1 ∂2f (St )·σ 2 ·St2 2 ∂x2 1 1 2 2 σ St 2 St2 + 0 dt + + ∂f ∂t dt + ∂f (St )·σ·dWt ∂x 1 σSt dWt St = (µ− 21 σ 2 )dt + σdWt Der Logarithmus eines geometrischen Wiener-Prozesses St ist also ein arithme1 tischer Wiener-Prozess mit Driftrate µ − σ 2 und Varianzrate σ 2 , d.h. St ist 2 lognormalverteilt. Dies ist gerade die Umkehrung von Beispiel i). 2.) Untersuchen wir nun das stochastische Verhalten des zu St gehörenden Terminkurses Ft . Wie in Satz 2.3 hergeleitet, ist bei stetigen Bestandshaltekosten b der ⋆ Forward Price Ft = St eb(t −t) . ⋆ −t) Mit f (x, t) := x · eb(t ∂f ∂x ⋆ −t) = eb(t , ∂f ∂t liefert Itô’s Lemma unter Verwendung der Ableitungen = −b · f (x, t) , ∂2f ∂x2 =0 für Ft die stochastische Differentialgleichung: 92 c Klaus Schindler SS 2016 Stochastische Prozesse II ⋆ −t) dFt = eb(t ⋆ −t) = eb(t Kapitel 5 ⋆ −t) dSt − bSt eb(t 5.5. Stochastische Differentiation dt + 0 ⋆ −t) (µSt dt + σSt dWt ) − bSt eb(t ⋆ −t) = (µ−b)St eb(t ⋆ −t) dt + σ eb(t dt St dWt = (µ−b)Ft dt + σFt dWt Stochastische Prozesse II Dies bedeutet, dass der Terminkurs Ft ebenfalls ein geometrischer Wiener-Prozess ist mit der gleichen Volatilität wie St , jedoch mit einer zu erwartenden momentanen Rendite µ − b pro Zeiteinheit. ❐ c Klaus Schindler SS 2016 93 K APITEL 6 BLACK/SCHOLESOptionsmodell Wie nicht anders zu erwarten, sind Annahmen, die so schwach sind, dass sie jeder akzeptiert, nicht ausreichend, um eine rationale Optionspreistheorie zu entwickeln. In diesem Sinne liefern die in Kapitel 2 hergeleiteten Arbitragebeziehungen nur Grenzen innerhalb derer sich der Optionspreis bewegen muss, jedoch keinen funktionalen Zusammenhang zwischen dem Optionspreis und seinen zugrundeliegenden Variablen (S, K, T usw.). Es liegt nun nahe, dem zugrundeliegenden Objektkurs1 ein stochastisches Verhalten zuzuschreiben. Der häufigste Ansatz ist die Forderung, dass der Aktienkurs eine geometrisch Brownsche Bewegung ist, d.h. dass in einem Zeitraum dt gilt dSt = µ·St ·dt + σ·St ·dWt (6.1) oder äquivalent hierzu, dass die Rendite eine arithmetisch Brownsche Bewegung ist, d.h. dSt St = µ·dt + σ·dWt (6.2) Die Drift µ gibt die gegenwärtig zu erwartende Rendite der Aktie an, die Volatilität σ die momentan zu erwartende Standardabweichung hiervon. µ hängt von den Risikopräferenzen der einzelnen Anleger ab und stellt gewissermaßen einen Ausgleich für das eingegangene Risiko σ dar. Die Idee von BLACK und SCHOLES war es nun, ein Portfolio aus Aktien durch leerverkaufte Calls risikolos zu machen („hedgen“). Hierzu versucht man die Anzahl der leerverkauften Calls so zu wählen, dass sie Gewinne oder Verluste in den Aktien neutralisieren. Das dermaßen konstruierte Hedgeportfeuille besitzt dann einen sicheren Ertrag und muss sich daher aus Arbitragegründen wie eine (risikolose) Anleihe verhalten. Im Gegensatz zu den in Kapitel 2 verwendeten Hedgeportfolios wird hierbei jedoch abhängig vom Kursverlauf eine kontinuierliche Anpassung im Bestand des Portfolios vorgenommen. Zusammen mit der Vorgabe des stochastischen Prozesses liefert die Beziehung Rendite des Hedgeportfolios = Rendite der sicheren Anleihe 1 Der Einfachheit halber werden wir im Folgenden nur noch von Aktienkursen reden. (6.3) Wahrscheinlichkeitsrechnung Kapitel 6 Duplikation eine partielle Differentialgleichung für den Wert des Call. Obwohl BLACK und SCHOLES bei der Herleitung der Differentialgleichung ein Fehler unterlaufen ist, lässt sich die Grundidee retten und sogar auf beliebige derivative Finanzinstrumente verallgemeinern. Außerdem genügt die wesentlich schwächere Forderung, dass der zugrundeliegende Aktienkurs durch einen allgemeinen Itô-Prozess beschrieben werden kann (siehe Abschnitt 5.5, Formel (5.9)). Satz 6.1 Jedes von St abhängige derivative Finanzinstrument, bei dem der Fälligkeitszeitpunkt t⋆ und der Payoff P (St⋆ , t⋆ ) gegeben sind, kann durch ein dynamisches Portfolio aus Aktien und risikolosen Bonds dupliziert werden, wenn St einem allgemeinen Itô-Prozess dSt = α(St , t)·dt + β(St , t)·dWt genügt. Der Wert V des Derivates ergibt sich als Lösung der partiellen DGL 2 ∂ V 1 2 ·β (S, t)· 2 2 ∂S + b·S· ∂V ∂V − i·V + =0 ∂S ∂t mit der Randbedingung V (St⋆ , t⋆ ) = P (St⋆ , t⋆ ). ❑ BLACK/SCHOLESOptionsmodell Beweis: O.B.d.A. setzen wir wieder voraus, dass das Objekt eine Aktie mit dem stetigen Dividendenertrag d und damit den Bestandshaltekosten b = i − d ist2 . Zum Beweis ist in Abhängigkeit von St ein (dynamisches) Hedgeportfolio, bestehend aus einer Anzahl n = n(St ) von Aktien und einer Anzahl m = m(St ) von Bonds Bt , derart zu bestimmen, dass das Duplikationsfolio und das derivative Finanzinstrument den gleichen Cashflow besitzen. n und m sind daher so zu wählen, dass bis zum Liquidationszeitpunkt t⋆ kein Cashflow und zum Zeitpunkt t⋆ der Cashflow auftritt, durch den das zu duplizierende Finanzinstrument charakterisiert ist3 , nämlich der Payoff. Wir überlegen zunächst, wie sich der Wert Vt = nSt + mBt des Duplikationsfolios im Zeitraum dt verändert. Für die Änderung dV von V gilt: dV = V (n+dn, m+dm, St +dS, Bt +dB) − V (n, m, St , Bt ) = (n+dn)·(St +dS) + (m+dm)·(Bt +dB) − (n·St + m·Bt ) = dn·(St +dS) + n·dS + dm·(Bt +dB) + m·dB Die Forderung, dass kein Cashflow auftritt, bedeutet nun, dass die durch den Kauf bzw. Verkauf von Aktien und Anleihen im Zeitraum dt auftretenden Zahlungen (dies sind alle 2 Der Beweis setzt nicht voraus, dass b konstant ist. Die weitere Argumentation bleibt auch gültig, wenn i und d zeitabhängige deterministische Größen sind. i = i(t) gibt in diesem Fall den zum Zeitpunkt t vorhandenen momentanen Zinssatz an. 3 Man spricht von einem selbstfinanzierenden Portfolio. Siehe hierzu auch Bemerkung 6.2 vi). 96 c Klaus Schindler SS 2016 Black/Scholes Kapitel 6 Größen außer ndS und m·dB = m·i·Bt ·dt) durch die Erträge bzw. Kosten des Objektes im gleichen Zeitraum, nämlich d·n·S·dt = (i−b)·n·S·dt ausgeglichen werden. Dies liefert: dV = (i−b)·n·S·dt + n·dS + m·dB = (i−b)·n·S·dt + n·dS + i·m·B·dt (6.4) Berechnet man die Wertänderung des Portfolios Vt = n·St +m·Bt alternativ mit dem Lemma von Itô (Gleichung(5.14) ) ergibt sich: dV = ∂2V ∂V ∂V 1 ·dt + ·dS + ·β 2 (S, t)· 2 ·dt 2 ∂t ∂S ∂S (6.5) Setzt man dies in Gleichung (6.4) ein und beachtet außerdem die Beziehung m·Bt = V − n·St , so erhält man: ∂V ∂V ∂2V 1 ·dt + ·dS + ·β 2 (S, t)· 2 ·dt = (i−b)·n·S·dt + n·dS + i·(V −n·S)·dt 2 ∂t ∂S ∂S (6.6) Ersetzt man in Gleichung (6.6) dS durch α(S, t)dt + β(S, t)dWt und ordnet nach dem stochastischen Anteil dWt und dem deterministischen Anteil dt, erhält man: ( ∂V ∂t + ∂V 1 ∂2V 2 β (S, t) − i·V α(S, t) + ∂S 2 ∂S 2 + n b·S−α(S, t) ) dt − β(S, t) ( ) ∂V −n dW ∂S =0 Dies ist nur möglich, wenn sowohl der risikolose als auch der stochastische Anteil gleich Null sind. Es ergeben sich daher die Gleichungen 2 ∂V ∂V 1 ∂ V + ·α(S, t) + · 2 ·β 2 (S, t) − i·V + n· b·S−α(S, t) = 0 2 ∂S ∂t ∂S (6.7) ∂V −n=0 ∂S (6.8) Setzt man Gleichung (6.8) in Gleichung (6.7) ein, ergibt sich die Differentialgleichung von BLACK/SCHOLES für den Wert V des Duplikationsportfolios und damit für den Wert F des derivativen Finanzinstrumentes: 2 ∂ V 1 2 ·β (S, t)· 2 2 ∂S + b·S· ∂V ∂V − i·V + =0 ∂S ∂t (6.9) Die Funktion V (S, t), die der Differentialgleichung (6.9) genügt und zum Zeitpunkt t⋆ den gleichen Pay-off wie das vorgegebene Finanzinstrument F (S) besitzt, für die also die Randbedingung V (St⋆ ) = P (St⋆ , t⋆ ) (6.10) gilt, beschreibt das vorgegebene Finanzinstrument. c Klaus Schindler SS 2016 97 BLACK/SCHOLESOptionsmodell und Wahrscheinlichkeitsrechnung Kapitel 6 Duplikation Bemerkung 6.2 i) Die in Satz 2.3 gefundene Funktion V (St , t⋆ , K) = St e(b−i)T −K e−iT für den Wert eines Terminkontraktes mit Terminkurs K erfüllt offensichtlich die DGL (6.9) und genügt der Randbedingung V (St⋆ ) = St⋆ − K. ii) Will man den in Satz 6.1 angegebenen dynamischen Duplikationsprozess4 durchführen, entstehen Probleme mit den (in einem perfekten Markt nicht vorhandenen) Transaktionskosten. iii) Die Anzahl der zum Hedgen benötigten Anleihen ist m = B ∂V −1 · V ∂V − ·S ∂S , die Anzahl . Sind die Größen n und m bekannt, der zum Hedgen benötigten Aktien ist n = ∂S ist der Wert Ft des duplizierten derivativen Finanzinstrumentes F zum Zeitpunkt t gleich dem Wert Vt des Duplikationsportfolios, also Ft = Vt = n · St + m · Bt In Kapitel 7 werden wir die Größen n und m für den Fall, dass St einer geometrisch Brownschen Bewegung genügt, explizit berechnen (siehe hierzu Bemerkung 7.2). Bei ∂V Terminkontrakten gilt wie in Teil i) gesehen n = = e(b−i)T . ∂S iv) Wie der Beweis zeigt, gilt der Duplikationssatz 6.1 auch ohne die klassische Voraussetzung, dass der Aktienkurs eine geometrisch Brownsche Bewegung ist. Er ist insbesondere auch dann gültig, wenn die Zinsen, Bestandshaltekosten oder die Volatilität des Objektes während der Laufzeit T = t − t⋆ deterministisch nicht konstant sind. Es lässt sich dann jedoch i.a. keine explizite Lösungsformel wie in Kapitel 7 herleiten. BLACK/SCHOLESOptionsmodell v) Die Black/Scholes-Differentialgleichung (6.9) ist unabhängig von Risikopräferenzen, d.h. unabhängig von α(St , t). Diese Größe geht also nicht explizit in die Optionsbewertung ein. Daher ist jede Lösung der DGL (6.9) ebenfalls von α(St , t) unabhängig und wir können bei der Lösungsbestimmung vereinfachend annehmen, dass alle Investoren risikoneutral sind, d.h. ihre Anlageentscheidung unabhängig vom jeweiligen Risiko treffen. Genauer bedeutet dies, dass alle Investoren sich indifferent verhalten zwischen einer Investition mit sicherer Rendite r und einer unsicheren Investition, die die gleiche erwartete Rendite r besitzt. In dieser fiktiven risikoneutralen Welt erwartet der Anleger also keinen Aufschlag für das Risiko, das er oder andere Investoren eingehen. Außerdem wird jeder Anleger die gleichen Optionsformeln finden wie in unserer „realen“ Welt. vi) Die im Beweis von Satz 6.1 verwendete Eigenschaft, dass bei der Duplikation kein Cashflow auftritt, wird als selbstfinanzierende Portfolio-Strategie bezeichnet (siehe hierzu 4 Häufig wird dieses Verfahren auch als Hedgeprozess bezeichnet, weil die ursprüngliche Idee von Black/Scholes darin bestand, ein risikoloses (d.h. gehedgtes Portfolio) zu konstruieren, um damit die Option zu bewerten. 98 c Klaus Schindler SS 2016 Black/Scholes Kapitel 6 BLACK/SCHOLESOptionsmodell Kapitel C des Anhangs). Nach außen hin entsteht der Eindruck, als ob die Wertänderung des Duplikationsportfolios V nur durch die Wertänderung der Aktien und Anleihen verursacht wird, weil dV = n·dS + m·dB gilt. ❐ c Klaus Schindler SS 2016 99 K APITEL 7 Eine analytische Lösung für europäische Optionen In Kapitel 6 wurde die Black/Scholes-Gleichung zur Bewertung derivativer Finanzinstrumente hergeleitet. Speziell lautet das mathematische Modell einer Kaufoption demnach: i·C − b·S· ∂2C ∂C ∂C 1 − ·β 2 (S, t)· 2 = , 2 ∂S ∂S ∂t C(S, t⋆ ) = max{0, St⋆ −K}, C(0, t) = 0, lim C(S, t) = S· e(b−i)T , 0 6 t 6 t⋆ , 0 < S < ∞, (7.1) 0 < S < ∞, (7.2) 0 6 t 6 t⋆ . S→∞ (7.3) Um das Problem (7.1) - (7.3) analytisch lösen zu können, fordern wir nun vereinfachend β(S, t) = σ·St , wie z.B. im Fall einer geometrisch Brownschen Bewegung. Außerdem setzen wir voraus, dass i und b während der Laufzeit der Option konstant sind. Bedingung (7.2) stellt eine Endbedingung (zum Ausübungszeitpunkt) dar, die durch die Transformation T := t⋆ −t (= Restlaufzeit) in eine Anfangsbedingung umgewandelt wird. Wir haben es so mit einem parabolischen Anfangswertproblem zu tun. Mit Hilfe weiterer Substitutionen kann die Gleichung auf eine einfache Form gebracht und gelöst werden. Die Substitution C(S, T ) := e−iT ·g(u, v) , mit v = σ 2 · 2b −1 σ2 2 T · 2 und u = überführt DGL (7.1) in die neue Differentialgleichung1 ∂2g ∂g = , 2 ∂u ∂v 0 6 v 6 σ2· mit der Anfangsbedingung 2b −1 σ2 2 t⋆ · , 2 u 2b −1 σ2 · ln S K + v, (7.4) −∞ < u < ∞ g(u, 0) = K· max{0, e 2b/σ2 −1 −1} =: g0 (u), −∞ < u < ∞. (7.5) Solche Anfangswertprobleme sind in der Literatur ausführlich dargestellt und treten beispielsweise bei der mathematischen Modellierung von Wärmeleitungs- und Diffusionsprozessen auf. Die Lösung lautet g(u, v) = 1 Z ∞ −∞ √ (ξ−u)2 1 ·g0 (ξ)· e− 4v 4πv dξ. Kurioserweise ist dies die bekannte Wärmeleitungsgleichung aus der Physik. Wahrscheinlichkeitsrechnung Kapitel 7 Black/Scholes-Formel Um zum Optionspreis C(S, T ) zu gelangen, muss man nun die Rücktransformation durchführen. Wir wollen uns hier nur auf einen Teil beschränken. C(St , T ) = e−iT ·g(u, v) = e−iT · Z ∞ (ξ−u)2 1 √ ·g0 (ξ)· e− 4v 4πv −∞ dξ Mit der Rücksubstitution ξ:=( σ2b2 −1)· ln( Kx ) erhält man die Anfangsbedingung g0 (ξ) in ihrer ursprünglichen Form max{0, x−K}. Ersetzt man schließlich u und v durch die entsprechenden Ausdrücke für S und T , ergibt sich C(St , T ) = e−iT · Z∞ 0 1 − 21 · √ ·e x σ 2 T 2π max{0, x−K}· √ h ln(x)− 2 ln(St )+(b− σ )T 2 σ2 T Der Ausdruck (7.6) kann weiter vereinfacht werden zu √ C(S, T ) = e(b−i)T ·S·N (y+σ T ) − e−iT ·K·N (y), i2 dx. (7.6) (7.7) 2 mit S ) + (b− σ2 )T ln( K √ y= , σ2 T wobei N die Standardnormalverteilung bezeichnet, d.h. N (x) = Z x −∞ 1 2π ϕ0,1 (z)dz = √ Z x −∞ z2 1 π e− 2 dz = √ Z ∞ − √x 2 2 e−z dz. Mit Hilfe der Put-Call-Parität für europäische Optionen (Satz 2.9) P (S, T ) = C(S, T ) − S· e(b−i)T +K· e−iT und N (y) = 1 − N (−y) ergibt sich der Wert einer europäischen Verkaufsoption als √ (7.8) P (S, T ) = e−iT ·K·N (−y) − e(b−i)T ·S·N (−y−σ T ). Nach Bemerkung 3.20 i) sind die Integrale (7.6) bzw. (7.8) abgezinste Erwartungswerte der Optionspayoffs (bzgl. einer speziellen Lognormalverteilung). Bei anderen Derivaten bleiben Vorgehensweise und Ergebnis gleich. Hierzu ist nur der Payoff des Call bzw. Put durch den Payoff des jeweiligen derivativen Finanzinstrumentes zu ersetzen. Der resultierende Satz bleibt auch gültig, wenn ein beliebiger Itô-Prozess vorausgesetzt wird2 . Es ist dann jedoch nicht mehr möglich, explizite Optionspreisformeln anzugeben. Eine analytische Lösung für europäische Optionen Satz 7.1 Genügt das underlying St einem geometrischen Wienerprozess dSt = b·St ·dt + σ·St ·dWt , so ergibt sich der Wert eines derivativen Finanzinstrumentes F , bei dem Fälligkeitszeitpunkt t⋆ und Payoff P (St⋆ , t⋆ ) gegeben sind, als abgezinster Erwartungswert des Payoffs bzgl. einer geeigneten Lognormalverteilung. Genauer gilt: F (St , T ) = e 2 −iT Z 0 ∞ 1 [ln(x)−(ln(St )+(b− 1 σ2 T Pt⋆ (x)· √ √ 2 · e− 2 · x 2π σ T Ein alternativer Beweis wird in Folgerung C.7 geliefert. 102 c Klaus Schindler SS 2016 σ 2 )T )]2 2 dx ❑ Black/Scholes Kapitel 7 Bemerkung 7.2 Die Formeln zur Bestimmung des Wertes europäischer Optionen (7.7) und (7.8) lassen sich nun auch im Rahmen der Duplikationsmethode interpretieren. Wie wir in Kapitel 6 gesehen haben, erfolgt die Bewertung eines derivativen Finanzinstru∂V mentes mit Hilfe eines dynamischen Duplikationsportfolios V , bestehend aus n = Aktien −1 ∂S ∂V V − ·S ∂S Anleihen B mit Nominalwert 1 (siehe hierzu auch Bemerkung und m = B · 6.2 iii)). Aus Formel (7.7) ergibt sich3 im Fall einer europäischen Kaufoption n= ∂V ∂S = ∂C ∂S √ = e(b−i)T N (y+σ T ) und m = −K·N (y) . Der Wert des Duplikationsportfolios ist daher √ n·St + m·Bt = e(b−i)T ·N (y+σ T )·St − K·N (y)· e−iT , und damit gleich dem berechneten Callwert. Der erste bzw. zweite Term in (7.7) steht somit ∂C für den Wert des Aktien- bzw. Anleihenanteils im Duplikationsportfolio. n = wird auch ∂S als Hedge-Rate bezeichnet. Sie bestimmt das zum Hedgen (genauer: Duplizieren) notwendige Verhältnis zwischen Aktien und Optionen. ❐ Beachtet man lim y = +∞ und lim y = −∞ , S→+∞ S→0 so gestattet die analytische Lösungsformel die Untersuchung interessanter Spezialfälle. • Ist S ≫ K, gilt N (y) ≈ 1, so dass sich Ceur asymptotisch wie e(b−i)T S − e−iT K verhält. • Für S → 0 gilt N (y) → 0, woraus Ceur (0, T ) = 0 bzw. Peur (0, T ) = e−iT K folgt. Da die analytischen Lösungsformeln vom Wert der entsprechenden Normalverteilungen abhängen, muss man bei praktischen Anwendungen auf Approximationen der Normalverteilung zurückgreifen. Tabelle 2 zeigt den Optionspreis, der mittels Formel (7.7) für eine konkrete europäische Kaufoption auf Grundlage der verschiedenen Näherungen der Normalverteilung aus Kapitel 3, Abschnitt 3.6 berechnet wurde. 3 Die Formel für n erweckt den Eindruck, als wäre nur der erste Term in der Call-Formel nach S differenziert worden. c Klaus Schindler SS 2016 103 Eine analytische Lösung für • Ist die Volatilität des Kurses Null (y = ±∞), d.h. ist S eine sichere Größe und ist S ebT > K, so ist der Callwert gleich dem Wert eines Terminkaufs, der Put ist wertlos. Dahingegen hat im Fall S ebT < K der Call den Wert 0 und der Put den Wert eines Terminverkaufs. Wahrscheinlichkeitsrechnung Kapitel 7 Black/Scholes-Formel Analytische Formel für europäische Kaufoption Aktienkurs: 230.00 e/Aktie Ausübungskurs: 210.00 e/Aktie stetiger Zinssatz: 0.04545 Volatilität: 0.25000 auf Jahresbasis Restlaufzeit: 0.50000 Jahre keine Dividende Optionspreis: Methode-a Methode-b Methode-c Methode-d 30.74261 30.74158 30.74352 30.74176 Tabelle 2 Eine analytische Lösung für europäische Optionen 104 c Klaus Schindler SS 2016 K APITEL 8 Das Binomialmodell für europäische Optionen Da die meisten Optionspreismodelle (insbesondere für amerikanische Optionen) keine analytische Lösung zulassen, müssen numerische Verfahren herangezogen werden. Am bekanntesten sind dabei Methoden, die den Aktienkurs als einen diskreten stochastischen Prozess (Kursbaum) modellieren (siehe auch Abschnitt 4.1.1). Da der Optionspreis zum Verfallszeitpunkt gleich dem inneren Wert ist, kann dann bei vorgegebenem Kursbaum der gesuchte Wert einer europäischen Option rekursiv berechnet werden1 . Nach Formel (7.6) ist nämlich zu einem Zeitpunkt tj der Wert einer europäischen Option der abgezinste Erwartungswert der möglichen Optionspreise zum Zeitpunkt tj+1 . Die Erzeugung des Kursbaumes erfordert, dass zwischen den unterschiedlichen Arten möglicher Erträge (bzw. Kosten) unterschieden wird. 8.1. Aktien ohne Erträge t⋆ Wir zerlegen zunächst die Optionslaufzeit2 in n äquidistante Zeitschritte ∆t= . Zu jedem n diskreten Zeitpunkt tj =j·∆t (j=0, . . . , n) kann - ausgehend von einem Kurs S j (j kennzeichnet den Zeitpunkt tj ) - mit einer gewissen Wahrscheinlichkeit pk zum nächsten Zeitpunkt tj+1 in einen von m neuen Zuständen Skj+1 (k=1, . . . , m) springen3 . Für die Wahrscheinlichkeiten pk soll dabei gelten m X pjk = 1, 0 6 pjk 6 1, für k=1, 2, . . . , m. k=1 Wenn man nun den Kurs zum Anfangszeitpunkt (z.B. dem gerade aktuellen) kennt, so kann man einen Baum möglicher Kurse bis hin zu einem gewünschten Zeitpunkt (z.B. dem Verfallsdatum) bestimmen. Nach Formel (7.6) ergibt sich der Wert der europäischen Option O(S j−1) zum Zeitpunkt tj−1 1 In Kapitel 10 wird das Verfahren auf amerikanische Optionen erweitert. 2 Hier wurde t = 0 gesetzt, so dass T = t⋆ − t = t⋆ gilt. 3 Für m=2 ergibt sich das Binomialmodell. Wahrscheinlichkeitsrechnung Kapitel 8 Aktien ohne Erträge als abgezinster Erwartungswert der zum Zeitpunkt tj möglichen Optionspreise O(Skj , tj ). Bei konstanten Zinsen erhält man E m X O(S j−1, tj−1 ) = e−i·∆t · [O(S j , tj )] = e−i·∆t · k=1 pk ·O(Skj , tj ). Da für den Endzeitpunkt tn zu jedem möglichen Aktienkurs S n dieses Kursbaums der Optionspreis O(S n ) bekannt ist, lassen sich die Optionswerte O(S n−1) zum Zeitpunkt tn−1 aus den Optionspreisen O(Skn ) berechnen. Diesen Prozess kann man für alle weiteren Zeitschritte tj (j = n−2, n−3, . . . , 0) fortsetzen und so die Optionspreise bis hin zum Anfangszeitpunkt berechnen4 . Betrachten wir als Beispiel den Fall m=2, d.h. das Binomialmodell aus Abschnitt 4.1.1. t⋆ Das Zeitintervall [0, t⋆ ] wird in n gleichgroße Teilintervalle ∆t= zerlegt und vorausgesetzt, n dass Kursänderungen nur zu den folgenden Zeitpunkten stattfinden t0 =0, t1 =∆t, t2 =2∆t, . . . , tn =n∆t=t⋆ Charakteristisch für das Binomialmodell ist, dass zu jedem Zeitpunkt nur zwei Kursänderungen stattfinden: • entweder bewegt sich der Kurs mit einer Wahrscheinlichkeit p1 und einer Änderungsrate u in die eine Richtung (z.B. nach oben), • oder er bewegt sich mit der Wahrscheinlichkeit p2 und der Änderungsrate d in die andere Richtung (z.B. nach unten). Die Wahrscheinlichkeiten pk und die Änderungsraten uk werden gemäß Abschnitt 5.1 so gewählt, dass im Grenzfall ∆t → 0 die dem Aktienkurs zugrundeliegende geometrisch Brownsche Bewegung dSt = µ·S·dt+σ·S·dWt entsteht. Aufgrund des Risikoneutralitätsargumentes (siehe Bemerkung 6.2 v)) kann µ=b gewählt werden. Da ln(S j+1 ) eine arithmetische Irrfahrt mit dem (bedingten) Erwartungswert ln(S j ) + 2 (b− σ2 )·∆t und der Varianz σ 2 ·∆t ist (Abschnitt 4.1.3), erhält man drei Gleichungen zur Bestimmung der vier Parameter: ! E ln(S j+1 ) ln(S j ) p1 + p2 = 1, ! = p1 · ln(uS j ) + p2 · ln(dS j ) = ln(S j ) + (b− p1 · ln(uS j ) − E 2 2 + p2 · ln(dS j ) − E σ2 )∆t 2 =: E ! = σ 2 ∆t. Wegen p2 = 1−p1 bleiben noch zwei Gleichungen mit drei Unbekannten übrig p1 ln u d + ln(d) = (1 − p1 )p1 ln 4 u 2 d b− σ2 ∆t, 2 = σ 2 ·∆t. Bei europäischen Optionen genügt also die Kenntnis der Aktienkurse und damit der Optionswerte zum Verfallszeitpunkt. Im Gegensatz hierzu muss bei amerikanischen Optionen der gesamte Kursbaum bei der rekursiven Optionswertberechnung verwendet werden, da je nach Aktienkurs unter Umständen mit einer vorzeitigen Ausübung zu rechnen ist. In diesem Sinn sind amerikanische Optionen kurswegabhängig. Das Binomialmodell für europäische Optionen 106 c Klaus Schindler SS 2016 das Binomialmodell Kapitel 8 8.1. Aktien ohne Erträge Zur Lösung dieses Gleichungssystems kann eine weitere Bedingung gefordert werden. Sinnvoll ist u·d = 1, damit unmittelbar hintereinander folgende Auf- und Abwärtsbewegungen σ 2 √ ∆t ergibt sich des Kurses zum Ausgangszustand zurückführen5 . Mit x = b− 2 p1 = 1 2 x , 2 σ 2 +x2 + √ u = eσ √ ∆t , p2 = 1−p1 , d = 1 u . Nach Formel (7.6) ergibt sich der Optionswert Okj zum Zeitpunkt tj als abgezinster Erwarj+1 tungswert der zum Zeitpunkt tj+1 möglichen Optionspreise Okj+1 und Ok+1 j+1 + (1−p)·Okj+1 . Okj = e−i∆t p·Ok+1 Da der Optionspreis Okn zum Verfallszeitpunkt t⋆ = tn gleich dem inneren Wert ist, kann man für j = n−1, n−2, . . . , 0 nacheinander alle Werte Okj bestimmen. Beispiel 8.1 1 Wir betrachten einen europäischen Call mit einer Laufzeit von Jahr, einem Ausübungs2 kurs K = 210 e auf eine Aktie mit einem Kurs in Höhe von S = 230 e. Während der Laufzeit sollen keine Dividenden anfallen. Bei n = 5 Schritten liefert das Binomialmodell Binomialmodell Aktienkurs: 230.00 Volatilität: 0.25 Ausübungskurs: 210.00 Restlaufzeit: 0.50 Dividende (keine/stetig/diskret): k Call/Put: C Aktueller Kurs: Zeit Dividende Kurse Skj 341.50558 315.54682 291.56126 269.39890 248.92117 230.00000 212.51708 196.36309 181.43700 167.64549 154.90230 S00 t0 0.00 keine Ok0 Zinssatz: Schritte: 0.04545 5 europ./amerik.: e Optionspreis: O00 = 30.378 = 230.00 t1 0.10 t2 0.20 t3 0.30 t4 0.40 t5 0.50 Ok1 Ok2 Ok3 Ok4 Ok5 131.506 106.497 83.457 62.237 44.328 30.378 81.561 60.349 40.818 26.175 16.200 38.921 20.951 11.238 6.010 2.517 1.275 0.646 0.000 0.000 0.000 Tabelle 3 Dies reduziert die Anzahl der zu untersuchenden möglichen Kurse drastisch von 2n auf n+1. c Klaus Schindler SS 2016 107 Das Binomialmodell für europäische 5 Wahrscheinlichkeitsrechnung Kapitel 8 Aktien mit stetigen Erträgen Die Aktienkurse Skj des Kursbaums sind in vereinfachter Form in einer Spalte angegeben. Die Berechnung der Optionspreise Okj findet sich im zweiten Teil der Tabelle. Anhand der Baumstruktur kann die iterative Berechnungsprozedur der Optionswerte verfolgt werden. Erhöht man die Schrittanzahl auf n = 100, d.h. ist ∆t = 0.02, so ergibt sich ein Optionspreis von 30.769 (siehe Tabelle 4). Binomialmodell Aktienkurs: 230.00 Volatilität: 0.25 Ausübungskurs: 210.00 Restlaufzeit: 0.50 Dividende ((keine/stetig/diskret): k Call/Put: C aktueller Kurs: 230.00 Zinssatz: Schritte: 0.04545 100 europ./amerik.: e Optionspreis: 30.76942 Tabelle 4 Betrachtet man die Werte dieses Beispiels für unterschiedliche Zeitunterteilungen n, sieht man, dass die Lösung des Binomialmodells mit wachsendem n gegen die Black/ScholesLösung konvergiert, ein Ergebnis, das sich auch theoretisch beweisen lässt (siehe z.B. [5]). n Optionswert Binomialmodell mit Schrittanzahl 5 10 20 50 100 150 30.378 30.817 30.724 30.751 30.769 30.740 Tabelle 5 Black/ScholesFormel 30.741 ❐ 8.2. Aktien mit stetigen Erträgen Treten während der Laufzeit der Option Erträge (Kosten) auf, muss die Erzeugung des Kursbaumes entsprechend der Ertragsart (stetig, diskret) modifiziert werden. Nachdem der Kursbaum bestimmt worden ist, wird der europäische Optionspreis durch die gleiche Rekursion wie vorher bestimmt, d.h. durch Erwartungswertbildung und Diskontierung. Liegt ein stetiger Dividendenertrag δ vor, wird der Kursbaum wie vorher erzeugt, wobei jedoch b = i durch b = i − δ ersetzt werden muss. Beispiel 8.2 1 Betrachten wir einen $-Call mit einer Restlaufzeit von Jahren, einem Kurs von S = 1, 50 e$ 3 und K = 1, 50 e$ . Der stetige Dividendenertrag (= ausländischer Zinssatz) betrage 1%. Tabelle 6 gibt die Werte, die das Binomialmodell bei n = 6 Schritten liefert: Binomialmodell Aktienkurs: 1.50 Volatilität: 0.20 Ausübungskurs: 1.50 Restlaufzeit: 0.33 Dividende (keine/stetig/diskret): s Call/Put: C Das Binomialmodell für europäische Optionen 108 c Klaus Schindler SS 2016 Zinssatz: 0.09000 Schritte: 6 Größe: 1% europ./amerik.: e das Binomialmodell Kapitel 8 Aktueller Kurs: 1.50 Zeit Dividende Kurse Skj 1.99034 1.89869 1.81127 1.72786 1.64830 1.57240 1.50000 1.43093 1.36504 1.30219 1.24223 1.18503 1.13046 0.00 stetig: Ok0 8.3. Aktien mit diskreten Erträgen Optionspreis: 0.087 0.06 1% Ok1 0.11 0.17 0.22 0.28 0.33 Ok2 Ok3 Ok4 Ok5 Ok6 0.490 0.405 0.324 0.247 0.180 0.127 0.087 0.234 0.161 0.105 0.067 0.041 0.311 0.148 0.079 0.042 0.022 0.012 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 Tabelle 6 ❐ 8.3. Aktien mit diskreten Erträgen a) Erträge als fester Prozentsatz des Aktienkurses Wir erzeugen zunächst einen Kursbaum, als ob keine Dividende gezahlt würde. Wird nun zu einem Zeitpunkt tx , tj−1 < tx 6 tj eine Dividende als fester Prozentsatz δ des Aktienkurses gezahlt, so bewirkt dies, dass - beginnend mit dem Zeitpunkt tj - alle zeitlich nachfolgenden ′ Kurse um den Wert δSkj , j ′ ≥ j, fallen (siehe nachfolgende Abbildung). j−1 ✶ (1 − δ)u2 Sk j j j−1 ✶ Sk+1 − δSk+1 = u(1 − δ)Sk j−1 q ✶ (1 − δ)Sk Skj−1 q S j − δS j = (1 − δ)S j−1 /u k k k q (1 − δ)S j−1 /u2 k Wird jede, während der Laufzeit der Option anfallende Dividende, auf diese Art und Weise in den ursprünglichen Kursbaum eingearbeitet, entsteht der für die Optionspreisberechnung relevante Kursbaum. Die Optionswerte werden wie bisher bestimmt. c Klaus Schindler SS 2016 109 Das Binomialmodell für europäische Beispiel 8.3 Als Beispiel betrachten wir eine Kaufoption mit einer Dividendenzahlung von δ =1% des Aktienkurses zum Zeitpunkt 0.15. Die Ergebnisse sind in Tabelle 7 dargestellt (in Klammern die Aktienkurse mit Dividendenabschlag). Wahrscheinlichkeitsrechnung Kapitel 8 Aktien mit diskreten Erträgen Binomialmodell Aktienkurs: 230.00 Volatilität: 0.25 Zinssatz: 0.04545 Ausübungskurs: 210.00 Restlaufzeit: 0.50 Schritte: 5 Dividende (keine/stetig/diskret): d Zeit: 0.15 Betrag: δ = 1% Call/Put: C europ./amerik.: e Aktueller Kurs: 230.00 Zeit Dividende Abschlagsfaktor 1 − δ Optionspreis Kurs ohne Abschlag 341.50558 315.54682 291.56126 269.39890 248.92117 230.00000 212.51708 196.36309 181.43700 167.64549 154.90230 0.00 diskret 1.00 Ok0 Optionspreis: 28.384 0.10 0.20 0.30 0.40 1.00 Ok1 0.99 Ok2 0.99 Ok3 0.99 Ok4 80.542 59.543 (288.65) 41.942 (266.70) 38.329 28.384 (248.92) 24.087 (246.43) (230.00) 14.592 (227.70) 9.547 (212.52) 4.886 (210.39) (194.40) 0.101 (179.62) 103.341 (312.39) 57.655 (266.70) 18.651 (227.70) 0.199 (194.40) 0.000 (165.97) 0.50 0.99 Ok5 128.091 (338.09) 78.646 (288.65) 36.432 (246.43) 0.392 (210.39) 0.000 (179.62) 0.000 (153.35) Tabelle 7 Beginnend mit dem Zeitpunkt t2 = 0.2 (bei 5 betrachteten Unterteilungen des Zeitintervalls 0 6 t 6 0.5) werden alle ursprünglich ohne Dividenden berechneten Kurse mit dem Faktor (1−δ) multipliziert (vergleiche Tabelle 3 für den Fall ohne Dividende). ❐ b) Erträge als feste Zahlungen Während der Laufzeit der Option mögen nun Dividenden (eine oder mehrere) mit festen Beträgen zu vorher genau bekannten Zeiten anfallen (z.B. 5 e zum Zeitpunkt tx und 10 e zum Zeitpunkt ty ). Nutzt man das in a) beschriebene Vorgehen zur Konstruktion des Kursbaums, so führen eine Auf- und sofortige Abwärtsbewegung des Kurses nicht mehr auf den Ausgangszustand zurück. Diese Tatsache kann man sich an einem einfachen Beispiel schnell veranschaulichen. Angenommen zum Zeitpunkt tx , t1 < tx 6 t2 < t⋆ , wird eine feste Dividende D gezahlt. Der Kursbaum hätte dann folgendes Aussehen: Das Binomialmodell für europäische Optionen 110 c Klaus Schindler SS 2016 das Binomialmodell Kapitel 8 ✶ S0 q uS 0 ✶ (u S − D) q ✶ (S 0 − D) q (S 0 /u2 − D) 0 S 0 /u 2 8.3. Aktien mit diskreten Erträgen ✿ ③ ✿ ③ ✿ ③ (u3 S 0 − Du) (uS 0 − D/u) (uS 0 − Du) (S 0 /u − D/u) (S 0 /u − Du) (S 0 /u3 − D/u) ✲ t0 t1 t2 t3 Der Kursbaum wird sehr unübersichtlich und ist für praktische Rechnungen ungeeignet. Außerdem können auf diese Art und Weise negative Kurse auftreten. Diese Schwierigkeiten vermeiden wir, indem wir den Aktienkurs S j als Summe einer Zufallsgröße S̃ j und einer sicheren Größe D j auffassen, d.h. S j = S̃ j + D j . Die risikolose Komponente D j ist dabei der Wert aller während der Laufzeit der Option anfallenden Dividendenzahlungen bezogen auf den Zeitpunkt tj . Erfolgen zum Beispiel Dividendenzahlungen in Höhe Dx1 , Dx2 , . . . , Dxℓ zu den Zeitpunkten 0 < tx1 < tx2 < · · · < txℓ < t⋆ , so hat D j (bei konstanten stetigen Zinsen) folgendes Aussehen Dj = X e−i(txk −tj ) Dxk {k|txk >tj } Ausgehend vom Anfangszustand S̃ 0 = S 0 − D 0 erzeugen wir zunächst einen Kursbaum für die Zufallskomponente S̃, woraus die Kurse S̃kj resultieren. Die Addition der Dividendenwerte liefert schließlich den uns eigentlich interessierenden Kursbaum von S Skj = S̃kj + D j . Wegen D n = 0 gilt insbesondere Skn = S̃kn . Der Wert einer europäischen Option berechnet sich dann wieder nach dem üblichen iterativen Verfahren. Beispiel 8.4 Tabelle 8 zeigt dieses Verfahren für einen europäischen Put auf eine Aktie, bei der zu den Zeiten t = 0.25 und t = 0.75 jeweils eine Dividendenzahlung in Höhe von 1 e anfällt (in Klammern jeweils die Kurse Skj mit Dividenden). c Klaus Schindler SS 2016 111 Das Binomialmodell für europäische Binomialmodell Aktienkurs: 100.00 Volatilität: 0.30 Zinssatz: 0.10000 Ausübungskurs: 100.00 Restlaufzeit: 1.00 Schritte: 6 Dividende (keine/stetig/diskret): d Zeit: 0.25, 0.75 Betrag: je 1.00 Call/Put: P europ./amerik.: e Wahrscheinlichkeitsrechnung Kapitel 8 Aktueller Kurs: 100 Zeit Dividende D j Kurse S̃kj 204.55 180.97 160.11 141.65 125.32 110.88 98.10 86.79 76.78 67.93 60.10 53.18 47.04 Das Binomialmodell für europäische Optionen 112 0.00 1.90 Ok0 0.17 1.94 Ok1 Aktien mit diskreten Erträgen Optionspreis: 7.646 0.33 0.96 Ok2 0.50 0.98 Ok3 1.00 0.00 Ok6 0.00 0.00 (204.55) 0.00 (180.97) 0.00 0.18 (161.10) 0.00 (160.11) 1.37 (142.63) 0.39 (141.65) 0.00 3.91 (126.28) 2.81 (126.32) 0.87 (125.32) 7.63 (112.81) 6.99 (111.85) 5.72 (110.88) 1.90 (100) 12.24 (99.06) 12.10 (99.09) 11.57 (98.10) (88.72) 18.78 (87.77) 19.95 (86.79) 23.22 (77.74) 27.21 (77.78) 30.42 (76.78) (68.91) 36.63 (67.93) 39.90 (61.09) 45.18 (60.10) (53.18) 52.96 (47.04) Tabelle 8 ❐ c Klaus Schindler SS 2016 0.67 0.99 Ok4 0.83 0.00 Ok5 K APITEL 9 Amerikanische Optionen Das Recht zur vorzeitigen Ausübung bereitet bei der Bewertung amerikanischer Optionen große Schwierigkeiten. Wie in Kapitel 2 gesehen, bewirkt dieses Ausübungsrecht, dass der Wert amerikanischer Optionen nicht unter den inneren Wert fallen darf. Diese Bedingung wird von europäischen Optionen im allgemeinen nicht erfüllt, so dass die europäischen Optionspreisformeln im allgemeinen nicht zur Bewertung amerikanischer Optionen verwendet werden können. Bei Puts lässt sich dies besonders einfach demonstrieren. Betrachten wir hierzu einen amerikanischen Put mit Ausübungskurs K und Laufzeit T . Nimmt man nun an, dass der Kurs St des underlying gleich Null ist, hat der amerikanische Put den Wert K, da der innere Wert gleich K ist und der Kurs des Underlying nicht weiter absinken kann. Dies bedeutet, dass der amerikanische Put in diesem Fall vorzeitig ausgeübt wird, weil das weitere Halten der Option nur Zinsverluste verursacht. Da wir den entsprechenden europäischen Call nur durch einen Terminverkauf glattstellen können, ist der Wert des europäischen Put in diesem Fall gleich K e−iT , also kleiner als der amerikanische Putwert Pam . Die folgenden Abbildungen zeigen dies für die Putwerte bei stetigen Bestandshaltekosten b in den Fällen b > 0 und b < 0. Wahrscheinlichkeitsrechnung Kapitel 9 Vorzeitige Ausübung Put ✻ K K−S b>0 K e−iT ✕ Pam K e−iT −S e(b−i)T Peur ✌ S ∗∗ K e−bT ✲S K Put ✻ K K−S b<0 K e−iT ✯ Pam K e−iT −S e(b−i)T Peur ✙ S ∗∗ K K e−bT ✲S Amerikanische und europäische Putwerte bei positiven und negativen Bestandhaltekosten Hierbei sollte auch beachtet werden, dass eine vorzeitige Ausübung des Put i.a. schon in Frage kommt, bevor der Kurs St = 0 erreicht ist. Heuristisch gesehen ist nämlich ab einem bestimmten kritischen Kurs des Underlying der Zinsverlust auf den inneren Wert der Option größer, als die durch eventuelle Kursveränderungen zu erwartende Wertsteigerung Amerikanische Optionen 114 c Klaus Schindler SS 2016 Amerikanische Optionen Kapitel 9 Vorzeitige Ausübung der Option1 . Da die Differentialgleichung von Black/Scholes jedoch nur gültig ist, solange die Option nicht ausgeübt wird2 , bedeutet dies, dass das amerikanische Optionspreisproblem ein freies Randwertproblem ist, bei dem die Differentialgleichung nur im Bereich der Kurse S gilt, die größer als der kritische Put-Kurs S ∗∗ = S ∗∗ (t) bzw. kleiner als der kritische Call-Kurs S ∗ = S ∗ (t) sind. Eine Lösung des amerikanischen Optionspreisproblems ist daher nur möglich, wenn der kritische Aktienkurs (d.h. der Rand des Definitionsbereiches der Black/ScholesDifferentialgleichung implizit oder explizit) mitberechnet wird (siehe hierzu das Binomial- bzw. Trinomialmodell in Kapitel 8 bzw. 10). Die folgende Grafik verdeutlicht diesen Sachverhalt für einen amerikanischen Call. • Im Bereich {(S, t) | t < t⋆ , 0 6 St < S ∗ (t)} gilt die Differentialgleichung von Black/Scholes. • Im Bereich {(S, t) | t < t⋆ , S ∗ (t) 6 St } fällt die Option zurück auf den inneren Wert, wobei ein stetiger Übergang in C und S ∂C ∂S stattfindet. Cam = max{St − K, 0} ✻ C, ∂C ∂S S ∗ (t) ✒ ✠ stetig 1 2 2 ∂2C σ S 2 ∂S 2 + bS ∂C ∂S − iC + ∂C ∂t =0 C = max{St⋆ − K, 0} ✠ t⋆ ✲ t 1 Dies ist einer der Gründe für die Zeitabhängigkeit des kritischen Kurses. 2 Da keine Transaktionskosten entstehen ist die vorzeitige Ausübung der Option damit gleichzusetzen, dass die Option gleich ihrem inneren Wert ist. c Klaus Schindler SS 2016 115 Amerikanische Optionen Trotz dieser Schwierigkeiten ist es in vielen Fällen möglich, mit Hilfe der in Kapitel 2 verwendeten Mitteln der Arbitrage Aussagen über die vorzeitige Ausübung amerikanischer Wahrscheinlichkeitsrechnung Kapitel 9 Vorzeitige Ausübung Optionen zu machen, ohne vom Objektkurs St stochastische Eigenschaften zu fordern. Zu beachten ist, dass der folgende Satz für amerikanische Puts nicht gilt. Satz 9.1 a) Ein amerikanischer Call auf ein Objekt, das während der Laufzeit der Option keine Erträge abwirft oder während der Laufzeit der Option Kosten verursacht, wird nicht vorzeitig ausgeübt und hat daher den gleichen Wert wie der ansonsten gleiche europäische Call. b) Für einen amerikanischen Call auf ein Objekt, das während der Laufzeit der Option nur Erträge zu bestimmten Zeitpunkten t1 , . . . , tn abwirft, ist eine frühzeitige Ausübung nur kurz vor einem der Zeitpunkte t1 , . . . , tn optimal. Insbesondere muss bei stetigen Erträgen zu jedem Zeitpunkt mit einer vorzeitigen Ausübung gerechnet werden. ❑ Beweis: Wir wenden die Put-Call-Parität aus Satz 2.9 für europäische Optionen an. Wie üblich bezeichne dabei K den Ausübungskurs, S den Objektkurs und T die Laufzeit der Option. a) Fallen diskrete Kosten B an, gilt nach Voraussetzung B 6 0. Daraus folgt: Ceur (St ) = Peur (St ) + St − B − K e−iT > St − K e−iT > St − K Fallen stetige Kosten d an, bedeutet dies d 6 0. Daraus folgt wegen b − i = −d > 0: Ceur (St ) = Peur (St ) + St e(b−i)T −K e−iT > St e(b−i)T −K e−iT > St − K In beiden Fällen gilt also für den europäischen Call Ceur (St ) > St − K Wegen Cam > Ceur ist daher der Wert des amerikanischen Call während der Laufzeit immer echt größer als der innere Wert, so dass eine vorzeitige Ausübung nicht erfolgt. b) O.B.d.A. sei t1 der nächstgelegene Zahlungszeitpunkt für Erträge. Ist t̃ ein beliebiger Zeitpunkt vor t1 , so bezeichne C̃eur (St ) bzw. C̃am (St ) den Wert eines europäischen bzw. Amerikanische Optionen 116 c Klaus Schindler SS 2016 Amerikanische Optionen Kapitel 9 Vorzeitige Ausübung amerikanischen Call mit gleichem Ausübungskurs K wie die vorgegebene amerikanische Option, jedoch dem Verfallszeitpunkt t̃. Wie in Teil a) gesehen, gilt dann für jeden Zeitpunkt t < t̃ : C̃eur (St ) > St − K Wegen der längeren Laufzeit und der vorzeitigen Ausübbarkeit des amerikanischen Call gilt jedoch nach Bemerkung 2.8 2.8 (4) 2.8 (5) Cam (St ) > C̃am (St ) > C̃eur (St ) > St − K Wie in Teil a) kann dann wieder geschlossen werden, dass der amerikanische Call zum Zeitpunkt t nicht vorzeitig ausgeübt wird. Die folgenden Abbildungen stellen den letzten Satzes nochmals graphisch dar. Im Fall b > i, was äquivalent zu d 6 0 ist, gilt Cam = Ceur . Im Fall b < i, was äquivalent zu d > 0 ist, gilt Cam > Ceur . In diesem Fall kann, wie die Graphik zeigt, insbesondere der Fall C(St ) > St auftreten. Call ✻ S e(b−i)T −K e−iT b>i Cam = Ceur S−K K c Klaus Schindler SS 2016 ✲S 117 Amerikanische Optionen Ke −bT Wahrscheinlichkeitsrechnung Kapitel 9 Amerikanische Put-Call-Parität Call ✻ b<i Cam > Ceur S−K S e(b−i)T −K e−iT Cam Ceur −bT Ke K ✲S S ∗ Die Put-Call-Parität lässt sich ebenfalls auf amerikanische Optionen übertragen. Da über die kritischen Kurse S ∗ (t) und S ∗∗ (t) – und damit über den Zeitpunkt einer vorzeitigen Ausübung – jedoch kaum Aussagen gemacht werden können, liefert die Put-Call-Parität für amerikanische Optionen nur noch Ungleichungen. Satz 9.2 (Put-Call-Parität für amerikanische Optionen) Für einen amerikanischen Call und einen amerikanischen Put mit gleichem Verfallszeitpunkt t⋆ , gleichem Ausübungskurs K auf das gleiche Objekt gelten folgende Aussagen a) Fallen während der Laufzeit T = t⋆ − t der Optionen Erträge bzw. Kosten mit dem Barwert Bt an, so ist St − K e−iT > Cam (St ) − Pam (St ) > St − K − Bt falls Bt > 0 St − K e−iT −Bt > Cam (St ) − Pam (St ) > St − K falls Bt 6 0 (9.1) b) Fallen während der Laufzeit T = t⋆ − t der Optionen stetige Bestandshaltekosten b auf das Objekt an, so ist St − K e−iT > Cam (St ) − Pam (St ) > St e(b−i)T −K falls b < i St e(b−i)T −K e−iT > Cam (St ) − Pam (St ) > St − K falls b > i (9.2) ❑ Beweis: a) Beispielhaft betrachten wir nur den Fall, dass das Objekt eine Aktie ist. Außerdem kann o.E. angenommen werden, dass nur eine Dividende mit Barwert D > 0 zum Amerikanische Optionen 118 c Klaus Schindler SS 2016 Amerikanische Optionen Kapitel 9 Vorzeitige Ausübung Zeitpunkt t1 während der Laufzeit T = t⋆ −t der Optionen anfällt. Wir zeigen zunächst die linke Ungleichung St −K e−iT > Cam (St )−Pam (St ). Hierzu betrachten wir folgendes Portfolio zum Zeitpunkt t: i) Kaufe den Put ii) Kaufe eine Aktie iii) Verkaufe Anleihen zum Nominalwert K, fällig zum Zeitpunkt t⋆ iv) Verkaufe den Call Dieses Portfolio wird trotz möglicher Suboptimalität bis zum Zeitpunkt t⋆ gehalten, auch wenn der leerverkaufte Call ausgeübt wird. Zu beachten ist, dass nach Satz 9.1 eine vorzeitige Ausübung des Call nur zum Zeitpunkt t̃ := t1 − ∆t stattfindet. In diesem Fall wird die Aktie aus dem Portfolio geliefert. Der Wert des Portfolios zum Zeitpunkt t⋆ ergibt sich dann aus der folgenden Tabelle: Wert zum Zeitpunkt t̃ = t1 − ∆t vorzeitige Ausübung Pos. des Call i) ii) iii) iv) >0 St⋆ ⋆ −K e−i(t −t̃) −(St⋆ − K) >0 P t⋆ t1 Call vorzeitig ausgeübt – D – – >0 St⋆ 6 K K − St⋆ – −K ⋆ K ei(t −t̃) >0 St⋆ > K 0 – −K ⋆ K ei(t −t̃) >0 Call nicht vorzeitig ausgeübt St⋆ 6 K K − St⋆ ⋆ St⋆ + D ei(t −t1 ) −K 0 >0 St⋆ > K 0 ⋆ St⋆ + D ei(t −t1 ) −K −(St⋆ − K) >0 Daher gilt für den Wert des Portfolios zum Zeitpunkt t wie behauptet: Pam (St ) + St − K e−iT −Cam (St ) > 0 (9.3) Die zweite Ungleichung beweist man analog, wobei hier zu berücksichtigen ist, dass der Put vorzeitig ausgeübt werden kann. b) Bei stetigen Bestandshaltekosten betrachten wir zuerst den Fall b > i ⇐⇒ d 6 0. Wir zeigen zunächst die linke Ungleichung Pam (St ) + St e(b−i)T −K e−iT > Cam (St ) (9.4) Hierzu betrachten wir folgendes Portfolio zum Zeitpunkt t: i) Kaufe den Put ii) Kaufe e(b−i)T Aktien c Klaus Schindler SS 2016 119 Amerikanische Optionen iii) Verkaufe Anleihen zum Nominalwert K, fällig zum Zeitpunkt t⋆ Wahrscheinlichkeitsrechnung Kapitel 9 Amerikanische Put-Call-Parität iv) Verkaufe den Call Wie in Teil a) zeigt man nun, dass, falls der Call nicht vorzeitig ausgeübt wird, der Wert des Portfolios zum Zeitpunkt t⋆ gleich Null ist. Hierbei ist zu beachten, dass die vorausgesetzten Lagerhaltungskosten (d 6 0) durch den Teilverkauf der Aktien finanziert werden, so dass zum Zeitpunkt t⋆ genau eine Aktie vorhanden ist. Wird der Call zwischenzeitlich zum Zeitpunkt t̃ ausgeübt, wird das gesamte Portfolio liquidiert und man erhält: ⋆ ⋆ Pam (St⋆ ) − (St⋆ − K) + St⋆ · e(b−i)(t −t̃) −K e−i(t −t̃) = ⋆ ⋆ Pam (St⋆ ) + K(1 − e−i(t −t̃) ) + St⋆ · (e(b−i)(t −t̃) −1) > 0 (9.5) Also gilt für den Wert des Portfolios zum Zeitpunkt t wie behauptet: Pam (St ) + St e(b−i)T −K e−iT −Cam (St ) > 0 (9.6) Im Fall b < i ⇐⇒ d > 0 beweist man die linke Ungleichung Pam (St ) + St − K e−iT > Cam (St ) (9.7) völlig analog, wobei es wegen d > 0 genügt, eine Aktie im Portefeuille zu halten. Beweisen wir nun im Fall b > i die rechte Ungleichung Cam (St ) > Pam (St ) + St − K (9.8) Wir betrachten hierzu folgendes Portfolio zum Zeitpunkt t: i) Kaufe den Call ii) Verkaufe den Put iii) Leerverkauf einer Aktie iv) Kaufe Anleihen zum Nominalwert K eiT , fällig zum Zeitpunkt t⋆ Wird der Put nicht vorzeitig ausgeübt, gilt zum Zeitpunkt t⋆ : 0 − (K − St⋆ ) −St⋆ e−(b−i)T +K eiT > 0 falls St⋆ < K 0 −St⋆ e−(b−i)T +K eiT > 0 falls St⋆ > K (St⋆ − K) + (9.9) Wird der Put zum Zeitpunkt t̃ vorzeitig ausgeübt, wird das gesamte Portfolio liquidiert und man erhält: Cam (St⋆ ) − (K − St⋆ ) − St⋆ · e−(b−i)(t̃−t) +K ei(t̃−t) > 0 (9.10) Damit gilt für den Wert des Portfolios zum Zeitpunkt t wie behauptet: Cam (St ) − Pam (St ) − St + K > 0 (9.11) Analog verfährt man im Fall b < i für die rechte Ungleichung Cam (St ) > Pam (St ) + St e(b−i)T −K wobei die Aktienposition auf e(b−i)T Aktien reduziert wird. Amerikanische Optionen 120 c Klaus Schindler SS 2016 (9.12) 10 Das Trinomialmodell für amerikanische Optionen Zur Bestimmung des Optionspreises amerikanischer Optionen wollen wir das Trinomialmodell vorstellen (siehe [32]). Alle vom amerikanischen Optionstyp stammenden Besonderheiten lassen sich natürlich auch auf das Binomialmodell übertragen. Das Trinomialmodell ist deshalb bemerkenswert, da es auf andere klassische numerische Verfahren zur Lösung partieller Differentialgleichungen hinweist, die auch zur Optionspreisbestimmung herangezogen werden können, die Differenzenverfahren. Das Trinomialmodell unterscheidet sich vom Binomialmodell dadurch, dass sich der Kurs zu jedem diskreten Zeitpunkt in drei statt in zwei Richtungen bewegen kann: p1 Skj p2 j+1 u1 Skj = Sk+1 ✸ ✲ u2 Skj = Skj+1 s j+1 u3 Skj = Sk−1 p3 Wie beim Binomialmodell müssen drei Bedingungen in Form von Gleichungen erfüllt werden (- die Summe der Wahrscheinlichkeiten ist Eins, - der Erwartungswert ist gegeben und - die Varianz ist vorgegeben). Die Anzahl der unbekannten Parameter beträgt hier jedoch sechs p1 + p2 + p3 = 1, p1 ln u1 + p2 ln u2 + p3 ln u3 = b− 2 σ 2 (10.1) ∆t, p1 (ln u1)2 + p2 (ln u2 )2 + p3 (ln u3 )2 = σ 2 ∆t + b − (10.2) σ2 2 2 ∆t2 . (10.3) An dieser Stelle muss man sich nun weitere Bedingungen überlegen, um zu sinnvollen Lösungen des Gleichungssystems zu gelangen. Um einen übersichtlichen Kursbaum konstruieren zu Wahrscheinlichkeitsrechnung Kapitel 10 Numerische Methoden können, fordert man u1 u3 = u22 . Dadurch wird die Anzahl der zum Zeitpunkt tn zu untersuchenden Kurse auf 2n + 1 reduziert und somit Speicherplatz gespart. Das Gleichungssystem bleibt aber weiterhin unterbestimmt. Wir wollen nun zwei mögliche Lösungen diskutieren. A) Angenommen, dass ein Zeitschritt des Trinomialmodells zwei Schritten des Binomialmodells entspricht. Die Parameter ergeben sich dann aus dem Binomialmodell als u1 = u2 , u2 = 1 , u3 = u−2 , u = eσ 2 √ ∆t/2 2 p1 = p , p2 = 2p(1 − p) , p3 = (1 − p) , p = 1 2 , 1 + (b − √ σ2 ∆t . ) 2 σ Das Trinomialmodell für europäische Optionen in dieser Variante benötigt also nur die Hälfte der Zeitschritte im Vergleich zum Binomialmodell, um die gleichen Ergebnisse zu erlangen. Es konvergiert somit schneller als das Binomialmodell gegen die Black/ScholesLösung. Tabelle 9 zeigt den Wert, den das Trinomialmodell für die europäische Kaufoption aus Beispiel ?? liefert (vergleiche Tabelle 4): Trinomialmodell 1 Aktienkurs: 230.00 Volatilität: 0.25 Ausübungskurs: 210.00 Restlaufzeit: 0.50 Dividende (keine/stetig/diskret): k Call/Put: C aktueller Kurs: 230.00 Zinssatz: Schritte: 0.04545 50 europ./amerik.: e Optionspreis: 30.76942 Tabelle 9 Amerikanische Optionen unterscheiden sich von den europäischen dadurch, dass die Ausübung zu einem beliebigen Zeitpunkt t′ , 0 < t′ ≤ t∗ erfolgen kann. Dabei ist C(S, t′ ) = max{0, S(t′ ) − K}. Mathematisch handelt es sich somit um ein freies Randwertproblem. Da eine analytische Lösung dieses Problems nicht möglich ist, muss man numerische Verfahren verwenden. Wie für europäische Optionen bestimmt man den Wert Okj der Option als abgezinsten Erj+1 j+1 wartungswert der in der Zukunft möglichen Optionspreise Ok+1 , Okj+1 und Ok−1 . Der Unterschied zu europäischen Optionen besteht nun darin, dass dieser Erwartungswert nicht unter dem inneren Wert liegen kann. Damit lautet die Berechnungsformel für amerikanische Kaufoptionspreise: j+1 j+1 Okj = max{Skj − K, e−i∆t [p1 Ok+1 + p2 Okj+1 + p3 Ok−1 ]}. Bewertet man im letzten Beispiel (Tabelle 9) die Option als amerikanischen Call, folgt Das Trinomialmodell für amerikanische Optionen 122 c Klaus Schindler SS 2016 Amerikanische Optionen Kapitel 10 Trinomialmodell 1 Aktienkurs: 230.00 Volatilität: 0.25 Ausübungskurs: 210.00 Restlaufzeit: 0.50 Dividende (keine/stetig/diskret): k Call/Put: C aktueller Kurs: 230.00 Zinssatz: Schritte: 0.04545 50 europ./amerik.: a Optionspreis: 30.76942 Tabelle 10 Europäische und amerikanische Calls auf Aktien, die während der Laufzeit keine Dividende zahlen, sind gleich zu bewerten. Der amerikanische Put ist dagegen wertvoller als der europäische. Bewertet man die letzten zwei Beispiele (Tabelle 9/10) die Optionen als Put, erhält man Peur = 6.05140 und Pam = 6.21159. B) Abschließend wollen wir noch eine zweite Möglichkeit diskutieren, wie man pk und uk wählen kann. Der gesamte Kursbaum soll nun einen gewissen Aufwärtstrend erfahren. Anstelle der Bedingung u2 = 1 setzen wir σ2 u2 = e(b− 2 )∆t . Desweiteren betrachten wir folgende Wahrscheinlichkeiten und Änderungsraten: u1 = e(b− σ2 )∆t+σh 2 √ p1 = p3 = p, p2 = (1 − 2p), p = T /2 , u2 = e(b− σ2 )∆t 2 , u3 = e(b− σ2 )∆t−σh 2 ∆t , T h2 √ T /2 , wobei h derzeit noch ein beliebiger Parameter ist. Diese pk und uk erfüllen das Gleichungssystem (10.1) - (10.3) exakt. Trinomialmodell 2 Aktienkurs: 230.00 Volatilität: 0.25 Ausübungskurs: 210.00 Restlaufzeit: 0.50 Dividende (keine/stetig/diskret): k Call/Put: C aktueller Kurs: 230.00 Zinssatz: Schritte: 0.04545 100 europ./amerik.: a Optionspreis: 30.74502 Tabelle 11 Interpretiert man pk als Wahrscheinlichkeit, so erhält man eine Bedingung an den Parameter h h> r ∆t . T (10.4) Betrachten wir uns das Modell für europäische Optionen, das durch diese Wahrscheinlichkeiten pk und Änderungsraten uk beschrieben wird, genauer. =e −i∆t ∆t ∆t j+1 ∆t j+1 Ok+1 + (1 − 2 2 )Okj+1 + 2 Ok−1 2 Th Th Th c Klaus Schindler SS 2016 . (10.5) 123 Das Trinomialmodell für amerikanische Okj Wahrscheinlichkeitsrechnung Kapitel 10 Numerische Methoden Setzt man ∆t = −(t∗ − tj+1) + (t∗ − tj ) = tj+1 − tj τ = ∗ −t ) j Okj ei(t ∆t T = h2 , 2 = Zkj so erhält man die explizite Differenzenapproximation der parabolischen Differentialgleichung (7.4) mit logarithmisch äquidistanten Abständen (siehe [28]). j+1 j+1 Zk+1 − 2Zkj+1 + Zk−1 Zkj − Zkj+1 = τ h2 (10.6) Die Bedingung (10.4) entspricht dann der bekannten Stabilitätsforderung für explizite Differenzenverfahren. Im Vergleich zu den bisher diskutierten Modellen sind bei dieser Variante die Wahrscheinlichkeiten pk - und somit auch die Berechnungsvorschrift (10.5) - nicht von der Volatilität abhängig. Gleichung (10.5) hängt nur über die Anfangsbedingung - dem Kurs zum Ausübungszeitpunkt - von σ ab, was bei der Berechnung der impliziten Volatilität ein wesentlicher Vorteil ist. Das Trinomialmodell für amerikanische Optionen 124 c Klaus Schindler SS 2016 11 Optionsmanagement (Portfolio-Insurance) Als Beispiel für ein aktives Management mit Optionen soll nun die Portefeuille-Versicherung (Portfolio Insurance) betrachtet werden. Als Portfolio Insurance bezeichnet man den Abschluss von Geschäften, welche die Risikostruktur eines Portfolios so verändern, dass zu einem im vorausbestimmten Termin - ein Absinken des Portfoliowertes unter ein bestimmtes Niveau (floor) verhindert wird1 und - die positiven Erträge durchgehend um einen kleinen Betrag gemindert werden (was als Zahlung einer Versicherungsprämie interpretiert werden kann). Geben wir hierfür zunächst ein einfaches Beispiel. Ein Kapitalbetrag von 105 e, soll in eine Aktie, mit dem aktuellen Kurs 1 e investiert werden. Wir betrachten hierzu zwei Alternativen. Portfolio A: Kauf von 105 Aktien. Portfolio B: Kauf von 100 Aktien und 100 Verkaufsoptionen mit dem Ausübungskurs K = 1, einer Laufzeit von einem Jahr und dem Gesamtpreis von 5 e. Der Preis der Verkaufsoptionen stellt in diesem Fall die Versicherungsprämie für die Aktien auf einen Versicherungsbetrag von 100 e dar. Der Wert des Portfolios beträgt nach genau einem Jahr mindestens 100 e, da Verluste im Aktienkurs durch die gekauften Puts gerade ausgeglichen werden. Steigen die Aktien über 1 e, verfallen die Puts wertlos. Durch die gezahlte Versicherungsprämie werden alle Gewinnwahrscheinlichkeiten mäßig reduziert, und die Wahrscheinlichkeit kleiner Verluste wird stark erhöht, wofür die Wahrscheinlichkeit größerer Verluste auf Null sinkt. Die folgende Tabelle zeigt die Wert- und Renditeentwicklung der beiden Portfolios in Abhängigkeit vom Aktienkurs St∗ in einem Jahr. Mathematisch gesehen ist die Portfolio Insurance ein Verfahren zur Risikotransformation, bei dem ein Portfolio mit einer gewünschten Risikostruktur erzeugt wird. 125 Optionsmanagement (Portfolio-Insurance) 1 Wahrscheinlichkeitsrechnung Aktienkurs St∗ [e ] 0,50 0,60 0,70 0,80 0,90 1,00 1,10 1,20 1,30 1,40 Kapitel 11 Unversichertes Portfolio Wert Rendite [e ] % p.a. 52,5 –50 63,0 –40 73,5 –30 84,0 –20 94,5 –10 105,0 0 115,5 +10 126,0 +20 136,5 +30 147,0 +40 Versichertes Portfolio Wert Rendite [e ] % p.a. 100 –4,8 100 –4,8 100 –4,8 100 –4,8 100 –4,8 100 –4,8 110 +4,8 120 +14,3 130 +23,8 140 +33,3 Portfolio-Insurance Versichertes Portfolio in % des unversicherten Portfolios 190 159 136 119 106 95 95 95 95 95 Die Vielzahl möglicher Strategien im Bereich der Portfolio Insurance lässt sich nach der Häufigkeit der zur Versicherung notwendigen Anpassungsmaßnahmen unterteilen in - statische Strategien, bei denen nach Bildung des Ausgangsportfolios höchstens eine weitere Umschichtung erfolgt - dynamische Strategien, bei denen im Idealfall kontinuierliche Anpassungen nach einer im Voraus festgelegten Regel erfolgen. Die zu Beginn geschilderte statische Strategie lässt sich auf zwei äquivalente Arten durchführen2 : Strategie 1: Der Anleger kauft Aktien und Verkaufsoptionen in passender Zahl. Strategie 2: Der Anleger kauft Anleihen im Nominalwert des gewünschten floor F und für den Rest des Geldes Kaufoptionen mit Ausübungskurs F auf das Objekt. Alle verfolgten Strategien beruhen auf einer Abwandlung dieser beiden Grundstrategien und erweisen sich als konsequente Anwendung der Put-Call-Parität aus Satz 2.9. Vor der Inangriffnahme einer Portefeuille-Versicherung müssen folgende Fragen geklärt werden: 1. Welche Finanzinstrumente stehen zur Verfügung (hierzu gehören vor allem die Informationen über Zinssätze, Volatilitäten, Korrelation zum Index u.ä. )? 2 Obwohl schwieriger zu handhaben, ist Strategie 1 dann sinnvoll, wenn ein vorgegebenes Aktienportefeuille versichert werden soll. Optionsmanagement (Portfolio-Insurance) 126 c Klaus Schindler SS 2016 Optionsmanagement Kapitel 11 2. Welche Vorstellungen hat der Anleger bezüglich - des Aufbaus des Portfolios (gewünschte Finanztitel) - des zur Verfügung stehenden Kapitals - des gewünschten zeitlichen Absicherungshorizonts - des gewünschten minimalen Portfoliowerts (floor) bzw. der gewünschten Minimalrendite3 (bzw. des in Kauf genommenen Maximalverlusts) nach Ablauf der Versicherungszeit. Stellvertretend für den Bereich der Portfolio Insurance wollen wir die oben beschriebenen Strategien 1 und 2 anhand eines Beispiels erläutern. Dabei gehen wir davon aus, dass das Objekt, in das investiert werden soll (o.B.d.A eine Aktie), vom Anleger vorher bestimmt worden ist. Je nach Ertrag4 unterscheiden wir zwei Fälle: Fall i) eine stetige Ertragsrendite d Fall ii) im voraus bekannte Erträge mit dem Barwert D0 Die Daten des Beispiels: Aktueller Zeitpunkt t = . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 05 Verfügbares Kapital V = . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .100.000 e Gewünschter floor F = . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .95.000 e Anlagehorizont T = . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 Jahre Aktueller Aktienkurs S0 = . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100 e stetiger Jahreszinssatz i = . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10% p.a. Jahresvolatilität σ der Aktie = . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30% Dividenden während der Laufzeit i) eine stetige Dividendenrendite d = . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2% p.a. ii) Dividenden im Barwert D0 = . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .5 e In beiden Fällen stehen wir vor dem Problem, die Anzahl n der Aktien, der (europäischen) Puts und den Ausübungskurs K der Puts zu bestimmen. 3 Bei gegebenem floor F und verfügbarem Kapital V ist die Minimalrendite r bei einem Zeithorizont von einem Jahr r = F −V V 4 Für negative Erträge, wie Lagerhaltungskosten, funktioniert das Verfahren analog. 5 Daraus folgt insbesondere t∗ = T . c Klaus Schindler SS 2016 127 Optionsmanagement (Portfolio-Insurance) Fall i) Die Aktie liefert eine stetige Dividendenrendite d = 2% p.a., die wir automatisch wieder in die Aktie investieren, so dass aus n Aktien nach T Jahren n ed·T Aktien geworden sind und Wahrscheinlichkeitsrechnung Kapitel 11 Portfolio-Insurance wir daher zu Beginn entsprechend viele Puts kaufen müssen. Da zum Investitionszeitpunkt der Wert des Portfolios genau V ist, liefert dies zunächst die Gleichung n · S0 + n ed·T P (S0 , T, K) = V . (11.1) Der Ausübungskurs K der Puts ist so zu bestimmen, dass der gewünschte floor nach zwei Jahren garantiert ist. Dies bedeutet, dass zum Zeitpunkt T bei einem Aktienkurs ST = K, zu dem der Putwert gerade 0 ist, der Wert des Portfolios genau den floor ergibt. Dies liefert die zweite Gleichung n · ed·T ST = n · ed·T K = F ⇐⇒ n = F K e−d·T . (11.2) Setzt man Gleichung (11.2) in Gleichung (11.1) ein, erhält man e−d·T S0 + P (S0 , T, K) − V F ·K =0 . (11.3) Mit der BLACK/SCHOLES-Formel für europäische Optionen kann nun der gesuchte Ausübungskurs K aus Gleichung (11.3) numerisch berechnet werden, etwa mit dem Newtonverfahren. Man erhält in diesem Fall den Wert K = 99, 58. F −d·T Um den floor von 95.000 e sicher zu erreichen, sind hier n = K e = 916, 6 Aktien und d·T 6 n · e = 954 Puts mit dem Ausübungskurs K = 99, 58 zu kaufen . Für die entsprechende Strategie mit Anleihen und Calls werden F e−i·T = 77.779,42 e festverzinslich angelegt und außerdem 954 Calls mit Ausübungskurs K = 99, 58 im Wert von 23,28 e/Call gekauft. Die Äquivalenz der beiden Strategien folgt aus der Put-Call-Parität für europäische Optionen: n · S0 + n ed·T P (S0 , T, K) = nK e(d−i)·T +n ed·T C(S0 , T, K) Die Wirkung der Versicherung lässt sich in der folgenden Tabelle ablesen: Aktienkurs St∗ [e ] 70 80 90 100 110 120 130 140 6 Unversichertes Portfolio Wert Rendite [e ] % p.a. 72.857 –27,1 83.265 –16,7 93.673 –6,3 104.081 +4,1 114.489 +14,5 124.897 +24,9 135.305 +35,3 145.714 +45,7 Versichertes Portfolio Wert Rendite [e ] % p.a. 95.000 –5,0 95.000 –5,0 95.000 –5,0 95.400 –4,6 104.940 +4,9 114.480 +14,5 124.020 +24,0 133.560 +34,6 Versichertes Portfolio in % des unversicherten Portfolios 130 114 101 92 92 92 92 92 Der Preis der Puts ist nach der Formel von BLACK/SCHOLES gleich 8,73 e/Put. Optionsmanagement (Portfolio-Insurance) 128 c Klaus Schindler SS 2016 Optionsmanagement Kapitel 11 Fall ii) Während der Laufzeit fallen Dividenden mit Barwert D0 = 5 e an. Wir legen diese festverzinslich an und erhalten zum Zeitpunkt T die Dividende DT = D0 eiT = 6,107 e. Der Kauf von n Aktien und n Puts führt dann unter Berücksichtigung der Dividende DT analog zu den Überlegungen in Fall i) auf die Gleichungen7 n · S0 + nP (S0 − D0 , T, K) = V (11.4) nK + nDT = F . (11.5) und Setzt man Gleichung (11.5) in Gleichung (11.4) ein, erhält man S0 + P (S0 − D0 , T, K) − V F · (K + DT ) = 0 . Analog zum Fall i) bestimmt man die relevanten Größen. Man erhält K = 96, 42 und n= F K + DT = 926, 55 . Für die Strategie mit Calls und Anleihen kaufen wir 926,55 Calls mit einem Wert von 23,99 e/Call und einem Ausübungskurs von K = 96, 42 und legen 95.000 e−iT = 77.779 e festverzinslich an. Die Wirkung der Versicherung im Fall ii) lässt sich in der folgenden Tabelle ablesen, wobei die Dividenden zum Zeitpunkt T zu berücksichtigen sind. Aktienkurs St∗ [e ] 70 80 90 96,42 100 110 120 130 140 Unversichertes Portfolio Wert Rendite [e ] % p.a. 76.107 –23,9 86.107 –13,9 96.107 –3,9 102.527 +2,5 106.107 +6,1 116.107 +16,1 126.107 +26,1 136.107 +36,1 146.107 +46,1 Versichertes Portfolio Wert Rendite [e ] % p.a. 94.996 –5,0 94.996 –5,0 94.996 –5,0 94.996 –5,0 98.313 –1,7 107.579 +7,6 116.844 +16,8 126.110 +26,1 135.375 +35,4 Versichertes Portfolio in % des unversicherten Portfolios 125 110 99 93 93 93 93 93 93 Neben der prinzipiellen Vorgehensweise zeigt das Beispiel die praktischen Schwierigkeiten, die bei der Portfolio Insurance auftreten: Eine Begründung für die Subtraktion der Bardividende D0 vom Kurs S0 findet man bei der Behandlung des Binomialmodells. c Klaus Schindler SS 2016 129 Optionsmanagement (Portfolio-Insurance) 7 Wahrscheinlichkeitsrechnung Kapitel 11 Portfolio-Insurance - Die Anzahl der benötigten Aktien und Optionen lässt sich nur bei großen Portefeuilles ohne großen prozentualen Fehler realisieren. - Es ist im allgemeinen nicht zu erwarten, dass der erforderliche Put bzw. Call zur Verfügung steht, weil a) bei Laufzeiten von mehr als einem Jahr kaum Optionen zu Verfügung stehen, b) Puts oder Calls mit dem berechneten Ausübungskurs i.a. nicht zur Verfügung stehen, c) die meisten gehandelten Optionen vom amerikanischen Typ und damit teurer als erforderlich sind8 . Gerade die letzte Schwierigkeit, dass die gewünschte Option nicht gehandelt wird, legt es nahe, sie mit dem in Kapitel 6 beschriebenen Delta-Hedge-Prozess zu erzeugen. Hierbei werden die zur Absicherung erforderlichen Optionen durch ein dynamisches (d.h. ständig anzupassendes) Portfolio aus Aktien und Anleihen synthetisiert. Wie bei allen dynamischen Strategien rückt dann jedoch das Problem der Transaktionskosten in den Vordergrund. Ein weiteres Problem besteht darin, größere Portefeuilles mit verschiedenen Aktien zu versichern. Hier empfiehlt es sich schon aus Kostengründen zur Absicherung auf Indexoptionen zurückzugreifen. In diesem Fall muss die Korrelation des Portefeuilles mit dem Index berücksichtigt werden. 8 Bei der Verwendung europäischer Optionen kann der Wert des Portfolios zwischenzeitlich unterhalb des floor liegen. Die entsprechende amerikanische Option liefert die gewünschte Absicherung nach unten während der gesamten Laufzeit. Diese durchaus wünschenswerte bessere Absicherung muss durch eine höhere Versicherungsprämie, d.h. einem höheren Optionspreis, erkauft werden. Optionsmanagement (Portfolio-Insurance) 130 c Klaus Schindler SS 2016 Literaturverzeichnis [1] Bachelier, L., Théorie de la spéculation, volume 3 of Annales de l’Ecole Normale Supérieure. Gauthier-Villars, Paris (1900) [2] Bauer, H., Wahrscheinlichkeitstheorie. 4. Aufl., De Gruyter, Berlin, New York (1991) [3] Baxter, M., Rennie, A., Financial Calculus: An Introduction to Derivative Pricing. Cambridge University Press, Cambridge (1998) [4] Black, F., Scholes, M., The Pricing of Options and Corporate Liabilities. Journal of Political Economy 81 (1973), 637-654 [5] Cox, John C., Rubinstein, Mark., Option Markets. Englewood Cliffs (1985) [6] Dalang, R.C., Morton, A., Willinger, W., Equivalent Martingale Measures and NoArbitrage in Stochastic Securities Market Models. Stochastics and Stochastics Reports 29 (1990), 185-201 [7] Delbaen, F., Schachermayer, W., A General Version of The Fundamental Theorem of Asset Pricing. Mathematische Annalen 300 (1994), 463-520 [8] Delbaen, F., Schachermayer, W., The Fundamental Theorem of Asset Pricing for Unbounded Stochastic Processes. Mathematische Annalen 312 (1998), 215-250 [9] Duffie, D, Dynamic Asset Pricing. Princeton University Press (1996) 2. Aufl. [10] Elliott, R. J.,Kopp, P. E., Hafner, C., Mathematics of Financial Markets. Springer, New York, Berlin, Heidelberg (1991) [11] Franke, J., Härdle, W., Hafner, C., Einführung in die Statistik der Finanzmärkte. Springer, New York, Berlin, Heidelberg - 2. Auflage (2008) [12] Harrison, J.M., Kreps, D.M., Martingales and Arbitrage in Multiperiod Securities Markets. Journal of Economic Theory 20 (1979), 381-408 [13] Hastings, Cecil jr. u.a., Approximations for digital computers. Princeton University Press. Princeton (1955) 131 Literatur [14] Hull, John. Options, Futures and other Derivative Securities. Englewood Cliffs: Prentice Hall. 8. Auflage (2010) Literatur [15] Ingersoll, Jonathan, Theory of financial decision making. Rowman & Littlefield, Totawa (New Jersey). (1987) [16] Irle, Albrecht, Finanzmathematik: Die Bewertung von Derivaten. Teubner Studienbücher. Stuttgart (1998) [17] Jarrow, Robert A., Rudd, Andrew, Option Pricing. Homewood, Ill. (1983) [18] Karatzas, Ioannis, Lectures on Mathematical Finance. CRM Monograph Series Vol. 8, American Mathematical Society (1997) [19] Karatzas, Ioannis, Shreve, Steven E., Methods of Mathematical Finance. Springer, New York, Berlin, Heidelberg (1999) [20] Karatzas, Ioannis, Shreve, Steven E., Brownian Motion and Stochastic Calculus. Springer, New York, Berlin, Heidelberg (1991) 2. Aufl. [21] Malliaris, A. G., Brock, W.A.., Stochastic Methods in Economics and Finance. NorthHolland (1982) [22] Merton, R. C., Continuous-Time Finance. Blackwell, Oxford (1990) [23] Merton, R. C., Theory of Rational Option Pricing. Bell J. Econom. Management Sci. 4, 141-183 (1973) [24] Musiela, Marek, Rutkowski, Marek, Martingale Methods in Financial Modelling. Springer, New York, Berlin, Heidelberg (1998) [25] Neftci, Salih N., An Introduction to the Mathematics of Financial Derivatives. Academic Press (1996) [26] Nielsen, L.N.., Pricing and Hedging of Derivative Securities. Oxford University Press (1999) [27] Pliska, S. R., Introduction to Mathematical Finance: Discrete Time Modells. Blackwell, Oxford (1997) [28] Samarskij, A.A., Theorie der Differenzenverfahren. Akademischer Verlagsgesellschaft Geest u. Portig K.-G.. Leipzig (1984) [29] Sandmann, Klaus, Einführung in die Stochastik der Finanzmärkte. Springer, New York, Berlin, Heidelberg (1999) [30] Welcker, Johannes, Kloy, Jörg W., Schindler, Klaus, Professionelles Optionsgeschäft. Verlag Moderne Industrie, Zürich (1992) 3. Aufl. Literatur 132 c Klaus Schindler SS 2016 Literatur [31] v. Weizsäcker, H., Winkler, G., Stochastic Integrals. Vieweg & Sohn, Braunschweig, Wiesbaden (1990) c Klaus Schindler SS 2016 133 Literatur [32] Wilmott, Dewynne, Howison, Option Pricing: Mathematical Models and Computation. Oxford Financial Press. (1993) Integrationstheorie Definition A.1 Unter einer Zerlegung Z des Intervalls [a, b] versteht man eine Menge Z := {t0 , t1 , . . . , tn } von Punkten tj mit a = t0 < t1 < . . . < tn = b. Hierdurch wird das Intervall [a, b] in n Teilintervalle [tk , tk+1 ] (k = 0, 2, . . . , n − 1) zerlegt. |Z | := max(tk+1 − tk ), d.h. die Länge des k größten auftretenden Teilintervalls und wird als Feinheit der Zerlegung Z bezeichnet. ❐ A.1. Funktionen von endlicher Variation Definition A.2 Für eine Funktion α : [a, b] −→ und eine Zerlegung Z := {t0 , t1 , . . . , tn } definiert man die Variation von α bzgl. Z durch: R V (Z ) := n−1 X k=0 |α(tk+1) − α(tk )| V := sup V (Z ) heißt totale Variation von α auf [a, b]. Gilt V < ∞, so heißt α von endlicher Z Variation auf [a, b]. Satz A.3 Für eine Funktion α : [a, b] −→ ❐ R gilt: a) α monoton =⇒ α von endlicher Variation. b) α Lipschitz-stetig =⇒ α von endlicher Variation. c) α von endlicher Variation =⇒ α beschränkt. Außerdem sind Summe, Differenz und Produkt von Funktionen von endlicher Variation selbst wieder von endlicher Variation. ❑ 135 Integrationstheorie A NHANG A Anhang A Riemann-Stieltjes-Integral A.2. Riemann-Stieltjes-Integral Definition A.4 Es seien die Funktionen f, α : [a, b] → und eine Zerlegung Z := {t0 , t1 , . . . , tn } gegeben. Wähle für k = 0, 1, . . . , n−1 Zwischenstellen τk ∈ [tk , tk+1 ] und bilde: R I(Z , τ ) := n−1 X k=0 f (τk ) · (α(tk+1) − α(tk )) Konvergiert I(Z , τ ) für |Z | → 0 gegen einen Grenzwert I, der weder von der gewählten Zerlegung Z noch von der Wahl der Zwischenstellen τk abhängt, so nennt man I das Riemann-Stieltjes-Integral von f . Man schreibt: I= Z b f (t)dα(t). a Für α(t) = t ergibt sich das Riemann-Integral als Spezialfall des Stieltjes-Integrals. ❐ Satz A.5 (Eigenschaften des Riemann-Stieltjes-Integrals) a) Existieren die entsprechenden Integrale auf der rechten Seite, so gelten die Linearitätseigenschaften: Z b a Z b a (k1 · f + k2 · g) dα = k1 f d(c1 · α + c2 · β) = c1 Z a Z b b) Existiert für a < c < b das Integral es gilt: Z b a f dα = Z c a f dα + Z b c b a f dα + k2 f dα + c2 Rb a Z b a Z b a R) ∈ R) g dα (k1 , k2 ∈ f dβ (c1 , c2 f dα, so auch die Integrale Rc a f dα, Rb c f dα und f dα c) Ist f auf [a, b] stetig und α von endlicher Variation, so existiert Z b a f dα. d) Ist f auf [a, b] stetig und α differenzierbar mit beschränkter Ableitung, so gilt: Z b a f (t)dα(t) = Z b a f (t) · α′ (t)dt e) Partielle Integration: R R Existiert ab f dg oder ab gdf , so auch das jeweils andere Integral und es gilt: Z b a f dg + Z b a gdf = f g f) Ist α stetig, so gilt Integrationstheorie 136 Z b a b a dα(t) = α(b) − α(a) c Klaus Schindler SS 2016 Integration Anhang A g) Sei f stetig auf [a, b] und α abschnittsweise konstant mit Sprungstellen (ck )m k=1 , dann ist: Z b a m X f dα = k=1 − f (ck ) · α(c+ k ) − α(ck ) {z | Sprunghöhe } ❑ Satz A.6 Sei f eine messbare Funktion auf dem Messraum (Ω, A). Dann existiert eine Folge (Tn )∞ n=1 messbarer Treppenfunktionen, die punktweise gegen f konvergiert, d.h. für jedes ω ∈ Ω gilt lim Tn (ω) = f (ω). ❑ n→∞ Beweis: Wegen f = f + − f − genügt es, f > 0 anzunehmen und zu zeigen, dass eine monoton ∞ wachsende Folge (Tn )n=1 mit lim Tn (x) = f (x) existiert. n→∞ Für n ∈ und i ∈ mit 1 6 i 6 n · 2n definieren wir hierzu im Definitionsbereich die messbaren Mengen N N En,i := x ∈ Ω i−1 2n 6 f (x) < i 2n und Fn := {x | f (x) > n} . Die Mengen En,i sind gerade die Urbilder der Zerlegung des Intervalls [0, n[ im Bildbereich 1 von f in 2n Teilintervalle der Länge n , wohingegen Fn das Urbild von [n, +∞[ ist. 2 Wegen der Messbarkeit von f sind die Mengen En,i und Fn Elemente der σ-Algebra A. Für festes n ∈ sind die Mengen En,i (i = 1, . . . , n2n ) und Fn offensichtlich disjunkt. Wir definieren nun N Tn := n n2 X i=1 i−1 2n · En,i +n· Fn , und zeigen, dass Tn (x) 6 Tn+1 (x) für alle x ∈ Ω und n ∈ die Fälle f (x) > n+1 und 0 6 f (x) < n+1. N gilt. Hierzu unterscheiden wir Ist f (x) > n+1, so ergibt sich nach Definition der Tn Tn (x) = n < n+1 = Tn+1 (x) 6 f (x) . k−1 k Ist 0 6 f (x) < n+1, so liegt x in genau einer Menge En+1,k , d.h. es ist n+1 6 f (x) < n+1 , 2 2 wobei 1 6 k 6 (n+1)2n+1 eindeutig bestimmt ist. Nach Definition von Tn+1 folgt daher Tn+1 (x) = k−1 2n+1 · (x) En+1,k = k−1 2n+1 6 f (x) . Ist k ungerade, gilt k = 2j − 1, woraus x ∈ En,j folgt und daher j−1 2n = 2j − 2 2n+1 = k−1 2n+1 = Tn+1 (x) . c Klaus Schindler SS 2016 137 Integrationstheorie Tn (x) = Anhang A Der Satz von Radon-Nikodym Ist k gerade, gilt k = 2j, woraus ebenfalls x ∈ En,j folgt und daher Tn (x) = j−1 2n = 2j − 2 2n+1 = k−2 2n+1 < k−1 2n+1 = Tn+1 (x) . Um die Konvergenz lim Tn (x) = f (x) zu überprüfen, betrachten wir zunächst den Fall n→∞ f (x) = +∞. Dann gilt Tn (x) = n, und die Behauptung ist erfüllt. Gelte daher f (x) < ∞. Für alle n > f (x) existiert dann ein k mit x ∈ En,k und daher Tn (x) = k−1 2n+1 6 f (x) < k 2n+1 Dies liefert 0 6 f (x) − Tn (x) < = 1 2n+1 k−1 2n+1 + 1 2n+1 = Tn (x) + 1 2n+1 . n→∞ −→ 0. A.3. Der Satz von Radon-Nikodym Satz A.7 (Radon-Nikodym) Seien λ und µ positive Maße auf dem Maßraum (Ω, A) mit i) 0 < µ(Ω) < ∞ und 0 < λ(Ω) < ∞ ii) λ ist absolut stetig bzgl. µ, d.h. es gilt µ(A) = 0 =⇒ λ(A) = 0 für alle A ∈ A (Schreibweise: λ ≪ µ). Dann existiert eine nichtnegative A-messbare Funktion h auf Ω, so dass gilt: ∀A ∈ A : λ(A) = Z A hdµ. Insbesondere gilt für alle messbaren Funktionen f : Z f dλ = Z f · hdµ. ❑ Bemerkung A.8 Man verwendet im Satz von Radon-Nikodym häufig die Kurzschreibweise λ = h · µ und nennt h die Dichte von λ bzgl. µ. Verursacht durch die Konstruktion wird h auch als Radondλ Nikodym-Ableitung bezeichnet. In diesem Fall schreibt man h = . ❐ dµ Integrationstheorie 138 c Klaus Schindler SS 2016 Der Satz von Girsanov Beispiel B.1 Seien Z1 , . . . , Zn unabhängige, standardnormalverteilte Zufallsvariablen auf dem Maßraum (Ω, A, P) und µ1 , . . . , µn ∈ . Dann wird durch R n P Q(dω) := ξ(ω) · P(dω) mit ξ(ω) := ei=1 µi Zi (ω)− 12 µ2i ein zu P äquivalentes Wahrscheinlichkeitsmaß Q definiert. Für die Verteilung der Z1 , . . . , Zn unter dem neuen Maß Q gilt dann: Q(Z1 ∈ dz1 , . . . , Zn ∈ dzn ) = e n P i=1 n P = ei=1 = µi zi − 21 µ2i µi zi − 12 µ2i 1 n (2π) 2 e − 12 ·P(Z1 ∈ dz1 , . . . , Zn ∈ dzn ) 1 n (2π) 2 · n P e (zi −µi )2 i=1 − 21 n P i=1 zi2 dz1 . . . dzn dz1 . . . dzn , d.h. die Z1 , . . . , Zn sind bzgl. Q unabhängig und normalverteilt mit den Erwartungswerf := Z − µ ten Q (Zi ) = µi und Q [(Zi − µi )2 ] = 1. Damit sind die Zufallsvariablen Z i i i unabhängige, standardnormalverteilte Zufallsvariablen auf dem Maßraum (Ω, A, Q). ❐ E E Beim Übergang von P zu Q durch Multiplikation mit ξ verändern sich also die Erwartungswerte der normalverteilten Zufallsvariablen, während die Volatilitätsstruktur bemerkenswerter Weise unbeeinflusst bleibt. Der Satz von Girsanov verallgemeinert diese Methode nun auf den stetigen Fall, d.h. er konstruiert zu einer vorgegebenen P-Brownschen Bewegung Wt ein äquivalentes Maß Q und einen geeignet angepassten Prozess W∗t , so dass dieser eine Q-Brownsche Bewegung darstellt. Dabei tritt an die Stelle der (beliebig vorgegebenen) Erwartungswerte µi eine („beliebig“ vorgegebene) Drift, also ein stochastischer Prozess Xt . Satz B.2 (Girsanov) Es sei (Ω, A, P) ein Wahrscheinlichkeitsraum, (Wt )t∈T eine Brownsche Bewegung bezüglich P, (It )t∈T eine Filtration in A und (Xt )t∈T ein adaptierter stochastischer Prozess. Ist dann der durch Z ξt := exp( 0 t Xu dWu − 1 2 Z 0 t Xu2 du) für alle t ∈ T 139 Der Satz von Girsanov A NHANG B Anhang B Martingal-Darstellungssatz definierte Prozess (ξt )t∈T ein Martingal bezüglich P und (It )t∈T , so ist der durch W∗t := Wt − Z t 0 Xu du für alle t ∈ [0, T ] definierte Prozess (W∗t )t∈T ein Wiener Prozess bezüglich der Filtration (It )t∈T und dem durch Q := ξT · P definierten1 , zu P äquivalenten Wahrscheinlichkeitsmaß Q. ❑ Der Satz von Girsanov besagt also, dass zu einer P-Brownschen Bewegung Wt ein äquivalentes Wahrscheinlichkeitsmaß Q gefunden werden kann, so dass Wt als Q-Brownsche Bewegung zur Zeit t die Drift Xt besitzt. Bemerkung B.3 Mit den obigen Bezeichnungen ist (ξt )t∈T jedenfalls dann ein Martingal bezüglich P und (It )t∈T , wenn die sogenannte Novikov-Bedingung E P exp( Z t 0 Xu2 du) <∞ für alle t ∈ [0, T ] erfüllt ist, d.h. wenn Xt nicht zu stark schwankt. ❐ B.1. Martingal-Darstellungssatz Ein weiteres wichtiges Hilfsmittel zur Herleitung der Black-Scholes-Formel mittels Martingaltheorie stellt das Martingal-Repräsentations-Theorem dar. Es besagt, dass jedes QMartingal unter gewissen Voraussetzungen mittels eines quadratisch integrierbaren Prozesses durch ein vorgegebenes Q-Martingal repräsentiert wird. Genauer gilt: Satz B.4 Sei (Mt )t∈T ein Martingal bezüglich des Wahrscheinlichkeitsmaßes Q und der Filtration (It )t∈T , für dessen Volatilitätsprozess (σt )t∈T Q-fast sicher σt 6= 0 für alle t ∈ gilt. Ist dann (Nt )t∈T ein weiteres Martingal bezüglich Q und (It )t∈T , so existiert ein (eindeutig R bestimmter) an (It )t∈T adaptierter stochastischer Prozess (Ht )t∈T mit 0T Ht2 σt2 dt < ∞, so dass gilt: T Nt = N0 + 1 Dies bedeutet Der Satz von Girsanov 140 R Ω Z 0 t Hs dMs . A (ω)dQ(ω) = Q(A) := ❑ R Ω A (ω)ξT dP(ω) = EP ( c Klaus Schindler SS 2016 A ξT ) für alle A ∈ A Stochastik Anhang B Beispiel B.5 Wie eine leichte Rechnung zeigt (Übung!), ist der Standard-Wiener-Prozess (Wt )t∈T bezüglich eines Wahrscheinlichkeitsmaßes P ein Martingal bezüglich P und der von ihm erzeugten Filtration (It )t∈T . Ist nun (Xt )t∈T ein weiteres Martingal bezüglich P und (It )t∈T , so gibt es nach obigem Satz einen an (It )t∈T adaptierten stochastischen Prozess (Ht )t∈[0,T ] , so dass Xt = X0 + Z t 0 Hs dWs . ❐ Bemerkung B.6 Schreibt man den letzten Ausdruck in differentieller Form, so erhält man dXt = Ht dWt . c Klaus Schindler SS 2016 141 Der Satz von Girsanov Das Beispiel zeigt also erneut, dass ein Martingal keine Drift aufweisen kann (vgl. Beispiel 4.18 ii)). ❐ Portfolio-Strategien Grundlegende Begriffe T Das Portfolio eines Marktteilnehmers zum Zeitpunkt t ∈ , d.h. die Anzahl der einzelnen Marktwerte (Kontrakte) in seinem Portfolio zum Zeitpunkt t, ist oft, wie z.B. beim dynamischen Duplikationsprozess bei der Herleitung der Black/Scholes-DGL, abhängig von dem Preisverlauf (Ss )s<t bis zu diesem Zeitpunkt t, also von der Information, die zu diesem Zeitpunkt zur Verfügung steht. Deshalb ist es naheliegend, seine Strategie, d.h. den zeitlichen Verlauf seiner Portfolio-Bestandes, ebenfalls als einen an (It )t∈T adaptierten ddimensionalen stochastischen Prozess (φt )t∈T zu modellieren. Dabei gibt φit (ω) an, wieviel von Wertpapier i zum Zeitpunkt t bei Umweltzustand ω im Portfolio vorhanden ist, wobei negative Werte für eine entsprechende Zahl an Leerverkäufen des jeweiligen Kontraktes stehen. Definition C.1 Sei M = (Ω, A, P, , (It )t∈T , (St )t∈T ) ein Marktmodell. Dann heißt ein an die Filtration (It )t∈T adaptierter d-dimensionaler stochastischer Prozess φ = (φt )t∈T eine PortfolioStrategie. d P Der stochastische Prozess (V (φt ))t∈T mit V (φt ) := φt ∗ St = φit Sti heißt der Wert der i=1 Strategie φ = (φt )t∈T . ❐ T Beispiel C.2 Man betrachte das Black-Scholes-Modell, d.h. auf dem Markt werden zwei Finanzinstrumente gehandelt: Ein risikobehafteter Wert S (Aktie) und ein risikoloser Wert B (Zerobond). Wie in Kapitel 5.4 wird dabei der Aktienkurs (St ) als geometrisch Brownsche Bewegung definiert, so dass er der stochastischen Differentialgleichung dSt = St (µdt + σdWt ) (C.1) genügt, wobei S0 > 0, µ und σ reelle Konstanten sowie (Wt ) eine Brownsche Bewegung auf einem filtrierten W-Raum (Ω, A, P, , (It )t∈T ) mit It := σ(Ws , s 6 t) seien. Der Kurs des Zerobonds Bt genüge der Differentialgleichung T dBt = rBt dt 143 Portfolio-Strategien A NHANG C Anhang C Black-Scholes mit konstantem reellen r. Ohne weiteres kann B0 = 1 angenommen werden, so dass sich Bt = ert ergibt. Das zugehörige Marktmodell lautet also T MBS = (Ω, A, P, , (It )t∈T , (St )t∈T ), wobei St := (St , Bt )T . Der zweidimensionale stochastische Prozess (φt )t∈T mit φt = (at , bt ) beschreibe nun eine Portfolio-Strategie, in der at (ω) die Anzahl der Aktien und bt (ω) die Anzahl der Anleihen im Portfolio zum Zeitpunkt t bei Umweltzustand ω angibt. Dann ergibt sich der Wert des Portfolios zum Zeitpunkt t als die Zufallsvariable V (φt ) = at St + bt Bt . ❐ Von besonderer Bedeutung sind Portfolio-Strategien, die - wenn einmal initialisiert - während ihrer Laufzeit keine Cash-Flows aufweisen, d.h. die beim Umschichten des Portfolios keine Zahlungen notwendig machen. Dies bedeutet, dass eventuelle Rückflüsse (durch Verkauf von Wertpapieren, Dividenden o.ä.) sich mit erforderlichen Zuschüssen (durch zusätzlichen Kauf von Wertpapieren, Bestandshaltekosten o.ä.) genau ausgleichen. Man spricht daher von selbstfinanzierenden Strategien. Nach außen hin hat man den Eindruck, als ob die Wertänderung dieser Portfolios nur durch die Kursänderung der beteiligten Wertpapiere verursacht wird. Formal ergibt sich folgende Definition. Definition C.3 Sei M = (Ω, A, P, , (It )t∈T , (St )t∈T ) ein Marktmodell und φ = (φt )t∈T eine PortfolioStrategie mit Wert (V (φt ))t∈T . Dann heißt φ T a) selbstfinanzierend, wenn P-fast sicher dV (φt ) = φt ∗ dSt = d X φit dSti gilt, i=1 b) zulässig, wenn P-fast sicher V (φt ) > 0 gilt. ❐ Anwendung auf das Black-Scholes-Modell Im folgenden werde das Black-Scholes-Modell MBS aus Beispiel C.2 betrachtet. Die sich anschließenden Ausführungen zeigen, dass auf einem solchen Markt keine Arbitrage möglich ist, genauer: Es gibt keine zulässige selbstfinanzierende Strategie mit Anfangswert V (φ0 ) = 0, deren Endwert V (φT ) mit positiver Wahrscheinlichkeit positiv ist. Portfolio-Strategien 144 c Klaus Schindler SS 2016 Portfolio-Strategien Anhang C Lemma C.4 Im Black-Scholes-Modell MBS = (Ω, A, P, , (It )t∈T , (St , Bt )t∈T ) ist die Portfoliostrategie (at , bt ) genau dann selbstfinanzierend, wenn der diskontierte Prozess1 (Ṽt )t∈T mit Ṽt = e−rt Vt der stochastischen DGL T dṼt = at dS̃t genügt, wobei S̃t = e−rt St den diskontierten Aktienkurs beschreibe. ❑ Beweis: Einfache Rechnung (Übungsaufgabe). Mit Hilfe des Satzes von Girsanov wird nun ein zu P äquivalentes Maß Q konstruiert, unter welchem der Prozess des diskontierten Aktienkurses ein Martingal ist. Unter Beachtung von (C.1) ergibt sich dS̃t = S̃t [(µ − r)dt + σdWt ]. (C.2) Setzt man nun ∀t ∈ T:X t := − µ−r , σ so ist die Novikov-Bedingung (vgl. Bemerkung B.3) sicherlich erfüllt. Daher ist für Q mit dQ = ξT := exp dP = exp Z 0 T Xu dWu − µ−r WT − σ − 1 2 Z 0 T Xu2 du ! 1 µ − r 2 T 2 σ µ−r nach dem Satz von Girsanov (W∗t )t∈T mit W∗t := Wt + t eine Q-Brownsche Bewegung. σ ∗ Wegen (C.2) gilt damit nach der Definition von Wt dS̃t = S̃t σdW∗t . (C.3) Nach dem Lemma von Itô (vgl. Beispiel 5.12) löst S̃t = S̃0 exp Z t 0 σdW∗u − 1 2 Z t 0 2 σ du die stochastische DGL. Da σ konstant ist, gilt für alle t ∈ E exp Z 0 t σ 2 du < ∞. Z Nach Bemerkung B.3 ist damit exp t σdW∗u − 0 1 2 Z t σ 2 du , also auch S̃t ein Q-Martingal. 0 Wenn wie hier aus dem Kontext ersichtlich, verzichtet man auf die explizite Angabe der zugehörigen Strategie und schreibt kurz Vt statt V (a, b)t . c Klaus Schindler SS 2016 145 Portfolio-Strategien 1 T die Novikov-Bedingung Anhang C Black-Scholes Q stellt also bezüglich (Set )t∈T ein zu P äquivalentes Martingalmaß dar.2 Aus der Definition von (W∗t )t∈T ergibt sich mit Hilfe von (C.1) dSt = St (rdt + σdW∗t ), d.h. unter dem Maß Q entspricht der erwartete Ertrag des risikobehafteten Wertpapiers gerade dem sicheren Ertrag der risikolosen Anleihe. Deshalb nennt man das Martingalmaß Q auch das risikoneutrale Wahrscheinlichkeitsmaß und im Gegensatz dazu P das objektive oder physische Wahrscheinlichkeitsmaß des Black-Scholes-Marktes. Nun ist aufgrund der Q-Martingaleigenschaft von Set wegen Lemma C.4 in Verbindung mit Satz 4.25 f) der diskontierte Wert einer selbstfinanzierenden Strategie Vet aber selbst ein lokales Q-Martingal. Deshalb ist der Wert jeder zulässigen selbstfinanzierenden Strategie als nichtnegativen lokales Q-Martingal ein Q-Supermartingal. Folglich gilt: Ist der Anfangswert einer zulässigen selbstfinanzierenden Strategie gleich Null, so muss ihr Wert auch zu jedem späteren Zeitpunkt t gleich Null sein. Mittels einer zulässigen selbstfinanzierenden Strategie ist also kein risikoloser Gewinn zu realisieren: Der Black-Scholes-Markt ist arbitragefrei. Der folgende Satz stellt das wichtigste Hilfsmittel zur Bewertung europäischer Optionen mit Hilfe des Black-Scholes-Modelles dar. Er sichert die Existenz einer die Option duplizierenden, zulässigen selbstfinanzierenden Strategie, deren Wert daher mittels Martingaltheorie berechnet wird. Satz C.5 Gegeben sei das Black-Scholes Modell MBS mit := [0, T ]. Die Funktion X beschreibe den Wert einer europäischen Option zum Verfallszeitpunkt T und sei Q-integrierbar. T a) Dann existiert eine zulässige selbstfinanzierende Strategie (at , bt )t∈T , welche X dupliziert und deren Wert (Vt )t∈T für alle t ∈ gegeben ist durch T Vt = E −r(T −t) Q [e X | It ]. (C.4) b) Schreibt sich in a) der Wert Vt in Abhängigkeit von t und St als eine Funktion Vt = F (t, St ) mit F ∈ C 1,2 ( × [0, ∞[), so gilt für die zugehörige Strategie T at = ∂F (t, St ) . ∂St ❑ Beweis: a) Man definiere (Vt )t∈T durch (C.4). Die Wohldefiniertheit folgt aus der Q-Integrierbarkeit von X. Wegen 2 Vet = e−rt Vt = E −rT Q [e X | It ] Es lässt sich zeigen, dass es als solches eindeutig bestimmt ist. Portfolio-Strategien 146 c Klaus Schindler SS 2016 Portfolio-Strategien Anhang C erkennt man Vet im Vergleich mit Beispiel 4.18 iii) als Q-Martingal. Man beachte hierzu, dass e−rT X genauso wie X nur von Umweltzuständen zum Zeitpunkt T abhängig ist und somit als Zufallsvariable auf (Ω, IT , Q) aufgefasst werden kann. (It )t∈T stellt gleichzeitig die natürliche Filtration für den Wiener Prozess (W∗ )t∈T dar, welcher, wie oben gesehen, ebenfalls ein Q-Martingal ist. Somit existiert nach Satz B.4 über die Martingal-Repräsentation ein an (It )t∈T adaptierter Prozess (Ht )t∈T mit RT 2 2 gilt: 0 Ht σ dt < ∞ Q-fast sicher, so dass für alle t ∈ T Vet = Ve0 + Z 0 t Hs dW∗s = V0 + Nun setze man für alle t ∈ at := Ht σ · Set , T Z 0 t Hs dW∗s . bt := Vet − at Set . Dann gilt nach einfacher Rechnung für alle t ∈ T at St + bt Bt = Vt und (at , bt )t∈T ist eine X duplizierende Strategie. Weiter gilt mit (C.3) für alle t ∈ T at dSet = at Set σdW∗t = Ht dW∗t = dVet , d.h. (at , bt )t∈T ist nach Lemma C.4 selbstfinanzierend. Aufgrund der Nichtnegativität von X und der Definition von Vt ist (at , bt )t∈T überdies zulässig. b) Für Vt = F (t, St ) mit F ∈ C 1,2 ( T × [0, ∞[) gilt nach dem Lemma von Itô: dVet = d(e−rt F (t, St )) ∂(e−rt F (t, St )) = dSt + A(t, St )dt ∂St ∂F (t, St ) −rt e St (rdt + σdW∗t ) + A(t, St )dt = ∂St ∂F (t, St ) e e S )dt = St σdW∗t + A(t, t ∂St ∂F (t, St ) e e S )dt. dSt + A(t, = t ∂St c Klaus Schindler SS 2016 147 Portfolio-Strategien e S ) verDa jedoch sowohl Vet als auch Set Q-Martingale sind, muss der Driftterm A(t, t schwinden. Nach Teil (a) des Satzes ist die zugehörige Strategie selbstfinanzierend und somit folgt nun mit Lemma C.4 die Behauptung. Anhang C Black-Scholes Bemerkung C.6 Mit den Bezeichnungen des vorangegangenen Satzes heißt Vt der faire Preis für die Option X zum Zeitpunkt t, denn bei diesem Preis ist nach den vorausgegangenen Überlegungen weder für den Käufer noch den Verkäufer der Option Arbitrage möglich. Gleichung (C.4) heißt risikoneutrale Bewertungsformel, da sich der faire Preis der Option als (bedingte) Erwartung des (abgezinsten) Optionswertes zum Ende der Laufzeit bezüglich des risikoneutralen Maßes des Black-Scholes-Modelles errechnet. ❐ Auf die folgende aus dem letzten Satz resultierende Aussage wurde schon in Kapitel 7 als Satz 7.1 formuliert. Folgerung C.7 Es gelten die Bezeichnungen des vorangegangenen Satzes. Ist der Wert X der europäischen Option zum Zeitpunkt T eine Funktion X = f (ST ) in Abhängigkeit vom Aktienkurs ST , so gilt Vt = F (t, St ), wobei F für x ∈ [0, ∞[ und t ∈ = [0, T ] definiert ist durch −r(T −t) F (t, x) = e Z +∞ −∞ T −y √ 2 (r− σ2 )(T −t)+σy T −t e 2 2 f xe √ dy 2π . (C.5) ❐ Beweis: Bezüglich Q besitzt (St ) Drift r und somit gilt St = S0 e(r− σ2 )t+σW∗t 2 . Damit schreibt sich ST in der Form ST = St (ST St−1 ) = St e(r− σ2 )(T −t)+σ(W ∗T −W∗t ) 2 . Da St bezüglich It messbar und W∗T − W∗t von It unabhängig ist, erhält man Vt = = = E E E −r(T −t) Q [e Q Q f (ST ) | It ] e−r(T −t) f (St e(r− e−r(T −t) f (x e(r− σ2 )(T −t)+σ(W ∗T −W∗t ) 2 σ2 )(T −t)+σ(W ∗T −W∗t ) 2 ) | It ) x=St Hieraus errechnet sich schließlich Vt = F (t, St ). Beispiel C.8 Man betrachte nun einen europäischen Call X = max{0, ST − K}. Mittels (C.5) berechnet sich dessen Wert zum Zeitpunkt t zu der aus Kapitel 7 bekannten Black-Scholes-Formel. C(t, St ) := Vt = ST N (d1 ) − K e−r(T −t) N (d2 ) mit 2 ln( SKT ) + (r + σ2 )(T − t) √ d1 := , σ T −t Portfolio-Strategien 148 2 ln( SKT ) + (r − σ2 )(T − t) √ d2 := . σ T −t c Klaus Schindler SS 2016 ❐ Der Satz von Taylor Differenzierbare Funktionen können vollständig „rekonstruiert“ werden, wenn die Ableitungen dieser Funktion an einer Stelle des Definitionsbereiches bekannt sind. Dies ist in vereinfachter Form die Aussage des Satzes von Taylor, der oft dazu verwendet wird, eine gegebene Funktion mittels Polynomen zu approximieren. Die beiden folgenden Sätze beschreiben dieses Ergebnis für Funktionen in einer und in zwei Variablen ohne näher auf die mathematischen Voraussetzungen einzugehen. Außerdem wird auf die ebenfalls mögliche Fehlerabschätzung verzichtet. Satz D.1 (Satz von Taylor in einer Veränderlichen) Für eine Funktion f (x) in einer Veränderlichen gilt f (x) = f (x0 ) + f ′′ (x0 ) f ′ (x0 ) (x − x0 ) + (x − x0 )2 1! 2! + f ′′′ (x0 ) (x − x0 )3 3! +··· oder in Kurzform (mit ∆f := f (x) − f (x0 ) und ∆x := x − x0 ): ∆f = f ′′ (x0 ) f ′ (x0 ) ∆x + (∆x)2 1! 2! + f ′′′ (x0 ) (∆x)3 3! +··· ❑ Satz D.2 (Satz von Taylor in zwei Veränderlichen) Für eine Funktion f (x, y) in zwei Veränderlichen gilt f (x, y) = f (x0 , y0 ) + = f (x0 , y0 ) + 1 + 2 f ′ (x0 , y0 ) x − x0 f ′′ (x0 , y0 ) x − x0 + (x − x0 , y − y0 ) +··· y − y0 y − y0 1! 2! ∂f (x0 , y0 ) ∂f (x0 , y0 ) (x − x0 ) + (y − y0 ) ∂x ∂y ∂ 2 f (x0 , y0 ) (x − x0 )2 ∂x2 ∂ 2 f (x0 , y0 ) ∂ 2 f (x0 , y0 ) +2 (y − y0 )2 (x − x0 )(y − y0 ) + ∂x∂y ∂y 2 +··· oder in Kurzform (mit ∆f := f (x, y) − f (x0 , y0 ), ∆x := x − x0 und ∆y := y − y0 ): ∆f = ∂f ∂f ∆x + ∆y ∂x ∂y + 1 2 ∂2f (∆x)2 ∂x2 +2 ∂2f ∆x∆y ∂x∂y + ∂2f (∆y)2 ∂y 2 +··· ❑ 149 Anhang A NHANG D