Vorlesungsnotizen Einführung in die stochastische Finanzmathematik Hanspeter Schmidli Mathematisches Institut der Universität zu Köln INHALTSVERZEICHNIS iii Inhaltsverzeichnis 1. Einführung ins State-Pricing 1 1.1. Arbitrage und State-Prices . . . . . . . . . . . . . . . . . . . . . . . . 1 1.2. Risikoneutrale Wahrscheinlichkeiten . . . . . . . . . . . . . . . . . . . 2 1.3. Optimaler Nutzen und Preise von Aktiven . . . . . . . . . . . . . . . 3 1.4. Äquilibrium, Pareto-Optimalität, vollständige Märkte . . . . . . . . . 6 1.5. Pareto-Optimalität und der repräsentative Händler . . . . . . . . . . 7 2. Modelle in diskreter Zeit 10 2.1. Der Markt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 2.2. Martingale und Arbitrage . . . . . . . . . . . . . . . . . . . . . . . . 12 2.3. Vollständige Märkte und Optionspreise . . . . . . . . . . . . . . . . . 13 3. Optimales Stoppen und Amerikanische Optionen 17 4. Stochastische Analysis 21 4.1. Das stochastische Integral . . . . . . . . . . . . . . . . . . . . . . . . 21 4.2. Die Itô-Formel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 4.3. Stochastische Differentialgleichungen . . . . . . . . . . . . . . . . . . 36 4.4. Der Ornstein–Uhlenbeck-Prozess . . . . . . . . . . . . . . . . . . . . . 38 4.5. Mehrdimensionale Differentialgleichungen . . . . . . . . . . . . . . . . 39 5. Das Black–Scholes-Modell 41 6. Preise und partielle Differentialgleichungen 51 7. Zinsratenmodelle 55 7.1. Obligationen und Obligationsoptionen . . . . . . . . . . . . . . . . . 55 7.2. Klassische Zinsratenmodelle . . . . . . . . . . . . . . . . . . . . . . . 60 7.2.1. Das Vasicek-Modell . . . . . . . . . . . . . . . . . . . . . . . 60 7.2.2. Das Cox–Ingersoll–Ross-Modell . . . . . . . . . . . . . . . . . 62 7.2.3. Das Heath–Jarrow–Morton-Modell . . . . . . . . . . . . . . . 66 7.3. Obligationen mit Kreditrisiko . . . . . . . . . . . . . . . . . . . . . . 70 7.4. Zinsswaps . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72 iv INHALTSVERZEICHNIS 8. Forwards and Futures 74 8.1. Forwards . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 8.2. Futures . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75 9. Portfolio Theorie 78 9.1. Markowitz-Diversifikation . . . . . . . . . . . . . . . . . . . . . . . . 78 9.2. Markowitz-Effizienz . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 9.3. Portfolio-Selektion . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 9.3.1. Optimaler Nutzen . . . . . . . . . . . . . . . . . . . . . . . . 81 9.3.2. Das Benchmark-Portfolio . . . . . . . . . . . . . . . . . . . . 81 9.3.3. Kontrolle der Shortfallwahrscheinlichkeit . . . . . . . . . . . . 82 9.4. Indexmodelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 9.5. Kapitalmarktgleichgewicht: Capital-Asset-Pricing-Model . . . . . . . 84 9.5.1. Das Marktindexmodell . . . . . . . . . . . . . . . . . . . . . . 84 9.5.2. Portfoliotheorie mit einer sicheren Anlage . . . . . . . . . . . 85 9.5.3. Capital-Asset-Prising-Model (CAPM) . . . . . . . . . . . . . 86 9.6. State-Price-beta-Modelle . . . . . . . . . . . . . . . . . . . . . . . . . 87 10.Risikomasse 89 10.1. Einführung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 10.2. Akzeptanzmengen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93 10.3. Darstellung von konvexen Risikomassen . . . . . . . . . . . . . . . . . 96 11.Weitere Aspekte 101 11.1. Aktien mit Dividendenzahlungen . . . . . . . . . . . . . . . . . . . . 101 11.2. Devisenoptionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101 11.3. Kombination von Optionspositionen . . . . . . . . . . . . . . . . . . . 102 11.3.1. Straddles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102 11.3.2. Strangles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102 11.3.3. Spreads . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103 11.3.4. Butterflies . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103 11.4. Spezielle Optionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103 INHALTSVERZEICHNIS v 11.4.1. Asiatische Optionen . . . . . . . . . . . . . . . . . . . . . . . 104 11.4.2. Optionen auf Futures . . . . . . . . . . . . . . . . . . . . . . 104 11.4.3. Optionen auf Optionen . . . . . . . . . . . . . . . . . . . . . . 105 11.4.4. Barrieren-Optionen . . . . . . . . . . . . . . . . . . . . . . . . 105 11.4.5. Digitale Optionen . . . . . . . . . . . . . . . . . . . . . . . . 106 11.5. Portfolio Insurance . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106 A. Stochastische Prozesse und Stoppzeiten 109 A.1. Stochastische Prozesse . . . . . . . . . . . . . . . . . . . . . . . . . . 109 A.2. Stoppzeiten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110 A.3. Prozesse von beschränkter Variation . . . . . . . . . . . . . . . . . . . 112 A.4. Quadratische Variation . . . . . . . . . . . . . . . . . . . . . . . . . . 114 B. Die Brownsche Bewegung 116 C. Martingale 118 D. Änderung des Masses 125 E. Trennung von konvexen Mengen 126 F. Gronwalls Lemma 126 Literatur 128 Index 129 vi INHALTSVERZEICHNIS 1. EINFÜHRUNG INS STATE-PRICING 1. 1 Einführung ins State-Pricing In diesem Kapitel betrachten wir eine Periode. Das heisst, wir können nur zu den Zeitpunkten 0 und 1 handeln. Im weiteren arbeiten wir mit einem Raum, wo die Welt nur eine endliche Anzahl möglicher Zustände hat. Das heisst, zum Zeitpunkt 1 gibt es nur eine endliche Anzahl möglicher Preise. 1.1. Arbitrage und State-Prices Es gibt S ∈ IIN verschiedene Zustände der Welt, {1, 2, . . . , S}. Ein Agent kann in N ∈ IIN Aktive investieren. Die Preise zur Zeit Null sind im Vektor q = (qi ) zusammengefasst, wobei qi den Preis des Aktivs i bezeichnet. Die N × S Matrix D bezeichnet die Preise zur Zeit 1. Das ist, Dij ist der Preis des Aktivs i, falls j der richtige Zustand der Welt ist. Der Zeilenvektor θ bezeichnet ein Portfolio. Der Agent kauft θi Einheiten des i-ten Aktivs. Ein negatives θi bedeutet, dass der Agent den Aktiv verkauft, ihn aber erst zum Zeitpunkt 1 ausliefert (Forward). Der Kaufpreis des Portfolios ist dann θq. Die möglichen Werte des Portfolios zum Zeitpunkt 1 sind θD, wobei die j-te Koordinate den Wert bezeichnet, falls j der richtige Zustand der Welt ist. Definition 1.1. Ein Portfolio θ heisst Arbitrage, falls θq ≤ 0 und θD > 0 (mindestens eine Koordinate ist streng positiv) oder θq < 0 und θD ≥ 0. Falls es Arbitrage gibt, ist es möglich, Geld zu generieren. Da in so einem Fall alle Agenten das Arbitrageportfolio kaufen wollen, würde sich der Preis sofort ändern. Eine Arbitrage kann in einem funktionierenden Markt nur kurzzeitig existieren. Wir können daher annehmen, dass es keine Arbitrage gibt. Satz 1.2. Es gibt genau dann keine Arbitrage, wenn ein Vektor ψ ∈ IRS mit streng positiven Koordinaten existiert, so dass q = Dψ. Definition 1.3. Ein Vektor ψ, der die Bedinungen aus Satz 1.2 erfüllt, heisst State-Price-Vektor. Beweis. gilt Nehmen wir an, es gebe einen State-Price-Vektor ψ. Ist nun θq ≤ 0, so θDψ = θq ≤ 0 . 2 1. EINFÜHRUNG INS STATE-PRICING Da ψ nur streng positive Koordinaten hat, impliziert θD ≥ 0, dass θD = 0. Ist θq < 0, folgt θDψ < 0. Also gibt es eine streng negative Koordinate von θD. Definieren wir nun M = {(−θq, θD) : θ ∈ IRN } and K = IR+ × IRS+ . Keine Arbitrage ist äquivalent mit K ∩ M = {0}. Die Mengen M und K \ M sind beide konvex. Daher gibt es eine lineare Funktion F : IRS+1 → IR (Lemma E.1), so dass F (z) < F (x) für alle z ∈ M und alle x ∈ K \ M . Da M ein linearer Unterraum ist, muss F auf M verschwinden. Also gibt es α ∈ IR und ψ ∈ IRS , so dass F (v, c) = αv + cψ. Da F (v, c) > 0 für alle (v, c) ∈ K \ M gilt, ist α > 0 und ψj > 0 für alle j. Für θ ∈ IRN erhalten wir −αθq + (θD)ψ = F (−θq, θD) = 0 . Somit folgt, dass ψ/α ein State-Price-Vektor ist, da θ beliebig ist. Nehmen wir an, wir wollen den Preis eines neuen Aktivs (z.B. einer Option) bestimmen. Die Werte zum Zeitpunkt 1 sind durch einen Vektor d gegeben. Soll keine Arbitragemöglichkeit geschaffen werden, muss also ein State-Price-Vektor existieren. So ein State-Price-Vektor muss auch State-Price-Vektor im Markt ohne den neuen Aktiv sein. Also sind alle möglichen Preise zur Zeit 0 durch die Formel dψ gegeben, wobei ψ ein State-Price-Vektor des Marktes ohne den neuen Aktiv ist. Ist d nicht linear abhänging von den Zeilen von D, wird die Menge der möglichen State-PriceVektoren verkleinert. 1.2. Risikoneutrale Wahrscheinlichkeiten Wir versehen nun den Markt mit einem Wahrscheinlichkeitsmass IIP. Sei pj die Wahrscheinlichkeit, dass der Zustand j der richtige Zustand ist. Da alle Zustände möglich P sein sollen, muss pj > 0 gelten. Sei ψ ein State-Preis-Vektor, und ψ0 = Sj=1 ψj . Definieren wir das Wahrscheinlichkeitsmass IIP∗ , das den Zuständen die Wahrscheinlichkeiten ψ̂j = ψj /ψ0 zuordnet. Dann sind die Masse IIP und IIP∗ äquivalent. Es gilt S X qi = Dij ψ̂j = IIE∗ [Di ] , ψ0 j=1 wobei die Zufallsvariable Di den Wert des i-ten Aktivs bezeichnet. Nehmen wir nun an, es sei möglich ein Portfolio θ zu konstruieren, so dass θ D = (1, 1, . . . , 1). Ein solches Portfolio würde unabhänging vom Zustand der Welt 1. EINFÜHRUNG INS STATE-PRICING 3 zum Zeitpunkt 1 den Wert 1 haben. Der Wert zum Zeitpunkt 0 ist dann θ q = θ Dψ = ψ0 . Der Preis einer risikolosen Einheit ist damit ψ0 , das heisst ψ0 ist ein risikoloser Diskontierungsfaktor. Somit ist qi = ψ0 IIE∗ [Di ] der diskontierte erwartete Wert des i-ten Aktivs. Aus diesem Grunde nennt man das Mass IIP∗ risikoneutrales Wahrscheinlichkeitsmass. Wird ein neuer Aktiv mit Auszahlung d zum Markt dazugefügt, so kann der Preis des Aktivs durch ψ0 IIE∗ [d] ausgedrückt werden, wobei d den Preis des neuen Aktivs bezeichnet. 1.3. Optimaler Nutzen und Preise von Aktiven Wir nehmen nun an, dass es ein Portfolio θ̂ mit der Eigenschaft θ̂D > 0 gibt. Das heisst, es gibt eine Möglichkeit so zu investieren, dass man im Zeitpunkt 1 keine Schulden hat, und in mindestens einem Zustand der Welt nicht alles Kapital verloren hat. Ein Agent ist definiert durch eine streng wachsende Nutzenfunktion U : IRS+ → IR und ein Einkommen e ∈ IRS+ . Der Agent handelt mit den N Aktiven, was wir durch ein Portfolio θ darstellen. Da der Agent nicht mehr Geld ausgeben kann, als er hat, muss die Bedingung θq ≤ 0 erfüllt sein. Den Betrag −θq konsumiert der Agent zur Zeit 0. Das Kapital im Zeitpunkt 1 ist daher in der Menge X (q, e) = {e + θD ∈ IRS+ : θ ∈ IRN , θq ≤ 0} . Insbesondere muss der Agent so investieren, dass er im Zeitpunkt 1 keine Schulden hat. Der Agent will nun seinen erwarteten Nutzen optimieren. Er versucht somit ein Portfolio θ ∗ zu finden, so dass U (e + θ ∗ D) = sup U (c) . (1.1) c∈X (q,e) Ein solches Portfolio muss θ ∗ q = 0 erfüllen. Ansonsten gibt es ein λ > 0, so dass (θ ∗ + λθ̂)q ≤ 0. Da (θ ∗ + λθ̂)D > θ ∗ D und U wachsend ist, kann θ ∗ nicht optimal sein. Die Existenz eines optimalen Portfolios hängt mit der “keine Arbitrage” Eigenschaft zusammen. 4 1. EINFÜHRUNG INS STATE-PRICING Proposition 1.4. Wenn die Gleichung (1.1) eine Lösung hat, kann keine Arbitrage existieren. Falls U stetig ist und keine Arbitrage existiert, dann hat (1.1) eine Lösung. Beweis. Nehmen wir an, dass θ ∗ existiert. Sei θ̃ eine Arbitrage. Dann ist λθ̃q ≤ 0 für alle λ > 0. Die Funktion λ 7→ U (e + (θ ∗ + λθ̃)D) ist wachsend in λ, da U streng wachsend ist und θ̃D ≥ 0 gilt. Somit muss θ̃D = 0 gelten, da sonst θ ∗ nicht existieren könnte. Somit gilt θ̃q < 0. Es gibt daher ein λ > 0, so dass (θ̃ + λθ̂)q ≤ 0. Wir schliessen, dass (θ ∗ + θ̃ + λθ̂)D > θ ∗ D . Da U streng wachsend ist, ist dies ein Widerspruch. Somit kann keine Arbitrage existieren. Nehmen wir nun an, dass U stetig ist, und dass es keine Arbitrage gibt. Es ist klar, dass X (q, e) abgeschlossen ist. Sei Y = {θ ∈ IRN : e + θD ∈ IRS+ , θq ≤ 0} . Die Menge Y ist abgeschlossen und konvex. Da 0 ∈ Y ist λθ ∈ Y falls θ ∈ Y und λ ∈ [0, 1]. Sei nun {θ n } eine Folge in Y, so dass kθ n k → ∞. Dann gibt es eine Teilfolge von {θ n /kθ n k} die konvergiert, sagen wir gegen θ 0 . Die Folge λθ n /kθ n k konvergiert dann gegen λθ 0 . Daher ist λθ 0 ∈ Y für alle λ > 0. Dies ist nur möglich, falls θ 0 q ≤ 0 und θ 0 D ≥ 0. Da es keine Arbitrage gibt, gilt θ 0 D = 0. Wir schliessen, dass X beschränkt ist. Somit ist X (q, e) kompakt. Also ist U ∗ = sup{U (c) : c ∈ X (q, e)} endlich. Da U stetig ist, existiert c∗ , so dass U (c∗ ) = U ∗ . Die Menge {θ : θq ≤ 0} ist abgeschlossen. Der Beweis oben zeigt, dass es ein Portfolio θ̄ gibt, so dass c∗ = e + θ̄D. Dies ist die Lösung der Gleichung (1.1). Satz 1.5. Nehmen wir an, es gebe eine Lösung zu (1.1), so dass c∗ = e + θ ∗ D > 0 streng positive Koordinaten hat. Sei ∂U (c∗ ) die Ableitung von U in c∗ , und nehmen wir an, dass sie existiert und dass die partiellen Ableitungen verschieden von Null sind. Dann gibt es eine Zahl λ > 0, so dass λ∂U (c∗ )> ein State-Price-Vektor ist. Beweis. Da U wachsend ist, gilt ∂U (c∗ ) ≥ 0. Sei θ ein Portfolio mit Preis θq = 0. Wir definieren die Funktion gθ (α) = U (c∗ + αθD) . 1. EINFÜHRUNG INS STATE-PRICING 5 Die Funktion hat ein Maximum in α = 0. Daher gilt θD∂U (c∗ )> = 0. Da dies für jeden Vektor θ orthogonal zu q gilt, gibt es ein µ ∈ IR\{0}, so dass D∂U (c∗ )> = µq. Da es, siehe Proposition 1.4, keine Arbitrage gibt, impliziert θ̂D > 0, dass θ̂q > 0. Aus µθ̂q = θ̂D∂U (c∗ )> > 0 folgt, dass µ > 0. Für λ = 1/µ erhält man q = λD∂U (c∗ )> . Da die partiellen Ableitungen strikt positiv sind, ist λ∂U (c∗ )> ein State-PriceVektor. Korollar 1.6. Sei U konkav und differenzierbar. Dann ist ein c∗ ∈ X (q, e) mit der Eigenschaft c∗ = e + θ ∗ D > 0 mit streng positiven Koordinaten und mit θ ∗ q = 0 genau dann optimal, wenn es ein λ > 0 gibt, so dass λ∂U (c∗ )> ein State-PriceVektor ist. Beweis. Ist c∗ optimal, dann folgt die Aussage aus Satz 1.5. Für die entgegengesetzte Richtung nehmen wir an, es gebe ein θ, so dass U (c∗ + θD) ≥ U (c∗ ) und c∗ + θD ∈ X (q, e). Dann ist θq ≤ 0. Da U konkav ist, gilt d ∗ 0≤ = θD∂U (c∗ )> = λ−1 θq ≤ 0 . U (c + µθD) dµ µ=0 Das heisst, U (c∗ +µθD) hat ein Maximum in µ = 0. Daher gilt U (c∗ +θD) = U (c∗ ). Ein Spezialfall ist der erwartete Nutzen. Sei pj die Wahrscheinlichkeit, dass j der richtige Zustand der Welt ist. Sei u : IR+ → IR eine streng wachsende Funktion. Der erwartete Nutzen ist definiert als U (c) = S X pj u(cj ) = IIE[u(c)] . j=1 Ist u differenzierbar, dann ist ∂U (c) = (pj u0 (cj ))j . Gibt es eine optimale Lösung c∗ der Gleichung (1.1), dann existiert ein λ > 0, so dass qi = λ X j Dij pj u0 (c∗j ) . 6 Schreiben wir ψ0 = 1. EINFÜHRUNG INS STATE-PRICING P j pj u0 (c∗j ) = IIE[u0 (c∗ )] und ψ̂j = pj u0 (c∗j )/ψ0 , erhalten wir qi = λψ0 IIE∗ [Di ] = λψ0 S X ψ̂j Dij . j=1 Wir können dies als diskontierten erwarteten Profit unter dem Mass IIP∗ interpretieren. 1.4. Äquilibrium, Pareto-Optimalität, vollständige Märkte Nehmen wir and, es gebe m Händler, die alle durch eine Nutzenfunktion U i und Einkommen ei definiert sind. Definition 1.7. Ein Äquilibrium für die Ökonomie {(U i , ei ), D} sind Variablen (θ 1 , . . . , θ m , q) , so dass für jeden Händler i ei + θ i D ≥ 0 gilt, und θ i die Funktion U i (ei + θD) P unter der Nebenbedingung θq ≤ 0 maximiert, so dass i θ i = 0. Ein Markt heisst vollständig, falls {θD : θ ∈ IRN } = IRS . Ein Markt heisst unvollständig, falls er nicht vollständig ist. P Sei e = i ei das Gesamteinkommen. Definition 1.8. Eine Konsumverteilung (c1 , . . . , cm ) ∈ (IRS+ )m heisst zulässig, falls c1 + · · · + cm ≤ e. Eine zulässige Konsumverteilung heisst Pareto-optimal, falls für jede zulässige Konsumverteilung (ĉ1 , . . . , ĉm ) mit U i (ĉi ) ≥ U i (ci ) für alle i gilt, dass U i (ĉi ) = U i (ci ) für alle i. Es gibt einen Zusammenhang zwischen vollständigen Märkten und Pareto-Optimalität. Proposition 1.9. Sei der Markt vollständig, und (θ 1 , . . . , θ m , q) ein Äquilibrium. Dann ist die Konsumverteilung (e1 + θ 1 D, . . . , em + θ m D) Pareto-optimal. P Beweis. Da j θ j D = 0, ist die Konsumverteilung zulässig. Proposition 1.4 impliziert, dass es keine Arbitrage gibt. Nehmen wir an, es gebe eine zulässige Konsumverteilung (ĉ1 , . . . , ĉm ), so dass U i (ĉi ) ≥ U i (ei +θ i D), und dass die Ungleichung für mindestens ein i streng ist. Da der Markt vollständig ist, gibt es einen Vektor P i i i (θ̂ ), so dass ĉi = ei + θ̂ D. Da die Konsumverteilung zulässig ist, gilt i θ̂ D ≤ 0. P i Aus der Optimalität folgt, dass θ i q = 0 und i θ̂ q > 0, da sonst ein j existieren P i würde, für das θ j nicht optimal wäre. Aber dann ist − i θ̂ eine Arbitrage. Daher muss die Äquilibrium-Konsumverteilung Pareto-optimal sein. 1. EINFÜHRUNG INS STATE-PRICING 7 Proposition 1.10. Nehmen wir an, dass ein State-Price-Vektor ψ existiert. Der State-Price-Vektor ist genau dann eindeutig, wenn der Markt vollständig ist. Beweis. Nehmen wir an, dass der Markt vollständig ist, und dass φ ein StatePrice-Vektor ist. Dann gibt es ein θ, so dass θD = (φ − ψ)> . Also gilt (φ − ψ)> (φ − ψ) = θD(φ − ψ) = θ(q − q) = 0 . Daher ist φ = ψ. Nehmen wir an, dass der Markt unvollständig ist. Dann hat nicht jede Gleichung θD = c eine Lösung θ. Das bedeutet, dass es eine nichttriviale Lösung φ ∈ IRS der Gleichung Dφ = 0 gibt. Aber dann gibt es ein λ > 0, so dass ψ − λφ echt positive Koordinaten hat. ψ − λφ ist dann ein State-Price-Vektor. 1.5. Pareto-Optimalität und der repräsentative Händler Für λ ∈ IRm + definieren wir die Nutzenfunktion Uλ (x) = sup c1 +···+cm ≤x ci ∈IRS + m X λi U i (ci ) . (1.2) i=1 Hilfssatz 1.11. Sei U i konkav für alle i. Eine Konsumverteilung (c1 , . . . , cm ), die zulässig ist, ist genau dann Pareto-optimal, wenn es ein λ ∈ IRm + mit streng 1 m positiven Koordinaten gibt, so dass (c , . . . , c ) die Gleichung (1.2) an der Stelle x = e = c1 + · · · + cm löst. Beweis. Sei (c1 , . . . , cm ) Pareto-optimal. Definieren wir die Mengen U = {y ∈ IRm : yi ≤ U i (z i ) − U i (ci ), für ein z zulässig} 0 und J = IRm + \ {0}. Dann gilt U ∩ J = ∅. Seien y und y zwei Vektoren in U und α ∈ (0, 1). Dann gilt i i i αy i + (1 − α)y 0 ≤ αU i (z i ) + (1 − α)U i (z 0 ) − U i (ci ) ≤ U i (αz i + (1 − α)z 0 ) − U i (ci ) ; das heisst, U ist konvex. Auch J ist konvex. Somit gibt es einen Vektor λ ∈ IRm , der eine lineare Funktion z 7→ λz definiert, so dass λy < λz für jedes beliebige Paar y ∈ U und z ∈ J (Lemma E.1). Da 0 ∈ U gilt λz > 0 für z ∈ J und λ hat strikt positive Koordinaten. Da 0 ein Randpunkt von J ist, folgt λy ≤ 0 für alle y ∈ U. Daher löst (c1 , . . . , cm ) die Gleichung (1.2). Sei nun (c1 , . . . , cm ) eine Lösung von (1.2). Sei (ĉ1 , . . . , ĉm ) zulässig, so dass U i (ci ) ≤ U i (ĉi ). Als Lösung von (1.2) muss U i (ci ) = U i (ĉi ) für alle i gelten. Daher ist (c1 , . . . , cm ) Pareto-optimal. 8 1. EINFÜHRUNG INS STATE-PRICING Proposition 1.12. Seien für alle i die Nutzenfunktionen U i konkav und streng wachsend. Nehmen wir an, dass der Markt vollständig ist, und dass (θ 1 , . . . θ m , q) ein Äquilibrium sei. Dann gibt es ein λ ∈ IRm + mit streng positiven Koordinaten, P i i i 1 m so dass Uλ (e) = i λ U (c ), wobei (c , . . . , c ) die Äquilibrium-Konsumverteilung ist. Weiter gilt, dass (0, q) ein Äquilibrium für den Einzelhändlermarkt {(Uλ , e), D} ist. Beweis. Da ein Äquilibrium existiert, gibt es keine Arbitrage (Proposition 1.4), und es existiert ein State-Price-Vektor ψ (Satz 1.2). Jeder Händler will seinen Nutzen U i (ci ) = U i (ei + θD) maximieren unter der Nebenbedingung 0 ≥ θq = θDψ = (ci − ei )ψ . Da der Markt vollständig ist, kann jedes ci ∈ IRS+ erzeugt werden. Ohne Einschränkung der Allgemeinheit können wir ei > 0 annehmen, da sonst ci = 0 gelten würde. Die Lösung maximiert die Funktion U i (ci ) − αi (ci − ei )ψ für ein αi ∈ IR. Da U i streng wachsend ist, folgt αi > 0. Sei λi = 1/αi . Für jede zulässige Konsumverteilung (x1 , . . . , xm ) haben wir m m m m X X X X i i i i i i i i λ U (c ) = λ U (c ) − c −e ψ = λi U i (ci ) − αi (ci − ei )ψ i=1 ≥ ≥ i=1 m X i=1 m X i=1 i i i i i i λ U (x ) − α (x − e )ψ = i=1 m X i i i λ U (x ) − i=1 m X i i x −e ψ i=1 λi U i (xi ) . i=1 Dies beweist den ersten Teil. Nehmen wir an, es gebe ein x ∈ IRS+ , so dass Uλ (x) > Uλ (e) und (x − e)ψ ≤ 0. Dann muss es eine Konsumverteilung (x1 , . . . , xm ) geben, P P P so dass i xi = x, i λi U i (xi ) > i λi U i (ci ) und m m m X X X i i i i λ α x ψ = xψ ≤ eψ = cψ= λi αi ci ψ . i=1 i=1 i=1 Aber dann gilt m m X X λi U i (xi ) − αi (xi − ei )ψ > λi U i (ci ) − αi (ci − ei )ψ , i=1 i=1 was ein Widerspruch ist, da es einen Händler i geben muss, so dass ci seinen Nutzen nicht maximiert. 1. EINFÜHRUNG INS STATE-PRICING 9 Korollar 1.13. Falls, zusätzlich zu den Annahmen von Proposition 1.12, e > 0 streng positive Koordinaten hat, und Uλ in e differenzierbar ist, dann kann λ so gewählt werden, dass ∂Uλ (e)> ein State-Price-Vektor ist. Das heisst, q = D∂Uλ (e)> . Beweis. Aus Korollar 1.6 folgt, dass es ein µ gibt, so dass µ∂Uλ (e)> ein StatePrice-Vektor ist. Ersetzen wir λ durch λ/µ, folgt die Aussage. 10 2. 2. MODELLE IN DISKRETER ZEIT Modelle in diskreter Zeit Wir arbeiten nun auf einem messbaren Raum (Ω, F). Wir nehmen in diesem Kapitel an, dass der Raum Ω endlich ist. 2.1. Der Markt Wir nehmen an, dass es d + 1 Aktiven gibt, mit Preis S n = (Sn0 , Sn1 , . . . , Snd )> zur Zeit n. Der Preisprozess ist {Fn }-adaptiert. Wir nehmen an, dass F0 = {∅, Ω}, das heisst, man hat keine Information im Zeitpunkt 0. Wir nehmen einen endlichen Zeithorizont N an, das heisst I = {0, 1, . . . , N }. Wir nehmen daher auch an, dass FN = F, das heisst, im Zeitpunkt N kennt man die ganze Information. Wir nehmen weiter an, dass Sn0 > 0 für alle n. Der Aktiv {Sn0 } heisst risikoloser Aktiv, die anderen riskante Aktiven. Der Einfachheit halber normieren wir S00 = 1. Wir verwenden den risikolosen Aktiv zum Diskontieren, βn = 1/Sn0 , und setzen S̃ni = βn Sni . Eine Handelsstrategie ist ein vorhersehbarer Prozess φ = {(φ0n , . . . , φdn )}. φin bezeichnet die Anzahl Einheiten des Aktiv i, die im Intervall (n − 1, n] im Portfolio gehalten werden. φ muss vorhersehbar sein, da man zur Zeit n − 1 über die Anzahl entscheiden muss. Der Wert des Portfolios zur Zeit n ist Vn (φ) = φn S n = d X φin Sni . i=0 Der diskontierte Wert ist Ṽn (φ) = βn φn S n = φn S̃ n . Definition 2.1. Eine Handelsstrategie heisst selbstfinanzierend, falls φn S n = φn+1 S n . Selbstfinanzierend kann auch auf folgende Arten ausgedrückt werden. Hilfssatz 2.2. Folgende Aussagen sind äquivalent: i) Die Strategie φ ist selbstfinanzierend. 2. MODELLE IN DISKRETER ZEIT 11 ii) Für jedes n gilt Vn (φ) = V0 (φ) + n X φj ∆S j , j=1 wobei ∆S j = S j − S j−1 . iii) Für jedes n gilt Ṽn (φ) = V0 (φ) + n X φj ∆S̃ j , j=1 wobei ∆S̃ j = S̃ j − S̃ j−1 = βj S j − βj−1 S j−1 . Beweis. Übung. Proposition 2.3. Zu jedem vorhersehbaren Prozess {(φ1n , . . . , φdn )} und für jedes F0 -messbare V0 gibt es einen eindeutigen Prozess φ0 , so dass die Strategie φ selbstfinanzierend ist mit Startwert V0 . Beweis. Selbstfinanzierend bedeutet, dass Ṽn (φ) = φ0n + d X φin S̃ni = V0 + i=1 n X d X φij ∆S̃ji , j=1 i=1 da ∆S̃j0 = 0. Daher ist φ0n eindeutig. Dass {φ0n } vorhersehbar ist, folgt aus φ0n = V0 + n−1 X d X j=1 i=1 φij ∆S̃ji − d X i φin S̃n−1 . i=1 Wir haben keine Einschränkung gemacht, dass immer eine positive Anzahl Aktiven im Portfolio sein müssen. φ0n < 0 bedeutet, dass man sich “Geld” leiht, um das Portfolio zu erwerben. φin < 0 nennt man eine kurze Position. Das bedeutet, dass man einen Forward Vertrag eingeht. Das heisst, man verspricht in Zukunft −φin Aktiven zu liefern, und erhält die Prämie dafür heute. In unserem Markt sind kurze Positionen erlaubt. Der Wert eines Portfolios darf aber nicht negativ werden, das heisst, ein Händler muss immer seinen Verpflichtungen nachkommen können. 12 2. MODELLE IN DISKRETER ZEIT Definition 2.4. Eine Strategie φ heisst zulässig, falls sie selbstfinanzierend ist und falls Vn (φ) ≥ 0 für alle n. Eine Strategie φ heisst Arbitrage, falls sie zulässig ist, V0 (φ) = 0 und VN (φ) > 0. Der (diskontierte) Gewinn ist definiert als G̃n (φ) = n X d X φij ∆S̃ji . j=1 i=1 2.2. Martingale und Arbitrage Hilfssatz 2.5. Ein Markt erlaubt Arbitrage genau dann, wenn es einen vorhersehbaren Prozess (φ1 , . . . , φd ) gibt, mit G̃N > 0. Beweis. Falls es Arbitrage gibt, hat die entsprechende Handelsstrategie die behauptete Eigenschaft. Nehmen wir an, es gebe einen vorhersehbaren Prozess mit G̃N > 0. Gilt G̃n (φ) ≥ 0 für alle n, dann haben wir eine Arbitrage gefunden. Sei n := sup{k < N : IIP[G̃k (φ) < 0] > 0}. Sei A = {G̃n (φ) < 0}. Wir definieren die Strategie ψj = 1IA 1Ij>n φj . Dann erhalten wir G̃j (ψ) = 1IA 1Ij>n (G̃j (φ) − G̃n (φ)). Daher gilt G̃N (ψ) > 0. Wir haben also eine Arbitrage konstruiert. Satz 2.6. Es gibt keine Arbitrage genau dann, wenn es ein äquivalentes Mass IIP∗ gibt, so dass der diskontierte Preisprozess S̃ ein Martingal unter IIP∗ ist. Beweis. Nehmen wir an, dass es ein äquivalentes Martingalmass gibt. Sei φ eine selbstfinanzierende Strategie mit V0 (φ) = 0 und VN (φ) ≥ 0. Dann ist Ṽn (φ) = n X φj ∆S̃ j j=1 ein IIP∗ -Martingal; das heisst, IIE∗ [VN (φ)] = V0 (φ) = 0. Da die Masse äquivalent sind, gilt auch IIP∗ [VN (φ) ≥ 0] = 1, und damit IIP∗ [VN (φ) = 0] = 1. Das Gleiche muss auch unter IIP gelten. Nehmen wir an, dass es keine Arbitrage gibt. Zu jedem vorhersehbaren Prozess assozieren wir die Zufallsvariable G̃N (φ). Bezeichnen wir den Raum dieser Variablen mit V. V ist dann ein konvexer Unterraum des Vektorraumes der Zufallsvariablen. Da Ω nur endlich viele Elemente hat, gilt IIE[X 2 ] < ∞ für alle X ∈ V. Sei Γ der Raum der echt positiven Zufallsvariablen. Dann gilt Γ ∩ V = ∅. {(φ1j , . . . , φdj )} 2. MODELLE IN DISKRETER ZEIT 13 Somit gibt es eine Zufallsvariable λ, die eine lineare Funktion X 7→ IIE[λX] definiert, so dass IIE[λX] > IIE[λY ] für alle X ∈ Γ und Y ∈ V (Satz von Hahn–Banach, Verallgemeinerung von Lemma E.1). Da V ein Unterraum ist, muss IIE[λY ] = 0 gelten für alle Y ∈ V, und somit IIE[λX] > 0 für alle X ∈ Γ. Da damit IIE[λλ− ] = −IIE[(λ− )2 ] ≤ 0 , schliessen wir, dass λ ≥ 0. Da IIE[λ] = IIE[1λ] > 0, haben wir λ > 0. Da auch IIE[λ1Iλ=0 ] = 0, schliessen wir, dass IIP[λ > 0] = 1. Wir dürfen nun annehmen, dass IIE[λ] = 1. Das Mass IIP∗ [A] = IIE[λ1IA ] ist daher äquivalent. Da IIE[λG̃N (φ)] = 0, schliessen wir aus Lemma C.3, dass S̃ ein Martingal ist. 2.3. Vollständige Märkte und Optionspreise Ein bedingter Anspruch ist eine positive Funktion der Variablen {S n : 1 ≤ n ≤ N }. Wir nennen einen Anspruch europäisch falls es nur eine Funktion von S N ist. i i + Beispiele sind die Call-Option h = (SN − K)+ oder die Put-Option h = (K − SN ) . Optionen können aber auch vom Preis in mehreren Zeitpunkten abhängen, wie zum P i + Beispiel die Asiatische Option h = (k −1 N j=N −k+1 Sj − K) . Definition 2.7. Ein bedingter Anspruch h heisst erreichbar, falls es eine zulässige Strategie φ gibt, mit der Eigenschaft, dass VN (φ) = h. Ein Markt heisst vollständig, falls jeder bedingte Anspruch erreichbar ist. Bemerkung. Ist ein Markt arbitragefrei, dann genügt es, eine selbstfinanzierende Strategie zu finden, die den Schlusswert h hat. Da {Ṽn (φ)} ein IIP∗ -Martingal ist, gilt Ṽn (φ) = IIE∗ [h̃ | Fn ]. Damit ist Ṽn (φ) ≥ 0. Da die Masse äquivalent sind, gilt diese Eigenschaft auch unter IIP. Das heisst, φ ist eine zulässige Strategie. Dass ein Markt arbitragefrei sein sollte, kann ökonomisch begründet werden. Dass ein Markt vollständig sein sollte, entbehrt jeder theoretischen Grundlage. Die Vollständigkeit ist aber eine nette Eigenschaft, die die Theorie einfacher macht. Viele der Modelle, die in der Praxis verwendet werden, haben diese Eigenschaft. Satz 2.8. Ein arbitragefreier Markt ist genau dann vollständig, wenn es ein eindeutiges äquivalentes Mass IIP∗ gibt, unter dem die diskontierten Preise Martingale sind. 14 2. MODELLE IN DISKRETER ZEIT Beweis. Nehmen wir an, der Markt sei arbitragefrei und vollständig. Sei h eine FN -messbare Zufallsvariable. Dann gibt es eine Strategie φ, die h reproduziert. Da φ selbstfinanzierend ist, gilt N X h = Ṽ (φ) = V (φ) + φj ∆S̃ j . N 0 0 SN j=1 Seien nun IIP1 und IIP2 zwei äquivalente Martingalmasse. Dann gilt IIE1 h h i h h i = V (φ) = II E . 0 2 0 0 SN SN Da h beliebig ist gilt IIP1 = IIP2 auf FN = F. Nehmen wir nun an, der Markt sei arbitragefrei und unvollständig. Es gibt dann ein äquivalentes Martingalmass IIP∗ (Satz 2.6). Sei V der Unterraum der Zufallsvariablen der Form N X φn ∆S̃ n , U0 + n=1 wobei U0 F0 -messbar, und {φn } vorhersehbar ist. Definieren wir das Skalarprodukt X · Y = IIE∗ [XY ]. Es gibt eine Zufallsvariable h ≥ 0, die nicht erreichbar, und damit nicht in V ist. Daher gibt es eine Zufallsvariable X 6= 0, die orthogonal zu V ist, das heisst IIE∗ [XY ] = 0 für alle Y ∈ V. Da der Raum endlich ist, ist kXk∞ = supΩ |X| < ∞. Da 1 ∈ V, ist IIE∗ [X] = 0. Definieren wir das äquivalente Mass h X i ∗ IIP1 [A] = IIE 1 + 1IA , 2kXk∞ so gilt IIE1 N hX i φn ∆S̃ n = 0 n=1 für jeden vorhersehbaren Prozess {φn }. Somit ist (Hilfssatz C.3) {S̃ n } ein IIP1 Martingal. Da X 6= 0, ist IIP1 verschieden von IIP∗ . Nehmen wir nun an, dass der Markt arbitragefrei und vollständig ist. Dann gibt es ein eindeutiges Martingalmass IIP∗ . Für einen bedingten Anspruch h gibt es dann eine Strategie {φ}, die h reproduziert. Wir haben, dass {Ṽn (φ)} ein IIP∗ -Martingal ist. Daher gilt i h 0 ∗ h Vn (φ) = Sn IIE F . 0 n SN 2. MODELLE IN DISKRETER ZEIT 15 Der Wert der Strategie ist daher eindeutig durch h bestimmt. Die Hedging-Strategie ist auch eindeutig bestimmt, Ṽn (φ) − Ṽn−1 (φ) = φn ∆S̃ n . Daraus lässt sich die Strategie {φn } berechnen. Es ist zu bemerken, dass wir die Vorhersehbarkeit nicht zeigen müssen. Durch die Vollständigkeit des Marktes wissen wir, dass es eine vorhersehbare Strategie gibt, die die obige Formel erfüllt. Die Lösung muss also diese Strategie sein. In einem nicht vollständigen Markt können wir aber nicht sicher sein, dass eine Lösung {φn } der Gleichung auch vorhersehbar ist. Weiter ist zu bemerken, dass IIP keine Rolle spielt. Man muss nur das Mass IIP∗ kennen, um den Preis zu bestimmen. Proposition 2.9. Ist in einem vollständigen und arbitragefreien Markt der Preis 0 | Fn ], dann gibt des bedingten Anspruchs h zur Zeit n verschieden von Sn0 IIE∗ [h/SN es eine Arbitrage (im um h vergrösserten Markt). 0 Beweis. Nehmen wir an, der Preis Vn0 sei strikt höher als Sn0 IIE∗ [h/SN | Fn ]. Dann kann man den bedingten Anspruch verkaufen, die Strategie φ̂n anwenden, wobei φ̂ik = φik für i ≥ 1, k ≥ n und φ̂0k = φ0k + (Vn0 − Vn (φ))/Sn0 . {φk } ist die Replikationsstrategie von h. Es ist einfach zu sehen, dass die Strategie selbstfinanzierend ist. Der Wert der Strategie zum Schlusszeitpunkt ist h+ 0 (Vn0 − Vn (φ))SN >h, Sn0 und man hat einen sicheren Gewinn, nachdem man die Verpflichtung h bezahlt hat. Ein ähnliches Argument kann man im Falle Vn0 < Vn (φ) verwenden. Betrachten wir nun eine amerikanische Option. Das ist ein adaptierter positiver Prozess {Zn }. Bei einer amerikanischen Call Option haben wir Zn = (Sni − K)+ , bei einer amerikanischen Put Option haben wir Zn = (K − Sni )+ . Der Halter der Option kann zu jedem Zeitpunkt n bestimmen, ob er die Option ausübt, oder wartet. Wenn der Halter die Option zum Zeitpunkt n ausübt, erhält er den Betrag Zn . Die Option kann aber nur einmal ausgeübt werden. Es ist klar, dass zum Zeitpunkt N der Wert der Option UN = ZN ist. Zum Zeitpunkt N − 1 haben wir die Möglichkeit, die Option auszuüben, was den Wert ZN −1 hat. Man kann auch mit der Ausübung warten. Dies hat den gleichen Wert, wie der bedingte Anspruch ZN . Da im vollständigen Markt ZN repliziert werden 16 2. MODELLE IN DISKRETER ZEIT kann, kann der Halter ohne Risiko sich für den höheren Wert im Zeitpunkt N − 1 entscheiden. Das heisst, der Wert der amerikanischen Option im Zeitpunkt N − 1 ist 0 0 UN −1 = max{ZN −1 , SN E∗ [ZN /SN | FN −1 ]} . −1 II Durch Induktion erhalten wir den Wert zur Zeit n 0 Un = max{Zn , Sn0 IIE∗ [Un+1 /Sn+1 | Fn ]} . Sei nun Ũn = Un /Sn0 der diskontierte Wert der amerikanischen Option. Proposition 2.10. Der Prozess {Ũn } ist ein IIP∗ -Supermartingal. Es ist das kleinste Supermartingal das Z̃n = Zn /Sn0 dominiert. Beweis. Es ist klar, dass {Ũn } Z̃n dominiert. Aus Ũn = max{Z̃n , IIE∗ [Ũn+1 | Fn ]} ≥ IIE∗ [Ũn+1 | Fn ] folgt auch die Supermartingaleigenschaft. Sei nun {Mn } Supermartingal das Z̃n dominiert. Dann gilt MN ≥ Z̃N = ŨN . Nehmen wir an, dass Mn ≥ Ũn . Dann gilt Mn−1 ≥ IIE∗ [Mn | Fn−1 ] ≥ IIE∗ [Ũn | Fn−1 ] . Somit haben wir Mn−1 ≥ max{Z̃n−1 , IIE∗ [Ũn | Fn−1 ]} = Ũn−1 . Somit dominiert {Mn } den Prozess {Ũn }. 3. OPTIMALES STOPPEN UND AMERIKANISCHE OPTIONEN 3. 17 Optimales Stoppen und Amerikanische Optionen Wir arbeiten nun mit einem beliebgigen Wahrscheinlichkeitsraum (Ω, F, IIP∗ ). Betrachten wir einen adaptierten Prozess {Zn } und definieren wir UN = ZN , und Un = max{Zn , IIE∗ [Un+1 | Fn ]} für n ≤ N − 1. Wir wissen (Proposition 2.10), dass {Un } das kleinste Supermartingal ist, das {Zn } dominiert. Der Prozess {Un } heisst Snell-Hülle des Prozesses {Zn }. Hilfssatz 3.1. Betrachten wir die Stoppzeit ν0 = inf{n ≥ 0 : Un = Zn }. Dann ist der Prozess {Uν0 ∧n } ein Martingal. Beweis. Da ZN = UN ist ν0 ≤ N . Wir schreiben Uν0 ∧n = U0 + n X 1Iν0 ≥j ∆Uj . j=1 Somit ist Uν0 ∧(n+1) − Uν0 ∧n = 1Iν0 ≥n+1 ∆Un+1 . Falls ν0 ≤ n, dann ist IIE∗ [Uν0 ∧(n+1) − Uν0 ∧n | Fn ] = 0. Falls ν0 > n, so ist Zn < Un . Das heisst Uν0 ∧n = Un = IIE∗ [Un+1 | Fn ] = IIE∗ [Uν0 ∧(n+1) | Fn ] , was die Martingaleigenschaft beweist. Wir bezeichnen nun mit Tn die Menge aller Stoppzeiten mit Werten in [n, N ]. Korollar 3.2. Die Stoppzeit ν0 hat die Eigenschaft dass U0 = IIE∗ [Zν0 ] = sup IIE∗ [Zν ] . ν∈T0 Beweis. Da {Uν0 ∧n } ein Martingal ist haben wir U0 = IIE∗ [Uν0 ∧N ] = IIE∗ [Uν0 ] = IIE∗ [Zν0 ] . Für ein beliebiges ν ∈ T0 ist {Uν∧n } ein Supermartingal (Satz C.5). Daher gilt U0 ≥ IIE∗ [Uν∧N ] = IIE∗ [Uν ] ≥ IIE∗ [Zν ] . 18 3. OPTIMALES STOPPEN UND AMERIKANISCHE OPTIONEN Wir interpretieren T0 als alle möglichen Strategien, die ein Halter der Option anwenden kann. Wir sehen dann, dass ν0 eine optimale Strategie ist. Falls man sich zum Zeitpunkt n befindet, zeigt ein ähnliches Argument, dass Un = sup IIE∗ [Zν | Fn ] = IIE∗ [Zνn | Fn ] , ν∈Tn wobei νn = inf{j ≥ n : Uj = Zj }. Satz 3.3. Eine Stoppzeit ν ist genau dann optimal, falls Zν = Uν und {Uν∧n } ein Martingal ist. Beweis. Ist Zν = Uν und {Uν∧n } ein Martingal, dann folgt wie im Beweis von Korollar 3.2, dass ν optimal ist. Sei ν optimal. Dann gilt U0 = IIE∗ [Zν ] ≤ IIE∗ [Uν ] . Da {Uν∧n } ein Supermartingal ist, muss das Gleichheitszeichen gelten, und es folgt, dass IIE∗ [Zν ] = IIE∗ [Uν ]. Da Uν ≥ Zν bedeutet dies, dass Uν = Zν . Da {Uν∧n } ein Supermartingal ist, gilt U0 ≥ IIE∗ [Uν∧n ] ≥ IIE∗ [Uν ] , siehe Satz C.5. Also ist IIE∗ [Uν∧n ] = IIE∗ [Uν ] = IIE∗ [IIE∗ [Uν | Fn ]] . Da aber Uν∧n ≥ IIE∗ [Uν | Fn ], gilt Uν∧n = IIE∗ [Uν | Fn ], und wir haben die Martingaleigenschaft bewiesen. Da {Un } ein Supermartinal ist, hat es eine Doob-Zerlegung (Satz C.10) Un = Mn − An . Proposition 3.4. Die grösste mögliche optimale Stoppzeit ist νmax = inf{n : An+1 6= 0} ∧ N . Beweis. Da {An } vorhersehbar ist, ist νmax eine Stoppzeit. Da Uνmax ∧n = Mνmax ∧n folgt, dass {Uνmax ∧n } ein Martingal ist. Weiter gilt Uνmax = N −1 X 1Iνmax =j Uj + 1Iνmax =N UN j=0 = N −1 X j=0 1Iνmax =j max{Zj , IIE∗ [Uj+1 | Fj ]} + 1Iνmax =N ZN . 3. OPTIMALES STOPPEN UND AMERIKANISCHE OPTIONEN 19 Da für νmax = j < N Aj = 0 gilt und Aj+1 > 0, erhalten wir IIE∗ [Uj+1 | Fj ] = Mj − Aj+1 = Uj − Aj+1 < Uj . Wir schliessen, dass Uj = Zj , das heisst Uνmax = Zνmax . Somit ist νmax optimal. Sei nun ν eine optimale Stoppzeit. Da {Uν∧n } ein Martingal ist und M0 = U0 , haben wir U0 = IIE∗ [Uν∧n ] = IIE∗ [Mν∧n ] − IIE∗ [Aν∧n ] = U0 − IIE∗ [Aν∧n ] . Also ist IIE∗ [Aν∧n ] = 0, das heisst Aν∧n = 0. Somit ist ν ≤ inf{n : An+1 > 0} = νmax . Nehmen wir nun an, dass {Xn } eine homogene Markovkette auf einem endlichen Raum E ist. Das heisst, es gibt eine Funktion P : E × E → [0, 1], so dass IIP[Xn+1 = y | X0 = x0 , . . . , Xn = xn ] = P (xn , y) . P Insbesondere gilt y∈E P (x, y) = 1. Die Preise der Aktiven seien von der Form S n = S(Xn ) für eine Funktion S : E → IRd+1 . Nehmen wir nun an, Zn = ψ(n, Xn ). Dann ist die Snell-Hülle gegeben durch Un = u(n, Xn ), wobei u(N, x) = ψ(N, x) und, für n ≤ N − 1, u(n, x) = max{ψ(n, x), P u(n + 1, x)}. Wir definieren hier P P f (x) = y∈E P (x, y)f (y). Kehren wir nun zu einem arbitragefreien und vollständigen Markt zurück. Wir haben gesehen, dass der Preis einer amerikanischen Option durch die Formel Un = Sn0 sup IIE∗ [Zν /Sν0 | Fn ] ν∈Tn gegeben ist. Die Doob-Zerlegung ist Ũn = M̃n − Ãn . Da der Markt vollständig ist, 0 gibt es eine selbstfinanzierende Strategie φ, so dass VN (φ) = SN M̃N . Wir erhalten Ṽn (φ) = IIE∗ [ṼN (φ) | Fn ] = IIE∗ [M̃N | Fn ] = M̃n . Damit ist Ũn = M̃n − Ãn = Ṽn (φ) − Ãn . Definieren wir An = Sn0 Ãn , erhalten wir Un = Vn (φ) − An . 20 3. OPTIMALES STOPPEN UND AMERIKANISCHE OPTIONEN Diese Strategie ist gut für den Verkäufer der Option. Er erhält die Prämie U0 , und hat dann immer den Wert Vn (φ) = Un + An ≥ Un ≥ Zn . Der Verkäufer kann also jederzeit seiner Verpflichtung nachkommen. Der Halter der Option kann eine optimale Stoppzeit ν wählen. Dann ist Aν = 0 und der Verkäufer macht keinen Gewinn. Investiert der Käufer in das Portfolio −φ, hat er zu jedem Zeitpunkt vor νmax den Wert −Un . Verwendet er eine optimale Stoppzeit, dann hat das Portfolio zum Stoppzeitpunkt den Wert −Uν = −Zν , was genau dem Wert der Option entspricht. Stoppt der Käufer nicht optimal, macht der Verkäufer einen Gewinn. Beispiel 3.5. Nehmen wir an, Sn0 sei deterministisch und wachsend. Wir betrachten eine amerikanische Call-Option Zn = (Sn1 − K)+ . Für den diskontierten Wert der europäischen Call-Option erhalten wir 1 1 c̃n = βN IIE∗ [(SN − K)+ | Fn ] ≥ IIE∗ [S̃N − βN K | Fn ] = S̃n1 − βN K . Daher gilt cn ≥ Sn1 −βN Sn0 K ≥ Sn1 −K. Da cn > 0, haben wir cn ≥ (Sn1 −K)+ . Somit ist der Wert der europäischen Option mindestens so gross, wie die Auszahlung der amerikanischen Option. Da ν = N eine mögliche Strategie ist, gilt auch cn ≤ sup Sn0 IIE∗ [βν (Sν1 − K)+ | Fn ] , ν∈Tn und somit haben wir Gleichheit. Wir schliessen daraus, dass An = 0 und νmax = 0 1 N . Damit ν0 6= νmax muss gelten, dass SN E∗ [(SN − K)+ | FN −1 ] = cN −1 = −1 βN II 1 + 1 (SN E∗ [(SN − K)+ | FN −1 ] ≥ −1 − K) . Aus Jensens Ungleichung schliessen wir II 0 1 + (SN βN −1 SN −1 − K) , also 1 + 1 0 + (SN −1 − K) ≥ (SN −1 − KSN −1 βN ) . 0 0 1 + Dies ist nur möglich, falls SN −1 = SN oder (SN −K) deterministisch ist. Das heisst, 1 1 0 0 entweder gilt IIP∗ [SN ≤ K | FN −1 ] = 1 oder SN ist FN −1 -messbar und SN −1 = SN . 4. STOCHASTISCHE ANALYSIS 4. 21 Stochastische Analysis 4.1. Das stochastische Integral Rt Nehmen wir an, wir wollen das Integral 0 Ws dWs definieren, wobei W eine standard Brownsche Bewegung ist. Wir könnten versuchen, das Integral über RiemannSummen zu definieren. Wir betrachten zwei Möglichkeiten, An = n X Wti−1 (Wti − Wti−1 ) i=1 und Bn = n X Wti (Wti − Wti−1 ) , i=1 wobei ti = it/n. Dann ist n n X X An + Bn = (Wti + Wti−1 )(Wti − Wti−1 ) = Wt2i − Wt2i−1 = Wt2 . i=1 i=1 Weiter gilt Bn − An = n X (Wti − Wti−1 )2 . i=1 Aus dem Beweis von Hilfssatz B.4 wissen wir, dass limn→∞ Bn − An = t. Wir schliessen, dass lim An = 21 (Wt2 − t) n→∞ und lim Bn = 12 (Wt2 + t) . n→∞ Wir können daher nicht einfach das stochastische Integral über Riemann-Summen definieren. In der Praxis wird man in einem Markt ein Portfolio zu einem Zeitpunkt t festlegen und in einem Zeitpunkt s > t wieder ändern. Da man nur die Information bis zum Zeitpunkt t verwenden kann, werden wir die Riemann-Summen {An } zur Definition verwenden. Wir beginnen mit einem stückweise konstanten adaptierten Prozess {Yt }. Für Y ist es natürlich, das Integral Z t Ys dWs = 0 N t −1 X i=0 Yτi (Wτi+1 − Wτi ) + Yt (Wt − WτNt ) 22 4. STOCHASTISCHE ANALYSIS zu definieren, wobei Nt = max{i : τi ≤ t}. Der so definierte stochastische Prozess Rt { 0 Ys dWs } ist stetig, und hat die folgende wichtige Eigenschaft. Sei τn0 = inf{t ≥ R τ 0 ∧t Rt 0 : | 0 Ys dWs | > n}. Dann ist { 0 n Ys dWs } ein Martingal. Hilfssatz 4.1. Seien {Xt } und {Yt } zwei stückweise konstante Prozesse und W Rt eine Brownsche Bewegung. Dann sind { 0 Ys dWs } und {Mt } lokale Martingale, wobei Z t Z t Z t Mt = Xs dWs − Ys dWs 0 0 Ys Xs ds . (4.1) 0 Sind {Xt } und {Yt } beschränkt, so sind { Rt 0 Ys dWs } und {Mt } Martingale. Beweis. Nehmen wir zuerst an, dass supt≥0 {max{|Xt |, |Yt |}} ≤ C < ∞. Sei s < t. Fügen wir die Stoppzeiten t und s zu {τi } und ordnen die Stoppzeiten, so können wir annehmen, dass es ein k = k(ω) gibt, so dass τk = t, und dass es ein ` = `(ω) gibt, so dass τ` = s. Wir bemerken zuerst, dass IIE −1)∧n h (NtX Yτi (Wτi+1 − Wτi ) i=1 n X n X = 2 i = IIE n h X 2 i Yτi 1Iτi <t (Wτi+1 − Wτi ) i=1 IIE[Yτi 1Iτi <t Yτj 1Iτj <t (Wτi+1 − Wτi )(Wτj+1 − Wτj )] . i=1 j=1 Ist i < j, so erhalten wir IIE[Yτi 1Iτi <t Yτj 1Iτj <t (Wτi+1 − Wτi )(Wτj+1 − Wτj )] = IIE[Yτi 1Iτi <t Yτj 1Iτj <t (Wτi+1 − Wτi )IIE[Wτj+1 − Wτj | Fτj ]] = 0 . Das anlaoge Resultat gilt für i > j. Somit erhalten wir IIE −1)∧n h (NtX Yτi (Wτi+1 n 2 i X − W τi ) = IIE[Yτ2i 1Iτi <t (Wτi+1 − Wτi )2 ] i=1 = i=1 n X IIE[Yτ2i 1Iτi <t IIE[(Wτi+1 − Wτi )2 | Fτi ]] i=1 = n X IIE[Yτ2i 1Iτi <t (τi+1 − τi ) | Fτi ] ≤ C 2 t . i=1 Somit ist bar. R τn ∧t 0 Yv dWv quadratisch integrierbar, und damit gleichmässig integrier- Wir haben dann i Z s i hZ t hZ t IIE Yv dWv Fs = Yv dWv + IIE Yv dWv Fs . 0 0 s 4. STOCHASTISCHE ANALYSIS 23 Wir haben weiter Z t N ∞ t −1 X X Yv dWv = Yτi (Wτi+1 − Wτi ) = Yτi 1Iτi <t (Wτi+1 − Wτi ) , s i=Ns i=Ns Wegen der gleichmässigen Integrierbarkeit gilt ∞ i X hZ t IIE Yv dWv Fs = IIE[Yτi 1Iτi <t (Wτi+1 − Wτi ) | Fs ] , s i=Ns Wir erhalten IIE[Yτi 1Iτi <t (Wτi+1 − Wτi ) | Fs ] = IIE[Yτi 1Iτi <t IIE[(Wτi+1 − Wτi ) | Fτi ] | Fs ] = 0 , und damit IIE t hZ s Also ist Rt 0 i Yv dWv Fs = 0 . Ys dWs ein Martingal. Wir haben Z t i i Z s hZ t hZ s Yv dWv Fs = 0 , Xv dWv IIE Xv dWv Yv dWv Fs = IIE 0 s 0 s und IIE hZ t Z Xv dWv s 0 s i Yv dWv Fs = 0 . Somit müssen wir IIE hZ t Z Z t Xv dWv − Yv dWv s t s s Yv Xv dv Fs = 0 zeigen. Sei nun {τn } die wachsende Folge der Sprungzeiten von beiden Prozessen X und Y , und nehmen wir weiterhin an, dass t und s zu den Stoppzeiten gehören. Wegen der Hölder-Ungleichung haben wir Z t i 2 hZ t hZ t 2 i hZ t 2 i IIE Yv dWv Xv dWv ≤ IIE Yv dWv IIE Xv dWv . Tk ∧t Tk ∧t Tk ∧t Tk ∧t Die rechte Seite kann beliebig klein gemacht werden. Wenn wir also die Summe durch die endliche Summe ersetzen, können wir den Fehler beliebig klein machen. Dies bedeutet, dass wir Summe und Erwartungswert vertauschen dürfen. Wir erhalten Z t i hZ t IIE Yv dWv Xv dWv Fs s s = ∞ X ∞ X i=Ns j=Ns IIE[Yτi Xτj 1Iτi <t 1Iτj <t (Wτi+1 − Wτi )(Wτj+1 − Wτj ) | Fs ] . 24 4. STOCHASTISCHE ANALYSIS Ist i < j, so erhalten wir IIE[Yτi Xτj 1Iτi <t 1Iτj <t (Wτi+1 − Wτi )(Wτj+1 − Wτj ) | Fs ] = IIE[Yτi Xτj 1Iτi <t 1Iτj <t (Wτi+1 − Wτi )IIE[Wτj+1 − Wτj | Fτj ] | Fs ] = 0 . Das analoge Resultat gilt für j < i. Weiter gilt für i = j IIE[Yτi Xτi 1Iτi <t (Wτi+1 − Wτi )2 | Fs ] = IIE[Yτi Xτi 1Iτi <t IIE[(Wτi+1 − Wτi )2 | Fτi ] | Fs ] = IIE[Yτi Xτi 1Iτi <t (τi+1 − τi ) | Fs ] . Also IIE hZ s t Z Yv dWv s t ∞ i X IIE[Yτi Xτi 1Iτi <t (τi+1 − τi ) | Fs ] Xv dWv Fs = i=Ns = IIE hZ t i Xv Yv dv . s Damit ist M ein Martingal. Sind X und Y nicht beschränkt, betrachten wir die Stoppzeiten τn0 = inf{t ≥ R t∧τ 0 0 : max{|X(t)|, |Y (t)|} ≥ n}. Es folgt, dass { 0 n Ys dWs } und {Mt∧τn0 } Martingale Rt sind. Daher sind { 0 Ys dWs } und {Mt } lokale Martingale. Rt Rt Wir sehen, dass {( 0 Ys dWs )2 − 0 Ys2 ds} ein lokales Martingal ist, falls Y stückweise konstant ist. Da wir diese Eigenschaft auch erwarten, wenn wir die DefiniRt tion des stochastischen Integrals ausdehnen, brauchen wir die Bedingung 0 Ys2 ds < ∞ für alle t. Wir nennen die Klasse aller Prozesse, die diese Bedingung erfüllen L2loc . Da wir annehmen, dass alle Prozesse cadlag sind, sind alle Prozesse in dieser Klasse. R∞ Die Klasse der Prozesse mit 0 IIE[Xs2 ] ds < ∞ nennen wir L2 . Wir wollen nun die Prozesse in L2 durch beschränkte stückweise konstante Prozesse approximieren. Hilfssatz 4.2. Sei X ∈ L2 . Dann gibt es eine Folge {X n } von beschränkten stückweise konstanten Prozessen, so dass i hZ ∞ lim IIE (Xsn − Xs )2 ds = 0 . (4.2) n→∞ 0 Beweis. Sei H der Raum aller beschränkten Prozesse aus L2 , für die die Aussage gilt. Konvergiere Y n ∈ H nach Y punktweise und beschränkt. Dann gibt es ein mn , 4. STOCHASTISCHE ANALYSIS 25 Rn so dass 0 (Ysmn − Ys )2 ds < n−1 . Ist Y n ∈ H, dann gibt es einfache Prozesse {Y n,k }, so dass (4.2) für {X k = Y mn ,k } und X = Y mn gilt. Wählt man einen Index k(n), so R ∞ m ,k(n) − Ysmn )2 ds] < n−1 , dann gilt dass IIE[ 0 (Ys n hZ n i lim IIE (Ysmn ,k(n) − Ys )2 ds = 0 , n→∞ 0 m ,k(n) 1Is≤n } und X = Y . da (a + b)2 ≤ 2(a2 + b2 ). Somit gilt (4.2) für {Xsn = Ys n Also ist Y ∈ H. Da die konstanten Funktionen und 1IA 1ITn ≤t<Tn+1 für A ∈ FTn stückweise konstante Prozesse sind, enthält H nach dem monotonen Klassentheorem alle beschränkten Prozesse. Sei nun X unbeschränkt. Dann gibt es Folgen von einfachen Prozessen {X n,k } R∞ die X1I|X|≤n approximieren. Da IIE[ 0 Xs2 1I|Xs |>n ds] → 0, folgt mit der obigen Konstruktion, dass X die Behauptung des Hilfssatzes erfüllt. Wir können nun ein stochastisches Integral auf ganz L2 definieren. R Satz 4.3. Sei X ∈ L2 . Dann gibt es einen eindeutigen Prozess X dW , so dass für jede Folge {X n } von beschränkten stückweise konstanten Prozessen, die 1 i 2 X hZ n n 2 (Xs − Xs ) ds IIE <∞ (4.3) 0 n erfüllt, für alle T > 0 gilt, dass Z t Z t n sup Xs dWs − Xs dWs → 0 0≤t≤T 0 0 R fast sicher und in L2 (IIP). X dW ist ein stetiges quadratisch integrierbares Martingal. Weiter, ist Y ∈ L2 , dann ist Z ∞ |Xs Ys | ds ≤ 0 nZ 0 ∞ Xs2 Z ds ∞ Ys2 ds o1 2 , (4.4) 0 und (4.1) ist ein Martingal. Bemerkung. Wegen Hilfssatz 4.2 gibt es immer eine Folge, die (4.3) erfüllt. 26 4. STOCHASTISCHE ANALYSIS Sei {X n } eine Folge von einfachen Prozessen, die (4.3) erfüllt. Dann ist Z t i Z t hX n+1 n IIE sup Xs dWs − Xs dWs Beweis. 0≤t≤T n 0 0 2 21 Z t X n n+1 ≤ IIE sup (Xs − Xs ) dWs 0≤t≤T n ≤ X 0 Z T 2 21 (Xsn+1 − Xsn ) dWs 4IIE 0 n 1 X Z T 2 n+1 n 2 =2 IIE (Xs − Xs ) ds n 0 1 X Z T 2 n+1 n 2 [(Xs − Xs ) − (Xs − Xs )] ds =2 IIE n 0 1 X Z T 2 n 2 (Xs − Xs ) ds ≤8 IIE <∞, n 0 wobei wir die Proposition C.9 sowie (a + b)2 ≤ 2(a2 + b2 ) verwendet haben. Somit R R ist X n dW eine Cauchyfolge, und damit konvergiert X n dW gleichmässig auf R beschränkten Zeitintervallen gegen einen Prozess X dW fast sicher. Wegen der Rt gleichmässigen Konvergenz, ist IIE[( 0 Xs dWs )2 ] < ∞, und der Grenzprozess ist stetig. Weiter gilt mit Hilfe des Lemmas von Fatou Z t Z t 2 n Xs dWs IIE sup Xs dWs − 0≤t≤T 0 0 Z t 2 Z t m n Xs dWs = IIE lim sup Xs dWs − m→∞ 0≤t≤T 0 0 Z t Z t 2 n m ≤ lim IIE sup Xs dWs − Xs dWs m→∞ 0≤t≤T 0 0 Z T 2 hZ T n m n m 2 ≤ lim 4IIE (Xs − Xs ) dWs = lim 4IIE (Xs − Xs ) ds m→∞ m→∞ 0 0 hZ T n 2 = 4IIE (Xs − Xs ) ds , 0 und die Konvergenz ist somit auch in L2 (IIP). Falls X = 0, dann muss der GrenzproR zess auch 0 sein, und daher hängt X dW nicht von der gewählten Approximation mit stückweise konstanten Prozessen ab. Es gilt IIE hZ 0 t (Xsn )2 hZ t i hZ t i n 2 2 ds ≤ 2 IIE (Xs − Xs ) ds + IIE (Xs ) ds i 0 0 4. STOCHASTISCHE ANALYSIS 27 Der erste Term ist beschränkt, da er für n → ∞ nach 0 konvergiert, der zweite Rt ist unabhängig von n. Somit folgt, dass 0 Xsn dWs für jedes feste t gleichmässig integrierbar ist. Weiter ist Z t Z t Z t 2 2 n n Xs dWs IIE Xs dWs = IIE (Xs − Xs ) dWs + 0 0 0 Z t 2 hZ t 2 n n + IIE ≤ 2 IIE (Xs − Xs ) dWs Xs dWs 0 0 hZ t i hZ t i n 2 2 ≤ 16 IIE (Xs − Xs ) ds + IIE (Xs ) ds 0 0 und damit, wenn man n gegen Unendlich gehen lässt, Z t 2 i hZ hZ t 2 Xs dWs (Xs ) ds ≤ 16IIE IIE ≤ 16IIE 0 ∞ i (Xs )2 ds < ∞ . 0 0 Rt Da damit { s Xun dWu } gleichmässig integrierbar ist, folgt Z t i i hZ t h Xu dWu Fs = IIE lim Xun dWu Fs IIE n→∞ s s i hZ t Xun dWu Fs = 0 = lim IIE n→∞ und damit R s X dW ein quadratisch integrierbares Martingal. (4.4) ist ein klassisches Resultat aus der Analysis. Seien nun {X n } und {Y n } Folgen von beschränkten stückweise konstanten Prozessen, die X und Y approxiR∞ R∞ mieren. Aus (4.4) folgt 0 (Xsn − Xs )Ysn ds → 0 und 0 Xs (Ysn − Ys ) ds → 0, R∞ woraus 0 (Xsn Ysn − Xs Ys ) ds → 0 folgt. Wie oben gesehen, sind die Prozesse R n R Rt X dW Y n dW und 0 Xsn Ysn ds gleichmässig integrierbar. Somit ist Z t Z t Z t i i hZ t h n Xu dWu Yu dWu Fs = IIE lim IIE Xu dWu Yun dWu Fs n→∞ s s s s Z t i hZ t = lim IIE Xun dWu Yun dWu Fs n→∞ s s i hZ t Xun Yun du Fs = lim IIE n→∞ s i i hZ t hZ t n n Xu Yu du Fs . = IIE lim Xu Yu du Fs = IIE s n→∞ Dies beweist, dass (4.1) ein Martingal ist. s Bevor wir das Integral ausdehnen, benötigen wir ein Resultat über das gestoppte Martingal. 28 4. STOCHASTISCHE ANALYSIS Hilfssatz 4.4. Sei X ∈ L2 und τ eine Stoppzeit. Dann gilt Z t Z τ ∧t Xs 1Iτ >s dWs . Xs dWs = 0 0 Beweis. Wir haben hZ t 2 i hZ t i hZ 2 IIE Xs 1Iτ >s dWs = IIE Xs 1Iτ >s ds = IIE 0 0 τ ∧t Xs2 i ds . 0 Weiter haben wir aufgrund des Stoppsatzes Z t hZ τ ∧t i hZ τ ∧t hZ t ii IIE Xs dWs Xs 1Iτ >s dWs = IIE Xs dWs IIE Xs 1Iτ >s dWs Fτ ∧t 0 0 0 Z τ ∧t0 hZ τ ∧t i = IIE Xs dWs Xs 1Iτ >s dWs 0 0 hZ τ ∧t i hZ τ ∧t i 2 2 Xs 1Iτ >s ds = IIE Xs ds . = IIE 0 Daraus folgt IIE hZ τ ∧t t Z Xs dWs − 0 Xs 1Iτ ≥s dWs 0 2 i =0, 0 was die Behauptung beweist. Wir wollen im weiteren das Integral auf L2loc ausdehnen. Definieren wir Tn = RT Rt inf{t : 0 Xs2 ds > n}, so ist 0 n Xs2 ds integrierbar, und Tn → ∞. Satz 4.5. Sei X ∈ L2loc . Dann gibt es einen eindeutigen stochastischen Prozess R Rτ X dW , so dass, falls τ eine Stoppzeit ist, so dass IIE[ 0 Xs2 ds] < ∞, so gilt R τ ∧t Rt R Xs dWs = 0 Xs 1Iτ >s dWs . X dW ist dann ein stetiges lokales Martingal. Ist 0 weiter Y ∈ L2loc , so ist (4.1) ein lokales Martingal. R T ∧t Rt Beweis. Wählen wir Tn wie oben, können wir 0 n Xs dWs = 0 Xs 1ITn >s dWs R T ∧t definieren. Aus Hilfssatz 4.4 folgt, dass für m > n das Integral 0 n Xs 1ITm >s dWs Rt R mit 0 Xs 1ITn >s dWs übereinstimmt. Damit können wir also X dW definieren. Ist Rτ nun τ eine Stoppzeit, so dass IIE[ 0 Xs2 ds] < ∞, so erhalten wir Z Tn ∧t Z Xs 1Iτ >s dWs = 0 t Z Xs 1Iτ >s 1ITn >s dWs = 0 Z = Xs dWs . 0 Xs 1ITn >s dWs 0 Tn ∧(τ ∧t) τ ∧t 4. STOCHASTISCHE ANALYSIS 29 Lassen wir n → ∞, sehen wir, dass die verlangte Bedingung gilt. Ist Y ein beliebiger Rτ Rt Prozess, so dass Yτ ∧t = 0 Xs 1Iτ >s dWs für jede Stoppzeit τ mit IIE[ 0 Xs2 ds] < ∞, so erhalten wir Z Z Tn ∧t t Xs dWs , Xs 1ITn >s dWs = YTn ∧t = 0 0 R T ∧t und Y muss mit dem konstruierten Prozess übereinstimmen. Da 0 n Xs dWs ein R Martingal ist, ist X dW ein lokales Martingal. Ist Y ∈ L2loc , so wählen wir die Rt Rt Stoppzeiten τn = inf{t : min{ 0 Xs2 ds, 0 Ys2 ds} > n}. Dann ist Mτn ∧t ein Martingal, und damit M ein lokales Martingal. Wir weiten nun die Definition des stochastischen Integrals auf Martingale der Rt R Form Nt = 0 Xs dWs aus. Wir wollen Y dN konstruieren. Wir wollen zeigen, R R R dass aus der analogen Konstruktion wie X dW folgt, dass Y dN = Y X dW . Hilfssatz 4.6. Sei Y ein stückweise konstanter Prozess. Dann gilt ∞ X Z t Yτk (Nτk+1 ∧t − Nτk ∧t ) = Ys Xs dWs . 0 k=0 Beweis. Ist X ein stückweise konstanter Prozess, so können wir annehmen, dass X und Y die selben Stoppzeiten benutzen. Also gilt ∞ X Yτk (Nτk+1 ∧t − Nτk ∧t ) = ∞ X Yτk Xτk (Wτk+1 ∧t − Wτk ∧t ) = Ys Xs dWs . 0 k=0 k=0 t Z Sei nun X ∈ L2 . Wählen wir eine Folge von stückweise konstanten Prozessen X n , Rt die X approximiert. Setzen wir Ntn = 0 Xsn dWs . Nehmen wir zuerst an, dass Y durch eine Konstante c beschränkt ist. Wir haben dann IIE ∞ hX Z t Yτk (Nτk+1 ∧t − Nτk ∧t ) − Ys Xs dWs 2 i 0 k=0 n ≤ 3 IIE ∞ hX 2 Yτk (Nτk+1 ∧t − Nτk ∧t − Nτnk+1 ∧t + Nτnk ∧t ) k=0 + + ∞ X k=0 Z t 0 Yτk (Nτnk+1 ∧t − Nτnk ∧t ) Ys (Xsn − Xs ) dWs Z − 2 io 0 t Ys Xsn dWs 2 30 4. STOCHASTISCHE ANALYSIS Der mittlere Term ist Null, und die beiden anderen Terme konvergieren gegen Null, wenn man mit n → ∞ geht. Also gilt auch in diesem Fall die Behauptung. Ist nun Y nicht beschränkt, so erhalten wir für Tm = inf{t : |Yt | > m} Z Tm ∧t ∞ X Yτk (Nτk+1 ∧Tm ∧t − Nτk ∧Tm ∧t ) = Ys Xs dWs . 0 k=0 Lassen wir m → ∞ gilt auch in diesem Fall die Behauptung. Für einen beliebigen Rt Prozess X ∈ L2loc sei Tn = inf{t : 0 Xs2 Ys2 ds > n}. Dann erhalten wir Z Tn ∧t ∞ X Ys Xs dWs . Yτk (Nτk+1 ∧Tn ∧t − Nτk ∧Tn ∧t ) = 0 k=0 Lassen wir n → ∞, folgt die Behauptung. Wir definieren nun L2 (N ) als die Klasse der Prozesse Y ∈ L2loc , so dass gilt R∞ 2 2 IIE[ 0 Ys Xs ds] < ∞. Satz 4.7. Sei Y ∈ L2 (N ). Dann gilt für jede Folge Y n von stückweise konstanRt R∞ ten Prozessen, so dass IIE[ 0 (Ysn − Ys )2 Xs2 ds] → 0, dass sup0≤t≤T { 0 Ysn dNs − Rt Y X dWs } fast sicher und in L2 (IIP) nach Null konvergiert. 0 s s Beweis. Aus h IIE sup 0≤t≤T t nZ Z Ysn 0 Ys Xs dWs o2 i 0 nZ h = IIE sup 0≤t≤T ≤ 4IIE t dNs − t Ysn Xs Z dWs − Ys Xs dWs o2 i 0 0 T hnZ t (Ysn − Ys )Xs dWs o2 i hZ T i = 4IIE (Ysn − Ys )2 Xs2 ds 0 0 2 folgt die Konvergenz in L (IIP). Weiter gilt für n 6= m Z t nZ t o2 n m IIE sup Ys dNs − Ys dNs 0≤t≤T 0 0 Z t nZ t o2 n ≤ 2IIE sup Ys Xs dWs − Ys Xs dWs 0≤t≤T 0 + 0 nZ 0 t Ysm Xs t Z dWs − Ys Xs dWs o2 i 0 hZ T i hZ T i n 2 2 ≤ 8 IIE (Ys − Ys ) Xs ds + IIE (Ysm − Ys )2 Xs2 ds . 0 Rt 0 Somit ist 0 Ysn dNs ein Cauchyfolge. Der Grenzwert kann nur Somit ist die Konvergenz auch fast sicher. Rt 0 Ysn Xs dWs sein. 4. STOCHASTISCHE ANALYSIS 31 Hilfssatz 4.8. Sei Y ∈ L2 (N ) und τ ein Stoppzeit. Dann gilt Z t Z τ ∧t Ys dNs = Ys 1Iτ >s dNs . 0 Beweis. Wir haben Z Z τ ∧t Ys dNs = 0 0 τ ∧t Z Ys Xs dWs = 0 t Z Ys 1Iτ >s Xs dWs = 0 t Ys 1Iτ >s dNs . 0 Rt Wir definieren L2loc (N ) als die Klasse aller Prozesse Y , für die 0 Ys2 Xs2 ds < ∞ für alle t. Rt R τ ∧t Satz 4.9. Sei Y ∈ L2loc (N ). Dann ist 0 Ys 1Iτ >s dNs = 0 Ys Xs dWs für jede Stoppzeit τ , so dass {Xt 1Iτ >t } ∈ L2 (N ). Beweis. Wir haben für {Xt 1Iτ >t } ∈ L2 (N ) Z Z t Z t Ys 1Iτ >s Xs dWs = Ys 1Iτ >s dNs = Xs Ys dWs . 0 0 0 τ ∧t Damit haben wir Rt 0 Ys dNs als Rt 0 Ys Xs dWs konstruiert. 4.2. Die Itô-Formel Definition 4.10. Ein stochastischer Prozess der Form Z t Z t Xt = X0 + Ys dWs + Zs ds 0 0 heisst Itô-Prozess, wenn die Integrale wohldefiniert sind, X0 F0 -messbar ist, und Y und Z adaptiert sind. Hilfssatz 4.11. Ein Itô-Prozess hat eine eindeutige Zerlegung. Beweis. Falls es zwei Zerlegungen (Y 1 , Z 1 ) und (Y 2 , Z 2 ) gibt, dann ist Z t Z t 1 2 (Ys − Ys ) dWs = (Zs2 − Zs1 ) ds 0 0 ein stetiges lokales Martingal von beschränkter Variation. Aus Hilfssatz C.15 schliessen wir, dass beide Seiten Null sind. Daher ist Z 1 = Z 2 . Da hZ t i hZ t 2 i 1 2 2 IIE (Ys − Ys ) ds = IIE (Ys1 − Ys2 ) dWs =0 0 folgt Rt (Ys1 0 − Ys2 )2 0 1 2 ds = 0 und Y = Y . 32 4. STOCHASTISCHE ANALYSIS Es ist nun möglich, das stochastische Integral hinsichtlich eines Itô-Prozesses zu definieren Z t Z t Z t Us dXs = Us Ys dWs + Us Zs ds . 0 0 0 Statt einer Brownschen Bewegung können wir auch p unabhängige Brownsche Bewegungen betrachten. Wir können dann Itô-Prozesse Xt = X0 + p Z X i=1 t Ysi dWsi t Z + Zs ds 0 0 betrachten. Haben wir zwei Itô-Prozesse X 1 und X 2 , dann definieren wir den Prozess 1 2 hX , X it = p Z X i=1 t Ys1,i Ys2,i Z ds = 0 t > Y 1s Y 2s ds , 0 wobei Y j = (Ysj,1 , . . . , Ysj,p ). hX 1 , X 2 it hat folgende Interpretation. Hilfssatz 4.12. Seien Xt1 und Xt2 zwei Itô-Prozesse. Wir setzen tnk = tk2−n . Dann konvergiert 2n X (Xt1nk − Xt1nk−1 )(Xt2nk − Xt2nk−1 ) = hX 1 , X 2 it . lim n→∞ k=1 Beweis. Stoppen wir, wenn max{|Xtk |, |Ytk |, |Ztk |, k = 1, 2} den Wert m erreicht und lassen dann m → ∞, so genügt es die Aussage zu beweisen, wenn alle Prozesse beschränkt sind. Nennen wir die entsprechende Konstante c. Es genügt die Aussage Rt für die einzelnen Terme zu beweisen. Ist Xt2 = 0 Zs2 ds, so ist wegen der Stetigkeit von Xt1 der Pfad Xt1 gleichmässig stetig. Sei ε > 0. Für n gross genug, ist damit |Xt1nk − Xt1nk−1 | < ε. Damit ist Z t 2n 2n X X 1 1 2 2 2 2 |Xtnk − Xtnk−1 | → ε |Zs | ds . (Xtnk − Xtnk−1 )(Xtnk − Xtnk−1 ) < ε k=1 k=1 0 Da ε beliebig war, ist der Grenzwert 0. Die Aussage gilt auch, wenn der erste Prozess von beschränkter Variation ist. Rt Sei nun Xtk = 0 Ysk dWsk für zwei unabhängige Brownsche Bewegungen Wtk . 4. STOCHASTISCHE ANALYSIS 33 Wir finden (mit Hilfe einer Approximation des stochastischen Integrals) 2n o2 i hnX IIE (Xt1nk − Xt1nk−1 )(Xt2nk − Xt2nk−1 ) k=1 n = = ≤ n 2 X 2 X IIE[(Xt1nk − Xt1nk−1 )(Xt2nk − Xt2nk−1 )(Xt1n` − Xt1n`−1 )(Xt2n` − Xt2n`−1 )] k=1 `=1 2n X IIE[{(Xt1nk − Xt1nk−1 )(Xt2nk − Xt2nk−1 )}2 ] k=1 2n X c4 (t2−n )2 = c4 t2 2−n . k=1 Letzteres ist summierbar. Mit Hilfe der Chebychev-Ungleichung und dem Borel– Cantelli-Lemma folgt, dass 2n X 1 1 2 2 (Xtnk − Xtnk−1 )(Xtnk − Xtnk−1 ) > ε k=1 nur endlich oft auftritt. Somit konvergiert dies ebenfalls nach Null. Rt Seien nun Xtk = 0 Ysk dWs für eine Brownsche Bewegung W . Da n 2 X (Xt1nk − Xt1nk−1 )(Xt2nk − Xt2nk−1 ) k=1 n = 1 4 2 X {[(Xt1nk + Xt2nk ) − (Xt1nk−1 + Xt2nk−1 )]2 − [(Xt1nk − Xt2nk ) − (Xt1nk−1 − Xt2nk−1 )]2 i k=1 und Z t Ys1 Ys2 ds = 0 1 4 Z t [(Ys1 + Ys2 )2 − (Ys1 + Ys2 )2 ] ds , 0 genügt es die Aussage für X = X 1 = X 2 zu beweisen. Da M definiert in (4.1) ein Martingal ist, ist Z tnk h i 2 IIE (Xtnk − Xtnk−1 ) − Ys2 ds = 0 . tn k−1 Weiter erhalten wir wegen der Martingaleigenschaft IIE 2n hnX k=1 2 (Xtnk − Xtnk−1 ) − Z tn k tn k−1 n Ys2 ds o2 i = 2 X k=1 Z hn 2 IIE (Xtnk − Xtnk−1 ) − tn k tn k−1 Ys2 ds o2 i . 34 4. STOCHASTISCHE ANALYSIS Rv Betrachten wir der Einfachheit halber nun IIE[(Xv2 − 0 Ys2 ds)2 ]. Wegen der Martingaleigenschaft ist dies Z vkm Z v 2m 2 i 2 i X h h 2 2 2 2 . Ys2 ds = Ys ds IIE (Xvkm − Xvk−1 IIE Xv − m ) − 0 m vk−1 k=1 Pm m 1 m ≤s<v m , so ist der letzte Erwartungswert Approximieren wir Ys durch 2k=1 Yvk−1 Ivk−1 k Z m h 2 i vk IIE (Xv2km − Xv2k−1 Ys2 ds m ) − m vk−1 2 2 −m 2 m Yv m (Wv m − Wv m ) + Y m (Wv m − Wv m ) − Y m 2 v}2 ] . = IIE[{2Xvk−1 vk−1 vk−1 k k−1 k−1 k k−1 m Bedingen auf Fvk−1 gibt IIE h (Xv2km − Xv2k−1 m ) Z vkm − m vk−1 Ys2 ds 2 i 2 −m −2m 2 = IIE[4Xv2k−1 v + 2Yv4k−1 v ]. m Yv m 2 m 2 k−1 Wir können Ysi durch c abschätzen. Weiter haben wir m hZ vk−1 i 2 2 m IIE[Xvk−1 E Ys ds ≤ c2 vk−1 ≤ c2 v . m ] = II 0 Damit erhalten wir Z h 2 2 IIE (Xvkm − Xvk−1 m ) − vkm m vk−1 Also ist IIE h Xv2 Z − Ys2 v Ys2 ds ds 2 i 2 i ≤ (4 · 2−m + 2 · 2−2m )c4 v 2 . ≤ (4 + 2 · 2−m )c4 v 2 . 0 Unterteilen wir also im ursprünglichen Ausdruck das Intervall in 2m Unterintervalle, wobei m > n, so erhalten wir Z tnk 2n 2n hnX o2 i X 2 2 IIE (X̃tnk − X̃tnk−1 ) − Ỹs ds ≤ (4 + 2 · 2−m )c4 (2−n t)2 tn k−1 k=1 k=1 = (4 + 2 · 2−m )c4 2−n t2 , wobei wir mit Ỹ und X̃ die Approximationen bezeichnen. Da die linke Seite nicht von m abhängt, können wir m gegen Unendlich gehen lassen, und erhalten damit Z tnk 2n hnX o2 i 2 2 n n IIE (Xtk − Xtk−1 ) − Ys ds ≤ 4c4 2−n t2 . k=1 tn k−1 Verwenden wir wieder die Chebychev-Ungleichung und das Borel–Cantelli-Lemma, so erhalten wir wie im Falle von unabhängigen Brownsche Bewegungen die Behauptung. 4. STOCHASTISCHE ANALYSIS 35 Proposition 4.13. (partielle Integration) Seien X 1 und X 2 Itô-Prozesse. Dann gilt Z t Z t 2 1 1 2 1 2 Xs dXs + Xs1 dXs2 + hX 1 , X 2 it . Xt X t = X0 X 0 + 0 0 Wir haben für tk = tk2−n Beweis. n Xt1 Xt2 − X01 X02 = 2 X n Xt1k−1 (Xt2k k=1 − Xt2k−1 ) + 2 X Xt2k−1 (Xt1k − Xt1k−1 ) k=1 + 2n X (Xt1k − Xt1k−1 )(Xt2k − Xt2k−1 ) . k=1 Diese Terme konvergieren gegen die gesuchten Integrale. Das nächste Resultat, bekannt unter dem Namen Itô-Formel, ist wichtig in Anwendungen. Satz 4.14. Seien X = (X 1 , . . . , X n )> Itô-Prozesse hinsichtlich einer p-dimensionalen Brownschen Bewegung. Sei f : IRn+1 → IR eine Funktion, die stetig differenzierbar ist bezüglich der ersten Variablen und zweimal stetig differenzierbar ist bezüglich der andern Variablen. Dann ist f (t, X t ) ein Itô-Prozess und Z t n Z t X ∂ ∂ f (s, X s ) ds + f (s, X s ) dXsi f (t, X t ) = f (0, X 0 ) + i ∂s ∂x 0 i=1 0 Z n t 2 X ∂ + 12 f (s, X s ) dhX i , X j is . i j ∂x x i,j=1 0 Beweis. Die Formel gilt trivialerweise für f (t, x) = c ∈ IR, f (t, x) = t und f (t, x) = xi . Nehmen wir an, die Formel gilt für f (t, x) und g(t, x). Die partielle Integration ergibt dann Z t f (t, X t )g(t, X t ) = f (0, X 0 )g(0, X 0 ) + g(s, X s ) df (s, X s ) 0 Z t + f (s, X s ) dg(s, X s ) + hf (·, X)g(·, X)it . 0 Wir haben Z tX n X n ∂ ∂ f (s, X s ) j g(s, X s ) dhX i , X j is . hf (·, X)g(·, X)it = i ∂x 0 i=1 j=1 ∂x 36 4. STOCHASTISCHE ANALYSIS Setzen wir alle Terme zusammen, erhalten wir, dass die Itô-Formel auch für das Produkt f (t, X t )g(t, X t ) gilt. Weiter, konvergiert f n (t, x) nach f (t, x), so dass auch die Ableitungen konvergieren und beschränkt sind, so gilt die Formel auch für f (t, x), falls sie für f n (t, x) gilt. Da die Formel für alle Polynome gilt, und sich jede stetige beschränkte Funktion durch Polynome gleichmässig approximieren lässt, gilt sie damit für alle beschränkten Funktionen, deren erste und zweite Ableitung beschränkt sind. Wir können die Prozesse so stoppen, dass die Funktionen und die Ableiungen beschränkt sind. Daher gilt die Aussage auch für die behaupteten Funktionen. Die letzte Summe in der Itô-Formel erscheint wegen der quadratischen Variation. Für einen Itô-Prozess schreiben wir kurz dXt = Yt dWt + Zt dt . Die eindimensionale Itô-Formel können wir dann schreiben als df (t, Xt ) = fx (t, Xt )Yt dWt + (ft (t, Xt ) + fx (t, Xt )Zt + 12 fxx (t, Xt )Yt2 ) dt . Beispiel 4.15. Ist f (t, x) = x2 , finden wir Z t Z t Z t 2 1 Wt = 2Ws dWs + 2 2 ds = 2 Ws dWs + t . 0 Dies führt zur Formel Rt 0 0 0 Ws dWs = 21 (Wt2 − t). 4.3. Stochastische Differentialgleichungen Seien b : IR+ × IR → IR und σ : IR+ × IR → IR+ zwei Funktionen. Wir sagen, X ist eine Lösung der stochastischen Differentialgleichung dXt = σ(t, Xt ) dWt + b(t, Xt ) dt , falls Z Xt = X 0 + t Z σ(s, Xs ) dWs + 0 und die Integrale wohldefiniert sind. t b(s, Xs ) ds 0 (4.5) 4. STOCHASTISCHE ANALYSIS 37 Satz 4.16. Seien b und σ stetige Funktionen, so dass es ein K ∈ IR gibt, mit i) |b(t, x) − b(t, y)| + |σ(t, x) − σ(t, y)| ≤ K|x − y| , ii) |b(t, x)| + |σ(t, x)| ≤ K(1 + |x|) , für alle x, y. Falls IIE[X02 ] < ∞, gibt es im Interval [0, T ] eine eindeutige Lösung zu (4.5) mit Anfangswert X0 . Diese Lösung erfüllt IIE[sup{|Xt |2 : 0 ≤ t ≤ T }] < ∞. Beweis. Betrachten wir die Klasse E der adaptierten Prozesse X auf [0, T ], die IIE[sup{|Xt |2 : 0 ≤ t ≤ T }] < ∞ erfüllen. Ausgestattet mit der Norm kXk = 1 IIE[sup{|Xt |2 : 0 ≤ t ≤ T }] 2 ist E ein Banachraum. Dann ist die Abbildung Φ, Z t Z t Φ(X)t = X0 + σ(s, Xs ) dWs + b(s, Xs ) ds 0 0 wohldefiniert. Das stochastische Integral ist ein Martingal, da E ⊂ L2 . Es folgt damit aus den Annahmen und aus Proposition C.9, dass Φ(X) ∈ E. Mit Hilfe von (a + b)2 ≤ 2(a2 + b2 ) schliessen wir für X, Y ∈ E, Z t 2 2 |Φ(X)t − Φ(Y )t | ≤ 2 sup (σ(s, Xs ) − σ(s, Ys )) dWs 0≤t≤T 0 Z t 2 + sup (b(s, Xs ) − b(s, Ys )) ds . 0≤t≤T 0 Aus Proposition C.9 schliessen wir 2 h IIE[|Φ(X)t − Φ(Y )t | ] ≤ 2IIE sup 0≤t≤T Z t |b(s, Xs ) − b(s, Ys )| ds 2 i 0 hZ T (σ(s, Xs ) − σ(s, Ys ))2 ds h0 i 2 2 2 ≤ (2K T + 8K T )IIE sup |Xt − Yt |2 + 8IIE i 0≤t≤T 2 2 2 = (2K T + 8K T )kX − Y k2 . Falls T klein genug ist, sagen wir T ≤ T0 , ist Φ eine Kontraktion. Daher gibt es eine eindeutige (in E) Lösung auf [0, T ∧ T0 ]. Da IIE[XT20 ] < ∞, können wir nun Prozesse betrachten, die auf [0, T0 ] mit X übereinstimmen (wir nehmen T > T0 an). Wir schliessen dann mit dem gleichen Argument, dass es eine eindeutige Lösung auf [0, T ∧ 2T0 ] gibt. Vollständige Induktion ergibt eine eindeutige Lösung auf [0, T ]. Es bleibt zu zeigen, dass die Lösung eindeutig ist in der Klasse der Itô-Prozesse. Dazu zeigen wir, dass eine Lösung in E sein muss. Sei X eine Lösung von (4.5). 38 4. STOCHASTISCHE ANALYSIS Sei τn = inf{s : |Xs | > n} und f n (t) = IIE[sup{|Xs |2 : 0 ≤ s ≤ t ∧ τn }]. Da (a + b + c)2 ≤ 3(a2 + b2 + c2 ) erhalten wir (wie oben) hZ t∧τn 2 i hZ t∧τn i n 2 f (t) ≤ 3 IIE[X0 ] + IIE |b(s, Xs )| ds + 4IIE σ 2 (s, Xs ) ds 0 0 hZ t∧τn 2 i hZ t∧τn i 2 ≤ 3 IIE[X0 ] + IIE K(1 + |Xs |) ds + 4IIE K 2 (1 + |Xs |)2 ds 0 0 Z t i h 2 2 2 2 ds 1 + IIE sup |Xv | ≤ 3 IIE[X0 ] + 2(K T + 4K ) 0≤v≤s∧τn 0 Z t 2 2 2 f n (s) ds . = 3(IIE[X0 ] + 2T K (T + 4)) + 6K (T + 4) 0 Aus Gronwalls Lemma F.1 finden wir f n (T ) ≤ 3(IIE[X02 ] + 2T K 2 (T + 4))(1 + exp{6K 2 (T + 4)T }) . Da diese Konstante nicht von n abhängt, folgt aus monotoner Konvergenz, dass X ∈ E. 4.4. Der Ornstein–Uhlenbeck-Prozess Betrachten wir die folgende stochastische Differentialgleichung dXt = −cXt dt + σ dWt , X0 = x. Dann sind die Bedinungen des Satzes 4.16 erfüllt, und es gibt eine eindeutige Lösung X. Der Prozess heisst Ornstein–Uhlenbeck-Prozess. Aus der Itô-Formel schliessen wir, dass Yt = Xt ect die folgende Differentialgleichung erfüllt, dYt = cXt ect dt + ect dXt = σect dWt . Daher ist Yt = x + σ Rt 0 ecs dWs , und Xt = xe −ct + σe −ct Z t ecs dWs . (4.6) 0 Der Mittelwert ist somit IIE[Xt ] = xe−ct und die Varianz ist Z t 1 − e−2ct 2 −2ct Var[Xt ] = σ e e2cs ds = σ 2 . 2c 0 Man kann einfach zeigen, dass X ein Gauss-Prozess ist. Lassen wir t → ∞, sehen wir, dass die Verteilung schwach gegen eine Normalverteilung mit Mittelwert 0 und 4. STOCHASTISCHE ANALYSIS 39 Varianz σ 2 /(2c) konvergiert. Starten wir in X0 mit dieser Verteilung, so haben wir einen stationären Prozess. Der Ornstein–Uhlenbeck-Prozess hat die Eigenschaft, dass er immer versucht zum Wert 0 zurückzukehren. Je weiter der Prozess von 0 entfernt ist, desto stärker ist die Drift gegen 0. 4.5. Mehrdimensionale Differentialgleichungen Sei W eine p-dimensionale Brownsche Bewegung. Gegeben seien Funktionen b : IR+ × IRn → IRn und σ : IR+ × IRn → IRn×p , sowie eine n-dimensionale F0 -messbare Zufallsvariable X 0 . Dann betrachten wir die n-dimensionale stochastische Differentialgleichung dX t = σ(t, X t ) dW t + b(t, X t ) dt . (4.7) Dies ist für jede Koordinate eine stochastische Differentialgleichung, und die Lösung muss das System der Differentialgleichungen erfüllen. Ähnlich wie im eindimensionalen Fall kann man folgenden Satz beweisen. Wir bezeichnen mit |x| die Euklidsche Norm in IRn und mit |σ| die Euklidsche Norm in IRn×p . Satz 4.17. Nehmen wir an, dass b und σ stetige Funktionen sind, die i) |b(t, x) − b(t, y)| + |σ(t, x) − σ(t, y)| ≤ K|x − y| , ii) |b(t, x)| + |σ(t, x)| ≤ K(1 + |x|) , erfüllen, und dass IIE[|X 0 |2 ] < ∞. Dann gibt es eine eindeutige Lösung X von (4.7). Weiter gilt, dass für alle T , IIE[sup{|X s |2 : 0 ≤ s ≤ T }] < ∞. Betrachten wir wieder der Einfachheit halber den eindimensionalen Fall. Da dXt eine Funktion von t, Xt und dWt ist, erwarten wir, dass die Zukunft der Lösung X nicht von der Vergangenheit abhängt. Das heisst, wir vermuten, dass die Lösung ein Markov-Prozess ist. Dies ist in der Tat der Fall. Nehmen wir an, dass t < s, und dass der Prozess bis zum Zeitpunkt t beobachtet wurde. Dann ist IIE[Xt2 ] < ∞, und es gibt einen eindeutigen Prozess Y , der die Gleichung Z t+v Z t+v Yv = Xt + σ(u, Yu−t ) dWu + b(u, Yu−t ) du t t erfüllt. Da Yv = Xt−v die Gleichung auch erfüllt, hat man ein heuristisches Argument, dass die Verteilung von Xs nur von Xt , und nicht von Ft abhängt. Einen formalen Beweis findet man in [7]. 40 4. STOCHASTISCHE ANALYSIS Satz 4.18. Seien die Bedinungen des Satzes 4.17 erfüllt und sei X die Lösung von (4.7). Dann ist X ein starker Markov-Prozess. Wir haben folgendes Korollar 4.19. Seien die Bedinungen des Satzes 4.17 erfüllt und sei X die Lösung von (4.7). Seien f (x) und r(t, x) ≥ 0 messbare Funktionen. Dann gibt es für jedes s < t eine messbare Funktion φ(x), so dass i h Rt IIE e− s r(v,X v ) dv f (X t ) Fs = φ(X s ) . 5. DAS BLACK–SCHOLES-MODELL 5. 41 Das Black–Scholes-Modell Wir arbeiten auf einem Wahrscheinlichkeitsraum (Ω, F, IIP) mit einer Brownschen Bewegung W auf dem Interval [0, T ] und der natürlichen Filtration {Ft }. Wir nehmen der Einfachheit halber an, dass F = FT . Wir betrachten nun einen Markt, in dem ein risikofreier Aktiv S 0 existiert, der der Differentialgleichung dSt0 = rSt0 dt genügt. Wir setzen S00 = 1. Dann gilt St0 = ert . Im Weiteren gibt es einen riskanten Aktiv S, der die stochastische Differentialgleichung dSt = σSt dWt + µSt dt erfüllt. Da man normalerweise eine Prämie für das Risiko bezahlt, können wir annehmen, dass µ > r. Dies ist aber für unsere Betrachtungen ohne Bedeutung. Wir nehmen an, dass S0 > 0. Wir können die Gleichung durch St teilen und dadurch die Variable St von den Variablen t und Wt separieren. Im Falle einer klassischen Differentialgleichung würde man dann eine Lösung für log St erhalten. Wir betrachten daher den Prozess Yt = log St . Da wir nicht wissen, dass St > 0 für alle t, stoppen wir zuerst den Prozess zur Zeit τε = inf{t : St < ε}. Aus der Itô-Formel schliessen wir für t ≤ τε 1 1 2 1 2 µSt − 21 σ (S ) dt = σ dWt + (µ − 21 σ 2 ) dt . dYt = σSt dWt + t St St (St )2 Diese Gleichung ist nun einfach zu lösen, Yt = Y0 + σWt + (µ − 21 σ 2 )t, und daher St = S0 exp{σWt + (µ − 21 σ 2 )t} . Insbesondere gilt die Formel auch, wenn wir ε → 0 gehen lassen. Wir müssen somit nicht in τε stoppen. Wir sehen, dass St lognormal verteilt ist. Wir wollen nun den Begriff “selbstfinanzierend” auf das Black–Scholes Modell übertragen. Ein Portfolio ist ein Prozess {φt } = {(φ0t , φt )}, der angibt wieviele Einheiten des risikolosen und des riskanten Aktivs man zur Zeit t hält. Der Wert des Portfolios ist dann Vt = φ0t St0 + φt St . Selbstfinanzierend bedeutet ja, dass man weder Geld konsumiert, noch Geld dazufügt, also dVt (φ) = φ0t dSt0 + φt dSt . 42 5. DAS BLACK–SCHOLES-MODELL Rt Die stochastischen Integrale auf der rechten Seite sind wohldefiniert, falls 0 |φ0s | ds < Rt ∞ und 0 (φs )2 ds < ∞. Wir brauchen also die folgende Definition. Definition 5.1. Eine selbstfinanzierende Strategie ist ein adaptierter Prozess φ, so dass Z T (|φ0t | + (φt )2 ) dt < ∞ , i) 0 φ0t St0 ii) + φt St = φ00 S00 Z + φ0 S0 + t φ0s dSs0 Z 0 0 für alle t ∈ [0, T ]. t φs dSs + Betrachten wir die diskontierten Prozesse S̃t0 = 1 und S̃t = e−rt St , sowie den diskontierten Wert Ṽt (φ) = e−rt Vt (φ). Dann können wir die Definition wie folgt schreiben. Hilfssatz 5.2. Sei φ ein adaptierter Prozess, so dass ist genau dann selbstfinanzierend, wenn Z t Ṽt (φ) = V0 (φ) + φs dS̃s . RT 0 (|φ0t | + (φt )2 ) dt < ∞. φ 0 Beweis. Sei φ selbstfinanzierend. Dann gilt dṼt (φ) = −rṼt (φ) dt + e−rt dVt (φ) = −r(φ0t S̃t0 + φt S̃t ) dt + e−rt (φ0t dSt0 + φt dSt ) = φ0t dS̃t0 + φt dS̃t = φt dS̃t . Die Umkehrung folgt ähnlich. Wir konstruieren nun ein äquivalentes Mass. Proposition 5.3. (Girsanovs Theorem) Sei L = exp{−(µ − r)WT /σ − 12 (µ − r)2 T /σ 2 }. Definieren wir das äquivalente Mass IIP∗ [A] = IIE[L1IA ] auf FT . Dann ist Wt∗ = Wt + (µ − r)t/σ für 0 ≤ t ≤ T eine Brownsche Bewegung unter IIP∗ . Insbesondere ist {S̃t } ein Martingal unter IIP∗ . Beweis. Der Prozess {Wt∗ } ist stetig und W0∗ = 0. Der Prozess Lt = exp{−(µ − r)Wt /σ − 12 (µ − r)2 t/σ 2 } = IIE[L | Ft ] ist ein IIP-Martingal. Für A ∈ Ft gilt dann IIP∗ [A] = IIE[Lt 1IA ], siehe (D.1), und IIP∗ [A | Fs ] = IIE[Lt 1IA | Fs ]/Ls für s ≤ t, siehe (D.2). 5. DAS BLACK–SCHOLES-MODELL 43 Betrachten wir nun einen Zuwachs von {Wt∗ }. Dann gilt für β ∈ IR, 0 ≤ t < t + s ≤ T und θ = (µ − r)/σ, ∗ IIE∗ [exp{β(Wt+s − Wt∗ )} | Ft ] = IIE[exp{β(Wt+s − Wt + θs) − θ(Wt+s − Wt ) − 21 θ2 s} | Ft ] = IIE[exp{(β − θ)(Wt+s − Wt )}] exp{(βθ − 21 θ2 )s} = exp{ 12 (β − θ)2 s + (βθ − 12 θ2 )s} = exp{ 12 β 2 s} . ∗ − Wt∗ unabhängig von Ft und normalverteilt Wir haben somit gezeigt, dass Wt+s mit Mittelwert 0 und Varianz s ist. Daher ist W ∗ eine Brownsche Bewegung. Da S̃t = S0 exp{σWt + (µ − 12 σ 2 − r)t} = S0 exp{σWt∗ − 21 σ 2 t} , folgt sofort, dass S̃ ein IIP∗ -Martingal ist. Definition 5.4. Eine Strategie φ heisst zulässig, falls sie selbstfinanzierend ist, und Vt (φ) ≥ 0 für alle t oder IIE∗ [(supt Vt (φ))2 ] < ∞. Eine Strategie φ heisst Arbitrage, falls sie zulässig ist, V0 (φ) = 0, VT (φ) ≥ 0 und IIP[VT (φ) > 0] > 0. Im diskreten Fall genügte es anzunehmen, dass VT (φ) ≥ 0. Falls es keine Arbitrage gab, war dann automatisch Vt (φ) ≥ 0 für alle t. Dies ist hier nicht mehr der Fall. Beispiel 5.5. Das Startkapital sei V0 (φ) = 0, und wir definieren dann folgende 1 Strategie: φt = σ −1 (1 − t)− 2 1Iτ >t /S̃t , wobei τ = inf{t > 0 : Ṽt (φ) > 1}. Wir haben Z t Z t Z t∧τ 1 ∗ φs dS̃s = σ φs S̃s dWs = (1 − s)− 2 dWs∗ . Ṽt (φ) = 0 0 0 Rt Wir setzen θt = σ 2 0 φ2s S̃s2 ds = − log(1 − (t ∧ τ )). Wir wählen {φ0t } so, dass die Strategie selbstfinanzierend wird. Die Strategie ist wohldefiniert, falls τ < 1. Es ist einfach zu zeigen, dass Ṽ1−e−t (φ) eine standard Brownsche Bewegung ist. Daher ist IIP∗ [τ < 1] = 1 = IIP[τ < 1] und die Strategie ist wohldefiniert. Da Ṽ1 (φ) = 1, hätten wir eine Arbitrage, falls wir nur verlangen würden, dass V1 (φ) ≥ 0. Das folgende Resultat ist oft nützlich. Satz 5.6. (Martingal-Repräsentationstheorem) Sei {Ft } erzeugt durch die W Brownsche Bewegung W , und F = t≥0 Ft . Sei M ein quadratisch integrierbares 44 5. DAS BLACK–SCHOLES-MODELL Martingal (das heisst, supt≥0 IIE[Mt2 ] < ∞). Dann gibt es einen adaptierten Prozess R∞ {Ht } mit IIE[ 0 Ht2 dt] < ∞, so dass Z Mt = M0 + t Hs dWs . 0 Bemerkung. Es ist hier wichtig, dass die Filtration nur durch die Brownsche Bewegung erzeugt wird. Satz 5.7. Im Black–Scholes-Modell gibt es keine Arbitrage. Beweis. Sei φ eine zulässige Strategie mit V0 (φ) = 0 und VT (φ) ≥ 0. Dann ist Z t Z t Ṽt (φ) = V0 (φ) + φs dS̃s = V0 (φ) + φs σ S̃t dWs∗ 0 0 ein lokales IIP∗ -Martingal. Nehmen wir die quadratische Integrierbarkeit an. Dann folgt, dass {Ṽt (φ)} ein IIP∗ -Martingal ist. Wir haben 0 = V0 (φ) = IIE∗ [ṼT (φ)]. Nehmen wir die Positivität an. Dann ist {Ṽt (φ)} ein Supermartingal (Hilfssatz C.14). Also erhalten wir 0 = V0 (φ) ≥ IIE∗ [ṼT (φ)] ≥ 0 . Somit IIP∗ [ṼT (φ) = 0] = 1. Da IIP und IIP∗ äquivalent sind, gilt auch IIP[ṼT (φ) = 0] = 1. Somit gibt es keine Arbitrage. Wie im diskreten Fall nennen wir h = f (S) einen bedingten Anspruch, wobei f : IR[0,T ] → IR+ ein positives Funktional ist. Der Einfachheit halber wird h im Zeitpunkt T ausbezahlt. Satz 5.8. Im Black–Scholes-Modell ist jeder bedingte Anspruch h mit der Eigenschaft IIE∗ [h2 ] < ∞ reproduzierbar, das heisst, es gibt ein zulässiges Portfolio φ, so dass VT (φ) = h. Der Wert dieses Portfolios (und damit der Preis) ist gegeben durch Vt (φ) = IIE∗ [e−r(T −t) h | Ft ] . Beweis. Da Ṽt (φ) = IIE∗ [e−rT h | Ft ] 5. DAS BLACK–SCHOLES-MODELL 45 ein quadratisch integrierbares Martingal ist, gibt es nach dem RepräsentationstheoRt rem einen Prozess H, so dass Ṽt (φ) = V0 (φ)+ 0 Hs dWs∗ . Setzen wir φt = Ht /(σ S̃t ), lässt sich φ0t konstruieren, so dass φ eine selbstfinanzierende Strategie ist. Es gilt Rt Rt Rt φ dS̃s = 0 Hs dWs∗ . Wegen der quadratischen Integrierbarkeit, ist { 0 φs dS̃s } 0 s ein Martingal. Wir haben dann VT (φ) = erT ṼT (φ) = erT IIE∗ [e−rT h | FT ] = h , das heisst, dass h reproduzierbar ist. Aus der Martingaleigenschaft folgt Vt (φ) = ert Ṽt (φ) = ert IIE∗ [e−rT h | Ft ] = IIE∗ [e−r(T −t) h | Ft ] . Da damit Vt (φ) ≥ 0, ist die Strategie zulässig. Falls h = f (ST ), haben wir Vt (φ) = e−r(T −t) IIE∗ [f (ST ) | Ft ]. Da ST lognormalverteilt ist, erhalten wir Z ∞ √ 1 2 −r(T −t) Vt (φ) = e f (St exp{σz T − t + (r − 12 σ 2 )(T − t)}) √ e−z /2 dz 2π −∞ Z ∞ 1 2 n −r(T −t) [v − log St − (r − 2 σ )(T − t)]2 o e f (ev ) exp − dv . (5.1) = p 2σ 2 (T − t) σ 2π(T − t) −∞ Wir sehen, dass Vt (φ) = f (t, St ) für eine Funktion f : IR2+ → IR+ . Setzen wir d1/2 = log x/K + (r ± 21 σ 2 )(T − t) √ , σ T −t erhalten wir die sogenannte Black–Scholes-Formel. Eine einfache Rechung ergibt für die Call Option f (ST ) = (ST − K)+ den Wert der Strategie f (t, x) = xΦ(d1 ) − Ke−r(T −t) Φ(d2 ) . Die Put-Option f (ST ) = (K − ST )+ hat den Wert f (t, x) = Ke−r(T −t) Φ(−d2 ) − xΦ(−d1 ) . Mit Φ(x) bezeichnen wir die Verteilungsfunktion der Standard-Normalverteilung. Der Erfolg der Black–Scholes-Formel rührt daher, dass der Driftparameter µ keine Rolle spielt. Es spielt also keine Rolle, was der einzelne Agent glaubt. Man braucht nur die Volatilität σ zu schätzen. Das macht man normalerweise, in dem man σ aus historischen Daten schätzt. Eine andere Möglichkeit wäre, Optionspreise in die Black–Scholes-Formel einzusetzen, und dann nach σ aufzulösen. 46 5. DAS BLACK–SCHOLES-MODELL Setzt man Optionspreise in die Black–Scholes-Formel ein, dann heisst das erhaltene σ implizierte Volatilität. Man kann sich jetzt verschiedene Laufzeiten der Option ansehen. Es stellt sich heraus, dass sich die implizierte Volatilität mit der Laufzeit ändert. Verbindet man die Punkte, erhält man eine konvexe Kurve. Man kann sich die implizierte Volatilität auch als Funktion des Ausübungspreises K ansehen. Auch hier erhält man eine konvexe Kurve. Diese Kurve nennt man Volatility-Smile. Der Grund dafür ist, dass das Black–Scholes-Modell nicht ganz der Realität entspricht. Es gibt (wenige) Tage, wo die Börse grosse Sprünge macht. Im weiteren ist die Volatilität nicht konstant. Für diese Unsicherheiten verlangt der Markt auch eine Prämie. Nehmen wir an, dass Vt (φ) = f (t, St ), und dass f (t, x) zweimal stetig nach x differenzierbar ist, und einmal stetig nach t. Dies ist der Fall, wenn h = f (ST ), wie man aus (5.1) erkennen kann. Setzen wir f˜(t, x) = f (t, xert )e−rt . Dann ist der diskontierte Wert des bedingten Anspruchs Ṽt (φ) = f˜(t, S̃t ) . Aus der Itô-Formel schliessen wir dann Z t Z t ∗ [f˜t (s, S̃s ) + 12 σ 2 S̃s2 f˜xx (s, S̃s )] ds . σ S̃s f˜x (s, S̃s ) dWs + f˜(t, S̃t ) = V0 + 0 0 Da Ṽt (φ) ein Martingal unter IIP∗ ist, muss der Teil mit der beschränkten Variation verschwinden. Also gilt Z t Z t ∗ σ S̃s f˜x (s, S̃s ) dWs = V0 + f˜x (s, S̃s ) dS̃s . f˜(t, S̃t ) = V0 + 0 0 Aus Hilfssatz 5.2 schliessen wir, dass die Strategie φt = f˜x (t, S̃t ) = fx (t, St ) selbstfinanzierend ist. Sie reproduziert aber auch den (diskontierten) Wert des bedingten Anspruchs. Die Anzahl Einheiten, die wir in den risikolosen Aktiv investieren, ist daher φ0t = (f (t, St ) − f˜x (t, St e−rt )St )e−rt = (f (t, St ) − fx (t, St )St )e−rt . Für die europäische Call-Option erhalten wir φt = Φ(d1 ) und φ0t = −Ke−rT Φ(d2 ). Für die europäische Put-Option erhalten wir φt = −Φ(−d1 ) und φ0t = Ke−rT Φ(−d2 ). In der Praxis nennt man fx (t, St ) “delta”, und die zweite Ableitung fxx (t, St ) “gamma”. Die Grösse gamma ist ein Mass, wie schnell man Aktien kaufen oder verkaufen muss, wenn sich der Aktienpreis ändert. Da man in der Praxis Administrationskosten und Steuern bezahlen muss, möchte man gerne ein kleines gamma 5. DAS BLACK–SCHOLES-MODELL 47 haben. Mit “theta” bezeichnet man ft (t, St ), was zusammen mit gamma ein Mass ist, wie schnell man den risikolosen Aktiv kaufen oder verkaufen muss, siehe (6.1). Als letzte Grösse hat man df (t, St )/dσ, die Ableitung bezüglich der Voltilität, definiert. Diese Grösse nennt man “vega”. Vega ist ein Mass, wie sensitiv der Preis hinsichtlich der Volatilität ist. Da man σ schätzen muss, ist vega das Risiko, das man eingeht, wenn man ein “falsches” σ für die Preisberechnung benutzt. Betrachten wir nun eine amerikanische Option. Das ist, die Auszahlung wird durch einen positiven Prozess {ht } bestimmt. Der Halter der Option kann eine Stoppzeit τ ≤ T bestimmen, und erhält dann den Betrag hτ . In diskreter Zeit haben wir gesehen, dass der Preis der amerikanischen Option mit einem optimalen Stoppproblem zusammenhängt. Weiter haben wir gesehen, dass, falls der Halter der Option nicht optimal stoppt, der Verkäufer der Option einen Gewinn macht. Dieser Gewinn kann aus dem Portfolio herausgenommen werden, was wir als Konsum von Kapital interpretieren können. Definition 5.9. Eine Handelsstrategie mit Konsum ist ein adaptierter ProRT zess φ, so dass 0 (|φ0t | + φ2t ) dt < ∞ und Z t Z t 0 0 0 0 0 0 φs dSs − Ct , φs dSs + φt St + φt St = φ0 S0 + φ0 S0 + 0 0 wobei C ein adaptierter wachsender Prozess mit C0 = 0 ist. Wir betrachten den Spezialfall ht = ψ(St ), wobei ψ(x) eine lineare obere Schranke ψ(x) ≤ A + Bx hat, für ein A, B ≥ 0. Wir suchen jetzt eine Strategie φ, so dass Vt (φ) ≥ ψ(St ) für alle t. Wie im diskreten Fall bezeichnen wir mit Tt die Klasse der Stoppzeiten mit Werten in [t, T ]. Satz 5.10. Sei f (t, x) = sup IIE∗ [e−r(τ −t) ψ(x exp{(r − 12 σ 2 )(τ − t) + σ(Wτ∗ − Wt∗ )})] . τ ∈Tt Dann gibt es eine Strategie φ, so dass Vt (φ) = f (t, St ) ≥ ψ(St ). Ist φ0 eine Strategie mit Konsum mit der Eigenschaft, dass Vt (φ0 ) ≥ ψ(St ), dann gilt Vt (φ0 ) ≥ Vt (φ). Beweis. Wählen wir die Stoppzeit τ = t, sehen wir dass f (t, St ) ≥ ψ(St ). Da Ts ⊂ Tt für t ≤ s ≤ T , haben wir für jede Stoppzeit τ ∈ Ts , f (t, St )e−rt ≥ IIE∗ [e−rτ ψ(Sτ ) | Ft ] = IIE∗ [IIE∗ [e−rτ ψ(Sτ ) | Fs ] | Ft ] . 48 5. DAS BLACK–SCHOLES-MODELL Wählen wir eine Stoppzeit τ , so dass f (s, Ss ) ≤ IIE∗ [e−r(τ −s) ψ(Sτ ) | Fs ] + ε. Da f (t, x) stetig in x ist, kann τ messbar gewählt werden. Der Beweis beruht auf der gleichmässigen Stetigkeit in einem Intervall. Dann erhalten wir f (t, St )e−rt ≥ IIE∗ [f (s, Ss )e−rs − ε | Ft ] . Da ε beliebig ist, haben wir IIE∗ [f (s, Ss )e−rs | Ft ] ≤ f (t, St )e−rt . Somit ist der Prozess {f (t, St )e−rt } ein Supermartingal. Sei nun M ein IIP∗ -Supermartingal mit der Eigenschaft, dass Mt ≥ ψ(St )e−rt für alle t. Dann gilt für τ ∈ Tt Mt ≥ IIE∗ [Mτ | Ft ] ≥ IIE∗ [e−rτ ψ(Sτ ) | Ft ] . Nehmen wir das Supremum über Tt , erhalten wir, dass Mt ≥ e−rt f (t, St ). Daher ist f (t, St ) die Snell-Hülle von e−rt ψ(St ). Sei φ0 eine Strategie mit Konsum mit Vt (φ0 ) ≥ ψ(St ). Dann gilt für den diskontierten Wert dieser Strategie Z t 0 0 −rt 0 φs dS̃s . Ṽt (φ ) + e Ct = V0 (φ ) + 0 Somit ist {Ṽt (φ0 ) + e−rt Ct0 } ein positives lokales Martingal, das bedeutet ein Supermartingal. Sei τ eine beliebige Stoppzeit. Dann ist IIE∗ [e−rτ ψ(Sτ )] ≤ IIE∗ [Ṽτ (φ0 )] ≤ IIE∗ [Ṽτ (φ0 ) + e−rτ Cτ0 ] ≤ V0 (φ0 ) . Nehmen wir das Supremum über alle Stoppzeiten, haben wir V0 (φ0 ) ≥ f (0, S0 ). Analog erhält man Vt (φ0 ) ≥ f (t, St ). Es bleibt zu zeigen, dass es eine Strategie φ gibt, so dass Vt (φ) = f (t, St ). Wir haben die Abschätzung f (t, St ) = sup IIE∗ [e−r(τ −t) ψ(Sτ ) | Ft ] ≤ sup IIE∗ [e−r(τ −t) (A + BSτ ) | Ft ] ≤ A + BSt . τ ∈Tt τ ∈Tt Da {St e−rt } ein IIP∗ -Martingal ist, ist es von der Klasse DL. Daraus schliessen wir, dass {f (t, St )e−rt } von der Klasse DL ist. Somit gibt es die Doob–Meyer-Zerlegung f (t, St )e−rt = M̃t − Ãt , wobei M̃ ein Martingal ist und à ein wachsender vorhersehbarer Prozess ist. Da {f (t, St )e−rt } ein stetiges Supermartingal ist, muss M̃ auch stetig sein. Da M̃T − ÃT quadratisch integrierbar und positiv ist, kann man zeigen, dass auch M̃T quadratisch integrierbar ist. Somit gibt es eine Strategie {φ̃t }, mit Rt M̃t = M̃0 + 0 φ̃s dS̃s . Setzen wir φ̃0t = M̃t − φ̃t S̃t , erhalten wir eine selbstfinanzierende Strategie. Da M̃ quadratisch integrierbar und positiv ist, ist die Strategie φ zulässig. Die Strategie φ mit φt = φ̃t und φ0t = φ̃0t − Ãt ist eine Handelsstrategie mit Konsum Ct = ert At , die den Wert f (t, St ) hat. 5. DAS BLACK–SCHOLES-MODELL 49 Wir können nun aus dem obigen Resultat schliessen, dass eine optimale Stoppzeit durch τ ∗ = inf{t : f (t, Xt ) = ψ(Xt )} = inf{t : Ãt > 0} gegeben ist. Betrachten wir nun die Amerikanische Call-Option. Wir vermuten, dass wie im diskreten Fall, die optimale Strategie darin besteht, bis zum Zeitpunkt T zu warten, bis man die Option einlöst. Es genügt, den Zeitpunkt 0 zu betrachten. Sei τ eine Stoppzeit mit Werten in [0, T ]. Dann gilt IIE∗ [e−rT (ST − K)+ | Fτ ] ≥ IIE∗ [S̃T − e−rT K | Fτ ] = S̃τ − e−rT K ≥ S̃τ − e−rτ K . Da die linke Seite positiv ist, gilt auch IIE∗ [e−rT (ST − K)+ | Fτ ] ≥ e−rτ (Sτ − K)+ . Somit ist der Optionspreis IIE∗ [e−rT (ST − K)+ ]. Da IIP∗ [ST > K | Ft ] > 0, ist es sicher nicht optimal, die Option einzulösen, falls Sτ ≤ K und τ < T . Dann ist im Falle Sτ > K S̃τ − e−rT K > S̃τ − e−rτ K falls τ < T . Das bedeutet, dass τ = T die einzige optimale Stoppzeit ist. Im Falle der amerikanischen Put-Option gibt es keine geschlossene Formel für den Optionspreis. Wir können eine obere Grenze finden, falls wir T = ∞ erlauben. Dann ist der Preis f (S0 ) = sup IIE∗ [e−rτ (K − Sτ )+ 1Iτ <∞ ] , τ ∈T wobei T die Klasse aller Stoppzeiten ist. Wir wollen nun die Funktion f (x) bestimmen. Proposition 5.11. Sei γ = 2r/σ 2 und x∗ = Kγ/(1 + γ). Dann ist K −x, falls x ≤ x∗ , f (x) = (K − x∗ )(x∗ /x)γ , falls x > x∗ . Bemerkung. Wir sehen, dass für T = ∞ die optimal Strategie gegeben ist durch τx∗ = inf{t : St < x∗ }. Für T < ∞ ist die optimale Strategie von der Form τ ∗ = inf{t ≤ T : St < x∗ (T − t)}, wobei die Funktion x∗ (t) numerisch berechnet werden muss. Beweis. Nach Definition ist die Funktion f gegeben durch f (x) = sup IIE∗ [(Ke−rτ − x exp{σWτ∗ − 21 σ 2 τ })+ 1Iτ <∞ ] . τ ∈T 50 5. DAS BLACK–SCHOLES-MODELL Wir sehen, dass f (x) positiv, fallend und konvex ist, und dass (τ = 0) f (x) ≥ (K − x)+ . Für τ = 1 erhalten wir f (x) > 0. Weiter gilt f (0) = K. Setzen wir x∗ = sup{x ≥ 0 : f (x) = K − x}. Dann ist 0 ≤ x∗ < K wohldefiniert. Aus der Konvexität schliessen wir f (x) = K − x für x ≤ x∗ und f (x) > (K − x)+ für x > x∗ . Wie im Fall T < ∞ gilt es, dass τ ∗ = inf{t : f (St ) = K − St } optimal ist, wobei wir benutzen, dass f (x) > 0. Somit ist τ ∗ = τx∗ . Wir können also das Problem lösen, indem wir φ(z) = IIE∗ [(Ke−rτz − x exp{σWτ∗z − 12 σ 2 τz })+ 1Iτz <∞ ] berechnen und dann maximieren, wobei τz = inf{t : St < z}. Wir können annehmen, dass 0 ≤ z < x ≤ K. Aus der Stetigkeit erhalten wir φ(z) = (K − z)IIE∗ [e−rτz 1Iτz <∞ ] . Wir bemerken, dass St = x exp{σWt∗ + (r − σ 2 /2)t}. Setzen wir µ = (r − 21 σ 2 )/σ, können wir schreiben τz = inf{t : Wt∗ + µt < σ −1 log(z/x)}. Man hat für Tb = inf{t : Wt∗ + µt < b} die allgemeine Formel p IIE∗ [e−αTb 1ITb <∞ ] = exp{µb − |b| µ2 + 2α} . Somit erhalten wir p φ(z) = (K − z) exp{µσ −1 log(z/x) + σ −1 log(z/x) µ2 + 2r} = (K − z)(z/x)γ . Die Ableitung ist φ0 (z) = x−γ z γ−1 (γ(K − z) − z) . Daher hat φ(z) das Maximum in x∗ . 6. PREISE UND PARTIELLE DIFFERENTIALGLEICHUNGEN 6. 51 Preise und partielle Differentialgleichungen Wir betrachten nun stochastische Prozesse, die durch die stochastische Differentialgleichung dXt = b(t, Xt ) dt + σ(t, Xt ) dWt gegeben sind. Die Funktionen b(t, x) und σ(t, x) seien so gewählt, dass sie die Bedingungen des Satzes 4.16 erfüllen. Dann haben wir die folgende Proposition 6.1. Sei f (t, x) eine zweimal stetig in x und stetig in t differenzierbare Funktion mit beschränkter Ableitung nach x. Sei A der Operator ∂f ∂ 2f ∂f + 21 σ 2 (t, x) 2 + b(t, x) . ∂t ∂x ∂x Rt Dann ist der Prozess {f (t, Xt ) − 0 Af (s, Xs ) ds} ein Martingal. Af (t, x) = Beweis. Aus der Itô-Formel schliessen wir, dass Z t Z t ∂ σ(s, Xs ) f (s, Xs ) dWs . Af (s, Xs ) ds = f (0, X0 ) + f (t, Xt ) − ∂x 0 0 Da ∂f (s, Xs ) ∂x beschränkt ist, haben wir ein Martingal. Korollar 6.2. Zusätzlich zu den Annahmen in Proposition 6.1 sei r(t, x) eine beschränkte stetige Funktion. Dann ist der Prozess o n n Z t r(s, Xs ) ds f (t, Xt ) exp − 0 Z t o o n Z s r(v, Xv ) dv (Af (s, Xs ) − r(s, Xs )f (s, Xs )) ds exp − − 0 0 ein Martingal. Beweis. on 6.1. Die Aussage folgt aus der partiellen Integrationsformel und Propositi Das obige Resultat gilt auch in mehrdimensionalen Modellen. Sei X ein ndimensionaler Itô-Prozess dX t = b(t, X t ) dt + σ(t, X t ) dW t , wobei W eine p-dimensionale Brownsche Bewegung ist. Wir definieren den Generator n n X ∂f 1X ∂ 2f ∂f Af (t, x) = + aij (t, x) + bi (t, x) , ∂t 2 i,j=1 ∂xi xj ∂x i i=1 wobei a = (aij )ij = σσ > . 52 6. PREISE UND PARTIELLE DIFFERENTIALGLEICHUNGEN Proposition 6.3. Nehmen wir an, dass b(t, x) und σ(t, x) die Bedingungen des Satzes 4.17 erfüllen, dass f zweimal stetig differenzierbar nach x und einmal stetig differenzierbar nach t ist, mit beschränkten Ableitungen nach x, und dass r(t, x) eine stetige beschränkte Funktion ist. Dann ist o n n Z t r(s, X s ) ds f (t, X t ) exp − Z 0t n Z s o o exp − r(v, X v ) dv (Af (s, X s ) − r(s, X s )f (s, X s )) ds − 0 0 ein Martingal. Beweis. Ähnlich wie der Beweis von Korollar 6.2. In Erweiterungen des Black–Scholes-Modelles muss man oft Ausdrücke der Form i o h n Z T r(s, X s ) ds f (X T ) Ft Vt (X t ) = IIE exp − t berechnen. Satz 6.4. Nehmen wir an, dass b(t, x) und σ(t, x) die Bedingungen des Satzes 4.17 erfüllen, und dass r(t, x) eine beschränkte Funktion ist. Sei f (t, x) eine Funktion die zweimal stetig differenzierbar nach x ist und stetig differenzierbar nach t. Falls f (t, x) die Gleichung Af (t, x) = r(t, x)f (t, x) und die Randbedingung f (T, x) = f (x) erfüllt, und |f (t, x)| ≤ K(1 + |x|2 ) für ein K > 0 gilt, dann ist f (t, x) = Vt (x). Ist umgekehrt Vt (x) zweimal stetig differenzierbar nach x und stetig differenzierbar nach t, dann erfüllt Vt (x) die Gleichung AVt (x) = r(t, x)Vt (x). Beweis. Nehmen wir an, dass f (t, x) die Bedingungen erfüllt. Sei τn = inf{t : |Xt | > n}. Dann ist nach Proposition 6.3 der Prozess n n Z t∧τn o o exp − r(s, X s ) ds f (t ∧ τn , X t∧τn ) 0 ein Martingal. Also ist auf {τn > t} h n Z f (t, X t ) = IIE exp − t T ∧τn i o r(s, X s ) ds f (T ∧ τn , X T ∧τn ) Ft . 6. PREISE UND PARTIELLE DIFFERENTIALGLEICHUNGEN 53 Der Ausdruck unter dem Erwartungswert ist durch eine quadratische Funktion beschränkt, die nach Satz 4.17 integrierbar ist. Somit ist der Ausdruck unter dem Erwartungswert gleichmässig integrierbar, und Grenzwert und Erwartungswert können vertauscht werden. Lassen wir n → ∞, folgt die Aussage. Nehmen wir nun an, dass Vt (x) zweimal nach x und einmal nach t differenzierbar ist. Dann erhalten wir aus der Itô-Formel o n Z t r(s, X s ) ds Vt (X t ) exp − 0 Z t n Z s o = V0 (X0 ) + exp − r(v, X v ) dv (AVs (X s ) − r(s, X s )Vs (X s )) ds 0 + 0 p Z t n X X j=1 0 i=1 n Z s o ∂V (X s ) dWsj . exp − r(v, X v ) dv σij (s, X s ) ∂xi 0 Nach der Definition von Vt (x) ist die linke Seite ein Martingal, die stochastischen Integrale auf der rechten Seite sind lokale Martingale. Daher ist auch das klassische Integral auf der rechten Seite ein lokales Martingal, stetig und von beschränkter Variation. Nach Hilfssatz C.15 ist dieses Martingal konstant. Daher gilt AVt (X t ) − r(t, X t )Vt (X t )) = 0. Das Problem besteht nun darin, die Gleichung AVt (x) = r(t, x)Vt (x) numerisch zu lösen. Wir werden hier keine numerischen Verfahren diskutieren. Der interessierte Leser findet diese Methoden in [10]. Im Black–Scholes-Modell haben wir Af (t, x) = ∂f ∂ 2f ∂f + 12 σ 2 x2 2 + rx . ∂t ∂x ∂x Wir müssen also die Gleichung ∂f ∂ 2f ∂f + 21 σ 2 x2 2 + rx − rf (t, x) = 0 ∂t ∂x ∂x (6.1) mit der Nebenbedingung f (T, x) = f (x) lösen. Man kann sich leicht davon überzeugen, dass die Preise, die wir für die europäischen Call- und Put-Optionen erhalten haben, die Differentialgleichung erfüllen. Wir betrachten jetzt noch amerikanische Optionen. Wir wollen die Funktion i h n Z τ o f (t, X t ) = sup IIE exp − r(s, X s ) ds f (X τ ) Ft τ ∈Tt berechnen. t 54 6. PREISE UND PARTIELLE DIFFERENTIALGLEICHUNGEN Satz 6.5. Nehmen wir an, dass b(t, x) und σ(t, x) die Bedingungen des Satzes 4.17 erfüllen, dass f˜ zweimal stetig differenzierbar nach x und einmal stetig differenzierbar nach t ist, beschränkte Ableitungen nach x hat, und dass r(t, x) eine stetige beschränkte Funktion ist. Falls max{Af˜(t, x) − r(t, x)f˜(t, x), f (x) − f˜(t, x)} = 0 , f˜(T, x) = f (x) , erfüllt ist, dann ist h n Z ˜ f (t, X t ) = f (t, X t ) = sup IIE exp − τ ∈Tt t τ i o r(s, X s ) ds f (X τ ) Ft . Beweis. Der Prozess n n Z t o exp − r(s, X s ) ds f˜(t, X t ) 0 Z t n Z s o o − exp − r(v, X v ) dv (Af˜(s, X s ) − r(s, X s )f˜(s, X s )) ds 0 0 ist ein Martingal. Da das Integral negativ ist, folgt, dass o o n n Z t r(s, X s ) ds f˜(t, X t ) exp − 0 ein Supermartingal ist. Da f˜(t, Xt ) ≥ f (Xt ) ist das Supermartingal grösser als die Snell-Hülle, und damit i o h n Z τ ˜ r(s, X s ) ds f (X τ ) Ft . f (t, X t ) ≥ sup IIE exp − τ ∈Tt t Definieren wir nun τ ∗ = inf{t : f˜(t, X t ) = f (X t )}. Dann ist n n Z t∧τ ∗ o o exp − r(s, X s ) ds f˜(t ∧ τ ∗ , X t∧τ ∗ ) 0 ein Martingal. Somit haben wir auf {τ ∗ > t} i h n Z τ∗ o f˜(t, X t ) = IIE exp − r(s, X s ) ds f˜(τ ∗ , X τ ∗ ) Ft , t wobei wir verwendet haben, dass τ ∗ ≤ T . Somit gilt i h n Z τ o ˜ f (t, X t ) ≤ sup IIE exp − r(s, X s ) ds f (X τ ) Ft . τ ∈Tt t 7. ZINSRATENMODELLE 7. 55 Zinsratenmodelle 7.1. Obligationen und Obligationsoptionen Bezeichnen wir mit F (t, T ) den Betrag, den jemand zur Zeit T zurückzahlen muss, der zum Zeitpunkt t sich einen Euro ausgeliehen hat. Nehmen wir für den Moment an, dass F (t, T ) deterministisch ist. Damit es keine Arbitrage geben kann, muss F (t, t) = 1 und F (t, s) = F (t, u)F (u, s) für alle 0 ≤ t ≤ u ≤ s gelten. Somit haben wir log F (t, s) = log F (t, u) + log F (u, s). Es ist daher naheliegend, dass es eine Funktion r(t) gibt, so dass nZ s o F (t, s) = exp r(u) du . t Die Funktion r(t) heisst Zinsintensität. Da niemand negative deterministische Zinsen akzeptieren würde, können wir annehmen, dass r(t) ≥ 0. Leiht man zum Zeitpunkt 0 einen Euro aus, ist der Wert dieses Euros zum Zeitpunkt t St0 = F (0, t). Da wir annehmen, dass kein Risiko damit verbunden ist, sollte man auf einem (sicheren) Bankkonto den gleichen Zins erhalten. Der Wertprozess S 0 erfüllt somit die Differentialgleichung dSt0 = r(t)St0 dt . (7.1) Eine Null-Coupon-Obligation ist eine Obligation, die keine Zinsen bezahlt und zu einem bestimmten Zeitpunkt T einen Euro zurückzahlt. Den Preis zum Zeitpunkt t bezeichnen wir mit P (t, T ). Damit es keine Arbitrage geben kann, muss P (t, T ) = F (t, T )−1 gelten. Leiht man nämlich den Betrag P (t, T ), erhält man mit Zinsen zum Zeitpunkt T den Betrag P (t, T )F (t, T ) zurück, was das Gleiche sein muss, wie bei einer Null-Coupon-Obligation. Ist nun der Zins stochastisch nehmen wir an, dass {r(t)} stochastisch ist. Der risikolose Aktiv S 0 erfüllt dann die Gleichung (7.1). Damit der Aktiv wohldefiniert RT ist, muss 0 |r(s)| ds < ∞ gelten. Wir bezeichnen weiterhin mit P (t, s) den Wert zum Zeitpunkt t einer Null-Coupon-Obligation, die zum Zeitpunkt s zurückgezahlt wird. Es muss daher gelten, dass P (t, t) = 1. Motiviert durch das Black–ScholesModell nehmen wir nun an, dass es ein zu IIP äquvalentes Mass IIP∗ gibt, so dass 56 {exp{− 7. ZINSRATENMODELLE Rt 0 r(u) du}P (t, s)} ein IIP∗ -Martingal ist. Das impliziert, da P (s, s) = 1, n Z t o nZ t o P (t, s) = exp − r(u) du P (t, s) exp r(u) du 0 0 h n Z s o i nZ t o ∗ = IIE exp − r(u) du Ft exp r(u) du 0 0 h n Z s o i = IIE∗ exp − r(u) du Ft . t Der Vollständigkeit halber führen wir noch den Kassakurs ein. Der Kassakurs R(t, s) ist die Zinsrate, die eine Null-Coupon-Obligation verspricht, das heisst P (t, s)eR(t,s)(s−t) = 1 . Somit gilt R(t, s) = − 1 log P (t, s) . s−t Wir machen nun die Annahme, dass die Filtration {Ft } durch eine Brownsche Bewegung erzeugt wird. Sei LT die Radon–Nikodym-Ableitung dIIP∗ /dIIP. Dann ist für alle FT -messbaren Variablen X, IIE∗ [X] = IIE[LT X]. Ist nun X Ft messbar, so haben wir IIE∗ [X] = IIE[Lt X], wobei Lt = IIE[LT | Ft ], siehe (D.1). Wir konstruieren nun eine Darstellung des Prozesses {Lt }. Proposition 7.1. Es gibt einen adaptierten Prozess {qt }, so dass Z t nZ t o 1 qs dWs − 2 Lt = exp qs2 ds . 0 0 Beweis. Sei τn = inf{t : Lt > n}. Da die Filtration durch die Brownsche Bewegung erzeugt wird und P (t, s) unter beiden Massen stetig ist, muss {Lt } auch stetig sein. Dann ist {Lt∧τn } ein quadratisch integrierbares Martingal. Nach dem Martingal-Representations-Theorem 5.6 gibt es dann einen adaptierten Prozess H n , so dass Z t∧τ n Hsn dWs . Lt∧τn = 1 + 0 Betrachten wir Z t∧τn Z n+1 1+ Hs dWs = L(t∧τn )∧τn+1 = Lt∧τn = 1 + 0 t∧τn Hsn dWs , 0 R t∧τn so sehen wir, dass 0 (Hsn+1 − Hsn ) dWs = 0. Daher ist auch hZ t∧τn i hZ t∧τn 2 i n+1 n 2 IIE (Hs − Hs ) ds = IIE (Hsn+1 − Hsn ) dWs =0. 0 0 7. ZINSRATENMODELLE 57 R t∧τ Da die linke Seite positiv ist, gilt 0 n (Hsn+1 − Hsn )2 ds = 0. Also muss Htn+1 = Htn auf [0, τn ] gelten. Es gibt somit einen Prozess H, so dass Z t Hs dWs . Lt = 1 + 0 Wir setzen nun qt = Ht /Lt . Die Itô-Formel ergibt Z t Z t 1 qs2 ds , log Lt = qs dWs − 2 0 0 was die Behauptung beweist. Wir erhalten somit das folgende Korollar 7.2. Der Preis der Null-Coupon-Obligation ist gegeben durch nZ s Z s o i P (t, s) = IIE exp qu dWu − (r(u) + 21 qu2 ) du Ft . t Beweis. t Dies folgt sofort aus der Formel (D.2) und Proposition 7.1. Proposition 7.3. Für jeden Auszahlungszeitpunkt s gibt es einen adaptierten Prozess {σts }, so dass dP (t, s) = σts P (t, s) dWt + (r(t) − σts qt )P (t, s) dt . (7.2) Rt Beweis. Der Prozess {P (t, s) exp{− 0 r(u) du}} ist ein IIP∗ -Martingal. Daher ist Rt {P (t, s) exp{− 0 r(u) du}Lt } ein IIP-Martingal. Alle Terme sind strikt positiv, also gibt es wie im Beweis von Proposition 7.1 einen Prozess {θts }, so dass Z t o n Z t o nZ t s 1 P (t, s) exp − r(u) du Lt = P (0, s) exp θu dWu − 2 (θus )2 du . 0 0 0 Damit ist Z t nZ t o s P (t, s) = P (0, s) exp (θu − qu ) dWu + (r(u) + 12 [qu2 − (θus )2 ]) du . 0 0 Mit Hilfe der Itô-Formel haben wir dP (t, s) = (θts − qt )P (t, s) dWt + {(r(t) + 21 [qt2 − (θts )2 ]) + 12 (θts − qt )2 }P (t, s) dt = (θts − qt )P (t, s) dWt + {r(t) − qt (θts − qt )}P (t, s) dt . Setzt man σts = θts − qt folgt die Behauptung. 58 7. ZINSRATENMODELLE Bemerkungen. i) Die stochastische Differentialgleichung hat nicht wie üblich den Anfangswert gegeben, sondern den Schlusswert P (s, s) = 1. Es handelt sich somit um eine stochastische Rückwartsdifferentialgleichung. ii) Unter dem Mass IIP∗ ist nach dem Girsanov-Theorem (Verallgemeinerung von Rt Proposition 5.3) der Prozess {Wt∗ = Wt − 0 qs ds} eine standard Brownsche Bewegung. Wir haben dann die stochastische Differentialgleichung dP (t, s) = σts P (t, s) dWt∗ + r(t)P (t, s) dt . Das heisst, unter IIP∗ wächst P (t, s) im Schnitt gleich wie der risikolose Aktiv. iii) Der durchschnittliche infinitesimale Zuwachs von P (t, s) ist unter dem Mass IIP (r(t) − σts qt )P (t, s). Die Differenz zum risikofreien Aktiv ist −σts qt P (t, s). Dies ist die Kompensation für die Zinsgarantie, die man übernommen hat. Daher nennt man qt auch den Risikopreis. Wir betrachten nun bedingte Ansprüche in diesem Zinsmarkt. Sei ζ < T ein Zeitpunkt und h ≥ 0 ein Fζ -messbarer bedingter Anspruch. Zum Beispiel kann h = (P (ζ, T ) − K)+ eine Call-Option auf den Preis P (ζ, T ) sein. Wir versuchen nun diesen bedingten Anspruch zu hedgen. Im Falle der Call-Option scheint es sinnvoll, mit Null-Coupon-Obligationen zu hedgen. Wir betrachten wieder Strategien φ = (φ0 , φ), wobei φ0t die Anzahl risikolose Aktiven und φt die Anzahl Null-Coupon-Obligationen bezeichnet, die man zum Zeitpunkt t im Portfolio hält. Der Wert der Strategie zum Zeitpunkt t ist nZ t o 0 0 0 r(s) ds + φt P (t, T ) . Vt (φ) = φt St + φt P (t, T ) = φt exp 0 Wir nennen ein Portfolio selbstfinanzierend, falls dVt (φ) = φ0t dSt0 + φt dP (t, T ) . Damit die Integrale wohldefiniert sind, brauchen wir die Bedingung Z ζ (|φ0t r(t)| + (φt σtT )2 ) dt < ∞ . 0 Analog zum Black–Scholes-Modell definieren wir 7. ZINSRATENMODELLE 59 Definition 7.4. Eine (wohldefinierte) Strategie φ heisst zulässig, falls sie selbstfinanzierend ist und Vt (φ) ≥ 0 oder (sup0≤t≤ζ Vt (φ))2 IIP∗ -integrierbar ist. Proposition 7.5. Sei ζ < T , sup0≤t≤ζ |r(t)| beschränkt und σtT 6= 0 für 0 ≤ t ≤ ζ. Rζ Sei h ≥ 0 eine Fζ -messbare Zufallsvariable, so dass h exp{− 0 r(t) dt} quadratisch integrierbar ist. Dann gibt es eine zulässige Strategie φ, so dass Vζ (φ) = h. Für jede solche Strategie gilt o i h n Z ζ ∗ r(s) ds h Ft . Vt (φ) = IIE exp − t Beweis. Sei φ eine zulässige Strategie mit Schlusswert h. Bezeichnen wir mit dem Tildezeichen die diskontierten Werte. Dann gilt dṼt (φ) = φt dP̃ (t, T ) = φt P̃ (t, T )σtT dWt∗ . Somit ist wegen der quadratischen Integrierbarkeit {Ṽt (φ)} ein Martingal. Insbesondere gilt h n Z ζ o i ∗ ∗ Ṽt (φ) = IIE [Ṽζ (φ) | Ft ] = IIE exp − r(s) ds h Ft . 0 Wir haben somit den Wert einer solchen Strategie bestimmt. Wir müssen somit noch zeigen, dass es eine Strategie gibt. Definieren wir Ṽt wie oben. Dann haben wir ein quadratisch integrierbares Martingal. Also gibt es einen Prozess θ, so dass Z ζ n Z ζ o h exp − r(s) ds = Ṽ0 + θt dWt∗ . 0 0 Wir setzen dann φt = θt P̃ (t, T )σtT und φ0t = Ṽt − θt . σtT Diese Strategie ist selbstfinanzierend, Vζ (φ) = h, hat einen positiven Wert, und ist quadratisch integrierbar. Die Integrierbarkeitsbedingungen sind erfüllt, da supt |r(t)| beschränkt ist, und Vt und θt2 quadratisch integrierbar sind. Bemerkung. Falls σtT > 0 für alle t < T , dann kann man zeigen, dass das Martingalmass IIP∗ eindeutig ist. Dies bedeutet, dass der Markt vollständig ist. Insbesondere kann man jede FT -messbare quadratisch integrierbare Variable hedgen. 60 7. ZINSRATENMODELLE 7.2. Klassische Zinsratenmodelle 7.2.1. Das Vasicek-Modell Seien a, b, σ strikt positive Zahlen. Wir definieren {r(t)} durch die stochastische Differentialgleichung dr(t) = a(b − r(t)) dt + σ dWt . Der Prozess {r(t) − b} ist somit ein Ornstein–Uhlenbeck Prozess. Wir möchten, dass der Prozess die Form dr(t) = a∗ (b∗ − r(t)) dt + σ ∗ dWt∗ hat, wobei W ∗ eine standard Brownsche Bewegung unter IIP∗ ist. Da dWt = dWt∗ + qt dt, haben wir dr(t) = [a(b − r(t)) + σqt ] dt + σ dWt∗ . Wir schliessen, dass σ ∗ = σ und qt = λ − αr(t). Damit erhalten wir a∗ = a + σα und b∗ = (ab + σλ)/a∗ . Da {r(t) − b} ein Ornstein–Uhlenbeck-Prozess ist, haben wir die Darstellung (4.6) Z t −at −at −at r(t) = r(0)e + b(1 − e ) + σe eas dWs . 0 Daher ist r(t) normalverteilt mit Mittelwert IIE[r(t)] = r(0)e−at + b(1 − e−at ) und Varianz Var[r(t)] = σ 2 (1 − e−2at )/(2a). Insbesondere hat man IIP[r(t) < 0] > 0. Dies trifft in der Realität nicht zu, falls r(t) den Zins auf einem Bankkonto bezeichnet. Dann würde man besser alles Geld abheben und zu Hause im Tresor aufbewahren, als das Geld auf der Bank zu belassen. Es kann auch sein, dass der Preis einer Null-Coupon-Obligation grösser als 1 ist. Auch dann wäre es besser, das Geld zu Hause aufzubewahren, als in die Obligation zu investieren. Hat man diese Möglichkeit im Markt (was wir hier ausschliessen), dann wäre der Markt nicht arbitragefrei. Die Möglichkeit r(t) < 0, wenn auch mit kleiner Wahrscheinlichkeit, ist nicht wünschenswert im Modell. Eine Diskussion dieses Problems findet man in [6]. Um den Preis einer Null-Coupon-Obligation zu berechnen, müssen wir den Ausdruck h n Z T o i ∗ P (t, T ) = IIE exp − r(s) ds Ft t RT berechnen. Wir wollen zuerst die Verteilung von t r(s) ds berechnen. Setzen wir der Einfachheithalber t = 0. Der deterministische Teil ist hZ T i Z T 1 − e−aT . IIE r(s) ds = r(0)e−as + b(1 − e−as ) ds = bT + (r(0) − b) a 0 0 7. ZINSRATENMODELLE 61 Der stochastische Teil ist T Z e −as s Z 0 eav dWv ds . 0 Da r(t) stetig und pfadweise beschränkt ist, können wir die Riemannsumme Z n T X −aiT /n iT /n av e e dWv n i=1 0 bilden und n gegen Unendlich gehen lassen. Die einzelnen Summanden sind normalverteilt mit Mittelwert 0, und somit sind die Riemann-Summen normalverteilt mit Mittelwert 0. Falls die Varianzen konvergieren, konvergiert auch die Verteilung der Riemannsummen, und der Grenzwert ist eine Normalverteilung. Wir müssen also RT die Varianz von 0 r(s) ds berechnen. Dies ist Var hZ T T Z i Z r(s) ds = T Z T Z Cov[r(s), r(v)] dv ds = 2 0 0 0 Cov[r(s), r(v)] dv ds . 0 Für die inneren Kovarianzen erhalten wir Z hZ s au 2 −a(s+v) e dWu , Cov[r(s), r(v)] = σ e Cov 0 v e au s i 2 −a(s+v) dWu = σ e 0 0 Z s∧v e2au du 0 e2a(s∧v) − 1 . = σ 2 e−a(s+v) 2a Also ergibt sich Var hZ 0 T i r(s) ds = σ 2 T Z e 0 −as Z 0 s eav − e−av dv ds a Z σ 2 T −as as = 2 e (e + e−as − 2) ds a 0 σ2 = 3 {2aT + 1 − e−2aT − 4(1 − e−aT )} 2a σ2 = 3 (2aT + 4e−aT − e−2aT − 3) . 2a Unter dem Mass IIP∗ müssen wir a und b durch a∗ und b∗ ersetzen. Der Preis P (0, T ) ist somit der Mittelwert einer Lognormal-Verteilung n hZ T i hZ T io ∗ ∗ 1 P (0, T ) = exp 2 Var r(s) ds − IIE r(s) ds . 0 Da r(t) < 0 möglich ist, kann es sein, dass P (0, T ) ≥ 1. 0 62 7.2.2. 7. ZINSRATENMODELLE Das Cox–Ingersoll–Ross-Modell Um das Problem mit negativen Zinsraten zu umgehen, haben Cox, Ingersoll und Ross [1] das folgende Modell vorgeschlagen p dr(t) = (a − br(t)) dt + σ r(t) dWt . Da die Lipschitz-Bedingung nicht erfüllt ist, können wir nicht Satz 4.16 anwenden, um zu zeigen, dass es eine eindeutige Lösung der stochastischen Differentialgleichung gibt. Ein Beweis, dass es eine eindeutige Lösung der stochastischen Differentialgleichung gibt, findet man in [4, S. 221]. Wir wollen untersuchen, ob der Prozess Null erreichen kann, falls man mit einem strikt positiven Wert startet. Proposition 7.6. Sei r(0) = x > 0 und τy = inf{t : r(t) = y}. Dann gilt i) Falls 2a ≥ σ 2 , dann gilt IIP[τ0 = ∞] = 1. ii) Falls 0 ≤ 2a < σ 2 und b ≥ 0, dann gilt IIP[τ0 < ∞] = 1. iii) Falls 0 ≤ 2a < σ 2 und b < 0, dann gilt IIP[τ0 < ∞] ∈ (0, 1). Beweis. Sei für 0 < y < x < M < ∞, τyM = τy ∧ τM . Wir suchen nach einem Martingal der Form {s(r(t))} für eine Funktion s(x). Aus Proposition 6.1 schliessen wir, dass wir die Gleichung 21 σ 2 xs00 (x)+(a−bx)s0 (x) = 0 lösen müssen. Eine mögliche Lösung ist Z x 2 2 y −2a/σ e2by/σ dy . s(x) = 1 Dann gilt 2 2 s0 (x) = x−2a/σ e2bx/σ , 2 2 s00 (x) = [2b/σ 2 − 2a/(σ 2 x)]x−2a/σ e2bx/σ . Sei nun 0 < y < x < M . Aus der Itô-Formel schliessen wir s(r(t ∧ τyM )) Z t∧τyM − s(x) = s0 (r(v))σ p r(v) dWv . 0 √ Da auf [y, M ] die Funktionen s0 (v) und v beschränkt sind, ist das stochastische Integral ein quadratisch integrierbares Martingal. Also haben wir IIE[{s(r(t ∧ τyM )) 2 2 − s(x)} ] = σ IIE hZ 0 t∧τyM i {s0 (r(v))}2 r(v) dv . 7. ZINSRATENMODELLE 63 √ Die linke Seite ist beschränkt. Da auf [y, M ] sowohl s0 (v) als auch v von Null wegbeschränkt sind, muss τyM < ∞ gelten. Der Stoppsatz und die Beschränktheit von s(r(t ∧ τyM )) implizieren (t → ∞) s(x) = IIE[s(r(τyM ))] = s(y)IIP[τyM = τy ] + s(M )IIP[τyM = τM ] . Insbesondere haben wir IIP[τy < τM ] = s(M ) − s(x) . s(M ) − s(y) Sei zuerst 2a ≥ σ 2 . Dann ist s(0) = −∞. Somit haben wir s(M ) − s(x) =0. y→0 s(M ) − s(y) IIP[τ0 < τM ] = lim Also erreicht r(t) den Wert M bevor der Wert 0 erreicht wird. Lassen wir M → ∞ geht auch τM → ∞, und damit haben wir IIP[τ0 < ∞] = 0. Ist 0 ≤ 2a < σ 2 , so ist s(0) endlich. Also erhalten wir wie oben IIP[τ0 < τM ] = s(M ) − s(x) . s(M ) − s(0) Ist zusätzlich b ≥ 0, so haben wir s(∞) = ∞, und damit, wenn wir M gegen unendlich gehen lassen, IIP[τ0 < ∞] = 1. Ist aber b < 0, so ist s(∞) < ∞, und IIP[τ0 < ∞] ∈ (0, 1) folgt. Wir möchten, dass der Prozess {r(t)} unter dem Mass IIP∗ von der gleichen Form ist, dr(t) = (a∗ − b∗ r(t)) dt + σ ∗ p r(t) dWt∗ . Mit der Brownschen Bewegung W ∗ bekommen wir p p dr(t) = a − br(t) + σ r(t)qt dt + σ r(t) dWt∗ . p p Also haben wir σ ∗ = σ und qt = −α r(t) + β/ r(t). Damit ist a∗ = a + βσ und b∗ = b + ασ. Da qt nur für r(t) > 0 definiert ist, muss 2a ≥ σ 2 gelten, falls β 6= 0. Da die Masse äquivalent sein sollen, müssen 2a ≥ σ 2 und 2a∗ ≥ σ 2 gleichzeitig gelten.. Um den Preis der Null-Coupon-Obligation und der Call-Option zu berechnen, brauchen wir das folgende Resultat. 64 7. ZINSRATENMODELLE Proposition 7.7. Seien λ, µ ≥ 0 und r(0) = x. Dann gilt Z t oi h n r(s) ds = exp{−aφλ,µ (t) − xψλ,µ (t)} , IIE exp −λr(t) − µ 0 wobei 2 2γet(γ+b)/2 , log σ2 σ 2 λ(eγt − 1) + γ − b + eγt (γ + b) λ(γ + b + eγt (γ − b)) + 2µ(eγt − 1) ψλ,µ (t) = 2 γt σ λ(e − 1) + γ − b + eγt (γ + b) φλ,µ (t) = − und γ = p b2 + 2σ 2 µ. Bemerkung. Seien {r1 (t)} und {r2 (t)} zwei unabhängige Cox–Ingersoll–RossModelle mit Parametern ai , b und σ, und Anfangswert xi . Die Brownschen Bewegungen bezeichnen wir mit W i . Dann erfüllt {r(t) = r1 (t) + r2 (t)} s s p p r1 (t) r2 (t) dr(t) = (a1 + a2 − br(t)) dt + σ r(t) dWt1 + σ r(t) dWt2 . r(t) r(t) Betrachten wir das Martingal W̃ , definiert als s s r1 (t) r2 (t) dW̃t = dWt1 + dWt2 , r(t) r(t) W̃0 = 0 . Der Klammer-Prozess wird dhW̃ , W̃ it = r (t) r (t) 2 1 + dt = dt . r(t) r(t) Man kann zeigen, dass W̃ eine standard Brownsche Bewegung ist. Somit haben wir dr(t) = (a1 + a2 − br(t)) dt + σ p r(t) dW̃t ist ein Cox–Ingersoll–Ross-Modell mit Parametern a1 + a2 , b, σ und Anfangswert x1 + x2 . Daher muss die Laplace-Transformation aus Proposition 7.7 die behauptete Form haben. Beweis. Wir wollen ein Martingal der Form Z t n o Mt = exp −µ r(s) ds F (T − t, r(t)) 0 7. ZINSRATENMODELLE 65 mit F (0, x) = e−λx konstruieren. Aus Korollar 6.2 schliessen wir, dass wir die Gleichung − ∂ 2F ∂F ∂F (t, x) + 12 σ 2 x 2 (t, x) + (a − bx) (t, x) − µxF (t, x) = 0 ∂t ∂x ∂x mit der Anfangsbedingung F (0, x) = e−λx lösen sollten. Machen wir den Ansatz F (t, x) = exp{−aφ(t) − xψ(t)}, erhalten wir das System −ψ 0 (t) = 21 σ 2 ψ 2 (t) + bψ(t) − µ , φ0 (t) = ψ(t) , mit den Randbedingungen ψ(0) = λ und φ(0) = 0. Die erste Gleichung lässt sich durch Separation der Variablen lösen, und wir erhalten ψλ,µ (t). Damit lässt sich die zweite Gleichung lösen, und wir erhalten φλ,µ (t). Da ψ(t) ≥ 0 und r(t) ≥ 0 ist, ist {Mt } beschränkt. Damit ist {Mt } gleichmässig integrierbar; das heisst, ein Martingal. Die Behauptung folgt nun aus der Martingaleigenschaft M0 = IIE[MT ]. Setzen wir µ = 0 und damit γ = |b|, erhalten wir die Laplace-Transformierte von r(t). Wir betrachten nur den Fall b > 0, 2a/σ2 n o 2betb 2λbx −λr(t) IIE[e ]= exp − 2 bt σ 2 λ(ebt − 1) + 2ebt b σ λ(e − 1) + 2ebt b 2 n o 2a/σ λbe−bt x b exp − 2 = σ 2 λ(1 − e−bt )/2 + b σ λ(1 − e−bt )/2 + b o n 1 λLζ = , 2 exp − 2a/σ 2λL + 1 (2λL + 1) wobei L = σ 2 (1 − e−bt )/(4b) und ζ = 4xb/(σ 2 (ebt − 1)). Definieren wir n 1 λζ o gδ,ζ (λ) = exp − , (2λ + 1)δ/2 2λ + 1 so sehen wir, dass r(t)/L die Laplace-Transformierte g4a/σ2 ,ζ (λ) hat. Die Funktion gδ,ζ (λ) ist die Laplace-Transformierte einer verallgemeinerten nicht-zentralen χ2 Verteilung mit δ Freiheitsgraden, und hat die Dichte fδ,ζ (z) = e−ζ/2 p 1 −z/2 −δ/4− 2 e z I ( zζ) , δ/2−1 1 2ζ δ/4− 2 wobei Iν (z) die modifizierte Besselfunktion erster Ordnung mit Index ν ist, Iν (z) = 1Iz>0 ∞ z ν X 2 n=0 (z/2)2n . n!Γ(ν + n + 1) 66 7. ZINSRATENMODELLE Die Besselfunktionen haben viele nette Eigenschaften und sind in den meisten mathematischen Programmen definiert. Ist die Zinsrate r(t) und qt wie oben definiert, können wir nun den Preis der Null-Coupon-Obligation berechnen. Mit a∗ und b∗ wie oben definiert erhalten wir o i h n Z T ∗ ∗ r(s) ds Ft = exp{−a∗ φ∗0,1 (T − t) − r(t)ψ0,1 P (t, T ) = IIE exp − (T − t)} . t ∗ sind, mit γ ∗ = Die Funktionen φ∗0,1 und ψ0,1 p (b∗ )2 + 2σ 2 , ∗ ∗ 2γ ∗ et(γ +b )/2 2 , = − 2 log ∗ σ γ − b∗ + eγ ∗ t (γ ∗ + b∗ ) ∗ 2(eγ t − 1) ∗ ψ0,1 (t) = ∗ . γ − b∗ + eγ ∗ t (γ ∗ + b∗ ) φ∗0,1 (t) Betrachten wir nun eine europäische Call-Option auf den Preis P (ζ, T ), mit ζ < T . Für den Preis zur Zeit 0 erhalten wir h n Z ζ o i ∗ C0 = IIE exp − r(s) ds (P (ζ, T ) − K)+ 0 h n Z ζ o i ∗ r(s) ds (exp{−aφ∗0,1 (T − ζ) − r(ζ)ψ0,1 (T − ζ)} − K)+ = IIE∗ exp − 0 h n Z ζ o i ∗ ∗ ∗ r(s) ds − aφ0,1 (T − ζ) − r(ζ)ψ0,1 (T − ζ) 1Ir(ζ)<r∗ = IIE exp − 0 h n Z ζ o i ∗ −KIIE exp − r(s) ds 1Ir(ζ)<r∗ , 0 wobei − log K − aφ∗0,1 (T − ζ) . r = ∗ ψ0,1 (T − ζ) ∗ 7.2.3. Das Heath–Jarrow–Morton-Modell Ein Problem mit den bisher betrachteten Modellen ist, dass die beobachteten Preise P (0, t) nicht mit den theoretischen Preisen zusammenpassen. Zwar kann man die Parameter so kalibrieren, dass die realen Preise die theoretischen Preise approximieren. Doch würde man es vorziehen, wenn das Modell die realen Preise reproduzieren würde. Man muss aber aufpassen. Sind die momentanen Preise falsch, so werden diese gefestigt und es entsteht eine ökonomische Blase. Beim Platzen dieser Blase kann die Wirtschaft viel Geld verlieren. 7. ZINSRATENMODELLE 67 Ein Ansatz ist das Modell von Hull und White [3]. Das Vasicek-Modell wird abgeändert zu dr(t) = [a(t) − b(t)r(t)] dt + σ(t) dWt . Statt den drei Konstanten lassen sich so drei Funktionen kalibrieren. Dies ergibt dann genügend Freiheitsgrade, um das Modell an die beobachteten Preise anzupassen. Die selbe Idee lässt sich mit dem Cox–Ingersoll–Ross-Modell durchführen, p dr(t) = [a(t) − b(t)r(t)] dt + σ(t) r(t) dWt . Wir wollen hier aber einen anderen Ansatz verfolgen. d Definieren wir die Vorwärtsraten f (t, s) = − ds log P (t, s). Dann können wir den Preis schreiben als n Z s o P (t, s) = exp − f (t, v) dv . t Es ist dann natürlich, die Zinsrate als r(t) = f (t, t) zu definieren. Im VasicekModell und im Cox–Ingersoll–Ross-Modell kann man sich direkt überzeugen, dass r(t) = f (t, t). Wir nehmen an, dass die Funktion f (t, s) in beiden Variablen stetig ist. Wenn nun t wächst, ändert sich P (t, s) und damit auch f (t, s). Da P (t, s) = Rs IIE [exp{− t r(v) dv} | Ft ] wird im Normalfall P (t, s1 ) und P (t, s2 ) sich in die “gleiche Richtung” ändern. Die Preise P (t, s) und somit die Vorwärtsraten f (t, s) müssen also abhängig sein. Wir modellieren deshalb Z t Z t σ(f (t, s)) dWv . (7.3) α(v, s) dv + f (t, s) = f (0, s) + ∗ 0 0 Damit haben wir die Dynamik definiert, mit der sich die Funktionen s 7→ f (·, s) verändern. Die Funktionen (t, s) 7→ α(t, s) und r 7→ σ(r) sollen stetig sein. Wir wollen, dass es ein äquivalentes Mass IIP∗ gibt, unter dem wir die Preise der Null-Coupon-Obligationen berechnen können. Die Existenz dieses Masses ist äquivalent damit, dass wir die Dynamik der Preise P (t, s) wie in (7.2) ausdrücken Rs können. Sei s fest und Xt = − t f (t, v) dv. Dann gilt P (t, s) = exp Xt . Hilfssatz 7.8. Es gilt Z sZ v Z sZ s σ(f (w, v)) dWw dv = σ(f (w, v)) dv dWw . t t t w 68 7. ZINSRATENMODELLE Bemerkung. Das Resultat entspricht dem Satz von Fubini. Wäre die Zeit t die obere Integrationgrenze, wäre der Satz von Fubini falsch. In der Tat, der Prozess RtRt RtRs g(v, s) ds dWv g(v, s) dW ds ist von beschränkter Variation, wogegen v 0 v 0 0 unbeschränkte Variation hat. Weiter, da in einem stochastischen Integral der Integrand adaptiert sein muss, RsRs würde ein doppeltes stochastisches Integral 0 v H(v, t) dWt dWv keinen Sinn machen. Beweis. Sei τn = inf{t ≥ 0 : max{supt≤v≤s f (t, v) > n}. Wir haben dann hZ s Z v 2 i IIE σ(f (w, v)) dWw dv τn ∧t τn ∧t Z z Z s Z s hZ u i σ(f (w, u)) dWw σ(f (v, z)) dWv 1Iτn ∧t<z∧u dz du IIE = τ ∧t τn ∧t 0 0 Z s Z s hZ nu∧z i σ(f (w, u))σ(f (w, z)) dw1Iτn ∧t<z∧u dz du IIE = τn ∧t 0 0 hZ s Z s Z u∧z i = IIE σ(f (w, u))σ(f (w, z)) dw dz du τn ∧t τn ∧t τn ∧t hZ s Z s Z s i = IIE σ(f (w, u))σ(f (w, z)) dz du dw τn ∧t w w h Z s Z s 2 i = IIE σ(f (w, u)) du dw . τn ∧t Weiter gilt hZ IIE s Z w s σ(f (w, v)) dv dWw τn ∧t 2 i = IIE s hZ Z τn ∧t w s σ(f (w, v)) dv 2 i dw . w Und IIE hZ s Z u Z s Z s i σ(f (z, v)) dv dWz σ(f (w, u)) dWw du τn ∧t z Z s Z s hZ u i = IIE σ(f (w, u)) dWw σ(f (z, v)) dv dWz 1Iu>τn ∧t du 0 τn ∧t τn ∧t z Z s hZ u Z s i = IIE σ(f (w, u)) σ(f (w, v)) dv dw1Iu>τn ∧t du 0 τn ∧t w Z s hZ s Z s i σ(f (w, u)) du σ(f (w, v)) dv dw = IIE τn ∧t w w h Z s Z s 2 i = IIE σ(f (w, u)) du dw . τn ∧t Zτns∧t τn ∧t w Zusammengefasst Z hZ s Z v IIE σ(f (w, v)) dWw dv − τn ∧t τn ∧t s τn ∧t Z s σ(f (w, v)) dv dWw w 2 i =0. 7. ZINSRATENMODELLE 69 Also gilt Z s Z v Z s Z s σ(f (w, v)) dWw dv = τn ∧t σ(f (w, v)) dv dWw , τn ∧t τn ∧t w und lässt man n → ∞, Z sZ s Z sZ v σ(f (w, v)) dWw dv = σ(f (w, v)) dv dWw . t t t w Insbesondere gilt die Behauptung für alle t ∈ Q ∧ [0, s], und da die Prozesse stetig sind, für alle t ∈ [0, s]. Somit haben wir Z s (−f (v, v) + f (v, v) − f (t, v)) dv Xt = t Z s Z sZ v Z sZ v =− f (v, v) dv + α(w, v) dw dv + σ(f (w, v)) dWw dv t t t t t Z s Z sZ s Z sZ s =− f (v, v) dv + α(w, v) dv dw + σ(f (w, v)) dv dWw t t w t w Z t Z tZ s Z tZ s = X0 + f (v, v) dv − α(w, v) dv dw − σ(f (w, v)) dv dWw . 0 0 w 0 w Wir haben also das stochastische Differential Z s Z s dXt = f (t, t) − α(t, v) dv dt − σ(f (t, v)) dv dWt . t t Aus der Itô-Formel erhalten wir Z s nZ s o2 1 α(t, v) dv + 2 σ(f (t, v)) dv P (t, s) dt dP (t, s) = f (t, t) − t t Z s − σ(f (t, v)) dv P (t, s) dWt . t Aus (7.2) und r(t) = f (t, t) schliessen wir Z s s σt = − σ(f (t, v)) dv t und σts qt Z s α(t, v) dv − = t Also haben wir Z s α(t, v) dv = t 1 2 nZ t 1 2 nZ s σ(f (t, v)) dv o2 . t s σ(f (t, v)) dv o2 Z − qt s σ(f (t, v)) dv . t 70 7. ZINSRATENMODELLE Differenzieren wir nach s, erhalten wir Z s σ(f (t, v)) dv − qt σ(f (t, s)) . α(t, s) = σ(f (t, s)) t Setzen wir dies in die Definition (7.3) ein, erhalten wir Z s σ(f (t, v)) dv dt + σ(f (t, s)) dWt∗ . df (t, s) = σ(f (t, s)) (7.4) t Das folgende Resultat wurde in [2] bewiesen. Satz 7.9. Sei σ(x) Lipschitz-stetig und beschränkt. Für jede stetige Funktion φ : [0, T ] → IR+ gibt es einen eindeutigen stetigen Prozess f (t, s), 0 ≤ t ≤ s ≤ T , so dass für alle s der Prozess t 7→ f (t, s), 0 ≤ t ≤ s, adaptiert ist, die Gleichung (7.4) und die Randbedingung f (0, s) = φ(s) erfüllt. Es ist in [2] gezeigt, dass es für die Funktion σ(x) = x keine eindeutige Lösung gibt. Daher kann man die Beschränktheit der Volatilität nicht weglassen. Das Interessante an diesem Modell ist, dass es, wie im Black–Scholes-Modell, nur nötig ist, die Funktion σ(x) zu bestimmen. Der Drift-Prozess α(t, s) hat auf die Festsetzung der Preise keinen Einfluss. 7.3. Obligationen mit Kreditrisiko In der Realität sind Option mit einem Kreditrisiko behaftet. Es ist somit nicht sicher, dass die Schuld zum Auslaufzeitpunkt wirklich zurückbezahlt wird. Ist τ der Zeitpunkt, an dem die Insolvenz eintritt, wird der Preis einer Null-CouponObligation i h n Z s o ∗ P (t, s) = IIE exp − r(u) du 1Iτ >s Ft . t Dies ist natürlich kleiner als der Preis der risikolosen Obligation. Der Preisunterschied ist der Preis für das Kreditrisiko. Eine Möglichkeit, Kreditrisiko zu modellieren sind die Intensitätsmodelle. Man nimmt an, dass die Verteilung von τ die folgende Form hat o i h n Z s ∗ ∗ IIP [τ > s | Ft ] = 1Iτ >t IIE exp − λ(X v ) dv Ft , t wobei λ(x) eine positive Funktion ist, und {X t } ein stochastischer Prozess. Zum Beispiel kann eine Koordinate von X die Zinsintensität r(t) sein. Oder eine Koordinate kann ausdrücken, wie die Firma durch eine Rating-Agentur beurteilt wurde. 7. ZINSRATENMODELLE 71 Nehmen wir an, dass X und r bekannt sind und betrachten der Einfachheit halber den Zeitpunkt t = 0. Der Preis der Null-Coupon-Obligation wird dann o n Z s o n Z s ∗ r(v) dv = exp − (λ(X v ) + r(v)) dv . IIP [τ > s | X, r] exp − 0 0 Somit wird der Preis der Null-Coupon-Obligation o i h n Z s ∗ (λ(X v ) + r(v)) dv Ft . P (t, s) = IIE exp − t Eine andere Möglichkeit zur Modellierung sind Strukturmodelle. Ein beliebtes Modell ist das Merton-Modell. Nehmen wir an, der Wert einer Firma wird als geometrische Brownsche Bewegung modelliert Vt = V0 exp{σWt + (µ − 21 σ 2 )t} . Die risikolose Zinsintensität ist r. Die Firma wird insolvent, wenn Vt < K. Das bedeutet, dass die Aktionäre die Firma liquidieren, falls Ihr Wert unter K sinkt. Dann wird der Preis der Null-Coupon-Obligation P (t, s) = IIE∗ [e−r(s−t) 1Iinf{Vu :t<u≤s}≥K | Ft ] = e−r(s−t) IIP∗ [inf{σ W̃u + (µ − 21 σ 2 )u : 0 ≤ u ≤ s − t} ≥ log K/Vt | Vt ] , wobei W̃ eine unabhängige Brownsche Bewegung ist. Die letzte Formel gilt natürlich nur auf der Menge {Vt > K}, da sonst die Obligation schon wertlos geworden ist. Der Prozess {Vt } sollte auch gleichviel Wert sein, wie die Summe aller Aktien. Das heisst, dass Vt ein Vielfaches des Aktienkurses ist. Somit muss unter dem Martingalmass σWt + (µ − 12 σ 2 )t = σWt∗ + (r − 21 σ 2 )t gelten. Man braucht also bloss die Ruinwahrscheinlichkeit einer Brownschen Bewegung mit Drift zu kennen. Tritt Insolvenz zum Zeitpunkt τ ein, und sind B Obligationen ausstehend, dann wird der Wert der Obligationen Be−r(s−τ ) sein. Wir nehmen an, dass e−r(s−τ ) B > K. Dann bekommen die Obligationshalter den Betrag K/B ausbezahlt. In diesem Fall wird die Formel komplizierter P (t, s) = IIE∗ [e−r((τ ∧s)−t) min{Vτ ∧s /B, 1} | Ft ] . Als Verallgemeinerung kann man die Grenze K zeitabhängig wählen, das heisst, τ = inf{t : Vt < Kt }. In diesem Fall wird die Berechnung von P (t, s) kompliziert, ausser man wählt Kt = K0 eδt für ein δ ∈ IR. Wir machen hier die Berechnung nicht explizit. 72 7. ZINSRATENMODELLE 7.4. Zinsswaps Ein Zinsswap ist eine Abmachung, bei der die Zinsen von zwei unterschiedlichen Schuldverschreibungen ausgetauscht werden, ohne dass die entsprechenden Schuldverschreibungen ausgetauscht werden. Normalerweise werden ein fester und ein variabler Zinssatz ausgetauscht. Die Swaps können auf zwei Arten verwendet werden: Falls man Schulden hat, kann man den Zins, den man zahlen muss austauschen. Falls man ein Darlehen gewährt hat, kann man den Zins, den man erhält, umwandeln. Zum Beispiel, eine Lebensversicherung hat Ihren Kunden einen festen Zinssatz versprochen. Nun gewährt die Lebensversicherung eine Hypothek zu einem variablen Zinssatz. Um sich gegen eine Zinssenkung abzusichern, geht die Lebensversicherung einen Swap-Kontrakt ein. Die Lebensversicherung zahlt der Gegenpartei einen variablen Zins, erhält im Gegenzug von der Gegenpartei einen festen Zins. Die zugrundeliegende Hypothek bleibt aber im Besitz der Lebensversicherung. Der variable Zinssatz wird oft durch die LIBOR (London Interbank Offered Rate) oder durch die EURIBOR (EURopean Interbank Offered Rate) bestimmt. Diese Zinssätze basieren auf relativ kurzfristigen Darlehen zwischen Banken, und sind gut beobachtbar. Wie aber die Erfahrung zeigt, können Bankangestellte die Zinssätze einfach manipulieren. In vielen Fällen werden die Zinsen des festen Zinssatzes einmal pro Jahr ausgerichtet, die Zinsen des variablen Zinssatzes werden halbjährlich bezahlt. Die zu bezahlenden Zinsen sind dann jeweils ein halbes Jahr im voraus bekannt. Das heisst, zu Beginn des Halbjahres werden die Zinsen, die am Ende des Halbjahres fällig werden, festgelegt. Seien 0 < t1 < · · · < tn = T die Zeiten, an denen Zinsen fällig werden, und t0 = 0. Nehmen wir an, dass ein Mass IIP∗ existiert, unter dem die Preise bestimmt werden. Die risikolose Zinsrate wird mit r(t) bezeichnet, und wir nehmen an, dass kein Kreditrisiko vorhanden ist. Zum Zeitpunkt tk−1 wird nun die Zahlung festgelegt, die zum Zeitpunkt tk erfolgen wird. Im Zeitpunkt tk wird also die Zahlung Vk erfolgen. Nehmen wir für den Moment an, dass die Schuld zum Zeitpunkt tk beglichen wird. Die Schuld im Zeitpunkt tk−1 ist 1. Also muss gelten h n Z tk o i ∗ 1 = (1 + Vk )IIE exp − r(v) dv Ftk−1 = (1 + Vk )P (tk−1 , tk ) . tk−1 Wir erhalten also Vk = (P (tk−1 , tk ))−1 − 1 . 7. ZINSRATENMODELLE 73 Der Wert dieser Zahlung zum Zeitpunkt 0 ist dann o i h n Z tk ∗ r(v) dv Vk IIE exp − 0 oi o i h n Z tk h n Z tk ∗ ∗ r(v) dv r(v) dv (1 + Vk ) − IIE exp − = IIE exp − 0 0 oi oi h n Z tk h n Z tk−1 ∗ ∗ r(v) dv r(v) dv − IIE exp − = IIE exp − 0 0 = P (0, tk−1 ) − P (0, tk ) . Der Wert der variablen Zinszahlungen ist also 1 − P (0, T ). Rechnen wir die (nicht zu bezahlende) Schuld dazu, wird der Wert also 1. Für die festen Zinszahlungen mit Zins r erhalten wir die Formel n X k=1 h n Z IIE r exp − ∗ tk r(v) dv oi =r 0 n X P (0, tk ) , k=1 wobei wir annehmen, dass tk = kT /n. Der faire Zinssatz wird somit 1 − P (0, T ) r = Pn . k=1 P (0, tk ) Der Wert des Zinsswaps zum Zeitpunkt 0 ist dann also, betrachtet vom Empfänger des festen Zinses, r n X k=1 P (0, tk ) − 1 + P (0, T ) = (1 + r)P (0, T ) + r n−1 X P (0, tk ) − 1 , k=1 wobei tk die Zeitpunkte der festen Zinszahlungen bezeichnet. Man kann auch Optionen auf Swaps kaufen, sogenannte Swaptions. Bei einem Call-Swaption hat der Käufer das Recht, aber nicht die Verpflichtung, zum Zeitpunkt t einen Swap-Kontrakt als Festratenempfänger einzugehen. Der Stillhalter verpflichtet sich bei einem Call-Swaption die feste Rate zu bezahlen, und im Gegenzug die variable Rate zu empfangen. Bei einem Put-Swaption hat der Käufer das Recht, aber nicht die Verflichtung einen Swap als Empfänger der variablen Rate einzugehen. In beiden Fällen kann man die Festzinsrate als Strike-Preis betrachten. 74 8. 8. FORWARDS AND FUTURES Forwards and Futures Wir betrachten in diesem Abschnitt einen generellen Gaussschen Markt. Das heisst, dass die Filtration durch eine d-dimensionale Brownsche Bewegung erzeugt wird. Der risikolose Aktiv ist gegeben durch nZ t o 0 r(s) ds , Zt = exp 0 wobei {r(t)} ein {Ft }-adaptierter Prozess ist. Die Preise werden unter einem äquivalenten Martingalmass IIP∗ berechnet. 8.1. Forwards Ein Forward ist ein Vertrag, der die Auslieferung eines Produkts zum Zeitpunkt T regelt, und im Zeitpunkt 0 nichts kostet. Zum Beispiel, wird der Vertrag geschlossen, dass der Vertragspartner die Aktie ST zum Preis K kauft, muss die Gleichung h n Z T oi ∗ 0 = IIE (ST − K) exp − r(s) ds = S0 − KP (0, T ) 0 gelten, also S0 . P (0, T ) Will man den Forward nun handeln, ist der Preis zur Zeit t h o i n Z T S0 P (t, T ) ∗ IIE ST − r(s) ds Ft = St − S0 exp − . P (0, T ) P (0, T ) t K= In einem generellen Modell vereinbaren die Vertragspartner zum Zeitpunkt t, dass die FT -messbare Variable W zum Preis Ft verkauft wird. Da der Preis 0 ist, muss die Gleichung i h n Z T o ∗ IIE exp − r(s) ds (W − Ft ) Ft = 0 t gelten. Daher ist Ft = IIE∗ [exp{− RT IIE∗ [exp{− t r(s) ds}W | Ft ] RT t r(s) ds} | Ft ] = IIE∗ [exp{− RT r(s) ds}W | Ft ] . P (t, T ) t Das ist der Wert der Zahlung W dividiert durch den Preis der Null-Coupon-Obligation. Der Wert des Vertrages zum Zeitpunkt s ist dann i h n Z T o ∗ IIE exp − r(v) dv (W − Ft ) Fs . s 8. FORWARDS AND FUTURES 75 Wird der Wahrscheinlichkeitsraum durch eine d-dimensionale Brownsche Bewegung generiert, so kann man zeigen, dass {Ft } ein Itô-Prozess ist. Sind zum Beispiel {r(t)} und W unabhängig, so erhalten wir die Formel Ft = IIE∗ [W | Ft ]. Somit ist in diesem Fall der Prozess {Ft } ein Martingal. Ein Beipiel für einen Forward ist ein Termingeschäft mit einem Swap. Die Parteien verpflichten sich dann, zum Zeitpunkt T einen Swap mit Laufzeit S (das heisst, Zahlungen im Intervall (T, T + S) einzugehen). 8.2. Futures Ein Future ist ein ähnlicher Vertrag wie ein Forward. Hier wird aber zu bestimmten Zeitpunkten der Vertrag justiert, so dass der Wert des Futures wieder 0 wird. Wir machen nun die vereinfachende Annahme, dass der Future stetig justiert wird, also dass der Wert über die gesamte Laufzeit 0 ist. Dies bedeutet, dass Dividenden bezahlt werden müssen, um den Wert auszugleichen. Verändert sich der Kurs des dem Futures zugrundeliegende Aktiv, muss einer der Partner dem andern die Kursdifferenz erstatten. Sei W eine FT -messbare Variable, die den “Wert” des Futures beschreibt. Dann ist der Wert zur Zeit T , ΦT = W . Hat die letzte Dividendenzahlung zur Zeit s stattgefunden, und ist jetzt Zeit t > s, dann muss der Verkäufer des Futures dem Halter des Futures den Wert Φt − Φs zur Zeit t bezahlen. Ist dieser Wert negativ, dann bedeutet dies, dass der Halter Φs − Φt an den Verkäufer bezahlen muss. Nehmen wir nun an, dass die Dividendenzahlungen stetig stattfinden, und dass {Φt } ein Itô-Prozess ist: dΦt = µt dt + σt dWt∗ . Benutzt man eine Strategie {θt }, das heisst, man hält zum Zeitpunkt t θt Futures Rt im Portfolio, dann ist der Gewinn 0 θs dΦs . Zum Zeitpunkt T findet keine Zahlung mehr statt. Wir nehmen weiter an, dass die Zinsintensität r(t) beschränkt ist. Rt Sei βt = exp{− 0 r(s) ds} der Diskontierungsprozess. Da der Wert des Vertrages zu jedem Zeitpunkt 0 ist, bedeutet dies, dass i hZ T ∗ IIE βs dΦs Ft = 0 . t 76 8. FORWARDS AND FUTURES Also haben wir für s ≥ t, i i i hZ s hZ s hZ T ∗ ∗ ∗ IIE βu dΦu Ft = IIE βu dΦu + IIE βu dΦu Fs Ft 0 0 s i hZ T = IIE∗ βu dΦu Ft 0 Z t i Z t hZ T ∗ βu dΦu . βu dΦu + IIE βu dΦu Ft = = 0 Somit ist { Rt 0 0 t βs dΦs } ein Martingal unter IIP∗ . Aus Z t Z βs dΦs = 0 t Z βs µs ds + 0 t βs σs dWt∗ 0 und Hilfssatz C.15 schliessen wir, dass βt µt = 0. Da βt > 0, muss µt = 0 gelten. Also ist {Φt } ein Martingal. Wir haben daher Φt = IIE∗ [ΦT | Ft ] = IIE∗ [W | Ft ] . Umgekehrt können wir schliessen, dass falls {Φt } ein Martingal ist, dann ist es ein Itô-Prozess (Martingal Representationstheorem). Sind W und {r(s)} unabhängig, dann sind Futures- und Forwardpreis identisch. Nehmen wir an, dass es eine selbstfinanzierende Strategie gibt (Aktive ohne Futures), die den Wert o nZ T r(s) ds Zt = W exp t reproduziert. Der Wert dieser Strategie zum Zeitpunkt t ist dann IIE∗ [W | Ft ] = Φt . Wir benutzen nun die folgende Strategie. Zum Zeitpunkt s halten wir θs = Rs exp{ t r(v) dv}1Is≥t Futures in unserem Portfolio. Weiter investieren wir den Betrag Φt in den risikolosen Aktiv, und Dividenden des Futures werden auch im risikolosen Aktiv investiert. Somit werden eventuelle negative Dividenden auch über die risikolose Investition finanziert. Da der Preis des Futures immer 0 ist, haben wir ab dem Zeitpunkt t eine selbstfinanzierende Strategie. Der Wert {Vt } der Strategie hat somit die Eigenschaft dVs = r(s)Vs ds + θs dΦs . Aus der Itô-Formel schliessen wir, dass nZ s o Vs = Φs exp r(v) dv . t 8. FORWARDS AND FUTURES 77 Somit haben wir nZ VT = ΦT exp t T nZ r(v) dv = W exp o T o r(v) dv = ZT . t Die Strategie, die ZT reproduziert, und die Futures-Strategie müssen also den selben Wert haben. Daher ist der Wert des Futures eindeutig bestimmt. Wir schliessen auch, dass der Futures und die Strategie, die ZT reproduziert, den gleichen Geldstrom erzeugen müssen. Verändern wir die Strategie zu einer Strategie mit Dividenden, erhalten wir eine Hedging-Strategie für den Futures. 78 9. 9. PORTFOLIO THEORIE Portfolio Theorie Wir vereinfachen nun den Markt. Wir definieren die Rendite des i-ten Aktivs D i − qi . Ri = qi Falls der Aktiv eine Dividende ausbezahlt, ist die Dividende im Preis Di zur Zeit 1 enthalten. 9.1. Markowitz-Diversifikation Der Investor basiert seine Entscheidungen nun nur auf den Grössen IIE[Ri ] und Var[Ri ]. Er bevorzugt grösseren Mittelwert und kleinere Varianz. Beginnen wir mit der Analyse im Fall, wo es nur zwei Aktiven gibt. Der Händler kann nun eine Einheit investieren. Er investiert x in den ersten Aktiv und 1 − x in den zweiten Aktiv. Dann wird seine Rendite R = xR1 + (1 − x)R2 . Sei ρ die Korrelation der beiden Renditen. Nehmen wir an, dass µ1 ≤ µ2 und σ1 ≤ σ2 , wobei µi = IIE[Ri ] und σi2 = Var[Ri ]. Die mittlere Rendite wird µ = xµ1 + (1 − x)µ2 . Die Varianz des Portfolios wird σ 2 = x2 σ12 + (1 − x)2 σ22 + 2ρx(1 − x)σ1 σ2 . Wir können nun die minimale Varianz suchen (varianzminimales Portfolio) 2[xσ12 − (1 − x)σ22 + (1 − 2x)ρσ1 σ2 ] = 0 . Dies hat die Lösung σ22 − ρσ1 σ2 . σ12 + σ22 − 2ρσ1 σ2 Der Nenner ist Var[R1 − R2 ] und daher, vorausgesetzt dass R1 6= R2 , verschieden von Null. Somit erhalten wir minimal die Varianz xVMP = (σ22 − ρσ1 σ2 )2 σ12 + (σ12 − ρσ1 σ2 )2 σ22 + 2ρσ1 σ2 (σ22 − ρσ1 σ2 )(σ12 − ρσ1 σ2 ) (σ12 + σ22 − 2ρσ1 σ2 )2 (1 − ρ2 )σ12 σ22 = 2 . σ1 + σ22 − 2ρσ1 σ2 2 σVMP = Betrachten wir nun σ 2 als Funktion von ρ. Ableiten ergibt 2x(1 − x)σ1 σ2 . Somit ist die Funktion wachsend in ρ, falls x ∈ [0, 1], und fallend sonst. Erlauben wir keine kurze Positionen, bekommen wir ein Bild, falls wir uns die Extremfälle ansehen. 9. PORTFOLIO THEORIE 79 ρ = −1 Man bemerke, dass ρ = −1 nicht für alle Verteilungen von Ri möglich ist. Wir haben die Varianz σ 2 = x2 σ12 + (1 − x)σ22 − 2x(1 − x)σ1 σ2 = (xσ1 − (1 − x)σ2 )2 . Damit ist σ = |xσ1 −(1−x)σ2 |. Also müssen wir x ≤ σ2 /(σ1 +σ2 ) und x ≥ σ2 /(σ1 +σ2 ) unterscheiden. Im ersten Fall haben wir σ2 − σ . x= σ1 + σ2 Der Mittelwert wird dann (σ2 − σ)µ1 + (σ1 + σ)µ2 µ= . σ1 + σ2 Dies ist eine Gerade, die (µ2 , σ2 ) mit ((µ1 σ2 + µ2 σ1 )/(σ1 + σ2 ), 0) verbindet. Analog folgt im anderen Fall, dass die Punkte auf der Gerade liegen, die (µ1 , σ1 ) mit ((µ1 σ2 + µ2 σ1 )/(σ1 + σ2 ), 0) verbindet. ρ = 1 Man bemerke, dass ρ = 1 nicht für alle Verteilungen von Ri möglich ist. Wir haben die Varianz σ 2 = x2 σ12 + (1 − x)σ22 + 2x(1 − x)σ1 σ2 = (xσ1 + (1 − x)σ2 )2 . Also können wir (falls σ2 > σ1 ) x= σ2 − σ σ2 − σ1 schreiben. Der Mittelwert wird daher (σ2 − σ)µ1 + (σ − σ1 )µ2 . µ= σ2 − σ1 Der Mittelwert ist also eine lineare Funktion von σ, das heisst die möglichen Werte (µ, σ) liegen auf der Gerade, die (µ1 , σ1 ) mit (µ2 , σ2 ) verbindet. ρ ∈ (−1, 1) Schreiben wir, vorausgesetzt dass µ1 < µ2 , µ2 − µ x= . µ2 − µ1 Setzen wir dies in die Varianz ein, erhalten wir σ2 = (µ2 − µ)2 σ12 + (µ − µ1 )2 σ22 + 2ρ(µ2 − µ)(µ − µ2 )σ1 σ2 . (µ2 − µ1 )2 Dies ist eine quadratische Funktion von µ. Die Werte von (µ, σ 2 ) liegen also auf der Parabel, die durch (µ1 , σ12 ), (µ2 , σ22 ) und das varianzminimale Portfolio geht. Im Vergleich mit den Funktionen in den Fällen ρ = ±1, müssen wir noch die Wurzel aus σ 2 nehmen. 80 9. PORTFOLIO THEORIE 9.2. Markowitz-Effizienz Nehmen wir nun, dass wir N Aktiven im Markt haben. Ein Anleger, der ein Portfolio nur über Mittelwert und Varianz der Rendite beurteilt, wird dann nur Portfolios wählen, die für einen festen Mittelwert minimale Varianz haben, oder für eine feste Varianz maximalen Mittelwert haben. Ein solches Portfolio nennen wir Markowitzeffizient. Im Falle von zwei Aktiven können wir alle Portfolios ausschliessen, die einen Mittelwert kleiner als den Mittelwert des varianzminimalen Portfolios haben. Wir betrachten nun das Problem, wie wir ein Portfolio mit festem Mittelwert wählen. Sei die Kovarianz von Ri und Rj durch σij gegeben. Wir wollen die Varianz N X N X σij xi xj i=1 j=1 unter den Nebenbedingungen N X N X µ i xi = r , i=1 xi = 1 i=1 minimieren. Das bedeutet, dass wir den Ausdruck 1 2 N X N X σij xi xj + ε1 r − i=1 j=1 N X µ i xi + ε2 1 − i=1 N X xi i=1 minimieren müssen. Leiten wir nach xi ab, erhalten wir N X σij xj − ε1 µi − ε2 = 0 . j=1 In Vektorform lauten die Gleichungen Σx − ε1 µ − ε2 e = 0 , wobei Σ die Kovarianzmatrix ist, µ = (µ1 , . . . , µN )> und e = (1, . . . , 1)> . Haben wir keine linearen Abhängigkeiten, ist Σ invertierbar, und x = Σ−1 (ε1 µ + ε2 e) . Die Nebenbedingugen ergeben µ> Σ−1 (ε1 µ + ε2 e) = r , e> Σ−1 (ε1 µ + ε2 e) = 1 , 9. PORTFOLIO THEORIE 81 woraus sich ε1 und ε2 bestimmen lassen. Wir sehen, dass die Lösung linear in r ist. Wir schliessen daraus, dass sich alle effizienten Portfolios als Linearkombination von zwei Portfolios auf dem effizienten Rand darstellen lassen. Unsere Herleitung betrachtete den Fall, wo auch kurze Positionen erlaubt waren. Falls man keine kurzen Positionen erlaubt, ist die Menge der möglichen Portfolios kleiner. Falls negative Positionen im global optimalen Portfolio vorkommen, wird man mindestens einen dieser Aktiven nicht im Portfolio führen. 9.3. Portfolio-Selektion Markowitz Effizienz sagt uns noch nicht, wie wir ein Portfolio wählen sollen. Wir haben immer noch alle Portfolios auf dem effizienten Rand zur Verfügung. Wir wollen nun Möglichkeiten diskutieren, wie man ein solches Portfolio wählen könnte. 9.3.1. Optimaler Nutzen Wir haben schon diskutiert, wie man den erwarteten Nutzen optimiert. Da wir nur Erwartungswert und Varianz zur Verfügung haben, kommt in diesem Fall nur quadratischer Nutzen in Frage. Wir könnten aber auch andere Funktionen von IIE[R] und Var[R] verwenden. Wir ändern das Problem leicht ab. Wir suchen ein Portfolio, so dass U (R) = IIE[R] − a Var[R] , a>0 maximal wird. Oder wir könnten p U (R) = IIE[R] − b Var[R] , b>0 maximieren. Beachte, dass die oben genannten Funktionen keine Nutzenfunktion im Sinne der Nutzentheorie sind. Um das Problem zu lösen, könnte man sich auf die effizienten Portfolios beschränken, da eine Lösung zum obigen Problem notwendigerweise effizient ist. Es ist aber einfacher, das Problem direkt zu lösen. 9.3.2. Das Benchmark-Portfolio In der Praxis wird man oft ein Benchmarkportfolio benutzen. Man hat sich bereits ein Portfolio oder einen Aktienindex vorgegeben. Dieses Portfolio benötigt man zum Vergleich. Eine Idee könnte sein, dass man die Varianz dieses Portfolios zum Vergleich wählt (das heisst, man will nicht mehr Risiko eingehen, als im BenchmarkPortfolio). Man wählt dann die maximale mittlere Rendite, die die gleiche Varianz 82 9. PORTFOLIO THEORIE hat, wie das Benchmarkportfolio. Dies dürfte aber in der Praxis nicht der Fall sein. Dort würde die Rendite ja mit der Rendite des Referenzportfolios verglichen. Somit wäre es sicherer, das Referenzportfolio zu reproduzieren. So versuchen viele Pensionskassen und Lebensversicherungen zum Beispiel den DAX zu reproduzieren. Solch ein Portfolio wird in der Regel nicht effizient sein, ausser der Index wurde als ein effizientes Portfolio konstruiert. 9.3.3. Kontrolle der Shortfallwahrscheinlichkeit Eine weitere Methode ist die Shortfallwahrscheinlichkeit. Nehmen wir an, ein Investierungsziel ist vorgegeben. Dann verlangen wir IIP[R ≤ z] = F (z) ≤ ε , also das Ziel muss mindestens mit Wahrscheinlichkeit 1 − ε erreicht werden. Falls sich die Menge der möglichen Portfolios mit der Menge {F (z) ≤ ε} schneidet, kann man den Wert (µ, σ 2 ) aus der Menge {F (z) ≤ ε} wählen, der µ maximiert. Man kann dann hoffen, dass es sich um ein effizientes Portfolio handelt. Dies muss nicht notwendigerweise der Fall sein. Die Theorie funktioniert, falls {Ri } multinomial normalverteilt ist. Dann ist auch R normalverteilt. It Nε das ε-Quantil der Standardnormalverteilung, dann muss µ + Nε σ > z gelten, oder µ > z − Nε σ. Dies ist eine lineare Bedingung, und, falls es eine Lösung gibt, ist diese effizient. Die Lösung lässt sich dann einfach graphisch bestimmen. Bleiben wir nun im normalverteilten Fall und betrachten mehrere Perioden. Wir können zwei Kriterien definieren. Als Ziel könnten wir eine mittlere Rendite angeben i h1 IIP (R1 + · · · + RT ) ≤ z ≤ ε . T Wegen der Parabelform des effizienten Randes schliessen wir, dass wir für alle Perioden das gleiche Portfolio wählen müssen. Wir erhalten damit die Bedingung √ µ > z − Nε σ/ T . Falls wir dies mit der gleichen Rendite für eine Periode vergleichen, sehen wir, dass wir mehr Risiko eingehen können. Oder, wir sehen, dass es möglich ist, eine höhere Rendite zu verlangen. 9. PORTFOLIO THEORIE 83 Man kann aber auch, für jedes Jahr eine Rendite vorgeben. Falls man nun nur zu Beginn ein Portfolio wählen darf (zum Beispiel, um Handelskosten zu vermeiden), und die Renditen in verschiedenen Jahren unabhängig sind, lautet die Bedingung 1 1 T T IIP[R > z , . . . , R > z ] = T Y IIP[Rj > z j ] = Y (1 − F (z j )) > 1 − ε . j=1 Ist z j = z konstant, erhalten wir 1 − F (z) > (1 − ε)1/T , was eine andere lineare Bedinung ist. Eine weitere Möglichkeit ist zu verlangen, dass F (z j ) ≤ εj , das heisst, wir haben eine Reihe von Bedinungen, die wir stellen. Jede Bedinung stellt eine Halbebene dar, in der die Lösung liegen muss. Diese Problem löst man am besten dann graphisch. 9.4. Indexmodelle Ein Problem ist der Fluch der Dimensionalität. Haben wir N Aktiven über T Perioden beobachtet, haben wir T N Daten. Die zu bestimmenden Parameter sind N Mittelwerte, N Varianzen und N (N − 1)/2 Kovarianzen, das heisst, N (N + 3)/2 Parameter. Die Anzahl Parameter wächst also quadratisch mit der Anzahl der Aktiven, die Beobachtungen linear. Das wird statistisch zu einer grossen Unsicherheit führen. Man braucht daher Modelle, die die Anzahl der Parameter reduzieren. Wie sich eine Aktie verhält, hängt von äusseren Ökonomischen Faktoren ab. Diese Faktoren lassen sich oft aus wenigen Aktiven schätzen. Betrachten wir den Fall von einem Faktor. Nehmen wir an, es gibt ein Indexportfolio RMI , aus dem der Faktor genügend genau geschätzt werden kann. Dieses 2 Portfolio ist durch Mittelwert µMI und Varianz σMI gegeben. Die andern N Aktiven sind durch die Gleichung Ri = ai + bi RMI + εi gegeben. Die Variablen RMI , {εi } sind paarweise unkorreliert. Wir haben weiter IIE[εi ] = 0, Var[εi ] = s2i . Es bleiben uns also 3N + 2 Parameter zu schätzen. Je mehr Faktoren man zulässt, um so mehr Parameter braucht man zu schätzen. Die Anzahl der Parameter wird aber linear mit N wachsen. Die meisten Modelle begnügen sich mit drei oder sechs Faktoren. Wir können jetzt die Erwartungswerte und Varianzen angeben. Für den Erwartungswert erhalten wir µi = IIE[Ri ] = ai + bi µMI . 84 9. PORTFOLIO THEORIE Für die Varianz erhalten wir 2 σi2 = Var[Ri ] = b2i σMI + s2i , und für die Kovarianzen i 6= j 2 . Cov[Ri , Rj ] = bi bj σMI Vergleichen wir den Aktiv mit dem Marktindex, erhalten wir 2 Cov[Ri , RRM ] = bi σMI . Also ist bi = und ai = µ i − Cov[Ri , RRM ] 2 σMI Cov[Ri , RRM ] µMI . 2 σMI bi heisst β-Wert der Aktie, ai heisst α-Wert der Aktie. P Für ein beliebiges Portfolio R = xi Ri erhält man also Mittelwert µR = X ai x i + X bi xi µMI und Varianz σR2 = X 2 x2i b2i σMI + X x2i s2i + 2 X 2 xi xj bi bj σMI = X xi b i 2 2 σMI + X x2i s2i . i<j 9.5. Kapitalmarktgleichgewicht: Capital-Asset-Pricing-Model 9.5.1. Das Marktindexmodell Wir nehmen nun an, dass das Marktportfolio einem realisierbaren Portfolio M entspricht. Wir haben dann X RMI = ci Ri für Gewichte {ci }. Wir erhalten dann also hX i X 2 ci Ri , RMI = ci Cov[Ri , RMI ] , σMI = Cov oder anders geschrieben σMI = X ci ρ(Ri , RMI )σi , 9. PORTFOLIO THEORIE 85 wobei ρ(Ri , RMI ) den Korrelationskoeffizienten bezeichnet. Wir schreiben σi = ρ(Ri , RMI )σi + (1 − ρ(Ri , RMI ))σi . Der erste Summand heisst systematisches Risiko, der zweite diversifizierbarbares Risiko. Der Name kommt daher, dass der erste Teil zum Marktrisiko beiträgt. Die β-Faktoren lassen sich nun als bi = ρ(Ri , RRM )σi systematisches Risiko der Aktie Cov[Ri , RRM ] = = 2 σMI σMI Marktrisiko darstellen. In der Praxis müssen noch die Parameter geschätzt werden. Dies ist ein lineares Regressionsproblem, das ein Standardproblem in der Statistik darstellt. 9.5.2. Portfoliotheorie mit einer sicheren Anlage Wir erlauben nun zusätzlich eine sichere Anlage R0 mit sicherem Zins r0 . Man kann zum Zins r0 sowohl Geld anlegen als auch sich Geld ausleihen. Mit a bezeichnen wir den Anteil des Kapitals, das wir in ein Aktienportfolio P anlegen. Somit ist 1 − a der Anteil, den wir in den sicheren Aktiv investieren. Das heisst, µ = aµP + (1 − a)r0 = r0 + a(µP − r0 ) und σ 2 = a2 σP2 . Schreiben wir a = σ/σP , erhalten wir µ = r0 + σ µP − r0 (µP − r0 ) = r0 + σ. σP σP Dies ist eine lineare Funktion, die in einem sinnvollen Markt steigend sein sollte. Setzen wir σ = σP , erhalten wir µ = µP , also das Portfolio P . Somit liegt das Portfolio P auf dem effizienten Rand. Betrachten wir nun den Gesamtmarkt, und betrachten wir alle möglichen Portfolios, die sich so konstruieren lassen, erkennen wir, dass der effiziente Rand durch das risikolose Portfolio und das Tangentenportfolio T des effizienten Randes ohne risikolosen Aktiv gegeben ist, das heisst das Portfolio T , bei dem die Tangente durch (0, r0 ) den effizienten Rand berührt. 86 9. PORTFOLIO THEORIE 9.5.3. Capital-Asset-Prising-Model (CAPM) Nehmen wir nun an, dass wir einen risikolosen Aktiv r0 haben. Mit dem Marktportfolio M bezeichnen wir die Summe aller Aktien am Markt. Der effiziente Rand lässt sich dann durch ein Tangentenportfolio T und den risikolosen Aktiv beschreiben. Jeder Investor wählt nun ein effizientes Portfolio Pi . Das heisst, der Anteil λi wird ins Tangentenportfolio T investiert, der Anteil 1 − λi in den risikolosen Aktiv. Ist Vi der Wert des Budgets des Händlers i, ist das Nachfrageportfolio X λi Vi xT , wobei xT den Anlagevektor des Portfolios T bezeichnet. Sei xM der Anlagevektor des Marktportfolios M , das heisst xM i bezeichnet den Anteil der i-ten Aktie am Gesamtwert P des Marktes. Damit wir ein Marktgleichgewicht haben muss Angebot und Nachfrage gleich sein, das heisst X λ i V i xT = P x M . Die beiden Vektoren xM und xT müssen also bis auf eine multiplikative Konstante gleich sein. Da die Summe der Koordinaten für beide Vektoren 1 ist, müssen die P Vektoren identisch sein und P = λi Vi . Wir haben also, dass das Marktportfolio M mit dem Tangentialportfolio T identisch ist. Wir folgern, dass die optimalen Portfolios durch die Gerade µ = r0 + µM − r0 σ σM gegeben sind. Diese Portfolios sind durch R = (1 − bR )r0 + bR RM gegeben, also haben wir µ = (1 − bR )r0 + bR µM = r0 + bR (µM − r0 ) = r0 + Cov[R, RM ] (µM − r0 ) . 2 σM Schreiben wir µ − r0 = bR (µM − r0 ) , können wir µM − r0 als Risikoprämie interpretieren. Der Faktor (µM − r0 )/σM heisst dann Marktpreis des Risikos. Wir haben also die Formel Erwartete Rendite = Risikoloser Zins + Markpreis des Risikos · systematisches Risiko . 9. PORTFOLIO THEORIE 87 Versuchen wir zum Schluss noch den Preis einer Aktie auszurechnen. Ist V der zukünftige Preis der Aktie, P der heutige Preis, so haben wir IIE[V ] − 1 = IIE[R] = r0 + bR (µM − r0 ) , P oder P = IIE[V ] . 1 + r0 + bR (µM − r0 ) Das ist der diskontierte erwartete Wert zum Zeitpunkt 1. Der Diskontierungsfaktor ist dabei durch einen Risikozuschlag erhöht. Eine Einheit heute hat so den Wert 1 + r0 + bR (µM − r0 ) zum Schlusszeitpunkt, ist also der Wert einer risikolosen Einheit plus den Wert des Risikos. 9.6. State-Price-beta-Modelle Kehren wir zum Einperiodenmodell aus Kapitel 1 zurück. Sei p > 0 in IRS mit echt positiven Koordinaten ein Wahrscheinlichkeitsvektor. Wir schreiben nun für jeden Vektor x ∈ IRS die Kurzformel IIE[x] = px = S X p j xj . j=1 Nehmen wir an, dass keine Arbitrage existiert. Dann gibt es einen State-Price-Vektor ψ. Wir schreiben πj = ψj /pj . Dann lässt sich X qi = pj Dij πj j schreiben. Der Vektor π heisst dann State-Price-Deflator. Für x, y ∈ IRS definieren wir die Kovarianz Cov[x, y] = S X pj xj yj − IIE[x]IIE[y] . j=1 Die Varianz ist definiert als Var[x] = Cov[x, x]. Sei θ ein Portfolio mit θq 6= 0. Die Rendite ist dann Rjθ = (θD)j −1. θq 88 9. PORTFOLIO THEORIE Wir nehmen weiter an, dass es ein risikoloses Portfolio mit konstanter Rendite Rc in allen Zuständen gibt. So ein Portfolio existiert, falls der Markt vollständig ist. Dann gilt P P IIE[Rθ ] Sj=1 pj πj − Sj=1 pj πj Rc IIE[Rθ ]IIE[π] − (1 − IIE[π]) θ c = IIE[R ] − R = PS IIE[π] j=1 pj πj PS θ E[Rθ ]IIE[π] Cov[Rθ , π] j=1 pj πj Rj − II =− =− . IIE[π] IIE[π] Das bedeutet, dass die Korrelation mit π einen negativen Effekt auf die erwartete Rendite hat. Die Korrelation zwischen x und y ist definiert als ( √ Cov[x,y] falls Var[x] Var[y] > 0, Var[x] Var[y] Cor[x, y] = 0 sonst. Da {θD} ein geschlossener Unterraum ist, gibt es immer ein Portfolio θ ∗ , so dass Cor[θ ∗ D, π] = sup Cor[θD, π] . θ Wir bezeichnen mit R∗ die entsprechende Rendite. Dann gilt Var[R∗ ] > 0. Es lässt sich zeigen, dass IIE[Rθ − Rc ] = βθ (IIE[R∗ ] − Rc ) , (9.1) wobei βθ = Cov[R∗ , Rθ ] . Var[R∗ ] Formel (9.1) heisst State-Price-beta-Modell. 10. RISIKOMASSE 10. 89 Risikomasse 10.1. Einführung In der Portfoliotheorie haben wir gesehen, wie man ein Portfolio mit Hilfe von Varianz und Mittelwert bewerten kann. Mittelwert und Varianz sind aber keine guten Indikatoren für ein Risiko. Nehmen wir an, ein Verlust hat einen Mittelwert von 1 und eine Varianz von 3. Nehmen wir an, wir hätten ein Kapital von 6, und wollen die Wahrscheinlichkeit berechnen, dass dieses Kapital nicht ausreicht. Wählen wir für den Verlust eine Normalverteilung, so ist die gesuchte Wahrscheinlichkeit 0.19%. Wählen wir aber eine Paretoverteilung F (x) = 1 − (2/(x + 2))3 , so wird die gesuchte Wahrscheinlichkeit 1.56%. Dies zeigt, dass Mittelwert und Varianz nicht ausreichen, um das Risiko zufriedenstellend zu beschreiben. Wir nehmen nun an, dass die Zufallsvariable X eine finanzielle Position beschreibt. Das heisst, X > 0 ist ein Gewinn und X < 0 ist ein Verlust. Wir bezeichnen mit X die Klasse aller Zufallsvariablen, mit L∞ ⊂ X die Klasse aller beschränkten Zufallsvariablen, mit Lp (p ≥ 1) die Klasse der Zufallsvariablen mit IIE[|X|p ] < ∞. Wir wollen nun der finanziellen Positon X ein regulatorisches Kapital zuordnen. Dies machen wir, vorerst für L∞ , mit einer Abbildung ρ : L∞ → IR. So eine Abbildung heisst monoton, falls ρ(X) ≤ ρ(Y ) falls X ≥ Y . Dies bedeutet, dass grösserer Verlust zu mehr regulatorischem Kapital führt. Die Abbildung heisst normiert, falls ρ(0) = 0 . Das bedeutet, dass keine finanzielle Position kein regulatorisches Kapital verlangt. Wir nennen so eine Abbildung translationsinvariant, falls für alle a ∈ IR ρ(X − a) = ρ(X) + a . Wenn wir also zusätzlich zu X noch den deterministischen Betrag a auszahlen (oder −a erhalten), so ändert sich das regulatorische Kapital um den selben Betrag. Es gilt damit die Formel ρ(X + ρ(X)) = 0. Definition 10.1. Eine Abbildung ρ : L∞ → IR heisst monetäres Risikomass, falls sie normiert, monoton und translationsinvariant ist. 90 10. RISIKOMASSE Die Normiertheit und die Monotonie impliziert, dass für X ≤ 0 ρ(X) ≥ 0 oder für X ≥ 0 ρ(X) ≤ 0 folgt. Macht man also sicher einen Verlust, so kann man kein Kapital entnehmen. Ein sicherer Gewinn muss nicht mit Eigenkapital abgesichert werden. Beispiel 10.2. In der Finanzindustrie wird oft der Value-at-Risk (V@R) verwendet. Der Value-at-Risk zum Konfidenzniveau α ∈ (0, 1) ist das 1 − α-Quantil der Verteilung von X, also V@Rα (X) = inf{x ∈ IR : IIP[x + X ≥ 0] ≥ α} . Typische Werte für α sind 99% (Basel III) oder 99.5% (Solvency II). Aus der Definition folgt, dass V@R normiert und monoton ist. Weiter haben wir inf{x : IIP[x + (X − a) ≥ 0] ≥ α} = inf{x − a + a : IIP[(x − a) + X ≥ 0] ≥ α} = inf{y : IIP[y + X ≥ 0] ≥ α} + a , und damit ist V@R auch translationsinvariant. Hilfssatz 10.3. Ein monetäres Risikomass ist Lipschitz-stetig bezüglich der Supremumsnorm. Beweis. gilt Wir haben X − Y ≤ kX − Y k∞ und damit X ≤ Y + kX − Y k∞ . Also ρ(Y ) − kX − Y k∞ = ρ(Y + kX − Y k∞ ) ≤ ρ(X) . Somit ist ρ(Y ) − ρ(X) ≤ kX − Y k∞ . Die Aussage gilt auch, wenn man die Rollen von X und Y vertauscht. Dies zeigt |ρ(X) − ρ(Y )| ≤ kX − Y k∞ . Wir wollen nun weitere wünschenswerte Eigenschaften für Risikomasse definieren. Ein Risikomass heisst positiv homogen, falls für alle λ ≥ 0 ρ(λX) = λρ(X) . Hält man also mehrere Einheiten eines Risikos, so verhält sich das regulatorische Kapital proportional. Insbesondere hängt ein positiv homogenes Risikomass nicht von der gewählten Währungseinheit ab. Ein positiv homogenes Risikomass muss insbesondere normiert sein. Ein Risikomass heisst subadditiv, falls für alle X, Y ∈ L∞ gilt ρ(X + Y ) ≤ ρ(X) + ρ(Y ) . 10. RISIKOMASSE 91 Diese Eigenschaft sagt, dass eine Diversifikation zu einem kleineren regulatorischen Kapital führt. Wäre die Subadditivität nicht erfüllt, so könnte man ein Portfolio in zwei Portfolios aufteilen, und müsste dadurch weniger Eigenkapital bereit stellen. Definition 10.4. Ein monetäres Risikomass heisst kohärent, falls es positiv homogen und subadditiv ist. Eine zur Subadditivität ähnliche Eigenschaft ist die Konvexität. Ein Risikomass heisst konvex, falls für alle X, Y ∈ L∞ und λ ∈ (0, 1) gilt ρ(λX + (1 − λ)Y ) ≤ λρ(X) + (1 − λ)ρ(Y ) . Eine etwas schwächere Eigenschaft ist die folgende. Ein Risikomass heisst quasikonvex, falls für alle X, Y ∈ L∞ und λ ∈ (0, 1) gilt ρ(λX + (1 − λ)Y ) ≤ max{ρ(X), ρ(Y )} . Wir haben den folgenden Zusammenhang. Hilfssatz 10.5. Sei ρ ein monetäres Risikomass. Dann gilt i) ρ ist genau dann quasi-konvex, wenn ρ konvex ist. ii) Ist ρ positiv homogen, so ist ρ genau dann kohärent, wenn es konvex ist. Beweis. i) Sei ρ quasi-konvex. Wir haben ρ(λ(X + ρ(X)) + (1 − λ)(Y + ρ(Y ))) ≤ max{ρ(X + ρ(X)), ρ(Y + ρ(Y ))} = 0 . Somit gilt wegen der Translationsinvarianz ρ(λX + (1 − λ)Y ) ≤ λρ(X) + (1 − λ)ρ(Y ) . Also ist das Risikomass konvex. Sei nun ρ konvex. Für m = max{ρ(X), ρ(Y )} erhalten wir ρ(λX + (1 − λ)Y ) ≤ λρ(X) + (1 − λ)ρ(Y ) ≤ λm + (1 − λ)m = m . Somit ist ρ quasikonvex. ii) Sei ρ kohärent. Dann gilt ρ(λX + (1 − λ)Y ) ≤ ρ(λX) + ρ((1 − λ)Y ) = λρ(X) + (1 − λ)ρ(Y ) , und ρ is konvex. Analog, falls ρ konvex ist, ρ(X + Y ) = 2ρ( 21 X + 21 Y ) ≤ 2( 12 ρ(X) + 12 ρ(Y )) = ρ(X) + ρ(Y ) . Also ist ρ subadditiv. 92 10. RISIKOMASSE Beispiel 10.2 (Fortsetzung). Für λ > 0 folgt inf{x : IIP[x + λX ≥ 0] ≥ α} = inf{λx : IIP[λx + λX ≥ 0] ≥ α} = λ inf{x : IIP[x + X ≥ 0] ≥ α} . Somit ist V@R positiv homogen. Hingegen ist V@R nicht subadditiv, und damit nicht konvex, wie folgendes Gegenbeispiel zeigt. Seien Xk unabhängig mit IIP[Xk = 1 1] = κα = 1 − IIP[Xk = 0] für ein 1 < κ < α− 2 . Dann ist V@Rα (Xk ) = −1. Weiter ist IIP[X1 + X2 = 2] = κ2 α2 < α, IIP[X1 + X2 = 1] = 2κα(1 − κα) und IIP[X1 + X2 = 0] = (1 − κα)2 . Daher ist V@R(X1 + X2 ) ≥ −1 > −2 = V@R(X1 ) + V@R(X2 ). Also ist V@R nicht subadditiv, und daher auch nicht konvex. Beispiel 10.6. Ein kohärentes Risikomass ist der Maximalverlust. Sei ρ(X) = − ess inf X := − inf{x : IIP[X < x] > 0}. Dies kann als Spezialfall V@R1 interpretiert werden. Die Beweise, dass es sich um ein normiertes, positiv homogenes monetäres Risikomass handelt, können analog zum V@R geführt werden. Sei nun ρ(X) = x und ρ(Y ) = y. Dann gilt IIP[X < −x] = 0 und IIP[Y < −y] = 0, da die Verteilungsfunktion linksstetig ist. Dann ist IIP[X + Y ≥ −x − y] ≥ IIP[X ≥ −x, Y ≥ −y] = IIP[X ≥ −x] + IIP[Y ≥ −y] − IIP[{X ≥ −x} ∪ {Y ≥ −y}] = 2 − IIP[{X ≥ −x} ∪ {Y ≥ −y}] ≥ 2 − 1 = 1 . Somit ist IIP[X + Y < −x − y] = 0, also ρ(X + Y ) ≤ x + y = ρ(X) + ρ(Y ). Damit ist das Risikomass subadditiv, und damit auch kohärent und konvex. Beispiel 10.7. Sei β > 0. Das Exponentialprinzip der Versicherungsmathematik berechnet eine Prämie nach der Formel ρ(X) = β −1 log IIE[e−βX ]. Dass ρ normiert und monoton ist, ist klar. Weiter ist ρ(X − a) = β −1 log IIE[e−β(X−a) ] = β −1 log eβa IIE[e−βX ] = a + β −1 log IIE[e−βX ] = ρ(X) + a . Also handelt es sich um ein monetäres Risikomass. Sei f (λ) = ρ(λX + (1 − λ)Y ) = β −1 log IIE[e−β(λX+(1−λ)Y ) ] . Wir erhalten f 0 (λ) = − IIE[(X − Y )e−β(λX+(1−λ)Y ) ] , IIE[e−β(λX+(1−λ)Y ) ] 10. RISIKOMASSE 93 und n IIE[(X − Y )2 e−β(λX+(1−λ)Y ) ] IIE[(X − Y )e−β(λX+(1−λ)Y ) ] 2 o − . f (λ) = β IIE[e−β(λX+(1−λ)Y ) ] IIE[e−β(λX+(1−λ)Y ) ] 00 Der Ausdruck in der Klammer kann als Varianz des Masses dQ e−β(λX+(1−λ)Y ) = dIIP IIE[e−β(λX+(1−λ)Y ) ] interpretiert werden, und ist daher positiv. Somit ist f (λ) eine konvexe Funktion. Ist X − Y nicht deterministisch, so ist f (λ) sogar streng konvex. Insbesondere ist ρ(λX + (1 − λ)Y ) = f (λ) ≤ λf (1) + (1 − λ)f (0) = λρ(X) + (1 − λ)ρ(Y ) . Also ist das Risikomass konvex. Setzen wir Y = 0 und X eine nicht-deterministische Zufallsvariable, so ist wegen der strengen Konvexität ρ(λX) = f (λ) < λf (1) + (1 − λ)f (0) = λρ(X) + (1 − λ)ρ(0) = λρ(X) . Also ist das Risikomass nicht positiv homogen, und damit nicht kohärent. 10.2. Akzeptanzmengen Ein alternativer Zugang zum regulatorischen Kapital ist die Definition von Akzeptanzmengen. Das heisst, wir betrachten eine Teilmenge A ⊂ L∞ von Risiken, die vom Regulator akzeptiert werden. Wir können dann jedem monetären Risikomass ρ die Akzeptanzmenge Aρ = {X ∈ L∞ : ρ(X) ≤ 0} zuordnen. Für diese X muss nämlich kein zusätzliches Kapital bereitgehalten werden. Die Position 0 sollte zulässig sein, also verlangen wir 0 ∈ A für jede Akzeptanzmenge. Weiter, sollte mit jeder akzeptablen Position auch jede bessere Position akzeptabel sein. Wir verlangen also, falls X ≤ Y und X ∈ A, so ist auch Y ∈ A. Definition 10.8. Eine Akzeptanzmenge heisst zulässig, falls 0 ∈ A und falls X ≤ Y mit X ∈ A, so ist auch Y ∈ A. Wir erhalten folgende Eigenschaften der durch ρ erzeugte Akzeptanzmenge. 94 10. RISIKOMASSE Hilfssatz 10.9. Sei ρ ein monetäres Risikomass. i) Aρ ist eine zulässige Akzeptanzmenge. ii) Ist X ∈ Aρ und Y ∈ L∞ , dann ist die Menge {λ ∈ [0, 1] : λX + (1 − λ)Y ∈ Aρ } abgeschlossen. iii) Es gilt ρ(X) = inf{x ∈ IR : x + X ∈ Aρ } . iv) ρ ist genau dann konvex, wenn Aρ konvex ist. v) ρ ist genau dann positiv homogen, wenn Aρ ein Kegel ist. vi) ρ ist genau dann kohärent, wenn Aρ ein konvexer Kegel ist. Beweis. i) Aus ρ(0) = 0 ≤ 0 folgt, dass 0 ∈ Aρ . Ist Aρ 3 X ≤ Y , so haben wir ρ(Y ) ≤ ρ(X) ≤ 0, also Y ∈ Aρ . ii) Aus Hilfssatz 10.3 folgt, dass die Abbildung λ 7→ ρ(λX + (1 − λ)Y ) stetig ist. Somit muss die Menge {λ ∈ [0, 1] : ρ(λX + (1 − λ)Y ) ≤ 0} abgeschlossen sein. iii) Da ρ(ρ(X) + X) = 0, folgt dass ρ(X) + X ∈ Aρ und damit ρ(X) ≥ inf{x ∈ IR : x + X ∈ Aρ }. Ist x + X ∈ Aρ , so ist ρ(X) = ρ(x + X − x) = ρ(x + X) + x ≤ x, und damit ρ(X) ≤ inf{x ∈ IR : x + X ∈ Aρ }. iv) Sei ρ konvex. Für X, Y ∈ Aρ und λ ∈ (0, 1) haben wir dann ρ(λX + (1 − λ)Y ) ≤ λρ(X) + (1 − λ)ρ(Y ) ≤ 0 . Damit ist λX + (1 − λ)Y ∈ Aρ , also Aρ konvex. Sei Aρ konvex und X , Y ∈ L∞ . Da ρ(X) + X und ρ(Y ) + Y in Aρ sind, ist auch λ(ρ(X) + X) + (1 − λ)(ρ(Y ) + Y ) ∈ Aρ . Also −λρ(X)−(1−λ)ρ(Y )+ρ(λX +(1−λ)Y ) = ρ(λ(ρ(X)+X)+(1−λ)(ρ(Y )+Y )) ≤ 0 . Dies ist äquivalent zur Aussage. v) Ist ρ positiv homogen und X ∈ Aρ , so ist ρ(λX) = λρ(X) ≤ 0 für jedes λ ≥ 0. Also ist λX ∈ Aρ , und damit Aρ ein Kegel. Sei nun Aρ ein Kegel und X ∈ L∞ . Dann ist λ(ρ(X) + X) ∈ Aρ , und damit −λρ(X) + ρ(λX) = ρ(λ(X + ρ(X))) ≤ 0 , 10. RISIKOMASSE 95 und damit ist ρ(λX) ≤ λρ(X). Nehmen wir ρ(λX) < λρ(X) an. Dann existiert ein x < λρ(X), so dass x + λX ∈ Aρ . Dann ist auch λ−1 x + X ∈ Aρ . Insbesondere ist ρ(X) > λ−1 x = λ−1 x − ρ(X) + ρ(X) = −ρ(λ−1 x + X) + ρ(X) ≥ ρ(X) , was ein Widerspruch ist. Also gilt ρ(λX) = λρ(X). vi) Dies folgt sofort aus Hilfssatz 10.5 ii). Wir haben gesehen, dass wir das Risikomass aus der Akzeptanzmenge zurückgewinnen können. Dies können wir zum Anlass nehmen, ein Risikomass aus einer beliebigen Akzeptanzmenge zu gewinnen. Sei A ⊂ L∞ eine beliebige zulässige Akzeptanzmenge. Wir definieren ρA (X) = inf{x ∈ IR : x + X ∈ A} . Dann gilt Hilfssatz 10.10. Sei A zulässig und sei ρA (0) = 0. i) ρA ist ein monetäres Risikomass. ii) A ⊂ AρA . Gleichheit gilt genau dann, wenn Hilfssatz 10.9 ii) gilt. Beweis. i) Da X beschränkt ist, gilt X − ess inf X ≥ 0, und damit ist X − ess inf X ∈ A. Dies bedeutet ρA (X) ≤ − ess inf X < ∞. Nehmen wir ρ(X) = −∞ an. Sei y ∈ IR. Es gibt ein x < y − ess sup X, so dass x + X ∈ A. Damit haben wir y ≥ y − (ess sup X − X) > x + X ∈ A . Somit wäre y ∈ A, d.h. IR ⊂ A, was ρA (0) = 0 widerspricht. Somit ist ρ reellwertig. Die Normiertheit haben wir angenommen. Sei X ≤ Y . Ist x + X ∈ A, so ist auch x + Y ∈ A. Also gilt ρA (Y ) = inf{x ∈ IR : x + Y ∈ A} ≤ inf{x ∈ IR : x + X ∈ A} = ρA (X) . Das Mass ist also monoton. Sei a ∈ IR. Weiter erhalten wir ρA (X − a) = inf{x ∈ IR : x + X − a ∈ A} = inf{y + a ∈ IR : y + X ∈ A} = ρ(X) + a . Also ist das Mass auch translationsinvariant. ii) Nach Definition ist für X ∈ A ρA (X) ≤ 0, also X ∈ AρA . Gilt A = AρA , so gilt 96 10. RISIKOMASSE Hilfssatz 10.9 ii). Es gelte umgekehrt Hilfssatz 10.9 ii). Sei X ∈ / A. Nach unserer Annahme ist 0 < ess sup |X| ∈ A. Dann gibt es ein ε > 0, so dass λ ess sup |X| + (1 − λ)X ∈ / A für 0 ≤ λ < ε. Aus der Lipschitz-Stetigkeit erhalten wir ρA ((1 − λ)X) − ρA (X) ≤ k(1 − λ)X − Xk = λkXk = λ ess sup |X| . Somit gilt ρA (X) ≥ ρA ((1 − λ)X) − λ ess sup |X| = ρA ((1 − λ)X + λ ess sup |X|) > 0 . Damit ist X ∈ / AρA . 10.3. Darstellung von konvexen Risikomassen Wir bezeichnen mit M die Menge aller Wahrscheinlichkeitsmasse auf Ω, die absolutstetig zu IIP sind. Mit Ms = {α1 IIP1 − α2 IIP2 : αk ≥ 0, IIPk ∈ M} bezeichnen wir die endlichen signierten Masse. Wir können dann hQ, Xi = IIEQ [X] als eine Abbildung von Ms × L∞ nach IR definieren. Die Abbildung ist bilinear. Sei ρ : L∞ → IR eine Abbildung. Wir definieren die konjugierte Abbildung ρ∗ : Ms → IR , Q 7→ sup hQ, Xi − ρ(X) . X∈L∞ ∗ Weiter definieren wir die zu ρ konjugierte Abbildung ρ∗∗ : L∞ → IR , X 7→ sup hQ, Xi − ρ∗ (Q) . Q∈Ms Hilfssatz 10.11. Die Abbildungen ρ∗ und ρ∗∗ sind konvex. Beweis. Seien Q1 , Q2 ∈ Ms , λ ∈ (0, 1), Q = λQ1 + (1 − λ)Q2 und ε > 0. Dann ist Q ∈ Ms . Wir können annehmen, dass ρ∗ (Qk ) < ∞, da sonst die Aussage trivial ist. Sei ρ∗ (Q) < ∞. Wählen wir X, so dass hQ, Xi − ρ(X) > ρ∗ (Q) − ε. Dann ist ρ∗ (Q) < hQ, Xi − ρ(X) + ε = λ(hQ1 , Xi − ρ(X)) + (1 − λ)(hQ2 , Xi − ρ(X)) + ε ≤ λρ∗ (Q1 ) + (1 − λ)ρ∗ (Q2 ) + ε . Da ε beliebig war, folgt dass ρ∗ konvex ist. Sei nun ρ∗ (Q) = ∞. Wählen wir a > 0. Dann existiert ein X, so dass hQ, Xi − ρ(X) > a + ρ∗ (Q1 ) + ρ∗ (Q2 ). Wie oben folgt dann a + ρ∗ (Q1 ) + ρ∗ (Q2 ) < hQ, Xi − ρ(X) ≤ λρ∗ (Q1 ) + (1 − λ)ρ∗ (Q2 ) . Dies ist aber nicht für alle a möglich. Somit muss max{ρ∗ (Q1 ), ρ∗ (Q2 )} = ∞ gelten. Dass ρ∗∗ konvex ist, folgt analog. 10. RISIKOMASSE 97 Hilfssatz 10.12. Sei ρ : L∞ → IR konvex. Dann ist ρ∗∗ = ρ. Beweis. Wir haben ρ∗∗ (X) = sup hQ, Xi − ρ∗ (Q) = sup {hQ, Xi − sup hQ, Y i − ρ(Y )} Q∈Ms Q∈Ms Y ∈L∞ ≤ sup {hQ, Xi − [hQ, Xi − ρ(X)]} = ρ(X) . Q∈Ms Für die umgekehrte Ungleichung, bemerken wir, dass die Menge K = {(X, x) ∈ L∞ × IR : ρ(X) ≤ x} konvex ist. Sei Y ∈ L∞ und y = ρ(Y ) − ε für ein ε > 0. Dann gibt es nach einem Trennungssatz für konvexe Mengen, ein lineares stetiges Funktional (Q, z) ∈ Ms × IR, so dass sup hQ, Xi + zx < hQ, Y i + zy . (X,x)∈K Wir haben, da (Y, ρ(Y )) ∈ K, hQ, Y i + zρ(Y ) ≤ sup hQ, Xi + zx < hQ, Y i + zy . (X,x)∈K Somit gilt z < 0. Also ρ∗ (Q/|z|) = sup hQ/|z|, Xi − ρ(X) < hQ/|z|, Y i − y = hQ/|z|, Y i − ρ(Y ) + ε . X∈L∞ Dies impliziert ρ(Y ) − ε < hQ/|z|, Y i − ρ∗ (Q/|z|) ≤ ρ∗∗ (Y ) . Da ε beliebig war, folgt die Aussage. Wir bezeichnen mit dom ρ∗ = {Q ∈ Ms : ρ∗ (Q) < ∞}. Satz 10.13. Eine Abbildung ρ : L∞ → IR ist genau dann ein konvexes Risikomass, wenn ρ(X) = − inf {IIEQ [X] + α(Q)} , Q∈P wobei ∅ = 6 P ⊂ M und α : P → IR ein Funktional mit inf Q∈P α(Q) = 0. Dabei kann P = − dom ρ∗ und α(Q) = ρ∗ (−Q) gewählt werden. Beweis. Nehmen wir ρ(X) = − inf Q∈P {IIEQ [X] + α(Q)} = supQ∈P {−IIEQ [X] − α(Q)} an. Dann ist ρ nach dem Beweis von Hilfssatz 10.11 konvex. Nach Voraussetzung ist ρ(0) = 0. Monotonie und Translationsinvarianz sind trivial. 98 10. RISIKOMASSE Sei ρ ein konvexes Risikomass. Dann ist ρ = ρ∗∗ . Sei Q ∈ Ms und Z ∈ L∞ mit Z ≥ 0, so dass hQ, Zi > 0. Dann ist ρ(tZ) ≤ 0 für alle t ≥ 0 und ρ∗ (Q) = sup hQ, Xi − ρ(X) ≥ sup thQ, Zi − ρ(tZ) ≥ sup thQ, Zi = ∞ . X∈L∞ t≥0 t≥0 Ist Q ∈ Ms , so dass es A ∈ F gibt mit Q(A) > 0, so erfüllt 1IA die obigen Bedingungen. Ist also ρ∗ (Q) 6= ∞, so muss −Q ein positives Mass sein. Sei Q ∈ Ms und Q(Ω) 6= −1. Dann erhalten wir ρ∗ (Q) ≥ suphQ, ai − ρ(a) = sup a(Q(Ω) + 1) = ∞ . a∈IR a∈IR Somit genügt es Q zu betrachten, so dass −Q ein Wahrscheinlichkeitsmass ist. Somit folgt die Aussage aus ρ = ρ∗∗ . Satz 10.14. Eine Abbildung ρ : L∞ → IR ist genau dann ein kohärentes Risikomass, wenn ρ(X) = − inf IIEQ [X] , Q∈P wobei ∅ = 6 P ⊂ M. Dabei kann P = − dom ρ∗ gewählt werden. Beweis. Aus Satz 10.13 folgt, dass ρ definiert wie oben ein konvexes Risikomass ist. Aus der Definition folgt sofort, dass ρ positiv homogen ist. Damit ist ρ kohärent. Sei nun ρ ein kohärentes Risikomass. Dann gilt die Darstellung aus Satz 10.13. Sei Q ∈ M. Wir haben nun ρ∗ (−Q) = sup h−Q, Xi − ρ(X) = sup sup h−Q, λXi − ρ(λX) λ>0 X∈L∞ X∈L∞ = sup λ sup h−Q, Xi − ρ(X) = sup λρ∗ (−Q) . λ>0 X∈L∞ λ>0 Somit muss ρ∗ (−Q) ∈ {0, ∞} gelten. Damit kann α(Q) = 0 gewählt werden, was die Darstellung beweist. Beispiel 10.15. (Average Value at Risk) Wir definieren den Average-Valueat-Risk Z 1 1 V@Rβ (X) dβ AV@Rα (X) = 1−α α für α ∈ (0, 1). Aus den entsprechenden Eigenschaften des Value-at-Risk folgt, dass AV@Rα ein positiv homogenes monetäres Risikomass ist. Sei F die Verteilung von 10. RISIKOMASSE 99 −X. Dann haben wir Varβ (X) = F −1 (β). Sei U eine auf (0, 1) gleichverteilte Zufallsvariable. Wir bemerken, dass dann F −1 (U ) die Verteilung von −X hat. Somit gilt Z 1 Z 1 1 1 −1 F (β) dβ = F −1 (β)1Iβ>α dβ AV@Rα (X) = 1−α α 1−α 0 1 = IIE[F −1 (U )1IU >α ] . 1−α Die Variablen F −1 (U ) und 1IU >α haben unter allen Variablen Y und Z, so dass Y die Verteilung F hat und Z Bernoulli-verteilt ist mit IIP[Z = 0] = 1 − IIP[Z = 1] = α die maximale Korrelation, da sie komonoton sind. Wir können also h Z i AV@Rα (X) = sup IIE (−X) 1−α Z schreiben, wobei Z Bernoulli-verteilt ist. Da IIE[Z/(1 − α)] = 1, ist dies eine Radon– Nikodym Dichte. Wir können also P = {Z/(1 − α) dIIP : Z ist Bernoulli (1 − α) verteilt} wählen. Somit ist AV@Rα (X) = sup IIEQ [−X] = − inf IIEQ [X] , Q∈P Q∈P und damit ist AV@Rα kohärent. Eine alternative Darstellung folgt mit P = {Q ∈ dQ 1 M : dII ≤ 1−α }. P Beispiel 10.16. Oft verwendet wird auch der TV@R, der Tail-Value-at-Risk oder Expected Shortfall. Dieser ist definiert als TV@Rα (X) = IIE[−X | X ≤ − V@Rα (X)] . Betrachtet man nur stetige Zufallsvariablen, so ist TV@Rα (X) = AV@Rα (X). In der Tat ist 1 1 IIE[F −1 (U )1IU >α ] = IIE[(−X)1IX≤− V@Rα (X) ] 1−α 1−α = TV@Rα (X) . AV@Rα (X) = Im allgemeinen ist TV@R ein positiv homogenes monetäres Risikomass. Das Gegenbeispiel zum V@R zeigt, dass TV@R nicht subadditiv ist. Daher ist TV@R nicht kohärent. 100 10. RISIKOMASSE Bemerkung. Wir haben hier nur Risikomasse auf L∞ betrachtet. Eine analoge Theorie lässt sich für Lp mit 1 ≤ p < ∞ durchführen. In diesem Falle arbeitet man auf dem Dualraum Lq mit q = p/(p − 1) falls p > 1 und q = ∞ falls p = 1. Ein konvexes Risikomass ρ auf Lp lässt sich dann darstellen als ρ(X) = sup IIE[XY ] − ρ∗ (Y ) , Y ∈L wobei L ⊂ Lq . 11. WEITERE ASPEKTE 11. 101 Weitere Aspekte 11.1. Aktien mit Dividendenzahlungen Betrachten wir das Black–Scholes-Modell. Falls die Aktie nun Dividenden bezahlt, wird der Wert der Aktie um den Wert der Dividenden grösser sein. Sei {Dt } der Dividendenprozess. Dann ist der Barwert der Dividenden im Interval (t, T ] zum Zeitpunkt t i hZ T ∗ −r(s−t) IIE e dDs Ft . t Somit muss der Aktienkurs folgendermassen gegeben sein i hZ T ∗ St = IIE e−r(s−t) dDs + e−r(T −t) ST Ft , t da man ST als Dividendenzahlung im Zeitpunkt T auffassen kann. Der Wert der Aktie lässt sich als Wert der zukünftigen Dividendenzahlungen im Intervall (t, ∞) auffassen. Berechnet man nun den Wert einer Option, dann muss man den Wert der Dividenden im Interval (t, T ] berücksichtigen; das heisst, modellieren. Diese Dividenden bekommt man ja nicht ausbezahlt, wenn man die Option hält. Man beachte, dass Rt {e−rt St } kein Martingal mehr ist, sondern {St e−rt + 0 e−rs dDs }. 11.2. Devisenoptionen Eine typische Anwendung von Optionen sind Optionen auf Devisen. Zum Beispiel, eine grosse deutsche Chemiefirma will eine Firma in den USA übernehmen. Sie unterbreitet den Aktionären ein Angebot, so dass die Firma in einem halben Jahr eine Million Dollars benötigt. Nun will sich die deutsche Firma absichern, und kauft daher eine Option über eine Million Dollars zum Ausübungspreis von 1 Million Euro. Nun liegt das Riskio bei der Bank, die die Option ausstellt. Den Wechselkurs {Xt } kann man dann zum Beispiel mit einer geometrischen Brownschen Bewegung modellieren Xt = X0 exp{σWt + (µ − σ 2 /2)t} . Nehmen wir (im deutschen Markt) einen risikolosen Zins mit Intensität r an, erhalten wir den Optionspreis e−r(T −t) IIE∗ [(M Xt − K)+ | Ft ] , 102 11. WEITERE ASPEKTE L KP K KC A Abbildung 11.1: Auszahlungsfunktion des Straddle, Strangle, Spread und Butterfly. wobei M die Anzahl Devisen im Vertrag bezeichnet. Wir sehen, dass auch hier die Black–Scholes-Formel gilt. Man bemerke, dass die Absenz von Arbitrage den Zinssatz im Ausland festlegt. Wir werden dies hier aber nicht beweisen. 11.3. Kombination von Optionspositionen 11.3.1. Straddles Ein Straddle ist das gleichzeitige Kaufen einer Call- und Put-Option mit dem gleichen Ausübungspreis, also mit Auszahlung (ST − K)+ + (K − ST )+ = max{ST − K, K − ST } = |ST − K| . 11.3.2. Strangles Ein Strangle ist auch ein gleichzeitiges Kaufen einer Call- und Put-Option, wobei die Ausübungspreise sich unterscheiden. Dabei ist der Call-Ausübungspreis KC grösser als der Put-Ausübungpreis KP . Die Auszahlung ist dann (ST − KC )+ + (KP − ST )+ = max{ST − KC , KP − ST , 0} . Es ist zu bemerken, dass im Fall KC < KP der Betrag KP − KC immer ausbezahlt wird. Man könnte diesen Vertrag somit als Kombination der Auszahlung KP − KC 11. WEITERE ASPEKTE 103 mit einem Strangle mit vertauschten Ausübungspreisen betrachten, da (ST − KC )+ + (KP − ST )+ = (ST − KP )+ + (KC − ST )+ + KP − KC . 11.3.3. Spreads Ein Call-Spread ist der Kauf einer Call-Option und gleichzeitige Verkauf einer CallOption mit höherem Ausübungspreis (ST − K)+ − (ST − A)+ = min{(ST − K)+ , A − K} , wobei A > K. So ein Kontrakt schützt den Käufer vor dem Risiko, das er eingeht, wenn der Markt sich “nomal” verhält. Die Auszahlung kann wegen der Put-CallParität auch mit Put-Optionen und einem Barwert erhalten werden (K − ST )+ − (A − ST )+ + (A − K) . Ein Put-Spread ist Kauf und Verkauf von Putoptionen (A − ST )+ − (K − ST )+ = min{(A − ST )+ , A − K} . 11.3.4. Butterflies Ein Butterfly wird durch den Kauf von zwei Call-Optionen mit verschiedenen Ausübungspreisen A und L und dem Verkauf von zwei Call-Optionen mit einem Ausübungspreis K dazwischen erzeugt, (ST − L)+ + (ST − A)+ − 2(ST − K)+ . Oft wählt man dabei K = (L + A)/2. 11.4. Spezielle Optionen Call- und Put-Optionen sowie deren Kombinationen sind etablierte Optionen. Sie werden an der “normalen” Börse gehandelt. Man nennt diese Optionen auch plain Vanilla. Daneben gibt es auch nicht-so-übliche Optionen. Diese werden ausserhalb der “normalen” Börse gehandelt, und man nennt sie over-the-counter, oder kurz OTC. Wir wollen hier ein paar dieser Optionen vorstellen. 104 11.4.1. 11. WEITERE ASPEKTE Asiatische Optionen Eine Voraussetzung der üblichen Modelle ist, dass der Markt genügend liquide ist, so dass ein einzelner Händler die Preise nicht direkt beeinflussen kann. Aber in vielen Bereichen ist der Markt nicht genügend liquide. Zum Beispiel, der Aktiv wird nicht täglich gehandelt, oder der Preis wird durch politische Entscheide bestimmt, oder ein paar wenige Händler kontrollieren die Preise des zugrundeliegenden Aktivs. Ein Beispiel eines solchen Marktes ist der Rohölmarkt. Zeichnet man jetzt eine Option auf so einen Aktiv, kann es sein, dass die eine Partei die Möglichkeit hat, den Preis zum Zeitpunkt T stark zu beinflussen. Um diesen Einfluss zu verkleinern, nimmt man daher einen Durchschnittspreis über eine bestimmte Periode statt des Endpreises in die Option k + 1 X St` − K , k `=1 wobei 0 < t1 < · · · < tk = T . Eine Version der Option ist der floating Strike, k 1 X + St , ST − k `=1 ` wobei hier tk < T gilt. Die stetigen Versionen der Option sind 1 Z T + Ss ds − K T −t t und Z t + 1 ST − Sv dv , t−s s wobei 0 ≤ t < T und 0 ≤ s < t ≤ T . Dadurch wird sichergestellt, dass eine Manipulation des Marktes über einen längeren Zeitraum sehr kostspielig ist. 11.4.2. Optionen auf Futures Statt eines Aktivs kann auch der Preis eines Futures (das heisst die Grösse Ft , die den Dividendenfluss bestimmt) einer Option zugrundeliegen. Optionen auf Futures werden vor allem zur Wertsicherung verwendet. Da das Kaufen und Verkaufen des Aktivs mit Unkosten verbunden ist, und daher in der Realität eine theoretisch gute Hedgingstrategie sehr teuer ist, versucht man mit Optionen auf Futures die Hedgingstrategie zu approximieren. Das Problem ist aber, dass das Anwenden einer solchen Strategie nur funktionieren kann, wenn faire Futurespreise im Markt existieren. Des Weiteren, muss das Hedging-Portfolio mit dem Portfolio, das dem Futures unterliegt, stark korreliert sein. 11. WEITERE ASPEKTE 11.4.3. 105 Optionen auf Optionen Eine weitere Möglichkeit sind Optionen auf Optionen (compound Options). Hier wählt man als unterliegenden Aktiv eine Option. Sei U > T . Dann lässt sich zum Beispiel als unterliegenden Aktiv eine Call-Option mit Ausübungszeitpunkt U wählen. Bei einer Call-Option hat dann der Halter das Recht, aber nicht die Verpflichtung zum Zeitpunkt T die Option mit Ausübungszeitpunkt U für einen bestimmten Preis A zu kaufen. Der Wert der Option zum Zeitpunkt 0 wird also o i + i o h n Z U h n Z T ∗ ∗ + r(s) ds (SU − K) FT − A . r(s) ds IIE exp − IIE exp − 0 T Der Vorteil dieser Option ist, dass ihr Preis weniger stark fluktuiert als der Preis einer gewöhnlichen Option. 11.4.4. Barrieren-Optionen Oft benutzt man eine Option nur dazu, um sich vor eher unwahrscheinlichen Ereignissen zu schützen. Daher hat man die sogenannten Barriere-Optionen eingeführt. Bei diesen Optionen tritt die Option erst in Kraft (oder verliert ihren Wert) falls der unterliegende Aktiv eine bestimmte Grenze erreicht. Das heisst, nicht nur der Endwert des Aktivs spielt eine Rolle, sondern der gesamte Pfad. Sei {St } der Preis des Aktivs, Mt = sup{Ss : 0 ≤ s ≤ t} und mt = inf{Ss : 0 ≤ s ≤ t}. Die Auszahlung eines Up-and-In-Call ist dann (ST − K)+ 1IMT ≥B für K < B und S0 < B. Man bemerke, dass B ≤ K keinen Sinn macht, da diese Option einer normalen Call-Option entspricht. Das Gegenstück ist ein Down-andIn-Call, (ST − K)+ 1ImT ≤B S0 > B. Ist B ≤ K, so hat die Option beim Erreichen der Barriere noch keinen Wert, sondern muss zuerst zum Wert K zurückkehren. Diese beiden Optionen nennt man Knock-In-Optionen. Bei einer Knock-Out-Option wird die Option wertlos, falls die Barriere erreicht wird. Man hat den Up-and-Out-Call (ST − K)+ 1IMT <B für K < B und S0 > B, und den Down-and-Out-Call (ST − K)+ 1ImT >B für K > B und S0 > B. Analoge Optionen erhält man auch, wenn man den Call durch einen Put ersetzt. Ob B > K oder K > B hängt davon ab, welche der Optionen Sinn machen. Eine Version der Barrieren-Option sind die Knock-Out-Optionen mit Prämie. In diesem Fall wird eine eine fixe Prämie fällig, falls die Barriere erreicht wird. Die Barrieren müssen auch nicht konstant über die Zeit sein, sondern können in verschiedenen Perioden verschieden gewählt werden. Da gibt es auch die Variante, 106 11. WEITERE ASPEKTE wo die Barriere in einem bestimmten Zeitraum erreicht oder nicht erreicht werden soll. Also z.B., die Option wird in einem Jahr ausgeübt, aber nur, wenn der Preis in den Monaten 3-9 die Barriere nicht überschreitet. Weiter gibt es die sogenannten Tunnel-Optionen. Bei dieser Version gibt es sowohl eine obere wie auch eine untere Schranke, die nicht erreicht werden sollen. Bei der Pariser-Option muss die Barriere für eine bestimmte Zeitspanne über-, bzw. unterschritten werden. Die Berechnung der Optionenpreise sind im allgemeinen recht kompliziert. Für das Black–Scholes Modell aber, kann man geschlossene Formeln für die Preise erhalten, da die gemeinsame Verteilung von (ST , MT ) und (ST , mT ) berechnet werden kann, siehe Hilfssatz D.1. 11.4.5. Digitale Optionen Ähnlich wie Barrieren-Optionen funktionieren die sogenannten digitalen Optionen. Bei digitalen Optionen wird ein bestimmter Wert ausbezahlt, falls MT ≥ B oder mT ≤ B. Hier sind auch Kombinationen möglich, wie z.B. 1IMT ≥B 1ImT >b für ein b < S0 < B. Hier wird die Option wertlos, falls ein bestimmter Wert unterschritten wird, erhält aber erst einen Wert, falls eine bestimmte obere Schranke erreicht wird. 11.5. Portfolio Insurance Ein professioneller Investor muss oft eine Mindestrendite erzielen, z.B. in der Lebensoder Pensionsversicherung. Zu diesem Zwecke muss ein Anlageportfolio abgesichert werden. Eine einfache Möglichkeit ist, auf einem Teil des Portfolios Put-Optionen zu kaufen. Der versicherte Teil hat dann den Wert M [ST +(K−ST )+ ] = M max{ST , K}, wobei M die Anzahl Aktien bezeichnet, die versichert sind. Das Problem mit dieser Strategie ist, dass Put-Optionen im Normalfall nicht so lange Laufzeiten haben, wie sie der Investor benötigt. Die Black–Scholes-Theorie erlaubt aber nun, virtuelle Optionen zu erzeugen. Der Wert einer Put-Option ist nach der Black–Scholes-Formel Ke−r(T −t) Φ(−d2 ) − St Φ(−d1 ) . Der Investor muss also KΦ(−d2 ) in den risikolosen Aktiv investieren, und Φ(−d1 ) Aktien verkaufen, das heisst, er sollte Φ(d1 ) Aktien behalten. Verhält sich also der Markt wirklich wie ein Black–Scholes-Modell, dann würde diese Strategie den Wert 11. WEITERE ASPEKTE 107 max{ST , K} ergeben. Auf diese Weise hat der Investor eine virtuelle Put-Option erzeugt, die sein Portfolio versichert. Ein Problem der Portfolio Insurance ist, dass die Strategie stetiges Handeln voraussetzt. Dies ist nicht möglich, da die Börse nicht 24 Stunden an sieben Tagen die Woche geöffnet ist. Weiter kann wegen der Transaktionskosten nicht stetig gehandelt werden. Ein weiteres Problem ist, dass das Black–Scholes-Modell nur bedingt den Markt beschreibt. Es gibt immer wieder “Crashes”, wo die Preise grosse Sprünge aufweisen. Diese Sprünge können durch politische Ereignisse oder Katastrophen erzeugt werden. Oder es kann auch zu Liquiditätsengpässen kommen, wenn z.B. viele Computer verkaufen wollen. Dann wird der Preis wegen des grossen Angebots sinken, und noch mehr Händler, die die Black–Scholes-Formel verwenden, werden verkaufen wollen. Um das Risiko von Verlusten bei Preis-Sprüngen zu verkleinern, kann man die sogenannte Constant-Proportion-Portfolio-Insurance anwenden. Hier teilt man die Anlageperiode in n kleinere Perioden auf, in denen man ein konstantes Portfolio hält. Das heisst, man wählt die Handelszeitpunkte 0 = t0 < t1 < · · · < tn = T . Zum Zeitpunkt 0 hat man das Anfangsvermögen V0 und einen Startfloor F0 = cV0 , wobei c ∈ (0, 1). Dies ergibt das sogenannte Start-Cushion (Startkissen) C0 = V0 − F0 = (1 − c)V0 . Man hat dann einen Wert m ∈ IIN, genannt Multiplikator, der angibt, wie hoch die Aktienquote ist, die man haben will. Die Start-Exposure wird dann E0 = mC0 . Man hat eine Konstante α gewählt, die angibt, welchen Anteil man höchstens in Aktien investieren darf. Diese Konstante kann auch vom Gesetz vorgeschrieben sein. Für einen dänischen Lebensversicherer gilt zum Beispiel α ≤ 0.7. Für Investmentfonds kann dies auch das Risikoprofil des Anlegers angeben. Der absolute Umfang der Investition wird dann A0 = min{mC0 , αV0 } , oder der Anteil der in die Aktien investiert wird, beträgt o n mC 0 ,α . q0 = min V0 Zum Umschichtungszeitpunkt tn wird wie folgt verfahren. Man hat den Floor Fn . Der kann z.B. konstant sein, Fn = F0 , oder er kann nachgezogen sein, Fn = F0 ertn , 108 11. WEITERE ASPEKTE das heisst, er folgt einer Mindestverzinsung. Ist das Cushion Cn = Vn − Fn , so wählt man o o n n mC n ,α ,0 . qn = max min Vn Liegt man also unter dem Floor, darf nicht in Aktien investiert werden. Je höher man also über dem Floor liegt, umso mehr wird man in Aktien investieren. Man sieht nun auch die Rolle von m. Je höher m, umso mehr investiert man in Aktien. Zum einen ist somit ein grosses m wünscheswert, da man so eine hohe erwartete Rendite erziehlt. Zum andern will man m klein halten, weil man dadurch das Risiko vergrössert. A. STOCHASTISCHE PROZESSE UND STOPPZEITEN A. 109 Stochastische Prozesse und Stoppzeiten In dieser Vorlesung arbeiten wir immer auf einem Massraum (Ω, F), der gross genug ist, um alle definierten Objekte zu tragen. Ist nichts anderes gesagt, ist der Raum mit einem Wahrscheinlichkeitsmass IIP versehen. Wir nehmen an, dass F vollständig ist, das heisst, alle Mengen A enthält, für die es ein B ∈ F gibt, so dass A ⊂ B und IIP[B] = 0. A.1. Stochastische Prozesse Wir werden in dieser Vorlesung stochatische Prozesse sowohl in diskreter Zeit als auch in stetiger Zeit betrachten. Sei daher I = IIN = {0, 1, 2, . . .} (diskrete Zeit) oder I = IR+ = [0, ∞) (stetige Zeit). Definition A.1. Ein stochastischer Prozess ist eine Familie X = {Xt }t∈I von Zufallsvariablen in IRd . Ist I = IR+ so heisst ein stochastischer Prozess cadlag, falls die Abbildung t 7→ Xt fast sicher rechtsstetig ist und alle Grenzwerte Xt− = lims↑t Xs existieren. Ist X cadlag, so schreiben wir ∆Xt = Xt − Xt− . Falls nichts anderes gesagt wird, nehmen wir in dieser Vorlesung an, dass alle stochastischen Prozesse in stetiger Zeit cadlag sind. Im weiteren werden wir den Ausdruck “fast sicher” weglassen, das heisst, zukünftige Aussagen gelten mit Wahrscheinlichkeit 1. Definition A.2. Eine wachsende Familie {Ft }t∈I von σ-Algebren mit Ft ⊂ F heisst Filtration. Wir nehmen an, dass die Filtration vollständig ist, das heisst, dass F0 alle Mengen A enthält, für die IIP[A] = 0. Ist I = IR+ , so heisst eine T Filtration rechtsstetig, falls Ft+ := s>t Fs = Ft . Sei X ein stochastischer Prozess (in diskreter oder stetiger Zeit). Ein stochastischer Prozess heisst adaptiert, falls für alle t die Variable Xt Ft -messbar ist. Die kleinste (rechtsstetige) Filtration, so dass X adaptiert ist, heisst natürliche Filtration und wird mit {FtX } bezeichnet. Es ist einfach zu sehen, dass Ft+ eine σ-Algebra ist. Nehmen wir den Durchschnitt aller rechtsstetigen Filtrationen, für die X adaptiert ist, erhalten wir eine rechtsstetige Filtration. Daher existiert {FtX }. 110 A. STOCHASTISCHE PROZESSE UND STOPPZEITEN A.2. Stoppzeiten Definition A.3. Sei {Ft } eine Filtration. Eine {Ft }-Stoppzeit ist eine I ∪ {∞}wertige Zufallsvariable T , so dass {T ≤ t} ∈ Ft für alle t ∈ I. Falls die Filtration gegeben ist, sagen wir kurz Stoppzeit. Sei I = IR+ . Ist T eine Stoppzeit, dann ist {T ≤ t − 1/n} ∈ Ft−1/n ⊂ Ft und deshalb [ {T < t} = {T ≤ t − 1/n} ∈ Ft . n∈IIN\{0} Falls {T < t} ∈ Ft für alle t, dann ist für jedes s > t {T ≤ t} ⊂ {T < s} ∈ Fs . Daher ist T eine {Ft+ } = {Ft }-Stoppzeit. Die letzte Aussage gilt nicht für diskrete Zeit. Da {T < t} = {T ≤ t − 1}, gilt für jede Stoppzeit {T < t} ∈ Ft−1 ⊂ Ft . Wir können aber nicht daraus schliessen, dass aus {T < t} ∈ Ft folgt, dass T eine Stoppzeit ist. Im Gegenteil, {T ≤ t} = {T < t + 1} ∈ Ft+1 ist nicht notwendigerweise in Ft . Sei T = t0 für ein t0 ∈ IR+ . Dann ist {T ≤ t} = {t0 ≤ t} = Ω falls t0 ≤ t, ∅ falls t0 > t und somit {T ≤ t} ∈ F0 ⊂ Ft . Daher ist T = t0 eine Stoppzeit. Sind S und T Stoppzeiten, dann sind auch S + T , S ∧ T und S ∨ T Stoppzeiten. In der Tat, [ ({S > u} ∩ {T > t − u}) ∈ Ft , {S + T > t} = {S > t} ∪ | {z } | {z } | {z } 0≤u≤t ∈Ft u∈Q {S ∧ T ≤ t} = {S ≤ t} ∪ {T ≤ t} ∈ Ft , ∈Fu ⊂Ft ∈Ft−u ⊂Ft {S ∨ T ≤ t} = {S ≤ t} ∩ {T ≤ t} ∈ Ft . Definition A.4. Sei T eine Stoppzeit. Die σ-Algebra der Ereignisse bis zur Stoppzeit T ist FT = {A ∈ F : A ∩ {T ≤ t} ∈ Ft ∀t ∈ IR+ } . Man kann zeigen, dass FT wirklich eine σ-Algebra ist. A. STOCHASTISCHE PROZESSE UND STOPPZEITEN 111 Hilfssatz A.5. Seien S und T Stoppzeiten und A ∈ FS . Dann ist A ∩ {S ≤ T } ∈ FT . Insbesondere ist {S ≤ T } ∈ FT . Weiter gilt {S ≤ T } ∈ FS ∩ FT = FS∧T . Beweis. Wir schreiben (A ∩ {S ≤ T }) ∩ {T ≤ t} = (A ∩ {S ≤ t}) ∩{S ∧ t ≤ T ∧ t} ∩ {T ≤ t} . {z } | {z } | ∈Ft ∈Ft Wir müssen also noch zeigen, dass {T ∧ t < S ∧ t} ∈ Ft . Dies folgt aus [ {T ∧ t < S ∧ t} = q∈Q+ {T ∧ t ≤ q ∧ t < S ∧ t} . | {z } ∈Fq∧t ⊂Ft Sei A ∈ FT ∧S . Dann folgt aus dem soeben Bewiesenen A = A ∩ {S ∧ T ≤ T } ∈ FT und analog A ∈ FS . Sei A ∈ FT ∩ FS . Dann ist A ∩ {S ∧ T ≤ t} = (A ∩ {S ≤ t}) ∪ (A ∩ {T ≤ t}) ∈ Ft und A ∈ FT ∧S folgt. Schliesslich gilt {S ≤ T } = {S ≤ (T ∧ S)} ∈ FT ∧S . Hilfssatz A.6. Sei X ein adaptierter (cadlag) stochastischer Prozess und B eine Borel-Menge. i) Falls I = IIN, dann ist T = inf{t ≥ 0 : Xt ∈ B} eine Stoppzeit. ii) Falls I = IR+ und B offen ist, dann ist T = inf{t ≥ 0 : Xt ∈ B} eine Stoppzeit. iii) Sei I = IR+ . Falls B kompakt ist oder falls d = 1 und B = [u, ∞), dann ist T = inf{t ≥ 0 : Xt ∈ B oder Xt− ∈ B} eine Stoppzeit. 112 Beweis. A. STOCHASTISCHE PROZESSE UND STOPPZEITEN i) Wir haben {T = n} = {Xn ∈ B} \n−1 \ {Xi ∈ / B} ⊂ Fn . i=0 Daher ist {T ≤ n} = ∪ni=0 {T = i} ∈ Fn . ii) Sei Ω0 = {ω : X(ω) ist cadlag}. Da IIP[Ω0 ] = 1 ist Ω0 ∈ F0 . Daher können wir Ω = Ω0 annehmen. Wegen der Rechtsstetigkeit und da B offen ist, gilt [ {Xs ∈ B} ∈ Ft . {T < t} = s∈Q∩[0,t) Daher ist {T ≤ t} = {T < t} ∪ {Xt ∈ B} ∈ Ft und T eine Ft -Stoppzeit. iii) Für ε > 0 definieren wir die ε-Umgebung Bε = {x : inf{|x − y| : y ∈ B} < ε}. Da X cadlag ist, gilt \ [ {T ≤ t} = {Xs ∈ Bε } ∪ {Xt ∈ B} ∈ Ft . ε∈Q∩(0,1) s∈Q∩[0,t) Daher ist T eine Stoppzeit. Definition A.7. Ein adaptierter stochastischer Prozess {Yt } heisst stückweise konstanter Prozess, falls er in der Form Yt = ∞ X Yτi 1I[τi ,τi+1 ) (t) i=0 geschrieben werden kann, wobei {τn } eine wachsende Folge von Stoppzeiten ist mit 0 = τ0 < τ1 < . . . und limn→∞ τn = ∞. Die Variablen Yτn sind Fτn -messbar. A.3. Prozesse von beschränkter Variation Wir betrachten hier Prozesse in stetiger Zeit. Definition A.8. Sei f : IR+ → IR eine cadlag Funktion. Wir definieren die Variation von f als V (f )t = |f (0)| + lim n→∞ n X |f (tk/n) − f (t(k − 1)/n)| . k=1 Wir sagen, f hat endliche Variation, falls V (f )t < ∞ für alle t ≥ 0. Man kann zeigen, dass der Grenzwert in [0, ∞] existiert. Ein stückweise konstanter Prozess ist immer von endlicher Variation. A. STOCHASTISCHE PROZESSE UND STOPPZEITEN 113 Hilfssatz A.9. Sei f eine Funktion von endlicher Variation. Dann gibt es ein eindeutiges Paar (g, h) von positiven wachsenden Funktionen, so dass f = g − h und V (f ) = g + h. Beweis. Wir können annehmen, dass f (0) = 0. Sei gn (t) = n X 1If (ti/n)>f (t(i−1)/n) (f (ti/n) − f (t(i − 1)/n)) , i=1 hn (t) = n X 1If (ti/n)<f (t(i−1)/n) (f (t(i − 1)/n) − f (ti/n)) . i=1 Es ist klar, dass gn (t) − hn (t) = f (t), und dass limn→∞ gn (t) + hn (t) = V (f )t . Wir wollen zeigen, dass gn und hn konvergieren. Die Folgen g2n (t) und h2n (t) sind wachsend in n und durch V (f )t beschränkt. Daher existieren die Grenzwerte f (t) und g(t), und es gilt V (f )t = g(t)+h(t). Sei nun kn eine Folge, so dass limn→∞ gkn (t) existiert. Dann ist lim hkn (t) = V (f )t − lim gkn (t) . n→∞ n→∞ Es folgt einfach, dass g2n kn (t) ≥ g2n (t) und h2n kn (t) ≥ h2n (t). Da lim g2n kn (t) + h2n kn (t) = V (f )t n→∞ muss jede konvergente Teilfolge gegen g(t), beziehungsweise gegen h(t) konvergieren. Das gleiche Argument zeigt, dass g2n kn (t) gegen limn→∞ gkn (t) konvergiert. Daher ist limn→∞ gkn (t) = g(t). Da f cadlag ist, folgt sofort, dass g und h cadlag sind. Es ist klar, dass g und h wachsend sind. Sei nun (g0 , h0 ) ein weiteres Paar mit f = g0 − h0 und V (f ) = g0 + h0 . Dann ist h0 = g0 − f = g0 − g + h und g0 = V (f ) − h0 = g + h − (g0 − g + h) = 2g − g0 . Das beweist, dass g0 = g und h0 = h. Hilfssatz A.10. Sei f eine Funktion von beschränkter Variation und A = {(g, h) : g, h wachsende positive Funktionen, f = g − h} . Sei g0 = inf A g und h0 = inf A h. Dann gilt (g0 , h0 ) ∈ A und V (f ) = g0 + h0 . 114 A. STOCHASTISCHE PROZESSE UND STOPPZEITEN Beweis. Es ist klar, dass g0 und h0 wachsend sind. Da h = g −f folgt (g0 , h0 ) ∈ A. Es folgt sofort, dass g0 (0) = (f (0))+ und h0 (0) = (f (0))− . Wir können also im weiteren annehmen, dass f (0) = 0. Seien nun gn , hn die Funktionen, die im Beweis von Hilfssatz A.9 konstruiert wurden. Setzen wir αi = g0 (ti/n) − g0 (t(i − 1)/n) und βi = h0 (ti/n) − h0 (t(i − 1)/n). Dann haben wir gn (t) = n X 1Iαi >βi (αi − βi ) ≤ i=1 n X 1Iαi >βi αi ≤ n X i=1 αi = g0 (t) . i=1 Daher gilt limn→∞ gn (t) ≤ g0 (t). Somit muss limn→∞ gn (t) = g0 (t) gelten. Rt Beispiel A.11. Sei f (t) = 0 α(s) ds eine absolut stetige Funktion. Dann sind Rt Rt g(t) = 0 (α(s))+ ds und h(t) = 0 (α(s))− ds. A.4. Quadratische Variation Definition A.12. Sei f : IR+ → IR eine cadlag Funktion. Die quadratische Variation ist definiert als 2 Q(f )t = f (0) + lim n→∞ n X [f (tk/n) − f (t(k − 1)/n)]2 . k=1 Wir sagen f hat endliche quadratische Variation, falls Q(f )t < ∞ für alle t. Man kann zeigen, dass der Grenzwert in [0, ∞] existiert. Hilfssatz A.13. Sei f eine Funktion von endlicher Variation. Dann ist X Q(f )t = (∆f (s))2 , s≤t wobei ∆f (s) = f (s) − f (s−) und f (0−) = 0. Beweis. Wir können annehmen, dass f (0) = 0. Nehmen wir zuerst an, dass f stetig ist. Dann ist f auf [0, t] gleichmässig stetig. Für n gross genug ist |f (ti ) − f (ti−1 )| < ε, wobei ti = ti/n. Somit haben wir n n X X 2 [f (tk ) − f (tk−1 )] ≤ ε |f (tk ) − f (tk−1 )| . k=1 k=1 Das bedeutet, dass Q(f )t ≤ εV (f )t . Da ε beliebig war, haben wir Q(f )t = 0. A. STOCHASTISCHE PROZESSE UND STOPPZEITEN Falls f nicht stetig ist, bemerken wir zuerst, dass V (f )t ≥ lim ε↓0 X 115 P s≤t |∆f (s)|, und |∆f (s)|1I|∆f (s)|<ε = 0 . s≤t Sei gε (t) = f (t) − X ∆f (s)1I|∆f (s)|<ε , s≤t das heisst, wir entfernen alle Sprünge, die kleiner als ε sind. Sei hε = f − gε . Dann ist (f (tk ) − f (tk−1 ))2 = (gε (tk ) − gε (tk−1 ))2 + (hε (tk ) − hε (tk−1 ))2 + 2(gε (tk ) − gε (tk−1 ))(hε (tk ) − hε (tk−1 )) . Wir haben |hε (tk ) − hε (tk−1 )| ≤ V (hε )t und n n X X 2 |hε (tk ) − hε (tk−1 )|V (hε )t . (hε (tk ) − hε (tk−1 )) ≤ k=1 k=1 Somit ist lim n→∞ n X (hε (tk ) − hε (tk−1 ))2 ≤ (V (hε )t )2 . k=1 Da ε beliebig ist, kann die rechte Seite beliebig klein gemacht werden. Weiter gilt n X |(gε (tk ) − gε (tk−1 ))(hε (tk ) − hε (tk−1 ))| ≤ n X |gε (tk ) − gε (tk−1 )|V (hε )t , k=1 k=1 woraus lim n→∞ n X |(gε (tk ) − gε (tk−1 ))(hε (tk ) − hε (tk−1 ))| ≤ V (gε )t V (hε )t . k=1 Hier kann die rechte Seite auch beliebig klein gemacht werden. Wir schliessen daraus, dass Q(f )t = limε→0 Q(gε )t . Da f nur endlich viele Sprünge hat, die grösser als ε sind, folgt dass, für n gross genug, jedes interval (tk−1 , tk ] höchstens einen Sprung von gε enthält. Damit folgt X X Q(gε ) = (∆g(s))2 = 1I|∆f (s)|≥ε (∆f (s))2 . s≤t Lässt man ε → 0 folgt das Resultat. s≤t 116 B. B. DIE BROWNSCHE BEWEGUNG Die Brownsche Bewegung Sei I = IR+ . Definition B.1. Ein (cadlag) stochastischer Prozess B auf IR heisst standard Brownsche Bewegung, falls i) B0 = 0, ii) B unabhängige Zuwächse hat und iii) Bt+s − Bs normalverteilt mit Mittelwert 0 und Varianz t ist. Ein d-dimensionaler Prozess B, wobei (B i ) unabhängige Brownsche Bewegungen sind, heisst d-dimensionale Brownsche Bewegung. Man kann zeigen (Wiener, 1923), dass es einen Wahrscheinlichkeitsraum gibt, auf dem eine Brownsche Bewegung existiert. Man kann weiter zeigen, dass eine Brownsche Bewegung stetige Pfade hat, und dass die Pfade nirgends differenzierbar sind. Hilfssatz B.2. Sei B eine Brownsche Bewegung und Wt = tB1/t falls t > 0. Wir setzen W0 = 0. Dann ist W eine Brownsche Bewegung. Beweis. Wir müssen zuerst zeigen, dass W in 0 stetig ist. Wir haben n W1/n 1X 1 (Bi − Bi−1 ) . = Bn = n n i=1 Das starke Gesetz der grossen Zahl zeigt, dass limn→∞ W1/n = 0. Weiter haben wir 1 W1/t = (Bbtc + (Bt − Bbtc )) . t Wir müssen daher zeigen, dass t−1 (Bt − Bbtc ) gegen Null konvergiert. Sei {tn } eine Folge, die gegen Unendlich konvergiert. Wir können annehmen (Teilfolge), dass P∞ √ n=1 Φ(− tn ) < ∞. Dann gilt √ √ √ tn IIP[|Btn − Bbtn c | > tn ] = 2Φ − p ≤ 2Φ(− tn ) . tn − btn c √ Das Lemma von Borel–Cantelli besagt, dass {|Btn − Bbtn c | > tn } nur endlich oft eintritt. Dies zeigt, dass limt→0 Wt = 0. Insbesondere ist W cadlag. B. DIE BROWNSCHE BEWEGUNG 117 Da B unabhängige Zuwächse hat, hängt für s > t der Zuwachs Ws − Wt von der Vorgeschichte nur von Wt ab. Wir zeigen nun, dass Ws − Wt bedingt auf B1/t eine N (0, s − t) Verteilung hat. Dann hat insbesondere W unabhängige Zuwächse. Die gemeinsame Dichte von (B1/t , B1/s ) ist n y2 (x − y)2 o 1 1 p exp − 2 + . f (x, y) = 1/s 1/t − 1/s 2π 1/s(1/t − 1/s) Somit wird die bedingte Dichte von B1/s gegeben B1/t = x s n s2 s2 xt 2 o exp − y− . 2π(s − t) 2(s − t) s Das heisst, die bedingte Verteilung von B1/s ist eine Normalverteilung mit Mittelwert tB1/t /s und Varianz (s − t)/s2 . Für die momentenerzeugende Funktion erhalten wir nun IIE[exp{r(sB1/s − tB1/t )} | B1/t ] = exp{rstB1/t /s + 21 r2 s2 (s − t)/s2 − rtB1/t } = er 2 (s−t)/2 . Somit hat Wt die geforderte Verteilung. Hilfssatz B.3. Eine Brownsche Bewegung hat in jedem Interval [0, ε] unendlich viele Nullstellen. Beweis. Betrachten wir die Brownsche Bewegung W = {tB1/t }. Wir müssen daher zeigen, dass {Wt } auf dem Interval [1/ε, ∞) unendliche viele Nullstellen hat. Da der Prozess {Wn : n ∈ IIN} eine Irrfahrt ist, folgt − limt→∞ Wt = limt→∞ Wt = ∞. Da W stetig ist, muss W unendlich viele Nullstellen haben. Hilfssatz B.4. Die Brownsche Bewegung hat quadratische Variation Q(B)t = t, und damit unendliche Variation. Beweis. Sei tk = tk/n. Wir wissen, dass Btk −Btk−1 normalverteilt ist mit Varianz t/n. Wegen der unabhängigen Zuwächse haben wir für h > k IIE[{(Btk − Btk−1 )2 − t/n}{(Bth − Bth−1 )2 − t/n}] = IIE[{(Btk − Btk−1 )2 − t/n}IIE[(Bth − Bth−1 )2 − t/n | Ftk ]] = 0 . 118 C. MARTINGALE Somit ist IIE n hX n 2 i hX i (Btk − Btk−1 ) − t = IIE {(Btk − Btk−1 )2 − t/n}2 = 2nt/n2 . 2 k=1 k=1 Pn Wir sehen, dass k=1 (Btk − Btk−1 )2 in L2 , daher fast sicher gegen t konvergiert. Daher ist Q(B)t = t. Dass V (B)t = ∞ folgt aus Hilfssatz A.13. C. Martingale Definition C.1. Ein (cadlag) Prozess M heisst {Ft }-Submartingal falls i) M ist adaptiert, ii) IIE[|Mt |] < ∞, iii) IIE[Mt | Fs ] ≥ Ms für alle s ≤ t. M heisst {Ft }-Supermartingal falls {−Mt } ein Submartingal ist. Ist M sowohl ein Sub- als auch ein Supermartingal, so nennt man M ein {Ft }-Martingal. Wir sagen kurz (Sub-, Super-)Martingal, falls M ein (Sub-, Super-)Martingal bezüglich seiner natürlichen Filtration ist. Beispiel C.2. Sei B eine Brownsche Bewegung und {Ft } die natürliche Filtration. Dann ist für t ≥ s IIE[Bt | Fs ] = IIE[Bt − Bs | Fs ] + Bs = Bs und B ist ein Martingal. Der Prozess {Bt2 −t} ist ein Martingal, da IIE[Bt2 −t | Fs ] = IIE[(Bt −Bs )2 | Fs ] + 2Bs IIE[Bt − Bs | Fs ] + Bs2 − t = Bs2 − s. Sei r > 0. Dann folgt ähnlich, dass {exp{rBt − r2 t/2}} ein Martingal ist. Das folgende Kriterium ist oft nützlich. Hilfssatz C.3. Sei I = IIN. Ein Prozess M ist genau dann ein Martingal, falls für jeden vorhersehbaren Prozess {Hn } (das heisst Hn ist Fn−1 -messbar) und jedes N ∈ IIN N hX i IIE Hn (Mn − Mn−1 ) = 0 (C.1) n=1 gilt. C. MARTINGALE Beweis. 119 Sei M ein Martingal. Dann gilt IIE N hX i Hn (Mn − Mn−1 ) FN −1 n=1 = = N −1 X n=1 N −1 X Hn (Mn − Mn−1 ) + HN IIE[MN − MN −1 | FN −1 ] Hn (Mn − Mn−1 ) . n=1 (C.1) folgt nun mit Induktion nach N . Nehmen wir an, dass (C.1) gilt. Sei A ∈ Fj , j ∈ IIN und Hn = 1IA 1In=j+1 . Dann gilt IIE[1IA (Mj+1 − Mj )] = 0. Das impliziert IIE[Mj+1 − Mj | Fj ] = 0, und M ist ein Martingal. Die folgenden beiden Sätze sind die Hauptresultate über Martingale. Satz C.4. (Konvergenzsatz) Sei M ein Submartingal, so dass supt≥0 IIE[Mt+ ] < ∞. Dann existiert M∞ = limt→∞ Mt fast sicher. Weiter gilt IIE[|M∞ |] < ∞. Satz C.5. (optionaler Stoppsatz) Stoppzeiten. Dann gilt für t > 0 Sei M ein Submartingal und seien T und S IIE[MS∧t | FT ] ≥ MT ∧S∧t . Korollar C.6. Sei M ein von unten beschränktes Supermartingal. Dann existiert M∞ , IIE[|M∞ |] < ∞ und Mt ≥ IIE[M∞ | Ft ]. Beweis. −M erfüllt die Bedingungen des Konvergenzsatzes und somit existiert M∞ . Weiter gilt Mt ≥ lim IIE[Ms | Ft ] ≥ IIE[ lim Ms | Ft ] = IIE[M∞ | Ft ] , s→∞ s→∞ wobei wir Fatous Lemma verwendet haben. 120 C. MARTINGALE Beispiel C.7. Seien σ, µ > 0 und Xt = σBt − µt für eine Brownsche Bewegung B. Da Mt = exp{(2µ/σ 2 )Xt } ein von unten beschränktes Martingal ist, existiert M∞ . Da wegen den stationären und unabhängigen Zuwächsen von X die Gleichung Var[Mt+1 | Ft ] = Mt2 Var[M1 ] erfüllt ist, muss M∞ ∈ {0, ∞} gelten. Da IIE[M∞ ] existiert, ist nur M∞ = 0 möglich. Somit gilt limt→∞ σBt − µt = −∞. Wir sehen, dass das Martingal nicht gleichmässig integrierbar ist. Nämlich, lim IIE[Mt ] = IIE[M0 ] = 1 6= 0 = IIE[ lim Mt ] . t→∞ t→∞ Beispiel C.8. Sei X eine integrierbare Zufallsvariable und Mt = IIE[X | Ft ]. Dann gilt für t > s IIE[Mt | Fs ] = IIE[IIE[X | Ft ] | Fs ] = IIE[X | Fs ] = Ms und M ist ein Martingal. Weiter gilt IIE[Mt+ ] ≤ IIE[|Mt |] = IIE[|IIE[X | Ft ]|] ≤ IIE[IIE[|X| | Ft ]] = IIE[|X|] < ∞ und es folgt, dass M∞ existiert. Wir wollen nun zeigen, dass M gleichmässig integrierbar ist, das heisst, dass lim sup IIE[|Mt |1I|Mt |>n ] = 0 . n→∞ t≥0 Wir schreiben IIE[|Mt |1I|Mt |>n ] = IIE[|IIE[X | Ft ]|1I|IIE[X|Ft ]|>n ] ≤ IIE[IIE[|X| | Ft ]1IIIE[|X||Ft ]>n ] und somit genügt es, positive Zufallsvariablen X zu betrachten. Weiter gilt IIE[IIE[X | Ft ]1IMt >n ] = IIE[IIE[X1IMt >n | Ft ]] = IIE[X1IMt >n ] . Sei M = supt Mt < ∞, da M∞ fast sicher existiert. Dann ist h i sup IIE[X1IMt >n ] ≤ IIE X sup 1IMt >n = IIE[X1IM>n ] . t≥0 t≥0 Da IIE[X1IM>n ] ≤ IIE[X] < ∞, gilt lim IIE[X1IM>n ] = IIE[X lim 1IM>n ] = 0 , n→∞ n→∞ (C.2) C. MARTINGALE 121 und {Mt } ist gleichmässig integrierbar. Wir versuchen nun M∞ zu bestimmen. Sei F∞ die kleinste σ-Algebra, so dass Ft ⊂ F∞ für alle t. Dann ist Mt F∞ -messbar und daher ist M∞ F∞ -messbar. IIE[M∞ | Ft ] = IIE[ lim Ms | Ft ] = lim IIE[Ms | Ft ] = Mt s→∞ s→∞ = IIE[X | Ft ] = IIE[IIE[X | F∞ ] | Ft ] . Da F∞ von den σ-Algebren Fs erzeugt ist, muss die obige Gleichung auch für t = ∞ gelten. Das bedeutet M∞ = IIE[M∞ | F∞ ] = IIE[IIE[X | F∞ ] | F∞ ] = IIE[X | F∞ ] . Proposition C.9. i) Sei M ein Submartingal. Dann gilt für x, T > 0 h i IIP sup Mt ≥ x ≤ x−1 IIE[MT+ ] . 0≤t≤T ii) Ist M positiv oder ein Martingal und IIE[MT2 ] < ∞, dann gilt h i IIE sup Mt2 ≤ 4IIE[MT2 ] . 0≤t≤T Beweis. i) Da {Mt+ } ein Submartingal ist (Jensens Ungleichung), können wir annehmen, dass M positiv ist. Sei F ⊂ [0, T ] eine endliche Teilmenge. Setzen wir τ = inf{t ∈ F : Mt ≥ x}. Dann gilt IIE[MT ] ≥ IIE[Mτ ∧T ] = IIE[Mτ 1Iτ ≤T ] + IIE[MT 1Iτ >T ] . Das zeigt h i IIE[MT 1Iτ ≤T ] ≥ IIE[Mτ 1Iτ ≤T ] ≥ xIIP[τ ≤ T ] = xIIP sup Mt ≥ x . t∈F Somit gilt IIP[supt∈F Mt ≥ x] ≤ x−1 IIE[MT+ ]. Sei nun F abzählbar. Wir wählen eine Folge F1 ⊂ F2 ⊂ · · · von endlichen Mengen mit ∪Fn = F . Dann folgt aus monotoner Konvergenz für y < x, h i h i IIP sup Mt ≥ x ≤ lim IIP sup Mt ≥ y ≤ y −1 IIE[MT+ ] . t∈F n→∞ t∈Fn 122 C. MARTINGALE Da y beliebig ist, gilt IIP[supt∈F Mt ≥ x] ≤ x−1 IIE[MT+ ]. Wählen wir F = Q folgt das Resultat. ii) Auch hier können wir annehmen, dass M positiv ist, da {|Mt |} ein Submartingal ist, falls M ein Martingal ist. Sei Z = sup0≤t≤T Mt . Dann ist für x > 0, Z ∞Z z∧x Z x Z x 2 IIE[(Z ∧ x) ] = 2 y dy dFZ (z) = 2 yIIP[Z ≥ y] dy ≤ 2 IIE[MT 1IZ≥y ] dy 0 0 = 2IIE[MT (Z ∧ x)] ≤ 0 1 2IIE[MT2 ] 2 IIE[(Z 0 ∧ 1 x)2 ] 2 . Hier brauchten wir ein Teilresultat aus dem Beweis von i) in der ersten Ungleichung, und die Cauchy–Schwarz-Ungleichung in der zweiten Ungleichung. Dies beweist die Behauptung. Satz C.10. (Doob-Zerlegung) Jedes Submartingal {Un } in diskreter Zeit hat eine eindeutige Zerlegung Un = Mn + An , wobei {Mn } ein Martingal ist, und {An } ist ein vorhersehbarer wachsender Prozess mit A0 = 0. Beweis. Da A0 = 0 haben wir M0 = U0 . Aus An+1 − An = IIE[An+1 − An | Fn ] = IIE[Un+1 | Fn ] − Un folgt An+1 = An + IIE[Un+1 | Fn ] − Un , und die Zerlegung ist eindeutig. Definieren wir {An } wie oben, so ist {An } wachsend und vorhersehbar. Für den entsprechenden Prozess {Mn } folgt IIE[Mn+1 | Fn ] = IIE[Un+1 | Fn ] − An+1 = Un − An = Mn , und {Mn } ist ein Martingal. In stetiger Zeit ist die Zerlegung etwas komplizierter. Wir nennen einen Prozess X von der Klasse DL, falls für jedes t die Familie {Xt∧τ : τ ∈ T } gleichmässig integrierbar ist. T bezeichnet die Klasse aller Stoppzeiten. Satz C.11. (Doob–Meyer-Zerlegung) Sei U ein Submartingal der Klasse DL. Dann gibt es ein Martingal M und einen wachsenden Prozess A mit A0 = 0, so dass Ut = Mt + At mit der Eigenschaft, dass für jedes positive Martingal V und jede Stoppzeit τ hZ t∧τ i hZ t∧τ i IIE Vs− dAs = IIE Vs− dAs = IIE[Vt∧τ At∧τ ] 0 gilt. 0 C. MARTINGALE 123 Man kann zeigen, dass ein Martingal immer von der Klasse DL ist. Definition C.12. Ein adaptierter stochastischer Prozess M heisst lokales Martingal, falls es eine aufsteigende Folge von Stoppzeiten {Tn } mit limn→∞ Tn = ∞ gibt, so dass für jedes n {MTn ∧t } ein Martingal ist. Eine solche Folge {Tn } nennt man Lokalisierungsfolge. Es ist klar, dass jedes Martingal ein lokales Martingal ist. Die Umkehrung gilt nicht. Beispiel C.13. Sei X eine Zufallsvariable, die nicht integrierbar ist (IIE[|X|] = ∞), und B eine Brownsche Bewegung, die unabhängig von X ist. Sei Mt = XBt . Da IIE[|Mt |] = ∞ ist M kein Martingal. Betrachten wir die Filtration Ft = FtB ∨ σ(X). Sei Tn = inf{t : |Mt | > n}. Dann ist MTn ∧t beschränkt und daher integrierbar. Wir haben IIE[Mt | Fs ] = XIIE[Bt | Fs ] = XBs = Ms . Daher ist M ein lokales Martingal. Hilfssatz C.14. Sei M ein von unten beschränktes lokales Martingal. Dann ist M ein Supermartingal. Beweis. Wir können annehmen, dass M ≥ 0. Sei {Tn } eine Lokalisierungsfolge. Wir bemerken, dass IIE[M0 ] existiert. Dann ist für t > s IIE[Mt | Fs ] = IIE[ lim MTn ∧t | Fs ] ≤ lim IIE[MTn ∧t | Fs ] = lim MTn ∧s = Ms . n→∞ n→∞ n→∞ Insbesondere ist Mt integrierbar. Hilfssatz C.15. Ein stetiges lokales Martingal von beschränkter Variation ist konstant. Beweis. Wir können annehmen, dass M0 = 0. Sei T = inf{t ≥ 0 : |Mt |+V (M )t > 1}. Wegen der Stetigkeit ist |MT | + V (M )T = 1 falls T < ∞. Betrachten wir nun den Prozess {MT ∧t }. Wegen der Beschränktheit ist dies ein Martingal. Sei ti = ti/n. Es gilt IIE[MT ∧ti MT ∧ti−1 ] = IIE[IIE[MT ∧ti | Fti−1 ]MT ∧ti−1 ] = IIE[(MT ∧ti−1 )2 ] . Daher gilt IIE[(MT ∧ti − MT ∧ti−1 )2 ] = IIE[(MT ∧ti )2 − (MT ∧ti−1 )2 ] . 124 C. MARTINGALE Dies impliziert n n hX i hX i 2 2 2 IIE[(MT ∧t ) ] = IIE (MT ∧ti ) − (MT ∧ti−1 ) = IIE (MT ∧ti − MT ∧ti−1 ) . 2 k=1 Da k=1 n n X X 2 (MT ∧ti − MT ∧ti−1 ) ≤ 2|MT ∧ti − MT ∧ti−1 | ≤ 2V (M )T ∧t ≤ 2 k=1 k=1 können wir Grenzwert und Integral vertauschen. Wir schliessen, dass n i h X IIE[(MT ∧t )2 ] = IIE lim (MT ∧ti − MT ∧ti−1 )2 = 0 . n→∞ k=1 Daher gilt MT ∧t = 0. Wir schliessen, dass Mt = 0 für t ≤ T . Insbesondere ist V (M )T ∧t = 0 und |MT ∧t | + V (M )T ∧t = 0. Das bedeutet, dass T > t. Also ist Mt = 0 für alle t. Definition C.16. Ein Semimartingal ist ein stochastischer Prozess X von der Form X = X0 + M + A, wobei M ein lokales Martingal ist und A ein Prozess mit endlicher Variation mit M0 = A0 = 0. Beispiel C.17. Sei B eine standard Brownsche Bewegung. Da {Bt2 − t} ein Martingal ist, ist {Bt2 } ein Semimartingal. Betrachten wir nun den Prozess {Bt4 }. Da IIE[Bt4 | Fs ] = IIE[(Bt − Bs + Bs )4 | Fs ] = 3(t − s)2 + 6(t − s)Bs2 + Bs4 . Betrachten wir 6 Rt 0 Bv2 dv. Aus Fubinis Theorem schliessen wir Z s Z t i h Z t 2 2 IIE 6 Bv dv Fs = 6 Bv dv + 6 (Bs2 + (v − s)) dv s 0 0 Z s =6 Bv2 dv + 6(t − s)Bs2 + 3(t − s)2 . 0 Wir sehen, dass Z t n o 4 Bt − 6 Bs2 ds 0 ein Martingal ist. Da 6 ein Semimartingal. Rt Bs2 0 ds ein Prozess von beschränkter Variation ist, ist {Bt4 } D. ÄNDERUNG DES MASSES D. 125 Änderung des Masses Sei {Ft } eine Filtration und betrachten wir einen endlichen Zeithorizont T . Wir nehmen F = FT an. Ein äquivalentes Mass IIP∗ ist dann definiert durch eine Radon– Nikodym-Ableitung LT > 0. Das heisst, ist X FT -messbar, dann haben wir IIE∗ [X] = IIE[LT X]. Für X = 1 erhalten wir IIE[LT ] = 1. Ist 0 ≤ t < T und X Ft -messbar, so haben wir IIE∗ [X] = IIE[LT X] = IIE[IIE[LT X | Ft ]] = IIE[IIE[LT | Ft ]X] . Betrachten wir das Martingal {Lt = IIE[LT | Ft ]}, haben wir also die Formel IIE∗ [X] = IIE[Lt X] . (D.1) Ist τ eine Stoppzeit, folgt ähnlich für eine Fτ ∧T messbare Variable X, IIE∗ [X] = IIE[Lτ ∧T X]. Wir bemerken, dass L0 = IIE[LT | F0 ] = IIE[LT ] = 1. Wir wollen nun die bedingte Erwartung unter IIP∗ finden. Sei A ∈ F = FT und B ∈ Ft . Dann haben wir IIP∗ [A ∩ B] = IIE[LT 1IA 1IB ] = IIE[1IB IIE[LT 1IA | Ft ]] = IIE∗ [1IB IIE[LT 1IA | Ft ]/Lt ] . Wir schliessen, dass IIP∗ [A | Ft ] = IIE[LT 1IA | Ft ]/Lt . (D.2) Ist A ∈ Fs für 0 ≤ t < s < T , so gilt IIP∗ [A | Ft ] = IIE[Ls 1IA | Ft ]/Lt . Ist W eine Brownsche Bewegung, dann ist Lt = exp{rWt − r2 t/2} ein Martingal. Unter IIP∗ bleibt W0 = 0 und die Pfade sind stetig. Es folgt dann für s < t und x ∈ IR IIP∗ [Wt − Ws ≤ x | Fs ] = IIE[exp{r(Wt − Ws ) − r2 (t − s)/2}1IWt −Ws ≤x | Fs ] Z x 1 2 2 e−y /(2(t−s)) dy = ery−r (t−s)/2 p 2π(t − s) −∞ Z x 1 2 =p e−(y−r(t−s)) /(2(t−s)) dy . 2π(t − s) 0 Somit ist Wt − Ws unabhängig von Fs und normalverteilt mit Mittelwert r(t − s) Varianz t − s. Dies bedeutet, dass W unter IIP∗ eine Brownsche Bewegung mit Drift r wird. Also ist Wt∗ = Wt − rt unter IIP∗ eine standard Brownsche Bewegung. 126 E. TRENNUNG VON KONVEXEN MENGEN Hilfssatz D.1. Sei Xt = σWt +µt eine Brownsche Bewegung mit Drift. Wir setzen Mt = sups≤t Xt . Dann gilt für a > max{b, 0} √ 2 IIP[Mt > a, Xt ≤ b] = e2µa/σ Φ((b − 2a − µt)/ σ 2 t) , wobei Φ(y) die Verteilungsfunktion der standard Normalverteilung bezeichnet. Beweis. Wir können σ 2 = 1 annehmen. Sei zuerst µ = 0. Sei T = inf{t > 0 : Wt > a}. Dann ist WT +s − WT eine Brownsche Bewegung, und somit ist auf {T ≤ t} IIP[Wt − WT ≤ b − a | FT ] = IIP[Wt − WT ≥ a − b | FT ]. Also haben wir √ IIP[Mt > a, Wt ≤ b] = IIP[Mt > a, Wt ≥ 2a − b] = IIP[Wt ≥ 2a − b] = Φ((b − 2a)/ t) . Dies ist die Behauptung für µ = 0. Ist µ 6= 0, so ändern wir das Mass mit dem Martingal Lt = exp{−µWt − µ2 t/2} = exp{−µXt + µ2 t/2} . Dann wird X eine Brownsche Bewegung unter IIP∗ . Somit erhalten wir IIP[Mt > a, Xt ≤ b] = IIE∗ [exp{µXt − µ2 t/2}; Mt > a, Xt ≤ b] Z b 1 −(y−2a)2 /(2t) 2 e dy = eµy−µ t/2 √ 2πt −∞ Z b 1 −(y−2a−µt)2 /(2t) 2µa √ =e e dy 2πt −∞ √ = e2µa Φ((b − 2a − µt)/ t) . Dies beweist die Formel. E. Trennung von konvexen Mengen Hilfssatz E.1. Seien U und V konvexe Mengen in IRn , so dass U ∩ V = ∅. Dann gibt es eine lineare Funktion f : IRn → IR, so dass f (u) > f (v) für alle u ∈ U und v ∈V. F. Gronwalls Lemma F. GRONWALLS LEMMA Hilfssatz F.1. 127 Sei f (t) eine lokal beschränkte Funktion, so dass Z t f (s) ds f (t) ≤ a + b 0 für Konstanten a, b ≥ 0. Dann gilt für alle t, f (t) ≤ aebt . Beweis. Wir können |f (s)| ≤ 1 annehmen. Wir zeigen nun, dass für alle n ∈ IIN n X 1 1 k f (t) ≤ a (bt) + (bt)n+1 k! (n + 1)! k=0 gilt. Die Aussage ist für n = 0 trivial. Sei n ≥ 1 und nehmen wir an, die Behauptung sei für n − 1 bewiesen. Dann erhalten wir t Z f (t) ≤ a + b 0 =a 1+ Z t h X n−1 1 i 1 f (s) ds ≤ a + b a (bt)k + (bt)n dt k! n! 0 k=0 n−1 X k=0 1 1 (bt)k+1 + (bt)n+1 . (k + 1)! (n + 1)! 1 (bt)n+1 für n → ∞ gegen 0 konvergiert. Lassen wir nun Wir bemerken, dass (n+1)! n → ∞, folgt die Behauptung. 128 LITERATUR Literatur [1] Cox, J.C., Ingersoll, J.E. and Ross, S.A. (1985). A theory of the term structure of interest rates. Econometrica 53, 385–407. [2] Heath, D., Jarrow, A. and Morton, A. (1987). Bond pricing and the term structure of interest rates. Preprint. [3] Hull, J. and White, A. (1993). One-factor-interest-rate models and the valuation of interest-rate derivative securitites. J. Financial and Quantitative Analysis 28, 235–254. [4] Ikeda, N. and Watanabe, S. (1981). Stochastic Differential Equations and Diffusion Processes. North Holland, Amsterdam. [5] Lamberton, D. and Lapeyre, B. (1996). Introduction to Stochastic Calculus Applied to Finance. Chapman & Hall, London. [6] Rogers, L.C.G (1995). Which model for term-structure of interest should one use?. In: Davis, M.H.A., Duffie, D., Fleming, W.H. and Shreve, S.E., eds., Mathematicial Finance. Springer-Verlag, New York, 93–115. [7] Rogers, L.C.G. and Williams, D. (1987). Diffusions, Markov Processes and Martingales. Volume II, Wiley, Chichester. [8] Schmidli, H. (2008). Einführung in die Stochastik. Vorlesungsnotizen, Universität zu Köln. [9] Schmidli, H. (2009). Wahrscheinlichkeitstherie I & II. Vorlesungsnotizen, Universität zu Köln. [10] Seydel, R. (2002). Tools for Computational Finance. Springer-Verlag, Berlin. INDEX 129 Index adaptiert, 109 Akzeptanzmenge zulässig, 93 amerikanische Option, 15 Anspruch erreichbar, 13 Äquilibrium, 6 Arbitrage, 1, 12, 43 asiatische Option, 104 Average-Value-at-Risk, 98 bedingter Anspruch, 13, 44 Brownsche Bewegung, 116 Butterfly, 103 cadlag, 109 ∆Xt , 109 Doob-Zerlegung, 122 effizient Markowitz-, 80 endliche quadratische Variation, 114 endliche Variation, 112 erreichbarer Anspruch, 13 europäisch Anspruch, 13 Option, 13 Expected Shortfall, 99 FtX , 109 Filtration, 109 natürliche, 109 rechtsstetig, 109 floating Strike, 104 Girsanovs Theorem, 42 Gronwalls Lemma, 127 implizierte Volatilität, 46 Itô-Formel, 35 Itô-Prozess, 31 Kassakurs, 56 Klasse DL, 122 kohärentes Risikomass, 91 Konsumverteilung zulässig, 6 Konvergenzsatz, 119 konvexes Risikomass, 91 lokales Martingal, 123 Lokalisierungsfolge, 123 Markowitz-effizient, 80 Markt unvollständig, 6 vollständig, 6, 13 Martingal, 118 lokales, 123 Semi-, 124 Sub-, 118 Super-, 118 Martingal Repräsentationstheorem, 43 monetäres Risikomass, 89 monotones Risikomass, 89 natürliche Filtration, 109 normiertes Risikomass, 89 Option amerikanische, 15 europäische, 13 optionaler Stoppsatz, 119 Ornstein–Uhlenbeck-Prozess, 38 OTC, 103 over-the-counter, 103 Pareto-optimal, 6 plain Vanilla, 103 Portfolio Insurance, 106 positiv homogen, 90 quadratische Variation, 114 endliche, 114 quasi-konvexes Risikomass, 91 130 rechtsstetige Filtration, 109 Repräsentationstheorem, 43 Risikomass kohärent, 91 konvex, 91 monetär, 89 monoton, 89 normiert, 89 positiv homogen, 90 quasi-konvex, 91 subadditiv, 90 translationsinvariant, 89 risikoneutrales Wahrscheinlichkeitsmass, 3 selbstfinanzierende Strategie, 10, 42, 58 Semimartingal, 124 Spread, 103 State-Price-Deflator, 87 State-Price-Vektor, 1 stochastischer Prozess, 109 Stoppsatz, 119 Stoppzeit, 110 Straddle, 102 Strangle, 102 Strategie selbstfinanzierend, 10, 42, 58 zulässig, 12, 43, 59 subadditiv, 90 Submartingal, 118 Supermartingal, 118 Swaptions, 73 Tail-Value-at-Risk, 99 translationsinvariant, 89 unvollständiger Markt, 6 Value-at-Risk, 90 Variation, 112 endlich, 112 endliche quadratische, 114 quadratische, 114 vollständiger Markt, 6, 13 Wahrscheinlichkeitsmass INDEX risikoneutrales, 3 Zinsswap, 72 zulässig Konsumverteilung, 6 Strategie, 12, 43, 59 zulässige Akzeptanzmenge, 93