Beispiel 20 (Maxima der Exponentialverteilung) Sei (Xk ) eine Folge von i.i.d. ZV mit Verteilungsfunktion F , F (x) = 1 − e−x für x ≥ 0. Zeigen Sie, dass F ∈ M DA(Λ) mit normierenden Konstanten an = 1 und bn = ln n. Beispiel 21 (Maxima der Cauchy-Verteilung) Sei (Xk ) eine Folge von i.i.d. ZV mit Verteilungsfunktion F und Dichtefunktion f , f (x) = (π(1 + x2 ))−1 für x ∈ IR. Zeigen Sie, dass F ∈ M DA(Φ1) mit normierenden Konstanten an = n/π und bn = 0. Definition 17 (Die Verallgemeinerte Extremwertverteilung) Die Verteilungsfunktion Hγ sei folgendermaßen gegeben: exp{−(1 + γx)−1/γ } wenn γ 6= 0 Hγ (x) = exp{− exp{−x}} wenn γ = 0 wobei 1 + γx > 0. D.h. der Definitionsbereich von Hγ wird folgendermaßen gegeben: x > −γ −1 wenn γ > 0 x < −γ −1 wenn γ < 0 x ∈ IR wenn γ = 0 Hγ heißt verallgemeinerte standard Extremwertverteilung. 48 Theorem 9 (Charakterisierung von M DA(Hγ )) • F ∈ M DA(Hγ ) mit γ > 0 ⇐⇒ F ∈ M DA(Φα) mit α = 1/γ > 0. • F ∈ M DA(H0) ⇐⇒ F ∈ M DA(Λ). • F ∈ M DA(Hγ ) mit γ < 0 ⇐⇒ F ∈ M DA(Ψα) mit α = −1/γ > 0. Theorem 10 (M DA(Φα), Gnedenko 1943) F ∈ M DA(Φα) (α > 0) ⇐⇒ F̄ ∈ RV−α (α > 0). ← −1 Wenn F ∈ M DA(Φα), dann limn→∞ a−1 n Mn = Φα mit an = F (1−n ). Beispiel 22 Zeigen Sie, dass die untenstehenden Verteilungen dem M DA(Φα) gehören und bestimmen Sie die normierenden Konstanten. • Pareto: F (x) = 1 − x−α , x > 1, α > 0. • Cauchy: f (x) = (π(1 + x2 ))−1 , x ∈ IR. • Student: f (x) = Γ((α+1)/2) √ , απΓ(α/2)(1+x2 /α)(α+1)/2 • Loggamma: f (x) = α ∈ IN, x ∈ IR. αβ (ln x)β−1 x−α−1 , Γ(β) x > 1, α, β > 0. 49 Theorem 11 (M DA(Ψα), Gnedenko 1943) F ∈ M DA(Ψα) (α > 0) ⇐⇒ xF := sup{x ∈ IR: F (x) < 1} < ∞ und F̄ (xF − x−1 ) ∈ RV−α (α > 0). Wenn F ∈ M DA(Ψα), dann limn→∞ a−1 n (Mn − xF ) = Ψα mit an = xF − F ← (1 − n−1). Beispiel 23 Sei X ∼ U (0, 1). Es gilt X ∈ M DA(Ψ1) mit an = 1/n, n ∈ IN. Theorem 12 (M DA(Λ)) Sei F eine Verteilungsfunktion mit rechtem Endpunkt xF ≤ ∞. F ∈ M DA(Λ) dann und nur dann wenn es ein z < xF existiert, sodass für F folgende Darstellung gilt: n Z x g(t) o F̄ (x) = c(x)exp − dt , ∀x, z < x ≤ xF . a(t) z Für die Funktionen c(x) und g(x) gilt limx↑xF c(x) = c > 0 und limt↑xF g(t) = 1, und a(t) ist eine positive absolut stetige Funktion, sodass limt↑xF a′ (t) = 0. 50 Theorem 13 (M DA(Λ), alternative Charakterisierung) Eine Verteilungsfunktion F gehört zu M DA(Λ) dann und nur dann wenn es eine positive Funktion ã existiert, sodass lim x↑xF F̄ (x + uã(x)) = e−u , ∀u ∈ IR F̄ (x) Eine mögliche Wahl für ã ist ã(x) = a(x) Z xF F̄ (t) dt a(x) = F̄ (x) x Die Funktion a(x) heißt durchschnittliche Überschußfunktion (mean excess function): a(x) = E(X − x|X > x), ∀x ≤ xF Einige Verteilungen, die dem M DA(Λ) gehören: • Normal: F (x) = (2π)−1/2 exp{−x2 /2}, x ∈ IR. • Exponential: f (x) = λ−1 exp{−λx}, x > 0, λ > 0. • Lognormal: f (x) = (2πx2 )−1/2 exp{−(ln x)2 /2}, x > 0. • Gamma: f (x) = βα xα−1 exp{−βx}, Γ(α) x > 0, α, β > 0. 51 Graphische Methoden zur Untersuchung des Verteilungsrandes • Histogramm • Quantil-Quantil Plots X1 , X2, . . . , Xn sind i.i.d. ZV mit einer unbekannten Verteilung F̃ . Es wird vermutet, dass F̃ am Rand von einer bekannten Verteilung F approximiert wird. Wie kann man diese Vermutung testen? Sei Xn,n ≤ Xn−1,n ≤ . . . ≤ X1,n eine sortierte Stichprobe aus X1 , X2 ,. . ., Xn . qq-plot: {(Xk,n , F ← ( n−k+1 )): k = 1, 2, . . . , n}. n+1 Bei einer plausiblen Vermutung stellt der qq-plot eine einigermaßen lineare Abhängigkeit dar. Diese Eigenschaft bleibt auch dann erhalten wenn die echte Verteilung und die Referenz-Verteilung nicht übereinstimmen, sondern vom selben Typus sind. Faustregel: Je größer das Quantil um so mehr “heavy tailed” ist die Verteilung! 52 Der Hill Schätzer Seien X1 , X2, . . . , Xn i.i.d. mit Verteilungsfunktion F , sodass F̄ ∈ RV−α , α > 0, d.h. F̄ (x) = x−α L(x) mit L ∈ RV0. Ziel: Schätzung von α! Theorem 14 (Satz von Karamata) Sei L eine langsam variierende und lokal beschränkte Funktion auf [x0 , +∞) für ein x0 ∈ IR. Dann gilt: (a) Für κ > −1: Z x tκL(t)dt ∼ K(x0 ) + xo 1 xκ+1 L(x) für x → ∞ κ+1 (K(x0 ) ist eine von x0 abhängige Konstante.) (b) Für κ < −1: Z x +∞ tκL(t)dt ∼ − 1 xκ+1 L(x) für x → ∞ κ+1 Beweis in Bingham et al. 1987. 53 Annahme: L ist lokal beschränkt in [u, +∞). Aus dem Satz von Karamata folgt: 1 E (ln(X) − ln(u)| ln(X) > ln(u)) = lim u→∞ F̄ (u) Z ∞ (ln x−ln u)dF (x) = α−1 . u (8) P Für die empirische Verteilung Fn(x) = n1 nk=1 I[xk ,∞) (x) und eine hohe stichprobenabhängige Schwelle xk,n , erhält man: E ln(X) − ln(xk,n)| ln(X) > ln(xk,n ) ≈ 1 F̄n(xk,n ) Z k−1 1 X (ln x − ln xk,n )dFn(x) = (ln xj,n − ln xk,n ). k − 1 Xk,n j=1 ∞ Wenn k = k(n) → ∞ und k/n → 0, dann Xk,n → ∞ für n → ∞, und dann folgt aus (8): 54 k−1 1 X d lim (ln xj,n − ln xk,n ) = α−1 n→∞ k − 1 j=1 Der untenstehende Hill-Schätzer ist also konsistent: −1 k X 1 (H) (ln xj,n − ln xk,n ) α̂k,n = k j=1 Wie wird ein passendes k für eine gegebene Stichprobengröße n gewählt? k zu klein: hohe Varianz des Schätzers! k zu gross: Schätzer basiert auf zentrale Werte der Verteilung =⇒ Der Schätzer ist verzerrt! n o (H) Grafische Inspektion des Hill Plots: k, α̂k,n : k = 2, . . . , n (H) Für einen gegebenen Schätzer α̂k,n von α erhält man folgenden Schätzer für die Randverteilung F̄ : −α̂(H) k,n x k ˆ . F̄ (x) = n xk,n 55 und folgenden Quantil–Schätzer: (H) −1/α̂k,n n xk,n . (1 − p) q̂p = F̂ ← (p) = k Die POT Methode (Peaks over Threshold) Definition 18 (Die verallgemeinerte Pareto Verteilung (GPD)) Die standard GPD Gγ : 1 − (1 + γx)−1/γ für γ 6= 0 Gγ (x) = 1 − exp{−x} für γ = 0 wobei x ∈ D(γ) D(γ) = 0≤x<∞ 0 ≤ x ≤ −1/γ für γ ≥ 0 für γ < 0 oder Gγ (x) = 1−(1+γx)−1/γ , x ∈ D(γ) für γ 6= 0, und G0 = limγ→0 Gγ . Sei ν ∈ IR und β > 0. Eine GPD ist durch die untenstehende Verteilungsfunktion gegeben Gγ,ν,β = 1 − (1 + γ wobei x ∈ D(γ, ν, β) und D(γ, ν, β) = x − ν −1/γ ) β ν≤x<∞ ν ≤ x ≤ ν − β/γ für γ ≥ 0 für γ < 0 56 Theorem 15 (Charakterisierung von M DA(Hγ )) Sein γ ∈ IR. Die untenstehenden Aussagen sind äquivalent: (i) F ∈ M DA(Hγ ) (ii) Es existiert eine positive messbare Funktion a(·), sodass für x ∈ D(γ) lim u↑xF F̄ (u + xa(u)) = Ḡγ (x). F̄ (u) Definition 19 (Exzess-Verteilung) Sei X eine ZV mit Verteilungsfunktion F und rechtem Endpunkt xF . Für u < xF Fu(x) = P (X − u ≤ x|X > u), x ≥ 0 heißt Exzess-Verteilungsfunktion über die Schwelle u. Theorem 16 (Eine weitere Charakterisierung von M DA(Hγ )) Sei γ ∈ IR. Folgende Aussagen sind äquivalent: (i) F ∈ M DA(Hγ ) (ii) Es existiert eine positive messbare Funktion β(·), sodass lim sup u↑xF x∈(0,xF −u) |Fu(x) − Gγ,0,β(u) (x)| = 0 57 POT: Schätzer für den Tail und das Quantil der ExzessVerteilung Seien X1,. . . , Xn i.i.d. ZV mit Verteilungsfunktion F ∈ M DA(Hγ ) für γ ∈ IR. • Wähle eine hohe Schwelle u (unter Verwendung von geeigneten stat. Verfahren) und berechne Nu = # {i ∈ {1, 2, . . . , n}: Xi > u} • Sei Y1,Y2,. . .,YNu eine Stichprobe von Exzess-Beobachtungen. Bestimme β̂ und γ̂, sodass folgendes gilt: F̄u(y) ≈ Ḡ d γ̂,0,β (u) (y), wobei F̄u(y) = P (X − u > y|X > u) • Kombiniere die obigen zwei Schritte um folgende Schätzer zu berechnen: −1/γ̂ y N u \ 1 + γ̂ F̄ (u + y) = (9) n β̂ ! −γ̂ n β̂ −1 (10) (1 − p) q̂p = u + γ̂ Nu 58 Wie wird eine hohe Schwelle u (POT Methode) gewählt? • u zu groß: Wenige Beobachtungen für die Schätzung von β̂ und γ̂. • u zu klein: die Approximation F̄u(y) ≈ Ḡγ̂,β̂(u) (u) ist nicht gut genug. Grundidee: Inspektion des Plots der empirischen durchschnittlichen Exzess-Funktion und Auswahl einer Schwelle u0, sodass die empirische durchschnittliche Exzess-Funktion für u > u0 annähernd linear ist. Begründung: die Durchschnittliche Exzess-Funktion der GP Dγ,0,β ist linear! Die empirische durchschnittliche Exzess-Funktion Seien X1 , X2, . . . , Xn i.i.d ZV. Sei Nu = #{i: 1 ≤ i ≤ n, Xi > u} die Anzahl der Überschreitung von u durch Xi Die empirische durchschnittliche Exzess-Funktion en(u): n 1 X en (u) = (Xi − u)I{Xi > u} Nu i=1 59 Der Plot der durchschnittlichen Exzess-Funktion: (Xk,n , en(Xk,n )) für k = 1, 2, . . . , n − 1. Wenn dieser Plot annähernd linear mit einem positiven Gradienten ist, so wird angenommen, dass die Verteilung einen heavy-tailed Paretoähnlichen Tail hat. Schätzung der Parameter γ und β Sei u eine gegebene Schwelle und Y1,Y2,. . .,YNu Beobachtungen der Überschüsse Xi > u, 1 ≤ i ≤ n. Die Log-Likelihood Funktion: ln L(γ, β, Y1, . . . , YNu ) = −Nu ln β − X Nu γ 1 +1 ln 1 + Yi γ β i=1 wobei Yi ≥ 0 für γ > 0 und 0 ≤ Yi ≤ −β/γ für γ < 0. L(γ, β, Y1, . . . , YNu ) ist die bedingte Wahrscheinlichkeit, dass F̄u(y) ≈ Ḡγ,0,β (y) unter der Bedingung, dass die Beobachtungen der Überschüsse Y1,Y2,. . .,YNu sind. Für die Ermittlung der Likelihood Funktion siehe Daley, Veve-Jones (2003) and Coles (2001). 60 Als Schätzer γ̂ und β̂ werden jene Werte von γ bzw. β verwendet, die die log-Likelihood Funktion maximieren (ML-Schätzer) Die Methode funktioniert gut für γ > −1/2. Die ML-Schätzer sind in diesem Fall normal verteilt: β̂ 1+γ (γ̂ − γ, − 1) ∼ N (0, Σ−1 /Nu ) wobei Σ−1 = −1 β −1 2 . Um die Unsicherheit über die einigermaßen willkürliche Auswahl von u zu reduzieren, überprüft man wie die ML-Schätzer in Abhängigkeit von u variieren. Weiters wird der Schätzer Nu \ F̄ (u + y) = n grafisch dargestellt und inspiziert. −1/γ̂ y 1 + γ̂ β̂ 61 Berechnung von Risikomaßen VaR und CVaR mit Hilfe der POT Methode Seien X1 , X2 , . . ., Xn Beobachtungen von i.i.d. ZVen mit unbekannter Verteilungsfunktion F . Direkt aus der POT Methode erhält man folgende Schätzer für die Randverteilung und das Quantil qp = V aRp(F ) von F −1/γ̂ Nu y \ F̄ (u + y) = 1 + γ̂ n β̂ ! −γ̂ β̂ n q̂p = u + −1 (1 − p) γ̂ Nu qp −u) Für 0 < γ̂ < 1 zeigen wir, dass CV\ aRp (F ) = qˆp + β̂+γ̂(ˆ ein Schätzer 1−γ̂ von CV aRp (F ) ist. Der Beweis erfolgt mit Hilfe der folgenden 2 Schritte: (1) Sei X eine ZV mit X ∼ GP Dγ,0,β und 0 < γ < 1. Es gilt CV aRp(X) = qp + β + γqp , 1−γ wobei qp := V aRp (X) das p-Quantil von X ist. 62 (2) Sei X eine ZV mit X ∼ F . Die Randverteilung F̄ (x) wird durch F̄ (u)Ḡγ,0,β (x − u) approximiert. Daraus folgt F ≈ F̃ mit F̃ := 1 − F̄ (u)Ḡγ,0,β (x − u). Für qp > u ist der CVaR der Approximation F̃ folgendermaßen gegeben: CV aRp(F̃ ) = qp + β + γ(qp − u) 1−γ 63