Beispiel 20 (Maxima der Exponentialverteilung) Sei (Xk) eine Folge

Werbung
Beispiel 20 (Maxima der Exponentialverteilung)
Sei (Xk ) eine Folge von i.i.d. ZV mit Verteilungsfunktion F , F (x) =
1 − e−x für x ≥ 0. Zeigen Sie, dass F ∈ M DA(Λ) mit normierenden
Konstanten an = 1 und bn = ln n.
Beispiel 21 (Maxima der Cauchy-Verteilung)
Sei (Xk ) eine Folge von i.i.d. ZV mit Verteilungsfunktion F und Dichtefunktion f , f (x) = (π(1 + x2 ))−1 für x ∈ IR. Zeigen Sie, dass
F ∈ M DA(Φ1) mit normierenden Konstanten an = n/π und bn = 0.
Definition 17 (Die Verallgemeinerte Extremwertverteilung)
Die Verteilungsfunktion Hγ sei folgendermaßen gegeben:
exp{−(1 + γx)−1/γ } wenn γ 6= 0
Hγ (x) =
exp{− exp{−x}}
wenn γ = 0
wobei 1 + γx > 0. D.h. der Definitionsbereich von Hγ wird folgendermaßen gegeben:
x > −γ −1 wenn γ > 0
x < −γ −1 wenn γ < 0
x ∈ IR
wenn γ = 0
Hγ heißt verallgemeinerte standard Extremwertverteilung.
48
Theorem 9 (Charakterisierung von M DA(Hγ ))
• F ∈ M DA(Hγ ) mit γ > 0 ⇐⇒ F ∈ M DA(Φα) mit α = 1/γ > 0.
• F ∈ M DA(H0) ⇐⇒ F ∈ M DA(Λ).
• F ∈ M DA(Hγ ) mit γ < 0 ⇐⇒ F ∈ M DA(Ψα) mit α = −1/γ > 0.
Theorem 10 (M DA(Φα), Gnedenko 1943)
F ∈ M DA(Φα) (α > 0) ⇐⇒ F̄ ∈ RV−α (α > 0).
←
−1
Wenn F ∈ M DA(Φα), dann limn→∞ a−1
n Mn = Φα mit an = F (1−n ).
Beispiel 22 Zeigen Sie, dass die untenstehenden Verteilungen dem
M DA(Φα) gehören und bestimmen Sie die normierenden Konstanten.
• Pareto: F (x) = 1 − x−α , x > 1, α > 0.
• Cauchy: f (x) = (π(1 + x2 ))−1 , x ∈ IR.
• Student: f (x) =
Γ((α+1)/2)
√
,
απΓ(α/2)(1+x2 /α)(α+1)/2
• Loggamma: f (x) =
α ∈ IN, x ∈ IR.
αβ
(ln x)β−1 x−α−1 ,
Γ(β)
x > 1, α, β > 0.
49
Theorem 11 (M DA(Ψα), Gnedenko 1943)
F ∈ M DA(Ψα) (α > 0) ⇐⇒ xF := sup{x ∈ IR: F (x) < 1} < ∞ und
F̄ (xF − x−1 ) ∈ RV−α (α > 0).
Wenn F ∈ M DA(Ψα), dann limn→∞ a−1
n (Mn − xF ) = Ψα mit
an = xF − F ← (1 − n−1).
Beispiel 23 Sei X ∼ U (0, 1). Es gilt X ∈ M DA(Ψ1) mit an = 1/n,
n ∈ IN.
Theorem 12 (M DA(Λ))
Sei F eine Verteilungsfunktion mit rechtem Endpunkt xF ≤ ∞.
F ∈ M DA(Λ) dann und nur dann wenn es ein z < xF existiert, sodass
für F folgende Darstellung gilt:
n Z x g(t) o
F̄ (x) = c(x)exp −
dt , ∀x, z < x ≤ xF .
a(t)
z
Für die Funktionen c(x) und g(x) gilt limx↑xF c(x) = c > 0 und
limt↑xF g(t) = 1, und a(t) ist eine positive absolut stetige Funktion,
sodass limt↑xF a′ (t) = 0.
50
Theorem 13 (M DA(Λ), alternative Charakterisierung)
Eine Verteilungsfunktion F gehört zu M DA(Λ) dann und nur dann
wenn es eine positive Funktion ã existiert, sodass
lim
x↑xF
F̄ (x + uã(x))
= e−u , ∀u ∈ IR
F̄ (x)
Eine mögliche Wahl für ã ist ã(x) = a(x)
Z xF
F̄ (t)
dt
a(x) =
F̄ (x)
x
Die Funktion a(x) heißt durchschnittliche Überschußfunktion
(mean excess function):
a(x) = E(X − x|X > x), ∀x ≤ xF
Einige Verteilungen, die dem M DA(Λ) gehören:
• Normal: F (x) = (2π)−1/2 exp{−x2 /2}, x ∈ IR.
• Exponential: f (x) = λ−1 exp{−λx}, x > 0, λ > 0.
• Lognormal: f (x) = (2πx2 )−1/2 exp{−(ln x)2 /2}, x > 0.
• Gamma: f (x) =
βα
xα−1 exp{−βx},
Γ(α)
x > 0, α, β > 0.
51
Graphische Methoden zur Untersuchung des Verteilungsrandes
• Histogramm
• Quantil-Quantil Plots
X1 , X2, . . . , Xn sind i.i.d. ZV mit einer unbekannten Verteilung F̃ .
Es wird vermutet, dass F̃ am Rand von einer bekannten Verteilung F approximiert wird. Wie kann man diese Vermutung testen?
Sei Xn,n ≤ Xn−1,n ≤ . . . ≤ X1,n eine sortierte Stichprobe aus X1 ,
X2 ,. . ., Xn .
qq-plot: {(Xk,n , F ← ( n−k+1
)): k = 1, 2, . . . , n}.
n+1
Bei einer plausiblen Vermutung stellt der qq-plot eine einigermaßen lineare Abhängigkeit dar. Diese Eigenschaft bleibt auch dann
erhalten wenn die echte Verteilung und die Referenz-Verteilung
nicht übereinstimmen, sondern vom selben Typus sind.
Faustregel: Je größer das Quantil um so mehr “heavy tailed” ist
die Verteilung!
52
Der Hill Schätzer
Seien X1 , X2, . . . , Xn i.i.d. mit Verteilungsfunktion F , sodass F̄ ∈ RV−α ,
α > 0, d.h. F̄ (x) = x−α L(x) mit L ∈ RV0.
Ziel: Schätzung von α!
Theorem 14 (Satz von Karamata)
Sei L eine langsam variierende und lokal beschränkte Funktion auf
[x0 , +∞) für ein x0 ∈ IR. Dann gilt:
(a) Für κ > −1:
Z x
tκL(t)dt ∼ K(x0 ) +
xo
1
xκ+1 L(x) für x → ∞
κ+1
(K(x0 ) ist eine von x0 abhängige Konstante.)
(b) Für κ < −1:
Z
x
+∞
tκL(t)dt ∼ −
1
xκ+1 L(x) für x → ∞
κ+1
Beweis in Bingham et al. 1987.
53
Annahme: L ist lokal beschränkt in [u, +∞).
Aus dem Satz von Karamata folgt:
1
E (ln(X) − ln(u)| ln(X) > ln(u)) = lim
u→∞ F̄ (u)
Z
∞
(ln x−ln u)dF (x) = α−1 .
u
(8)
P
Für die empirische Verteilung Fn(x) = n1 nk=1 I[xk ,∞) (x) und eine hohe
stichprobenabhängige Schwelle xk,n , erhält man:
E ln(X) − ln(xk,n)| ln(X) > ln(xk,n ) ≈
1
F̄n(xk,n )
Z
k−1
1 X
(ln x − ln xk,n )dFn(x) =
(ln xj,n − ln xk,n ).
k
−
1
Xk,n
j=1
∞
Wenn k = k(n) → ∞ und k/n → 0, dann Xk,n → ∞ für n → ∞, und
dann folgt aus (8):
54
k−1
1 X
d
lim
(ln xj,n − ln xk,n ) = α−1
n→∞ k − 1
j=1
Der untenstehende Hill-Schätzer ist also konsistent:
−1

k
X
1
(H)
(ln xj,n − ln xk,n )
α̂k,n = 
k j=1
Wie wird ein passendes k für eine gegebene Stichprobengröße n
gewählt?
k zu klein: hohe Varianz des Schätzers!
k zu gross: Schätzer basiert auf zentrale Werte der Verteilung =⇒
Der Schätzer ist verzerrt!
n
o
(H)
Grafische Inspektion des Hill Plots:
k, α̂k,n : k = 2, . . . , n
(H)
Für einen gegebenen Schätzer α̂k,n
von α erhält man folgenden
Schätzer für die Randverteilung F̄ :
−α̂(H)
k,n
x
k
ˆ
.
F̄ (x) =
n xk,n
55
und folgenden Quantil–Schätzer:
(H)
−1/α̂k,n
n
xk,n .
(1 − p)
q̂p = F̂ ← (p) =
k
Die POT Methode (Peaks over Threshold)
Definition 18 (Die verallgemeinerte Pareto Verteilung (GPD))
Die standard GPD Gγ :
1 − (1 + γx)−1/γ für γ 6= 0
Gγ (x) =
1 − exp{−x}
für γ = 0
wobei x ∈ D(γ)
D(γ) =
0≤x<∞
0 ≤ x ≤ −1/γ
für γ ≥ 0
für γ < 0
oder Gγ (x) = 1−(1+γx)−1/γ , x ∈ D(γ) für γ 6= 0, und G0 = limγ→0 Gγ .
Sei ν ∈ IR und β > 0. Eine GPD ist durch die untenstehende Verteilungsfunktion gegeben
Gγ,ν,β = 1 − (1 + γ
wobei x ∈ D(γ, ν, β) und
D(γ, ν, β) =
x − ν −1/γ
)
β
ν≤x<∞
ν ≤ x ≤ ν − β/γ
für γ ≥ 0
für γ < 0
56
Theorem 15 (Charakterisierung von M DA(Hγ ))
Sein γ ∈ IR. Die untenstehenden Aussagen sind äquivalent:
(i) F ∈ M DA(Hγ )
(ii) Es existiert eine positive messbare Funktion a(·), sodass für x ∈
D(γ)
lim
u↑xF
F̄ (u + xa(u))
= Ḡγ (x).
F̄ (u)
Definition 19 (Exzess-Verteilung)
Sei X eine ZV mit Verteilungsfunktion F und rechtem Endpunkt xF .
Für u < xF
Fu(x) = P (X − u ≤ x|X > u), x ≥ 0
heißt Exzess-Verteilungsfunktion über die Schwelle u.
Theorem 16 (Eine weitere Charakterisierung von M DA(Hγ ))
Sei γ ∈ IR. Folgende Aussagen sind äquivalent:
(i) F ∈ M DA(Hγ )
(ii) Es existiert eine positive messbare Funktion β(·), sodass
lim
sup
u↑xF x∈(0,xF −u)
|Fu(x) − Gγ,0,β(u) (x)| = 0
57
POT: Schätzer für den Tail und das Quantil der ExzessVerteilung
Seien X1,. . . , Xn i.i.d. ZV mit Verteilungsfunktion F ∈ M DA(Hγ ) für
γ ∈ IR.
• Wähle eine hohe Schwelle u (unter Verwendung von geeigneten
stat. Verfahren) und berechne
Nu = # {i ∈ {1, 2, . . . , n}: Xi > u}
• Sei Y1,Y2,. . .,YNu eine Stichprobe von Exzess-Beobachtungen.
Bestimme β̂ und γ̂, sodass folgendes gilt:
F̄u(y) ≈ Ḡ
d
γ̂,0,β
(u)
(y),
wobei F̄u(y) = P (X − u > y|X > u)
• Kombiniere die obigen zwei Schritte um folgende Schätzer zu
berechnen:
−1/γ̂
y
N
u
\
1 + γ̂
F̄ (u
+ y) =
(9)
n
β̂
!
−γ̂
n
β̂
−1
(10)
(1 − p)
q̂p = u +
γ̂
Nu
58
Wie wird eine hohe Schwelle u (POT Methode) gewählt?
• u zu groß: Wenige Beobachtungen für die Schätzung von β̂ und
γ̂.
• u zu klein: die Approximation F̄u(y) ≈ Ḡγ̂,β̂(u) (u) ist nicht gut
genug.
Grundidee: Inspektion des Plots der empirischen durchschnittlichen
Exzess-Funktion und Auswahl einer Schwelle u0, sodass die empirische
durchschnittliche Exzess-Funktion für u > u0 annähernd linear ist.
Begründung: die Durchschnittliche Exzess-Funktion der GP Dγ,0,β ist
linear!
Die empirische durchschnittliche Exzess-Funktion
Seien X1 , X2, . . . , Xn i.i.d ZV.
Sei Nu = #{i: 1 ≤ i ≤ n, Xi > u} die Anzahl der Überschreitung von u
durch Xi
Die empirische durchschnittliche Exzess-Funktion en(u):
n
1 X
en (u) =
(Xi − u)I{Xi > u}
Nu i=1
59
Der Plot der durchschnittlichen Exzess-Funktion: (Xk,n , en(Xk,n )) für
k = 1, 2, . . . , n − 1.
Wenn dieser Plot annähernd linear mit einem positiven Gradienten ist,
so wird angenommen, dass die Verteilung einen heavy-tailed Paretoähnlichen Tail hat.
Schätzung der Parameter γ und β
Sei u eine gegebene Schwelle und Y1,Y2,. . .,YNu Beobachtungen der
Überschüsse Xi > u, 1 ≤ i ≤ n.
Die Log-Likelihood Funktion:
ln L(γ, β, Y1, . . . , YNu ) = −Nu ln β −
X
Nu
γ
1
+1
ln 1 + Yi
γ
β
i=1
wobei Yi ≥ 0 für γ > 0 und 0 ≤ Yi ≤ −β/γ für γ < 0.
L(γ, β, Y1, . . . , YNu ) ist die bedingte Wahrscheinlichkeit, dass F̄u(y) ≈
Ḡγ,0,β (y) unter der Bedingung, dass die Beobachtungen der
Überschüsse Y1,Y2,. . .,YNu sind.
Für die Ermittlung der Likelihood Funktion siehe Daley, Veve-Jones
(2003) and Coles (2001).
60
Als Schätzer γ̂ und β̂ werden jene Werte von γ bzw. β verwendet, die
die log-Likelihood Funktion maximieren (ML-Schätzer)
Die Methode funktioniert gut für γ > −1/2.
Die ML-Schätzer sind in diesem Fall normal verteilt:
β̂
1+γ
(γ̂ − γ, − 1) ∼ N (0, Σ−1 /Nu ) wobei Σ−1 =
−1
β
−1
2
.
Um die Unsicherheit über die einigermaßen willkürliche Auswahl von
u zu reduzieren, überprüft man wie die ML-Schätzer in Abhängigkeit
von u variieren.
Weiters wird der Schätzer
Nu
\
F̄ (u
+ y) =
n
grafisch dargestellt und inspiziert.
−1/γ̂
y
1 + γ̂
β̂
61
Berechnung von Risikomaßen VaR und CVaR mit Hilfe der POT
Methode
Seien X1 , X2 , . . ., Xn Beobachtungen von i.i.d. ZVen mit unbekannter
Verteilungsfunktion F . Direkt aus der POT Methode erhält man folgende Schätzer für die Randverteilung und das Quantil qp = V aRp(F )
von F
−1/γ̂
Nu
y
\
F̄ (u
+ y) =
1 + γ̂
n
β̂
!
−γ̂
β̂
n
q̂p = u +
−1
(1 − p)
γ̂
Nu
qp −u)
Für 0 < γ̂ < 1 zeigen wir, dass CV\
aRp (F ) = qˆp + β̂+γ̂(ˆ
ein Schätzer
1−γ̂
von CV aRp (F ) ist.
Der Beweis erfolgt mit Hilfe der folgenden 2 Schritte:
(1) Sei X eine ZV mit X ∼ GP Dγ,0,β und 0 < γ < 1. Es gilt
CV aRp(X) = qp +
β + γqp
,
1−γ
wobei qp := V aRp (X) das p-Quantil von X ist.
62
(2) Sei X eine ZV mit X ∼ F . Die Randverteilung F̄ (x) wird durch
F̄ (u)Ḡγ,0,β (x − u) approximiert. Daraus folgt F ≈ F̃ mit F̃ :=
1 − F̄ (u)Ḡγ,0,β (x − u). Für qp > u ist der CVaR der Approximation
F̃ folgendermaßen gegeben:
CV aRp(F̃ ) = qp +
β + γ(qp − u)
1−γ
63
Herunterladen