12. Übungsblatt zur Statistik II Prof. Dr. Holger Dette, WiSe 2016/2017 Aufgabe 1. Seien X1 , . . . , Xn unabhängig identisch P-verteilt. Weiterhin seien X1∗ , . . . , Xn∗ unabhängig identisch Pn -verteilt, wobei Pn die empirische Verteilung von X1 , . . . , Xn bezeichnet. Sei nun F eine Donsker Klasse mit Einhüllender F . Zeigen Sie, dass dann h i P ∗ sup E h(Ĝn )|X1 , . . . , Xn − Eh(GP ) −→ 0 h∈BL1 (`∞ (F )) gilt. Dabei bezeichne G∗n = eine Brown’sche Brücke. √ n(P∗n − Pn ) den empirischen Bootstrap Prozess und GP Aufgabe 2. Seien X1 , . . . , Xn unabhängig identisch verteilt mit Verteilung Pϑ . Sei ϑ̂n ein auf X1 , . . . , Xn basierender Schätzer, sodass für jede konvergente Folge (hn )n und jedes ϑ √ √ D n(ϑ̂n − ϑ − hn / n) −→ Lϑ unter Pϑ+hn /√n , für eine stetige Verteilung Lϑ . Zeigen Sie, dass dann √ D n(ϑ̂∗n − ϑ̂n ) −→ Lϑ bedingt auf X1 , . . . , Xn in Wahrscheinlichkeit, wobei ϑ̂∗n derselbe Schätzer wie ϑ̂n ist, basierend auf Beobachtungen der Verteilung Pϑ̂n . Aufgabe 3. a) Für β, L > 0 sei P(β, L) die Menge aller Wahrscheinlichkeitsdichten in der Klasse |p(bβc) (x) − p(bβc) (y)| H(β, L) = p : R → R bβc-mal diff.bar mit sup ≤L . |x − y|β−bβc x,y∈R Sei weiter K eine quadratisch integrierbare Funktion mit den Eigenschaften Z Z Z j K(x) dx = 1, x K(x) dx = 0 für alle j = 1, . . . , bβc, |x|β |K(x)| dx < ∞. Zeigen Sie, dass der Kerndichteschätzer p̂n mit Bandbreite hn = n−1/(2β+1) und Kern K die Ungleichung 2β sup sup E (p̂n (x) − p(x))2 ≤ c · n− 2β+1 x∈R p∈P(β,L) für eine Konstante c = c(β, L, K) erfüllt. b) Seien Xi = (Xi1 , . . . , Xid )T , i = 1, . . . , n, unabhängig identisch verteilte Rd wertige Zufallsvariablen mit zweimal stetig differenzierbarer Dichte p : Rd → R, sodass alle zweiten partiellen Ableitungen gleichmäßig beschränkt sind. Sei K : Rd → R eine Funktion mit den Eigenschaften Z Z K(x) dx = 1, xi K(x) dx = 0 für alle i = 1, . . . , d und Z |xi xj | · |K(x)| dx < ∞ für alle i, j = 1, . . . , d. Zeigen Sie, dass für den multivariaten Kerndichteschätzer mit Bandbreite h > 0 und Kern K n 1 X Xi1 − x1 Xid − xd p̂n (x1 , . . . , xd ) = K ,..., nhd i=1 h h die Abschätzung 1 4 sup E(p̂n (x) − p(x)) ≤ c h + d nh x∈R 2 für eine Konstante c = c(p, K, d) > 0 gilt. 2 Aufgabe 4. Seien (X1 , Y1 ), . . . , (Xn , Yn ) unabhängig identisch verteilt mit E|Y1 | < ∞. Für einen Kern K und eine Bandbreite h > 0 ist durch Pn X −x Pn Pi=1 Yi K ( ih ) , Xi −x 6= 0 falls K X −x n i=1 i h fˆn (x) = i=1 K ( h ) 0, sonst ein Schätzer für die Regressionsfunktion f (x) = E[Y1 |X1 = x] gegeben. Beweisen Sie die Darstellung R y p̂n (x, y) dy fˆn (x) = p̂n (x) falls p̂n (x) 6= 0 und Z Z K(x) dx = 1 und xK(x) dx = 0, wobei n 1 X p̂n (x) = K nh i=1 Xi − x h n 1 X Xi − x Yi − x und p̂n (x, y) = K K . nh2 i=1 h h Besprechung in der Übung am 06.02.2017 3