Universität Konstanz Fachbereich Mathematik und Statistik Dr. Volker Bürkel Andrea Robles Sommersemester 2011 test test Stochastik 1, Teil 2 (Statistik) 2. Übungsblatt Aufgabe 2.1 Sei X1 , . . . , Xn eine Folge von iid-Zufallsvariablen mit Verteilungsfunktion F (x). 1. Die empirische Verteilungsfunktion Fn (x) der Stichprobe X1 , . . . , Xn ist definiert als n Fn (x) := 1X 1(−∞,x] (Xi ). n i=1 Zeigen Sie, dass es für jede reelle Zahl x gilt Fn (x) → F (x) P-a.s. n → ∞. Hinweis: Verwenden Sie das starke Gesetz der großen Zahlen. 2. Das empirische Maß Pn (x) einer Stichprobe X1 . . . , Xn ist für jede borelsche Menge B definiert als n 1X 1B (Xi ). Pn (B) := n i=1 Zeigen Sie, dass es für jede borelsche Menge B gilt Pn (B) → PX (B) P-a.s. n → ∞, wobei PX die Verteilung der Zufallsvariablen X1 . . . , Xn ist (PX (B) := P (Xi ∈ B)). 3. Nehmen Sie an, dass X1 , . . . , Xn iid-Zufallsvariablen sind mit Werten in dem endlichen Intervall (a, b], und mit Dichte f (x) = 1(a,b] (x)F 0 (x). Das Histogramm Hn (x) der Stichprobe X1 , . . . , Xn mit Bandbreiten wm = (b − a)/m für m ∈ Z ist ( #{j ≤ n : Xj ∈ Ikm } falls x ∈ Ikm Hn (x) := 0 falls x ∈ / (a, b] wobei Ikm = (a + (k − 1)wm , a + kwm ], k = 1, . . . , m eine disjunkte Partition des Intervalls (a, b] in Intervalle mit Länge wm ist. Für alle x ∈ Ikm ist Hn (x) die Anzahl von Beobachtungen innerhalb dieses Intervalles. Gemäß des starken Gesetz der großen Zahlen gilt für x ∈ Ikm und festes m 1 Hn (x) → P (Xj ∈ Ikm ) P-a.s. n → ∞ n mit P (Xj ∈ Ikm ) = F (a + kwm ) − F (a + (k − 1)wm ). Nehmen Sie an, dass f (x) stetig auf (a, b] ist und betrachten ein festes x ∈ (a, b]. Für alle m sei km der Index, so dass x zu Ikmm gehört, d.h. a + (km − 1)wm < x ≤ a + km wm . Zeigen Sie, dass 1 P (Xj ∈ Ikmm ) → f (x) m → ∞ (so wm → 0). wm Hinweis: Die Definition des Histogramms hier unterscheidet sich von der Definition im Rahmen der deskriptiven Statistik in der Vorlesung dadurch, dass die Klassenbreite zunächst nicht berücksichtigt wird. Da die Klassenbreite aber konstant ist bleibt das so definierte Histogramm proportional“zum Histogramm aus der Vorlesung. ” Aufgabe 2.2 Sei X1 , . . . , Xn eine Folge von iid-Zufallsvariablen mit Verteilungsfunktion F (x). 1. Bestimmen Sie die Verteilungsfunktion vom X(n) := max{X1 , . . . , Xn }. 2. Bestimmen Sie die Verteilungsfunktion vom X(1) := min{X1 , . . . , Xn }. Hinweis: Was ist P (max{X1 , . . . , Xn } ≤ x)? Aufgabe 2.3 (Computeraufgabe) Erzeugen Sie die folgende Stichproben aus der Standardnormalverteilung N (0, 1) in R: - 100 Stichproben mit Stichprobengröße N1 = 100 - 100 Stichproben mit Stichprobengröße N2 = 1.000 - 100 Stichproben mit Stichprobengröße N3 = 10.000 1. Berechnen Sie den Durchschnitt aller Durchschnitte, d.h. 100 X ¯k = 1 X̄ X̄ik , 100 i=1 mit X̄ik = 1 Nk PNk k j=1 Xij und k = 1, 2, 3. 2. Berechnen Sie den Durchschnitt aller Varianzen, d.h. 100 S̄ 2,k 1 X 2,k = Si , 100 i=1 mit Si2,k = 1 Nk PNk k j=1 (Xij − X̄ik )2 und k = 1, 2, 3. 3. Vergleichen Sie die Ergebnisse vom 1. und 2. mit der Aufgabe 1.3. k und S 2,k , . . . , S 2,k mit k = 2, 3. 4. Erstellen Sie ein Histogramm für die Folgen X̄1k , . . . , X̄100 1 100 Die Computerübung soll an die Übungsleiter gemailt werden. Die Adressen werden in den Richtlinien bekannt gegeben. Abgabe bis Dienstag 07.06.11 8.30 Uhr in die Briefkästen auf F4.