Übungsaufgaben, Statistik 1 6. Übungswoche Kapitel 6: Stetige Verteilungen [ 1 ] In Beispiel 1.7 (siehe auch Kap. 6) wurde für die Zeit X zwischen zwei starken Erdbeben als Modell eine Exponentialverteilung mit dem Parameter λ = 0.04 verwendet. a) Geben Sie den Erwartungswert und die Varianz von X an. b) Berechnen Sie mit Hilfe der Dichtefunktion die Wahrscheinlichkeiten, dass die Zeit zwischen zwei starken Erdbeben i) kleiner als 25, 50 bzw. 75 Tage, ii) größer als 60, 90 bzw. 120 Tage, iii) größer als 25 und kleiner als 50 Tage ist. c) Geben Sie die Verteilungsfunktion an und berechnen Sie die obigen Wahrscheinlichkeiten mit Hilfe der Verteilungsfunktion. d) Geben Sie eine Formel für die Wahrscheinlichkeit an, dass die Zeit zwischen zwei starken Erdbeben größer als t ist und berechnen Sie diese Wahrscheinlichkeiten für t = 30, 60, 100, 200 und 365. e) Wie kann man die obigen Wahrscheinlichkeiten mit R berechnen? f(x) [ 2 ] Die folgende Abbildung zeigt oben die Dichtefunktion und unten die Verteilungsfunktion der Standardnormalverteilung N (0, 1). 0.50 0.45 0.40 0.35 0.30 0.25 0.20 0.15 0.10 0.05 0.00 −4 −3 −2 −1 0 x 1 2 3 4 F(t) Übungsaufgaben, Statistik 2 1.0 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0.0 −4 −3 −2 −1 0 1 2 3 4 t Die folgenden Fragen sollen graphisch gelöst werden. Machen Sie sich immer an der Dichtefunktion deutlich, welche Flächen Sie gerade berechnen bzw. welche Flächen gegeben sind. a) Bestimmen Sie die Wahrscheinlichkeiten i) P (X ≤ a) für a = −2.0, −1.5, −1.0, −0.5, 0, 0.5, 1.0, 1.5, 2.0, 2.5, 3.0. ii) P (X ≥ b) für b = −2, −1, 0, 1, 2. iii) P (X ∈ (a, b]) für (a, b] = (−2, 1], (−1, 2], (−3, 2], (−2, 3], (−2, 2], (−1, 1]. b) Bestimmen Sie k1 , so dass P (X ≤ k1 ) = α für α = 0.05, 0.10 und 0.20. c) Bestimmen Sie k2 , so dass P (X ≥ k2 ) = α für α = 0.05, 0.10 und 0.20. d) Bestimmen Sie k1 und k2 , so dass P (X ≤ k1 ) = P (X ≥ k2 ) = α/2 für α = 0.05, 0.10 und 0.2. Wie groß ist dann P (k1 ≤ X ≤ k2 )? e) Kontrollieren Sie Ihre Ergebnisse mit Hilfe der Tabelle der Standardnormalverteilung aus dem Skript. f) Mit welchen R-Befehlen können Sie die obigen Ergebnisse erhalten? Hinweis: Die Umkehrfunktion der Verteilungsfunktion kann in R mit qnorm berechnet werden. [ 3 ] Die Zufallsvariable X sei binomialverteilt mit den Parametern n = 10 und π = 0.2. Berechnen Sie die folgenden Wahrscheinlichkeiten exakt und mit Hilfe der Approximation durch die Normalverteilung, jeweils mit und ohne Stetigkeitskorrektur. Geben Sie dazu jeweils die entsprechenden R-Befehle an. a) P (X < 2) und P (X > 2) b) P (2 < X ≤ 4) c) Vergleichen Sie die Genauigkeit dieser 2 Normalapproximationen. Übungsaufgaben, Statistik 3 [ 4 ] Rechteckverteilung Welche der folgenden Aussagen sind WAHR? Kreuzen Sie sie an. a) Der Erwartungswert einer Rechteckverteilung im Intervall [a, b] ist genau die Mitte des ( Intervalls [a, b]. ) b) Auch die Varianz einer Rechteckverteilung im Intervall [a, b] liegt im Intervall [a, b]. ( ) c) Es gibt nur drei stetige Verteilungen: die Rechteckverteilung, die Exponentialverteilung ( und die Normalverteilung. ) d) Die Rechteckverteilung hat zwei Parameter a und b und das Intervall [a, b] ist der ( Bereich der möglichen Werte. ) e) Die Verteilungsfunktion einer rechteckverteilten Zufallsvariablen mit den Parametern ( a und b ist im Intervall [a, b] eine Gerade mit der Steigung 1/(b − a). ) f) Die Dichtefunktion der Rechteckverteilung mit Werten im Intervall [a, b] ist über diesem ( Intervall eine waagerechte Gerade y = b−a, d.h. die Dichtefunktion bildet ein Rechteck über [a, b] mit der Höhe b − a. ) g) Für die Rechteckverteilung im Intervall (a,b) gilt: Je größer die Länge des Intervalls, ( desto kleiner ist die Varianz. ) [ 5 ] Exponentialverteilung Welche der folgenden Aussagen sind WAHR? Kreuzen Sie sie an. a) Die Verteilungsfunktion einer Exponentialfunktion ist für x > 0 streng monoton stei- ( gend. ) b) Ist X exponentialverteilt mit dem Parameter λ = 1, so gilt F (t) = e−t . ( ) c) Die Dichtefunktion der Exponentialverteilung ist für x ≥ 0 eine streng monoton fallende ( Funktion mit f (0) = λ. ) d) Ist X eine exponentialverteilte Zufallsvariable mit dem Parameter λ > 0, so gilt immer: ( P (X ∈ [0, 1]) > P (X ∈ [1, 2]). ) e) Für die Verteilungsfunktion einer exponentialverteilten Zufallsvariablen X mit dem ( Parameter λ > 0 gilt: F (t) = 1 − e−λt für −∞ < t < ∞. ) f) Für eine exponentialverteilte Zufallsvariable X mit dem Parameter λ > 0 gilt immer: ( E(X) = Var(X) = 1/λ. ) g) Für die Exponentialverteilung mit dem Parameter λ gilt, je größer der Erwartungswert, ( desto größer ist die Varianz. ) h) Eine exponentialverteilte Zufallsvariable nimmt nur Werte kleiner als λ an. ( ) i) Die Exponentialverteilung tritt häufig im Zusammenhang mit einem Poisson-Prozess ( auf. ) j) Bei einem Poisson-Prozess sind die Zeiten bis zum Eintritt eines Ereignisses exponen- ( tialverteilt. ) Übungsaufgaben, Statistik 4 [ 6 ] Normalverteilung Welche der folgenden Aussagen sind WAHR? Kreuzen Sie sie an. a) Für die Standardnormalverteilung gilt P (−µ < X < µ) ≈ 0.68. ( ) b) Die Dichtefunktion der Normalverteilung ist symmetrisch um x = µ. ( ) c) Für die Standardnormalverteilung gilt P (X ≤ −1) = P (X ≥ 1). ( ) d) Für die Normalverteilung gilt P (X ≤ µ) = 0.5 ( ) e) Für die Normalverteilung gilt, je größer σ 2 , desto schmaler und höher wird die Dichte- ( funktion. ) f) Für die Normalverteilung gilt: Der Parameter µ bestimmt nur die Lage, nicht die ( Gestalt der Dichtefunktion. ) g) Die Verteilungsfunktion einer N (µ; σ 2 )-verteilten Zufallsvariablen hängt nicht von den ( Parametern ab. ) h) Die Normalverteilung wird wegen ihrer komplizierten Dichtefunktion eher selten ver- ( wendet. ) [ 7 ] Approximation von Verteilungen Welche der folgenden Aussagen sind WAHR? Kreuzen Sie sie an. a) Man sollte niemals eine diskrete Verteilung durch eine stetige Verteilung approximieren. ( ) b) Für große λ lässt sich die Poissonverteilung durch eine Normalverteilung approximieren. ( ) c) Wenn X ∼ b(n, π) und die Voraussetzungen für eine Approximation durch die Nor- ( t − nπ . malverteiulung erfüllt sind, so gilt P (X ≤ t) ≈ Φ nπ(1 − π) ) d) Die Approximation der Binomialverteilung durch die Normalverteilung gilt für große ( n und ist genau dann besonders gut, wenn π sehr klein oder sehr groß ist. ) e) Die Approximation der Binomialverteilung durch die Normalverteilung kann durch die ( Stetigkeitskorrektur verbessert werden. ) f) Approximiert man die Binomialverteilung b(n, π) durch die Normalverteilung mit Ste- ( t + 0.5 − µ tigkeitskorrektur, so gilt: P (X ≤ t) ≈ Φ mit µ = nπ und σ 2 = nπ(1−π). σ ) Übungsaufgaben, Statistik 5 Kapitel 7: Modellanpassung und Parameterschätzung [ 1 ] Die Dichtefunktion einer Zufallsvariablen X sei f (x) = αxα−1 0 0<x<1 sonst Dabei ist α > 0 ein Parameter. Z Hinweis: Beachten Sie die Potenzregel der Integration: xa dx = 1 xa+1 a+1 (a 6= −1) Bestimmen Sie den Schätzer von α nach der Methode der Momente. [ 2 ] Histogramm als Schätzer Welche der folgenden Aussagen sind WAHR? Kreuzen Sie sie an. a) Ein Histogramm vermittelt einen Eindruck, wie die zu schätzende Dichtefunktion aus- ( sehen könnte. ) b) Jedes Histogramm hat alle Eigenschaften einer Dichtefunktion. ( ) c) ( ) d) Ein normiertes Histogramm kann verwendet werden, um gewisse Wahrscheinlichkeiten ( zu schätzen. ) e) Die Wahl der Klassen für ein Histogramm und insbesondere die Anzahl der Klassen ist ( unbedeutend für die Güte und damit die Aussagekraft eines Histogramms. ) f) Ein normiertes Histogramm mit 10 Klassen hat 10 freie Parameter. ( ) g) Ein normiertes Histogramm kann als Schätzer der Dichtefunktion aufgefasst werden. ( ) h) Man sollte immer möglichst viele Klassen für ein Histogramm verwenden, denn es gilt: ( Je größer die Anzahl der Klassen, desto genauer ist die Schätzung der Dichtefunktion. ) i) Vergrößert man die Anzahl der Klassen eines Histogramms, so verringert sich der Fehler ( durch Approximation, während der Fehler durch Schätzung steigt. ) j) Der Gesamtfehler bei der Schätzung einer Dichtefunktion durch ein normiertes Hi- ( stogramm setzt sich aus dem Fehler durch Approximation und dem Fehler durch Schätzung zusammen. ) k) Man sollte für ein Histogramm möglicht immer eine hohe Klassenanzahl verwenden, ( da man dann viele Einzelheiten der Stichprobe erkennen kann. ) l) Der Fehler durch Approximation hängt sehr stark von der Stichprobengröße ab. ( ) ( ) n) Der Gesamtfehler sinkt mit steigender Stichprobengröße bei gleicher Anzahl zu ( schätzender Parameter. ) Ein normiertes Histogramm ist nichtnegativ und die Summe aller Flächen ist Eins. m) Je größer meine Stichprobe, desto genauer kann ich schätzen.