¨Ubung zur Vorlesung Statistik I WS 2013

Werbung
Übung zur Vorlesung Statistik I
WS 2013-2014
Übungsblatt 7
2. Dezember 2013
Aufgabe 21 (2 Punkte):
A
Sei X eine Zufallsvariable, für die Erwartungswert und Varianz existieren.
Zeigen Sie, dass die zugehörige standardisierte Zufallsvariable
X − E(X)
Z= p
Var(X)
Erwartungswert 0 und Varianz 1 hat.
Hinweis: Benutzen Sie die Rechenregeln für Erwartungswert und Varianz
(Begleitfolien zur Vorlesung S. 168-169).
B
X sei das Ergebnis einer Messung und trage die Einheit µm. In welchen
physikalischen Einheiten werden E(X), Var(X) und Z gemessen?
Lösung:
A
(a) Erwartungswert von Z:
!
X − E(X)
1
=p
E(Z) = E p
E (X − E(X)) =
Var(X)
Var(X)
1
= p
(E(X) − E(X)) = 0
Var(X)
(b) Varianz von Z:
Var(Z) = Var
=
B
X − E(X)
p
Var(X)
!
=
1
Var (X − E(X)) =
Var(X)
1
Var(X) = 1
Var(X)
Direkt aus den Definitionsformeln wird klar, dass der Erwartungswert
von X die gleiche Einheit wie X, also µm trägt, die Varianz von X
jedoch in µm2 gemessen wird. Z muss dimensionslos sein (d.h. hat keine
Einheit), da sich die Einheiten herauskürzen.
Aufgabe 22 (4 Punkte): Ein fairer Würfel wird n mal geworfen.
Berechnen Sie mit R für
A
n = 60 und
B
n = 6000
die Wahrscheinlichkeit, dass die Anzahl k der Einser um mehr als 10% vom
Erwartungswert abweicht. Berechnen Sie in A den exakten Wert und benutzen
Sie in B die Näherung des Zentralen Grenzwertsatzes.
Lösung:
A
Bei n = 60 unabhängigen Würfen werden 10 Einser erwartet. Es muss
also die Wahrscheinlichkeit für weniger als 9 oder mehr als 11 Einser
berechnet werden:
> pbinom(8,size=60,prob=1/6)+(1-pbinom(11,size=60,prob=1/6))
[1] 0.6041029
B
Bei n = 6000 unabhängigen Würfen werden 1000 Einser erwartet. Es
muss die Wahrscheinlichkeit für k < 900 oder k > 1100 berechnet werden.
> pnorm((899-1000)/sqrt(6000*1/6*5/6)) +
+ (1-pnorm((1100-1000)/sqrt(6000*1/6*5/6)))
[1] 0.0004997315
Aufgabe 23 (4 Punkte): Sei X ∼ B(n, p) eine binomial verteilte Zufallsvariable, die ein Zufallsexperiment mit n unabhängigen Wiederholungen und
Trefferwahrscheinlichkeit p beschreibt. Sei weiter Z die standardisierte Zufallsvariable zu X. Plotten Sie für
A
n = 11 und p = 0.52
B
n = 11 und p = 0.09
C
n = 1000 und p = 0.52
D
n = 1000 und p = 0.09
die Verteilungsfunktion von Z im Bereich (−4, 4). Zeichnen Sie noch in die vier
Diagramme die Kurve der Verteilungsfunktion der Standardnormalverteilung
ein.
Beurteilen Sie anhand der Graphiken die Approximationsgüte des Zentralen
Grenzwertsatzes und geben Sie eine Rangfolge an.
Hinweis: Die (kumulierte) Verteilungsfunktion F (x) = P(Z ≤ x), x ∈ IR von
Z ist eine Stufenfunktion. Bestimmen Sie zunächst die Position ihrer Unstetigkeitsstellen und dann die Höhe der Stufen. Den Plot einer Stufenfunktion
erhält man mit plot und der Option type=’s’. Die Kurve der Standardnormalverteilung kann mit der Funktion points den schon erstellten Graphiken
beigefügt werden.
Lösung:
A
> n <- 11
> p <- 0.52
Die Verteilungsfunktion der standardisierten Zufallsvariable Z von X ∼
B(n, p) lautet
!
X − np
≤x .
F (x) = P(Z ≤ x) = P p
np(1 − p)
Für xk = √k−np , k = 0, . . . , n gilt
np(1−p)
F (xk ) = P
X − np
k − np
p
≤p
np(1 − p)
np(1 − p)
!
= P(X ≤ k).
Die Verteilungsfunktion für Z nimmt daher bei xk = √k−np , k ∈ IR
np(1−p)
die gleichen Werte an wie die Verteilungsfunktion von X bei k. Deshalb
liegen die Sprungstellen von F bei xk , k = 0, . . . , n und die Sprunghöhen
sind die gleichen wie die der zugehörigen Binomialverteilung.
>
>
>
>
+
x <- (0:n-n*p)/sqrt(n*p*(1-p))
y <- pbinom(0:n, size=n, prob=p)
plot(x=x,y=y, type="s", xlim=c(-4,4), ylim=c(0,1), col="red")
points(x=seq(-4,4,1/1000),y=pnorm(seq(-4,4,1/1000)),
type="l", col="blue")
1.0
0.8
0.6
0.0
0.2
0.4
y
−4
−2
0
2
4
x
B
>
>
>
>
n <- 11
p <- 0.09
x <- (0:n-n*p)/sqrt(n*p*(1-p))
x
[1] -1.04303024 0.01053566
[6] 4.22479927 5.27836517
[11] 9.49262878 10.54619468
1.06410156
6.33193107
2.11766746
7.38549697
3.17123337
8.43906288
Da der kleinste Wert von x größer als −4 ist, muss x um −4 und y um
0 ergänzt werden
>
>
>
>
>
+
x <- c(-4,x)
y <- pbinom(0:n, size=n, prob=p)
y <- c(0,y)
plot(x=x,y=y, type="s", xlim=c(-4,4), ylim=c(0,1), col="red")
points(x=seq(-4,4,1/1000),y=pnorm(seq(-4,4,1/1000)),
type="l", col="blue")
1.0
0.8
0.6
0.0
0.2
0.4
y
−4
−2
0
2
4
x
C
>
>
>
>
>
>
+
n <- 1000
p <- 0.52
x <- (0:n-n*p)/sqrt(n*p*(1-p))
y <- pbinom(0:n, size=n, prob=p)
plot(x=x,y=y, type="s", xlim=c(-4,4), ylim=c(0,1), col="red")
points(x=seq(-4,4,1/1000),y=pnorm(seq(-4,4,1/1000)),
type="l", col="blue")
1.0
0.8
0.6
0.0
0.2
0.4
y
−4
−2
0
2
4
x
D
>
>
>
>
>
>
+
n <- 1000
p <- 0.09
x <- (0:n-n*p)/sqrt(n*p*(1-p))
y <- pbinom(0:n, size=n, prob=p)
plot(x=x,y=y, type="s", xlim=c(-4,4), ylim=c(0,1), col="red")
points(x=seq(-4,4,1/1000),y=pnorm(seq(-4,4,1/1000)),
type="l", col="blue")
1.0
0.8
0.6
0.0
0.2
0.4
y
−4
−2
0
2
4
x
Offensichtlich lautet die Reihenfolge bezüglich der Approximationsgüte (“schlecht“
nach “gut“): Diagramm 2, Diagramm 1, Diagramm 4 und Diagramm 3.
Aufgabe 24 (4 Punkte):
A
In einer Studie wird Heilmittel A an n = 10 Patienten getestet. Man
beobachtet k = 6 Heilungen. Berechnen Sie den P-Wert des einseitigen
Binomialtest für die Nullhypothesen
(a) H0 : p ≤ 0.5 und
(b) H0 : p ≤ 0.3.
B
In einer anderen Studie wird Heilmittel A an n = 100 Patienten getestet.
Wieder beobachtet man eine Heilrate von 60%. Wie lauten die P-Werte
des einseitigen Binomialtests für
(a) H0 : p ≤ 0.5 und
(b) H0 : p ≤ 0.3?
Warum sind die P-Werte in der zweiten Studie kleiner als in der ersten Studie?
Welche der Nullhypothesen können auf den Niveaus α = 0.1, 0.05 bzw. α =
0.001 abgelehnt werden?
Lösung:
A
>
>
>
>
>
n <- 10
k <- 6
P_a <- 1 - pbinom(k-1,n,0.5)
P_b <- 1 - pbinom(k-1,n,0.3)
P_a
[1] 0.3769531
> P_b
[1] 0.04734899
B
>
>
>
>
>
n <- 100
k <- 60
P_a <- 1 - pbinom(k-1,n,0.5)
P_b <- 1 - pbinom(k-1,n,0.3)
P_a
[1] 0.02844397
> P_b
[1] 5.12995e-10
Da die das Verhältnis von Standardabweichung zu Erwartungswert bei
der Binomialverteilung mit n = 100 nur 1/10 so groß ist wie bei der
Binomialverteilung mit n = 10, ist die gleiche prozentuale Abweichung
vom Erwartungswert bei n = 100 viel unwahrscheinlicher als bei n = 10.
Die Nullhypothese H0 : p ≤ 0.5 kann in A auf keinem der drei Niveaus
abgelehnt werden, in B auf den Niveaus α = 0.1 und α = 0.05. Die Nullhypothese H0 : p ≤ 0.3 kann in A nur auf dem 10% und dem 5% Niveau
abgelehnt werden, in B dagegen auf allen drei angegebenen Niveaus.
Schicken Sie Ihre Lösung bis spätestens Sonntag, den 8.12.2013 direkt an
Ihre(n) Tutor(in):
[email protected] (Franziska Metge).
[email protected] (Konrad Neumann)
[email protected] (Ivo Parchero)
Herunterladen