Aufgabe 1: (17 Punkte)

Werbung
Aufgabe 1: (17 Punkte)
a) Ränge Ri der yi -Werte:
1
130
30.1
1
i
xi
yi
Ri
2
140
41.9
4
3
150
39.3
3
4
160
32.5
2
5
170
51.7
6
6
180
47.0
5
7
190
58.4
8
8
200
54.4
7
9
230
60.8
9
10
240
63.7
10
11
280
70.2
11
12
290
75.1
12
Der Spearman-Rangkorrelationskoezient ρxy lässt sich mit der folgenden Formel berechnen:
n
X
6
ρxy = 1 −
·
(j − Rj )2 .
n · (n2 − 1) j=1
Hierbei ist
n
X
(j − Rj )2 = (2 − 4)2 + (4 − 2)2 + (5 − 6)2 + (6 − 5)2 + (7 − 8)2 + (8 − 7)2
j=1
= 12.
Also ist der Spearman-Rangkorrelationskoezient
1
ρxy = 1 −
· 12 ≈ 0.9580.
286
b) Empirischer Pearson-Korrelationskoezient rxy :
rxy =
1
n−1
³P
n
j=1
xj · yj − n · x̄ · ȳ
sx · sy
´
=
1
11
(130806 − 12 · 196.67 · 52.09)
≈ 0.9395
52.97 · 14.38
c) Die Parameter a∗ und b∗ in der geschätzten Regressionsgeraden y = a∗ + b∗ x berechnen
sich wie folgt:
sy
14.38
b∗ = rxy ·
≈ 0.9395 ·
≈ 0.2550
sx
52.97
a∗ = ȳ − b∗ · x̄ ≈ 52.09 − 0.2550 · 196.67 ≈ 1.932.
und ein Schätzer für die Varianz σ 2 des Fehlers ist
n−1 2
11
2
σ̂ 2 =
sy (1 − rxy
)≈
· 14.382 · (1 − 0.93952 ) ≈ 26.690.
n−2
10
d) Kondenzbereich für b zur Kondenzwahrscheinlichkeit 1−α = 0.95: Zunächst benötigt
man das 1 − α/2-Quantil der tn−2 -Verteilung:
tn−2,1−α/2 = t10,0.975 ≈ 2.23
(Tabelle A.2).
Die untere Grenze des Kondenzbereichs für b ist (S. 188, wobei gemäÿ der Schreibweise
im Skript der Schätzer für b jetzt mit b̂ statt mit b∗ bezeichnet wird):
√
σ̂ · tn−2,1−α/2
26.690 · 2.23
b̂ − √
≈ 0.2550 − √
≈ 0.2550 − 0.0628 ≈ 0.1922.
n · sx
12 · 52.97
Die obere Grenze des Kondenzbereichs für b ist:
σ̂ · tn−2,1−α/2
≈ 0.2550 + 0.0628 ≈ 0.3263.
b̂ + √
n · sx
Der gesuchte Kondenzbereich ist also [0.1922, 0.3263].
Aufgabe 2: (15 Punkte)
X1 , . . . , X5 Niederschlagsmengen in den nächsten fünf Jahren, wobei diese Zufallsvariablen
X1 , . . . , X5 die Verteilung N (805, 16900) besitzen.
a) Wahrscheinlichkeit, dass im nächsten Jahr mehr als 1000 mm Niederschlag fallen:
X1 − 805
1000 − 805
)
P (X1 > 1000) = P ( √
> √
16900
16900
|
{z
}
=:Y ∼N (0,1)
= P (Y > 1.5) = 1 − Φ(1.5) ≈ 1 − 0.9332 (Tabelle A.1)
= 0.0668 = 6.68%
b) Wahrscheinlichkeit, dass in den nächsten fünf Jahren mindestens einmal eine Niederschlagsmenge von mehr als 1000 mm auftritt:
P (Mindestens ein Xi > 1000, i = 1, 2, 3, 4, 5 )
= 1 − P (Alle Xi ≤ 1000, i = 1, 2, 3, 4, 5 )
= 1 − P (X1 ≤ 1000, X2 ≤ 1000, . . . , X5 ≤ 1000)
= 1 − P (X1 ≤ 1000) · P (X2 ≤ 1000) · · · P (X5 ≤ 1000) (Unabhängigkeit)
= 1 − P (X1 ≤ 1000)5 (Identische Verteilung von X1 , . . . , X5 )
≈ 1 − 0.93325 ≈ 0.2923 = 29.23%
c) Wahrscheinlichkeit, dass die Gesamtniederschlagsmenge in den nächsten fünf Jahren
höchstens 4700 mm beträgt: Sei Z := X1 + X2 + . . . + X5 . Nach der Faltungsformel für
Normalverteilungen hat Z eine N (5 · 805, 5 · 16900)-Verteilung (also N (4025, 84500)).
Daher gilt
4700 − 4025
Z − 4025
> √
)
P (Z ≤ 4700) = P ( √
84500
84500
|
{z
}
=:Y ∼N (0,1)
= P (Y < 2.3221) ≈ Φ(2.32) ≈ 0.9898 (Tabelle A.1)
= 98.98%.
Aufgabe 3: (15 Punkte)
a) Gemeinsame Verteilung von X1 und Y :
P (X1
P (X1
P (X1
P (X1
= 0, Y
= 0, Y
= 1, Y
= 1, Y
= 0)
= 1)
= 0)
= 1)
=
=
=
=
P (X1
P (X1
P (X1
P (X1
= 0, X2
= 0, X2
= 1, X2
= 1, X2
= 1) = P (X1
= 0) = P (X1
= 0) = P (X1
= 1) = P (X1
= 0) · P (X2
= 0) · P (X2
= 1) · P (X2
= 1) · P (X2
= 1) = 0.5 · 0.5 = 0.25,
= 0) = 0.5 · 0.5 = 0.25,
= 0) = 0.5 · 0.5 = 0.25,
= 1) = 0.5 · 0.5 = 0.25.
Randverteilungen von X1 und Y :
P (X1 = 0) = P (X1 = 1) = 0.5,
P (Y = 0) = P (X1 = 0, Y = 0) + P (X1 = 1, Y = 0) = 0.25 + 0.25 = 0.5,
P (Y = 1) = P (X1 = 0, Y = 1) + P (X1 = 1, Y = 1) = 0.25 + 0.25 = 0.5.
Eingetragen in die Tabelle:
P (X1 = j, Y = k)
k=0
k=1
P (X1 = j)
j=0
0.25
0.25
0.5
j=1
0.25
0.25
0.5
P (Y = k)
0.5
0.5
1
b) Erwartungswerte:
E(X1 ) = 0 · P (X1 = 0) + 1 · P (X1 = 1) = 0.5,
E(Y ) = 0 · P (Y = 0) + 1 · P (Y = 1) = 0.5.
Korrelationskoezienten ρ(X1 , Y ):
E(X1 · Y ) = 0 · 0 · P (X1 = 0, Y = 0) + 1 · 0 . . . + 0 · 1 . . . + 1 · 1 · P (X1 = 1, Y = 1) = 0.25
und damit
ρ(X1 , Y ) =
E(X1 · Y ) − E(X1 ) · E(Y )
q
V (X1 ) · V (Y )
0.25 − 0.5 · 0.5
=q
= 0.
V (X1 ) · V (Y )
c) X1 und Y sind stochastisch unabhängig, da für beliebige j ∈ {0, 1} und beliebige
k ∈ {0, 1} gilt
P (X1 = j, Y = k) = 0.25 = 0.5 · 0.5 = P (X1 = j) · P (Y = k),
siehe obige Tabelle.
Aufgabe 4: (18 Punkte)
a) Es ist die Hypothese
H0 : µ = ν
zu testen gegen
H1 : µ 6= ν.
Hier ist der zweiseitige Zwei-Stichproben-t-Test zu verwenden. Für die Prüfgröÿe benötigt man die Mittelwerte und empirischen Varianzen:
x̄ =
n
1X
xi ≈ 1.74545,
n i=1
Ã
s2x
!
n
X
1
=
x2 − n · x̄2 ≈ 0.63273,
n − 1 i=1 i
ȳ =
m
1 X
yj ≈ 2.12727,
m j=1

s2y

m
1 X
y 2 − m · ȳ 2  ≈ 0.62618.
=
m − 1 j=1 j
Die Teststatistik ist
q
T =q
1
((n
m+n−2
mn
(x̄
m+n
q
− ȳ)
− 1)s2x + (m − 1)s2y )
11
≈ q2
(1.74545 − 2.12727)
1
(0.63273
2
+ 0.62618)
≈ −1.129.
Der kritische Wert ist nach Tabelle A.2
tm+n−2,1−α/2 = t20,0.975 ≈ 2.09.
Wegen |T | < tm+n−2,1−α/2 lehnt der Test H0 nicht ab.
b) Hier ist der Mann-Whitney-U -Test geeignet. Zunächst ist die Summe der Ränge der
xi in der gemeinsamen Stichprobe aller 22 Daten. Es ergibt sich
W = 1 + 2 + 5 + 6 + 8.5 + 8.5 + 10 + 14 + 15 + 18 + 20 = 108.
Die Teststatistik ist
U =W−
n(n + 1)
= 108 − 66 = 42.
2
Die kritischen Werte sind
Um,n,1−α/2 = U11,11,0.975 = 91 (Tabelle A.7),
m · n − Um,n,1−α/2 = 121 − 91 = 30.
Da weder U ≥ Um,n,1−α/2 noch U ≤ m · n − Um,n,1−α/2 gilt, kann H0 nicht abgelehnt
werden.
Aufgabe 5: (14 Punkte)
a) Die Hypothese ist
H0 : p ≤ p0 ,
die Alternative ist als
H1 : p > p 0
mit p0 = 0.7 zu wählen. Wenn der Test die Hypothese ablehnt, hat der Hersteller seine
Behauptung statistisch nachgewiesen (zum Signikanzniveau α).
b) Die Prüfgröÿe ist Sn = S100 . Die Hypothese H0 , dass weniger als 70 % der Patienten
geheilt werden, wird abgelehnt, falls S100 groÿ genug ist, d.h. falls S100 ≥ k̃ . Wegen
P0.7 (S100 ≥ 78) = 1 − P0.7 (S100 ≤ 77) = 0.048 = 4.8% ≤ 5% ist k̃ = 78 der kritische
Wert für den Test.
c) pWert: P0.7 (S100 ≥ 76) = 1 − P0.7 (S100 ≤ 75) = 1 − 0.886 = 0.114 = 11.4%.
Aufgabe 6: (11 Punkte)
Es gibt s = 5 mögliche Ausgänge bei der Beobachtung einer Familie (0, 1, 2, 3 oder 4
Mädchen). Die Hypothese
H0 : p0 =
1
,
16
1
p1 = ,
4
3
p2 = ,
8
1
p3 = ,
4
p4 =
1
16
wird mit dem χ2 -Anpassungstest getestet. Die Prüfgröÿe ist
X n2j
1 s−1
1
T =
−n=
n j=0 qj
500
Der kritische Wert ist
Ã
!
362
1302 1922 1152
272
− 500 = 2.408.
+
+
+
+
1/16
1/4
3/8
1/4
1/16
χ2s−1,1−α = χ24,0.95 ≈ 9.49.
Wegen T < χ2s−1,1−α lehnt der χ2 -Anpassungstest die Hypothese H0 nicht ab.
Herunterladen