Prüfungsausarbeitung Statistik und Wahrscheinlichkeitstheorie

Werbung
Prüfungsausarbeitung
Statistik und Wahrscheinlichkeitstheorie
Wintersemester 2014/15
helmi77
4. Mai 2015
Inhaltsverzeichnis
Musterprüfung
Aufgabe 1 . .
Aufgabe 2 . .
Aufgabe 3 . .
Aufgabe 4 . .
Aufgabe 5 . .
Aufgabe 6 . .
Aufgabe 7 . .
Aufgabe 8 . .
.
.
.
.
.
.
.
.
2
2
3
4
6
7
8
10
11
Prof. Gurker (28/01/2015)
Aufgabe 6 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Aufgabe 7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Aufgabe 8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12
12
14
15
Prof. Gurker (11/03/2015)
Aufgabe 1 . . . . . . . . . .
Aufgabe 2 . . . . . . . . . .
Aufgabe 3 . . . . . . . . . .
Aufgabe 4 . . . . . . . . . .
Aufgabe 5 . . . . . . . . . .
Aufgabe 6 . . . . . . . . . .
Aufgabe 7 . . . . . . . . . .
Aufgabe 8 . . . . . . . . . .
16
16
17
18
19
20
21
23
24
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
1
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Musterprüfung
Aufgabe 1
Die folgenden Daten sind Beobachtungen einer stochastischen Größe:
-0.42, -1.27, 0.79, 1.42, 0.58, 0.61, -1.06, -1.69, 2.07, 1.18
0.0
0.2
0.4
Fn(x)
0.6
0.8
1.0
(a) Zeichnen Sie die empirische Verteilungsfunktion Fb.
−2
−1
0
1
2
x
(b) Bestimmen Sie x, S 2 und S.
n
1X
x=
xi
n
(1)
x = 0.221
(2)
i=1
2
n
S2 =
1 X
(xi − x)2
n−1
(3)
i=1
S 2 = 1.589654̇
(4)
√
S2
p
S = 1.589654̇
(5)
S ≈ 1.261
(7)
S=
(6)
(c) Bestimmen Sie den Median und die Hinges.
-1.69, -1.27, -1.06, -0.42, 0.58, 0.61, 0.79, 1.18, 1.42, 2.07
(
x
n ungerade
x
e = 1 ((n+1)/2)
n gerade
2 x(n/2) + x((n+1)/2)
1
x
e = (0.58 + 0.61)
2
x
e = 0.595
(8)
(9)
(10)
x0.25 = min{x ∈ R : Fbn (x) ≥ 0.25}
(11)
x0.25 = −1.06
(12)
x0.75 = min{x ∈ R : Fbn (x) ≥ 0.75}
(13)
x0.75 = 1.18
(14)
(d) Bestimmen Sie das 0.8-Quantil (Typ 2).
1
x0.8 = (x(8) + x(9) )
2
1
x0.8 = (1.18 + 1.42)
2
x0.8 = 1.3
(15)
(16)
(17)
Anmerkung: Bei Typ 2 wird im Falle einer Unstetigkeit gemittelt. Im obigen Beispiel tritt
dieser Fall ein, da die Stelle y = 0.8 unstetig ist (siehe Abbildung oben), daher wird das
Mittel der beiden fraglichen Werte (1.18 und 1.42) als 0.8-Quantil gewählt.
Aufgabe 2
Ein für eine Krankheit entwickelter Bluttest zeigt in 99.5% der Fälle das korrekte Ergebnis, bei
Erkrankten und bei nicht Erkrankten. Weiter ist bekannt, dass ca. 0.2% der Bevölkerung diese
Krankheit hat.
(a) Mit welcher Wahrscheinlichkeit ist bei einer zufällig ausgewählten Person der Test positiv?
X . . . Test einer zufällig ausgewählten Person ist positiv
(18)
P (X) = (0.002 ∗ 0.995) + (0.998 ∗ 0.005)
(19)
P (X) = 0.00698
(20)
3
0.002
0.998
¬krank
krank
0.995
0.005
0.005
0.995
positiv
negativ
positiv
negativ
(b) Mit welcher Wahrscheinlichkeit ist eine zufällig ausgewählte Person, deren Test positiv ist,
tatsächlich erkrankt?
X . . . Person ist krank
(21)
Y . . . Test ist positiv
P (Y | X)P (X)
P (X | Y ) =
P (Y )
0.995 ∗ 0.002
P (X | Y ) =
0.00698
P (X | Y ) ≈ 0.285
(22)
(23)
(24)
(25)
(c) Geben Sie eine Erklärung für die (unerwartet?) kleine Wahrscheinlichkeit von (b).
Die kleine Wahrscheinlichkeit könnte sich dadurch erklären, dass nur ein sehr kleiner Teil
der Bevölkerung wirklich von der Krankheit betroffen ist.
(d) Wie lautet für (b) die Odds–Form der Bayes’schen Formel?
P (H) P (A | H)
P (H | A)
=
×
P (H | A)
P (H) P (A | H)
P (X | Y )
P (X) P (Y | X)
=
×
P (X | Y )
P (X) P (Y | X)
0.285
0.002 0.995
≈
×
0.715
0.998 0.005
0.399 ≈ 0.399
Aufgabe 3
Die Dichte der sG X sei gegeben wie folgt:
(
4e−4(x−1)
f (x) =
0
4
wenn x ≥ 1
wenn x < 1
(26)
(27)
(28)
(29)
(a) Bestimmen Sie den Erwartungswert von X.
Z ∞
xf (x)dx
E(X) =
Z−∞
∞
x4e−4(x−1) dx
E(X) =
Z1 ∞
E(X) =
x4e−4x e4 dx
1
Z ∞
4
xe−4x dx
E(X) = 4e
1
Z
Z
0
f (x)g(x)dx = f (x)g(x) − f (x)g 0 (x)dx
Z ∞
Z ∞
1 −4x ∞
1
−4x
xe dx = − e x −
− e−4x dx
4
4
1
1
1∞ Z ∞
1 −4x 1 −4x ∞
−4x
xe dx = − e x −
e
4
16
1
1
1
Z ∞
1 −4
1 −4
5 −4
−4x
xe dx = e + e = e
4
16
16
1
5
5
E(X) = 4e4 e−4 =
16
4
(b) Bestimmen Sie die Verteilungsfunktion von X (plus Skizze).
Z
F (x) = f (x)dx
Z
F (x) = 4e−4(x−1) dx
Z
F (x) = 4e−4x e4 dx
Z
F (x) = 4e4 e−4x dx
−1 −4x
e
+c
4
F (x) = −e4−4x + c
F (x) = 4e4
0
F (1) = 0 ⇔ −e + c = 0 ⇔ c = 1
(
−e4−4x + 1 wenn x ≥ 1
F (x) =
0
wenn x < 1
(30)
(31)
(32)
(33)
(34)
(35)
(36)
(37)
(38)
(39)
(40)
(41)
(42)
(43)
(44)
(45)
(46)
(c) Wie kann man mit Hilfe eines uniformen Zufallszahlengenerators Realisationen von X ∼ f
erzeugen?
X := F −1 (U )
P (X ≤ x) = F (x)
(48)
(U ) ≤ x) = F (x)
(49)
(U ) ≤ F (x)) = F (x)
(50)
P (U ≤ F (x)) = F (x)
(51)
P (F
P (F ◦ F
−1
(47)
−1
5
1.0
0.8
0.6
0.0
0.2
0.4
y
0
1
2
3
4
x
Aufgabe 4
Die Dichte der sG X sei gegeben durch:
(
x2 /9
f (x) =
0
wenn 0 < x < 3
sonst
Betrachten Sie die Transformation Y = X 2 .
(a) Wie lautet die Jacobian?
J=
dg −1 (y)
dx
=
=
dy
dy
1
dg(x)
dx
Y = X 2 ⇒ g(x) = x2
√
g −1 (y) = y
dg −1 (y)
dy
1
= √ =J
2 y
(b) Bestimmen Sie mittels Transformationssatz die Dichte von Y .
−1 dg (y) −1
fY (y) = fX (g (y)) dy √ 2
√
y
y
1
fY (y) =
√ =
9 2 y
18
6
(52)
(53)
(54)
(55)
(56)
(57)
(c) Berechnen Sie - nach Definition und mittels LotUS - den Erwartungswert von Y .
Z ∞
xf (x)dx (Definition)
E(X) =
−∞
Z 32
√
Z 32 3
y
y2
y
E(Y ) =
dy =
dy
18
18
0
0
! 2
5
y 2 3
35
E(Y ) =
=
45 0
45
Z ∞
g(y)fX (y)dy (LotUS)
E(Y ) =
E(Y ) =
−∞
Z 3 4
y
0
(58)
9
dy =
35
y 5 3
=
45 0 45
(59)
(60)
(61)
(62)
Aufgabe 5
Die Lebensdauern von drei in Serie geschalteten Komponenten seien unabhängige Exponentialverteilungen mit λ1 = 0.003, λ2 = 0.010 und λ3 = 0.008. Bestimmen Sie für die Lebensdauer
X des Seriensystems:
(a) die Verteilungsfunktion.
X1 ,X2 , X3 unabhängig
(63)
Xi ∼ Fi (x), i = 1(1)3
(64)
X = min{X1 , X2 , X3 }
(65)
FX (x) = P (X ≤ x)
(66)
= P (min{X1 , X2 , X3 } ≤ x)
(67)
= 1 − P (min{X1 , X2 , X3 } > x)
(68)
= 1 − P (X1 > x, X2 > x, X3 > x)
(69)
= 1 − P (X1 > x)P (X2 > x)P (X3 > x)
(70)
= 1 − (1 − P (X1 ≤ x))(1 − P (X2 ≤ x))(1 − P (X3 ≤ x))
(71)
=1−
=1−
3
Y
(1 − P (Xi ≤ x))
(72)
i=1
3
Y
(1 − Fi (x))
(73)
i=1
−λi x
Fi (x) = 1 − e
FX (x) = 1 −
(74)
3
Y
3
Y
i=1
P
− 3i=1 λi x
i=1
(1 − (1 − e−λi x )) = 1 −
FX (x) = 1 − e
e−λi x
(75)
(76)
Anmerkung: In Schritt 69 wird der Umstand ausgenutzt, dass sämtliche sGs grösser oder
gleich x sein müssen, sobald das Minimum grösser oder gleich x ist. In Schritt 70 wird
weiters die Unabhängigkeit der sGs X1 , X2 , X3 verwendet.
7
(b) die Dichte. (Um welche Verteilung handelt es sich?)
fX (x) =
3
X
λi e−
P3
i=1
λi x
(77)
i=1
Es handelt sich erneut um eine Exponentialverteilung.
(c) den Erwartungswert, die Varianz und die Streuung.
1
1
1
=
=
λ
λ1 + λ2 + λ3
0.021
1
1
2
σ = 2 =
λ
0.000441
E(X) = σ =
(78)
(79)
(d) den Median und das 90%-Quantil.
F (x0.5 ) = 0.5
(80)
1 − e−λx0.5 = 0.5
(81)
−e
−λx0.5
= −0.5
(82)
−λx0.5 = ln(0.5)
− ln(0.5)
x0.5 =
λ
x0.5 ≈ 33
(83)
F (x0.9 ) = 0.9
− ln(0.1)
x0.9 =
λ
x0.9 ≈ 109.65
(86)
Aufgabe 6
Die Dichte der stochastischen Grösse X sei gegeben wie folgt:
f (x; θ) = θxθ−1 I(0,1) (x) für θ > 0
Für n unabhängige Beobachtungen x1 , x2 , . . . , xn von X:
8
(84)
(85)
(87)
(88)
(a) Bestimmen Sie die (Log-) Likelihoodfunktion.
L(θ) =
n
Y
f (xi ; θ) =
i=1
n
Y
θxθ−1
I(0,1) (xi ) = θn
i
i=1
ln(L(θ)) = l(θ) = ln θn
n
Y
n
Y
xθ−1
i
(89)
i=1
!
xθ−1
i
(90)
i=1
n
Y
!
xθ−1
i
(91)
ln(xθ−1
)
i
(92)
(θ − 1) ln(xi )
(93)
= ln(θn ) + ln
i=1
= n ln(θ) +
= n ln(θ) +
n
X
i=1
n
X
i=1
= n ln(θ) + (θ − 1)
n
X
ln(xi )
(94)
i=1
(b) Bestimmen Sie den ML-Schätzer von θ.
n
n X
dl(θ)
= +
ln(xi )
dθ
θ
i=1
n
X
=n+θ
ln(xi )
(95)
(96)
i=1
n+θ
θ
n
X
i=1
n
X
dl(θ)
=0
dθ
(97)
ln(xi ) = 0
(98)
ln(xi ) = −n
(99)
i=1
−n
θb = Pn
i=1 ln(xi )
(100)
(c) Bestimmen Sie auf Basis der folgenden fünf Beobachtungen den ML-Schätzwert von θ.
0.34, 0.58, 0.80, 0.32, 0.83
θb =
−5
≈ 1.576
ln(0.34) + ln(0.58) + ln(0.80) + ln(0.32) + ln(0.83)
(101)
(d) Bestimmen Sie auf Basis der Beobachtungen (c) den ML-Schätzwert für den Mittelwert
E(X) von X. (Hinweis: Invarianz; vgl. Skriptum S 260.)
9
Z 1
xθxθ−1 dx = θ
xθ dx
0
0
θ+1 1
x
= θ
=θ
θ + 1 0 θ + 1
θ
g(θ) =
θ+1
b
d = g(θ)
b = θ
g(θ)
(Invarianz)
θb + 1
Z
1
E(X) =
b =
g(θ)
Pn −n
i=1 ln(xi )
−n
Pn
+
i=1 ln(xi )
=
1
Pn
(102)
(103)
(104)
(105)
Pn −n
i=1 ln(xi )
Pn
−n+
Pn i=1 ln(xi )
i=1 ln(xi )
(106)
−n i=1 ln(xi )
Pn
i=1 ln(xi ))
i=1 ln(xi )(−n +
n
P
=
n − ni=1 ln(xi )
5
b =
g(θ)
5 − (ln(0.34) + ln(0.58) + ln(0.80) + ln(0.32) + ln(0.83))
b ≈ 0.6118
g(θ)
= Pn
(107)
(108)
(109)
(110)
Aufgabe 7
Zwölf Personen werden dazu aufgefordert, eine bestimmte Aufgabe nach zwei Methoden zu
erledigen, wobei die dazu benötigte Zeit (in Minuten) gemessen wird. Die Ergebnisse sind wie
folgt:
Person
1
2
3
4
5
6
Zeit (min)
Methode 1 Methode 2
17
18
16
14
21
19
14
11
18
23
24
21
Diff.
-1
2
2
3
5
3
Person
7
8
9
10
11
12
Zeit (min)
Methode 1 Methode 2
16
10
14
13
21
19
23
24
13
15
18
20
Diff.
6
1
2
-1
-2
-2
Man kann davon ausgehen, dass die Beobachtungen aus einer (bivariaten) Normalverteilung
stammen. (Hinweis: Beachten Sie, dass es sich um verbundene Stichproben handelt, betrachten
Sie die Differenzen der Beobachtungen; vgl. Skriptum 7.3.5.)
10
(a) Bestimmen Sie ein 95%-Konfidenzintervall für die Differenz µd = µ1 −µ2 der Ausführungszeiten.
n
Xn =
1X
xi
n
(111)
i=1
2
Xn =
3
(112)
n
Sn2 =
1 X
(xi − X n )2
n−1
(113)
i=1
290
33
p
Sn = Sn2
Sn2 =
KI :
KI :
Sn
Sn
X n − tn−1;1−α/2 √ , X n + tn−1;1−α/2 √
n
n
!
r
r
2
290 2
290
− t11;0.975
, + t11;0.975
3
396 3
396
(114)
(115)
KI : (−1.217, 2.550)
(116)
(117)
(118)
(b) Lässt sich die Behauptung vertreten, dass Methode 2 schneller zum Ziel führt? Testen Sie
dazu (mit α = 5%) H0 : µd = 0 gegen H1 : µd > 0. (Vgl. Skriptum 7.4.5.)
H0 : µd = µ0 = 0
X n − µ0
√
Sn / n
Xn
√
T0 =
Sn / n
√
2 198
≈ 0.779
T0 = √
3 145
T0 =
(119)
(120)
(121)
(122)
H1 : µd > 0 =⇒ H0 verwerfen, falls T0 > tn−1;1−α
t11;0.95 = 1.796
T0 < t11;0.95
(123)
(124)
Folgerung: H0 hält Stand.
Aufgabe 8
Ein Hemdenhersteller behauptet, dass 91% der Produkte beste“ Qualität (1. Klasse) sind, 8%
”
sind zweite Wahl“ (2. Klasse) und nur 1% sind Ausschuss (3. Klasse). Um diese Behauptung
”
zu testen, werden 500 Hemden zufällig ausgewählt und geprüft, mit dem folgenden Ergebnis:
434 beste Qualität, 48 zweite Wahl und 18 Ausschuss
11
(a) Lässt sich die Behauptung des Herstellers auf dem Niveau α = 5% verwerfen? (Hinweis:
χ2 –Anpassungstest)
Klasse
1
2
3
Summe
Xi
434
48
18
500
pi0
0.91
0.08
0.01
1
npi0
455
40
5
500
(Xi − npi0 )2 /npi0
0.969
1.6
33.8
36.369
H0 verwerfen, falls Qk−1 > χ2k−1;1−α
Qk−1 =
k
X
(Xi − npi0 )2
i=1
npi0
Q2 = 36.369
χ22;0.95 = 5.991
Q2 >
χ22;0.95
(125)
(126)
(127)
(128)
Folgerung: H0 wird verworfen.
(b) Wie lautet ein passender R–Code zum obigen Test?
(c) Der p–Wert des obigen Tests beträgt 1.266e-08. Was bedeutet dieser Wert? Wie wird er
berechnet?
(i) Der p-Wert einer H0 ist der grösste Wert von α, für den die H0 nicht verworfen wird.
(ii) Berechnung
p-Wert = P (χ2 (k − 1) ≥ Qk−1 )
γ(k/2, x/2)
F (x; k) =
Γ(k/2)
Z ∞
Γ(t) =
xt−1 e−x dx
(129)
(130)
(131)
0
Γ(n) = (n − 1)! ∀n > 0
Z x
γ(s, x) =
ts−1 e−t dt
(132)
(133)
0
γ(1, 18.185)
Γ(1)
−8
p-Wert = 1.26640 . . . × 10
p-Wert = F (36.369, 2) =
(134)
(135)
Prof. Gurker (28/01/2015)
Aufgabe 6
Die folgende Tabelle ist die Zusammenfassung einer Stichprobe der Grösse n = 60 von X ∼ P (λ)
(Poisson-Verteilung):
12
x
Häufigkeit
0
1
1
6
2
10
3
24
4
9
5
8
6
2
(a) Bestimmen Sie den Momentschätzwert von λ.
n
E(X) =
1X
Xi
n
(136)
i=1
b = E(X) = 186 = 31
λ
60
10
(137)
(b) Bestimmen Sie den ML-Schätzwert von λ (mit Herleitung).
λk e−λ
k!
n
Y
L(λ) =
f (xi ; λ)
f (k; λ) =
(138)
(139)
i=1
n
Y
λxi e−λ
xi !
i=1
xi −λ n
X
λ e
l(λ) =
ln
xi !
L(λ) =
l(λ) =
i=1
n X
(140)
(141)
ln(λxi e−λ ) − ln(xi !)
(142)
ln(λxi ) + ln(e−λ ) − ln(xi !)
(143)
i=1
l(λ) =
n X
i=1
l(λ) =
n
X
(xi ln(λ) − λ − ln(xi !))
(144)
i=1
l0 (λ) =
n X
xi
λ
i=1
0
l (λ) = 0 ⇔
−1
n X
xi
i=1
λ
−1 =0
n
n
i=1
i=1
1X
1X
xi − n = 0 ⇔ λ =
xi
λ
n
(145)
(146)
(147)
n
X
b= 1
λ
xi
n
i=1
13
(148)
(c) Sind die beiden obigen Schätzer erwartungstreu und konsistent? Warum?
?
Eθ (θbn ) = θ
(Erwartungstreue)
!
n
X
1
b =E
E(λ)
xi
n
i=1
!
n
X
1
= E
xi
n
(149)
(150)
(151)
i=1
n
1X
E(xi )
n
(152)
n
1X
=
λ=λ
n
(153)
=
i=1
i=1
b =λ E(λ)
n
1X
P
Xi −→ E(X)
n
(154)
(GGZ)
(155)
i=1
P
θbn −→ θ (Konsistenz)
n
X
b= 1
λ
xi
n
(156)
(157)
i=1
P
b −→
λ
λ
(158)
Aufgabe 7
Aus einem Produktionslos werden n = 1000 Glühlampen zufällig ausgewählt und auf ihre
Funktionsfähigkeit überprüft. Dabei stellt man fest, dass 19 Lampen defekt sind.
(a) Wie lautet der (ML-) Schätzwert für den Defektanteil p?
n
1X
pb = X n =
Xi
n
(Bernoulli Vert.)
(159)
i=1
Xn =
19
= 0.019
1000
(160)
(b) Bestimmen Sie ein 95%-Konfidenzintervall für den Defektanteil p. (Hinweis: Nehmen Sie
das Standardintervall.)
r
pb(1 − pb)
pb ± z1−α/2
(161)
n
z0.975 = 1.960
(162)
KI : pb ± 0.00846
(163)
KI : (0.0105, 0.0275)
(164)
(c) Lässt sich behaupten, dass der Defektanteil grösser als 1.5% ist? Testen Sie dazu (mit
α = 5%) H0 : p = 0.015 gegen H1 : p > 0.015. (Hinweis: Nehmen Sie den approximativen
14
Test für grosse Stichproben; vgl. Skriptum S 303.)
Y =
n
X
Xi ≈ N (np, np(1 − p))
(165)
i=1
Y − np0
Z0 = p
np0 (1 − p0 )
(Teststatistik)
(166)
H0 : p = 0.015 gegen H1 : p > 0.015
(167)
H0 verwerfen, falls Z0 > z1−α
(168)
Z0 = 1.041 und z0.95 = 1.6449
(169)
Z0 6> z0.95 ⇒ H0 hält stand
(170)
(d) Der exakte p-Wert des Tests von (c) ist 0.1789. Was bedeutet dieser Wert? Wie wird er
berechnet?
(i) Der p-Wert einer H0 ist der grösste Wert von α, für den die H0 nicht verworfen wird.
(ii) Berechnung
Aufgabe 8
Für zwei Typen von Batterien ergaben sich die folgenden Kapazitäten (in Ah):
Typ 1: 158, 162, 134, 135, 155, 146, 156
Typ 2: 208, 207, 212, 206, 211, 187, 199
Die Daten stammen aus unabhängigen Normalverteilungen: N (µ1 , σ12 ), N (µ2 , σ22 )
(a) Bestimmen Sie Schätzwerte für die Parameter.
n
1X
X=
Xi
n
(171)
i=1
1046
7
1430
Y =
7
n
1 X
S2 =
(Xi − X)2
n−1
X=
(172)
(173)
(174)
i=1
891
7
1594
2
SY =
21
2
SX
=
(175)
(176)
(b) Ermitteln Sie – unter der Voraussetzung σ12 = σ22 – ein 95% Konfidenzintervall für die
15
Differenz ∆ = µ2 − µ1 der mittleren Kapazitäten.
r
1
1
+
m n
2
(m − 1)SX + (n − 1)SY2
Sp2 =
m+n−2
4267
Sp2 =
42
t12;0.975 = 2.179
X − Y ± tm+n−2;1−α/2 Sp
(177)
(178)
(179)
(180)
X − Y ± 11.74
(181)
KI : (−66.597, −43.117)
(182)
(c) Wie lauten für (b) die Standard R-Commands?
> x = c(158, 162, 134, 135, 155, 146, 156)
> y = c(208, 207, 212, 206, 211, 187, 199)
> t.test(x,y,var.equal=TRUE)$conf.int
[1] -66.59591 -43.11837
attr(,"conf.level")
[1] 0.95
Prof. Gurker (11/03/2015)
Aufgabe 1
Die folgenden (bereits geordneten) Daten sind Ausfallzeiten von n = 25 Komponenten:
28.8
90.3
113.0
44.2
91.9
119.6
58.4
92.4
120.9
66.0
94.2
129.5
74.3
98.9
140.9
78.5
99.2
81.8
103.5
83.1
105.1
85.7
108.4
89.8
108.7
(a) Bestimmen und zeichnen Sie das Histogramm der relativen Häufigkeiten auf Basis der Klasseneinteilung: [20, 40], (40, 60], . . . , (140, 160].
P
P 2
(b) Bestimmen Sie x, s2 und s. (Hinweis:
xi = 2307.1 und
xi = 228508.2)
n
x=
1X
2307.1
= 92.284
xi =
n
25
(183)
i=1
n
n
1 X
1 X 2
(xi − x)2 =
xi − 2xxi + x2
n−1
n−1
i=1
i=1
!
n
n
X
X
1
2
2
xi − 2x
=
xi + nx
= 649.99
n−1
i=1
i=1
√
2
s = s = 25.495
s2 =
(184)
(185)
(186)
(c) Bestimmen Sie das 0.8-Quantil (Typ 1 oder 2).
x0.8 = x(20) = 108.7
16
(187)
0.010
0.000
0.005
Häufigkeit
0.015
0.020
Histogramm
20
40
60
80
100
120
140
160
Wert
Aufgabe 2
Die folgenden (bereits geordneten) Daten sind Ausfallzeiten von n = 25 Komponenten:
28.8
90.3
113.0
44.2
91.9
119.6
58.4
92.4
120.9
66.0
94.2
129.5
74.3
98.9
140.9
78.5
99.2
81.8
103.5
83.1
105.1
85.7
108.4
89.8
108.7
(a) Bestimmen Sie den Median und die Hinges.
x0.5 = x((n+1)/2) = x(13) = 92.4
(188)
x0.25 = x(7) = 81.8
(189)
x0.75 = x(19) = 108.4
(190)
(b) Bestimmen Sie die Fences (Skriptum S. 27)
LF = Q1 − 1.5(Q3 − Q1 ) = x0.25 − 1.5(x0.75 − x0.25 ) = 41.9
(191)
UF = Q3 + 1.5(Q3 − Q1 ) = x0.75 + 1.5(x0.75 − x0.25 ) = 148.3
(192)
(c) Bestimmen und zeichnen Sie den Boxplot. (Gibt es Ausreisser?)
Der Wert 28.8 ist ein Ausreisser (siehe Boxplot unten).
17
40
60
80
100
120
140
Boxplot
Aufgabe 3
Die Dichte einer sG X ist gegeben wie folgt:
(
4/x5
f (x) =
0
x≥1
x<1
Bestimmen Sie:
(a) die Verteilungsfunktion von X.
Z
x
f (s)ds
F (x) =
−∞
Z x
=
−5
4s
1
=1−
ds = −s
(193)
−4
x
(194)
1
1
x4
(195)
(b) die Wahrscheinlichkeit, dass X > 2.
P (X > 2) = 1 − P (X ≤ 2) = 1 − F (2)
1
1
=1− 1−
=
16
16
18
(196)
(197)
(c) den Erwartungswert von X.
Z
∞
E(X) =
xf (x)dx
Z−∞
∞
−5
(198)
Z
x4x dx = 4
1
−1 ∞ 4
=4
=
3x3 1
3
=
∞
x−4 dx
(199)
1
(200)
(d) die Varianz von X.
Var(X) = E(X 2 ) − E(X)2
Z ∞
16
x2 4x−5 dx −
=
9
1 ∞
16
−2 16
2
−
=
=2−
=
x2 1
9
9
9
(201)
(202)
(203)
(e) Wie kann man auf Basis von U ∼ U (0, 1) Beobachtungen von X generieren?
Mittels Inversionsmethode (F −1 (x) berechnen).
Aufgabe 4
Ein Seriensystem besteht aus 5 Komponenten. Die Lebensdauern Xi der Komponenten folgen unabhängigen Exponentialverteilungen mit Mittelwert 120 Stunden. Bestimmen Sie für die
Lebensdauer X des Seriensystems:
(a) die Verteilungsfunktion (mit Herleitung).
Xi ∼ Fi (x), i = 1(1)5
(204)
X = min{X1 , X2 , X3 , X4 , X5 }
(205)
FX (x) = P (X ≤ x)
(206)
= P (min{X1 , X2 , X3 , X4 , X5 } ≤ x)
(207)
= 1 − P (min{X1 , X2 , X3 , X4 , X5 } > x)
(208)
= 1 − P (X1 > x, X2 > x, X3 > x, X4 > x, X5 > x)
(209)
= 1 − P (X1 > x)P (X2 > x)P (X3 > x)P (X4 > x)P (X5 > x)
(210)
=1−
=1−
5
Y
(1 − P (Xi ≤ x))
(211)
i=1
5
Y
(1 − Fi (x))
(212)
i=1
Fi (x) = 1 − e−λi x ,
FX (x) = 1 −
λi =
1
1
=
τi
120
(213)
5
5
Y
Y
(1 − (1 − e−λi x )) = 1 −
e−λi x
(214)
i=1
P
− 5i=1 λi x
(215)
FX (x) = 1 − e
i=1
= 1 − e−x/24
19
(b) die Dichte. (Um Welche Verteilung handelt es sich?)
Es handelt sich um eine Exponentialverteilung.
fX (x) = λe−λx =
1 −x/24
e
24
(216)
(c) den Erwartungswert, die Streuung und den Median.
E(X) = σ =
1
= 24
λ
(217)
F (x0.5 ) = 0.5
1−e
−x/24
(218)
= 0.5
(219)
e−x/24 = 0.5
−x
= ln(0.5)
24
x0.5 = −24 ln(0.5) = 16.636
(220)
(221)
(222)
(d) Wie lautet ein R-Code zur Erzeugung von 10 Lebensdauern des Seriensystems (ausgehend
von generierten Lebensdauern der Komponenten)?
n = 10
x = numeric(n)
for (i in 1:n) {
k = rexp(n = 5, rate = 1 / 120)
x[i] = min(k)
}
Aufgabe 5
(a) Die gemeinsame Dichte von X und Y sei gegeben durch:
(
4xy 0 < x < 1, 0 < y < 1
f (x, y) =
0
sonst
1
fx (x) =
f (x, y)dy = 2xy = 2x
0
0
1
Z 1
fy (y) =
f (x, y)dx = 2x2 y = 2y
Z
1
2
0
(223)
(224)
0
f (x, y) = fx (x)fy (y) = 4xy
Dann sind X und Y :
2 unabhängig
2 unkorreliert
nicht unabhängig aber unkorreliert
weder unabhängig noch unkorreliert
20
(225)
(b) Für zwei sGn X und Y gelte Y = aX + b (mit a > 0). Dann ist der Korrelationskoeffizient
ρxy von X und Y gegeben durch:
ρxy = a
2
ρxy = 1
ρxy = 0
ρxy = −1
(c) X1 , X2 , . . . , Xn seien iid sGn mit Verteilungsfunktion F . Dann ist die Verteilungsfunktion
des Maximums der sGn gegeben durch:
[1 − F (x)]n
1 − F n (x)
1 − [1 − F (x)]n
2
F n (x)
(d) X und Y seien bivariat normalverteilt: (X, Y ) ∼ N2 (0, 0, 1, 1, ρ = 1/2). Dann sind die
bedingten Erwartungswerte gegeben durch?
σ2
(x − µ1 ) =
σ1
σ1
E(X | y) = µ1 + ρ (y − µ2 ) =
σ2
E(Y | x) = µ2 + ρ
x
2
y
2
(226)
(227)
(e) X1 , X2 , . . . , Xn sei eine Stichprobe aus einer Verteilung mit Mittelwert µ P
und Varianz σ 2 .
1
Für grosses n gilt nach dem ZGVS für den Stichprobenmittelwert X = n ni=1 Xi :
X ≈ N µ, σ 2 /n
X ≈ N (µ, σ 2 ) X ≈ N (nµ, nσ 2 ) 2
Aufgabe 6
Die folgenden Werte sind (unabhängige) Beobachtungen einer exponentialverteilten sG X ∼
Exp(τ ) (mit Mittelwert τ ):
29.4
3.6
14.3
4.8
8.1
3.4
(a) Wie lautet der Momentschätzer von τ ?
n
τb =
1X
63.6
Xi =
= 10.6
n
6
i=1
21
(228)
(b) Bestimmen Sie den ML-Schätzer von τ (mit Herleitung).
1 −x/τ
e
τ
n
n
Y
Y
1 −xi /τ
L(τ ) =
e
f (xi ; τ ) =
τ
i=1
i=1
n Y
n P
n
n
1
1
−xi /τ
e− i=1 (xi /τ )
=
e
=
τ
τ
f (x) =
(229)
(230)
(231)
i=1
=
1 (−1/τ ) Pni=1 xi
e
τn
(232)
P
1
(−1/τ ) n
i=1 xi
+
ln
e
τn
n
1X
= −n ln(τ ) −
xi
τ
l(τ ) = ln (L(τ )) = ln
(233)
(234)
i=1
n
1 X
−n
l0 (τ ) =
+ 2
xi
τ
τ
(235)
i=1
l0 (τ ) = 0 =⇒ −nτ +
n
X
n
xi = 0 ⇐⇒ τ =
1X
xi
n
(236)
i=1
i=1
(c) Ist der ML-Schätzer erwartungstreu und konsistent? (Begründete Antworten!)
(i) Erwartungstreue
E(b
τ) = τ
(237)
n
1X
xi
n
E(b
τ) = E
!
i=1
=
=
n
X
1
E
xi
n
!
(238)
i=1
n
n
i=1
i=1
1X
1X
nτ
E(xi ) =
τ=
n
n
n
=τ
(239)
(240)
(ii) Konsistenz
P
τbn −→ τ
1
n
τbn =
1
n
n
X
i=1
n
X
P
für n −→ ∞
Xi −→ E(X)
(GGZ)
P
Xi −→ E(X) = τ
(241)
(242)
(243)
i=1
(d) Bestimmen Sie auf Basis von (b) einen Schätzer für den Median von X.
1
2
1
−x/τ
= ⇐⇒ x0.5 = τb ln(2)
1−e
2
x0.5 = x
e = 7.347
F (x0.5 ) =
22
(244)
(245)
(246)
Aufgabe 7
Die folgenden n = 8 Beobachtungen stammen von einer Normalverteilung N (µ, σ 2 ) mit unbekanntem Mittelwert µ und unbekannter Varianz σ 2 :
123
127
127
110
111
138
124
115
(a) Bestimmen Sie die Schätzwerte für µ und für σ 2 . (Hinweis: Nehmen Sie unverzerrte Schätzer.)
n
1X
µ
b=x=
xi
n
(247)
i=1
975
= 121.875
8
n
1 X
(xi − x)2
σ
b 2 = s2 =
n−1
=
(248)
(249)
i=1
=
624.875
= 89.268
7
(250)
(b) Bestimmen Sie ein 90%-Konfidenzintervall für den Mittelwert µ.
Sn
KI : X n ± tn−1;1−α/2 √
n
t7;0.95 = 1.895 Sn = 9.448
9.448
KI : 121.875 ± 1.895 × √
8
KI : (115.545, 128.205)
(c) Bestimmen Sie ein 90%-Konfidenzintervall für die Streuung σ.
s
s
!
(n − 1)Sn2
(n − 1)Sn2
KI :
,
χn−1;1−α/2
χn−1;α/2
χ7;0.95 = 14.067 χ7;0.05 = 0.989
!
r
r
624.875
624.875
KI :
,
14.067
0.989
KI : (6.665, 25.136)
(251)
(252)
(253)
(254)
(255)
(256)
(257)
(258)
(d) Lässt sich behaupten, dass der Mittelwert grösser als 120 ist? Testen Sie dazu die folgenden
Hypothesen (zum Niveau α = 10%):
H0 : µ = 120
gegen H1 : µ > 120
H0 verwerfen, falls T0 > tn−1;1−α
X n − µ0
√
t7;0.9 = 1.415
Sn / n
1.875
T0 =
= 0.561
3.340
T0 < t7;0.9 =⇒ H0 nicht verwerfen
T0 =
Die Behauptung lässt sich nicht vertreten.
23
(259)
(260)
(261)
(262)
Aufgabe 8
Die folgende Tabelle ist die Zusammenfassung einer Stichprobe der Grösse 50 von einer sG X
mit Merkmalraum M = {0, 1, 2, 3}.
x
Häufigkeit
0
12
1
20
2
14
3
4
(a) Ist die Binomialverteilung mit n = 3 und p = 1/2 ein geeignetes Modell? Nehmen Sie den
Chiquadrat-Anpassungstest mit α = 10%.
n k
p(k) =
p (1 − p)n−k (Binom. Vert.)
(263)
k
Klasse
0
1
2
3
Summe
Xi
12
20
14
4
50
pi0
0.125
0.375
0.375
0.125
1
Qk−1 =
npi0
6.25
18.75
18.75
6.25
50
(Xi − npi0 )2 /npi0
5.29
0.083̇
1.203̇
0.81
7.387
k
X
(Xi − npi0 )2
i=1
npi0
Q2 = 7.387
(264)
(265)
H0 verwerfen, falls Qk−1 > χ2k−1;1−α
χ22;0.9 = 4.605
(266)
χ22;0.9
(267)
Q2 >
H0 wird verworfen, es handelt sich nicht um ein geeignetes Modell.
(b) R-Code zum obigen Test?
dat = c(rep(0, 12), rep(1, 20), rep(2, 14), rep(3, 4))
class.2 = cut(dat, breaks = c(-1,0,1,2,3))
result = chisq.test(table(class.2), p = dbinom(c(0, 1, 2, 3), 3, 1/2))
(c) Der p-Wert des obigen Tests beträgt 0.061. Was bedeutet dieser Wert? Wie wird er berechnet?
(i) Der p-Wert einer H0 ist der grösste Wert von α, für den die H0 nicht verworfen wird.
24
(ii) Berechnung
p-Wert = P (χ2 (k − 1) ≥ Qk−1 )
γ(k/2, x/2)
F (x; k) =
Γ(k/2)
Z ∞
xt−1 e−x dx
Γ(t) =
(268)
(269)
(270)
0
Γ(n) = (n − 1)! ∀n > 0
Z x
ts−1 e−t dt
γ(s, x) =
(271)
(272)
0
p-Wert = F (7.387, 3) =
p-Wert = 0.0605
25
γ(3/2, 7.387/2)
Γ(3/2)
(273)
(274)
Herunterladen