Prüfungsausarbeitung Statistik und Wahrscheinlichkeitstheorie Wintersemester 2014/15 helmi77 4. Mai 2015 Inhaltsverzeichnis Musterprüfung Aufgabe 1 . . Aufgabe 2 . . Aufgabe 3 . . Aufgabe 4 . . Aufgabe 5 . . Aufgabe 6 . . Aufgabe 7 . . Aufgabe 8 . . . . . . . . . . 2 2 3 4 6 7 8 10 11 Prof. Gurker (28/01/2015) Aufgabe 6 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Aufgabe 7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Aufgabe 8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 12 14 15 Prof. Gurker (11/03/2015) Aufgabe 1 . . . . . . . . . . Aufgabe 2 . . . . . . . . . . Aufgabe 3 . . . . . . . . . . Aufgabe 4 . . . . . . . . . . Aufgabe 5 . . . . . . . . . . Aufgabe 6 . . . . . . . . . . Aufgabe 7 . . . . . . . . . . Aufgabe 8 . . . . . . . . . . 16 16 17 18 19 20 21 23 24 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Musterprüfung Aufgabe 1 Die folgenden Daten sind Beobachtungen einer stochastischen Größe: -0.42, -1.27, 0.79, 1.42, 0.58, 0.61, -1.06, -1.69, 2.07, 1.18 0.0 0.2 0.4 Fn(x) 0.6 0.8 1.0 (a) Zeichnen Sie die empirische Verteilungsfunktion Fb. −2 −1 0 1 2 x (b) Bestimmen Sie x, S 2 und S. n 1X x= xi n (1) x = 0.221 (2) i=1 2 n S2 = 1 X (xi − x)2 n−1 (3) i=1 S 2 = 1.589654̇ (4) √ S2 p S = 1.589654̇ (5) S ≈ 1.261 (7) S= (6) (c) Bestimmen Sie den Median und die Hinges. -1.69, -1.27, -1.06, -0.42, 0.58, 0.61, 0.79, 1.18, 1.42, 2.07 ( x n ungerade x e = 1 ((n+1)/2) n gerade 2 x(n/2) + x((n+1)/2) 1 x e = (0.58 + 0.61) 2 x e = 0.595 (8) (9) (10) x0.25 = min{x ∈ R : Fbn (x) ≥ 0.25} (11) x0.25 = −1.06 (12) x0.75 = min{x ∈ R : Fbn (x) ≥ 0.75} (13) x0.75 = 1.18 (14) (d) Bestimmen Sie das 0.8-Quantil (Typ 2). 1 x0.8 = (x(8) + x(9) ) 2 1 x0.8 = (1.18 + 1.42) 2 x0.8 = 1.3 (15) (16) (17) Anmerkung: Bei Typ 2 wird im Falle einer Unstetigkeit gemittelt. Im obigen Beispiel tritt dieser Fall ein, da die Stelle y = 0.8 unstetig ist (siehe Abbildung oben), daher wird das Mittel der beiden fraglichen Werte (1.18 und 1.42) als 0.8-Quantil gewählt. Aufgabe 2 Ein für eine Krankheit entwickelter Bluttest zeigt in 99.5% der Fälle das korrekte Ergebnis, bei Erkrankten und bei nicht Erkrankten. Weiter ist bekannt, dass ca. 0.2% der Bevölkerung diese Krankheit hat. (a) Mit welcher Wahrscheinlichkeit ist bei einer zufällig ausgewählten Person der Test positiv? X . . . Test einer zufällig ausgewählten Person ist positiv (18) P (X) = (0.002 ∗ 0.995) + (0.998 ∗ 0.005) (19) P (X) = 0.00698 (20) 3 0.002 0.998 ¬krank krank 0.995 0.005 0.005 0.995 positiv negativ positiv negativ (b) Mit welcher Wahrscheinlichkeit ist eine zufällig ausgewählte Person, deren Test positiv ist, tatsächlich erkrankt? X . . . Person ist krank (21) Y . . . Test ist positiv P (Y | X)P (X) P (X | Y ) = P (Y ) 0.995 ∗ 0.002 P (X | Y ) = 0.00698 P (X | Y ) ≈ 0.285 (22) (23) (24) (25) (c) Geben Sie eine Erklärung für die (unerwartet?) kleine Wahrscheinlichkeit von (b). Die kleine Wahrscheinlichkeit könnte sich dadurch erklären, dass nur ein sehr kleiner Teil der Bevölkerung wirklich von der Krankheit betroffen ist. (d) Wie lautet für (b) die Odds–Form der Bayes’schen Formel? P (H) P (A | H) P (H | A) = × P (H | A) P (H) P (A | H) P (X | Y ) P (X) P (Y | X) = × P (X | Y ) P (X) P (Y | X) 0.285 0.002 0.995 ≈ × 0.715 0.998 0.005 0.399 ≈ 0.399 Aufgabe 3 Die Dichte der sG X sei gegeben wie folgt: ( 4e−4(x−1) f (x) = 0 4 wenn x ≥ 1 wenn x < 1 (26) (27) (28) (29) (a) Bestimmen Sie den Erwartungswert von X. Z ∞ xf (x)dx E(X) = Z−∞ ∞ x4e−4(x−1) dx E(X) = Z1 ∞ E(X) = x4e−4x e4 dx 1 Z ∞ 4 xe−4x dx E(X) = 4e 1 Z Z 0 f (x)g(x)dx = f (x)g(x) − f (x)g 0 (x)dx Z ∞ Z ∞ 1 −4x ∞ 1 −4x xe dx = − e x − − e−4x dx 4 4 1 1 1∞ Z ∞ 1 −4x 1 −4x ∞ −4x xe dx = − e x − e 4 16 1 1 1 Z ∞ 1 −4 1 −4 5 −4 −4x xe dx = e + e = e 4 16 16 1 5 5 E(X) = 4e4 e−4 = 16 4 (b) Bestimmen Sie die Verteilungsfunktion von X (plus Skizze). Z F (x) = f (x)dx Z F (x) = 4e−4(x−1) dx Z F (x) = 4e−4x e4 dx Z F (x) = 4e4 e−4x dx −1 −4x e +c 4 F (x) = −e4−4x + c F (x) = 4e4 0 F (1) = 0 ⇔ −e + c = 0 ⇔ c = 1 ( −e4−4x + 1 wenn x ≥ 1 F (x) = 0 wenn x < 1 (30) (31) (32) (33) (34) (35) (36) (37) (38) (39) (40) (41) (42) (43) (44) (45) (46) (c) Wie kann man mit Hilfe eines uniformen Zufallszahlengenerators Realisationen von X ∼ f erzeugen? X := F −1 (U ) P (X ≤ x) = F (x) (48) (U ) ≤ x) = F (x) (49) (U ) ≤ F (x)) = F (x) (50) P (U ≤ F (x)) = F (x) (51) P (F P (F ◦ F −1 (47) −1 5 1.0 0.8 0.6 0.0 0.2 0.4 y 0 1 2 3 4 x Aufgabe 4 Die Dichte der sG X sei gegeben durch: ( x2 /9 f (x) = 0 wenn 0 < x < 3 sonst Betrachten Sie die Transformation Y = X 2 . (a) Wie lautet die Jacobian? J= dg −1 (y) dx = = dy dy 1 dg(x) dx Y = X 2 ⇒ g(x) = x2 √ g −1 (y) = y dg −1 (y) dy 1 = √ =J 2 y (b) Bestimmen Sie mittels Transformationssatz die Dichte von Y . −1 dg (y) −1 fY (y) = fX (g (y)) dy √ 2 √ y y 1 fY (y) = √ = 9 2 y 18 6 (52) (53) (54) (55) (56) (57) (c) Berechnen Sie - nach Definition und mittels LotUS - den Erwartungswert von Y . Z ∞ xf (x)dx (Definition) E(X) = −∞ Z 32 √ Z 32 3 y y2 y E(Y ) = dy = dy 18 18 0 0 ! 2 5 y 2 3 35 E(Y ) = = 45 0 45 Z ∞ g(y)fX (y)dy (LotUS) E(Y ) = E(Y ) = −∞ Z 3 4 y 0 (58) 9 dy = 35 y 5 3 = 45 0 45 (59) (60) (61) (62) Aufgabe 5 Die Lebensdauern von drei in Serie geschalteten Komponenten seien unabhängige Exponentialverteilungen mit λ1 = 0.003, λ2 = 0.010 und λ3 = 0.008. Bestimmen Sie für die Lebensdauer X des Seriensystems: (a) die Verteilungsfunktion. X1 ,X2 , X3 unabhängig (63) Xi ∼ Fi (x), i = 1(1)3 (64) X = min{X1 , X2 , X3 } (65) FX (x) = P (X ≤ x) (66) = P (min{X1 , X2 , X3 } ≤ x) (67) = 1 − P (min{X1 , X2 , X3 } > x) (68) = 1 − P (X1 > x, X2 > x, X3 > x) (69) = 1 − P (X1 > x)P (X2 > x)P (X3 > x) (70) = 1 − (1 − P (X1 ≤ x))(1 − P (X2 ≤ x))(1 − P (X3 ≤ x)) (71) =1− =1− 3 Y (1 − P (Xi ≤ x)) (72) i=1 3 Y (1 − Fi (x)) (73) i=1 −λi x Fi (x) = 1 − e FX (x) = 1 − (74) 3 Y 3 Y i=1 P − 3i=1 λi x i=1 (1 − (1 − e−λi x )) = 1 − FX (x) = 1 − e e−λi x (75) (76) Anmerkung: In Schritt 69 wird der Umstand ausgenutzt, dass sämtliche sGs grösser oder gleich x sein müssen, sobald das Minimum grösser oder gleich x ist. In Schritt 70 wird weiters die Unabhängigkeit der sGs X1 , X2 , X3 verwendet. 7 (b) die Dichte. (Um welche Verteilung handelt es sich?) fX (x) = 3 X λi e− P3 i=1 λi x (77) i=1 Es handelt sich erneut um eine Exponentialverteilung. (c) den Erwartungswert, die Varianz und die Streuung. 1 1 1 = = λ λ1 + λ2 + λ3 0.021 1 1 2 σ = 2 = λ 0.000441 E(X) = σ = (78) (79) (d) den Median und das 90%-Quantil. F (x0.5 ) = 0.5 (80) 1 − e−λx0.5 = 0.5 (81) −e −λx0.5 = −0.5 (82) −λx0.5 = ln(0.5) − ln(0.5) x0.5 = λ x0.5 ≈ 33 (83) F (x0.9 ) = 0.9 − ln(0.1) x0.9 = λ x0.9 ≈ 109.65 (86) Aufgabe 6 Die Dichte der stochastischen Grösse X sei gegeben wie folgt: f (x; θ) = θxθ−1 I(0,1) (x) für θ > 0 Für n unabhängige Beobachtungen x1 , x2 , . . . , xn von X: 8 (84) (85) (87) (88) (a) Bestimmen Sie die (Log-) Likelihoodfunktion. L(θ) = n Y f (xi ; θ) = i=1 n Y θxθ−1 I(0,1) (xi ) = θn i i=1 ln(L(θ)) = l(θ) = ln θn n Y n Y xθ−1 i (89) i=1 ! xθ−1 i (90) i=1 n Y ! xθ−1 i (91) ln(xθ−1 ) i (92) (θ − 1) ln(xi ) (93) = ln(θn ) + ln i=1 = n ln(θ) + = n ln(θ) + n X i=1 n X i=1 = n ln(θ) + (θ − 1) n X ln(xi ) (94) i=1 (b) Bestimmen Sie den ML-Schätzer von θ. n n X dl(θ) = + ln(xi ) dθ θ i=1 n X =n+θ ln(xi ) (95) (96) i=1 n+θ θ n X i=1 n X dl(θ) =0 dθ (97) ln(xi ) = 0 (98) ln(xi ) = −n (99) i=1 −n θb = Pn i=1 ln(xi ) (100) (c) Bestimmen Sie auf Basis der folgenden fünf Beobachtungen den ML-Schätzwert von θ. 0.34, 0.58, 0.80, 0.32, 0.83 θb = −5 ≈ 1.576 ln(0.34) + ln(0.58) + ln(0.80) + ln(0.32) + ln(0.83) (101) (d) Bestimmen Sie auf Basis der Beobachtungen (c) den ML-Schätzwert für den Mittelwert E(X) von X. (Hinweis: Invarianz; vgl. Skriptum S 260.) 9 Z 1 xθxθ−1 dx = θ xθ dx 0 0 θ+1 1 x = θ =θ θ + 1 0 θ + 1 θ g(θ) = θ+1 b d = g(θ) b = θ g(θ) (Invarianz) θb + 1 Z 1 E(X) = b = g(θ) Pn −n i=1 ln(xi ) −n Pn + i=1 ln(xi ) = 1 Pn (102) (103) (104) (105) Pn −n i=1 ln(xi ) Pn −n+ Pn i=1 ln(xi ) i=1 ln(xi ) (106) −n i=1 ln(xi ) Pn i=1 ln(xi )) i=1 ln(xi )(−n + n P = n − ni=1 ln(xi ) 5 b = g(θ) 5 − (ln(0.34) + ln(0.58) + ln(0.80) + ln(0.32) + ln(0.83)) b ≈ 0.6118 g(θ) = Pn (107) (108) (109) (110) Aufgabe 7 Zwölf Personen werden dazu aufgefordert, eine bestimmte Aufgabe nach zwei Methoden zu erledigen, wobei die dazu benötigte Zeit (in Minuten) gemessen wird. Die Ergebnisse sind wie folgt: Person 1 2 3 4 5 6 Zeit (min) Methode 1 Methode 2 17 18 16 14 21 19 14 11 18 23 24 21 Diff. -1 2 2 3 5 3 Person 7 8 9 10 11 12 Zeit (min) Methode 1 Methode 2 16 10 14 13 21 19 23 24 13 15 18 20 Diff. 6 1 2 -1 -2 -2 Man kann davon ausgehen, dass die Beobachtungen aus einer (bivariaten) Normalverteilung stammen. (Hinweis: Beachten Sie, dass es sich um verbundene Stichproben handelt, betrachten Sie die Differenzen der Beobachtungen; vgl. Skriptum 7.3.5.) 10 (a) Bestimmen Sie ein 95%-Konfidenzintervall für die Differenz µd = µ1 −µ2 der Ausführungszeiten. n Xn = 1X xi n (111) i=1 2 Xn = 3 (112) n Sn2 = 1 X (xi − X n )2 n−1 (113) i=1 290 33 p Sn = Sn2 Sn2 = KI : KI : Sn Sn X n − tn−1;1−α/2 √ , X n + tn−1;1−α/2 √ n n ! r r 2 290 2 290 − t11;0.975 , + t11;0.975 3 396 3 396 (114) (115) KI : (−1.217, 2.550) (116) (117) (118) (b) Lässt sich die Behauptung vertreten, dass Methode 2 schneller zum Ziel führt? Testen Sie dazu (mit α = 5%) H0 : µd = 0 gegen H1 : µd > 0. (Vgl. Skriptum 7.4.5.) H0 : µd = µ0 = 0 X n − µ0 √ Sn / n Xn √ T0 = Sn / n √ 2 198 ≈ 0.779 T0 = √ 3 145 T0 = (119) (120) (121) (122) H1 : µd > 0 =⇒ H0 verwerfen, falls T0 > tn−1;1−α t11;0.95 = 1.796 T0 < t11;0.95 (123) (124) Folgerung: H0 hält Stand. Aufgabe 8 Ein Hemdenhersteller behauptet, dass 91% der Produkte beste“ Qualität (1. Klasse) sind, 8% ” sind zweite Wahl“ (2. Klasse) und nur 1% sind Ausschuss (3. Klasse). Um diese Behauptung ” zu testen, werden 500 Hemden zufällig ausgewählt und geprüft, mit dem folgenden Ergebnis: 434 beste Qualität, 48 zweite Wahl und 18 Ausschuss 11 (a) Lässt sich die Behauptung des Herstellers auf dem Niveau α = 5% verwerfen? (Hinweis: χ2 –Anpassungstest) Klasse 1 2 3 Summe Xi 434 48 18 500 pi0 0.91 0.08 0.01 1 npi0 455 40 5 500 (Xi − npi0 )2 /npi0 0.969 1.6 33.8 36.369 H0 verwerfen, falls Qk−1 > χ2k−1;1−α Qk−1 = k X (Xi − npi0 )2 i=1 npi0 Q2 = 36.369 χ22;0.95 = 5.991 Q2 > χ22;0.95 (125) (126) (127) (128) Folgerung: H0 wird verworfen. (b) Wie lautet ein passender R–Code zum obigen Test? (c) Der p–Wert des obigen Tests beträgt 1.266e-08. Was bedeutet dieser Wert? Wie wird er berechnet? (i) Der p-Wert einer H0 ist der grösste Wert von α, für den die H0 nicht verworfen wird. (ii) Berechnung p-Wert = P (χ2 (k − 1) ≥ Qk−1 ) γ(k/2, x/2) F (x; k) = Γ(k/2) Z ∞ Γ(t) = xt−1 e−x dx (129) (130) (131) 0 Γ(n) = (n − 1)! ∀n > 0 Z x γ(s, x) = ts−1 e−t dt (132) (133) 0 γ(1, 18.185) Γ(1) −8 p-Wert = 1.26640 . . . × 10 p-Wert = F (36.369, 2) = (134) (135) Prof. Gurker (28/01/2015) Aufgabe 6 Die folgende Tabelle ist die Zusammenfassung einer Stichprobe der Grösse n = 60 von X ∼ P (λ) (Poisson-Verteilung): 12 x Häufigkeit 0 1 1 6 2 10 3 24 4 9 5 8 6 2 (a) Bestimmen Sie den Momentschätzwert von λ. n E(X) = 1X Xi n (136) i=1 b = E(X) = 186 = 31 λ 60 10 (137) (b) Bestimmen Sie den ML-Schätzwert von λ (mit Herleitung). λk e−λ k! n Y L(λ) = f (xi ; λ) f (k; λ) = (138) (139) i=1 n Y λxi e−λ xi ! i=1 xi −λ n X λ e l(λ) = ln xi ! L(λ) = l(λ) = i=1 n X (140) (141) ln(λxi e−λ ) − ln(xi !) (142) ln(λxi ) + ln(e−λ ) − ln(xi !) (143) i=1 l(λ) = n X i=1 l(λ) = n X (xi ln(λ) − λ − ln(xi !)) (144) i=1 l0 (λ) = n X xi λ i=1 0 l (λ) = 0 ⇔ −1 n X xi i=1 λ −1 =0 n n i=1 i=1 1X 1X xi − n = 0 ⇔ λ = xi λ n (145) (146) (147) n X b= 1 λ xi n i=1 13 (148) (c) Sind die beiden obigen Schätzer erwartungstreu und konsistent? Warum? ? Eθ (θbn ) = θ (Erwartungstreue) ! n X 1 b =E E(λ) xi n i=1 ! n X 1 = E xi n (149) (150) (151) i=1 n 1X E(xi ) n (152) n 1X = λ=λ n (153) = i=1 i=1 b =λ E(λ) n 1X P Xi −→ E(X) n (154) (GGZ) (155) i=1 P θbn −→ θ (Konsistenz) n X b= 1 λ xi n (156) (157) i=1 P b −→ λ λ (158) Aufgabe 7 Aus einem Produktionslos werden n = 1000 Glühlampen zufällig ausgewählt und auf ihre Funktionsfähigkeit überprüft. Dabei stellt man fest, dass 19 Lampen defekt sind. (a) Wie lautet der (ML-) Schätzwert für den Defektanteil p? n 1X pb = X n = Xi n (Bernoulli Vert.) (159) i=1 Xn = 19 = 0.019 1000 (160) (b) Bestimmen Sie ein 95%-Konfidenzintervall für den Defektanteil p. (Hinweis: Nehmen Sie das Standardintervall.) r pb(1 − pb) pb ± z1−α/2 (161) n z0.975 = 1.960 (162) KI : pb ± 0.00846 (163) KI : (0.0105, 0.0275) (164) (c) Lässt sich behaupten, dass der Defektanteil grösser als 1.5% ist? Testen Sie dazu (mit α = 5%) H0 : p = 0.015 gegen H1 : p > 0.015. (Hinweis: Nehmen Sie den approximativen 14 Test für grosse Stichproben; vgl. Skriptum S 303.) Y = n X Xi ≈ N (np, np(1 − p)) (165) i=1 Y − np0 Z0 = p np0 (1 − p0 ) (Teststatistik) (166) H0 : p = 0.015 gegen H1 : p > 0.015 (167) H0 verwerfen, falls Z0 > z1−α (168) Z0 = 1.041 und z0.95 = 1.6449 (169) Z0 6> z0.95 ⇒ H0 hält stand (170) (d) Der exakte p-Wert des Tests von (c) ist 0.1789. Was bedeutet dieser Wert? Wie wird er berechnet? (i) Der p-Wert einer H0 ist der grösste Wert von α, für den die H0 nicht verworfen wird. (ii) Berechnung Aufgabe 8 Für zwei Typen von Batterien ergaben sich die folgenden Kapazitäten (in Ah): Typ 1: 158, 162, 134, 135, 155, 146, 156 Typ 2: 208, 207, 212, 206, 211, 187, 199 Die Daten stammen aus unabhängigen Normalverteilungen: N (µ1 , σ12 ), N (µ2 , σ22 ) (a) Bestimmen Sie Schätzwerte für die Parameter. n 1X X= Xi n (171) i=1 1046 7 1430 Y = 7 n 1 X S2 = (Xi − X)2 n−1 X= (172) (173) (174) i=1 891 7 1594 2 SY = 21 2 SX = (175) (176) (b) Ermitteln Sie – unter der Voraussetzung σ12 = σ22 – ein 95% Konfidenzintervall für die 15 Differenz ∆ = µ2 − µ1 der mittleren Kapazitäten. r 1 1 + m n 2 (m − 1)SX + (n − 1)SY2 Sp2 = m+n−2 4267 Sp2 = 42 t12;0.975 = 2.179 X − Y ± tm+n−2;1−α/2 Sp (177) (178) (179) (180) X − Y ± 11.74 (181) KI : (−66.597, −43.117) (182) (c) Wie lauten für (b) die Standard R-Commands? > x = c(158, 162, 134, 135, 155, 146, 156) > y = c(208, 207, 212, 206, 211, 187, 199) > t.test(x,y,var.equal=TRUE)$conf.int [1] -66.59591 -43.11837 attr(,"conf.level") [1] 0.95 Prof. Gurker (11/03/2015) Aufgabe 1 Die folgenden (bereits geordneten) Daten sind Ausfallzeiten von n = 25 Komponenten: 28.8 90.3 113.0 44.2 91.9 119.6 58.4 92.4 120.9 66.0 94.2 129.5 74.3 98.9 140.9 78.5 99.2 81.8 103.5 83.1 105.1 85.7 108.4 89.8 108.7 (a) Bestimmen und zeichnen Sie das Histogramm der relativen Häufigkeiten auf Basis der Klasseneinteilung: [20, 40], (40, 60], . . . , (140, 160]. P P 2 (b) Bestimmen Sie x, s2 und s. (Hinweis: xi = 2307.1 und xi = 228508.2) n x= 1X 2307.1 = 92.284 xi = n 25 (183) i=1 n n 1 X 1 X 2 (xi − x)2 = xi − 2xxi + x2 n−1 n−1 i=1 i=1 ! n n X X 1 2 2 xi − 2x = xi + nx = 649.99 n−1 i=1 i=1 √ 2 s = s = 25.495 s2 = (184) (185) (186) (c) Bestimmen Sie das 0.8-Quantil (Typ 1 oder 2). x0.8 = x(20) = 108.7 16 (187) 0.010 0.000 0.005 Häufigkeit 0.015 0.020 Histogramm 20 40 60 80 100 120 140 160 Wert Aufgabe 2 Die folgenden (bereits geordneten) Daten sind Ausfallzeiten von n = 25 Komponenten: 28.8 90.3 113.0 44.2 91.9 119.6 58.4 92.4 120.9 66.0 94.2 129.5 74.3 98.9 140.9 78.5 99.2 81.8 103.5 83.1 105.1 85.7 108.4 89.8 108.7 (a) Bestimmen Sie den Median und die Hinges. x0.5 = x((n+1)/2) = x(13) = 92.4 (188) x0.25 = x(7) = 81.8 (189) x0.75 = x(19) = 108.4 (190) (b) Bestimmen Sie die Fences (Skriptum S. 27) LF = Q1 − 1.5(Q3 − Q1 ) = x0.25 − 1.5(x0.75 − x0.25 ) = 41.9 (191) UF = Q3 + 1.5(Q3 − Q1 ) = x0.75 + 1.5(x0.75 − x0.25 ) = 148.3 (192) (c) Bestimmen und zeichnen Sie den Boxplot. (Gibt es Ausreisser?) Der Wert 28.8 ist ein Ausreisser (siehe Boxplot unten). 17 40 60 80 100 120 140 Boxplot Aufgabe 3 Die Dichte einer sG X ist gegeben wie folgt: ( 4/x5 f (x) = 0 x≥1 x<1 Bestimmen Sie: (a) die Verteilungsfunktion von X. Z x f (s)ds F (x) = −∞ Z x = −5 4s 1 =1− ds = −s (193) −4 x (194) 1 1 x4 (195) (b) die Wahrscheinlichkeit, dass X > 2. P (X > 2) = 1 − P (X ≤ 2) = 1 − F (2) 1 1 =1− 1− = 16 16 18 (196) (197) (c) den Erwartungswert von X. Z ∞ E(X) = xf (x)dx Z−∞ ∞ −5 (198) Z x4x dx = 4 1 −1 ∞ 4 =4 = 3x3 1 3 = ∞ x−4 dx (199) 1 (200) (d) die Varianz von X. Var(X) = E(X 2 ) − E(X)2 Z ∞ 16 x2 4x−5 dx − = 9 1 ∞ 16 −2 16 2 − = =2− = x2 1 9 9 9 (201) (202) (203) (e) Wie kann man auf Basis von U ∼ U (0, 1) Beobachtungen von X generieren? Mittels Inversionsmethode (F −1 (x) berechnen). Aufgabe 4 Ein Seriensystem besteht aus 5 Komponenten. Die Lebensdauern Xi der Komponenten folgen unabhängigen Exponentialverteilungen mit Mittelwert 120 Stunden. Bestimmen Sie für die Lebensdauer X des Seriensystems: (a) die Verteilungsfunktion (mit Herleitung). Xi ∼ Fi (x), i = 1(1)5 (204) X = min{X1 , X2 , X3 , X4 , X5 } (205) FX (x) = P (X ≤ x) (206) = P (min{X1 , X2 , X3 , X4 , X5 } ≤ x) (207) = 1 − P (min{X1 , X2 , X3 , X4 , X5 } > x) (208) = 1 − P (X1 > x, X2 > x, X3 > x, X4 > x, X5 > x) (209) = 1 − P (X1 > x)P (X2 > x)P (X3 > x)P (X4 > x)P (X5 > x) (210) =1− =1− 5 Y (1 − P (Xi ≤ x)) (211) i=1 5 Y (1 − Fi (x)) (212) i=1 Fi (x) = 1 − e−λi x , FX (x) = 1 − λi = 1 1 = τi 120 (213) 5 5 Y Y (1 − (1 − e−λi x )) = 1 − e−λi x (214) i=1 P − 5i=1 λi x (215) FX (x) = 1 − e i=1 = 1 − e−x/24 19 (b) die Dichte. (Um Welche Verteilung handelt es sich?) Es handelt sich um eine Exponentialverteilung. fX (x) = λe−λx = 1 −x/24 e 24 (216) (c) den Erwartungswert, die Streuung und den Median. E(X) = σ = 1 = 24 λ (217) F (x0.5 ) = 0.5 1−e −x/24 (218) = 0.5 (219) e−x/24 = 0.5 −x = ln(0.5) 24 x0.5 = −24 ln(0.5) = 16.636 (220) (221) (222) (d) Wie lautet ein R-Code zur Erzeugung von 10 Lebensdauern des Seriensystems (ausgehend von generierten Lebensdauern der Komponenten)? n = 10 x = numeric(n) for (i in 1:n) { k = rexp(n = 5, rate = 1 / 120) x[i] = min(k) } Aufgabe 5 (a) Die gemeinsame Dichte von X und Y sei gegeben durch: ( 4xy 0 < x < 1, 0 < y < 1 f (x, y) = 0 sonst 1 fx (x) = f (x, y)dy = 2xy = 2x 0 0 1 Z 1 fy (y) = f (x, y)dx = 2x2 y = 2y Z 1 2 0 (223) (224) 0 f (x, y) = fx (x)fy (y) = 4xy Dann sind X und Y : 2 unabhängig 2 unkorreliert nicht unabhängig aber unkorreliert weder unabhängig noch unkorreliert 20 (225) (b) Für zwei sGn X und Y gelte Y = aX + b (mit a > 0). Dann ist der Korrelationskoeffizient ρxy von X und Y gegeben durch: ρxy = a 2 ρxy = 1 ρxy = 0 ρxy = −1 (c) X1 , X2 , . . . , Xn seien iid sGn mit Verteilungsfunktion F . Dann ist die Verteilungsfunktion des Maximums der sGn gegeben durch: [1 − F (x)]n 1 − F n (x) 1 − [1 − F (x)]n 2 F n (x) (d) X und Y seien bivariat normalverteilt: (X, Y ) ∼ N2 (0, 0, 1, 1, ρ = 1/2). Dann sind die bedingten Erwartungswerte gegeben durch? σ2 (x − µ1 ) = σ1 σ1 E(X | y) = µ1 + ρ (y − µ2 ) = σ2 E(Y | x) = µ2 + ρ x 2 y 2 (226) (227) (e) X1 , X2 , . . . , Xn sei eine Stichprobe aus einer Verteilung mit Mittelwert µ P und Varianz σ 2 . 1 Für grosses n gilt nach dem ZGVS für den Stichprobenmittelwert X = n ni=1 Xi : X ≈ N µ, σ 2 /n X ≈ N (µ, σ 2 ) X ≈ N (nµ, nσ 2 ) 2 Aufgabe 6 Die folgenden Werte sind (unabhängige) Beobachtungen einer exponentialverteilten sG X ∼ Exp(τ ) (mit Mittelwert τ ): 29.4 3.6 14.3 4.8 8.1 3.4 (a) Wie lautet der Momentschätzer von τ ? n τb = 1X 63.6 Xi = = 10.6 n 6 i=1 21 (228) (b) Bestimmen Sie den ML-Schätzer von τ (mit Herleitung). 1 −x/τ e τ n n Y Y 1 −xi /τ L(τ ) = e f (xi ; τ ) = τ i=1 i=1 n Y n P n n 1 1 −xi /τ e− i=1 (xi /τ ) = e = τ τ f (x) = (229) (230) (231) i=1 = 1 (−1/τ ) Pni=1 xi e τn (232) P 1 (−1/τ ) n i=1 xi + ln e τn n 1X = −n ln(τ ) − xi τ l(τ ) = ln (L(τ )) = ln (233) (234) i=1 n 1 X −n l0 (τ ) = + 2 xi τ τ (235) i=1 l0 (τ ) = 0 =⇒ −nτ + n X n xi = 0 ⇐⇒ τ = 1X xi n (236) i=1 i=1 (c) Ist der ML-Schätzer erwartungstreu und konsistent? (Begründete Antworten!) (i) Erwartungstreue E(b τ) = τ (237) n 1X xi n E(b τ) = E ! i=1 = = n X 1 E xi n ! (238) i=1 n n i=1 i=1 1X 1X nτ E(xi ) = τ= n n n =τ (239) (240) (ii) Konsistenz P τbn −→ τ 1 n τbn = 1 n n X i=1 n X P für n −→ ∞ Xi −→ E(X) (GGZ) P Xi −→ E(X) = τ (241) (242) (243) i=1 (d) Bestimmen Sie auf Basis von (b) einen Schätzer für den Median von X. 1 2 1 −x/τ = ⇐⇒ x0.5 = τb ln(2) 1−e 2 x0.5 = x e = 7.347 F (x0.5 ) = 22 (244) (245) (246) Aufgabe 7 Die folgenden n = 8 Beobachtungen stammen von einer Normalverteilung N (µ, σ 2 ) mit unbekanntem Mittelwert µ und unbekannter Varianz σ 2 : 123 127 127 110 111 138 124 115 (a) Bestimmen Sie die Schätzwerte für µ und für σ 2 . (Hinweis: Nehmen Sie unverzerrte Schätzer.) n 1X µ b=x= xi n (247) i=1 975 = 121.875 8 n 1 X (xi − x)2 σ b 2 = s2 = n−1 = (248) (249) i=1 = 624.875 = 89.268 7 (250) (b) Bestimmen Sie ein 90%-Konfidenzintervall für den Mittelwert µ. Sn KI : X n ± tn−1;1−α/2 √ n t7;0.95 = 1.895 Sn = 9.448 9.448 KI : 121.875 ± 1.895 × √ 8 KI : (115.545, 128.205) (c) Bestimmen Sie ein 90%-Konfidenzintervall für die Streuung σ. s s ! (n − 1)Sn2 (n − 1)Sn2 KI : , χn−1;1−α/2 χn−1;α/2 χ7;0.95 = 14.067 χ7;0.05 = 0.989 ! r r 624.875 624.875 KI : , 14.067 0.989 KI : (6.665, 25.136) (251) (252) (253) (254) (255) (256) (257) (258) (d) Lässt sich behaupten, dass der Mittelwert grösser als 120 ist? Testen Sie dazu die folgenden Hypothesen (zum Niveau α = 10%): H0 : µ = 120 gegen H1 : µ > 120 H0 verwerfen, falls T0 > tn−1;1−α X n − µ0 √ t7;0.9 = 1.415 Sn / n 1.875 T0 = = 0.561 3.340 T0 < t7;0.9 =⇒ H0 nicht verwerfen T0 = Die Behauptung lässt sich nicht vertreten. 23 (259) (260) (261) (262) Aufgabe 8 Die folgende Tabelle ist die Zusammenfassung einer Stichprobe der Grösse 50 von einer sG X mit Merkmalraum M = {0, 1, 2, 3}. x Häufigkeit 0 12 1 20 2 14 3 4 (a) Ist die Binomialverteilung mit n = 3 und p = 1/2 ein geeignetes Modell? Nehmen Sie den Chiquadrat-Anpassungstest mit α = 10%. n k p(k) = p (1 − p)n−k (Binom. Vert.) (263) k Klasse 0 1 2 3 Summe Xi 12 20 14 4 50 pi0 0.125 0.375 0.375 0.125 1 Qk−1 = npi0 6.25 18.75 18.75 6.25 50 (Xi − npi0 )2 /npi0 5.29 0.083̇ 1.203̇ 0.81 7.387 k X (Xi − npi0 )2 i=1 npi0 Q2 = 7.387 (264) (265) H0 verwerfen, falls Qk−1 > χ2k−1;1−α χ22;0.9 = 4.605 (266) χ22;0.9 (267) Q2 > H0 wird verworfen, es handelt sich nicht um ein geeignetes Modell. (b) R-Code zum obigen Test? dat = c(rep(0, 12), rep(1, 20), rep(2, 14), rep(3, 4)) class.2 = cut(dat, breaks = c(-1,0,1,2,3)) result = chisq.test(table(class.2), p = dbinom(c(0, 1, 2, 3), 3, 1/2)) (c) Der p-Wert des obigen Tests beträgt 0.061. Was bedeutet dieser Wert? Wie wird er berechnet? (i) Der p-Wert einer H0 ist der grösste Wert von α, für den die H0 nicht verworfen wird. 24 (ii) Berechnung p-Wert = P (χ2 (k − 1) ≥ Qk−1 ) γ(k/2, x/2) F (x; k) = Γ(k/2) Z ∞ xt−1 e−x dx Γ(t) = (268) (269) (270) 0 Γ(n) = (n − 1)! ∀n > 0 Z x ts−1 e−t dt γ(s, x) = (271) (272) 0 p-Wert = F (7.387, 3) = p-Wert = 0.0605 25 γ(3/2, 7.387/2) Γ(3/2) (273) (274)