Aufgabe 1 (ca. 10 P) Untersuchen Sie anhand der folgenden Stichprobenerhebung, welchen Einfluß der Siliziumgehalt einer Stahlsorte (Merkmal X) auf die Druckfestigkeit des Stahls (Merkmal Y ) hat. Seite 1 xi [%] 0, 2 0, 22 0, 22 0, 25 0, 28 0, 30 0, 32 0, 32 0, 34 0, 35 N yi [ mm2 ] 540 580 540 620 560 600 660 580 600 620 Hilfsgrößen: 10 X 10 X xi = 2, 8 ; 1 yi = 5900 ; 1 10 X x2i = 0, 8106 ; 1 10 X yi2 = 3494000 ; 1 10 X xi yi = 1664. 1 1 a) Berechnen Sie aus den Hilfsgrößen die empirischen Mittelwerte x̄, ȳ, die empirischen Streuungen s2X , s2Y und die empirische Kovarianz sXY (Formeln und Werte). Lösung 1a: n = 10 x̄ ȳ x¯2 = = = s2X = y¯2 = s2Y = xy ¯ = sXY = 1 n 1 n 1 n 1 n 1 n 1 n 1 n 1 n n P xi = 1 10 · 2, 8 = 0, 28 yi = 1 10 · 5900 = 590 x2i = 1 10 · 0, 8106 = 0, 08106 (xi − x̄)2 = x¯2 − x̄2 1 n P 1 n P 1 n P 1 n P = (yi − ȳ)2 = y¯2 − ȳ 2 n P 1 n P 1 n P 1 1 10 yi2 1 xi yi = 0, 08106 − 0, 0784 = 0, 00266 · 3494000 = 349400 = 349400 − 348100 = 1300 = 166, 4 − 165, 2 = 1, 2 = 166, 4 (xi − x̄)(yi − ȳ) = xy ¯ − x̄ · ȳ zu Aufgabe 1 Seite 2 1 b) Man gebe MKQ-Schätzwerte für die Koeffizienten a, b der Regressionsgerade y = a + bx an. Steigt oder fällt die Druckfestigkeit des Stahls im Mittel mit wachsendem Siliziumgehalt? 1 c) Man berechne den empirischen Korrelationskoeffizienten ρXY . Bewerten Sie das Ergebnis. Lösung 1b: b = sXY /s2X = 1, 2/0, 00266 a = ȳ − bx̄ ≈ 451, 128 = 590 − b · 0, 28 ≈ 463, 684 Regressionsgerade y = a + bx Steigung der Regressionsgeraden b > 0 ⇒ Mit wachsendem Siliziumgehalt steigt die Druckfestigkeit der Stahlsorte (im betrachteten Bereich). Lösung 1c: ρXY = sXY 1, 2 ≈ ≈ 0, 645 sX · sY 0, 0516 · 36, 0555 ⇒ Zwischen den Merkmalen X und Y besteht kein guter linearer Zusammenhang. Aufgabe 2 (ca. 12 P) Seite 3 Ein Lebensmittelgroßhändler vereinbart mit seinem Geflügellieferanten ein mittleres Hähnchengewicht von mindestens 1000 g. Eine Stichprobenerhebung vom Umfang n = 7 ergab einen empirischen Mittelwert x̄ = 960, 7[g] und eine empirische Streuung s2 = (46, 5)2 [g 2 ]. Es werde angenommen, daß die Gewichte der gelieferten Hähnchen Realisierungen einer normalverteilten Zufallsvariablen X sind. 2 a) Man gebe ein nach oben begrenztes 95%-Vertrauensintervall für ξ = EX an. Man teste die Hypothese H0 : ξ = 1000g mit einer Sicherheitswahrscheinlichkeit von 95%. Nötigenfalls gebe man die Alternative an. Lösung 2a: (n−1) % p(ξ ≤ X̄ + tP S P ·√ )= n 100 (6) ξ = EX ; t95% = 1, 943 ; s = 46, 5 ; n = 7 ; x̄ = 960, 7 46, 5 ξ ≤ 960, 7 + 1, 943 · √ 7 ξ ≤ 994, 85 ist ein realisiertes, nach oben begrenztes 95% − V I für ξ. Test: H0 : ξ = 1000[g] = ξ0 Da ξ0 = 1000[g] nicht im 95%-VI liegt, wird H0 zugunsten H1 : ξ < ξ0 = 1000[g] verworfen. zu Aufgabe 2 Seite 4 2 b) Man führe den Test aus a) mit der höheren Sicherheitswahrscheinlichkeit von 99% durch. 2 c) Man gebe ein zweiseitiges 95% - Vertrauensintervall für die Streuung σ 2 von X an. Lösung 2b: P = 99 (6) t99% = 3, 143 Realisiertes VI: 46, 5 ξ ≤ 960, 7 + 3, 143 · √ 7 ξ ≤ 1015, 94 ist ein realisiertes, nach oben begrenztes 99%-VI für ξ Test: H0 : ξ = 1000[g] = ξ0 Da ξ0 = 1000[g] im 99%-VI liegt, braucht H0 mit der erhöhten Sicherheitswahrscheinlichkeit nicht verworfen zu werden. Lösung 2c:) P (n − 1)S 2 (n − 1) · S 2 2 ≤ σ ≤ 2 Xn−1,P χ2n−1,Q% % ! = P −Q 100 P = 97, 5 ; Q = 2, 5 χ26;97,5% = 14, 4 χ26;2,5% = 1, 24 6 · (46, 5)2 6 · (46, 5)2 ≤ σ2 ≤ 14, 4 1, 24 2 900, 94 ≤ σ ≤ 10462, 5 ist ein realisiertes, zweiseitiges 95%-VI für die unbekannte Streuung σ 2 von X. Aufgabe 3 ( ca. 8 P) Seite 5 Eine Angestelle verläßt an 225 Arbeitstagen eines Jahres jeweils kurz nach Dienstschluß ihr Büro. Die Dauern Xi ; i = 1, 2, . . . , 225 ; der zusätzlichen täglichen Arbeitszeit werden als stetige, unabhängige Zufallsvariable mit Erwartungswert E(Xi ) = 5[min] und Streuung D2 (Xi ) = 25[min2 ] betrachtet. Mit Hilfe des Zentralen Grenzwertsatzes berechne man (näherungsweise) die Wahrscheinlichkeit dafür, daß die Angestellte in einem Jahr insgesamt mehr als 15 h zusätzlich arbeitet. Lösung D2 (Xi ) = 25[min 2 ] EXi = 5[min] E 225 X 225 X ! Xi = 1 D 2 225 X EXi = 225 · 5 = 1125 1 ! Xi = 225 X 1 D2 (Xi ) = 225 · 25 = 5625 1 p 225 X ! Xi ≥ 15 · 60 = 1 900 − 1125 Y − 1125 √ p ≥ √ 5625 5625 ! = p(U ≥ −3) wobei Y = 225 P 1 Xi . U ist näherungsweise (0; 1)-normalverteilt. Wegen p(U ≥ −3) = p(U ≤ 3) = G(3) = 0, 99865 (G Verteilungsfunktion der (0;1)Normalverteilung). Die Angestellte arbeitet mit einer Wahrscheinlichkeit von 0,99865 mehr als 15 h zusätzlich pro Jahr. Aufgabe 4 (ca. 10 P) Die Funktion f : IR2 → IR mit f (x, y) = Zufallsvariablen (X,Y). Seite 6 1 4 −|x|−|y| e ist Dichte einer zweidimensionalen 4 a) Man berechne die Randdichten fX bzw. fY von X bzw. Y . (Ergebnis: fX (x) = 21 e−|x| ; fY (y) = 12 e−|y| ) 4 b) Sind X und Y unabhängige Zufallsvariable? Lösung 4a: fX (x) = +∞ Z +∞ Z f (x, y) dy = −∞ −∞ 1 −|x| −|y| e ·e dy = 4 +∞ Z∞ 1 −|x| Z 1 −|x| −|y| = e · e dy = e ·2· e−y dy = 4 4 −∞ = Analog fY (y) = +∞ R −∞ Ergebnis: fX (x) = 1 2 0 1 −|x| e · −e−y 2 h i∞ 0 = 1 −|x| e 2 f (x, y) dx = 21 e−|y| e−|x| ; fY (y) = 1 2 e−|y| Lösung 4b: fX · fY = f = ⇒ X, Y sind unabhängige Zufallsvariable. 1 −|x|−|y| e 4 zu Aufgabe 4 Seite 7 4 c) Man berechne die zweiseitige (symmetrische) P %-Grenze λP % der Zufallsvariablen X (Skizze von fX !) Lösung 4c: λρ% Z λρ% Z fX (x)dx = −λρ% −λρ% h = −e−x iλρ% 0 0 = −e−λρ% + 1 = P 100 P P ⇒ λρ% = − ln(1 − ) 100 100 = − ln 0, 1 = ln 10 ≈ 2, 30 ⇒ e−λρ% = 1 − z.B.: λ90% λρ% Z 1 −|x| 1 −x e dx = 2 · e dx 2 2