Stochastik SS13, Serie 1 Lösungen 1 Aufgabe a) Anzahl abs. Häuf. Rel. Häuf. 35 1 0.05 37 3 0.15 38 6 0.30 40 5 0.25 41 3 0.15 42 1 0.05 43 1 0.05 b) Histogramm Anzahl Werte ≤ x n < 35 35≤ x <37 37≤ x <38 0 1/20 4/20 42≤ x <43 x≥ 43 19/20 1 empir. VF F (x) = F (x) x F (x) 38≤ x <40 10/20 40≤ x <41 15/20 c) Mittelwert = 39.2 Standardabweichung = 1.98 Variationskoeffizient = 0.05 d) 10%-Quantil = 37 25%-Quantil = 38 Median = 40 75%-Quantil = 40.5 (abweichend zu MATLAB-Algorithmus) 95%-Quantil = 41.50 (abweichend zu MATLAB-Algorithmus) 2 Aufgabe 4 41≤ x <42 18/20 a) N Mittelwert Median Standardabweichung Quantile 25 75 Quartilsabstand 99 397934 1.0815 1.0000 1.3303 0.0000 2.0000 2.0000 5.0000 b) 3 Aufgabe a) Histogramm b) Empirische VF c) Boxplot 5 keine ausreißerverdächtigen Werte 4 Aufgabe a) Kontingenztabelle Naturwissenschaft Geisteswissenschaft Wirtschaftswissenschaft für Streik 20 10 10 40 gegen Streik 5 5 20 30 neutral 15 5 10 30 40 20 40 100 Randverteilungen: Einstellung zum Streik: 40% für Streik, 30% gegen Streik, 30% neutral Verteilung auf Fachgruppen: 40% Natur-, 20% Geistes-, 40% Wirtschaftswissenschaften b) Verteilung des Einstellung zum Streik in den Fachgruppen. bedingte Verteilung der Streikeinstellung 20 5 15 , 50% dafür, , 12.5% dagegen, , 37.5% Naturwissenschaften: 40 40 40 neutral 10 5 5 , 50% dafür, , 25% dagegen, , 25% neutral Geisteswissenschaft: 20 20 20 10 20 10 , 25% dafür, , 50% dagegen, , 25% neutral Wirtschaftswissenschaft 40 40 40 c) Besetzung bei Unabh. Naturwissenschaft Geisteswissenschaft Wirtschaftswissenschaft für Streik 16 8 16 40 gegen Streik 12 6 12 30 neutral 12 6 12 30 40 20 40 100 χ2 = 14.583 (Schwellwert von 9.49 wird überschritten, somit Streikeinstellung abh. von Fachgruppe) s r χ2 14.583 Kontingenzkoeffizient: K = = = 0.357 2 χ +n 14.583 + 100 r d K mit d = min(p, q) = 3 korrigierter Kontingenzkoeffizient: Kcorr = d − 1 r 3 Kcorr = · 0.357 = 0.437 3−1 5 Aufgabe Chi-Quadrat = 32.72 6 Kontingenzkoeffizient = 0.564 korrigierter Kontingenzkoeffizient = 6 Aufgabe r 3 · 0.564 = 0.691 2 a) r = 0.994 b) y = −0.582 + 0.037x 2 c) Total: SSY = (n P− 1)sy =2 5.029 Restvarianz (yP i − ŷi ) = 0.057, P erklärte Varianz (ȳ − ŷi )2 = SSY − (yi − ŷi )2 = 5.029 − 0.057 = 4.972 d) R2 = r2 = 0.989 7 Aufgabe a) b) Pearson: r = −0.872, x y x2 y2 xy 6 30.2 36 912.04 181.2 18 9.8 324 96.04 176.4 30 4.7 900 22.09 141.0 42 1.8 1764 3.24 75.6 54 0.8 2916 0.64 43.2 Summe 150 47.3 5940 1034.05 617.4 r = −0.872 Spearman: rs = −1 wegen strenger Monotonie x y Rg(x) Rg(y) di 6 30.2 1 5 -4 18 9.8 2 4 -2 30 4.7 3 3 0 42 1.8 4 2 2 54 0.8 5 1 4 rs = −1 7 c) y lny 30.2 3.4078 9.8 2.2824 4.7 1.5476 1.8 0.5878 0.8 -0.2231 Pearson-Korrelation r = −0.998, Logarithmieren bewirkt Linearisierung. d) y = 26.16 − 0.5567x, R2 = 0.7607 Exponentiale Regression y = 50.37 · e−0.0862x , R2 = 0.9956 8 Aufgabe a) Pearson-Korrelation: r = −0.984 b) Regressionsfunktion: y = 92.8 − 9.6x c) R2 = 0.968 96.8% der Varianz von y wird durch Regression erklärt, Restvarianz ist 3.2% Gesamt SSYP= 238 Restvarianz (yi − ŷi )2 P = 7.6 erklärte Varianz SSY − (yi − ŷi )2 = 230.4 R2 = 0.968 9 Aufgabe zu Fuß: 8 Linearisierung: z = ln y = ln b0 + b1 T = a0 + a1 T Schätzug der Regressionskoeffizienten von z = a0 + a1 T mit Formeln für lineare Regression a1 = −0.048243 a0 = 5.971 2 folglich b1 = −0.048243, b0 = ea0 = e5.971 2 = 391.97576 gesuchte Funktion: y = 391.97576 · e−0.048243T Reststreuung im Exponentialmodell Viskosität y 3.0 5.3 8.2 14.7 20.1 Prognose ŷ 3.148 4 5.100 5 8.262 8 13.386 21.685 Residuenquadr. 0.0220 0.039 8 0.0039 1.726 6 2.512 2 Reststreuung 0.0220 + 0.039 8 + 0.0039 + 1.726 6 + 2.512 2 = 4.3045 Gesamtstreuung von y: (3.0 − 10.5589)2 + (5.3 − 10.5589)2 + (8.2 − 10.5589)2 + (14.7 − 10.5589)2 + (20.1 − 10.5589)2 = 198.54 4.3045 = 0.978 32 Bestimmtheitsmaß: R2 = 1 − 198.54 im Vergleich dazu bei Zwischenrechnung der lin Reg.: R2 = 0.992(diese Reststreuung wird bei der Schätzung minimiert) zum Vergleich: nichtlineare Regression mit MATLAB Schätzung des exponentiellen Modells mit größerer Genauigkeit y = 288.8 · e−0.04396T Bestimmtheitsmaß R2 = 0.9861 10 Aufgabe 9 Urdaten Transformation von x zu 1/x Linearisierung: ln S = ln A − m ln N , entspricht y = a0 + a1 x mit y = ln S, x = ln N ergibt a0 = 3.927, a1 = −0.072 somit A = ea0 = 50.75, m = −0.072 und S = 50.75 · N 0.072 zum Vergleich: mit MATLAB ŷ = 50.52 ∗ x0.07033 Bestimmtheitsmaß R2 = 0.9755 10