A Fachbereich Mathematik Prof. Dr. J. Lehn T. Harth A. Rößler B. Walther TECHNISCHE UNIVERSITÄT DARMSTADT SS 2003 23./24.04. 2003 Einführung in die Statistik für WInf, Inf, BI, ET etc. 1. Übung Gruppenübungen Aufgabe G1 Bei der Messung des Körpergewichts von 20 männlichen Schülern ergaben sich die folgenden Werte [in kg]: 62.5 58.0 57.0 59.5 64.0 54.5 58.5 59.5 57.0 61.5 56.0 61.0 54.5 65.5 62.5 57.0 60.0 56.5 59.5 58.5 a) Erstellen Sie ein Histogramm mit der Klasseneinteilung (54.0, 56.0], (56.0, 58.0], . . . , (64.0, 66.0]. b) Skizzieren Sie die empirische Verteilungsfunktion zu der Messreihe. c) Bestimmen Sie das arithmetische Mittel, den Median, die Spannweite, die empirische Varianz, die empirische Standardabweichung und den Quartilabstand. d) Veranschaulichen Sie die Struktur der Messreihe mit Hilfe eines Boxplots. Aufgabe G2 Bei einer Klausur konnten maximal 120 Punkte erreicht werden. In der folgenden Tabelle ist zu jeder Note diejenige Punktzahl p angegeben, die zum Erhalt dieser Note mindestens erreicht werden mußte. Note 1.0 1.3 1.7 2.0 2.3 2.7 p 120 115 109 102 94 85 3.0 3.3 3.7 4.0 5.0 75 64 52 40 0 Folgende Punktzahlen wurden von den 25 Teilnehmern erreicht: 41 82 5 12 41 52 84 94 47 102 45 70 73 59 62 20 31 40 74 51 64 75 98 76 60 a) Bestimmen Sie jeweils im Sinne der Bildung des arithmetischen Mittels die durchschnittliche Punktzahl sowie die Durchschnittsnote. b) Vergleichen Sie die Note, die man bei durchschnittlicher Punktzahl erhalten würde, mit der Durchschnittsnote. c) Bestimmen Sie die Mediane zu Noten und Punktzahlen. d) Vergleichen Sie die Note, die man beim Median der Punktzahlen erhalten würde, mit dem Median der Notenverteilung. Aufgabe G3 Gegeben sei eine Messreihe x1 , . . . , xn mit arithmetischem Mittel x und empirischer Varianz s2x . a) Zeigen Sie: Werden die Messwerte gemäß yi = axi + b für i = 1, . . . , n linear transformiert, so gilt für das arithmetische Mittel der transformierten Werte y = ax + b und für die empirische Varianz s2y = a2 s2x . b) Im Jahr 2002 wurden in Seattle die folgenden monatlichen Niederschläge (in inches) gemessen: 6.49 4.18 2.82 4.29 1.11 1.73 0.64 0.04 0.42 0.66 3.71 5.98 Berechnen Sie die durchschnittliche Niederschlagsmenge in einem Monat und die zugehörige empirische Streuung in inches und in cm (Hinweis: 1 inch = 2.54 cm). c) Zeigen Sie, dass die Funktion f : R −→ R gegeben durch f (a) = n X (xi − a)2 i=1 an der Stelle â = x ihr Minimum annimmt. Hausübungen Abgabe am 2. Mai Aufgabe H1 An 40 Exemplaren einer bestimmten Pflanze wurde die Anzahl x der Stengelblätter am Hauptspross bestimmt. Es ergaben sich folgende Werte mit den angegebenen Häufigkeiten: x Häufigkeit 2 1 3 3 4 1 5 4 6 8 7 7 8 3 9 10 11 12 14 15 16 17 1 4 1 2 1 2 1 1 a) Bestimmen Sie den Median der Verteilung. b) Erstellen Sie die empirische Verteilungsfunktion und lesen Sie daraus die Quantile x0.1 und x0.75 ab. c) Veranschaulichen Sie die Messreihe mit einem Stabdiagramm. d) Erstellen Sie einen Box–Plot für diese Messreihe. Aufgabe H2 Sei x1 , . . . , xn eine Messreihe mit dem Median x e, f : R → R eine monoton wachsende Funktion und yi = f (xi ) für i = 1, . . . , n. a) Zeigen Sie, dass für den Median ye der transformierten Messreihe y1 , . . . , yn gilt: ye = f (e x). b) Geben Sie den Median der Niederschlagsmengen aus Aufgabe G3 in cm an. c) Gilt für die arithmetischen Mittel x und y ebenfalls y = f (x)? (bitte wenden) Aufgabe H3 Die folgende Tabelle ist ein Auszug aus dem Statistischen Jahrbuch 2002 vom Statistischen Bundesamt zum Thema Privathaushalte im April 2001 nach dem monatlichen Haushaltsnettoeinkommen. j aj bj nj 1 1 − 1 000 1 319 2 1 000 − 1 800 4 588 3 1 800 − 2 500 6 092 4 2 500 − 3 000 3 874 5 3 000 − 4 000 6 756 6 4 000 − 5 000 5 115 7 5 000 − 7 500 6 134 Der Eintrag nj in Zeile j entspricht der Anzahl von Privathaushalten mit einem monatlichen Haushaltsnettoeinkommen zwischen aj und bj DM. Insgesamt sind hier 33 878 Privathaushalte erfasst. a) Zeichnen Sie ein Histogramm der Meßreihe mit den vorgegebenen Klassen. Benutzen Sie folgende Einheiten: 1 cm = 500 auf der x-Achse, 1 cm = 0.02 auf der y-Achse. b) Zeichnen Sie ein Histogramm, bei dem auf der y-Achse der Quotient aus relativer Häufigkeit und Klassenbreite aufgetragen ist. Günstig sind dabei die folgenden Einheiten: 1 cm = 500 auf der x-Achse, 1 cm = 2 × 10−5 auf der y-Achse. Berechnen Sie den Flächeninhalt des Histogramms. c) Vergleichen Sie die beiden Histogramme. Welche Darstellung würden Sie zur Beschreibung der Daten vorziehen? d) Gilt x̃ < x̄ oder x̄ < x̃? Stellen Sie eine (begründete) Vermutung allein unter Benutzung der Histogramme an. Aufgabe H4 Im Rahmen von Untersuchungen über zulässige Höchstwerte von Schadstoffen in Futtermitteln wurden Fütterungsversuche an Mastschweinen angestellt. Dem Futter von 13 Schweinen wurden verschiedene Mengen von Bleiacetat (x1 , . . . , x13 ) beigegeben und nach einem bestimmten Zeitraum wurden dann die Bleikonzentrationen in der Nierenrinde (y1 , . . . , y13 ) gemessen. Die entsprechenden Werte (in mg Pb pro kg Futter bzw. pro kg Nierenrinde) sind in der nachfolgenden Tabelle dargestellt. xi yi 2.0 3.2 5.4 2.4 8.9 15.8 2.3 6.9 11.8 4.5 2.6 2.9 3.8 0.12 0.18 0.42 0.18 0.61 1.02 0.14 0.55 0.74 0.24 0.14 0.20 0.20 a) Erstellen Sie ein Punktediagramm und berechnen Sie die empirische Kovarianz sowie die empirische Korrelation zwischen der Bleikonzentration im Futter und in der Nierenrinde. Erscheint ein linearer Zusammenhang zwischen den beobachteten Größen angemessen? b) Bestimmen Sie die Regressionsgerade zur Vorhersage des Bleigehalts in der Nierenrinde aus der Bleikonzentration im Futter und tragen Sie diese in das Punktediagramm ein. Wie groß ist die Quadratsumme der Residuen? c) Welchen Vorhersagewert für den Bleigehalt in der Nierenrinde erhält man bei einer Bleikonzentration des Futters von 10 mg. Aufgabe H5 Auf dem Darmstädter Wochenmarkt ist eine Erhebung über die Länge und das Gewicht von Salatgurken durchgeführt worden. Dabei erhielt man folgende Messwerte: Länge (in cm) 30 31 33 37 39 40 Gewicht (in g) 595 610 625 640 655 715 a) Stellen Sie die Messergebnisse in einem Punktediagramm dar. b) Berechnen Sie zu der oben angegebenen Messreihe die empirische Kovarianz sowie den empirischen Korrelationskoeffizienten. c) Berechnen Sie die Regressionsgerade zur Vorhersage des Gewichtes an Hand der Länge der Salatgurken und zeichnen Sie diese in das Punktediagramm aus a) ein. d) Berechnen Sie die Regressionsgerade zur Vorhersage der Länge an Hand des Gewichtes der Salatgurken und zeichnen Sie diese in das Punktediagramm aus a) ein. e) Berechnen Sie den Schnittpunkt der beiden Geraden. P P 2 P P 2 P Hinweis: xi = 210, xi = 7 440, yi = 3 840, yi = 2 466 600, xi yi = 135 210 i i i i i Aufgabe H6 a) Bestimmen Sie diejenige lineare Transformation yi = axi + b, a > 0, durch die sich aus einer Messreihe x1 , . . . , xn mit s2x > 0 eine transformierte Messreihe y1 , . . . , yn ergibt, für die gilt: y=0 und s2y = 1 (Man bezeichnet y1 , . . . , yn als standardisierte Messreihe). b) Gegeben sei nun die zweidimensionale Messreihe (x1 , y1 ), . . . , (xn , yn ) mit der empirischen Korrelation sxy und dem empirischen Korrelationskoeffizienten rxy . Berechnen Sie die empirische Korrelation suv und den empirischen Korrelationskoeffizienten ruv der standardisierten zweidimensionalen Messreihe x − x̄ y − ȳ x − x̄ y − ȳ 1 n n 1 , , . . . , (un , vn ) = , . (u1 , v1 ) = sx sy sx sy