Prof. Dr. Peter Schmidt Volkswirtschaftslehre & Statistik FB Wirtschaft Wintersemester 2001 / 2002 http://www.fbw.hs-bremen.de/~pschmidt Statistik @ Nachklausur Grundstudium Freitag, 7. Dezember 2001 (14.00 - 15.30 Uhr) Im Multiple-Choice-Teil (Aufg. 1) ergibt jede richtige Lösung (zu einer Aussage) 1,5 Punkte. Es können hier also insgesamt 30 Punkte erzielt werden (es werden keine Bonus-Punkte vergeben). Die Lösungen von Fill-In-Aufgaben (Aufg. 2 bis 5) sind in die dafür vorgesehenen Felder (Freiräume) einzutragen. Dies gilt für Skizzen, Grafiken und Texte analog. Die Lösungen gelten nur dann, wenn der vollständige Lösungsweg erkennbar ist ! Es ist NUR in der gehefteten Klausur zu arbeiten. Als Konzeptseiten können die Rückseiten der Blätter benutzt werden. Die Blätter müssen geheftet bleiben. Es können insgesamt 90 Punkte erreicht werden. Die erreichbare Punktzahl der einzelnen Aufgaben ist angegeben. Da auch die Bearbeitungszeit 90 Minuten beträgt, sind die Punktzahlen ein Anhalt für die sinnvolle Bearbeitungszeit der Aufgaben. Bearbeiten Sie möglichst viele Aufgaben. Zulässige Hilfsmittel: Bitte schreiben Sie nicht mit roten Stift. - Formelsammlung ohne eigene Text-Anmerkungen (Formeln zugelassen), - Taschenrechner ohne Textverarbeitungsfunktion. Überprüfen Sie zu Beginn die Klausur auf Vollständigkeit (5 Aufgaben auf 6 Seiten) und füllen bitte vorab die unten stehenden Kästchen aus („Versuch“ = ich schreibe die Klausur zum ... Mal). Viel Erfolg ! Lösungshinweise ! Name: Vorname: 1. Versuch: 2. Versuch: Wenn zutreffend, unbedingt ankreuzen 3./4. Versuch: MatrikelNr: Bitte beantworten Sie die folgenden Fragen: Alter: Studiengang: Semester: Geschlecht: Berufsausbildung (J/N): Diese Angaben werden -natürlich- nicht zusammen mit Ihrem Namen/Matr.Nr. gespeichert, sondern dienen ausschließlich statistischer Auswertung! Aufg. Punkte: Ab hier bitte nichts beschriften oder ankreuzen: 1. MC (30) 2 (14) Datum: 3 (18) Note 4 (10) 5 (18) (90) Unterschrift Achtung: Bitte keinen Leistungsnachweis-Bogen beilegen! Die benotete Klausur ist Ihr Leistungsnachweis Lösungshinweise Aufgabe 1 Multiple Choice Bitte kreuzen Sie an - Erläuterungen sind nicht erforderlich. Hinweis: Eine Multiple-Choice-Aussage ist nur „richtig“, wenn die Aussage immer gilt. Gibt es ein einziges Gegenbeispiel, so ist sie „falsch“. [je 1,5 Punkte Gesamt 30 Punkte] richtig falsch Welche Aussage ist richtig? X 1.1 Die Anzahl von Reisig-Borsten bei den 20 Besen einer Stichprobe ist eine Zufallsvariable. X 1.2 Wenn X bei einer Stichprobe von 100 Besen = 2 ist, dann kann die Grundgesamtheit N(15,20) verteilt sein. 1.3 Wenn bei einer Regression a=1 und b=1 ist, dann kann R2 = 0 und r < 0 sein. 1.4 Eine Lorenzkurve entspricht der Gleichverteilungsgraden, wenn alle Untersuchungseinheiten gleiche Merkmalsausprägungen haben. 1.5 Wenn sich bei einem für 2 Güter berechnetem Preisindex der eine Preis verdoppelt und der andere halbiert, nimmt der Index einen Wert von 100 an 1.6 Eine KQ-Regression basiert darauf, daß die Summe der quadrierten Residuen minimiert wird. 1.7 Ein Preisindex ist ein gewogenes geometrisches Mittel aus Preissteigerungen. 1.8 Der Modalwert läßt sich für metrisch skalierte Merkmale bestimmen. X 1.9 Das geometrische Mittel hat immer einen Wert über 1. X 1.10 Wenn sich alle Preise erhöhen, ist LP immer gleich PP. X X X X X X X 1.11 Die Grenzen eines Konfidenzintervalles sind Realisationen von Zufallsvariablen X X 1.12 Scheinkorrelationen weisen einen außergewöhnlich niedriges R2 auf 1.13 Die relative Häufigkeit unterscheidet sich von der prozentualen durch den Faktor 100 X X 1.14 Je größer der Anstieg der Regressionsgraden, desto größer ist der BravaisPearson-Korrelationskoeffizient 1.15 Gleitende Durchschnitte bereinigen u.a. saisonale Schwankungen X 1.16 Wenn man eine Stichprobe mit n > 50 zieht, ist das Merkmal in der Grundgesamtheit immer normalverteilt X 1.17 Eine Verhältnisskala ist automatisch stetig (kann beliebig viele Werte annehmen) X 1.18 Ein Preisindex von 125 für 2000 zur Basis 1995 bedeutet, daß die Preise im Durchschnitt um 5 % pro Jahr gestiegen sind. X 1.19 Ein Histogramm kann bei gleichen Klassenbreiten verwendet werden. X 1.20 Das LKM mißt die Fläche unter der Gleichverteilungsgrade. Statistik@Hogwarts - Schmidt - Wintersemester 2001/2002 (30) Seite 2 Lösungshinweise Aufgabe 2 Im Fach „zauberhafte Zahlenwelten“ werden die Grundlagen der trimagischen Statistik unterrichtet. [Gesamt: 14 Punkte] Aufgabe 2.1 Ordnen Sie die folgenden Merkmale unterschiedlichen Skalen und Merkmalstypen zu [4 Punkte] Einkommen der Eltern - Haarfarbe der Schüler - Alter der Lehrer - Anzahl der Stufen zum Schlafraum Geschlecht - Abstammung (Ausprägungen: Muggel oder Zauberer) - Schulfächer - Schulnoten - Anzahl der Punkte in der Abschlußprüfung Bei (möglicher) Einordnung in mehrere Zellen bitte Erläuterung bzw. Beispiel. Skala nominal ordinal metrisch Merkmalstyp diskret Haarfarbe, Geschlecht, Abstammung (aus z.B. Harrys Sicht), Schulfächer Abstammung (aus z.B. Malfoy-Sicht), Schulnoten Einkommen Alter (in Tagen o.ä.) stetig Aufgabe 2.2 Alter (in Jahren) Anzahl Stufen, Anzahl Punkte Erläutern Sie in Ihren eigenen Worten die unterschiedliche Skalierung der in einer Klausur erzielten Punkte und der daraus ermittelten Schulnoten. [2 Punkte] Punkte beinhalten die volle Information über absolute und relative Höhe, Abstände, Verhältnisse -> Verhältnisskala. Noten sind künstlich erzeugte Informationen, die nicht mehr die o.a. Informationen beinhalten, sondern nur noch die Reihenfolge (Rang) Aufgabe 2.3 Was folgert aus dieser Unterscheidung für statistische Auswertungen? Zwei Beispiele [2 Punkte] Es dürfen nur statistische Maße für metrische Daten benutzt werden. Bsp. Mittelwert: nur Median oder Modus, kein arithmetisches Mittel Bsp. Streuungsmaße: nur SW oder DAA (auf Basis des ZW), aber keine Varianz / StAbw Aufgabe 2.4 Für das Anmischen eines Zaubertrankes brauchen die Schüler unterschiedlich lange. Teilen Sie die folgenden Minuten-Angaben in 5 gleichgroße Klassen ein, ermitteln Sie absolute und prozentuale Häufigkeiten und zeichnen Sie ein Histogramm [6 Punkte] 3; 3; 6,5; 7,5; 9; 10; 10; 12; 15; 25; 25; 25; 30; 32; 32; 35 Klassierte Aufbereitung: Klasse Obergrenze 1 7 2 14 3 21 4 28 5 35 relat. Häufigkeit fi prozent. Hfk fi % 3 0,1875 18,75% 0,42857 5 0,3125 31,25% 0,71429 1 0,0625 6,25% 0,14286 3 0,1875 18,75% 0,42857 4 0,25 25,00% 0,57143 16 1 100,00% Summen: 0,80000 0,71429 Histogramm 0,70000 0,57143 0,60000 0,50000 Dichte = ni/ xi absolute Anzahl ni 0,42857 0,42857 0,40000 0,30000 0,20000 0,14286 0,10000 0,00000 1 2 3 4 5 Anmerk ung: Die Klassen sind gleich breit, so daß ein Histogramm nich unbedingt nötig war. Aber da es nun einmal gefragt war, müssen die Flächen aneinander stoßen Die Ermittlung der Dichte ändern nichts am Bild (gegenüber der Darstellung von ni), gehört aber grundsätzlich zum Histogramm. Statistik@Hogwarts - Schmidt - Wintersemester 2001/2002 Seite 3 Lösungshinweise Aufgabe 3 Für 8 Jahre liegen Werte für die Werbeausgaben X von Hogwarts in Goldsickeln für Zeitungsanzeigen und die jeweilige Schüler-Anmeldezahlen Y vor. [Gesamt: 18 Punkte] Aufgabe 3.1 Beschreiben Sie den Zusammenhang mit einer linearen KQ-Regressionsanalyse. [5 Punkte] Aufgabe 3: X: Werbeausgaben; Y: Anmeldungen Ermittlung R^2 (Yi^ - y_q) 2 (Yi - y_q) 2 1, 5 1 0,5 0 i 1 2 3 4 5 6 7 xi 12 22 19 33 16 18 22 Yi 92 128 122 170 105 115 125 xi2 144 484 361 1089 256 324 484 xi * Yi 1104 2816 2318 5610 1680 2070 2750 Yi^ 89,9 127,5 116,2 169,0 104,9 112,5 127,5 8 18 103 324 1854 160 960 3466 20202 0 0,2 0,4 0,6 0,8 1 3.1) REGRESSION: n= Mittelwerte: x_q = 20,0 y_q = 120,00 a= b= 1, 2 784,0 56,76 64,0 14,19 4,0 2398,05 2500,0 = 227,03 225,0 0,98176 56,76 25,0 56,76 25,0 112,5 56,76 289,0 960 3774 3916 8 = Wurzel R2 2 R = 0,964 3.2) Erwartete Werte: xi Yi^ Hilfsrechungen: 44,66 3,77 r 908,14 0 40 95040 / 2128 8016 / 2128 44,7 195,3 180 Streudiagramm (Punktwolke) 160 140 120 100 80 60 y = 3,7669x + 44,662 R2 = 0,9639 40 20 0 0 5 10 15 20 25 30 35 Schätzfunktion: y^ = 44,66 + 3,77 x Aufgabe 3.2 Welche Anmeldezahlen sind zu erwarten, wenn keine Werbung getätigt würde? Welche bei Einsatz von 40 Goldsickeln? [2 Punkte] s.o.: x = 0 => y^=44,7 (=a) x = 40 => y^ = 195,3 Aufgabe 3.3 Prof. Lupin bezweifelt die Gültigkeit dieser Aussagen und bezeichnet sie als „faulen Zauber“. Ermitteln Sie die Güte der Regression. Können Sie Lupins Zweifel zerstreuen? [4 Punkte] s.o. R2 = 0,964. Das ist ein recht hoher Wert und sollte Lupin überzeugen. Aufgabe 3.4 Was bedeutet das in Aufgabe 3.3 ermittelte Maß in Worten? [2 Punkte] Über 96% der Schwankungen der y-Werte werden durch die Regression erklärt. Aufgabe 3.5 Ermitteln Sie den Korrelationskoeffizienten nach Bravais/Pearson. [1 Punkt] Bei linearer Einfachregression gilt: r = Wurzel ( R2 ) r = 0,982 Aufgabe 3.6 Zeichnen Sie den Zusammenhang. In der Zeichnung sollen die Ursprungswerte, die geschätzten und die in Aufgabe 3.2 ermittelten Werte deutlich erkennbar sein. [4 Punkte] Siehe Abbildung oben Statistik@Hogwarts - Schmidt - Wintersemester 2001/2002 (18) Seite 4 Lösungshinweise Aufgabe 4 Die Schülerinnen und Schüler beschweren sich bei der Schulleitung, daß die Einkäufe in Hogsmead immer teurer werden. Der Ökonomielehrer, Prof. Keynes untersucht das Einkaufsverhalten der zauberhaften Kids in zwei aufeinanderfolgenden Jahren (J1, J2) und stellt folgende Zahlen fest (Preise in Knuts (Kn)): [10 Punkte] Produkt ME Tinte ml 10 11 Kn 5,80 Kn 5,70 Federn Stk. 5 4 Kn 2,40 Kn 2,20 Schokofrösche Stk. 18 30 Kn 2,20 Kn 1,80 Flaschen 3 5 Kn 0,90 Kn 1,00 Butterbier Menge J1 Menge J2 Preis J1 Preis J2 Aufgabe 4.1 Berechnen Sie den Preisindex nach Laspeyres für J1 zur Basis J2. [4 Punkte] s.u. LP=92,1 der Preisindex ist kleiner 100, die Preise sind also durchschnittlich gesunken. Aufgabe 4.2 Errechnen Sie die absolute und prozentuale Änderung der Ausgaben, die der Zaubernachwuchs für seine Lebenshaltung getätigt hat [3 Punkte] Preisindex Produkt ME Tinte ml Stk. Federn Schokofrösche Stk. Butterbier Flaschen Symbole: Verbrauch Menge J1 Menge J2 10 11 5 4 18 30 3 5 q0 q1 Preise Preis J1 Preis J2 Kn 5,80 Kn 5,70 Kn 2,40 Kn 2,20 Kn 2,20 Kn 1,80 Kn 0,90 Kn 1,00 p0 p1 Ausgaben p*q J1 p*q J2 Kn 58,00 Kn 62,70 Kn 12,00 Kn 8,80 Kn 39,60 Kn 54,00 Kn 2,70 Kn 5,00 Kn 112,30 Kn 130,50 Ausgabenentwicklung: Ermittlung der PREIS-Indices: Laspeyres: Index: LP p1 * q0 p0 * q0 57 11 32,4 3 103,4 0,9207 58 12 39,6 2,7 112,3 Steigerungen +16,2% (10) 92,1 Aufgabe 4.3 Was werden Keynes und Dumbledore den Beschwerdeführern antworten? (= Interpretieren Sie die in 4.1 und 4.2 ermittelten Befunde) [3 Punkte] Das Preisniveau in Hogsmead ist nicht gestiegen, sondern gefallen. Die Kids geben nur mehr aus, weil sie sich mehr Süßkram kaufen. Die Professoren werden Ihnen nahe legen, erst nach zu denken und sich dann laut zu beschweren. Eventuell steht im nächsten Jahr ein vertiefter Mathe oder Statistik-Schein auf dem Programm ;-) Statistik@Hogwarts - Schmidt - Wintersemester 2001/2002 Seite 5 Lösungshinweise Aufgabe 5 Im Unterricht Zaubertränke bei Prof. Snape gibt es zwei Gruppen von Schülern: 22 Schüler aus Gryffindor (Gruppe G) und 26 Schüler aus Hufflpuff (Gruppe H). Der durchschnittliche Punktabzug für Schwatzen während des Unterrichts beträgt bei G 10,1 Punkte und bei H 9,6 Punkte jeweils mit einer Standardabweichung von 2 Punkten. [Gesamt: 18 Punkte] Aufgabe 5.1 Snape geht davon aus, daß er beide Gruppen gleich behandelt. Testen Sie diese Aussage mit einem Konfidenzniveau von 95 %. [7 Punkte] Test auf Mittelwertdifferenz: (8.3.5 Zweistichprobentest) Informationen ni Mittelwerte Standardabweichungen Stichprobe 1 (G) n1 = 22 x 1 = 10,1 s1 = 2 Stichprobe 2 (M) n2 = 26 x 2 = 9,6 s2 = 2 1) Hypothese: Ho: x 1 - x 2 = 0 x 1 = x 2 2) = 0,05 lt. Aufgabenstellung 3) bei Mittelwertdifferenz keine Fallunterscheidung (auch keine Ermittlung von x oder p̂ ) 5) t 4) tc = 2,013 6) |tx| > |tc| ? 7) x1 x2 s12 s 22 n1 n2 = 0,86 Nein H0 nicht verwerfen ! Die Mittelwerte unterscheiden sich nicht signifikant // Snape behandelt die Gruppen ähnlich. Aufgabe 5.2 Prof. McGonagall geht davon aus, daß sie in diesem Schuljahr im Durchschnitt 10 Pluspunkte pro Schüler vergeben hat. In einer Stichprobe von 49 Schülern ergibt sich ein Mittelwert von 9,55 bei einer Standardabweichung von 1,4. Prüfen Sie mit einem Hypothesentest, ob McGonagalls Annahme richtig ist. Die Irrtumswahrscheinlichkeit sei 5 %, jede Abweichung sei unerwünscht, die Population normalverteilt. [7 Punkte] Beobachtungen Mittelwert Standardabweichung Verteilung Grundgesamtheit k.A. Behauptung: 0= 10 k.A. normalverteilt Stichprobe 49 Informationen 1) Hypothesen: x = 9,55 Ho: = o = 10 und H1: o zweiseitig kritischer Bereich 2) = 5 % lt. Aufgabenstellung 3) unbekannt, n > 30 3. Fall 4) F(zc) = 1- zc = 1,96 5) zx = -2,25 oder x = 0,2 6) |zx|< |zc| H0 verwerfen 7) 1,4 cu = 9,608 ; co = 10,392 x < co H0 verwerfen Aussage kann nicht aufrechterhalten werden, der Mittelwert dürfte unter 10 Punkten liegen. Aufgabe 5.3 Skizzieren Sie die Testentscheidung aus 5.2 zeichnerisch [4 Punkte] Zeichnen Sie für den Test des Mittelwertes für die Hypothese H0: die Dichtefunktion f(x); die Mittelwerte µ0 und x ; die Ober- und Untergrenzen des kritischen Bereiches; die Ablehungs- und Nichtablehnungsbereiche; Die Flächen von und (1 - ); stellen Sie dabei die Abszisse in zwei Varianten dar: eine Achse für den Stichprobenmittelwert x und eine Achse für die standardisierte Variable z. (vgl. Skizzen in Statistik-Büchern oder Materialsammlung) Achtung, die Abszisse ist ein x -Achse (keine x-Achse). Entsprechend war die Ordinate mit f( x ) (und f(z)) zu kennzeichnen! Statistik@Hogwarts - Schmidt - Wintersemester 2001/2002 (18) Seite 6