Budapester Wirtschaftshochschule Fakultät für Handel, Gastronomie und Tourismus Studiengang Tourismus und Hotel Management STATISTIK KLAUSUR 2.TEIL DES LEHRMATERIALS (2011/2012, 1. SEMESTER) DEZ. 14, 2011 LÖSUNGEN 1. Geben Sie 2 Anwendungen für den t-Test an. (4) Test für Mittelwert einer normalverteilten Stichprobe mit unbekannter Varianz, Test für die Gleichung der Mittelwert für zwei normalverteilten Stichproben, Test für Signifikanz der Koeffiziente 2. Definieren Sie die Varianzanalyse. (4) Die Fragestellung: Hat ein nominalskalierte Faktor Einfluss auf ein verhältnisskaliertes Merkmal? Man kann die Gleichung der Mittelwerte mit einer F-Test untersuchen. 3. Definieren Sie die Elastizität. Wie kann man sie schätzen? (4) Die Fragestellung: um wie viel Prozent ändert sich die abhängige Variable, wenn sich die Einflussfaktor um 1 % ändert? Die Schätzung: E y / y y x x / x x y 4. Wir haben die Durchschnittergebnisse von 5 Frauen und 5 Männer. Können wir es behaupten, dass Frauen ein signifikant besseres Ergebnis haben (bei =0,05)? (8) Ergebnisse der Frauen 3.5 3.0 3.9 4.0 4.6 Ergebnisse der Männer 2.6 3.2 4.3 2.9 4.0 Die Hypothesen: H0 m1=m2, H1 m1≠m2 Man kann die 2-Stichproben t-Test anwenden (die Stichproben sind unabhängig). Die Teststatistik: T (X1 X 2 ) n n2 S 1 n 1n 2 3,8 3,4 10 0,663 25 0,954 weil S (n 1 1)S12 (n 2 1)S 22 1,42 2,1 n1 n 2 2 8 FG=8, Krit.Wert: 2,306, also wir können H0 nict verwerfen, es kann sein, dass die Ergebnisse beide Geschlechte gleich ist. 5. Wir haben die Anzahl von Kraftfahrzeugen per 1000 Einwohner sowie das GDP (per Person und Jahr) in 3 Ländern untersucht. Kfz (pro 1000 Einw.) 550 850 1000 GDP (Tausend €) 20 70 85 a/ Berechnen Sie die Regressionsgerade mit dem GDP als Einflussfaktor und der KFz Anzahl als erklärte Variable. (6) b/ Sind die Koeffizienten signifikant? (8) ybar=800, xbar=58,33. Daraus die Koeffizienten der Regression: x n a i 1 i x yi y x n i 1 i x 15500 6,69 2316,7 2 b 800 6,69 * 58,33 409,8 xi yi geschaetzte Werte ( Residuen yˆi axi b ) ( yi yˆi ) ( yi yˆi )2 20 550 543,6 -6,4 40,96 70 850 878,1 28,1 789,61 85 1000 978,5 -21,5 464,4 0 1294,97 H0: a=a0=0 mit der t-test: (x x) t (aˆ a0 ) 2 i ̂ wo das Freiheitsgrad ist n-2 (wir haben diesmal 2 Parametern geschätzt). n ˆ y i 1 i yˆ i 2 n2 t (aˆ a0 ) 1294,97 35,98 1 (x i x)2 ˆ 6,69 Der kritische Wert (für α=5%): t1,0.975=12,71 Also die Koeffizient a (die Trendkoeffizient) ist nicht signifikant. H0: b=b0=0 t bˆ b0 1 x2 ˆ n ( xi x ) 2 2316,7 8,95 35,98 t 409,8 - 0 1 58,33 2 35,98 * 3 2316,7 8,5 Der kritische Wert (für α=5%): t1,0.975=12,71 Also die b Koeffizient ist auch nicht signifikant (weil die Stichprobe ist viel zu klein). 6. Wir haben IQ Tests in 2 Studentengruppen durchgeführt. In die ersten Gruppe, in der 16 Studenten waren, haben wir 100 als Durchschnitt bekommen und 10 als geschätzte Standardabweichung. In der zweiten Gruppe, mit 25 Studenten, war der Durchschnitt 110 und die geschätzte Standardabweichung 12. Können wir die Hypothese, dass beide Gruppen gleich intelligent sind, bei =0,05 verwerfen? (8) Weil wir haben unabhängige Stichproben, die 2-Stichproben-t-Test wird angewandt. X 100, Y 110 t n m2 nm(n m 2) nm X Y ( X i X ) 2 (Yi Y ) 2 16 * 25 * 39 41 100 110 2,77 100 *15 144 * 24 t n m 2,1 t 39,0.975 2,021 Weil der Wert der Statistik ist grösser als 2,021, wir können die Nullhypothese verwerfen, also die Gruppen sind mit grossen Wahrscheinlichkeit nicht gleich intelligent. 7. Die Größe von zwanzig, fünfjährigen Kindern wurde gemessen (die Ergebnisse, in cm sind in der folgenden Tabelle gegeben). Wir interessieren uns für die Verteilung der Höhe. Kann man bei =5% beibehalten, daß die Höhe einer Normalverteilung mit dem Erwartungswert 100 (cm) und der Varianz 16 (cm) folgt? (10) 99 101 90 96 105 109 97 102 98 100 93 98 103 97 102 89 91 93 97 98 Hier wird ein Chi-Quadrat Anpassungstest angewandt. Weil wir haben nicht sehr viele Daten, wir teilen die Daten in vier Klassen ein: Am besten sind diese so zu wählen, dass alle gleiche Wahrscheinlichkeit haben, also die Grenzen sind: m-2σ/3, m, m+2σ/3 also 97,3 100 102,7. Die beobachtete Haufigkeiten in diese Gruppen: 9 4 4 (falls 100 ist in Gruppe 3). Die Teststatistik: ( (9-5)2+(4-5)2+(4-5)2+(3-5)2)/5=5,4. FG=3 (Die Parametern wurde nicht geschätzt), Kritische Wert aus der Khi-Tabelle: 7,81. Also wir können die Nullhypothese nicht verwerfen, es kann sein dass die Höhendaten aus dieser Normalverteilung stamen. 8. Nehmen wir an, dass wir nach einer Regressionsberechnung die folgenden Residuen für unsere Zeitreihe bekommen haben: Jahr 2009 Quartal Anzahl der (Residuen) Gäste 2010 1 2 3 4 1 2 3 4 40 12 -18 -14 42 8 -40 -30 Berechnen Sie bitte den Autokorrelationskoeffizienten 1ter Ordnung! (8) Zeitintervall 1 2 3 4 5 6 7 8 40 12 -18 -14 42 8 -40 -30 1600 144 324 196 1764 64 1600 900 ut-1 40 12 -18 -14 42 8 -40 ut*ut-1 480 -216 252 -588 336 -320 1200 Anzahl der (Residuen, ut) Quadrierte Residuen Gäste Daraus die Autokorrelation erste Ordnung: (480-216+252-588+336-320+1200)/( 1600+144+324+196+1764+64+1600+900)=1144/6592=0,174, also es ist kein starke Zusammenhang zwischen die Nachbarwerte.