Budapester Wirtschaftshochschule Fakultät für Handel, Gastronomie und Tourismus, Studiengang Tourismus und Hotel Management STATISTIK 2 PRÜFUNG (2011/2012, 1. SEMESTER) JAN 4, 2012 1. Geben Sie 2 Anwendungen für den Chi-Quadrat-Test an. (6) Unabhängigkeitstest, Anpassungstest 2. Definieren Sie den Korrelogram. (8) Die graphische Darstellung der Folge der Autokorrelationskoeffizienten (rk) in Abhängigkeit von den Lags k in einem Koordinatensystem 3. a/ Falls wir haben 4 mal so viel Beobachtungen, der Konfidenzbereich wird…0.5...mal so Breit. (4) b/ Der Nationalität ist nominal skaliert (4) 4. Wir haben die folgende Punktenverteilung der Statistikklausur: Punkten 20- b.u. 30 30-b.u. 40 40-b.u. 50 50-60 Anzahl 12 14 10 4 Berechnen Sie die 25%, 50% und 90% Quantilen für die Punktenverteilung a/ mit der Hilfe der originalen Daten (9) Ohne eine Korrektur, man kann einfach die Mitte der Klasse anwenden: Wein n=40, n/4 ist ganz, x0.25 xn / 4 x( n / 41) 2 also ist der 25% Quantil (arithm. Mittel von die 10. und 11. Beobachtung in die geordnete Reihe), es ist 25 Punkte. Genau so für 50%-Quantil (Median), es ist die arithm. Mittel von die 20. und 21. Beobachtung in die geordnete Reihe, also 35 Punkte. 90% Quantil es ist die arithm. Mittel von die 36. und 37. Beobachtung in die geordnete Reihe, es ist (45+55)/2=50 Punkte. und b/ mit der Hilfe der angepasste Normalverteilung! (15) Arithm.Mittel: xbar=(12*25+14*35+10*45+4*55)/40=36,5 Punkte. Daraus die Varianz: (12*(25-36.5)^2+14*(35-36.5)^2+10*(45-36.5)^2+4*(55-36.5)^2)/39=95,128 und die Std.abweichung: s=9,75 Punkte. Die gewünschte Quantile für die Standardnormalverteilung (von die Tabelle): 25%: -0.674, 90%: 1.282. 50%: 0, Für unsere Verteilung es gibt xbar +s*q, also 25%: 36.5-0.674*9.75=29,9 Punkte, 50%: 36.5 Punkte, 90%: 36.5+1.282*9.75=49 Punkte. 5. Wir setzen es voraus, dass die Duchschnitt-temperaturen am Januar 4 in Budapest ein Standardabweichung von 3C haben. Die arithmetische Mittel der 25 Beobachtungen von die letzten Jahren beträgt -1.2C. Geben Sie ein Konfidenzbereich für die Erwartungswert der Temperaturen bei =0,01! (14) Der Intervall (die Standardabweichung wurde gegeben): ( x z1 / 2 n 3 (1,2 2,58 , x z1 / 2 25 n ) 3 ,1,2 2,58 25 ) 1,2 1.55 (2,75 C;0,35 C ) 6.Wir haben Stichproben von die Preise von Hamburger in Deutschland und in Italien. Können wir es beibehalten, dass die Preise im durchschnitt gleich sind in diese Länder (bei =0,05)? (16) Preise (Deutschland), in Euro 3.5 3.0 3.4 2.0 2.6 Preise (Italien), in Euro 2.6 3.2 3.3 2.9 2.0 Die Hypothesen: H0 m1=m2, H1 m1≠m2 Man kann die 2-Stichproben t-Test anwenden (die Stichproben sind unabhängig). Die Teststatistik: T (X 1 X 2 ) n n2 S 1 n 1n 2 2,9 2,8 10 0,57 25 0,28 weil S (n 1 1)S12 (n 2 1)S 22 n1 n 2 2 0,36 0,01 0,25 0,81 0,09 0,04 0,16 0,25 0,01 0,64 8 2,62 0,57 8 FG=8, Krit.Wert: 2,306, also wir können H0 nicht verwerfen, es kann sein, dass die Preise im durchschnitt in diese Länder gleich sind. 7. Wir haben die Deutschergebnisse in 4 Schulen untersucht. Wir vermuten, dass es hängt zusammen mit der wochentliche Anzahl der Deutschstunden. Deutschergebnisse 3.2 3.5 3.8 4.3 Deutschstunden 2 3 4 5 a/ Berechnen Sie die Regressionsgerade mit dem Anzahl der Deutschstunden als Einflussfaktor und die Deutschergebnisse als erklärte Variable. (12) xbar=3.5, ybar=3.7. Daraus die Koeffizienten der Regression: x n a i 1 i x yi y x n i 1 i x 2 0,3 *1,5 0,2 * 0,5 0,1 * 0,5 0,8 *1,5 0,36 2,25 0,25 0,25 2,25 b 3,7 0,36 * 3,5 2,44 xi yi geschaetzte Werte ( Residuen yˆi axi b ) ( yi yˆi ) ( yi yˆi )2 2 3.2 3,16 0,04 0,0016 3 3.5 3,52 -0,02 0,0004 4 3.8 3,88 -0,08 0,0064 5 4.3 4,24 0,06 0,0036 0 0,012 H0: a=a0=0 mit der t-test: (x x) t (aˆ a0 ) 2 i ̂ wo das Freiheitsgrad ist n-2 (wir haben diesmal 2 Parametern geschätzt). n ˆ y i 1 i yˆ i 2 n2 t (aˆ a0 ) 0,012 0,077 2 2 ( x x ) i ˆ 4,5 0,36 9,2 0,077 Der kritische Wert (für α=5%): t1,0.975=4,3 Also die Koeffizient a (die Trendkoeffizient) ist signifikant. H0: b=b0=0 t t bˆ b0 1 x2 ˆ n ( xi x ) 2 2,44 - 0 1 3.5 2 0,077 * 4 4.5 18,38 Der kritische Wert (für α=5%): t1,0.975=4,3 Also die b Koeffizient ist auch signifikant 8. Wir haben die folgende Kontingenztabelle für die Nationalität der Gäste in 3 Hotels. Kann man die Nullhypothese, dass diese Merkmale unabhängig sind bei =0,05 verwerfen? (16) Hotel ** Nationalität der Gäste deutsch ungarisch andere 12 10 18 *** 15 8 7 **** 13 4 13 Die Tabelle mit Randhäufigkeiten: Hotel Nationalität der Gäste deutsch ungarisch andere ** 12 18 10 40 *** 15 8 7 30 **** 13 4 13 30 30 30 100 40 Erwartete Häufigkeiten Hotel Nationalität der Gäste deutsch ungarisch andere ** 16 12 12 *** 12 9 9 **** 12 9 9 Daraus die Teststatistik: (12-16)2/16+(18-12)2/12+(10-12)2/12+(15-12)2/12+(8-9)2/9+(79)2/9+(13-12)2/12+(4-9)2/9+(13-9)2/9=1+3+1/3+3/4+1/9+4/9+1/12+25/9+16/9=10,2 FG=2*2=4, die kritische Wert h 4,0.95=9,49. Also wir können die Nullhypothese verwerfen, es ist wahrscheinlich, dass es gibt ein zusammenhang zwischen die Nationalität und die Hotelpreferenzen.