Hochschule für Handel, Gastronomie und Tourismus

Werbung
Budapester Wirtschaftshochschule
Fakultät für Handel, Gastronomie und Tourismus, Studiengang Tourismus und Hotel Management
STATISTIK 2 PRÜFUNG (2011/2012, 1. SEMESTER) JAN 4, 2012
1. Geben Sie 2 Anwendungen für den Chi-Quadrat-Test an. (6)
Unabhängigkeitstest, Anpassungstest
2. Definieren Sie den Korrelogram. (8)
Die graphische Darstellung der Folge der Autokorrelationskoeffizienten (rk) in Abhängigkeit von den Lags k
in einem Koordinatensystem
3. a/ Falls wir haben 4 mal so viel Beobachtungen, der Konfidenzbereich wird…0.5...mal so Breit. (4)
b/ Der Nationalität ist nominal skaliert (4)
4. Wir haben die folgende Punktenverteilung der Statistikklausur:
Punkten
20- b.u. 30
30-b.u. 40
40-b.u. 50
50-60
Anzahl
12
14
10
4
Berechnen Sie die 25%, 50% und 90% Quantilen für die Punktenverteilung
a/ mit der Hilfe der originalen Daten (9)
Ohne eine Korrektur, man kann einfach die Mitte der Klasse anwenden: Wein n=40, n/4 ist ganz,
x0.25 
xn / 4   x( n / 41)
2
also
ist der 25% Quantil (arithm. Mittel von die 10. und 11.
Beobachtung in die geordnete Reihe), es ist 25 Punkte.
Genau so für 50%-Quantil (Median), es ist die arithm. Mittel von die 20. und 21. Beobachtung in
die geordnete Reihe, also 35 Punkte.
90% Quantil es ist die arithm. Mittel von die 36. und 37. Beobachtung in die geordnete Reihe, es ist
(45+55)/2=50 Punkte.
und b/ mit der Hilfe der angepasste Normalverteilung! (15)
Arithm.Mittel: xbar=(12*25+14*35+10*45+4*55)/40=36,5 Punkte.
Daraus die Varianz: (12*(25-36.5)^2+14*(35-36.5)^2+10*(45-36.5)^2+4*(55-36.5)^2)/39=95,128 und die
Std.abweichung: s=9,75 Punkte.
Die gewünschte Quantile für die Standardnormalverteilung (von die Tabelle): 25%: -0.674,
90%: 1.282.
50%:
0,
Für unsere Verteilung es gibt xbar +s*q, also 25%: 36.5-0.674*9.75=29,9 Punkte,
50%: 36.5 Punkte,
90%: 36.5+1.282*9.75=49 Punkte.
5. Wir setzen es voraus, dass die Duchschnitt-temperaturen am Januar 4 in Budapest ein
Standardabweichung von 3C haben. Die arithmetische Mittel der 25 Beobachtungen von die letzten Jahren
beträgt -1.2C. Geben Sie ein Konfidenzbereich für die Erwartungswert der Temperaturen bei =0,01! (14)
Der Intervall (die Standardabweichung wurde gegeben):
( x  z1 / 2

n
3
(1,2  2,58 

, x  z1 / 2
25
n
)
3
,1,2  2,58 
25
)  1,2  1.55  (2,75 C;0,35 C )
6.Wir haben Stichproben von die Preise von Hamburger in Deutschland und in Italien. Können wir es
beibehalten, dass die Preise im durchschnitt gleich sind in diese Länder (bei =0,05)? (16)
Preise (Deutschland), in Euro
3.5
3.0
3.4
2.0
2.6
Preise (Italien), in Euro
2.6
3.2
3.3
2.9
2.0
Die Hypothesen: H0 m1=m2, H1 m1≠m2 Man kann die 2-Stichproben t-Test anwenden (die Stichproben sind
unabhängig). Die Teststatistik:
T
(X 1  X 2 )
n  n2
S 1
n 1n 2

2,9  2,8
10
0,57
25
 0,28
weil
S
(n 1  1)S12  (n 2  1)S 22

n1  n 2  2
0,36  0,01  0,25  0,81  0,09  0,04  0,16  0,25  0,01  0,64

8
2,62
 0,57
8
FG=8, Krit.Wert: 2,306, also wir können H0 nicht verwerfen, es kann sein, dass die Preise im durchschnitt
in diese Länder gleich sind.
7. Wir haben die Deutschergebnisse in 4 Schulen untersucht. Wir vermuten, dass es hängt zusammen mit der
wochentliche Anzahl der Deutschstunden.
Deutschergebnisse 3.2 3.5 3.8 4.3
Deutschstunden
2
3
4
5
a/ Berechnen Sie die Regressionsgerade mit dem Anzahl der Deutschstunden als Einflussfaktor und die
Deutschergebnisse als erklärte Variable. (12)
xbar=3.5, ybar=3.7. Daraus die Koeffizienten der Regression:
 x
n
a
i 1
i

 x yi  y
 x
n
i 1
i
x



2
0,3 *1,5  0,2 * 0,5  0,1 * 0,5  0,8 *1,5
 0,36
2,25  0,25  0,25  2,25
b  3,7  0,36 * 3,5  2,44
xi
yi
geschaetzte Werte
(
Residuen
yˆi  axi  b ) ( yi  yˆi )
( yi  yˆi )2
2 3.2
3,16
0,04
0,0016
3 3.5
3,52
-0,02
0,0004
4 3.8
3,88
-0,08
0,0064
5 4.3
4,24
0,06
0,0036
0
0,012
H0: a=a0=0 mit der t-test:
 (x  x)
t  (aˆ  a0 ) 
2
i
̂
wo das Freiheitsgrad ist n-2 (wir haben diesmal 2 Parametern geschätzt).
n
ˆ 
 y
i 1
i
 yˆ i 
2
n2

t  (aˆ  a0 ) 
0,012
 0,077
2
2
(
x

x
)
 i
ˆ
4,5
 0,36 
 9,2
0,077
Der kritische Wert (für α=5%): t1,0.975=4,3
Also die Koeffizient a (die Trendkoeffizient) ist signifikant.
H0: b=b0=0
t
t
bˆ  b0
1
x2
ˆ

n  ( xi  x ) 2
2,44 - 0
1 3.5 2
0,077 *

4 4.5
 18,38
Der kritische Wert (für α=5%): t1,0.975=4,3
Also die b Koeffizient ist auch signifikant
8. Wir haben die folgende Kontingenztabelle für die Nationalität der Gäste in 3 Hotels. Kann man die
Nullhypothese, dass diese Merkmale unabhängig sind bei =0,05 verwerfen? (16)
Hotel
**
Nationalität der Gäste
deutsch ungarisch
andere
12
10
18
***
15
8
7
****
13
4
13
Die Tabelle mit Randhäufigkeiten:
Hotel
Nationalität der
Gäste
deutsch
ungarisch
andere
**
12
18
10
40
***
15
8
7
30
**** 13
4
13
30
30
30
100
40
Erwartete Häufigkeiten
Hotel
Nationalität der Gäste
deutsch ungarisch andere
**
16
12
12
***
12
9
9
****
12
9
9
Daraus
die
Teststatistik:
(12-16)2/16+(18-12)2/12+(10-12)2/12+(15-12)2/12+(8-9)2/9+(79)2/9+(13-12)2/12+(4-9)2/9+(13-9)2/9=1+3+1/3+3/4+1/9+4/9+1/12+25/9+16/9=10,2
FG=2*2=4, die kritische Wert h 4,0.95=9,49. Also wir können die Nullhypothese verwerfen, es ist
wahrscheinlich, dass es gibt ein zusammenhang zwischen die Nationalität und die Hotelpreferenzen.
Herunterladen