Hochschule für Handel, Gastronomie und Tourismus

Werbung
Budapester Wirtschaftshochschule
Fakultät für Handel, Gastronomie und Tourismus
Studiengang Tourismus und Hotel Management
STATISTIK KLAUSUR 2.TEIL DES LEHRMATERIALS (2011/2012, 1. SEMESTER) DEZ. 14, 2011
LÖSUNGEN
1. Geben Sie 2 Anwendungen für den t-Test an. (4)
Test für Mittelwert einer normalverteilten Stichprobe mit unbekannter Varianz,
Test für die Gleichung der Mittelwert für zwei normalverteilten Stichproben,
Test für Signifikanz der Koeffiziente
2. Definieren Sie die Varianzanalyse. (4)
Die Fragestellung: Hat ein nominalskalierte Faktor Einfluss auf ein verhältnisskaliertes Merkmal?
Man kann die Gleichung der Mittelwerte mit einer F-Test untersuchen.
3. Definieren Sie die Elastizität. Wie kann man sie schätzen? (4)
Die Fragestellung: um wie viel Prozent ändert sich die abhängige Variable, wenn sich die
Einflussfaktor um 1 % ändert? Die Schätzung:
E
y / y y x


x / x x y
4. Wir haben die Durchschnittergebnisse von 5 Frauen und 5 Männer. Können wir es behaupten, dass Frauen
ein signifikant besseres Ergebnis haben (bei =0,05)? (8)
Ergebnisse der Frauen
3.5
3.0
3.9
4.0
4.6
Ergebnisse der Männer
2.6
3.2
4.3
2.9
4.0
Die Hypothesen: H0 m1=m2, H1 m1≠m2 Man kann die 2-Stichproben t-Test anwenden (die Stichproben sind
unabhängig). Die Teststatistik:
T
(X1  X 2 )
n  n2
S 1
n 1n 2

3,8  3,4
10
0,663
25
 0,954
weil
S
(n 1  1)S12  (n 2  1)S 22
1,42  2,1

n1  n 2  2
8
FG=8, Krit.Wert: 2,306, also wir können H0 nict verwerfen, es kann sein, dass die Ergebnisse beide
Geschlechte gleich ist.
5. Wir haben die Anzahl von Kraftfahrzeugen per 1000 Einwohner sowie das GDP (per Person und Jahr) in
3 Ländern untersucht.
Kfz (pro 1000 Einw.) 550 850 1000
GDP (Tausend €)
20
70
85
a/ Berechnen Sie die Regressionsgerade mit dem GDP als Einflussfaktor und der KFz Anzahl als erklärte
Variable. (6)
b/ Sind die Koeffizienten signifikant? (8)
ybar=800, xbar=58,33. Daraus die Koeffizienten der Regression:
 x
n
a
i 1
i

 x yi  y
 x
n
i 1
i
x

15500
 6,69
2316,7


2
b  800  6,69 * 58,33  409,8
xi
yi
geschaetzte Werte
(
Residuen
yˆi  axi  b ) ( yi  yˆi )
( yi  yˆi )2
20
550
543,6
-6,4
40,96
70
850
878,1
28,1
789,61
85 1000
978,5
-21,5
464,4
0
1294,97
H0: a=a0=0 mit der t-test:
 (x  x)
t  (aˆ  a0 ) 
2
i
̂
wo das Freiheitsgrad ist n-2 (wir haben diesmal 2 Parametern geschätzt).
n
ˆ 
 y
i 1
i
 yˆ i 
2
n2

t  (aˆ  a0 ) 
1294,97
 35,98
1
 (x
i
 x)2
ˆ
 6,69 
Der kritische Wert (für α=5%): t1,0.975=12,71
Also die Koeffizient a (die Trendkoeffizient) ist nicht signifikant.
H0: b=b0=0
t
bˆ  b0
1
x2
ˆ

n  ( xi  x ) 2
2316,7
 8,95
35,98
t
409,8 - 0
1 58,33 2
35,98 *

3 2316,7
 8,5
Der kritische Wert (für α=5%): t1,0.975=12,71
Also die b Koeffizient ist auch nicht signifikant (weil die Stichprobe ist viel zu klein).
6. Wir haben IQ Tests in 2 Studentengruppen durchgeführt. In die ersten Gruppe, in der 16 Studenten waren,
haben wir 100 als Durchschnitt bekommen und 10 als geschätzte Standardabweichung. In der zweiten
Gruppe, mit 25 Studenten, war der Durchschnitt 110 und die geschätzte Standardabweichung 12. Können
wir die Hypothese, dass beide Gruppen gleich intelligent sind, bei =0,05 verwerfen? (8)
Weil wir haben unabhängige Stichproben, die 2-Stichproben-t-Test wird angewandt.
X  100, Y  110
t n m2 
nm(n  m  2)
nm
X Y
( X
i

 X ) 2   (Yi  Y ) 2
16 * 25 * 39
41
100  110
 2,77
100 *15  144 * 24
t n  m  2,1  t 39,0.975  2,021
Weil der Wert der Statistik ist grösser als 2,021, wir können die Nullhypothese verwerfen, also die
Gruppen sind mit grossen Wahrscheinlichkeit nicht gleich intelligent.
7. Die Größe von zwanzig, fünfjährigen Kindern wurde gemessen (die Ergebnisse, in cm sind in der
folgenden Tabelle gegeben). Wir interessieren uns für die Verteilung der Höhe. Kann man bei =5%
beibehalten, daß die Höhe einer Normalverteilung mit dem Erwartungswert 100 (cm) und der Varianz 16
(cm) folgt? (10)
99
101
90
96
105
109
97
102
98
100
93
98
103
97
102
89
91
93
97
98
Hier wird ein Chi-Quadrat Anpassungstest angewandt.
Weil wir haben nicht sehr viele Daten, wir teilen die Daten in vier Klassen ein: Am besten sind diese so zu
wählen, dass alle gleiche Wahrscheinlichkeit haben, also die Grenzen sind: m-2σ/3,
m,
m+2σ/3
also 97,3
100
102,7. Die beobachtete Haufigkeiten in diese Gruppen: 9
4
4
(falls 100 ist in Gruppe 3). Die Teststatistik: ( (9-5)2+(4-5)2+(4-5)2+(3-5)2)/5=5,4.
FG=3 (Die Parametern wurde nicht geschätzt), Kritische Wert aus der Khi-Tabelle: 7,81. Also wir können
die Nullhypothese nicht verwerfen, es kann sein dass die Höhendaten aus dieser Normalverteilung stamen.
8. Nehmen wir an, dass wir nach einer Regressionsberechnung die folgenden Residuen für unsere Zeitreihe
bekommen haben:
Jahr
2009
Quartal
Anzahl
der
(Residuen)
Gäste
2010
1
2
3
4
1
2
3
4
40
12
-18
-14
42
8
-40
-30
Berechnen Sie bitte den Autokorrelationskoeffizienten 1ter Ordnung! (8)
Zeitintervall
1
2
3
4
5
6
7
8
40
12
-18
-14
42
8
-40
-30
1600
144
324
196
1764
64
1600
900
ut-1
40
12
-18
-14
42
8
-40
ut*ut-1
480
-216
252
-588
336
-320
1200
Anzahl
der
(Residuen, ut)
Quadrierte Residuen
Gäste
Daraus
die
Autokorrelation
erste
Ordnung:
(480-216+252-588+336-320+1200)/(
1600+144+324+196+1764+64+1600+900)=1144/6592=0,174, also es ist kein starke Zusammenhang
zwischen die Nachbarwerte.
Herunterladen