Budapester Wirtschaftshochschule Fakultät für Handel, Gastronomie und Tourismus Studiengang Tourismus und Hotel Management STATISTIK 2 AUFGABEN 2012/ 8 1.) In der folgenden Tabelle haben wir Daten über die Lieblingsbiermarken von 200 Leuten. Alter/Lieblingsmarke Durstlöscher Hitzekühler Jung 50 30 Alt 10 50 Führen sie ein Unabhängigkeitstest mit =1% durch! Gute Laune 20 40 =0,01 m=2 und k=3 Formulierung der Hypothesen: H0: das Alter und die Lieblingsmarke sind unabhängig H1: sie sind nicht unabhängig Häufigkeiten und Randhäufigkeiten: Alter/Lieblingsmarke Jung Alt Randhäufigkeiten Erwartete Häufigkeiten 100 60 30 200 100 60 30 200 Durstlöscher Hitzekühler Gute Laune Randhäufigkeiten 50 30 20 100 10 50 40 100 60 80 60 200 100 80 40 200 100 80 40 200 100 60 30 200 100 60 30 200 Teststatistik: T 50 302 30 402 20 302 10 302 50 402 40 302 30 40 30 30 40 400 100 100 400 100 100 1000 200 38,33 30 40 30 30 40 30 30 40 Freiheitsgrad: (2-1)(3-1)=2 Die kritische Schranke: h0,99; 2 9,21 30 Kritische Region: 9,21; Die Testfunktion T=38,33 ist in der kritischen Region, deshalb H0 wird abgelehnt. Mit 1% Sicherheit man kann behaupten, dass es eine Zusammenhang zwischen Alter und Lieblingsmarke gibt. 2.) Anlässlich der Fußballeuropameisterschaft möchte die Illustrierte "Neue Zeit" prüfen, ob Fussball immer noch ein reiner "Männersport" ist. Die Leserinnen und Leser sind aufgefordert in der Redaktion anzurufen und anzugeben, ob ihr Interesse "sehr groß/gross", "mittelmässig" oder "klein/ nicht vorhanden" ist. Nach drei harten Tagen hat die Praktikantin Frau Meyer 1182 Anrufen entgegengenommen und erstellt folgende Tabelle: Interesse Geschlecht Frauen Männer sehr gross/gross 95 320 mittelmässig 160 154 klein/ nicht vorhanden 155 298 Ist das Interesse an Fussball unabhängig vom Geschlecht? (Signifikanzniveau 5%) =0,05 m=3 und k=2 Formulierung der Hypothesen: H0: die Interesse und das Geschlecht sind unabhängig H1: sie sind nicht unabhängig Häufigkeiten und Randhäufigkeiten: Interesse/Geschlecht Sehr gross/gross Mittelmässig Klein/nicht vorhanden Randhäufigkeiten Erwartete Häufigkeiten 410 415 144 1182 410 314 108,9 1182 410 453 157,1 1182 Teststatistik: T Männer 320 154 298 772 Frauen 95 160 155 410 Randhäufigkeiten 415 314 453 1182 772 415 271 1182 772 314 205,1 1182 772 453 295,9 1182 95 1442 160 108,92 155 157,12 320 2712 144 108,9 154 205,12 298 295,92 205,1 Freiheitsgrad: (3-1)(2-1)=2 Die kritische Schranke: h0,95; 2 5,99 Kritische Region: 5,99; 295,9 157,1 62,3 271 Die Testfunktion T=62,3 ist in der kritischen Region, deshalb H0 wird abgelehnt. Mit 5% Sicherheit man kann behaupten, dass es eine Zusammenhang zwischen Interesse an Fussball und Geschlecht gibt. 3.) 20 Firmen wurden über ihren Jahreseinkommen (M Ft) befragt. Wir interessieren uns für die Verteilung der Einkommen. Kann man bei =5% behaupten, dass die Einkommen einer Normalverteilung mit dem Erwartungswert 100 M Ft und der Varianz 25 M Ft folgen? 99 93 101 98 90 103 96 97 105 102 109 89 97 91 102 93 98 97 100 98 H0: das Einkommen der Firmen ist N(100,52) H1: das Einkommen der Firmen ist nicht N(100,52) n=20 =0,05 Sei X: das Einkommen einer Firma Wir wissen, dass X~N(100,52) Wir haben 20 Beobachtungen, also 4 Klassen kann man bilden. Es ist nicht Nötig, die Quartile als Grenzpunkte zu wählen, eine mögliche Einteilung ist die folgende: <95 95- b.u. 100 100- b.u. 105 105Häufigkeiten 5 8 5 2 Erwartete Häufigkeiten 0,1587*20= 0,3413*20= 0,3413*20= 0,1587*20=3,17 3,17 6,83 6,83 X 100 95 100 P( X 95) P 1 1 1 1 0,8413 0,1587 5 5 1 95 100 X 100 100 100 P(95 X 100) P 0 1 0,1587 0,3413 5 5 5 2 P(100 X 105) P(105 X 100) 0,3413 P(105 X ) P( X 95) 0,1587 Teststatistik: (5 3,17) 2 (8 6,83) 2 (5 6,83) 2 (2 3,17) 2 T 2,18 3,17 6,83 6,83 3,17 Kein Parameter war geschätzt, so der Freiheitsgrad ist 4-1=3. Die kritische Schranke: h0,95;3 7,81 Kritische Region: 7,81; Die Testfunktion T=2,18 ist nicht in der kritischen Region, deshalb H0 wird nicht abgelehnt. Mit 5% Sicherheit man kann behaupten, dass das Einkommen der Firmen N(100,52) ist. 4.) Wir haben 100 vermutlich normalverteilte Zufallszahlen wie folgendes klassifiziert. Intervall 0-bis unter 0,25 0,25-bis unter 0,5 0,5-bis unter 0,75 Häufigkeit 28 22 19 Können wir die Nullhypothese (Normalverteilung) bei =10% verwerfen? 0,75-bis unter 1 31 n=100 =0,1 Klassenmitten: 0,125 x ˆ 0,375 0,625 0,875 28 0,125 22 0,375 19 0,625 31 0,875 0,5075 100 28 (0,125 0,5075) 2 ... 31 (0,875 0,5075) 2 0,3 100 1 Also wir können die Werte runden und N(0,5;0,32) anpassen. Die erwartete Häufigkeiten (vergessen wir es nicht, dass man alle reelle Zahlen einteilen soll): Intervall bis unter 0,25 0,25-bis unter 0,5 0,5-bis unter 0,75 0,75Wahrscheinlichkeit 0,2033 0,2967 0,2967 0,2033 Erwartete Häufigkeit 20,33 29,67 29,67 20,33 X 0,5 0,25 0,5 5 P( X 0,25) P 1 0,83 1 0,7967 0,2033 0,3 6 0,3 Teststatistik: (28 20,33) 2 (22 29,67) 2 (19 29,67) 2 (31 20,33) 2 T 14,31 20,33 29,67 29,67 20,33 Wir haben 2 Parameter geschätzt, so der Freiheitsgrad ist 4-1-2=1. Die kritische Schranke: h0,9;1 2,71 Kritische Region: 2,71; Die Testfunktion T=14,31 ist in der kritischen Region, deshalb H0 wird abgelehnt. Mit 10% Sicherheit man kann behaupten, dass die Daten nicht Normalverteilt sind.