Wirtschaftsstatistik 2, Gruppe 3, letztes Update am 12. Mai 2014

Werbung
Wirtschaftsstatistik 2, Gruppe 3, letztes Update am 12. Mai 2014
Normalverteilung, Schätzverfahren, Testverfahren
Die Werte der Verteilungsfunktion Φ(x) für die Standardnormalverteilung finden Sie in der Literatur1 zum Kurs (die Seite 318-319).
1. Die Zufallsvariable X sei standardnormalverteilt. Mit welcher Wahrscheinlichkeit:
a) Ist X kleiner als 1?(84%)
b) Liegt X zwischen 1 und 2?(13%)
c) Ist X entweder größer als 2 oder kleiner als −2?(4%)
2. Wie verändert sich das Ergebnis im Beispiel 1c) falls X ∼ N (−1.5, 2).(Es wäre 38%)
3. Wir betrachten eine Zufallsstichprobe X1 , . . . , Xn , wobei Xi ∼ N (µ, σ 2 ) für jede i =
1, . . . , n.
a) Mit welcher Wahrscheinlichkeit ist X̄n kleiner als die Konstante µ?(50%)
b) Wie groß muss unsere Zufallsstichprobe sein (d.h. n =?), so dass P (X̄n > 0) = 99%,
angenommen dass µ = 4 und σ 2 = 1? (n ≥ 1)
In der folgenden Aufgabe sollten Sie die Zentrale Grenzwertsatz benutzen. Die Fragestellung
hier ist anders als die im Beispiel aus der Vorlesung. Überlegen Sie sich, was Sie eigentlich
berechnen sollen.
4. Sie wollen Ihre eigene Firma mit 100 Angestellten gründen. Jeder von Ihren Angestellten
würde einen Gehalt ungefähr in der Höhe von 1400 e (netto) monatlich erwarten. Die
Standardabweichung σ des Gehaltswunsches eines Angestellten ist 300 e. Mit wenigstens
wie viel Geld sollten Sie beim Budgetentwurf für die Lohnausgaben rechnen, so dass Sie
diese Ausgaben mit der Wahrscheinlichkeit von 99% nicht unterschätzen? (146990 e)
1
Brannath/Futschik/Krall: Statistik im Studium der Wirtschaftswissenschaften: Eine Einführung anhand von
Beispielen.
1
5. Jetzt ist es schon ein paar Jahren als Sie Ihre Firma gegründet haben. Der Firmenvorstand
wollte jetzt die Gehaltspolitik der Firma anschauen und beurteilen. Dafür haben Sie eine
Umfrage bei Ihren Angestellten durchführen. Die Ergebnisse dieser Umfrage werden Ihnen
später helfen Ihre Gehaltspolitik und anschließend auch die Personalpolitik zu optimieren.
Die Datenbank (zufriedenheit.txt) mit den Ergebnissen der Umfrage beträgt folgende Variable:
Id
Geschlecht
Dauer
Zufriedenheit
Ausbildung
Gehalt
die Identifikationsnummer des Angestellten (1 bis 100)
das Geschlecht des Angestellten (Frau, Mann)
die Dauer, die der Angestellte in Ihren Firma schon arbeitet (in Jahren)
die Zufriedenheit des Angestellten mit der Firma
(zufrieden, eher zufrieden, eher unzufrieden, unzufrieden)
die erreichte Ausbildung (Grundschule, Matura, Diplom)
monatlicher Gehalt (in e )
a) Schauen Sie sich die Daten gut an. Welche(n) von den Variablen konnten wir als
stetige Variable behandeln?(Gehalt)
In den folgenden Aufgaben haben Sie oft einen Teil des Outputs vom statistischen
Software R zur Verfügung.
b) Folgender Output zeigt die geschätzte Quantile der Variable Gehalt.
Quantil
Gehalt
0%
685.9
5%
948.6
10%
1038.8
25%
1189.1
50%
1371.8
75%
1611.0
90%
1875.0
95%
1933.8
Wie viel muss ein Angestellte monatlich verdienen, so dass er zwischen 5% Angestellten ist, die am besten verdienen?(mindestens 1933.8)
c) An der Abbildung 1 sind zwei Boxplot Grafiken. Beide bilden die geschätzte Quantile
der Variable Gehalt ab, ein für die Männer und ein für die Frauen in Ihrer Firma.
Überlegen Sie sich ob wir daraus schließen konnten, dass der Gehalt von Geschlecht
des Angestellten abhängt. Warum ja/nein?
(Hinweis: die Mediane vergleichen)
d) An der Abbildung 2 ist das Histogramm der Variable Gehalt. Überlegen Sie sich ob
Sie daraus schließen konnten, dass diese Variable normalverteilt ist. Warum ja/nein?
(Hinweis: mit der Glockenkurve vergleichen)
e) Konstruieren Sie das 95% Konfidenzintervall für den Erwartungswert der Variable
Gehalt. Welche Quantile brauchen Sie hier? (Vorsicht, die Varianz σ 2 kennen wir
nicht und müssen es aus den Daten schätzen d.h. statt σ 2 müssen wir den Schätzer
s2 benutzen!) Interpretieren Sie dieses Intervall.
(Hinweis: s = 308.84, X̄n = 1408.45, Qt99 (97.5%) = 1.98) (KI= (1347.17, 1469.72))
f) Würde sich die Länge des Konfidenzintervalles verändern, falls wir für Überdeckungswahrscheinlichkeit 99% ( statt üblichen 95%) wählen?(Ja, KI wird breiter.)
2
100%
2162.1
ID
Gehalt
3
1400.67
4
949.47
5
1299.6
6
1659.47
7
1191.93
8
1255.8
9
1466.87
10
1368.67
11
1168.27
Tabelle 1: Gehalt von 10 ausgewählten Angestellten.
6. In der Tabelle 1 haben wir, als repräsentative Stichprobe, 10 von unseren Angestellten
ausgewählt. Xi ist eine Zufallsvariable, die das Gehalt von i-ten Angestellten repräsentiert.
Wir nehmen an, dass Xi ∼ N (µ, σ 2 ) und dass Xi voneinander unabhängig sind. Benutzen
Sie die Tabelle 1:
a) Um den Punktschätzer für µ und σ zu bestimmen. Vergleichen Sie ihre Werte mit
den Werten, die der Software R aus der gesamten Datenbank berechnet hat, d.h. mit
X̄n = 1408.45 und s = 308.84. (X̄n = 1352.2, s = 238.3)
b) Zentrieren Sie Ihren neuen Punktschätzer für µ und bestimmen Sie dessen Verteilung.
(Beachten Sie den Unterschied zwischen zwei Fällen : Entweder σ = 300 oder σ ist
unbekannt.)
√
√
( n X̄nσ−µ ∼ N (0, 1), n X̄ns−µ ∼ t9 )
c) Benutzen Sie Ihre neue Punktschätzer aus 1b), um den 90% Konfidenzintervall für µ
zu bestimmen. Sagen Sie auch explizit, welche Quantile Sie benutzt haben.
(Falls σ− bekannt, d.h. QN (0,1) (95%) = 1.65 und das KI = (1195.7, 1508.7)
σ− unbekannt, d.h. Qt9 (95%) = 1.83 und das KI = (1214, 1490.3) )
7. Mit den Annahmen aus dem vorherigen Beispiel, berechnen Sie die konkrete Werte der
Teststatistik und Ablehnungsbereich für den Test der Hypothese H0 : µ = 1500 mit
Signifikanzniveau α = 5% 10%, wobei σ 2 unbekannt ist. (Hinweis : schauen Sie sich auch
die Seite 173 aus der Literatur2 zum Kurs an).
a) Finden Sie die passende Alternativhypothese. (H1 : µ 6= 1500)
b) Entscheiden Sie, ob wir die H0 auf dem 5% 10%3 Testniveau verwerfen sollten.
(Verwerfen, da | T |> Qt9 (95%), wobei T = −1.96.)
c) Den p-Wert dieses Tests finden wir im Software Output:
p-Wert = 0.038 0.0815
Benutzen Sie p-Wert um nochmal die H0 zu beurteilen. (Das Signifikanzniveau bleibt
α = 5% ) (Verwerfen, da α > p−Wert ist.)
2
Brannath/Futschik/Krall: Statistik im Studium der Wirtschaftswissenschaften: Eine Einführung anhand von
Beispielen.
3
Hier war vorher 5% Testniveau. Da müssten wir aber die Teststatistik mit dem Qt9 (97.5%) vergleichen. Würde
sich dann das Testergebnis ändern? Ja, da |T | < Qt9 (97.5%) = 2.262. Sie sehen, dass das Testergebnis auch davon
abhängt, welches Testniveau wir uns wählen.
3
12
1761.2
2000
Gehalt
1500
1000
Frau
Mann
Abbildung 1: Der Boxplot der Variable Gehalt für die Männer und Frauen.
4
25
20
15
frequency
10
5
0
1000
1500
Abbildung 2: Das Histogram der Variable Gehalt.
5
2000
Herunterladen