Johann Wolfgang Goethe-Universität Frankfurt am Main Professur für Statistik und Ökonometrie (Empirische Wirtschaftsforschung) Fachbereich Wirtschaftswissenschaften Prof. Dr. Reinhard Hujer Mertonstraße 17 Postfach 11 19 32 D-60054 Frankfurt am Main Telefon: +49 (069) 798-28115 Fax +49 (069) 798-23673 E-Mail: [email protected] Frankfurt, 26. November 2002 Übungsaufgaben zu Statistik II im WS 02/03 Aufgabe 1 Für 8 voneinander unabhängige Personen, die im Erdgeschoß eines Hauses in einen Aufzug einsteigen, ist jeweils die Wahrscheinlichkeit in Etage 1,2,3 und 4 auszusteigen, wie folgt gegeben: 1a) Etage 1: 0,4 Etage 2: 0,3 Etage 3: 0,2 Etage 4: 0,1 Wieviele Kombinationsmöglichkeiten gibt es, dass von den 8 Personen 3 Passagiere in Etage 1, 2 Passagiere in Etage 2, 2 Passagiere in Etage 3 und 1 Passagier in Etage 4 aussteigen ? 1b) Wie groß ist die Wahrscheinlchkeit, dass 3 Passagiere in Etage 1, 2 Passagiere in Etage 2, 2 Passagiere in Etage 3 und 1 Passagier in Etage 4 aussteigen ? 1c) Beweisen Sie, dass die Symmetrieeigenschaft der Standardnormalverteilung FN(-x) = 1 - FN(x) die Beziehung − x p = x1− p zwischen dem p ⋅ 100 % Quantil x p und dem (1 − p ) ⋅ 100 % Quantil x1− p impliziert. ( ) Hinweis: FN x p = p 1 Aufgabe 2 2a) Die Merkmale X und Y sind unabhängig voneinander. Die zufälligen Ausprägungen des Vektors (X,Y) werden mit Hilfe der bivariaten Normalverteilung modelliert. Dabei ist die Randverteilung von X eine Normalverteilung mit µ x = 5 und σ x2 = 4 während die Parameter µ y = 7 und σ y2 = 1 die marginale Verteilung von Y definieren. Beschreiben Sie formal die gemeinsame Dichtefunktion von (X,Y). 2b) Sei X eine hypergeometrisch verteilte Zufallsvariable mit Dichtefunktion fH( x | N, n, M), wobei aus den insgesamt N Kugeln eine 2% -ige Zufallsstichprobe gezogen wird. Da die Bedingung n/N = 0,02 ≤ 0,05 erfüllt wird, kann die Zufallsvariable X auch approximatix durch eine Binomialverteilung beschrieben werden. Wie müssen die entsprechenden Parameter für die Versuchsanzahl sowie für die Erfolgswahrscheinlichkeit der zu verwendenden Binomialverteilung gewählt werden ? 2c) Erklären Sie das Ergebnis aus Teilaufgabe 2b). 2d) Welche Verteilungsform hat die Stichprobenfunktion X = 1 n X i , die ein arithmetisches Mittel n i =1 der unabhängig identisch verteilten Zufallsvariablen Xi mit E(Xi) = λ−1 und Var(Xi) = λ−2 ist ? Charakterisieren Sie die Verteilung von X durch den Erwartungswert und die Varianz. Aufgabe 3 3a) Zeigen Sie, daß für n unabhängige Stichprobenzüge X 1 ,..., X n mit E( X i ) = µ und 1 Var ( X i ) = σ 2 die Schätzfunktion σ~ 2 = ( X 1 − X n ) 2 erwartungstreu für σ2 ist. 2 Hinweis: Erweitern Sie die Differenz um µ ! 3b) Der notwendige Stichprobenumfang n ist für einen vorgegebenen absoluten Fehler ∆p (dichotome Grundgesamtheit, Modell mit Zurücklegen): n= z 2 p (1 − p ) ( ∆p )2 Beweisen Sie diese Behauptung. 3c) Zeigen Sie außerdem, daß n aus 3b) für p = 0,5 maximal ist. 2 Aufgabe 4 4a) Der Ausschußanteil einer sehr großen Warenlieferung beträgt 15 %. Die Sendung wird abgelehnt, wenn in einer Stichprobe vom Umfang 20 mehr als 3 fehlerhafte Stücke auftreten. Welche Wahrscheinlichkeit für die Ablehnung ist zu erwarten? 4b) In einer zu überprüfenden Warenlieferung sind drei unterschiedliche Produktionstypen S1 , S2 , S3 mit den Anteilen 60 %, 30 % bzw. 10 % enthalten. Wie groß ist die Wahrscheinlichkeit, daß bei einer zufälligen Entnahme von drei Teilen je ein Stück jedes Produkttyps zu finden ist? 4c) Ein Hersteller von Textilien will mit Hilfe einer Stichprobe aus einem Lagerbestand von 1.000 Textilien feststellen, wieviel Prozent seiner hergestellten Waren einen Webfehler haben. Es sollen die beiden alternativen Annahmen überprüft werden, daß entweder 5 % oder 15 % seiner Waren einen Webfehler aufweisen. Anhand einer Stichprobe vom Umfang n=10 (ohne Zurücklegen) soll nun entschieden werden, welcher dieser Anteile richtig ist. Die Wahrscheinlichkeiten für die möglichen Stichprobenergebnisse lauten: n 3 4 5 6 7 8 9 10 0,599 0,315 0,075 0,011 0,001 0,0001 0,0 0,0 0,0 0,0 0,0 p=15 % 0,197 0,347 0,276 0,130 0,040 0,009 0,001 0,0001 0,0 0,0 0,0 p=5 % 0 1 2 Wir nehmen an, daß in der Stichprobe zwei fehlerhafte Stücke enthalten sind. Für welchen Anteilswert in der Grundgesamtheit würden Sie sich entscheiden? Erklären Sie anhand dieses Beispiels, was Sie unter „Maximum Likelihood“ verstehen. 3 Aufgabe 5 5a) Die Lebensdauer einer Bildröhre sei normalverteilt mit dem Mittelwert µ = 3.000 Stunden und der Standardabweichung σ = 700 Stunden. Wie groß ist die Wahrscheinlichkeit, daß die Lebensdauer einer Bildröhre 5b) 1. mehr als 3.500 Stunden beträgt, 2. zwischen 2.720 und 3.700 Stunden liegt? Ein Fabrikant entwickelt eine neue Bildröhre und behauptet, daß diese eine längere Lebensdauer besitzt. Hierzu wird ein Experiment mit n = 25 dieser neuen Bildröhre durchgeführt (die Lebensdauer der neuen Bildröhre sei ebenfalls normalverteilt mit einer Standardabweichung von σ = 700 Std.). 1. Bestimmen Sie für den Test mit H 0: µ = µ 0 ≤ 3.000 gegen die Alternative H1: µ > 3.000 den kritischen Bereich für den Mittelwert ( α = 5% ). 2. Erläutern Sie anhand dieses Beispiels den Fehler 1. Art und den Fehler 2. Art. 3. Welcher Zusammenhang besteht zwischen der Operationscharakteristik und dem Fehler 2. Art? 4. Berechnen Sie die Wahrscheinlichkeit des Fehlers 2. Art für den Test, falls der „wahre“ Mittelwert für die Lebensdauer der neuen Bildröhre µ = 3.300 Stunden beträgt. Aufgabe 6 Eine im Jahr 1995 durchgeführte Befragung von 500 Frankfurter Studenten bezüglich der Höhe der Zimmermieten ergab eine durchschnittliche monatliche Miethöhe von 500 DM mit einer Standardabweichung von 110 DM. 6a) Errechnen Sie das 95 %-Konfidenzintervall und das 99 %-Konfidenzintervall für die durchschnittliche monatliche Miethöhe aller Frankfurter Studenten. Wie verändert sich das Intervall bei Vergrößerung der Wahrscheinlichkeit. 6b) Wie groß muß der Stichprobenumfang n sein, wenn mit einer Wahrscheinlichkeit von 95 % von µ lediglich Abweichungen in Höhe von ± 5 DM zugelassen sind? 6c) Eine zum gleichen Zeitpunkt erfolgte Befragung von 300 Marburger Studenten ergab eine durchschnittliche monatliche Zimmermiete von 400 DM mit einer Standardabweichung von 100 DM. Geben Sie ein 95 %-Konfidenzintervall für die Differenz der beiden Mittelwerte (= durchschnittliche Mietausgaben für Zimmer) an. 4 6d) Prüfen Sie mit einer Irrtumswahrscheinlichkeit von 1 %, ob aufgrund der Stichprobenergebnisse darauf geschlossen werden kann, daß die Marburger Studenten im Durchschnitt eine andere Miete zahlen als die Frankfurter Studenten Aufgabe 7 7a) Eine Befragung von 100 Personen im Hinblick auf die Wartezeiten bei Arztbesuchen ergab folgende Werte: Wartezeit (in Std.) Häufigkeit 0 < x ≤ 0,5 55 0,5 < x ≤ 1 30 1 < x ≤ 1,5 15 1,5 < x 0 Ermitteln Sie mit Hilfe des χ2 -Anpassungstests, ob die Häufigkeitsverteilung durch eine Exponentialverteilung mit einem geschätzten Parameter λ = 1,8 angenähert werden kann ( α = 0,05). 7b) Die Wartezeit der 100 beobachteten Personen verteilen sich wie folgt auf HNO- und Augenarzt: Wartezeit (in Std.) HNO-Arzt Augenarzt bis 0,5 20 35 0,5 bis 1,0 20 10 1,0 bis 1,5 6 9 Überprüfen Sie mit α = 0,01 die Hypothese, die Wartezeit sei unabhängig vom Arzttyp. 5 Aufgabe 8 Folgende Arbeitsnachfragefunktion wurde bestimmt: EMP = b1 ⋅ GDP b2 ⋅ WAGE b3 mit EMP = Beschäftigte Arbeitnehmer im Inland (Jahresdurchschnitt) GDP = Bruttoinlandsprodukt (in Mrd. DM, in Preisen von 1991) WAGE = Monatliches Bruttoeinkommen aus unselbständiger Arbeit je durchschnittlich beschäftigten Arbeitnehmer (in Preisen von 1991) Mit den entsprechenden Daten des Statistischen Bundesamtes (Fachserie 18, Reihe 1.1) für den Zeitraum von 1970 bis 1993 (n = 24) ließen sich für die alten Bundesländer folgende Rechenergebnisse ermitteln: ln GDPt = 182,83 ln WAGE t = 199,16 t t (ln GDPt )2 = 1393 . ,34 (ln WAGE t )2 = 1652 . ,99 t t ln EMPt ⋅ ln GDPt = 1841 . ,66 ln WAGE t ⋅ ln GDPt = 1517 . ,56 t t ln EMPt ⋅ ln WAGE t = 2.006,09 t und ∧ ∧ (ln EMPt − ln EMP t )2 = 0,00312 (ln EMP t − ln EMP )2 = 0,05606 t t sowie σb = 0,247573 σb = 0,047627 σb = 0,067286 . 1 8a) 2 3 Ermitteln Sie durch entsprechende Umformungen einen mit der Kleinst-Quadrate-Methode schätzbaren Ansatz für diese Arbeitsnachfragefunktion. Berechnen Sie für diese Funktion nach der Kleinst-Quadrate-Methode den Parameter b3 und interpretieren Sie dessen Wert. Die Werte der übrigen Koeffizienten sind: ∧ ln b1 = 8,950595 und b 2 = 0,532373 . 8b) Berechnen Sie das Bestimmtheitsmaß R2 für diese Regression und interpretieren Sie es. 8c) Überprüfen Sie, ob die geschätzten Parameter b2 und b3 signifikant von Null verschieden sind (Signifikanzniveau α = 0,05). 8d) Testen Sie die Signifikanz der Regressionsgleichung bei α = 0,025. 6