Blatt 8 SS 2004 D. Kahnert STATISTIK II BWL Klausurvorbereitung Aufgabe 1. Ein Markt wurde in den Jahren 2001, 2002 und 2003 von 3 Firmen beliefert. Es bezeichne xi die von der Firma i produzierte Anzahl von Maschinen. 2001 2002 2003 i xi xi xi 1 10000 30000 2 20000 30000 3 40000 30000 30000 a) Berechnen und zeichnen Sie jeweils die Lorenzkurve. b) Berechnen Sie jeweils den Gini-Koeffizienten. d) Überprüfen Sie Ihr Resultat aus b) durch erneute Berechnung des GiniKoeffizienten mit Hilfe der Formel P 2 · ni=1 i · xi n + 1 P − G= . n · ni=1 xi n Aufgabe 2. a) Die Zufallsvariable X sei exponential-verteilt mit der Dichte f (x) = se−sx (s > 0) für x ≥ 0. Bestimmen Sie E(X n ) für alle natürlichen Zahlen n. b) Zeigen Sie: Sind Zufallsvariablen X und Y unkorreliert (d.h. Kov(X, Y ) = E(XY ) − E(X)E(Y ) = 0), so gilt Kov(a1 X + a2 Y, b1 X + b2 Y ) = a1 b1 V (X) + a2 b2 V (Y ). Aufgabe 3. Eine Zufallsvariable X besitze eine Dichte , x<d 0 (d > 0). f (x) = 3d3 , x≥d x4 a) Bestimmen Sie E(X) und V (X). b) Wie kann man mit Hilfe von a) b1) d erwartungstreu schätzen? b2) d2 erwartungstreu schätzen? c) Wie kann man den Parameter d nach der Maximum-Likelihood-Methode schätzen, wenn eine Stichprobe x1 , x2 , . . . , xn vorliegt? Aufgabe 4. Aus einer Schachtel mit blauen und gelben Kugeln werden nacheinander 75 Kugeln mit Zurücklegen gezogen. Es sei bekannt, dass der Anteil der blauen Kugeln entweder 2/5 (Nullhypothese H0 ) oder aber 1/5 (Alternative H1 ) ist. Es werde H0 verworfen, wenn höchstens 20 blaue Kugeln gezogen werden. Bestimmen Sie näherungsweise (mit Hilfe von approximierenden Normalverteilungen) Wahrscheinlichkeiten für Fehler 1. und 2. Art. Aufgabe 5. Um Aufschluss über das Wahlverhalten, d.h. die Wahlbeteiligung und die Stimmabgabe verschiedener Bevölkerungsgruppen, zu bekommen, wird bei jeder Wahl der Abgeordneten des Europäischen Parlaments eine repräsentative Wahlstatistik erstellt. Dazu werden aus den rund 90000 Wahlbezirken rund 2900 Stichprobenwahlbezirke zufällig ausgewählt. In diesen Stichprobenwahlbezirken werden die amtlichen Stimmzettel mit Unterscheidungsaufdruck nach Geschlecht und Altersgruppe versehen. Statistiker K. interessiert sich für den Anteil der PDS-Wählerinnen unter den weiblichen Wählern der Altersgruppe 18 bis 20 Jahre. Dazu erzeugt er sich aus den obigen Daten Realisierungen x1 , . . . , xn ∈ {0, 1} von unabhängigen identisch b(1, p)-verteilten Zufallsvariablen X1 , . . . , Xn , wobei p = P[X1 = 1] die Wahrscheinlichkeit ist, dass eine zufällig ausgewählte Wählerin der Altersgruppe 18 bis 20 Jahre PDS wählt. a) Unter Verwendung der obigen Stichprobe schätzt Statistiker K. den Wert von p durch n p̂ = 1X xi . n i=1 Wie groß muss n mindestens sein, damit p̂ vom wahren Wert p mit Wahrscheinlichkeit (mindestens) 0.95 um nicht mehr als 0.02 abweicht? Anleitung: Seien X1 , . . . , Xn unabhängige Zufallsvariablen mit P[Xi = 1] = p und P[Xi = 0] = 1 − p(i = 1, . . . , n). Bestimmen Sie für p ∈ (0, 1) fest n (mit Hilfe des Zentralen Grenzwertsatzes) so, dass # " n 1 X Xi − p ≤ 0.02 ≈ 0.95 P n i=1 und maximieren Sie diese Schranke für n dann bezüglich p ∈ (0, 1). Hinweis: Nach dem Zentralen Grenzwertsatz gilt # n X 1 (Xi − EX1 ) ≤ x ≈ Φ(x). P √ p n · V (X1 ) i=1 " b) Sei nun n = 400. Bestimmen Sie unter Verwendung des zentralen Grenzwertsatzes das minimale δ ∈ R+ , für das für alle p ∈ (0, 1) gilt: " # n 1 X Xi − p ≤ δ ≥ 0.95 P n i=1