Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 5.1 Binomialverteilung - Alternative Darstellung n Versuche mit 2 möglichen Ausgängen. Setze Yj = 1 wenn Erfolg im j-ten Versuch 0 wenn kein Erfolg im j-ten Versuch Y1, . . . , Yn sind 0-1-Zufallsgrößen (oder Bernoulli-verteilte Zufallsgrößen) X= n X Yj = Anzahl der Erfolge in n Versuchen j=1 Versuche unabhängig und identisch Y1, . . . , Yn u.i.v. mit Ws(Yj = 1) = p, Ws(Yj = 0) = 1 − p X ist B(n, p)-verteilt Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 5.2 Beispiele: i) n Personen mit Kopfschmerzen erhalten neues Medikament Yj = 1 wirkt beim j-ten Patienten 0 wirkt nicht beim j-ten Patienten p = Ws(Yj = 1) Wirkungswahrscheinlichkeit p = 0, 9 X= ”wirkt in 9 von 10 Fällen” Pn j=1 Yj ist B(n, p)-verteilt. n = 20, X = 15. Ist dann p = 0.9 noch glaubhaft? Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 5.3 Für n = 20, p = 0.9 : Ws(X ≤ 15) = 15 X 20 k=0 Tabelle 1 = k 0.9k (1 − 0.9)20−k 0, 0432 = 4, 32% ii) n junge Kraftfahrer im 1. Jahr nach Führerscheinerwerb Yj = 1 j-ter Fahrer unfallfrei (Erfolg) 0 j-ter Fahrer nicht unfallfrei (kein Erfolg) p = Ws(Yj = 1) = Ws(”unfallfrei”) Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 5.4 iii) Umfrage unter Unternehmern: ”Rechnen Sie 2012 mit einer besseren, gleichbleibenden oder schlechteren Geschäftslage als 2011?” Ende 2012 Rückfrage: Yj = 1 j-ter Unternehmer schätzte Entwicklung richtig ein 0 j-ter Unternehmer schätzte Entwicklung falsch ein p = Ws (”korrekte Vorhersage der Geschäftsentwicklung”) = Ws(Yj = 1) X= Pn j=1 Yj = Anzahl korrekter Einschätzungen ist B(n, p)-verteilt. Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 5.5 Spezialfall: Stichprobenziehen mit Zurücklegen Population von N Objekten oder Personen M davon haben bestimmtes Merkmal. Wie groß ist der Anteil p = M N der Objekte mit dem Merkmal? Wähle nacheinander n Objekte, wobei bereits gewählte wieder gewählt werden können Stichprobe X = Anzahl der Objekte in der Stichprobe, die das Merkmal besitzen ist B(n, p)-verteilt: c n Auswahlen von Objekten n Versuche = c Auswahl eines Objekts mit Merkmal. ”Erfolg” = Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 5.6 Wahrscheinlichkeitsgewichte der Binomialverteilung mit n = 10, p = 0.5: k n−k , k = 0, . . . , n Ws(X = k) = n k p (1 − p) Prof. Dr. J. Franke n = 10, p = 0.1 Statistik II für Wirtschaftswissenschaftler 5.7 Prof. Dr. J. Franke n = 100, p = 0.5 Statistik II für Wirtschaftswissenschaftler 5.8 Prof. Dr. J. Franke n = 100, p = 0.1 Statistik II für Wirtschaftswissenschaftler 5.9 Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 5.10 Modell: X ist B(n, p)-verteilt. p =? Schätzer für p : X p̂ = n Beispiel: Wahlumfrage n = 2000 Personen werden nach Wahlabsicht befragt, X = 118 wollen ihre Stimme der ABCPartei geben. Stimmanteil p in der Gesamtwählerschaft? Einzelversuch: Wähle Person rein zufällig aus Wählerschaft aus: Erfolg: ABC-Wähler Misserfolg: kein ABC-Wähler p = Ws(Erfolg) = Wahrscheinlichkeit, dass es ABC-Wähler ist. 118 p̂ = = 5, 8% 2000 Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 5.11 Konfidenzintervalle für Wahrscheinlichkeiten Beispiel: Wahlumfrage men. ABC-Partei erhält p̂ = 5, 8% Stim- Aussagekräftiger: Stimmanteil liegt ziemlich sicher im Intervall [5,2%, 6,3%]. Konfidenzintervalle für allgemeine Verteilungsparameter Modell: Die Daten X1, . . . , XN sind unabhängig voneinander und besitzen dieselbe Verteilungsfunktion Ws(Xj ≤ t) = Fϑ(t) Fϑ bekannt bis auf den reellwertigen Parameter ϑ ∈ Θ ⊆ R. ϑ =? Beispiele: a) B(n, p), ϑ = p b) N (µ, σ 2), ϑ = µ Θ = [0, 1] Θ = (−∞, ∞) Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 5.12 X1, . . . , XN u.i.v. mit Ws(Xj ≤ t) = Fϑ(t) Definition: Vorgegeben: 0 < α 1 (typisch: 0, 05, 0, 01, . . .) Ein Konfidenzintervall zum (Sicherheits-) Niveau 1 − α (kurz: (1−α)-Konfidenzintervall) für ϑ ist ein zufälliges Intervall [T1, T2] mit Grenzen Ti = gi(X1, . . . , XN ), i = 1, 2, für das gilt: Wsϑ([T1, T2] 3 ϑ) ≥ 1 − α für alle ϑ ∈ Θ Gleich, was der wahre Wert ϑ des Parameters ist: der Intervallschätzer [T1, T2] überdeckt ihn mit hoher Wahrscheinlichkeit (≥ 1 − α). Prof. Dr. J. Franke n = 10, p = 0.5 Statistik II für Wirtschaftswissenschaftler 5.13 k + 0.5 − np Bessere Approximation: Ws(X ≤ k) ≈ Φ √ npq Prof. Dr. J. Franke n = 10, p = 0.5 Statistik II für Wirtschaftswissenschaftler 5.14 Prof. Dr. J. Franke n = 30, p = 0.5 Statistik II für Wirtschaftswissenschaftler 5.15 Prof. Dr. J. Franke n = 30, p = 0.5 Statistik II für Wirtschaftswissenschaftler 5.16 Prof. Dr. J. Franke n = 100, p = 0.5 Statistik II für Wirtschaftswissenschaftler 5.17 Prof. Dr. J. Franke n = 100, p = 0.5 Statistik II für Wirtschaftswissenschaftler 5.18 Prof. Dr. J. Franke n = 100, p = 0.1 Statistik II für Wirtschaftswissenschaftler 5.19 Prof. Dr. J. Franke n = 100, p = 0.1 Statistik II für Wirtschaftswissenschaftler 5.20 Prof. Dr. J. Franke n = 10, p = 0.1 Statistik II für Wirtschaftswissenschaftler 5.21 Prof. Dr. J. Franke n = 10, p = 0.1 Statistik II für Wirtschaftswissenschaftler 5.22 Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 5.23 Für α = 0, 05, (1 − α 2 )-Quantil von N (0, 1) = 1.96 ≈ 2 s p̂ − 2 s p̂(1 − p̂) p̂(1 − p̂) , p̂ + 2 n n ist ein approximatives 0,95-Konfidenzintervall für den Parameter p der Binomialverteilung. Anwendung: Wahlprognose, Stimmanteil bei 6% d.h. p̂ = 0, 06. Sicher über die 5%-Hürde? n = 2000 0,95 - Konfidenzintervall: s 0, 06 ± 2 0, 06 · 0, 94 = [0, 494 , 0, 706] 2000 Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 5.24 4.8 Binomial- und Vorzeichentest Modell: X binomialverteilt mit Parameter (n, p) n groß, 0 p 1, so dass B(n, p) ≈ N (np, npq), q = 1 − p Approximativer Binomialtest mit Teststatistik (q0 = 1 − p0) X − n p0 0 X = √ n p0q0 ≈ N (0, 1) wenn p = p0 Alternative H0 verwerfen, wenn H0 : p = p 0 p ≤ p0 H1 : p > p 0 X 0 > c1−α = (1 − α)-Quantil von N (0, 1) H0 : p = p 0 p ≥ p0 H1 : p < p 0 X 0 < −c1−α H0 : p = p 0 H1 : p 6= p0 |X 0| > c1− α Hypothese 2 Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 5.25 Für kleine n exakter Binomialtest: bn,p,α = α-Quantil von B(n, p) (Tabelle 1 von ”innen nach außen”) Tabelle 1 Verteilungsfunktion Fn,p(k) = Wsn,p(X ≤ k). Suche zu α ein k mit Fn,p(k) ≈ α Hypothese k ≈ bn,p,α Alternative H0 verwerfen, wenn H0 : p = p 0 p ≤ p0 H1 : p > p 0 X > bn,p0,1−α H0 : p = p 0 p ≥ p0 H1 : p < p 0 X < bn,p0,α H0 : p = p 0 H1 : p 6= p0 X > bn,p0,1− α oder X < bn,p0, α 2 2 Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 5.26 Tabelle 1: Verteilungsfunktion der Binomialverteilungen für ausgewählte Werte von (n, p) X sei B(n, p)-verteilt. Die Tabelle enthält dann die Werte Fn,p(k) = Ws(X ≤ k) für k = 0, . . . , n. n=9 k 0 1 2 3 4 5 6 7 8 9 0.05 0.6302 0.9288 0.9916 0.9994 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.10 0.3874 0.7748 0.9470 0.9917 0.9991 0.9999 1.0000 1.0000 1.0000 1.0000 0.15 0.2316 0.5995 0.8591 0.9661 0.99 44 0.9994 1.0000 1.0000 1.0000 1.0000 p 0.20 0.1342 0.4362 0.7382 0.9144 0.9804 0.9969 0.9997 1.0000 1.0000 1.0000 0.25 0.0751 0.3003 0.6007 0.8343 0.9511 0.9900 0.9987 0.9999 1.0000 1.0000 0.30 0.0404 0.1960 0.4628 0.7297 0.9012 0.9747 0.9957 0.9996 1.0000 1.0000 0.35 0.0207 0.1211 0.3373 0.6089 0.8283 0.9464 0.9888 0.9986 0.9999 1.0000 Prof. Dr. J. Franke n=9 k 0 1 2 3 4 5 6 7 8 9 Statistik II für Wirtschaftswissenschaftler 5.27 p 0.40 0.0101 0.0705 0.2318 0.4826 0.7334 0.9006 0.9750 0.9962 0.9997 1.0000 0.45 0.0046 0.0385 0.1495 0.3614 0.6214 0.8342 0.9502 0.9909 0.9992 1.0000 0.50 0.0020 0.0195 0.0898 0.2539 0.5000 0.7461 0.9102 0.9805 0.9980 1.0000 0.55 0.0008 0.0091 0.0498 0.1658 0.3786 0.6386 0.8505 0.9615 0.9954 1.0000 0.60 0.0003 0.0038 0.0250 0.0994 0.2666 0.5174 0.7682 0.9295 0.9899 1.0000 0.65 0.0001 0.0014 0.0112 0.0536 0.1717 0.3911 0.6627 0.8789 0.0793 1.0000 α = 0, 05, n = 9, p = 0, 5: Fn,p(1) = 0, 0195 ≈ 0, 05 bn,p,α ≈ 1 oder: Ersetze α durch α̃ = 0, 0195 bn,p,α̃ = 1 Prof. Dr. J. Franke n=9 k 0 1 2 3 4 5 6 7 8 9 Statistik II für Wirtschaftswissenschaftler 5.28 p 0.70 0.0000 0.0004 0.0043 0.0253 0.0988 0.2703 0.5372 0.8040 0.9596 1.0000 0.75 0.0000 0.0001 0.0013 0.0100 0.0489 0.1657 0.3993 0.6997 0.9249 1.0000 0.80 0.0000 0.0000 0.0003 0.0031 0.0196 0.0856 0.2618 0.5638 0.8658 1.0000 0.85 0.0000 0.0000 0.0000 0.0006 0.0056 0.0339 0.1409 0.4005 0.7684 1.0000 0.90 0.0000 0.0000 0.0000 0.0001 0.0009 0.0083 0.0530 0.2252 0.6126 1.0000 0.95 0.0000 0.0000 0.0000 0.0000 0.0000 0.0006 0.0084 0.0712 0.3698 1.0000 α = 0, 95, n = 9, p = 0, 7: Fn,p(8) = 0, 9596 ≈ 0, 95 bn,p,α ≈ 8 oder: Ersetze α durch α̃ = 0, 9596 bn,p,α̃ = 8 Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 5.29 Anwendung des Binomialtests: Vorzeichentest Neues Rezept für Tomatensuppe aus der Dose 8 Geschmackstester bewerten blind altes und neues Rezept (mit 0-10 Punkten) Tester A B C D E F G H Bewertung alt neu 6 8 4 9 5 4 8 7 3 9 6 9 7 7 5 9 Differenz alt−neu −2 −5 1 1 −6 −3 0 −4 Vorzeichen − − + + − − 0 − Vereinfachung: Entferne Teilexperimente mit Vorzeichen 0 (Bindungen) aus der Stichprobe. Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 5.30 Alternative H1 : neu besser als alt Hypothese H0 : neu nicht besser als alt, d.h. Ws(+) ≥ 0.5 Modell + = Erfolg, n unabhängige, identische Versuche n = Stichprobenumfang (nach Entfernen von Vorzeichen 0) X = Anzahl der positiven Vorzeichen + ist B(n, p)-verteilt. 1 Hypothese: H0 : p = Ws(+) ≥ p0 = 2 1 Alternative: H1 : p = Ws(+) < p0 = 2 Beobachtet X = 2, n = 7 Tabelle: b7,0.5,0.0625 = 1 X≥1 akzeptiere H0 auf Niveau 6,25% Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 5.31 Vergleich zweier Wahrscheinlichkeiten/Anteile (Skript S. 92) Zwei Populationen, deren Mitglieder ein bestimmtes Merkmal haben können. Sind die beiden Anteile an Merkmalsinhabern gleich? Beispiel: ABC-Wähler unter den männlichen bzw. unter den weiblichen Wahlberechtigten Modell: X, Z unabhängig und jeweils binomialverteilt mit Parameter (n, p1) bzw. (m, p2) Schätzer für p1, p2: p̂1 = X , n p̂2 = Hilfsgröße: p̂ = Z m X +Z n+m Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 5.32 X Z X +Z , p̂2 = , p̂ = n m n+m Unter der Hypothese H0 : p1 = p2 = p schätzen p̂1, p̂2, p̂ alle den gemeinsamen Anteil p der Merkmalsinhaber in beiden Populationen. p̂1 = n, m groß, 0 p1, p2 1, so dass B(n, p1), B(m, p2) mit der Normalverteilung approximiert werden können. Dann: Zweistichproben-Binomialtest mit Teststatistik (q̂ = 1 − p̂) pˆ − p̂2 ∆ = q1 n+m n m p̂q̂ Intuition: p̂1 ≈ p̂2 ≈ N (0, 1) wenn p1 = p2 ∆≈0 H0 annehmen Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 5.33 Hypothese Alternative H0 verwerfen, wenn H 0 : p1 = p2 p1 ≤ p2 H1 : p 1 > p 2 ∆ > c1−α = (1 − α)-Quantil von N (0, 1) H 0 : p1 = p2 p1 ≥ p2 H1 : p 1 < p 2 ∆ < −c1−α H 0 : p1 = p2 H1 : p1 6= p2 |∆| > c1− α 2 Beispiel: Haben Angestellte und Angehörige der Geschäftsleitung unterschiedliche Einstellungen zu ethischem Verhalten im Geschäftsleben? Frage in einer Studie: Die Angst, erwischt zu werden und den Arbeitsplatz zu verlieren, hat einen großen Einfluss auf ethisches Verhalten im Beruf - Ja oder Nein? Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 5.34 Die Angst, erwischt zu werden und den Arbeitsplatz zu verlieren, hat einen großen Einfluss auf ethisches Verhalten im Beruf - Ja oder Nein? Angestellte (n=755): 57 % Ja Geschäftsleitung (m=616): 50 % Ja Schätzer p̂1 = 0, 57 > p̂2 = 0, 50 signifikant oder zufällig? Beobachtungen X = np̂1 ≈ 430 (gerundet), Z = mp̂2 = 308 p̂ = 430+308 755+616 = 0, 538 Teststatistik: ∆ = q 0, 57 − 0, 50 755+616 755·616 0, 538 · 0, 462 ∆ > 2, 326 = 99%-Quantil von N (0, 1) werfen auf Niveau 1% = 2, 586 > 2, 326 H0 : p1 ≤ p2 ver-