Binomialverteilung - Alternative Darstellung n Versuche mit 2

Werbung
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 5.1
Binomialverteilung - Alternative Darstellung
n Versuche mit 2 möglichen Ausgängen. Setze
Yj =



1 wenn Erfolg im j-ten Versuch


0 wenn kein Erfolg im j-ten Versuch
Y1, . . . , Yn sind 0-1-Zufallsgrößen (oder Bernoulli-verteilte Zufallsgrößen)
X=
n
X
Yj = Anzahl der Erfolge in n Versuchen
j=1
Versuche unabhängig und identisch
Y1, . . . , Yn u.i.v. mit
Ws(Yj = 1) = p, Ws(Yj = 0) = 1 − p
X ist B(n, p)-verteilt
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 5.2
Beispiele:
i) n Personen mit Kopfschmerzen erhalten neues Medikament
Yj =



1 wirkt beim j-ten Patienten


0 wirkt nicht beim j-ten Patienten
p = Ws(Yj = 1) Wirkungswahrscheinlichkeit
p = 0, 9
X=
”wirkt in 9 von 10 Fällen”
Pn
j=1 Yj ist B(n, p)-verteilt.
n = 20, X = 15. Ist dann p = 0.9 noch glaubhaft?
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 5.3
Für n = 20, p = 0.9 :
Ws(X ≤ 15)
=
15 X
20
k=0
Tabelle 1
=
k
0.9k (1 − 0.9)20−k
0, 0432 = 4, 32%
ii) n junge Kraftfahrer im 1. Jahr nach Führerscheinerwerb
Yj =



1 j-ter Fahrer unfallfrei (Erfolg)


0 j-ter Fahrer nicht unfallfrei (kein Erfolg)
p = Ws(Yj = 1) = Ws(”unfallfrei”)
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 5.4
iii) Umfrage unter Unternehmern:
”Rechnen Sie 2012 mit einer besseren, gleichbleibenden oder
schlechteren Geschäftslage als 2011?”
Ende 2012 Rückfrage:
Yj =



1 j-ter Unternehmer schätzte Entwicklung richtig ein


0 j-ter Unternehmer schätzte Entwicklung falsch ein
p = Ws (”korrekte Vorhersage der Geschäftsentwicklung”)
= Ws(Yj = 1)
X=
Pn
j=1 Yj = Anzahl korrekter Einschätzungen
ist B(n, p)-verteilt.
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 5.5
Spezialfall: Stichprobenziehen mit Zurücklegen
Population von N Objekten oder Personen
M davon haben bestimmtes Merkmal.
Wie groß ist der Anteil p = M
N der Objekte mit dem Merkmal?
Wähle nacheinander n Objekte, wobei bereits gewählte wieder
gewählt werden können
Stichprobe
X = Anzahl der Objekte in der Stichprobe, die das Merkmal besitzen
ist B(n, p)-verteilt:
c n Auswahlen von Objekten
n Versuche =
c Auswahl eines Objekts mit Merkmal.
”Erfolg” =
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 5.6
Wahrscheinlichkeitsgewichte der
Binomialverteilung mit n = 10, p = 0.5:
k
n−k , k = 0, . . . , n
Ws(X = k) = n
k p (1 − p)
Prof. Dr. J. Franke
n = 10, p = 0.1
Statistik II für Wirtschaftswissenschaftler 5.7
Prof. Dr. J. Franke
n = 100, p = 0.5
Statistik II für Wirtschaftswissenschaftler 5.8
Prof. Dr. J. Franke
n = 100, p = 0.1
Statistik II für Wirtschaftswissenschaftler 5.9
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 5.10
Modell: X ist B(n, p)-verteilt.
p =?
Schätzer für p :
X
p̂ =
n
Beispiel: Wahlumfrage
n = 2000 Personen werden nach
Wahlabsicht befragt, X = 118 wollen ihre Stimme der ABCPartei geben.
Stimmanteil p in der Gesamtwählerschaft?
Einzelversuch: Wähle Person rein zufällig aus Wählerschaft aus:
Erfolg: ABC-Wähler
Misserfolg: kein ABC-Wähler
p = Ws(Erfolg) = Wahrscheinlichkeit, dass es ABC-Wähler ist.
118
p̂ =
= 5, 8%
2000
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 5.11
Konfidenzintervalle für Wahrscheinlichkeiten
Beispiel: Wahlumfrage
men.
ABC-Partei erhält p̂ = 5, 8% Stim-
Aussagekräftiger: Stimmanteil liegt ziemlich sicher im Intervall
[5,2%, 6,3%].
Konfidenzintervalle für allgemeine Verteilungsparameter
Modell: Die Daten X1, . . . , XN sind unabhängig voneinander und
besitzen dieselbe Verteilungsfunktion Ws(Xj ≤ t) = Fϑ(t)
Fϑ bekannt bis auf den reellwertigen Parameter ϑ ∈ Θ ⊆ R. ϑ =?
Beispiele: a) B(n, p), ϑ = p
b) N (µ, σ 2), ϑ = µ
Θ = [0, 1]
Θ = (−∞, ∞)
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 5.12
X1, . . . , XN u.i.v. mit Ws(Xj ≤ t) = Fϑ(t)
Definition: Vorgegeben: 0 < α 1 (typisch: 0, 05, 0, 01, . . .)
Ein Konfidenzintervall zum (Sicherheits-) Niveau 1 − α (kurz:
(1−α)-Konfidenzintervall) für ϑ ist ein zufälliges Intervall [T1, T2]
mit Grenzen Ti = gi(X1, . . . , XN ), i = 1, 2, für das gilt:
Wsϑ([T1, T2] 3 ϑ) ≥ 1 − α
für alle ϑ ∈ Θ
Gleich, was der wahre Wert ϑ des Parameters ist:
der Intervallschätzer [T1, T2] überdeckt ihn mit hoher Wahrscheinlichkeit (≥ 1 − α).
Prof. Dr. J. Franke
n = 10, p = 0.5
Statistik II für Wirtschaftswissenschaftler 5.13
k + 0.5 − np Bessere Approximation: Ws(X ≤ k) ≈ Φ
√
npq
Prof. Dr. J. Franke
n = 10, p = 0.5
Statistik II für Wirtschaftswissenschaftler 5.14
Prof. Dr. J. Franke
n = 30, p = 0.5
Statistik II für Wirtschaftswissenschaftler 5.15
Prof. Dr. J. Franke
n = 30, p = 0.5
Statistik II für Wirtschaftswissenschaftler 5.16
Prof. Dr. J. Franke
n = 100, p = 0.5
Statistik II für Wirtschaftswissenschaftler 5.17
Prof. Dr. J. Franke
n = 100, p = 0.5
Statistik II für Wirtschaftswissenschaftler 5.18
Prof. Dr. J. Franke
n = 100, p = 0.1
Statistik II für Wirtschaftswissenschaftler 5.19
Prof. Dr. J. Franke
n = 100, p = 0.1
Statistik II für Wirtschaftswissenschaftler 5.20
Prof. Dr. J. Franke
n = 10, p = 0.1
Statistik II für Wirtschaftswissenschaftler 5.21
Prof. Dr. J. Franke
n = 10, p = 0.1
Statistik II für Wirtschaftswissenschaftler 5.22
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 5.23
Für α = 0, 05, (1 − α
2 )-Quantil von N (0, 1) = 1.96 ≈ 2

s
p̂ − 2
s

p̂(1 − p̂)
p̂(1 − p̂) 
, p̂ + 2
n
n
ist ein approximatives 0,95-Konfidenzintervall für den Parameter
p der Binomialverteilung.
Anwendung: Wahlprognose, Stimmanteil bei 6% d.h. p̂ = 0, 06.
Sicher über die 5%-Hürde? n = 2000
0,95 - Konfidenzintervall:
s
0, 06 ± 2
0, 06 · 0, 94
= [0, 494 , 0, 706]
2000
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 5.24
4.8 Binomial- und Vorzeichentest
Modell: X binomialverteilt mit Parameter (n, p)
n groß, 0 p 1, so dass B(n, p) ≈ N (np, npq), q = 1 − p
Approximativer Binomialtest mit Teststatistik (q0 = 1 − p0)
X − n p0
0
X = √
n p0q0
≈ N (0, 1) wenn p = p0
Alternative
H0 verwerfen, wenn
H0 : p = p 0
p ≤ p0
H1 : p > p 0
X 0 > c1−α = (1 − α)-Quantil von N (0, 1)
H0 : p = p 0
p ≥ p0
H1 : p < p 0
X 0 < −c1−α
H0 : p = p 0
H1 : p 6= p0
|X 0| > c1− α
Hypothese
2
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 5.25
Für kleine n exakter Binomialtest:
bn,p,α = α-Quantil von B(n, p) (Tabelle 1 von ”innen nach außen”)
Tabelle 1
Verteilungsfunktion Fn,p(k) = Wsn,p(X ≤ k).
Suche zu α ein k mit Fn,p(k) ≈ α
Hypothese
k ≈ bn,p,α
Alternative
H0 verwerfen, wenn
H0 : p = p 0
p ≤ p0
H1 : p > p 0
X > bn,p0,1−α
H0 : p = p 0
p ≥ p0
H1 : p < p 0
X < bn,p0,α
H0 : p = p 0
H1 : p 6= p0
X > bn,p0,1− α oder X < bn,p0, α
2
2
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 5.26
Tabelle 1: Verteilungsfunktion der Binomialverteilungen für
ausgewählte Werte von (n, p)
X sei B(n, p)-verteilt. Die Tabelle enthält dann die Werte
Fn,p(k) = Ws(X ≤ k) für k = 0, . . . , n.
n=9
k
0
1
2
3
4
5
6
7
8
9
0.05
0.6302
0.9288
0.9916
0.9994
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
0.10
0.3874
0.7748
0.9470
0.9917
0.9991
0.9999
1.0000
1.0000
1.0000
1.0000
0.15
0.2316
0.5995
0.8591
0.9661
0.99 44
0.9994
1.0000
1.0000
1.0000
1.0000
p
0.20
0.1342
0.4362
0.7382
0.9144
0.9804
0.9969
0.9997
1.0000
1.0000
1.0000
0.25
0.0751
0.3003
0.6007
0.8343
0.9511
0.9900
0.9987
0.9999
1.0000
1.0000
0.30
0.0404
0.1960
0.4628
0.7297
0.9012
0.9747
0.9957
0.9996
1.0000
1.0000
0.35
0.0207
0.1211
0.3373
0.6089
0.8283
0.9464
0.9888
0.9986
0.9999
1.0000
Prof. Dr. J. Franke
n=9
k
0
1
2
3
4
5
6
7
8
9
Statistik II für Wirtschaftswissenschaftler 5.27
p
0.40
0.0101
0.0705
0.2318
0.4826
0.7334
0.9006
0.9750
0.9962
0.9997
1.0000
0.45
0.0046
0.0385
0.1495
0.3614
0.6214
0.8342
0.9502
0.9909
0.9992
1.0000
0.50
0.0020
0.0195
0.0898
0.2539
0.5000
0.7461
0.9102
0.9805
0.9980
1.0000
0.55
0.0008
0.0091
0.0498
0.1658
0.3786
0.6386
0.8505
0.9615
0.9954
1.0000
0.60
0.0003
0.0038
0.0250
0.0994
0.2666
0.5174
0.7682
0.9295
0.9899
1.0000
0.65
0.0001
0.0014
0.0112
0.0536
0.1717
0.3911
0.6627
0.8789
0.0793
1.0000
α = 0, 05, n = 9, p = 0, 5:
Fn,p(1) = 0, 0195 ≈ 0, 05
bn,p,α ≈ 1
oder: Ersetze α durch α̃ = 0, 0195
bn,p,α̃ = 1
Prof. Dr. J. Franke
n=9
k
0
1
2
3
4
5
6
7
8
9
Statistik II für Wirtschaftswissenschaftler 5.28
p
0.70
0.0000
0.0004
0.0043
0.0253
0.0988
0.2703
0.5372
0.8040
0.9596
1.0000
0.75
0.0000
0.0001
0.0013
0.0100
0.0489
0.1657
0.3993
0.6997
0.9249
1.0000
0.80
0.0000
0.0000
0.0003
0.0031
0.0196
0.0856
0.2618
0.5638
0.8658
1.0000
0.85
0.0000
0.0000
0.0000
0.0006
0.0056
0.0339
0.1409
0.4005
0.7684
1.0000
0.90
0.0000
0.0000
0.0000
0.0001
0.0009
0.0083
0.0530
0.2252
0.6126
1.0000
0.95
0.0000
0.0000
0.0000
0.0000
0.0000
0.0006
0.0084
0.0712
0.3698
1.0000
α = 0, 95, n = 9, p = 0, 7:
Fn,p(8) = 0, 9596 ≈ 0, 95
bn,p,α ≈ 8
oder: Ersetze α durch α̃ = 0, 9596
bn,p,α̃ = 8
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 5.29
Anwendung des Binomialtests: Vorzeichentest
Neues Rezept für Tomatensuppe aus der Dose
8 Geschmackstester bewerten blind altes und neues Rezept (mit
0-10 Punkten)
Tester
A
B
C
D
E
F
G
H
Bewertung
alt
neu
6
8
4
9
5
4
8
7
3
9
6
9
7
7
5
9
Differenz
alt−neu
−2
−5
1
1
−6
−3
0
−4
Vorzeichen
−
−
+
+
−
−
0
−
Vereinfachung: Entferne Teilexperimente mit Vorzeichen 0 (Bindungen) aus der Stichprobe.
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 5.30
Alternative H1 : neu besser als alt
Hypothese H0 : neu nicht besser als alt,
d.h. Ws(+) ≥ 0.5
Modell + = Erfolg, n unabhängige, identische Versuche
n = Stichprobenumfang (nach Entfernen von Vorzeichen 0)
X = Anzahl der positiven Vorzeichen + ist B(n, p)-verteilt.
1
Hypothese: H0 : p = Ws(+) ≥ p0 = 2
1
Alternative: H1 : p = Ws(+) < p0 = 2
Beobachtet
X = 2, n = 7
Tabelle: b7,0.5,0.0625 = 1
X≥1
akzeptiere H0 auf Niveau 6,25%
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 5.31
Vergleich zweier Wahrscheinlichkeiten/Anteile (Skript S. 92)
Zwei Populationen, deren Mitglieder ein bestimmtes Merkmal haben können. Sind die beiden Anteile an Merkmalsinhabern gleich?
Beispiel: ABC-Wähler unter den männlichen bzw. unter den weiblichen Wahlberechtigten
Modell: X, Z unabhängig und jeweils binomialverteilt mit Parameter (n, p1) bzw. (m, p2)
Schätzer für p1, p2:
p̂1 =
X
,
n
p̂2 =
Hilfsgröße: p̂ =
Z
m
X +Z
n+m
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 5.32
X
Z
X +Z
,
p̂2 = ,
p̂ =
n
m
n+m
Unter der Hypothese H0 : p1 = p2 = p schätzen p̂1, p̂2, p̂ alle den
gemeinsamen Anteil p der Merkmalsinhaber in beiden Populationen.
p̂1 =
n, m groß, 0 p1, p2 1, so dass B(n, p1), B(m, p2) mit der Normalverteilung approximiert werden können. Dann:
Zweistichproben-Binomialtest mit Teststatistik (q̂ = 1 − p̂)
pˆ − p̂2
∆ = q1
n+m
n m p̂q̂
Intuition: p̂1 ≈ p̂2
≈ N (0, 1) wenn p1 = p2
∆≈0
H0 annehmen
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 5.33
Hypothese
Alternative
H0 verwerfen, wenn
H 0 : p1 = p2
p1 ≤ p2
H1 : p 1 > p 2
∆ > c1−α = (1 − α)-Quantil von N (0, 1)
H 0 : p1 = p2
p1 ≥ p2
H1 : p 1 < p 2
∆ < −c1−α
H 0 : p1 = p2
H1 : p1 6= p2
|∆| > c1− α
2
Beispiel:
Haben Angestellte und Angehörige der Geschäftsleitung unterschiedliche Einstellungen zu ethischem Verhalten im Geschäftsleben?
Frage in einer Studie:
Die Angst, erwischt zu werden und den Arbeitsplatz zu verlieren,
hat einen großen Einfluss auf ethisches Verhalten im Beruf - Ja
oder Nein?
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 5.34
Die Angst, erwischt zu werden und den Arbeitsplatz zu verlieren,
hat einen großen Einfluss auf ethisches Verhalten im Beruf - Ja
oder Nein?
Angestellte (n=755): 57 % Ja
Geschäftsleitung (m=616): 50 % Ja
Schätzer p̂1 = 0, 57 > p̂2 = 0, 50
signifikant oder zufällig?
Beobachtungen X = np̂1 ≈ 430 (gerundet),
Z = mp̂2 = 308
p̂ = 430+308
755+616 = 0, 538
Teststatistik: ∆ = q
0, 57 − 0, 50
755+616
755·616 0, 538 · 0, 462
∆ > 2, 326 = 99%-Quantil von N (0, 1)
werfen auf Niveau 1%
= 2, 586 > 2, 326
H0 : p1 ≤ p2 ver-
Herunterladen