2.2. Schätzen von Vertrauensintervallen 2.2.1

2.2. Schätzen von Vertrauensintervallen
2.2.1. Schwankungsintervall
Beispiel: X = Betrag von Geldüberweisungen, normalverteilt, µ = 5000 €, σ = 1000 €
Zufallsstichprobe mit n = 100,
Schätzer für µ: X
Gesucht: Intervall, in dem X
Prof. Dr. H. G. Strohe
mit 95%iger Sicherheit liegt
Statistik II
II. 30
2.2.1. Schwankungsintervall
Allgemeiner:
X ~ N(µ, σ²) und Wahrscheinlichkeit α gegeben.
Schätzer für µ, X ~ N( µ , σ ² ) denn
n
σ =
2
x
σ2
........
Aufgabe: d so bestimmen, dass
P( µ − d ≤ X ≤ µ + d ) = 1 − α
Prof. Dr. H. G. Strohe
Statistik II
II. 31
2.2.1. Schwankungsintervall
Lösung:
Standardisierung:
Z=
X −µ
σ
~ N(0;1)
(Warum so??)
n
⎞
⎛
⎜ d
⎟
X
−
µ
d
⎟ = 1−α
P⎜ −
<
≤
σ
σ ⎟
⎜ σ
⎜
⎟
n
n
n⎠
⎝
Prof. Dr. H. G. Strohe
Statistik II
II. 32
2.2.1. Schwankungsintervall
P( − z < ( X − µ )
n
≤ z) = 1 − α
σ
⎞
⎛
⎜X −µ
⎟
α
≤ z⎟ =1−
P⎜
2
⎜ σ
⎟
⎜
⎟
⎝ n
⎠
(z = d
n
)
σ
Also:
z als 1-α/2-Quantil in Tafel bei 1-α/2 ablesen:
dann :
d = z1−α / 2
σ
n
P( µ − d ≤ X ≤ µ + d ) = 1 − ........
Grenzen des Schwankungsintervalls unabhängig vom Zufallsversuch "Stichprobe".
Prof. Dr. H. G. Strohe
Statistik II
II. 33
2.2.1. Schwankungsintervall
Beispiel: α = 5% = 0.05
1- α/2 = 0.975
z = z1 - α/2 = 1.96
Nach Tafel
d = z1−α / 2
σ
n
= 1.96 · 1000 / 10 = 196
Schwankungsintervall (4804; 5196]
Interpretation?
Stimmt näherungsweise auch bei Abweichen von Normalverteilung.
(Wann? Warum??)
Prof. Dr. H. G. Strohe
Statistik II
II. 34
2.2.2. Konfidenzintervall, Konfidenzniveau
Jetzt umgekehrte Fragestellung:
Schätzungen B^
0
B-d
B B+d
(wahr, fest)
B
(wahr, fest)
Konfidenzintervalle
Schwankungsintervall
Unterschied zwischen Konfidenz- und Schwankungsintervall
Prof. Dr. H. G. Strohe
Statistik II
II. 35
2.2.2. Konfidenzintervall, Konfidenzniveau
Grenzen des Konfidenzintervalls (Vertrauensgrenzen) hängen von Zufallsstichprobe ab,
| sie sind Zufallsvariablen
Interpretation:
Mit Wahrscheinlichkeit 1-α überdeckt ein Intervall [Πˆ − d, Πˆ + d) den wahren Parameter π
Prof. Dr. H. G. Strohe
Statistik II
II. 36
2.2.3. Intervallschätzung des Erwartungswertes
(=Durchschnitt in der Grundgesamtheit)
α
- Irrtumswahrscheinlichkeit
1- α - statistische Sicherheit oder Konfidenzniveau
a)
bei bekannter Varianz
X ~ N(µ; σ²),
µ unbekannt (aber fest)
Irrtumswahrscheinlichkeit α vorgegeben
Gesucht: Konfidenzintervall für µ = E(X)
Prof. Dr. H. G. Strohe
Statistik II
II. 37
2.2.3. Intervallschätzung des Erwartungswertes
Lösung:
1. Zufallsstichprobe vom Umfang n ziehen:
X1, . . ., Xn
2. Punktschätzung für Erwartungswert
?? (Wdh.)
3. Konfidenzintervall
P( X − d ≤ µ < X + d ) = 1 − α
Prof. Dr. H. G. Strohe
Statistik II
II. 38
2.2.3. Intervallschätzung des Erwartungswertes
Gesucht d; d = zσ x
σ x2 = ??
σ
σ ⎞
⎛
P⎜ X-z
≤µ<X +z
⎟ =1−α
n
n⎠
⎝
Standardisierung:
X −µ
⎛
⎞
P⎜ -z ≤
n < +z⎟ = 1−α
σ
⎝
⎠
Prof. Dr. H. G. Strohe
Statistik II
II. 39
2.2.3. Intervallschätzung des Erwartungswertes
also
z = z1−α
2
:
⎛
⎞
⎜ X-µ
⎟
α
< z α ⎟ = 1−
P⎜
1− ⎟
2
⎜ σ
2⎟
⎜
⎝ n
⎠
(s. 1.3.3)
Quantil aus Tafel ablesen und oben einsetzen
Prof. Dr. H. G. Strohe
Statistik II
II. 40
2.2.3. Intervallschätzung des Erwartungswertes
Verfahren kurz:
α ->
->
z1−α
(1-α/2-Quantil der Standard-Normalv.)
2
d = z1−α / 2σ x
-> Intervall
[ X − d; X + d )
( X aus Stichprobe)
Gilt bei großen n näherungsweise auch für nicht normalverteilte Variable.
Warum??
Bei kleinen Grundgesamtheiten und ohne Zurücklegen Korrekturfaktor für d: ??
(s. 2.1.2)
Prof. Dr. H. G. Strohe
Statistik II
II. 41
2.2.3. Intervallschätzung des Erwartungswertes
Beispiel: X: Höhe von Überweisungsaufträgen,
σ = 400 €,
Gesucht: Konfidenzintervall für unbekanntes µ
α = 0.01 (festgelegt)
Zufallsstichprobe (in €) :
2000,
2000,
1500,
1200,
Prof. Dr. H. G. Strohe
2700,
1500,
1700,
1100,
2500,
1600,
1800,
1200,
Statistik II
1200,
1400,
1100,
1100
II. 42
2.2.3. Intervallschätzung des Erwartungswertes
noch Beispiel:
x = 1600 €
α
1−
2
= 0,995
z1-α/2 = z0,995 = ........
d = z0,995
σ
n
(99,5%-Quantil)
= 2,58 ⋅ 400 / 4 = 258 €
Konfidenzintervall: [1342; 1858)
Interpretation?
Prof. Dr. H. G. Strohe
Statistik II
II. 43
2.2.3. Intervallschätzung des Erwartungswertes
b)
bei unbekannter Varianz (realistischer)
Wir hatten:
σ
⎛
P⎜ X − z1−α
≤
2 n
⎝
µ
< X − z1−α
2
σ ⎞
⎟ =1−α
n⎠
ist äquivalent zu:
α
⎛ X −µ
⎞
P⎜
≤ z1−α ⎟ = 1 −
2
2⎠
⎝σ / n
Prof. Dr. H. G. Strohe
Statistik II
II. 44
2.2.3. Intervallschätzung des Erwartungswertes
Jetzt Schätzung von σ2 durch Stichprobenvarianz S2:
S
S ⎞
⎛
P⎜ X-t
≤ µ < X +t
⎟ = 1−α
n
n⎠
⎝
t unbekannt
X und S Zufallsvariablen
Umformen zu:
⎞
⎛
⎟
⎜X −µ
α
< t ⎟ =1−
P⎜
2
⎟
⎜ S
⎟
⎜
⎠
⎝ n
Prof. Dr. H. G. Strohe
Statistik II
II. 45
2.2.3. Intervallschätzung des Erwartungswertes
Neue Zufallsvariable,
T=
( X − µ) ⋅ n
S
ist nicht normalverteilt.
hat t-Verteilung, von W.S. Gosset 1905, Pseudonym Student
Eigenschaften:
- Symmetrisch, E(T) = 0
- Flacher als Standardnormalverteilung
Prof. Dr. H. G. Strohe
Statistik II
II. 46
2.2.3. Intervallschätzung des Erwartungswertes
- Parameter: :, F und Freiheitsgrade FG = n - 1
- Für große n durch Standardnormalverteilung approximierbar
-
Prof. Dr. H. G. Strohe
Statistik II
II. 47
2.2.3. Intervallschätzung des Erwartungswertes
Vorgehen:
1. Vorgabe von α
2. Berechnen von 1 − α 2
3. Ablesen des Quantils
t1n−−α1
aus der t-Tafel
2
Prof. Dr. H. G. Strohe
Statistik II
II. 48
2.2.3. Intervallschätzung des Erwartungswertes
4. Ziehen der Zufallsstichprobe
5. Punktschätzungen X für µ und S für σ aus Stichprobe
s
n
6. Berechnen von
d = t1n−−α1 2
7. Konfidenzintervall [
x - d, x + d)
Bei kleinen Grundgesamtheiten und ohne Zurücklegen Korrekturfaktor für d: ??
Prof. Dr. H. G. Strohe
Statistik II
II. 49
2.2.3. Intervallschätzung des Erwartungswertes
Beispiel: X wie vorher, α = 1 %
Gleiche Stichprobenrealisationen
x = 1600 €;
n = 16;
Berechnen:
s= ∑
( xi − x )²
= 495
(n − 1)
1 - α/2 = ...........
t150.995 = 2.947 (99,5%-Quantil)
Prof. Dr. H. G. Strohe
Statistik II
II. 50
2.2.3. Intervallschätzung des Erwartungswertes
(noch Beispiel)
d = 2.947 • 495 /4 = 364.7
Konfidenzintervall [1235,3; ............)
Warum größer als vorher?
Stichprobenvarianz zufällig größer als σ;
Quantil t gesetzmäßig größer als z.
Warum??
Prof. Dr. H. G. Strohe
Statistik II
II. 51
2.2.3. Intervallschätzung des Erwartungswertes
Stichprobenumfang bei Intervallschätzungen
Bekannt: Streuung σ
Verlangt: Fehler kleiner als d
Irrtumswahrscheinlichkeit höchstens α
Gesucht: n
aus d = z
1-
α
2
σ
n
z12-α / 2 ⋅ σ²
folgt : n =
......2
Prof. Dr. H. G. Strohe
Statistik II
II. 52
2.2.4. Intervallschätzung von Anteilen oder Wahrscheinlichkeiten
Bisher:
Punktschätzung
H
(ML-Schätzer für Parameter p der Zweipunkt- und Binomialverteilung)
pˆ =
n
H ist binomialverteilt, exakte Intervallschätzung mit Binomialverteilung möglich.
Hier einfacher: (Wdh.)
pˆ = ∑
Xi
n
Prof. Dr. H. G. Strohe
X i ∈ {0,1}
Statistik II
II. 53
2.2.4. Intervallschätzung von Anteilen oder Wahrscheinlichkeiten
d.h. Stichprobendurchschnitt, assymptotisch normalverteilt.
Warum?
Wdh: Für np(1-p)>?? ann Verteilung von p̂ durch Normalverteilung angenähert werden
Schon bewiesen:
E( pˆ ) = .......
Var( pˆ ) = σ pˆ ² =
p (1 - p )
n
Einsetzen in Konfidenzintervall für Durchschnitt:
Prof. Dr. H. G. Strohe
Statistik II
II. 54
2.2.4. Intervallschätzung von Anteilen oder Wahrscheinlichkeiten
P ( X-z1−α σ x ≤ µ < X + z1−α σ x ) = 1 - α
Wir hatten:
2
(σ x 2 = Var( x ) =
2
2
σ
)
n
Das wird jetzt:
P ( pˆ -z1−α σ pˆ ≤ p < pˆ + z1−α σ pˆ ) = 1 - α
2
2
(σ pˆ 2 = Var( pˆ ) =
⎛
P⎜⎜ pˆ − z1−α
2
⎝
p (1-p)
)
n
p............
≤ p < pˆ + z1−α
2
n
Prof. Dr. H. G. Strohe
p............ ⎞
⎟ = 1−α
⎟
n
⎠
Statistik II
II. 55
2.2.4. Intervallschätzung von Anteilen oder Wahrscheinlichkeiten
Bestimmung des (1-α/2)-Quantils der Standardnormalverteilung mit
⎛
⎜
P⎜
⎜
⎜
⎝
⎞
⎟
α
pˆ − p
< z1−α / 2 ⎟ = 1 −
⎟
2
p (1 − p )
⎟
n
⎠
„Fehler“:
d = z1−α/ 2 ⋅
p( 1 − p)
n
Problem?
Sicher gilt:
p (1 − p ) ≤ ..........
Prof. Dr. H. G. Strohe
Warum?
Statistik II
II. 56
2.2.4. Intervallschätzung von Anteilen oder Wahrscheinlichkeiten
Praktische Näherung
pˆ ( 1 − pˆ )
n
d ≈ z1−α/ 2 ⋅
Vorgehen kurz:
1. Festlegen von α
2. Berechnen von
1−α
2
3. Ablesen von z1-α/2 aus Standardnormalverteilung (wenn npˆ (1 − pˆ ) > 9 )
4. Ziehen der Zufallstichprobe
5. Punktschätzung
pˆ = H
Prof. Dr. H. G. Strohe
n
für p
Statistik II
II. 57
2.2.4. Intervallschätzung von Anteilen oder Wahrscheinlichkeiten
6. Abschätzen von
d = z1−α ⋅
2
p (1 − p )
n
[ pˆ − d , pˆ + d )
7. Berechnen des Konfidenzintervalls
mit
P( pˆ − d ≤ p < pˆ + d ) = 1 − α
Prof. Dr. H. G. Strohe
Statistik II
II. 58
2.2.4. Intervallschätzung von Anteilen oder Wahrscheinlichkeiten
Beispiel (Marktforschung): Das neue Album von Marianne ist da!
Wie viel Prozent der Hausfrauen kennen sie?
95% Sicherheit gewünscht
Zufallsstichprobe von
n = 200 ergibt h = 40.
Punktschätzung: p̂ = 40/ 200
Prof. Dr. H. G. Strohe
Statistik II
II. 59
2.2.4. Intervallschätzung von Anteilen oder Wahrscheinlichkeiten
noch Beispiel:
α = 0,05
1−
α
2
= 0,975;
d ≈ 1,96 ⋅ 0,2 ⋅
z0,975 = ..............
0,8
= 1,96 ⋅ 0,028 = 0,055
200
Intervallschätzung: [0.145, .........)
d.h.?
Prof. Dr. H. G. Strohe
Statistik II
II. 60
2.2.4. Intervallschätzung von Anteilen oder Wahrscheinlichkeiten
Notwendiger Stichprobenumfang
Forderung: Fehler geringer als d.
Sicherheitswahrscheinlichkeit mindestens 1 - α
Wir hatten
d = z1−α ⋅
2
Also jetzt
p (1 − p )
n
z12−α / 2 ⋅ p (1 − p )
n=
.........²
Prof. Dr. H. G. Strohe
Statistik II
II. 61
2.2.4. Intervallschätzung von Anteilen oder Wahrscheinlichkeiten
Problem:
p und p̂ unbekannt
- sicher: p(1-p) ≤ 0,25
- oder Abschätzungen,
z.B. p < 0,1 oder p > 0,9 =>
Prof. Dr. H. G. Strohe
p(1-p) < 0,09
Statistik II
II. 62
2.2.4. Intervallschätzung von Anteilen oder Wahrscheinlichkeiten
Beispiel: Wählerbefragung zum Anteil der Grünen.
Abschätzung: Sicher unter 10%.
α=5%, d = ± 1 Prozentpunkt gefordert.
n = 1,96 2 ⋅ 0,09
0,0001
= 3457,44
Interpretation und
Anwendung?
Prof. Dr. H. G. Strohe
Statistik II
II. 63