Schließende Statistik

Werbung
TU Dortmund
Wintersemester 2009/2010 – Statistik für Ökonomen
Kapitel 3 – Schließende Statistik
Bemerkung 3.34:
Die hier betrachteten Konfidenzintervalle für unbekannte Erwartungswerte sind
umso schmaler,
• je größer der Stichprobenumfang n ist,
• je kleiner die (geschätzte) Standardabweichung σ (bzw. σ̂) ist,
• je kleiner das Konfidenzniveau 1 − α bzw. je größer die Irrtumswahrscheinlichkeit α ist.
Dr. Karsten Webel
330
TU Dortmund
Wintersemester 2009/2010 – Statistik für Ökonomen
Kapitel 3 – Schließende Statistik
Beispiel 3.37: (Fortsetzung Bsp. 3.30 & 3.33)
a) Wieviele Studierende müssen befragt werden, damit das 95%-Konfidenzintervall für die mittlere Wartezeit nicht breiter ist als vier Minuten?
b) Wieviele mittelständische Unternehmen müssen befragt werden, damit das
90%-Konfidenzintervall für den Anteil der Betriebe, die bei Lockerung des
Kündigungsschutzes zusätzliche Mitarbeiter einstellen wollen, nicht breiter
als zehn Prozentpunkte ist?
Dr. Karsten Webel
331
TU Dortmund
Wintersemester 2009/2010 – Statistik für Ökonomen
Kapitel 3 – Schließende Statistik
Beispiel 3.37: (Fortsetzung)
zu a)
bisher:
L = Vo − Vu = 14, 7 − 9, 8 = 4, 9
= 4 Minuten & 54 Sekunden
jetzt:
!
L≤4
Dr. Karsten Webel
332
TU Dortmund
Wintersemester 2009/2010 – Statistik für Ökonomen
Kapitel 3 – Schließende Statistik
Beispiel 3.37: (Fortsetzung)
dazu:
L = Vo − Vu
= X̄ + u1− α2
= 2u
1− α
2
also:
!
L≤4
⇔
n≥
µ
µ
¶
σ
σ
√ − X̄ − u1− α2 √
n
n
σ
√
n
2 u1− α2 σ
4
¶2
=
µ
2 · 1, 645 · 5
4
¶
= 24, 01
Es müssen mindestens 25 Studierende befragt werden.
Dr. Karsten Webel
333
TU Dortmund
Wintersemester 2009/2010 – Statistik für Ökonomen
Kapitel 3 – Schließende Statistik
Beispiel 3.37: (Fortsetzung)
zu b)
bisher:
L = Vo − Vu = 0, 5 − 0, 3 = 0, 2
= 20 Prozentpunkte
jetzt:
!
L ≤ 0, 1
Dr. Karsten Webel
334
TU Dortmund
Wintersemester 2009/2010 – Statistik für Ökonomen
Kapitel 3 – Schließende Statistik
Beispiel 3.37: (Fortsetzung)
dazu:
L = Vo − Vu
= p̂ + u1− α2
µ
¶
σ̂
σ̂
√ − p̂ − u1− α2 √
n
n
σ̂
= 2 u1− α2 √
n
Problem: L hängt nun auch über σ̂ von n ab
Dr. Karsten Webel
335
TU Dortmund
Wintersemester 2009/2010 – Statistik für Ökonomen
Kapitel 3 – Schließende Statistik
Beispiel 3.37: (Fortsetzung)
p
Lösung: Abschätzung durch σ̂ = p̂ (1 − p̂) ≤ 1/2
^
σ
0.5
0.25
0
0
0.25
0.5
0.75
1
^
p
Dr. Karsten Webel
336
TU Dortmund
Wintersemester 2009/2010 – Statistik für Ökonomen
Kapitel 3 – Schließende Statistik
Beispiel 3.37: (Fortsetzung)
Damit folgt:
L = 2 u1− α2
σ̂
1/2 u1− α2
√ ≤ 2 u1− α2 √ = √ .
n
n
n
Also:
!
L ≤ 0, 1
⇔
n≥
µ
u1− α2
0, 1
¶2
=
µ
1, 645
0, 1
¶2
= 270, 6025.
Es müssen mindestens 271 mittelständische Unternehmen befragt werden.
Dr. Karsten Webel
337
TU Dortmund
Wintersemester 2009/2010 – Statistik für Ökonomen
Kapitel 3 – Schließende Statistik
Bemerkung 3.38: Fazit zur Intervallschätzung
• Konfidenzintervalle für den unbekannten Erwartungswert einer Normalverteilung mit bekannter Varianz (Quantile der Standardnormalverteilung)
• Konfidenzintervalle für den unbekannten Erwartungswert einer Normalverteilung mit unbekannter Varianz (Quantile der t-Verteilung mit n − 1 Freiheitsgraden
• approximative Konfidenzintervalle für unbekannte Anteile einer Binomialverteilung (Quantile der Standardnormalverteilung)
Dr. Karsten Webel
338
Statistische Signifikanztests
TU Dortmund
Wintersemester 2009/2010 – Statistik für Ökonomen
Kapitel 3 – Schließende Statistik
Motivation:
Quelle: Süddeutsche Zeitung, 07. August 2009.
Dr. Karsten Webel
340
TU Dortmund
Wintersemester 2009/2010 – Statistik für Ökonomen
Kapitel 3 – Schließende Statistik
Motivation:
• bisher: Punkt- und Intervallschätzungen für unbekannte Parameter einer
Verteilung, dabei keine Verwendung von Vorinformationen
• jetzt: Vorinformationen, Vermutungen über einzelne Parameter einer Verteilung oder über sonstige Eigenschaften einer Zufallsvariablen sind bekannt
( Nullhypothese“)
”
Dr. Karsten Webel
341
TU Dortmund
Wintersemester 2009/2010 – Statistik für Ökonomen
Kapitel 3 – Schließende Statistik
Beispiel 3.39: Wartezeiten beim ZfS (Fortsetzung Bsp. 3.19)
Das Zentrum für Studienangelegenheiten an der TU Dortmund behauptet, dass
die mittlere Wartezeit von Besuchern nicht mehr als zehn Minuten beträgt. Eine
Befragung von 16 zufällig ausgewählten Besuchern ergab folgende Wartezeiten
(in Minuten):
12, 20, 5, 15, 8, 1, 30, 25, 10, 4, 17, 11, 20, 10, 6, 2.
Nehmen Sie an, dass diese Wartezeiten Realisationen einer normalverteilten
Zufallsvariablen mit bekannter Standardabweichung σ = 5 sind.
Wie ist die Behauptung des Zentrums für Studienangelegenheiten zu bewerten?
Dr. Karsten Webel
342
TU Dortmund
Wintersemester 2009/2010 – Statistik für Ökonomen
Kapitel 3 – Schließende Statistik
Beispiel 3.39: Wartezeiten beim ZfS (Fortsetzung)
Situation:
uiv
X1, X2, . . . , X16 ∼ N (µ, 25).
Testproblem:
H0 : µ ≤ 10 gegen
Dr. Karsten Webel
H1 : µ > 10.
343
TU Dortmund
Wintersemester 2009/2010 – Statistik für Ökonomen
Kapitel 3 – Schließende Statistik
Beispiel 3.40: Salz in der Suppe
Ein skeptischer Mensagänger möchte an einem bestimmten Tag die Nullhypothese
Mindestens die Hälfte aller Suppen ist versalzen.“ überprüfen. Er will diese
”
Nullhypothese verwerfen, wenn von fünf zufällig ausgewählten Suppen keine
einzige versalzen ist.
Wie ist diese Testprozedur zu beurteilen?
Dr. Karsten Webel
344
TU Dortmund
Wintersemester 2009/2010 – Statistik für Ökonomen
Kapitel 3 – Schließende Statistik
Beispiel 3.40: Salz in der Suppe (Fortsetzung)
Situation:
uiv
X1, X2, . . . , X5 ∼ Bin (1, p) mit
Xi =
Testproblem:
H0 : p ≥ 0, 5 gegen


1,
i-te Suppe ist versalzen
.

0, sonst
H1 : p < 0, 5.
Testentscheidung:
Lehne H0 ab, wenn T =
5
X
Xi = 0
gilt.
i=1
Dr. Karsten Webel
345
TU Dortmund
Wintersemester 2009/2010 – Statistik für Ökonomen
Kapitel 3 – Schließende Statistik
Bemerkung 3.41: mögliche Konsequenzen einer Testentscheidung
Richter
Angeklagter
unschuldig
schuldig
Dr. Karsten Webel
Freispruch
Verurteilung
X
nicht gut
nicht gut
X
346
TU Dortmund
Wintersemester 2009/2010 – Statistik für Ökonomen
Kapitel 3 – Schließende Statistik
Bemerkung 3.41: mögliche Konsequenzen einer Testentscheidung (Fortsetzung)
Testentscheidung
Realität
Dr. Karsten Webel
Lehne H0 nicht ab
Lehne H0 ab
H0 wahr
X
Fehler 1. Art
H0 falsch
Fehler 2. Art
X
347
TU Dortmund
Wintersemester 2009/2010 – Statistik für Ökonomen
Kapitel 3 – Schließende Statistik
No test based upon a theory of probability can by itself
”
provide any valuable evidence of the truth or falsehood of a hypothesis.“
(Neyman & Pearson (1933), On the problem of the most efficient tests of
statistical hypotheses, Phil Trans R Soc Lond A 231, 289 – 337.)
Dr. Karsten Webel
348
TU Dortmund
Wintersemester 2009/2010 – Statistik für Ökonomen
Kapitel 3 – Schließende Statistik
Beispiel 3.42: Salz in der Suppe (Fortsetzung Bsp. 3.40)
Die Wahrscheinlichkeit, weniger als die Hälfte aller Suppen als versalzen einzuordnen, obwohl mindestens die Hälfte aller Suppen versalzen ist, beträgt:
P (Fehler 1. Art) = P (H0 ablehnen | H0 wahr)
= max P (T = 0 | p ≥ 0, 5)
p
= P (T = 0 | p = 0, 5), da T ∼ Bin (5, p)
µ ¶
5
· 0, 50 · 0, 55 = 0, 55
=
0
= 0, 03125 = 3, 125%.
Dr. Karsten Webel
349
TU Dortmund
Wintersemester 2009/2010 – Statistik für Ökonomen
Kapitel 3 – Schließende Statistik
Beispiel 3.42: Salz in der Suppe (Fortsetzung)
Die Wahrscheinlichkeit, mindestens die Hälfte aller Suppen als versalzen einzuordnen, obwohl weniger als die Hälfte aller Suppen versalzen ist, beträgt:
P (Fehler 2. Art) = P (H0 nicht ablehnen | H0 falsch)
= P (T > 0 | p < 0, 5)
= 1 − P (T = 0 | p < 0, 5),
µ ¶
5
· p0 · (1 − p)5
= 1−
0
da T ∼ Bin (5, p)
= 1 − (1 − p)5.
Dr. Karsten Webel
350
TU Dortmund
Wintersemester 2009/2010 – Statistik für Ökonomen
Kapitel 3 – Schließende Statistik
Beispiel 3.42: Salz in der Suppe (Fortsetzung)
p ∈ H1
P (Fehler 2. Art)
Dr. Karsten Webel
0,49
0,45
0,35
0,25,
0,05
96,550%
94,967%
88,397%
76,270%
22,622%
351
TU Dortmund
Wintersemester 2009/2010 – Statistik für Ökonomen
Kapitel 3 – Schließende Statistik
Beispiel 3.42: Salz in der Suppe (Fortsetzung)
P (H0 ablehnen)
1
0.75
0.5
0.25
0
0
H1
0.5
H0
1
p
Dr. Karsten Webel
352
TU Dortmund
Wintersemester 2009/2010 – Statistik für Ökonomen
Kapitel 3 – Schließende Statistik
Definition 3.43: Gütefunktion
Es sei θ ∈ Θ = Θ0 ∪ Θ1 mit Θ0 ∩ Θ1 = ∅. Gegeben sei weiter ein beliebiger Test
für das Testproblem
H0 : θ ∈ Θ0
gegen
H1 : θ ∈ Θ1.
Dann heißt die Funktion
g(θ) = P (H0 ablehnen | θ)
Gütefunktion des Tests.
Dr. Karsten Webel
353
TU Dortmund
Wintersemester 2009/2010 – Statistik für Ökonomen
Kapitel 3 – Schließende Statistik
Bemerkung 3.44:
• Interpretation:
Gütefunktion = P (Fehler 1. Art) auf H0
Gütefunktion = 1 − P (Fehler 2. Art) auf H1
• gleichzeitiges Minimieren beider Fehlerwahrscheinlichkeiten unmöglich
• gebe maximale Wahrscheinlichkeit für Fehler 1. Art vor ( Signifikanzniveau“)
”
und minimiere Wahrscheinlichkeit für Fehler 2. Art
Dr. Karsten Webel
354
TU Dortmund
Wintersemester 2009/2010 – Statistik für Ökonomen
Kapitel 3 – Schließende Statistik
Bemerkung 3.45:
Jeder statistische Signifikanztest kann nach folgendem Standardschema durchgeführt werden:
1. Aufstellen des Testproblems, Festlegung des Signifikanzniveaus α
2. Bestimmung einer geeigneten Prüfgröße sowie deren Verteilung unter H0
3. Festlegung des kritischen Bereichs (Verwerfungs- oder Ablehnbereichs)
4. Berechnung der Realisation der Prüfgröße anhand der gezogenen Stichprobe
5. Ablehnen von H0, wenn sich die Realisation der Prüfgröße im kritischen
Bereich befindet
Dr. Karsten Webel
355
TU Dortmund
Wintersemester 2009/2010 – Statistik für Ökonomen
Kapitel 3 – Schließende Statistik
f(x)
Bemerkung 3.45: (Fortsetzung)
Dichte unter H0
kritischer Bereich
kritischer Wert
Dr. Karsten Webel
356
Herunterladen