TU Dortmund Wintersemester 2009/2010 – Statistik für Ökonomen Kapitel 3 – Schließende Statistik Bemerkung 3.34: Die hier betrachteten Konfidenzintervalle für unbekannte Erwartungswerte sind umso schmaler, • je größer der Stichprobenumfang n ist, • je kleiner die (geschätzte) Standardabweichung σ (bzw. σ̂) ist, • je kleiner das Konfidenzniveau 1 − α bzw. je größer die Irrtumswahrscheinlichkeit α ist. Dr. Karsten Webel 330 TU Dortmund Wintersemester 2009/2010 – Statistik für Ökonomen Kapitel 3 – Schließende Statistik Beispiel 3.37: (Fortsetzung Bsp. 3.30 & 3.33) a) Wieviele Studierende müssen befragt werden, damit das 95%-Konfidenzintervall für die mittlere Wartezeit nicht breiter ist als vier Minuten? b) Wieviele mittelständische Unternehmen müssen befragt werden, damit das 90%-Konfidenzintervall für den Anteil der Betriebe, die bei Lockerung des Kündigungsschutzes zusätzliche Mitarbeiter einstellen wollen, nicht breiter als zehn Prozentpunkte ist? Dr. Karsten Webel 331 TU Dortmund Wintersemester 2009/2010 – Statistik für Ökonomen Kapitel 3 – Schließende Statistik Beispiel 3.37: (Fortsetzung) zu a) bisher: L = Vo − Vu = 14, 7 − 9, 8 = 4, 9 = 4 Minuten & 54 Sekunden jetzt: ! L≤4 Dr. Karsten Webel 332 TU Dortmund Wintersemester 2009/2010 – Statistik für Ökonomen Kapitel 3 – Schließende Statistik Beispiel 3.37: (Fortsetzung) dazu: L = Vo − Vu = X̄ + u1− α2 = 2u 1− α 2 also: ! L≤4 ⇔ n≥ µ µ ¶ σ σ √ − X̄ − u1− α2 √ n n σ √ n 2 u1− α2 σ 4 ¶2 = µ 2 · 1, 645 · 5 4 ¶ = 24, 01 Es müssen mindestens 25 Studierende befragt werden. Dr. Karsten Webel 333 TU Dortmund Wintersemester 2009/2010 – Statistik für Ökonomen Kapitel 3 – Schließende Statistik Beispiel 3.37: (Fortsetzung) zu b) bisher: L = Vo − Vu = 0, 5 − 0, 3 = 0, 2 = 20 Prozentpunkte jetzt: ! L ≤ 0, 1 Dr. Karsten Webel 334 TU Dortmund Wintersemester 2009/2010 – Statistik für Ökonomen Kapitel 3 – Schließende Statistik Beispiel 3.37: (Fortsetzung) dazu: L = Vo − Vu = p̂ + u1− α2 µ ¶ σ̂ σ̂ √ − p̂ − u1− α2 √ n n σ̂ = 2 u1− α2 √ n Problem: L hängt nun auch über σ̂ von n ab Dr. Karsten Webel 335 TU Dortmund Wintersemester 2009/2010 – Statistik für Ökonomen Kapitel 3 – Schließende Statistik Beispiel 3.37: (Fortsetzung) p Lösung: Abschätzung durch σ̂ = p̂ (1 − p̂) ≤ 1/2 ^ σ 0.5 0.25 0 0 0.25 0.5 0.75 1 ^ p Dr. Karsten Webel 336 TU Dortmund Wintersemester 2009/2010 – Statistik für Ökonomen Kapitel 3 – Schließende Statistik Beispiel 3.37: (Fortsetzung) Damit folgt: L = 2 u1− α2 σ̂ 1/2 u1− α2 √ ≤ 2 u1− α2 √ = √ . n n n Also: ! L ≤ 0, 1 ⇔ n≥ µ u1− α2 0, 1 ¶2 = µ 1, 645 0, 1 ¶2 = 270, 6025. Es müssen mindestens 271 mittelständische Unternehmen befragt werden. Dr. Karsten Webel 337 TU Dortmund Wintersemester 2009/2010 – Statistik für Ökonomen Kapitel 3 – Schließende Statistik Bemerkung 3.38: Fazit zur Intervallschätzung • Konfidenzintervalle für den unbekannten Erwartungswert einer Normalverteilung mit bekannter Varianz (Quantile der Standardnormalverteilung) • Konfidenzintervalle für den unbekannten Erwartungswert einer Normalverteilung mit unbekannter Varianz (Quantile der t-Verteilung mit n − 1 Freiheitsgraden • approximative Konfidenzintervalle für unbekannte Anteile einer Binomialverteilung (Quantile der Standardnormalverteilung) Dr. Karsten Webel 338 Statistische Signifikanztests TU Dortmund Wintersemester 2009/2010 – Statistik für Ökonomen Kapitel 3 – Schließende Statistik Motivation: Quelle: Süddeutsche Zeitung, 07. August 2009. Dr. Karsten Webel 340 TU Dortmund Wintersemester 2009/2010 – Statistik für Ökonomen Kapitel 3 – Schließende Statistik Motivation: • bisher: Punkt- und Intervallschätzungen für unbekannte Parameter einer Verteilung, dabei keine Verwendung von Vorinformationen • jetzt: Vorinformationen, Vermutungen über einzelne Parameter einer Verteilung oder über sonstige Eigenschaften einer Zufallsvariablen sind bekannt ( Nullhypothese“) ” Dr. Karsten Webel 341 TU Dortmund Wintersemester 2009/2010 – Statistik für Ökonomen Kapitel 3 – Schließende Statistik Beispiel 3.39: Wartezeiten beim ZfS (Fortsetzung Bsp. 3.19) Das Zentrum für Studienangelegenheiten an der TU Dortmund behauptet, dass die mittlere Wartezeit von Besuchern nicht mehr als zehn Minuten beträgt. Eine Befragung von 16 zufällig ausgewählten Besuchern ergab folgende Wartezeiten (in Minuten): 12, 20, 5, 15, 8, 1, 30, 25, 10, 4, 17, 11, 20, 10, 6, 2. Nehmen Sie an, dass diese Wartezeiten Realisationen einer normalverteilten Zufallsvariablen mit bekannter Standardabweichung σ = 5 sind. Wie ist die Behauptung des Zentrums für Studienangelegenheiten zu bewerten? Dr. Karsten Webel 342 TU Dortmund Wintersemester 2009/2010 – Statistik für Ökonomen Kapitel 3 – Schließende Statistik Beispiel 3.39: Wartezeiten beim ZfS (Fortsetzung) Situation: uiv X1, X2, . . . , X16 ∼ N (µ, 25). Testproblem: H0 : µ ≤ 10 gegen Dr. Karsten Webel H1 : µ > 10. 343 TU Dortmund Wintersemester 2009/2010 – Statistik für Ökonomen Kapitel 3 – Schließende Statistik Beispiel 3.40: Salz in der Suppe Ein skeptischer Mensagänger möchte an einem bestimmten Tag die Nullhypothese Mindestens die Hälfte aller Suppen ist versalzen.“ überprüfen. Er will diese ” Nullhypothese verwerfen, wenn von fünf zufällig ausgewählten Suppen keine einzige versalzen ist. Wie ist diese Testprozedur zu beurteilen? Dr. Karsten Webel 344 TU Dortmund Wintersemester 2009/2010 – Statistik für Ökonomen Kapitel 3 – Schließende Statistik Beispiel 3.40: Salz in der Suppe (Fortsetzung) Situation: uiv X1, X2, . . . , X5 ∼ Bin (1, p) mit Xi = Testproblem: H0 : p ≥ 0, 5 gegen 1, i-te Suppe ist versalzen . 0, sonst H1 : p < 0, 5. Testentscheidung: Lehne H0 ab, wenn T = 5 X Xi = 0 gilt. i=1 Dr. Karsten Webel 345 TU Dortmund Wintersemester 2009/2010 – Statistik für Ökonomen Kapitel 3 – Schließende Statistik Bemerkung 3.41: mögliche Konsequenzen einer Testentscheidung Richter Angeklagter unschuldig schuldig Dr. Karsten Webel Freispruch Verurteilung X nicht gut nicht gut X 346 TU Dortmund Wintersemester 2009/2010 – Statistik für Ökonomen Kapitel 3 – Schließende Statistik Bemerkung 3.41: mögliche Konsequenzen einer Testentscheidung (Fortsetzung) Testentscheidung Realität Dr. Karsten Webel Lehne H0 nicht ab Lehne H0 ab H0 wahr X Fehler 1. Art H0 falsch Fehler 2. Art X 347 TU Dortmund Wintersemester 2009/2010 – Statistik für Ökonomen Kapitel 3 – Schließende Statistik No test based upon a theory of probability can by itself ” provide any valuable evidence of the truth or falsehood of a hypothesis.“ (Neyman & Pearson (1933), On the problem of the most efficient tests of statistical hypotheses, Phil Trans R Soc Lond A 231, 289 – 337.) Dr. Karsten Webel 348 TU Dortmund Wintersemester 2009/2010 – Statistik für Ökonomen Kapitel 3 – Schließende Statistik Beispiel 3.42: Salz in der Suppe (Fortsetzung Bsp. 3.40) Die Wahrscheinlichkeit, weniger als die Hälfte aller Suppen als versalzen einzuordnen, obwohl mindestens die Hälfte aller Suppen versalzen ist, beträgt: P (Fehler 1. Art) = P (H0 ablehnen | H0 wahr) = max P (T = 0 | p ≥ 0, 5) p = P (T = 0 | p = 0, 5), da T ∼ Bin (5, p) µ ¶ 5 · 0, 50 · 0, 55 = 0, 55 = 0 = 0, 03125 = 3, 125%. Dr. Karsten Webel 349 TU Dortmund Wintersemester 2009/2010 – Statistik für Ökonomen Kapitel 3 – Schließende Statistik Beispiel 3.42: Salz in der Suppe (Fortsetzung) Die Wahrscheinlichkeit, mindestens die Hälfte aller Suppen als versalzen einzuordnen, obwohl weniger als die Hälfte aller Suppen versalzen ist, beträgt: P (Fehler 2. Art) = P (H0 nicht ablehnen | H0 falsch) = P (T > 0 | p < 0, 5) = 1 − P (T = 0 | p < 0, 5), µ ¶ 5 · p0 · (1 − p)5 = 1− 0 da T ∼ Bin (5, p) = 1 − (1 − p)5. Dr. Karsten Webel 350 TU Dortmund Wintersemester 2009/2010 – Statistik für Ökonomen Kapitel 3 – Schließende Statistik Beispiel 3.42: Salz in der Suppe (Fortsetzung) p ∈ H1 P (Fehler 2. Art) Dr. Karsten Webel 0,49 0,45 0,35 0,25, 0,05 96,550% 94,967% 88,397% 76,270% 22,622% 351 TU Dortmund Wintersemester 2009/2010 – Statistik für Ökonomen Kapitel 3 – Schließende Statistik Beispiel 3.42: Salz in der Suppe (Fortsetzung) P (H0 ablehnen) 1 0.75 0.5 0.25 0 0 H1 0.5 H0 1 p Dr. Karsten Webel 352 TU Dortmund Wintersemester 2009/2010 – Statistik für Ökonomen Kapitel 3 – Schließende Statistik Definition 3.43: Gütefunktion Es sei θ ∈ Θ = Θ0 ∪ Θ1 mit Θ0 ∩ Θ1 = ∅. Gegeben sei weiter ein beliebiger Test für das Testproblem H0 : θ ∈ Θ0 gegen H1 : θ ∈ Θ1. Dann heißt die Funktion g(θ) = P (H0 ablehnen | θ) Gütefunktion des Tests. Dr. Karsten Webel 353 TU Dortmund Wintersemester 2009/2010 – Statistik für Ökonomen Kapitel 3 – Schließende Statistik Bemerkung 3.44: • Interpretation: Gütefunktion = P (Fehler 1. Art) auf H0 Gütefunktion = 1 − P (Fehler 2. Art) auf H1 • gleichzeitiges Minimieren beider Fehlerwahrscheinlichkeiten unmöglich • gebe maximale Wahrscheinlichkeit für Fehler 1. Art vor ( Signifikanzniveau“) ” und minimiere Wahrscheinlichkeit für Fehler 2. Art Dr. Karsten Webel 354 TU Dortmund Wintersemester 2009/2010 – Statistik für Ökonomen Kapitel 3 – Schließende Statistik Bemerkung 3.45: Jeder statistische Signifikanztest kann nach folgendem Standardschema durchgeführt werden: 1. Aufstellen des Testproblems, Festlegung des Signifikanzniveaus α 2. Bestimmung einer geeigneten Prüfgröße sowie deren Verteilung unter H0 3. Festlegung des kritischen Bereichs (Verwerfungs- oder Ablehnbereichs) 4. Berechnung der Realisation der Prüfgröße anhand der gezogenen Stichprobe 5. Ablehnen von H0, wenn sich die Realisation der Prüfgröße im kritischen Bereich befindet Dr. Karsten Webel 355 TU Dortmund Wintersemester 2009/2010 – Statistik für Ökonomen Kapitel 3 – Schließende Statistik f(x) Bemerkung 3.45: (Fortsetzung) Dichte unter H0 kritischer Bereich kritischer Wert Dr. Karsten Webel 356