Statistik I für Betriebswirte Vorlesung 14 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 11. Juli 2016 Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 14 Version: 14. Juli 2016 1 Statistische Prüfverteilungen I Zur Bestimmung von Konfidenzintervallen für Parameter der Normalverteilung und die später zu behandelnden statistischen Tests benötigt man Quantile von bestimmten Verteilungen, die mit der Normalverteilung zusammenhängen und die man statistische Prüfverteilungen nennt. Dies sind I I I I die χ2 -Verteilung (Chi-Quadrat-Verteilung), die t-Verteilung (Student-Verteilung) und die F -Verteilung (Fisher-Verteilung). In den nachfolgenden Folien zu den speziellen Prüfverteilungen seien deshalb X1 , . . . , Xn unabhängige normalverteilte Zufallsgrößen mit Erwartungswert µ und Varianz σ 2 jeweils und n X = 1X Xi , n i=1 n S2 = 2 1 X Xi − X . n−1 i=1 Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 14 Version: 14. Juli 2016 2 Die χ2 -Verteilung (Chi-Quadrat-Verteilung) I I I Parameter: m ∈ N ( Anzahl der Freiheitsgrade“). ” Zufallsgröße Y mit Dichtefunktion fY bzw. Verteilungsfunktion FY 0, x ≤ 0; m fY (x) = − x2 x 2 −1 2 m2 Γ m e , x > 0 ; (2) Z x fY (y ) dy , x ∈ R . FY (x) = −∞ I Es gelten EY = m I und VarY = 2m . Es ist für Xi ∼ N(µ, σ 2 ), u.i.v. (i.i.d.), n 1 X (Xi − µ)2 σ2 χ2 − verteilt mit n Freiheitsgraden und n 2 1 X X X − i σ2 χ2 − verteilt mit n − 1 Freiheitsgraden. i=1 i=1 Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 14 Version: 14. Juli 2016 3 Die χ2 -Verteilung (Chi-Quadrat-Verteilung) II I Dichtefunktionen der χ2 -Verteilung mit m = 1 (rot), m = 5 (grün) und m = 8 (blau) Freiheitsgraden I Quantile von χ2 -Verteilungen können aus Tabellen abgelesen oder mit Hilfe von Rechnerprogrammen berechnet werden. Für größere Werte m lassen sich die Quantile approximieren, z.B. gilt I χ21−α ≈ Prof. Dr. Hans-Jörg Starkloff 2 1 √ 2m − 1 + Φ−1 (α) 2 Statistik I für Betriebswirte Vorlesung 14 Version: 14. Juli 2016 4 Tabelle Quantile χ2 -Verteilung Quelle Beispiel: G. Bourier; Statistik-Übungen; Gabler Verlag / Springer Fachmedien Wiesbaden GmbH, Wiesbaden; 2012 (E-Book Bibliothek TUBAF) Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 14 Version: 14. Juli 2016 5 Die t-Verteilung (Student-Verteilung) I I I Parameter: m ∈ N ( Anzahl der Freiheitsgrade“). ” Zufallsgröße Y mit Dichtefunktion fY bzw. Verteilungsfunktion FY − m+1 2 Γ m+1 x2 2 fY (x) = √ , x ∈ R; 1 + m πm Γ m2 Z x FY (x) = fY (y ) dy , x ∈ R . −∞ I Es gelten EY = 0 I (m ≥ 2) und VarY = m m−2 (m ≥ 3) . v u n u 1 X 2 2 Es ist für Xi ∼ N(µ, σ ), u.i.v., S = t Xi − X n−1 i=1 √ X −µ n S Prof. Dr. Hans-Jörg Starkloff t − verteilt mit n − 1 Freiheitsgraden. Statistik I für Betriebswirte Vorlesung 14 Version: 14. Juli 2016 6 Die t-Verteilung (Student-Verteilung) II I Dichtefunktionen der t-Verteilung mit m = 1 (rot), m = 5 (grün) und m = 8 (blau) Freiheitsgraden I Quantile von t-Verteilungen können aus Tabellen abgelesen oder mit Hilfe von Rechnerprogrammen berechnet werden. I Für größere Werte m lässt sich die Verteilung recht gut durch eine Standardnormalverteilung approximieren. Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 14 Version: 14. Juli 2016 7 Tabelle Quantile t-Verteilung Quelle Beispiel: G. Bourier; Statistik-Übungen; Gabler Verlag / Springer Fachmedien Wiesbaden GmbH, Wiesbaden; 2012 (E-Book Bibliothek TUBAF) Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 14 Version: 14. Juli 2016 8 Die F -Verteilung (Fisher-Verteilung) I I I Parameter: m1 , m2 ∈ N ( Anzahl der Freiheitsgrade“). ” Zufallsgröße Y mit Dichtefunktion fY bzw. Verteilungsfunktion FY x ≤ 0; 0 , m +m m1 m1 1 2 −1 Γ ( 2 ) m1 2 fY (x) = · x 2 m1 +m2 , x > 0 ; m m Γ( 21 )Γ( 22 ) m2 m 2 1+ m1 x 2 Z x FY (x) = fY (y ) dy , x ∈ R . −∞ I Es gelten für m2 > 2 bzw. m2 > 4 EY = I m2 m2 − 2 und VarY = 2m22 (m1 + m2 − 2) . m1 (m2 − 2)2 (m2 − 4) Sind Yi unabhängig und χ2 -verteilt mit mi Freiheitsgraden m2 Y1 (i = 1, 2), dann ist Y = F -verteilt mit Freiheitsgraden m1 Y2 m1 , m2 . Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 14 Version: 14. Juli 2016 9 Die F -Verteilung (Fisher-Verteilung) II I Dichtefunktionen der F -Verteilung mit m1 = 5, m2 = 5 (rot), m1 = 5, m2 = 50 (grün) und m1 = 50, m2 = 50 (blau) Freiheitsgraden I Quantile von F -Verteilungen können aus Tabellen abgelesen oder mit Hilfe von Rechnerprogrammen berechnet werden. I Bezeichnet fm1 ,m2 ;α das Quantil einer F -Verteilung mit m1 , m2 1 Freiheitsgraden zum Niveau α, dann gilt fm1 ,m2 ;1−α = . fm2 ,m1 ;α Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 14 Version: 14. Juli 2016 10 Konfidenzintervall für µ falls X ∼ N(µ, σ 2 ), σ 2 unbekannt I I I Es ist für Xi ∼ N(µ, σ 2 ) , u.i.v., S = q 1 n−1 Pn i=1 Xi − X 2 √ X −µ n t − verteilt mit n − 1 Freiheitsgraden. S Mit dem Quantil tn−1;1− α2 zum Niveau 1 − α2 der t-Verteilung mit n − 1 Freiheitsgraden gilt dann √ X −µ P −tn−1;1− α2 ≤ n ≤ tn−1;1− α2 = 1 − α , S S S P X − √ tn−1;1− α2 ≤ µ ≤ X + √ tn−1;1− α2 = 1 − α . n n Damit erhält man die Formel für das (zweiseitige) Konfidenzintervall I für den Erwartungswert µ der Normalverteilung bei unbekannter Varianz σ 2 zum Konfidenzniveau 1 − α S S Iµ = X − √ tn−1;1− α2 ; X + √ tn−1;1− α2 . n n Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 14 Version: 14. Juli 2016 11 Beispielaufgabe I Aufgabe: In einem Betrieb werden unter anderem grüne Bohnen in Dosen abgefüllt. Bei einer Stichprobe von 25 Dosen wurden folgende Abfüllgewichte in g ermittelt: 173 , 176 , 172 , 176 , 175 , 174 , 172 , 173 , 173 , 178 , 176 , 177 , 175 , 176 , 173 , 172 , 175 , 174 , 172 , 174 , 173 , 177 , 176 , 174 , 174 . Es wird angenommen, dass es sich bei den Werten um Realisierungen einer normalverteilten Zufallsgröße handelt. 1. Bestimmen Sie einen Schätzer für das mittlere Abfüllgewicht µ ! 2. Geben Sie ein Konfidenzintervall zum Niveau 0.95 für das Durchschnittsgewicht an ! I Größen zur Lösung: x = 174.4, n = 25, s = 1.756, s 2 = 3.083, α 1 − = 0.975, t24;0.975 = 2.064. 2 Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 14 Version: 14. Juli 2016 12 Konfidenzintervall für σ 2 falls X ∼ N(µ, σ 2 ), µ bekannt n I Es ist für Xi ∼ N(µ, σ 2 ) , u.i.v., S ∗2 = 1X (Xi − µ)2 , n i=1 n nS ∗2 1 X = 2 (Xi − µ)2 σ2 σ χ2 − verteilt mit n Freiheitsgraden. i=1 I Mit den Quantilen χ2n; α bzw. χ2n;1− α zu den Niveaus 1− α 2 2 2 α 2 bzw. der χ2 -Verteilung mit n Freiheitsgraden gilt dann P P nS ∗2 ≤ 2 ≤ χ2n;1− α 2 σ nS ∗2 nS ∗2 2 ≤ σ ≤ χ2n;1− α χ2n; α ! χ2n; α 2 2 Prof. Dr. Hans-Jörg Starkloff = 1 − α, = 1 − α. 2 Statistik I für Betriebswirte Vorlesung 14 Version: 14. Juli 2016 13 Konfidenzintervall für σ 2 falls X ∼ N(µ, σ 2 ), µ bekannt I Damit erhält man die Formel für das (zweiseitige) Konfidenzintervall I für die Varianz σ 2 der Normalverteilung bei bekanntem Erwartungswert µ zum Konfidenzniveau 1 − α # " nS ∗2 nS ∗2 ; . Iσ2 = χ2n;1− α χ2n; α 2 I 2 Das (zweiseitige) Konfidenzintervall I für die Standardabweichung σ der Normalverteilung bei bekanntem Erwartungswert µ zum Konfidenzniveau 1 − α erhält man daraus durch Berechnung der Quadratwurzeln: # "s s nS ∗2 nS ∗2 ; . Iσ = χ2n;1− α χ2n; α 2 Prof. Dr. Hans-Jörg Starkloff 2 Statistik I für Betriebswirte Vorlesung 14 Version: 14. Juli 2016 14 Konfidenzintervall für σ 2 falls X ∼ N(µ, σ 2 ), µ unbekannt n−1 I Es ist für Xi ∼ 2 1 X u.i.v., S = Xi − X , n−1 2 N(µ, σ 2 ) , i=1 n (n − 1)S 2 1 X = (Xi − X )2 σ2 σ2 χ2 − verteilt mit n − 1 i=1 Freiheitsgraden. I Mit den Quantilen χ2n−1; α bzw. χ2n−1;1− α zu den Niveaus 1− α 2 der χ2 -Verteilung 2 2 α 2 bzw. mit n − 1 Freiheitsgraden gilt dann (n − 1)S 2 2 α P χ2n−1; α ≤ = 1 − α, ≤ χ n−1;1− 2 2 σ2 ! 2 (n − 1)S 2 (n − 1)S P ≤ σ2 ≤ = 1 − α. χ2n−1;1− α χ2n−1; α 2 Prof. Dr. Hans-Jörg Starkloff 2 Statistik I für Betriebswirte Vorlesung 14 Version: 14. Juli 2016 15 Konfidenzintervall für σ 2 falls X ∼ N(µ, σ 2 ), µ unbekannt I Damit erhält man die Formel für das (zweiseitige) Konfidenzintervall I für die Varianz σ 2 der Normalverteilung bei unbekanntem Erwartungswert µ zum Konfidenzniveau 1 − α # " (n − 1)S 2 (n − 1)S 2 ; . Iσ2 = χ2n−1;1− α χ2n−1; α 2 I 2 Das (zweiseitige) Konfidenzintervall I für die Standardabweichung σ der Normalverteilung bei unbekanntem Erwartungswert µ zum Konfidenzniveau 1 − α erhält man daraus durch Berechnung der Quadratwurzeln: # "s s (n − 1)S 2 (n − 1)S 2 ; . Iσ = χ2n−1;1− α χ2n−1; α 2 Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 14 2 Version: 14. Juli 2016 16 Einseitige Konfidenzintervalle I Einseitige Konfidenzintervalle, d.h. nur obere bzw. nur untere Konfidenzgrenzen, erhält man, indem man bei den zweiseitigen Konfidenzintervallen die entsprechende Grenze wählt und bei den Quantilen α2 durch α ersetzt. Die andere Grenze wird dann entsprechend der möglichen Werte des Parameters gewählt, also z.B. −∞ als untere Grenze für den Erwartungswert µ oder 0 als untere Grenze für die Varianz σ 2 oder die Standardabweichung σ. I Oft verwendet werden einseitige Konfidenzintervalle mit oberer Konfidenzgrenze zur Intervallschätzung der Varianz σ 2 einer Normalverteilung; ist der Erwartungswert µ unbekannt, lautet das entsprechende Konfidenzintervall zum Konfidenzniveau 1 − α: " # (n − 1)S 2 Iσ2 = 0 ; . χ2n−1;α Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 14 Version: 14. Juli 2016 17 Beispiel Konfidenzintervall für σ 2 I Im Wägebeispiel aus der vorigen Vorlesung waren: n = 10 , x = 10.1 , s 2 = 0.23572 = 0.0556 , die Werte werden als normalverteilt mit unbekanntem Erwartungswert µ und unbekannter Varianz σ 2 angenommen. I Dann sind mit den Quantilen χ29;0.025 = 2.70 , χ29;0.05 = 3.33 , χ29;0.975 = 19.0 die Konfidenzintervalle zum Konfidenzniveau 1 − α = 0.95 : I I I I 9 · 0.0556 9 · 0.0556 zweiseitig für σ 2 : Iσ2 = ; = [0.0263 ; 0.1853] ; 2.70 h√ 19.0 √ i zweiseitig für σ : Iσ = 0.0263 ; 0.1853 = [0.1622 ; 0.4305] ; 9 · 0.0556 2 einseitig (oben) für σ : Iσ2 = 0 ; = [0 ; 0.1503] ; h √ 3.33i einseitig (oben) für σ : Iσ = 0 ; 0.1503 = [0 ; 0.3877] . Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 14 Version: 14. Juli 2016 18 Asymptotische Konfidenzintervalle I Die Konfidenzintervalle für den Erwartungswert bzw. die Varianz können als asymptotische Konfidenzintervalle auch für nicht-normalverteilte Merkmale (mit endlicher Varianz) genutzt werden, wenn der Stichprobenumfang n groß genug ist. I Dabei genügt bei symmetrischen Verteilungen oft schon eine Anzahl von n ≈ 15 Stichprobenwerten, während bei schiefen Verteilungen oft n ≈ 30 noch nicht ausreicht. I Auch eine unbekannte Wahrscheinlichkeit p kann mit Hilfe eines solchen asymptotischen Konfidenzintervalls geschätzt werden. Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 14 Version: 14. Juli 2016 19 Konfidenzintervall für eine Wahrscheinlichkeit p I I Aufgabe: Ereignisses 1, Xi = 0, Intervallschätzung der Wahrscheinlichkeit p eines A, also p = P(A). A tritt bei Beobachtung i ein, (i = 1, . . . , n). A tritt bei Beobachtung i nicht ein, I Die Schätzgröße für p ist die relative Häufigkeit p̂ = X , dabei ist die absolute Häufigkeit X = nX binomialverteilt mit Parametern n und p. I Mit Hilfe des Grenzwertsatzes von Moivre-Laplace kann man ein asymptotisches Konfidenzintervall I = [Gu ; Go ] zum Konfidenzniveau 1 − α konstruieren. I Dieses kann für große Stichprobenumfänge n genutzt werden, als Faustregel gelten np̂ > 5 und n(1 − p̂) > 5. Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 14 Version: 14. Juli 2016 20 Konfidenzintervall für eine Wahrscheinlichkeit p I Mit dem Quantil z1− α2 der Standardnormalverteilung zum Niveau α 1− erhält man 2 # " r 1 X (n − X ) 1 2 1 2 Gu = + z1− α , X + z1− α − z1− α2 2 2 2 2 n 4 n + z1− α 2 " # r X (n − X ) 1 2 1 1 2 Go = X + z1− α + z1− α2 + z1− α . 2 2 2 2 n 4 n + z1− α 2 I Eine einseitige untere Konfidenzgrenze wäre dann z.B. gegeben durch # " r 1 1 2 X (n − X ) 1 2 Gu = X + z1−α − z1−α + z1−α . 2 2 n 4 n + z1−α Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 14 Version: 14. Juli 2016 21 Beispiel: Konfidenzintervall für p I Aufgabe: Zur Schätzung des Ausschussanteils eines umfangreichen Lieferpostens werde diesem eine Stichprobe von 200 Teilen entnommen. Dabei wurden 190 einwandfreie Teile festgestellt. 1. Geben Sie eine Schätzung für den Ausschussanteil an. 2. Berechnen Sie ein Konfidenzintervall für den Ausschussanteil zum Konfidenzniveau 1 − α = 0.95. I Größen zur Lösung: n = 200, 1− α 2 x= = 0.975, Prof. Dr. Hans-Jörg Starkloff 10 200 = 0.05, absolute Häufigkeit x = 10, z0.975 = 1.96 . Statistik I für Betriebswirte Vorlesung 14 Version: 14. Juli 2016 22 Klausur Statistik I für Betriebswirte I Termin: Montag, 1. August 2016, 7:30 - 9:30 Uhr . I Es muss selbstständig gearbeitet werden. Als Hilfsmittel für die Prüfung ist außer Notebook und Handy alles zugelassen. I Raumaufteilung: I Alte Mensa AME 1001 Studiengang Betriebswirtschaftslehre mit Matrikelnummer größer gleich 60 000 und Studiengang Betriebswirtschaftslehre für die Ressourcenwirtschaft; I Audimax AUD 1001 Studiengang Business und Law ; I DBI DBI-TZ Studiengang Betriebswirtschaftslehre mit Matrikelnummer kleiner 60 000 und Studiengang Wirtschaftsingenieurswesen. Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 14 Version: 14. Juli 2016 23