Statistik I für Betriebswirte Vorlesung 14

Werbung
Statistik I für Betriebswirte
Vorlesung 14
Prof. Dr. Hans-Jörg Starkloff
TU Bergakademie Freiberg
Institut für Stochastik
11. Juli 2016
Prof. Dr. Hans-Jörg Starkloff
Statistik I für Betriebswirte Vorlesung 14
Version: 14. Juli 2016
1
Statistische Prüfverteilungen
I
Zur Bestimmung von Konfidenzintervallen für Parameter der
Normalverteilung und die später zu behandelnden statistischen Tests
benötigt man Quantile von bestimmten Verteilungen, die mit der
Normalverteilung zusammenhängen und die man statistische
Prüfverteilungen nennt. Dies sind
I
I
I
I
die χ2 -Verteilung (Chi-Quadrat-Verteilung),
die t-Verteilung (Student-Verteilung) und
die F -Verteilung (Fisher-Verteilung).
In den nachfolgenden Folien zu den speziellen Prüfverteilungen seien
deshalb X1 , . . . , Xn unabhängige normalverteilte Zufallsgrößen mit
Erwartungswert µ und Varianz σ 2 jeweils und
n
X =
1X
Xi ,
n
i=1
n
S2 =
2
1 X
Xi − X .
n−1
i=1
Prof. Dr. Hans-Jörg Starkloff
Statistik I für Betriebswirte Vorlesung 14
Version: 14. Juli 2016
2
Die χ2 -Verteilung (Chi-Quadrat-Verteilung) I
I
I
Parameter: m ∈ N ( Anzahl der Freiheitsgrade“).
”
Zufallsgröße Y mit Dichtefunktion fY bzw. Verteilungsfunktion FY

 0,
x ≤ 0;
m
fY (x) =
− x2
x 2 −1
 2 m2 Γ m e , x > 0 ;
(2)
Z x
fY (y ) dy , x ∈ R .
FY (x) =
−∞
I
Es gelten
EY = m
I
und VarY = 2m .
Es ist für Xi ∼ N(µ, σ 2 ), u.i.v. (i.i.d.),
n
1 X
(Xi − µ)2
σ2
χ2 − verteilt mit n Freiheitsgraden und
n
2
1 X
X
X
−
i
σ2
χ2 − verteilt mit n − 1 Freiheitsgraden.
i=1
i=1
Prof. Dr. Hans-Jörg Starkloff
Statistik I für Betriebswirte Vorlesung 14
Version: 14. Juli 2016
3
Die χ2 -Verteilung (Chi-Quadrat-Verteilung) II
I
Dichtefunktionen der χ2 -Verteilung mit m = 1 (rot), m = 5 (grün)
und m = 8 (blau) Freiheitsgraden
I
Quantile von χ2 -Verteilungen können aus Tabellen abgelesen oder
mit Hilfe von Rechnerprogrammen berechnet werden.
Für größere Werte m lassen sich die Quantile approximieren, z.B. gilt
I
χ21−α ≈
Prof. Dr. Hans-Jörg Starkloff
2
1 √
2m − 1 + Φ−1 (α)
2
Statistik I für Betriebswirte Vorlesung 14
Version: 14. Juli 2016
4
Tabelle Quantile χ2 -Verteilung
Quelle Beispiel:
G. Bourier; Statistik-Übungen; Gabler Verlag / Springer Fachmedien Wiesbaden GmbH, Wiesbaden; 2012
(E-Book Bibliothek TUBAF)
Prof. Dr. Hans-Jörg Starkloff
Statistik I für Betriebswirte Vorlesung 14
Version: 14. Juli 2016
5
Die t-Verteilung (Student-Verteilung) I
I
I
Parameter: m ∈ N ( Anzahl der Freiheitsgrade“).
”
Zufallsgröße Y mit Dichtefunktion fY bzw. Verteilungsfunktion FY
− m+1
2
Γ m+1
x2
2
fY (x) = √
, x ∈ R;
1
+
m
πm Γ m2
Z x
FY (x) =
fY (y ) dy , x ∈ R .
−∞
I
Es gelten
EY = 0
I
(m ≥ 2)
und VarY =
m
m−2
(m ≥ 3) .
v
u
n
u 1 X
2
2
Es ist für Xi ∼ N(µ, σ ), u.i.v., S = t
Xi − X
n−1
i=1
√ X −µ
n
S
Prof. Dr. Hans-Jörg Starkloff
t − verteilt mit n − 1 Freiheitsgraden.
Statistik I für Betriebswirte Vorlesung 14
Version: 14. Juli 2016
6
Die t-Verteilung (Student-Verteilung) II
I
Dichtefunktionen der t-Verteilung mit m = 1 (rot), m = 5 (grün)
und m = 8 (blau) Freiheitsgraden
I
Quantile von t-Verteilungen können aus Tabellen abgelesen oder mit
Hilfe von Rechnerprogrammen berechnet werden.
I
Für größere Werte m lässt sich die Verteilung recht gut durch eine
Standardnormalverteilung approximieren.
Prof. Dr. Hans-Jörg Starkloff
Statistik I für Betriebswirte Vorlesung 14
Version: 14. Juli 2016
7
Tabelle Quantile t-Verteilung
Quelle Beispiel:
G. Bourier; Statistik-Übungen; Gabler Verlag / Springer Fachmedien Wiesbaden GmbH, Wiesbaden; 2012
(E-Book Bibliothek TUBAF)
Prof. Dr. Hans-Jörg Starkloff
Statistik I für Betriebswirte Vorlesung 14
Version: 14. Juli 2016
8
Die F -Verteilung (Fisher-Verteilung) I
I
I
Parameter: m1 , m2 ∈ N ( Anzahl der Freiheitsgrade“).
”
Zufallsgröße Y mit Dichtefunktion fY bzw. Verteilungsfunktion FY

x ≤ 0;

 0 , m +m
m1
m1
1
2
−1
Γ
( 2 ) m1 2
fY (x) =
· x 2 m1 +m2 , x > 0 ;
m
m

 Γ( 21 )Γ( 22 ) m2
m
2
1+ m1 x
2
Z x
FY (x) =
fY (y ) dy , x ∈ R .
−∞
I
Es gelten für m2 > 2 bzw. m2 > 4
EY =
I
m2
m2 − 2
und VarY =
2m22 (m1 + m2 − 2)
.
m1 (m2 − 2)2 (m2 − 4)
Sind Yi unabhängig und χ2 -verteilt mit mi Freiheitsgraden
m2 Y1
(i = 1, 2), dann ist Y =
F -verteilt mit Freiheitsgraden
m1 Y2
m1 , m2 .
Prof. Dr. Hans-Jörg Starkloff
Statistik I für Betriebswirte Vorlesung 14
Version: 14. Juli 2016
9
Die F -Verteilung (Fisher-Verteilung) II
I
Dichtefunktionen der F -Verteilung mit m1 = 5, m2 = 5 (rot),
m1 = 5, m2 = 50 (grün) und m1 = 50, m2 = 50 (blau)
Freiheitsgraden
I
Quantile von F -Verteilungen können aus Tabellen abgelesen oder
mit Hilfe von Rechnerprogrammen berechnet werden.
I
Bezeichnet fm1 ,m2 ;α das Quantil einer F -Verteilung mit m1 , m2
1
Freiheitsgraden zum Niveau α, dann gilt fm1 ,m2 ;1−α =
.
fm2 ,m1 ;α
Prof. Dr. Hans-Jörg Starkloff
Statistik I für Betriebswirte Vorlesung 14
Version: 14. Juli 2016
10
Konfidenzintervall für µ falls X ∼ N(µ, σ 2 ), σ 2 unbekannt
I
I
I
Es ist für Xi ∼ N(µ, σ 2 ) , u.i.v., S =
q
1
n−1
Pn
i=1
Xi − X
2
√ X −µ
n
t − verteilt mit n − 1 Freiheitsgraden.
S
Mit dem Quantil tn−1;1− α2 zum Niveau 1 − α2 der t-Verteilung mit
n − 1 Freiheitsgraden gilt dann
√ X −µ
P −tn−1;1− α2 ≤ n
≤ tn−1;1− α2 = 1 − α ,
S
S
S
P X − √ tn−1;1− α2 ≤ µ ≤ X + √ tn−1;1− α2 = 1 − α .
n
n
Damit erhält man die Formel für das (zweiseitige) Konfidenzintervall
I für den Erwartungswert µ der Normalverteilung bei unbekannter
Varianz σ 2 zum Konfidenzniveau 1 − α
S
S
Iµ = X − √ tn−1;1− α2 ; X + √ tn−1;1− α2 .
n
n
Prof. Dr. Hans-Jörg Starkloff
Statistik I für Betriebswirte Vorlesung 14
Version: 14. Juli 2016
11
Beispielaufgabe
I
Aufgabe: In einem Betrieb werden unter anderem grüne Bohnen in
Dosen abgefüllt. Bei einer Stichprobe von 25 Dosen wurden folgende
Abfüllgewichte in g ermittelt:
173 , 176 , 172 , 176 , 175 , 174 , 172 , 173 , 173 ,
178 , 176 , 177 , 175 , 176 , 173 , 172 , 175 ,
174 , 172 , 174 , 173 , 177 , 176 , 174 , 174 .
Es wird angenommen, dass es sich bei den Werten um
Realisierungen einer normalverteilten Zufallsgröße handelt.
1. Bestimmen Sie einen Schätzer für das mittlere Abfüllgewicht µ !
2. Geben Sie ein Konfidenzintervall zum Niveau 0.95 für das
Durchschnittsgewicht an !
I
Größen zur Lösung:
x = 174.4,
n = 25,
s = 1.756, s 2 = 3.083,
α
1 − = 0.975, t24;0.975 = 2.064.
2
Prof. Dr. Hans-Jörg Starkloff
Statistik I für Betriebswirte Vorlesung 14
Version: 14. Juli 2016
12
Konfidenzintervall für σ 2 falls X ∼ N(µ, σ 2 ), µ bekannt
n
I
Es ist für Xi ∼ N(µ, σ 2 ) , u.i.v., S ∗2 =
1X
(Xi − µ)2 ,
n
i=1
n
nS ∗2
1 X
= 2
(Xi − µ)2
σ2
σ
χ2 − verteilt mit n Freiheitsgraden.
i=1
I
Mit den Quantilen χ2n; α bzw. χ2n;1− α zu den Niveaus
1−
α
2
2
2
α
2
bzw.
der χ2 -Verteilung mit n Freiheitsgraden gilt dann
P
P
nS ∗2
≤ 2 ≤ χ2n;1− α
2
σ
nS ∗2
nS ∗2
2
≤
σ
≤
χ2n;1− α
χ2n; α
!
χ2n; α
2
2
Prof. Dr. Hans-Jörg Starkloff
= 1 − α,
= 1 − α.
2
Statistik I für Betriebswirte Vorlesung 14
Version: 14. Juli 2016
13
Konfidenzintervall für σ 2 falls X ∼ N(µ, σ 2 ), µ bekannt
I
Damit erhält man die Formel für das (zweiseitige) Konfidenzintervall
I für die Varianz σ 2 der Normalverteilung bei bekanntem
Erwartungswert µ zum Konfidenzniveau 1 − α
#
"
nS ∗2
nS ∗2
;
.
Iσ2 =
χ2n;1− α χ2n; α
2
I
2
Das (zweiseitige) Konfidenzintervall I für die Standardabweichung σ
der Normalverteilung bei bekanntem Erwartungswert µ zum
Konfidenzniveau 1 − α erhält man daraus durch Berechnung der
Quadratwurzeln:
#
"s
s
nS ∗2
nS ∗2
;
.
Iσ =
χ2n;1− α
χ2n; α
2
Prof. Dr. Hans-Jörg Starkloff
2
Statistik I für Betriebswirte Vorlesung 14
Version: 14. Juli 2016
14
Konfidenzintervall für σ 2 falls X ∼ N(µ, σ 2 ), µ unbekannt
n−1
I
Es ist für Xi ∼
2
1 X
u.i.v., S =
Xi − X ,
n−1
2
N(µ, σ 2 ) ,
i=1
n
(n − 1)S 2
1 X
=
(Xi − X )2
σ2
σ2
χ2 − verteilt mit n − 1
i=1
Freiheitsgraden.
I
Mit den Quantilen χ2n−1; α bzw. χ2n−1;1− α zu den Niveaus
1−
α
2
der
χ2 -Verteilung
2
2
α
2
bzw.
mit n − 1 Freiheitsgraden gilt dann
(n − 1)S 2
2
α
P χ2n−1; α ≤
= 1 − α,
≤
χ
n−1;1− 2
2
σ2
!
2
(n − 1)S 2
(n
−
1)S
P
≤ σ2 ≤
= 1 − α.
χ2n−1;1− α
χ2n−1; α
2
Prof. Dr. Hans-Jörg Starkloff
2
Statistik I für Betriebswirte Vorlesung 14
Version: 14. Juli 2016
15
Konfidenzintervall für σ 2 falls X ∼ N(µ, σ 2 ), µ unbekannt
I
Damit erhält man die Formel für das (zweiseitige) Konfidenzintervall
I für die Varianz σ 2 der Normalverteilung bei unbekanntem
Erwartungswert µ zum Konfidenzniveau 1 − α
#
"
(n − 1)S 2 (n − 1)S 2
;
.
Iσ2 =
χ2n−1;1− α
χ2n−1; α
2
I
2
Das (zweiseitige) Konfidenzintervall I für die Standardabweichung σ
der Normalverteilung bei unbekanntem Erwartungswert µ zum
Konfidenzniveau 1 − α erhält man daraus durch Berechnung der
Quadratwurzeln:
#
"s
s
(n − 1)S 2
(n − 1)S 2
;
.
Iσ =
χ2n−1;1− α
χ2n−1; α
2
Prof. Dr. Hans-Jörg Starkloff
Statistik I für Betriebswirte Vorlesung 14
2
Version: 14. Juli 2016
16
Einseitige Konfidenzintervalle
I
Einseitige Konfidenzintervalle, d.h. nur obere bzw. nur untere
Konfidenzgrenzen, erhält man, indem man bei den zweiseitigen
Konfidenzintervallen die entsprechende Grenze wählt und bei den
Quantilen α2 durch α ersetzt. Die andere Grenze wird dann
entsprechend der möglichen Werte des Parameters gewählt, also
z.B. −∞ als untere Grenze für den Erwartungswert µ oder 0 als
untere Grenze für die Varianz σ 2 oder die Standardabweichung σ.
I
Oft verwendet werden einseitige Konfidenzintervalle mit oberer
Konfidenzgrenze zur Intervallschätzung der Varianz σ 2 einer
Normalverteilung; ist der Erwartungswert µ unbekannt, lautet das
entsprechende Konfidenzintervall zum Konfidenzniveau 1 − α:
"
#
(n − 1)S 2
Iσ2 = 0 ;
.
χ2n−1;α
Prof. Dr. Hans-Jörg Starkloff
Statistik I für Betriebswirte Vorlesung 14
Version: 14. Juli 2016
17
Beispiel Konfidenzintervall für σ 2
I
Im Wägebeispiel aus der vorigen Vorlesung waren:
n = 10 , x = 10.1 , s 2 = 0.23572 = 0.0556 ,
die Werte werden als normalverteilt mit unbekanntem
Erwartungswert µ und unbekannter Varianz σ 2 angenommen.
I
Dann sind mit den Quantilen
χ29;0.025 = 2.70 ,
χ29;0.05 = 3.33 ,
χ29;0.975 = 19.0
die Konfidenzintervalle zum Konfidenzniveau 1 − α = 0.95 :
I
I
I
I
9 · 0.0556 9 · 0.0556
zweiseitig für σ 2 : Iσ2 =
;
= [0.0263 ; 0.1853] ;
2.70
h√ 19.0 √
i
zweiseitig für σ : Iσ =
0.0263 ; 0.1853 = [0.1622 ; 0.4305] ;
9 · 0.0556
2
einseitig (oben) für σ : Iσ2 = 0 ;
= [0 ; 0.1503] ;
h √ 3.33i
einseitig (oben) für σ : Iσ = 0 ; 0.1503 = [0 ; 0.3877] .
Prof. Dr. Hans-Jörg Starkloff
Statistik I für Betriebswirte Vorlesung 14
Version: 14. Juli 2016
18
Asymptotische Konfidenzintervalle
I
Die Konfidenzintervalle für den Erwartungswert bzw. die Varianz
können als asymptotische Konfidenzintervalle auch für
nicht-normalverteilte Merkmale (mit endlicher Varianz) genutzt
werden, wenn der Stichprobenumfang n groß genug ist.
I
Dabei genügt bei symmetrischen Verteilungen oft schon eine Anzahl
von n ≈ 15 Stichprobenwerten, während bei schiefen Verteilungen
oft n ≈ 30 noch nicht ausreicht.
I
Auch eine unbekannte Wahrscheinlichkeit p kann mit Hilfe eines
solchen asymptotischen Konfidenzintervalls geschätzt werden.
Prof. Dr. Hans-Jörg Starkloff
Statistik I für Betriebswirte Vorlesung 14
Version: 14. Juli 2016
19
Konfidenzintervall für eine Wahrscheinlichkeit p
I
I
Aufgabe:
Ereignisses
1,
Xi =
0,
Intervallschätzung der Wahrscheinlichkeit p eines
A, also p = P(A).
A tritt bei Beobachtung i ein,
(i = 1, . . . , n).
A tritt bei Beobachtung i nicht ein,
I
Die Schätzgröße für p ist die relative Häufigkeit p̂ = X , dabei ist
die absolute Häufigkeit X = nX binomialverteilt mit Parametern n
und p.
I
Mit Hilfe des Grenzwertsatzes von Moivre-Laplace kann man ein
asymptotisches Konfidenzintervall I = [Gu ; Go ] zum
Konfidenzniveau 1 − α konstruieren.
I
Dieses kann für große Stichprobenumfänge n genutzt werden, als
Faustregel gelten np̂ > 5 und n(1 − p̂) > 5.
Prof. Dr. Hans-Jörg Starkloff
Statistik I für Betriebswirte Vorlesung 14
Version: 14. Juli 2016
20
Konfidenzintervall für eine Wahrscheinlichkeit p
I
Mit dem Quantil z1− α2 der Standardnormalverteilung zum Niveau
α
1−
erhält man
2
#
"
r
1
X (n − X ) 1 2
1 2
Gu =
+ z1− α ,
X + z1− α − z1− α2
2
2
2
2
n
4
n + z1−
α
2
"
#
r
X (n − X ) 1 2
1
1 2
Go =
X + z1− α + z1− α2
+ z1− α .
2
2
2
2
n
4
n + z1−
α
2
I
Eine einseitige untere Konfidenzgrenze wäre dann z.B. gegeben
durch
#
"
r
1
1 2
X (n − X ) 1 2
Gu =
X + z1−α − z1−α
+ z1−α .
2
2
n
4
n + z1−α
Prof. Dr. Hans-Jörg Starkloff
Statistik I für Betriebswirte Vorlesung 14
Version: 14. Juli 2016
21
Beispiel: Konfidenzintervall für p
I
Aufgabe: Zur Schätzung des Ausschussanteils eines umfangreichen
Lieferpostens werde diesem eine Stichprobe von 200 Teilen
entnommen. Dabei wurden 190 einwandfreie Teile festgestellt.
1. Geben Sie eine Schätzung für den Ausschussanteil an.
2. Berechnen Sie ein Konfidenzintervall für den Ausschussanteil zum
Konfidenzniveau 1 − α = 0.95.
I
Größen zur Lösung:
n = 200,
1−
α
2
x=
= 0.975,
Prof. Dr. Hans-Jörg Starkloff
10
200
= 0.05, absolute Häufigkeit x = 10,
z0.975 = 1.96 .
Statistik I für Betriebswirte Vorlesung 14
Version: 14. Juli 2016
22
Klausur Statistik I für Betriebswirte
I
Termin:
Montag, 1. August 2016, 7:30 - 9:30 Uhr .
I
Es muss selbstständig gearbeitet werden. Als Hilfsmittel für die
Prüfung ist außer Notebook und Handy alles zugelassen.
I
Raumaufteilung:
I
Alte Mensa AME 1001
Studiengang Betriebswirtschaftslehre mit Matrikelnummer größer
gleich 60 000 und
Studiengang Betriebswirtschaftslehre für die Ressourcenwirtschaft;
I
Audimax AUD 1001
Studiengang Business und Law ;
I
DBI DBI-TZ
Studiengang Betriebswirtschaftslehre mit Matrikelnummer kleiner
60 000 und
Studiengang Wirtschaftsingenieurswesen.
Prof. Dr. Hans-Jörg Starkloff
Statistik I für Betriebswirte Vorlesung 14
Version: 14. Juli 2016
23
Herunterladen