Vorlesung: Statistik II für Wirtschaftswissenschaft - StaBLab

Werbung
Vorlesung: Statistik II für
Wirtschaftswissenschaft
Prof. Dr. Helmut Küchenhoff
Institut für Statistik, LMU München
Sommersemester 2017
Einführung
1
Wahrscheinlichkeit: Definition und Interpretation
2
Elementare Wahrscheinlichkeitsrechnung
3
Zufallsgrößen
4
Spezielle Zufallsgrößen
diskrete Verteilungen
stetige Verteilungen
Bernoulliverteilung
Definition Bernoulliverteilung
Ein Experiment mit nur zwei Ergebnissen (1 = Erfolg, 0 = Misserfolg) gehorcht einer Bernoulliverteilung.
Kurzschreibweise: X ∼ B(1, p)
(
P(X = x) =
Statistik 2
Sommersemester 2017
p
1−p
falls x = 1
falls x = 0
Helmut Küchenhoff (Institut für Statistik, LMU)
129 / 172
Bernoulliverteilung
Erwartungswert und Varianz
E (X ) = p
Var (X ) = p (1 − p)
Statistik 2
Sommersemester 2017
Helmut Küchenhoff (Institut für Statistik, LMU)
130 / 172
Bernoulliverteilung
−1
Statistik 2
B(1, 0.8)
●
0
0
0.2
●
0.2
●
●
0.5
0.5
B(1, 0.5)
0.8
0.8
graphische Beispiele der Wahrscheinlichkeitsfunktion
0
1
Sommersemester 2017
2
3
4
5
−1
0
1
2
Helmut Küchenhoff (Institut für Statistik, LMU)
3
4
5
131 / 172
Bernoulliverteilung
1
0.5
0.2
0
B(1, 0.5)
−1
Statistik 2
0
1
Sommersemester 2017
2
3
4
5
B(1, 0.8)
0
0.2
0.5
1
graphische Beispiele der Verteilungssfunktion
−1
0
1
2
Helmut Küchenhoff (Institut für Statistik, LMU)
3
4
5
132 / 172
Bernoulliverteilung
Beispiel
Betrachtet wird das Ergebnis eines einmaligen Münzwurfs mit einer
unfairen Münze:
Ausprägungen: 1 (Kopf), 0 (Zahl)
2
P(X = 1) =
3
2
E (X ) =
3
2
2
2
Var (X ) = · (1 − ) =
3
3
9
Statistik 2
Sommersemester 2017
Helmut Küchenhoff (Institut für Statistik, LMU)
133 / 172
Binomialverteilung
Definition Binomialverteilung
Werden n unabhängige und identische Bernoulliexperimente durchgeführt, so folgt die Anzahl der Erfolge einer Binomialverteilung.
Kurzschreibweise: X ∼ B(n, p)
n
P(X = x) =
p x (1 − p)n−x ,
x
Statistik 2
Sommersemester 2017
x = 0, 1, ..., n
Helmut Küchenhoff (Institut für Statistik, LMU)
134 / 172
Binomialverteilung
Erwartungswert und Varianz
E (X ) = np
Var (X ) = np (1 − p)
Statistik 2
Sommersemester 2017
Helmut Küchenhoff (Institut für Statistik, LMU)
135 / 172
Binomialverteilung
B(15, 0.7)
0.3
0.3
B(15, 0.2)
0.4
0.4
graphische Beispiele der Wahrscheinlichkeitsfunktion
●
●
0.2
0.2
●
●
●
●
●
0.1
0.1
●
●
●
●
●
10
0.4
5
●
●
●
●
●
●
●
●
●
0
●
●
5
10
15
0.3
B(50, 0.5)
0.2
0.3
0.2
●●●●●●●●
0
●
0.1
●●●
●
●
●
●
●
●
10
●●●
●
●
●
●
20
Sommersemester 2017
●
●●●
●●●●●●●●●●●●●●●●●●●●●●●●●
30
40
50
0.0
0.1
●
●
●
0.0
●
15
B(50, 0.3)
●
Statistik 2
0.0
●
●
0.4
0.0
●
●
0
●
●
●
●
●●●●●●●●●●●●●●●●●
0
10
●
●
●
20
Helmut Küchenhoff (Institut für Statistik, LMU)
●
●
●
●
●
30
●
●●
●●●●●●●●●●●●●●●●
40
50
136 / 172
Binomialverteilung
1.0
0.8
0.6
0.4
0.2
0.0
B(15, 0.2)
10
15
5
10
15
0.8
0.2
0.4
0.6
0.8
0.6
0.4
10
20
Sommersemester 2017
30
40
50
B(50, 0.5)
0.0
0.2
0.0
B(50, 0.3)
0
Statistik 2
0
1.0
5
1.0
0
B(15, 0.7)
0.0
0.2
0.4
0.6
0.8
1.0
graphische Beispiele der Verteilungssfunktion
0
10
20
Helmut Küchenhoff (Institut für Statistik, LMU)
30
40
50
137 / 172
Binomialverteilung
Beispiel
Betrachtet wird die Anzahl des Ereignisses Kopf oben“ beim zehn”
maligen Münzwurf mit einer unfairen Münze:
n = 10
2
p=
3
2
= 6, 67
3 2
2
= 2, 22
Var (X ) = 10 · · 1 −
3
3
7 10−7
2
2
10
P(X = 7) =
·
· 1−
= 0, 26
7
3
3
E (X ) = 10 ·
Statistik 2
Sommersemester 2017
Helmut Küchenhoff (Institut für Statistik, LMU)
138 / 172
Beispiel: Wahlprognose
100 zufällig ausgewählte Wahlberechtigte werden befragt.
30% aller Wahlberechtigten wählen Partei S.
→ Wie groß ist die Wahrscheinlichkeit, dass von den 100 Befragten
mehr als 50 die Partei S wählen?
X ∼ B(100, 0.3)
P(X ≥ 50)
Statistik 2
= P(X = 50) + P(X = 51) + . . . + P(X = 100)
100
=
· 0.350 · 0.750 + . . .
50
= 0.00002206
Sommersemester 2017
Helmut Küchenhoff (Institut für Statistik, LMU)
139 / 172
geometrische Verteilung
Definition geometrische Verteilung
Interessiert man sich für die Anzahl der Versuche, bis bei einem
Bernoulliexperiment ein Erfolg beobachtet wird, so folgt dieser Versuchsaufbau einer geometrischen Verteilung.
Kurzschreibweise: X ∼ G (p)
P(X = x) = p (1 − p)x−1 ,
Statistik 2
Sommersemester 2017
x ∈N
Helmut Küchenhoff (Institut für Statistik, LMU)
140 / 172
geometrische Verteilung
Erwartungswert und Varianz
Statistik 2
Sommersemester 2017
E (X ) =
1
p
Var (X ) =
1
p
1
−1
p
Helmut Küchenhoff (Institut für Statistik, LMU)
141 / 172
geometrische Verteilung
G(0.8)
G(0.2)
0.6
0.4
0.2
0.2
0.4
0.6
●
0.8
0.8
graphische Beispiele der Wahrscheinlichkeitsfunktion
●
●
●
●
0.0
● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●
0
Statistik 2
5
10
Sommersemester 2017
15
20
25
30
●
0.0
●
●
0
5
●
● ●
● ● ●
● ● ● ● ● ●
● ● ● ● ● ● ● ● ● ● ● ● ●
10
15
Helmut Küchenhoff (Institut für Statistik, LMU)
20
25
30
142 / 172
geometrische Verteilung
1.0
0.8
0.6
0.4
0.2
0.0
G(0.8)
0
Statistik 2
5
10
Sommersemester 2017
15
20
25
30
G(0.2)
0.0
0.2
0.4
0.6
0.8
1.0
graphische Beispiele der Verteilungssfunktion
0
5
10
15
Helmut Küchenhoff (Institut für Statistik, LMU)
20
25
30
143 / 172
geometrische Verteilung
Beispiel
Betrachtet wird die Anzahl der Würfe, bis eine 1 gewürfelt wird.
Dies ist geometrisch verteilt mit p = 61 , also X ∼ G ( 16 ).
1
=6
1/6
1
1
Var (X ) =
(
− 1) = 30
1/6 1/6
E (X ) =
Im Mittel fällt beim sechsten Wurf eine 1.
Statistik 2
Sommersemester 2017
Helmut Küchenhoff (Institut für Statistik, LMU)
144 / 172
Poissonverteilung
Definition Poissonverteilung
Soll die Wahrscheinlichkeit für die Häufigkeit bzw. Anzahl des Eintretens eines bestimmten Ereignisses innerhalb eines fest vorgegebenen Intervalls der Länge t (hier nur t = 1) beschrieben werden,
so lässt sich dies mit einer Poissonverteilung modellieren.
Kurzschreibweise: X ∼ Po(λ),
P(X = x) =
Statistik 2
Sommersemester 2017
λ>0
λx
· exp(−λ),
x!
x ∈ N0
Helmut Küchenhoff (Institut für Statistik, LMU)
145 / 172
Poissonverteilung
Erwartungswert und Varianz
E (X ) = λ
Var (X ) = λ
Statistik 2
Sommersemester 2017
Helmut Küchenhoff (Institut für Statistik, LMU)
146 / 172
Poissonverteilung
Po(15)
0.20
0.20
Po(4)
0.30
0.30
graphische Beispiele der Wahrscheinlichkeitsfunktion
● ●
●
0.10
0.10
●
●
●
● ●
●
●
●
●
●
●
●
●
●
0
Statistik 2
●
5
● ●
● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●
10
Sommersemester 2017
15
20
25
30
0.00
0.00
●
●
●
●
●
●
●
●
● ● ● ● ● ●
0
5
●
10
15
Helmut Küchenhoff (Institut für Statistik, LMU)
20
●
● ●
● ● ● ● ●
25
30
147 / 172
Poissonverteilung
1.0
0.8
0.6
0.4
0.2
0.0
Po(4)
0
Statistik 2
5
10
Sommersemester 2017
15
20
25
30
Po(15)
0.0
0.2
0.4
0.6
0.8
1.0
graphische Beispiele der Verteilungssfunktion
0
5
10
15
Helmut Küchenhoff (Institut für Statistik, LMU)
20
25
30
148 / 172
Poissonverteilung
Additionssatz
Sind X ∼ Po(a) und Y ∼ Po(b) unabhängige Zufallsvariablen,
dann gilt:
X + Y ∼ Po(a + b).
Statistik 2
Sommersemester 2017
Helmut Küchenhoff (Institut für Statistik, LMU)
149 / 172
Poissonverteilung
Beispiel
Bei einer Hotline weiß man aus Erfahrung, dass dort am Freitag
zwischen 15 und 16 Uhr 7 (= λ) Kunden den Dienst in Anspruch
nehmen. Die Wahrscheinlichkeit dafür, dass es mal 9 Kunden sind,
beträgt:
79
· exp(−7) = 0, 1014.
P(X = 9) =
9!
Statistik 2
Sommersemester 2017
Helmut Küchenhoff (Institut für Statistik, LMU)
150 / 172
Einführung
1
Wahrscheinlichkeit: Definition und Interpretation
2
Elementare Wahrscheinlichkeitsrechnung
3
Zufallsgrößen
4
Spezielle Zufallsgrößen
diskrete Verteilungen
stetige Verteilungen
Exponentialverteilung
Definition Exponentialverteilung
Wird die stetige Wartezeit bis zum Eintreten eines Ereignisses betrachtet und wird gefordert, dass die weitere Wartezeit unabhängig
von der bereits verstrichenen Wartezeit ist, so bietet sich die Exponentialverteilung zur Modellierung dieses Problems an.
Kurzschreibweise: X ∼ Expo(λ)
(
λ · exp(−λx) für x ≥ 0
f (x) =
0
sonst
(
F (x) =
1 − exp(−λx) für x ≥ 0
0
sonst
Die Exponentialverteilung ist damit das stetige Analogon zur geometrischen Verteilung.
Statistik 2
Sommersemester 2017
Helmut Küchenhoff (Institut für Statistik, LMU)
151 / 172
Exponentialverteilung
Erwartungswert und Varianz
E (X ) =
Var (X ) =
Statistik 2
Sommersemester 2017
1
λ
1
λ2
Helmut Küchenhoff (Institut für Statistik, LMU)
152 / 172
Exponentialverteilung
1.5
1.0
0.5
0
Statistik 2
Expo(0,5)
0.0
0.0
0.5
1.0
1.5
Expo(2)
2.0
2.0
graphische Beispiele der Dichtefunktion
2
Sommersemester 2017
4
6
8
10
0
2
4
Helmut Küchenhoff (Institut für Statistik, LMU)
6
8
10
153 / 172
Exponentialverteilung
1.0
0.8
0.6
0.4
0.2
0.0
Expo(2)
0
Statistik 2
5
Sommersemester 2017
10
15
20
Expo(0,5)
0.0
0.2
0.4
0.6
0.8
1.0
graphische Beispiele der Verteilungssfunktion
0
5
10
Helmut Küchenhoff (Institut für Statistik, LMU)
15
20
154 / 172
Exponentialverteilung
Zusammenhang zwischen Exponential- und Poissonverteilung
Die Anzahl der Ereignisse Y innerhalb eines Kontinuums ist poissonverteilt mit Parameter λ genau dann, wenn die Wartezeit zwischen zwei Ereignissen exponentialverteilt mit Parameter λ ist.
Statistik 2
Sommersemester 2017
Helmut Küchenhoff (Institut für Statistik, LMU)
155 / 172
Exponentialverteilung
Beispiel
Die Zufallsvariable X : Lebensdauer einer Glühbirne einer Schau”
fensterbeleuchtung“ sei exponentialverteilt mit Parameter λ = 10.
Damit gilt:
E (X ) =
1
1
1
; Var (X ) = 2 =
10
10
100
Die Zufallsvariable Y : Anzahl der ausgefallenen Glühbirnen“ ist
”
damit poissonverteilt mit Parameter λ = 10 und damit E (Y ) = 10
sowie Var (Y ) = 10.
Betrachten wir als Kontinuum ein Jahr, so erhalten wir für die
erwartete Anzahl der ausgefallenen Glühbirnen pro Jahr
E (Y ) = 10 Glühbirnen pro Jahr
und für die zu erwartende Wartezeit zwischen zwei Ausfällen
E (X ) =
Statistik 2
Sommersemester 2017
1
Jahr = 36, 5 Tage.
10
Helmut Küchenhoff (Institut für Statistik, LMU)
156 / 172
Pareto-Verteilung
Verteilung zur Modellierung von Einkommen Kurzschreibweise:
X ∼ Pareto(k, α) Verteilungsfunktion
(
α
1 − kx
für x ≥ k
F (x) =
0
sonst
Dichte :
(
f (x) =
αk α
x α+1
0
für x ≥ k
sonst
Erwartungswert:
E (X ) =
Statistik 2
Sommersemester 2017
α
k
α−1
Helmut Küchenhoff (Institut für Statistik, LMU)
157 / 172
Pareto-Verteilung
graphische Beispiele der Dichtefunktion
Statistik 2
Sommersemester 2017
Helmut Küchenhoff (Institut für Statistik, LMU)
158 / 172
Normalverteilung
Definition Normalverteilung
Die Normalverteilung ist die in der Statistik am häufigsten verwendete stetige Verteilung. Ihre Verteilung liegt (recht) eng und
symmetrisch um ihren Erwartungswert.
Kurzschreibweise: X ∼ N(µ, σ 2 )
1
(x − µ)2
f (x) = √ · exp −
2σ 2
σ 2π
Statistik 2
Sommersemester 2017
Helmut Küchenhoff (Institut für Statistik, LMU)
159 / 172
Anwendungen
viele Zufallsvariablen sind (nach Transformation) (ungefähr)
normalverteilt.
beim Zusammenwirken vieler zufälliger Einflüsse ist der geeignet
aggregierte Gesamteffekt oft approximativ normalverteilt (Zentraler
Grenzwertsatz).
die asymptotische Grenzverteilung, also die Verteilung bei unendlich
großem Stichprobenumfang, typischer statistischer Größen ist die
Normalverteilung.
Statistik 2
Sommersemester 2017
Helmut Küchenhoff (Institut für Statistik, LMU)
160 / 172
Normalverteilung
Erwartungswert und Varianz
E (X ) = µ
Var (X ) = σ 2
Dies sind zugleich die Parameter der Verteilung.
Statistik 2
Sommersemester 2017
Helmut Küchenhoff (Institut für Statistik, LMU)
161 / 172
Normalverteilung
1.0
0.8
0.6
0.4
0.2
0.0
N(0, 1)
0
2
4
10
14
16
18
20
0.8
0.2
0.4
0.6
0.8
0.6
0.4
−5
Sommersemester 2017
0
5
10
N(0, 0.5)
0.0
0.2
0.0
N(0, 5)
−10
Statistik 2
12
1.0
−2
1.0
−4
N(15, 1)
0.0
0.2
0.4
0.6
0.8
1.0
graphische Beispiele der Verteilungssfunktion
−10
−5
0
Helmut Küchenhoff (Institut für Statistik, LMU)
5
10
162 / 172
Normalverteilung
graphische Beispiele der Dichtefunktion
0.4
0.3
0.2
0.1
0
2
4
10
12
14
16
18
20
0.2
0.4
0.6
0.8
N(0, 0.5)
0.0
0.0
0.2
0.4
0.6
0.8
N(0, 5)
1.0
−2
1.0
−4
−10
Statistik 2
N(15, 1)
0.0
0.0
0.1
0.2
0.3
0.4
N(0, 1)
−5
Sommersemester 2017
0
5
10
−10
−5
0
Helmut Küchenhoff (Institut für Statistik, LMU)
5
10
163 / 172
Normalverteilung II
Statistik 2
Sommersemester 2017
Helmut Küchenhoff (Institut für Statistik, LMU)
164 / 172
Normalverteilung III
Statistik 2
Sommersemester 2017
Helmut Küchenhoff (Institut für Statistik, LMU)
165 / 172
Normalverteilung
Standardisierung
Sei X ∼ N(µ, σ 2 ). Dann ist
Z=
Statistik 2
Sommersemester 2017
X −µ
∼ N(0, 1)
σ
Helmut Küchenhoff (Institut für Statistik, LMU)
166 / 172
Normalverteilung
Häufig kommen unabhängig und identisch verteilte Zufallsgrößen vor.
Man spricht dann von iid (independently identically distributed)
Zufallsgrößen.
Additionssatz
iid
Seien X1 , ..., Xn ∼ N(µ, σ 2 ), dann ist deren Summe normalverteilt:
n
X
Xi ∼ N nµ, nσ 2 .
i=1
Das arithmetische Mittel der Zufallsvariablen X1 , ..., Xn ist ebenfalls
normalverteilt:
n
σ2
1X
X̄ =
Xi ∼ N µ,
.
n
n
i=1
Statistik 2
Sommersemester 2017
Helmut Küchenhoff (Institut für Statistik, LMU)
167 / 172
Anwendung aus der Qualitätskontrolle
Statistik 2
Sommersemester 2017
Helmut Küchenhoff (Institut für Statistik, LMU)
168 / 172
Beispiel mit Proben von 4 Einheiten
Eingriffsgrenzen:
σ
X̄ + 3 · √
4
20
25
UCL
15
CL
10
Group summary statistics
30
xbar Chart
for X2
LCL
1
2
3
4
5
6
7
8
9 10
12
14
16
18
20
Group
Number of groups = 20
Center = 18.4875
StdDev = 7.139388
Statistik 2
Sommersemester 2017
LCL = 7.778418
UCL = 29.19658
Number beyond limits = 1
Number violating runs = 0
Helmut Küchenhoff (Institut für Statistik, LMU)
169 / 172
Beispiel mit Proben von 4 Einheiten
xbar Chart
for X$X1 and Xnew$X1
80
UCL
60
100
New data in Xnew$X1
CL
40
Group summary statistics
Calibration data in X$X1
LCL
1
3
5
7
9
11
13
15
17
19
21
23
25
27
29
Group
Number of groups = 30
Center = 60.375
StdDev = 14.93443
Statistik 2
Sommersemester 2017
LCL = 37.97335
UCL = 82.77665
Number beyond limits = 3
Number violating runs = 0
Helmut Küchenhoff (Institut für Statistik, LMU)
170 / 172
Normalverteilung
Rechenregeln
Sei Φ( x−µ
σ ) die Verteilungsfunktion der Standardnormalverteilung zu einer beliebigen Normalverteilung F (x).
Seien a und b beliebige reelle Zahlen, za =
b−µ
σ deren Standardisierungen und
a−µ
σ
und zb =
sei z ein beliebiges Quantil der Standardnormalverteilung.
Dann gilt:
P(X ≤ b) = F (b) = Φ(zb )
P(X > b) = 1 − Φ(zb )
P(a ≤ X ≤ b) = Φ(zb ) − Φ(za )
Φ(−z) = 1 − Φ(z)
Φ(0) = 0, 5
P(−a ≤ X ≤ a) = 2Φ(za ) − 1
Statistik 2
Sommersemester 2017
Helmut Küchenhoff (Institut für Statistik, LMU)
171 / 172
Normalverteilung
wichtige Quantile der Standardnormalverteilung
Quantile, die oft beim Testen von Hypothesen verwendet werden:
α = 0, 05: z1−α = z0,95 = 1, 64
α = 0, 05: z1− α2 = z0,975 = 1, 96
α = 0, 01: z1−α = z0,99 = 2, 33
α = 0, 01: z1− α2 = z0,995 = 2, 58
Quantilbestimmung
Ein beliebiges Quantil xp einer nichtstandardisierten Normalverteilung kann durch folgende Rechnung bestimmt werden:
xp = µ + σ · zp
Statistik 2
Sommersemester 2017
Helmut Küchenhoff (Institut für Statistik, LMU)
172 / 172
Herunterladen