Einführung in die Statistik für Wirtschaftswissenschaftler

Werbung
Einführung in die Statistik für
Wirtschaftswissenschaftler
für Betriebswirtschaft und Internationales Management
Sommersemester 2013
Stefan Etschberger
Hochschule Augsburg
Statistik Einführung
Stefan Etschberger
Eigenschaften der Normalverteilung
Dichte ist symmetrisch zu µ:
1. Einführung
f(µ − x) = f(µ + x)
à µ ist Lage-, σ ist Streuungsparameter
Standardnormalverteilung:
N(0; 1) mit Verteilungsfunktion Φ(x) (→ Tabelle 3)
Kenntnis von Φ(x), µ und σ genügt, denn:
X ∼ N(µ; σ) ⇐⇒ X−µ
⇒
σ ∼ N(0; 1)
F(x) = Φ
x−µ
σ
2. Deskriptive Statistik
3. W-Theorie
Kombinatorik
Zufall und Wahrscheinlichkeit
Zufallsvariablen und
Verteilungen
Verteilungsparameter
4. Induktive Statistik
Tabellen
Quellen
Tabelle enthält nur positive x: Deswegen
Φ(−x) = 1 − Φ(x)
126
x1 \x2
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
x1 \x2
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
1.1
0
0.01
0.02
0.03
0.04
0.05
0.50000
0.53983
0.57926
0.61791
0.65542
0.69146
0.72575
0.75804
0.78814
0.81594
0.84134
0.86433
0.50399
0.54380
0.58317
0.62172
0.65910
0.69497
0.72907
0.76115
0.79103
0.81859
0.84375
0.86650
0.50798
0.54776
0.58706
0.62552
0.66276
0.69847
0.73237
0.76424
0.79389
0.82121
0.84614
0.86864
0.51197
0.55172
0.59095
0.62930
0.66640
0.70194
0.73565
0.76730
0.79673
0.82381
0.84850
0.87076
0.51595
0.55567
0.59483
0.63307
0.67003
0.70540
0.73891
0.77035
0.79955
0.82639
0.85083
0.87286
0.51994
0.55962
0.59871
0.63683
0.67364
0.70884
0.74215
0.77337
0.80234
0.82894
0.85314
0.87493
0
0.01
0.02
0.03
0.04
0.05
0.06
0.07
0.50000
0.53983
0.57926
0.61791
0.65542
0.69146
0.72575
0.75804
0.50399
0.54380
0.58317
0.62172
0.65910
0.69497
0.72907
0.76115
0.50798
0.54776
0.58706
0.62552
0.66276
0.69847
0.73237
0.76424
0.51197
0.55172
0.59095
0.62930
0.66640
0.70194
0.73565
0.76730
0.51595
0.55567
0.59483
0.63307
0.67003
0.70540
0.73891
0.77035
0.51994
0.55962
0.59871
0.63683
0.67364
0.70884
0.74215
0.77337
0.52392
0.56356
0.60257
0.64058
0.67724
0.71226
0.74537
0.77637
0.52790
0.56749
0.60642
0.64431
0.68082
0.71566
0.74857
0.77935
Statistik Einführung
Stefan Etschberger
Normalverteilung: Beispiel
Beispiel:
Projektdauer X ∼ N(39; 2).
1. Einführung
Wahrscheinlichkeit für Projektdauer zwischen 37 und 41 Wochen?
3. W-Theorie
2. Deskriptive Statistik
Kombinatorik
Zufall und Wahrscheinlichkeit
Lösung:
Zufallsvariablen und
Verteilungen
Verteilungsparameter
P(37 5 X 5 41) = F(41) − F(37)
= Φ 41−39
−Φ
2
4. Induktive Statistik
37−39
2
Tabellen
Quellen
= Φ(1) − Φ(−1)
= Φ(1) − [1 − Φ(1)]
= 2 · Φ(1) − 1
= 2 · 0,8413 − 1
= 0,6826
127
Statistik Einführung
Stefan Etschberger
Lageparameter
a) Modus xMod : f(xMod ) = f(x) für alle x
(i.A. nicht eindeutig, z.B. Gleichverteilung)
1. Einführung
2. Deskriptive Statistik
Beispiele:
3. W-Theorie
Kombinatorik
Normalverteilung: xMod = µ
Diskrete Verteilung mit:
Zufall und Wahrscheinlichkeit
Zufallsvariablen und
Verteilungen
x 0 1 2
f(x) 41 12 14
b) Median xMed : F(xMed ) =
1
2
Verteilungsparameter
4. Induktive Statistik
⇒ xMod = 1
Tabellen
Quellen
bzw. kleinstes x mit F(x) >
1
2
Beispiele:
Normalverteilung: xMed = µ
Diskrete Verteilung
oben: F(0) = 14 < 21 , F(1) =
3
4
>
1
2
⇒ xMed = 1
128
Statistik Einführung
Stefan Etschberger
Lageparameter: Fraktile
c) α -Fraktil xα : F(xα ) = α (für stetige Verteilungen)
Beispiel: X ∼ N(0; 1), Y ∼ N(3; 2)
1. Einführung
2. Deskriptive Statistik
x0,975 =
1,96
x0,025 = −x0,975
= −1,96
y0,025 = 2 · x0,025 +3 = −0,92
(Tab. 3)
3. W-Theorie
Kombinatorik
Zufall und Wahrscheinlichkeit
Zufallsvariablen und
Verteilungen
Verteilungsparameter
Hinweise:
4. Induktive Statistik
Tabellen
xMed = x0,5
Wenn xα nicht vertafelt → Interpolation:
Quellen
1
2
x1 \x2
xα ≈ xa + (xb − xa ) ·
mit
α−a
b−a
a : größte vertafelte Zahl < α
b : kleinste vertafelte Zahl > α
Beispiel: X ∼ N(0; 1); x0,6 ≈ 0,25 + (0,26 − 0,25) ·
0,2533
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
1.9
0,6−0,5987
0,6026−0,5987
0
0.01
0.02
0.03
0.04
0.05
0.50000
0.53983
0.57926
0.61791
0.65542
0.69146
0.72575
0.75804
0.78814
0.81594
0.84134
0.86433
0.88493
0.90320
0.91924
0.93319
0.94520
0.95543
0.96407
0.97128
0.50399
0.54380
0.58317
0.62172
0.65910
0.69497
0.72907
0.76115
0.79103
0.81859
0.84375
0.86650
0.88686
0.90490
0.92073
0.93448
0.94630
0.95637
0.96485
0.97193
0.50798
0.54776
0.58706
0.62552
0.66276
0.69847
0.73237
0.76424
0.79389
0.82121
0.84614
0.86864
0.88877
0.90658
0.92220
0.93574
0.94738
0.95728
0.96562
0.97257
0.51197
0.55172
0.59095
0.62930
0.66640
0.70194
0.73565
0.76730
0.79673
0.82381
0.84850
0.87076
0.89065
0.90824
0.92364
0.93699
0.94845
0.95818
0.96638
0.97320
0.51595
0.55567
0.59483
0.63307
0.67003
0.70540
0.73891
0.77035
0.79955
0.82639
0.85083
0.87286
0.89251
0.90988
0.92507
0.93822
0.94950
0.95907
0.96712
0.97381
0.51994
0.55962
0.59871
0.63683
0.67364
0.70884
0.74215
0.77337
0.80234
0.82894
0.85314
0.87493
0.89435
0.91149
0.92647
0.93943
0.95053
0.95994
0.96784
0.97441
=
129
Statistik Einführung
Stefan Etschberger
Lageparameter: Erwartungswert
d) Erwartungswert E(X) bzw. µ:
X
xi f(xi ),




 i
∞
Z
E(X) =



xf(x) dx,


1. Einführung
falls X diskret
2. Deskriptive Statistik
3. W-Theorie
Kombinatorik
falls X stetig
Zufall und Wahrscheinlichkeit
Zufallsvariablen und
Verteilungen
−∞
Verteilungsparameter
4. Induktive Statistik
Beispiel: Diskrete Verteilung mit
x 0 1 2
f(x) 14 21 14
Tabellen
Quellen
⇒
E(X) = 0 ·
1
4
+1·
1
2
+2·
1
4
=1
Beispiel: Für eine exponentialverteilte Zufallsvariable X mit der Dichte
λ · e−λx für x ≥ 0
f(x) =
folgt
0
sonst
Z∞
Z∞
Z∞
1
1
E(X) =
x · f(x)dx = λ
x · e−λx dx = λ − xe−λx −
1 · − e−λx dx
λ
λ
−∞
0
0
∞
1
1
1
= −xe−λx − e−λx = −0 − −0 −
=
λ
λ
λ
0
130
Statistik Einführung
Stefan Etschberger
Rechenregeln für den Erwartungswert
Ist f symmetrisch bzgl. a, so gilt E(X) = a
Beispiel: f der Gleichverteilung symmetrisch
⇒ E(X) = a+b
bzgl. a+b
2
2
1. Einführung
Lineare Transformation:
2. Deskriptive Statistik
3. W-Theorie
E(a + bX) = a + b · E(X)
Kombinatorik
Zufall und Wahrscheinlichkeit
Zufallsvariablen und
Verteilungen
Summenbildung:
Verteilungsparameter
4. Induktive Statistik
E
n
X
i=1
!
Xi
=
n
X
Tabellen
E(Xi )
Quellen
i=1
Beispiel: X gleichverteilt in [0; 10], Y ∼ N(1; 1); Z = X + 5Y
E(Z) = E(X+5Y) = E(X)+E(5Y) = E(X)+5·E(Y) =
10+0
2
+5·1 = 10
Unabhängigkeit:
X, Y unabhängig ⇒ E(X · Y) = E(X) · E(Y)
131
Statistik Einführung
Stefan Etschberger
Streuungsparameter
Varianz Var(X) bzw. σ2 :
X
[xi − E(X)]2 f(xi ),




2
Var(X) = E([X − E(X)] ) =
wenn X diskret
i
Z∞




[x − E(X)]2 f(x) dx,
1. Einführung
2. Deskriptive Statistik
wenn X stetig
−∞
3. W-Theorie
Kombinatorik
Zufall und Wahrscheinlichkeit
Zufallsvariablen und
Verteilungen
Standardabweichung Sta(X) bzw. σ:
2
Var(X) = (0 − 1) ·
p
Var(X)
Verteilungsparameter
4. Induktive Statistik
Tabellen
x 0 1 2
1 1 1
f(x) 4
2 4
Beispiel: Diskrete Verteilung
Sta(X) =
:
Quellen
1
1
1
1
2
2
+ (1 − 1) · + (2 − 1) ·
=
4
2
4
2
Beispiel: Für eine exponentialverteilte Zufallsvariable X (Dichte siehe Erwartungswert) folgt
Z∞
Z∞
−λx
1 2
Var(X) =
(x − E(X))f(x)dx = λ
x− λ
·e
dx
−∞
= e
−λx
0
2
−x +
2
= 0 − −0 −
2x
λ
−
1 2
λ
1 2
λ
1
= 2
λ
−
2
λ2
−
2x
λ
+
2
λ2
∞
0
132
Statistik Einführung
Stefan Etschberger
Rechenregeln für die Varianz
Verschiebungssatz:
Var(X) = E(X2 ) − [E(X)]2
1. Einführung
2. Deskriptive Statistik
Beispiel: Diskrete Verteilung
2
E(X )
⇒ E(X2 ) − [E(X)]2
2
x 0 1 2
1 1
f(x) 1
4 2 4
:
1
2
2
=
0 ·
=
3
2
3
2
=
1
4
2
+1 ·
3. W-Theorie
Kombinatorik
+2 ·
1
4
Zufall und Wahrscheinlichkeit
Zufallsvariablen und
Verteilungen
Verteilungsparameter
4. Induktive Statistik
− 12 =
1
2
= Var(X)
Tabellen
Quellen
Lineare Transformation:
Var(a + bX) = b2 Var(X)
Summenbildung gilt nur, wenn die Xi unabhängig! Dann:
!
n
n
X
X
Xi =
Var(Xi )
Var
i=1
i=1
133
Erwartungswerte und Varianzen wichtiger Verteilungen
Verteilung von X
E(X)
Var(X)
Binomialverteilung B(n; p)
np
np(1 − p)
Statistik Einführung
Stefan Etschberger
1. Einführung
2. Deskriptive Statistik
3. W-Theorie
N−M N−n
nM
N
N N−1
Hypergeometrische Verteilung
mit den Parametern N, M, n
nM
N
Poisson-Verteilung P(λ)
λ
a+b
2
λ
(b − a)2
12
µ
σ2
Kombinatorik
Zufall und Wahrscheinlichkeit
Zufallsvariablen und
Verteilungen
Verteilungsparameter
4. Induktive Statistik
Tabellen
Gleichverteilung in [a; b]
mit a < b
Normalverteilung N(µ; σ)
Quellen
134
Statistik Einführung
Stefan Etschberger
Kovarianz und Korrelation
Kovarianz:
Cov(X, Y)
= E[(X − E(X))(Y − E(Y))]
= E(X · Y) − E(X) · E(Y)
(Verschiebungssatz)
1. Einführung
2. Deskriptive Statistik
3. W-Theorie
Kombinatorik
Zufall und Wahrscheinlichkeit
Zufallsvariablen und
Verteilungen
Korrelationskoeffizient:
Verteilungsparameter
4. Induktive Statistik
ρ(X, Y) = p
Cov(X, Y)
Var(X) · Var(Y)
Tabellen
Quellen
Bemerkungen:
ρ ist r nachgebildet ⇒ ρ ∈ [−1; 1]
|ρ| = 1 ⇐⇒ Y = a + bX (mit b 6= 0)
ρ = 0 ⇐⇒ X, Y unkorreliert
Varianz einer Summe zweier ZV:
Var(X + Y) = Var(X) + Var(Y) + 2 Cov(X, Y)
135
Herunterladen