Einführung in die Statistik für Wirtschaftswissenschaftler

Werbung
Einführung in die Statistik für
Wirtschaftswissenschaftler
für Betriebswirtschaft und Internationales Management
Sommersemester 2013
Stefan Etschberger
Hochschule Augsburg
Statistik Einführung
Stefan Etschberger
Lageparameter: Erwartungswert
d) Erwartungswert E(X) bzw. µ:
X
xi f(xi ),




 i
∞
Z
E(X) =



xf(x) dx,


1. Einführung
falls X diskret
2. Deskriptive Statistik
3. W-Theorie
Kombinatorik
falls X stetig
Zufall und Wahrscheinlichkeit
Zufallsvariablen und
Verteilungen
−∞
Verteilungsparameter
4. Induktive Statistik
Beispiel: Diskrete Verteilung mit
x 0 1 2
f(x) 14 21 14
Tabellen
Quellen
⇒
E(X) = 0 ·
1
4
+1·
1
2
+2·
1
4
=1
Beispiel: Für eine exponentialverteilte Zufallsvariable X mit der Dichte
λ · e−λx für x ≥ 0
f(x) =
folgt
0
sonst
Z∞
Z∞
Z∞
1
1
E(X) =
x · f(x)dx = λ
x · e−λx dx = λ − xe−λx −
1 · − e−λx dx
λ
λ
−∞
0
0
∞
1
1
1
= −xe−λx − e−λx = −0 − −0 −
=
λ
λ
λ
0
130
Statistik Einführung
Stefan Etschberger
Rechenregeln für den Erwartungswert
Ist f symmetrisch bzgl. a, so gilt E(X) = a
Beispiel: f der Gleichverteilung symmetrisch
⇒ E(X) = a+b
bzgl. a+b
2
2
1. Einführung
Lineare Transformation:
2. Deskriptive Statistik
3. W-Theorie
E(a + bX) = a + b · E(X)
Kombinatorik
Zufall und Wahrscheinlichkeit
Zufallsvariablen und
Verteilungen
Summenbildung:
Verteilungsparameter
4. Induktive Statistik
E
n
X
i=1
!
Xi
=
n
X
Tabellen
E(Xi )
Quellen
i=1
Beispiel: X gleichverteilt in [0; 10], Y ∼ N(1; 1); Z = X + 5Y
E(Z) = E(X+5Y) = E(X)+E(5Y) = E(X)+5·E(Y) =
10+0
2
+5·1 = 10
Unabhängigkeit:
X, Y unabhängig ⇒ E(X · Y) = E(X) · E(Y)
131
Statistik Einführung
Stefan Etschberger
Streuungsparameter
Varianz Var(X) bzw. σ2 :
X
[xi − E(X)]2 f(xi ),




2
Var(X) = E([X − E(X)] ) =
wenn X diskret
i
Z∞




[x − E(X)]2 f(x) dx,
1. Einführung
2. Deskriptive Statistik
wenn X stetig
−∞
3. W-Theorie
Kombinatorik
Zufall und Wahrscheinlichkeit
Zufallsvariablen und
Verteilungen
Standardabweichung Sta(X) bzw. σ:
2
Var(X) = (0 − 1) ·
p
Var(X)
Verteilungsparameter
4. Induktive Statistik
Tabellen
x 0 1 2
1 1 1
f(x) 4
2 4
Beispiel: Diskrete Verteilung
Sta(X) =
:
Quellen
1
1
1
1
2
2
+ (1 − 1) · + (2 − 1) ·
=
4
2
4
2
Beispiel: Für eine exponentialverteilte Zufallsvariable X (Dichte siehe Erwartungswert) folgt
Z∞
Z∞
−λx
1 2
Var(X) =
(x − E(X))f(x)dx = λ
x− λ
·e
dx
−∞
= e
−λx
0
2
−x +
2
= 0 − −0 −
2x
λ
−
1 2
λ
1 2
λ
1
= 2
λ
−
2
λ2
−
2x
λ
+
2
λ2
∞
0
132
Statistik Einführung
Stefan Etschberger
Rechenregeln für die Varianz
Verschiebungssatz:
Var(X) = E(X2 ) − [E(X)]2
1. Einführung
2. Deskriptive Statistik
Beispiel: Diskrete Verteilung
2
E(X )
⇒ E(X2 ) − [E(X)]2
2
x 0 1 2
1 1
f(x) 1
4 2 4
:
1
2
2
=
0 ·
=
3
2
3
2
=
1
4
2
+1 ·
3. W-Theorie
Kombinatorik
+2 ·
1
4
Zufall und Wahrscheinlichkeit
Zufallsvariablen und
Verteilungen
Verteilungsparameter
4. Induktive Statistik
− 12 =
1
2
= Var(X)
Tabellen
Quellen
Lineare Transformation:
Var(a + bX) = b2 Var(X)
Summenbildung gilt nur, wenn die Xi unabhängig! Dann:
!
n
n
X
X
Xi =
Var(Xi )
Var
i=1
i=1
133
Erwartungswerte und Varianzen wichtiger Verteilungen
Verteilung von X
E(X)
Var(X)
Binomialverteilung B(n; p)
np
np(1 − p)
Statistik Einführung
Stefan Etschberger
1. Einführung
2. Deskriptive Statistik
3. W-Theorie
N−M N−n
nM
N
N N−1
Hypergeometrische Verteilung
mit den Parametern N, M, n
nM
N
Poisson-Verteilung P(λ)
λ
a+b
2
λ
(b − a)2
12
µ
σ2
Kombinatorik
Zufall und Wahrscheinlichkeit
Zufallsvariablen und
Verteilungen
Verteilungsparameter
4. Induktive Statistik
Tabellen
Gleichverteilung in [a; b]
mit a < b
Normalverteilung N(µ; σ)
Quellen
134
Statistik Einführung
Stefan Etschberger
Kovarianz und Korrelation
Kovarianz:
Cov(X, Y)
= E[(X − E(X))(Y − E(Y))]
= E(X · Y) − E(X) · E(Y)
(Verschiebungssatz)
1. Einführung
2. Deskriptive Statistik
3. W-Theorie
Kombinatorik
Zufall und Wahrscheinlichkeit
Zufallsvariablen und
Verteilungen
Korrelationskoeffizient:
Verteilungsparameter
4. Induktive Statistik
ρ(X, Y) = p
Cov(X, Y)
Var(X) · Var(Y)
Tabellen
Quellen
Bemerkungen:
ρ ist r nachgebildet ⇒ ρ ∈ [−1; 1]
|ρ| = 1 ⇐⇒ Y = a + bX (mit b 6= 0)
ρ = 0 ⇐⇒ X, Y unkorreliert
Varianz einer Summe zweier ZV:
Var(X + Y) = Var(X) + Var(Y) + 2 Cov(X, Y)
135
Statistik Einführung: Gliederung
1
Einführung
2
Deskriptive Statistik
3
Wahrscheinlichkeitstheorie
4
Induktive Statistik
4
Induktive Statistik
Grundlagen
Punkt-Schätzung
Intervall-Schätzung
Signifikanztests
Statistik Einführung
Stefan Etschberger
Grundlagen der induktiven Statistik
Vollerhebung of unmöglich,
1. Einführung
Deshalb: Beobachte Teilgesamtheit und schließe auf
Grundgesamtheit
2. Deskriptive Statistik
3. W-Theorie
4. Induktive Statistik
Grundlagen
Punkt-Schätzung
Beispiel
Intervall-Schätzung
Signifikanztests
Warensendung von 1000 Stück; darunter M Stück Ausschuss.
M ist unbekannt.
→ Zufällige Entnahme von n = 30 Stück („Stichprobe“).
Darunter 2 Stück Ausschuss.
Denkbare Zielsetzungen:
Schätze M durch eine Zahl (z.B.
2
30
Tabellen
Quellen
· 1000 = 66,67)
Schätze ein Intervall für M (z.B. M ∈ [58; 84])
Teste die Hypothese, dass M > 50 ist.
137
Grundbegriffe
Statistik Einführung
Stefan Etschberger
Grundgesamtheit (G): Menge aller relevanten Merkmalsträger.
Verteilung von G: F(x) = P(X 5 x) = Wahrscheinlichkeit, dass
ein Merkmalsträger ausgewählt wird, der beim untersuchten
Merkmal maximal die Ausprägung x aufweist.
Uneingeschränkte (reine) Zufallsauswahl:
Jedes Element von G hat die selbe Chance, ausgewählt zu
werden.
Stichprobenumfang (n): Anzahl der Merkmalsträger in der
Stichprobe.
1. Einführung
2. Deskriptive Statistik
3. W-Theorie
4. Induktive Statistik
Grundlagen
Punkt-Schätzung
Intervall-Schätzung
Signifikanztests
Tabellen
Quellen
Einfache Stichprobe:
Uneingeschränkte Zufallsauswahl und unabhängige Ziehung.
→ Alle Stichprobenvariablen X1 , . . . , Xn sind iid.
Stichprobenergebnis:
n-Tupel der Realisationen der
Stichprobenvariablen, (x1 , . . . , xn ).
138
Statistik Einführung
Stefan Etschberger
Wichtige Stichprobenfunktionen
Gegeben: Einfache Stichprobe X1 , . . . , Xn ,
Beliebige Verteilung mit E(Xi ) = µ, Var(Xi ) = σ2
Stichprobenfunktion V
n
X
Bezeichnung
E(V)
Var(V)
Merkmalssumme
nµ
nσ2
1. Einführung
2. Deskriptive Statistik
Xi
i=1
X̄ =
3. W-Theorie
4. Induktive Statistik
n
1 X
Xi
n i=1
Stichprobenmittel
µ
Gauß-Statistik
n
1 X
2
(Xi − µ)
n i=1
mittlere quadr. Abw. bezüglich µ
n
1 X
2
(Xi − X̄)
n i=1
mittlere quadr. Abw.
n−1 2
σ
n
Stichprobenvarianz
σ2
n
X
1
2
(Xi − X̄)
n − 1 i=1
√
S = S2
X̄ − µ √
n
S
Grundlagen
Punkt-Schätzung
Intervall-Schätzung
Signifikanztests
X̄ − µ √
n
σ
S2 =
σ2
n
0
1
Tabellen
Quellen
σ2
Stichproben-Standardabw.
t-Statistik
139
350 508 545
D=c(435,300,730,540,350,295,350,820,620,350,
110,1800,800,700,280,200,480,30,350,300,
360,250,480,250,200,340,320,283,980,424,
1850,590,1080,1300,45,530,680,365,1000,1000,
1000,150,300,400,720,250,240,692,350,650,
180,300,300,530,350,360,360,296,580,360,
670,315,640,800,700,350,550,950,640,600,
850,200,570,600,490,540,400,120,120,180,
360,156,125,100,120,80,60,300,400,800,600,618,
250,170,810,350,350,800,400,280,420,800,
300,280,800,508,425,600,500,500,400,700,
700,300,500,500,545,600,500,500,765,200,120,
150,250,150,600,650,430,275,750,500,
1589,240,240,220,240,250,600,500)
60 600
Herunterladen