Erwartungswert und Varianz von Zufallsgrößen Zufällige Auswahl

Werbung
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 7.1
Erwartungswert und Varianz von Zufallsgrößen
Zufällige Auswahl von Mann und Frau
X=
Y =
)
(
Körpergröße
der Frau
des Mannes
Wir erwarten X < Y
In der Mehrzahl der Fälle wird das so sein.
Aber: X > Y kann vorkommen!
Modell: X, Y unabhängig und N (µx, σx2)- bzw. N (µy , σy2)-verteilt
Beispiel: µx = 165 cm, µy = 175 cm, σx = σy = 10 cm
Scatter-Plot von unabhängigen, wie (X, Y ) verteilten (X1, Y1), . . . , (XN , YN )
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 7.2
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 7.3
X Zufallsgröße mit möglichen Werten x1, . . . , xn
1 , j = 1, . . . , n
Laplace-verteilt: Ws(X = xj ) = n
Erwartungswert oder Mittelwert von X
n
1 X
EX =
xj ,
n j=1
beliebige diskrete Verteilung mit Wahrscheinlichkeitsgewichten
Ws(X = xj ) = pj
EX =
=
n
X
j=1
n
X
j=1
xj p j
xj Ws(X = xj )
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 7.4
Beispiele: (Skript, S. 39) a) Würfelwurf: Ws(X = k) = 1
6, k =
1, . . . , 6
1
EX = (1 + 2 + . . . + 6) = 3, 5
6
b) Y 0-1-Zufallsgröße; Ws(Y = 1) = p
EY = 0 · Ws(Y = 0) + 1 · Ws(Y = 1) = p
c) X kann die Werte 1, 2, 3, 100 annehmen.
333
,
Ws(X = k) =
1000
gewöhnliches Mittel:
EX =
k = 1, 2, 3,
1
=
für k = 100.
1000
1+2+3+100
= 26, 5
4
1
333
· (1 + 2 + 3) +
· 100 = 2, 098
1000
1000
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 7.5
Erwartungswert EX einer beliebigen reellwertigen Zufallsgröße
a) Verteilung von X diskret mit Werten x1, x2, . . . und
Wsgewichten pj = Ws(Xj = xj )
EX =
∞
X
∞
X
xj pj =
j=1
xj Ws(X = xj )
j=1
b) X hat Wsdichte p(x)
EX =
Z ∞
−∞
x p(x)dx.
Es gibt (seltene) Fälle, wo EX nicht existiert!
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 7.6
Beispiele:
a) X Poisson-verteilt: P(λ),
Werte 0,1,2,. . .
∞
X
∞
X
λj −λ
EX =
j pj =
j
e
=λ
j=0
j=0 j!
b) X exponentialverteilt: Exp(λ)
EX =
Z ∞
−∞
x p(x)dx =
c) B(n, p): EX = np
d) H(n, M, N ): EX = n M
N
e) N (µ, σ 2): EX = µ
Z ∞
0
xλe−λxdx =
1
λ
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 7.7
2
µ+ σ2
2
f) lognormal(µ, σ ) : EX = e
g) Weibull(λ, β) : EX = 1β Γ(1 + β1 )
λ
Gamma-Funktion: Γ(n + 1) = n!
Allgemein: Hat X eine Wsdichte, die symmetrisch um µ ist, so
ist EX = µ.
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 7.8
Erwartungswerte von Funktionen einer Zufallsgröße
X Zufallsgröße mit Werten in X
f reellwertige Funktion auf X , Ef (X) =?
1. Möglichkeit:
Verteilung der Zufallsgröße Y = f (X) bestimmen,
z.B.: X N (µ, σ 2)
Y = exp(X) lognormal
2. Möglichkeit: a) X Werte xj , Wsgewichte pj , j = 1, 2, . . . .
∞
X
Ef (X) =
f (xj )pj =
j=1
∞
X
f (xj )Ws(X = xj )
j=1
b) X Wsdichte p(x)
Ef (X) =
Z ∞
−∞
f (x) p(x)dx.
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 7.9
Gesetz der großen Zahlen: X1, . . . , XN u.i.v. reellwertige Zufallsgrößen mit EX = µ. Dann:
N
1 X
XN =
Xj → µ
N j=1
für N → ∞
(der Zufall mittelt sich heraus)
Genauer: Ws(X N → µ) = 1
Interpretation des Erwartungswerts EX
Wiederhole das Experiment, das X liefert, sehr oft auf unabhängige Weise
unabhängige X1, . . . , XN mit derselben Verteilung wie X. Dann gilt:
N
1 X
XN =
Xj ≈ EX
N j=1
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 7.10
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 7.11
Anwendung: Schätzer für Verteilungsparameter
X1, . . . , XN u.i.v. Exp(λ)-verteilt
1
X N ≈ EX =
λ
1
1
λ̂ =
=λ
≈
XN
EX
Erwartungswert oder Mittelwert EX in der Praxis
Produktion: Zielwert µ0 soll im Mittel eingehalten werden
Messwerte X1, X2, . . . , XN sollen im Mittel µ0 sein, d.h. es muss
EXj = µ0 gelten
Investitionen oder Geschäftsstrategien: Gewinn X nicht exakt
vorhersagbar
erwarteter Gewinn EX möglichst groß
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 7.12
Zusätzliche Wünsche:
Produktion: Abweichungen vom Zielwert µ0 nicht zu groß
Investitionen: zufällige Schwankungen des Gewinns (Risiko) nicht
zu hoch
Varianz var X einer reellwertigen Zufallsgröße
var X = E X − EX
√
Standardabweichung σ(X) = var X
2
Produktion: var Xj klein als Qualitätsforderung
Investitionen: var X oder σ(X)=Volatilität als Risikomaße
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 7.13
Nobelpreis für Wirtschaftswissenschaften (1990): H. Markowitz
für seine Theorie der Portfolio-Auswahl (1952/1959)
Bei der Auswahl eines Portfolios für zu investierendes Kapitel
spielen erwartete Rendite (EX) und Risiko (gemessen durch
var X) die wesentliche Rolle (mean-variance analysis).
Beide wachsen tendenziell gemeinsam, aber durch geschickte Portfoliowahl kann man, z.B. durch Risikodiversifizierung, die erwartete Rendite unter der Nebenbedingung maximieren, dass das
Risiko (= Varianz oder Volatilität) ein vorgegebenes Limit nicht
übersteigt:
Maximiere EX!
unter der Bedingung var X ≤ Limit
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 7.14
Beispiele: (Skript, S. 43)
a) P(λ)
EX = λ
var X = E X − EX
=
∞
X
2
λk −λ
2
e
=λ
(k − λ)
k!
k=0
b) N (µ, σ 2)
= E(X − λ)2
EX = µ
var X = E X − µ
2
=
Z ∞
−∞
(x − µ)2 √
c) B(n, p): var X = n p(1 − p) = n pq
M ) N −n
(1
−
d) H(n, M, N ): var X = n M
N
N N −1
1
2πσ 2
− (x−µ)
2
e
2σ
2
dx = σ 2
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 7.15
e) Exp(λ) : var X = λ12
2
2
f) lognormal (µ, σ 2) : var X = e2µ+σ (eσ − 1)
1
g) Weibull (λ, β) : var X = 2/β Γ(1 + β2 ) − Γ2(1 + β1 )
λ
Schätzer für Varianz aus Gesetz der Großen Zahlen
X1, . . . , XN u.i.v. mit EXj = µ, var Xj = σ 2
N N 2
2
2
X
X
1
1
2
Xj − X N ≈
Xj − µ ≈ E X1−µ = var X1 = σ 2
sN =
N − 1 j=1
N j=1
2 , falls N groß genug
s2
ist
brauchbarer
Schätzer
für
σ
N
- nicht nur für normalverteilte Daten.
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 7.16
Rechenregeln für Erwartungswerte
Erwartungswert linear: Für beliebige Konstanten c1, . . . , cN
!
E c1X1 + . . . + cN XN
= c1EX1 + . . . + c1EXN
Faktorisierung des Erwartungswerts für unabhängige X1, . . . , XN
E(X1 · . . . · XN ) = EX1 · . . . · EXN
Speziell für u.i.v. X1, . . . , XN :
E(X1 · . . . · XN ) = EX1
N
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 7.17
Rechenregeln für Varianzen
var cX
= c2var X,
σ cX = cσ(X)
Additivität des Erwartungswerts für unabhängige X1, . . . , XN

var 

N
X
Xj  =
j=1
N
X
var Xj
j=1
Speziell für u.i.v. X1, . . . , XN :

var 
N
X

Xj  = N · var X1
j=1
var X N = var
1 PN X
1 var X → 0
=
1
j
N j=1
N
PN
1
und const = EX1, da EX N = N j=1 EXj = EX1
X N → const
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 7.18
X1, . . . , XN u.i.v., Schätzer für µ = EXj :
XN
Approximatives (1 − α)-Konfidenzintervall für µ = EX
s
α
X N ± √N qα,
qα = (1 − ) − Quantil von tN −1
2
N
Anwendung: Approximatives Konfidenzintervall für λ, wenn X1, . . . , XN
unabhängig identisch Exp(λ)-verteilt, µ = EXj = 1
λ
[T1, T2] Konfidenzintervall für µ
Ws T1 ≤ 1
λ ≤ T2
1 ≤ λ ≤ 1 mit Wahrscheinlichkeit ≈ 1 − α
T2
T1
"
#
1 1
,
T2 T1
≈ (1 − α)-Konfidenzintervall für λ
≈1−α
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 7.19
Abhängige Zufallsgrößen: Kovarianz und Korrelation
X, Y reellwertige Zufallsgrößen mit Wsdichten px, py
2.
V = X
Zufallsvektor
mit
Werten
in
R
Y
zweidimensionale Dichte pv (x, y)
Ws(a ≤ X ≤ b, c ≤ Y ≤ d) =
X, Y unabhängig
⇐⇒
Z Z b
c a
pv (x, y)dx dy
pv (x, y) = px(x) · py (y)
Statt Untersuchung der Funktion pv (x, y) nur Zahl als Maß für
die Stärke der Abhängigkeit:
Kovarianz bzw. Korrelation von X und Y .
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 7.20
Kovarianz cov (X, Y ) zweier reellwertiger Zufallsgrößen X, Y
!
cov (X, Y ) = E (X − EX) · (Y − EY
= E(X · Y ) − EX · EY
Korrelation
cov (X, Y )
cov (X, Y )
=q
corr(X, Y ) =
σ(X) · σ(Y )
var (X) · var (Y )
Die Korrelation ist skaleninvariant:
corr(aX, bY )=corr(X, Y ), a, b> 0.
Es gilt immer:
−1 ≤ corr(X, Y ) ≤ +1
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 7.21
Was bedeutet der Korrelationswert?
1) X, Y unabhängig
cov (X, Y ) = 0
corr(X, Y ) = 0
X, Y heißen unkorreliert
2) Y proportional zu X, d.h. Y = c · X für ein c 6= 0
2 · var X
cov (X, Y ) = cov (X, cX) = c · cov
(X,
X)
,
var
Y
=
c
{z
}
|
=var X


 +1
c>0
c
corr(X, Y ) =
=
für

|c|
 −1
c<0
Das gilt auch allgemein für Y = c · X + d.
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 7.22
3) Aus X, Y unkorreliert,d.h. corr(X, Y ) = 0, folgt nicht (!),
dass X, Y unabhängig
Extremes Gegenbeispiel: X U (−1, +1)-verteilt, Y = X 2
corr(X, Y ) = 0
obwohl Y völlig von X abhängt (aber auf nichtlineare Weise)
Fazit: Korrelation misst das Ausmaß der linearen Abhängigkeit
von X und Y .
Wichtiger Sonderfall:
X, Y gemeinsam normalverteilt. Dann:
X, Y unabhängig
⇔
corr(X, Y ) = 0
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 7.23
Streudiagramme oder Scatterplots (vgl. Skript, 1.6)
2 Messungen je Objekt
x1
zweidimensionale Daten y , . . . , xy N ∈ R2
1
N
X j
modellieren als Zufallsvektoren
Yj
, j = 1, . . . , N
Streudiagramm oder Scatterplot
Xj , Yj beeinflussen sich nicht
Plot weitgehend parallel zu Koordinatenachsen
unkorreliert
typisch: Ellipse mit Hauptachsen parallel zu Koordinatenachsen
(Normalverteilung!)
Xj , Yj zusätzlich gleiche Variabilität
Kreis
Xj , Yj beeinflussen sich
Plot steigt oder fällt
corr(Xj , Yj ) > 0 bzw. < 0
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 7.24
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 7.25
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 7.26
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 7.27
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 7.28
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 7.29
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 7.30
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 7.31
Kovarianz- und Korrelationsschätzer
Modell: (x1, y1), . . . , (xn, yN ) sind Werte von unabhängig, identisch verteilten Zufallsvektoren (X1, Y1), . . . , (XN , YN ) mit
µx = EXj , σx2 = var Xj
c = cov (Xj , Yj )
µy = EYj , σy2 = var Yj
ρ = corr(Xj , Yj )
cov (X1, Y1) = E{(X1 − µx)(Y1 − µy )}
N
X
1
(Xj − µx)(Yj − µy )
≈
N − 1 j=1
N
X
1
≈
(Xj − X N )(Yj − Y N ) = ĉN
N − 1 j=1
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 7.32
Stichprobenkovarianz ĉN und Stichprobenkorrelation ρ̂N schätzen
c bzw. ρ
ĉN
ρ̂N =
,
sN,x · sN,y
s2
N,x =
N
X
1
(Xj − X N )2,
N − 1 j=1
s2
N,y = . . .
Test auf Unabhängigkeit zweier Stichproben
Modell: Paare von Messungen (X1, Y1), . . . , (XN , YN ) unabhängig
und identisch gemeinsam normalverteilt mit Korrelation ρ.
gemeinsam normalverteilt:
2 )-verteilt für alle a, b.
a · X + b · Y ist N (µa,b, σa,b
In diesem Fall gilt:
Xj , Yj unabhängig ←→ Xi, Yi unkorreliert, ( d.h. ρ = 0)
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 7.33
Fisher-Transformation
1 1 + ρ̂N
ln
2 1 − ρ̂N
1 + ρ0
ln
1 − ρ0
ρ̂N
ρ0
Teststatistik
√
Z=
N −3
2
(
ln
1 + ρ̂N
1 + ρ0
− ln
1 − ρ̂N
1 − ρ0
(= 0 für ρ0 = 0)
)
ist unter der Hypothese H0 : ρ = ρ0 ungefähr N (0, 1)-verteilt für
N ≥ 50, ρ0 nicht zu nahe bei ±1.
Korrelationstest (qβ = β-Quantil von N (0, 1))
Hypothese
Alternative
H0 verwerfen, wenn
H 0 : ρ = ρ0
oder ρ ≤ ρ0
H 0 : ρ = ρ0
H1 : ρ > ρ 0
Z > q1−α
H1 : ρ 6= ρ0
|Z| > q1− α
2
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 7.34
Abhängigkeit zwischen Ladenmiete/m2 (=
ˆ Geschäftslage) und
Umsatz in Ladenkette.
Daten für N = 53 Filialgeschäfte:
Xj = Umsatz pro m2 Ladenfläche
Yj = Miete pro m2 Ladenfläche
Stichprobenkorrelation ρ̂53 = 0, 37
Positive Korrelation zwischen Miete und Umsatz oder nicht?
Teste H0 : ρ = 0 (oder ≤ 0) gegen H1 : ρ > 0
√
Z=












1 + 0, 37
50
1+0
ln
− ln
= 2, 744


2 
 1 − 0, 37

| 1{z− 0}
Niveau α = 0, 01, q1−α = 2, 326
=0
Unabhängigkeit verwerfen
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 7.35
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 7.36
Allgemeine Regressionsmodelle
Datenpaare (X1, , Y1), . . . , (XN , YN ) unabhängig
Modell:
Yj = g(Xj ) + ej ,
j = 1, . . . , N
Residuen e1, . . . , eN u.i.v. mit Eej = 0, var ej = σe2
(oft: e1, . . . , eN u.i.v. N (0, σe2)-verteilt)
Probleme: 1) Schätze die Regressionsfunktion g(x)
2) Sage YN +1 vorher, gegeben den Wert von XN +1
Wenn XN +1 = x bekannt ist, so ist YbN +1 = g(x) die beste
Vorhersage für das zugehörige YN +1.
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 7.37
Lineare Regressionsmodelle
g(x) bekannt bis auf endlich viele Parameter, die linear in g
eingehen.
Beispiele:
g(x) = b0 + b1x Regressionsgerade
g(x) = b0 + b1x + b2x2 parabolische Regression
g(x) = b0 + b1x + . . . + bpxp polynomiale Regression
g(x) = b0 + b1 cos(x) + b2 cos(2x) + a1 sin(x) + a2 sin(2x)
trigonometrische Regression
nicht: g(x) = b1 eb2x + a1 e−a2x (Beispiel für nichtlineare Regression)
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 7.38
Regressionsgerade g(x) = b0 + b1x
Daten: (X1, , Y1), . . . , (XN , YN )
Kleinste-Quadrate-Ansatz:
Schätze b0, b1 durch die Kleinste-Quadrate-Schätzer b̂0, b̂1 definiert durch
N
X
j=1
Lösung:
!2
Yj − b̂0 − b̂1Xj
= min
N
X
b0 ,b1 j=1
!2
Yj − b0 − b1Xj
PN
j=1 (Yj − Y N ) · (Xj − X N )
b̂1 =
PN
2
j=1 (Xj − X N )
b̂0 = Y N − b̂1X N

=

ĉN 
s2
N,x
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 7.39
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 7.40
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 7.41
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 7.42
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 7.43
Daten: Korndurchmesser (x) und Druckfestigkeit (y) von Steinsalzkörnern
Prof. Dr. J. Franke
Daten und Regressionsgerade
Statistik II für Wirtschaftswissenschaftler 7.44
Prof. Dr. J. Franke
Daten, Regressionsgerade und Regressionsparabel
Statistik II für Wirtschaftswissenschaftler 7.45
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 7.46
Capital asset pricing model (CAPM)
(W. Sharpe, Nobelpreis für Wirtschaftswissenschaften, 1990)
Rendite = prozentuale Änderung von Anlagewert
R0 = Rendite von risikoloser Anleihe
R(i) = Rendite von Aktie Nr. i, i = 1, . . . , p
RM = Rendite von Markt (=
ˆ Rendite von marktbreitem Index,
z.B. S&P500)
Mittlere Exzessrendite der Aktie proportional zu der Exzessrendite des Marktes:
E(R(i) − R0) = βi · E(RM − R0)
Prof. Dr. J. Franke
Regressionsmodell:
Statistik II für Wirtschaftswissenschaftler 7.47
R(i) − R0 = Y (i), RM − R0 = X,
Y (i) = αi + βiX + e(i)
Daten: Rt(i), Xt im Jahr t
Yt(i) = αi + βi Xt + et(i), t = 1, . . . , N
CAPM
αi = 0, in Praxis aber nicht immer erfüllt
βi(RM − R0) =
ˆ Marktrisiko der Aktie i.
βi > 1
riskanter als Markt
βi = 1
genauso riskant wie Markt
βi < 1
risikoloser als Markt
βi groß
erwartete Rendite groß für den Preis höheren Risikos
Prof. Dr. J. Franke
Industry
Air transport
Real property
Travel, outdoor recreat.
Electronics
Misc. Finance
Nondurables, entertainm.
Consumer durables
Business machines
Retail, general
Media
Insurance
Trucking, freight
Aerospace
Apparel
Construction
Motor vehicles
Photographic, optical
Chemicals
Statistik II für Wirtschaftswissenschaftler 7.48
Beta
1.80
1.70
1.66
1.60
1.60
1.47
1.44
1.43
1.43
1.39
1.34
1.31
1.30
1.27
1.27
1.27
1.24
1.22
Industry
Energy, raw material
Tires, rubber goods
Railroads, shipping
Forest products, paper
Drugs Medicine
Domestic oil
Soaps, cosmetics
Steel
Containers
Nonferrous metals
Agriculture
Liquor
International oil
Banks
Tobacco
Telephone
Energy, utilities
Gold
Beta
1.22
1.21
1.19
1.16
1.14
1.12
1.09
1.02
1.01
0.99
0.99
0.89
0.85
0.81
0.80
0.75
0.60
0.36
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 7.49
Regression und Korrelation
Korrelation = Maß für die lineare“ Abhängigkeit zwischen zwei
”
Merkmalen Yj und Xj
Wenn Xj , Yj über eine Regressionsgerade verknüpft sind:
Yj = b0 + b1Xj + ej ,
mit ej unabhängig von Xj , Eej = 0, var ej = σe2, var Xj = σx2,
dann gilt
ρ = corr(Xj , Yj ) = r
b1
b2
1+
Insbesondere: ρ = 0 ⇐⇒ b1 = 0
σe2
σx2
,
v
u 2
uσ
ρ
t e
b1 = q
2
1 − ρ2 σx
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 7.50
Test, ob Yj von Xj abhängt:
H 0 : b1 = 0
gegen H1 : b1 6= 0.
Modell:
Yj = b0+b1Xj +ej , j = 1, . . . , N, e1, . . . , eN sind u.i.v. N (0, σe2)
X1, . . . , XN haben ein beliebige Verteilung, sind aber unabhängig
von e1, . . . , eN . Die Xj können auch deterministisch sein.
Hilfsgrößen:
σ̂e2 =
N 2
X
1
Yj − b̂1 − b̂2Xj
N − 2 j=1
σ̂x2 =
N 2
N −1 2
1 X
sx
Xj − X N =
N j=1
N
σ̂12 =
σ̂e2
σ̂x2
schätzt var b̂1
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 7.51
√
T10 =
Teststatistik
N b̂1
.
σ̂1
ist tN −2-verteilt, wenn die Hypothese H0 : b1 = 0 zutrifft.
Hypothese
Alternative
H0 verwerfen, wenn
H0 : b1 = 0
oder H0 : b1 ≤ 0
H0 : b1 = 0
oder H0 : b1 ≥ 0
H0 : b1 = 0
H1 : b1 > 0
T10 > tN −2,1−α
H1 : b1 < 0
T10 < tN −2,α = −tN −2,1−α
H1 : b1 6= 0
|T10| > tN −2,1−α/2
wobei tN −2,β = β-Quantil von tN −2.
Der Test kann auch benutzt werden, wenn e1, . . . , eN nur un”
gefähr“ normalverteilt sind, hat dann aber auch näherungsweise
das Niveau α.
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 7.52
Allgemeiner Regressionstest
H0 : b1 = bo1
Teststatistik
gegen H1 : b1 6= bo1.
√
N (b̂1 − bo1)
.
T1 =
σ̂1
Hypothese
Alternative
H0 verwerfen, wenn
H0 : b1 = bo1
oder H0 : b1 ≤ bo1
H0 : b1 = bo1
oder H0 : b1 ≥ bo1
H0 : b1 = bo1
H1 : b1 > bo1
T1 > tN −2,1−α
H1 : b1 < bo1
T1 < tN −2,α = −tN −2,1−α
H1 : b1 6= bo1
|T1| > tN −2,1−α/2
Auf ähnliche Weise kann auch getestet werden, ob Parameter in
komplizierteren linearen Regressionsmodellen bestimmte Werte
annehmen, z.B. ob H0 : b2 = 0 im Modell
q
Yj = b0 + b1Xj + b2 Xj + ej
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 7.53
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 7.54
Fallstudie:
(Xj , Yj ) = Anzahl Passagiere und Flugunkosten in T US-$
(Boeing 737, Flugstrecke 500 Meilen unter ähnlichen Bedingungen)
(61 4.28), (63 4.08), (67 4.42), (69 4.17), (70 4.48), (74 4.30),
(76 4.82), (81 4.70), (86 5.11), (91 5.13), (95 5.64), (97 5.56)
Geschätzte Regressionsgerade:
y = b̂0+b̂1x = 1, 570+0, 0407x
Vorhersage der Unkosten für Flug mit x = 80 Passagieren:
ŷ = 1, 570 + 0, 0407 · 80 = 4, 83
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 7.55
Prof. Dr. J. Franke
Modell:
Statistik II für Wirtschaftswissenschaftler 7.56
Yj = b0 + b1Xj + ej ,
Eej = 0, var ej = σe2
!
Stichprobenresiduen
êj = Yj − b̂0 + b̂1Xj
Schätzer für σe2, var b̂1 :
N
X
1
σ̂e2 =
ê2
,
N − 2 j=1 j
2
σ̂
e
σ̂12 = 2
σ̂x
N = 12, α = 0, 01, 99%-Quantil von tN −2 = 2, 76
√
N b̂1
0
Test H0 : b1 = 0:
T1 =
= 9, 43 > 2, 76
H0 verwerfen
σ̂1
Residuenplot: Stichprobenresiduen êj gegen Werte auf der Regressionsgerade b̂0 + b̂1Xj
sollten wie u.i.v. normalverteilte Daten mit Mittelwert 0 aussehen, wenn das Modell die Daten gut genug approximiert
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 7.57
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 7.58
Simuliertes Fallbeispiel: Ausgaben für Luxuswaren gegen Haushaltsjahreseinkommen
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 7.59
Residuenplot spricht nicht gegen das Modell: Regressionsgerade
+ u.i.v. normalverteilte Residuen
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 7.60
Dieselben Daten + Haushalte mit hohem Einkommen
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 7.61
Residuenplot für ergänzten Datensatz spricht gegen das Modell
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 7.62
Daten, geschätzte Regressionsgerade und wahre abflachende Regressionsfunktion
Zugehörige Unterlagen
Herunterladen