Statistik II für Wirtschaftswissenschaftler 7.1 Erwartungswert und Varianz von Zufallsgrößen Zufällige Auswahl von Mann und Frau X= Y = ) ( Körpergröße der Frau des Mannes Wir erwarten X < Y In der Mehrzahl der Fälle wird das so sein. Aber: X > Y kann vorkommen! Modell: X, Y unabhängig und N (µx, σx2)- bzw. N (µy , σy2)-verteilt Beispiel: µx = 165 cm, µy = 175 cm, σx = σy = 10 cm Scatter-Plot von unabhängigen, wie (X, Y ) verteilten (X1, Y1), . . . , (XN , YN ) Statistik II für Wirtschaftswissenschaftler 7.2 Statistik II für Wirtschaftswissenschaftler 7.3 X Zufallsgröße mit möglichen Werten x1, . . . , xn 1 , j = 1, . . . , n Laplace-verteilt: Ws(X = xj ) = n Erwartungswert oder Mittelwert von X n 1 X EX = xj , n j=1 beliebige diskrete Verteilung mit Wahrscheinlichkeitsgewichten Ws(X = xj ) = pj EX = = n X j=1 n X j=1 xj p j xj Ws(X = xj ) Statistik II für Wirtschaftswissenschaftler 7.4 Beispiele: (Skript, S. 39) a) Würfelwurf: Ws(X = k) = 1 6, k = 1, . . . , 6 1 EX = (1 + 2 + . . . + 6) = 3, 5 6 b) Y 0-1-Zufallsgröße; Ws(Y = 1) = p EY = 0 · Ws(Y = 0) + 1 · Ws(Y = 1) = p c) X kann die Werte 1, 2, 3, 100 annehmen. 333 , Ws(X = k) = 1000 gewöhnliches Mittel: EX = k = 1, 2, 3, 1 = für k = 100. 1000 1+2+3+100 = 26, 5 4 1 333 · (1 + 2 + 3) + · 100 = 2, 098 1000 1000 Statistik II für Wirtschaftswissenschaftler 7.5 Erwartungswert EX einer beliebigen reellwertigen Zufallsgröße a) Verteilung von X diskret mit Werten x1, x2, . . . und Wsgewichten pj = Ws(Xj = xj ) EX = ∞ X ∞ X xj pj = j=1 xj Ws(X = xj ) j=1 b) X hat Wsdichte p(x) EX = Z ∞ −∞ x p(x)dx. Es gibt (seltene) Fälle, wo EX nicht existiert! Statistik II für Wirtschaftswissenschaftler 7.6 Beispiele: a) X Poisson-verteilt: P(λ), Werte 0,1,2,. . . ∞ X ∞ X λj −λ EX = j pj = j e =λ j=0 j=0 j! b) X exponentialverteilt: Exp(λ) EX = Z ∞ −∞ x p(x)dx = c) B(n, p): EX = np d) H(n, M, N ): EX = n M N e) N (µ, σ 2): EX = µ Z ∞ 0 xλe−λxdx = 1 λ Statistik II für Wirtschaftswissenschaftler 7.7 2 µ+ σ2 2 f) lognormal(µ, σ ) : EX = e g) Weibull(λ, β) : EX = 1β Γ(1 + β1 ) λ Gamma-Funktion: Γ(n + 1) = n! Allgemein: Hat X eine Wsdichte, die symmetrisch um µ ist, so ist EX = µ. Statistik II für Wirtschaftswissenschaftler 7.8 Erwartungswerte von Funktionen einer Zufallsgröße X Zufallsgröße mit Werten in X f reellwertige Funktion auf X , Ef (X) =? 1. Möglichkeit: Verteilung der Zufallsgröße Y = f (X) bestimmen, z.B.: X N (µ, σ 2) Y = exp(X) lognormal 2. Möglichkeit: a) X Werte xj , Wsgewichte pj , j = 1, 2, . . . . ∞ X Ef (X) = f (xj )pj = j=1 ∞ X f (xj )Ws(X = xj ) j=1 b) X Wsdichte p(x) Ef (X) = Z ∞ −∞ f (x) p(x)dx. Statistik II für Wirtschaftswissenschaftler 7.9 Gesetz der großen Zahlen: X1, . . . , XN u.i.v. reellwertige Zufallsgrößen mit EX = µ. Dann: N 1 X XN = Xj → µ N j=1 für N → ∞ (der Zufall mittelt sich heraus) Genauer: Ws(X N → µ) = 1 Interpretation des Erwartungswerts EX Wiederhole das Experiment, das X liefert, sehr oft auf unabhängige Weise unabhängige X1, . . . , XN mit derselben Verteilung wie X. Dann gilt: N 1 X XN = Xj ≈ EX N j=1 Statistik II für Wirtschaftswissenschaftler 7.10 Statistik II für Wirtschaftswissenschaftler 7.11 Anwendung: Schätzer für Verteilungsparameter X1, . . . , XN u.i.v. Exp(λ)-verteilt 1 X N ≈ EX = λ 1 1 λ̂ = =λ ≈ XN EX Erwartungswert oder Mittelwert EX in der Praxis Produktion: Zielwert µ0 soll im Mittel eingehalten werden Messwerte X1, X2, . . . , XN sollen im Mittel µ0 sein, d.h. es muss EXj = µ0 gelten Investitionen oder Geschäftsstrategien: Gewinn X nicht exakt vorhersagbar erwarteter Gewinn EX möglichst groß Statistik II für Wirtschaftswissenschaftler 7.12 Zusätzliche Wünsche: Produktion: Abweichungen vom Zielwert µ0 nicht zu groß Investitionen: zufällige Schwankungen des Gewinns (Risiko) nicht zu hoch Varianz var X einer reellwertigen Zufallsgröße var X = E X − EX √ Standardabweichung σ(X) = var X 2 Produktion: var Xj klein als Qualitätsforderung Investitionen: var X oder σ(X)=Volatilität als Risikomaße Statistik II für Wirtschaftswissenschaftler Nobelpreis für Wirtschaftswissenschaften (1990): H. Markowitz für seine Theorie der Portfolio-Auswahl (1952/1959) Bei der Auswahl eines Portfolios für zu investierendes Kapitel spielen erwartete Rendite (EX) und Risiko (gemessen durch var X) die wesentliche Rolle (mean-variance analysis). Beide wachsen tendenziell gemeinsam, aber durch geschickte Portfoliowahl kann man, z.B. durch Risikodiversifizierung, die erwartete Rendite unter der Nebenbedingung maximieren, dass das Risiko (= Varianz oder Volatilität) ein vorgegebenes Limit nicht übersteigt: Maximiere EX! unter der Bedingung var X ≤ Limit 7.13 Statistik II für Wirtschaftswissenschaftler 7.14 Beispiele: (Skript, S. 43) a) P(λ) EX = λ var X = E X − EX = ∞ X 2 λk −λ 2 e =λ (k − λ) k! k=0 b) N (µ, σ 2) = E(X − λ)2 EX = µ var X = E X − µ 2 = Z ∞ −∞ (x − µ)2 √ c) B(n, p): var X = n p(1 − p) = n pq M ) N −n (1 − d) H(n, M, N ): var X = n M N N N −1 1 2πσ 2 − (x−µ) 2 e 2σ 2 dx = σ 2 Statistik II für Wirtschaftswissenschaftler 7.15 e) Exp(λ) : var X = λ12 2 2 f) lognormal (µ, σ 2) : var X = e2µ+σ (eσ − 1) 1 g) Weibull (λ, β) : var X = 2/β Γ(1 + β2 ) − Γ2(1 + β1 ) λ Schätzer für Varianz aus Gesetz der Großen Zahlen X1, . . . , XN u.i.v. mit EXj = µ, var Xj = σ 2 N N 2 2 2 X X 1 1 2 Xj − X N ≈ Xj − µ ≈ E X1−µ = var X1 = σ 2 sN = N − 1 j=1 N j=1 2 , falls N groß genug s2 ist brauchbarer Schätzer für σ N - nicht nur für normalverteilte Daten. Statistik II für Wirtschaftswissenschaftler 7.16 Rechenregeln für Erwartungswerte Erwartungswert linear: Für beliebige Konstanten c1, . . . , cN ! E c1X1 + . . . + cN XN = c1EX1 + . . . + c1EXN Faktorisierung des Erwartungswerts für unabhängige X1, . . . , XN E(X1 · . . . · XN ) = EX1 · . . . · EXN Speziell für u.i.v. X1, . . . , XN : E(X1 · . . . · XN ) = EX1 N Statistik II für Wirtschaftswissenschaftler 7.17 Rechenregeln für Varianzen var cX = c2var X, σ cX = cσ(X) Additivität des Erwartungswerts für unabhängige X1, . . . , XN var N X Xj = j=1 N X var Xj j=1 Speziell für u.i.v. X1, . . . , XN : var N X Xj = N · var X1 j=1 var X N = var 1 PN X 1 var X → 0 = 1 j N j=1 N PN 1 und const = EX1, da EX N = N j=1 EXj = EX1 X N → const Statistik II für Wirtschaftswissenschaftler 7.18 X1, . . . , XN u.i.v., Schätzer für µ = EXj : XN Approximatives (1 − α)-Konfidenzintervall für µ = EX s α X N ± √N qα, qα = (1 − ) − Quantil von tN −1 2 N Anwendung: Approximatives Konfidenzintervall für λ, wenn X1, . . . , XN unabhängig identisch Exp(λ)-verteilt, µ = EXj = 1 λ [T1, T2] Konfidenzintervall für µ Ws T1 ≤ 1 λ ≤ T2 1 ≤ λ ≤ 1 mit Wahrscheinlichkeit ≈ 1 − α T2 T1 " # 1 1 , T2 T1 ≈ (1 − α)-Konfidenzintervall für λ ≈1−α Statistik II für Wirtschaftswissenschaftler 7.19 Abhängige Zufallsgrößen: Kovarianz und Korrelation X, Y reellwertige Zufallsgrößen mit Wsdichten px, py 2. V = X Zufallsvektor mit Werten in R Y zweidimensionale Dichte pv (x, y) Ws(a ≤ X ≤ b, c ≤ Y ≤ d) = X, Y unabhängig ⇐⇒ Z Z b c a pv (x, y)dx dy pv (x, y) = px(x) · py (y) Statt Untersuchung der Funktion pv (x, y) nur Zahl als Maß für die Stärke der Abhängigkeit: Kovarianz bzw. Korrelation von X und Y . Statistik II für Wirtschaftswissenschaftler 7.20 Kovarianz cov (X, Y ) zweier reellwertiger Zufallsgrößen X, Y ! cov (X, Y ) = E (X − EX) · (Y − EY = E(X · Y ) − EX · EY Korrelation cov (X, Y ) cov (X, Y ) =q corr(X, Y ) = σ(X) · σ(Y ) var (X) · var (Y ) Die Korrelation ist skaleninvariant: corr(aX, bY )=corr(X, Y ), a, b> 0. Es gilt immer: −1 ≤ corr(X, Y ) ≤ +1 Statistik II für Wirtschaftswissenschaftler 7.21 Was bedeutet der Korrelationswert? 1) X, Y unabhängig cov (X, Y ) = 0 corr(X, Y ) = 0 X, Y heißen unkorreliert 2) Y proportional zu X, d.h. Y = c · X für ein c 6= 0 2 · var X cov (X, Y ) = cov (X, cX) = c · cov (X, X) , var Y = c {z } | =var X +1 c>0 c corr(X, Y ) = = für |c| −1 c<0 Das gilt auch allgemein für Y = c · X + d. Statistik II für Wirtschaftswissenschaftler 7.22 3) Aus X, Y unkorreliert,d.h. corr(X, Y ) = 0, folgt nicht (!), dass X, Y unabhängig Extremes Gegenbeispiel: X U (−1, +1)-verteilt, Y = X 2 corr(X, Y ) = 0 obwohl Y völlig von X abhängt (aber auf nichtlineare Weise) Fazit: Korrelation misst das Ausmaß der linearen Abhängigkeit von X und Y . Wichtiger Sonderfall: X, Y gemeinsam normalverteilt. Dann: X, Y unabhängig ⇔ corr(X, Y ) = 0 Statistik II für Wirtschaftswissenschaftler 7.23 Streudiagramme oder Scatterplots (vgl. Skript, 1.6) 2 Messungen je Objekt x1 zweidimensionale Daten y , . . . , xy N ∈ R2 1 N X j modellieren als Zufallsvektoren Yj , j = 1, . . . , N Streudiagramm oder Scatterplot Xj , Yj beeinflussen sich nicht Plot weitgehend parallel zu Koordinatenachsen unkorreliert typisch: Ellipse mit Hauptachsen parallel zu Koordinatenachsen (Normalverteilung!) Xj , Yj zusätzlich gleiche Variabilität Kreis Xj , Yj beeinflussen sich Plot steigt oder fällt corr(Xj , Yj ) > 0 bzw. < 0 Statistik II für Wirtschaftswissenschaftler 7.24 Statistik II für Wirtschaftswissenschaftler 7.25 Statistik II für Wirtschaftswissenschaftler 7.26 Statistik II für Wirtschaftswissenschaftler 7.27 Statistik II für Wirtschaftswissenschaftler 7.28 Statistik II für Wirtschaftswissenschaftler 7.29 Statistik II für Wirtschaftswissenschaftler 7.30 Statistik II für Wirtschaftswissenschaftler 7.31 Kovarianz- und Korrelationsschätzer Modell: (x1, y1), . . . , (xn, yN ) sind Werte von unabhängig, identisch verteilten Zufallsvektoren (X1, Y1), . . . , (XN , YN ) mit µx = EXj , σx2 = var Xj c = cov (Xj , Yj ) µy = EYj , σy2 = var Yj ρ = corr(Xj , Yj ) cov (X1, Y1) = E{(X1 − µx)(Y1 − µy )} N X 1 (Xj − µx)(Yj − µy ) ≈ N − 1 j=1 N X 1 ≈ (Xj − X N )(Yj − Y N ) = ĉN N − 1 j=1 Statistik II für Wirtschaftswissenschaftler 7.32 Stichprobenkovarianz ĉN und Stichprobenkorrelation ρ̂N schätzen c bzw. ρ ĉN ρ̂N = , sN,x · sN,y s2 N,x = N X 1 (Xj − X N )2, N − 1 j=1 s2 N,y = . . . Test auf Unabhängigkeit zweier Stichproben Modell: Paare von Messungen (X1, Y1), . . . , (XN , YN ) unabhängig und identisch gemeinsam normalverteilt mit Korrelation ρ. gemeinsam normalverteilt: 2 )-verteilt für alle a, b. a · X + b · Y ist N (µa,b, σa,b In diesem Fall gilt: Xj , Yj unabhängig ←→ Xi, Yi unkorreliert, ( d.h. ρ = 0) Statistik II für Wirtschaftswissenschaftler Fisher-Transformation 7.33 1 1 + ρ̂N ln 2 1 − ρ̂N 1 + ρ0 ln 1 − ρ0 ρ̂N ρ0 Teststatistik √ Z= N −3 2 ( ln 1 + ρ̂N 1 + ρ0 − ln 1 − ρ̂N 1 − ρ0 (= 0 für ρ0 = 0) ) ist unter der Hypothese H0 : ρ = ρ0 ungefähr N (0, 1)-verteilt für N ≥ 50, ρ0 nicht zu nahe bei ±1. Korrelationstest (qβ = β-Quantil von N (0, 1)) Hypothese Alternative H0 verwerfen, wenn H 0 : ρ = ρ0 oder ρ ≤ ρ0 H 0 : ρ = ρ0 H1 : ρ > ρ 0 Z > q1−α H1 : ρ 6= ρ0 |Z| > q1− α 2 Statistik II für Wirtschaftswissenschaftler 7.34 Abhängigkeit zwischen Ladenmiete/m2 (= ˆ Geschäftslage) und Umsatz in Ladenkette. Daten für N = 53 Filialgeschäfte: Xj = Umsatz pro m2 Ladenfläche Yj = Miete pro m2 Ladenfläche Stichprobenkorrelation ρ̂53 = 0, 37 Positive Korrelation zwischen Miete und Umsatz oder nicht? Teste H0 : ρ = 0 (oder ≤ 0) gegen H1 : ρ > 0 √ Z= 1 + 0, 37 50 1+0 ln − ln = 2, 744 2 1 − 0, 37 | 1{z− 0} Niveau α = 0, 01, q1−α = 2, 326 =0 Unabhängigkeit verwerfen Statistik II für Wirtschaftswissenschaftler 7.35 Statistik II für Wirtschaftswissenschaftler 7.36 Allgemeine Regressionsmodelle Datenpaare (X1, , Y1), . . . , (XN , YN ) unabhängig Modell: Yj = g(Xj ) + ej , j = 1, . . . , N Residuen e1, . . . , eN u.i.v. mit Eej = 0, var ej = σe2 (oft: e1, . . . , eN u.i.v. N (0, σε2)-verteilt) Probleme: 1) Schätze die Regressionsfunktion g(x) 2) Sage YN +1 vorher, gegeben den Wert von XN +1 Wenn XN +1 = x bekannt ist, so ist YbN +1 = g(x) die beste Vorhersage für das zugehörige YN +1. Statistik II für Wirtschaftswissenschaftler Lineare Regressionsmodelle g(x) bekannt bis auf endlich viele Parameter, die linear in g eingehen. Beispiele: g(x) = b0 + b1x Regressionsgerade g(x) = b0 + b1x + b2x2 parabolische Regression g(x) = b0 + b1x + . . . + bpxp polynomiale Regression g(x) = b0 + b1 cos(x) + b2 cos(2x) + a1 sin(x) + a2 sin(2x) trigonometrische Regression nicht: g(x) = b1 eb2x + a1 e−a2x (Beispiel für nichtlineare Regression) 7.37 Statistik II für Wirtschaftswissenschaftler 7.38 Regressionsgerade g(x) = b0 + b1x Daten: (X1, , Y 1), . . . , (XN , YN ) Kleinste-Quadrate-Ansatz: Schätze b0, b1 durch die Kleinste-Quadrate-Schätzer b̂0, b̂1 definiert durch N X j=1 Lösung: !2 Yj − b̂0 − b̂1Xj = min N X b0 ,b1 j=1 !2 Yj − b0 − b1Xj PN j=1 (Yj − Y N ) · (Xj − X N ) b̂1 = PN 2 j=1 (Xj − X N ) b̂0 = Y N − b̂1X N = ĉN s2 N,x Statistik II für Wirtschaftswissenschaftler 7.39 Statistik II für Wirtschaftswissenschaftler 7.40 Statistik II für Wirtschaftswissenschaftler 7.41 Statistik II für Wirtschaftswissenschaftler 7.42 Statistik II für Wirtschaftswissenschaftler 7.43 Statistik II für Wirtschaftswissenschaftler 7.44 Statistik II für Wirtschaftswissenschaftler 7.45 Statistik II für Wirtschaftswissenschaftler Capital asset pricing model (CAPM) (W. Sharpe, Nobelpreis für Wirtschaftswissenschaften, 1990) Rendite = prozentuale Änderung von Anlagewert R0 = Rendite von risikoloser Anleihe R(i) = Rendite von Aktie Nr. i, i = 1, . . . , p RM = Rendite von Markt (= ˆ Rendite von marktbreitem Index, z.B. S&P500) Mittlere Exzessrendite der Aktie proportional zu der Exzessrendite des Marktes: E(R(i) − R0) = βi · E(RM − R0) 7.46 Statistik II für Wirtschaftswissenschaftler Regressionsmodell: R(i) − R0 = Y (i), RM − R0 = X, Y (i) = αi + βiX + e(i) Daten: Rt(i), Xt im Jahr t Yt(i) = αi + βi Xt + et(i), t = 1, . . . , N CAPM αi = 0, in Praxis aber nicht immer erfüllt βi(RM − R0) = ˆ Marktrisiko der Aktie i. βi > 1 riskanter als Markt βi = 1 genauso riskant wie Markt βi < 1 risikoloser als Markt βi groß erwartete Rendite groß für den Preis höheren Risikos 7.47 Statistik II für Wirtschaftswissenschaftler Industry Air transport Real property Travel, outdoor recreat. Electronics Misc. Finance Nondurables, entertainm. Consumer durables Business machines Retail, general Media Insurance Trucking, freight Aerospace Apparel Construction Motor vehicles Photographic, optical Chemicals Beta 1.80 1.70 1.66 1.60 1.60 1.47 1.44 1.43 1.43 1.39 1.34 1.31 1.30 1.27 1.27 1.27 1.24 1.22 7.48 Industry Energy, raw material Tires, rubber goods Railroads, shipping Forest products, paper Drugs Medicine Domestic oil Soaps, cosmetics Steel Containers Nonferrous metals Agriculture Liquor International oil Banks Tobacco Telephone Energy, utilities Gold Beta 1.22 1.21 1.19 1.16 1.14 1.12 1.09 1.02 1.01 0.99 0.99 0.89 0.85 0.81 0.80 0.75 0.60 0.36 Statistik II für Wirtschaftswissenschaftler 7.49 Regression und Korrelation Korrelation = Maß für die lineare“ Abhängigkeit zwischen zwei ” Merkmalen Yj und Xj Wenn Xj , Yj über eine Regressionsgerade verknüpft sind: Yj = b0 + b1Xj + ej , mit ej unabhängig von Xj , Eej = 0, var ej = σe2, var Xj = σx2, dann gilt ρ = corr(Xj , Yj ) = r b1 b2 1+ Insbesondere: ρ = 0 ⇐⇒ b1 = 0 σe2 σx2 , v u 2 uσ ρ t e b1 = q 2 1 − ρ2 σx Statistik II für Wirtschaftswissenschaftler 7.50 Test, ob Yj von Xj abhängt: H 0 : b1 = 0 gegen H1 : b1 6= 0. Modell: Yj = b0+b1Xj +ej , j = 1, . . . , N, e1, . . . , eN sind u.i.v. N (0, σe2) X1, . . . , XN haben ein beliebige Verteilung, sind aber unabhängig von e1, . . . , eN . Die Xj können auch deterministisch sein. Hilfsgrößen: σ̂e2 = N 2 X 1 Yj − b̂1 − b̂2Xj N − 2 j=1 σ̂x2 = N 2 N −1 2 1 X sx Xj − X N = N j=1 N σ̂12 = σ̂e2 σ̂x2 schätzt var b̂1 Statistik II für Wirtschaftswissenschaftler 7.51 √ T10 = Teststatistik N b̂1 . σ̂1 ist tN −2-verteilt, wenn die Hypothese H0 : b1 = 0 zutrifft. Hypothese Alternative H0 verwerfen, wenn H0 : b1 = 0 oder H0 : b1 ≤ 0 H0 : b1 = 0 oder H0 : b1 ≥ 0 H0 : b1 = 0 H1 : b1 > 0 T10 > tN −2,1−α H1 : b1 < 0 T10 < tN −2,α = −tN −2,1−α H1 : b1 6= 0 |T10| > tN −2,1−α/2 wobei tN −2,β = β-Quantil von tN −2. Der Test kann auch benutzt werden, wenn e1, . . . , eN nur un” gefähr“ normalverteilt sind, hat dann aber auch näherungsweise das Niveau α. Statistik II für Wirtschaftswissenschaftler 7.52 Allgemeiner Regressionstest H0 : b1 = bo1 Teststatistik gegen H1 : b1 6= bo1. √ N (b̂1 − bo1) . T1 = σ̂1 Hypothese Alternative H0 verwerfen, wenn H0 : b1 = bo1 oder H0 : b1 ≤ bo1 H0 : b1 = bo1 oder H0 : b1 ≥ bo1 H0 : b1 = bo1 H1 : b1 > bo1 T1 > tN −2,1−α H1 : b1 < bo1 T1 < tN −2,α = −tN −2,1−α H1 : b1 6= bo1 |T1| > tN −2,1−α/2 Auf ähnliche Weise kann auch getestet werden, ob Parameter in komplizierteren linearen Regressionsmodellen bestimmte Werte annehmen, z.B. ob H0 : b2 = 0 im Modell q Yj = b0 + b1Xj + b2 Xj + ej Statistik II für Wirtschaftswissenschaftler 7.53 Statistik II für Wirtschaftswissenschaftler 7.54 Fallstudie: (Xj , Yj ) = Anzahl Passagiere und Flugunkosten in T US-$ (Boeing 737, Flugstrecke 500 Meilen unter ähnlichen Bedingungen) (61 4.28), (63 4.08), (67 4.42), (69 4.17), (70 4.48), (74 4.30), (76 4.82), (81 4.70), (86 5.11), (91 5.13), (95 5.64), (97 5.56) Geschätzte Regressionsgerade: y = b̂0+b̂1x = 1, 570+0, 0407x Vorhersage der Unkosten für Flug mit x = 80 Passagieren: ŷ = 1, 570 + 0, 0407 · 80 = 4, 83 Statistik II für Wirtschaftswissenschaftler 7.55 Statistik II für Wirtschaftswissenschaftler Modell: Yj = b0 + b1Xj + ej , Stichprobenresiduen 7.56 Eej = 0, var ej = σe2 êj = Yj − b̂0 + b̂1Xj Schätzer für σe2, var b̂1 : σ̂e2 = N X 1 ê2 j, N − 2 j=1 σ̂e2 2 σ̂1 = 2 σ̂x N = 12, α = 0, 01, 99%-Quantil von tN −2 = 2, 76 √ N b̂1 Test H0 : b1 = 0: T10 = = 9, 43 > 2, 76 H0 verwerfen σ̂1 Residuenplot: Stichprobenresiduen êj gegen Werte auf der Regressionsgerade b̂0 + b̂1Xj sollten wie u.i.v. normalverteilte Daten mit Mittelwert 0 aussehen, wenn das Modell die Daten gut genug approximiert Statistik II für Wirtschaftswissenschaftler 7.57 Statistik II für Wirtschaftswissenschaftler Simuliertes Fallbeispiel: Ausgaben für Luxuswaren gegen Haushaltsjahreseinkommen 7.58 Statistik II für Wirtschaftswissenschaftler Residuenplot spricht nicht gegen das Modell: Regressionsgerade + u.i.v. normalverteilte Residuen 7.59 Statistik II für Wirtschaftswissenschaftler Dieselben Daten + Haushalte mit hohem Einkommen 7.60 Statistik II für Wirtschaftswissenschaftler Residuenplot für ergänzten Datensatz spricht gegen das Modell 7.61 Statistik II für Wirtschaftswissenschaftler Daten, geschätzte Regressionsgerade und wahre abflachende Regressionsfunktion 7.62