Einführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management Sommersemester 2013 Stefan Etschberger Hochschule Augsburg Statistik Einführung Stefan Etschberger Eigenschaften der Normalverteilung Dichte ist symmetrisch zu µ: 1. Einführung f(µ − x) = f(µ + x) à µ ist Lage-, σ ist Streuungsparameter Standardnormalverteilung: N(0; 1) mit Verteilungsfunktion Φ(x) (→ Tabelle 3) Kenntnis von Φ(x), µ und σ genügt, denn: X ∼ N(µ; σ) ⇐⇒ X−µ ⇒ σ ∼ N(0; 1) F(x) = Φ x−µ σ 2. Deskriptive Statistik 3. W-Theorie Kombinatorik Zufall und Wahrscheinlichkeit Zufallsvariablen und Verteilungen Verteilungsparameter 4. Induktive Statistik Tabellen Quellen Tabelle enthält nur positive x: Deswegen Φ(−x) = 1 − Φ(x) 126 x1 \x2 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 x1 \x2 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 1.1 0 0.01 0.02 0.03 0.04 0.05 0.50000 0.53983 0.57926 0.61791 0.65542 0.69146 0.72575 0.75804 0.78814 0.81594 0.84134 0.86433 0.50399 0.54380 0.58317 0.62172 0.65910 0.69497 0.72907 0.76115 0.79103 0.81859 0.84375 0.86650 0.50798 0.54776 0.58706 0.62552 0.66276 0.69847 0.73237 0.76424 0.79389 0.82121 0.84614 0.86864 0.51197 0.55172 0.59095 0.62930 0.66640 0.70194 0.73565 0.76730 0.79673 0.82381 0.84850 0.87076 0.51595 0.55567 0.59483 0.63307 0.67003 0.70540 0.73891 0.77035 0.79955 0.82639 0.85083 0.87286 0.51994 0.55962 0.59871 0.63683 0.67364 0.70884 0.74215 0.77337 0.80234 0.82894 0.85314 0.87493 0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.50000 0.53983 0.57926 0.61791 0.65542 0.69146 0.72575 0.75804 0.50399 0.54380 0.58317 0.62172 0.65910 0.69497 0.72907 0.76115 0.50798 0.54776 0.58706 0.62552 0.66276 0.69847 0.73237 0.76424 0.51197 0.55172 0.59095 0.62930 0.66640 0.70194 0.73565 0.76730 0.51595 0.55567 0.59483 0.63307 0.67003 0.70540 0.73891 0.77035 0.51994 0.55962 0.59871 0.63683 0.67364 0.70884 0.74215 0.77337 0.52392 0.56356 0.60257 0.64058 0.67724 0.71226 0.74537 0.77637 0.52790 0.56749 0.60642 0.64431 0.68082 0.71566 0.74857 0.77935 Statistik Einführung Stefan Etschberger Normalverteilung: Beispiel Beispiel: Projektdauer X ∼ N(39; 2). 1. Einführung Wahrscheinlichkeit für Projektdauer zwischen 37 und 41 Wochen? 3. W-Theorie 2. Deskriptive Statistik Kombinatorik Zufall und Wahrscheinlichkeit Lösung: Zufallsvariablen und Verteilungen Verteilungsparameter P(37 5 X 5 41) = F(41) − F(37) = Φ 41−39 −Φ 2 4. Induktive Statistik 37−39 2 Tabellen Quellen = Φ(1) − Φ(−1) = Φ(1) − [1 − Φ(1)] = 2 · Φ(1) − 1 = 2 · 0,8413 − 1 = 0,6826 127 Statistik Einführung Stefan Etschberger Lageparameter a) Modus xMod : f(xMod ) = f(x) für alle x (i.A. nicht eindeutig, z.B. Gleichverteilung) 1. Einführung 2. Deskriptive Statistik Beispiele: 3. W-Theorie Kombinatorik Normalverteilung: xMod = µ Diskrete Verteilung mit: Zufall und Wahrscheinlichkeit Zufallsvariablen und Verteilungen x 0 1 2 f(x) 41 12 14 b) Median xMed : F(xMed ) = 1 2 Verteilungsparameter 4. Induktive Statistik ⇒ xMod = 1 Tabellen Quellen bzw. kleinstes x mit F(x) > 1 2 Beispiele: Normalverteilung: xMed = µ Diskrete Verteilung oben: F(0) = 14 < 21 , F(1) = 3 4 > 1 2 ⇒ xMed = 1 128 Statistik Einführung Stefan Etschberger Lageparameter: Fraktile c) α -Fraktil xα : F(xα ) = α (für stetige Verteilungen) Beispiel: X ∼ N(0; 1), Y ∼ N(3; 2) 1. Einführung 2. Deskriptive Statistik x0,975 = 1,96 x0,025 = −x0,975 = −1,96 y0,025 = 2 · x0,025 +3 = −0,92 (Tab. 3) 3. W-Theorie Kombinatorik Zufall und Wahrscheinlichkeit Zufallsvariablen und Verteilungen Verteilungsparameter Hinweise: 4. Induktive Statistik Tabellen xMed = x0,5 Wenn xα nicht vertafelt → Interpolation: Quellen 1 2 x1 \x2 xα ≈ xa + (xb − xa ) · mit α−a b−a a : größte vertafelte Zahl < α b : kleinste vertafelte Zahl > α Beispiel: X ∼ N(0; 1); x0,6 ≈ 0,25 + (0,26 − 0,25) · 0,2533 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 0,6−0,5987 0,6026−0,5987 0 0.01 0.02 0.03 0.04 0.05 0.50000 0.53983 0.57926 0.61791 0.65542 0.69146 0.72575 0.75804 0.78814 0.81594 0.84134 0.86433 0.88493 0.90320 0.91924 0.93319 0.94520 0.95543 0.96407 0.97128 0.50399 0.54380 0.58317 0.62172 0.65910 0.69497 0.72907 0.76115 0.79103 0.81859 0.84375 0.86650 0.88686 0.90490 0.92073 0.93448 0.94630 0.95637 0.96485 0.97193 0.50798 0.54776 0.58706 0.62552 0.66276 0.69847 0.73237 0.76424 0.79389 0.82121 0.84614 0.86864 0.88877 0.90658 0.92220 0.93574 0.94738 0.95728 0.96562 0.97257 0.51197 0.55172 0.59095 0.62930 0.66640 0.70194 0.73565 0.76730 0.79673 0.82381 0.84850 0.87076 0.89065 0.90824 0.92364 0.93699 0.94845 0.95818 0.96638 0.97320 0.51595 0.55567 0.59483 0.63307 0.67003 0.70540 0.73891 0.77035 0.79955 0.82639 0.85083 0.87286 0.89251 0.90988 0.92507 0.93822 0.94950 0.95907 0.96712 0.97381 0.51994 0.55962 0.59871 0.63683 0.67364 0.70884 0.74215 0.77337 0.80234 0.82894 0.85314 0.87493 0.89435 0.91149 0.92647 0.93943 0.95053 0.95994 0.96784 0.97441 = 129 Statistik Einführung Stefan Etschberger Lageparameter: Erwartungswert d) Erwartungswert E(X) bzw. µ: X xi f(xi ), i ∞ Z E(X) = xf(x) dx, 1. Einführung falls X diskret 2. Deskriptive Statistik 3. W-Theorie Kombinatorik falls X stetig Zufall und Wahrscheinlichkeit Zufallsvariablen und Verteilungen −∞ Verteilungsparameter 4. Induktive Statistik Beispiel: Diskrete Verteilung mit x 0 1 2 f(x) 14 21 14 Tabellen Quellen ⇒ E(X) = 0 · 1 4 +1· 1 2 +2· 1 4 =1 Beispiel: Für eine exponentialverteilte Zufallsvariable X mit der Dichte λ · e−λx für x ≥ 0 f(x) = folgt 0 sonst Z∞ Z∞ Z∞ 1 1 E(X) = x · f(x)dx = λ x · e−λx dx = λ − xe−λx − 1 · − e−λx dx λ λ −∞ 0 0 ∞ 1 1 1 = −xe−λx − e−λx = −0 − −0 − = λ λ λ 0 130 Statistik Einführung Stefan Etschberger Rechenregeln für den Erwartungswert Ist f symmetrisch bzgl. a, so gilt E(X) = a Beispiel: f der Gleichverteilung symmetrisch ⇒ E(X) = a+b bzgl. a+b 2 2 1. Einführung Lineare Transformation: 2. Deskriptive Statistik 3. W-Theorie E(a + bX) = a + b · E(X) Kombinatorik Zufall und Wahrscheinlichkeit Zufallsvariablen und Verteilungen Summenbildung: Verteilungsparameter 4. Induktive Statistik E n X i=1 ! Xi = n X Tabellen E(Xi ) Quellen i=1 Beispiel: X gleichverteilt in [0; 10], Y ∼ N(1; 1); Z = X + 5Y E(Z) = E(X+5Y) = E(X)+E(5Y) = E(X)+5·E(Y) = 10+0 2 +5·1 = 10 Unabhängigkeit: X, Y unabhängig ⇒ E(X · Y) = E(X) · E(Y) 131 Statistik Einführung Stefan Etschberger Streuungsparameter Varianz Var(X) bzw. σ2 : X [xi − E(X)]2 f(xi ), 2 Var(X) = E([X − E(X)] ) = wenn X diskret i Z∞ [x − E(X)]2 f(x) dx, 1. Einführung 2. Deskriptive Statistik wenn X stetig −∞ 3. W-Theorie Kombinatorik Zufall und Wahrscheinlichkeit Zufallsvariablen und Verteilungen Standardabweichung Sta(X) bzw. σ: 2 Var(X) = (0 − 1) · p Var(X) Verteilungsparameter 4. Induktive Statistik Tabellen x 0 1 2 1 1 1 f(x) 4 2 4 Beispiel: Diskrete Verteilung Sta(X) = : Quellen 1 1 1 1 2 2 + (1 − 1) · + (2 − 1) · = 4 2 4 2 Beispiel: Für eine exponentialverteilte Zufallsvariable X (Dichte siehe Erwartungswert) folgt Z∞ Z∞ −λx 1 2 Var(X) = (x − E(X))f(x)dx = λ x− λ ·e dx −∞ = e −λx 0 2 −x + 2 = 0 − −0 − 2x λ − 1 2 λ 1 2 λ 1 = 2 λ − 2 λ2 − 2x λ + 2 λ2 ∞ 0 132 Statistik Einführung Stefan Etschberger Rechenregeln für die Varianz Verschiebungssatz: Var(X) = E(X2 ) − [E(X)]2 1. Einführung 2. Deskriptive Statistik Beispiel: Diskrete Verteilung 2 E(X ) ⇒ E(X2 ) − [E(X)]2 2 x 0 1 2 1 1 f(x) 1 4 2 4 : 1 2 2 = 0 · = 3 2 3 2 = 1 4 2 +1 · 3. W-Theorie Kombinatorik +2 · 1 4 Zufall und Wahrscheinlichkeit Zufallsvariablen und Verteilungen Verteilungsparameter 4. Induktive Statistik − 12 = 1 2 = Var(X) Tabellen Quellen Lineare Transformation: Var(a + bX) = b2 Var(X) Summenbildung gilt nur, wenn die Xi unabhängig! Dann: ! n n X X Xi = Var(Xi ) Var i=1 i=1 133 Erwartungswerte und Varianzen wichtiger Verteilungen Verteilung von X E(X) Var(X) Binomialverteilung B(n; p) np np(1 − p) Statistik Einführung Stefan Etschberger 1. Einführung 2. Deskriptive Statistik 3. W-Theorie N−M N−n nM N N N−1 Hypergeometrische Verteilung mit den Parametern N, M, n nM N Poisson-Verteilung P(λ) λ a+b 2 λ (b − a)2 12 µ σ2 Kombinatorik Zufall und Wahrscheinlichkeit Zufallsvariablen und Verteilungen Verteilungsparameter 4. Induktive Statistik Tabellen Gleichverteilung in [a; b] mit a < b Normalverteilung N(µ; σ) Quellen 134 Statistik Einführung Stefan Etschberger Kovarianz und Korrelation Kovarianz: Cov(X, Y) = E[(X − E(X))(Y − E(Y))] = E(X · Y) − E(X) · E(Y) (Verschiebungssatz) 1. Einführung 2. Deskriptive Statistik 3. W-Theorie Kombinatorik Zufall und Wahrscheinlichkeit Zufallsvariablen und Verteilungen Korrelationskoeffizient: Verteilungsparameter 4. Induktive Statistik ρ(X, Y) = p Cov(X, Y) Var(X) · Var(Y) Tabellen Quellen Bemerkungen: ρ ist r nachgebildet ⇒ ρ ∈ [−1; 1] |ρ| = 1 ⇐⇒ Y = a + bX (mit b 6= 0) ρ = 0 ⇐⇒ X, Y unkorreliert Varianz einer Summe zweier ZV: Var(X + Y) = Var(X) + Var(Y) + 2 Cov(X, Y) 135