Einführung in die Statistik für Wirtschaftswissenschaftler für Betriebswirtschaft und Internationales Management Sommersemester 2013 Stefan Etschberger Hochschule Augsburg Statistik Einführung Stefan Etschberger Lageparameter: Erwartungswert d) Erwartungswert E(X) bzw. µ: X xi f(xi ), i ∞ Z E(X) = xf(x) dx, 1. Einführung falls X diskret 2. Deskriptive Statistik 3. W-Theorie Kombinatorik falls X stetig Zufall und Wahrscheinlichkeit Zufallsvariablen und Verteilungen −∞ Verteilungsparameter 4. Induktive Statistik Beispiel: Diskrete Verteilung mit x 0 1 2 f(x) 14 21 14 Tabellen Quellen ⇒ E(X) = 0 · 1 4 +1· 1 2 +2· 1 4 =1 Beispiel: Für eine exponentialverteilte Zufallsvariable X mit der Dichte λ · e−λx für x ≥ 0 f(x) = folgt 0 sonst Z∞ Z∞ Z∞ 1 1 E(X) = x · f(x)dx = λ x · e−λx dx = λ − xe−λx − 1 · − e−λx dx λ λ −∞ 0 0 ∞ 1 1 1 = −xe−λx − e−λx = −0 − −0 − = λ λ λ 0 130 Statistik Einführung Stefan Etschberger Rechenregeln für den Erwartungswert Ist f symmetrisch bzgl. a, so gilt E(X) = a Beispiel: f der Gleichverteilung symmetrisch ⇒ E(X) = a+b bzgl. a+b 2 2 1. Einführung Lineare Transformation: 2. Deskriptive Statistik 3. W-Theorie E(a + bX) = a + b · E(X) Kombinatorik Zufall und Wahrscheinlichkeit Zufallsvariablen und Verteilungen Summenbildung: Verteilungsparameter 4. Induktive Statistik E n X i=1 ! Xi = n X Tabellen E(Xi ) Quellen i=1 Beispiel: X gleichverteilt in [0; 10], Y ∼ N(1; 1); Z = X + 5Y E(Z) = E(X+5Y) = E(X)+E(5Y) = E(X)+5·E(Y) = 10+0 2 +5·1 = 10 Unabhängigkeit: X, Y unabhängig ⇒ E(X · Y) = E(X) · E(Y) 131 Statistik Einführung Stefan Etschberger Streuungsparameter Varianz Var(X) bzw. σ2 : X [xi − E(X)]2 f(xi ), 2 Var(X) = E([X − E(X)] ) = wenn X diskret i Z∞ [x − E(X)]2 f(x) dx, 1. Einführung 2. Deskriptive Statistik wenn X stetig −∞ 3. W-Theorie Kombinatorik Zufall und Wahrscheinlichkeit Zufallsvariablen und Verteilungen Standardabweichung Sta(X) bzw. σ: 2 Var(X) = (0 − 1) · p Var(X) Verteilungsparameter 4. Induktive Statistik Tabellen x 0 1 2 1 1 1 f(x) 4 2 4 Beispiel: Diskrete Verteilung Sta(X) = : Quellen 1 1 1 1 2 2 + (1 − 1) · + (2 − 1) · = 4 2 4 2 Beispiel: Für eine exponentialverteilte Zufallsvariable X (Dichte siehe Erwartungswert) folgt Z∞ Z∞ −λx 1 2 Var(X) = (x − E(X))f(x)dx = λ x− λ ·e dx −∞ = e −λx 0 2 −x + 2 = 0 − −0 − 2x λ − 1 2 λ 1 2 λ 1 = 2 λ − 2 λ2 − 2x λ + 2 λ2 ∞ 0 132 Statistik Einführung Stefan Etschberger Rechenregeln für die Varianz Verschiebungssatz: Var(X) = E(X2 ) − [E(X)]2 1. Einführung 2. Deskriptive Statistik Beispiel: Diskrete Verteilung 2 E(X ) ⇒ E(X2 ) − [E(X)]2 2 x 0 1 2 1 1 f(x) 1 4 2 4 : 1 2 2 = 0 · = 3 2 3 2 = 1 4 2 +1 · 3. W-Theorie Kombinatorik +2 · 1 4 Zufall und Wahrscheinlichkeit Zufallsvariablen und Verteilungen Verteilungsparameter 4. Induktive Statistik − 12 = 1 2 = Var(X) Tabellen Quellen Lineare Transformation: Var(a + bX) = b2 Var(X) Summenbildung gilt nur, wenn die Xi unabhängig! Dann: ! n n X X Xi = Var(Xi ) Var i=1 i=1 133 Erwartungswerte und Varianzen wichtiger Verteilungen Verteilung von X E(X) Var(X) Binomialverteilung B(n; p) np np(1 − p) Statistik Einführung Stefan Etschberger 1. Einführung 2. Deskriptive Statistik 3. W-Theorie N−M N−n nM N N N−1 Hypergeometrische Verteilung mit den Parametern N, M, n nM N Poisson-Verteilung P(λ) λ a+b 2 λ (b − a)2 12 µ σ2 Kombinatorik Zufall und Wahrscheinlichkeit Zufallsvariablen und Verteilungen Verteilungsparameter 4. Induktive Statistik Tabellen Gleichverteilung in [a; b] mit a < b Normalverteilung N(µ; σ) Quellen 134 Statistik Einführung Stefan Etschberger Kovarianz und Korrelation Kovarianz: Cov(X, Y) = E[(X − E(X))(Y − E(Y))] = E(X · Y) − E(X) · E(Y) (Verschiebungssatz) 1. Einführung 2. Deskriptive Statistik 3. W-Theorie Kombinatorik Zufall und Wahrscheinlichkeit Zufallsvariablen und Verteilungen Korrelationskoeffizient: Verteilungsparameter 4. Induktive Statistik ρ(X, Y) = p Cov(X, Y) Var(X) · Var(Y) Tabellen Quellen Bemerkungen: ρ ist r nachgebildet ⇒ ρ ∈ [−1; 1] |ρ| = 1 ⇐⇒ Y = a + bX (mit b 6= 0) ρ = 0 ⇐⇒ X, Y unkorreliert Varianz einer Summe zweier ZV: Var(X + Y) = Var(X) + Var(Y) + 2 Cov(X, Y) 135 Statistik Einführung: Gliederung 1 Einführung 2 Deskriptive Statistik 3 Wahrscheinlichkeitstheorie 4 Induktive Statistik 4 Induktive Statistik Grundlagen Punkt-Schätzung Intervall-Schätzung Signifikanztests Statistik Einführung Stefan Etschberger Grundlagen der induktiven Statistik Vollerhebung of unmöglich, 1. Einführung Deshalb: Beobachte Teilgesamtheit und schließe auf Grundgesamtheit 2. Deskriptive Statistik 3. W-Theorie 4. Induktive Statistik Grundlagen Punkt-Schätzung Beispiel Intervall-Schätzung Signifikanztests Warensendung von 1000 Stück; darunter M Stück Ausschuss. M ist unbekannt. → Zufällige Entnahme von n = 30 Stück („Stichprobe“). Darunter 2 Stück Ausschuss. Denkbare Zielsetzungen: Schätze M durch eine Zahl (z.B. 2 30 Tabellen Quellen · 1000 = 66,67) Schätze ein Intervall für M (z.B. M ∈ [58; 84]) Teste die Hypothese, dass M > 50 ist. 137 Grundbegriffe Statistik Einführung Stefan Etschberger Grundgesamtheit (G): Menge aller relevanten Merkmalsträger. Verteilung von G: F(x) = P(X 5 x) = Wahrscheinlichkeit, dass ein Merkmalsträger ausgewählt wird, der beim untersuchten Merkmal maximal die Ausprägung x aufweist. Uneingeschränkte (reine) Zufallsauswahl: Jedes Element von G hat die selbe Chance, ausgewählt zu werden. Stichprobenumfang (n): Anzahl der Merkmalsträger in der Stichprobe. 1. Einführung 2. Deskriptive Statistik 3. W-Theorie 4. Induktive Statistik Grundlagen Punkt-Schätzung Intervall-Schätzung Signifikanztests Tabellen Quellen Einfache Stichprobe: Uneingeschränkte Zufallsauswahl und unabhängige Ziehung. → Alle Stichprobenvariablen X1 , . . . , Xn sind iid. Stichprobenergebnis: n-Tupel der Realisationen der Stichprobenvariablen, (x1 , . . . , xn ). 138 Statistik Einführung Stefan Etschberger Wichtige Stichprobenfunktionen Gegeben: Einfache Stichprobe X1 , . . . , Xn , Beliebige Verteilung mit E(Xi ) = µ, Var(Xi ) = σ2 Stichprobenfunktion V n X Bezeichnung E(V) Var(V) Merkmalssumme nµ nσ2 1. Einführung 2. Deskriptive Statistik Xi i=1 X̄ = 3. W-Theorie 4. Induktive Statistik n 1 X Xi n i=1 Stichprobenmittel µ Gauß-Statistik n 1 X 2 (Xi − µ) n i=1 mittlere quadr. Abw. bezüglich µ n 1 X 2 (Xi − X̄) n i=1 mittlere quadr. Abw. n−1 2 σ n Stichprobenvarianz σ2 n X 1 2 (Xi − X̄) n − 1 i=1 √ S = S2 X̄ − µ √ n S Grundlagen Punkt-Schätzung Intervall-Schätzung Signifikanztests X̄ − µ √ n σ S2 = σ2 n 0 1 Tabellen Quellen σ2 Stichproben-Standardabw. t-Statistik 139 350 508 545 D=c(435,300,730,540,350,295,350,820,620,350, 110,1800,800,700,280,200,480,30,350,300, 360,250,480,250,200,340,320,283,980,424, 1850,590,1080,1300,45,530,680,365,1000,1000, 1000,150,300,400,720,250,240,692,350,650, 180,300,300,530,350,360,360,296,580,360, 670,315,640,800,700,350,550,950,640,600, 850,200,570,600,490,540,400,120,120,180, 360,156,125,100,120,80,60,300,400,800,600,618, 250,170,810,350,350,800,400,280,420,800, 300,280,800,508,425,600,500,500,400,700, 700,300,500,500,545,600,500,500,765,200,120, 150,250,150,600,650,430,275,750,500, 1589,240,240,220,240,250,600,500) 60 600