Vorlesung: Statistik II für Wirtschaftswissenschaft Prof. Dr. Helmut Küchenhoff Institut für Statistik, LMU München Sommersemester 2017 Einführung 1 Wahrscheinlichkeit: Definition und Interpretation 2 Elementare Wahrscheinlichkeitsrechnung 3 Zufallsgrößen 4 Spezielle Zufallsgrößen diskrete Verteilungen stetige Verteilungen Bernoulliverteilung Definition Bernoulliverteilung Ein Experiment mit nur zwei Ergebnissen (1 = Erfolg, 0 = Misserfolg) gehorcht einer Bernoulliverteilung. Kurzschreibweise: X ∼ B(1, p) ( P(X = x) = Statistik 2 Sommersemester 2017 p 1−p falls x = 1 falls x = 0 Helmut Küchenhoff (Institut für Statistik, LMU) 129 / 172 Bernoulliverteilung Erwartungswert und Varianz E (X ) = p Var (X ) = p (1 − p) Statistik 2 Sommersemester 2017 Helmut Küchenhoff (Institut für Statistik, LMU) 130 / 172 Bernoulliverteilung −1 Statistik 2 B(1, 0.8) ● 0 0 0.2 ● 0.2 ● ● 0.5 0.5 B(1, 0.5) 0.8 0.8 graphische Beispiele der Wahrscheinlichkeitsfunktion 0 1 Sommersemester 2017 2 3 4 5 −1 0 1 2 Helmut Küchenhoff (Institut für Statistik, LMU) 3 4 5 131 / 172 Bernoulliverteilung 1 0.5 0.2 0 B(1, 0.5) −1 Statistik 2 0 1 Sommersemester 2017 2 3 4 5 B(1, 0.8) 0 0.2 0.5 1 graphische Beispiele der Verteilungssfunktion −1 0 1 2 Helmut Küchenhoff (Institut für Statistik, LMU) 3 4 5 132 / 172 Bernoulliverteilung Beispiel Betrachtet wird das Ergebnis eines einmaligen Münzwurfs mit einer unfairen Münze: Ausprägungen: 1 (Kopf), 0 (Zahl) 2 P(X = 1) = 3 2 E (X ) = 3 2 2 2 Var (X ) = · (1 − ) = 3 3 9 Statistik 2 Sommersemester 2017 Helmut Küchenhoff (Institut für Statistik, LMU) 133 / 172 Binomialverteilung Definition Binomialverteilung Werden n unabhängige und identische Bernoulliexperimente durchgeführt, so folgt die Anzahl der Erfolge einer Binomialverteilung. Kurzschreibweise: X ∼ B(n, p) n P(X = x) = p x (1 − p)n−x , x Statistik 2 Sommersemester 2017 x = 0, 1, ..., n Helmut Küchenhoff (Institut für Statistik, LMU) 134 / 172 Binomialverteilung Erwartungswert und Varianz E (X ) = np Var (X ) = np (1 − p) Statistik 2 Sommersemester 2017 Helmut Küchenhoff (Institut für Statistik, LMU) 135 / 172 Binomialverteilung B(15, 0.7) 0.3 0.3 B(15, 0.2) 0.4 0.4 graphische Beispiele der Wahrscheinlichkeitsfunktion ● ● 0.2 0.2 ● ● ● ● ● 0.1 0.1 ● ● ● ● ● 10 0.4 5 ● ● ● ● ● ● ● ● ● 0 ● ● 5 10 15 0.3 B(50, 0.5) 0.2 0.3 0.2 ●●●●●●●● 0 ● 0.1 ●●● ● ● ● ● ● ● 10 ●●● ● ● ● ● 20 Sommersemester 2017 ● ●●● ●●●●●●●●●●●●●●●●●●●●●●●●● 30 40 50 0.0 0.1 ● ● ● 0.0 ● 15 B(50, 0.3) ● Statistik 2 0.0 ● ● 0.4 0.0 ● ● 0 ● ● ● ● ●●●●●●●●●●●●●●●●● 0 10 ● ● ● 20 Helmut Küchenhoff (Institut für Statistik, LMU) ● ● ● ● ● 30 ● ●● ●●●●●●●●●●●●●●●● 40 50 136 / 172 Binomialverteilung 1.0 0.8 0.6 0.4 0.2 0.0 B(15, 0.2) 10 15 5 10 15 0.8 0.2 0.4 0.6 0.8 0.6 0.4 10 20 Sommersemester 2017 30 40 50 B(50, 0.5) 0.0 0.2 0.0 B(50, 0.3) 0 Statistik 2 0 1.0 5 1.0 0 B(15, 0.7) 0.0 0.2 0.4 0.6 0.8 1.0 graphische Beispiele der Verteilungssfunktion 0 10 20 Helmut Küchenhoff (Institut für Statistik, LMU) 30 40 50 137 / 172 Binomialverteilung Beispiel Betrachtet wird die Anzahl des Ereignisses Kopf oben“ beim zehn” maligen Münzwurf mit einer unfairen Münze: n = 10 2 p= 3 2 = 6, 67 3 2 2 = 2, 22 Var (X ) = 10 · · 1 − 3 3 7 10−7 2 2 10 P(X = 7) = · · 1− = 0, 26 7 3 3 E (X ) = 10 · Statistik 2 Sommersemester 2017 Helmut Küchenhoff (Institut für Statistik, LMU) 138 / 172 Beispiel: Wahlprognose 100 zufällig ausgewählte Wahlberechtigte werden befragt. 30% aller Wahlberechtigten wählen Partei S. → Wie groß ist die Wahrscheinlichkeit, dass von den 100 Befragten mehr als 50 die Partei S wählen? X ∼ B(100, 0.3) P(X ≥ 50) Statistik 2 = P(X = 50) + P(X = 51) + . . . + P(X = 100) 100 = · 0.350 · 0.750 + . . . 50 = 0.00002206 Sommersemester 2017 Helmut Küchenhoff (Institut für Statistik, LMU) 139 / 172 geometrische Verteilung Definition geometrische Verteilung Interessiert man sich für die Anzahl der Versuche, bis bei einem Bernoulliexperiment ein Erfolg beobachtet wird, so folgt dieser Versuchsaufbau einer geometrischen Verteilung. Kurzschreibweise: X ∼ G (p) P(X = x) = p (1 − p)x−1 , Statistik 2 Sommersemester 2017 x ∈N Helmut Küchenhoff (Institut für Statistik, LMU) 140 / 172 geometrische Verteilung Erwartungswert und Varianz Statistik 2 Sommersemester 2017 E (X ) = 1 p Var (X ) = 1 p 1 −1 p Helmut Küchenhoff (Institut für Statistik, LMU) 141 / 172 geometrische Verteilung G(0.8) G(0.2) 0.6 0.4 0.2 0.2 0.4 0.6 ● 0.8 0.8 graphische Beispiele der Wahrscheinlichkeitsfunktion ● ● ● ● 0.0 ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● 0 Statistik 2 5 10 Sommersemester 2017 15 20 25 30 ● 0.0 ● ● 0 5 ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● 10 15 Helmut Küchenhoff (Institut für Statistik, LMU) 20 25 30 142 / 172 geometrische Verteilung 1.0 0.8 0.6 0.4 0.2 0.0 G(0.8) 0 Statistik 2 5 10 Sommersemester 2017 15 20 25 30 G(0.2) 0.0 0.2 0.4 0.6 0.8 1.0 graphische Beispiele der Verteilungssfunktion 0 5 10 15 Helmut Küchenhoff (Institut für Statistik, LMU) 20 25 30 143 / 172 geometrische Verteilung Beispiel Betrachtet wird die Anzahl der Würfe, bis eine 1 gewürfelt wird. Dies ist geometrisch verteilt mit p = 61 , also X ∼ G ( 16 ). 1 =6 1/6 1 1 Var (X ) = ( − 1) = 30 1/6 1/6 E (X ) = Im Mittel fällt beim sechsten Wurf eine 1. Statistik 2 Sommersemester 2017 Helmut Küchenhoff (Institut für Statistik, LMU) 144 / 172 Poissonverteilung Definition Poissonverteilung Soll die Wahrscheinlichkeit für die Häufigkeit bzw. Anzahl des Eintretens eines bestimmten Ereignisses innerhalb eines fest vorgegebenen Intervalls der Länge t (hier nur t = 1) beschrieben werden, so lässt sich dies mit einer Poissonverteilung modellieren. Kurzschreibweise: X ∼ Po(λ), P(X = x) = Statistik 2 Sommersemester 2017 λ>0 λx · exp(−λ), x! x ∈ N0 Helmut Küchenhoff (Institut für Statistik, LMU) 145 / 172 Poissonverteilung Erwartungswert und Varianz E (X ) = λ Var (X ) = λ Statistik 2 Sommersemester 2017 Helmut Küchenhoff (Institut für Statistik, LMU) 146 / 172 Poissonverteilung Po(15) 0.20 0.20 Po(4) 0.30 0.30 graphische Beispiele der Wahrscheinlichkeitsfunktion ● ● ● 0.10 0.10 ● ● ● ● ● ● ● ● ● ● ● ● ● ● 0 Statistik 2 ● 5 ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● 10 Sommersemester 2017 15 20 25 30 0.00 0.00 ● ● ● ● ● ● ● ● ● ● ● ● ● ● 0 5 ● 10 15 Helmut Küchenhoff (Institut für Statistik, LMU) 20 ● ● ● ● ● ● ● ● 25 30 147 / 172 Poissonverteilung 1.0 0.8 0.6 0.4 0.2 0.0 Po(4) 0 Statistik 2 5 10 Sommersemester 2017 15 20 25 30 Po(15) 0.0 0.2 0.4 0.6 0.8 1.0 graphische Beispiele der Verteilungssfunktion 0 5 10 15 Helmut Küchenhoff (Institut für Statistik, LMU) 20 25 30 148 / 172 Poissonverteilung Additionssatz Sind X ∼ Po(a) und Y ∼ Po(b) unabhängige Zufallsvariablen, dann gilt: X + Y ∼ Po(a + b). Statistik 2 Sommersemester 2017 Helmut Küchenhoff (Institut für Statistik, LMU) 149 / 172 Poissonverteilung Beispiel Bei einer Hotline weiß man aus Erfahrung, dass dort am Freitag zwischen 15 und 16 Uhr 7 (= λ) Kunden den Dienst in Anspruch nehmen. Die Wahrscheinlichkeit dafür, dass es mal 9 Kunden sind, beträgt: 79 · exp(−7) = 0, 1014. P(X = 9) = 9! Statistik 2 Sommersemester 2017 Helmut Küchenhoff (Institut für Statistik, LMU) 150 / 172 Einführung 1 Wahrscheinlichkeit: Definition und Interpretation 2 Elementare Wahrscheinlichkeitsrechnung 3 Zufallsgrößen 4 Spezielle Zufallsgrößen diskrete Verteilungen stetige Verteilungen Exponentialverteilung Definition Exponentialverteilung Wird die stetige Wartezeit bis zum Eintreten eines Ereignisses betrachtet und wird gefordert, dass die weitere Wartezeit unabhängig von der bereits verstrichenen Wartezeit ist, so bietet sich die Exponentialverteilung zur Modellierung dieses Problems an. Kurzschreibweise: X ∼ Expo(λ) ( λ · exp(−λx) für x ≥ 0 f (x) = 0 sonst ( F (x) = 1 − exp(−λx) für x ≥ 0 0 sonst Die Exponentialverteilung ist damit das stetige Analogon zur geometrischen Verteilung. Statistik 2 Sommersemester 2017 Helmut Küchenhoff (Institut für Statistik, LMU) 151 / 172 Exponentialverteilung Erwartungswert und Varianz E (X ) = Var (X ) = Statistik 2 Sommersemester 2017 1 λ 1 λ2 Helmut Küchenhoff (Institut für Statistik, LMU) 152 / 172 Exponentialverteilung 1.5 1.0 0.5 0 Statistik 2 Expo(0,5) 0.0 0.0 0.5 1.0 1.5 Expo(2) 2.0 2.0 graphische Beispiele der Dichtefunktion 2 Sommersemester 2017 4 6 8 10 0 2 4 Helmut Küchenhoff (Institut für Statistik, LMU) 6 8 10 153 / 172 Exponentialverteilung 1.0 0.8 0.6 0.4 0.2 0.0 Expo(2) 0 Statistik 2 5 Sommersemester 2017 10 15 20 Expo(0,5) 0.0 0.2 0.4 0.6 0.8 1.0 graphische Beispiele der Verteilungssfunktion 0 5 10 Helmut Küchenhoff (Institut für Statistik, LMU) 15 20 154 / 172 Exponentialverteilung Zusammenhang zwischen Exponential- und Poissonverteilung Die Anzahl der Ereignisse Y innerhalb eines Kontinuums ist poissonverteilt mit Parameter λ genau dann, wenn die Wartezeit zwischen zwei Ereignissen exponentialverteilt mit Parameter λ ist. Statistik 2 Sommersemester 2017 Helmut Küchenhoff (Institut für Statistik, LMU) 155 / 172 Exponentialverteilung Beispiel Die Zufallsvariable X : Lebensdauer einer Glühbirne einer Schau” fensterbeleuchtung“ sei exponentialverteilt mit Parameter λ = 10. Damit gilt: E (X ) = 1 1 1 ; Var (X ) = 2 = 10 10 100 Die Zufallsvariable Y : Anzahl der ausgefallenen Glühbirnen“ ist ” damit poissonverteilt mit Parameter λ = 10 und damit E (Y ) = 10 sowie Var (Y ) = 10. Betrachten wir als Kontinuum ein Jahr, so erhalten wir für die erwartete Anzahl der ausgefallenen Glühbirnen pro Jahr E (Y ) = 10 Glühbirnen pro Jahr und für die zu erwartende Wartezeit zwischen zwei Ausfällen E (X ) = Statistik 2 Sommersemester 2017 1 Jahr = 36, 5 Tage. 10 Helmut Küchenhoff (Institut für Statistik, LMU) 156 / 172 Pareto-Verteilung Verteilung zur Modellierung von Einkommen Kurzschreibweise: X ∼ Pareto(k, α) Verteilungsfunktion ( α 1 − kx für x ≥ k F (x) = 0 sonst Dichte : ( f (x) = αk α x α+1 0 für x ≥ k sonst Erwartungswert: E (X ) = Statistik 2 Sommersemester 2017 α k α−1 Helmut Küchenhoff (Institut für Statistik, LMU) 157 / 172 Pareto-Verteilung graphische Beispiele der Dichtefunktion Statistik 2 Sommersemester 2017 Helmut Küchenhoff (Institut für Statistik, LMU) 158 / 172 Normalverteilung Definition Normalverteilung Die Normalverteilung ist die in der Statistik am häufigsten verwendete stetige Verteilung. Ihre Verteilung liegt (recht) eng und symmetrisch um ihren Erwartungswert. Kurzschreibweise: X ∼ N(µ, σ 2 ) 1 (x − µ)2 f (x) = √ · exp − 2σ 2 σ 2π Statistik 2 Sommersemester 2017 Helmut Küchenhoff (Institut für Statistik, LMU) 159 / 172 Anwendungen viele Zufallsvariablen sind (nach Transformation) (ungefähr) normalverteilt. beim Zusammenwirken vieler zufälliger Einflüsse ist der geeignet aggregierte Gesamteffekt oft approximativ normalverteilt (Zentraler Grenzwertsatz). die asymptotische Grenzverteilung, also die Verteilung bei unendlich großem Stichprobenumfang, typischer statistischer Größen ist die Normalverteilung. Statistik 2 Sommersemester 2017 Helmut Küchenhoff (Institut für Statistik, LMU) 160 / 172 Normalverteilung Erwartungswert und Varianz E (X ) = µ Var (X ) = σ 2 Dies sind zugleich die Parameter der Verteilung. Statistik 2 Sommersemester 2017 Helmut Küchenhoff (Institut für Statistik, LMU) 161 / 172 Normalverteilung 1.0 0.8 0.6 0.4 0.2 0.0 N(0, 1) 0 2 4 10 14 16 18 20 0.8 0.2 0.4 0.6 0.8 0.6 0.4 −5 Sommersemester 2017 0 5 10 N(0, 0.5) 0.0 0.2 0.0 N(0, 5) −10 Statistik 2 12 1.0 −2 1.0 −4 N(15, 1) 0.0 0.2 0.4 0.6 0.8 1.0 graphische Beispiele der Verteilungssfunktion −10 −5 0 Helmut Küchenhoff (Institut für Statistik, LMU) 5 10 162 / 172 Normalverteilung graphische Beispiele der Dichtefunktion 0.4 0.3 0.2 0.1 0 2 4 10 12 14 16 18 20 0.2 0.4 0.6 0.8 N(0, 0.5) 0.0 0.0 0.2 0.4 0.6 0.8 N(0, 5) 1.0 −2 1.0 −4 −10 Statistik 2 N(15, 1) 0.0 0.0 0.1 0.2 0.3 0.4 N(0, 1) −5 Sommersemester 2017 0 5 10 −10 −5 0 Helmut Küchenhoff (Institut für Statistik, LMU) 5 10 163 / 172 Normalverteilung II Statistik 2 Sommersemester 2017 Helmut Küchenhoff (Institut für Statistik, LMU) 164 / 172 Normalverteilung III Statistik 2 Sommersemester 2017 Helmut Küchenhoff (Institut für Statistik, LMU) 165 / 172 Normalverteilung Standardisierung Sei X ∼ N(µ, σ 2 ). Dann ist Z= Statistik 2 Sommersemester 2017 X −µ ∼ N(0, 1) σ Helmut Küchenhoff (Institut für Statistik, LMU) 166 / 172 Normalverteilung Häufig kommen unabhängig und identisch verteilte Zufallsgrößen vor. Man spricht dann von iid (independently identically distributed) Zufallsgrößen. Additionssatz iid Seien X1 , ..., Xn ∼ N(µ, σ 2 ), dann ist deren Summe normalverteilt: n X Xi ∼ N nµ, nσ 2 . i=1 Das arithmetische Mittel der Zufallsvariablen X1 , ..., Xn ist ebenfalls normalverteilt: n σ2 1X X̄ = Xi ∼ N µ, . n n i=1 Statistik 2 Sommersemester 2017 Helmut Küchenhoff (Institut für Statistik, LMU) 167 / 172 Anwendung aus der Qualitätskontrolle Statistik 2 Sommersemester 2017 Helmut Küchenhoff (Institut für Statistik, LMU) 168 / 172 Beispiel mit Proben von 4 Einheiten Eingriffsgrenzen: σ X̄ + 3 · √ 4 20 25 UCL 15 CL 10 Group summary statistics 30 xbar Chart for X2 LCL 1 2 3 4 5 6 7 8 9 10 12 14 16 18 20 Group Number of groups = 20 Center = 18.4875 StdDev = 7.139388 Statistik 2 Sommersemester 2017 LCL = 7.778418 UCL = 29.19658 Number beyond limits = 1 Number violating runs = 0 Helmut Küchenhoff (Institut für Statistik, LMU) 169 / 172 Beispiel mit Proben von 4 Einheiten xbar Chart for X$X1 and Xnew$X1 80 UCL 60 100 New data in Xnew$X1 CL 40 Group summary statistics Calibration data in X$X1 LCL 1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 Group Number of groups = 30 Center = 60.375 StdDev = 14.93443 Statistik 2 Sommersemester 2017 LCL = 37.97335 UCL = 82.77665 Number beyond limits = 3 Number violating runs = 0 Helmut Küchenhoff (Institut für Statistik, LMU) 170 / 172 Normalverteilung Rechenregeln Sei Φ( x−µ σ ) die Verteilungsfunktion der Standardnormalverteilung zu einer beliebigen Normalverteilung F (x). Seien a und b beliebige reelle Zahlen, za = b−µ σ deren Standardisierungen und a−µ σ und zb = sei z ein beliebiges Quantil der Standardnormalverteilung. Dann gilt: P(X ≤ b) = F (b) = Φ(zb ) P(X > b) = 1 − Φ(zb ) P(a ≤ X ≤ b) = Φ(zb ) − Φ(za ) Φ(−z) = 1 − Φ(z) Φ(0) = 0, 5 P(−a ≤ X ≤ a) = 2Φ(za ) − 1 Statistik 2 Sommersemester 2017 Helmut Küchenhoff (Institut für Statistik, LMU) 171 / 172 Normalverteilung wichtige Quantile der Standardnormalverteilung Quantile, die oft beim Testen von Hypothesen verwendet werden: α = 0, 05: z1−α = z0,95 = 1, 64 α = 0, 05: z1− α2 = z0,975 = 1, 96 α = 0, 01: z1−α = z0,99 = 2, 33 α = 0, 01: z1− α2 = z0,995 = 2, 58 Quantilbestimmung Ein beliebiges Quantil xp einer nichtstandardisierten Normalverteilung kann durch folgende Rechnung bestimmt werden: xp = µ + σ · zp Statistik 2 Sommersemester 2017 Helmut Küchenhoff (Institut für Statistik, LMU) 172 / 172