Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie Dr. Roland Füss ● Statistik II: Schließende Statistik ● SS 2007 3. Spezielle diskrete Wahrscheinlichkeitsmodelle 3.1 Gleichverteilung • Gleichverteilung: Bei der Gleichverteilung hat jedes Ereignis die gleiche Eintrittswahrscheinlichkeit: Wahrscheinlichkeitsfunktion: Verteilungsfunktion: f (x i ) = 1 für i = 1,2,..., n n ⎧0 , x < x1 ⎪i ⎪ F ( xi ) = ⎨ , xi ≤ x ≤ xi +1 n ⎪ ⎪⎩1 , xn ≤ x 1 Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie Dr. Roland Füss ● Statistik II: Schließende Statistik ● SS 2007 • z.B. Würfel: 3.2 Bernoulliverteilung Bernoulliverteilung: Bei einem Bernoulliexperiment können nur die Ereignisse A und A mit den Wahrscheinlichkeiten P ( A) = p und P(A ) = 1 − P( A) = 1 − p = q eintreffen. Dem Eintreffen der Ereignisse A und A werden oft die Werte 0 und 1 zugeordnet (z.B. Stück ist defekt, oder nicht defekt mit den Wahrscheinlichkeiten p = 0,4 und q = 0,6): 2 Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie Dr. Roland Füss ● Statistik II: Schließende Statistik ● SS 2007 3.3 Binomialverteilung • Wird das Bernoulli Experiment n mal wiederholt und sucht man die Wahrscheinlichkeit, dass das Ereignis A mit P ( A ) = p x mal vorkommt, so ist die Zufallsvariable X binomialverteilt mit den Parametern n und p: X ~ B (x n; p ) , x d.h. x-mal soll das Ereignis A eintreffen: P(x − mal A) = P( A)P( A)...P( A) = P( A) = p x 3 Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie Dr. Roland Füss ● Statistik II: Schließende Statistik ● SS 2007 und die restlichen n-x mal das andere Ereignis A : P((n − x ) − mal A ) = P(A )P(A )....P(A ) = P (A ) n− x = (1 − p ) • bei n unabhängigen Wiederholungen gibt es ⎛n⎞ ⎜⎜ ⎟⎟ ⎝ x⎠ n− x mögliche Anordnungen bei denen das Ereignis A x-mal auftritt. Die Wahrscheinlichkeitsfunktion berechnet sich dann als: ⎛ n⎞ n− x f ( x ) = ⎜⎜ ⎟⎟ p x (1 − p ) ⎝ x⎠ ⎧0 , x < 0 ⎪int ( x ) ⎪ ⎛ n⎞ n−k F (x ) = ⎨ ∑ ⎜⎜ ⎟⎟ p k (1 − p ) , 0 ≤ x ≤ n • Die Verteilungsfunktion ist dann: ⎪ k =0 ⎝ k ⎠ ⎪⎩1 , 1 ≤ n 4 Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie Dr. Roland Füss ● Statistik II: Schließende Statistik ● SS 2007 • Da p < 0,5 ist, weist die Verteilung eine positive Schiefe auf. Falls p > 0,5 besitzt die Verteilung eine negative Schiefe. • Erwartungswert: Hat die Zufallsvariable die beiden möglichen Werte 1 (Ereignis A tritt ein) und 0 (Ereignis A tritt nicht ein), so ist der Erwartungswert der i-ten 5 Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie Dr. Roland Füss ● Statistik II: Schließende Statistik ● SS 2007 Ausprägung von X gegeben durch: E (x i ) = 1 ⋅ p + 0 ⋅ (1 − p ) = p . Die Zufallsvariable X n erhält man dann durch Addition der einzelnen x i : X = ∑ xi i =1 ⎛ n ⎞ n Dadurch ist der Erwartungswert von: E ( X ) = E ⎜ ∑ xi ⎟ = ∑ E ( xi ) = n ⋅ p ⎝ i =1 ⎠ i =1 • Varianz: Die Varianz der i-ten Ausprägung von X ist: 2 σ = ∑ (xi − E (xi ))2 ⋅ f (xi ) = (1 − p )2 p + (0 − p )2 (1 − p ) was nach etwas Umformen p (1 − p ) 2 i i =1 ergibt. Für die Varianz von X ergibt sich dann σ 2 = n ⋅ p(1 − p ) ⎛ n ⎞ x n− x n ⎛ n ⎞ t x n− x • Momenterzeugende Funktion: MEF (t ) = ∑ e ⎜⎜ x ⎟⎟ p q = ∑ ⎜⎜ x ⎟⎟( pe ) q . x =0 x =0 ⎝ ⎠ ⎝ ⎠ n xt Unter Berücksichtigung der binomischen Formel kann man auch schreiben: 6 Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie Dr. Roland Füss ● Statistik II: Schließende Statistik ● SS 2007 n ⎛ n ⎞ x n− x ⎛ n ⎞ t x n− x t n ⎟ ⎜ ⎜⎜ ⎟⎟ pe q a b pe q a b ( ) ( + ) = + = ∑ Allg.: und im konkreten Fall: ⎜ x⎟ x =0 ⎝ x ⎠ ⎝ ⎠ ( ) n • MEF ' (t ) = n( pet + q ) pet n −1 • MEF ' ' (t ) = n(n − 1)( pet + q ) n−2 pe t pe t + n( pe t + q ) n −1 pe t • Reproduktivitätseigenschaft: Besteht eine Zufallsvariable Z aus zwei (oder mehreren) stochastisch unabhängigen Zufallsvariablen X und Y die beide dieselbe Wahrscheinlichkeit p haben, X ~ B(n, p ) und Y ~ B(m, p ) , dann ist Z auch binomialverteilt mit Z ~ B(n + m, p ) . • Rekursionsformel: Hat man die Wahrscheinlichkeit f ( x ) für ein bestimmtes x schon berechnet, kann man die Wahrscheinlichkeiten für x+1 relativ einfach mit der 7 Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie Dr. Roland Füss ● Statistik II: Schließende Statistik ● SS 2007 Rekursionsformel berechnen: ⎛ n ⎞ ⎜⎜ ⎟⎟ ⎝ x + 1⎠ ⎛ n⎞ ⎜⎜ ⎟⎟ ⎝ x⎠ ⎛ n ⎞ x +1 n − x −1 ⎜ ⎟p q f ( x + 1) ⎜⎝ x + 1⎟⎠ = = f (x ) ⎛ n ⎞ x n− x ⎜⎜ ⎟⎟ p q ⎝ x⎠ ⎛ n ⎞ ⎜⎜ ⎟⎟ p 1 + x ⎝ ⎠ ⎛n⎞ ⎜⎜ ⎟⎟ q ⎝ x⎠ . Nach Kürzen geht in (n − x ) über. Damit lautet die Wahrscheinlichkeit für x+1: (x + 1) f ( x + 1) = (n − x ) p ⋅ f (x ) (x + 1)q • Die Binomialverteilung darf nur beim Fall „mit Zurücklegen“ angewendet werden, also nur dann, wenn die Wahrscheinlichkeiten p immer gleich bleiben oder aber, wenn die Änderung der Wahrscheinlichkeiten hinreichend klein ist (n / N ) < 0,05 . 8 Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie Dr. Roland Füss ● Statistik II: Schließende Statistik ● SS 2007 3.4 Hypergeometrische Verteilung • Hypergeometrische Verteilung: Ähnliche Situation wie bei der Binomialverteilung, nur dass die Kugeln jetzt nicht zurückgelegt werden und sich so die Wahrscheinlichkeiten bei jeder weiteren Ziehung verändern. Bezeichnungen und Bsp.: N = Anzahl der Elemente in der Grundgesamtheit (weiße und schwarze Kugeln) M = Anzahl der Elemente mit einem bestimmten alternativen Merkmal (z.B. weiße Kugeln). n = Anzahl der Elemente der Stichprobe (ohne Zurücklegen). x = Anzahl der Ereignisträger in der Stichprobe (wie viele weiße Kugeln wurden gezogen). 9 Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie Dr. Roland Füss ● Statistik II: Schließende Statistik ● SS 2007 • Beim ersten Ziehen beträgt die Wahrscheinlichkeit für das Ziehen einer weißen M Kugel noch p = N , verändert sich aber von da an für jedes weitere Ziehen so dass die Binomialverteilung nicht angewendet werden darf. ⎛M ⎞ • Aus insgesamt M weißen Kugeln können x weiße Kugeln auf ⎜⎜ x ⎟⎟ Arten ⎝ ⎠ gezogen werden. • Die übrigen n − x schwarze Kugeln können dann aus insgesamt N-M schwarzen Kugeln auf ⎛N −M ⎞ ⎜⎜ ⎟⎟ ⎝ n−x ⎠ Arten gezogen werden. 1 • Da jede Ergebnisfolge mit der Wahrscheinlichkeit ⎛ N ⎞ eintritt, ergibt sich: ⎜⎜ ⎟⎟ ⎝n⎠ 10 Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie Dr. Roland Füss ● Statistik II: Schließende Statistik ● SS 2007 • Wahrscheinlichkeitsfunktion: ⎛M ⎞ ⎛N − M ⎞ ⎟ ⎜ ⎟⋅⎜ ⎜ x⎟ ⎜ n − x⎟ ⎝ ⎠ ⎝ ⎠ f ( x )= ⎛N⎞ ⎜ ⎟ ⎜ n⎟ ⎝ ⎠ Die Hypergeometrische Verteilung hängt von den 3 Parametern N, M und n ab. Die Bezeichnung für die Zufallsvariable X ist dann: X ~ H ( x | n ; M ; N ) • Verteilungsfunktion: ⎛M ⎞ ⎛N − M ⎞ ⎟ ⎜ ⎟⋅⎜ ⎟ ⎜ n − k⎟ int ( x ) ⎜ k ⎝ ⎠ ⎝ ⎠ F( x ) = ∑ ⎛N⎞ k =a ⎜ ⎟ ⎜ n⎟ ⎝ ⎠ M • Erwartungswert: μ = n ⋅ N = np 11 Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie Dr. Roland Füss ● Statistik II: Schließende Statistik ● SS 2007 2 • Varianz: σ = (N − n ) ⋅ n N −1 ⋅ N −n M ⎛ M⎞ ⋅ ⎜1 − ⎟ = np (1 − p ) . N −1 N⎠ N ⎝ Bis auf den Term N −n N −1 stimmt die Varianz mit der Varianz der Binomialverteilung überein. Dieser Term ist daher der Korrekturfaktor für endliche Gesamtheiten. 12 Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie Dr. Roland Füss ● Statistik II: Schließende Statistik ● SS 2007 • Rekursionsformel: f ( x + 1| n ; M ; N ) = (n − x ) ⋅ (M − x ) ⋅ f ( x | n ; M; N ) (x + 1) ⋅ (N − M − n + x +1) Die Rekursionsformel ist nur bedingt empfehlenswert, da sie ähnlich aufwendig wie eine neue Berechnung für den Fall x+1 ist. 3.5 Geometrische Verteilung • Geometrische Verteilung: Ein Bernoulli Experiment wird beliebig oft wiederholt. Gesucht ist die Zufallsvariable X, die angibt, wie oft das Zufallsexperiment wiederholt werden muss bis zum ersten Mal das Ereignis A auftritt. • Wahrscheinlichkeitsfunktion: Die Wahrscheinlichkeit, dass beim x-ten Versuchen zum ersten Mal A auftritt berechnet sich als: P (([x − 1] − mal A ) ∩ A) = P (A ) x −1 P( A) = p(1 − p ) x −1 13 Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie Dr. Roland Füss ● Statistik II: Schließende Statistik ● SS 2007 Manchmal definiert man X auch als die Anzahl der Misserfolge, bis zum ersten Mal A x auftritt. Dann lautet die Wahrscheinlichkeitsfunktion: f (x ) = p(1 − p ) x k −1 • Verteilungsfunktion: Fg (x ) = ∑ p ⋅ q (1. Erfolg) k =1 Fg (x ) = 1 − (1 − p ) int [ x ] = 1 − q x +1 (Anzahl Mißerfolge) 1− p 1 • Erwartungswert: E ( X ) = p (1. Erfolg) und E ( X ) = p (Anzahl Mißerfolge) 1− p • Varianz: p 2 t t • MEF (t ) = ∑ e pq = p ∑ (e q ) = 1 − e t q = p ⋅ (1 − e q ) x =0 x =0 ∞ ∞ xt x x • MEF ' (t ) = − p ⋅ (1 − e q ) ⋅ (− e q ) = p t −2 t p −1 et q (1 − e q ) t 2 14 Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie Dr. Roland Füss ● Statistik II: Schließende Statistik ● SS 2007 ( ) ⎡ e t (− 2) − e t q ⎤ et + 3 2⎥ • MEF ' ' (t ) = pq ⎢ t t 1 − e q ⎥⎦ ⎣⎢ 1 − e q ( ) ( ) • Je grösser p ist desto schneller konvergiert f (x ) gegen 0 und F ( x ) gegen 1. 15 Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie Dr. Roland Füss ● Statistik II: Schließende Statistik ● SS 2007 3.6. Negative Binomialverteilung • Negative Binomialverteilung: Ähnlich wie bei der geometrischen Verteilung wird jetzt nach der Zufallsvariablen X gesucht, die angibt, wie oft man das Bernoulli Experiment wiederholen muss bis das Ereignis A genau r mal eingetreten ist. • X= 0 bedeutet, dass bei jedem der r Durchführungen das Ereignis A eingetreten ist • X= 1 bedeutet, dass der r-te Erfolg nach der (r+1)-ten Durchführungen eintritt. • Bevor der r-te Erfolg eintritt müssen in (x + r − 1) Durchführungen bereits r-1 Erfolge realisiert worden sein. Bei der letzten (also bei der (x + r ) -ten) Wiederholung beträgt die Wahrscheinlichkeit des Eintretens von A (= Erfolg) P ( A) = p . Daraus ergibt sich die: ⎛ x + r − 1⎞ x r • Wahrscheinlichkeitsfunktion: f (x ) = ⎜⎜ r − 1 ⎟⎟ p (1 − p ) mit (r −1) = x ⎝ ⎠ 16 Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie Dr. Roland Füss ● Statistik II: Schließende Statistik ● SS 2007 Die Verteilung der Zufallsvariable X bezeichnet man kompakt als: X ~ NB (r , p ) • Verteilungsfunktion: F (x ) = int ( x ) ⎛ k + r − 1⎞ r k ⎟⎟ p (1 − p ) k =0 ⎝ r − 1 ⎠ ∑ ⎜⎜ 17 Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie Dr. Roland Füss ● Statistik II: Schließende Statistik ● SS 2007 • Erwartungswert: E (x ) = μ = 2 • Varianz: σ = r (1 − p ) p r (1 − p ) p2 • Rekursionsformel: Die Formel lässt sich ähnlich herleiten wie für den Fall der Binomialverteilung: f (x + 1) = (1 − p ) x+r f ( x ) mit f (x = 0) = p r x +1 • Die Geometrische Verteilung ergibt sich als Spezialfall mir r =1. 3.7 Poissonverteilung • Poissonverteilung: Grenzverteilung der Binomialverteilung wenn p sehr klein (z.B. p λ ≤ 0,1) und wenn n sehr gross ist (z.B. n konstant: p = λ n ≥ 100). Dabei bleibt der Erwartungswert → λ = pn . 18 Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie Dr. Roland Füss ● Statistik II: Schließende Statistik ● SS 2007 • Herleitung der Poissonverteilung aus der Binomialverteilung bei n → ∞ : ⎛ n ⎞⎛ λ ⎞ ⎛ λ ⎞ f ( x ) = ⎜⎜ ⎟⎟⎜ ⎟ ⎜1 − ⎟ n⎠ ⎝ x ⎠⎝ n ⎠ ⎝ x n− x λ wobei p durch n ersetzt wird. 1 x⎛ λ ⎞ ⎛ λ ⎞ n! = λ ⎜1 − ⎟ ⎜1 − ⎟ x!(n − x )! n x ⎝ n ⎠ ⎝ n ⎠ n 1 n(n − 1)(n − 2) ⋅ ... ⋅ (n − x + 1)(n − x )! x ⎛ λ ⎞ ⎛ λ ⎞ λ ⎜1 − ⎟ ⎜1 − ⎟ = x! (n − x )! n x ⎝ n⎠ ⎝ n⎠ n −x −x man kann jetzt die (n − x )! aus Zähler und Nenner kürzen. Die einzelnen Terme konvergieren dann für n → ∞ gegen: lim n →∞ n(n − 1)(n − 2) ⋅ ... ⋅ (n − x + 1)(n − x )! =1 (n − x )! n x ⎛ λ⎞ lim ⎜1 − ⎟ n →∞ ⎝ n⎠ −x ⎛ λ⎞ lim ⎜1 − ⎟ = e −λ n →∞ n⎠ ⎝ n =1 19 Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie Dr. Roland Füss ● Statistik II: Schließende Statistik ● SS 2007 lim f ( x ) = e n →∞ −λ λx x! • Die Wahrscheinlichkeitsfunktion ist also: • Verteilungsfunktion: ⎧ −λ λ x , x = 0,1,2,... ⎪e f (x ) = ⎨ x! ⎪0 , sonst ⎩ ⎧0 , x < 0 ⎪ F (x ) = ⎨ x −λ λk ⎪∑ e k! ⎩k =0 20 Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie Dr. Roland Füss ● Statistik II: Schließende Statistik ● SS 2007 • Mittelwert: E (x ) = np = λ 2 • Varianz: σ = λ • Falls eine Binomialverteilung also gleiche Werte für Mittelwert und Varianz hat, ist das ein Hinweis, dass sie durch die Poissonverteilung approximiert werden kann. 21 Lehrstuhl für Empirische Wirtschaftsforschung und Ökonometrie Dr. Roland Füss ● Statistik II: Schließende Statistik ● SS 2007 λ x +1 λ x ⋅ λ1 • Rekursionsformel: f (x + 1) = e (x + 1)! = e (x + 1)x! −λ = λ x +1 e −λ λx x! −λ → f (x + 1) = λ x +1 ⋅ f (x ) 22