Kapitel 3 Stetige Verteilungen 3.1 Rechteckverteilung Für die Rechteckverteilung benutzen wir die Notation U (a; b). Der Buchstabe U rührt von der englischen Bezeichnung Uniform her. Wir wollen aber nicht Gleichverteilung oder gleichmäßige Verteilung sagen, um keine Verwechslungen mit gleicher Verteilung zu provozieren. Statt gleicher Verteilung werden wir identische Verteilung sagen. Wir schreiben X U (a; b) ; wenn eine Zufallsvariable X eine Rechteckverteilung besitzt. Dabei sind a und b zwei Parameter, für die a < b gelten muss. Definition 3.1 Die Dichtefunktion der Rechteckverteilung ist gegeben durch: ( fX (x) = 1 b a 0 für a x b sonst : Der Verlauf der Dichtefunktion (siehe Abbildung 3.1) entspricht einem Rechteck über dem Intervall [a; b℄. Die Standardform der Rechteckverteilung oder Standardrechteckverteilung U (0; 1), die große Bedeutung bei der Erzeugung von Zufallszahlen hat, hat die Parameter a = 0 und b = 1. Satz 3.1 Die Verteilungsfunktion der Rechteckverteilung ist: 8 > < 0 : 1 FX (t) = > t a b a für für für 23 t<a atb t>b: 24 KAPITEL 3. STETIGE VERTEILUNGEN 1/(b-a) a b Abbildung 3.1: Dichtefunktion der Rechteckverteilung Beweis: 8 > > > < Zt FX (t) = für t R 1 dx b a a fX (x)dx = > 1 t<a für a t b für t > b : 0 > > : = 1 t a b a } Abbildung 3.2 zeigt die Verteilungsfunktion. Es handelt sich also um eine Gerade mit der Steigung 1=(b a). Wir wollen jetzt den Erwartungswert und die Varianz einer Rechteckverteilung bestimmen. Satz 3.2 Sei X eine Zufallsvariable mit einer Rechteckverteilung mit den Parametern a und b. Dann gilt EX = b+a 2 und V arX = a Z (b a)2 : 12 Beweis: EX = 1 Z 1 " = EX 2 = b Z a x2 xfX (x)dx = x2 2b b 1 1 # a b a = " Z 1 b x 0 dx + x 1 b2 2 b 1 x3 dx = a b a3 a a2 a # b a = = 1 b a b+a : 2 1 Z dx + x 0 dx b 1 b3 a3 1 2 = (a + ab + b2 ) : 3 b a 3 3.1. RECHTECKVERTEILUNG 25 Nach Satz 2.2 gilt dann a+b 2 1 2 2 2 2 V arX = EX (EX ) = (a + ab + b ) 3 2 2 2 2 2 2 4(a + ab + b ) 3(a + 2ab + b ) a 2ab + b2 = = 12 12 2 (b a) = : 12 ! } 1 a b Abbildung 3.2: Verteilungsfunktion der Rechteckverteilung Für Anwendungen wichtig ist das folgende Resultat: Satz 3.3 Sei X eine Zufallsvariable mit einer streng monotonen Verteilungsfunktion FX (x). Die Zufallsvariable U = FX (X ) ist dann verteilt wie U (0; 1),d.h. U U (0; 1) : Beweis: Die Verteilungsfunktion von U ist FU (u) = P (fU ug) = P (fFX (X ) ug) = P (fFX 1(FX (X )) FX 1 (u)g) = P (fX FX 1 (u)g) = FX (FX 1 (u)) = u 0u1: Dies ist die Verteilungsfunktion einer U (0; 1) Zufallsvariablen. Im vorletzten Schritt wurde die Definition der Verteilungsfunktion von X (FX (t) = P (fX tg)) benutzt. } Anschaulich kann man sich den obigen Sachverhalt wie folgt vorstellen. Abbildung 3.3 zeigt die Verteilungsfunktion FX (x). Von den auf der x-Achse angedeuteten Realisationen der 26 KAPITEL 3. STETIGE VERTEILUNGEN Zufallsvariablen X geht man dann in Pfeilrichtung zu den entsprechenden Werten der Verteilungsfunktion, die man an der u-Achse abliest. Dies sind dann die Realisationen der Zufallsvariablen U . 1.0 0.8 u 0.6 0.4 0.2 0.0 -4 -2 0 x 2 4 Abbildung 3.3: Zur Konstruktion der Zufallsvariablen U Angewendet wird der Satz wie folgt: Wenn wir eine Verteilung FX (x) für die Daten x1 ; x2 ; :::; xn postulieren, dann müssen u1 FX (x1 ); u2 = FX (x2 ); :::; un = FX (xn ) U (0; 1)-verteilt sein. = Wir können dies z.B. durch graphische Darstellungen (wie Histogramm) oder durch andere statistische Verfahren überprüfen. Ein Histogramm sollte etwa so aussehen, wie das in Abbildung 3.4 dargestellte Histogramm. 2.0 1.5 1.0 0.5 0.0 0.0 0.2 0.4 0.6 0.8 1.0 x Abbildung 3.4: Histogramm der u1 ; u2 ; :::; un (n = 100) Das Histogramm in Abbildung 3.4 wurde mit folgenden R-Befehlen erzeugt: u<-runif(100) # erzeugt 100 U(0,1)-Zufallszahlen hist(u, probability=T) # zeichnet Histogramm Stellt man sich die empirische Verteilungsfunktion der u1 ; u2 ; : : : ; un graphisch dar, so sollte sich ungefähr eine Gerade mit der Steigung 1 wie in Abbildung 3.5 ergeben. Die Abbildung 3.5 wurde mit den folgenden R-Befehlen erzeugt. 3.1. RECHTECKVERTEILUNG 27 u<-sort(runif(100)) # erzeugt und sortiert 100 U(0,1)-ZZ y<-(1:100)/100 # bildet Folge 1/100, 2/100, ..., 100/100 plot(u, y, type="s", ylab="F n") # plottet emp. Vertfkt. abline(0,1) # zeichnet Diagonale 1.0 Fn(u) 0.8 0.6 0.4 0.2 0.0 0.0 0.2 0.4 0.6 0.8 1.0 u Abbildung 3.5: Empirische Verteilungsfunktion der u1 ; u2 ; :::; un (n = 100) Beispiel 3.1 (Verteilung des P-Wertes unter der Nullhypothese) Sei X die Prüfgröße in einem Hypothesentest. Die Verteilungsfunktion der Prüfgröße unter der Nullhypothese sei FX . Der P-Wert bei einem einseitigen Hypothesentest ist dann FX (X ) oder 1 FX (X ) ; je nachdem, ob der Ablehnungsbereich links oder rechts liegt. Der P-Wert ist eine Zufallsvariable. Es folgt aus Satz 3.3, dass der P-Wert unter der Nullhypothese eine U (0; 1)-Verteilung besitzt. Häufig ist die exakte Verteilung einer Prüfgröße nicht bekannt. Man kann dann meistens nur eine asymptotische Verteilung der Prüfgröße unter der Nullhypothese angeben. In Böker (1996) und Böker und Dannenberg (1995, 1996) werden eine Reihe von graphischen Verfahren betrachtet, mit denen man überprüfen kann, wie gut diese Approximation ist. Dazu werden Prüfgrößen unter der Nullhypothese simuliert und die P-Werte mit Hilfe der asymptotischen Verteilung berechnet. Diese P-Werte sollten sich verhalten wie Realisationen U (0; 1)-verteilter Zufallsvariablen. Man kann insbesondere überprüfen, ob die Prüfgrößen gewisse gewünschte Signifikanzniveaus einhalten können. Der folgende Satz ist gewissermaßen die Umkehrung des vorangehenden Satzes. Satz 3.4 Sei U U (0; 1) und F (x) eine streng monotone Verteilungsfunktion. Dann hat die Zufallsvariable X = F 1 (U ) die Verteilungsfunktion F (x). 28 KAPITEL 3. STETIGE VERTEILUNGEN Beweis: P (fX xg) = P (fF 1(U ) xg) = P (fF (F 1(U )) F (x)g) = P (fU F (x)g) = FU (F (x)) = F (x) : Im letzten Schritt, wurde benutzt, dass der Stelle F (x), also gleich F (x) ist. P (fU F (x)g) die Verteilungsfunktion von U an } Der Inhalt dieses Satzes wird durch Abbildung 3.6 veranschaulicht. Dort ist wieder die Verteilungsfunktion F (x) dargestellt. Jetzt geht man jedoch den umgekehrten Weg. Man geht von Realisationen der Rechteckverteilung U (0; 1) auf der Ordinate, der u-Achse, aus, geht dann in Pfeilrichtung zur Verteilungsfunktion FX (x) und bestimmt dann auf der Abszisse den zugehörigen x-Wert. 1.0 0.8 u 0.6 0.4 0.2 0.0 -4 -2 0 x 2 4 Abbildung 3.6: Zur Konstruktion der Zufallsvariablen X mit Verteilungsfunktion F (x) Der Satz 3.4 findet Anwendung bei der Erzeugung von Zufallszahlen mit der Verteilungsfunktion F (x). Es ist leicht U (0; 1)-Zufallszahlen, besser sollte man Pseudo-Zufallszahlen sagen, zu erzeugen. Das sind Zahlen, die sich, ,,wenigstens annähernd” so verhalten wie ,,echte” Realisationen U (0; 1)-verteilter Zufallsvariablen. Jeder Rechner hat solch ein Verfahren implementiert. Dabei wird häufig die lineare Kongruenz-Methode benutzt. Seien u1 ; u2 ; : : : ; un auf diese Weise gegeben. Man bilde x1 = F 1 (u1 ); x2 = F 1 (u2); : : : ; xn = F 1 (un ) : Dann verhalten sich x1 ; x2 ; : : : ; xn wie Realisationen von Zufallsvariablen mit der Verteilungsfunktion F (x). Beispiel 3.2 (Erzeugung exponentialverteilter Zufallsvariablen) Es sollen (Pseudo)-Zufallszahlen erzeugt werden, die sich verhalten wie ,,echte” Realisationen exponentialverteilter Zufallsvariablen. Die Verteilungsfunktion der Exponentialverteilung mit dem Parameter ( > 0) ist F (x) = 1 e x : 3.2. NORMALVERTEILUNG 29 Um die Umkehrfunktion F 1 zu bestimmen, setzen wir u=1 e x : Diese Gleichung ist nach x aufzulösen: x= Speziell für = 1 ist log(1 u)= = F 1 (u) : x= log (1 u) : (3.1) In der folgenden Tabelle stehen einige Werte von u, die mit dem R-Befehl runif(5) erzeugt wurden. Die x-Werte wurden nach Gleichung (3.1) erzeugt. u x 0.42 0.54 0.31 0.37 0.87 2.04 0.17 0.19 0.69 1.17 R-Befehle zur Rechteckverteilung dunif(x, min=0, max=1) berechnet die Dichtefunktion der Rechteckverteilung an der Stelle x, wobei x ein Vektor ist. Defaultmäßig (min=0, max=1) wird die Dichte der Standardrechteckverteilung berechnet. Durch Veränderung der optionalen Argumente min und max kann die Dichtefunktion für beliebige Parameter a und b berechnet werden. punif(q, min=0, max=1) berechnet die Verteilungsfunktion der Rechteckverteilung mit den Parametern a =min und b =max an der Stelle q, wobei q ein Vektor ist. qunif(p, min=0, max=1) berechnet die Umkehrfunktion der Verteilungsfunktion der Rechteckverteilung mit den Parametern a =min und b =max an der Stelle p, wobei p ein Vektor von Wahrscheinlichkeiten, also Zahlen zwischen 0 und 1, ist. runif(n, min=0, max=1) erzeugt vall [0; 1℄. n rechteckverteilte Zufallszahlen im Inter- 3.2 Normalverteilung Definition 3.2 Die Dichtefunktion der Normalverteilung ist gegeben durch fX (x) = p 1 2e 2 (x )2 =22 für 1<x<1: Dabei sind und 2 Parameter, für die gelten muss 1<<1 und 2 > 0 : 30 KAPITEL 3. STETIGE VERTEILUNGEN Man schreibt dafür Für = 0 und 2 X N (; 2 ) : = 1 erhält man die Standardnormalverteilung, deren Dichte durch fX (x) = p1 e 2 gegeben ist. Man schreibt dann x2 =2 1<x<1 für X N (0; 1) : Abbildung 3.7 zeigt die Dichtefunktion der Standardnormalverteilung. 0.5 f(x) 0.4 0.3 0.2 0.1 0.0 -4 -2 0 2 4 6 8 10 x Abbildung 3.7: Dichtefunktion der Standardnormalverteilung Über den Verlauf der Dichtefunktion (siehe Abbildung 3.7) kann man sagen: Die Dichtefunktion hat ihr Maximum an der Stelle , sie ist symmetrisch um eine senkrechte Achse bei und hat Wendepunkte an den Stellen und + . Der Parameter ist ein Lageparameter. Eine Veränderung von bei konstantem bewirkt nur eine Verschiebung der Dichtefunktion (siehe Abbildung 3.8). 0.5 f(x) 0.4 0.3 0.2 0.1 0.0 -4 -2 0 2 4 6 8 10 x Abbildung 3.8: Dichtefunktion der N(3,1)-Verteilung 3.2. NORMALVERTEILUNG 31 0.5 f(x) 0.4 0.3 0.2 0.1 0.0 -4 -2 0 2 4 6 8 10 x Abbildung 3.9: Dichtefunktion der N(3,4)-Verteilung Dagegen ist 2 ein Streuungsparameter. Mit wachsendem 2 wird die Kurve flacher und breiter (siehe Abbildung 3.9). Die Verteilungsfunktion der Standardnormalverteilung ist FX (x) = (x) = x Z 1 f (z )dz = x Z 1 p1 e 2 z 2 =2 dz : Abbildung 3.10 zeigt den Verlauf der Verteilungsfunktion der Standardnormalverteilung. Diese Verteilungsfunktion ist nicht durch eine elementare Funktion darstellbar. Für die Standardnormalverteilung (N (0; 1)) ist die Verteilungsfunktion tabelliert. Das ist wegen des folgenden Satzes ausreichend: Satz 3.5 Ist X verteilt wie N (; 2 ), so ist Z= X verteilt wie N (0; 1). N (; 2) und Z N (0; 1): P (fa < X < b g) Als Folgerung aus diesem Satz ergibt sich, wenn X P (fa < X < bg) = ( a X b = P < < ( )! a b = P <Z< ! b a = ; )! 32 KAPITEL 3. STETIGE VERTEILUNGEN wobei = FZ die Verteilungsfunktion der Standardnormalverteilung sei, die aus der Tabelle abgelesen werden kann. Manche Tabellen enthalten jedoch (z ) nur für z 0. Dann hat man zu beachten, dass aus Symmetriegründen (siehe Abbildung 3.7 oder 3.10) gilt ( z ) = 1 (z ) : 1.0 F(x) 0.8 0.6 0.4 0.2 0.0 -4 -2 0 x 2 4 Abbildung 3.10: Verteilungsfunktion der Standardnormalverteilung Zwischen den Verteilungsfunktionen der N (; 2 )- und N (0; 1)-Verteilung besteht der folgende Zusammenhang, den wir beweisen wollen, da diese Beweismethode auch in anderen Situationen nützlich sein kann. Satz 3.6 Die Verteilungsfunktion FX einer N (; 2 )-Verteilung ist FX (x) = x 1<x<1; wobei die Verteilungsfunktion der Standardnormalverteilung bezeichne. Beweis: Die Verteilungsfunktion der N (; 2 )-Verteilung ist FX (x) = x Z 1 p 1 2e 2 Wir substituieren z= Dann ist dz 1 = dt Dabei ändern sich die Grenzen wie folgt: (t )2 =22 dt (t ) : oder dt = dz : : 3.2. NORMALVERTEILUNG Wenn t = Wenn t = x, ist z 33 1, ist z = 1 : = x : Damit ist FX (x) = Beispiel 3.3 Sei X x Z 1 p1 e 2 z 2 =2 dz x = : } N (10; 32 ). Die zugehörige Dichtefunktion ist in Abbildung 3.11 dargestellt. 0.3 f(x) 0.2 0.1 0.0 0 5 10 x 15 20 Abbildung 3.11: Dichtefunktion der N(10,9)-Verteilung Die Verteilungsfunktion ist dann FX (x) = x 10 : 3 Die Wahrscheinlichkeit P (13 X 16), die in Abbildung 3.12 als Fläche unterhalb der Dichtefunktion zwischen 13 und 16 dargestellt ist, berechnet sich dann zu: 16 10 13 10 P (f13 X 16g) = FX (16) FX (13) = 3 3 = (2) (1) = 0:977 0:841 = 0:136 : Satz 3.7 Für eine normalverteilte Zufallsvariable X EX = und N (; 2) gilt V ar(X ) = 2 : 34 KAPITEL 3. STETIGE VERTEILUNGEN 0.3 f(x) 0.2 0.1 0.0 0 5 Abbildung 3.12: P (f13 < X 10 x 15 20 < 16g) als Fläche unterhalb der Dichtefunktion Beweis: 1 Z E (X ) = 1 1 e 2 2 xp (x )2 =22 dx : Wir verwenden wieder die Substitution z= Dann ist x : dz 1 = dx x = z + oder dx = dz : Dabei ändern sich die Grenzen wie folgt. 1, ist z = 1 : Wenn x = 1, ist z = 1 : Wenn x = Damit folgt: E (X ) = 1 Z 1 Z1 1 (z + ) p 2 e 2 1 = z p e 2 1 | z 2 =2 dz z 2 =2 dz + {z 0 } 1 = 1 (z + ) p e 2 1 1 p e 2 1 Z 1 Z z 2 =2 dz = 1 Z 1 | z 2 =2 dz p1 e 2 {z 1 z 2 =2 dz =: } Das erste Integral in der zweiten Zeile ist Null, da der Integrand punktsymmetrisch zum Ursprung ist, z.B. ergibt sich für z= 1: z = +1 : ( 1) p12 e (+1) p12 e ( 1)2 =2 (1)2 =2 : 3.2. NORMALVERTEILUNG 35 Es gilt also g (z ) = g ( z ) ; wenn wir den Integranden, dessen Graph in Abbildung 3.13 dargestellt ist, mit g bezeichnen. 0.4 g(z) 0.2 0.0 -0.2 -0.4 -4 -2 0 z 2 4 2 Abbildung 3.13: Graph der Funktion z p12 e z =2 für =1 Bei der Bestimmung der Varianz verwenden wir wieder die gleiche Substitution wie oben. Zur Berechnung des Integrals in der zweiten Zeile verwenden wir die Regel der partiellen Integration, die hier zur Erinnerung noch einmal aufgeschrieben sei: b Z a V ar(X ) = = 1 Z 1 2 (x b 0 v (x)w (x)dx = v (x)w(x) a )2 1 p 1 2e 2 1 z zp e 2 1 Z (x )2 =22 dx z 2 =2 dz " = 2 | = b Z a 1 Z 1 pz e 2 0 v (x)w(x)dx : z22 p z 2 =2 {z 0 1 e 2 2 1 # 1} + 2 (3.2) z 2 =2 dz 1 Z | 1 p1 e 2 {z 1 z 2 =2 dz = 2 } Bei der partiellen Integration wurde v(z) = z =) v0(z) = 1 w0(z) = z p12 e z =2 =) w(z) = 2 p1 e z2 =2 2 benutzt. } Die große Bedeutung der Normalverteilung beruht auf folgenden Tatsachen: a) Viele Phänomene sind normalverteilt: z.B. in der Finanzwissenschaft, Astronomie, Ökonometrie, Biologie usw. 36 KAPITEL 3. STETIGE VERTEILUNGEN b) Aufgrund des folgenden Satzes kann man viele Zufallsvariablen durch eine Normalverteilung approximieren. Satz 3.8 (Zentraler Grenzwertsatz) Die Zufallsvariablen X1 ; X2 ; :::; Xn seien unabhängig und identisch verteilt mit EXi = und V arXi = 2 < 1. Sei n P X n = n1 Xi . Dann ist i=1 X n p _ N (0; 1) : = n Das Zeichen _ bedeutet, die entsprechende Zufallsvariable ist asymptotisch verteilt wie N (0; 1). Man beachte E Xn = und V arX n = 2 =n : Der standardisierte Mittelwert ist asymptotisch standardnormalverteilt. Wenn n groß n durch eine Normalverteilung approximiert werden. wird, kann die Verteilung von X 3 3 n= 5 2 n = 10 2 1 1 0 0 0 1 2 3 0 Mittelwerte 1 2 3 Mittelwerte 3 3 n = 20 2 n = 50 2 1 1 0 0 0 1 2 Mittelwerte 3 0 1 2 3 Mittelwerte Abbildung 3.14: Histogramme von je 1 000 Mittelwerten in Stichproben der Größe 5; 10; 20; 50 aus einer exponentialverteilten Grundgesamtheit n = Abbildung 3.14 veranschaulicht den zentralen Grenzwertsatz. Dort sind die Mittelwerte von je 1 000 Stichproben der Größen n = 5; 10; 20; 50 in einem Histogramm dargestellt. Je größer der Stichprobenumfang, desto mehr nähert sich die Form des Histogramms der Dichtefunktion einer Normalverteilung an. 3.2. NORMALVERTEILUNG 37 c) Oft ist eine Variable die Summe unterschiedlicher Zufallseinflüsse. In solchen Fällen ist die Normalverteilung häufig ein gutes Modell. d) Die theoretischen Eigenschaften sind einfach zu bestimmen. Daher ist die Theorie der Normalverteilung sehr weit entwickelt. e) Die Normalverteilung hat viele angenehme Eigenschaften. So sind Linearkombinationen und insbesondere Summen unabhängiger normalverteilter Zufallsvariablen wieder normalverteilt. f) Abgesehen von einigen Ausnahmen sind Maximum-Likelihood-Schätzer von Parametern asymptotisch normalverteilt. Man benutzt dann diese Eigenschaft bei der Konstruktion von Konfidenzintervallen. g) Die Normalverteilung tritt im Zusammenhang mit sogenannten Wiener-Prozessen auf. Ein Wiener-Prozess ist ein stochastischer Prozess X (t); t 0 mit stetiger Zeit, d.h. für jedes t gibt es eine Zufallsvariable X (t). Eine der Annahmen des Wiener-Prozesses ist, dass die Zuwächse X (t) X (s) für s < t normalverteilt sind. Wiener-Prozesse fanden zunächst Anwendung in der Physik, wo die Bewegung eines kleinen Teilchens beschrieben wurde, das einer großen Anzahl kleiner Stöße ausgesetzt ist. In diesem Zusammenhang spricht man von einer Brownschen Bewegung. Wiener-Prozesse werden aber auch als Modell für Aktienkurse angewendet und wurden z.B. bei der Herleitung der Black-Scholes-Formel verwendet, deren Erfinder 1997 mit dem Nobelpreis für Wirtschaftswissenschaften ausgezeichnet wurden. Aufgrund ihrer angenehmen Eigenschaften und der weit entwickelten Theorie wird die Annahme einer Normalverteilung in vielen statistischen Verfahren, wie Varianzanalyse, Regressionsanalyse, Zeitreihenanalyse, Diskriminanzanalyse usw. verwendet. Ein weiterer Vorteil ist es, dass die unter der Annahme der Normalverteilung entwickelten Test- und Schätzverfahren relativ unempfindlich gegenüber Abweichungen von dieser Annahme sind. Man sagt, dass solche Verfahren robust sind. So kommt es z.B. beim t-Test zur Prüfung der Hypothese, dass der Erwartungswert einen bestimmten Wert besitzt, nicht so sehr darauf an, dass die einzelnen Beobachtungen einer Normalverteilung entstammen, sondern mehr, dass der Mittelwert normalverteilt ist, was aufgrund des zentralen Grenzwertsatzes zumindest für große n gewährleistet ist. R-Befehle zur Normalverteilung dnorm(x, mean=0, sd=1) berechnet die Dichtefunktion der Normalverteilung an der Stelle x, wobei x ein Vektor ist. Defaultmäßig (mean=0, sd=1) wird die Dichte der Standardnormalverteilung berechnet. Durch Veränderung der optionalen Argumente mean und sd kann die Dichtefunktion für beliebige Parameter und 2 berechnet werden. Dabei ist zu beachten, dass sd die Standardabweichung, also die Quadratwurzel aus der Varianz 2 ist. Der Erwartungswert ist durch mean anzugeben. pnorm(q, mean=0, sd=1) berechnet die Verteilungsfunktion der Normalverteilung mit dem Erwartungswert =mean und der Standardabweichung sd an der Stelle q, wobei q ein Vektor ist. Standardmäßig wird P (X q ) berechnet. Mit dem zusätzlichen Argument lower.tail=F wird die Wahrscheinlichkeit P (X > q ) berechnet. 38 KAPITEL 3. STETIGE VERTEILUNGEN qnorm(p, mean=0, sd=1) berechnet die Umkehrfunktion der Verteilungsfunktion der Normalverteilung mit dem Erwartungswert =mean und der Standardabweichung sd an der Stelle p, wobei p ein Vektor von Wahrscheinlichkeiten, also Zahlen zwischen 0 und 1, ist. Auch hier kann das Argument lower.tail verwendet werden. rnorm(n, mean=0, sd=1)] erzeugt n normalverteilte Zufallszahlen mit dem Erwartungswert =mean und der Standardabweichung sd. 3.3 Gammaverteilung Definition 3.3 Die Gammafunktion ist für 1 Z ( ) = Für = 1 ergibt sich (1) = 0 1 Z 0 > 0 definiert durch das Integral t 1 e t dt : (3.3) e t dt = 1 : Wir wenden für > 1 auf das Integral in Gleichung (3.3) die Regel der partiellen Integration (siehe Gleichung (3.2)) an. Dabei setzen wir v (t) = t und =) 1 w0(t) = e t v 0 (t) = ( =) 1)t 2 w(t) = e t : Damit folgt ( ) = t 1 e t j1 0 | {z 0 Das bedeutet 1 0 Z } 0 ( 1 1)t 2 e t dtA ( ) = ( = ( 1 Z 1) t 2 e t dt : 0 | 1) ( {z ( 1) } 1) : Daraus folgt für natürliche Zahlen: (1) (2) (3) (4) .. . = = = = 1 1 (1) = 1 1 = 1 = 1! 2 (2) = 2 1 = 2 = 2! 3 (3) = 3 2 1 = 6 = 3! (n) = (n 1) (n 1) = (n 1)(n 2) : : : 2 1 = (n 1)! 3.3. GAMMAVERTEILUNG 39 Satz 3.9 Für natürliche Zahlen n gilt: (n) = (n 1)! Die Gammafunktion kann mit der R-Funktion gamma(x) berechnet werden. Sie ist in Abbildung 3.15 dargestellt. Gammafunktion 20 Γ(ν) 15 10 5 0 0 1 2 ν 3 4 5 Abbildung 3.15: Der Graph der Gammafunktion Definition 3.4 Die Dichtefunktion der Gammaverteilung ist gegeben durch 8 < fX (x) = : x 1 e ( ) 0 x x0 sonst : Dabei sind und Parameter, für die gelten muss > 0 und > 0 : Wir schreiben X G( ; ) ; wenn eine Zufallsvariable X eine Gammaverteilung besitzt. (3.4) 40 KAPITEL 3. STETIGE VERTEILUNGEN Wir wollen nachweisen, dass durch Gleichung (3.7) tatsächlich eine Dichtefunktion definiert wird, d.h. dass das Integral 1 1 x x e Z 0 ( ) 1 1 Z 1 dx = x e ( ) 0 x dx 1 1 Z = (x) 1 e ( ) 0 x dx (3.5) ( ) ergeben. den Wert 1 hat, d.h. das ganz rechts stehende Integral muss Wir verwenden die Substitution =) t = x dt = dx : Die Grenzen ändern sich wie folgt: Wenn x = 0, ist t = 0 : Wenn x = 1, ist t = 1 : Damit ergibt sich für das obige Integral in Gleichung (3.5) 1 1 Z 1 t t e dt = 1 : ( ) 0 | {z ( ) } } Einen wichtigen Spezialfall der Gammaverteilung erhalten wir, wenn der Parameter Wert 1 hat. Dann ist 1 x1 1 e fX (x) = (1) x = e x für den x0: Dies ist die Dichte einer Exponentialverteilung mit dem Parameter , d.h. G(1; ) Exp() : (3.6) Wir werden die Exponentialverteilung später in Abschnitt 3.5 behandeln. Satz 3.10 Es gelte Dann gilt X G( ; ) : EX = = und V arX = =2 : Die Abhängigkeit der Dichtefunktion von den Parametern dungen 3.16 - 3.19 entnehmen. und können Sie den Abbil- 3.3. GAMMAVERTEILUNG 41 1.0 0.5 f(x) 0.8 0.6 1 1.5 0.4 2 0.2 0.0 0 5 10 15 x Abbildung 3.16: Dichtefunktionen der Gammaverteilung mit 2 = 1 und = 0:5; 1; 1:5 und 1.0 0.8 f(x) 0.5 0.6 0.4 1 1.5 0.2 2 0.0 0 5 10 15 x Abbildung 3.17: Dichtefunktionen der Gammaverteilung mit und 2 = 1=2 und = 0:5; 1; 1:5 Man entnimmt diesen Abbildungen, dass der Parameter für die Gestalt oder die Form der Dichtefunktion verantwortlich ist. In der englischen Literatur sagt man, dass ein ‘shape’Parameter ist, während ein ‘scale’-Parameter ist, d.h. bestimmt die Skala oder die Breite der Dichtefunktion. R-Befehle zur Gammaverteilung: Beachten Sie bitte, dass der scale-Parameter in R in unserer Bezeichnungsweise das Inverse des Parameters ist, d.h. R verwendet die Dichtefunktion der Gammaverteilung in der Form: 8 < fX (x) = : xa a 1 e x=b x 0 b (a) 0 sonst : (3.7) Dabei ist a = und b = 1=. dgamma(x, shape,scale=1) berechnet die Dichtefunktion der Gammaverteilung mit den Parametern = 1 und =shape an der Stelle x. Dabei kann x ein Vektor sein. 42 KAPITEL 3. STETIGE VERTEILUNGEN 1.0 f(x) 0.8 1 0.6 0.4 0.2 0.5 0.25 0.0 0 5 10 15 x Abbildung 3.18: Dichtefunktionen der Gammaverteilung mit = 1 und = 1; 0:5 und 0:25 1.0 f(x) 0.8 0.6 1 0.4 0.2 0.5 0.25 0.0 0 5 10 15 x Abbildung 3.19: Dichtefunktionen der Gammaverteilung mit 0:25 = 1:5 und = 1; 0:5 und pgamma(q, shape,scale=1) berechnet die Verteilungsfunktion der Gammaverteilung mit den Parametern = 1 und =shape an der Stelle q . Dabei kann q ein Vektor sein. qgamma(p, shape,scale=1) berechnet die Umkehrfunktion der Verteilungsfunktion der Gammaverteilung mit den Parametern = 1 und =shape an der Stelle p. Dabei muss p ein Vektor von Wahrscheinlichkeiten, d.h. von Zahlen zwischen 0 und 1 sein. rgamma(n, shape,scale=1) erzeugt Parametern = 1 und =shape. n gammaverteilte Zufallszahlen mit den Anwendungen der Gammaverteilung a) Wir betrachten einen Poissonprozess. Das ist eine Folge von zufälligen Punkten (Ereignissen) auf der positiven reellen Zahlenachse, unter der man sich häufig die Zeit vorstellt. Bedingungen unter denen, eine solche zufällige Folge von Punkten ein Poissonprozess ist, werden an anderer Stelle betrachtet (siehe S. 51). Die Wartezeit (siehe 3.3. GAMMAVERTEILUNG 43 Abbildung 3.20) bis zum -ten ( muss eine ganze Zahl sein) Ereignis eines Poissonprozesses ist G( ; )-verteilt. W G( ; ) b) Die Gammaverteilung der Wartezeiten bis zum -ten Ereignis eines Poissonprozesses folgt aus dem folgenden Resultat. Die Zeiten zwischen Ereignissen eines Poissonprozesses sind nämlich unabhängig und identisch exponentialverteilt. Satz 3.11 Wenn X1 ; X2 ; :::; X unabhängig und identisch exponentialverteilt sind, d.h. Xi Exp(), ist X i=1 Xi G( ; ) : Poissonprozess W1 W2 W3 Zeit Abbildung 3.20: Wartezeiten bei einem Poissonprozess Beispiel 3.4 Sie haben eine Netzkarte und eine Ersatzkarte. Die Lebensdauern der einzelnen Karten seien exponentialverteilt mit Parameter = 1=500 Tage. Wir suchen eine Antwort auf die Frage: Wie groß ist die Wahrscheinlichkeit, dass Sie in einem Jahr keine zusätzliche Netzkarte brauchen, d.h. dass die Netzkarte und die Ersatzkarte zusammen für mindestens 1 Jahr reichen? Sei X1 die Lebensdauer der Netzkarte. Sei X2 die Lebensdauer der Ersatzkarte. Die Lebensdauer beider Karten zusammen ist X = X1 + X2 ; und die gesuchte Wahrscheinlichkeit ist P (fX > 365g) : 44 KAPITEL 3. STETIGE VERTEILUNGEN Aufgrund unserer Annahmen über die Verteilungen von X1 und X2 und des Satzes 3.11 gilt X G(2; 1=500) : Abbildung 3.21 zeigt die Dichtefunktion von X und die gesuchte Wahrscheinlichkeit als schraffierte Fläche unterhalb der Dichtefunktion. Sie können diese Wahrscheinlichkeit mit dem RBefehl 1-pgamma (365, 2, 500) oder pgamma(365,2,500,lower.tail=F) berechnen. Es gilt P (fX > 365g) = 0:8337 : c) Für ganzzahliges bezeichnet. wird die Gammaverteilung (G( ; )) auch als Erlangverteilung 8 7 10 000*f(x) 6 5 4 3 2 P({X>365}) 1 0 0 Abbildung 3.21: P (fX 1000 2000 3000 4000 5000 x > 365g) als Fläche unterhalb der Dichtefunktion 3.4 Chiquadratverteilung Die aus der Grundvorlesung bekannte Chiquadratverteilung ist ein Spezialfall der Gammaverteilung. Satz 3.12 Die Gammaverteilung mit den Parametern = n=2 und = 1=2 stimmt mit der 2 -Verteilung mit dem Parameter n überein. Dabei ist n eine positive ganze Zahl. 3.4. CHIQUADRATVERTEILUNG 45 Die 2 -Verteilung hat einen Parameter n. Wir schreiben X 2n oder X 2 (n) ; wenn X eine 2 -Verteilung mit dem Parameter n besitzt und sagen: X hat eine 2 -Verteilung mit n Freiheitsgraden. Die Dichtefunktion der 2 -Verteilung mit n Freiheitsgraden ist 8 > < f (x) = > : xn=2 1 e x=2 x 0 2n=2 (n=2) 0 sonst : Aus Satz 3.10 erhalten wir sofort: Satz 3.13 Sei Dann gilt X 2n : EX = n und V arX = 2n : Beweis: Nach Satz 3.12 gilt 2n G(n=2; 1=2) : Erwartungswert und Varianz einer Gammaverteilung waren in Satz 3.10 angegeben. Mit = n=2 und = 1=2 folgt EX = und V arX = n=2 = =n 1=2 n=2 = = 2n : 2 (1=2)2 Die Abbildungen 3.22 - 3.24 zeigen einige Dichtefunktionen der 2 -Verteilung mit wachsender Anzahl der Freiheitsgrade. Beachten Sie bei diesen Abbildungen die unterschiedlichen Achsenskalierungen. Ab n = 3 Freiheitsgraden hat die 2 -Verteilung eine ganz typische Form, die sich mit wachsenden Freiheitsgraden der Normalverteilung annähert, dabei verschiebt sich die Kurve weiter nach rechts. Für n = 2 Freiheitsgrade stimmt die 2 -Verteilung mit der Exponentialverteilung mit dem Parameter = 1=2 überein (siehe Satz 3.12 und Gleichung (3.6)). Anwendungen der 2 -Verteilung: Die 2 -Verteilung tritt häufig als Verteilung von Prüfgrößen bei Hypothesentests auf. Die Prüfgröße nS 2 02 46 KAPITEL 3. STETIGE VERTEILUNGEN 1.0 0.8 f(x) 1 0.6 0.4 2 0.2 3 4 0.0 0 5 10 15 x Abbildung 3.22: Dichtefunktionen der 2 -Verteilung 0.10 10 15 0.08 f(x) 20 0.06 30 0.04 0.02 0.0 0 20 40 60 x Abbildung 3.23: Dichtefunktionen der 2 -Verteilung zur Prüfung der Hypothese 2 = 02 , dass die Varianz in einer Grundgesamtheit einen ganz bestimmten Wert 02 hat, ist 2 -verteilt mit n 1 Freiheitsgraden. Dabei ist S2 n 1X = (X n i=1 i X )2 die geschätzte Varianz und n der Stichprobenumfang. Die Verteilung gilt exakt unter der Normalverteilungsannahme, andernfalls nur approximativ. Die Prüfgröße im Anpassungstest von Pearson ist asymptotisch 2 -verteilt. Geprüft wird die Hypothese, dass Zufallsvariablen eine ganz bestimmte Verteilung besitzen (z.B. U (0; 1) oder N (0; 1)) oder einer bestimmten Verteilungsfamilie angehören (z.B. Gammaverteilung oder Normalverteilung). Die Prüfgröße im Unabhängigkeitstest bei Kontingenztafeln ist als Spezialfall des Anpassungstests ebenfalls asymptotisch 2 -verteilt. Summen von Quadraten von unabhängigen N (0; 1)-verteilten Zufallsvariablen sind 2 -verteilt. Solche Summen von Quadraten treten in der Varianzanalyse häufig auf und 3.5. EXPONENTIALVERTEILUNG 47 0.06 30 40 50 60 f(x) 0.04 0.02 0.0 0 20 40 60 80 100 x Abbildung 3.24: Dichtefunktionen der 2 -Verteilung bilden Zähler und Nenner von F -Prüfgrößen, die Ihnen in den Vorlesungen Lineare Modelle und Ökonometrie begegnen werden. Solche Quotienten führen dann zu einer F -Verteilung. Wir werden an späterer Stelle darauf zurückkommen (S. 85). R-Befehle zur Chiquadratverteilung: dchisq(x, df) berechnet die Dichtefunktion der Chiquadratverteilung mit dem Parameter n =df an der Stelle x. Dabei kann x ein Vektor sein. pchisq(q, df, ncp=0) berechnet die Verteilungsfunktion der Chiquadratverteilung mit dem Parameter n =df an der Stelle q . Dabei kann q ein Vektor sein. Mit dem optionalen Argument ncp wird der Nichtzentralitätsparameter festgelegt. Wir behandeln hier die zentrale Chiquadratverteilung, für die ncp=0 ist. qchisq(p, df) berechnet die Umkehrfunktion der Verteilungsfunktion der Chiquadratverteilung mit dem Parameter n =df an der Stelle p. Dabei muss p ein Vektor von Wahrscheinlichkeiten, d.h. von Zahlen zwischen 0 und 1 sein. rchisq(n, df) erzeugt n =df. n chiquadratverteilte Zufallszahlen mit dem Parameter 3.5 Exponentialverteilung Definition 3.5 Die Dichtefunktion der Exponentialverteilung ist gegeben durch ( f (x) = e 0 x 0x<1 sonst : Dabei ist ein Parameter, für den gelten muss >0: 48 KAPITEL 3. STETIGE VERTEILUNGEN Wir schreiben X Exp() ; wenn eine Zufallsvariable X eine Exponentialverteilung mit dem Parameter besitzt. In einer alternativen Darstellung, die Sie in der Literatur finden werden, wird anstelle des Parameters der Parameter = 1= verwendet. In dieser Darstellung ist dann die Dichtefunktion ( 1 x= e f (x) = 0 0x<1 sonst : Es sei daran erinnert, dass die Exponentialverteilung ein Spezialfall der Gammaverteilung ist. Eine Gammaverteilung mit dem Parameter = 1 ist eine Exponentialverteilung. Exp() G(1; ) Abbildung 3.25 zeigt einige Dichtefunktionen in Abhängigkeit vom Parameter . 2.0 1.5 f(x) 2 1.0 0.5 1 0.5 0.0 0 1 2 3 4 5 x Abbildung 3.25: Dichtefunktionen der Exponentialverteilung in Abhängigkeit von Die Dichtefunktionen sind monoton fallend, nehmen an der Stelle 0 den Wert des Parameters an. 1.0 0.8 2 F(x) 1 0.5 0.6 0.4 0.2 0.0 0 1 2 3 4 5 x Abbildung 3.26: Verteilungsfunktionen der Exponentialverteilung in Abhängigkeit von 3.5. EXPONENTIALVERTEILUNG 49 Satz 3.14 Die Verteilungsfunktion der Exponentialverteilung mit dem Parameter ist ( 0 1 e F (t) = t<0 t0: für für t Beweis: Für t 0 ist F (t) = = Z 0 t f (x)dx = e t Z 0 t x dx e t +1=1 e = e x t 0 : } In der alternativen Darstellung gilt: ( F (t) = 0 1 e t= für für t<0 t0 Abbildung 3.26 zeigt einige Verteilungsfunktionen der Exponentialverteilung in Abhängigkeit des Parameters . Obwohl wir Erwartungswert und Varianz der Exponentialverteilung aus denen der Gammaverteilung mit dem Parameter = 1 ableiten könnten, wollen wir beide hier explizit berechnen. Satz 3.15 Es gelte X Exp() : Dann gilt EX = Beweis: EX = 1 1 Z 1 und V arX = xfX (x)dx = 1 Z 0 xe 1 : 2 x dx Wir verwenden die Regel der partiellen Integration (siehe Gleichung (3.2) und setzen dabei v(x) = x =) v0(x) = 1 w0(x) = e x =) w(x) = e x 50 KAPITEL 3. STETIGE VERTEILUNGEN Damit gilt EX = 1 xe x 0 {z } =0 | 1 1Z = e 0 | Dabei wurde benutzt, dass 1 Z 0 x dx {z lim xe = x )dx 1 : } =1 x!1 ( e x =0 und dass das Integral über eine Dichtefunktion 1 ergibt. Durch zweimalige Anwendung der partiellen Integration erhält man EX 2 = 1 Z 0 x2 e x dx = 2=2 und damit nach Satz 2.2 V arX = EX 2 (EX )2 = 2=2 (1=)2 = 1=2 } In der alternativen Darstellung gilt EX = und V arX = 2 : Anwendungen der Exponentialverteilung: a) Die Exponentialverteilung ist ein nützliches Modell für die Lebensdauer von Teilen, die nicht wesentlich ,,altern”, wie elektronische Komponenten oder Fensterscheiben. In diesem Zusammenhang ist die Exponentialverteilung durch die folgende Eigenschaft charakterisiert: Satz 3.16 (Markoffsche Eigenschaft) Sei X die Lebensdauer eines Teiles. Die Zufallsvariable X ist genau dann exponentialverteilt, wenn für alle x und x0 P (fX > x + x0 gjfX > x0 g) = P (fX > xg) (3.8) gilt. Dieser Satz besagt, dass man Individuen (Teilen), deren Lebensdauer einer Exponentialverteilung folgt, ihr Alter nicht anmerkt. Gleichung (3.8) bedeutet, dass die bedingte Wahrscheinlichkeit, den Zeitpunkt x + x0 zu überleben, wenn man weiß, dass der Zeitpunkt x0 bereits überlebt wurde, genau so groß ist wie die Wahrscheinlichkeit, den 3.5. EXPONENTIALVERTEILUNG 51 Zeitpunkt x (von 0 ausgehend) zu überleben. Das bisher erreichte Alter des Individuums hat also keinen Einfluss auf die weiteren Überlebenswahrscheinlichkeiten, z.B. gilt P (fX > (3 + 2) JahregjfX > 2 Jahreg) = P (fX > 3 Jahreg) : Das bedeutet die Wahrscheinlichkeit P (fEin zwei Jahre altes Teil hält sich noch drei weitere Jahre g) ist gleich der Wahrscheinlichkeit P (fEin neues Teil hält sich drei Jahre g) : Die Exponentialverteilung ist also eine Verteilung ohne Gedächtnis. Auch Gegenstände, die sich wenig verändern, z. B. Teller, haben eine exponentialverteilte Lebensdauer. b) Die Zeitintervalle zwischen Ereignissen eines Poissonprozesses sind exponentialverteilt. Typischerweise sind dies die folgenden Ereignisse: Unfälle, Nachfrage bestimmter Produkte, Stürme, Fluten, Telefonanrufe, radioaktiver Zerfall, usw.. Wir wollen die für einen Poissonprozess charakteristischen Eigenschaften in der folgenden Definition zusammenfassen. Definition 3.6 Ein Poissonprozess liegt vor, wenn die folgenden Eigenschaften erfüllt sind i) Die Wahrscheinlichkeit, dass ein Ereignis in einem Intervall der Länge t vorkommt, ist t, wobei eine Konstante ist. ii) Die Wahrscheinlichkeit, dass zwei oder mehr Ereignisse in einem Intervall der Länge t vorkommen, ist klein im Vergleich zu t. lim t!0 P (f2 oder mehr Ereignisse in tg) =0 P (f1 Ereignis in tg) iii) Die Ereignisse treten unabhängig auf. Satz 3.17 Die Zeit zwischen zwei Ereignissen in einem Poissonprozess ist exponentialverteilt mit dem Parameter . Beweis: Betrachten Sie die Abbildung 3.27. Dort sind zwei Ereignisse durch das Zeichen dargestellt. 52 KAPITEL 3. STETIGE VERTEILUNGEN | | | | | | | | | | | | | | | | | | | | | 123 n X Abbildung 3.27: Zeitintervall zwischen zwei Ereignissen in einem Poissonprozess Sei X das Zeitintervall zwischen diesen beiden Ereignissen. Die Zeitachse ist in kleine Intervalle der Länge t aufgeteilt. Die Anzahl der Teilintervalle zwischen diesen beiden Ereignissen sei n. Wir müssen zeigen, dass die Verteilungsfunktion von X die einer Exponentialverteilung ist (siehe Satz 3.14). Äquivalent dazu ist der Nachweis, dass P (fX > xg), diese Funktion bezeichnet man auch als Überlebenszeitfunktion, gegeben ist durch P (fX > xg) = ( 0 e x<0 x0 für x für Für x > 0 gilt P (fX > xg) = P (fkein Ereignis in Intervall 1 und kein Ereignis in Intervall 2 und .. . g) P (fkein Ereignis in Intervall 1g) P (fkein Ereignis in Intervall 2g) kein Ereignis in Intervall n = .. . P (fkein Ereignis in Intervall ng) = (1 t) (1 t) : : : (1 t)} | {z = (1 t)n n = (1 t)x=t : Nun gilt (siehe z.B. Sydsæter und Hammond (2003), Formel (6.11.4) oder (7.10.1)) lim (1 t)x=t = e t!0 x : Damit gilt für x > 0 F (x) = P (fX xg) = 1 P (fX > xg) = 1 e x : } R-Befehle zur Exponentialverteilung: dexp(x, rate=1) berechnet die Dichtefunktion der Exponentialverteilung mit dem Parameter =rate=1 an der Stelle x. Dabei kann x ein Vektor sein. 3.6. BETAVERTEILUNG 53 pexp(q, rate=1) berechnet die Verteilungsfunktion der Exponentialverteilung mit dem Parameter =rate an der Stelle q . Dabei kann q ein Vektor sein. qexp(p, rate=1) berechnet die Umkehrfunktion der Verteilungsfunktion der Exponentialverteilung mit dem Parameter =rate an der Stelle p. Dabei muss p ein Vektor von Wahrscheinlichkeiten, d.h. von Zahlen zwischen 0 und 1 sein. rexp(n, rate=1) erzeugt n exponentialverteilte Zufallszahlen mit dem Parameter =rate. 3.6 Betaverteilung Definition 3.7 Die Betafunktion ist definiert durch B (; ) = = Z1 0 t 1 (1 t) 1 dt >0 >0 () ( ) : ( + ) Es gibt eine R-Funktion beta(a,b), die die Betafunktion nach der obigen Formel berechnet. Definition 3.8 Die Dichtefunktion der Betaverteilung ist gegeben durch ( fX (x) = x 1 (1 x) B (; ) 0 1 0x1 sonst : Die Betaverteilung hat zwei Parameter, für die gelten muss >0 und >0: Wir schreiben X Be(; ) ; wenn X eine Betaverteilung mit den Parametern und besitzt. Die Verteilungsfunktion ist für 0 < x < 1 gleich x 1 Z 1 FX (x) = t (1 t) 1 dt : B (; ) 0 54 KAPITEL 3. STETIGE VERTEILUNGEN Das Integral auf der rechten Seite der obigen Gleichung ist auch als unvollständiger Betafunktions-Quotient (,,incomplete beta function ratio”) bekannt. Wir werden die Verteilungsfunktion bei Bedarf mit R berechnen (siehe unten). Satz 3.18 Die Zufallsvariable X sei betaverteilt mit den Parametern und . Dann gilt E (X ) = + V arX = und ( + )2 ( + + 1) : Beweis: Im folgenden Beweis benutzen wir den Zusammenhang zwischen der Betafunktion und der Gammafunktion (siehe Definition 3.7). EX = Z1 0 xf (x)dx = Z1 0 ( + 1) ( ) ( + 1 + ) = + = EX 2 = Z1 0 x2 f (x)dx = Z1 0 x x x) 1 B ( + 1; ) dx = B (; ) B (; ) ( + ) () ( + ) = () ( ) () ( + )( + ) 1+1 (1 x) 1 B ( + 2; ) dx = B (; ) B (; ) ( + ) ( + 1) () ( + ) = () ( ) () ( + )( + 1 + )( + ) 1+2 (1 ( + 2) ( ) = ( + 2 + ) ( + 1) = ( + 1 + )( + ) Mit Satz 2.2 folgt ( + 1) 2 2 2 V arX = EX (EX ) = ( + 1 + )( + ) + 2 ( + 1)( + ) ( + 1 + ) = ( + 1 + )( + )2 3 + 2 + 2 + 3 2 2 = = : ( + )2 ( + + 1) ( + )2 ( + + 1) ! } Abbildung 3.28 zeigt einige Dichtefunktionen der Betaverteilung. Diese Abbildung macht deutlich, wie verschieden die Gestalt der Dichtefunktion in Abhängigkeit der beiden Parameter sein kann. Für = 1 und = 1 ergibt sich als Spezialfall die Rechteckverteilung 3.6. BETAVERTEILUNG 55 3 3 3 0.5, 3 1, 3 3 2, 3 3, 3 2 2 2 2 1 1 1 1 0 0.0 0.5 1.0 3 0 0.0 0.5 1.0 3 0 0.0 0.5 1.0 3 0.5, 2 1, 2 0 0.0 3, 2 2 2 2 1 1 1 1 0.5 1.0 3 0 0.0 0.5 1.0 3 0 0.0 0.5 1.0 3 0.5, 1 1, 1 0 0.0 2, 1 2 2 1 1 1 1 1.0 3 0 0.0 0.5 1.0 3 0 0.0 0.5 1.0 3 0.5, 0.5 1, 0.5 0 0.0 2, 0.5 2 2 1 1 1 1 1.0 0 0.0 0.5 1.0 0 0.0 1.0 3, 0.5 2 0.5 0.5 3 2 0 0.0 1.0 3, 1 2 0.5 0.5 3 2 0 0.0 1.0 3 2, 2 2 0 0.0 0.5 0.5 1.0 0 0.0 0.5 1.0 Abbildung 3.28: Dichtefunktionen der Betaverteilung U (0; 1). Für = ist die Dichtefunktion symmetrisch zu einer senkrechten Achse durch x = 0:5. Vertauscht man und , so wird die Dichtefunktion an der gleichen Achse gespiegelt. Die Betaverteilung kann auch in Abhängigkeit von den Parametern und dargestellt werden, wobei = E (X ) und = 1 : + Da die Betaverteilung nur Werte im Intervall [0; 1℄ annehmen kann, gilt 0<<1 und >0: Da E (X ) = =( + ) ist, gilt = + und = 1 : + > 0 und > 0 sind, 56 KAPITEL 3. STETIGE VERTEILUNGEN Umgekehrt gilt: = = und = (1 )= : Mit diesen neuen Parametern gilt E (X ) = Var(X ) = (1 und )=(1 + ) : Der Parameter ist ein Formparameter. Er bestimmt die Gestalt der Dichtefunktion. Abbildung 3.29 zeigt Dichtefunktionen der Betaverteilung in Abhängigkeit von diesen Parametern. 3 3 0.33 , 0.1 3 0.33 , 0.33 3 0.33 , 0.5 2 2 2 2 1 1 1 1 0 0.0 3 0.5 1.0 0 0.0 3 0.4 , 0.1 0.5 1.0 0 0.0 3 0.4 , 0.33 0.5 1.0 0 0.0 3 0.4 , 0.5 2 2 2 2 1 1 1 1 0 0.0 3 0.5 1.0 0 0.0 3 0.5 , 0.1 0.5 1.0 0 0.0 3 0.5 , 0.33 0.5 1.0 0 0.0 3 0.5 , 0.5 2 2 2 2 1 1 1 1 0 0.0 3 0.5 1.0 0 0.0 3 0.67 , 0.1 0.5 1.0 0 0.0 3 0.67 , 0.33 0.5 1.0 0 0.0 3 0.67 , 0.5 2 2 2 2 1 1 1 1 0 0.0 0.5 1.0 0 0.0 0.5 1.0 0 0.0 0.5 1.0 0 0.0 0.33 , 0.67 0.5 1.0 0.4 , 0.67 0.5 1.0 0.5 , 0.67 0.5 1.0 0.67 , 0.67 0.5 1.0 Abbildung 3.29: Dichtefunktionen der Betaverteilung als Funktion von und Anstelle des Parameters wird auch der Parameter '= 1 = ++1 +1 3.6. BETAVERTEILUNG 57 betrachtet. Für diesen Parameter gilt 0 < ' < 1. Es ist dann = (1 ')=' und = (1 )(1 ')=' : Mit den Parametern und ' gilt E (X ) = Var(X ) = (1 und )' : Abbildung 3.30 zeigt Dichtefunktionen der Betaverteilung in Abhängigkeit von den Parametern und '. 3 3 0.33 , 0.1 3 0.33 , 0.25 3 0.33 , 0.33 2 2 2 2 1 1 1 1 0 0.0 3 0.5 1.0 0 0.0 3 0.4 , 0.1 0.5 1.0 0 0.0 3 0.4 , 0.25 0.5 1.0 0 0.0 3 0.4 , 0.33 2 2 2 2 1 1 1 1 0 0.0 3 0.5 1.0 0 0.0 3 0.5 , 0.1 0.5 1.0 0 0.0 3 0.5 , 0.25 0.5 1.0 0 0.0 3 0.5 , 0.33 2 2 2 2 1 1 1 1 0 0.0 3 0.5 1.0 0 0.0 3 0.67 , 0.1 0.5 1.0 0 0.0 3 0.67 , 0.25 0.5 1.0 0 0.0 3 0.67 , 0.33 2 2 2 2 1 1 1 1 0 0.0 0.5 1.0 0 0.0 0.5 1.0 0 0.0 0.5 1.0 0 0.0 0.33 , 0.5 0.5 1.0 0.4 , 0.5 0.5 1.0 0.5 , 0.5 0.5 1.0 0.67 , 0.5 0.5 1.0 Abbildung 3.30: Dichtefunktionen der Betaverteilung als Funktion von und ' 58 KAPITEL 3. STETIGE VERTEILUNGEN Anwendungen der Betaverteilung a) Aufgrund der großen Flexibilität der Gestalt der Dichtefunktion ist die Betaverteilung sehr gut geeignet für stetige Zufallsvariablen, die nur Werte im Intervall (0; 1) annehmen, z.B. als Modell für Anteile. b) Wir werden die Betaverteilung als Modell für die Apriori-Verteilung des Parameters einer Bernoulli-Verteilung verwenden (siehe S. 192). Die Betaverteilung wird sich als konjugierte Verteilung (siehe Beispiel 10.7) der Binomialverteilung erweisen, und wir werden sie zur Konstruktion der Beta-Binomialverteilung verwenden (siehe S. 176). c) In der ,,Normalverteilungstheorie” erhält man die Betaverteilung als Verteilung von V 2 = X12 =(X12 + X22 ) ; wobei X12 ; X22 unabhängige 2 -verteilte Zufallsvariablen sind mit den Parametern n1 und n2 . Es gilt dann V 2 Be(n1 =2; n2 =2) : Da die 2 -Verteilung ein Spezialfall der Gammaverteilung ist, folgt dieses Resultat aus dem folgenden allgemeineren: Wenn X1 und X2 eine Gammaverteilung mit identischem Parameter und 1 bzw. 2 besitzen, so gilt: X1 X1 + X2 Be(1; 2 ) : d) Die Zufallsvariable X besitze eine F -Verteilung (siehe Definition 5.2) mit 1 und 2 Freiheitsgraden, dann gilt: 1 X 2 + 1 X Be(1 =2; 2=2) : e) Für = = 1=2 ergibt sich als Spezialfall die Arcus-Sinus-Verteilung, die in der Theorie der ,,random walks” Anwendung findet. Erfüllen die Parameter + = 1 (jedoch 6= 1=2), so spricht man auch von einer verallgemeinerten Arcus-SinusVerteilung. f) Seien U1 ; U2 ; : : : Un unabhängig und identisch U (0; 1)-verteilt. Ordnet man die Realisationen u1 ; u2 ; : : : ; un der Größe nach, so dass u(1) u(2) u(3) : : : u(n) ; so nennt man die durch diese Umordnung neu entstehenden Zufallsvariablen U(i) ; i = 1; 2; : : : ; n die i-ten Ordnungsstatistiken, die ganz allgemein bei der Konstruktion verteilungsfreier Verfahren Anwendung finden. Unter der obigen Annahme der Rechteckverteilung für Ui gilt U(i) Be(i; n i + 1) : 3.6. BETAVERTEILUNG 59 R-Befehle zur Betaverteilung: dbeta(x, shape1, shape2) berechnet die Dichtefunktion der Betaverteilung mit den Parametern =shape1 und =shape2 an der Stelle x. Dabei kann x ein Vektor sein. pbeta(q, shape1, shape2) berechnet die Verteilungsfunktion der Betaverteilung mit den Parametern =shape1 und =shape2 an der Stelle q . Dabei kann q ein Vektor sein. qbeta(p, shape1, shape2) berechnet die Umkehrfunktion der Verteilungsfunktion der Betaverteilung mit den Parametern =shape1 und =shape2 an der Stelle p. Dabei muss p ein Vektor von Wahrscheinlichkeiten, d.h. von Zahlen zwischen 0 und 1 sein. rbeta(n, shape1, shape2) erzeugt n betaverteilte Zufallszahlen mit den Parametern =shape1 und =shape2.