Definition 2.34. Sei X eine stetige Z.V. mit Verteilungsfunktion F und Dichte f . Dann heißt Z E(X) := ∞ −∞ x · f (x) dx der Erwartungswert von X, sofern dieses Integral existiert. Entsprechend wird die Varianz V (X) definiert: Z ∞ (x − E(X))2 · f (x) dx. V (X) = −∞ Die Sätze über Erwartungswerte und Varianz in Kapitel 2.3 übertragen sich auf den stetigen Fall, insbesondere gilt auch Satz 2.16. Wir können die Varianz auch wie folgt berechnen: Z ∞ V (X) = x2 · f (x) dx − [E(X)]2. −∞ Beispiel 2.35. Erwartungswert einer N (µ, σ 2) verteilten Z.V. ist µ, die Varianz ist σ 2. In dem Fall ist die Zufallsvariable (X − µ)/σ standardnormalverteilt. Die Verteilungsfunktion einer N (µ, σ 2) verteilten Z.V. ist x − µ Φ σ 51 und die Dichtefunktion f (x) = wobei 1 x − µ ϕ σ σ 1 2 1 ϕ(x) = √ e− 2 x 2π die Dichte der Standardnormalverteilung mit µ = 0 und σ = 1 ist. 2.6 Eigenschaften der Normalverteilung Satz 2.36. Es seien X1 und X2 zwei unabhängig normalverteilte Zufallsvariablen mit Erwartungswerten µ1 und µ2 sowie Varianzen σ12 und σ22. Dann ist auch X1 + X2 normalverteilt mit Erwartungswert µ1 + µ2 und Varianz σ12 + σ22. Man nennt diese Eigenschaft auch die Faltungseigenschaft der Normalverteilung: Haben ganz allgemein zwei unabhängige Z.V. die Dichten f und g, so hat X1 +X2 die Dichte Z ∞ f (t)g(x − t) dt −∞ 52 und das hier auftretende Integral heißt die Faltung von f und g. Beim schwachen Gesetz der großen Zahlen (Satz 2.30) haben wir gesehen, dass man Erwartungswert und Varianz des arithmetischen Mittels von unabhängigen und identisch verteilten Zufallsvariablen berechnen kann. Im Fall normalverteilter Z.V. kennt man sogar die Verteilung. Der Beweis ist im Gegensatz zu den meisten bisher formulierten Sätze nicht trivial: Satz 2.37 (Zentraler Grenzwertsatz). Es seien X1, . . . , Xn unabhängige und identisch verteilte Zufallsvariablen mit Erwartungswert µ und Varianz σ 2 auf einem Wahrscheinlichkeitsraum (Ω, P ). Dann gilt für die Folge der Zufallsvariablen X̃ = n1 (X1 + . . . + Xn): lim P ( n→∞ X̃ − µ √ ≤ z) = Φ(z). σ/ n Mit anderen Worten: Das arithmetische Mittel ist asymptotisch N (µ, σ 2/n)verteilt. Sei FB(n,p) die Verteilungsfunktion einer B(n, p) verteilten Zufallsvariable Sn. Dann gilt x + 12 − np FB(n,p)(x) ≈ Φ p np(1 − p) 53 falls np undn(1 − p) beide groß sind (Faustregel: np(1 − p) ≥ 9). Man nennt die Addition von +1/2 die Stetigkeitskorrektur. Das wird deutlich, wenn man sich ein Beispiel anschaut, z.B. die Verteilung von B(300, 0.2) und die entsprechende Normalverteilung ohne und mit Stetigkeitskorrektur. Im ersten Bild ohne, im zweiten Bild mit Stetigkeitskorrektur: 54 Man nennt diese Approximation der Binomialverteilung durch die Normalverteilung auch den zentralen Grenzwertsatz von deMoivre-Laplace. Beachten Sie, dass bei der Berechnung der W.K. P (k ≤ Sn ≤ l) die “Stetigkeitskorrektur” an der unteren Schranke mit einem anderen Vorzeichen erfolgt: l + 21 − np k − 12 − np P (k ≤ Sn ≤ l) ≈ Φ p −Φ p np(1 − p) np(1 − p) Da die Poissonverteilung als Grenzverteilung der Binomialverteilung auftritt ist es auch nicht überraschend, dass die Poissonverteilung FP (λ) zum Parameter λ 55 durch die Normalverteilung approximiert werden kann: x + 1/2 − λ √ FP (λ)(x) ≈ Φ λ 2.7 Gleichverteilung und Exponentialverteilung Eine Zufallsvariable X mit Realisierungen auf einem Intervall [a, b] heißt gleichverteilt, falls für die Wahrscheinlichkeiten gilt d−c P (X ∈ [c, d]) = b−a für a ≤ c ≤ d ≤ b. Die Dichtefunktion f (x) ist dann 1 x ∈ (a, b) f (x) = b−a 0 sonst Man kann dann daraus leicht Erwartungswert und Varianz einer auf [a, b] gleichverteilten Zufallsvariablen X bestimmen: b+a E(X) = 2 (b − a)2 . V (X) = 12 56 Definition 2.38. Eine Zufallsvariable X heißt exponentialverteilt zum Parameter λ (geschrieben X ∼ Exp(λ)), wenn die Dichte f (x) = λ · e−λx für x > 0 und 0 sonst ist. Satz 2.39. Die Verteilungsfunktion F (x) einer Exponentialverteilung ist F (x) = 1 − e−λx für x ≥ 0 und 0 für x < 0. Der Erwartungswert ist 1/λ und die Varianz 1/λ2. Bemerkung 2.40. Die Exponentialverteilung ist gedächtnislos im folgenden Sinne: P (X ≥ t + h|X ≥ t) = P (X ≥ h) für alle t, h > 0. Hier sind die Bilder der Dichten von zwei Exponentialverteilungen, einmal zum Parameter λ = 1 (rot) und einmal zum Parameter λ = 1/2 (blau). 57 2.8 Gammaverteilung Zunächst verallgemeinern wir den Begriff der Fakultät: Z ∞ xz−1e−x.x, z > 0 Γ(z) := 0 Es gilt Γ(k) = (k − 1)! für k ∈ {1, 2, 3, . . .}. Definition 2.41. Eine Zufallsvariable X heißt gammaverteilt (∼ Γ(α, λ)) mit Parametern α > 0 und λ > 0, wenn ihre Dichte λα α−1 −λx f (x) = x e fürx > 0 Γ(α) 58 ist (und 0 für x ≤ 0). Der Parameter λ ist nur ein “Formparameter”, denn wenn X ∼ Γ(α, 1), dann gilt λ1 X ∼ Γ(α, λ). Der Parameter α hingegen hat wesentlichen Einflußauf die Dichtefunktion. Im Fall α = 1 erhalten wir die Exponentialverteilung. Satz 2.42. Sei X ∼ Γ(α, λ), dann E(X) = α λ V (X) = α . λ2 Das folgende Bild zeigt die Dichte der Gammaverteilung jeweils für λ = 1 und α = 0.5 (rot), α = 1 (blau) und α = 2 (grün): 59 3 Statistik 60