2.5 Parameter einer Wahrscheinlichkeitsverteilung Literatur: [Papula Bd. 3, Kap. II.5], [Benning, Kap. 3.3], [Bronstein et al., Kap. 13.2.2] In der deskriptiven Statistik wurden zur Charakterisierung von Häufigkeitsverteilungen Lage- und Streuungsparameter bestimmt. In ähnlicher Weise lassen sich auch für die Wahrscheinlichkeitsverteilung einer Zufallsvariablen Parameter angeben. Def 1 Ist X eine diskrete Zufallsgröße, die die Werte xi mit den Wahrscheinlichkeiten pi annimmt, dann ist deren Erwartungswert µ = E(X) definiert durch X E(X) := xi pi . i Unter dem Erwartungswert der stetigen Zufallsgröße X mit der Dichtefunktion f (x) versteht man die Größe Z∞ E(X) := xf (x) dx. −∞ Bsp 2 Sei X eine gleichverteilte, diskrete Zufallsgröße mit den Werten xi = i, i = 1, . . . , n. Dann ist E(X) = X xi pi = i 1X xi n i gleich dem arithmetischen Mittel der möglichen Werte. Bsp 3 Sei X eine gleichverteilte, stetige Zufallsgröße mit Werten im Intervall [a, b]. Dann ist Z E(X) = a b b 1 1 x2 b2 − a2 a+b x· dx = = = b−a b − a 2 a 2(b − a) 2 gleich dem arithmetischen Mittel der möglichen Werte. Satz 4 Wenn Z = g(X) eine Funktion der Zufallsvariablen X ist, gilt für den Erwartungswert der transformierten Zufallsvariablen Z P g(xi )pi falls X diskret, i E(Z) = E[g(X)] = R∞ g(x)f (x) dx falls X stetig. −∞ 2.5 – 1 Def 5 Die Varianz σ 2 = Var(X) = D2 (X) kennzeichnet die Streuung der Werte einer Zufallsvariablen X um ihren Erwartungswert µ = E(X). Sie ist als Erwartungswert aller quadrierten Zufallsabweichungen definiert, σ 2 = Var(X) = D2 (X) := E[(X − µ)2 ]. Die Standardabweichung σ ist die (positive) Wurzel der Varianz. Satz 6 Es gilt E[(X − µ)2 ] = E(X 2 ) − µ2 . Ü 7 Beweisen Sie diesen Satz. Bsp 8 (Wurf mit zwei unterscheidbaren Würfeln) Die diskrete Zufallsvariable X = Augensumme beider Würfel ist wie folgt verteilt: xi 2 3 4 5 6 7 8 9 10 11 12 pi 1 36 2 36 3 36 4 36 5 36 6 36 5 36 4 36 3 36 2 36 1 36 Der Erwartungswert ist folglich X 1 2 1 252 µ = E(X) = xi pi = 2 · +3· + . . . + 12 · = = 7. 36 36 36 36 i Bei häufiger Wiederholung des Würfelexperiments erwarten wir eine durchschnittliche Augensumme von etwa 7. Die Varianz ist X 2 1 210 1 σ2 = = = 5,83. (xi −µ)2 pi = (2−7)2 · +(3−7)2 · +. . .+(12−7)2 · 36 36 36 36 i √ Die Standardabweichung beträgt somit σ = 5,83 = 2,42. Wir können jetzt noch die Wahrscheinlichkeit P (µ − σ ≤ X ≤ µ + σ) bestimmen: P (µ − σ ≤ X ≤ µ + σ) = P (5 ≤ X ≤ 9) = 4 5 6 5 4 24 2 + + + + = = . 36 36 36 36 36 36 3 Diese Größenordnung ist typisch. Ü 9 Man berechne die Varianz bei (a) diskreter und (b) stetiger Gleichverteilung. Satz 10 (Lineare Transformation) Wird eine Zufallsvariable Y durch lineare Transformation Y = aX + b aus einer Zufallsvariablen X abgeleitet, ergeben sich deren Erwartungswert und Varianz zu E(Y ) = a E(X) + b, Var(Y ) = a2 Var(X). Beweis Einsetzen in die Definition. q.e.d. Folgerung 11 Jede Zufallsvariable X kann durch die Transformation Y = X −µ σ standardisiert werden. Es gilt E(Y ) = 0 und Var(Y ) = 1. 2.5 – 2 (1) Bsp 12 (Binomialverteilung) Wir erinnern uns, dass bei der Binomialverteilung ein Bernoulliexperiment (Münzwurf, Qualitätskontrolle) n-mal nacheinander ausgeführt wird. Die Zufallsvariable Xn = Anzahl der Versuche, in denen das Ereignis eintritt besitzt die Wahrscheinlichkeiten n k pk = P (Xn = k) = p (1 − p)n−k , k k = 0, 1, 2, . . . , n. Der Erwartungswert ist µ = E(Xn ) = n X k=0 n k k· p (1 − p)n−k = np, k was entweder durch eine längere Rechnung oder durch die folgende Überlegung gezeigt werden kann. Bei n = 1 ist der Erwartungswert E(X1 ) = p. Man überlegt sich (im Vorgriff auf den nächsten Abschnitt) weiter, dass bei n-facher unabhängiger Ausführung des immer gleichen Experiments, der Erwartungswert um den Faktor n wächst. Folglich ist E(Xn ) = np. Die Varianz berechnet sich nach der Formel n X n k (k − np)2 · p (1 − p)n−k = np(1 − p). σ2 = k k=0 Auch hier kann man zunächst die Überlegung für n = 1 anstellen 1 X k=0 1 k (k − p) · p (1 − p)1−k = p2 (1 − p) + (1 − p)2 p = p(1 − p). k 2 Die Varianz vervielfacht sich bei entsprechend ofter Wiederholung des BernoulliExperiments. Bsp 13 (Poisson-Verteilung) Bei der Poissonverteilung mit dem Parameter λ besitzt die Zufallsgröße die Wahrscheinlichkeiten pk = P (X = k) = λk −λ e , k! k = 0, 1, 2, . . . , λ > 0. Hier gilt µ = σ 2 = λ, für den Beweis verweisen wir auf die Literatur. Wir hatten das Ergebnis für den Erwartungswert schon bei der Interpretation vorweggenommen: • Ein Kaufhaus wird an einem Samstag durchschnittlich alle 10 Sekunden von einem Kunden betreten: λ = 6 war der Erwartungswert, die durchschnittliche Anzahl von Kunden, die pro Minute das Kaufhaus betreten. • Beim radioaktiven Zerfall gibt der Parameter λ gibt an, wieviele Atomkerne in einer Sekunde durchschnittlich zerfallen. 2.5 – 3 Bsp 14 (Normalverteilung) Bei der Normalverteilung treten Erwartungswert µ und Standardabweichung σ bereits in der Definition von Dichte- bzw. Verteilungsfunktion auf: f (x) = F (x) = (x−µ)2 1 √ e− 2σ2 , σ 2π Zx (t−µ)2 1 √ e− 2σ2 dt. σ 2π (2) (3) −∞ Entsprechend (1) kann die Normalverteilung in die Standardnormalverteilung mit x2 1 ϕ(x) = √ e− 2 , 2π Zx t2 1 Φ(x) = √ e− 2 dt 2π −∞ überführt werden. Ausnahmsweise werden Dichte- und Verteilungsfunktion hier (und in einigen Büchern, z.B. [Papula]) mit ϕ und Φ bezeichnet, denn oft werden die Funktionen F und Φ gleichzeitig innerhalb einer Rechnung benötigt, siehe die folgende Bemerkung. Bem 15 Die Berechnung von Wahrscheinlichkeiten, z.B. P (X < 7), einer normalverteilten Zufallsvariablen X kann nicht über die direkte Auswertung der Verteilungsfunktion erfolgen, da das uneigentliche Integral in (3) nicht elementar lösbar ist. Stattdessen erfolgt zunächst die Standardisierung Y = (X −µ)/σ, denn die Werte der Verteilungsfunktion Φ der standardisierten Normalverteilung sind tabelliert. Rx Man muss beachten, dass verschiedene Tabellenwerke statt Φ(x) = f (x) dx −∞ die Größe Φ0 (x) = Rx 0 f (x) dx = Φ(x) − 1 2 angeben. Außerdem ist zu beachten, dass oft nur positive Argumente x > 0 tabelliert sind, die negativen ergeben sich aus der Formel Φ(−x) = 1−Φ(x) bzw. Φ(±x) = 1 2 ± Φ0 (x), siehe auch die ausführliche Darstellung in [Papula Bd. 3, II.6.4.4]. Aufg 16 Mit welcher Wahrscheinlichkeit liegt der Wert einer (µ, σ)-normalverteilten Zufallsgröße X im Intervall (µ − σ, µ + σ)? Lösung: Sei Y = (X − µ)/σ die Standardnormalverteilung. Deren Verteilungsfunktion F ist tabelliert. Nach Umrechnung von x = µ ± σ in y = ±1 gilt: P (X ∈ (µ − σ, µ + σ)) = P (Y ∈ (−1, 1)) = F (1) − F (−1) = F (1) − [1 − F (1)] = 2F (1) − 1 = 2 · 0,8413 − 1 = 68,27 %. Bei einer großen Anzahl von Versuchen werden von den beobachteten Werten einer normalverteilten Zufallsgröße etwa 68,3 % zwischen den 1σ-Grenzen liegen, d.h. im Intervall (µ − σ, µ + σ). 2.5 – 4 Def 17 Wird eine Wahrscheinlichkeit α vorgegeben und gilt P (X ≥ xα ) = α, dann heißt die zu α gehörige Abszisse xα Quantil der Verteilung. Bem 18 1. Manchmal werden die Quantile auch über die Gleichungen P (X ≤ xα ) = α oder P (−xα/2 ≤ X ≤ xα/2 ) = P (|X| ≤ xα/2 ) = 1 − α definiert. 2. Manche Bücher bezeichnen kleine Werte von α, z.B. α = 5 % oder α = 1 % als Irrtumswahrscheinlichkeit . Die dazugehörigen Quantile sind für die wichtigsten praktischen Verteilungen tabelliert worden. Aufg 19 Sei X eine standardnormalverteilte Zufallsgröße. Man bestimme die Abszissen xα , xβ und xγ , so dass P (X ≥ xα ) = 10 %, P (X ≤ xβ ) = 10 %, P (|X| ≥ xγ ) = 10 %, Lösung: • Φ(xα ) = P (X ≤ xα ) = 1 − 0,1 = 0,9 ⇒ xα = 1,282. • xβ = −1,282, weil Φ(−x) = 1 − Φ(x). • Wegen Φ(−x) = 1 − Φ(x) gilt Φ(xγ ) = 0,95, also xγ = 1,645. Ü 20 An einem Forellenteich fischt ein erfahrener Angler. Für ihn kommen nur 40 bis 60 cm große Tiere in Frage; kleinere Fische sind unter seiner Würde, größere Fische passen nicht in die Pfanne. Er weiß, dass die Größe der Forellen des Teiches normalverteilt ist mit dem Erwartungswert µ = 50 cm und der Standardabweichung σ = 10 cm. Wie groß ist die Wahrscheinlichkeit, dass ein ihm genehmer Fisch an die Angel geht? Da kommt ein anderer Angler des Wegs und behauptet, er habe schon einmal eine 75 cm lange Forelle gefangen. Würden Sie dem anderen Angler glauben? Besser gefragt: Wie bewerten Sie die Aussage des anderen Anglers? 2.5 – 5