1 Beispiel 6 (Einige Aufgaben zur Gleichverteilung) Aufgabe 1 (Anwendung der Chebyshev-Ungleichung) Sei X eine Zufallsvariable mit E(X) = µ und var(X) = σ 2 a) Schätzen Sie die Wahrscheinlichkeit dafür, daß eine Realisierung von X nicht mehr als k vom Erwartungswert abweicht, nach unten ab b) Angenommen, X sei gleichverteilt auf den natürlichen Zahlen von 1 bis 10. Bestimmen Sie die Wahrscheinlichkeit dafür, daß eine Realisierung von X um höchstens k vom Erwartungswert abweicht ( k = 1 und k = 3 ). c) Vergleichen Sie die Ergebnisse von Teil a) und b). Lösung: Der übliche Ansatz nach Chebyshev ist: a) P(X - E(X) > k ) < var(X) k 2 ⇔ P(X - E(X) ≤ k) ≥ 1 - var(X) k2 =1- σ k 2 2 b) E(X) = 5.5 = 11/2 P(X - 5.5 ≤ 1) = P(X = 5) + P(X = 6) = 1/5 P(X - 5.5 ≤ 3 ) = P(X = 5)+P(X = 6)+P(X = 7)+P(X = 8)+P(X = 4)+P(X = 3) = 3/5. c) var(X) = E(X2) - E(X)2 = = (1 + 4 + 9 + 16 + 25 + 36 + 49 + 64 + 81 + 100)/10 - 121/4 = (770 - 605)/20 = 165/20 P( X - E(X) ≤ 1) ≥ 1 - σ2 = 1 - 165/20 = - 145/20 ( eine triviale und wertlose Schranke ). P( X - E(X) ≤ 3) ≥ 1 - σ2 /9 = 1 - 165/180 = 15/180 = 1/12 ( eine Schranke weitaus schwächer als in b) ) 2 Aufgabe 2 (Anwendung der Chebyshev-Ungleichung) Schreiben Sie Chebyshevs Ungleichung hin und diskutieren Sie die Chebyshevsche Ungleichung am Beispiel der Gleichverteilung. Lösung σ2 Die Chebyschev-Ungleichung P(X - µ ≥ k) ≤ k2 liefert eine obere Schranke dafür, daß eine Realisierung von X außerhalb eines symmetrisch um E(X) gelegenen Intervalls liegt. Sei die stetige Gleichverteilung U(a,b) = U(0, 1) betrachtet mit 2 ab 1 b- a 1 = , var (X) = = E(X) = 2 2 12 12 Sei für die Chebyshevsche Abschätzung k= 1/4, dann gilt 1 1 4 P X- > ≤ (eine ganz wertlose obere Schranke) 2 4 3 1 1 1 P X- > = 2 4 2 Tatsächlich ist aber Für k = 1 folgt aus der Chebyshevschen Abschätzung 1 1 P X- > 1 ≤σ 2 = , 2 12 während für die tatsächliche Abweichung gilt: P X- 1 > 1 = 0. 2 3 Aufgabe 3 (Transformation einer Gleichverteilung) Sei X stetig gleichverteilt über (0, 1); bestimmen Sie die Dichtefunktion von Y:= eX Für welche empirischen Sachverhalte könnte eine solche Verteilung zutreffen? Lösung X~U(0, 1) mit Verteilungsfunktion 0 , x∈(-∞,0] F(x) = x , x∈(0,1) 1 , x∈[1,∞) { Sei x∈(0, 1) F(x) = P(X≤x) = x ⇒ (Monotonie von ex) P(eX ≤ ex) = x ⇒ P(Y ≤ ex) = x ⇒ (mit der Transformation ex =: y oder x = logy) ⇒ F(y) = PY ≤ y) = log y 1 Dichtefunktion f(y) = F'(y) = y Der neue Definitionsbereich (aus der Monotonie des Logarithmus): 0≤x≤1, x = logy ⇒ (Monotonie des Logarithmus) 1≤y≤e 1 für 1 ≤ y ≤ e y P(Y ≤ y) = P(ex ≤ y) = P(X ≤ logy) = F(logy) = logy = G(y) ⇒ g(y) = { 0 sonst Es wird ausschließlich von der Definition einer Verteilung und der speziellen Gleichverteilung Gebrauch gemacht. 4 Aufgabe 4 1 2 n -2 Die diskrete Zufallsvariable Xn (n≥2) nehme die Realisationen 0, n - 1 , n - 1 ..., n - 1 , 1 mit 1 1 jeweils gleicher Wahrscheinlichkeit P(Xn = 0) = P(Xn = n - 1 ) = ... = P(Xn = 1) = n an. a) Berechnen Sie die zugehörige Verteilungsfunktion F und zeichnen Sie F sowie die Wahrscheinlichkeitsfunktion f für X2, X3, X4 und X10. b) Welche Realisationswahrscheinlichkeiten und welche Verteilungfunktion ergeben sich für n→∞? c) Ermitteln Sie zu dieser Verteilungsfunktion eine Dichte. Lösungsskizze 0 x<0 1 1 0≤x< n n-1 2 1 2 ≤x< n n-1 n- 1 a) F(x) = n-1 n-1 ≤x<1 n n 1 1≤x b) Für n → ∞: P(X = x) → 0, fallen alle Stufen der Treppenfunktion der Verteilung auf die Diagonale, so daß im Grenzübergang gilt: 0 x<0 F(x) → x 0≤x≤1 1 1<x Die diskrete Gleichverteilung geht (optisch) über zu der stetigen Gleichverteilung, aber tatsächlich bleibt es eine unstetige Funktion, wie die Bilder verdeutlichen, s.u. c) F ist differenzierbar für x ≠ 0, x ≠ 1. Dort gilt: 1 0<x<1 F'(x) → 0 x<0 oder 1<x { { 5 Zeichnungen für n=3,9,27 sind z.B.: n=3: x 0 1 1 S 2 1 3 1 3 1 3 1 x 0 1 8 1 4 3 8 1 2 5 8 3 4 7 8 1 S Häufigkeiten: 1 9 1 9 1 9 1 9 1 9 1 9 1 9 1 9 1 9 1 Häufigkeiten: n=9: n=27: 6 Aufgabe 5 (zu Mittelwert und Varianz) Eine Zufallsvariable X nimmt die drei Werte 1, 2 und 3 mit jeweils gleicher Wahrscheinlichkeit p an. Bestimmen Sie allgemein: a) den Erwartungswert E(X) und b) die Varianz var(X); c) geben Sie die numerischen Werte von E(X) und var(X) an. Lösung: p=1/3; E(X) = (1+2+3)/3 = 2; var(X) = (1-2)2p + (2-2)2p +(3-2)2p = 2p = 2/3 Ganz ähnlich ist die folgende Aufgabe zu einer Nicht-Gleichverteilung: Aufgabe 5’ Eine Zufallsvariable X nimmt die drei Werte -1, 0 und +1 mit den Wahrscheinlichkeiten p1 , p2 und p3 an. Bestimmen Sie a) den Erwartungswert E(X) und b) die Varianz var(X). c) Überprüfen Sie Ihre Ergebnisse mit den Zahlenwerten p1 = p3 = 0.25, p2 = 0.5 Lösung: a) E(X) = - p1 + p3 =: -q b) var(X) = (-1 + p1 - p3)2 p1 +(p1 - p3)2 p2 + (1 + p1 - p3)2 p3 = (-1 + q)2 p1 +q2 p2 + (1 + q)2 p3 a) Falls q=0, d.h. E(X) = 0; var(X) = p1 + p3; aus Symmetriegründen folgt E(X) = 0 sofort, dann ist die Varianz auch klar. Aufgabe 6 Eine Zufallsvariable X sei gleichverteilt X~U(0,1). Bestimmen Sie Erwartungswert und Varianz für Xn, n=1,2,3,.... . Die Lösung folgt aus den Definitionen: E(Xn) = 1 x ndx = x n+1 n+1 E(X2n) E(Xn)2 0 var(X n) = - = 1 0 x 2ndx -[ 1 0 x ndx ]2 x 2n+1 x2n+2 = 2n+1 (n+1) 2 7 Aufgabe 7 (zur Schätzung) a) Sei X diskret gleichverteilt auf den Werten 1, ..., N b) Sei X stetig gleichverteilt auf dem Intervall [0, b], wobei 0 < b ist. Berechnen Sie nach der Maximum-Likelihood-Methode einen Schätzer für N bzw. b, wenn eine einfache Stichprobe vom Umfang n gezogen wird. Lösung 1 fallsx ∈ {1, ..., N} N a) f(x) = 0 sonst n L(N) = Π i=1 1 n f(xi)= unter der Voraussetzung, daß xi ∈{1, ..., n} ∀ i N 1 n+1 <0 N Je kleiner N, desto größer L(N). Für N<xi ist f(xi ) = 0 und damit L(N) = 0. Also muß gelten xi ≤ N ∀ i. L(N) fällt streng monoton, Ableitung: -n Der ML-Schätzer ist daher: N = max xi 1 für0 ≤ x ≤ b b b) f(x) = 0 sonst L(b) = 1 n , analog zu a) gilt: je kleiner b, desto größer L(b), also: b = max xi b 8 Aufgabe 7’ (zur Schätzung) Sei X eine Zufallsvariable mit der Dichtefunktion 1 0< x <b f(x) = b 0 sonst Formulierung 1: Bestimmen Sie zu einer Zufallsstichprobe von nur einer Beobachtung den MaximumLikelihood-Schätzer sowie den Momentenschätzer für b und überprüfen Sie beide im Hinblick auf Erwartungstreue. Eine andere Formulierung ist: Sei die Stichprobe eine einzige Beobachtung. Entscheiden Sie sich für eine Methode zur Schätzung von b und begründen Sie Ihre Entscheidung im Hinblick auf Erwartungstreue und Effizienz. Eine dritte Formulierung ist: Eine Stichprobe soll aus einer (stetig) gleichverteilten Grundgesamtheit kommen d.h. 1 P(X) = , 0<X<B B Bestimmen Sie die Maximum Likelihood Schätzfunktion für B, nämlich B sowie E(B) und var(B) Lösung Für beide Schätzer wird der Erwartungwert benötigt: 1 E(X) = b b 0 2 1 x xdx = b 2 b | 0 = b 2 b ML - Schätzer: Xmax = X = b, E(X) = ≠ b ⇒ verzerrt 2 Momentenschätzer: ! b X = E(X) = ⇒ b=2X 2 b E b = 2 E X = 2 E X = 2 = b ⇒ unverzerrt 2 9 Aufgabe 8 (zur Wartezeitbestimmung) Was ist die Wahrscheinlichkeit, daß die 2 Beobachtungen von einer auf [0,1] gleichverteilten Zufallsvariablen um nicht mehr als 0.5 differieren. a) Bestimmen Sie die gesuchte Wahrscheinlichkeit mit Hilfe einer Graphik genau. b) Bestimmen Sie eine untere Schranke für die gesuchte Wahrscheinlichkeit. Lösung Zu a) Die Wahrscheinlichkeit einer Differenz größer als 1/2 wird durch die schraffierten Flächen der Abbildung gegeben: X2 1 1 2 1 2 1 X1 Daher gilt: P(|X 1 - X2| ≤ 0.5) = 0.75 Zu b) Differenz Y := X1 - X2 mit E(Y) = 0, var(Y) = 1 , wird durch Chebyshevs 6 Ungleichung abgeschätzt: var(Y) P(|Y - 0|≤0.5) ≥ 1 =1- 2 = 1 2 3 3 k ⋅n Eine Verallgemeinerung ist die folgende Aufgabe, die ebenfalls im wesentlichen graphisch gelöst wird: 10 Aufgabe 8’ Ein Mann und eine Frau verabreden sich für 12.30 Uhr in einem Lokal. Die Ankunftszeit des Mannes ist gleichverteilt zwischen 12.15 Uhr und 12.45 Uhr, die Ankunftszeit der Frau ist gleichverteilt zwischen 12.00 Uhr und 13.00 Uhr. Bestimmen Sie die Wahrscheinlichkeit dafür, daß niemand länger als 5 Minuten auf den jeweils anderen warten muß. Lösung X~U(0, 60) Ankunftszeit der Frau; Y~U(15, 45) Ankunftszeit des Mannes Y 60 45 30 15 X 15 30 45 60 a) gemeinsame Wahrscheinlichkeit dafür, daß die Frau höchstens 5 Minuten nach dem Mann ankommt b) gemeinsame Wahrscheinlichkeit dafür, daß der Mann höchstens 5 Minuten nach der Frau kommt Da beide Flächen gleich groß sind und einander nicht überschneiden, genügt es, eine der beiden zu berechnen: P(|X - Y| ≤ 5) = P(X - Y ≤ 5) + P(Y - X ≤ 5) = 2P(X - Y ≤ 5) 0 45 2 1 = 30 60 45 15 y+5 y+5 y 1 dxdy = 900 [ y 15 = 5(45 - 15) 1 = 900 6 1 dx]dy = 900 45 y+5 x y dy = 15 1 900 45 5dy = 15 5 45 y 15 900 11 Aufgabe 9 (zur e-Konstanten) Seien {X1, X2…, Xn} identisch gleichverteilte Zufallsvariable Xk ~ U(a, b) = U(0, 1) Bestimmen Sie die Wahrscheinlichkeiten a)p n = P[Sn<1]⇔ Ereignis {Die Summe von n Variablen ist kleiner als 1} b)f n = P[Sn-1 <1 und Sn>1] ⇔ Ereignis {Die Summe von n Variablen ist größer als 1} [the probbility of first passage)] c) qn = P[n = N und Sn-1 <1 und Sn>1] (Zählgrößendichte) d)E[N] = e (Eulersche Konstante) Lösung: 1 pn = P[Sn<1] = (Beweis: anhand der Konstruktion eines Ereignisbaums n! n= 1 ein Überschreiten der Eins ist unmöglich da U(0,1), d.h. p1 = 1.Für n = 2 kommen zwei Möglichkeiten hinzu, usw.; aus der Unabhängigkeit folgt dann n=1, S1 <1 n=2, S 2>1 n=3, S 3>1 n=4,S 4>1 S 2<1 – S3>1 S3<1 S4>1 – S >1 S <1 4 4 n–1 qn = P[n = N und Sn-1 <1 und Sn>1 = n! ∞ E[N] = Σ n=2 – n(n–1) = n! ∞ Σ n=2 1 = (n–2)! ∞ Σ n=0 1 = e, da e = n! ∞ Σ n=0 1 n! 1 2 NB 2: Der Zusammenhang zwischen der Zufallsvariablen, die summiert wird und Zufallsvariable “Zahl der Summanden” tritt auch in anderem Kontext auf, z.B. Poissonund Exponential-Verteilung, siehe außerdem die Theorie der stochastischen Prozesse NB 1: Man beachte den naheliegenden Fehlschluß E[N] = 2, e≠2, obwohl E[X] = 12 Aufgabe 10 (χ 2-Anpassungstest) Ein Zufallsgenerator erzeugt Ziffern 0, 1, 2,...,9. Überprüfen Sie zum Signifikanzniveau α = 0.01 die Hypothesen H0: "die generierten Ziffern entstammen einer Gleichverteilung" gegen H1: "nicht H0" anhand der folgenden unabhängigen Stichprobe, die in der Tabelle zusammengefaßt ist: Ziffer 0 1 2 3 4 5 6 7 8 9 Häufigkeit 7 9 10 10 12 13 10 10 11 Lösung: n= 100; X= generierte Ziffer H0: x ~ U(0,9) d.h, auf {0, 1,...,9} gegen H1: nicht H0 Gefragt ist, ob eine signifikante Abweichung der beobachteten Häufigkeiten bi von den erwarteten Häufigkeiten ei , die jeweils 0.1 sind vorliegt. Ein χ 2-Test liefert die gesuchte Entscheidung: d≠H0⇔ k Σ i=1 ⇒ (ni–np i)2 np i >k mit 1-α= 0.99= χk–1 (k)= 2 χ29 (k) ⇒ k= 21.7; npi = 10 χ2emp = 109 + 101 + 104 + 109 + 101 + 104 < 6 < k ⇒ d=H0 Aufgabe 11 (Mittelwerte der 0-1 Gleichverteilung) Zeigen Sie, daß der n-te Mittelwert der 0-1 Gleichverteilung 1 E(Xn) = n+1 Beweis: Der Beweis erfolgt durch direkte Integration: 1 xk + 1 1 k µk = E(X ) = = = , k= 1, 2, 3 , … k+1 0 k+1 0 Ein rekursives Bildungsgesetz ist n µn = µn-1 ⋅ , n= 1, 2, 3, …, µ0 = 1 n+1 Für die Varianz folgt das bekannte Ergebnis: 1 1 1 var(X) = E(X2) - E(X)2 = – = 3 4 12 1 x k dx 8