Wahrscheinlichkeitsrechnung und Statistik 8. Vorlesung Wahrscheinlichkeitsrechnung und Statistik Pseudozufallszahlen sind, wie der Name schon sagt, keine echten Zufallszahlen, sondern werden durch Generatoren erzeugt. Als Pseudozufallszahlen bezeichnet man Zahlenfolgen die durch einen deterministischen Algorithmus (Pseudozufallszahlengenerator) berechnet werden (und somit nicht zufällig sind) aber (für hinreichend kurze Sequenzen) zufällig aussehen. Es werden meist Pseudozufallszahlen herangezogen, da sie sich jederzeit neu erzeugen lassen und replizierbar sind, d.h. bei Vorgabe eines festen Startwertes erzeugt der Generator jedesmal wieder dieselben Pseudozufallszahlen. Echte Zufallszahlen können von physikalischen Generatoren, unter anderem durch die Beobachtung: radioaktiver Zerfälle oder quantenphysikalische Effekte, das Rauschen elektronischer Bauelemente, das Rauschen in der Atmosphäre. Diese Verfahren nennen sich physikalische Zufallszahlengeneratoren, sind jedoch zeitlich oder technisch recht aufwendig. Wahrscheinlichkeitsrechnung und Statistik Zufallszahlengeneratoren In der Regel geht man von einem Zufallszahlengenerator aus, der bei jedem Aufruf eine neue Zahl, die im Intervall [0; 1] gleichverteilt ist, berechnet. in Matlab: rand oder unifrnd(0, 1) Aus diesen Zufallszahlen werden die Zufallsvariablen des betrachteten Problems erzeugt. Die Zufallszahlen werden fast ausschließlich durch geeignete Algorithmen als Pseudozufallszahlen im Rechner erzeugt. Wahrscheinlichkeitsrechnung und Statistik Das Verfahren für die Erzeugung der Pseudo-Zufallszahlen, welche eine gegebene diskrete Verteilung haben Diskrete Verteilung: Man generiere Zufallszahlen, die folgende diskrete Verteilung haben 0 1 X ∼ , 1−p p mit Hilfe auf [0,1] gleichmäßig verteilten Zufallszahlen. Sei U ∼ U[0, 1]; z.B. U = rand oder U = unifrnd(0, 1) Wenn U ≤ p ⇒ Y = 1; Wenn U > p ⇒ Y = 0; display (Y ) ⇒ Y ist eine Zufallszahl welche die obige Verteilung hat Wahrscheinlichkeitsrechnung und Statistik Man generiere Zufallszahlen, die folgende diskrete Verteilung haben x1 x2 x3 X ∼ , p1 p2 p3 mit Hilfe auf [0,1] gleichmäßig verteilten Zufallszahlen. Sei U ∼ U[0, 1]; z.B. U = rand oder U = unifrnd(0, 1) Wenn U ≤ p1 ⇒ Y = x1 ; Wenn p1 < U ≤ p1 + p2 ⇒ Y = x2 ; Wenn p1 + p2 < U ≤ p1 + p2 + p3 = 1 ⇒ Y = x3 ; display (Y ) ⇒ Y ist eine Zufallszahl welche die obige Verteilung hat Wahrscheinlichkeitsrechnung und Statistik Inversionsmethode Diskrete Verteilung: Gegeben seien x1 , . . . , xn (die Werte), p1 , . . . , pn (ihre Wahrscheinlichkeiten). Man generiere Zufallszahlen, die folgende diskrete Verteilung haben x1 x2 . . . xn X ∼ , p1 p2 . . . pn mit Hilfe auf [0,1] gleichmäßig verteilten Zufallszahlen. Sei U ∼ U[0, 1]; z.B. U = rand oder U = unifrnd(0, 1) Wenn U ≤ p1 ⇒ Y = x1 ; Wenn p1 < U ≤ p1 + p2 ⇒ Y = x2 ; Wenn p1 + p2 < U ≤ p1 + p2 + p3 ⇒ Y = x3 ; ... Wenn p1 + · · · + pk < U ≤ p1 + · · · + pk+1 ⇒ Y = xk+1 ... display (Y ) Wahrscheinlichkeitsrechnung und Statistik Beispiele von Zufallsgeneratoren in Matlab Verteilung von X Bin(n, p) Unif (n) Poisson(λ) U[a, b] Zufallsgenerator binornd(n, p) unidrnd(n) poissrnd(λ) unifrnd(a, b) N (µ, σ 2 ) N (0, 1) Gamma(α, β) Exp(λ) normrnd(µ, σ) randn gamrnd(α, β) exprnd( λ1 ) Wahrscheinlichkeitsrechnung und Statistik in Matlab Verteilung von X Bin(n, p) Unif (n) Poisson(λ) U[a, b] Verteilungsfunktion FX (x) binocdf (x, n, p) unidcdf (x, n) poisscdf (x, λ) unifcdf (x, a, b) P(X = x) (Wkt., X diskret) fX (x) (Dichtefunktion, X stetig) binopdf (x, n, p) unidpdf (x, n) poisspdf (x, λ) unifpdf (x, a, b) N (µ, σ 2 ) Gamma(α, β) Exp(λ) normcdf (x, µ, σ) gamcdf (x, α, β) expcdf (x, λ1 ) normpdf (x, µ, σ) gampdf (x, α, β) exppdf (x, λ1 ) Wahrscheinlichkeitsrechnung und Statistik Stetige Verteilung: Man generiere Zufallszahlen, welche eine gegebene, stetige Verteilungsfunktion F haben: Man definiert für jedes y ∈ (0, 1) die Funktion −1 F (y ) , falls F umkehrbar ist G (y ) = inf{x ∈ R : F (x) ≥ y } falls F nicht umkehrbar ist Sei U ∼ U[0, 1]; z.B. U = rand oder U = unifrnd(0, 1) Man berechnet Y = G (U). display (Y ) ⇒ Y ist eine Zufallszahl welche die obige stetige Verteilung hat Wahrscheinlichkeitsrechnung und Statistik Anwendung Eine zufällige Variable X hat Cauchy Verteilung, d.h. sie hat folgende Dichtefunktion fX (t) = 1 , t ∈ R. π(1 + t 2 ) a) Man berechne die Verteilungsfunktion F von X b) Man berechne die Umkehrfunktion F −1 . c) Man simuliere Zufallswerte für X mit Hilfe der Inversionsmethode. Wahrscheinlichkeitsrechnung und Statistik Definition 18 (Xn )n ist eine Folge von unabhängigen ZG, wenn ∀ {i1 , . . . , ik } ⊂ N die ZG Xi1 , . . . , Xik sind unabhängig, d.h. P(Xi1 ≤ xi1 , . . . , Xik ≤ xik ) = P(Xi1 ≤ xi1 ) · · · · · P(Xik ≤ xik ) ∀ xi1 , . . . , xik ∈ R. Zum Beispiel: ZG Xn = die angezeigte Zahl im n-ten Wurf eines Würfels ⇒ (Xn )n ist eine Folge von unabhängigen ZG Wahrscheinlichkeitsrechnung und Statistik Definition 19 Die Folge (Xn )n von ZG konvergiert fast sicher zur ZG X , wenn P({ω ∈ Ω : lim Xn (ω) = X (ω)}) = 1. n→∞ f.s. Bezeichnung: Xn → X 1. Beispiel: Xn ∼ − n1 0.5 1 n 0.5 f.s. ⇒ Xn −→ ??? Wahrscheinlichkeitsrechnung und Statistik 2. Beispiel: Ω := [0, 1] Grundraum, K := B([0, 1]) Borel-σ-Algebra auf [0, 1]; sei P das Wahrscheinlichkeitsmaß auf [0, 1], d.h. für alle α < β aus [0, 1] berechnet man P [α, β] = P [α, β) = P (α, β] = P (α, β) := β − α P entspricht dem Lebesgue Maß auf [0,1] (siehe 2. Vorlesung) f.s. Xn (ω) = ω + ω n , ω ∈ [0, 1], n ≥ 1 ⇒ Xn −→ lim Xn (ω) = n→∞ ω 2 ??? für ω ∈ [0, 1) für ω = 1 Sei X (ω) = ω für alle ω ∈ Ω ⇒ {ω ∈ Ω : lim Xn (ω) = ω} = [0, 1) n→∞ ⇒ P({ω ∈ Ω : lim Xn (ω) = ω}) = P([0, 1)) = 1 n→∞ f.s. und Statistik X → Wahrscheinlichkeitsrechnung X Relative und absolute Häufigkeit Sei A ein zufälliges Ereignis das in einem Experiment auftaucht; man wiederholt das Experiment n mal (unter denselben gegebenen Bedingungen); man bezeichnen mit kn (A) wie oft das Ereignis A auftaucht; die relative Häufigkeit des Ereignisses A ist die Zahl kn (A) ; die absolute Häufigkeit des Ereignisses A ist die hn (A) = n Zahl kn (A). Experiment: Man wirft n mal eine Münze; A: man erhält Zahl n Anzahl Durchführungen Exp. 100 1000 10000 f .s. 1 2 hn (A) −→ absolute Häufigkeit kn (A) 48 497 5005 relative Häufigkeit hn (A) 0.48 0.497 0.5005 (siehe Satz 20) Wahrscheinlichkeitsrechnung und Statistik Das Starke Gesetz der großen Zahlen (SGGZ) Definition 20 Die Folge von ZG (Xn )n mit E |Xn | < ∞ für alle n ∈ N erfüllt das starke Gesetz der großen Zahlen (SGGZ) wenn n 1 X f .s. Xk − E (Xk ) −→ 0. n k=1 Wahrscheinlichkeitsrechnung und Statistik Das Starke Gesetz der großen Zahlen (SGGZ) Satz 18 Sei (Xn )n Folge von unabhängigen ZG mit E |Xn | < ∞ für alle ∞ X 1 V (Xn ) < ∞ ⇒ (Xn )n erfüllt das SGGZ. n ∈ N und n2 n=1 Satz 19 Sei (Xn )n Folge von unabhängigen ZG mit der gleichen Verteilung wie die ZG X (d.h. E (Xn ) = E (X ) , V (Xn ) = V (X ) für alle n ∈ N) ⇒ (Xn )n erfüllt das SGGZ, d.h. 1 f .s. (X1 + · · · + Xn ) −→ E (X ). n Wahrscheinlichkeitsrechnung und Statistik Würfeln: Matlab Simulation Gesetz der großen Zahlen clear all clf hold on n=350; x=unidrnd(6,1,n); for i=1:n s(i)=sum(x(1:i))/i; y(i)=i; plot(y(i),s(i),’b.’) plot(y(i),3.5,’g-’) end plot(y,s,’r-’) xlabel(’Anzahl Würfe’) ylabel(’Durchschnittliche Summe der Zahlen’) ⇒ x(1:7)=[1, 4, 6, 6, 2, 1 ,1] ⇒ s(1:7)=[1, 2.5, 3.6667, 4.25, 3.8, 3.3333, 3] Wahrscheinlichkeitsrechnung und Statistik Gesetz der großen Zahlen Wahrscheinlichkeitsrechnung und Statistik Satz 20 Sei A ein zufälliges Ereignis das in einem Experiment auftaucht; man wiederholt das Experiment n mal (unter denselben gegebenen Bedingungen). Das Gesetz der großen Zahlen: je öfter man das Zufallsexperiment durchführt (also je größer n), desto besser approximiert die relative Häufigkeit hn (A) des Ereignisses A seine echte Wahrscheinlichkeit P(A): f .s. hn (A) −→ P(A), wenn n → ∞. In der Praxis: hn (A) ≈ P(A), wenn n hinreichend groß ist! Beweis: Man benutzt Satz 19. Wahrscheinlichkeitsrechnung und Statistik