Wahrscheinlichkeitsrechnung und Statistik

Werbung
Wahrscheinlichkeitsrechnung und Statistik
8. Vorlesung
Wahrscheinlichkeitsrechnung und Statistik
Pseudozufallszahlen sind, wie der Name schon sagt, keine echten
Zufallszahlen, sondern werden durch Generatoren erzeugt.
Als Pseudozufallszahlen bezeichnet man Zahlenfolgen die durch
einen deterministischen Algorithmus
(Pseudozufallszahlengenerator) berechnet werden (und somit nicht
zufällig sind) aber (für hinreichend kurze Sequenzen) zufällig
aussehen. Es werden meist Pseudozufallszahlen herangezogen, da
sie sich jederzeit neu erzeugen lassen und replizierbar sind, d.h. bei
Vorgabe eines festen Startwertes erzeugt der Generator jedesmal
wieder dieselben Pseudozufallszahlen.
Echte Zufallszahlen können von physikalischen Generatoren,
unter anderem durch die Beobachtung: radioaktiver Zerfälle oder
quantenphysikalische Effekte, das Rauschen elektronischer
Bauelemente, das Rauschen in der Atmosphäre. Diese Verfahren
nennen sich physikalische Zufallszahlengeneratoren, sind jedoch
zeitlich oder technisch recht aufwendig.
Wahrscheinlichkeitsrechnung und Statistik
Zufallszahlengeneratoren
In der Regel geht man von einem Zufallszahlengenerator aus, der
bei jedem Aufruf eine neue Zahl, die im Intervall [0; 1]
gleichverteilt ist, berechnet.
in Matlab: rand oder unifrnd(0, 1)
Aus diesen Zufallszahlen werden die Zufallsvariablen des
betrachteten Problems erzeugt. Die Zufallszahlen werden fast
ausschließlich durch geeignete Algorithmen als Pseudozufallszahlen
im Rechner erzeugt.
Wahrscheinlichkeitsrechnung und Statistik
Das Verfahren für die Erzeugung der Pseudo-Zufallszahlen,
welche eine gegebene diskrete Verteilung haben
Diskrete Verteilung: Man generiere Zufallszahlen, die folgende
diskrete Verteilung haben
0
1
X ∼
,
1−p p
mit Hilfe auf [0,1] gleichmäßig verteilten Zufallszahlen.
Sei U ∼ U[0, 1]; z.B. U = rand oder U = unifrnd(0, 1)
Wenn U ≤ p ⇒ Y = 1;
Wenn U > p ⇒ Y = 0;
display (Y )
⇒ Y ist eine Zufallszahl welche die obige Verteilung hat
Wahrscheinlichkeitsrechnung und Statistik
Man generiere Zufallszahlen, die folgende diskrete Verteilung haben
x1 x2 x3
X ∼
,
p1 p2 p3
mit Hilfe auf [0,1] gleichmäßig verteilten Zufallszahlen.
Sei U ∼ U[0, 1]; z.B. U = rand oder U = unifrnd(0, 1)
Wenn U ≤ p1 ⇒ Y = x1 ;
Wenn p1 < U ≤ p1 + p2 ⇒ Y = x2 ;
Wenn p1 + p2 < U ≤ p1 + p2 + p3 = 1 ⇒ Y = x3 ;
display (Y )
⇒ Y ist eine Zufallszahl welche die obige Verteilung hat
Wahrscheinlichkeitsrechnung und Statistik
Inversionsmethode
Diskrete Verteilung: Gegeben seien x1 , . . . , xn (die Werte), p1 , . . . , pn (ihre
Wahrscheinlichkeiten). Man generiere Zufallszahlen, die folgende diskrete
Verteilung haben
x1 x2 . . . xn
X ∼
,
p1 p2 . . . pn
mit Hilfe auf [0,1] gleichmäßig verteilten Zufallszahlen.
Sei U ∼ U[0, 1]; z.B. U = rand oder U = unifrnd(0, 1)
Wenn U ≤ p1 ⇒ Y = x1 ;
Wenn p1 < U ≤ p1 + p2 ⇒ Y = x2 ;
Wenn p1 + p2 < U ≤ p1 + p2 + p3 ⇒ Y = x3 ;
...
Wenn p1 + · · · + pk < U ≤ p1 + · · · + pk+1 ⇒ Y = xk+1
...
display (Y )
Wahrscheinlichkeitsrechnung und Statistik
Beispiele von Zufallsgeneratoren in Matlab
Verteilung von X
Bin(n, p)
Unif (n)
Poisson(λ)
U[a, b]
Zufallsgenerator
binornd(n, p)
unidrnd(n)
poissrnd(λ)
unifrnd(a, b)
N (µ, σ 2 )
N (0, 1)
Gamma(α, β)
Exp(λ)
normrnd(µ, σ)
randn
gamrnd(α, β)
exprnd( λ1 )
Wahrscheinlichkeitsrechnung und Statistik
in Matlab
Verteilung
von X
Bin(n, p)
Unif (n)
Poisson(λ)
U[a, b]
Verteilungsfunktion
FX (x)
binocdf (x, n, p)
unidcdf (x, n)
poisscdf (x, λ)
unifcdf (x, a, b)
P(X = x) (Wkt., X diskret)
fX (x) (Dichtefunktion, X stetig)
binopdf (x, n, p)
unidpdf (x, n)
poisspdf (x, λ)
unifpdf (x, a, b)
N (µ, σ 2 )
Gamma(α, β)
Exp(λ)
normcdf (x, µ, σ)
gamcdf (x, α, β)
expcdf (x, λ1 )
normpdf (x, µ, σ)
gampdf (x, α, β)
exppdf (x, λ1 )
Wahrscheinlichkeitsrechnung und Statistik
Stetige Verteilung: Man generiere Zufallszahlen, welche eine
gegebene, stetige Verteilungsfunktion F haben:
Man definiert für jedes y ∈ (0, 1) die Funktion
−1
F (y )
, falls F umkehrbar ist
G (y ) =
inf{x ∈ R : F (x) ≥ y } falls F nicht umkehrbar ist
Sei U ∼ U[0, 1]; z.B. U = rand oder U = unifrnd(0, 1)
Man berechnet Y = G (U). display (Y )
⇒ Y ist eine Zufallszahl welche die obige stetige Verteilung hat
Wahrscheinlichkeitsrechnung und Statistik
Anwendung
Eine zufällige Variable X hat Cauchy Verteilung, d.h. sie hat
folgende Dichtefunktion
fX (t) =
1
, t ∈ R.
π(1 + t 2 )
a) Man berechne die Verteilungsfunktion F von X
b) Man berechne die Umkehrfunktion F −1 . c) Man simuliere
Zufallswerte für X mit Hilfe der Inversionsmethode.
Wahrscheinlichkeitsrechnung und Statistik
Definition 18
(Xn )n ist eine Folge von unabhängigen ZG, wenn
∀ {i1 , . . . , ik } ⊂ N die ZG Xi1 , . . . , Xik sind unabhängig, d.h.
P(Xi1 ≤ xi1 , . . . , Xik ≤ xik ) = P(Xi1 ≤ xi1 ) · · · · · P(Xik ≤ xik )
∀ xi1 , . . . , xik ∈ R.
Zum Beispiel:
ZG Xn = die angezeigte Zahl im n-ten Wurf eines Würfels
⇒ (Xn )n ist eine Folge von unabhängigen ZG
Wahrscheinlichkeitsrechnung und Statistik
Definition 19
Die Folge (Xn )n von ZG konvergiert fast sicher zur ZG X , wenn
P({ω ∈ Ω : lim Xn (ω) = X (ω)}) = 1.
n→∞
f.s.
Bezeichnung: Xn → X
1. Beispiel:
Xn ∼
− n1
0.5
1
n
0.5
f.s.
⇒ Xn −→ ???
Wahrscheinlichkeitsrechnung und Statistik
2. Beispiel:
Ω := [0, 1] Grundraum, K := B([0, 1]) Borel-σ-Algebra auf [0, 1];
sei P das Wahrscheinlichkeitsmaß auf [0, 1], d.h. für alle α < β aus
[0, 1] berechnet man
P [α, β] = P [α, β) = P (α, β] = P (α, β) := β − α
P entspricht dem Lebesgue Maß auf [0,1] (siehe 2. Vorlesung)
f.s.
Xn (ω) = ω + ω n , ω ∈ [0, 1], n ≥ 1 ⇒ Xn −→
lim Xn (ω) =
n→∞
ω
2
???
für ω ∈ [0, 1)
für ω = 1
Sei X (ω) = ω für alle ω ∈ Ω
⇒ {ω ∈ Ω : lim Xn (ω) = ω} = [0, 1)
n→∞
⇒ P({ω ∈ Ω : lim Xn (ω) = ω}) = P([0, 1)) = 1
n→∞
f.s.
und Statistik
X → Wahrscheinlichkeitsrechnung
X
Relative und absolute Häufigkeit
Sei A ein zufälliges Ereignis das in einem Experiment auftaucht;
man wiederholt das Experiment n mal (unter denselben gegebenen
Bedingungen); man bezeichnen mit kn (A) wie oft das Ereignis A
auftaucht; die relative Häufigkeit des Ereignisses A ist die Zahl
kn (A)
; die absolute Häufigkeit des Ereignisses A ist die
hn (A) =
n
Zahl kn (A).
Experiment: Man wirft n mal eine Münze; A: man erhält Zahl
n Anzahl
Durchführungen Exp.
100
1000
10000
f .s. 1
2
hn (A) −→
absolute Häufigkeit
kn (A)
48
497
5005
relative Häufigkeit
hn (A)
0.48
0.497
0.5005
(siehe Satz 20)
Wahrscheinlichkeitsrechnung und Statistik
Das Starke Gesetz der großen Zahlen (SGGZ)
Definition 20
Die Folge von ZG (Xn )n mit E |Xn | < ∞ für alle n ∈ N erfüllt das
starke Gesetz der großen Zahlen (SGGZ) wenn
n
1 X
f .s.
Xk − E (Xk ) −→ 0.
n
k=1
Wahrscheinlichkeitsrechnung und Statistik
Das Starke Gesetz der großen Zahlen (SGGZ)
Satz 18
Sei (Xn )n Folge von unabhängigen ZG mit E |Xn | < ∞ für alle
∞
X
1
V (Xn ) < ∞ ⇒ (Xn )n erfüllt das SGGZ.
n ∈ N und
n2
n=1
Satz 19
Sei (Xn )n Folge von unabhängigen ZG mit der gleichen Verteilung
wie die ZG X (d.h. E (Xn ) = E (X ) , V (Xn ) = V (X ) für alle
n ∈ N) ⇒ (Xn )n erfüllt das SGGZ, d.h.
1
f .s.
(X1 + · · · + Xn ) −→ E (X ).
n
Wahrscheinlichkeitsrechnung und Statistik
Würfeln: Matlab Simulation Gesetz der großen Zahlen
clear all
clf
hold on
n=350;
x=unidrnd(6,1,n);
for i=1:n
s(i)=sum(x(1:i))/i;
y(i)=i;
plot(y(i),s(i),’b.’)
plot(y(i),3.5,’g-’)
end
plot(y,s,’r-’)
xlabel(’Anzahl Würfe’)
ylabel(’Durchschnittliche Summe der Zahlen’)
⇒ x(1:7)=[1, 4, 6, 6, 2, 1 ,1]
⇒ s(1:7)=[1, 2.5, 3.6667, 4.25, 3.8, 3.3333, 3]
Wahrscheinlichkeitsrechnung und Statistik
Gesetz der großen Zahlen
Wahrscheinlichkeitsrechnung und Statistik
Satz 20
Sei A ein zufälliges Ereignis das in einem Experiment auftaucht;
man wiederholt das Experiment n mal (unter denselben gegebenen
Bedingungen).
Das Gesetz der großen Zahlen: je öfter man das Zufallsexperiment
durchführt (also je größer n), desto besser approximiert die relative
Häufigkeit hn (A) des Ereignisses A seine echte Wahrscheinlichkeit
P(A):
f .s.
hn (A) −→ P(A), wenn n → ∞.
In der Praxis: hn (A) ≈ P(A), wenn n hinreichend groß ist!
Beweis: Man benutzt Satz 19.
Wahrscheinlichkeitsrechnung und Statistik
Herunterladen