1. Grundbegriffe der Stochastik - iks.hs

Werbung
1. Grundbegri¤e der Stochastik
Raum der Ereignisse. Die einelementigen Teilmengen f!g heiß
en auch Elementarereignisse.
Das Ereignis A tritt ein, wenn ein ! 2 A eintritt.
A ist ein geeignetes System von Teilmengen A von .
B Operationen mit Ereignissen A; B; A1 ; A2 ; : : : 2 A
A [ B Ereignis A oder B tritt ein
A \ B Ereignisse A und B treten ein
AnB Ereignis A tritt ein, nicht aber B
A B Ereignis B schließ
t A ein
Sn
Ai mindestens eines der Ereignisse Ai tritt ein
Tni=1
i=1 Ai alle Ai treten ein
nA = A das zu A komplementäre Ereignis, tritt ein, wenn A nicht eintritt.
A \ B = ; bedeutet Ereignisse A und B sind unvereinbar.
Axiome: P (A) heiß
t Wahrscheinlichkeit des zufälligen Ereignisses, falls
(1) Für alle A 2 A gilt: 0 P (A) 1.
Wahrscheinlichkeiten liegen zwischen 0 und 1.
(2) P ( ) = 1:
(3) Für unvereinbare Ereignisse A1 ; : : : ; An 2 A (Ai \ Aj = ; für i 6= j) gilt:
P
n
[
i=1
Ai
!
=
n
X
P (Ai ).
i=1
allgemeiner: für alle unvereinbaren Ereignisse A1 ; : : : ; An ; : : : 2 A gilt:
!
1
1
[
X
P
Ai =
P (Ai ).
i=1
i=1
B Daraus lassen sich weitere Formeln ableiten:
(4) P (;) = 0
(5) Unter der Voraussetzung A \ B = ; =) P (A [ B) = P (A) + P (B)
(6) P (A) = 1 P (A)
(7) Unter der Voraussetzung A B =) P (A) P (B)
(8)
P (A [ B) = P (A) + P (B) P (A \ B)
(9) P (A [ B) P (A) + P (B)
(10) P (A) = P (A \ B) + P (A \ B)
1
Definition: Es seien A; B 2 A mit P (B) > 0. Dann heiß
t
P (A j B) =
P (A \ B)
P (B)
die bedingte Wahrscheinlichkeit von A unter der Bedingung B.
Formeln:
P (A j C) = 1
P (A j C)
P (A j C) = P (A \ B j C) + P (A \ B j C)
Definition: Die Ereignisse A und B 2 A heiß
en unabhängig, wenn P (A \ B) =
P (A)P (B):
B A und B sind genau dann unabhängig, wenn P (A j B) = P (A):
Formel der totalen Wahrscheinlichkeit - Bayessche Formel
B Gegeben seien Ereignisse A; B 2 A.
P (A) = P (A j B) P (B) + P (A j B) P (B)
P (A j B)P (B)
P (B j A) =
P (A)
B Gegeben seien Ereignisse A; B1 ; : : : ; Bn 2 A, P (Bi ) > 0.
S
Die Bi bilden ein vollständiges System von Ereignissen:
= ni=1 Bi , Bi \ Bj = ; für
i 6= j, d.h. die Bi sind unvereinbar und schöpfen alle Möglichkeiten in
aus. Das
bedeutet, dass genau ein Bi immer eintritt.
Formel der totalen Wkt.
P (A) =
n
X
i=1
P (A j Bi )P (Bi )
Bayessche Formel
P (Bi j A) =
P (A j Bi )P (Bi )
P (A j Bi )P (Bi )
= n
X
P (A)
P (A j Bj )P (Bj )
j=1
2
Zuverlässigkeit und Verfügbarkeit von Systemen
Gegeben System mit Elementen e1 ; : : : ; en .
p1 ; : : : ; pn Wahrscheinlichkeiten mit der die Elemente funktionstüchtig sind,
p Verfügbarkeit des Systems; ist die Wahrscheinlichkeit, mit der das System funktioniert.
Verfügbarkeit des Seriensystems
p = p1 p2 : : : pn
Verfügbarkeit des Parallelsystems
p=1
(1
p1 ) (1
3
p2 ) : : : (1
pn )
2. Zufallsgröß
en
Diskrete Zufallsgröß
en
Verteilungstabelle:
Wert
x1
x2
Wahrscheinlichkeit p1
p2
:::
xr
evtl. unendlich viele Werte
pr
pi = P (X = xi )
r
X
Bedingungen:
0 < pi < 1;
pi = 1
i=1
B oft ist xi = i. Dann Formel für Wahrscheinlichkeiten:
P (m
X
l) =
l
X
pi
i=m
Diskrete Verteilungen
Verteilung
Parameter
Einzelwktn.
pi
Gleichverteilung
Poisson-Verteilung
Binomialverteilung
hypergeometrische
Verteilung
geometrische
Verteilung
1
n
n2N
>0
(i = 1 : : : n)
i
i!
e
(i = 0; 1; : : :)
n i
p (1 p)n i
i
M N M
i
n i
(i
N
n
n 2 N; p 2 (0; 1)
N; M; n 2 N
N M; n N
p 2 (0; 1)
(i = 0; : : : ; n)
= q; : : : ; r)
p)i 1 p (i = 1; 2; : : :)
(1
Verteilung
Erwartungs- Varianz
wert E(X)
Var(X)
Gleichverteilung
n+1
2
1 2
n
12
1
12
np
np(1
p)
Mn
N
M n(N M )(N
N 2 (N 1)
Poisson-Verteilung
Binomialverteilung
hypergeometrische
Verteilung
geometrische
Verteilung
q = maxf0; n + M
1
1 p
p
p2
N g; r = minfM; ng
4
n)
Kenngröß
en diskreter Verteilungen
Erwartungswert:
E (X) =
r
X
xi pi
i=1
Varianz (Streuung):
Var (X) =
r
X
E (X))2 pi =
(xi
i=1
Standardabweichung:
(X) =
r
X
x2i pi
(E (X))2
i=1
p
Var (X)
Stetige Zufallsgröß
en
B Verteilungsfunktion:
F (x) = P (X
x)
Eigenschaften der Verteilungsfunktion einer stetigen Zufallsgröß
e:
(a)
lim F (x) = 0; lim F (x) = 1
x! 1
x!1
(b) F ist monoton wachsend, d.h. F (x) F (y) für x < y.
(c) F ist stetig, d.h.
lim F (x) = F (x0 ) für alle x0 :
x!x0
B Wahrscheinlichkeitsdichte (Dichtefunktion) der Zufallsgröß
e:
f (x) = F 0 (x)
=)
P (a
P (X
P (X
X
a) =
b) =
b) =
Z a
Z
1
1
Z
b
f (x) dx = F (b)
a
f (x) dx = F (a)
f (x) dx = 1
F (b)
b
Das Argument x, für das f (x) maximal wird, heiß
t Modalwert.
B Eine Funktion f ist Dichte einer Zufallsgröß
e, falls
Z 1
1) f (x) 0, 2)
f (x) dx = 1
1
5
F (a)
Stetige Verteilungen
Verteilung
Parameter
Gleichverteilung auf [a,b]
Normalverteilung N ( ;
Dichtefunktion
a; b 2 R; a < b
2
2 R;
)
Exponentialverteil. Exp( )
>0
Gammaverteilung
; >0
2
>0
2
-Verteilung
n Freiheitsgrade
n2N
Weibullverteilung
f (x)
1
(x 2 [a; b])
b a
1
(x
)2
p
für x 2 R
exp
2 2
2
e x für x > 0
1
x 1 e x= für x > 0
( )
1
xn=2 1 e x=2 für x > 0
2n=2 (n=2)
; >0
logarithmische
Normalverteilung
2 R;
t-Verteilung
n Freiheitsgrade
exp(x) bedeutet ex
x
n2N
e
(x= )
für x > 0
1
exp
2 x
(ln(x)
2
((n + 1)=2)
p
(n=2) n
x2
1+
n
p
>0
1
)2
für x > 0
2
(n+1)=2
Normalverteilung N (0; 1) ist die standardisierte Normalverteilung
(x) ist Verteilungsfunktion der standardisierten Normalverteilung ! Tabelle
Verteilung
Gleichverteilung [a,b]
Verteilungsfunktion F (x)
Erwartungswert Varianz
E(X)
Var(X)
x
b
a+b
2
Normalverteilung
Exponentialverteilung
Gammaverteilung
Weibullverteilung
2
n -Verteilung
logarithmische
Normalverteilung
tn -Verteilung
a
a
x
a)2
12
(b
2
1 e x
für x > 0
1
>0
1
2
2
nicht explizit
1
exp( (x= ) )
für x > 0
nicht explizit
1+
n
ln(x)
e
nicht explizit
0
6
1
2
1+
2
1+
2n
+
2 =2
e2
+
2
n
n
2
e
2
1
1
2
(p) ist Gammafunktion !Tabelle;
(m) = (m
p
1
( )=
;
2
3
1p
( )=
;
2
2
(1) = 1;
B Wahrscheinlichkeiten der Normalverteilung: X
P (X
P (a
a) =
X
a
;
1)! für m 2 N
N( ;
P (X
b
b) =
5
3p
( )=
2
4
(2) = 1;
2
)
b
b) = 1
a
;
;
Beachte: ( x) = 1
(x) für alle x,
(0) = 0:5
Satz: Ist X N ( ; 2 ), dann Y = aX + b N (a + b; a2
2
):
Kenngröß
en stetiger Verteilungen
Erwartungswert:
E(X) =
Varianz :
Var(X) =
=
Standardabweichung:
(X) =
Schiefe:
Z
Z
sZ
Z
1
1
1
1
xf (x) dx
1
E(X))2 f (x) dx
(x
x2 f (x) dx
(E(X))2
1
1
(x
E(X))2 f (x) dx
1
(X) =
R1
1
(x E(X))3 f (x) dx
p
(Var (X))3
(X) > 0 bedeutet rechtsschiefe Verteilung, Modalwert liegt i.A. links neben E(X)
(X) < 0 bedeutet linksschiefe Verteilung, Modalwert liegt i.A. rechts neben E(X)
(X) = 0 symmetrische Verteilung
Schiefe spezieller Verteilungen: Normalverteilung N ( ; 2 ) ! (X) = 0
Exponentialverteilung Exp( ) ! (X) = 2
Definition: Eine Zahl q heiß
t Quantil der Ordnung
mit der Verteilungsfunktion F , falls
F (q ) =
7
der stetigen Zufallsgröß
eX
Dies bedeutet:
P (X
q )=
Z
q
f (x) dx =
1
Median: m = q0:5
P (X
m) = P (X > m) = 0:5
z( ) Quantil der Standardnormalverteilung N (0; 1),
tn ( ) Quantil der tn -Verteilung,
2
2
n ( ) Quantil der n -Verteilung
Unabhängigkeit von Zufallsgröß
en
Definition: Zwei Zufallsgröß
en X und Y heiß
en unabhängig, falls gilt:
P (X 2 A; Y 2 B) = P (X 2 A) P (Y 2 B)
für alle geeigneten Mengen A; B
R.
Satz: Die Summe von unabhängigen normalverteilten Zufallsgröß
en ist wieder normalverteilt.
N ( 2 ; 22 ) unabhängig
X N ( 1 ; 21 ); Y
=) X + Y
N ( 1 + 2 ; 21 + 22 )
Rechenregeln für Wahrscheinlichkeiten und Kenngröß
en
B Seien
(1)
(2)
(3)
(4)
(5)
(6)
=)
X; Y zwei Zufallsgröß
en. Dann gilt für reelle Zahlen a; b:
E(X + Y ) = E(X) + E(Y )
E(aX) = aE(X)
E(XY ) = E(X) E(Y ), falls X und Y unabhängig
Var(X) = E(X E(X))2 = EX 2 (EX)2
Var(aX) = a2 Var(X)
Var(X + Y ) = Var(X) + Var(Y ), falls X und Y unabhängig
E(aX + b) = aE(X) + b
Var(aX + b) = a2 Var(X)
8
(a; b 2 R)
Zentraler Grenzwertsatz
B Folge unabhängiger Zufallsgröß
en X1 ; X2 ; : : :, jedes der Xi besitzt die Verteilungsfunk2
tion F , E(Xi ) = , Var(Xi ) = .
Satz: Der zentrale Grenzwertsatz besagt, dass die Verteilungsfunktion der Größ
e
n
1 X
Yn = p
(Xi
n i=1
)
gegen die Verteilungsfunktion der N (0; 1)-Verteilung konvergiert. Für groß
es n besitzt
n
X
Xi näherungsweise (asymptotisch) die Verteilung N (n ; n 2 ):
i=1
X
bin(n; p)
P (k
X
l np + 0:5
p
np(1 p)
l)
!
k np 0:5
p
np(1 p)
!
Diskrete Zufallsvektoren
Zufallsvektor (X; Y ),
X nimmt Werte x1 ; : : : ; xr an
Y nimmt Werte y1 ; : : : ; ys an
Darstellung als Verteilungstabelle (Kreuztabelle):
X
x1
..
.
xr
..
.Y
y1
ys
p11
..
.
pr1
p1s
..
.
prs
p1:
..
.
pr:
p:1
p:s
1
pij = P (X = xi ; Y = yj );
pi: = P (X = xi );
p:j = P (Y = yj )
p1: ; : : : ; pr: nennt man die Randverteilung von X, p:1 ; : : : ; p:s die Randverteilung von Y .
pi: = pi1 + : : : + pis
(Zeilensumme)
p:j = p1j + : : : + prj
(Spaltensumme)
9
r X
s
X
pij = 1
i=1 j=1
Unabhängigkeit von X und Y bedeutet:
pij = pi: p:j
8i; j
B Abhängigkeitsmaßzweier Zufallsgröß
en X und Y : Korrelationskoe¢ zient
cov(X; Y )
= corr(X; Y ) = p
Var(X) Var(Y )
Kovarianz für diskrete Zufallsgröß
en:
cov(X; Y ) =
r X
s
X
E(X)E(Y ) mit xi ; yj ; pij wie oben,
xi yj pij
i=1 j=1
1
1
Stetige Zufallsvektoren
(X; Y ) zweidimensionaler stetiger Zufallsvektor, Paar zweier Zufallsgröß
en
Verteilungsfunktion:
F (x; y) = P (X x; Y
y)
monoton wachsend in jedem Argument
Verteilungsdichte:
f (x; y) =
F (x; y) =
Z
y
1
@2
F (x; y)
@x@y
Z x
f (u; v) dudv
1
Eine Funktion f ist Dichte von (X; Y ), falls
1) f (x; y)
0, 2)
Z
1
1
Z
1
f (x; y) dxdy = 1
1
Formel für Wahrscheinlichkeiten:
P (a
X
b; c
Y
d) =
Z bZ
a
= F (b; d)
F (b; c)
10
d
f (x; y) dydx
c
F (a; d) + F (a; c)
Randverteilungen FX und FY von X bzw. Y :
FX (x) = lim F (x; y);
FY (y) = lim F (x; y):
y!1
x!1
Für die Randdichten fX und fY gilt:
Z
fX (x) =
1
f (x; y) dy;
fY (y) =
1
Z
1
f (x; y) dx
1
Satz: Die beiden Zufallsgröß
en X; Y mit der gemeinsamen Dichte f (x; y) sind genau
dann unabhängig, wenn
P (X
x; Y
y) = P (X
y) bzw. f (x; y) = fX (x)fY (y) 8x; y 2 R:
x) P (Y
B Korrelationskoe¢ zient
cov(X; Y )
= corr(X; Y ) = p
Var(X) Var(Y )
mit cov(X; Y ) =
Es gilt:
1
Z
+1
1
Z
+1
xyf (x; y) dxdy
1
1:
11
E(X)E(Y )
3. Erzeugung von Zufallszahlen
Die Erzeugung gleichverteilter Zufallszahlen
modulare Arithmetik
a b mod m; m ist der Modul (a; b 2 Z; m 2 N; m 2)
a und b lassen bei der Division durch m den gleichen Rest
a = km + r; b = lm + r mit k; l; r 2 Z; 0 r < m.
B lineare Kongruenzmethode
xi = (axi
1
+ b) mod m mit 0
xi < m
Vorzugeben sind a; b und eine so genannte Saatzahl x0 , dann Iteration beliebig oft durchführen.
Eine Skalierung ui = xi =m führt auf Zufallszahlen aus [0,1].
Um eine sehr groß
e Periodenlänge durch die Wahl von a; b; m zu erhalten, sollte man
folgende Bedingungen berücksichtigen:
- b ist teilerfremd zu m.
- a 1 mod p für jeden Primfaktor p von m.
- Ist m durch 4 teilbar, so ist auch a 1 durch 4 teilbar.
Dann ist m die Periodenlänge.
L’Ecuyer-Generator MRG32k3a
L’Ecuyer 1999
Variable xi ; yi ; zi 2 Z; ui 2 R
Rechnung mit "double precision"-Zahlen auf 32bit-Rechner
Saatzahlen: x0 ; x1 ; x2 ; y0 ; y1 ; y2 2 Z
Schleife bez. i = 3; 4; : : :
xi = (1403580xi
yi = (527612yi
1
2
810728xi 3 ) mod 4294 967 087
1370589yi 3 ) mod 4294 944 443
zi = (xi
ui
yi ) mod 4294 967 087;
zi
=
4294 967 088
Ausgabe: Folge u1 ; u2 ; : : : von Pseudozufallszahlen, die auf [0,1] gleichverteilt sind.
12
Erzeugung von Zufallszahlen mit einer beliebigen stetigen Verteilung
Wir erzeugen gleichverteilte Pseudozufallszahlen:
U1 ; : : : ; Un und bilden die
1
Umkehrfunktion F (x) zur Verteilungsfunktion.
Die Folge F 1 (U1 ); : : : ; F 1 (Un ) stellt dann Pseudozufallszahlen zur Verteilungsfunktion
F dar.
B Box-Müller-Methode (Polar-Methode) zur Erzeugung von normalverteilten Zufallszahlen
Schritt 1: Erzeuge Zufallszahlen U1 ; U2 aus G[0; 1]
Berechne Z1 = 2U1 1; Z2 = 2U2 1; S = Z12 + Z22
Schritt 2: Falls S 1 gehe zu Schritt 1
Schritt 3: Bilde
r
r
2 ln(S)
2 ln(S)
; X2 = Z2
X1 = Z1
S
S
X1 ; X2 stellen Pseudozufallszahlen zu zwei unabhängigen N (0; 1)-verteilten Zufallsgröß
en
dar.
Erzeugung von Zufallszahlen einer diskreten Verteilung
Gegeben diskrete Verteilung:
Wert
x1
x2
Wahrscheinlichkeiten p1
p2
kumulierte Wktn.
q2 = p 1 + p 2
q1 = p 1
:::
xr
pr
:::
qr = 1
P
qi = ik=1 pk . Wir bilden Intervalle I1 = [0; q1 ); I2 = [q1 ; q2 ); : : : Ir = [qr 1 ; 1]:
B Erzeugung von Pseudozufallszahlen der diskreten Verteilung:
(1) Erzeugung der gleichverteilten Pseudozufallszahlen: U1 ; : : : ; Un
(2) Für jedes Uj suche man das k, so dass Uj 2 Ik , dann Xj = xk . Wir erhalten Pseudozufallszahlen X1 ; : : : ; Xn
13
Herunterladen