2.1.1. Beispiele: Diskrete Zufallsvariable und ihre Verteilung

Werbung
2.1.1. Beispiele: Diskrete Zufallsvariable und ihre Verteilung.
(a) Zeitpunkt des ersten Wurfs von Zahl“ beim ∞-fachen, unabhängi”
gen Münzwurf mit Erfolgswahrscheinlichkeit p ∈ (0, 1) 1. Zur Modellierung
des ∞-fachen, unabhängigen Münzwurfs mit Erfolgswahrscheinlichkeit p ∈ (0, 1)
wird der in Abschnitt 1.4.2 eingeführte Wahrscheinlichkeitsraum (Ω, F, P) benutzt.
Insbesondere ist Ω = {0, 1}N und F = σ(Fendl ) 2. Außerdem ist das Wahrscheinlichkeitsmaß P durch (1.5) bestimmt.
Zunächst sind Xk : (Ω, F, P) → ({0, 1}, Pot({0, 1})) mit 3 Xk (ω) = ωk , ω ∈ Ω,
k ∈ N, Zufallsvariable. Offensichtlich modelliert für k ∈ N die Zufallsvariable Xk
das Ergebnis des k-ten Wurfs der Münze 4.
Durch T (ω) := inf{k ∈ N : Xk (ω) = 1}, ω ∈ Ω, wird nun eine (N, Pot(N))wertige Funktion T auf (Ω, F, P) definiert. Da
{T = n} = {ω ∈ Ω : T (ω) = n}
(3)
= {ω ∈ Ω : X1 (ω) = · · · = Xn−1 (ω) = 0, Xn (ω) = 1}
= {ω ∈ Ω : ω1 = · · · = ωn−1 = 0, ωn = 1} ∈ Fendl ⊂ F,
n ∈ N,
ist T eine diskrete Zufallsvariable 5. Diese Zufallsvariable modelliert den Zeitpunkt
des ersten Wurfs von Zahl“. Die Verteilung PT von T ist eindeutig bestimmt durch
”
P[T = n], n ∈ N 6. Weil
P[T = n] =
7
P[{ω ∈ Ω : ω1 = · · · = ωn−1 = 0, ωn = 1}]
=
8
(1 − p)n−1 p,
n ∈ N,
ist T geometrisch verteilt mit Parameter p 9.
Bemerkung. Auch bei anderen beliebig oft unabhängig wiederholten, identischen
Experimenten“ mit zwei möglichen Ausgängen Erfolg“, bzw. Mißerfolg“ ist der
”
”
”
Zeitpunkt des ersten Erfolgs geometrisch verteilt 10.
(b) Konstruktion einer diskreten Zufallsvariablen mit einer vorgegebenen Verteilung 11. Sei auf N ein Wahrscheinlichkeitsmaß 12 µ = (µn )n∈N gegeben.
Gesucht ist eine N-wertige Zufallsvariable mit der Verteilung µ. Damit ist insbesondere ein Wahrscheinlichkeitsraum (Ω, F, P) und eine meßbare 13 (N, Pot(N))-wertige
1Im folgenden wird Beispiel (c) in Abschnitt 1.8 etwas ausführlicher behandelt.
2Ω ist der Raum der {0, 1}-wertigen Folgen und F die kleinste σ-Algebra, die die Menge F
endl
jener Ereignisse, die durch endlich viele Würfe der Münze bestimmt sind, enthält.
3Beachte, daß ω = (ω , ω , . . . ), ω ∈ Ω. X ist somit die Projektion auf die k-te Koordinate.
1
2
k
4Wenn die Familie der Zufallsvariablen X , k ∈ N, zu einem Objekt (X )
k
k k∈N zusammengefaßt
wird, ergibt sich ein einfaches Beispiel eines stochastischen Prozesses. Insbesondere liegt hier ein
Bernoulli-Prozeß vor. Allgemein sind bei einem Bernoulli-Prozeß Y = (Yk )k∈N die Zufallsvariablen Yk , k ∈ N, unabhängig und identisch verteilt.
5Vgl. dazu Bemerkung (ii) in Abschnitt 2.1.
6Vgl. Bemerkung (iii) in Abschnitt 2.1.
7Wegen (3).
8Aufgrund von (1.5).
9Vgl. Beispiel (c) in Abschnitt 1.8.
10Der Parameter dieser geometrischen Verteilung stimmt mit der Erfolgswahrscheinlichkeit
bei der einmaligen Durchführung des Experiments überein. Beispielsweise ist beim ∞-fachen, unabhängigen Wurf eines Würfels der Zeitpunkt des ersten Wurfs einer 5 geometrisch mit Parameter
1/6 verteilt.
11
Im folgenden Beispiel (c) wird gezeigt, wie die hier vorgestellten Konstruktionen eine praktische Bedeutung gewinnen können.
12Insbesondere ist µ ≥ 0, n ∈ N, und P
n
n∈N µn = 1.
13Auf der abzählbaren Menge N wird üblicherweise die σ-Algebra Pot(N) verwendet.
1
2
Funktion X auf (Ω, F, P) anzugeben, d.h., zu konstruieren
PX [{n}] = P[X = n] = µn ,
14
, so daß
n ∈ N.
Eine erste Möglichkeit besteht darin, zunächst Ω = N, F = Pot(N) und P = µ zu
wählen und anschließend X : (Ω, F, P) → (N, Pot(N)) durch 15 X(ω) = ω, ω ∈ Ω,
zu definieren. Da
PX [{n}] =
16
P[{ω ∈ Ω : X(ω) = n}]
=
17
P[{ω ∈ Ω : ω = n}] = P[{n}] =
18
µn ,
n ∈ N,
wird damit das Konstruktionsproblem gelöst.
Es wäre auch möglich, 19 (Ω, F, P) = ([0, 1], B([0, 1]), λ[0,1] ) zu wählen und X1
durch 20
Pn−1
Pn
(4)
X1 (ω) = n, ω ∈
k=1 µk ,
k=1 µk , n ∈ N,
zu definieren. Da
PX1 [{n}] =
21
=
22
=
23
λ[0,1] [{ω ∈ [0, 1] : X1 (ω) = n}]
Pn−1
Pn
λ[0,1] ω ∈ [0, 1] : k=1 µk ≤ ω < k=1 µk
P
Pn−1
| nk=1 µk − k=1
µk | = µn , n ∈ N,
(5)
löst auch dieser Ansatz mit der Zufallsvariablen X1 das Konstruktionsproblem.
(c) Simulation einer Folge unabhängiger 24, diskreter Zufallsvariablen
mit einer vorgegebenen Verteilung. Als Basis zur Verwendung von StatistikSoftware erzeugen Computer üblicherweise unabhängige“ Folgen von Zufallszahlen
”
x1 , x2 , . . . , die in [0, 1] gleichverteilt“ sind, d.h., mit den Zahlen x1 , x2 , . . . wird ei”
25
ne Realisierung einer Folge unabhängiger, in [0, 1] gleichverteilter Zufallsvariablen
simuliert. Genaugenommen sind diese Zahlen aber in keiner Weise unabhängig oder
zufällig, da sie durch spezielle, i. allg. rekursive Algorithmen berechnet werden und
somit völlig deterministisch sind. Nur aufgrund ihrer Komplexität scheinen sie jene
14A priori ist nicht klar, ob es zu jedem Wahrscheinlichkeitsmaß µ auch eine Zufallsvariable X
gibt, deren Verteilung PX gleich µ ist.
15X ist die Identität auf Ω = N.
16Aufgrund der Definition 2.1.B der Verteilung P einer Zufallsvariablen X.
X
17
Wegen der speziellen Definition der Zufallsvariablen X.
18
Da P = µ gewählt wird.
19
Vgl. Abschnitt 1.4.1.
20Der Funktion X sollte auch ein Wert X(ω) für ω = 1 zugewiesen werden. Da λ
1
[0,1] [{1}] = 0,
ist der genaue Wert X1 (1) allerdings irrelevant. Allgemein werden zwei auf einem Wahrscheinlichkeitsraum (Ω, F, P) definierte Zufallsvariablen X und Y als identisch betrachtet, d.h., miteinander
identifiziert, wenn
P[{ω ∈ Ω : X(ω) = Y (ω)}] = P[X = Y ] = 1.
In diesem Fall schreibt man X = Y , f.s. (fast-sicher).
21Weil die N-wertige Zufallsvariable X auf dem Wahrscheinlichkeitsraum ([0, 1], B([0, 1]),
1
λ[0,1] ) definiert ist.
22
Aufgrund von (4).
23
Da das Lebesguemaß eines Intervalls dessen Länge ist, vgl. Abschnitt 1.4.1.
24Der Begriff der Unabhängigkeit von Zufallsvariablen wird in Abschnitt 2.2.2 erläutert werden.
Zum Verständnis der nun folgenden Überlegungen sei an die mathematische Intuition appelliert.
25Eine Realisierung einer Familie X , X , . . . von Zufallsvariablen, die auf einem Wahrschein1
2
lichkeitsraum (Ω, F, P) definiert sind, ergibt sich, wenn eine Folge X1 (ω), X2 (ω), . . . für ein festes,
aber beliebiges ω ∈ Ω betrachtet wird.
7. November 2007
3
Eigenschaften zu besitzen. Sie werden daher auch als Pseudozufallszahlen bezeichnet 26.
Die Überlegungen in (5) demonstrieren, daß durch die transformierten Zufallszahlen 27 X1 (x1 ), X1 (x2 ), . . . unabhängige Zufallsvariablen mit der Verteilung µ
simuliert werden können.
Literatur
[1] C. Hesse. Angewandte Wahrscheinlichkeitstheorie. Vieweg 2003.
[2] M. Matsumoto, T. Nishimura. Mersenne twister: a 623-dimensionally equidistributed uniform
pseudo-random number generator. ACM Transactions on Modeling and Computer Simulation 8 (Special issue on uniform random number generation), 3 - 30, 1998.
26Ein bekanntes Verfahren ist die lineare Kongruenzmethode, vgl. z.B. [1], Abschnitt 10.2. Zu
vorgegebenen Parametern m ∈ N, a = 1, . . . , m − 1, c = 0, 1, . . . , m − 1 und einem Startwert
y0 = 0, 1, . . . , m − 1 betrachtet man zunächst die Folge yn , n ∈ N0 , mit
yn+1 = (ayn + c)
mod m,
n = 0, 1, 2, . . . ,
(∗)
und bildet diese anschließend mit xn = yn /m, n = 0, 1, 2, . . . , in das Intervall [0, 1] ab. Wenn m,
a, c und y0 geschickt“ gewählt werden, hat die Folge xn , n = 0, 1, 2, . . . , ein Erscheinungsbild wie
”
eine typische“ Realisierung einer Folge unabhängiger, in [0, 1] gleichverteilter Zufallsvariablen.
”
Bei einer unglücklichen Wahl der Parameter erhält man aber u.U. eine sehr regelmäßige Folge
y0 , y1 , y2 , . . . . Beispielsweise ergibt sich 5, 0, 5, 0, . . . für a = c = y0 = 5, m = 10. Allgemein
besitzt eine durch eine Relation wie (∗) bestimmte Zahlenfolge immer eine endliche Periode, die
höchstens gleich m ist.
Etliche klassische, ältere Zufallsgeneratoren basieren auf der linearen Kongruenzmethode. Oft
hat sich allerdings im Lauf der Zeit herausgestellt, daß jene oft benutzten Zufallsgeneratoren,
deren Perioden zwischen 230 und 248 liegen, eine nur geringe Qualität besitzen. Hingegen gibt es
mit dem Mersenne Twister einen modernen Zufallsgenerator, der in einer gut bewährten Variante
mit 219937 − 1 eine extrem große Mersennesche Primzahl als Periode besitzt, vgl. z.B. [2].
Auf den üblichen Computern sind Zufallsgeneratoren und auch Befehle zur Simulation von
unabhängigen Zufallsvariablen mit einer vorgegebenen Verteilung meistens verfügbar, evtl. als
Teil des Betriebssystems oder im Rahmen von Softwarepaketen wie Maple, Mathematica oder R.
Weiterhin enthalten wissenschaftliche Software-Bibliotheken, wie z.B. die GNU Scientific Library
(GSL), vgl. http://www.gnu.org/software/gsl/, derartige Software.
27
Die Funktion X1 wird in (4) definiert.
7. November 2007
Herunterladen