2.1.1. Beispiele: Diskrete Zufallsvariable und ihre Verteilung

2.1.1. Beispiele: Diskrete Zufallsvariable und ihre Verteilung.
(a) Zeitpunkt des ersten Wurfs von Zahl“ beim ∞-fachen, unabhängi”
gen Münzwurf mit Erfolgswahrscheinlichkeit p ∈ (0, 1) 1. Zur Modellierung
des ∞-fachen, unabhängigen Münzwurfs mit Erfolgswahrscheinlichkeit p ∈ (0, 1)
wird der in Abschnitt 1.4.2 eingeführte Wahrscheinlichkeitsraum (Ω, F, P) benutzt.
Insbesondere ist Ω = {0, 1}N und F = σ(Fendl ) 2. Außerdem ist das Wahrscheinlichkeitsmaß P durch (1.5) bestimmt.
Zunächst sind Xk : (Ω, F, P) → ({0, 1}, Pot({0, 1})) mit 3 Xk (ω) = ωk , ω ∈ Ω,
k ∈ N, Zufallsvariable. Offensichtlich modelliert für k ∈ N die Zufallsvariable Xk
das Ergebnis des k-ten Wurfs der Münze 4.
Durch T (ω) := inf{k ∈ N : Xk (ω) = 1}, ω ∈ Ω, wird nun eine (N, Pot(N))wertige Funktion T auf (Ω, F, P) definiert. Da
{T = n} = {ω ∈ Ω : T (ω) = n}
(3)
= {ω ∈ Ω : X1 (ω) = · · · = Xn−1 (ω) = 0, Xn (ω) = 1}
= {ω ∈ Ω : ω1 = · · · = ωn−1 = 0, ωn = 1} ∈ Fendl ⊂ F,
n ∈ N,
ist T eine diskrete Zufallsvariable 5. Diese Zufallsvariable modelliert den Zeitpunkt
des ersten Wurfs von Zahl“. Die Verteilung PT von T ist eindeutig bestimmt durch
”
P[T = n], n ∈ N 6. Weil
P[T = n] =
7
P[{ω ∈ Ω : ω1 = · · · = ωn−1 = 0, ωn = 1}]
=
8
(1 − p)n−1 p,
n ∈ N,
ist T geometrisch verteilt mit Parameter p 9.
Bemerkung. Auch bei anderen beliebig oft unabhängig wiederholten, identischen
Experimenten“ mit zwei möglichen Ausgängen Erfolg“, bzw. Mißerfolg“ ist der
”
”
”
Zeitpunkt des ersten Erfolgs geometrisch verteilt 10.
(b) Konstruktion einer diskreten Zufallsvariablen mit einer vorgegebenen Verteilung 11. Sei auf N ein Wahrscheinlichkeitsmaß 12 µ = (µn )n∈N gegeben.
Gesucht ist eine N-wertige Zufallsvariable mit der Verteilung µ. Damit ist insbesondere ein Wahrscheinlichkeitsraum (Ω, F, P) und eine meßbare 13 (N, Pot(N))-wertige
1Im folgenden wird Beispiel (c) in Abschnitt 1.8 etwas ausführlicher behandelt.
2Ω ist der Raum der {0, 1}-wertigen Folgen und F die kleinste σ-Algebra, die die Menge F
endl
jener Ereignisse, die durch endlich viele Würfe der Münze bestimmt sind, enthält.
3Beachte, daß ω = (ω , ω , . . . ), ω ∈ Ω. X ist somit die Projektion auf die k-te Koordinate.
1
2
k
4Wenn die Familie der Zufallsvariablen X , k ∈ N, zu einem Objekt (X )
k
k k∈N zusammengefaßt
wird, ergibt sich ein einfaches Beispiel eines stochastischen Prozesses. Insbesondere liegt hier ein
Bernoulli-Prozeß vor. Allgemein sind bei einem Bernoulli-Prozeß Y = (Yk )k∈N die Zufallsvariablen Yk , k ∈ N, unabhängig und identisch verteilt.
5Vgl. dazu Bemerkung (ii) in Abschnitt 2.1.
6Vgl. Bemerkung (iii) in Abschnitt 2.1.
7Wegen (3).
8Aufgrund von (1.5).
9Vgl. Beispiel (c) in Abschnitt 1.8.
10Der Parameter dieser geometrischen Verteilung stimmt mit der Erfolgswahrscheinlichkeit
bei der einmaligen Durchführung des Experiments überein. Beispielsweise ist beim ∞-fachen, unabhängigen Wurf eines Würfels der Zeitpunkt des ersten Wurfs einer 5 geometrisch mit Parameter
1/6 verteilt.
11
Im folgenden Beispiel (c) wird gezeigt, wie die hier vorgestellten Konstruktionen eine praktische Bedeutung gewinnen können.
12Insbesondere ist µ ≥ 0, n ∈ N, und P
n
n∈N µn = 1.
13Auf der abzählbaren Menge N wird üblicherweise die σ-Algebra Pot(N) verwendet.
1
2
Funktion X auf (Ω, F, P) anzugeben, d.h., zu konstruieren
PX [{n}] = P[X = n] = µn ,
14
, so daß
n ∈ N.
Eine erste Möglichkeit besteht darin, zunächst Ω = N, F = Pot(N) und P = µ zu
wählen und anschließend X : (Ω, F, P) → (N, Pot(N)) durch 15 X(ω) = ω, ω ∈ Ω,
zu definieren. Da
PX [{n}] =
16
P[{ω ∈ Ω : X(ω) = n}]
=
17
P[{ω ∈ Ω : ω = n}] = P[{n}] =
18
µn ,
n ∈ N,
wird damit das Konstruktionsproblem gelöst.
Es wäre auch möglich, 19 (Ω, F, P) = ([0, 1], B([0, 1]), λ[0,1] ) zu wählen und X1
durch 20
Pn−1
Pn
(4)
X1 (ω) = n, ω ∈
k=1 µk ,
k=1 µk , n ∈ N,
zu definieren. Da
PX1 [{n}] =
21
=
22
=
23
λ[0,1] [{ω ∈ [0, 1] : X1 (ω) = n}]
Pn−1
Pn
λ[0,1] ω ∈ [0, 1] : k=1 µk ≤ ω < k=1 µk
P
Pn−1
| nk=1 µk − k=1
µk | = µn , n ∈ N,
(5)
löst auch dieser Ansatz mit der Zufallsvariablen X1 das Konstruktionsproblem.
(c) Simulation einer Folge unabhängiger 24, diskreter Zufallsvariablen
mit einer vorgegebenen Verteilung. Als Basis zur Verwendung von StatistikSoftware erzeugen Computer üblicherweise unabhängige“ Folgen von Zufallszahlen
”
x1 , x2 , . . . , die in [0, 1] gleichverteilt“ sind, d.h., mit den Zahlen x1 , x2 , . . . wird ei”
25
ne Realisierung einer Folge unabhängiger, in [0, 1] gleichverteilter Zufallsvariablen
simuliert. Genaugenommen sind diese Zahlen aber in keiner Weise unabhängig oder
zufällig, da sie durch spezielle, i. allg. rekursive Algorithmen berechnet werden und
somit völlig deterministisch sind. Nur aufgrund ihrer Komplexität scheinen sie jene
14A priori ist nicht klar, ob es zu jedem Wahrscheinlichkeitsmaß µ auch eine Zufallsvariable X
gibt, deren Verteilung PX gleich µ ist.
15X ist die Identität auf Ω = N.
16Aufgrund der Definition 2.1.B der Verteilung P einer Zufallsvariablen X.
X
17
Wegen der speziellen Definition der Zufallsvariablen X.
18
Da P = µ gewählt wird.
19
Vgl. Abschnitt 1.4.1.
20Der Funktion X sollte auch ein Wert X(ω) für ω = 1 zugewiesen werden. Da λ
1
[0,1] [{1}] = 0,
ist der genaue Wert X1 (1) allerdings irrelevant. Allgemein werden zwei auf einem Wahrscheinlichkeitsraum (Ω, F, P) definierte Zufallsvariablen X und Y als identisch betrachtet, d.h., miteinander
identifiziert, wenn
P[{ω ∈ Ω : X(ω) = Y (ω)}] = P[X = Y ] = 1.
In diesem Fall schreibt man X = Y , f.s. (fast-sicher).
21Weil die N-wertige Zufallsvariable X auf dem Wahrscheinlichkeitsraum ([0, 1], B([0, 1]),
1
λ[0,1] ) definiert ist.
22
Aufgrund von (4).
23
Da das Lebesguemaß eines Intervalls dessen Länge ist, vgl. Abschnitt 1.4.1.
24Der Begriff der Unabhängigkeit von Zufallsvariablen wird in Abschnitt 2.2.2 erläutert werden.
Zum Verständnis der nun folgenden Überlegungen sei an die mathematische Intuition appelliert.
25Eine Realisierung einer Familie X , X , . . . von Zufallsvariablen, die auf einem Wahrschein1
2
lichkeitsraum (Ω, F, P) definiert sind, ergibt sich, wenn eine Folge X1 (ω), X2 (ω), . . . für ein festes,
aber beliebiges ω ∈ Ω betrachtet wird.
7. November 2007
3
Eigenschaften zu besitzen. Sie werden daher auch als Pseudozufallszahlen bezeichnet 26.
Die Überlegungen in (5) demonstrieren, daß durch die transformierten Zufallszahlen 27 X1 (x1 ), X1 (x2 ), . . . unabhängige Zufallsvariablen mit der Verteilung µ
simuliert werden können.
Literatur
[1] C. Hesse. Angewandte Wahrscheinlichkeitstheorie. Vieweg 2003.
[2] M. Matsumoto, T. Nishimura. Mersenne twister: a 623-dimensionally equidistributed uniform
pseudo-random number generator. ACM Transactions on Modeling and Computer Simulation 8 (Special issue on uniform random number generation), 3 - 30, 1998.
26Ein bekanntes Verfahren ist die lineare Kongruenzmethode, vgl. z.B. [1], Abschnitt 10.2. Zu
vorgegebenen Parametern m ∈ N, a = 1, . . . , m − 1, c = 0, 1, . . . , m − 1 und einem Startwert
y0 = 0, 1, . . . , m − 1 betrachtet man zunächst die Folge yn , n ∈ N0 , mit
yn+1 = (ayn + c)
mod m,
n = 0, 1, 2, . . . ,
(∗)
und bildet diese anschließend mit xn = yn /m, n = 0, 1, 2, . . . , in das Intervall [0, 1] ab. Wenn m,
a, c und y0 geschickt“ gewählt werden, hat die Folge xn , n = 0, 1, 2, . . . , ein Erscheinungsbild wie
”
eine typische“ Realisierung einer Folge unabhängiger, in [0, 1] gleichverteilter Zufallsvariablen.
”
Bei einer unglücklichen Wahl der Parameter erhält man aber u.U. eine sehr regelmäßige Folge
y0 , y1 , y2 , . . . . Beispielsweise ergibt sich 5, 0, 5, 0, . . . für a = c = y0 = 5, m = 10. Allgemein
besitzt eine durch eine Relation wie (∗) bestimmte Zahlenfolge immer eine endliche Periode, die
höchstens gleich m ist.
Etliche klassische, ältere Zufallsgeneratoren basieren auf der linearen Kongruenzmethode. Oft
hat sich allerdings im Lauf der Zeit herausgestellt, daß jene oft benutzten Zufallsgeneratoren,
deren Perioden zwischen 230 und 248 liegen, eine nur geringe Qualität besitzen. Hingegen gibt es
mit dem Mersenne Twister einen modernen Zufallsgenerator, der in einer gut bewährten Variante
mit 219937 − 1 eine extrem große Mersennesche Primzahl als Periode besitzt, vgl. z.B. [2].
Auf den üblichen Computern sind Zufallsgeneratoren und auch Befehle zur Simulation von
unabhängigen Zufallsvariablen mit einer vorgegebenen Verteilung meistens verfügbar, evtl. als
Teil des Betriebssystems oder im Rahmen von Softwarepaketen wie Maple, Mathematica oder R.
Weiterhin enthalten wissenschaftliche Software-Bibliotheken, wie z.B. die GNU Scientific Library
(GSL), vgl. http://www.gnu.org/software/gsl/, derartige Software.
27
Die Funktion X1 wird in (4) definiert.
7. November 2007