2.1.1. Beispiele: Diskrete Zufallsvariable und ihre Verteilung. (a) Zeitpunkt des ersten Wurfs von Zahl“ beim ∞-fachen, unabhängi” gen Münzwurf mit Erfolgswahrscheinlichkeit p ∈ (0, 1) 1. Zur Modellierung des ∞-fachen, unabhängigen Münzwurfs mit Erfolgswahrscheinlichkeit p ∈ (0, 1) wird der in Abschnitt 1.4.2 eingeführte Wahrscheinlichkeitsraum (Ω, F, P) benutzt. Insbesondere ist Ω = {0, 1}N und F = σ(Fendl ) 2. Außerdem ist das Wahrscheinlichkeitsmaß P durch (1.5) bestimmt. Zunächst sind Xk : (Ω, F, P) → ({0, 1}, Pot({0, 1})) mit 3 Xk (ω) = ωk , ω ∈ Ω, k ∈ N, Zufallsvariable. Offensichtlich modelliert für k ∈ N die Zufallsvariable Xk das Ergebnis des k-ten Wurfs der Münze 4. Durch T (ω) := inf{k ∈ N : Xk (ω) = 1}, ω ∈ Ω, wird nun eine (N, Pot(N))wertige Funktion T auf (Ω, F, P) definiert. Da {T = n} = {ω ∈ Ω : T (ω) = n} (3) = {ω ∈ Ω : X1 (ω) = · · · = Xn−1 (ω) = 0, Xn (ω) = 1} = {ω ∈ Ω : ω1 = · · · = ωn−1 = 0, ωn = 1} ∈ Fendl ⊂ F, n ∈ N, ist T eine diskrete Zufallsvariable 5. Diese Zufallsvariable modelliert den Zeitpunkt des ersten Wurfs von Zahl“. Die Verteilung PT von T ist eindeutig bestimmt durch ” P[T = n], n ∈ N 6. Weil P[T = n] = 7 P[{ω ∈ Ω : ω1 = · · · = ωn−1 = 0, ωn = 1}] = 8 (1 − p)n−1 p, n ∈ N, ist T geometrisch verteilt mit Parameter p 9. Bemerkung. Auch bei anderen beliebig oft unabhängig wiederholten, identischen Experimenten“ mit zwei möglichen Ausgängen Erfolg“, bzw. Mißerfolg“ ist der ” ” ” Zeitpunkt des ersten Erfolgs geometrisch verteilt 10. (b) Konstruktion einer diskreten Zufallsvariablen mit einer vorgegebenen Verteilung 11. Sei auf N ein Wahrscheinlichkeitsmaß 12 µ = (µn )n∈N gegeben. Gesucht ist eine N-wertige Zufallsvariable mit der Verteilung µ. Damit ist insbesondere ein Wahrscheinlichkeitsraum (Ω, F, P) und eine meßbare 13 (N, Pot(N))-wertige 1Im folgenden wird Beispiel (c) in Abschnitt 1.8 etwas ausführlicher behandelt. 2Ω ist der Raum der {0, 1}-wertigen Folgen und F die kleinste σ-Algebra, die die Menge F endl jener Ereignisse, die durch endlich viele Würfe der Münze bestimmt sind, enthält. 3Beachte, daß ω = (ω , ω , . . . ), ω ∈ Ω. X ist somit die Projektion auf die k-te Koordinate. 1 2 k 4Wenn die Familie der Zufallsvariablen X , k ∈ N, zu einem Objekt (X ) k k k∈N zusammengefaßt wird, ergibt sich ein einfaches Beispiel eines stochastischen Prozesses. Insbesondere liegt hier ein Bernoulli-Prozeß vor. Allgemein sind bei einem Bernoulli-Prozeß Y = (Yk )k∈N die Zufallsvariablen Yk , k ∈ N, unabhängig und identisch verteilt. 5Vgl. dazu Bemerkung (ii) in Abschnitt 2.1. 6Vgl. Bemerkung (iii) in Abschnitt 2.1. 7Wegen (3). 8Aufgrund von (1.5). 9Vgl. Beispiel (c) in Abschnitt 1.8. 10Der Parameter dieser geometrischen Verteilung stimmt mit der Erfolgswahrscheinlichkeit bei der einmaligen Durchführung des Experiments überein. Beispielsweise ist beim ∞-fachen, unabhängigen Wurf eines Würfels der Zeitpunkt des ersten Wurfs einer 5 geometrisch mit Parameter 1/6 verteilt. 11 Im folgenden Beispiel (c) wird gezeigt, wie die hier vorgestellten Konstruktionen eine praktische Bedeutung gewinnen können. 12Insbesondere ist µ ≥ 0, n ∈ N, und P n n∈N µn = 1. 13Auf der abzählbaren Menge N wird üblicherweise die σ-Algebra Pot(N) verwendet. 1 2 Funktion X auf (Ω, F, P) anzugeben, d.h., zu konstruieren PX [{n}] = P[X = n] = µn , 14 , so daß n ∈ N. Eine erste Möglichkeit besteht darin, zunächst Ω = N, F = Pot(N) und P = µ zu wählen und anschließend X : (Ω, F, P) → (N, Pot(N)) durch 15 X(ω) = ω, ω ∈ Ω, zu definieren. Da PX [{n}] = 16 P[{ω ∈ Ω : X(ω) = n}] = 17 P[{ω ∈ Ω : ω = n}] = P[{n}] = 18 µn , n ∈ N, wird damit das Konstruktionsproblem gelöst. Es wäre auch möglich, 19 (Ω, F, P) = ([0, 1], B([0, 1]), λ[0,1] ) zu wählen und X1 durch 20 Pn−1 Pn (4) X1 (ω) = n, ω ∈ k=1 µk , k=1 µk , n ∈ N, zu definieren. Da PX1 [{n}] = 21 = 22 = 23 λ[0,1] [{ω ∈ [0, 1] : X1 (ω) = n}] Pn−1 Pn λ[0,1] ω ∈ [0, 1] : k=1 µk ≤ ω < k=1 µk P Pn−1 | nk=1 µk − k=1 µk | = µn , n ∈ N, (5) löst auch dieser Ansatz mit der Zufallsvariablen X1 das Konstruktionsproblem. (c) Simulation einer Folge unabhängiger 24, diskreter Zufallsvariablen mit einer vorgegebenen Verteilung. Als Basis zur Verwendung von StatistikSoftware erzeugen Computer üblicherweise unabhängige“ Folgen von Zufallszahlen ” x1 , x2 , . . . , die in [0, 1] gleichverteilt“ sind, d.h., mit den Zahlen x1 , x2 , . . . wird ei” 25 ne Realisierung einer Folge unabhängiger, in [0, 1] gleichverteilter Zufallsvariablen simuliert. Genaugenommen sind diese Zahlen aber in keiner Weise unabhängig oder zufällig, da sie durch spezielle, i. allg. rekursive Algorithmen berechnet werden und somit völlig deterministisch sind. Nur aufgrund ihrer Komplexität scheinen sie jene 14A priori ist nicht klar, ob es zu jedem Wahrscheinlichkeitsmaß µ auch eine Zufallsvariable X gibt, deren Verteilung PX gleich µ ist. 15X ist die Identität auf Ω = N. 16Aufgrund der Definition 2.1.B der Verteilung P einer Zufallsvariablen X. X 17 Wegen der speziellen Definition der Zufallsvariablen X. 18 Da P = µ gewählt wird. 19 Vgl. Abschnitt 1.4.1. 20Der Funktion X sollte auch ein Wert X(ω) für ω = 1 zugewiesen werden. Da λ 1 [0,1] [{1}] = 0, ist der genaue Wert X1 (1) allerdings irrelevant. Allgemein werden zwei auf einem Wahrscheinlichkeitsraum (Ω, F, P) definierte Zufallsvariablen X und Y als identisch betrachtet, d.h., miteinander identifiziert, wenn P[{ω ∈ Ω : X(ω) = Y (ω)}] = P[X = Y ] = 1. In diesem Fall schreibt man X = Y , f.s. (fast-sicher). 21Weil die N-wertige Zufallsvariable X auf dem Wahrscheinlichkeitsraum ([0, 1], B([0, 1]), 1 λ[0,1] ) definiert ist. 22 Aufgrund von (4). 23 Da das Lebesguemaß eines Intervalls dessen Länge ist, vgl. Abschnitt 1.4.1. 24Der Begriff der Unabhängigkeit von Zufallsvariablen wird in Abschnitt 2.2.2 erläutert werden. Zum Verständnis der nun folgenden Überlegungen sei an die mathematische Intuition appelliert. 25Eine Realisierung einer Familie X , X , . . . von Zufallsvariablen, die auf einem Wahrschein1 2 lichkeitsraum (Ω, F, P) definiert sind, ergibt sich, wenn eine Folge X1 (ω), X2 (ω), . . . für ein festes, aber beliebiges ω ∈ Ω betrachtet wird. 7. November 2007 3 Eigenschaften zu besitzen. Sie werden daher auch als Pseudozufallszahlen bezeichnet 26. Die Überlegungen in (5) demonstrieren, daß durch die transformierten Zufallszahlen 27 X1 (x1 ), X1 (x2 ), . . . unabhängige Zufallsvariablen mit der Verteilung µ simuliert werden können. Literatur [1] C. Hesse. Angewandte Wahrscheinlichkeitstheorie. Vieweg 2003. [2] M. Matsumoto, T. Nishimura. Mersenne twister: a 623-dimensionally equidistributed uniform pseudo-random number generator. ACM Transactions on Modeling and Computer Simulation 8 (Special issue on uniform random number generation), 3 - 30, 1998. 26Ein bekanntes Verfahren ist die lineare Kongruenzmethode, vgl. z.B. [1], Abschnitt 10.2. Zu vorgegebenen Parametern m ∈ N, a = 1, . . . , m − 1, c = 0, 1, . . . , m − 1 und einem Startwert y0 = 0, 1, . . . , m − 1 betrachtet man zunächst die Folge yn , n ∈ N0 , mit yn+1 = (ayn + c) mod m, n = 0, 1, 2, . . . , (∗) und bildet diese anschließend mit xn = yn /m, n = 0, 1, 2, . . . , in das Intervall [0, 1] ab. Wenn m, a, c und y0 geschickt“ gewählt werden, hat die Folge xn , n = 0, 1, 2, . . . , ein Erscheinungsbild wie ” eine typische“ Realisierung einer Folge unabhängiger, in [0, 1] gleichverteilter Zufallsvariablen. ” Bei einer unglücklichen Wahl der Parameter erhält man aber u.U. eine sehr regelmäßige Folge y0 , y1 , y2 , . . . . Beispielsweise ergibt sich 5, 0, 5, 0, . . . für a = c = y0 = 5, m = 10. Allgemein besitzt eine durch eine Relation wie (∗) bestimmte Zahlenfolge immer eine endliche Periode, die höchstens gleich m ist. Etliche klassische, ältere Zufallsgeneratoren basieren auf der linearen Kongruenzmethode. Oft hat sich allerdings im Lauf der Zeit herausgestellt, daß jene oft benutzten Zufallsgeneratoren, deren Perioden zwischen 230 und 248 liegen, eine nur geringe Qualität besitzen. Hingegen gibt es mit dem Mersenne Twister einen modernen Zufallsgenerator, der in einer gut bewährten Variante mit 219937 − 1 eine extrem große Mersennesche Primzahl als Periode besitzt, vgl. z.B. [2]. Auf den üblichen Computern sind Zufallsgeneratoren und auch Befehle zur Simulation von unabhängigen Zufallsvariablen mit einer vorgegebenen Verteilung meistens verfügbar, evtl. als Teil des Betriebssystems oder im Rahmen von Softwarepaketen wie Maple, Mathematica oder R. Weiterhin enthalten wissenschaftliche Software-Bibliotheken, wie z.B. die GNU Scientific Library (GSL), vgl. http://www.gnu.org/software/gsl/, derartige Software. 27 Die Funktion X1 wird in (4) definiert. 7. November 2007