KAPITEL 17 GESETZE DER GROSSEN ZAHLEN Am Anfang der Wahrscheinlichkeitsrechnung stand der Wunsch, gewisse experimentelle Fakten zu modellieren, die man vage als empirische Gesetze des Zufalls bezeichnete und die sich in einer erstaunlichen Konstanz der Häufigkeiten von Ereignissen manifestierten, wenn man nur eine genügend grosse Anzahl von Wiederholungen eines Experiments zuliess. So hat man bereits vor sehr langer Zeit bemerkt, dass sich bei einer grossen Zahl von Wiederholungen des Werfens einer perfekten Münze die Häufigkeit des Auftretens von Zahl tatsächlich um den Wert 12 stabilisiert, den man von daher versucht war, als die Wahrscheinlichkeit für das Auftreten von Zahl anzusprechen. J. Bernoulli (Ars Conjectandi, ) war der erste, der ein Modell für dieses Phänomen entworfen hat. Er hat einen Konvergenzbegriff eingeführt, welcher dem der Konvergenz in der Wahrscheinlichkeit eng verwandt ist, und er hat gezeigt, dass die Häufigkeit des Auftretens von Zahl in diesem Modell tatsächlich gegen 12 konvergiert. Die Argumente Bernoullis waren kombinatorischer Art und sehr kompliziert. Sie wurden von Tchebychev erheblich vereinfacht und zwar dank der Ungleichung, die seinen Namen trägt und die er bei diesem Anlass eingeführt hat. Die von J. Bernoulli untersuchte Problemstellung wurde in der Folge beträchtlich ausgeweitet und führte zu den verschiedensten Versionen von Aussagen, die man unter dem Begriff Gesetze der grossen Zahlen zusammenfasst. Es sei nun (Xn ) (n ≥ 1) eine Folge von reellen und zentrierten Zufallsvariablen. Gesucht sind hinreichende Bedingungen dafür, dass die Folge der Zufallsvariablen n 1 Xk (n ≥ 1) n k=1 gemäss einem der in Kapitel 16 behandelten Konvergenzbegriffe gegen 0 konvergiert. Dabei sind nur die Konvergenz in der Wahrscheinlichkeit und die fast-sichere Konvergenz systematisch untersucht worden. Entsprechend ist die Rede von dem schwachen und dem starken Gesetz der grossen Zahlen. Definition. — Die Folge (Xn ) (n ≥ 1) genügt dem schwachenGesetz der n grossen Zahlen, wenn die Folge mit dem allgemeinen Glied n1 k=1 Xk in 270 KAPITEL 17: GESETZE DER GROSSEN ZAHLEN der Wahrscheinlichkeit gegen 0 konvergiert. Die Folge (Xn ) (n ≥ 1) genügt dem starken n Gesetz der grossen Zahlen, wenn die Folge mit dem allgemeinen 1 Glied n k=1 Xk fast-sicher gegen 0 konvergiert. 1. Das schwache Gesetz der grossen Zahlen. — Es gibt mehrere hinreichende Bedingungen, die sicherstellen, dass eine Folge (Xn ) (n ≥ 1) von Zufallsvariablen dem schwachen Gesetz der grossen Zahlen genügt. Wir geben hier einige dieser Aussagen an, wobei stets die Notation (1.1) Sn = n Xk , Yn = k=1 Sn n (n ≥ 1) verwendet wird. Theorem 1.1 (Schwaches Gesetz der grossen Zahlen in L2 für paarweise nichtkorrelierte Zufallsvariable). — Es sei (Xn ) (n ≥ 1) eine Folge von sind. Für Zufallsvariablen aus L2 , die zentriert und paarweise nichtkorreliert n 2 2 2 jedes n ≥ 1 sei Var Xn = σn < +∞. Wenn (1/n ) k=1 σk für n → ∞ gegen 0 konvergiert, so konvergiert Yn in L2 gegen 0, und damit gilt auch Yn → 0 in der Wahrscheinlichkeit. Beweis. — Da die Xn paarweise nichtkorreliert sind, gilt für jedes n ≥ 1 E[Yn2 ] n 1 1 2 = Var Yn = 2 Var Sn = 2 σk n n k=1 und somit E[Yn2 ] → 0 für n → ∞, d.h. Yn → 0 in L2 . Die Konvergenz von Yn gegen 0 in der Wahrscheinlichkeit ist nun eine unmittelbare Konsequenz der Ungleichung von Bienaymé-Tchebychev. Bemerkungen. — Die Aussage von Theorem 1.1 gilt natürlich insbesondere dann, wenn die Zufallsvariablen Xn als Gesamtheit unabhängig sind oder nur paarweise unabhängig sind. Anwendung 1.2. — Es sei (Xn ) (n ≥ 1) eine Folge von Zufallsvariablen aus L2 , die paarweise nichtkorreliert sind.Für jedes n ≥ 1 sei E[Xn ] = µn ; n die Folge mit dem allgemeinen Glied n1 k=1 µk konvergiere für n → ∞ n gegen µ und (1/n2 ) k=1 σk2 konvergiere gegen 0. Dann konvergiert die n 1 Folge ( n k=1 Xk ) in L2 gegen µ, und damit gilt Konvergenz auch in der Wahrscheinlichkeit. Beweis. — Wir wenden Theorem 1.1 auf die Folge (Xn − µn ) (n ≥ 1) von zentrierten Zufallsvariablen an und erhalten aus 1 1 1 (Xk − µk ) = Xk − µk → 0 n n n n n n k=1 k=1 k=1 1. DAS SCHWACHE GESETZ DER GROSSEN ZAHLEN 271 das gewünschte Resultat für die L2 -Konvergenz, also auch für die Konvergenz in der Wahrscheinlichkeit. Das folgende Korollar betrifft die Situation von identisch verteilten Zufallsvariablen und ist ebenfalls ein Korollar von Theorem 1.1. Theorem 1.3 (Schwaches Gesetz der grossen Zahlen in L2 für paarweise nichtkorrelierte Zufallsvariablen mit identischer Verteilung.). — Es sei (Xn ) (n ≥ 1) eine Folge von zentrierten Zufallsvariablen aus L2 , die identisch verteilt und paarweise nichtkorreliert sind. Dann gilt Yn → 0 in L2 , also Yn → 0 in der Wahrscheinlichkeit. Beweis. — Für jedes n ≥ 1 ist Var Xn = σn2 = σ 2 < +∞. Also gilt n 1 2 σ2 σ = →0 k n2 n k=1 und die Behauptung folgt aus Theorem 1.1. Bemerkung 1. — Die Aussage von Theorem 1.3 gilt natürlich insbesondere dann, wenn die Zufallsvariablen Xn als Gesamtheit unabhängig oder nur paarweise unabhängig sind. Bemerkung 2. — Die Folge mit dem allgemeinen Glied E[Yn2 ] konvergiert monoton absteigend gegen 0, denn es gilt E[Yn2 ] = σ 2 /n ↓ 0. Anwendung 1.4. — Es sei (Xn ) (n ≥ 1) eine Folge von Zufallsvariablen aus L2 , die identisch verteilt und paarweise nichtkorreliert sind; n dabei sei µ 1 der gemeinsame Erwartungswert der Xn . Dann konvergiert n k=1 Xk gegen µ in L2 , also auch in der Wahrscheinlichkeit. Beweis. — Man wendet Theorem 1.3 auf die Folge (Xn − µ) (n ≥ 1) von zentrierten Zufallsvariablen an und erhält 1 1 (Xk − µ) = Xk − µ → 0 n n n n k=1 k=1 in L2 , also auch in der Wahrscheinlichkeit. Anwendung 1.5. — Es sei (Xn ) (n ≥ 1) eine Folge von unabhängigen, identisch verteilten Zufallsvariablen mit derVerteilung pε1 + qε0 , wobei n 0 ≤ p ≤ 1, p + q = 1. Dann konvergiert n1 k=1 Xk gegen p in L2 , also auch in der Wahrscheinlichkeit. Dies ist das klassische Beispiel des Münzwurfs von Bernoulli. Wie wir gesehen haben, ist der Beweis des schwachen Gesetzes der grossen Zahlen (Theoreme 1.1 und 1.3) besonders einfach für Zufallsvariable aus der 272 KAPITEL 17: GESETZE DER GROSSEN ZAHLEN Klasse L2 . Tatsächlich kann man sich von dieser Hypothese befreien und lediglich deren Zugehörigkeit zu L1 voraussetzen, wenn man zusätzlich noch annimmt, dass sie paarweise unabhägig und identisch verteilt sind. Der Beweis des schwachen Gesetzes der grossen Zahlen ist in diesem Fall schwieriger und verwendet die Techniken des Stutzens und Zentrierens, was wir jetzt darstellen werden. Theorem 1.6 (Schwaches Gesetz der grossen Zahlen in L1 für paarweise unabhängige, identisch verteilte Zufallsvariable). — Es sei (Xn ) (n ≥ 1) eine Folge von zentrierten Zufallsvariablen aus L1 , die paarweise unabhängig und identisch verteilt sind. Mit den Bezeichnungen (1.1) gilt dann Yn → 0 in L1 , also auch Yn → 0 in der Wahrscheinlichkeit. Beweis. — Würden die Xn zu L2 gehören, so folgte die Behauptung aus Theorem 1.3, denn aus Yn → 0 im quadratischen Mittel folgt die Konvergenz auch in L1 . Die Beweisidee besteht darin, sich mit Hilfe der Techniken des Stutzens und Zentrierens auf den Fall von L2 zurückzuziehen. Das folgende technische Lemma wird dabei helfen. Lemma 1.7. — Zu jedem ε > 0 gibt es eine Borel-messbare und beschränkte Funktion f auf R derart, dass f ◦ X1 (wie X1 ) zentriert ist und X1 − f ◦ X1 1 < ε gilt. Dabei hängt f nur von der Verteilung von X1 ab. Beweis des Lemmas. a) Sei also ε > 0 vorgegeben; da X1 zu L1 gehört, kann man ein hinreichend grosses c > 0 wählen, damit für die Funktion x, für |x| ≤ c; g(x) = x I[−c,+c] = 0, sonst; folgende Gleichung gilt: |x| dµ(x) < ε. X1 − g ◦ X1 1 = {|x|>c} b) Die Funktion g leistet nicht notwendigerweise das Gewünschte, da g ◦ X1 nicht zentriert sein muss. Um die Zentrierung zu erreichen, geht man über zu der Funktion f (x) = g(x) − m, wobei m = E[g ◦ X1 ], also f (x) = x I[−c,+c] (x) − x dµ(x). [−c,+c] c) Für hinreichend grosses c erfüllt f die Anforderungen, denn nun ist f ◦ X1 nach Konstruktion zentriert und X1 − f ◦ X1 1 < ε kann man 1. DAS SCHWACHE GESETZ DER GROSSEN ZAHLEN 273 folgendermassen erreichen. Man wählt c so gross, dass X1 − g ◦ X1 1 < ε gilt, was nach a) möglich ist. Da X1 zentriert ist, gilt |m| = |E[X1 ] − m| = |E[X1 ] − E[g ◦ X1 ]| ≤ X1 − g ◦ X1 1 < ε und somit schliesslich X1 − f ◦ X1 1 ≤ X1 − g ◦ X1 1 + |m| < 2ε. Nun können wir den Beweis von Theorem 1.6 angehen. Es sei Xn = f ◦ Xn , Sn = X1 + · · · + Xn und Yn = Sn /n. Die Zufallsvariablen Xn sind zentriert, paarweise unabhängig und identisch verteilt. Als beschränkte Variablen gehören sie zu L2 . Somit folgt aus Theorem 1.3 Yn → 0 in L2 und somit auch in L1 . Andererseits gilt 1 ≤ Xk − Xk 1 . n n Yn − Yn 1 k=1 Aber für k = 1, . . . , n hängt der Ausdruck Xk − Xk 1 nur von der gemeinsamen Verteilung der Xn ab; alle diese Glieder sind also gleich und es folgt Yn − Yn 1 ≤ X1 − X1 1 < ε. Schliesslich gilt Yn 1 ≤ Yn − Yn 1 + Yn 1 , grosses n gilt. Die Folge mit dem so dass Yn 1 < 2ε für hinreichend allgemeinen Glied Yn 1 = E |Yn | konvergiert also für n → ∞ gegen 0. Bemerkung 1. — Die Aussage von Theorem 1.6 gilt natürlich auch dann, wenn die Zufallsvariablen Xn unabhängig sind. Bemerkung 2. — In dem Fall, dass die Variablen Xn unabhängig sind, konvergiert die Folge mit dem allgemeinen Glied E |Yn | = Yn 1 monoton absteigend gegen 0. Diese Bemerkung kann man folgendermassen einsehen. Wegen Yn−1 = n Xn Yn − n−1 n−1 ist E[Yn−1 | Yn ] = n 1 Yn − E[Xn | Yn ]. n−1 n−1 Andererseits ist E[X1 | Yn ] = · · · = E[Xn | Yn ], da die Zufallsvariablen X1 , . . . , Xn unabhängig und identisch verteilt sind. Somit hat man Yn = E[Yn | Yn ] = 1 E[X1 | Yn ] + · · · + E[Xn | Yn ] = E[Xn | Yn ], n 274 KAPITEL 17: GESETZE DER GROSSEN ZAHLEN und damit folgt E[Yn−1 | Yn ] = sowie n 1 Yn − Yn = Yn n−1 n−1 |Yn | ≤ E |Yn−1 | | Yn . Nimmt man nun von beiden Seiten den Erwartungswert, so folgt E |Yn | ≤ E |Yn−1 | . 2. Das starke Gesetz der grossen Zahlen. — Wir beginnen diesen Abschnitt mit einer Version des starken Gesetzes der grossen Zahlen für Zufallsvariable aus L2 . (Einen Beweis findet man in dem Buch von FourgeaudFuchs (op. cit.).) Theorem 2.1 (Starkes Gesetz der grossen Zahlen für Zufallsvariable aus L ). — Es sei (Xn ) (n ≥ 1) eine Folge von zentrierten und unabhängigen Zufallsvariablen aus L2 . Für n ≥ 1 sei Var Xn = σn2 < +∞ und, wie vorher, 2 (2.1) Sn = n k=1 Wenn die Reihe n≥1 Xk , Yn = Sn n (n ≥ 1). σn2 /n2 konvergiert, so gilt Yn → 0 fast-sicher. Theorem 2.2 (Rajchman). — Es sei (Xn ) (n ≥ 1) eine Folge von zentrierten und unabhängigen Zufallsvariablen aus L2 . Für n ≥ 1 sei Var Xn = σn2 ; weiter werden die Bezeichnungen wie oben in (2.1) verwendet. Ist supn σn2 < +∞, so gilt a) Yn → 0 fast-sicher; b) Yn → 0 in L2 . Beweis. 1 σn2 2 ≤ σ < ∞ und a) Es sei σ 2 = supn σn2 < +∞; dann gilt 2 2 n≥1 n n≥1 n damit Yn → 0 fast-sicher gemäss Theorem 2.1. n 1 σ2 2 2 → 0 und daher Yn → 0 in σ ≤ b) Es gilt E[Yn ] = Var Yn = 2 n k=1 k n L2 gemäss Theorem 1.1. Bemerkung 1. — Rajchman hat die entsprechenden Aussagen auch für den Fall gezeigt, bei dem unabhängig durch paarweise nichtkorreliert ersetzt wird. Bemerkung 2. — Man kann also in der Aussage des Satzes von Bernoulli die Konvergenz in der Wahrscheinlichkeit durch die fast-sichere Konvergenz ersetzen (E. Borel). 275 2. DAS STARKE GESETZ DER GROSSEN ZAHLEN Theorem 2.3 (Starkes Gesetz der grossen Zahlen für Zufallsvariable aus L (Kolmogorov)). — Es sei (Xn ) (n ≥ 1) eine Folge von zentrierten, unabhängigen und identisch verteilten Zufallsvariablen aus L1 . Mit den Bezeichnungen wie oben in (2.1) gilt dann Yn → 0 fast-sicher. Beweis (L. Pratelli, unveröffentlicht). 1 f.s. a) Gemäss Theorem 4.2 aus Kapitel 16 ist die Aussage Yn −→ 0 äquivalent zu der Feststellung (m → ∞). für jedes ε > 0 gilt P sup |Yk | > ε −→ 0 k≥m b) Folgendes Lemma wird benötigt: Lemma 2.4. — Für jedes m ≥ 1 und jedes ε > 0 gilt ε P sup |Yk | > ε ≤ Ym 1 , k≥m d.h. aus Ym → 0 in L1 folgt Ym → 0 fast-sicher. c) Die Behauptung des Theorems folgt nun aus a) und b) und Theorem 1.6 (schwaches Gesetz der grossen Zahlen in L1 ). Beweis des Lemmas. — Man beweist die folgende, zum Lemma äquivalente Aussage: Für jedes Paar (m, n) von ganzen Zahlen mit 1 ≤ m ≤ n und jedes ε > 0 gilt ε P sup |Yk | > ε ≤ Ym 1 . m≤k≤n Wir betrachten die Menge Tn = sup{k : 1 ≤ k ≤ n, |Yk | > ε } (mit der Konvention sup ∅ = −∞) und setzen A = {supm≤k≤n |Yk | > ε }. Dann ist A = {Tn ≥ m} = {Tn = k} und ε P(A) = ε m≤k≤n P{Tn = k}. m≤k≤n Nach Definition der Tn gilt aber für jedes k mit m ≤ k ≤ n die Abschätzung εP{Tn = k} ≤ |Yk | dP = Yk dP + (−Yk ) dP {Tn =k} {Tn =k, Yk >0} {Tn =k, Yk <0} = B + C. Wir werden B und C getrennt berechnen. Zunächst ist k 1 B= Xj dP. k j=1 {Tn =k, Yk >0} 276 KAPITEL 17: GESETZE DER GROSSEN ZAHLEN Da nun aber die Xn unabhängig und identisch verteilt sind, haben alle Integrale auf der rechten Seite den gleichen Wert. Die rechte Seite ist also auch gleich dem arithmetischen Mittel von k Zahlen, die ihrerseits alle gleich dem Wert des Integrals {Tn =k, Yk >0} X1 dP sind. Sie ist dann aber auch gleich dem arithmetischen Mittel von m (≤ k) Zahlen mit eben diesem Wert. Folglich kann man m 1 X1 dP = Ym dP B= m j=1 {Tn =k, Yk >0} {Tn =k, Yk >0} schreiben. Ganz entsprechend geht man für C vor und erhält (−Ym ) dP. C= {Tn =k, Yk <0} Zusammenfassend erhält man εP{Tn = k} ≤ B + C = und durch Summation über k εP(A) ≤ m≤k≤n {Tn =k} {Tn =k} |Ym | dP , |Ym | dP ≤ E[ |Ym | ] = Ym 1 . Korollar 2.5. — Es sei (Xn ) (n ≥ 1) eine Folge von unabhängigen und identisch verteilten Zufallsvariablen aus L1 . Dann gilt 1 f.s. Xk −→ E[X1 ]. Yn = n n k=1 Dieses Korollar hat eine Umkehrung; cf. Aufgabe 3. 3. Die Lemmata von Borel-Cantelli Lemma 3.1 (Borel-Cantelli). — Es sei (An ) (n ≥ 1) eine Folge von Ereignissen,und es bezeichne A∗ den Limes lim supn An . ∗ a) Ist n≥1 P(An ) < +∞, so ist P(A ) = 0, d.h. mit Wahrscheinlichkeit 1 treten nur endlich viele der Ereignisse An ein. b) Seien nun die Ereignisse An paarweise unabhängig. ∗ Ist n≥1 P(An ) = +∞, so ist P(A ) = 1, d.h. mit Wahrscheinlichkeit 1 treten unendlich viele der Ereignisse An ein. Beweis. a) Es ist A∗ = n≥1 k≥n Ak , also gilt für jedes n ≥ 1 Ak ) ≤ P(Ak ). P(A∗ ) ≤ P( k≥n k≥n Nun ist der rechte Ausdruck der Rest der Ordnung n einer konvergenten Reihe, er muss also für n → ∞ gegen 0 gehen. Daher gilt P(A∗ ) = 0. 277 3. DIE LEMMATA VON BOREL-CANTELLI b) Wir setzen Sn = IA1 + · · · + IAn . Dann gilt nach Voraussetzung E[Sn ] = n E[IAk ] = k=1 n P(Ak ) ↑ +∞. k=1 Da die An paarweise unabhängig sind, hat man aber auch n n n 2 Var IAk ≤ E[IAk ] = E[IAk ] = E[Sn ]. Var Sn = k=1 k=1 k=1 Setzt man nun Tn = Sn /E[Sn ], so erhält man Var Sn 1 , E[(Tn − 1)2 ] = Var Tn = ≤ 2 (E[Sn ]) E[Sn ] und dies konvergiert für n → ∞ gegen 0. Damit wurde Tn − 1 → 0 in L2 gezeigt, dies, ebenso wie Tn → 1, gilt dann auch in der Wahrscheinlichkeit. für Man kann somit aus der Folge (Tn ) eine Teilfolge (Tnk ) herausziehen, die Tnk → 1 fast-sicher für k → ∞ gilt. Da die Voraussetzung n≥1 P(An ) = +∞ zu E[Snk ] ↑ ∞ für k → ∞ äquivalent ist, folgt Snk ↑ ∞ für k → ∞ fastsicher, und diese Aussage ist schliesslich äquivalent zu P(A∗ ) = 1. Bemerkung. — Die Umkehrung der Aussage a) gilt nicht. Um dies einzusehen, nehme man den Wahrscheinlichkeitsraum (Ω, A, P) mit Ω = [0, 1], mit der Borel-σ-Algebra von [0, 1] als A und dem Lebesgue-Mass auf [0, 1] als P. Betrachtet man nun die Folge von Ereignissen(An = [0, 1/n]) An = {0} und (n ≥ 1), so ist diese Folge monoton-absteigend, also A∗ = n≥1 P(A∗ ) = 0. Es ist aber n≥1 P(An ) = 1 = +∞. n n≥1 Die Voraussetzung der Unabhängigkeit in b) ist also wesentlich. Anwendung. — Wir betrachten eine unabhängige Folge von Münzwürfen, wobei die Wahrscheinlichkeit des Auftretens von Zahl in einem Wurf gleich p (0 < p < 1) sei. Nun sei A ein Wort der Länge l ≥ 1, d.h. eine Folge von l Symbolen, von denen jedes entweder Zahl oder Kopf bedeutet. Weiter bezeichne A1 das Ereignis, dass das Wort A in den ersten l Würfen realisiert wird, A2 das Ereignis, dass A in den folgenden l Würfen realisiert sind unabhängig und für jedes n ≥ 1 wird, etc. Die Ereignisse A1 , A2 , . . . gilt P(An ) = P(A1 ) > 0, somit ist n≥1 P(An ) = +∞. Aus Teil b) des Lemmas folgt nun, dass mit Wahrscheinlichkeit 1 das Wort A unendlich oft im Verlauf des Spiels auftritt. Ein analoges Argument zeigt, dass ein Affe, der zufällig auf einer Schreibmaschine tippt, mit Wahrscheinlichkeit 1 jeden 278 KAPITEL 17: GESETZE DER GROSSEN ZAHLEN Text beliebiger endlicher Länge im Verlauf von unendlich vielen Anschlägen einmal schreibt.1 Das Lemma von Borel-Cantelli hat folgende Konsequenz. Theorem 3.2 ((0, 1)-Gesetz von E. Borel). — Es sei (An ) (n ≥ 1) eine Folge von paarweise unabhängigen Ereignissen und A∗ bezeichne das Ereignis lim supn An . Dann kann P(A∗ ) nur die Werte 0 oder 1 annehmen, und zwar je nachdem, ob die Reihe mit dem allgemeinen Glied P(An ) konvergiert oder divergiert. Dieses Theorem ist ein erstes Beispiel für das berühmte (0, 1)-Gesetz von Kolmogorov, welches besagt, dass gewisse terminale Ereignisse nur mit Wahrscheinlichkeit 0 oder 1 auftreten können. Als Anwendung dieses Theorems werden wir nun zeigen, dass für eine Folge (Xn ) (n ≥ 1) von unabhängigen Zufallsvariablen, für welche die Folge n Xk fast-sicher gegen einen Limes Y konvergiert, (Yn ) (n ≥ 1) mit Yn = n1 k=1 dieser Limes fast-sicher konstant sein muss. Um dies zu sehen, stellen wir zunächst fest, dass das System (X1 , . . . , Xk ) für jedes k ≥ 1 unabhängig von Y = limn (X1 + · · · + Xn )/n = limn (Xk+1 + · · · + Xk+n )/n ist, und somit auch Yk unabhängig von Y . Für jedes reelle x ist also das Ereignis {Yk ≤ x} unabhängig von dem Ereignis {Y ≤ x}. (Das Ereignis {Y ≤ x} ist ein typisches terminales Ereignis.) Somit gilt P({Yk ≤ x} ∩ {Y ≤ x}) = P{Yk ≤ x}P{Y ≤ x} für jedes reelle x. Lässt man nun k gegen unendlich gehen, so folgt daraus P{Y ≤ x} = (P{Y ≤ x})2 ; dann kann aber für jedes x nur P{Y ≤ x} = 0 oder 1 gelten. Da die Abbildung x → P{Y ≤ x} eine Verteilungsfunktion ist, muss sie notwendigerweise eine Stufe der Höhe 1 sein. Also ist Y = konstant. ERGÄNZUNGEN UND ÜBUNGEN 1. — Es sei (Xn ) (n ≥ 1) eine Folge von unabhängigen und identisch verteilten Zufallsvariablen aus L2 . Dabei sei m = E[X1 ] und σ 2 = Var X1 . Für jedes n ≥ 2 werden die folgenden Zufallsvariablen definiert: 1 Xk , Yn = n n k=1 1 1 Zn = (Xk − Yn )2 . n−1 n k=1 Borel (Émile). — Le hasard. — Paris, Librairie Félix Alcan, . ERGÄNZUNGEN UND ÜBUNGEN 279 a) Man berechne E[Zn ]. f.s. b) Man zeige Zn −→ σ 2 für n → ∞. 2. — Es sollen nun die Voraussetzungen von Theorem 1.6 gelten, wobei die Zufallsvariablen Xn als Gesamtheit unabhängig, und nicht etwa nur paarweise unabhängig seien. Man zeige auf direktem Weg, und zwar unter Verwendung p von charakteristischen Funktionen, dass Yn −→ 0 gilt. 3. — Es sei (Xn ) (n ≥ 1) eine Folge von unabhängigen und identisch n f.s. verteilten Zufallsvariablen. Dabei gelte Yn = (1/n) Xk −→ Y . k=1 Man beweise die folgenden Aussagen: P{|Xn | ≥ n} < +∞; a) n≥1 b) die Xn sind integrierbar; c) Y ist fast-sicher konstant. 4. — Es sei (Xn ) (n ≥ 1) eine Folge von Zufallsvariablen und Sn = √ L p X1 + · · · + Xn . Man zeige, dass aus Sn / n −→ Y dann Sn /n −→ 0 folgt, d.h. die Folge (Xn ) (n ≥ 1) genügt dem schwachen Gesetz der grossen Zahlen. 5. — Das Modell des Münzwurfs von Bernoulli kann dazu verwendet werden, um einen bemerkenswerten Beweis des Approximationssatzes von Weierstrass zu liefern. Dieser Satz sagt aus, dass eine auf einem beschränkten Intervall stetige Funktion dort von Polynomen gleichmässig approximiert werden kann. Dieser Beweis stammt von Bernstein. Es sei (Xn ) (n ≥ 1) eine Folge von unabhängigen und mittels pε1 + qε0 (0 ≤ p ≤ 1, p + q = 1) identisch verteilten Zufallsvariablen. Man setzt n p wieder Yn = (1/n) Xk ; der Satz von Bernoulli besagt Yn −→ p. Sei nun k=1 h : [0, 1] → R eine stetige und somit beschränkte Funktion. Wir zeigen E[h ◦ Yn ] → h(p) (n → ∞), wobei dies gleichmässig für p ∈ [0, 1] gilt. Beweis. — Bezeichnet µ die Verteilung von Yn , so gilt für jedes δ > 0 A= |E[h ◦ Yn − h(p)]| ≤ E[ |h ◦ Yn − h(p)| ] = A + B, wobei |h(x) − h(p)| dµ(x) und B = |h(x) − h(p)| dµ(x). {|x−p|≤δ} {|x−p|>δ} Als stetige Funktion auf [0, 1] ist h sogar gleichmässig stetig. Zu jedem ε > 0 gibt es also ein δ(ε) > 0 derart, dass |x − p| ≤ δ die Abschätzung |h(x) − h(p)| < ε impliziert. Damit ist A < ε. Halten wir nun ε, und damit auch δ fest. Es sei M eine obere Schranke für |h| auf [0, 1]. Dann gilt B ≤ 2M {|x−p|>δ} dµ(x) = 2M P{|Yn − p| > δ}, 280 KAPITEL 17: GESETZE DER GROSSEN ZAHLEN und dies wird gemäss der Ungleichung von Bienaymé-Tchebychev majorisiert durch 2M Var Yn /δ 2 ≤ 2M pq/(nδ 2 ) ≤ 2M/(nδ 2 ). Die rechte Seite ist aber von p unabhängig und strebt für n → ∞ gegen 0. Dies gilt also auch für B, und zwar gleichmässig in p. Folglich konvergiert E[h ◦ Yn ] für n → ∞ gleichmässig in p gegen h(p). Wegen Yn = Sn /n und L(Sn ) = B(n, p) gilt aber E[h ◦ Yn ] = n k=0 n k h(k/n) p (1 − p)n−k , k und dieser Ausdruck konvergiert gleichmässig für p ∈ [0, 1] gegen h(p). Dies ist gerade die Aussage des Satzes von Weierstrass, wobei die Polynome sogar noch explizit angegeben werden. Man nennt sie auch Bernstein-Polynome. 6. — Wir betrachten nun die Kugel Bn (0, R) im Rn (n ≥ 1) mit Mittelpunkt 0 und Radius R ≥ 0. Ihr Volumen ist Vn (R) = π n/2 Rn /Γ(1 + n/2) (cf. Aufgabe 12, Kap. 14). Wir projizieren dieses Volumen auf eine der Achsen, etwa die x-Achse; man erhält eine Massenverteilung auf R, die eine Dichte gn (x, R) besitzt. Mittels geeigneter Normierung wird daraus eine Wahrscheinlichkeitsdichte fn (x, R) = gn (x, R)/Vn (R). Wählt man nun √ erstaunlicherweise fest, dass die Folge der WahrscheinR = n, so stellt man√ lichkeitsdichten fn (x, n) für n → ∞ punktweise gegen die Dichte der Normalverteilung N (0, 1) konvergiert. Anders gesagt, für jedes reelle x gilt √ 2 1 fn (x, n ) → √ e−x /2 2π (n → ∞). 7. — Es sei (un ) (n ≥ 1) eine Folge von reellen Zahlen mit 0 < un ≤ 1 für jedes n ≥ 1. Weiter sei (Xn ) (n ≥ 1) eine Folge von unabhängigen Zufallsvariablen, wobei Xn für jedes n ≥ 1 die Verteilung un ε1/un +(1−un )ε0 hat. Dann gilt: 1) Für jedes n ≥ 1 ist E[Xn ] = 1. p 2) Xn −→ 0 genau dann, wenn un → 0. f.s. un < +∞. 3) Xn −→ 0 genau dann, wenn n≥1 Man beachte: für eine Folge (un ) (n ≥ 1) mit der Eigenschaft, dass die Reihe X1 + · · · + Xn f.s. −→ 0 aus mit dem allgemeinen Glied un konvergiert, folgt n dem Resultat 3) und dem Satz von Césaro, obwohl man E[Xn ] = 1 für alle n ≥ 1 hat. http://www.springer.com/978-3-7643-6169-3