W Norbert Kusolitsch Maß- und Wahrscheinlichkeitstheorie Eine Einführung SpringerWienNewYork Ao. Univ.-Prof. Norbert Kusolitsch Institut für Statistik und Wahrscheinlichkeitstheorie, Technische Universität Wien, Österreich Das Werk ist urheberrechtlich geschützt. Die dadurch begründeten Rechte, insbesondere die der Übersetzung, des Nachdruckes, der Entnahme von Abbildungen, der Funksendung, der Wiedergabe auf photomechanischem oder ähnlichem Wege und der Speicherung in Datenverarbeitungsanlagen, bleiben, auch bei nur auszugsweiser Verwertung, vorbehalten. Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Buch berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten wären und daher von jedermann benutzt werden dürfen. Produkthaftung: Sämtliche Angaben in diesem Fachbuch/wissenschaftlichen Werk erfolgen trotz sorgfältiger Bearbeitung und Kontrolle ohne Gewähr. Eine Haftung des Autors oder des Verlages aus dem Inhalt dieses Werkes ist ausgeschlossen. © 2011 Springer-Verlag/Wien Printed in Germany SpringerWienNewYork ist ein Unternehmen von Springer Science + Business Media springer.at Satz/Layout: Reproduktionsfertige Vorlage des Autors Druck: Strauss GmbH, 69509 Mörlenbach, Deutschland Gedruckt auf säurefreiem, chlorfrei gebleichtem Papier SPIN 80034812 Mit 20 Abbildungen Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar. ISBN 978-3-7091-0684-6 SpringerWienNewYork Tibor Nemetz zum Gedenken Vorwort Dieses Buch ist aus Vorlesungen über „Maß- und Wahrscheinlichkeitstheorie“ entstanden, die ich in den letzten Jahren an der TU Wien für drittsemestrige Studenten mit grundlegenden Kenntnissen aus Analysis im Anschluss an eine elementare Einführung in die Wahrscheinlichkeitsrechnung gehalten habe. Es ist daher empfehlenswert, wenn der Leser ein entsprechendes Wissen mitbringt, aber, um auch für das Selbststudium geeignet zu sein, ist das Buch so konzipiert, dass es für sich alleine gelesen werden kann (die dafür notwendigen Begriffe und Resultate sind im Anhang zusammengestellt). Es sei betont, dass es sich um ein Lehrbuch handelt, das sich an einen Leserkreis wendet, der sich einen ersten Überblick über die wesentlichsten Themen und Problemstellungen der Maß- und Integrationstheorie, sowie der auf maßtheoretischen Konzepten aufbauenden Wahrscheinlichkeitstheorie verschaffen möchte. Keinesfalls ist es für Experten gedacht, die nach einer umfassenden Darstellung mit Verweisen auf die Originalliteratur suchen, oder die sich einen Überblick über die neuesten Entwicklungen verschaffen möchten. Diejenigen Leserinnen und Leser, denen dieses Buch als Einstiegsdroge dient - ich hoffe es gibt welche - und die sich eingehender mit einem oder beiden Fachgebieten auseinandersetzen wollen, finden in der Literaturliste eine Reihe empfehlenswerter Werke. Zur Maß- und Integrationstheorie hervorheben möchte ich das gleichnamige Buch von J. Elstrodt, Neben einer umfangreichen Bibliographie an Originalarbeiten enthält es zahlreiche Bemerkungen über die historischen Entwicklungen und etliche Kurzbiographien von Mathematikern, die bedeutende Beiträge zu diesem Themenkreis geleistet haben. Ein ausgezeichnetes Buch, das beide Gebiete sehr ausführlich und umfassend behandelt, ist P. Billingsley’s „Probability and Measure“, und zur Wahrscheinlichkeitstheorie seien neben den klassichen zwei Bänden von W. Feller vor allem die Bücher von L. Breiman und D. Williams erwähnt. Der Zielsetzung des Buches entsprechend habe ich nicht immer die kürzeste und eleganteste Darstellung gewählt, sondern um des besseren Verständnisses willen mitunter auch Umwege in Kauf genommen oder auf Beweisideen zurückgegriffen, die mir intuitiver schienen. So wird etwa Lebesgues viii Vorwort Satz über die Differenzierbarkeit monotoner Funktionen nicht, wie meist üblich, mit Hilfe von Vitali-Überdeckungen bewiesen, sondern ich habe dazu den geometrisch so anschaulichen Satz von Riesz über die aufgehende Sonne verwendet. Für einen einsemestrigen kombinierten Kurs über Maß- und Wahrscheinlichkeitstheorie ist der Umfang wohl zu groß. Da wird man eine Auswahl treffen müssen, etwa durch Verzicht auf die Abschnitte 6.6 - 6.8, 7.4 , 7.7, 7.8, 8.4, 10.3, 10.4, 13.3, 13.4, 14.3, 15.4, 17.3 - 17.5 sowie das gesamte Kapitel 16. Die Auswahl für einen Semesterkurs, der nur Maß- und Integrationstheorie behandelt, ergibt sich von selbst, und in zwei Semestern sollte es möglich sein den gesamten Stoff durchzuarbeiten. Mein besonderer Dank gilt den Studentinnen und Studenten, die bei der Verfassung des Manuskripts und der Erstellung der Grafiken mitgeholfen haben. Danken möchte ich aber auch jenen die mit Anregungen, Ratschlägen und Berichtigungen zur Verbesserung des Textes und der Beseitigung zahlreicher Fehler beigetragen haben. Für die verbleibenden Fehler und Unklarheiten ist selbstverständlich der Autor verantwortlich. Den Leserinnen und Lesern danke ich im Voraus, wenn sie mich darauf aufmerksam machen oder mir sonstige Verbesserungsvorschläge mailen (an [email protected]). Und zu guter Letzt danke ich dem Team des Springer-Verlages, Wien, insbesondere Frau Schilgerius und Frau Mag. Martiska für die wohlwollende Unterstützung und kompetente technische Hilfe, mit der sie zur Verwirklichung und Fertigstellung des Buches beigetragen haben. Wien, Oktober 2010 Norbert Kusolitsch Inhaltsverzeichnis 1 Einführung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.1 Ein Beispiel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1 2 Mengen und Mengensysteme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1 Elementare Mengenlehre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Algebren und σ-Algebren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3 Semiringe, Ringe und σ-Ringe . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4 Erzeugte Systeme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.5 Monotone Systeme und Dynkin-Systeme . . . . . . . . . . . . . . . . . . . . 5 5 10 13 19 22 3 Mengenfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.1 Inhalte und Maße auf Semiringen . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2 Die Fortsetzung von Inhalten und Maßen auf Ringe . . . . . . . . . . 3.3 Eigenschaften von Inhalten und Maßen . . . . . . . . . . . . . . . . . . . . . 3.4 Additionstheorem und verwandte Sätze . . . . . . . . . . . . . . . . . . . . 27 27 30 32 35 4 Fortsetzung von Maßen auf σ–Algebren . . . . . . . . . . . . . . . . . . . . . . . 4.1 Äußere Maße und Carathéodory-Messbarkeit . . . . . . . . . . . . . . . 4.2 Fortsetzungs- und Eindeutigkeitssatz . . . . . . . . . . . . . . . . . . . . . . . 4.3 Vervollständigung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 41 43 46 5 Unabhängigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 5.1 Die durch ein Ereignis bedingte Wahrscheinlichkeit . . . . . . . . . . 51 5.2 Unabhängigkeit von Ereignissystemen . . . . . . . . . . . . . . . . . . . . . . 53 6 Lebesgue-Stieltjes-Maße . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.1 Definition und Regularität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.2 Verteilungsfunktionen auf R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.3 Das Lebesgue-Maß auf R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.4 Diskrete und stetige Verteilungsfunktionen . . . . . . . . . . . . . . . . . . 6.5 Wahrscheinlichkeitsverteilungen auf R . . . . . . . . . . . . . . . . . . . . . 57 57 59 61 63 66 x Inhaltsverzeichnis 6.6 Verteilungsfunktionen auf Rk . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 6.7 Wahrscheinlichkeitsverteilungen auf (Rk , Bk ) . . . . . . . . . . . . . . . 76 6.8 Das k-dimensionale Lebesgue-Maß . . . . . . . . . . . . . . . . . . . . . . . . . 81 7 Messbare Funktionen - Zufallsvariable . . . . . . . . . . . . . . . . . . . . . . . . 87 7.1 Definition und Eigenschaften . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87 7.2 Erweitert reellwertige Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . 90 7.3 Treppenfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92 7.4 Baire-Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94 7.5 Subsigmaalgebren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 7.6 Unabhängige Zufallsvariable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 7.7 Verallgemeinertes Null-Eins-Gesetz von Kolmogoroff . . . . . . . . . 101 7.8 Cantor-Menge und nichtmessbare Mengen . . . . . . . . . . . . . . . . . . 103 7.9 Konvergenzarten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 8 Die Verteilung einer Zufallsvariablen . . . . . . . . . . . . . . . . . . . . . . . . . 113 8.1 Das induzierte Maß . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113 8.2 Gemeinsame Verteilung und Randverteilungen . . . . . . . . . . . . . . 114 8.3 Die inverse Verteilungsfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . 117 8.4 Maßtreue Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122 9 Das Integral - Der Erwartungswert . . . . . . . . . . . . . . . . . . . . . . . . . . . 129 9.1 Definition des Integrals . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129 9.2 Konvergenzsätze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135 9.3 Das unbestimmte Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142 9.4 Zusammenhang zwischen Riemann- und Lebesgues-Integral . . . 145 9.5 Das Integral transformierter Funktionen . . . . . . . . . . . . . . . . . . . . 149 10 Produkträume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159 10.1 Die Produktsigmaalgebra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159 10.2 Der Satz von Fubini . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163 10.3 Maße auf unendlich-dimensionalen Produkträumen . . . . . . . . . 176 10.4 Null-Eins-Gesetz von Hewitt- Savage . . . . . . . . . . . . . . . . . . . . . . . 182 10.5 Stetige Zufallsvariable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 184 10.6 Die Faltung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187 11 Zerlegung und Integraldarstellung signierter Maße . . . . . . . . . . . . 195 11.1 Die Hahn-Jordan-Zerlegung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195 11.2 Die Lebesgue-Zerlegung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198 11.3 Der Satz von Radon-Nikodym . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199 12 Integral und Ableitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203 12.1 Funktionen von beschränkter Variation . . . . . . . . . . . . . . . . . . . . . 203 12.2 Absolut stetige Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205 12.3 Der Hauptsatz der Differential- und Integralrechnung . . . . . . . . 210 Inhaltsverzeichnis xi 13 Lp - Räume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215 13.1 Integralungleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215 13.2 Vollständigkeit der Lp -Räume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219 13.3 Gleichmäßige Integrierbarkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223 13.4 Der Dualraum zu Lp (Ω, S, μ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 226 14 Bedingte Erwartungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231 14.1 Der Satz von der vollständigen Erwartung . . . . . . . . . . . . . . . . . . 231 14.2 Die durch eine σ-Algebra bedingte Erwartung . . . . . . . . . . . . . . . 234 14.3 Reguläre, bedingte Wahrscheinlichkeiten . . . . . . . . . . . . . . . . . . . 242 15 Gesetze der großen Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 249 15.1 Die Varianz und andere Momente . . . . . . . . . . . . . . . . . . . . . . . . . 249 15.2 Schwache Gesetze der großen Zahlen . . . . . . . . . . . . . . . . . . . . . . 254 15.3 Starke Gesetze der großen Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . 256 15.4 Ergodensätze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 264 16 Martingale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 271 16.1 Definition und grundlegende Eigenschaften . . . . . . . . . . . . . . . . . 271 16.2 Transformation von Submartingalen . . . . . . . . . . . . . . . . . . . . . . 277 16.3 Konvergenzsätze für Submartingale . . . . . . . . . . . . . . . . . . . . . . . 282 17 Verteilungskonvergenz und Grenzwertsätze . . . . . . . . . . . . . . . . . . 289 17.1 Schwache Konvergenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 289 17.2 Der klassische zentrale Grenzverteilungssatz . . . . . . . . . . . . . . . 293 17.3 Schwache Kompaktheit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 296 17.4 Charakteristische Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 299 17.5 Der Grenzverteilungssatz von Lindeberg-Feller . . . . . . . . . . . . . . . 309 A Anhang . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 317 A.1 Das Diagonalisierungsverfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . 317 A.2 Das Auswahlaxiom . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 318 A.3 Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 318 A.4 Topologie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 323 A.5 Analysis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 328 A.6 Konvexe Mengen und Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . 329 A.7 Eindeutigkeit der Exponentialfunktion . . . . . . . . . . . . . . . . . . . . . . 333 A.8 Trigonometrie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 334 A.9 Komplexe Analysis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 336 A.10 Funktionalanalysis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 339 A.11 Drehung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 341 Literaturverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 343 Stichwortverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 345 1 Einführung 1.1 Ein Beispiel Wirft man einen Würfel bis zur ersten Sechs, so kann man die Wahrscheinlichkeit, dass dies gerade beim n-ten Wurf passiert, berechnen, indem man die Menge Ωn := {1, . . . , 6}n aller n-Tupel betrachtet, die man mit den Augenzahlen 1, . . . , 6 bilden kann. Ωn besteht aus |Ωn | = 6n Elementen und bei einem fairen Würfel sollte jedes n-Tupel gleich wahrscheinlich sein. Die erste Sechs erscheint gerade dann beim n-ten Wurf, wenn das n-Tupel der Wurfergebnisse in An := {(x1 , . . . , xn−1 , 6) : xi ∈ {1, . . . , 5} ∀i = 1, . . . , n − 1} liegt. Wegen |An | = 5n−1 folgt dann aus der klassischen Wahrscheinlichkeitsdefinition günstige Fälle 5n−1 P (An ) = = n . mögliche Fälle 6 Um die Wahrscheinlichkeiten der einzelnen Ausgänge zu bestimmen, haben wir für jedes n einen anderen Wahrscheinlichkeitsraum Ωn verwendet. Man kann dies nur umgehen, wenn man als Raum der Versuchsausgänge die Menge Ω := {(x1 , x2 , . . . ) : xi ∈ {1, . . . , 6} ∀ i ∈ N} aller Folgen, die mit den Zahlen 1, . . . , 6 gebildet werden können, betrachtet. Ersetzt man in diesen Folgen jede Sechs durch eine Null, so kann man die ∞ entsprechende Folge (x1 , x2 , . . . ) interpretieren als Zahl x := xi 6−i , ani=1 n geschrieben im 6-adischen Zahlensystem. Bei Zahlen der Form xn = 0 , die auch periodisch als n−1 i=1 xi 6−i + (xn − 1) −n + 5 i=1 ∞ xi 6−i mit 6−i ange- i=n+1 schrieben werden können, wollen wir immer die endliche Form verwenden. Dadurch entspricht jeder Zahl aus [0, 1) eine eindeutige Folge. Wir werden etwas später sehen, dass es praktisch keine Rolle spielt, wenn wir damit den Folgen (x1 , . . . , xn , 5, 5, . . . ), xn < 5 keine Zahl zuordnen kön- 2 1 Einführung nen. Aber auf Grund der obigen Ausführungen ist klar, dass unser Raum Ω überabzählbar sein muss. Wir haben angenommen, dass jedes konkrete n-Tupel (x1 , . . . , xn ) ∈ Ωn mit der gleichen Wahrscheinlichkeit P ((x1 , . . . , xn )) := 6−n auftreten kann. Die Menge aller Folgen, deren erste n Würfe durch das n-Tupel (x1 , . . . , xn ) festgelegt sind, bezeichnen wir mit A(x1 , . . . , xn ) , d.h. A(x1 , . . . , xn ) := {(x1 , . . . , xn , xn+1 , . . . ) : xn+i ∈ {0, . . . , 5} Der Folge (x1 , . . . , xn , 0, . . . ) entspricht die Zahl x := n ∀ i ∈ N} . xi · 6−i und der Folge i=1 (x1 , . . . , xn , 5, . . . ) ist die Zahl x + 6−n zugeordnet. Da wir keine periodischen Darstellungen der Form (x1 , . . . , xn , 5, . . . ) zulassen, entsprechen den Folgen aus A(x1 , . . . , xn ) die Zahlen aus dem Intervall [x, x + 6−n ) , und die Länge dieses Intervalls ist gerade die Wahrscheinlichkeit von A(x1 , . . . , xn ) , d.h. P (A(x1 , . . . , xn )) = 61n . Von einem sinnvollen Wahrscheinlichkeitsbegriff wird man verlangen, dass keine Untermenge wahrscheinlicher als eine sie enthaltende Obermenge sein sollte. Man nennt das die Monotonie der Wahrscheinlichkeit. Da für jede Folge (x1 , x2 , . . . ) gilt (x1 , x2 , . . . ) ∈ A(x1 , . . . , xn ) ∀ n ∈ N , muss daraus folgen P ({(x1 , x2 , . . . )}) ≤ 61n ∀ n ∈ N , d.h. jede Folge hat Wahrscheinlichkeit P ((x1 , x2 , . . . )) = 0 . Damit ist klar, dass die Wahrscheinlichkeitsverteilung P nicht durch die Wahrscheinlichkeiten der einzelnen Punkte von Ω festgelegt werden kann. Außerdem kann man überabzählbar viele Terme nicht aufsummieren, d.h. eine Summe der Form P ((x1 , x2 . . .)) ergibt keinen Sinn. (x1 ,x2 ,...)∈ A(x1 ,x2 ,...,xn ) Die Menge der Folgen (x1 , . . . , xn , 5, 5, . . . ), xn < 5, n ∈ N ist abzählbar. Daher kann man die Summe der Wahrscheinlichkeiten der einzelnen Punkte dieser Menge bilden und erhält Wahrscheinlichkeit 0 , was durchaus unserer Intuition entspricht, denn man wird es für ausgeschlossen halten, dass bei einem fairen Würfel ab einem bestimmten Zeitpunkt nur mehr Sechsen geworfen werden. Somit ist es praktisch irrelevant sich mit dieser Menge zu beschäftigen. ∞ Ist nun [a, b) ein beliebiges Teilintervall von [0, 1) mit a = ai 6−i und b= ∞ i=1 −i bi 6 , und bezeichnet man die auf n Stellen abgerundeten Werte von i=1 a und b mit ân bzw. b̂n (d.h. ân = n i=1 ai 6−i bzw. b̂n = n bi 6−i ), so bilden die i=1 Intervalle [ân , ân +6−n ), [ân +6−n , ân +2·6−n ), . . . , [b̂n , b̂n +6−n ) eine disjunkte Überdeckung von [a, b) , deren Wahrscheinlichkeit der Summe b̂n + 6−n − ân der Längen der Teilintervalle entspricht. Ohne die beiden Randintervalle [ân , ân + 6−n ) , [b̂n , b̂n + 6−n ) reduziert sich die Gesamtlänge der Vereinigung der verbleibenden Intervalle auf b̂n −ân −6−n und diese Vereinigung liegt nun zur Gänze in [a, b) . Wegen der Monotonie der Wahrscheinlichkeitsverteilung 1.1 Ein Beispiel 3 sollte daher gelten b̂n − ân − 6−n ≤ P ([a, b)) ≤ b̂n − ân + 6−n . Daraus folgt lim b̂n = b und lim 6−n = 0 wegen lim ân = a, n→∞ n→∞ n→∞ P ([a, b)) = b − a . Diese Verteilung, die jedem Teilintervall [a, b) ⊆ [0, 1), a ≤ b seine Länge b − a als Wahrscheinlichkeit zuordnet, wird stetige Gleichverteilung auf [0, 1) genannt. Der Name rührt daher, dass jedes Teilintervall mit einer gegebenen Länge dieselbe Wahrscheinlichkeit besitzt, unabhängig von seiner Lage in [0, 1) . Man sagt auch, die stetige Gleichverteilung ist translationsinvariant. Wir zeigen nun, dass es unmöglich ist, durch P jeder Teilmenge von [0, 1) eine Wahrscheinlichkeit zuzuordnen, wenn man fordert, dass man die Wahrscheinlichkeiten abzählbar vieler disjunkter Mengen aufsummieren darf, und, wenn man die Forderung der Translationsinvarianz aufrecht erhalten möchte. Mit den Bezeichnungen x := max{z ∈ Z : z ≤ x}, x mod 1 := x − x ist x ∼ y ⇔ (x − y) mod 1 ∈ Q ∩ [0, 1) eine Äquivalenzrelation. und bestimmt daher eine Klassenzerlegung von [0, 1) . Man nimmt nun aus jeder Klasse genau ein Element und bildet damit eine Menge A (das Auswahlaxiom A.2 besagt, dass dies möglich ist). Somit gilt x = y , x, y ∈ A ⇒ (x − y) mod 1 ∈ / Q. Ist A + x := {y = (a + x) mod 1 : a ∈ A} , dann bilden die {A + q : q ∈ Q} eine disjunkte Zerlegung von [0, 1) , denn für q1 = q2 , qi ∈ Q gilt klarerweise A + q1 ∩ A + q2 = ∅ , und für jedes x ∈ [0, 1) gibt es ein y ∈ A , sodass A+q . x ∼ y ⇒ ∃ q : x−y mod 1 = q ∈ Q ⇒ x ∈ A+q. Also [0, 1) = q∈Q ∩[0,1) Die Translationsinvarianz bedeutet P (A + q) = P (A) ∀ q ∈ Q . Darf man nun die Wahrscheinlichkeiten der A + q aufsummieren, so gilt 0 , wenn P (A) = 0 P ([0, 1)) = ∞ , wenn P (A) > 0 . Das widerspricht P ([0, 1)) = 1 , womit unsere Behauptung bewiesen ist. Wir müssen also für die stetige Gleichverteilung einen kleineren Definitionsbereich als die Potenzmenge von [0, 1) suchen. 2 Mengen und Mengensysteme 2.1 Elementare Mengenlehre Mit P(Ω) := {A : A ⊆ Ω} bezeichnen wir die Potenzmenge von Ω = ∅ . Die mengentheoretischen Operationen werden als bekannt vorausgesetzt. A∪B A∩B A \ B := A ∩ B c A B := (A \ B) ∪ (B \ A) die Vereinigung vonA und B der Durchschnitt vonA und B die Differenz vonA und B die symmetrische Differenz vonA und B . Definition 2.1. Ist f : Ω1 → Ω2 eine beliebige Abbildung und A ⊆ Ω1 , so nennt man die Abbildung f |A : A → Ω2 , definiert durch f |A (ω) := f (ω) ∀ ω ∈ A die Einschränkung oder Restriktion von f auf A . Definition 2.2. Ist f : Ω1 → Ω2 eine beliebige Abbildung, so nennt man f −1 (A) := {ω ∈ Ω1 : f (ω) ∈ A} das Urbild von A ⊆ Ω2 . In der Wahrscheinlichkeitstheorie ist auch die Schreibweise [f ∈ A]für das Urbild gebräuchlich. Für ∅ = C ⊆ P(Ω2 ) bezeichnet f −1 (C) := f −1 (C) : C ∈ C das System der Urbilder von C . Lemma 2.3 (Operationstreue des Urbilds). Ist f : Ω1 → Ω2 eine beliebige Abbildung, so gilt 1. f −1 (∅) = ∅, 2. f −1 (Ω2 ) = Ω1 , c −1 c 3. f −1 (A ) =f (A) , Ai = (f −1 (Ai )), 4. f −1 i i −1 −1 5. f Ai = (f (Ai )) . i i Beweis. Die obigen Aussagen folgen unmittelbar aus Definition 2.2. 6 2 Mengen und Mengensysteme Definition 2.4. Ist (Ωi )i∈I eine Familie von Mengen mit einer beliebigen Indexmenge I , so nennt man Ωi := {ω : I → Ωi : ω(i) ∈ Ωi ∀ i ∈ I} i i∈I I das kartesische Produkt der Ωi . Gilt Ωi = Ω ∀ i ∈ I , schreibt man dafür Ω . Ist J ⊆ I und bezeichnet man die Elemente von ΩJ := Ωj mit ωJ , so j∈J wird durch prI,J (ω) := ωJ : ωJ (j) = ω(j) ∀ j ∈ J eine surjektive Funktion prI,J : ΩI := Ωi → ΩJ definiert, die man Projektion von ΩI auf ΩJ nennt. i∈I Statt prI,J schreibt man auch prJ bzw. prj , wenn J = {j} , wenn I gegeben ist. Bemerkung 2.5. Ωi der Raum der n-Tupel (ω1 , . . . , ωn ) , d. h. es gilt 1. Für |I| = n ist i∈I Ωi = {(ω1 , . . . , ωn ) : ωi ∈ Ωi ∀ i} . i∈I Ωi = {(ω1 , ω2 , . . .) : ωi ∈ Ωi n∀ i} als 2. Bei abzählbarem I kann i∈I Folgenraum angeschrieben werden. Ωi . 3. Ist A ⊆ ΩJ , J ⊂ I , so gilt klarerweise pr−1 J (A) = A × i∈J c Lemma 2.6. Sind A, B und C beliebige Teilmengen einer Menge Ω , so gilt: 1. A ∩ B = B ∩ A , 2. A ∩ (B ∩ C) = (A ∩ B) ∩ C , 3. A B = B A , 4. A B = Ac B c , 5. A ∅ = A , 6. A A = ∅ , 7. A B = (A ∪ B) \ (A ∩ B) , 8. (A B)c = (A ∩ B) ∪ (Ac ∩ B c ) , 9. A (B C) = (A B) C , 10. A ∩ (B C) = (A ∩ B) (A ∩ C) , 11. A C ⊆ (A B) ∪ (B C) , 12. (A ∩ B) (C ∩ D) ⊆ (A C) ∪ (B D) . Beweis. ad 1. -6. Diese Punkte sind trivial. ad 7. A B = (A∩ B c ) ∪ (B ∩ Ac ) = (A∪ B) ∩ (B ∪ B c ) ∩ (A ∪ Ac ) ∩ (Ac ∪ B c ) = (A ∪ B) ∩ (Ac ∪ B c ) = (A ∪ B) ∩ (A ∩ B)c = (A ∪ B) \ (A ∩ B) . ad 8. Aus Punkt 7. folgt (A B)c = (A∪B)c ∪(A∩B) = (Ac ∩B c )∪(A∩B) . ad 9. (B C)\A = Ac ∩[(B ∩C c )∪(B c ∩C)] = (Ac ∩B ∩C c )∪(Ac ∩B c ∩C) . Aus Punkt 8. folgt A \ (B C) = A ∩ [(B ∩ C) ∪ (Ac ∩ B c )] = (A ∩ B ∩ C) ∪ (A ∩ B c ∩ C c ) . 2.1 Elementare Mengenlehre 7 Die beiden obigen Gleichungen zusammen ergeben A (B C) = (A ∩ B ∩ C) ∪ (A ∩ B c ∩ C c ) ∪ (Ac ∩ B ∩ C c ) ∪ (Ac ∩ B c ∩ C). Da die rechte Seite dieser Gleichung symmetrisch in A, B und C ist, muss gelten A (B C) = (A B) C . ad 10. Durch Umformen erhält man (A ∩ B) (A ∩ C) = [(A ∩ B) ∩ (A ∩ C)c ] ∪ [(A ∩ B)c ∩ (A ∩ C)] = [(A ∩ B) ∩ (Ac ∪ C c )] ∪ [(Ac ∪ B c ) ∩ (A ∩ C)] = (A ∩ B ∩ C c ) ∪ (A ∩ B c ∩ C) = A ∩ [(B ∩ C c ) ∪ (B c ∩ C)] = A ∩ (B C) . ad 11. Auch dies ergibt sich durch einfache Umformung A C = (A ∩ C c ) ∪ (Ac ∩ C) = (A ∩ B ∩ C c ) ∪ (A ∩ B c ∩ C c ) ∪ (Ac ∩ B ∩ C) ∪ (Ac ∩ B c ∩ C) ⊆ (B ∩ C c ) ∪ (A ∩ B c ) ∪ (Ac ∩ B) ∪ (B c ∩ C) = (A B) ∪ (B C) . ad 12. (A ∩ B) \ (C ∩ D) = (A ∩ B) ∩ (C c ∪ D c ) = (A ∩ B ∩ C c ) ∪ (A ∩ B ∩ D c ) ⊆ (A ∩ C c ) ∪ (B ∩ Dc ) ⊆ (A C) ∪ (B D) . Aus Symmetriegründen gilt auch (C ∩ D) \ (A ∩ B) ⊆ (A C) ∪ (B D) . Lemma 2.7. ⎛ ⎝ Ai i∈I ⎞ Bj ⎠ ⊆ j∈I (Ai Bi ) . (2.1) i∈I Beweis. ⎞c ⎛ ⎞ ⎛ ⎝Ai ∩ Ai ∩ ⎝ Bj ⎠ = Bjc ⎠ ⊆ (Ai ∩ Bic ) ⊆ (Ai Bi ). i j i Analog zeigt man Bj j j ∩ i c Ai i ⊆ i (Ai Bi ) . i Lemma 2.8. Sind I1 , . . . , In endliche Indexmengen, so gilt für beliebige Mengen Ai,j i = 1, . . . , n, j ∈ Ii : n Ai,j = i=1 j∈Ii und n i=1 j∈Ii (j1 ,...,jn )∈ Ai,j = n n Ii (2.2) Ai,ji (2.3) i=1 (j1 ,...,jn )∈ Ai,ji i=1 n n i=1 Ii i=1