Universität Paderborn Fakultät für Elektrotechnik, Informatik und Mathematik Institut für Mathematik Maß- und Integrationstheorie Kai Gehrs [email protected] Paderborn, 16. Februar 2007 Inhaltsverzeichnis 1 Maßtheoretische Grundlagen 1.1 Semiringe, Ringe und Algebren . . . . . . . . . 1.2 Erzeugende Strukturen . . . . . . . . . . . . . . 1.3 Borelsche Mengen . . . . . . . . . . . . . . . . . 1.4 Meßbare Abbildungen . . . . . . . . . . . . . . 1.5 Meßbare numerische Funktionen . . . . . . . . . 1.6 Maße und verwandte Begriffe . . . . . . . . . . 1.7 Vollständige Maßräume . . . . . . . . . . . . . . 1.8 Das Borel-Lebesgue-Maß und das Lebesgue-Maß . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 3 5 6 8 11 14 21 23 2 Grundlagen der Integrationstheorie 2.1 Approximation durch Treppenfunktionen . . . 2.2 Weitere Konvergenzaussagen . . . . . . . . . . 2.3 Das Lebesgue-Integral . . . . . . . . . . . . . 2.4 Grenzwertsätze für Lebesgue-Integrale . . . . 2.5 Vergleich von Riemann- und Lebesgue-Integral 2.6 Die Lp -Räume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 25 26 28 35 39 44 . . . . . . . . 51 51 52 56 57 60 62 66 69 . . . . . . 3 Anwendungen in der Stochastik 3.1 Wahrscheinlichkeitsmaße . . . . . . . . . . . . . . . . 3.2 Zufallsvariablen . . . . . . . . . . . . . . . . . . . . . 3.3 Integration bezüglich Wahrscheinlichkeitsverteilungen 3.4 Absolut-stetige Maße und Verteilungsfunktionen . . . 3.5 Erwartungswerte von Zufallsvariablen . . . . . . . . . 3.6 Allgemeine p-te Momente von Zufallsvariablen . . . . 3.7 Grenzwertsätze und Anwendungen . . . . . . . . . . 3.8 Schwaches Gesetz der großen Zahlen . . . . . . . . . 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Kapitel 1 Maßtheoretische Grundlagen In diesem ersten Kapitel werden wir die grundlegenden Strukturen kennenlernen, in denen wir uns im Rahmen von Maß- und Integrationstheorie “bewegen”. Dazu gehören in erster Linie (Mengen-)Algebren bzw. σ-(Mengen)-Algebren, aber auch einfachere Strukturen, aus denen sich solche “erzeugen” lassen. Sei im gesamten Kapitel stets Ω eine Grundmenge von Elementen, z.B. Ω = R, Ω = [0, 1] etc., sowie M ein Mengensystem M ⊆ ℘(Ω), wobei ℘ die Potenzmenge, also die Menge aller Teilmengen, bezeichnet. Ferner bezeichnen wir für A ∈ ℘(Ω) mit A := Ω \ A das Komplement der Menge A. 1.1 Semiringe, Ringe und Algebren Wir beginnen mit den elementaren, für uns interessanten Strukturen, die wir in der folgenden Definition einführen: Definition 1.1. Sei M ⊆ ℘(Ω) ein System von Mengen. (i) M heißt ein Semiring in Ω wenn gilt: (a) ∅ ∈ M (b) Sind A, B ∈ M, so folgt stets A ∩ B ∈ M. (c) Für beliebige A, B ∈ M existieren stets endlich Sn viele paarweise disjunkte Mengen A1 , . . . , An ∈ M mit A \ B = i=1 Ai . (ii) M heißt ein Ring in Ω, wenn für alle A, B ∈ M gilt: (a) A ∪ B ∈ M (b) A \ B ∈ M. 3 4 KAPITEL 1. MASSTHEORETISCHE GRUNDLAGEN (iii) M heißt eine Algebra in Ω, wenn gilt: (a) Sind A, B ∈ M, so folgt stets A ∪ B ∈ M. (b) Ω ∈ M (c) Ist A ∈ M, so folgt stets A ∈ M. (iv) Ein Ring bzw. eine Algebra M heißt ein σ-Ring bzw. eine σ-Algebra, wenn zusätzlich S zu den üblichen Eigenschaften gilt: Sind An ∈ M, n ∈ N, so folgt stets ∞ n=1 An ∈ M. (v) M heißt monoton oder auch monotone Klasse, wenn gilt: (a) Sind A1 ⊆ A2 ⊆ A3 ⊆ . . ., An ∈ M für alle n ∈ N, so folgt M. S∞ An ∈ (b) Sind A1 ⊇ A2 ⊇ A3 ⊇ . . ., An ∈ M für alle n ∈ N, so folgt M. T∞ An ∈ n=1 n=1 Bemerkung 1.2. Da Algebren stets auch Komplemente von Mengen S∞enthalten, enthalten σ-Algebren neben abzählbaren Vereinigungen der Form n=1 T∞An auch T∞ alle abzählbaren Durchschnitte n=1 An , denn es gilt nach DeMorgan n=1 An = S∞ n=1 An . Ferner ist jede Algebra A ein Ring, denn sind A, B ∈ A, so folgt A \ B = A ∩ B = A ∪ B ∈ A. Beispiel 1.3. Die beiden einfachsten Beispiele, die alle Bedingungen der obigen Definition befriedigen, sind ℘(Ω) und {∅, Ω}. Ein wenig interessanter ist das folgende Beispiel: Betrachte das Mengensystem M1 = {(a, b] | a ≤ b, a, b ∈ R} mit der Konvention (a, a] = ∅. Dann ist M1 ein Semiring. Offensichtlich ist M1 kein Ring, denn die Vereinigung zweier disjunkter Intervalle lässt sich offensichtlich nicht als Intervall der Form (a, b] schreiben. Wenn M1 kein Ring ist, so kann M1 auch keine Algebra sein, denn jede Algebra ist ein Ring. Dagegen ist M2 mit M2 := {A ⊆ Ω | A oder A ist endlich} zwar eine Algebra, aber keine σ-Algebra, denn abzählbare Vereinigungen endlicher Mengen sind unendlich und müssen nicht endliches Komplement S∞ besitzen.1 Betrachte dazu z.B. Ω = [0, 1] und 1 An := { n } für n ∈ N. Dann ist n=1 An = { n | n ∈ N} nicht endlich und ebenso auch ihr Komplement keine endliche Menge. Wir werden nun sehen, dass die in Definition 1.1 geforderten Eigenschaften an Mengensysteme bei Durchschnittbildung im wesentlichen erhalten bleiben: 1.2. ERZEUGENDE STRUKTUREN 5 Satz 1.4. Sei I eine beliebige Indexmenge und Mi ein System von Ringen bzw. σ-Ringen bzw. Algebren bzw. σ-Algebren bzw. monotonen Klassen. Dann T ist auch i∈I Mi wieder ein Ring bzw. ein σ-Ring bzw. eine Algebra bzw. eine σ-Algebra bzw. eine montone Klasse. Beweis. Exemplarisch führenTwir den Beweis für den Fall, dass Mi ein Familie von Ringen ist. Sind A, B ∈ i∈I Mi , so folgt A, B ∈ Mi für alle T i ∈ I. Folglich gilt A ∪ B, A \ B ∈ Mi für alle i ∈ I, also auch A ∪ B, A \ B ∈ i∈I Mi . Analog folgt alles andere. 1.2 Erzeugende Strukturen In diesem Abschnitt werden wir sehen, dass wir aus einfacheren Strukturen kompliziertere “gewinnen’ können, d.h. dass z.B. ein Semiring einen Ring und dieser wiederum eine Algebra erzeugen kann. Definition 1.5. Sei wieder M ⊆ ℘(Ω) ein Mengensystem. Der Durchschnitt aller Ringe bzw. σ-Ringe bzw. Algebren bzw. σ-Algebren bzw. monotoner Klassen, die M enthalten, heißt der bzw. die bzw. das von M erzeugte Ring bzw. σRing bzw. Algebra bzw. σ-Algebra bzw. montone Klasse und wird mit R(M) bzw. Rσ (M) bzw. A(M) bzw. Aσ (M) bzw. m(M) bezeichnet. Bezüglich Inklusion sind also die Mengen R(M) bzw. Rσ (M) bzw. A(M) bzw. Aσ (M) bzw. m(M) die jeweils kleinste Struktur, die M enthält. Statt Aσ (M) schreiben wir häufig kurz σ(M) und nennen diese σ-Algebra auch die Borelsche Erweiterung von M. Lemma 1.6. Sind M1 und M2 Mengensysteme mit M1 ⊆ R(M2 ) und M2 ⊆ R(M1 ), so folgt R(M1 ) = R(M2 ). Beweis. Aus M1 ⊆ R(M2 ) folgt sofort R(M1 ) ⊆ R(M2 ). Wegen der geforderten Symmetrie folgt sofort auch die umgekehrte Inklusion. Dies zeigt die Behauptung. Mit dem folgenden Satz charakterisieren wir diejenigen Ringe, die von Seminringen erzeugt werden, ein wenig genauer: Satz 1.7. Der von einem Semiring S erzeugte Ring R(S) ist das System aller endlichen Vereinigungen V von paarweise disjunkten Mengen aus S. 6 KAPITEL 1. MASSTHEORETISCHE GRUNDLAGEN Beweis. Wir zeigen zunächst Sm V ⊆ R(S). Seien A1 , . . . , Am ∈ S mit Ai ∩Aj = ∅. Wegen S ⊆ R(S) folgt i=1 Ai ∈ R(S). Nun zur umgekehrten Inklusion. Es gilt S ⊆ V ⊆ R(S). Mit obigem Lemma erhalten wir daher R(V) = R(S). Gelingt es zu zeigen, dass V ein Ring ist, so folgt daraus V = R(V) = R(S). Sind A, B ∈ V, so gibt es nach Definition von V endlich Sm viele paarweise Sndisjunkte Mengen A1 , . . . , Am und B1 , . . . , Bn in S mit A = i=1 Ai und B = j=1 Bj . Es gilt nun: m n m [ n [ [ [ A∩B = Ai ∩ Bj = (Ai ∩ Bj ). i=1 j=1 i=1 j=1 Weil Ai ∩ Bj paarweise disjunkt sind und Ai ∩ Bj ∈ S folgt A ∩ B ∈ V, d.h. der Durchschnitt zweier beliebiger Mengen aus V ist wieder ein Element von V. Damit sind auch endliche Durchschnitte von Elementen aus V stets wieder in V enthalten. Für jedes feste j sind die Mengen Ai \ Bj paarweise disjunkt und lassen sich nach Definition 1.1(i)(c) als disjunkte Vereinigung von Mengen aus S schreiben. Folglich ist jede dieser Mengen der Gestalt Ai \Bj inS V enthalten und, da sie für festes j paarweise disjunkt sind, wir erhalten A\Bj = m i=1 (Ai \Bj ) ∈ V und damit auch n n [ \ A\B =A\ Bj = (A \ Bj ) ∈ V. j=1 j=1 Wegen A ∪ B = (A \ B) ∪ B und da A \ B und B disjunkt sind, folgt auch A ∪ B ∈ V, d.h. V ist ein Ring. Ohne Beweis geben wir noch den folgenden Satz an, der auf ähnliche Weise wie im obigen Beweis gezeigt werden kann: Satz 1.8. Ist A eine Algebra, so gilt m(A) = σ(A), d.h. die von einer Algebra erzeugte monotone Klasse ist gleich ihrer Borelschen Erweiterung. 1.3 Borelsche Mengen Sei im folgenden (Ω, O) ein topologischer Raum. Zur Erinnerung: Es ist O eine Topologie auf Ω, wenn ∅, Ω ∈ O und endliche Durchschnitte und beliebige Vereinigungen von Elementen aus O stets wieder in O enthalten sind. Dann definieren wir: Definition 1.9. Die σ-Algebra σ(O), die von der Topologie O auf Ω erzeugt wird, heisst die σ-Algebra der Borelschen Teilmengen von Ω und wird mit B(Ω, O) bezeichnet. 1.3. BORELSCHE MENGEN 7 Für uns von besonderem Interesse ist der Fall Ω = Rd , d ∈ N. Für a = (a1 , . . . , ad ), b = (b1 , . . . , bd ) ∈ Ω definieren wir a ≤ b :⇐⇒ ai ≤ bi , i = 1, . . . , d a < b :⇐⇒ a ≤ b und a 6= b a / b :⇐⇒ ai < bi , i = 1, . . . , d sowie (a, b) := {c ∈ Ω | a / c / b} (a, b] := {c ∈ Ω | a / c ≤ b} [a, b) := {c ∈ Ω | a ≤ c / b} [a, b] := {c ∈ Ω | a ≤ c ≤ b} und I()d := {(a, b) | a, b ∈ Ω} I(]d := {(a, b] | a, b ∈ Ω} I[)d := {[a, b) | a, b ∈ Ω} I[]d := {[a, b] | a, b ∈ Ω} Satz 1.10. Es sei Ω = Rd und es sei Ad die Menge aller abgeschlossenen Teilmengen von Rd , Od die Menge aller offenen Teilmengen von Rd sowie Kd die Menge aller kompakten Teilmengen von Rd . Dann gilt: B(Rd ) = σ(I()d ) = σ(I(]d ) = σ(I[)d ) = σ(I[]d ) = σ(Od ) = σ(Ad ) = σ(Kd ), d.h. alle aufgeführten Mengen erzeugen dieselbe σ-Algebra der Borelschen Teilmengen von Ω. T 1 Beweis. S Es sei 1 := (1, . . . , 1) S ∈ Ω. Dann gilt: (a, b] T = ∞ n=1 (a, b + n · 1), ∞ ∞ ∞ (a, b) = n=1 [a+ n1 ·1, b), [a, b) = n=1 [a, b− n1 ·1], [a, b] = n=1 (a− n1 ·1, b]. Damit folgt σ(I(]d ) ⊆ σ(I()d ) ⊆ σ(I[)d ) ⊆ σ(I[]d ) ⊆ σ(I(]d ), also σ(I(]d ) = σ(I()d ) = σ(I[)d ) = σ(I[]d ). Da sich jede offene Menge als höchstens abzählbare Vereinigung offener “Intervalle” aus I()d schreiben lässt, erhalten wir ferner: σ(Od ) ⊆ σ(I()d ). Da alle Mengen in I()d offen sind, folgt auch die umgekehrte Inklusion und wir erhalten σ(Od ) = σ(I()d ). Desweiteren gilt I[]d ⊆ Kd ⊆ Ad ⊆ σ(Od ). Per Definition gilt ferner B(Ω) = σ(Od ). Anwendung der σ-Operation auf die letzte Inklusionskette liefert dann noch die fehlenden Identitäten und der Satz ist bewiesen. 8 KAPITEL 1. MASSTHEORETISCHE GRUNDLAGEN Bemerkung 1.11. Es gilt {∅, Rd } ( B(Rd ) ( ℘(Rd ), d.h. insbesondere dass es auch nicht-Borelsche Teilmengen von Rd gibt. Die Konstruktion solcher Mengen kann mit Hilfe des Auswahlaxioms durchgeführt werden. Wir führen sie hier nicht durch. Bemerkung 1.12. Neben den oben angegebenen Erzeugendensystemen der σAlgebra der Borelschen Teilmengen von Rd , gilt auch B(Rd ) = σ({(−∞ · 1, c] | S c ∈ Rd }), denn aus (−∞ · 1, c] = ∞ n=1 (−n · 1, c] folgt zunächst σ({(−∞ · 1, c] | d d d c ∈ R }) ⊆ σ(I(] ) = B(R ). Umgekehrt gilt (a, b] = (−∞ · 1, b] \ (−∞ · 1, a], also I(]d ⊆ σ({(−∞ · 1, c] | c ∈ Rd }) und damit die Behauptung. Ebenso zeigt man, dass auch B(Rd ) = σ({[c, 1 · ∞) | c ∈ Rd }) gilt. 1.4 Meßbare Abbildungen Seien Ω, E 6= ∅ Grundmengen und X : Ω → E eine Abbildung. Für jede Teilmenge A ⊆ Ω setzen wir X(A) := {X(ω) | ω ∈ A} und für jede Teilmenge Γ ⊆ E definieren wir die Urbildmenge X −1 (Γ) := {ω ∈ Ω | X(ω) ∈ Γ}. Es gelten die folgenden wichtigen Eigenschaften, die wir hier ohne Beweis angeben, die sich aber auf elementarem Niveau nachrechnen lassen: Sei I eine beliebige Indexmenge sowie (Γi )i∈I ⊆ ℘(E), M, N ⊆ E. Dann gilt: (i) Ist M ⊆ N , so folgt auch X −1 (M ) ⊆ X −1 (N ). (ii) X −1 (M ) = X −1 (M ∩ X(Ω)) S S (iii) X −1 ( i∈I Γi ) = i∈I X −1 (Γi ) T T (iv) X −1 ( i∈I Γi ) = i∈I X −1 (Γi ) (v) X −1 (∅) := ∅ verwenden wir als Konvention. (vi) X −1 (E) = Ω (vii) X −1 (M \ N ) = X −1 (M ) \ X −1 (N ) (viii) X −1 (M ) = X −1 (M ) Unmittelbar aus diesen Eigenschaften ergibt sich das folgende Resultat: Korollar 1.13. Sind Ω, E 6= ∅ Grundmengen und ist X : Ω → E eine Abbildung, so überträgt X alle wesentlichen Eigenschaften eines Mengensystems M ⊆ ℘(E) auf das Urbildsystem X −1 (M) := {X −1 (Γ) | Γ ∈ M}. Mit anderen Worten: Ist M ein Ring, eine Algebra, ein σ-Ring, eine σ-Algebra oder eine monotone Klasse, so auch X −1 (M). 1.4. MESSBARE ABBILDUNGEN 9 Definition 1.14. Sei E 6= ∅ und E eine σ-Algebra in E. Dann heißt das Paar (E, E) ein meßbarer Raum. Definition 1.15. Sind (Ω, F) und (E, E) meßbare Räume und ist X : Ω → E eine Abbildung, so heißt X F-E-meßbar oder kurz meßbar, wenn klar ist, welche zugrundeliegenden σ-Algebren gemeint sind, falls gilt X −1 (E) ⊆ F. Bemerkung und Definition 1.16. Sind (Ω, OΩ ) und (E, OE ) topologische Räume, so ist X : Ω → E stetig, wenn Urbilder offener Mengen unter X wieder offen sind, d.h. falls X −1 (OE ) ⊆ OΩ . Betrachten wir also auf Ω und E die σ-Algebren der Borelschen Teilmengen, so werden wir sehen, dass jede stetige Abbildung meßbar ist. Die Umkehrung gilt nicht, wie wir ein wenig später auch sehen werden. Starten wir ferner mit einer Abbildung X : Ω → E und ist uns auf E eine σ-Algebra E gegeben, so können wir in Ω die σ-Algebra X −1 (E) betrachten. Wir nennen dann X −1 (E) die von X erzeugte σ-Algebra in Ω. Offensichtlich ist X −1 (E) die kleinste σ-Algebra in Ω, so dass X meßbar ist. Entsprechende Konzepte für X anstelle von X −1 existieren nicht. Wir wollen nun ein etwas handlicheres Kriterium dafür angeben, wann eine Abbildung messbar ist. Satz 1.17. (Hinreichende Meßbarkeitsbedingung) Seien (Ω, F) und (E, E) meßbare Räume und X : Ω → E eine Abbildung. Hinreichend für die Meßbarkeit der Abbildung X ist, dass für ein beliebiges Erzeugendensystem E 0 von E gilt: X −1 (E 0 ) ⊆ F. Beweis. Sei G eine beliebige σ-Algebra in Ω und definiere X ◦ G := {Γ ⊆ ℘(E) | X −1 (Γ) ∈ G}. Dann ist X ◦ G eine σ-Algebra in E, denn X −1 (E) = Ω ∈ G, also E ∈ X ◦ G. Für ein beliebiges Γ ∈ X ◦ G gilt X −1 (Γ) ∈ G, also X −1 (Γ) = X −1 (Γ) ∈ G, d.h. Γ ∈ X ◦ G. Es bleibt zu zeigen, dass auch abzählbare Vereinigungen von Elementen aus X ◦ G wieder in X ◦ G enthalten sind. −1 Sei (Γ (ΓnS ) ∈ G für alle n ∈ N und folglich n )n∈N ⊆ XS◦ G. Dann gilt X S ∞ ∞ −1 −1 X ( n=1 Γn ) = n=1 X (Γn ) ∈ G, d.h. ∞ n=1 Γn ∈ X ◦ G. Nun zum eigentlichen Beweis des Satzes: Nach Voraussetzung ist E 0 ein Erzeugendensystem von E, also σ(E 0 ) = E, und es gilt X −1 (E 0 ) ⊆ F. Damit erhalten wir E 0 ⊆ X ◦ F, also E = σ(E 0 ) ⊆ σ(X ◦ F) = X ◦ F, da X ◦ F bereits eine σ-Algebra ist. Insgesamt folgt also X −1 (E) ⊆ F. Um auf Meßbarkeit zu überprüfen genügt es also, zu beweisen dass das Urbild eines Erzeugendensystems der betreffenden σ-Algebra in der σ-Algebra des Definitionsbereichs der jeweiligen Abbildung enthalten ist. Unmittelbar aus dem Satz vom hinreichenden Meßbarkeitskriterium folgt: 10 KAPITEL 1. MASSTHEORETISCHE GRUNDLAGEN Korollar 1.18. Sind (Ω, OΩ ) und (E, OE ) topologische Räume und ist X : Ω → E stetig, so ist X B(Ω, OΩ )-B(E, OE )-meßbar. Beweis. Die Stetigkeit von X bedeutet gerade X −1 (OE ) ⊆ OΩ und OE ist ein Erzeugendensystem der Borel-σ-Algebra in E. Beispiel 1.19. Wir betrachten die Dirichlet-Funktion X : [0, 1] → R mit X(x) := 1[0,1]∩Q (x), d.h. diejenige Funktion die 1 ist auf allen rationalen Punkten aus [0, 1] und 0 auf allen irrationalen Punkten. Die Funktion X ist nicht stetig. Sei nun Γ ⊆ B(R). Dann gilt ∅ [0, 1] ∩ Q X −1 (Γ) = [0, 1] \ Q [0, 1] falls falls falls falls 0, 1 ∈ /Γ 1 ∈ Γ, 0 ∈ /Γ 0 ∈ Γ, 1 ∈ /Γ 0, 1 ∈ Γ S Offensichtlich gilt ∅, [0, 1] ⊆ B([0, 1]). Ferner ist [0, 1] ∩ Q = x∈[0,1]∩Q {x} eine abzählbare Vereinigung von Einpunktmengen. Da sowohl Einpunktmengen als auch damit abzählbare Vereinigungen dieser in B([0, 1]) enthalten sind, folgt [0, 1] ∩ Q ⊆ B([0, 1]). Damit folgt auch [0, 1] \ Q = [0, 1] \ ([0, 1] ∩ Q) ⊆ B([0, 1]). Damit ist X zwar nicht stetig, aber dennoch B([0, 1])-B(R)-meßbar. Korollar 1.20. Die Komposition meßbarere Abbildungen ist meßbar. Im Detail: Sind (Ω, F), (E1 , E1 ) und (E2 , E2 ) meßbare Räume und X : Ω → E1 und Y : E1 → E2 meßbare Abbildungen, so ist auch Y ◦ X meßbar. Beweis. Es gilt Y −1 (E2 ) ⊆ E1 und X −1 (E1 ) ⊆ F. Also gilt (Y ◦ X)−1 (E2 ) = X −1 (Y −1 (E2 )) ⊆ F. Beispiel 1.21. Alle elementaren Operationen R2 → R mit (x, y) 7→ x ± y, (x, y) 7→ x · y, (x, y) 7→ x ∨ y := max{x, y}, (x, y) 7→ x ∧ y := min{x, y} sind stetig und daher meßbar. Wir wollen nun die Begrifflichkeiten ausdehnen auf diskrete Produkte meßbarer Räume: Lemma und Definition 1.22. Sei nQ∈ N und (Ei , Ei )i=1,...,n eine endliche Familie meßbarer Räume. Setze Ω := ni=1 Ei := E1 × . . . × En . Sei ferner πi : Ω → Ei ,Sπi (ω1 , . . . , ωn ) := ωi die i-te Koordinatenprojektion. Dann ist Q n n −1 i=1 Ei := σ( i=1 πi (Ei )) die kleinste Qn σ-Algebra, bezüglich derer alle Projektionen πi meßbar sind. Wir nennen i=1 Ei die Produkt-σ-Algebra zu E1 , . . . , En . 1.5. MESSBARE NUMERISCHE FUNKTIONEN 11 Qd d Bemerkung 1.23. Betrachten wir Ω := und sind πi für i=1 R = R iQ= 1, . . . , d die i-ten Koordinatenprojektionen, so ist die Produkt-σ-Algebra d i=1 B(R) bezüglich derer alle Koordinatenprojektionen meßbar sind gerade die Borel-σ-Algebra B d (R) aus Satz 1.10. Das obige Lemma bietet also einen alternativen, abstrakteren Zugang zu einer Verallgemeinerung der σ-Algebra der Borelschen Teilmengen auf R hin zu einer σ-Algebra der Borelschen Teilmengen auf Rd . Desweiteren lässt sich die obige Konstruktion noch weiter verallgemeinern: Statt der Prodjektionen πi können auch beliebige meßbare Abbildungen Qn Xi : Ω → Ei betrachtet werden, wobei Ω = i=1 Ei , und dann analog diejenige kleinste σ-Algebra auf Ω definiert wird bezüglich derer alle Xi meßbar sind. Man kann sogar nicht endliche und nicht diskrete Indexmengen bei der Produktbildung betrachten und gelangt dann zu dem Begriff des stochastischen Prozeßes. 1.5 Meßbare numerische Funktionen In diesem Abschnitt werden wir uns mit meßbaren numerischen Funktionen beschäftigen. Sei wieder Ω 6= ∅ eine Grundmenge. Wir bezeichnen mit R := R ∪ {−∞, ∞} die Kompaktifizierung der reellen Achse und vereinbaren aus Konsistenzgründen für c ∈ R die folgenden Konventionen: c + ∞ = ∞, c − ∞ = −∞, c · ∞ = ∞, falls c > 0 und c · ∞ = −∞, falls c < 0, 0 · (±∞) = 0, ∞ + ∞ = ∞, −∞ − ∞ = −∞, ∞ · ∞ = ∞, −∞ · ∞ = −∞, −∞ · (−∞) = ∞, ∞ − ∞ ist nicht definiert. Ferner gelte für alle definierten Sonderfälle jeweils auch das Kommutativgesetz. Definition 1.24. Die σ-Algebra der Borelschen Teilmengen auf R ist definiert als B(R) := {A, A ∪ {∞}, A ∪ {−∞}, A ∪ {−∞, ∞} | A ∈ B(R)}. d Analog wird auch die σ-Algebra der Borelschen Teilmengen von R definiert. Für eine beliebige Abbildung f und eine Menge Γ bezeichnen wir das Urbild f −1 (Γ) von an nun auch mit [f ∈ Γ]. Definition 1.25. Eine Funktion f : Ω → R heißt eine numerische Funktion. Eine Funktion g : Ω → R heißt eine reelle numerische Funktion. Satz 1.26. Sei (Ω, F) ein meßbarer Raum und f : Ω → R eine numerische Funktion. Dann ist f genau dann F-B(R)-meßbar, wenn eine der folgenden Bedingungen erfüllt ist: (i) [f ≤ c] ∈ F für alle c ∈ R 12 KAPITEL 1. MASSTHEORETISCHE GRUNDLAGEN (ii) [f < c] ∈ F für alle c ∈ R (iii) [f ≥ c] ∈ F für alle c ∈ R (iv) [f > c] ∈ F für alle c ∈ R Beweis. Da jede der Mengen {[−∞, c] | c ∈ R}, {[−∞, c) | c ∈ R}, {[c, ∞] | c ∈ R} und {(c, ∞] | c ∈ R} ein Erzeugendensystem von B(R) ist, folgt die Behauptung aus der hinreichenden Meßbarkeitsbedingung 1.17. Lemma 1.27. Sei (Ω, F) ein meßbarer Raum und f, g : Ω → R meßbare numerische Funktionen. Dann gilt: (i) [f < g] ∈ F (ii) [f ≤ g] ∈ F (iii) [f = g] ∈ F (iv) [f > g] ∈ F (v) [f ≥ g] ∈ F Beweis. Es gilt für a, b ∈ R a S < b genau dann, wenn S es ein q ∈ Q gibt mit a < q < b. Also folgt: [f < g] = q∈Q [f < q < g] = q∈Q ([f < q] ∩ [g > q]) ∈ F, da mit [f < q], [g > q] ∈ F auch [f < q]∩[g > q] ∈ F und damit T∞ auch abzählbare Vereinigungen über diese Mengen. Ferner gilt [f ≤ g] = n=1 [f < g + n1 ]. Da jede der Mengen [f < g + n1 ] nach dem, was wir bereits gezeigt haben, in F liegt, liegt auch der abzählbare Durchschnitt über all diese Mengen in F. Wegen [f = g] = [f ≤ g] \ [f < g] folgt auch [f = g] ∈ F. Der Rest folgt analog. Satz 1.28. Sei (Ω, F) ein meßbarer Raum. Sind f, g : Ω → R meßbare Funktionen, so sind auch (i) c · f für alle c ∈ R (ii) f ± g (iii) f · g (iv) f ∨ g und f ∧ g meßbare Funktionen (falls sie definiert sind). 1.5. MESSBARE NUMERISCHE FUNKTIONEN 13 Beweis. (i) Es gilt [c · f ≤ a] = [f ≤ ac ] und letztere Menge liegt nach dem obigen Lemma in F. (ii) Es gilt [f ± g ≤ a] = [f ≤ a ∓ g] und letztere Menge liegt ebenfalls nach obigem Lemma in F. Der Beweis von (iii) ist aufwendiger. Wir führen ihn hier nicht durch. Die Aussagen (iv) folgen mit [f ∨ g ≤ a] = [f ≤ a] ∩ [g ≤ a] und [f ∧ g ≤ a] = [f ≤ a] ∪ [g ≤ a]. Korollar 1.29. Sei (Ω, F) ein meßbarer Raum. Dann ist f : Ω → R meßbar genau dann, wenn f + := f ∨ 0 und f − := −(f ∧ 0) meßbar sind. Beweis. Sei f meßbar. Da die Nullfunktion 0 meßbar ist ([0 ≤ c] ist für jedes c ∈ R entweder ∅ oder Ω und beide Mengen sind in F enthalten), sind nach dem obigen Satz f ∨ 0 und f ∧ 0 meßbar, also auch f + und f − . Sind f + und f − meßbare numerische Funktionen, so auch f + − f − = f . Dies zeigt die Behauptung. Satz 1.30. Sei (Ω, F) ein meßbarer Raum und (fn )n∈N eine Familie meßbarer numerischer Funktionen fn : Ω → R. Dann sind (falls definiert) ebenfalls meßbar: (i) supn∈N fn (ii) inf n∈N fn (iii) lim supn→∞ fn (iv) lim inf n→∞ fn T Beweis. Wegen [supn∈N fn ≤ a] = ∞ n=1 [fn ≤ a] und da alle Mengen [fn ≤ a] in F enthalten sind, folgt auch [supn∈N fn ≤ a] ∈ F, d.h. supn∈N fn ist meßbar. Die Aussage über das Infimum folgt mit Übergang zu Komplementen. Wegen lim supn→∞ fn = inf n∈N supm≥n fm und lim inf n→∞ fn = supn∈N inf m≥n fm folgt daraus auch bereits die Meßbarkeit von lim supn→∞ fn und lim inf n→∞ fn . Dass in der Situation von oben unter speziellen Bedingungen auch limn→∞ fn wieder eine meßbare Funktion ist, ist richtig. Jedoch sind zum Beweis Voraussetzungen nötig, die wir momentan noch nicht zur Hand haben. Das nötige Handwerkszeug werden wir zur Verfügung haben, wenn wir Maße, Maßräume und vollständige Maßräume studiert haben. 14 1.6 KAPITEL 1. MASSTHEORETISCHE GRUNDLAGEN Maße und verwandte Begriffe Sei wieder Ω 6= ∅ eine Grundmenge. In diesem Abschnitt werden wir Maße auf meßbaren Räumen einführen. Definition 1.31. Sei S ein Semiring in Ω. Eine Abbildung µ : S → R heißt ein Inhalt, falls gilt: (i) µ(∅) = 0 (ii) µ ≥ 0 (iii) µ d.h. sind AP 1 , . . . , An ∈ S paarweise disjunkt mit Snist endlich additiv, S n n i=1 µ(Ai ). i=1 Ai ∈ S, so gilt µ( i=1 Ai ) = µ heißt ein σ-additiver Inhalt oder auch ein jede FamiS∞Prämaß, falls für S ∞ A ∈ S gilt: µ( lie (A ) disjunkter Mengen aus S mit i=1 Ai ) = i=1 i P∞ n n∈N i=1 µ(Ai ). Ist S sogar eine σ-Algebra, so heißt ein Prämaß ein Maß. Ist der Bildbereich von µ bereits durch R gegeben, so spricht man von einem reellen Inhalt, Prämaß bzw. Maß. Ist ferner F eine σ-Algebra in Ω und µ : F → R ein Maß auf F, so nennen wir das Tripel (Ω, F, µ) einen Maßraum. Bemerkung 1.32. Inhalte, Prämaße und Maße sind ganz spezielle numerische Funktionen. Offensichtlich ist jedes Maß gleichzeitig ein Prämaß und jedes Prämaß ist ein Inhalt. Wir erinnern uns daran, dass wir als Erzeugendensystem der σ-Algebra der Borelschen Teilmengen auf R z.B. die Menge aller halboffenen Intervalle der Form (a, b] wählen konnten. Die Menge dieser Intervalle bildete einen Semiring. Das σ-Erzeugnis dieses Semirings war dann gerade die σ-Algebra der Borelschen Teilmengen auf R. Ähnlich wie wir einen Semiring zu einer σ-Algebra erweitert haben, werden wir auch bei der Definition von Maßen auf σ-Algebren vorgehen. Zunächst betrachten wir einen Semiring und einen Inhalt auf diesem Semiring. Dann werden wir sehen, dass wir den Inhalt auf dem Semiring unter geeigneten Voraussetzungen zu einem Maß auf derjenigen σ-Algebra fortsetzen können, die von dem betreffenden Seminring erzeugt wird. Satz 1.33. (Erster Fortsetzungssatz) Sei S ein Semiring in Ω sowie µ : S → R ein Inhalt. Dann kann µ in eindeutiger Weise zu einem genauso bezeichneten Inhalt µ : R(S) → R auf den von S erzeugten Ring R(S) fortgesetzt werden. Ist dabei µ ein reeller Inhalt auf S, so ist auch seine Fortsetzung ein reeller Inhalt auf R(S). Ist µ σ-additiv auf S, so auch seine Fortsetzung auf R(S). 1.6. MASSE UND VERWANDTE BEGRIFFE 15 Beweis. Während des Beweises bezeichnen wir die Fortsetzung des Inhalts µ mit µ. Sei R := R(S). Nach Satz 1.7 ist der von dem Semiring S erzeugte Ring R(S) gerade das System aller endlichen Vereinigungen V von paarweise disjunkten Mengen aus S. Für eine beliebige Menge A ∈ RSexistieren also stets n endlich viele disjunkte Mengen Pn A1 , . . . , An ∈ S mit A = i=1 Ai . Wir können daher definieren: µ(A) := i=1 µ(Ai ). Zeigen wir, dass diese Definition nicht von der Wahl der Darstellung von A als disjunkte Vereinigung endlich vieler Mengen Smabhängt, so haben wir auf diese Weise einen Inhalt definiert. Sei daher A = i=1 Bi für ebenfalls paarweise disjunkte Mengen B1 , . . . , Bm ∈ S. Dann gilt: µ(A) = n X i=1 µ(Ai ) = n m n X m [ X X µ (Ai ∩ Bj ) = µ(Ai ∩ Bj ). i=1 j=1 i=1 j=1 Pm Pn Ganz analog folgt µ(A) = j=1 i=1 µ(Bj ∩ Ai ), indem man die Rollen der Ai und Bj vertauscht. Also ist µ ein auf ganz R wohldefinierter Inhalt. Ist so folgt nun ν : R → R ein weiterer Inhalt, der auf S mit µ übereinstimmt, Sn für ein beliebiges A ∈ R mit derP üblichen Darstellung A = i=1 Ai , Ai ∈ S Pn n für i = 1, . . . , n gerade ν(A) = i=1 µ(Ai ) = µ(A), also die i=1 ν(Ai ) = behauptete Eindeutigkeit. Ist nun µ reellwertig, so ist auch µ per Definition reellwertig. Es bleibt zu zeigen, dass die Fortsetzung eines σ-additiven Inhalts stets wieder σ-additiv ist. Sei also µ σ-additiv S∞ und (An )n∈N eine Familie paarweise disjunkter Mengen aus R mit V := n=1 An ∈ R. Für jedes An existieren Smn endlich viele paarweise disjunkte Mengen An1 , . . . , Anmn ∈ S mit An = j=1 Anj . Wegen V S ∈ R gibt es ebenso paarweise disjunkte SMengen V1 , . . . , Vm ∈ S S∞ ∞ Smn m mit V = i=1 Vi . Es gilt Vi = n=1 (Vi ∩ An ) = n=1 j=1 (Vi ∩ Anj ) und da mit Vi , Anj ∈ S P auch P Vi ∩ Anj ∈ S gilt, folgt mit derSσ-Additivität von ∞ mn m µS gerade µ(Vi ) = nj ). Wegen V = n=1 i=1 Vi ergibt sich Pm j=1 µ(Vi ∩ PA ∞ m P∞ Pmn µ( n=1 An ) = µ(V ) = i=1 µ(Vi ) = i=1 n=1 j=1 µ(Vi ∩ Anj ), woraus sich die behauptete σ-Additivität von µ ergibt. Beispiel 1.34. Alle Wahrscheinlichkeitsmaße sind Inhalte, Prämaße und Maße. Betrachten wir Ω = [0, 1] ∩ Q und S := {(a, b] ∩ Q, (a, b) ∩ Q, [a, b) ∩ Q, [a, b] ∩ Q | a, b ∈ [0, 1]} so ist S ein Semiring und vermöge µ(I) := (b − a)+ wird ein Inhalt auf S definiert. Dieser ist allerdings S nicht σ-additiv, denn es gilt µ(Ω) = µ([0, 1]∩ Q) = 1−0 = 1, aber [0, 1]∩Q = x∈[0,1]∩Q {[x, x]} ist eine abzählbare Vereinigung disjunkter Mengen und µ([x, x]) = 0. Wäre µ σ-additiv, so folgt µ([0, 1] ∩ Q) = P d d x∈[0,1]∩Q µ([x, x]) = 0. Ist ferner Ω = R und S := I(] , so wird vermöge Qd Qd λ((a, b]) := i=1 λ(ai , bi ] := i=1 (bi − ai )+ der sogenannte Borel-Lebesguesche Elementarinhalt definiert. Wir werden auf ihn nochmals zurückkommen. 16 KAPITEL 1. MASSTHEORETISCHE GRUNDLAGEN Wir wollen nun einige weitere elementare Eigenschaften von Inhalten zusammentragen, die uns später noch von Nutzen sein werden. Lemma 1.35. Sei S ein Semiring in Ω und µ : S → R ein Inhalt. Dann gilt: (i) Sind A, B ∈ S mit A ⊆ B, so gilt µ(A) ≤ µ(B). S P (ii) Für je endlich viele A1 , . . . , An ∈ S, n ∈ N, gilt µ( ni=1 Ai ) ≤ ni=1 µ(Ai ). (iii) Sind A, B ∈ S mit A ∪ B ∈ S, so gilt µ(A ∪ B) = µ(A) + µ(B) − µ(A ∩ B). Beweis. Per Definition des Semiringes erhalten wir die Darstellung B = A ∪ Sn i=1 Ai für paarweise disjunkte A1 , . . . , An ∈ S, die P ebenfalls disjunkt zu A gewählt werden können. Dann gilt µ(B) = µ(A) + ni=1 µ(Ai ), woraus wegen µ ≥ 0 sofort die Behauptung aus (i) folgt. Behauptung (ii) zeigen wir nur für den Fall n = 2: Sind A1 , A2 ∈ S, so gibt es wieder entsprechende S paarweise disjunkte Mengen BS1 , . . . , Bn und C1 , . . . , Cm mit A1 = (A1 ∩ A2 ) ∪ ni=1 SnBi und m = (A1 ∩ A2 ) P ∪ i=1 Bi ∪ A2 = (A1 ∩ A2 ) ∪ j=1 Cj . Dann gilt aber A1 ∪ A2P S m n m µ(B ) + C und es folgt µ(A ∪ A ) = µ(A ∩ A ) + 1 2 1 j=1 µ(Cj ). i=1 P i j=1 j P2n m Ferner gilt µ(A1 ) + µ(A2 ) = 2 · µ(A1 ∩ A2 ) + i=1 µ(Bi ) + j=1 µ(Cj ), woraus im Fall n = 2 die Behauptung folgt. Die Verallgemeinerung auf endlich viele Mengen A1 , . . . , An wird mit analogen Schlüssen bewiesen. Die Behautung aus (iii) folgt sofort durch Vergleich der drei Summendarstellungen für µ(A1 ), µ(A2 ) und µ(A1 ∪ A2 ). Die obigen Eigenschaften erinnern uns wieder stark an die Eigenschaften eines Wahrscheinlichkeitsmaßes und sind daher auch nicht überraschend. Lemma 1.36. Sei R ein Ring in Ω und µ : S R → R ein Inhalt. Dann gilt für System (An )n∈N ⊆ R mit ∞ n=1 An ∈ R die Abschätzung P∞jedes disjunkte S∞ µ(A ) ≤ µ( A ). n n=1 n=1 n Sn S∞ Beweis. Für alle n ∈ N gilt A ⊆ i i=1 i=1 Ai . Mit obigem Lemma folgt daher Sn S∞ µ( i=1 Ai ) ≤ µ( i=1 AS i ). Da R ein Ring ist, sind endliche Vereinigungen in R n enthalten und es gilt Pn i=1 Ai ∈ R für S alle n ∈ N. S Da die Mengen paarweise disjunkt sind, folgt i=1 µ(Ai ) = µ( ni=1 Ai ) ≤ µ( ∞ i=1 Ai ). Grenzübergang für n → ∞ liefert somit die Behautung. Wenn µ σ-additiv, also ein Prämaß, ist, so gilt per Definition im obigen Lemma die Gleichheit. Bei nicht-σ-additiven Inhalten steht dort eine echte Ungleichung. Für Prämaße erhalten wir die folgende, allgemeinere Aussage: 1.6. MASSE UND VERWANDTE BEGRIFFE 17 Lemma 1.37. Sei R ein Ring in Ω und µ : R → R ein S∞Prämaß auf R. Dann gilt für alle P A ∈ R und alle (An )n∈N ⊆ R mit A ⊆ n=1 An die Ungleichung µ(A) ≤ ∞ n=1 µ(An ). Der Beweis wird ganz ähnlich zu dem Beweis des obigen Lemmas geführt. Wir führen ihn hier nicht durch. Ebenso ohne ausführlichen Beweis geben wir die folgende Charakterisierung von σ-Additivität mit Hilfe von Stetigkeit an: Satz 1.38. Sei R ein Ring in Ω und µ : R → R ein Inhalt. µ ist genau dann ein Prämaß, wenn für jedes A ∈ R und für jede montone Folge (An )n∈N ⊆ R mit An ↑ A gilt: µ(An ) ↑ µ(A). Ist µ sogar reellwertig, so sind äquivalent: (a) µ ist ein Prämaß. (b) Für jedes A ∈ R und für jede montone Folge (An )n∈N ⊆ R mit An ↑ A gilt: µ(An ) ↑ µ(A). (c) Für jedes A ∈ R und für jede montone Folge (An )n∈N ⊆ R mit An ↓ A gilt: µ(An ) ↓ µ(A). (d) Für jede montone Folge (An )n∈N ⊆ R mit An ↓ ∅ gilt: µ(An ) ↓ 0. Beweis. Wir skizzieren die Idee: Sei A ∈ R und (An )n∈N ⊆ R mit An ↑ A. Betrachte die Disjunktifizierung A = A1 ∪ (A2 \ A1 ) ∪ (A3 \ A2 ) ∪ (A4 \ A3 ) ∪ . . . . |{z} | {z } | {z } | {z } =:B1 =:B2 =:B3 =:B4 Ist µ σ-additiv, so gilt: µ(A) = ∞ X n=1 µ(Bn ) = lim m→∞ m X µ(Bn ) = lim µ m→∞ n=1 m [ Bn . n=1 S Wegen m n=1 Bn = Am folgt also µ(A) = limm→∞ µ(Am ). Umgekehrt erfülle µ die Stetigkeitsbedingung. Sei (An )n∈N eine Folge S Sm paarweise disjunkter Mengen aus R mit A := ∞ A ∈ R. Setze B := m n=1 n n=1 An . Dann ist (Bm )m∈N eine monoton wachsende Mengenfolge mit Bm ↑ A. Es folgt nach Voraussetzung µ(Bm ) → µ(A) für m → ∞. Da µ als Inhalt endlich additiv ist, erhalten wir µ(Bm ) = µ m [ n=1 m X An = µ(An ) n=1 18 KAPITEL 1. MASSTHEORETISCHE GRUNDLAGEN und damit µ ∞ [ An = µ(A) = lim µ(Bm ) = lim n=1 m→∞ m→∞ m X n=1 µ(An ) = ∞ X µ(An ), n=1 also die behauptete σ-Additivität. Alle anderen Aussagen folgen mit analogen Schlüssen. Wir wollen nun daran arbeiten, wie man ein Prämaß zu einem Maß fortsetzen kann. Der erste Fortsetzungssatz 1.33 lieferte die Aussage, dass sich jeder Inhalt auf einem Semiring in eindeutiger Weise unter Erhalt seiner wesentlichen Eigenschaften (z.B. der σ-Additivität) zu einem Inhalt auf den von dem Seminring erzeugten Ring fortsetzen läßt. Da die σ-Additivität bei diesem Fortsetzungsprozeß erhalten bleibt, kann auch jedes Prämaß auf einem Semiring zu einem eindeutig bestimmten Prämaß auf den vom Semiring erzeugten Ring fortgesetzt werden kann. Die Konstruktion der Fortsetzung eines Prämaßes auf einem Ring hin zu einem Maß auf einer σ-Algebra geht auf Caratheodory zurück und wird hier im folgenden skizziert, wobei wir nicht immer alle Beweise bis ins kleinste Detail durchführen. Alle Beweise finden sich z.B. in dem Buch Maß- und Integrationstheorie von Heinz Bauer. Zunächst benötigen wir den Begriff des äußeren Maßes: Definition 1.39. Wir nennen eine Abbildung µ? : ℘(Ω) → R ein äußeres Maß auf Ω oder auch ℘(Ω), wenn gilt: (i) µ? (∅) = 0 (ii) µ? ≥ 0 (iii) Sind A, B ∈ ℘(Ω) mit A ⊆ B, so gilt stets µ? (A) ≤ µ? (B). S P∞ ? (iv) Für jede Folge (An )n∈N ⊆ ℘(Ω) gilt µ? ( ∞ n=1 An ) ≤ n=1 µ (An ). Bemerkung 1.40. Vergessen wir für einen Moment, dass ein äußeres Maß auf der gesamten Potenzmenge von Ω definiert sein muss, so stellen wir fest dass jedes Prämaß auf einem Ring R per Definition die Eigenschaften (i) und (ii) erfüllt. Nach Lemma 1.35 erfüllt ein Prämaß auch die Monotonieforderung aus (iii). Eigenschaft (iv) ist für jedes Prämaß nach Lemma 1.37 gegeben. Ferner ist jedes auf ganz ℘(Ω) definierte Maß ein äußeres Maß. Die Umkehrung ist falsch, wie das folgende Beispiel zeigt. 1.6. MASSE UND VERWANDTE BEGRIFFE 19 Beispiel 1.41. Sei Ω = {1, 2} und ( 0 falls A = ∅ µ? (A) := . 1 falls A ∈ ℘(Ω) \ {∅} Offensichtlich ist µ? ein äußeres Maß, denn die Bedingungen (i), (ii) und (iii) der obigen Definition sind in jedem Fall erfüllt. Auch die Monotonieforderung aus (iv) läßt sich leicht verifizieren. Allerdings ist µ? kein Maß, ja nicht einmal sogar ein Inhalt, denn wäre es ein Maß, so müsste gelten 1 = µ? (Ω) = µ? ({1} ∪ {2}) = µ? ({1}) + µ? ({2}) = 1 + 1 = 2. Widerspruch! Definition 1.42. Sei µ? : ℘(Ω) → R ein äußeres Maß. M ∈ ℘(Ω) heißt µ? meßbar, falls für alle A ∈ ℘(Ω) gilt: µ? (A ∩ M ) + µ? (A ∩ M ) = µ? (A). Die Menge aller µ? -meßbaren Mengen bezeichnen wir mit M(µ? ). Den folgenden Satz zitieren wir ohne Beweis: Der Beweis des Satzes ist technisch sehr aufwendig. Satz 1.43. Es sei µ? : ℘(Ω) → R ein äußeres Maß. Dann gilt: (i) M(µ? ) ist eine σ-Algebra. (ii) µ? |M(µ? ) ist ein Maß. Ebenso ohne Beweis geben wir an: Lemma 1.44. Es sei µ : R → R ein Prämaß auf dem Ring R. Für jede Teilmenge A ⊆ Ω sei ∞ o n [ An U(A) := (An )n∈N ⊆ R | A ⊆ n=1 die Menge aller Überdeckungen von A durch jeweils abzählbar viele Vereinigungen von Elementen aus R und o ( n P∞ inf µ(A ) | (A ) ∈ U(A) falls U(A) = 6 ∅ n n n∈N n=1 µ? (A) := ∞ falls U(A) = ∅ Dann gilt: (i) µ? ist ein äußeres Maß. 20 KAPITEL 1. MASSTHEORETISCHE GRUNDLAGEN (ii) R ⊆ M(µ? ) (iii) µ? |R = µ Bemerkung 1.45. (Fortsetzung eines Prämaßes zu einem Maß) Satz 1.43 zusammen mit Lemma 1.44 liefert nun die gewünschte Fortsetzung eines Prämaßes zu einem Maß. Wir starten mit einem Prämaß µ auf einem Ring R. Dann zeigt uns Lemma 1.44 wie wir ein äußeres Maß µ? definieren können, derart, dass µ? auf R mit µ übereinstimmt. Dann betrachten wir µ? auf M(µ? ). Letzteres Mengensystem ist nach Satz 1.43 eine σ-Algebra und µ? ein Maß darauf. Wir wollen uns zum Abschluß dieses Abschnitts noch der Frage der Eindeutigkeit widmen: Ist das gemäß Bemerkung 1.45 definierte Maß die eindeutige Fortsetzung von µ auf M(µ? )? Wie lässt sich M(µ? ) alternativ charakterisieren? Die erste Frage werden wir sofort beantworten. Beim Versuch der Beantwortung der zweiten Frage werden wir auf den Begriff des vollständigen Maßraums treffen. Zunächst aber betrachten wir ein Beispiel, dass zeigt, dass die Forsetzung eines Prämaßes nicht eindeutig sein muss. Beispiel 1.46. Sei Ω 6= ∅ und R = {∅} der triviale Ring. Dann ist durch µ(∅) := 0 ein Prämaß auf R definiert. Die kleinste σ-Algebra, die R umfasst ist {∅, Ω}. Offensichtlich kann nun µ auf diese auf unendlich viele Arten fortgesetzt werden, denn für µ(Ω) kann jede reelle Zahl ≥ 0 gewählt werden. Die Fortsetzung ist also keinesweg eindeutig. Wir beobachten, dass sich Ω jedoch nicht von den Elementen aus R “approximieren” lässt. Der folgende Satz liefert eine Formalisierung dieser Beobachtung. Satz 1.47. (Eindeutigkeitssatz) Sei Z ein durchschnittsstabiles Erzeugendensystem der σ-Algebra A in Ω. Es existiere eine Folge (Zn )n∈N ⊆ Z mit Zn ↑ Ω für n → ∞. Dann gilt für beliebige Maße µ und ν auf A: Ist µ|Z = ν|Z , so folgt bereits µ|A = ν|A . Definition 1.48. Ein Inhalt µ : S → R auf dem Semiring S heißt σ-endlich, falls eine Folge (An )n∈N ⊆ S existiert mit An ↑ Ω für n → ∞ und µ(An ) < ∞ für alle n ∈ N. Da jeder Semiring, der einen Ring erzeugt, stets ein durchschnittsstabiles Erzeugendensystem für den betreffenden Ring ist, erhalten wir als Folgerung aus Satz 1.47: 1.7. VOLLSTÄNDIGE MASSRÄUME 21 Korollar 1.49. Sei S ein Semiring und R := R(S). Jedes σ-endliche Prämaß µ : R → R kann auf genau eine Weise zu einem genauso bezeichneten Maß auf σ(R) fortgesetzt werden. Beweis. Satz 1.43 zusammen mit Lemma 1.44 liefern eine Fortsetzung von µ auf M(µ? ) ⊇ R. Da µ σ-endlich ist, sind die Voraussetzungen aus Satz 1.47 erfüllt. 1.7 Vollständige Maßräume Wir werden in diesem Abschnitt eine alternative Charakterisierung für die σAlgebra M(µ? ) der µ? -meßbaren Mengen finden. Sei wie immer Ω eine Grundmenge. Definition 1.50. Sei R ein Ring in Ω und µ : R → R ein Inhalt auf R. Mit NR := {A ∈ R | µ(A) = 0} bezeichnen wir die Menge der Nullmengen bezüglich µ von R. Mit NR0 := {M ∈ ℘(Ω) | es gibt A ∈ NR mit M ⊆ A} bezeichnen wir die Menge aller Teilmengen von Nullmengen in R. Bemerkung 1.51. In der Notation der obigen Definition gilt: NR ist ein Mengenideal in R, d.h. ∅ ∈ NR , mit A, B ∈ NR folgt auch A ∪ B ∈ NR und ist A ∈ NR und B ∈ R, so folgt stets auch A ∩ B ∈ NR . Klar ist ∅ ∈ NR . Für A ∈ NR und B ∈ R folgt wegen A ∩ B ⊆ A und da µ ein Inhalt ist µ(A ∩ B) ≤ µ(A) = 0, also µ(A ∩ B) = 0. Für A, B ∈ NR erhalten wir µ(A ∪ B) = µ(A) + µ(B) − µ(A ∩ B) = 0 + 0 − 0 = 0. Analog zeigt man auch, dass NR0 ein Mengenideal in ℘(Ω) ist. Desweiteren lässt sich sogar zeigen, dass NR0 ein Mengenteilring von ℘(Ω) ist. Wir erinnern uns, dass σ(R) die kleinste σ-Algebra in ℘(Ω) ist, die R umfasst. Daher erhalten wir zusammen mit der Notation aus dem letzten Abschnitt die Inklusionskette R ⊆ σ(R) ⊆ M(µ? ), wobei µ? das entsprechende äußere Maß bezeichnet, dass wir als Fortsetzung von µ auf die σ-Algebra M(µ? ) nach der Konstruktion von Caratheodory im letzten Abschnitt erhalten hatten. Daraus ergibt sich also NR ⊆ Nσ(R) ⊆ NM(µ? ) 0 0 und NR0 ⊆ Nσ(R) ⊆ NM(µ ?). Wenn wir Maße betrachten, so “schielen” häufig mit einem Auge auf die Wahrscheinlichkeitsmaße, die sich letztendlich einfach als Spezialfälle der hier eingeführten allgemeinen Theorie ergeben sollen. Im Falle von Wahrscheinlichkeits- 22 KAPITEL 1. MASSTHEORETISCHE GRUNDLAGEN maßen P sollte für jede Menge A mit P(A) = 0 auch P(B) = 0 für jede Teilmenge B ⊆ A gelten, wobei A und B stillschweigend als zu demselben Mengensystem gehörig vorausgesetzt werden. Man sagt: Wenn eine Menge von Ereignissen “unmöglich” ist, so sollte rein intuitiv auch jede Teilmenge einer solchen Mengen von unmöglichen Ereignissen mit P meßbar sein und ebenfalls unmöglich sein (also das Maß 0 haben). Leider ist dieser Fall nicht selbstverständlich, wenn wir ein Prämaß von einem Ring auf eine entsprechende größere, den Ring umfassende, σ-Algebra fortsetzen. Wir definieren also zunächst: Definition 1.52. Sei (Ω, F, µ) ein Maßraum. Dann heißt dieser vollständig bezüglich µ, wenn gilt NF0 ⊆ F gilt. Wir nennen dann auch µ ein vollständiges Maß. Ein Maßraum ist also vollständig, wenn genau der in der obigen Bemerkung angesprochene Fall nicht eintreten kann: Ist A ∈ F eine beliebige Nullmenge, so gilt im Falle eines vollständigen Maßraums stets: Jede Teilmenge M ⊆ A ist in F enthalten. Beispiel 1.53. Betrachte Ω := Maß 1 µ(Γ) := 2 0 (0, 2] und F = {∅, (0, 1], (1, 2], Ω} sowie das falls Γ ∈ {(0, 1], (1, 2]} . falls Γ = (0, 2] sonst Dann gilt NF = {∅}, also auch NF0 = {∅}. Damit ist µ ein vollständiges Maß. Betrachtet man dagegen das Maß ( 1 falls 1 ∈ Γ ν(Γ) := , 0 sonst so gilt NF = {∅, (1, 2]}. Da aber beliebige Teilmengen von (1, 2] nicht in F enthalten sind, ist ν kein vollständiges Maß. Wir können allerdings eine Vervollständigung (Ω, F 0 , ν 0 ) von (Ω, F, ν) betrachten mit F 0 := F ∪ ℘((1, 2]) und ν 0 sei wie ν definiert. Dann ist (Ω, F 0 , ν 0 ) ein vollständiger Maßraum. Definition 1.54. Sei (Ω, F, µ) ein Maßraum. Dann heißt (Ω, F 0 , µ0 ) die Vervollständigung von (Ω, F, µ), falls gilt: (i) µ0 ist eine Fortsetzung von µ auf F 0 . (ii) µ0 ist ein vollständiges Maß. 1.8. DAS BOREL-LEBESGUE-MASS UND DAS LEBESGUE-MASS 23 (iii) Jedes vollständige Maß µ, welches µ fortsetzt, ist auch eine Fortsetzung von µ0 . Das zentrale Ergebnis für uns liefert der folgende Satz: Satz 1.55. (Vervollständigung von Maßräumen) Sei µ : F → R ein σendliches Maß auf der σ-Algebra F und µ? das von µ auf der σ-Algebra M(µ? ) der µ? -meßbaren Mengen induzierte Maß. Dann ist (Ω, M(µ? ), µ? ) die Vervollständigung von (Ω, F, µ), d.h. es gilt (Ω, F 0 , µ0 ) = (Ω, M(µ? ), µ? ). 1.8 Das Borel-Lebesgue-Maß Lebesgue-Maß und das Wir betrachten den Erzeuger I(]d einer Borel-σ-Algebra und setzen wie zuvor Q λd (a, b) := di=1 (bi − ai )+ für a, b ∈ Rd . Dann gilt: Lemma 1.56. Sei λd der wie oben angegebene Borel-Lebesguesche Elementarinhalt. Die eindeutig bestimmte gleichbezeichnete Fortsetzung von λd auf R(I(]d ) ist σ-additiv, d.h. ein Prämaß. Ferner ist λd σ-endlich. Den technischen Beweis der σ-Additivität führen wir hier nicht durch. Der Trick besteht im wesentlichen darin, dass man nur die Nullstetigkeit von λd im Sinne von Satz 1.38 zeigen muss und dabei spezielle Eigenschaften kompakter Mengen im Rn geschickt in einem Widerspruchsbeweis ausnutzt. Die σ-Endlichkeit von λd folgt aus der Tatsache λd ((−n · 1, n · 1]) = (2 · n)d < ∞ für alle n ∈ N, wobei (−n · 1, n · 1] ↑ Ω = Rd . Definition 1.57. Für jedes d ∈ N heißt die eindeutig bestimmte Fortsetzung von λd von R(I(]d ) auf ganz B(Rd ) das Borel-Lebesgue-Maß auf Rd und dessen Vervollständigung (λd )0 das Lebesgue-Maß auf der σ-Algebra B(Rd )0 der Lebesgue-meßbaren Mengen. 24 KAPITEL 1. MASSTHEORETISCHE GRUNDLAGEN Kapitel 2 Grundlagen der Integrationstheorie Wie im vorhergehenden Kapitel bezeichne Ω 6= ∅ stets eine Grundmenge. Wir führen die folgende Sprechweise ein, die wir von nun an häufiger gebrauchen werden: Definition 2.1. Sei (Ω, F, µ) ein Maßraum und P ein Prädikat über Ω. Dann sagen wir die Eigenschaft P gilt µ-fast-überall falls die Menge {ω ∈ Ω | P (ω) ist falsch} eine Nullmenge bezüglich µ ist. 2.1 Approximation durch Treppenfunktionen Sei (Ω, F, µ) ein Maßraum. Wir wollen uns in diesem Abschnitt ein wenig mit Treppenfunktionen beschäftigen. Eine Treppenfunktion ϕ : Ω → R ist von der Pn Form ϕ = i=1 ci · 1Ei für E1 , . . . , En ∈ ℘(Ω) und reelle Zahlen c1 , . . . , cn . Diese Funktionen werden später bei der Definition des Lebesgue-Integrals sehr hilfreich sein. Es gilt: Satz Pn 2.2. Sei (Ω, F, µ) ein Maßraum. Eine Treppenfunktion ϕ : Ω → R, ϕ = i=1 ci ·1Ei , ist genau dann meßbar, wenn alle Mengen E1 , . . . , En meßbar sind, d.h. falls Ei ∈ F für i = 1, . . . , n gilt. Beweis. O.B.d.A. dürfen wir ci < ci+1 Snannehmen und voraussetzen, dass Ei ∩ Ej = ∅ für alle i 6= j gilt sowie Ω = i=1 Ei . Sei α ∈ R beliebig. Dann gibt es ein j mit cj ≤ α < cj+1 . Es ist [ϕ ≤ α] die Menge Sj aller ω, die in E1 oder E2 oder usw. oder in Ej liegen. Also gilt [ϕ ≤ α] = i=1 Ei und [ϕ ≤ α] ∈ F genau dann, wenn alle E1 , . . . , Ej in F liegen. Dies zeigt die Behauptung. 25 26 KAPITEL 2. GRUNDLAGEN DER INTEGRATIONSTHEORIE Der folgende Satz besagt, dass sich jede meßbare Funktion stets durch eine Folge von meßbaren Treppenfunktionen approximieren lässt. Satz 2.3. (Approximation meßbarer Funktionen durch Treppenfunktionen) Sei f : Ω → R eine meßbare numerische Funktion. Dann existiert eine Folge (ϕn )n∈N von meßbaren Treppenfunktionen mit ϕn (ω) → f (ω) für alle ω ∈ Ω (“punktweise Konvergenz”). Gilt f (ω) ≥ 0 für ein ω ∈ Ω, so ist (ϕn (ω))n∈N eine monton nicht fallende Folge reeller Zahlen. Ist f beschränkt, so konvergiert (ϕn )n∈N sogar gleichmäßig gegen f . Beweis. Der Trick besteht darin, die Funktion f in Positiv- und Negativteil zu zerlegen, d.h. f in der Form f = f + − f − mit f + , f − ≥ 0 zu schreiben und sich o.B.d.A. auf eine Funktion f ≥ 0 zu beschränken. Definiere dann zu jedem n ∈ N die Mengen i i−1 (i) En := ω ∈ Ω | n ≤ f (ω) < n 2 2 für i = 1, . . . , n · 2n und Fn := {ω ∈ Ω | f (ω) ≥ n}. Die Folge der Treppenfunktionen erhalten wir dann vermöge n ϕn := n·2 X i−1 i=1 2n · 1En(i) + n · 1Fn . (i) Da f meßbar ist, sind alle Mengen En und Fn meßbar und folglich nach dem obigen Satz auch ϕn für jedes n ∈ N. Die punktweise Konvergenz zeigt man nun wie folgt: Ist ω ∈ Ω mit f (ω) = ∞, so ist ω ∈ Fn für alle n ∈ N und ϕn (ω) → ∞ für n → ∞. Ist ω ∈ Ω mit f (ω) < ∞, so existiert für alle hinreichend großen ≤ 21n und 2in − f (ω) ≤ 21n . Es folgt n ∈ N ein Index 1 ≤ i ≤ n · 2n mit f (ω) − i−1 2n |f (ω) − ϕn (ω)| ≤ 21n → 0 für n → ∞. Die Monotonieaussage ist per Definition von ϕn klar. Sei nun f beschränkt und ε > 0 beliebig aber fest vorgegeben. Wähle n ∈ N mit f < n und 21n < ε. Es gilt dann Fn = ∅. Folglich existiert zu (i) jedem ω ∈ Ω ein Index 1 ≤ i ≤ n · 2n mit ω ∈ En und wir erhalten wie oben |f (ω) − ϕn (ω)| ≤ 21n < ε, also die gleichmäßige Konvergenz. 2.2 Weitere Konvergenzaussagen Wir werden nun im wesentlichen zwei Resultate kennenlernen, die sich auf die Konvergenz von meßbaren numerischen Funktionen beziehen. Wir hatten bereits in Kapitel I gesehen, dass Infima, Suprema, Limites Inferia und Limites 2.2. WEITERE KONVERGENZAUSSAGEN 27 Superia von meßbaren numerischen Funktionenfolgen stets wieder meßbare numerische Funktionen sind. Die Aussage, dass auch der Limes von meßbaren Funktionen wieder eine meßbare Funktion ergibt bedarf der Vollständigkeit des zugrundeliegenden Maßraums wie der Beweis des folgenden Satzes zeigt. Satz 2.4. Sei (Ω, F, µ) ein vollständiger Maßraum und (fn )n∈N eine Folge meßbarer numerischer Funktionen fn : Ω → R für alle n ∈ N. Ist f : Ω → R eine Funktion mit limn→∞ fn (ω) = f (ω) für fast alle ω ∈ Ω, so ist f meßbar. Beweis. Sei A := {ω ∈ Ω | limn→∞ fn (ω) 6= f (ω)}. Dann ist A eine Nullmenge, d.h. µ(A) = 0. Da nach Voraussetzung der Vollständigkeit des Maßraums (Ω, F, µ) jede Nullmenge B ⊆ A aus ℘(Ω) ebenfalls in F enthalten ist, ist f |A : A → R meßbar bezüglich der σ-Algebra F ∩ A. Da für alle ω ∈ Ω \ A gilt limn→∞ fn (ω) = f (ω), folgt auch lim inf n→∞ fn (ω) = f (ω). Wir hatten in Satz 1.30 gesehen, dass der Limes-Inferior einer Folge meßbarer numerischer Funktionen eine meßbare Funktion liefert. Daher ist f : Ω \ A → R meßbar, also auch f : Ω → R. Wir wollen nun einen weiteren Konvergenzbegriff kennenlernen, der sich als ein wenig schwächer als punktweise Konvergenz herausstellen wird: Definition 2.5. Sei (Ω, F, µ) ein Maßraum und (fn )n∈N eine Folge meßbarer numerischer Funktionen fn : Ω → R für alle n ∈ N sowie f : Ω → R meßbar. Wir sagen, (fn )n∈N konvergiert dem Maß µ nach gegen f , kurz fn ⇒ f , falls wir für jedes ε > 0 erhalten: limn→∞ µ([|fn − f | ≥ ε]) = 0. Satz 2.6. (Lebesgue) Sei (Ω, F, µ) ein vollständiger Maßraum mit µ(Ω) < ∞ und (fn )n∈N eine Folge meßbarer numerischer Funktionen fn : Ω → R für alle n ∈ N sowie f : Ω → R eine numerische Funktion. Ferner seien f, fn fast überall endlich für alle n ∈ N. Gilt dann fn (ω) → f (ω) für fast alle ω ∈ Ω, so gilt auch fn ⇒ f . Beweis. O.B.d.A. dürfen wir f ≥ 0 voraussetzen. Als Limes meßbarer Funktionen ist f nach dem vorhergehenden Satz meßbar. Wir definieren nun die Mengen A := {ω ∈ Ω | f (ω) = ∞} und An := {ω ∈ Ω | fn (ω) = ∞} S für alle n ∈ N. Ferner sei B := {ω ∈ Ω | limn→∞ fn (ω) 6= f (ω)}. Dann ist Q := ∞ n=1 An ∪A∪B eine Nullmenge, d.h. µ(Q) = 0. Für alle S∞n ∈ N definiere nun En (ε) T∞:= {ω ∈ Ω | |fn (ω) − f (ω)| ≥ ε} und Rn (ε) := k=n Ek (ε), sowie M (ε) := n=1 Rn (ε). Wir müssen zeigen, dass gilt: limn→∞ µ(En (ε)) = 0. Da fn und f meßbar sind für alle n ∈ N, sind M (ε), En (ε) und Rn (ε) sämtlich in F enthalten. Ferner gilt R1 (ε) ⊇ R2 (ε) ⊇ R3 (ε) ⊇ . . ., d.h. (Rn (ε))n∈N ist eine monoton fallende 28 KAPITEL 2. GRUNDLAGEN DER INTEGRATIONSTHEORIE Mengenfolge mit Limes M (ε) in F. Wegen µ(Ω) < ∞ und der Stetigkeit des Maßes µ folgt daher aus Rn (ε) ↓ M (ε) gerade µ(Rn (ε)) → µ(M (ε)). Wir zeigen nun M (ε) ⊆ Q. Sei ω0 ∈ / Q. Nach Konstruktion von Q gilt fn (ω0 ), f (ω0 ) < ∞ für alle n ∈ N und fn (ω0 ) → f (ω0 ) für n → ∞. Zu jedem ε > 0 existiert also ein Index n0 mit ω0 ∈ Rn0 (ε) und ω0 ∈ / Rn0 +1 (ε). Dann folgt aber ω0 ∈ / M (ε), also M (ε) ⊆ Q. Da µ vollständig ist und M (ε) ∈ F folgt damit µ(M (ε)) ≤ µ(Q) = 0, also µ(M (ε)) = 0. Es folgt limn→∞ µ(Rn (ε)) = µ(M (ε)) = 0 und wegen En (ε) ⊆ Rn (ε) folgt limn→∞ µ(En (ε)) = 0. Bemerkung 2.7. Die Umkehrung des Satzes von Lebesgue gilt nicht, d.h. punktweise Konvergenz ist wirklich der stärkere Konvergenzbegriff als Konvergenz dem Maße nach. Betrachte dazu Ω := [0, 1) mit dem Lebesgue-Maß λ (i) (i) und die Mengen Ek := [ i−1 , ki ) für 1 ≤ i ≤ k und k ∈ N sowie fk := 1E (i) . k k Dann gilt einerseits für alle 0 < ε < 1: (i) (i) λ([|fk | ≥ ε]) = λ(Ek ) = (i) 1 →0 k (i) für k → ∞, also fk ⇒ 0 für k → ∞. Angenommen, es gelte fk (ω) → 0 für k → ∞ und alle ω ∈ Ω \ N , wobei N ⊆ Ω eine Nullmenge ist. Wähle dann ein (i ) beliebiges ω0 ∈ Ω\N . Dann gibt es zu jedem k ∈ N einen Index ik mit ω0 ∈ Ek k , (1) (k) (i ) denn für jedes k gilt Ek ∪ . . . ∪ Ek = Ω. Folglich gilt für die Teilfolge (fk k )k∈N (i ) (i) gerade fk k (ω0 ) = 1 für alle k ∈ N, d.h. (fk )k∈N kann nicht punktweise gegen die Nullfunktion konvergieren. Ebenso kann auch die Forderung µ(Ω) < ∞ nicht entfallen, denn betrachten wir z.B. Ω := [0, ∞) mit dem Lebesgue-Maß λ und fn (ω) := (ω + n1 )2 sowie f (ω) := ω 2 . Dann gilt fn (ω) → f (ω) punktweise für alle ω ∈ Ω, aber i h 2ω 1 λ([|fn − f | ≥ ε) = λ + 2 ≥ ε = ∞, n n da ω ∈ [0, ∞). Falls µ nicht als vollständiges Maß vorausgesetzt wird, so muss die Meßbarkeit der Funktion f zusätzlich gefordert werden. 2.3 Das Lebesgue-Integral In diesem Abschnitt kommen wir nun endlich zur Definition des gewünschten allgemeinen Integral-Begriffs. 2.3. DAS LEBESGUE-INTEGRAL 29 Definition 2.8. Sei (Ω, F, µ) ein Maßraum und f : E ⊆ F → R eine meßbare, nichtnegative Funktion sowie n n o X Tf := ϕ = ci · 1Ei | n ∈ N, ci ∈ R+ , E ⊆ F, ϕ ≤ f i 0 i=1 die Menge aller Treppenfunktionen, die punktweise kleiner oder gleich der Funktion f sind. Dann heißt Z n X f d µ := sup ci · µ(Ei ∩ E) ϕ∈Tf E i=1 das Lebesgue-Integral der Funktion f auf E. Bemerkung 2.9. Ist f eine beschränkte Funktion, etwa −∞ < m := inf ω∈E f (ω) und M := supω∈E f (ω) < ∞, so ist folgende Definition des Lebesgue-Integrals äquivalent zu der obigen Definition: Zu einer jeden Zerlegung Z := {y1 , . . . , yn } des Intervalls [m, M ] mit m = y1 < y2 < . . . < yn = M definieren wir die Mengen Ei := {ω ∈ E | yi ≤ f (ω) < yi+1 }, i = 1, . . . , n − 1 und En := {ω ∈ E | f (ω) = yn = M }. Dann gilt für das Lebesgue-Integral: Z n X f d µ = sup yi · µ(Ei ), Z E i=1 wobei sich das Supremum über alle Zerlegungen Z des Intervalls [m, M ] erstreckt. Wichtig ist zu beachten, dass das Lebesgue-Integral durchaus den Wert ∞ annehmen kann. Wir können die Definition des Lebesgue-Integrals auf nahezu beliebige meßbare Funktionen ausweiten: Definition 2.10. Sei (Ω, F, µ) ein Maßraum und f : E ⊆ F → R eine meßbare Funktion sowie f + :=Rf ∨ 0 und f − := −(fR ∧ 0) die Zerlegung von f in Positivund Negativteil. Gilt E f + d µ < ∞ oder E f − d µ < ∞, so definieren wir Z Z Z + f d µ := f dµ − f − d µ. E E E 30 KAPITEL 2. GRUNDLAGEN DER INTEGRATIONSTHEORIE R R Falls E f + d µ < ∞ und E f − d µ < ∞ gilt, so nennen wir f summierbar auf E bezüglich µ. Die Menge aller bezüglich µ summierbaren Funktionen auf E bezeichnen wir im folgenden mit L(E, µ). Schon das folgende Beispiel zeigt, dass das Lebesgue-Integral um ein Vielfaches “robuster” ist als das Riemann-Integral: Beispiel 2.11. Sei Ω := R und E := [0, 1] versehen mit dem Lebesgue-Maß λ. Wir betrachten f := 1E∩Q . Dann ist f sicherlich nicht Riemann-integrierbar auf E, aber wir erhalten für das Lebesgue-Integral Z Z f dλ = 1E∩Q d λ = 0, E E denn: Ist Z := {y1 , . . . , yn } eine beliebige Zerlegung des Intervalls [0, 1] mit 0 = y1 < y2 < . . . < yn = 1, so gilt für 2 ≤ i < n: Ei = {ω ∈ [0, 1] | yi ≤ f (ω) < yi+1 } = ∅ und E1 = {ω ∈ [0, 1] | 0 ≤ f (ω) < y2 } = [0, 1] \ Q sowie En = {ω ∈ [0, 1] | f (ω) = 1} = [0, 1] ∩ Q. S Es gilt aber En = q∈[0,1]∩Q {q} ist eine abzählbare Vereinigung von Einpunktmengen, die bezüglich des Lebesgue-Maßes das Maß Null haben. Es folgt λ(En ) = 0. Ferner gilt λ(E1 ) = λ([0, 1]) − λ(Q) = 1, da Q abzählbar ist. Da sowieso λ(Ei ) = 0 für 2 ≤ i < n gilt, folgt also für jede Summe der Form n X yi · λ(Ei ) = y1 · λ(E1 ) = 0 · 1 = 0. i=1 Damit ist der Wert des Lebesgue-Integrals in der Tat = 0. P Lemma 2.12. Sei (Ω, F, µ) ein Maßraum und ϕn = ni=1 ci · 1Ei eine Treppenfunktion mit Ei ⊆ F für i = 1, . . . , n. Dann gilt für E ⊆ F: Z ϕn d µ = E n X ci · µ(E ∩ Ei ). i=1 Beweis. Folgt sofort aus der “ersten Definition” des Lebesgue-Integrals. 2.3. DAS LEBESGUE-INTEGRAL 31 Satz 2.13. (Eigenschaften des Lebesgue-Integrals) Sei (Ω, F, µ) ein Maßraum. (i) Ist f : E ⊆ F → R mit m ≤ f (ω) ≤ M für fast alle ω ∈ E, so gilt: Z m · µ(E) ≤ f d µ ≤ M · µ(E). E (ii) Seien f, g ∈ L(E, µ) und c ∈ R. Dann gilt f + g, c · f ∈ L(E, µ) und Z Z Z Z Z (f + g) d µ = f dµ + g d µ sowie (c · f ) d µ = c · f d µ. E E E E E Damit wird L(E, µ) zu einem linearen Raum. (iii) Sei A ⊆ E meßbar und f ≥ 0. Dann gilt Z Z f d µ. f dµ ≤ E A (iv) Aus 0 ≤ f (ω) ≤ g(ω) für alle ω ∈ E folgt Z Z g d µ. f dµ ≤ 0≤ E (v) Ist f ≥ 0 mit R E E f d µ = 0, so folgt f (ω) = 0 für fast alle ω ∈ E. Beweis. Die Aussagen (i) bis (iv) folgen unmittelbar aus der Definition des Lebesgue-Integrals, wobei bei beschränkten Funktionen auf die zur ursprünglichen Definition äquivalente Definition über Zerlegungen des Intervalls [m, M ] zurückgegriffen werden kann. Nicht so leicht einzusehen ist die Aussage aus (v). Wir setzen F := {ω ∈ E | f (ω) > 0} und müssen zeigen, dass F eine µ1 Nullmenge ist. Definiere nun S∞En := {ω ∈ E | f (ω) > n }. Dann gilt En ⊆ En+1 für alle n ∈ N und F = n=1 En . Wegen der Monotonie des Maßes µ folgt µ(En ) ≤ µ(En+1 ) ≤ µ(F ) für alle n ∈ N und folglich limn→∞ µ(En ) = µ(F ). Angenommen, es gelte µ(F ) > 0. Dann existiert ein ε > 0 mit ε < µ(F ) und ein n ∈ N mit µ(En ) > ε. Wegen f (ω) > n1 für alle ω ∈ En folgt damit Z Z Z ε 1 1 0= f dµ ≥ f dµ ≥ · 1En d µ = · µ(En ) > > 0. n n E En En n Widerspruch! Also folgt µ(F ) = 0 und damit die Behauptung. 32 KAPITEL 2. GRUNDLAGEN DER INTEGRATIONSTHEORIE Satz und Definition 2.14. Sei (Ω, F, µ) ein Maßraum. Dann gilt: (i) Ist f : Ω → R eine meßbare numerische Funktion mit f ≥ 0 auf Ω, so ist durch Z ν(A) := f d µ, ∀A ∈ F A ein Maß auf Ω definiert. (ii) Ist f ∈ L(Ω, µ), so ist die Mengenfunktion Z ν(A) := f d µ, ∀A ∈ F A noch immer σ-additiv. Man nennt die Funktion f ≥ 0 in (i) auch die Dichte von ν bezüglich µ. Beweis. (i) Wegen f ≥ 0 auf ganz Ω liefert Satz 2.13(iv) ν(A) ≥ 0 für alle A ∈ F. Ferner gilt offensichtlich ν(∅) = 0. Es bleibt also noch die σ-Additivität zu S∞zeigen. Sei (An )n∈N ⊆ F eine Folge paarweise disjunkter Mengen und A := m=1 Am . Für alle ϕ ∈ Tf gilt nun (mit den üblichen Notationen): Z ϕdµ = A Z X n A = n X ci · n X ci · µ(A ∩ Ei ) = i=1 ∞ X n X ci · µ i=1 ∞ [ (Am ∩ Ei ) m=1 ∞ X n ∞ Z X X µ(Am ∩ Ei ) = ci · µ(Am ∩ Ei ) = m=1 ∞ Z X m=1 ci · 1Ei d µ = i=1 i=1 ≤ m=1 i=1 m=1 ϕdµ Am f dµ Am Bilden wir nun das Supremum über alle ϕ ∈ Tf , so ergibt sich Z f dµ ≤ ν(A) = A ∞ Z X m=1 f dµ = Am ∞ X ν(Am ). m=1 P∞ P Es bleibt zu zeigen: ν(A) ≥ m=1 ν(Am ). Wegen ν(A) ≤ ∞ m=1 ν(Am ) genügt es zu zeigen, dass für zwei Mengen A1 , A2 ∈ F mit A1 ∩ A2 = ∅ gilt: Z Z Z ν(A1 ∪ A2 ) = f dµ = f dµ + f d µ = ν(A1 ) + ν(A2 ). A1 ∪A2 A1 A2 2.3. DAS LEBESGUE-INTEGRAL 33 Wir haben oben bereits gesehen, dass ν(A1 ∪ A2 ) ≤ ν(A1 ) + ν(A2 ) gilt. Umgekehrt gibt es zu jedem ε > 0 Treppenfunktionen ϕ1 , ϕ2 ∈ Tf mit Z Z Z Z f dµ = ϕ1 d µ + ε sowie f dµ = ϕ2 d µ + ε. A1 A1 A2 A2 Nun sei ϕ(ω) := max{ϕ1 (ω), ϕ2 (ω)}. Dann ist auch ϕ eine Treppenfunktion und folglich meßbar. Es folgt: Z Z Z Z ν(A1 ) + ν(A2 ) = f dµ + f dµ = ϕ1 d µ + ε + ϕ2 d µ + ε A1 A2 A1 A2 Z Z Z ≤ ϕdµ + ϕdµ + 2 · ε = ϕdµ + 2 · ε A1 A2 A1 ∪A2 Z ≤ f d µ + 2 · ε = ν(A1 ∪ A2 ) + 2 · ε. A1 ∪A2 Für ε → 0 erhalten wir also ν(A1 ) + ν(A2 ) ≤ ν(A1 ∪ A2 ) und damit insgesamt ν(A1 ∪ A2 ) = ν(A1 ) + ν(A2 ). Daraus folgt, wie oben bereits angedeutet, die σ-Additivität. (ii) Für allgemeines f ∈ L(Ω, µ) zerlege Rf = f + − f − wieder in Positiv- und Negativteil. Wegen f ∈ L(Ω, µ) gilt 0 ≤ E f ± d µ < ∞ für alle E ∈ F. Somit folgt die Behauptung für f ± aus dem ersten Teil dieses Satzes und damit mit Hilfe von Satz 2.13(ii) für f = f + − f − aus der Additivität des Integrals. Korollar 2.15. Sei (Ω, F, µ) ein Maßraum und A, B ∈ F mit B ⊆ A und µ(A \ B) = 0. Sei ferner R f : A → R eine Rmeßbare numerische Funktion. Gilt für eines der Integrale A f d µ < ∞ oder B f d µ < ∞, so gilt dies auch für das zweite Integral und es folgt Z Z f dµ = f d µ < ∞. A B Beweis. O.b.d.A. dürfen wir wieder f ≥ 0 auf A annehmen. Dann folgt wegen µ(A \ B) = 0 gerade Z Z Z Z Z f dµ = f dµ = f dµ + f dµ = f d µ. A B∪(A\B) B A\B B Definition 2.16. Sei (Ω, F, µ) ein Maßraum, E ⊆ F und f, g : E → R meßbare numerische Funktionen. Dann schreiben wir f ∼E g, falls µ({ω ∈ E | f (ω) 6= g(ω)}) = 0, d.h. falls f und g fast überall auf E übereinstimmen bzw. überall bis auf einer Nullmenge auf E übereinstimmen. 34 KAPITEL 2. GRUNDLAGEN DER INTEGRATIONSTHEORIE Korollar 2.17. Sei (Ω, F, µ) ein Maßraum, E ⊆ F und f, g : E → R meßbare numerische Funktionen. Dann gilt: (i) Die Relation ∼E ist eine Äquivalenzrelation. (ii) Sind f, g ∈ L(E, µ) mit f ∼E g, so folgt: Z Z f dµ = g d µ. E E (iii) Ist f ∈ L(Ω, µ), so ist f fast überall endlich. Beweis. Die Aussagen ergeben sich unmittelbar aus den bisher erarbeiteten Resultaten. Wir werden auf die Äquivalenzrelation ∼ nochmals zu sprechen kommen, wenn wir die Lp -Räume in einem der nächsten Abschnitte studieren. Satz 2.18. (“Majorantenkriterium” für Lebesgue-Integrale) Sei (Ω, F, µ) ein Maßraum, E ⊆ F und g, h : E → R meßbare numerische Funktionen mit |g(ω)| ≤ h(ω) für alle ω ∈ E. Ist h ∈ L(E, µ), so ist auch g ∈ L(E, µ) und es gilt Z Z gdµ ≤ h d µ. E E Beweis. O.b.d.A. sei wieder g ≥ 0. Dann folgt die Behauptung sofort aus Tg ⊆ Th . Mit dem folgenden wichtigen Satz schließen wir diesen Abschnitt ab und kommen im nächsten Abschnitt zu Konvergenzaussagen für Lebesgue-Integrale. Satz 2.19. Sei (Ω, F, µ) ein Maßraum und E ⊆ F. Dann gilt f ∈ L(E, µ) genau dann, wenn |f | ∈ L(E, µ). Beweis. Wir zerlegen f in Positiv- und Negativteil, also f = f + − f − . Dann gilt: ( f + (ω) falls ω ∈ A |f (ω)| = f + (ω) + f − (ω) = f − (ω) falls ω ∈ E \ A mit A := {ω ∈ E | f (ω) ≥ 0}. Dann folgt, dass Z Z Z Z Z + − + |f | d µ = f dµ + f dµ = f dµ + f− d µ E A E\A E E genau dann definiert ist, wenn sowohl f + als auch f − Elemente von L(E, µ) sind, d.h. genau dann, wenn f ∈ L(E, µ) gilt. 2.4. GRENZWERTSÄTZE FÜR LEBESGUE-INTEGRALE 2.4 35 Grenzwertsätze für Lebesgue-Integrale In diesem Abschnitt werden wir grundlegende Konvergenzaussagen erarbeiten. Insbesondere werden wir Aussagen über Grenzwerte Lebesgue-integrierbarer Funktionen beweisen können, die für Riemann-integrierbare Funktionen im allgemeinen nicht richtig sind. Satz 2.20. (Satz von Bepo-Levi über monotone Konvergenz) Sei (Ω, F, µ) ein Maßraum, E ⊆ F und (fn )n∈N eine Folge meßbarer numerischer Funktionen fn : E → R mit 0 ≤ f1 (ω) ≤ f2 (ω) ≤ f3 (ω) ≤ . . . für alle ω ∈ E. Dann gilt Z Z lim n→∞ fn d µ = E lim fn d µ. E n→∞ R Beweis. O.B.d.A. sei E fn d µ ≤ C < ∞ für alle n ∈ N. Definiere f : E → R vermöge f (ω) := limn→∞ fn (ω) für alle ω ∈ E. Dann ist f ≥ 0 und f ist meßbar nach Satz 1.30. Setze nun Z fn d µ αn := E für alle n ∈ N. Dann gilt 0 ≤ α1 ≤ α2 ≤ α3 ≤ . . . ≤ C · µ(E). Also ist (αn )n∈N eine beschränkte, monton steigende Folge reeller Zahlen und α := limn→∞ αn existiert und ist endlich. Wegen fn (ω) ≤ f (ω) für alle n ∈ N und alle ω ∈ E folgt Z Z Z lim fn d µ = lim αn ≤ α ≤ f dµ = lim fn d µ. n→∞ n→∞ E E n→∞ E Um die Ungleichung in anderer Richtung zu beweisen, definieren wir für beliebige aber feste c ∈ (0, 1) und ϕ ∈ Tf die Mengen En := En (ϕ, Tf ) := {ω ∈ E | fn (ω) > c · ϕ(ω)} für alle n ∈ N. Da sowohl ϕ als Treppenfunktion aus Tf meßbar ist und jedes fn meßbar ist nach Voraussetzung, folgt En ∈ F. Ferner gilt En ⊆ En+1 ⊆ E. Wegen f S ≥ ϕ auf E existiert zu jedemSω ∈ E ein n ∈ N mit fn (ω) ≥ c · ϕ(ω), ∞ also ω ∈ ∞ m=1 Em . Hieraus folgt E = n=1 En und Z Z Z fn d µ ≥ fn d µ ≥ c · ϕdµ E En En für alle ϕ ∈ Tf und c ∈ (0, 1). Für c → 1 ergibt sich Z Z Z fn d µ ≥ fn d µ ≥ ϕ d µ. E En En 36 KAPITEL 2. GRUNDLAGEN DER INTEGRATIONSTHEORIE Bilden wir nun das Supremum über alle ϕ ∈ Tf , so folgt Z Z lim fn d µ ≥ f d µ. n→∞ E E Satz 2.21. (Satz von Lebesgue über monotone Konvergenz) Sei (Ω, F, µ) ein Maßraum, E ⊆ F und (fn )n∈N eine Folge meßbarer numerischer Funktionen fn : E → R mit f1 (ω) ≤ f2 (ω) ≤ f3 (ω) ≤ . . . für alle ω ∈ E. Gibt es ein m ∈ N mit fm ∈ L(E, µ) und eine numerische Funktion f : E → R mit f (ω) = lim fn (ω) n→∞ für alle ω ∈ E, so folgt Z Z f d µ = lim n→∞ E fn d µ. E Beweis. O.B.d.A. nehmen wir m = 1 an, also f1 ∈ L(E, µ). Dann ist f1 fast überall endlich auf E. Wir können sogar annehmen, dass f1 (ω) < ∞ für alle ω ∈ E gilt, denn ist dies nicht der Fall, so können wir eine Funktion g ∈ L(E, µ) definieren durch ( f1 (ω) falls |f1 (ω)| < ∞ . g(ω) := 0 falls |f1 (ω)| = ∞ Dann stimmen R R f1 und g fast überall überein, d.h. f1 ∼E g und daher auch f d µ = E g d µ. Also im folgenden gelte o.B.d.A., dass f1 (ω) < ∞ für alle E 1 ω ∈ E sei. Wir definieren die Funktionen gn (ω) := fn (ω) − f1 (ω) für alle ω ∈ E. Für alle n ∈ N ist gn als Differenz meßbarer numerischer Funktionen wieder eine meßbare numerische Funktion und es gilt 0 ≤ gn (ω) ≤ gn+1 (ω) für alle ω ∈ E und alle n ∈ N. Sei g(ω) := limn→∞ gn (ω) für alle ω ∈ E. Auf die Folge (gn )n∈N und ihren Limes g können wir den Satz von Bepo-Levi zur monotonen Konvergenz 2.20 anwenden, also Z Z Z lim gn d µ = lim gn d µ = g d µ. n→∞ E n→∞ E E Wegen g = f − f1 und f1 ∈ L(E, µ) erhalten wir dann Z Z Z Z (f − f1 ) d µ = gdµ = lim gn d µ = lim gn d µ n→∞ n→∞ E E E E Z Z = lim fn d µ − f1 d µ , n→∞ also die Behauptung. E E 2.4. GRENZWERTSÄTZE FÜR LEBESGUE-INTEGRALE 37 Bemerkung 2.22. Der Satz von Lebesgue über monotone Konvergenz 2.21 verallgemeinert den Satz über monotone Konvergenz von Bepo-Levi 2.20 von einer monoton wachsenden Folge nicht-negativer Funktionen aus auf eine beliebige Folge monoton wachsender Funktionen aus L(E, µ). Korollar 2.23. Sei (Ω, F, µ) ein Maßraum, E ⊆ F und (fn )n∈N eine Folge meßbarer numerischer Funktionen fn : E → R mit f1 (ω) R ≤ f2 (ω) ≤ f3 (ω) ≤ . . . für alle ω ∈ E. Falls fn ∈ L(E, µ) für alle n ∈R N mit E fn d µ < RC für alle n ∈ N, so gilt für f (ω) := limn→∞ fn (ω) gerade E f d µ = limn→∞ E fn d µ < C, also f ∈ L(E, µ). Mit den nächsten Sätzen werden wir unsere Konvergenzaussagen auf immer allgemeinere Funktionenfolgen aus L(E, µ) ausweiten. Satz 2.24. (Lemma von Fatou) Sei (Ω, F, µ) ein Maßraum, E ⊆ F und (fn )n∈N eine Folge meßbarer numerischer Funktionen fn : E → R. Dann gilt: (i) Ist fn ≥ 0 für alle n ∈ N, so folgt Z Z fn d µ. lim inf fn d µ ≤ lim inf E n→∞ n→∞ E (ii) Ist fn ≤ 0 für alle n ∈ N, so folgt Z Z lim sup fn d µ ≥ lim sup fn d µ. E n→∞ n→∞ E Beweis. Wir zeigen nur (i). Die Behauptung in (ii) folgt ganz analog. Definiere gn (ω) := inf k≥n fk (ω) für alle n ∈ N und ω ∈ E. Dann sind die Funktionen gn , n ∈ N, wieder meßbar nach den üblichen Argumenten und es gilt 0 ≤ g1 (ω) ≤ g2 (ω) ≤ g3 (ω) ≤ . . . sowie per Definition der gn gerade gn ≤ fn für alle n ∈ N. Es folgt mit der Monotonie des Integrals Z Z gn d µ ≤ fn d µ E und für n → ∞ E Z gn d µ ≤ lim inf lim n→∞ Z E n→∞ fn d µ. E Ferner gilt, da die Folge (gn )n∈N monoton wachsend ist lim inf fn (ω) = sup inf fk (ω) = sup gn (ω) = lim gn (ω). n→∞ n∈N k≥n n∈N n→∞ 38 KAPITEL 2. GRUNDLAGEN DER INTEGRATIONSTHEORIE Auf die Folge (gn )n∈N können wir den Satz über monotone Konvergenz von Bepo-Levi 2.20 anwenden. Dies liefert schließlich Z Z Z Z lim inf fn d µ = lim gn d µ = lim gn d µ ≤ lim inf fn d µ, E n→∞ E n→∞ n→∞ n→∞ E E also die Behauptung. Satz 2.25. (Satz von Lebesgue über dominante Konvergenz) Sei (Ω, F, µ) ein Maßraum, E ⊆ F und (fn )n∈N eine Folge meßbarer numerischer Funktionen fn : E → R mit fn (ω) → f (ω) für ein f : E → R für fast alle ω ∈ E. Gibt es ein g ∈ L(E, µ) mit |fn (ω)| ≤ g(ω) für fast alle ω ∈ E, so folgt f ∈ L(E, µ) mit Z Z Z f dµ ≤ E und |f | d µ ≤ E gdµ E Z Z f d µ = lim n→∞ E fn d µ. E Beweis. Es gilt wegen 0 ≤ |fn | ≤ g für alle n ∈ N offensichtlich auch 0 ≤ |f | ≤ g. Mit Hilfe des Majorantenkriteriums für Lebesgue-Integrale 2.18 folgt f, fn ∈ L(E, µ) für alle n ∈ N. Wegen 0 ≤ |fn | ≤ g folgt fn − g ≤ 0 und wir erhalten mit dem Lemma von Fatou 2.24 Z Z Z lim sup(fn − g) d µ = (f − g) d µ. lim sup (fn − g) d µ ≤ n→∞ E E n→∞ E Wegen 0 ≤ |fn | ≤ g folgt ebenso fn +g ≥ 0 und erneute Anwendung des Lemmas von Fatou 2.24 ergibt Z Z Z (f + g) d µ = lim inf (fn + g) d µ ≤ lim inf (fn + g) d µ. E n→∞ E n→∞ E R Insgesamt erhalten wir per Addition bzw. Subtraktion von E g d µ auf beiden Seiten der beiden gewonnenen Ungleichungen die Abschätzung Z Z Z lim sup fn d µ ≤ f d µ ≤ lim inf fn d µ, n→∞ also E n→∞ E Z Z f d µ = lim E n→∞ fn d µ. E E 2.5. VERGLEICH VON RIEMANN- UND LEBESGUE-INTEGRAL 39 Dass der Satz von Lebesgue über dominante Konvergenz nicht auf die Existenz der Majorante verzichten kann, zeigt das folgende Beispiel: Beispiel 2.26. Betrachte die Folge stetiger Funktionen (fn )n∈N mit fn : [0, 1] → R definiert durch 1 2 ) falls x ∈ [0, 2·n 4 · n · x 1 1 2 fn (x) := 4 · n − 4 · n · x falls x ∈ [ 2·n , n ) . 0 falls x ∈ [ n1 , 1] Die Funktionen sind für alle n ∈ N Lebesgue-integrierbar und schließen stets ein Dreieck mit der Grundseitenlänge n1 und der Höhe 2 · n mit der x-Achse im Intervall [0, 1] ein. Folglich gilt: Z 1 fn (x) d x = 1 ∀n ∈ N, 0 aber fn (x) → 0 für alle x ∈ [0, 1], denn ist x ∈ [0, 1], so gibt es stets ein N ∈ N mit fk (x) = 0 für alle k ≥ N . Es folgt also mit f (x) := limn→∞ fn (x) für alle x ∈ [0, 1] gerade Z 1 Z 1 f (x) d x 6= lim fn (x) d x = lim 1 = 1. 0= 0 n→∞ 0 n→∞ Der Satz von Lebesgue über dominante Konvergenz kann also nicht auf die Existenz der Majorante verzichten. Im obigen Beispiel haben wir mit dem Lebesgue-Integral gerechnet, als wenn es das Riemann-Integral wäre. Dass diese Vorgehensweise korrekt ist, wollen wir im nächsten Abschnitt sehen. 2.5 Vergleich von Riemann- und LebesgueIntegral Sei im ganzen Abschnitt der betrachtete Maßraum (R, B(R)0 , λ0 ) und E := [a, b], a < b, ein Intervall endlicher Länge. Im folgenden schreiben wir für R Rb das Lebesgue-Integral E f d λ0 der Einfachheit halber (L) a f (x) d x sowie Rb (R) a f (x) d x für das Riemann-Integral der Funktion f : [a, b] → R über dem Intervall E = [a, b]. 40 KAPITEL 2. GRUNDLAGEN DER INTEGRATIONSTHEORIE Satz 2.27. (Riemann-Integral ↔ Lebesgue-Integral) Mit den Bezeichnungen von oben gilt: (i) Ist f auf [a, b] Riemann-integrierbar, so ist f ∈ L([a, b], λ0 ) und Z b b Z f (x) d x. f (x) d x = (R) (L) a a (ii) Ist f beschränkt, so ist f genau dann Riemann-integrierbar auf [a, b], wenn f fast überall stetig auf [a, b] ist. Beweis. (i) Sei (Zk )∞ k=1 eine Folge von Zerlegungen des Intervalls [a, b] mit Zk+1 ⊇ Zk (man sagt auch: Zk+1 ist feiner als Zk ). Ferner gelte ∆(Zk ) → 0 für k → ∞, wobei ∆(Zk ) den maximalen Abstand zwischen zwei benachbarten Punkten der Zerlegung bezeichnet. Wir definieren für alle k ∈ N die Treppenfunktionen Uk und Lk vermöge Uk (a) = Lk (a) = f (a) und Uk (x) := Mi := sup f (x) x∈[xi−1 ,xi ] Lk (x) := mi := inf f (x) x∈[xi−1 ,xi ] für x ∈ (xi−1 , xi ]. Es gilt dann Z b (L) Uk (x) d x = a Z (L) b Lk (x) d x = a k X i=1 k X Mi · (xi − xi−1 ) =: S(Zk , f ), mi · (xi − xi−1 ) =: s(Zk , f ). i=1 Wegen Zk+1 ⊇ Zk erhalten wir U1 (x) ≥ U2 (x) ≥ . . . ≥ Uk (x) ≥ f (x) ≥ Lk (x) ≥ . . . ≥ L2 (x) ≥ L1 (x) für alle x ∈ [a, b]. Wir setzen U (x) := lim Uk (x), k→∞ L(x) := lim Lk (x). k→∞ Ist f Riemann-integrierbar, so folgt aus ∆(Zk ) → 0, dass Z lim s(Zk , f ) = (R) k→∞ b f (x) d x = lim S(Zk , f ). a k→∞ 2.5. VERGLEICH VON RIEMANN- UND LEBESGUE-INTEGRAL 41 Da Uk und Lk meßbare Treppenfunktionen sind, punktweise gegen U bzw. L konvergieren und ferner alle Uk und Lk durch eine Lebesgue-integrierbare Treppenfunktion majorisiert werden können (je nach Vorzeichensituation durch L1 oder U1 ), folgt aus dem Satz von Lebesgue über dominante Konvergenz 2.25 b Z lim (L) Uk (x) d x = (L) k→∞ U (x) d x a sowie Z a b Z b L(x) d x. Lk (x) d x = (L) lim (L) k→∞ b Z a a Insgesamt erhalten wir also Z b Z b Z b f (x) d x Lk (x) d x = lim s(Zk , f ) = (R) L(x) d x = lim (L) (L) k→∞ k→∞ a a a Z b Z b = lim S(Zk , f ) = lim (L) Uk (x) d x = (L) U (x) d x, k→∞ also b Z k→∞ Z a b a b Z U (x) d x. f (x) d x = (L) L(x) d x = (R) (L) a a a Rb Weiter ergibt sich wegen L(x) ≤ f (x) ≤ U (x) und (L) a (U (x) − L(x)) d x = 0 bereits U (x) = L(x) fast überall, d.h. U (x) = f (x) = L(x) fast überall, d.h. f ist Lebesgue-integrierbar und Z b Z b Z b (L) f (x) d x = (L) L(x) d x = (R) f (x) d x, a a a also die Behauptung von (i) gezeigt. S∞ (ii) Sei Z := k=1 Zk . Dann gilt λ(Z) = 0, da Z eine abzählbare Menge ist. 42 KAPITEL 2. GRUNDLAGEN DER INTEGRATIONSTHEORIE Behauptung. f ist genau dann stetig im Punkt x0 ∈ [a, b]\Z, wenn U (x0 ) = L(x0 ). Beweis der Behauptung. Sei f stetig in x0 . Dann gibt es zu jedem ε > 0 ein δ > 0 mit |f (x) − f (x0 )| ≤ ε für alle x mit |x − x0 | ≤ δ. Wegen ∆(Zk ) → 0 existiert ein K ∈ N, so dass ∆(Zk ) < δ für alle k ≥ K gilt. Es folgt: Uk (x0 ) − Lk (x0 ) = Mi − mi = (Mi − f (x0 )) + (f (x0 ) − mi ) < ε + ε = 2 · ε, also U (x0 ) = L(x0 ). Es gelte nun umgekehrt U (x0 ) = L(x0 ) und es sei ε > 0 beliebig vorgegeben. Dann gilt L(x0 ) = f (x0 ) = U (x0 ) und daher existiert ein K ∈ N mit ε ε UK (x0 ) − f (x0 ) ≤ und f (x0 ) − LK (x0 ) ≤ . 2 2 Wähle nun δ := min{|x0 − x| | x ∈ ZK }. Dann gilt für alle x mit |x − x0 | < δ gerade LK (x0 ) ≤ f (x) ≤ UK (x0 ), also nach obiger Abschätzung |f (x) − f (x0 )| ≤ ε, d.h. f ist stetig in x0 . Zurück zum eigentlichen Beweis: Wenn f nun Riemann-integrierbar auf [a, b] ist, dann folgt, wie wir beim Beweis des ersten Teils des Satzes gesehen haben und in der Notation, die wir dort schon verwendet hatten, U (x) = L(x) fast überall auf [a, b], d.h. f ist stetig fast überall auf [a, b]. Ist umgekehrt f fast überall stetig auf [a, b], so gilt U (x) = f (x) = L(x) fast überall auf [a, b] und folglich Z b Z b L(x) d x, U (x) d x = (L) (L) a a woraus sich, wie wir im Beweis von Teil (i) gezeigt hatten, S(Zk , f )−s(Zk , f ) → 0 für k → ∞ ergibt, d.h. f ist Riemann-integrierbar. Beispiel 2.28. Betrachte [a, b] := [0, 1] und die Funktion f (x) definiert durch ( x2 falls x ∈ [0, 1] \ Q f (x) := . sin(x) falls x ∈ [0, 1] ∩ Q Dann gilt Z 1 Z (L) f (x) d x = (L) 0 2 x d x + (L) [0,1]\Q | Z Z sin(x) d x = (R) [0,1]∩Q {z } 0 1 1 x2 d x = , 3 =0 da [0, 1] ∩ Q eine Nullmenge unter dem Lebesgue-Maß ist und zu der Menge [0, 1] \ Q bei der Integration über x2 nach Korollar 2.15 schadlos die Nullmenge 2.5. VERGLEICH VON RIEMANN- UND LEBESGUE-INTEGRAL 43 der abzählbar vielen rationalen Punkte aus [0, 1] hinzugefügt werden kann, ohne den Wert des Lebesgue-Integrals zu ändern. Auf [0, 1] stimmt dann nach dem vorhergehenden Satz das Lebesgue-Integral über x2 mit dem Riemann-Integral überein. Beispiel 2.29. Die Aussage, dass eine Funktion f , die Riemann-integrierbar ist, stets auch Lebesgue-integrierbar ist, ist für allgemeine Intervalle nicht richtig. Betrachten wir statt [a, b] für a < b von endlicher Länge unter dem LebesgueMaß z.B. R+ , also die gesamte positive reelle Achse, und darauf die Funktion , so ist das Integral f (x) := sin(x) x Z ∞ sin(x) (R) dx x 0 endlich, denn: Definiere Z (n+1)·π an := (R) n·π sin(x) d x. x Jedes der Integrale an existiert, denn die Funktion überall stetig auf (0, ∞). Folglich ist Z ∞ (R) 0 ∞ sin(x) x ist beschränkt und fast ∞ X X sin(x) (−1)n · |an | an = dx = x n=0 n=0 P∞ n und (an )n∈N ist eine Nullfolge. Die Reihe n=0 (−1) · |an | konvergiert also nach dem Konvergenzkriterium von Leibniz, woraus die Endlichkeit des Integrals folgt. Dagegen ist sin(x) jedoch nicht Lebesgue-integrierbar. Satz 2.19 sagt x uns, dass eine Funktion Lebesgue-integrierbar ist genau dann, wenn es ihr Betrag ist. Definiert man dann Z (n+1)·π bn := (L) n·π so folgt bn ≥ 2 (n+1)·π sin(x) d x, x und damit Z (L) 0 ∞ ∞ sin(x) X bn = ∞, dx = x n=0 indem man eine geeignete divergente Minorante für P∞ n=0 bn wählt. 44 KAPITEL 2. GRUNDLAGEN DER INTEGRATIONSTHEORIE Die obige Charakterisierung von Riemann-Integrierbarkeit beschränkter Funktionen auf einem Intervall endlicher Länge erlaubt es nun auch, einfache Beispiele für Folgen Riemann-integrierbarer Funktionen zu finden, deren Limes selbst keine Riemann-integrierbare Funktion mehr ist: Beispiel 2.30. Sei An := {q1 , . . . , qn } für alle n ∈ N, wobei (qn )n∈N eine Abzählung von Q sei. Dann ist jede der Funktionen fn := 1[0,1]∩An beschränkt und fast überall stetig, also Riemann-integrierbar. Allerdings gilt limn→∞ 1[0,1]∩An = 1[0,1]∩Q und 1[0,1]∩Q ist an jedem irrationalen Punkt aus [0, 1] unstetig, also fast überall unstetig und folglich auch nicht Riemann-integriebar. 2.6 Die Lp-Räume In diesem Abschnitt werden wir die Vollständigkeit der Lp -Räume zeigen, die in vielen mathematischen Bereichen, so z.B. in der Funktionalanalysis, immer wieder gerne als Beispiele für Banachräume herangezogen werden. Wie in den vorhergehenden Abschnitten bezeichne Ω 6= ∅ wieder stets eine Grundmenge. Ferner sei (Ω, F, µ) ein vollständiger Maßraum und L(Ω, µ) bezeichne wieder die Menge der bezüglich µ summierbaren Funktionen Ω → R. Definition 2.31. Sei f ∈ L(Ω, µ). Es bezeichne [f ] := {g ∈ L(Ω, µ) | g ∼Ω f } die Restklasse von f bezüglich der Äquivalenzrelation ∼Ω . Wir definieren für 1 ≤ p < ∞ vermöge p1 Z p |f | d µ kf kp := Ω die Funktionenräume Lp := {[f ] | kf kp < ∞} und für p = ∞ das essentielle Supremum oder auch wesentliche Supremum durch kf k∞ := esse sup f := inf{c ≥ 0 | |f (ω)| ≤ c für fast alle ω ∈ Ω} sowie den zugehörigen Funktionenraum L∞ := {[f ] | kf k∞ < ∞}. Bemerkung 2.32. Es gilt [f ] = [g] genau dann, wenn f = g fast überall auf Ω, d.h. es gilt µ({ω ∈ Ω | f (ω) 6= g(ω)}) = 0. 2.6. DIE LP -RÄUME 45 Wir werden uns nun zunächst darum bemühen zu zeigen, dass die so definierten Funktionenräume normierte Räume sind. Wir benötigen zunächst folgendes klassisches Resultat aus der reellen Analysis: Lemma 2.33. Seien a, b > 0. Dann gilt für 1 < p, q < ∞ mit 1 1 + =1 p q (man sagt auch, dass p und q zueinander “konjugiert” sind) die Ungleichung 1 1 ap · bq ≤ a b + . p q Beweis. Sei o.B.d.A. t := ab ≥ 1 (anderenfalls betrachte ab , zeige ganz analog zur folgenden Vorgehensweise die Behauptung und vertausche anschließend die “Rollen” der beliebig wählbaren Werte p und q). Division der behaupteten Ungleichung durch b ergibt die dazu äquivalente Formulierung 1 tp ≤ t 1 + . p q Setzen wir 1 g(t) := t p , h(t) := t 1 + , p q so müssen wir g(t) ≤ h(t) für alle t ≥ 1 zeigen. Für t = 1 gilt g(1) = 1 = h(1). Wir zeigen nun, dass g für alle t ≥ 1 langsamer wächst als h. Daraus folgt dann 1 die Behauptung. Es gilt für alle t ≥ 1, dass t− q ≤ 1 und somit g 0 (t) = 1 p1 −1 1 − 1q 1 ·t = · t ≤ = h0 (t), p p p also die Behauptung. Satz 2.34. Es seien 1 ≤ p, q ≤ ∞ mit ebenfalls zugelassen sind. Dann gilt: 1 p + 1 q = 1, wobei hier p = 1 und q = ∞ (i) (Höldersche Ungleichung) Seien f, g : Ω → R meßbar mit kf kp , kgkq < ∞. Dann gilt Z |f · g| d µ ≤ kf kp · kgkq . Ω Insbesondere folgt f · g ∈ L(Ω, µ). 46 KAPITEL 2. GRUNDLAGEN DER INTEGRATIONSTHEORIE (ii) (Minkowski Ungleichung) Seien kf kp , kgkp < ∞. Dann gilt |f + g| ∈ Lp (Ω, µ) und kf + gkp ≤ kf kp + kgkp (“Dreiecksungleichung”). Beweis. (i) Wir betrachten zunächst den Fall 1 < p, q < ∞. Ohne Einschränkung seien kf kp , kgkq 6= 0, denn anderenfalls ist f · g = 0 fast überall auf Ω und wir haben nichts zu zeigen. Setzen wir |f (ω)| p |g(ω)| q a := , b := , kf kp kgkq so folgt mit dem vorhergehenden Lemma |f (ω)| |g(ω)| 1 |f (ω)| p 1 |g(ω)| q + · · ≤ · 0≤a ·b = kf kp kgkq p kf kp q kgkq 1 q 1 p für alle ω ∈ Ω. Integrieren wir die Ungleichung über Ω, so erhalten wir Z Z Z 1 1 1 p · |f | d µ + · |g|q d µ · |f · g| d µ ≤ kf kp · kgkq Ω p · kf kpp Ω q · kgkqq Ω 1 1 p q ≤ p · kf kp + q · kgkq p · kf kp q · kgkq 1 1 = + = 1. p q Daraus folgt die Höldersche Ungleichung. Im Fall p = 1 und q = ∞ erhalten wir Z Z |f · g| d µ ≤ esse sup g · |f | d µ = kgk∞ · kf k1 , Ω Ω also die Behauptung auch für diesen Fall. (ii) Es sei p > 1. Dann gilt für alle ω ∈ Ω die Abschätzung |f (ω) + g(ω)|p ≤ |f (ω)| · |(f + g)(ω)|p−1 + |g(ω)| · |(f + g)(ω)|p−1 . Integration über Ω liefert nun Z Z Z p p−1 p kf + gkp = |f + g| d µ ≤ |f | · |f + g| d µ + |g| · |f + g|p−1 d µ. Ω Ω Ω Die Höldersche Ungleichung liefert Z |f | · |f + g|p−1 d µ ≤ kf kp · k|f + g|p−1 kq , Ω 2.6. DIE LP -RÄUME Z 47 |g| · |f + g|p−1 d µ ≤ kgkp · k|f + g|p−1 kq , Ω also mit (p − 1) · q = p kf + gkpp ≤ kf kp · k|f + g|p−1 kq + kgkp · k|f + g|p−1 kq Z 1q (p−1)·q = (kf kp + kgkp ) · |f + g| dµ Ω Z 1q = (kf kp + kgkp ) · |f + g|p d µ Ω p = (kf kp + kgkp ) · kf + gkpq = (kf kp + kgkp ) · kf + gkp−1 p , d.h. kf + gkp ≤ kf kp + kgkp . Die Behauptung für q = ∞ folgt aus der üblichen Dreicksungleichung für den Betrag und der Monotonie des Lebesgue-Integrals. Satz 2.35. Für 1 ≤ p ≤ ∞ ist Lp (Ω, µ) ein normierter Raum, d.h. ein linearer Raum bzw. Vektorraum mit der Norm k · kp . Beweis. Sind [f ], [g] ∈ Lp (Ω, µ), so gilt kf kp , kgkp < ∞. Die Minkowski Ungleichung liefert dann kf + gkp ≤ kf kp + kgkp < ∞, also neben [f + g] ∈ Lp (Ω, µ) auch die Gültigkeit der Dreiecksungleichung für k · kp . Für alle [f ] ∈ Lp (Ω, µ) und alle α ∈ R gilt wegen kf kp < ∞ gerade Z p |α · f |p d µ = |α|p · kf kpp < ∞, kα · f kp = Ω d.h. einerseits [α · f ] ∈ Lp (Ω, µ) und andererseits kα · f kp = |α| · kf kp , also die Homogenität von k · kp . Insgesamt ist damit Lp (Ω, µ) ein linearer Raum. Wir müssen noch zeigen, dass gilt kf kp = 0 genau dann, wenn [f ] = [0]. Gilt [f ] = [0], so ist Rf = 0 fast überall auf Ω und es folgt |f |p = 0 fast überall auf p p Ω, also R kf kpp = Ω |f | d µ =p 0 und somit kf kp = 0. Ist umgekehrt kf kp = 0, so folgt Ω |f | d µ = 0, also |f | = 0 fast überall auf Ω, d.h. auch f = 0 fast überall auf Ω und damit [f ] = [0]. Also ist k · kp eine Norm und die Behauptungen sind gezeigt. Für den Fall p = ∞ folgt alles analog. Wir werden nun sehen, dass die Räume Lp (Ω, µ) für 1 ≤ p ≤ ∞ nicht nur gewöhnliche normierte Räume, sondern sogar Banachräume sind. Satz 2.36. Die normierten Räume Lp (Ω, µ) für 1 ≤ p ≤ ∞ sind Banachräume. 48 KAPITEL 2. GRUNDLAGEN DER INTEGRATIONSTHEORIE Beweis. Wir müssen zeigen, dass jede Cauchy-Folge in Lp (Ω, µ) einen Limes in Lp (Ω, µ) besitzt. Zunächst beweisen wir den Fall p < ∞. Abkürzender Weise schreiben wir die Elemente [f ] von Lp (Ω, µ) von nun an schlicht als f . Sei (fn )n∈N eine Cauchy-Folge in Lp (Ω, µ). Dann gibt es zu jedem n ∈ N ein N ∈ N mit kfk − fm kpp ≤ 1 =: ε 22n für alle k, m ≥ N . Wir definieren vermöge gn := fN die Teilfolge (gn )n∈N von (fn )n∈N . Für die behauptete Vollständigkeit genügt es zu zeigen, dass g := limn→∞ gn ∈ Lp (Ω, µ) gilt. Für n 1o Yn := ω ∈ Ω | |gn+1 (ω) − gn (ω)|p ≥ n 2 gilt µ(Yn ) = 2n Z Yn 1 dµ ≤ 2n Z Z p |gn+1 − gn | d µ ≤ Yn |gn+1 − gn |p d µ Ω 1 = kgn+1 − gn kpp ≤ 2n , 2 S d.h. µ(Yn ) ≤ 2−n . Setzen wir Zn := ∞ k=n Yk , so folgt Z1 ⊇ Z2 ⊇ Z3 ⊇ . . . und weiter ∞ ∞ ∞ [ X X 1 2−k = n−1 . µ(Yk ) = µ(Zn ) = µ Yk ≤ 2 k=n k=n k=n T∞ Somit ergibt sich für Z := n=1 Zn , dass µ(Z) = lim µ(Zn ) = 0, n→∞ dies bedeutet, Z ist eine Nullmenge. Wie definieren nun ( P g1 (ω) + ∞ n=1 (gn+1 (ω) − gn (ω)) falls ω ∈ Ω \ Z g(ω) := . 0 falls ω ∈ Z Aufgrund der Tatsache, dass für alle ω ∈ Ω \ ZN gilt |gk+1 (ω) − gk (ω)|p ≤ 1 , 2k k ≥ N, folgt aus der Identität gm (ω) = g1 (ω) + m−1 X n=1 (gn+1 (ω) − gn (ω)), 2.6. DIE LP -RÄUME 49 dass ∞ X ∞ X 1 1 |gn+1 (ω) − gn (ω)| ≤ sup |g(ω) − gm (ω)| ≤ sup = m−1 → 0 n 2 2 ω∈Ω\Zm n=m ω∈Ω\Zm n=m p p für m → ∞. Folglich konvergiert die Folge (gn )n∈N gleichmäßig und absolut gegen g auf Ω \ Zm , d.h. gn → g bezüglich des Maßes µ und auch fast überall. 1 ergibt sich schließlich Folglich ist g auch meßbar. Aus kgk − gm kpp ≤ 22n kg − gm kp ≤ lim sup kgk − gm kp ≤ k→∞ 1 22n/p < ∞, R also Ω |g − gm |p d µ ≤ 2−2n/p . Mit des Satz von Lebesgue über dominante Konvergenz 2.25 folgt dann |g − gm |p ∈ L(Ω, µ) beziehungsweise g − gm ∈ Lp (Ω, µ). Wegen gm ∈ Lp (Ω, µ) und g − gm ∈ Lp (Ω, µ) und da Lp (Ω, µ) insbesondere ein Vektorraum ist, folgt g = (g − gm ) + gm ∈ Lp (Ω, µ). Der Fall p = ∞ wird mit ganz analogen Schlüssen und einem analog definierten Grenzwert der Teilfolge gezeigt. Desweiteren lässt sich im Spezialfall p = q = 2 der folgende Satz zeigen, den wir hier zur Information ohne Beweis angeben: Satz 2.37. Im Fall p = 2 ist h·, ·i : L2 (Ω, µ) × L2 (Ω, µ) → R gegeben durch Z f · g d µ, ∀f, g ∈ L2 (Ω, µ) hf, gi := Ω ein Skalarprodukt und es gilt kf k2 = p hf, f i. Damit wird L2 (Ω, µ) zu einem Hilbertraum. Der Beweis des Satzes besteht lediglich darin, die Eigenschaften des Skalarprodukts nachzurechnen. Als Korollar aus der Hölderschen Ungleichung ergibt sich das folgende klassische Resultat: Korollar 2.38. (Cauchy-Schwarzsche Ungleichung) Seien f, g ∈ L2 (Ω, µ). Dann gilt |hf, gi| ≤ kf k2 · kgk2 . 50 KAPITEL 2. GRUNDLAGEN DER INTEGRATIONSTHEORIE Beweis. Die Behautung folgt unmittelbar aus Z Z |hf, gi| = f · g d µ ≤ |f · g| d µ ≤ kf k2 · kgk2 . Ω Ω Satz 2.39. Es gelte µ(Ω) < ∞ und 1 ≤ p ≤ q ≤ ∞. Dann gilt Lq (Ω, µ) ⊆ Lp (Ω, µ). Beweis. Es gilt |f (ω)|p ≤ 1, falls |f (ω)| ≤ 1 für ω ∈ Ω. Ferner ist |f (ω)|p ≤ |f (ω)|q , falls |f (ω)| ≥ 1 für ω ∈ Ω. Damit gilt: |f (ω)|p ≤ 1 + |f (ω)|q . Die Montonie des Lebesgue-Integrals liefert dann Z Z Z Z p q |f | d µ ≤ 1Ω d µ + |f | d µ = µ(Ω) + |f |q d µ < ∞, Ω Ω Ω Ω falls f ∈ Lq (Ω, µ). In diesem Fall folgt dann also mit f ∈ Lp (Ω, µ) die Behauptung. Kapitel 3 Anwendungen in der Stochastik In diesem Kapitel werden wir einige Anwendungen für die doch sehr theoretischen Resultate der vorhergehenden beiden Kapitel diskutieren. Prädestiniert für Anwendungen von Maß- und Integrationstheorie ist der Bereich der Stochastik. Wir beginnen zunächst mit einigen grundlegenden Begriffen der Wahrscheinlichkeitstheorie, die sich ihrerseits aber immer wieder als Spezialfälle bzw. Anwendungen der in den vorhergehenden beiden Kapiteln erarbeiteten Theorie herausstellen werden. In diesem Kapitel werden wir uns ausschließlich mit vollständigen Maßen bzw. Maßräumen beschäftigen, so dass wir die übliche 0 im Exponenten, die wir im ersten Kapitel angefügt hatten, um die Vervollständigung eines Maßes bzw. eines Maßraums anzudeuten, nicht mehr explizit hinschreiben. 3.1 Wahrscheinlichkeitsmaße Wir hatten in Kapitel I vollständige Maßräume (Ω, F, µ) für eine Grundmenge Ω 6= ∅, eine σ-Algebra F ⊆ ℘(Ω) und ein Maß µ : F → R studiert. Hier werden wir jetzt den Begriff des Wahrscheinlichkeitsraums einführen, der im Grunde nichts anderes als ein Maßraum mit einer zusätzlichen Forderung an das zugrundeliegende Maß ist: Definition 3.1. Sei Ω 6= ∅ eine Grundmenge und F eine σ-Algebra in Ω. Ferner sei P : F → R ein vollständiges Maß mit P(Ω) = 1. Dann heißt P ein Wahrscheinlichkeitsmaß und (Ω, F, P) ein Wahrscheinlichkeitsraum. Bemerkung 3.2. Sei (Ω, F, P) ein Wahrscheinlichkeitsraum. Wegen der Monotonie und der Nichtnegativität des Maßes folgt für alle A ∈ F gerade 51 52 KAPITEL 3. ANWENDUNGEN IN DER STOCHASTIK 0 ≤ P(A) ≤ 1. Man nennt die Elemente von F im Kontext von Wahrscheinlichkeitsräumen auch Ereignisse. Beispiel 3.3. Ein einfaches Beispiel für einen ersten elementaren Wahrscheinlichkeitsraum ist ([0, 1], B([0, 1]), λ), wobei λ wie üblich das Lebesgue-Maß bezeichne und B([0, 1]) die σ-Algebra der Borelschen Teilmengen von [0, 1]. Wegen λ(Ω) = λ([0, 1]) = 1−0 ist λ in der Tat offensichtlich ein Wahrscheinlichkeitsmaß auf [0, 1] und definiert die sogenannte Gleichverteilung auf dem Einheitsintervall. So elementar und einfach dieses Beispiel auch erscheint: Es wird uns in diesem Kapitel immer wieder zur Veranschaulichung dienen und wir werden am Ende sehen, wie man mit Hilfe dieses Wahrscheinlichkeitsraums z.B. R 1 über sogenannte Monte-Carlo-Methoden den Wert des bestimmten Integrals 0 f (x) d x für eine schwierige, unordentlich glatte Funktion mit stochastischen Mitteln bestimmen kann. Beispiel 3.4. Der Wahrscheinlichkeitsraum aus Beispiel 3.3 kann leicht auf den Fall Ω = [a, b] verallgemeinert werden. Hierzu betrachtet man schlicht statt des Lebesgue-Maßes auf [a, b], was für b − a 6= 1 kein Wahrscheinlichkeitsmaß auf Ω 1 · λ, wobei λ das Lebesgue-Maß definiert, das Wahrscheinlichkeitsmaß P := b−a auf Ω = [a, b] bezeichnet. Beispiel 3.5. Auch viel einfachere (diskrete) Beispiele sind natürlich von der Definition erfasst. Beim Würfeln mit einem idealen Würfel geht man gemeinhin davon aus, dass jede der Augenzahlen 1, 2, 3, 4, 5 und 6 mit der gleichen Wahrscheinlichkeit erzielt werden kann. Ein passender Wahrscheinlichkeitsraum für das Zufallsexperiment “1 × Würfeln” ist dann (Ω, F, P) mit Ω = {1, 2, 3, 4, 5, 6}, F = ℘(Ω) und P(ω) := 16 für alle ω ∈ Ω, wobei die Definition von P auf naheliegende Weise auf alle Elemente aus ℘(Ω) fortgesetzt wird. In diesem simplen Beispiel spiegelt sich unsere Vorgehensweise aus dem ersten Kapitel über Maßtheorie wieder. Wir definieren das “Maß” zunächst auf elementaren Bestandteilen von ℘(Ω), um es dann auf geeignete Weise auf eine σ-Algebra (hier ℘(Ω)) fortzusetzen. Hier ist ℘(Ω) eine recht kleine, übersichtliche Menge. Für nicht endliches Ω ist jedoch die Potenzmenge in der Regel viel zu “fein” und zu “groß”, um sinnvoll damit arbeiten zu können. 3.2 Zufallsvariablen Im Gegensatz zur allgemeinen Maßtheorie spricht man in der Stochastik nicht von meßbaren numerischen Funktionen, sondern von Zufallsvariablen. 3.2. ZUFALLSVARIABLEN 53 Definition 3.6. Sei (Ω, F, P) ein Wahrscheinlichkeitsraum. Dann heißt X : Ω → R eine Zufallsvariable, wenn für alle a ∈ R gilt: X −1 ((−∞, a]) = {ω ∈ Ω | X(ω) ≤ a} ∈ F. Bemerkung 3.7. In Zufallsexperimenten repräsentieren die Elemente der Grundmenge Ω die möglichen Ausgänge des Experiments. Die Ausgänge des Experiments möchte man beurteilen, klassifizieren etc. Daher ordnet man bestimmten Ausgängen eines Zufallsexperiments reelle Zahlen zu, so dass man eine Abbildung von dem “abstrakten Raum” Ω in die reellen Zahlen R erhält. Diese Abbildungen sind dann genau Zufallsvariablen. Fragen wie z.B. “Wie groß ist die Wahrscheinlichkeit, dass die Werte der Zufallsvariable in einem bestimmten Bereich liegen?” lassen sich dann auf Grundlage der obigen Definition beantworten. Ein zentraler Begriff in der Stochastik ist der Begriff der Verteilung, der eine Zufallsvariable X unterliegt. Definition 3.8. Sei (Ω, F, P) ein Wahrscheinlichkeitsraum und X : Ω → R eine Zufallsvariable. Dann heißt die Funktion PX : B(R) → [0, 1] auf der σ-Algebra der Borelschen Teilmengen von R definiert durch PX (B) := P(X −1 (B)), B ∈ B(R), die (Wahrscheinlichkeits-)Verteilung der Zufallsvariable X. Satz 3.9. Sei (Ω, F, P) ein Wahrscheinlichkeitsraum und X : Ω → R eine Zufallsvariable. Die Wahrscheinlichkeitsverteilung PX : B(R) → [0, 1] der Zufallsvariable X ist ein Wahrscheinlichkeitsmaß auf B(R). Beweis. Da P ein Wahrscheinlichkeitsmaß ist, ist klar dass gilt PX (∅) = 0 sowie PX ≥ 0 und PX (R) = 1. Es bleibt die σ-Additivität zu zeigen: Sei dazu (Bi )i∈N eine Folge paarweise disjunkter Mengen aus B(R). Setze Ai := X −1 (Bi ) für alle i ∈ N.SDann ist (A )i∈N eine Folge paarweise disjunkter Mengen in F und wegen Si∞ ∞ −1 X ( i=1 Bi ) = i=1 X −1 (Bi ) erhalten wir PX ∞ [ Bi = P X i=1 also die Behauptung. −1 ∞ [ i=1 Bi =P ∞ [ i=1 Ai = ∞ X i=1 P(Ai ) = ∞ X i=1 PX (Bi ), 54 KAPITEL 3. ANWENDUNGEN IN DER STOCHASTIK Bemerkung 3.10. Die Intuition, die sich hinter den Begriffen der Zufallsvariable und ihrer Verteilung verbirgt, kann wie folgt beschrieben werden: Einem Zufallsexperiment liegt ein abstrakter Wahrscheinlichkeitsraum (Ω, F, P) zugrunde. Um nicht in diesem abstrakten Raum “rechnen” zu müssen, betrachtet man stattdessen Zufallsvariablen, die die Ausgänge des Experiments in den bekannten Raum (R, B(R)) abbilden. Um weiterhin über Wahrscheinlichkeiten reden zu können, muß man neben der Abbildung der Ausgänge des Zufallsexperiments auch noch eine Abbildung des auf dem abstrakten Raum definierten Wahrscheinlichkeitsmaßes P finden. Diese “Abbildung” ist in Form der Verteilung einer Zufallsvariable gegeben. Man nennt daher auch PX das Bildmaß von P unter X. Beispiel 3.11. Wir betrachten zunächst eine konstante Zufallsvariable X mit X ≡ a für ein a ∈ R deren Definitionsbereich durch irgendeinen abstrakten Wahrscheinlichkeitsraum gegeben ist. Dann ist die Wahrscheinlichkeitsverteilung PX von X gegeben durch ( 1 falls a ∈ B PX (B) = , 0 falls a ∈ /B denn ist a ∈ B, so enthält X −1 (B) alle ω ∈ Ω, die von X auf a abgebildet werden. Wegen X(ω) = a für alle ω ∈ Ω gilt also X −1 (B) = Ω und daher PX (B) = P(X −1 (B)) = P(Ω) = 1. Ist a ∈ / B, so ist X −1 (B) = ∅, also PX (B) = −1 P(X (B)) = P(∅) = 0. Insbesondere gilt PX ({a}) = 1, d.h. die gesamte “Masse” liegt auf dem Punkt a. Man bezeichnet PX auch mit δa und nennt δa das auf a konzentrierte Dirac-Maß. Interessant an dem obigen Beispiel ist bereits, dass wir in der Tat in der Lage sind, die Verteilung der betrachteten Zufallsvariable zu bestimmen, ohne ein Wort über den im Urbildbereich zugrundeliegenden Wahrscheinlichkeitsraum (Ω, F, P) verloren zu haben. Wir verallgemeinern das Beispiel weiter: Beispiel 3.12. Sei p ∈ [0, 1]. Betrachte die Zufallsvariable X definiert durch ( a mit Wahrscheinlichkeit p X(ω) = b mit Wahrscheinlichkeit 1 − p für ein ω ∈ Ω aus dem zugrundeliegenden abstrakten Wahrscheinlichkeitsraum. Dann ist PX für eine beliebige Borelsche Menge B ∈ B(R) vollständig beschrie- 3.2. ZUFALLSVARIABLEN 55 ben durch 1 p PX (B) = 1 − p 0 falls falls falls falls a, b ∈ B a ∈ B und b ∈ /B . b ∈ B und a ∈ /B a, b ∈ /B Insgesamt lässt sich PX (B) für ein beliebiges B ∈ B(R) dann auch in der Form PX (B) = p · δa (B) + (1 − p) · δb (B) schreiben, wobei δa und δb gemäß des vorhergehenden Beispiels die auf a bzw. b konzentrierten Dirac-Maße bezeichnen. Man sagt auch, dass X eine diskrete Zufallsvariable ist, da X nur endlich viele reelle Zahlen als Werte annehmen kann. Beispiel 3.13. Die Verteilung einer jeden diskreten Zufallsvariablen X a1 mit Wahrscheinlichkeit p1 a2 mit Wahrscheinlichkeit p2 X(ω) = . .. .. . a mit Wahrscheinlichkeit p n n mit a1 , a2 , . . . , an ∈ R und pi ≥ 0 für alle i = 1, . . . , n und gegeben durch n X PX (B) = pi · δai (B), Pn i=1 pi = 1 ist i=1 wobei B ∈ B(R) beliebig ist. Das obige Beispiel klassifiziert bereits die Verteilungen aller diskreten Zufallsvariablen. Wir werden im folgenden desweilen auf dieses elementare Beispiel zurückkommen. Der Begriff der “Unabhängigkeit” ist in der Stochastik von großer Bedeutung. An dieser Stelle mag die folgende Definition ein wenig unmotiviert erscheinen. Später, wenn wir z.B. auf Momente von Zufallsvariablen zu sprechen kommen, werden wir sehen, dass im Fall von unabhängigen Zufallsvariablen häufig viel einfachere “Rechenregeln” gelten. Definition 3.14. Sei (Ω, F, P) ein Wahrscheinlichkeitsraum. Zwei Zufallsvariablen X : Ω → R und Y : Ω → R heißen unabhängig, wenn für alle B, C ∈ B(R) gilt: P(X −1 (B) ∩ Y −1 (C)) = P(X −1 (B)) · P(Y −1 (C)). 56 KAPITEL 3. ANWENDUNGEN IN DER STOCHASTIK Beispiel 3.15. Betrachte den Wahrscheinlichkeitsraum ([0, 1], B([0, 1]), λ) und die Zufallsvariablen X = 1[0, 1 ] und Y = 1[ 1 , 3 ] . Seien B, C ∈ B(R). Dann gilt: 2 4 4 ∅ [0, 1 ] 2 X −1 (B) = 1 ( , 1] 2 [0, 1] falls falls falls falls und ganz analog erhalten wir ∅ [ 1 , 3 ] 4 4 Y −1 (C) = 1 [0, ) ∪ ( 34 , 1] 4 [0, 1] 0, 1 ∈ /B 1 ∈ B und 0 ∈ /B 0 ∈ B und 1 ∈ /B 0, 1 ∈ B falls falls falls falls 0, 1 ∈ /C 1 ∈ C und 0 ∈ /C . 0 ∈ C und 1 ∈ /C 0, 1 ∈ C Man rechnet nun leicht nach, dass für jede mögliche Kombination von Urbildmengen X −1 (B) und Y −1 (C) die Bedingung λ(X −1 (B)∩Y −1 (C)) = λ(X −1 (B))· λ(Y −1 (C)) erfüllt ist. 3.3 Integration bezüglich Wahrscheinlichkeitsverteilungen Das erste Resultat in diesem Abschnitt, das wir behandeln, ist von fundamentaler Wichtigkeit für die Wahrscheinlichkeitstheorie. Es zeigt uns, wie wir bei der Integration bezüglich von Wahrscheinlichkeitsverteilungen das Maß “wechseln” können: Satz 3.16. Sei X : Ω → R eine beliebige Zufallsvariable und g ∈ L1 eine integrierbare Funktion. Dann gilt Z Z g(X(ω)) d P(ω) = g(x) d PX (x). Ω R Beweis. Wir betrachten zunächst den einfachen Fall g = 1A , A ⊆ B(R). Dann gilt für die linke Seite der behaupteten Identität Z Z g(X(ω)) d P(ω) = 1A (X(ω)) d P(ω) = P(X −1 (A)). Ω Ω 3.4. ABSOLUT-STETIGE MASSE UND VERTEILUNGSFUNKTIONEN 57 Für die rechte Seite erhalten wir Z Z Z g(x) d PX (x) = 1A d PX (x) = 1 d PX (x) = PX (A) = P(X −1 (A)), R A R per Definition der Verteilung von X. Dies zeigt die Behauptung im Fall der Funktion 1A . Da alle nichtnegativen meßbaren Funktionen g über Treppenfunktionen approximiert werden können (auf diese Weise haben wir das Lebesgue-Integral definiert), lässt sich mit Hilfe der Grenzwertsätze zur monotonen Konvergenz die Identität auf alle nichtnegativen meßbaren Funktionen ausweiten. Ist g eine beliebige meßbare Funktion, so zerlegen wir g wieder in Positiv- und Negativteil g + und g − mit g = g + − g − und erhalten dann aus der Linearität des Integrals die Behauptung im allgemeinen. Beispiel 3.17. Wir betrachten wieder die konstante Zufallsvariable X ≡ a für ein a ∈ R. Wir hatten gesehen, dass gilt PX = δa . Die linke Seite der Identität aus Satz 3.16 ist dann gegeben durch Z Z Z g(X(ω)) d P(ω) = g(a) d P(ω) = g(a) · 1 d P(ω) = g(a) · P(Ω) = g(a) Ω Ω Ω sowie die rechte Seite durch Z Z g(x) d δa , g(x) d PX (x) = R R d.h. es gilt Z g(x) d δa = g(a). R Integration der Funktion g bezüglich des Dirac-Maßes bewirkt also die Auswertung von g im Punkt a. 3.4 Absolut-stetige Maße und Verteilungsfunktionen In Satz und Definition 2.14 im Rahmen des Kapitels zur Integrationstheorie fiel bereits der Begriff der Dichte, auf den wir in diesem Abschnitt nun wieder zurückkommen werden. Die Maße der Form Z A 7→ f dλ A 58 KAPITEL 3. ANWENDUNGEN IN DER STOCHASTIK mit nicht-negativer integrierbarer Funktion f heißen absolut-stetig und die Funktion f ihre Dichte bezüglich des Lebesgue-Maßes λ oder kurz einfach Dichte. Im KontextRvon wahrscheinlichkeitstheoretischen Überlegungen ist sicherlich die Forderung f d λ = 1 sinnvoll. Die (kumulative) Verteilungsfunktion zu einer Dichte f ist gegeben durch Z y F (y) := f (x) d x, −∞ wobei das Integral wie üblich das Lebesgue-Integral sei. Im folgenden definieren wir die (kumulative) Verteilungsfunktion einer Zufallsvariable: Definition 3.18. Sei (Ω, F, P) ein Wahrscheinlichkeitsraum und X : Ω → R eine Zufallsvariable. Dann heißt FX (y) := P({ω ∈ Ω | X(ω) ≤ y}) = PX ((−∞, y]) die (kumulative) Verteilungsfunktion der Zufallsvariable X. Satz 3.19. Sei (Ω, F, P) ein Wahrscheinlichkeitsraum und X : Ω → R eine Zufallsvariable. Dann gilt: (i) FX ist monoton nicht fallend, d.h. aus y1 ≤ y2 folgt FX (y1 ) ≤ FX (y2 ). (ii) limy→∞ FX (y) = 1 und limy→−∞ FX (y) = 0. (iii) FX ist rechtsseitig stetig, d.h. aus y → y0 , y ≥ y0 , folgt stets FX (y) → FX (y0 ). Beweis. (i) Aus y1 ≤ y2 folgt {ω ∈ Ω | X(ω) ≤ y1 } ⊆ {ω ∈ Ω | X(ω) ≤ y2 }, also FX (y1 ) = P({ω ∈ Ω | X(ω) ≤ y1 }) ≤ P({ω ∈ Ω | X(ω) ≤ y2 }) = FX (y2 ). (ii) Betrachte An := {ω ∈ Ω | X(ω) ≤ n} für alle n ∈ N. Dann gilt A1 ⊆ A2 ⊆ A3 ⊆ . . ., d.h. (An )n∈N ist eine monoton wachsende Mengenfolge in F, und An ↑ Ω. Nach Satz 1.38 gilt dann, da P ein Maß ist: P(An ) ↑ P(Ω) = 1. Wegen P(An ) = P({ω ∈ Ω | X(ω) ≤ n}) = FX (n) folgt damit FX (n) → 1 für n → ∞. Für die zweite Behauptung betrachtet man die Mengen Bn := {ω ∈ Ω | X(ω) ≤ −n} für alle n ∈ N. Dann gilt B1 ⊇ B2 ⊇ B3 ⊇ . . . und Bn ↓ ∅. Daher erhalten wir nach Satz 1.38 die Konvergenzaussage P(Bn ) ↓ P(∅) = 0. Es folgt wegen P(Bn ) = P({ω ∈ Ω | X(ω) ≤ −n}) = FX (−n) die Behauptung. 3.4. ABSOLUT-STETIGE MASSE UND VERTEILUNGSFUNKTIONEN 59 (iii) Sei (yn )n∈N eine Folge reeller Zahlen mit yn → y0 , yn ≥ y0 . Betrachte An := {ω ∈ Ω | X(ω) ≤ yn }. Dann gilt A1 ⊇ A2 ⊇ A3 ⊇ . . . und lim FX (yn ) = lim P(An ) n→∞ n→∞ =P ∞ \ An n=1 = P({ω ∈ Ω | X(ω) ≤ y0 }) = FX (y0 ). Korollar 3.20. Sei (Ω, F, P) ein Wahrscheinlichkeitsraum und X : Ω → R eine Zufallsvariable. Dann ist FX stetig genau dann, wenn PX ({y}) = 0 für alle y ∈ R gilt. Beweis. Sei (an )n∈N eine Folge reeller Zahlen mit an ≥ 0 für alle n ∈ N und an → 0 für n → ∞. Dann gilt: PX ({y}) = lim PX ((y − an , y]) n→∞ = lim (FX (y) − FX (y − an )) n→∞ = FX (y) − lim FX (y − an ). n→∞ Daraus folgt die behauptete Äquivalenz. Den folgenden Satz zitieren wir ohne Beweis: Satz 3.21. (Banach & Kuratowksi, 1929) Unter der Voraussetzung der Gültigkeit der Kontinuumshypothese der Mengentheorie gibt es keine auf ganz ℘(R) definierte σ-additive Funktion P : ℘(R) → R mit P(R) = 1, die jeder Einpunktmenge {y}, y ∈ R, den Wert P({y}) = 0 zuordnet. Bemerkung 3.22. Der Satz von Banach und Kuratowski besagt, dass es keinen Sinn macht, als σ-Algebra auf R die gesamte Potenzmenge zu betrachten, denn jedes auf ganz ℘(R) definierte Wahrscheinlichkeitsmaß ist diskret, d.h. es ordnet Einpunktmengen eine von Null verschiedene Wahrscheinlichkeit zu. Wir haben aber im letzten Korollar gesehen, dass für alle Wahrscheinlichkeitsmaße PX mit stetiger Verteilungsfunktion FX gilt: PX ({y}) = 0 für alle y ∈ R. 60 KAPITEL 3. ANWENDUNGEN IN DER STOCHASTIK Satz 3.23. Ist PX ein absolut-stetiges Wahrscheinlichkeitsmaß auf R mit Dichte fX : R → R sowie g : R → R integrierbar, so gilt: Z Z g(x) d PX (x) = g(x) · fX (x) d x. R R Beweis. Betrachte g(x) = 1A , A ⊆ B(R). Dann liefert die linke Seite der behaupteten Identität: Z Z Z g(x) d PX (x) = 1A d PX (x) = 1 d PX (x) = PX (A) R A R und die rechte Seite Z Z Z g(x) · fX (x) d x = 1A · fX (x) d x = fX (x) d x = PX (A) R A R per Definition der Dichte fX von PX . Die allgemeine Behauptung folgt wie üblich, da man jede meßbare Funktion durch Treppenfunktionen approximieren kann und mit Hilfe der Sätze von der monotonen Konvergenz. Korollar 3.24. Ist PX ein absolut-stetiges Wahrscheinlichkeitsmaß auf R mit Dichte fX : R → R sowie g : R → R integrierbar, so gilt: Z Z g(X(ω)) d P(ω) = g(x) · fX (x) d x. Ω R Beweis. Folgt sofort aus Satz 3.16 und Satz 3.23. 3.5 Erwartungswerte von Zufallsvariablen Der Begriff des Erwartungswertes ist von zentraler Bedeutung für die Stochastik. In allen folgenden Abschnitten dieses Kapitels wird er uns immer wieder begegnen. Definition 3.25. Sei (Ω, F, P) ein Wahrscheinlichkeitsraum und X : Ω → R eine Zufallsvariable. Dann heißt das abstrakte Integral Z E(X) := X(ω) d P(ω) Ω der Erwartungswert der Zufallsvariable X. 3.5. ERWARTUNGSWERTE VON ZUFALLSVARIABLEN 61 Bemerkung 3.26. Mit den Resultaten des vorhergehenden Abschnitts erhalten wir die alternativen Darstellungen Z ∞ x d PX (x) E(X) = −∞ sowie, falls PX absolut-stetig mit Dichte fX ist Z ∞ E(X) = x · fX (x) d x. −∞ Beispiel 3.27. Betrachte die Verteilung PX = 12 · P1 + 12 · P2 , wobei P1 = δa und P2 die Dichte f2 habe. Dann gilt Z ∞ Z ∞ 1 1 xd x d PX (x) = · P1 + · P2 (x) E(X) = 2 2 −∞ Z−∞ Z ∞ 1 1 ∞ = xd · P1 (x) + xd · P2 (x) 2 2 −∞ Z ∞ Z−∞ ∞ 1 1 x d δa (x) + · x d P2 (x) = · 2 −∞ 2 −∞ Z ∞ 1 1 = ·a+ · x · f2 (x) d x. 2 2 −∞ Dabei haben wir stillschweigend die Linearität des Lebesgue-Maßes in der “zweiten Variable” verwendet. Die Gültigkeit dieser Linearität bezüglich der “Integrationsvariablen” ergibt sich aber sofort aus der Definition des Lebesgue-Integrals über Treppenfunktionen: Ersetzt man in der ursprünglichen Definition 2.8 das Maß µ durch die Summe zweier Maße µ1 und µ2 , so sieht man die behauptete Linearität leicht ein. Bemerkung 3.28. Da der Erwartungswert schlicht als Lebesgue-Integral definiert ist, “erbt” er alle Eigenschaften des entsprechenden Lebesgue-Integrals. Z.B. ist der Erwartungswert stets linear, denn Z E(α · X + β · Y ) = (α · X(ω) + β · Y (ω)) d P(ω) Ω Z Z = α · X(ω) d P(ω) + β · Y (ω) d P(ω) Ω = α · E(X) + β · E(Y ). Ω 62 KAPITEL 3. ANWENDUNGEN IN DER STOCHASTIK Beispiel 3.29. Mit Hilfe der erarbeiteten Theorie können wir nun im Handumdrehen die “Schuldefinition” des Erwartungswertes einer diskreten Zufallsvariablen herleiten: Betrachte die Zufallsvariable X mit a1 mit Wahrscheinlichkeit p1 a2 mit Wahrscheinlichkeit p2 X(ω) = . . .. .. . a mit Wahrscheinlichkeit p n n Pn Der Erwartungswert von X wird dann gemeinhin als i=1 ai · pi “definiert”. In unserer Situation ergibt sich diese spezielle Formel in ganz natürlicher Weise. Wir hatten schon dass die Wahrscheinlichkeitsverteilung von X gegeben Pgesehen, n ist durch PX = i=1 pi · δai , wobei δai wie üblich das auf ai konzentrierte DiracMaß bezeichne. Dann gilt: Z Z Z n X E(X) = X(ω) d P(ω) = x d PX (x) = xd pi · δai (x) Ω = n X R Z pi · i=1 x d δai (x) = R R n X i=1 p i · ai , i=1 also die obige Formel. 3.6 Allgemeine p-te Momente von Zufallsvariablen Neben der Kenngröße des Erwartungswertes lassen sich auf ganz analoge Weise auch weitere aussagekräftige Kenngrößen definieren. Definition 3.30. Sei (Ω, F, P) ein Wahrscheinlichkeitsraum und X : Ω → R eine Zufallsvariable mit X ∈ Ln (Ω, P). Dann heißt Z n E(X ) = X n (ω) d P(ω) Ω für n ∈ N das n-te Moment der Zufallsvariable X. Bemerkung 3.31. Wie schon im letzten Abschnitt, wo wir verschiedene Darstellungen für den Erwartungswert betrachtet hatten, erhalten wir auch hier ganz analog: Z ∞ E(X n ) = xn d PX (x) −∞ 3.6. ALLGEMEINE P -TE MOMENTE VON ZUFALLSVARIABLEN 63 bzw. im Fall, dass PX absolut-stetig stetig mit Dichte fX ist Z ∞ n E(X ) = xn · fX (x) d x. −∞ Satz 3.32. Sei (Ω, F, P) ein Wahrscheinlichkeitsraum und X : Ω → R eine Zufallsvariable. Ist E(X n ) endlich für ein n ∈ N, so ist auch E(X k ) endlich für alle k ≤ n. Ist ferner E(X n ) nicht endlich, so auch E(X l ) für alle l ≥ n. Beweis. Die Behauptung folgt sofort aus Satz 2.39, wo wir entsprechende Aussagen über Inklusionen der Lp -Räume eingesehen hatten. Definition 3.33. Sei (Ω, F, P) ein Wahrscheinlichkeitsraum und X : Ω → R eine Zufallsvariable. Dann heißt Var(X) := E(X − E(X))2 die Varianz der Zufallsvariablen X und p σ(X) := Var(X) die Standardabweichung der Zufallsvariablen X. Bemerkung 3.34. In der Notation von oben gilt mit µ := E(X) gerade Var(X) = E(X − µ)2 = E(X 2 − 2 · µ · X + µ2 ) = E(X 2 ) − 2 · µ · E(X) + µ2 = E(X 2 ) − E(X)2 , also Var(X) = E(X 2 ) − E(X)2 . Ferner gilt für a ∈ R also stets Var(a·X) = E((a·X)2 )−E(a·X)2 = a2 ·(E(X 2 )− E(X)2 ) = a2 · Var(X). Auf analoge Weise lassen sich noch weitere elementare Rechenregeln für die Varianz und die Standardabweichung einer Zufallsvariablen zeigen. Beispiel 3.35. Sei X gleichverteilt auf [a, b], d.h. fX = Z ∞ 1 · 1[a,b] d x E(X) = x· b−a −∞ Z b 1 = · xdx b−a a 1 b 2 − a2 = · b−a 2 a+b = 2 1 b−a · 1[a,b] . Dann gilt 64 KAPITEL 3. ANWENDUNGEN IN DER STOCHASTIK und Z 2 ∞ x2 · E(X ) = −∞ 1 · 1[a,b] d x b−a Z b 1 = · x2 d x b−a a b 3 − a3 1 · = b−a 3 a2 + a · b + b 2 = , 3 also Var(X) = E(X 2 ) − E(X)2 = (b−a)2 . 12 Beispiel 3.36. Betrachte die Gaußsche Glockenkurve, d.h. die Dichte der Normalverteilung gegeben durch ϕµ,σ (x) = √ (x − µ)2 1 · exp − . 2 · σ2 2·π·σ Ist X eine Zufallsvariable mit Dichte ϕµ,σ , so gilt E(X) = µ und Var(X) = σ 2 . Die Behauptung ergibt sich mittels trickreichem Integrieren. Es lässt sich sogar zeigen, dass alle p-ten Momente für p ≥ 1 existieren, wenn X “normalverteilt” ist. Beispiel 3.37. Ist X eine Zufallsvariable mit der Dichtefunktion fX (x) = 1 1 · π 1 + x2 (man sagt auch: X ist gemäß der Cauchy-Verteilung verteilt), so ist E(X n ) nicht endlich für alle n ∈ N. Wir kommen nun auf den Begriff der Unabhängigkeit zurück: Satz 3.38. Sei (Ω, F, P) ein Wahrscheinlichkeitsraum und X, Y : Ω → R Zufallsvariablen. Dann sind X und Y unabhängig genau dann, wenn E(f (X) · g(Y )) = E(f (X)) · E(g(Y )) für alle meßbaren, beschränkten Funktionen f, g : R → R. 3.6. ALLGEMEINE P -TE MOMENTE VON ZUFALLSVARIABLEN 65 Beweis. Es gelte E(f (X) · g(Y )) = E(f (X)) · E(g(Y )). Seien B1 , B2 ∈ B(R). Betrachte f := 1B1 und g := 1B2 . Dann gilt nach Voraussetzung Z 1B1 (X(ω)) · 1B2 (Y (ω)) d P(ω) E(f (X) · g(Y )) = ZΩ Z = 1B1 (X(ω)) d P(ω) · 1B2 (Y (ω)) d P(ω) Ω Ω = E(f (X)) · E(g(Y )). Ferner gilt Z Z 1B1 (X(ω)) · 1B2 (Y (ω)) d P(ω) = 1B1 ×B2 (X(ω), Y (ω)) d P(ω) Ω Ω = P(X −1 (B1 ) ∩ Y −1 (B2 )) und andererseits Z Z 1B1 (X(ω)) d P(ω) · 1B2 (Y (ω)) d P(ω) = P(X −1 (B1 )) · P(Y −1 (B2 )), Ω Ω d.h. X und Y sind in der Tat unabhängig. Nun zeigen wir die umgekehrte Implikation: Seien X und Y unabhängig. Nach dem obigen Argument gilt dann die Identität E(f (X) · g(Y )) = E(f (X)) · E(g(Y )) bereits für alle Elementarfunktionen der Form f = 1B1 und g = 1B2 . Die Linearität P liefert P des Erwartungswertes dann die Behauptung für alle Funktionen ϕ := i bi · 1Bi und ψ := j cj · 1Cj . Da sich alle beschränkten meßbaren Funktionen f und g durch solche Treppenfunktionen approximieren lassen, folgt die Behauptung wie üblich mit Hilfe des Satzes von Lebesgue über dominanten Konvergenz 2.25 (f ,g sind beschränkt nach Voraussetzung). Satz 3.39. Sei (Ω, F, P) ein Wahrscheinlichkeitsraum und X1 , . . . , Xn : Ω → R unabhängige Zufallsvariablen. Dann gilt: Var n X i=1 Xi = n X Var(Xi ) i=1 und insbesondere im Fall n = 2 gerade Var(X1 + X2 ) = Var(X1 ) + Var(X2 ), falls X1 und X2 unabhängige Zufallsvariablen sind. 66 KAPITEL 3. ANWENDUNGEN IN DER STOCHASTIK Beweis. Wir zeigen die Behauptung zunächst für den Fall n = 2. Es ergibt sich mit Hilfe der vorausgesetzten Unabhängigkeit nach dem vorhergehenden Satz Var(X1 + X2 ) = E(X1 + X2 )2 − (E(X1 + X2 ))2 = E(X12 ) + 2 · E(X1 · X2 ) + E(X22 ) − (E(X1 ))2 − 2 · E(X1 ) · E(X2 ) − (E(X2 ))2 = E(X12 ) + 2 · E(X1 ) · E(X2 ) + E(X22 ) − (E(X1 ))2 − 2 · E(X1 ) · E(X2 ) − (E(X2 ))2 = E(X12 ) − (E(X1 ))2 + E(X22 ) − (E(X2 ))2 = Var(X1 ) + Var(X2 ), also die Behauptung. Für n > 2 folgt die Behauptung vermöge Var n X Xi = Var X1 + n X i=1 i=2 = n X Xi = Var(X1 ) + Var n X Xi = . . . i=2 Var(Xi ), i=1 also insgesamt alles gezeigt. 3.7 Grenzwertsätze und Anwendungen Auch in diesem Abschnitt bezeichne (Ω, F, P) wieder einen Wahrscheinlichkeitsraum und (Xn )n∈N eine Folge von Zufallsvariablen Xi : Ω → R für alle i ∈ N. Wir erinnern uns, dass die “Funktionswerte” der Xi uns die Ausgänge eines Zufallsexperiments mitteilen. Stellen wir uns nun vor, die Zufallsvariablen Xi haben die gleiche Verteilung. Dann können wir uns die Sequenz (Xn )n∈N als eine Folge von Wiederholungen ein und desselben Experiments vorstellen. Wir wollen im folgenden vor allem den Fall betrachten, dass diese Wiederholungen voneinander unabhängig sind (so z.B. das Würfeln mit einem Würfel oder das Ziehen aus einer Urne mit Zurücklegen der jeweils gezogenen Kugel). Dazu müssen wir unsere Definition von Unabhängigkeit von endlich vielen Zufallsvariablen auf eine Sequenz der Form (Xn )n∈N ausdehnen. Definition 3.40. Wir sagen, dass (Xn )n∈N eine Sequenz von unabhängigen Zufallsvariablen ist, wenn für jedes n ∈ N die Zufallsvariablen X1 , . . . , Xn unabhängig sind. Diese Definition ist äquivalent zu der sonst üblichen: (Xn )n∈N ist eine Sequenz von unabhängigen Zufallsvariablen, wenn je endlich viele Xi1 , . . . , Xin 3.7. GRENZWERTSÄTZE UND ANWENDUNGEN 67 unabhängig sind. Wir wollen uns nun ein wenig mit Sequenzen der Form Sn := X1 + . . . + Xn beschäftigen. Haben alle Xi die gleiche Verteilung und sind sie unabhängig, so ist Snn der durchschnittliche Wert von Xn (oder auch Xn−1 , . . . , X1 , da alle Xi die gleiche Verteilungsfunktion haben und somit die eine Zufallsvariable stets eine Kopie der anderen ist). Wir wollen versuchen, die folgende Frage zu beantworten: Wann konvergieren die Zufallsvariablen Sn und, wenn ja, gegen welchen Wert? In welchem Sinne findet diese Konvergenz statt? Wir werden zunächst einen geeigneten Konvergenzbegriff einführen: Definition 3.41. Die Folge von Zufallsvariablen (Xn )n∈N konvergiert in Wahrscheinlichkeit gegen die Zufallsvariable X, wenn für alle ε > 0 gilt: lim P(|Xn − X| > ε) = 0. n→∞ Definition 3.42. Die Folge von Zufallsvariablen (Xn )n∈N konvergiert fast sicher gegen die Zufallsvariable X, wenn es eine Nullmenge N ⊆ Ω gibt derart, dass lim Xn (ω) = X(ω) n→∞ für alle ω ∈ Ω \ N gilt. Bemerkung 3.43. Konvergenz “fast sicher” von (Xn )n∈N gegen X bedeutet also, dass Xn überall bis auf einer Nullmenge punktweise gegen X konvergiert. Konvergenz in Wahrscheinlichkeit ist lediglich ein Spezialfall der Konvergenz dem Maße nach, die wir in Definition 2.5 eingeführt hatten. Wir werden nun sehen, dass Konvergenz “fast sicher” stets Konvergenz “in Wahrscheinlichkeit” impliziert. Satz 3.44. Konvergiert die Folge von Zufallsvariablen (Xn )n∈N fast sicher gegen die Zufallsvariable X, so konvergiert (Xn )n∈N auch in Wahrscheinlichkeit gegen X. Beweis. Folgt sofort aus der allgemeineren Formulierung des Satzes von Lebesgue 2.6. Bemerkung 3.45. Dass aus Konvergenz dem Maße nach (also hier: Konvergenz in Wahrscheinlichkeit) nicht fast überall punktweise Konvergenz (also hier: Konvergenz fast sicher) folgt, haben wir in einem Beispiel im Anschluß an den Beweis von Satz 2.6 gesehen. Dort haben wir auf Ω = [0, 1) das Lebesgue-Maß λ betrachtet, dass wir auch als Wahrscheinlichkeitsmaß interpretieren können. Somit ist das Beispiel auch im stochastischen Kontext relevant. 68 KAPITEL 3. ANWENDUNGEN IN DER STOCHASTIK Satz 3.46. (Ungleichung von Chebyshev) Sei Y : Ω → R+ 0 eine nichtnegative Zufallsvariable, ε > 0 und 0 < p < ∞. Dann gilt P(Y ≥ ε) ≤ E(Y p ) . εp Beweis. Der Beweis ist sehr einfach. Sei A := {ω ∈ Ω | Y (ω) ≥ ε}. Dann gilt: Z Z Z p p p p E(Y ) = Y (ω) d P(ω) ≥ Y (ω) d P(ω) ≥ ε · 1(ω) d P(ω) ≥ εp · P(A), Ω A A woraus nach Divison durch εp sofort die Behauptung folgt. Bemerkung 3.47. Die Ungleichung von Chebyshev zeigt uns, dass Konvergenz in Lp (Ω, P) bezüglich der Norm k · kp stets Konvergenz in Wahrscheinlichkeit impliziert, denn gilt kYn − Y kp → 0 für n → ∞, wobei (Yn )n∈N eine Folge von Zufallsvariablen und Y eine Zufallsvariable ist, so gilt auch kYn − Y kpp → 0, also Z p E(|Yn − Y | ) = |Yn (ω) − Y (ω)|p d P(ω) = kYn − Y kpp → 0, Ω für n → ∞. Die Ungleichung von Chebyshev liefert nun P(|Yn − Y | ≥ ε) ≤ E(|Yn − Y |p ) →0 εp für n → ∞ und für jedes feste ε > 0. Dies bedeutet aber, dass Yn gegen Y in Wahrscheinlichkeit konvergiert. Wir kommen nun zu dem zentralen Resultat dieses Abschnitts, dem schwachen Gesetz der großen Zahlen. Satz 3.48. (Schwaches Gesetz der großen Zahlen) Sei X1 , X2 , . . . eine Folge unabhängiger, identisch verteilter Zufallsvariablen mit E(Xi ) = m und Var(Xi ) ≤ K < ∞ für alle i ∈ N. Setze Sn := X1 + . . . + Xn für alle n ∈ N. Dann konvergiert Snn gegen den Erwartungswert m sowohl im L2 -Sinne als auch in Wahrscheinlichkeit. Beweis. Es ist E(Sn ) = E(X1 ) + . . . + E(Xn ) = n · m für alle n ∈ N nach der Linearität des Erwartungswertes. Damit erhalten wir E S n n =m und E S n n −m 2 = Var S n n . 3.8. SCHWACHES GESETZ DER GROSSEN ZAHLEN 69 Nach Satz 3.39 folgt nun, da X1 , X2 , . . . unabhängig sind, Var S n n 1 n2 1 = 2 n 1 ≤ 2 n K = n = · Var(Sn ) · (Var(X1 ) + . . . + Var(Xn )) ·n·K →0 für n → ∞. Es folgt E( Snn − m)2 → 0 für n → ∞, also die behauptete L2 -Konvergenz. Da wir in der obigen Bemerkung gesehen hatten, dass Lp Konvergenz stets Konvergenz in Wahrscheinlichkeit impliziert, folgt hieraus die Behauptung. 3.8 Anwendungen des schwachen Gesetzes der großen Zahlen Wir werden in diesem letzten Abschnitt im wesentlichen zwei Anwendungen für das schwache Gesetz der großen Zahlen 3.48 kennenlernen. Die erste ist der sogenannte Approximationssatz von Bernstein-Weierstrass und die zweite eine Monte-Carlo-Methode zur Berechnung von bestimmten Integralen “schwieriger Funktionen” (d.h. Funktionen, von denen wir keine Stammfunktion kennen oder berechnen können). Letztere Methode werden wir jedoch nicht in aller Allgemeinheit, sondern nur für einen sehr speziellen Fall andeuten. Satz 3.49. (Approximationssatz von Bernstein-Weierstrass) Ist f : [0, 1] → R eine stetige Funktion, so konvergiert die Folge der BernsteinPolynome n k X n fn (x) := · xk · (1 − x)n−k · f k n k=0 gleichmäßig gegen die Funktion f . Beweis. Wir definieren eine Folge von Zufallsvariablen (Xi )i∈N vermöge ( 1 mit Wahrscheinlichkeit x Xi := 0 mit Wahrscheinlichkeit 1 − x 70 KAPITEL 3. ANWENDUNGEN IN DER STOCHASTIK sowie Sn := X1 + . . . + Xn für alle n ∈ N. Nun betrachten wir die Zufallsvariable f ( Snn ). Die Zufallsvariable Sn kann die Werte 0, 1, 2, . . . , n annehmen, da Sn die Summe der Xi ist und jedes Xi nur den Wert 0 oder 1 annehmen kann. Die n Wahrscheinlichkeit, dass Sn den Wert k annimmt ist gegeben durch k · xk · (1 − x)n−k . Folglich kann die Zufallsvariable f ( Snn ) die Werte f ( nk ) annehmen für k = 0, . . . , n und nimmt jeden dieser Werte ebenfalls mit Wahrscheinlichkeit n · xk · (1 − x)n−k an. Damit ergibt sich für ihren Erwartungswert k n k S X n n k n−k = · x · (1 − x) ·f = fn (x). E f n k n k=0 Es folgt: S n − f (x) sup |fn (x) − f (x)| ≤ sup E f n x∈[0,1] x∈[0,1] S n − f (x) . ≤ sup E f n x∈[0,1] Da f : [0, 1] → R als stetige Funktion auf dem kompakten Intervall [0, 1] automatisch gleichmäßig-stetig ist, gibt es zu jedem ε > 0 ein δ > 0 mit |f (x)−f (y)| ≤ 2ε für alle x, y ∈ [0, 1] mit |x − y| ≤ δ. Damit folgt dann aber: Z S S n n − f (x) = − f (x) E f f d P(ω) Sn n n {ω|| n −x|<δ} Z S n + − f (x) d P(ω). f n {ω|| Snn −x|≥δ} Das erste Integral können wir nach oben durch 2ε abschätzen. Für das zweite Integral erhalten wir Z S S n n − f (x) d P(ω) ≤ 2 · sup |f (x)| · P − x ≥ δ . f n n x∈[0,1] {ω|| Snn −x|≥δ} Wegen E( Snn ) = E(Xi ) = x liefert das schwache Gesetz der großen Zahlen 3.48 S n P − x ≥ δ → 0 n für n → ∞, denn Var( Snn ) ist endlich. Es handelt sich sogar um in x gleichmäßige Konvergenz, denn mit 4·x·(1−x) ≤ 1 und Var(Sn ) = n·Var(Xi ) = n·(E(Xi2 )− 3.8. SCHWACHES GESETZ DER GROSSEN ZAHLEN 71 (E(Xi ))2 ) = n · (x − x2 ) = n · x · (1 − x) folgt mit der Ungleichung von Chebyshev 3.46 (setze dort p = 2): E(| Sn − x|2 ) S Var( Snn ) x · (1 − x) 1 n n P − x ≥ δ ≤ = ≤ ≤ . 2 2 2 n δ δ n·δ 4 · n · δ2 Für hinreichend große n wird also die linke Seite der letzten Ungleichung beliebig klein, also das Gesamtintegral ≤ 2ε . Insgesamt folgt damit sup |fn (x) − f (x)| ≤ ε, x∈[0,1] was die behauptete gleichmäßige Konvergenz beweist. Der Approximationssatz von Bernstein-Weierstraß ist ein klassisches Resultat der Analysis und findet nicht nur dort, sondern auch in der Funktionalanalysis Anwendnung. Die Aussage über die gleichmäßige Konvergenz besagt im wesentlichen nichts anderes, als dass die Menge der Bernstein-Polynome dicht in C([0, 1]) mit der Supremumsnorm liegt. Als zweite Anwendung kommen wir dazu, wie man Werte von schwierigen bestimmten Integralen über dem Einheitsintervall [0, 1] mit stochastischen Mitteln berechnen kann: Satz 3.50. (Monte-Carlo-Methode zur Berechnung von Integralen) Sei f : [0, 1] → R eine integrierbare Funktion und (Xn )n∈N eine Folge unabhängiger Zufallsvariablen auf [0, 1], die der Gleichverteilung unterliegen. Definiere die Folge der Zufallsvariablen In := n 1 X · f (Xk ) n k=1 für alle n ∈ N. Dann gilt: Z 1 In → f (x) d x 0 für n → ∞ in Wahrscheinlichkeit. Beweis. Die Verteilung der Zufallsvariablen Xk ist das Lebesgue-Maß auf [0, 1]. Also gilt nach Satz 3.16 Z Z Z Z E(f (Xk )) = f (Xk (ω)) d P(ω) = f (x) d PXk (x) = f (x) d λ = f (x) d x. Ω [0,1] [0,1] [0,1] 72 KAPITEL 3. ANWENDUNGEN IN DER STOCHASTIK Es folgt: Z n X 1 1 f (x) d x. E(In ) = · E f (Xk ) = · n · E(f (Xk )) = n n [0,1] k=1 Das schwache Gesetz der großen Zahlen 3.48 liefert daher mit Z 1 P In − f (x) d x ≥ ε → 0 0 die gewünschte Konvergenz in Wahrscheinlichkeit.