Grundlagen zur Maß- und Integrationstheorie mit ersten

Werbung
Universität Paderborn
Fakultät für Elektrotechnik, Informatik und Mathematik
Institut für Mathematik
Maß- und Integrationstheorie
Kai Gehrs
[email protected]
Paderborn, 16. Februar 2007
Inhaltsverzeichnis
1 Maßtheoretische Grundlagen
1.1 Semiringe, Ringe und Algebren . . . . . . . . .
1.2 Erzeugende Strukturen . . . . . . . . . . . . . .
1.3 Borelsche Mengen . . . . . . . . . . . . . . . . .
1.4 Meßbare Abbildungen . . . . . . . . . . . . . .
1.5 Meßbare numerische Funktionen . . . . . . . . .
1.6 Maße und verwandte Begriffe . . . . . . . . . .
1.7 Vollständige Maßräume . . . . . . . . . . . . . .
1.8 Das Borel-Lebesgue-Maß und das Lebesgue-Maß
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
3
3
5
6
8
11
14
21
23
2 Grundlagen der Integrationstheorie
2.1 Approximation durch Treppenfunktionen . . .
2.2 Weitere Konvergenzaussagen . . . . . . . . . .
2.3 Das Lebesgue-Integral . . . . . . . . . . . . .
2.4 Grenzwertsätze für Lebesgue-Integrale . . . .
2.5 Vergleich von Riemann- und Lebesgue-Integral
2.6 Die Lp -Räume . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
25
25
26
28
35
39
44
.
.
.
.
.
.
.
.
51
51
52
56
57
60
62
66
69
.
.
.
.
.
.
3 Anwendungen in der Stochastik
3.1 Wahrscheinlichkeitsmaße . . . . . . . . . . . . . . . .
3.2 Zufallsvariablen . . . . . . . . . . . . . . . . . . . . .
3.3 Integration bezüglich Wahrscheinlichkeitsverteilungen
3.4 Absolut-stetige Maße und Verteilungsfunktionen . . .
3.5 Erwartungswerte von Zufallsvariablen . . . . . . . . .
3.6 Allgemeine p-te Momente von Zufallsvariablen . . . .
3.7 Grenzwertsätze und Anwendungen . . . . . . . . . .
3.8 Schwaches Gesetz der großen Zahlen . . . . . . . . .
1
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Kapitel 1
Maßtheoretische Grundlagen
In diesem ersten Kapitel werden wir die grundlegenden Strukturen kennenlernen, in denen wir uns im Rahmen von Maß- und Integrationstheorie “bewegen”.
Dazu gehören in erster Linie (Mengen-)Algebren bzw. σ-(Mengen)-Algebren,
aber auch einfachere Strukturen, aus denen sich solche “erzeugen” lassen. Sei
im gesamten Kapitel stets Ω eine Grundmenge von Elementen, z.B. Ω = R,
Ω = [0, 1] etc., sowie M ein Mengensystem M ⊆ ℘(Ω), wobei ℘ die Potenzmenge, also die Menge aller Teilmengen, bezeichnet. Ferner bezeichnen wir für
A ∈ ℘(Ω) mit A := Ω \ A das Komplement der Menge A.
1.1
Semiringe, Ringe und Algebren
Wir beginnen mit den elementaren, für uns interessanten Strukturen, die wir in
der folgenden Definition einführen:
Definition 1.1. Sei M ⊆ ℘(Ω) ein System von Mengen.
(i) M heißt ein Semiring in Ω wenn gilt:
(a) ∅ ∈ M
(b) Sind A, B ∈ M, so folgt stets A ∩ B ∈ M.
(c) Für beliebige A, B ∈ M existieren stets endlich
Sn viele paarweise disjunkte Mengen A1 , . . . , An ∈ M mit A \ B = i=1 Ai .
(ii) M heißt ein Ring in Ω, wenn für alle A, B ∈ M gilt:
(a) A ∪ B ∈ M
(b) A \ B ∈ M.
3
4
KAPITEL 1. MASSTHEORETISCHE GRUNDLAGEN
(iii) M heißt eine Algebra in Ω, wenn gilt:
(a) Sind A, B ∈ M, so folgt stets A ∪ B ∈ M.
(b) Ω ∈ M
(c) Ist A ∈ M, so folgt stets A ∈ M.
(iv) Ein Ring bzw. eine Algebra M heißt ein σ-Ring bzw. eine σ-Algebra, wenn
zusätzlich S
zu den üblichen Eigenschaften gilt: Sind An ∈ M, n ∈ N, so
folgt stets ∞
n=1 An ∈ M.
(v) M heißt monoton oder auch monotone Klasse, wenn gilt:
(a) Sind A1 ⊆ A2 ⊆ A3 ⊆ . . ., An ∈ M für alle n ∈ N, so folgt
M.
S∞
An ∈
(b) Sind A1 ⊇ A2 ⊇ A3 ⊇ . . ., An ∈ M für alle n ∈ N, so folgt
M.
T∞
An ∈
n=1
n=1
Bemerkung 1.2. Da Algebren stets auch Komplemente von Mengen
S∞enthalten,
enthalten σ-Algebren neben abzählbaren
Vereinigungen der Form n=1
T∞An auch
T∞
alle abzählbaren Durchschnitte n=1 An , denn es gilt nach DeMorgan n=1 An =
S∞
n=1 An . Ferner ist jede Algebra A ein Ring, denn sind A, B ∈ A, so folgt
A \ B = A ∩ B = A ∪ B ∈ A.
Beispiel 1.3. Die beiden einfachsten Beispiele, die alle Bedingungen der obigen
Definition befriedigen, sind ℘(Ω) und {∅, Ω}. Ein wenig interessanter ist das
folgende Beispiel: Betrachte das Mengensystem M1 = {(a, b] | a ≤ b, a, b ∈
R} mit der Konvention (a, a] = ∅. Dann ist M1 ein Semiring. Offensichtlich
ist M1 kein Ring, denn die Vereinigung zweier disjunkter Intervalle lässt sich
offensichtlich nicht als Intervall der Form (a, b] schreiben. Wenn M1 kein Ring
ist, so kann M1 auch keine Algebra sein, denn jede Algebra ist ein Ring. Dagegen
ist M2 mit M2 := {A ⊆ Ω | A oder A ist endlich} zwar eine Algebra, aber keine
σ-Algebra, denn abzählbare Vereinigungen endlicher Mengen sind unendlich und
müssen nicht endliches Komplement
S∞ besitzen.1 Betrachte dazu z.B. Ω = [0, 1] und
1
An := { n } für n ∈ N. Dann ist n=1 An = { n | n ∈ N} nicht endlich und ebenso
auch ihr Komplement keine endliche Menge.
Wir werden nun sehen, dass die in Definition 1.1 geforderten Eigenschaften an
Mengensysteme bei Durchschnittbildung im wesentlichen erhalten bleiben:
1.2. ERZEUGENDE STRUKTUREN
5
Satz 1.4. Sei I eine beliebige Indexmenge und Mi ein System von Ringen
bzw. σ-Ringen
bzw. Algebren bzw. σ-Algebren bzw. monotonen Klassen. Dann
T
ist auch i∈I Mi wieder ein Ring bzw. ein σ-Ring bzw. eine Algebra bzw. eine
σ-Algebra bzw. eine montone Klasse.
Beweis. Exemplarisch führenTwir den Beweis für den Fall, dass Mi ein Familie
von Ringen ist. Sind A, B ∈ i∈I Mi , so folgt A, B ∈ Mi für alle
T i ∈ I. Folglich
gilt A ∪ B, A \ B ∈ Mi für alle i ∈ I, also auch A ∪ B, A \ B ∈ i∈I Mi . Analog
folgt alles andere.
1.2
Erzeugende Strukturen
In diesem Abschnitt werden wir sehen, dass wir aus einfacheren Strukturen
kompliziertere “gewinnen’ können, d.h. dass z.B. ein Semiring einen Ring und
dieser wiederum eine Algebra erzeugen kann.
Definition 1.5. Sei wieder M ⊆ ℘(Ω) ein Mengensystem. Der Durchschnitt
aller Ringe bzw. σ-Ringe bzw. Algebren bzw. σ-Algebren bzw. monotoner Klassen, die M enthalten, heißt der bzw. die bzw. das von M erzeugte Ring bzw. σRing bzw. Algebra bzw. σ-Algebra bzw. montone Klasse und wird mit R(M)
bzw. Rσ (M) bzw. A(M) bzw. Aσ (M) bzw. m(M) bezeichnet.
Bezüglich Inklusion sind also die Mengen R(M) bzw. Rσ (M) bzw. A(M)
bzw. Aσ (M) bzw. m(M) die jeweils kleinste Struktur, die M enthält. Statt
Aσ (M) schreiben wir häufig kurz σ(M) und nennen diese σ-Algebra auch die
Borelsche Erweiterung von M.
Lemma 1.6. Sind M1 und M2 Mengensysteme mit M1 ⊆ R(M2 ) und M2 ⊆
R(M1 ), so folgt R(M1 ) = R(M2 ).
Beweis. Aus M1 ⊆ R(M2 ) folgt sofort R(M1 ) ⊆ R(M2 ). Wegen der geforderten Symmetrie folgt sofort auch die umgekehrte Inklusion. Dies zeigt die
Behauptung.
Mit dem folgenden Satz charakterisieren wir diejenigen Ringe, die von Seminringen erzeugt werden, ein wenig genauer:
Satz 1.7. Der von einem Semiring S erzeugte Ring R(S) ist das System aller
endlichen Vereinigungen V von paarweise disjunkten Mengen aus S.
6
KAPITEL 1. MASSTHEORETISCHE GRUNDLAGEN
Beweis. Wir zeigen zunächst
Sm V ⊆ R(S). Seien A1 , . . . , Am ∈ S mit Ai ∩Aj = ∅.
Wegen S ⊆ R(S) folgt i=1 Ai ∈ R(S). Nun zur umgekehrten Inklusion. Es gilt
S ⊆ V ⊆ R(S). Mit obigem Lemma erhalten wir daher R(V) = R(S). Gelingt
es zu zeigen, dass V ein Ring ist, so folgt daraus V = R(V) = R(S). Sind
A, B ∈ V, so gibt es nach Definition von V endlich
Sm viele paarweise
Sndisjunkte
Mengen A1 , . . . , Am und B1 , . . . , Bn in S mit A = i=1 Ai und B = j=1 Bj . Es
gilt nun:
m
n
m [
n
[
[
[
A∩B =
Ai ∩
Bj =
(Ai ∩ Bj ).
i=1
j=1
i=1 j=1
Weil Ai ∩ Bj paarweise disjunkt sind und Ai ∩ Bj ∈ S folgt A ∩ B ∈ V, d.h. der
Durchschnitt zweier beliebiger Mengen aus V ist wieder ein Element von V.
Damit sind auch endliche Durchschnitte von Elementen aus V stets wieder in
V enthalten. Für jedes feste j sind die Mengen Ai \ Bj paarweise disjunkt und
lassen sich nach Definition 1.1(i)(c) als disjunkte Vereinigung von Mengen aus S
schreiben. Folglich ist jede dieser Mengen der Gestalt Ai \Bj inS
V enthalten und,
da sie für festes j paarweise disjunkt sind, wir erhalten A\Bj = m
i=1 (Ai \Bj ) ∈ V
und damit auch
n
n
[
\
A\B =A\
Bj =
(A \ Bj ) ∈ V.
j=1
j=1
Wegen A ∪ B = (A \ B) ∪ B und da A \ B und B disjunkt sind, folgt auch
A ∪ B ∈ V, d.h. V ist ein Ring.
Ohne Beweis geben wir noch den folgenden Satz an, der auf ähnliche Weise wie
im obigen Beweis gezeigt werden kann:
Satz 1.8. Ist A eine Algebra, so gilt m(A) = σ(A), d.h. die von einer Algebra
erzeugte monotone Klasse ist gleich ihrer Borelschen Erweiterung.
1.3
Borelsche Mengen
Sei im folgenden (Ω, O) ein topologischer Raum. Zur Erinnerung: Es ist O eine
Topologie auf Ω, wenn ∅, Ω ∈ O und endliche Durchschnitte und beliebige
Vereinigungen von Elementen aus O stets wieder in O enthalten sind. Dann
definieren wir:
Definition 1.9. Die σ-Algebra σ(O), die von der Topologie O auf Ω erzeugt
wird, heisst die σ-Algebra der Borelschen Teilmengen von Ω und wird mit
B(Ω, O) bezeichnet.
1.3. BORELSCHE MENGEN
7
Für uns von besonderem Interesse ist der Fall Ω = Rd , d ∈ N. Für a =
(a1 , . . . , ad ), b = (b1 , . . . , bd ) ∈ Ω definieren wir
a ≤ b :⇐⇒ ai ≤ bi , i = 1, . . . , d
a < b :⇐⇒ a ≤ b und a 6= b
a / b :⇐⇒ ai < bi , i = 1, . . . , d
sowie
(a, b) := {c ∈ Ω | a / c / b}
(a, b] := {c ∈ Ω | a / c ≤ b}
[a, b) := {c ∈ Ω | a ≤ c / b}
[a, b] := {c ∈ Ω | a ≤ c ≤ b}
und
I()d := {(a, b) | a, b ∈ Ω}
I(]d := {(a, b] | a, b ∈ Ω}
I[)d := {[a, b) | a, b ∈ Ω}
I[]d := {[a, b] | a, b ∈ Ω}
Satz 1.10. Es sei Ω = Rd und es sei Ad die Menge aller abgeschlossenen
Teilmengen von Rd , Od die Menge aller offenen Teilmengen von Rd sowie Kd
die Menge aller kompakten Teilmengen von Rd . Dann gilt:
B(Rd ) = σ(I()d ) = σ(I(]d ) = σ(I[)d ) = σ(I[]d ) = σ(Od ) = σ(Ad ) = σ(Kd ),
d.h. alle aufgeführten Mengen erzeugen dieselbe σ-Algebra der Borelschen Teilmengen von Ω.
T
1
Beweis. S
Es sei 1 := (1, . . . , 1) S
∈ Ω. Dann gilt: (a, b] T
= ∞
n=1 (a, b + n · 1),
∞
∞
∞
(a, b) = n=1 [a+ n1 ·1, b), [a, b) = n=1 [a, b− n1 ·1], [a, b] = n=1 (a− n1 ·1, b]. Damit
folgt σ(I(]d ) ⊆ σ(I()d ) ⊆ σ(I[)d ) ⊆ σ(I[]d ) ⊆ σ(I(]d ), also σ(I(]d ) = σ(I()d ) = σ(I[)d ) =
σ(I[]d ). Da sich jede offene Menge als höchstens abzählbare Vereinigung offener
“Intervalle” aus I()d schreiben lässt, erhalten wir ferner: σ(Od ) ⊆ σ(I()d ). Da alle
Mengen in I()d offen sind, folgt auch die umgekehrte Inklusion und wir erhalten
σ(Od ) = σ(I()d ). Desweiteren gilt I[]d ⊆ Kd ⊆ Ad ⊆ σ(Od ). Per Definition gilt
ferner B(Ω) = σ(Od ). Anwendung der σ-Operation auf die letzte Inklusionskette
liefert dann noch die fehlenden Identitäten und der Satz ist bewiesen.
8
KAPITEL 1. MASSTHEORETISCHE GRUNDLAGEN
Bemerkung 1.11. Es gilt {∅, Rd } ( B(Rd ) ( ℘(Rd ), d.h. insbesondere dass es
auch nicht-Borelsche Teilmengen von Rd gibt. Die Konstruktion solcher Mengen
kann mit Hilfe des Auswahlaxioms durchgeführt werden. Wir führen sie hier
nicht durch.
Bemerkung 1.12. Neben den oben angegebenen Erzeugendensystemen der σAlgebra der Borelschen Teilmengen
von Rd , gilt auch B(Rd ) = σ({(−∞ · 1, c] |
S
c ∈ Rd }), denn aus (−∞ · 1, c] = ∞
n=1 (−n · 1, c] folgt zunächst σ({(−∞ · 1, c] |
d
d
d
c ∈ R }) ⊆ σ(I(] ) = B(R ). Umgekehrt gilt (a, b] = (−∞ · 1, b] \ (−∞ · 1, a], also
I(]d ⊆ σ({(−∞ · 1, c] | c ∈ Rd }) und damit die Behauptung. Ebenso zeigt man,
dass auch B(Rd ) = σ({[c, 1 · ∞) | c ∈ Rd }) gilt.
1.4
Meßbare Abbildungen
Seien Ω, E 6= ∅ Grundmengen und X : Ω → E eine Abbildung. Für jede
Teilmenge A ⊆ Ω setzen wir X(A) := {X(ω) | ω ∈ A} und für jede Teilmenge
Γ ⊆ E definieren wir die Urbildmenge X −1 (Γ) := {ω ∈ Ω | X(ω) ∈ Γ}. Es
gelten die folgenden wichtigen Eigenschaften, die wir hier ohne Beweis angeben,
die sich aber auf elementarem Niveau nachrechnen lassen: Sei I eine beliebige
Indexmenge sowie (Γi )i∈I ⊆ ℘(E), M, N ⊆ E. Dann gilt:
(i) Ist M ⊆ N , so folgt auch X −1 (M ) ⊆ X −1 (N ).
(ii) X −1 (M ) = X −1 (M ∩ X(Ω))
S
S
(iii) X −1 ( i∈I Γi ) = i∈I X −1 (Γi )
T
T
(iv) X −1 ( i∈I Γi ) = i∈I X −1 (Γi )
(v) X −1 (∅) := ∅ verwenden wir als Konvention.
(vi) X −1 (E) = Ω
(vii) X −1 (M \ N ) = X −1 (M ) \ X −1 (N )
(viii) X −1 (M ) = X −1 (M )
Unmittelbar aus diesen Eigenschaften ergibt sich das folgende Resultat:
Korollar 1.13. Sind Ω, E 6= ∅ Grundmengen und ist X : Ω → E eine Abbildung, so überträgt X alle wesentlichen Eigenschaften eines Mengensystems
M ⊆ ℘(E) auf das Urbildsystem X −1 (M) := {X −1 (Γ) | Γ ∈ M}. Mit anderen
Worten: Ist M ein Ring, eine Algebra, ein σ-Ring, eine σ-Algebra oder eine
monotone Klasse, so auch X −1 (M).
1.4. MESSBARE ABBILDUNGEN
9
Definition 1.14. Sei E 6= ∅ und E eine σ-Algebra in E. Dann heißt das Paar
(E, E) ein meßbarer Raum.
Definition 1.15. Sind (Ω, F) und (E, E) meßbare Räume und ist X : Ω → E
eine Abbildung, so heißt X F-E-meßbar oder kurz meßbar, wenn klar ist, welche
zugrundeliegenden σ-Algebren gemeint sind, falls gilt X −1 (E) ⊆ F.
Bemerkung und Definition 1.16. Sind (Ω, OΩ ) und (E, OE ) topologische
Räume, so ist X : Ω → E stetig, wenn Urbilder offener Mengen unter X wieder offen sind, d.h. falls X −1 (OE ) ⊆ OΩ . Betrachten wir also auf Ω und E die
σ-Algebren der Borelschen Teilmengen, so werden wir sehen, dass jede stetige
Abbildung meßbar ist. Die Umkehrung gilt nicht, wie wir ein wenig später auch
sehen werden. Starten wir ferner mit einer Abbildung X : Ω → E und ist uns auf
E eine σ-Algebra E gegeben, so können wir in Ω die σ-Algebra X −1 (E) betrachten. Wir nennen dann X −1 (E) die von X erzeugte σ-Algebra in Ω. Offensichtlich
ist X −1 (E) die kleinste σ-Algebra in Ω, so dass X meßbar ist. Entsprechende
Konzepte für X anstelle von X −1 existieren nicht.
Wir wollen nun ein etwas handlicheres Kriterium dafür angeben, wann eine
Abbildung messbar ist.
Satz 1.17. (Hinreichende Meßbarkeitsbedingung) Seien (Ω, F) und
(E, E) meßbare Räume und X : Ω → E eine Abbildung. Hinreichend für die
Meßbarkeit der Abbildung X ist, dass für ein beliebiges Erzeugendensystem E 0
von E gilt: X −1 (E 0 ) ⊆ F.
Beweis. Sei G eine beliebige σ-Algebra in Ω und definiere X ◦ G := {Γ ⊆ ℘(E) |
X −1 (Γ) ∈ G}. Dann ist X ◦ G eine σ-Algebra in E, denn X −1 (E) = Ω ∈ G,
also E ∈ X ◦ G. Für ein beliebiges Γ ∈ X ◦ G gilt X −1 (Γ) ∈ G, also
X −1 (Γ) = X −1 (Γ) ∈ G, d.h. Γ ∈ X ◦ G. Es bleibt zu zeigen, dass auch abzählbare Vereinigungen von Elementen aus X ◦ G wieder in X ◦ G enthalten sind.
−1
Sei (Γ
(ΓnS
) ∈ G für alle n ∈ N und folglich
n )n∈N ⊆ XS◦ G. Dann gilt X
S
∞
∞
−1
−1
X ( n=1 Γn ) = n=1 X (Γn ) ∈ G, d.h. ∞
n=1 Γn ∈ X ◦ G. Nun zum eigentlichen Beweis des Satzes: Nach Voraussetzung ist E 0 ein Erzeugendensystem von
E, also σ(E 0 ) = E, und es gilt X −1 (E 0 ) ⊆ F. Damit erhalten wir E 0 ⊆ X ◦ F, also
E = σ(E 0 ) ⊆ σ(X ◦ F) = X ◦ F, da X ◦ F bereits eine σ-Algebra ist. Insgesamt
folgt also X −1 (E) ⊆ F.
Um auf Meßbarkeit zu überprüfen genügt es also, zu beweisen dass das Urbild
eines Erzeugendensystems der betreffenden σ-Algebra in der σ-Algebra des Definitionsbereichs der jeweiligen Abbildung enthalten ist. Unmittelbar aus dem
Satz vom hinreichenden Meßbarkeitskriterium folgt:
10
KAPITEL 1. MASSTHEORETISCHE GRUNDLAGEN
Korollar 1.18. Sind (Ω, OΩ ) und (E, OE ) topologische Räume und ist X : Ω →
E stetig, so ist X B(Ω, OΩ )-B(E, OE )-meßbar.
Beweis. Die Stetigkeit von X bedeutet gerade X −1 (OE ) ⊆ OΩ und OE ist ein
Erzeugendensystem der Borel-σ-Algebra in E.
Beispiel 1.19. Wir betrachten die Dirichlet-Funktion X : [0, 1] → R mit
X(x) := 1[0,1]∩Q (x), d.h. diejenige Funktion die 1 ist auf allen rationalen Punkten aus [0, 1] und 0 auf allen irrationalen Punkten. Die Funktion X ist nicht
stetig. Sei nun Γ ⊆ B(R). Dann gilt

∅



[0, 1] ∩ Q
X −1 (Γ) =

[0, 1] \ Q



[0, 1]
falls
falls
falls
falls
0, 1 ∈
/Γ
1 ∈ Γ, 0 ∈
/Γ
0 ∈ Γ, 1 ∈
/Γ
0, 1 ∈ Γ
S
Offensichtlich gilt ∅, [0, 1] ⊆ B([0, 1]). Ferner ist [0, 1] ∩ Q = x∈[0,1]∩Q {x} eine
abzählbare Vereinigung von Einpunktmengen. Da sowohl Einpunktmengen als
auch damit abzählbare Vereinigungen dieser in B([0, 1]) enthalten sind, folgt
[0, 1] ∩ Q ⊆ B([0, 1]). Damit folgt auch [0, 1] \ Q = [0, 1] \ ([0, 1] ∩ Q) ⊆ B([0, 1]).
Damit ist X zwar nicht stetig, aber dennoch B([0, 1])-B(R)-meßbar.
Korollar 1.20. Die Komposition meßbarere Abbildungen ist meßbar. Im Detail:
Sind (Ω, F), (E1 , E1 ) und (E2 , E2 ) meßbare Räume und X : Ω → E1 und Y :
E1 → E2 meßbare Abbildungen, so ist auch Y ◦ X meßbar.
Beweis. Es gilt Y −1 (E2 ) ⊆ E1 und X −1 (E1 ) ⊆ F. Also gilt (Y ◦ X)−1 (E2 ) =
X −1 (Y −1 (E2 )) ⊆ F.
Beispiel 1.21. Alle elementaren Operationen R2 → R mit (x, y) 7→ x ± y,
(x, y) 7→ x · y, (x, y) 7→ x ∨ y := max{x, y}, (x, y) 7→ x ∧ y := min{x, y} sind
stetig und daher meßbar.
Wir wollen nun die Begrifflichkeiten ausdehnen auf diskrete Produkte meßbarer
Räume:
Lemma und Definition 1.22. Sei nQ∈ N und (Ei , Ei )i=1,...,n eine endliche
Familie meßbarer Räume. Setze Ω := ni=1 Ei := E1 × . . . × En . Sei ferner
πi : Ω → Ei ,Sπi (ω1 , . . . , ωn ) := ωi die i-te Koordinatenprojektion. Dann ist
Q
n
n
−1
i=1 Ei := σ( i=1 πi (Ei )) die kleinste
Qn σ-Algebra, bezüglich derer alle Projektionen πi meßbar sind. Wir nennen i=1 Ei die Produkt-σ-Algebra zu E1 , . . . , En .
1.5. MESSBARE NUMERISCHE FUNKTIONEN
11
Qd
d
Bemerkung 1.23. Betrachten wir Ω :=
und sind πi für
i=1 R = R
iQ= 1, . . . , d die i-ten Koordinatenprojektionen, so ist die Produkt-σ-Algebra
d
i=1 B(R) bezüglich derer alle Koordinatenprojektionen meßbar sind gerade
die Borel-σ-Algebra B d (R) aus Satz 1.10. Das obige Lemma bietet also einen alternativen, abstrakteren Zugang zu einer Verallgemeinerung der σ-Algebra der
Borelschen Teilmengen auf R hin zu einer σ-Algebra der Borelschen Teilmengen
auf Rd . Desweiteren lässt sich die obige Konstruktion noch weiter verallgemeinern: Statt der Prodjektionen πi können auch beliebige
meßbare Abbildungen
Qn
Xi : Ω → Ei betrachtet werden, wobei Ω = i=1 Ei , und dann analog diejenige kleinste σ-Algebra auf Ω definiert wird bezüglich derer alle Xi meßbar
sind. Man kann sogar nicht endliche und nicht diskrete Indexmengen bei der
Produktbildung betrachten und gelangt dann zu dem Begriff des stochastischen
Prozeßes.
1.5
Meßbare numerische Funktionen
In diesem Abschnitt werden wir uns mit meßbaren numerischen Funktionen
beschäftigen. Sei wieder Ω 6= ∅ eine Grundmenge. Wir bezeichnen mit R :=
R ∪ {−∞, ∞} die Kompaktifizierung der reellen Achse und vereinbaren aus
Konsistenzgründen für c ∈ R die folgenden Konventionen: c + ∞ = ∞, c − ∞ =
−∞, c · ∞ = ∞, falls c > 0 und c · ∞ = −∞, falls c < 0, 0 · (±∞) = 0,
∞ + ∞ = ∞, −∞ − ∞ = −∞, ∞ · ∞ = ∞, −∞ · ∞ = −∞, −∞ · (−∞) = ∞,
∞ − ∞ ist nicht definiert. Ferner gelte für alle definierten Sonderfälle jeweils
auch das Kommutativgesetz.
Definition 1.24. Die σ-Algebra der Borelschen Teilmengen auf R ist definiert
als B(R) := {A, A ∪ {∞}, A ∪ {−∞}, A ∪ {−∞, ∞} | A ∈ B(R)}.
d
Analog wird auch die σ-Algebra der Borelschen Teilmengen von R definiert.
Für eine beliebige Abbildung f und eine Menge Γ bezeichnen wir das Urbild
f −1 (Γ) von an nun auch mit [f ∈ Γ].
Definition 1.25. Eine Funktion f : Ω → R heißt eine numerische Funktion.
Eine Funktion g : Ω → R heißt eine reelle numerische Funktion.
Satz 1.26. Sei (Ω, F) ein meßbarer Raum und f : Ω → R eine numerische
Funktion. Dann ist f genau dann F-B(R)-meßbar, wenn eine der folgenden
Bedingungen erfüllt ist:
(i) [f ≤ c] ∈ F für alle c ∈ R
12
KAPITEL 1. MASSTHEORETISCHE GRUNDLAGEN
(ii) [f < c] ∈ F für alle c ∈ R
(iii) [f ≥ c] ∈ F für alle c ∈ R
(iv) [f > c] ∈ F für alle c ∈ R
Beweis. Da jede der Mengen {[−∞, c] | c ∈ R}, {[−∞, c) | c ∈ R}, {[c, ∞] |
c ∈ R} und {(c, ∞] | c ∈ R} ein Erzeugendensystem von B(R) ist, folgt die
Behauptung aus der hinreichenden Meßbarkeitsbedingung 1.17.
Lemma 1.27. Sei (Ω, F) ein meßbarer Raum und f, g : Ω → R meßbare numerische Funktionen. Dann gilt:
(i) [f < g] ∈ F
(ii) [f ≤ g] ∈ F
(iii) [f = g] ∈ F
(iv) [f > g] ∈ F
(v) [f ≥ g] ∈ F
Beweis. Es gilt für a, b ∈ R a S
< b genau dann, wenn
S es ein q ∈ Q gibt mit
a < q < b. Also folgt: [f < g] = q∈Q [f < q < g] = q∈Q ([f < q] ∩ [g > q]) ∈ F,
da mit [f < q], [g > q] ∈ F auch [f < q]∩[g > q] ∈ F und damit
T∞ auch abzählbare
Vereinigungen über diese Mengen. Ferner gilt [f ≤ g] = n=1 [f < g + n1 ]. Da
jede der Mengen [f < g + n1 ] nach dem, was wir bereits gezeigt haben, in F
liegt, liegt auch der abzählbare Durchschnitt über all diese Mengen in F. Wegen
[f = g] = [f ≤ g] \ [f < g] folgt auch [f = g] ∈ F. Der Rest folgt analog.
Satz 1.28. Sei (Ω, F) ein meßbarer Raum. Sind f, g : Ω → R meßbare Funktionen, so sind auch
(i) c · f für alle c ∈ R
(ii) f ± g
(iii) f · g
(iv) f ∨ g und f ∧ g
meßbare Funktionen (falls sie definiert sind).
1.5. MESSBARE NUMERISCHE FUNKTIONEN
13
Beweis. (i) Es gilt [c · f ≤ a] = [f ≤ ac ] und letztere Menge liegt nach dem
obigen Lemma in F.
(ii) Es gilt [f ± g ≤ a] = [f ≤ a ∓ g] und letztere Menge liegt ebenfalls nach
obigem Lemma in F.
Der Beweis von (iii) ist aufwendiger. Wir führen ihn hier nicht durch. Die Aussagen (iv) folgen mit [f ∨ g ≤ a] = [f ≤ a] ∩ [g ≤ a] und [f ∧ g ≤ a] = [f ≤
a] ∪ [g ≤ a].
Korollar 1.29. Sei (Ω, F) ein meßbarer Raum. Dann ist f : Ω → R meßbar
genau dann, wenn f + := f ∨ 0 und f − := −(f ∧ 0) meßbar sind.
Beweis. Sei f meßbar. Da die Nullfunktion 0 meßbar ist ([0 ≤ c] ist für jedes c ∈ R entweder ∅ oder Ω und beide Mengen sind in F enthalten), sind
nach dem obigen Satz f ∨ 0 und f ∧ 0 meßbar, also auch f + und f − . Sind f +
und f − meßbare numerische Funktionen, so auch f + − f − = f . Dies zeigt die
Behauptung.
Satz 1.30. Sei (Ω, F) ein meßbarer Raum und (fn )n∈N eine Familie meßbarer numerischer Funktionen fn : Ω → R. Dann sind (falls definiert) ebenfalls
meßbar:
(i) supn∈N fn
(ii) inf n∈N fn
(iii) lim supn→∞ fn
(iv) lim inf n→∞ fn
T
Beweis. Wegen [supn∈N fn ≤ a] = ∞
n=1 [fn ≤ a] und da alle Mengen [fn ≤ a]
in F enthalten sind, folgt auch [supn∈N fn ≤ a] ∈ F, d.h. supn∈N fn ist meßbar.
Die Aussage über das Infimum folgt mit Übergang zu Komplementen. Wegen
lim supn→∞ fn = inf n∈N supm≥n fm und lim inf n→∞ fn = supn∈N inf m≥n fm folgt
daraus auch bereits die Meßbarkeit von lim supn→∞ fn und lim inf n→∞ fn .
Dass in der Situation von oben unter speziellen Bedingungen auch limn→∞ fn
wieder eine meßbare Funktion ist, ist richtig. Jedoch sind zum Beweis Voraussetzungen nötig, die wir momentan noch nicht zur Hand haben. Das nötige
Handwerkszeug werden wir zur Verfügung haben, wenn wir Maße, Maßräume
und vollständige Maßräume studiert haben.
14
1.6
KAPITEL 1. MASSTHEORETISCHE GRUNDLAGEN
Maße und verwandte Begriffe
Sei wieder Ω 6= ∅ eine Grundmenge. In diesem Abschnitt werden wir Maße auf
meßbaren Räumen einführen.
Definition 1.31. Sei S ein Semiring in Ω. Eine Abbildung µ : S → R heißt ein
Inhalt, falls gilt:
(i) µ(∅) = 0
(ii) µ ≥ 0
(iii) µ
d.h. sind AP
1 , . . . , An ∈ S paarweise disjunkt mit
Snist endlich additiv, S
n
n
i=1 µ(Ai ).
i=1 Ai ∈ S, so gilt µ( i=1 Ai ) =
µ heißt ein σ-additiver Inhalt oder auch ein
jede FamiS∞Prämaß, falls für S
∞
A
∈
S
gilt:
µ(
lie
(A
)
disjunkter
Mengen
aus
S
mit
i=1 Ai ) =
i=1 i
P∞ n n∈N
i=1 µ(Ai ). Ist S sogar eine σ-Algebra, so heißt ein Prämaß ein Maß. Ist der
Bildbereich von µ bereits durch R gegeben, so spricht man von einem reellen
Inhalt, Prämaß bzw. Maß. Ist ferner F eine σ-Algebra in Ω und µ : F → R ein
Maß auf F, so nennen wir das Tripel (Ω, F, µ) einen Maßraum.
Bemerkung 1.32. Inhalte, Prämaße und Maße sind ganz spezielle numerische Funktionen. Offensichtlich ist jedes Maß gleichzeitig ein Prämaß und jedes
Prämaß ist ein Inhalt. Wir erinnern uns daran, dass wir als Erzeugendensystem
der σ-Algebra der Borelschen Teilmengen auf R z.B. die Menge aller halboffenen Intervalle der Form (a, b] wählen konnten. Die Menge dieser Intervalle
bildete einen Semiring. Das σ-Erzeugnis dieses Semirings war dann gerade die
σ-Algebra der Borelschen Teilmengen auf R. Ähnlich wie wir einen Semiring zu
einer σ-Algebra erweitert haben, werden wir auch bei der Definition von Maßen
auf σ-Algebren vorgehen. Zunächst betrachten wir einen Semiring und einen
Inhalt auf diesem Semiring. Dann werden wir sehen, dass wir den Inhalt auf
dem Semiring unter geeigneten Voraussetzungen zu einem Maß auf derjenigen
σ-Algebra fortsetzen können, die von dem betreffenden Seminring erzeugt wird.
Satz 1.33. (Erster Fortsetzungssatz) Sei S ein Semiring in Ω sowie µ : S →
R ein Inhalt. Dann kann µ in eindeutiger Weise zu einem genauso bezeichneten
Inhalt µ : R(S) → R auf den von S erzeugten Ring R(S) fortgesetzt werden. Ist
dabei µ ein reeller Inhalt auf S, so ist auch seine Fortsetzung ein reeller Inhalt
auf R(S). Ist µ σ-additiv auf S, so auch seine Fortsetzung auf R(S).
1.6. MASSE UND VERWANDTE BEGRIFFE
15
Beweis. Während des Beweises bezeichnen wir die Fortsetzung des Inhalts µ
mit µ. Sei R := R(S). Nach Satz 1.7 ist der von dem Semiring S erzeugte
Ring R(S) gerade das System aller endlichen Vereinigungen V von paarweise
disjunkten Mengen aus S. Für eine beliebige Menge A ∈ RSexistieren also stets
n
endlich viele disjunkte Mengen
Pn A1 , . . . , An ∈ S mit A = i=1 Ai . Wir können
daher definieren: µ(A) := i=1 µ(Ai ). Zeigen wir, dass diese Definition nicht
von der Wahl der Darstellung von A als disjunkte Vereinigung endlich vieler
Mengen
Smabhängt, so haben wir auf diese Weise einen Inhalt definiert. Sei daher
A = i=1 Bi für ebenfalls paarweise disjunkte Mengen B1 , . . . , Bm ∈ S. Dann
gilt:
µ(A) =
n
X
i=1
µ(Ai ) =
n
m
n X
m
[
X
X
µ
(Ai ∩ Bj ) =
µ(Ai ∩ Bj ).
i=1
j=1
i=1 j=1
Pm Pn
Ganz analog folgt µ(A) =
j=1
i=1 µ(Bj ∩ Ai ), indem man die Rollen der
Ai und Bj vertauscht. Also ist µ ein auf ganz R wohldefinierter Inhalt. Ist
so folgt
nun ν : R → R ein weiterer Inhalt, der auf S mit µ übereinstimmt,
Sn
für ein beliebiges A ∈ R mit derP
üblichen Darstellung
A = i=1 Ai , Ai ∈ S
Pn
n
für i = 1, . . . , n gerade ν(A) =
i=1 µ(Ai ) = µ(A), also die
i=1 ν(Ai ) =
behauptete Eindeutigkeit. Ist nun µ reellwertig, so ist auch µ per Definition reellwertig. Es bleibt zu zeigen, dass die Fortsetzung eines σ-additiven Inhalts stets
wieder σ-additiv ist. Sei also µ σ-additiv
S∞ und (An )n∈N eine Familie paarweise
disjunkter Mengen aus R mit V := n=1 An ∈ R. Für jedes An existieren
Smn endlich viele paarweise disjunkte Mengen An1 , . . . , Anmn ∈ S mit An = j=1 Anj .
Wegen V S
∈ R gibt es ebenso paarweise
disjunkte SMengen
V1 , . . . , Vm ∈ S
S∞
∞ Smn
m
mit V = i=1 Vi . Es gilt Vi = n=1 (Vi ∩ An ) = n=1 j=1 (Vi ∩ Anj ) und
da mit Vi , Anj ∈ S P
auch P
Vi ∩ Anj ∈ S gilt, folgt mit derSσ-Additivität von
∞
mn
m
µS
gerade µ(Vi ) =
nj ). Wegen V =
n=1
i=1 Vi ergibt sich
Pm j=1 µ(Vi ∩
PA
∞
m P∞ Pmn
µ( n=1 An ) = µ(V ) = i=1 µ(Vi ) = i=1 n=1 j=1 µ(Vi ∩ Anj ), woraus sich
die behauptete σ-Additivität von µ ergibt.
Beispiel 1.34. Alle Wahrscheinlichkeitsmaße sind Inhalte, Prämaße und Maße.
Betrachten wir Ω = [0, 1] ∩ Q und S := {(a, b] ∩ Q, (a, b) ∩ Q, [a, b) ∩ Q, [a, b] ∩ Q |
a, b ∈ [0, 1]} so ist S ein Semiring und vermöge µ(I) := (b − a)+ wird ein Inhalt
auf S definiert. Dieser ist allerdings
S nicht σ-additiv, denn es gilt µ(Ω) = µ([0, 1]∩
Q) = 1−0 = 1, aber [0, 1]∩Q = x∈[0,1]∩Q {[x, x]} ist eine abzählbare Vereinigung
disjunkter
Mengen und µ([x, x]) = 0. Wäre µ σ-additiv, so folgt µ([0, 1] ∩ Q) =
P
d
d
x∈[0,1]∩Q µ([x, x]) = 0. Ist ferner Ω = R und S := I(] , so wird vermöge
Qd
Qd
λ((a, b]) := i=1 λ(ai , bi ] := i=1 (bi − ai )+ der sogenannte Borel-Lebesguesche
Elementarinhalt definiert. Wir werden auf ihn nochmals zurückkommen.
16
KAPITEL 1. MASSTHEORETISCHE GRUNDLAGEN
Wir wollen nun einige weitere elementare Eigenschaften von Inhalten zusammentragen, die uns später noch von Nutzen sein werden.
Lemma 1.35. Sei S ein Semiring in Ω und µ : S → R ein Inhalt. Dann gilt:
(i) Sind A, B ∈ S mit A ⊆ B, so gilt µ(A) ≤ µ(B).
S
P
(ii) Für je endlich viele A1 , . . . , An ∈ S, n ∈ N, gilt µ( ni=1 Ai ) ≤ ni=1 µ(Ai ).
(iii) Sind A, B ∈ S mit A ∪ B ∈ S, so gilt µ(A ∪ B) = µ(A) + µ(B) − µ(A ∩ B).
Beweis.
Per Definition des Semiringes erhalten wir die Darstellung B = A ∪
Sn
i=1 Ai für paarweise disjunkte A1 , . . . , An ∈ S, die
P ebenfalls disjunkt zu A
gewählt werden können. Dann gilt µ(B) = µ(A) + ni=1 µ(Ai ), woraus wegen
µ ≥ 0 sofort die Behauptung aus (i) folgt. Behauptung (ii) zeigen wir nur für
den Fall n = 2: Sind A1 , A2 ∈ S, so gibt es wieder entsprechende
S paarweise
disjunkte Mengen BS1 , . . . , Bn und C1 , . . . , Cm mit A1 = (A1 ∩ A2 ) ∪ ni=1
SnBi und
m
= (A1 ∩ A2 ) P
∪ i=1 Bi ∪
A2 = (A1 ∩ A2 ) ∪ j=1 Cj . Dann gilt aber A1 ∪ A2P
S
m
n
m
µ(B
)
+
C
und
es
folgt
µ(A
∪
A
)
=
µ(A
∩
A
)
+
1
2
1
j=1 µ(Cj ).
i=1 P i
j=1 j
P2n
m
Ferner gilt µ(A1 ) + µ(A2 ) = 2 · µ(A1 ∩ A2 ) + i=1 µ(Bi ) + j=1 µ(Cj ), woraus
im Fall n = 2 die Behauptung folgt. Die Verallgemeinerung auf endlich viele
Mengen A1 , . . . , An wird mit analogen Schlüssen bewiesen. Die Behautung aus
(iii) folgt sofort durch Vergleich der drei Summendarstellungen für µ(A1 ), µ(A2 )
und µ(A1 ∪ A2 ).
Die obigen Eigenschaften erinnern uns wieder stark an die Eigenschaften eines
Wahrscheinlichkeitsmaßes und sind daher auch nicht überraschend.
Lemma 1.36. Sei R ein Ring in Ω und µ : S
R → R ein Inhalt. Dann gilt
für
System (An )n∈N ⊆ R mit ∞
n=1 An ∈ R die Abschätzung
P∞jedes disjunkte
S∞
µ(A
)
≤
µ(
A
).
n
n=1
n=1 n
Sn
S∞
Beweis.
Für
alle
n
∈
N
gilt
A
⊆
i
i=1
i=1 Ai . Mit obigem Lemma folgt daher
Sn
S∞
µ( i=1 Ai ) ≤ µ( i=1 AS
i ). Da R ein Ring ist, sind endliche Vereinigungen in R
n
enthalten und es gilt
Pn i=1 Ai ∈ R für
S alle n ∈ N.
S Da die Mengen paarweise
disjunkt sind, folgt i=1 µ(Ai ) = µ( ni=1 Ai ) ≤ µ( ∞
i=1 Ai ). Grenzübergang für
n → ∞ liefert somit die Behautung.
Wenn µ σ-additiv, also ein Prämaß, ist, so gilt per Definition im obigen Lemma
die Gleichheit. Bei nicht-σ-additiven Inhalten steht dort eine echte Ungleichung.
Für Prämaße erhalten wir die folgende, allgemeinere Aussage:
1.6. MASSE UND VERWANDTE BEGRIFFE
17
Lemma 1.37. Sei R ein Ring in Ω und µ : R → R ein
S∞Prämaß auf R. Dann
gilt für alle
P A ∈ R und alle (An )n∈N ⊆ R mit A ⊆ n=1 An die Ungleichung
µ(A) ≤ ∞
n=1 µ(An ).
Der Beweis wird ganz ähnlich zu dem Beweis des obigen Lemmas geführt. Wir
führen ihn hier nicht durch. Ebenso ohne ausführlichen Beweis geben wir die
folgende Charakterisierung von σ-Additivität mit Hilfe von Stetigkeit an:
Satz 1.38. Sei R ein Ring in Ω und µ : R → R ein Inhalt. µ ist genau dann
ein Prämaß, wenn für jedes A ∈ R und für jede montone Folge (An )n∈N ⊆ R
mit An ↑ A gilt: µ(An ) ↑ µ(A). Ist µ sogar reellwertig, so sind äquivalent:
(a) µ ist ein Prämaß.
(b) Für jedes A ∈ R und für jede montone Folge (An )n∈N ⊆ R mit An ↑ A
gilt: µ(An ) ↑ µ(A).
(c) Für jedes A ∈ R und für jede montone Folge (An )n∈N ⊆ R mit An ↓ A
gilt: µ(An ) ↓ µ(A).
(d) Für jede montone Folge (An )n∈N ⊆ R mit An ↓ ∅ gilt: µ(An ) ↓ 0.
Beweis. Wir skizzieren die Idee: Sei A ∈ R und (An )n∈N ⊆ R mit An ↑ A.
Betrachte die Disjunktifizierung
A = A1 ∪ (A2 \ A1 ) ∪ (A3 \ A2 ) ∪ (A4 \ A3 ) ∪ . . . .
|{z} | {z } | {z } | {z }
=:B1
=:B2
=:B3
=:B4
Ist µ σ-additiv, so gilt:
µ(A) =
∞
X
n=1
µ(Bn ) = lim
m→∞
m
X
µ(Bn ) = lim µ
m→∞
n=1
m
[
Bn .
n=1
S
Wegen m
n=1 Bn = Am folgt also µ(A) = limm→∞ µ(Am ). Umgekehrt erfülle µ
die Stetigkeitsbedingung.
Sei (An )n∈N eine Folge
S
Sm paarweise disjunkter Mengen
aus R mit A := ∞
A
∈
R.
Setze
B
:=
m
n=1 n
n=1 An . Dann ist (Bm )m∈N eine
monoton wachsende Mengenfolge mit Bm ↑ A. Es folgt nach Voraussetzung
µ(Bm ) → µ(A) für m → ∞. Da µ als Inhalt endlich additiv ist, erhalten wir
µ(Bm ) = µ
m
[
n=1
m
X
An =
µ(An )
n=1
18
KAPITEL 1. MASSTHEORETISCHE GRUNDLAGEN
und damit
µ
∞
[
An = µ(A) = lim µ(Bm ) = lim
n=1
m→∞
m→∞
m
X
n=1
µ(An ) =
∞
X
µ(An ),
n=1
also die behauptete σ-Additivität. Alle anderen Aussagen folgen mit analogen
Schlüssen.
Wir wollen nun daran arbeiten, wie man ein Prämaß zu einem Maß fortsetzen
kann. Der erste Fortsetzungssatz 1.33 lieferte die Aussage, dass sich jeder Inhalt
auf einem Semiring in eindeutiger Weise unter Erhalt seiner wesentlichen Eigenschaften (z.B. der σ-Additivität) zu einem Inhalt auf den von dem Seminring
erzeugten Ring fortsetzen läßt. Da die σ-Additivität bei diesem Fortsetzungsprozeß erhalten bleibt, kann auch jedes Prämaß auf einem Semiring zu einem
eindeutig bestimmten Prämaß auf den vom Semiring erzeugten Ring fortgesetzt
werden kann. Die Konstruktion der Fortsetzung eines Prämaßes auf einem Ring
hin zu einem Maß auf einer σ-Algebra geht auf Caratheodory zurück und wird
hier im folgenden skizziert, wobei wir nicht immer alle Beweise bis ins kleinste Detail durchführen. Alle Beweise finden sich z.B. in dem Buch Maß- und
Integrationstheorie von Heinz Bauer. Zunächst benötigen wir den Begriff des
äußeren Maßes:
Definition 1.39. Wir nennen eine Abbildung µ? : ℘(Ω) → R ein äußeres Maß
auf Ω oder auch ℘(Ω), wenn gilt:
(i) µ? (∅) = 0
(ii) µ? ≥ 0
(iii) Sind A, B ∈ ℘(Ω) mit A ⊆ B, so gilt stets µ? (A) ≤ µ? (B).
S
P∞ ?
(iv) Für jede Folge (An )n∈N ⊆ ℘(Ω) gilt µ? ( ∞
n=1 An ) ≤
n=1 µ (An ).
Bemerkung 1.40. Vergessen wir für einen Moment, dass ein äußeres Maß auf
der gesamten Potenzmenge von Ω definiert sein muss, so stellen wir fest dass
jedes Prämaß auf einem Ring R per Definition die Eigenschaften (i) und (ii)
erfüllt. Nach Lemma 1.35 erfüllt ein Prämaß auch die Monotonieforderung aus
(iii). Eigenschaft (iv) ist für jedes Prämaß nach Lemma 1.37 gegeben. Ferner ist
jedes auf ganz ℘(Ω) definierte Maß ein äußeres Maß. Die Umkehrung ist falsch,
wie das folgende Beispiel zeigt.
1.6. MASSE UND VERWANDTE BEGRIFFE
19
Beispiel 1.41. Sei Ω = {1, 2} und
(
0 falls A = ∅
µ? (A) :=
.
1 falls A ∈ ℘(Ω) \ {∅}
Offensichtlich ist µ? ein äußeres Maß, denn die Bedingungen (i), (ii) und (iii) der
obigen Definition sind in jedem Fall erfüllt. Auch die Monotonieforderung aus
(iv) läßt sich leicht verifizieren. Allerdings ist µ? kein Maß, ja nicht einmal sogar
ein Inhalt, denn wäre es ein Maß, so müsste gelten 1 = µ? (Ω) = µ? ({1} ∪ {2}) =
µ? ({1}) + µ? ({2}) = 1 + 1 = 2. Widerspruch!
Definition 1.42. Sei µ? : ℘(Ω) → R ein äußeres Maß. M ∈ ℘(Ω) heißt µ? meßbar, falls für alle A ∈ ℘(Ω) gilt: µ? (A ∩ M ) + µ? (A ∩ M ) = µ? (A). Die
Menge aller µ? -meßbaren Mengen bezeichnen wir mit M(µ? ).
Den folgenden Satz zitieren wir ohne Beweis: Der Beweis des Satzes ist technisch
sehr aufwendig.
Satz 1.43. Es sei µ? : ℘(Ω) → R ein äußeres Maß. Dann gilt:
(i) M(µ? ) ist eine σ-Algebra.
(ii) µ? |M(µ? ) ist ein Maß.
Ebenso ohne Beweis geben wir an:
Lemma 1.44. Es sei µ : R → R ein Prämaß auf dem Ring R. Für jede
Teilmenge A ⊆ Ω sei
∞
o
n
[
An
U(A) := (An )n∈N ⊆ R | A ⊆
n=1
die Menge aller Überdeckungen von A durch jeweils abzählbar viele Vereinigungen von Elementen aus R und
o
( n P∞
inf
µ(A
)
|
(A
)
∈
U(A)
falls U(A) =
6 ∅
n
n n∈N
n=1
µ? (A) :=
∞
falls U(A) = ∅
Dann gilt:
(i) µ? ist ein äußeres Maß.
20
KAPITEL 1. MASSTHEORETISCHE GRUNDLAGEN
(ii) R ⊆ M(µ? )
(iii) µ? |R = µ
Bemerkung 1.45. (Fortsetzung eines Prämaßes zu einem Maß) Satz
1.43 zusammen mit Lemma 1.44 liefert nun die gewünschte Fortsetzung eines
Prämaßes zu einem Maß. Wir starten mit einem Prämaß µ auf einem Ring R.
Dann zeigt uns Lemma 1.44 wie wir ein äußeres Maß µ? definieren können,
derart, dass µ? auf R mit µ übereinstimmt. Dann betrachten wir µ? auf M(µ? ).
Letzteres Mengensystem ist nach Satz 1.43 eine σ-Algebra und µ? ein Maß
darauf.
Wir wollen uns zum Abschluß dieses Abschnitts noch der Frage der Eindeutigkeit
widmen: Ist das gemäß Bemerkung 1.45 definierte Maß die eindeutige Fortsetzung von µ auf M(µ? )? Wie lässt sich M(µ? ) alternativ charakterisieren? Die
erste Frage werden wir sofort beantworten. Beim Versuch der Beantwortung der
zweiten Frage werden wir auf den Begriff des vollständigen Maßraums treffen.
Zunächst aber betrachten wir ein Beispiel, dass zeigt, dass die Forsetzung eines
Prämaßes nicht eindeutig sein muss.
Beispiel 1.46. Sei Ω 6= ∅ und R = {∅} der triviale Ring. Dann ist durch
µ(∅) := 0 ein Prämaß auf R definiert. Die kleinste σ-Algebra, die R umfasst
ist {∅, Ω}. Offensichtlich kann nun µ auf diese auf unendlich viele Arten fortgesetzt werden, denn für µ(Ω) kann jede reelle Zahl ≥ 0 gewählt werden. Die
Fortsetzung ist also keinesweg eindeutig. Wir beobachten, dass sich Ω jedoch
nicht von den Elementen aus R “approximieren” lässt. Der folgende Satz liefert
eine Formalisierung dieser Beobachtung.
Satz 1.47. (Eindeutigkeitssatz) Sei Z ein durchschnittsstabiles Erzeugendensystem der σ-Algebra A in Ω. Es existiere eine Folge (Zn )n∈N ⊆ Z mit
Zn ↑ Ω für n → ∞. Dann gilt für beliebige Maße µ und ν auf A: Ist µ|Z = ν|Z ,
so folgt bereits µ|A = ν|A .
Definition 1.48. Ein Inhalt µ : S → R auf dem Semiring S heißt σ-endlich,
falls eine Folge (An )n∈N ⊆ S existiert mit An ↑ Ω für n → ∞ und µ(An ) < ∞
für alle n ∈ N.
Da jeder Semiring, der einen Ring erzeugt, stets ein durchschnittsstabiles Erzeugendensystem für den betreffenden Ring ist, erhalten wir als Folgerung aus
Satz 1.47:
1.7. VOLLSTÄNDIGE MASSRÄUME
21
Korollar 1.49. Sei S ein Semiring und R := R(S). Jedes σ-endliche Prämaß
µ : R → R kann auf genau eine Weise zu einem genauso bezeichneten Maß auf
σ(R) fortgesetzt werden.
Beweis. Satz 1.43 zusammen mit Lemma 1.44 liefern eine Fortsetzung von µ
auf M(µ? ) ⊇ R. Da µ σ-endlich ist, sind die Voraussetzungen aus Satz 1.47
erfüllt.
1.7
Vollständige Maßräume
Wir werden in diesem Abschnitt eine alternative Charakterisierung für die σAlgebra M(µ? ) der µ? -meßbaren Mengen finden. Sei wie immer Ω eine Grundmenge.
Definition 1.50. Sei R ein Ring in Ω und µ : R → R ein Inhalt auf R. Mit
NR := {A ∈ R | µ(A) = 0} bezeichnen wir die Menge der Nullmengen bezüglich
µ von R. Mit NR0 := {M ∈ ℘(Ω) | es gibt A ∈ NR mit M ⊆ A} bezeichnen wir
die Menge aller Teilmengen von Nullmengen in R.
Bemerkung 1.51. In der Notation der obigen Definition gilt: NR ist ein Mengenideal in R, d.h. ∅ ∈ NR , mit A, B ∈ NR folgt auch A ∪ B ∈ NR und
ist A ∈ NR und B ∈ R, so folgt stets auch A ∩ B ∈ NR . Klar ist ∅ ∈ NR .
Für A ∈ NR und B ∈ R folgt wegen A ∩ B ⊆ A und da µ ein Inhalt ist
µ(A ∩ B) ≤ µ(A) = 0, also µ(A ∩ B) = 0. Für A, B ∈ NR erhalten wir
µ(A ∪ B) = µ(A) + µ(B) − µ(A ∩ B) = 0 + 0 − 0 = 0. Analog zeigt man auch,
dass NR0 ein Mengenideal in ℘(Ω) ist. Desweiteren lässt sich sogar zeigen, dass
NR0 ein Mengenteilring von ℘(Ω) ist. Wir erinnern uns, dass σ(R) die kleinste
σ-Algebra in ℘(Ω) ist, die R umfasst. Daher erhalten wir zusammen mit der
Notation aus dem letzten Abschnitt die Inklusionskette
R ⊆ σ(R) ⊆ M(µ? ),
wobei µ? das entsprechende äußere Maß bezeichnet, dass wir als Fortsetzung
von µ auf die σ-Algebra M(µ? ) nach der Konstruktion von Caratheodory im
letzten Abschnitt erhalten hatten. Daraus ergibt sich also
NR ⊆ Nσ(R) ⊆ NM(µ? )
0
0
und NR0 ⊆ Nσ(R)
⊆ NM(µ
?).
Wenn wir Maße betrachten, so “schielen” häufig mit einem Auge auf die Wahrscheinlichkeitsmaße, die sich letztendlich einfach als Spezialfälle der hier eingeführten allgemeinen Theorie ergeben sollen. Im Falle von Wahrscheinlichkeits-
22
KAPITEL 1. MASSTHEORETISCHE GRUNDLAGEN
maßen P sollte für jede Menge A mit P(A) = 0 auch P(B) = 0 für jede Teilmenge B ⊆ A gelten, wobei A und B stillschweigend als zu demselben Mengensystem gehörig vorausgesetzt werden. Man sagt: Wenn eine Menge von Ereignissen
“unmöglich” ist, so sollte rein intuitiv auch jede Teilmenge einer solchen Mengen
von unmöglichen Ereignissen mit P meßbar sein und ebenfalls unmöglich sein
(also das Maß 0 haben). Leider ist dieser Fall nicht selbstverständlich, wenn wir
ein Prämaß von einem Ring auf eine entsprechende größere, den Ring umfassende, σ-Algebra fortsetzen. Wir definieren also zunächst:
Definition 1.52. Sei (Ω, F, µ) ein Maßraum. Dann heißt dieser vollständig
bezüglich µ, wenn gilt NF0 ⊆ F gilt. Wir nennen dann auch µ ein vollständiges Maß.
Ein Maßraum ist also vollständig, wenn genau der in der obigen Bemerkung
angesprochene Fall nicht eintreten kann: Ist A ∈ F eine beliebige Nullmenge, so
gilt im Falle eines vollständigen Maßraums stets: Jede Teilmenge M ⊆ A ist in
F enthalten.
Beispiel 1.53. Betrachte Ω :=
Maß


1
µ(Γ) := 2


0
(0, 2] und F = {∅, (0, 1], (1, 2], Ω} sowie das
falls Γ ∈ {(0, 1], (1, 2]}
.
falls Γ = (0, 2]
sonst
Dann gilt NF = {∅}, also auch NF0 = {∅}. Damit ist µ ein vollständiges Maß.
Betrachtet man dagegen das Maß
(
1 falls 1 ∈ Γ
ν(Γ) :=
,
0 sonst
so gilt NF = {∅, (1, 2]}. Da aber beliebige Teilmengen von (1, 2] nicht in F
enthalten sind, ist ν kein vollständiges Maß. Wir können allerdings eine Vervollständigung (Ω, F 0 , ν 0 ) von (Ω, F, ν) betrachten mit F 0 := F ∪ ℘((1, 2]) und
ν 0 sei wie ν definiert. Dann ist (Ω, F 0 , ν 0 ) ein vollständiger Maßraum.
Definition 1.54. Sei (Ω, F, µ) ein Maßraum. Dann heißt (Ω, F 0 , µ0 ) die Vervollständigung von (Ω, F, µ), falls gilt:
(i) µ0 ist eine Fortsetzung von µ auf F 0 .
(ii) µ0 ist ein vollständiges Maß.
1.8. DAS BOREL-LEBESGUE-MASS UND DAS LEBESGUE-MASS
23
(iii) Jedes vollständige Maß µ, welches µ fortsetzt, ist auch eine Fortsetzung
von µ0 .
Das zentrale Ergebnis für uns liefert der folgende Satz:
Satz 1.55. (Vervollständigung von Maßräumen) Sei µ : F → R ein σendliches Maß auf der σ-Algebra F und µ? das von µ auf der σ-Algebra M(µ? )
der µ? -meßbaren Mengen induzierte Maß. Dann ist (Ω, M(µ? ), µ? ) die Vervollständigung von (Ω, F, µ), d.h. es gilt (Ω, F 0 , µ0 ) = (Ω, M(µ? ), µ? ).
1.8
Das
Borel-Lebesgue-Maß
Lebesgue-Maß
und
das
Wir betrachten den Erzeuger I(]d einer Borel-σ-Algebra und setzen wie zuvor
Q
λd (a, b) := di=1 (bi − ai )+ für a, b ∈ Rd . Dann gilt:
Lemma 1.56. Sei λd der wie oben angegebene Borel-Lebesguesche Elementarinhalt. Die eindeutig bestimmte gleichbezeichnete Fortsetzung von λd auf R(I(]d )
ist σ-additiv, d.h. ein Prämaß. Ferner ist λd σ-endlich.
Den technischen Beweis der σ-Additivität führen wir hier nicht durch. Der Trick
besteht im wesentlichen darin, dass man nur die Nullstetigkeit von λd im Sinne
von Satz 1.38 zeigen muss und dabei spezielle Eigenschaften kompakter Mengen
im Rn geschickt in einem Widerspruchsbeweis ausnutzt. Die σ-Endlichkeit von
λd folgt aus der Tatsache λd ((−n · 1, n · 1]) = (2 · n)d < ∞ für alle n ∈ N, wobei
(−n · 1, n · 1] ↑ Ω = Rd .
Definition 1.57. Für jedes d ∈ N heißt die eindeutig bestimmte Fortsetzung
von λd von R(I(]d ) auf ganz B(Rd ) das Borel-Lebesgue-Maß auf Rd und dessen Vervollständigung (λd )0 das Lebesgue-Maß auf der σ-Algebra B(Rd )0 der
Lebesgue-meßbaren Mengen.
24
KAPITEL 1. MASSTHEORETISCHE GRUNDLAGEN
Kapitel 2
Grundlagen der
Integrationstheorie
Wie im vorhergehenden Kapitel bezeichne Ω 6= ∅ stets eine Grundmenge. Wir
führen die folgende Sprechweise ein, die wir von nun an häufiger gebrauchen
werden:
Definition 2.1. Sei (Ω, F, µ) ein Maßraum und P ein Prädikat über Ω. Dann
sagen wir die Eigenschaft P gilt µ-fast-überall falls die Menge {ω ∈ Ω |
P (ω) ist falsch} eine Nullmenge bezüglich µ ist.
2.1
Approximation durch Treppenfunktionen
Sei (Ω, F, µ) ein Maßraum. Wir wollen uns in diesem Abschnitt ein wenig mit
Treppenfunktionen
beschäftigen. Eine Treppenfunktion ϕ : Ω → R ist von der
Pn
Form ϕ =
i=1 ci · 1Ei für E1 , . . . , En ∈ ℘(Ω) und reelle Zahlen c1 , . . . , cn .
Diese Funktionen werden später bei der Definition des Lebesgue-Integrals sehr
hilfreich sein. Es gilt:
Satz
Pn 2.2. Sei (Ω, F, µ) ein Maßraum. Eine Treppenfunktion ϕ : Ω → R, ϕ =
i=1 ci ·1Ei , ist genau dann meßbar, wenn alle Mengen E1 , . . . , En meßbar sind,
d.h. falls Ei ∈ F für i = 1, . . . , n gilt.
Beweis. O.B.d.A. dürfen wir ci < ci+1
Snannehmen und voraussetzen, dass Ei ∩
Ej = ∅ für alle i 6= j gilt sowie Ω = i=1 Ei . Sei α ∈ R beliebig. Dann gibt es
ein j mit cj ≤ α < cj+1 . Es ist [ϕ ≤ α] die Menge
Sj aller ω, die in E1 oder E2
oder usw. oder in Ej liegen. Also gilt [ϕ ≤ α] = i=1 Ei und [ϕ ≤ α] ∈ F genau
dann, wenn alle E1 , . . . , Ej in F liegen. Dies zeigt die Behauptung.
25
26
KAPITEL 2. GRUNDLAGEN DER INTEGRATIONSTHEORIE
Der folgende Satz besagt, dass sich jede meßbare Funktion stets durch eine Folge
von meßbaren Treppenfunktionen approximieren lässt.
Satz 2.3. (Approximation meßbarer Funktionen durch Treppenfunktionen) Sei f : Ω → R eine meßbare numerische Funktion. Dann existiert
eine Folge (ϕn )n∈N von meßbaren Treppenfunktionen mit ϕn (ω) → f (ω) für alle ω ∈ Ω (“punktweise Konvergenz”). Gilt f (ω) ≥ 0 für ein ω ∈ Ω, so ist
(ϕn (ω))n∈N eine monton nicht fallende Folge reeller Zahlen. Ist f beschränkt, so
konvergiert (ϕn )n∈N sogar gleichmäßig gegen f .
Beweis. Der Trick besteht darin, die Funktion f in Positiv- und Negativteil zu
zerlegen, d.h. f in der Form f = f + − f − mit f + , f − ≥ 0 zu schreiben und
sich o.B.d.A. auf eine Funktion f ≥ 0 zu beschränken. Definiere dann zu jedem
n ∈ N die Mengen
i
i−1
(i)
En := ω ∈ Ω | n ≤ f (ω) < n
2
2
für i = 1, . . . , n · 2n und
Fn := {ω ∈ Ω | f (ω) ≥ n}.
Die Folge der Treppenfunktionen erhalten wir dann vermöge
n
ϕn :=
n·2
X
i−1
i=1
2n
· 1En(i) + n · 1Fn .
(i)
Da f meßbar ist, sind alle Mengen En und Fn meßbar und folglich nach dem
obigen Satz auch ϕn für jedes n ∈ N. Die punktweise Konvergenz zeigt man nun
wie folgt: Ist ω ∈ Ω mit f (ω) = ∞, so ist ω ∈ Fn für alle n ∈ N und ϕn (ω) → ∞
für n → ∞. Ist ω ∈ Ω mit f (ω) < ∞, so existiert für alle hinreichend großen
≤ 21n und 2in − f (ω) ≤ 21n . Es folgt
n ∈ N ein Index 1 ≤ i ≤ n · 2n mit f (ω) − i−1
2n
|f (ω) − ϕn (ω)| ≤ 21n → 0 für n → ∞. Die Monotonieaussage ist per Definition
von ϕn klar. Sei nun f beschränkt und ε > 0 beliebig aber fest vorgegeben.
Wähle n ∈ N mit f < n und 21n < ε. Es gilt dann Fn = ∅. Folglich existiert zu
(i)
jedem ω ∈ Ω ein Index 1 ≤ i ≤ n · 2n mit ω ∈ En und wir erhalten wie oben
|f (ω) − ϕn (ω)| ≤ 21n < ε, also die gleichmäßige Konvergenz.
2.2
Weitere Konvergenzaussagen
Wir werden nun im wesentlichen zwei Resultate kennenlernen, die sich auf die
Konvergenz von meßbaren numerischen Funktionen beziehen. Wir hatten bereits in Kapitel I gesehen, dass Infima, Suprema, Limites Inferia und Limites
2.2. WEITERE KONVERGENZAUSSAGEN
27
Superia von meßbaren numerischen Funktionenfolgen stets wieder meßbare numerische Funktionen sind. Die Aussage, dass auch der Limes von meßbaren
Funktionen wieder eine meßbare Funktion ergibt bedarf der Vollständigkeit des
zugrundeliegenden Maßraums wie der Beweis des folgenden Satzes zeigt.
Satz 2.4. Sei (Ω, F, µ) ein vollständiger Maßraum und (fn )n∈N eine Folge meßbarer numerischer Funktionen fn : Ω → R für alle n ∈ N. Ist f : Ω → R eine
Funktion mit limn→∞ fn (ω) = f (ω) für fast alle ω ∈ Ω, so ist f meßbar.
Beweis. Sei A := {ω ∈ Ω | limn→∞ fn (ω) 6= f (ω)}. Dann ist A eine Nullmenge, d.h. µ(A) = 0. Da nach Voraussetzung der Vollständigkeit des Maßraums
(Ω, F, µ) jede Nullmenge B ⊆ A aus ℘(Ω) ebenfalls in F enthalten ist, ist
f |A : A → R meßbar bezüglich der σ-Algebra F ∩ A. Da für alle ω ∈ Ω \ A gilt
limn→∞ fn (ω) = f (ω), folgt auch lim inf n→∞ fn (ω) = f (ω). Wir hatten in Satz
1.30 gesehen, dass der Limes-Inferior einer Folge meßbarer numerischer Funktionen eine meßbare Funktion liefert. Daher ist f : Ω \ A → R meßbar, also auch
f : Ω → R.
Wir wollen nun einen weiteren Konvergenzbegriff kennenlernen, der sich als ein
wenig schwächer als punktweise Konvergenz herausstellen wird:
Definition 2.5. Sei (Ω, F, µ) ein Maßraum und (fn )n∈N eine Folge meßbarer
numerischer Funktionen fn : Ω → R für alle n ∈ N sowie f : Ω → R meßbar.
Wir sagen, (fn )n∈N konvergiert dem Maß µ nach gegen f , kurz fn ⇒ f , falls wir
für jedes ε > 0 erhalten: limn→∞ µ([|fn − f | ≥ ε]) = 0.
Satz 2.6. (Lebesgue) Sei (Ω, F, µ) ein vollständiger Maßraum mit µ(Ω) < ∞
und (fn )n∈N eine Folge meßbarer numerischer Funktionen fn : Ω → R für alle
n ∈ N sowie f : Ω → R eine numerische Funktion. Ferner seien f, fn fast
überall endlich für alle n ∈ N. Gilt dann fn (ω) → f (ω) für fast alle ω ∈ Ω, so
gilt auch fn ⇒ f .
Beweis. O.B.d.A. dürfen wir f ≥ 0 voraussetzen. Als Limes meßbarer Funktionen ist f nach dem vorhergehenden Satz meßbar. Wir definieren nun die Mengen
A := {ω ∈ Ω | f (ω) = ∞} und An := {ω ∈ Ω | fn (ω) = ∞} S
für alle n ∈ N.
Ferner sei B := {ω ∈ Ω | limn→∞ fn (ω) 6= f (ω)}. Dann ist Q := ∞
n=1 An ∪A∪B
eine Nullmenge, d.h. µ(Q) = 0. Für alle
S∞n ∈ N definiere nun En (ε)
T∞:= {ω ∈
Ω | |fn (ω) − f (ω)| ≥ ε} und Rn (ε) := k=n Ek (ε), sowie M (ε) := n=1 Rn (ε).
Wir müssen zeigen, dass gilt: limn→∞ µ(En (ε)) = 0. Da fn und f meßbar sind
für alle n ∈ N, sind M (ε), En (ε) und Rn (ε) sämtlich in F enthalten. Ferner
gilt R1 (ε) ⊇ R2 (ε) ⊇ R3 (ε) ⊇ . . ., d.h. (Rn (ε))n∈N ist eine monoton fallende
28
KAPITEL 2. GRUNDLAGEN DER INTEGRATIONSTHEORIE
Mengenfolge mit Limes M (ε) in F. Wegen µ(Ω) < ∞ und der Stetigkeit des
Maßes µ folgt daher aus Rn (ε) ↓ M (ε) gerade µ(Rn (ε)) → µ(M (ε)). Wir zeigen
nun M (ε) ⊆ Q. Sei ω0 ∈
/ Q. Nach Konstruktion von Q gilt fn (ω0 ), f (ω0 ) < ∞
für alle n ∈ N und fn (ω0 ) → f (ω0 ) für n → ∞. Zu jedem ε > 0 existiert also ein
Index n0 mit ω0 ∈ Rn0 (ε) und ω0 ∈
/ Rn0 +1 (ε). Dann folgt aber ω0 ∈
/ M (ε), also
M (ε) ⊆ Q. Da µ vollständig ist und M (ε) ∈ F folgt damit µ(M (ε)) ≤ µ(Q) = 0,
also µ(M (ε)) = 0. Es folgt limn→∞ µ(Rn (ε)) = µ(M (ε)) = 0 und wegen
En (ε) ⊆ Rn (ε) folgt limn→∞ µ(En (ε)) = 0.
Bemerkung 2.7. Die Umkehrung des Satzes von Lebesgue gilt nicht,
d.h. punktweise Konvergenz ist wirklich der stärkere Konvergenzbegriff als Konvergenz dem Maße nach. Betrachte dazu Ω := [0, 1) mit dem Lebesgue-Maß λ
(i)
(i)
und die Mengen Ek := [ i−1
, ki ) für 1 ≤ i ≤ k und k ∈ N sowie fk := 1E (i) .
k
k
Dann gilt einerseits für alle 0 < ε < 1:
(i)
(i)
λ([|fk | ≥ ε]) = λ(Ek ) =
(i)
1
→0
k
(i)
für k → ∞, also fk ⇒ 0 für k → ∞. Angenommen, es gelte fk (ω) → 0 für
k → ∞ und alle ω ∈ Ω \ N , wobei N ⊆ Ω eine Nullmenge ist. Wähle dann ein
(i )
beliebiges ω0 ∈ Ω\N . Dann gibt es zu jedem k ∈ N einen Index ik mit ω0 ∈ Ek k ,
(1)
(k)
(i )
denn für jedes k gilt Ek ∪ . . . ∪ Ek = Ω. Folglich gilt für die Teilfolge (fk k )k∈N
(i )
(i)
gerade fk k (ω0 ) = 1 für alle k ∈ N, d.h. (fk )k∈N kann nicht punktweise gegen
die Nullfunktion konvergieren. Ebenso kann auch die Forderung µ(Ω) < ∞ nicht
entfallen, denn betrachten wir z.B. Ω := [0, ∞) mit dem Lebesgue-Maß λ und
fn (ω) := (ω + n1 )2 sowie f (ω) := ω 2 . Dann gilt fn (ω) → f (ω) punktweise für
alle ω ∈ Ω, aber
i
h 2ω
1 λ([|fn − f | ≥ ε) = λ + 2 ≥ ε = ∞,
n
n
da ω ∈ [0, ∞). Falls µ nicht als vollständiges Maß vorausgesetzt wird, so muss
die Meßbarkeit der Funktion f zusätzlich gefordert werden.
2.3
Das Lebesgue-Integral
In diesem Abschnitt kommen wir nun endlich zur Definition des gewünschten
allgemeinen Integral-Begriffs.
2.3. DAS LEBESGUE-INTEGRAL
29
Definition 2.8. Sei (Ω, F, µ) ein Maßraum und f : E ⊆ F → R eine meßbare,
nichtnegative Funktion sowie
n
n
o
X
Tf := ϕ =
ci · 1Ei | n ∈ N, ci ∈ R+
,
E
⊆
F,
ϕ
≤
f
i
0
i=1
die Menge aller Treppenfunktionen, die punktweise kleiner oder gleich der Funktion f sind. Dann heißt
Z
n
X
f d µ := sup
ci · µ(Ei ∩ E)
ϕ∈Tf
E
i=1
das Lebesgue-Integral der Funktion f auf E.
Bemerkung 2.9. Ist f eine beschränkte Funktion, etwa −∞ < m :=
inf ω∈E f (ω) und M := supω∈E f (ω) < ∞, so ist folgende Definition des
Lebesgue-Integrals äquivalent zu der obigen Definition: Zu einer jeden Zerlegung Z := {y1 , . . . , yn } des Intervalls [m, M ] mit m = y1 < y2 < . . . < yn = M
definieren wir die Mengen
Ei := {ω ∈ E | yi ≤ f (ω) < yi+1 },
i = 1, . . . , n − 1
und
En := {ω ∈ E | f (ω) = yn = M }.
Dann gilt für das Lebesgue-Integral:
Z
n
X
f d µ = sup
yi · µ(Ei ),
Z
E
i=1
wobei sich das Supremum über alle Zerlegungen Z des Intervalls [m, M ] erstreckt. Wichtig ist zu beachten, dass das Lebesgue-Integral durchaus den Wert
∞ annehmen kann.
Wir können die Definition des Lebesgue-Integrals auf nahezu beliebige meßbare
Funktionen ausweiten:
Definition 2.10. Sei (Ω, F, µ) ein Maßraum und f : E ⊆ F → R eine meßbare
Funktion sowie f + :=Rf ∨ 0 und f − := −(fR ∧ 0) die Zerlegung von f in Positivund Negativteil. Gilt E f + d µ < ∞ oder E f − d µ < ∞, so definieren wir
Z
Z
Z
+
f d µ :=
f dµ −
f − d µ.
E
E
E
30
KAPITEL 2. GRUNDLAGEN DER INTEGRATIONSTHEORIE
R
R
Falls E f + d µ < ∞ und E f − d µ < ∞ gilt, so nennen wir f summierbar auf
E bezüglich µ. Die Menge aller bezüglich µ summierbaren Funktionen auf E
bezeichnen wir im folgenden mit L(E, µ).
Schon das folgende Beispiel zeigt, dass das Lebesgue-Integral um ein Vielfaches
“robuster” ist als das Riemann-Integral:
Beispiel 2.11. Sei Ω := R und E := [0, 1] versehen mit dem Lebesgue-Maß λ.
Wir betrachten f := 1E∩Q . Dann ist f sicherlich nicht Riemann-integrierbar auf
E, aber wir erhalten für das Lebesgue-Integral
Z
Z
f dλ =
1E∩Q d λ = 0,
E
E
denn: Ist Z := {y1 , . . . , yn } eine beliebige Zerlegung des Intervalls [0, 1] mit
0 = y1 < y2 < . . . < yn = 1, so gilt für 2 ≤ i < n:
Ei = {ω ∈ [0, 1] | yi ≤ f (ω) < yi+1 } = ∅
und
E1 = {ω ∈ [0, 1] | 0 ≤ f (ω) < y2 } = [0, 1] \ Q
sowie
En = {ω ∈ [0, 1] | f (ω) = 1} = [0, 1] ∩ Q.
S
Es gilt aber En = q∈[0,1]∩Q {q} ist eine abzählbare Vereinigung von Einpunktmengen, die bezüglich des Lebesgue-Maßes das Maß Null haben. Es folgt
λ(En ) = 0. Ferner gilt λ(E1 ) = λ([0, 1]) − λ(Q) = 1, da Q abzählbar ist. Da
sowieso λ(Ei ) = 0 für 2 ≤ i < n gilt, folgt also für jede Summe der Form
n
X
yi · λ(Ei ) = y1 · λ(E1 ) = 0 · 1 = 0.
i=1
Damit ist der Wert des Lebesgue-Integrals in der Tat = 0.
P
Lemma 2.12. Sei (Ω, F, µ) ein Maßraum und ϕn = ni=1 ci · 1Ei eine Treppenfunktion mit Ei ⊆ F für i = 1, . . . , n. Dann gilt für E ⊆ F:
Z
ϕn d µ =
E
n
X
ci · µ(E ∩ Ei ).
i=1
Beweis. Folgt sofort aus der “ersten Definition” des Lebesgue-Integrals.
2.3. DAS LEBESGUE-INTEGRAL
31
Satz 2.13. (Eigenschaften des Lebesgue-Integrals) Sei (Ω, F, µ) ein Maßraum.
(i) Ist f : E ⊆ F → R mit m ≤ f (ω) ≤ M für fast alle ω ∈ E, so gilt:
Z
m · µ(E) ≤
f d µ ≤ M · µ(E).
E
(ii) Seien f, g ∈ L(E, µ) und c ∈ R. Dann gilt f + g, c · f ∈ L(E, µ) und
Z
Z
Z
Z
Z
(f + g) d µ =
f dµ +
g d µ sowie
(c · f ) d µ = c ·
f d µ.
E
E
E
E
E
Damit wird L(E, µ) zu einem linearen Raum.
(iii) Sei A ⊆ E meßbar und f ≥ 0. Dann gilt
Z
Z
f d µ.
f dµ ≤
E
A
(iv) Aus 0 ≤ f (ω) ≤ g(ω) für alle ω ∈ E folgt
Z
Z
g d µ.
f dµ ≤
0≤
E
(v) Ist f ≥ 0 mit
R
E
E
f d µ = 0, so folgt f (ω) = 0 für fast alle ω ∈ E.
Beweis. Die Aussagen (i) bis (iv) folgen unmittelbar aus der Definition des
Lebesgue-Integrals, wobei bei beschränkten Funktionen auf die zur ursprünglichen Definition äquivalente Definition über Zerlegungen des Intervalls [m, M ]
zurückgegriffen werden kann. Nicht so leicht einzusehen ist die Aussage aus (v).
Wir setzen F := {ω ∈ E | f (ω) > 0} und müssen zeigen, dass F eine µ1
Nullmenge ist. Definiere nun
S∞En := {ω ∈ E | f (ω) > n }. Dann gilt En ⊆ En+1
für alle n ∈ N und F = n=1 En . Wegen der Monotonie des Maßes µ folgt
µ(En ) ≤ µ(En+1 ) ≤ µ(F ) für alle n ∈ N und folglich limn→∞ µ(En ) = µ(F ).
Angenommen, es gelte µ(F ) > 0. Dann existiert ein ε > 0 mit ε < µ(F ) und
ein n ∈ N mit µ(En ) > ε. Wegen f (ω) > n1 für alle ω ∈ En folgt damit
Z
Z
Z
ε
1
1
0=
f dµ ≥
f dµ ≥
· 1En d µ = · µ(En ) > > 0.
n
n
E
En
En n
Widerspruch! Also folgt µ(F ) = 0 und damit die Behauptung.
32
KAPITEL 2. GRUNDLAGEN DER INTEGRATIONSTHEORIE
Satz und Definition 2.14. Sei (Ω, F, µ) ein Maßraum. Dann gilt:
(i) Ist f : Ω → R eine meßbare numerische Funktion mit f ≥ 0 auf Ω, so ist
durch
Z
ν(A) :=
f d µ, ∀A ∈ F
A
ein Maß auf Ω definiert.
(ii) Ist f ∈ L(Ω, µ), so ist die Mengenfunktion
Z
ν(A) :=
f d µ, ∀A ∈ F
A
noch immer σ-additiv.
Man nennt die Funktion f ≥ 0 in (i) auch die Dichte von ν bezüglich µ.
Beweis. (i) Wegen f ≥ 0 auf ganz Ω liefert Satz 2.13(iv) ν(A) ≥ 0 für alle
A ∈ F. Ferner gilt offensichtlich ν(∅) = 0. Es bleibt also noch die σ-Additivität
zu
S∞zeigen. Sei (An )n∈N ⊆ F eine Folge paarweise disjunkter Mengen und A :=
m=1 Am . Für alle ϕ ∈ Tf gilt nun (mit den üblichen Notationen):
Z
ϕdµ =
A
Z X
n
A
=
n
X
ci ·
n
X
ci · µ(A ∩ Ei ) =
i=1
∞
X
n
X
ci · µ
i=1
∞
[
(Am ∩ Ei )
m=1
∞ X
n
∞ Z
X
X
µ(Am ∩ Ei ) =
ci · µ(Am ∩ Ei ) =
m=1
∞ Z
X
m=1
ci · 1Ei d µ =
i=1
i=1
≤
m=1 i=1
m=1
ϕdµ
Am
f dµ
Am
Bilden wir nun das Supremum über alle ϕ ∈ Tf , so ergibt sich
Z
f dµ ≤
ν(A) =
A
∞ Z
X
m=1
f dµ =
Am
∞
X
ν(Am ).
m=1
P∞
P
Es bleibt zu zeigen: ν(A) ≥ m=1 ν(Am ). Wegen ν(A) ≤ ∞
m=1 ν(Am ) genügt
es zu zeigen, dass für zwei Mengen A1 , A2 ∈ F mit A1 ∩ A2 = ∅ gilt:
Z
Z
Z
ν(A1 ∪ A2 ) =
f dµ =
f dµ +
f d µ = ν(A1 ) + ν(A2 ).
A1 ∪A2
A1
A2
2.3. DAS LEBESGUE-INTEGRAL
33
Wir haben oben bereits gesehen, dass ν(A1 ∪ A2 ) ≤ ν(A1 ) + ν(A2 ) gilt. Umgekehrt gibt es zu jedem ε > 0 Treppenfunktionen ϕ1 , ϕ2 ∈ Tf mit
Z
Z
Z
Z
f dµ =
ϕ1 d µ + ε sowie
f dµ =
ϕ2 d µ + ε.
A1
A1
A2
A2
Nun sei ϕ(ω) := max{ϕ1 (ω), ϕ2 (ω)}. Dann ist auch ϕ eine Treppenfunktion und
folglich meßbar. Es folgt:
Z
Z
Z
Z
ν(A1 ) + ν(A2 ) =
f dµ +
f dµ =
ϕ1 d µ + ε +
ϕ2 d µ + ε
A1
A2
A1
A2
Z
Z
Z
≤
ϕdµ +
ϕdµ + 2 · ε =
ϕdµ + 2 · ε
A1
A2
A1 ∪A2
Z
≤
f d µ + 2 · ε = ν(A1 ∪ A2 ) + 2 · ε.
A1 ∪A2
Für ε → 0 erhalten wir also ν(A1 ) + ν(A2 ) ≤ ν(A1 ∪ A2 ) und damit insgesamt
ν(A1 ∪ A2 ) = ν(A1 ) + ν(A2 ). Daraus folgt, wie oben bereits angedeutet, die
σ-Additivität.
(ii) Für allgemeines f ∈ L(Ω, µ) zerlege Rf = f + − f − wieder in Positiv- und
Negativteil. Wegen f ∈ L(Ω, µ) gilt 0 ≤ E f ± d µ < ∞ für alle E ∈ F. Somit
folgt die Behauptung für f ± aus dem ersten Teil dieses Satzes und damit mit
Hilfe von Satz 2.13(ii) für f = f + − f − aus der Additivität des Integrals.
Korollar 2.15. Sei (Ω, F, µ) ein Maßraum und A, B ∈ F mit B ⊆ A und
µ(A \ B) = 0. Sei ferner
R f : A → R eine Rmeßbare numerische Funktion. Gilt
für eines der Integrale A f d µ < ∞ oder B f d µ < ∞, so gilt dies auch für
das zweite Integral und es folgt
Z
Z
f dµ =
f d µ < ∞.
A
B
Beweis. O.b.d.A. dürfen wir wieder f ≥ 0 auf A annehmen. Dann folgt wegen
µ(A \ B) = 0 gerade
Z
Z
Z
Z
Z
f dµ =
f dµ =
f dµ +
f dµ =
f d µ.
A
B∪(A\B)
B
A\B
B
Definition 2.16. Sei (Ω, F, µ) ein Maßraum, E ⊆ F und f, g : E → R meßbare
numerische Funktionen. Dann schreiben wir f ∼E g, falls µ({ω ∈ E | f (ω) 6=
g(ω)}) = 0, d.h. falls f und g fast überall auf E übereinstimmen bzw. überall
bis auf einer Nullmenge auf E übereinstimmen.
34
KAPITEL 2. GRUNDLAGEN DER INTEGRATIONSTHEORIE
Korollar 2.17. Sei (Ω, F, µ) ein Maßraum, E ⊆ F und f, g : E → R meßbare
numerische Funktionen. Dann gilt:
(i) Die Relation ∼E ist eine Äquivalenzrelation.
(ii) Sind f, g ∈ L(E, µ) mit f ∼E g, so folgt:
Z
Z
f dµ =
g d µ.
E
E
(iii) Ist f ∈ L(Ω, µ), so ist f fast überall endlich.
Beweis. Die Aussagen ergeben sich unmittelbar aus den bisher erarbeiteten Resultaten.
Wir werden auf die Äquivalenzrelation ∼ nochmals zu sprechen kommen, wenn
wir die Lp -Räume in einem der nächsten Abschnitte studieren.
Satz 2.18. (“Majorantenkriterium” für Lebesgue-Integrale) Sei
(Ω, F, µ) ein Maßraum, E ⊆ F und g, h : E → R meßbare numerische Funktionen mit |g(ω)| ≤ h(ω) für alle ω ∈ E. Ist h ∈ L(E, µ), so ist auch g ∈ L(E, µ)
und es gilt
Z
Z
gdµ ≤
h d µ.
E
E
Beweis. O.b.d.A. sei wieder g ≥ 0. Dann folgt die Behauptung sofort aus Tg ⊆
Th .
Mit dem folgenden wichtigen Satz schließen wir diesen Abschnitt ab und kommen im nächsten Abschnitt zu Konvergenzaussagen für Lebesgue-Integrale.
Satz 2.19. Sei (Ω, F, µ) ein Maßraum und E ⊆ F. Dann gilt f ∈ L(E, µ)
genau dann, wenn |f | ∈ L(E, µ).
Beweis. Wir zerlegen f in Positiv- und Negativteil, also f = f + − f − . Dann
gilt:
(
f + (ω) falls ω ∈ A
|f (ω)| = f + (ω) + f − (ω) =
f − (ω) falls ω ∈ E \ A
mit A := {ω ∈ E | f (ω) ≥ 0}. Dann folgt, dass
Z
Z
Z
Z
Z
+
−
+
|f | d µ =
f dµ +
f dµ =
f dµ +
f− d µ
E
A
E\A
E
E
genau dann definiert ist, wenn sowohl f + als auch f − Elemente von L(E, µ)
sind, d.h. genau dann, wenn f ∈ L(E, µ) gilt.
2.4. GRENZWERTSÄTZE FÜR LEBESGUE-INTEGRALE
2.4
35
Grenzwertsätze für Lebesgue-Integrale
In diesem Abschnitt werden wir grundlegende Konvergenzaussagen erarbeiten.
Insbesondere werden wir Aussagen über Grenzwerte Lebesgue-integrierbarer
Funktionen beweisen können, die für Riemann-integrierbare Funktionen im allgemeinen nicht richtig sind.
Satz 2.20. (Satz von Bepo-Levi über monotone Konvergenz) Sei
(Ω, F, µ) ein Maßraum, E ⊆ F und (fn )n∈N eine Folge meßbarer numerischer
Funktionen fn : E → R mit 0 ≤ f1 (ω) ≤ f2 (ω) ≤ f3 (ω) ≤ . . . für alle ω ∈ E.
Dann gilt
Z
Z
lim
n→∞
fn d µ =
E
lim fn d µ.
E n→∞
R
Beweis. O.B.d.A. sei E fn d µ ≤ C < ∞ für alle n ∈ N. Definiere f : E → R
vermöge f (ω) := limn→∞ fn (ω) für alle ω ∈ E. Dann ist f ≥ 0 und f ist meßbar
nach Satz 1.30. Setze nun
Z
fn d µ
αn :=
E
für alle n ∈ N. Dann gilt 0 ≤ α1 ≤ α2 ≤ α3 ≤ . . . ≤ C · µ(E). Also ist (αn )n∈N
eine beschränkte, monton steigende Folge reeller Zahlen und α := limn→∞ αn
existiert und ist endlich. Wegen fn (ω) ≤ f (ω) für alle n ∈ N und alle ω ∈ E
folgt
Z
Z
Z
lim
fn d µ = lim αn ≤ α ≤
f dµ =
lim fn d µ.
n→∞
n→∞
E
E n→∞
E
Um die Ungleichung in anderer Richtung zu beweisen, definieren wir für beliebige
aber feste c ∈ (0, 1) und ϕ ∈ Tf die Mengen
En := En (ϕ, Tf ) := {ω ∈ E | fn (ω) > c · ϕ(ω)}
für alle n ∈ N. Da sowohl ϕ als Treppenfunktion aus Tf meßbar ist und jedes
fn meßbar ist nach Voraussetzung, folgt En ∈ F. Ferner gilt En ⊆ En+1 ⊆ E.
Wegen f S
≥ ϕ auf E existiert zu jedemSω ∈ E ein n ∈ N mit fn (ω) ≥ c · ϕ(ω),
∞
also ω ∈ ∞
m=1 Em . Hieraus folgt E =
n=1 En und
Z
Z
Z
fn d µ ≥
fn d µ ≥ c ·
ϕdµ
E
En
En
für alle ϕ ∈ Tf und c ∈ (0, 1). Für c → 1 ergibt sich
Z
Z
Z
fn d µ ≥
fn d µ ≥
ϕ d µ.
E
En
En
36
KAPITEL 2. GRUNDLAGEN DER INTEGRATIONSTHEORIE
Bilden wir nun das Supremum über alle ϕ ∈ Tf , so folgt
Z
Z
lim
fn d µ ≥
f d µ.
n→∞
E
E
Satz 2.21. (Satz von Lebesgue über monotone Konvergenz) Sei
(Ω, F, µ) ein Maßraum, E ⊆ F und (fn )n∈N eine Folge meßbarer numerischer
Funktionen fn : E → R mit f1 (ω) ≤ f2 (ω) ≤ f3 (ω) ≤ . . . für alle ω ∈ E. Gibt
es ein m ∈ N mit fm ∈ L(E, µ) und eine numerische Funktion f : E → R mit
f (ω) = lim fn (ω)
n→∞
für alle ω ∈ E, so folgt
Z
Z
f d µ = lim
n→∞
E
fn d µ.
E
Beweis. O.B.d.A. nehmen wir m = 1 an, also f1 ∈ L(E, µ). Dann ist f1 fast
überall endlich auf E. Wir können sogar annehmen, dass f1 (ω) < ∞ für alle
ω ∈ E gilt, denn ist dies nicht der Fall, so können wir eine Funktion g ∈ L(E, µ)
definieren durch
(
f1 (ω) falls |f1 (ω)| < ∞
.
g(ω) :=
0
falls |f1 (ω)| = ∞
Dann
stimmen
R
R f1 und g fast überall überein, d.h. f1 ∼E g und daher auch
f d µ = E g d µ. Also im folgenden gelte o.B.d.A., dass f1 (ω) < ∞ für alle
E 1
ω ∈ E sei. Wir definieren die Funktionen gn (ω) := fn (ω) − f1 (ω) für alle ω ∈ E.
Für alle n ∈ N ist gn als Differenz meßbarer numerischer Funktionen wieder
eine meßbare numerische Funktion und es gilt 0 ≤ gn (ω) ≤ gn+1 (ω) für alle
ω ∈ E und alle n ∈ N. Sei g(ω) := limn→∞ gn (ω) für alle ω ∈ E. Auf die Folge
(gn )n∈N und ihren Limes g können wir den Satz von Bepo-Levi zur monotonen
Konvergenz 2.20 anwenden, also
Z
Z
Z
lim
gn d µ =
lim gn d µ =
g d µ.
n→∞
E n→∞
E
E
Wegen g = f − f1 und f1 ∈ L(E, µ) erhalten wir dann
Z
Z
Z
Z
(f − f1 ) d µ =
gdµ =
lim gn d µ = lim
gn d µ
n→∞
n→∞ E
E
E
E
Z
Z
= lim
fn d µ −
f1 d µ ,
n→∞
also die Behauptung.
E
E
2.4. GRENZWERTSÄTZE FÜR LEBESGUE-INTEGRALE
37
Bemerkung 2.22. Der Satz von Lebesgue über monotone Konvergenz 2.21 verallgemeinert den Satz über monotone Konvergenz von Bepo-Levi 2.20 von einer
monoton wachsenden Folge nicht-negativer Funktionen aus auf eine beliebige
Folge monoton wachsender Funktionen aus L(E, µ).
Korollar 2.23. Sei (Ω, F, µ) ein Maßraum, E ⊆ F und (fn )n∈N eine Folge
meßbarer numerischer Funktionen fn : E → R mit f1 (ω)
R ≤ f2 (ω) ≤ f3 (ω) ≤ . . .
für alle ω ∈ E. Falls fn ∈ L(E, µ) für alle n ∈R N mit E fn d µ < RC für alle n ∈
N, so gilt für f (ω) := limn→∞ fn (ω) gerade E f d µ = limn→∞ E fn d µ < C,
also f ∈ L(E, µ).
Mit den nächsten Sätzen werden wir unsere Konvergenzaussagen auf immer
allgemeinere Funktionenfolgen aus L(E, µ) ausweiten.
Satz 2.24. (Lemma von Fatou) Sei (Ω, F, µ) ein Maßraum, E ⊆ F und
(fn )n∈N eine Folge meßbarer numerischer Funktionen fn : E → R. Dann gilt:
(i) Ist fn ≥ 0 für alle n ∈ N, so folgt
Z
Z
fn d µ.
lim inf fn d µ ≤ lim inf
E
n→∞
n→∞
E
(ii) Ist fn ≤ 0 für alle n ∈ N, so folgt
Z
Z
lim sup fn d µ ≥ lim sup fn d µ.
E
n→∞
n→∞
E
Beweis. Wir zeigen nur (i). Die Behauptung in (ii) folgt ganz analog. Definiere
gn (ω) := inf k≥n fk (ω) für alle n ∈ N und ω ∈ E. Dann sind die Funktionen gn ,
n ∈ N, wieder meßbar nach den üblichen Argumenten und es gilt 0 ≤ g1 (ω) ≤
g2 (ω) ≤ g3 (ω) ≤ . . . sowie per Definition der gn gerade gn ≤ fn für alle n ∈ N.
Es folgt mit der Monotonie des Integrals
Z
Z
gn d µ ≤
fn d µ
E
und für n → ∞
E
Z
gn d µ ≤ lim inf
lim
n→∞
Z
E
n→∞
fn d µ.
E
Ferner gilt, da die Folge (gn )n∈N monoton wachsend ist
lim inf fn (ω) = sup inf fk (ω) = sup gn (ω) = lim gn (ω).
n→∞
n∈N k≥n
n∈N
n→∞
38
KAPITEL 2. GRUNDLAGEN DER INTEGRATIONSTHEORIE
Auf die Folge (gn )n∈N können wir den Satz über monotone Konvergenz von
Bepo-Levi 2.20 anwenden. Dies liefert schließlich
Z
Z
Z
Z
lim inf fn d µ =
lim gn d µ = lim
gn d µ ≤ lim inf
fn d µ,
E
n→∞
E n→∞
n→∞
n→∞
E
E
also die Behauptung.
Satz 2.25. (Satz von Lebesgue über dominante Konvergenz) Sei
(Ω, F, µ) ein Maßraum, E ⊆ F und (fn )n∈N eine Folge meßbarer numerischer
Funktionen fn : E → R mit fn (ω) → f (ω) für ein f : E → R für fast alle
ω ∈ E. Gibt es ein g ∈ L(E, µ) mit |fn (ω)| ≤ g(ω) für fast alle ω ∈ E, so folgt
f ∈ L(E, µ) mit
Z
Z
Z
f dµ ≤
E
und
|f | d µ ≤
E
gdµ
E
Z
Z
f d µ = lim
n→∞
E
fn d µ.
E
Beweis. Es gilt wegen 0 ≤ |fn | ≤ g für alle n ∈ N offensichtlich auch 0 ≤
|f | ≤ g. Mit Hilfe des Majorantenkriteriums für Lebesgue-Integrale 2.18 folgt
f, fn ∈ L(E, µ) für alle n ∈ N. Wegen 0 ≤ |fn | ≤ g folgt fn − g ≤ 0 und wir
erhalten mit dem Lemma von Fatou 2.24
Z
Z
Z
lim sup(fn − g) d µ = (f − g) d µ.
lim sup (fn − g) d µ ≤
n→∞
E
E
n→∞
E
Wegen 0 ≤ |fn | ≤ g folgt ebenso fn +g ≥ 0 und erneute Anwendung des Lemmas
von Fatou 2.24 ergibt
Z
Z
Z
(f + g) d µ =
lim inf (fn + g) d µ ≤ lim inf (fn + g) d µ.
E
n→∞
E
n→∞
E
R
Insgesamt erhalten wir per Addition bzw. Subtraktion von E g d µ auf beiden
Seiten der beiden gewonnenen Ungleichungen die Abschätzung
Z
Z
Z
lim sup fn d µ ≤
f d µ ≤ lim inf
fn d µ,
n→∞
also
E
n→∞
E
Z
Z
f d µ = lim
E
n→∞
fn d µ.
E
E
2.5. VERGLEICH VON RIEMANN- UND LEBESGUE-INTEGRAL
39
Dass der Satz von Lebesgue über dominante Konvergenz nicht auf die Existenz
der Majorante verzichten kann, zeigt das folgende Beispiel:
Beispiel 2.26. Betrachte die Folge stetiger Funktionen (fn )n∈N mit fn : [0, 1] →
R definiert durch

1
2

)
falls x ∈ [0, 2·n
4 · n · x
1 1
2
fn (x) := 4 · n − 4 · n · x falls x ∈ [ 2·n , n ) .


0
falls x ∈ [ n1 , 1]
Die Funktionen sind für alle n ∈ N Lebesgue-integrierbar und schließen stets
ein Dreieck mit der Grundseitenlänge n1 und der Höhe 2 · n mit der x-Achse im
Intervall [0, 1] ein. Folglich gilt:
Z 1
fn (x) d x = 1 ∀n ∈ N,
0
aber fn (x) → 0 für alle x ∈ [0, 1], denn ist x ∈ [0, 1], so gibt es stets ein N ∈ N
mit fk (x) = 0 für alle k ≥ N . Es folgt also mit f (x) := limn→∞ fn (x) für alle
x ∈ [0, 1] gerade
Z 1
Z 1
f (x) d x 6= lim
fn (x) d x = lim 1 = 1.
0=
0
n→∞
0
n→∞
Der Satz von Lebesgue über dominante Konvergenz kann also nicht auf die
Existenz der Majorante verzichten.
Im obigen Beispiel haben wir mit dem Lebesgue-Integral gerechnet, als wenn es
das Riemann-Integral wäre. Dass diese Vorgehensweise korrekt ist, wollen wir
im nächsten Abschnitt sehen.
2.5
Vergleich von Riemann- und LebesgueIntegral
Sei im ganzen Abschnitt der betrachtete Maßraum (R, B(R)0 , λ0 ) und E :=
[a, b], a < b, ein Intervall endlicher Länge. Im folgenden schreiben wir für
R
Rb
das Lebesgue-Integral E f d λ0 der Einfachheit halber (L) a f (x) d x sowie
Rb
(R) a f (x) d x für das Riemann-Integral der Funktion f : [a, b] → R über dem
Intervall E = [a, b].
40
KAPITEL 2. GRUNDLAGEN DER INTEGRATIONSTHEORIE
Satz 2.27. (Riemann-Integral ↔ Lebesgue-Integral) Mit den Bezeichnungen von oben gilt:
(i) Ist f auf [a, b] Riemann-integrierbar, so ist f ∈ L([a, b], λ0 ) und
Z
b
b
Z
f (x) d x.
f (x) d x = (R)
(L)
a
a
(ii) Ist f beschränkt, so ist f genau dann Riemann-integrierbar auf [a, b], wenn
f fast überall stetig auf [a, b] ist.
Beweis. (i) Sei (Zk )∞
k=1 eine Folge von Zerlegungen des Intervalls [a, b] mit
Zk+1 ⊇ Zk (man sagt auch: Zk+1 ist feiner als Zk ). Ferner gelte ∆(Zk ) → 0
für k → ∞, wobei ∆(Zk ) den maximalen Abstand zwischen zwei benachbarten
Punkten der Zerlegung bezeichnet. Wir definieren für alle k ∈ N die Treppenfunktionen Uk und Lk vermöge Uk (a) = Lk (a) = f (a) und
Uk (x) := Mi :=
sup
f (x)
x∈[xi−1 ,xi ]
Lk (x) := mi :=
inf
f (x)
x∈[xi−1 ,xi ]
für x ∈ (xi−1 , xi ]. Es gilt dann
Z
b
(L)
Uk (x) d x =
a
Z
(L)
b
Lk (x) d x =
a
k
X
i=1
k
X
Mi · (xi − xi−1 ) =: S(Zk , f ),
mi · (xi − xi−1 ) =: s(Zk , f ).
i=1
Wegen Zk+1 ⊇ Zk erhalten wir
U1 (x) ≥ U2 (x) ≥ . . . ≥ Uk (x) ≥ f (x) ≥ Lk (x) ≥ . . . ≥ L2 (x) ≥ L1 (x)
für alle x ∈ [a, b]. Wir setzen
U (x) := lim Uk (x),
k→∞
L(x) := lim Lk (x).
k→∞
Ist f Riemann-integrierbar, so folgt aus ∆(Zk ) → 0, dass
Z
lim s(Zk , f ) = (R)
k→∞
b
f (x) d x = lim S(Zk , f ).
a
k→∞
2.5. VERGLEICH VON RIEMANN- UND LEBESGUE-INTEGRAL
41
Da Uk und Lk meßbare Treppenfunktionen sind, punktweise gegen U bzw. L
konvergieren und ferner alle Uk und Lk durch eine Lebesgue-integrierbare Treppenfunktion majorisiert werden können (je nach Vorzeichensituation durch L1
oder U1 ), folgt aus dem Satz von Lebesgue über dominante Konvergenz 2.25
b
Z
lim (L)
Uk (x) d x = (L)
k→∞
U (x) d x
a
sowie
Z
a
b
Z
b
L(x) d x.
Lk (x) d x = (L)
lim (L)
k→∞
b
Z
a
a
Insgesamt erhalten wir also
Z b
Z b
Z b
f (x) d x
Lk (x) d x = lim s(Zk , f ) = (R)
L(x) d x = lim (L)
(L)
k→∞
k→∞
a
a
a
Z b
Z b
= lim S(Zk , f ) = lim (L)
Uk (x) d x = (L)
U (x) d x,
k→∞
also
b
Z
k→∞
Z
a
b
a
b
Z
U (x) d x.
f (x) d x = (L)
L(x) d x = (R)
(L)
a
a
a
Rb
Weiter ergibt sich wegen L(x) ≤ f (x) ≤ U (x) und (L) a (U (x) − L(x)) d x = 0
bereits U (x) = L(x) fast überall, d.h. U (x) = f (x) = L(x) fast überall, d.h. f
ist Lebesgue-integrierbar und
Z b
Z b
Z b
(L)
f (x) d x = (L)
L(x) d x = (R)
f (x) d x,
a
a
a
also die Behauptung
von (i) gezeigt.
S∞
(ii) Sei Z := k=1 Zk . Dann gilt λ(Z) = 0, da Z eine abzählbare Menge ist.
42
KAPITEL 2. GRUNDLAGEN DER INTEGRATIONSTHEORIE
Behauptung. f ist genau dann stetig im Punkt x0 ∈ [a, b]\Z, wenn U (x0 ) = L(x0 ).
Beweis der Behauptung. Sei f stetig in x0 . Dann gibt es zu jedem ε > 0
ein δ > 0 mit |f (x) − f (x0 )| ≤ ε für alle x mit |x − x0 | ≤ δ. Wegen ∆(Zk ) → 0
existiert ein K ∈ N, so dass ∆(Zk ) < δ für alle k ≥ K gilt. Es folgt:
Uk (x0 ) − Lk (x0 ) = Mi − mi = (Mi − f (x0 )) + (f (x0 ) − mi ) < ε + ε = 2 · ε,
also U (x0 ) = L(x0 ). Es gelte nun umgekehrt U (x0 ) = L(x0 ) und es sei ε > 0
beliebig vorgegeben. Dann gilt L(x0 ) = f (x0 ) = U (x0 ) und daher existiert ein
K ∈ N mit
ε
ε
UK (x0 ) − f (x0 ) ≤
und f (x0 ) − LK (x0 ) ≤ .
2
2
Wähle nun δ := min{|x0 − x| | x ∈ ZK }. Dann gilt für alle x mit |x − x0 | < δ
gerade
LK (x0 ) ≤ f (x) ≤ UK (x0 ),
also nach obiger Abschätzung |f (x) − f (x0 )| ≤ ε, d.h. f ist stetig in x0 . Zurück zum eigentlichen Beweis: Wenn f nun Riemann-integrierbar auf [a, b] ist,
dann folgt, wie wir beim Beweis des ersten Teils des Satzes gesehen haben und
in der Notation, die wir dort schon verwendet hatten, U (x) = L(x) fast überall
auf [a, b], d.h. f ist stetig fast überall auf [a, b]. Ist umgekehrt f fast überall
stetig auf [a, b], so gilt U (x) = f (x) = L(x) fast überall auf [a, b] und folglich
Z b
Z b
L(x) d x,
U (x) d x = (L)
(L)
a
a
woraus sich, wie wir im Beweis von Teil (i) gezeigt hatten, S(Zk , f )−s(Zk , f ) →
0 für k → ∞ ergibt, d.h. f ist Riemann-integrierbar.
Beispiel 2.28. Betrachte [a, b] := [0, 1] und die Funktion f (x) definiert durch
(
x2
falls x ∈ [0, 1] \ Q
f (x) :=
.
sin(x) falls x ∈ [0, 1] ∩ Q
Dann gilt
Z 1
Z
(L)
f (x) d x = (L)
0
2
x d x + (L)
[0,1]\Q
|
Z
Z
sin(x) d x = (R)
[0,1]∩Q
{z
}
0
1
1
x2 d x = ,
3
=0
da [0, 1] ∩ Q eine Nullmenge unter dem Lebesgue-Maß ist und zu der Menge
[0, 1] \ Q bei der Integration über x2 nach Korollar 2.15 schadlos die Nullmenge
2.5. VERGLEICH VON RIEMANN- UND LEBESGUE-INTEGRAL
43
der abzählbar vielen rationalen Punkte aus [0, 1] hinzugefügt werden kann, ohne
den Wert des Lebesgue-Integrals zu ändern. Auf [0, 1] stimmt dann nach dem
vorhergehenden Satz das Lebesgue-Integral über x2 mit dem Riemann-Integral
überein.
Beispiel 2.29. Die Aussage, dass eine Funktion f , die Riemann-integrierbar ist,
stets auch Lebesgue-integrierbar ist, ist für allgemeine Intervalle nicht richtig.
Betrachten wir statt [a, b] für a < b von endlicher Länge unter dem LebesgueMaß z.B. R+ , also die gesamte positive reelle Achse, und darauf die Funktion
, so ist das Integral
f (x) := sin(x)
x
Z ∞
sin(x)
(R)
dx
x
0
endlich, denn: Definiere
Z
(n+1)·π
an := (R)
n·π
sin(x)
d x.
x
Jedes der Integrale an existiert, denn die Funktion
überall stetig auf (0, ∞). Folglich ist
Z
∞
(R)
0
∞
sin(x)
x
ist beschränkt und fast
∞
X
X
sin(x)
(−1)n · |an |
an =
dx =
x
n=0
n=0
P∞
n
und (an )n∈N ist eine Nullfolge. Die Reihe
n=0 (−1) · |an | konvergiert also
nach dem Konvergenzkriterium von Leibniz, woraus die Endlichkeit des Integrals folgt. Dagegen ist sin(x)
jedoch nicht Lebesgue-integrierbar. Satz 2.19 sagt
x
uns, dass eine Funktion Lebesgue-integrierbar ist genau dann, wenn es ihr Betrag ist. Definiert man dann
Z
(n+1)·π
bn := (L)
n·π
so folgt bn ≥
2
(n+1)·π
sin(x) d x,
x
und damit
Z
(L)
0
∞
∞
sin(x) X
bn = ∞,
dx =
x
n=0
indem man eine geeignete divergente Minorante für
P∞
n=0 bn
wählt.
44
KAPITEL 2. GRUNDLAGEN DER INTEGRATIONSTHEORIE
Die obige Charakterisierung von Riemann-Integrierbarkeit beschränkter Funktionen auf einem Intervall endlicher Länge erlaubt es nun auch, einfache Beispiele für Folgen Riemann-integrierbarer Funktionen zu finden, deren Limes selbst
keine Riemann-integrierbare Funktion mehr ist:
Beispiel 2.30. Sei An := {q1 , . . . , qn } für alle n ∈ N, wobei (qn )n∈N eine Abzählung von Q sei. Dann ist jede der Funktionen fn := 1[0,1]∩An beschränkt und fast überall stetig, also Riemann-integrierbar. Allerdings gilt
limn→∞ 1[0,1]∩An = 1[0,1]∩Q und 1[0,1]∩Q ist an jedem irrationalen Punkt aus [0, 1]
unstetig, also fast überall unstetig und folglich auch nicht Riemann-integriebar.
2.6
Die Lp-Räume
In diesem Abschnitt werden wir die Vollständigkeit der Lp -Räume zeigen, die
in vielen mathematischen Bereichen, so z.B. in der Funktionalanalysis, immer
wieder gerne als Beispiele für Banachräume herangezogen werden. Wie in den
vorhergehenden Abschnitten bezeichne Ω 6= ∅ wieder stets eine Grundmenge.
Ferner sei (Ω, F, µ) ein vollständiger Maßraum und L(Ω, µ) bezeichne wieder
die Menge der bezüglich µ summierbaren Funktionen Ω → R.
Definition 2.31. Sei f ∈ L(Ω, µ). Es bezeichne [f ] := {g ∈ L(Ω, µ) | g ∼Ω f }
die Restklasse von f bezüglich der Äquivalenzrelation ∼Ω . Wir definieren für
1 ≤ p < ∞ vermöge
p1
Z
p
|f | d µ
kf kp :=
Ω
die Funktionenräume
Lp := {[f ] | kf kp < ∞}
und für p = ∞ das essentielle Supremum oder auch wesentliche Supremum
durch
kf k∞ := esse sup f := inf{c ≥ 0 | |f (ω)| ≤ c für fast alle ω ∈ Ω}
sowie den zugehörigen Funktionenraum
L∞ := {[f ] | kf k∞ < ∞}.
Bemerkung 2.32. Es gilt [f ] = [g] genau dann, wenn f = g fast überall auf
Ω, d.h. es gilt µ({ω ∈ Ω | f (ω) 6= g(ω)}) = 0.
2.6. DIE LP -RÄUME
45
Wir werden uns nun zunächst darum bemühen zu zeigen, dass die so definierten Funktionenräume normierte Räume sind. Wir benötigen zunächst folgendes
klassisches Resultat aus der reellen Analysis:
Lemma 2.33. Seien a, b > 0. Dann gilt für 1 < p, q < ∞ mit
1 1
+ =1
p q
(man sagt auch, dass p und q zueinander “konjugiert” sind) die Ungleichung
1
1
ap · bq ≤
a b
+ .
p q
Beweis. Sei o.B.d.A. t := ab ≥ 1 (anderenfalls betrachte ab , zeige ganz analog
zur folgenden Vorgehensweise die Behauptung und vertausche anschließend die
“Rollen” der beliebig wählbaren Werte p und q). Division der behaupteten Ungleichung durch b ergibt die dazu äquivalente Formulierung
1
tp ≤
t 1
+ .
p q
Setzen wir
1
g(t) := t p ,
h(t) :=
t 1
+ ,
p q
so müssen wir g(t) ≤ h(t) für alle t ≥ 1 zeigen. Für t = 1 gilt g(1) = 1 = h(1).
Wir zeigen nun, dass g für alle t ≥ 1 langsamer wächst als h. Daraus folgt dann
1
die Behauptung. Es gilt für alle t ≥ 1, dass t− q ≤ 1 und somit
g 0 (t) =
1 p1 −1 1 − 1q
1
·t
= · t ≤ = h0 (t),
p
p
p
also die Behauptung.
Satz 2.34. Es seien 1 ≤ p, q ≤ ∞ mit
ebenfalls zugelassen sind. Dann gilt:
1
p
+
1
q
= 1, wobei hier p = 1 und q = ∞
(i) (Höldersche Ungleichung) Seien f, g : Ω → R meßbar mit kf kp , kgkq <
∞. Dann gilt
Z
|f · g| d µ ≤ kf kp · kgkq .
Ω
Insbesondere folgt f · g ∈ L(Ω, µ).
46
KAPITEL 2. GRUNDLAGEN DER INTEGRATIONSTHEORIE
(ii) (Minkowski Ungleichung) Seien kf kp , kgkp < ∞. Dann gilt |f + g| ∈
Lp (Ω, µ) und
kf + gkp ≤ kf kp + kgkp
(“Dreiecksungleichung”).
Beweis. (i) Wir betrachten zunächst den Fall 1 < p, q < ∞. Ohne Einschränkung seien kf kp , kgkq 6= 0, denn anderenfalls ist f · g = 0 fast überall
auf Ω und wir haben nichts zu zeigen. Setzen wir
|f (ω)| p
|g(ω)| q
a :=
, b :=
,
kf kp
kgkq
so folgt mit dem vorhergehenden Lemma
|f (ω)| |g(ω)|
1 |f (ω)| p 1 |g(ω)| q
+ ·
·
≤ ·
0≤a ·b =
kf kp
kgkq
p
kf kp
q
kgkq
1
q
1
p
für alle ω ∈ Ω. Integrieren wir die Ungleichung über Ω, so erhalten wir
Z
Z
Z
1
1
1
p
· |f | d µ +
· |g|q d µ
· |f · g| d µ ≤
kf kp · kgkq Ω
p · kf kpp Ω
q · kgkqq Ω
1
1
p
q
≤
p · kf kp +
q · kgkq
p · kf kp
q · kgkq
1 1
= + = 1.
p q
Daraus folgt die Höldersche Ungleichung. Im Fall p = 1 und q = ∞ erhalten wir
Z
Z
|f · g| d µ ≤ esse sup g · |f | d µ = kgk∞ · kf k1 ,
Ω
Ω
also die Behauptung auch für diesen Fall.
(ii) Es sei p > 1. Dann gilt für alle ω ∈ Ω die Abschätzung
|f (ω) + g(ω)|p ≤ |f (ω)| · |(f + g)(ω)|p−1 + |g(ω)| · |(f + g)(ω)|p−1 .
Integration über Ω liefert nun
Z
Z
Z
p
p−1
p
kf + gkp =
|f + g| d µ ≤
|f | · |f + g| d µ + |g| · |f + g|p−1 d µ.
Ω
Ω
Ω
Die Höldersche Ungleichung liefert
Z
|f | · |f + g|p−1 d µ ≤ kf kp · k|f + g|p−1 kq ,
Ω
2.6. DIE LP -RÄUME
Z
47
|g| · |f + g|p−1 d µ ≤ kgkp · k|f + g|p−1 kq ,
Ω
also mit (p − 1) · q = p
kf + gkpp ≤ kf kp · k|f + g|p−1 kq + kgkp · k|f + g|p−1 kq
Z
1q
(p−1)·q
= (kf kp + kgkp ) ·
|f + g|
dµ
Ω
Z
1q
= (kf kp + kgkp ) ·
|f + g|p d µ
Ω
p
= (kf kp + kgkp ) · kf + gkpq
= (kf kp + kgkp ) · kf + gkp−1
p ,
d.h. kf + gkp ≤ kf kp + kgkp . Die Behauptung für q = ∞ folgt aus der üblichen
Dreicksungleichung für den Betrag und der Monotonie des Lebesgue-Integrals.
Satz 2.35. Für 1 ≤ p ≤ ∞ ist Lp (Ω, µ) ein normierter Raum, d.h. ein linearer
Raum bzw. Vektorraum mit der Norm k · kp .
Beweis. Sind [f ], [g] ∈ Lp (Ω, µ), so gilt kf kp , kgkp < ∞. Die Minkowski Ungleichung liefert dann kf + gkp ≤ kf kp + kgkp < ∞, also neben [f + g] ∈ Lp (Ω, µ)
auch die Gültigkeit der Dreiecksungleichung für k · kp . Für alle [f ] ∈ Lp (Ω, µ)
und alle α ∈ R gilt wegen kf kp < ∞ gerade
Z
p
|α · f |p d µ = |α|p · kf kpp < ∞,
kα · f kp =
Ω
d.h. einerseits [α · f ] ∈ Lp (Ω, µ) und andererseits kα · f kp = |α| · kf kp , also
die Homogenität von k · kp . Insgesamt ist damit Lp (Ω, µ) ein linearer Raum.
Wir müssen noch zeigen, dass gilt kf kp = 0 genau dann, wenn [f ] = [0]. Gilt
[f ] = [0], so ist Rf = 0 fast überall auf Ω und es folgt |f |p = 0 fast überall auf
p
p
Ω, also
R kf kpp = Ω |f | d µ =p 0 und somit kf kp = 0. Ist umgekehrt kf kp = 0, so
folgt Ω |f | d µ = 0, also |f | = 0 fast überall auf Ω, d.h. auch f = 0 fast überall
auf Ω und damit [f ] = [0]. Also ist k · kp eine Norm und die Behauptungen sind
gezeigt. Für den Fall p = ∞ folgt alles analog.
Wir werden nun sehen, dass die Räume Lp (Ω, µ) für 1 ≤ p ≤ ∞ nicht nur
gewöhnliche normierte Räume, sondern sogar Banachräume sind.
Satz 2.36. Die normierten Räume Lp (Ω, µ) für 1 ≤ p ≤ ∞ sind Banachräume.
48
KAPITEL 2. GRUNDLAGEN DER INTEGRATIONSTHEORIE
Beweis. Wir müssen zeigen, dass jede Cauchy-Folge in Lp (Ω, µ) einen Limes
in Lp (Ω, µ) besitzt. Zunächst beweisen wir den Fall p < ∞. Abkürzender Weise
schreiben wir die Elemente [f ] von Lp (Ω, µ) von nun an schlicht als f . Sei (fn )n∈N
eine Cauchy-Folge in Lp (Ω, µ). Dann gibt es zu jedem n ∈ N ein N ∈ N mit
kfk − fm kpp ≤
1
=: ε
22n
für alle k, m ≥ N . Wir definieren vermöge gn := fN die Teilfolge (gn )n∈N
von (fn )n∈N . Für die behauptete Vollständigkeit genügt es zu zeigen, dass
g := limn→∞ gn ∈ Lp (Ω, µ) gilt. Für
n
1o
Yn := ω ∈ Ω | |gn+1 (ω) − gn (ω)|p ≥ n
2
gilt
µ(Yn )
=
2n
Z
Yn
1
dµ ≤
2n
Z
Z
p
|gn+1 − gn | d µ ≤
Yn
|gn+1 − gn |p d µ
Ω
1
= kgn+1 − gn kpp ≤ 2n ,
2
S
d.h. µ(Yn ) ≤ 2−n . Setzen wir Zn := ∞
k=n Yk , so folgt Z1 ⊇ Z2 ⊇ Z3 ⊇ . . . und
weiter
∞
∞
∞
[
X
X
1
2−k = n−1 .
µ(Yk ) =
µ(Zn ) = µ
Yk ≤
2
k=n
k=n
k=n
T∞
Somit ergibt sich für Z := n=1 Zn , dass
µ(Z) = lim µ(Zn ) = 0,
n→∞
dies bedeutet, Z ist eine Nullmenge. Wie definieren nun
(
P
g1 (ω) + ∞
n=1 (gn+1 (ω) − gn (ω)) falls ω ∈ Ω \ Z
g(ω) :=
.
0
falls ω ∈ Z
Aufgrund der Tatsache, dass für alle ω ∈ Ω \ ZN gilt
|gk+1 (ω) − gk (ω)|p ≤
1
,
2k
k ≥ N,
folgt aus der Identität
gm (ω) = g1 (ω) +
m−1
X
n=1
(gn+1 (ω) − gn (ω)),
2.6. DIE LP -RÄUME
49
dass
∞
X
∞
X
1
1
|gn+1 (ω) − gn (ω)| ≤
sup |g(ω) − gm (ω)| ≤ sup
= m−1 → 0
n
2
2
ω∈Ω\Zm n=m
ω∈Ω\Zm
n=m
p
p
für m → ∞. Folglich konvergiert die Folge (gn )n∈N gleichmäßig und absolut
gegen g auf Ω \ Zm , d.h. gn → g bezüglich des Maßes µ und auch fast überall.
1
ergibt sich schließlich
Folglich ist g auch meßbar. Aus kgk − gm kpp ≤ 22n
kg − gm kp ≤ lim sup kgk − gm kp ≤
k→∞
1
22n/p
< ∞,
R
also Ω |g − gm |p d µ ≤ 2−2n/p . Mit des Satz von Lebesgue über dominante Konvergenz 2.25 folgt dann |g − gm |p ∈ L(Ω, µ) beziehungsweise g − gm ∈ Lp (Ω, µ).
Wegen gm ∈ Lp (Ω, µ) und g − gm ∈ Lp (Ω, µ) und da Lp (Ω, µ) insbesondere ein
Vektorraum ist, folgt g = (g − gm ) + gm ∈ Lp (Ω, µ). Der Fall p = ∞ wird mit
ganz analogen Schlüssen und einem analog definierten Grenzwert der Teilfolge
gezeigt.
Desweiteren lässt sich im Spezialfall p = q = 2 der folgende Satz zeigen, den wir
hier zur Information ohne Beweis angeben:
Satz 2.37. Im Fall p = 2 ist h·, ·i : L2 (Ω, µ) × L2 (Ω, µ) → R gegeben durch
Z
f · g d µ, ∀f, g ∈ L2 (Ω, µ)
hf, gi :=
Ω
ein Skalarprodukt und es gilt
kf k2 =
p
hf, f i.
Damit wird L2 (Ω, µ) zu einem Hilbertraum.
Der Beweis des Satzes besteht lediglich darin, die Eigenschaften des Skalarprodukts nachzurechnen. Als Korollar aus der Hölderschen Ungleichung ergibt sich
das folgende klassische Resultat:
Korollar 2.38. (Cauchy-Schwarzsche Ungleichung) Seien f, g ∈ L2 (Ω, µ).
Dann gilt
|hf, gi| ≤ kf k2 · kgk2 .
50
KAPITEL 2. GRUNDLAGEN DER INTEGRATIONSTHEORIE
Beweis. Die Behautung folgt unmittelbar aus
Z
Z
|hf, gi| = f · g d µ ≤
|f · g| d µ ≤ kf k2 · kgk2 .
Ω
Ω
Satz 2.39. Es gelte µ(Ω) < ∞ und 1 ≤ p ≤ q ≤ ∞. Dann gilt Lq (Ω, µ) ⊆
Lp (Ω, µ).
Beweis. Es gilt |f (ω)|p ≤ 1, falls |f (ω)| ≤ 1 für ω ∈ Ω. Ferner ist |f (ω)|p ≤
|f (ω)|q , falls |f (ω)| ≥ 1 für ω ∈ Ω. Damit gilt:
|f (ω)|p ≤ 1 + |f (ω)|q .
Die Montonie des Lebesgue-Integrals liefert dann
Z
Z
Z
Z
p
q
|f | d µ ≤
1Ω d µ + |f | d µ = µ(Ω) + |f |q d µ < ∞,
Ω
Ω
Ω
Ω
falls f ∈ Lq (Ω, µ). In diesem Fall folgt dann also mit f ∈ Lp (Ω, µ) die Behauptung.
Kapitel 3
Anwendungen in der Stochastik
In diesem Kapitel werden wir einige Anwendungen für die doch sehr theoretischen Resultate der vorhergehenden beiden Kapitel diskutieren. Prädestiniert für Anwendungen von Maß- und Integrationstheorie ist der Bereich der
Stochastik. Wir beginnen zunächst mit einigen grundlegenden Begriffen der
Wahrscheinlichkeitstheorie, die sich ihrerseits aber immer wieder als Spezialfälle
bzw. Anwendungen der in den vorhergehenden beiden Kapiteln erarbeiteten
Theorie herausstellen werden.
In diesem Kapitel werden wir uns ausschließlich mit vollständigen Maßen
bzw. Maßräumen beschäftigen, so dass wir die übliche 0 im Exponenten, die
wir im ersten Kapitel angefügt hatten, um die Vervollständigung eines Maßes
bzw. eines Maßraums anzudeuten, nicht mehr explizit hinschreiben.
3.1
Wahrscheinlichkeitsmaße
Wir hatten in Kapitel I vollständige Maßräume (Ω, F, µ) für eine Grundmenge
Ω 6= ∅, eine σ-Algebra F ⊆ ℘(Ω) und ein Maß µ : F → R studiert. Hier
werden wir jetzt den Begriff des Wahrscheinlichkeitsraums einführen, der im
Grunde nichts anderes als ein Maßraum mit einer zusätzlichen Forderung an
das zugrundeliegende Maß ist:
Definition 3.1. Sei Ω 6= ∅ eine Grundmenge und F eine σ-Algebra in Ω.
Ferner sei P : F → R ein vollständiges Maß mit P(Ω) = 1. Dann heißt P ein
Wahrscheinlichkeitsmaß und (Ω, F, P) ein Wahrscheinlichkeitsraum.
Bemerkung 3.2. Sei (Ω, F, P) ein Wahrscheinlichkeitsraum. Wegen der Monotonie und der Nichtnegativität des Maßes folgt für alle A ∈ F gerade
51
52
KAPITEL 3. ANWENDUNGEN IN DER STOCHASTIK
0 ≤ P(A) ≤ 1. Man nennt die Elemente von F im Kontext von Wahrscheinlichkeitsräumen auch Ereignisse.
Beispiel 3.3. Ein einfaches Beispiel für einen ersten elementaren Wahrscheinlichkeitsraum ist ([0, 1], B([0, 1]), λ), wobei λ wie üblich das Lebesgue-Maß bezeichne und B([0, 1]) die σ-Algebra der Borelschen Teilmengen von [0, 1]. Wegen
λ(Ω) = λ([0, 1]) = 1−0 ist λ in der Tat offensichtlich ein Wahrscheinlichkeitsmaß
auf [0, 1] und definiert die sogenannte Gleichverteilung auf dem Einheitsintervall.
So elementar und einfach dieses Beispiel auch erscheint: Es wird uns in diesem
Kapitel immer wieder zur Veranschaulichung dienen und wir werden am Ende
sehen, wie man mit Hilfe dieses Wahrscheinlichkeitsraums z.B.
R 1 über sogenannte
Monte-Carlo-Methoden den Wert des bestimmten Integrals 0 f (x) d x für eine
schwierige, unordentlich glatte Funktion mit stochastischen Mitteln bestimmen
kann.
Beispiel 3.4. Der Wahrscheinlichkeitsraum aus Beispiel 3.3 kann leicht auf den
Fall Ω = [a, b] verallgemeinert werden. Hierzu betrachtet man schlicht statt des
Lebesgue-Maßes auf [a, b], was für b − a 6= 1 kein Wahrscheinlichkeitsmaß auf Ω
1
· λ, wobei λ das Lebesgue-Maß
definiert, das Wahrscheinlichkeitsmaß P := b−a
auf Ω = [a, b] bezeichnet.
Beispiel 3.5. Auch viel einfachere (diskrete) Beispiele sind natürlich von der
Definition erfasst. Beim Würfeln mit einem idealen Würfel geht man gemeinhin
davon aus, dass jede der Augenzahlen 1, 2, 3, 4, 5 und 6 mit der gleichen Wahrscheinlichkeit erzielt werden kann. Ein passender Wahrscheinlichkeitsraum für
das Zufallsexperiment “1 × Würfeln” ist dann (Ω, F, P) mit Ω = {1, 2, 3, 4, 5, 6},
F = ℘(Ω) und P(ω) := 16 für alle ω ∈ Ω, wobei die Definition von P auf naheliegende Weise auf alle Elemente aus ℘(Ω) fortgesetzt wird. In diesem simplen Beispiel spiegelt sich unsere Vorgehensweise aus dem ersten Kapitel über
Maßtheorie wieder. Wir definieren das “Maß” zunächst auf elementaren Bestandteilen von ℘(Ω), um es dann auf geeignete Weise auf eine σ-Algebra (hier
℘(Ω)) fortzusetzen. Hier ist ℘(Ω) eine recht kleine, übersichtliche Menge. Für
nicht endliches Ω ist jedoch die Potenzmenge in der Regel viel zu “fein” und zu
“groß”, um sinnvoll damit arbeiten zu können.
3.2
Zufallsvariablen
Im Gegensatz zur allgemeinen Maßtheorie spricht man in der Stochastik nicht
von meßbaren numerischen Funktionen, sondern von Zufallsvariablen.
3.2. ZUFALLSVARIABLEN
53
Definition 3.6. Sei (Ω, F, P) ein Wahrscheinlichkeitsraum. Dann heißt X :
Ω → R eine Zufallsvariable, wenn für alle a ∈ R gilt:
X −1 ((−∞, a]) = {ω ∈ Ω | X(ω) ≤ a} ∈ F.
Bemerkung 3.7. In Zufallsexperimenten repräsentieren die Elemente der
Grundmenge Ω die möglichen Ausgänge des Experiments. Die Ausgänge des
Experiments möchte man beurteilen, klassifizieren etc. Daher ordnet man bestimmten Ausgängen eines Zufallsexperiments reelle Zahlen zu, so dass man eine
Abbildung von dem “abstrakten Raum” Ω in die reellen Zahlen R erhält. Diese
Abbildungen sind dann genau Zufallsvariablen. Fragen wie z.B. “Wie groß ist
die Wahrscheinlichkeit, dass die Werte der Zufallsvariable in einem bestimmten
Bereich liegen?” lassen sich dann auf Grundlage der obigen Definition beantworten.
Ein zentraler Begriff in der Stochastik ist der Begriff der Verteilung, der eine
Zufallsvariable X unterliegt.
Definition 3.8. Sei (Ω, F, P) ein Wahrscheinlichkeitsraum und X : Ω → R eine
Zufallsvariable. Dann heißt die Funktion PX : B(R) → [0, 1] auf der σ-Algebra
der Borelschen Teilmengen von R definiert durch
PX (B) := P(X −1 (B)),
B ∈ B(R),
die (Wahrscheinlichkeits-)Verteilung der Zufallsvariable X.
Satz 3.9. Sei (Ω, F, P) ein Wahrscheinlichkeitsraum und X : Ω → R eine
Zufallsvariable. Die Wahrscheinlichkeitsverteilung PX : B(R) → [0, 1] der Zufallsvariable X ist ein Wahrscheinlichkeitsmaß auf B(R).
Beweis. Da P ein Wahrscheinlichkeitsmaß ist, ist klar dass gilt PX (∅) = 0 sowie
PX ≥ 0 und PX (R) = 1. Es bleibt die σ-Additivität zu zeigen: Sei dazu (Bi )i∈N
eine Folge paarweise disjunkter Mengen aus B(R). Setze Ai := X −1 (Bi ) für alle
i ∈ N.SDann ist (A
)i∈N eine Folge paarweise disjunkter Mengen in F und wegen
Si∞
∞
−1
X ( i=1 Bi ) = i=1 X −1 (Bi ) erhalten wir
PX
∞
[
Bi = P X
i=1
also die Behauptung.
−1
∞
[
i=1
Bi
=P
∞
[
i=1
Ai =
∞
X
i=1
P(Ai ) =
∞
X
i=1
PX (Bi ),
54
KAPITEL 3. ANWENDUNGEN IN DER STOCHASTIK
Bemerkung 3.10. Die Intuition, die sich hinter den Begriffen der Zufallsvariable und ihrer Verteilung verbirgt, kann wie folgt beschrieben werden: Einem Zufallsexperiment liegt ein abstrakter Wahrscheinlichkeitsraum (Ω, F, P)
zugrunde. Um nicht in diesem abstrakten Raum “rechnen” zu müssen, betrachtet man stattdessen Zufallsvariablen, die die Ausgänge des Experiments in den
bekannten Raum (R, B(R)) abbilden. Um weiterhin über Wahrscheinlichkeiten
reden zu können, muß man neben der Abbildung der Ausgänge des Zufallsexperiments auch noch eine Abbildung des auf dem abstrakten Raum definierten
Wahrscheinlichkeitsmaßes P finden. Diese “Abbildung” ist in Form der Verteilung einer Zufallsvariable gegeben. Man nennt daher auch PX das Bildmaß von
P unter X.
Beispiel 3.11. Wir betrachten zunächst eine konstante Zufallsvariable X mit
X ≡ a für ein a ∈ R deren Definitionsbereich durch irgendeinen abstrakten
Wahrscheinlichkeitsraum gegeben ist. Dann ist die Wahrscheinlichkeitsverteilung PX von X gegeben durch
(
1 falls a ∈ B
PX (B) =
,
0 falls a ∈
/B
denn ist a ∈ B, so enthält X −1 (B) alle ω ∈ Ω, die von X auf a abgebildet
werden. Wegen X(ω) = a für alle ω ∈ Ω gilt also X −1 (B) = Ω und daher
PX (B) = P(X −1 (B)) = P(Ω) = 1. Ist a ∈
/ B, so ist X −1 (B) = ∅, also PX (B) =
−1
P(X (B)) = P(∅) = 0. Insbesondere gilt PX ({a}) = 1, d.h. die gesamte
“Masse” liegt auf dem Punkt a. Man bezeichnet PX auch mit δa und nennt δa
das auf a konzentrierte Dirac-Maß.
Interessant an dem obigen Beispiel ist bereits, dass wir in der Tat in der Lage
sind, die Verteilung der betrachteten Zufallsvariable zu bestimmen, ohne ein
Wort über den im Urbildbereich zugrundeliegenden Wahrscheinlichkeitsraum
(Ω, F, P) verloren zu haben. Wir verallgemeinern das Beispiel weiter:
Beispiel 3.12. Sei p ∈ [0, 1]. Betrachte die Zufallsvariable X definiert durch
(
a mit Wahrscheinlichkeit p
X(ω) =
b mit Wahrscheinlichkeit 1 − p
für ein ω ∈ Ω aus dem zugrundeliegenden abstrakten Wahrscheinlichkeitsraum.
Dann ist PX für eine beliebige Borelsche Menge B ∈ B(R) vollständig beschrie-
3.2. ZUFALLSVARIABLEN
55
ben durch

1



p
PX (B) =
1 − p



0
falls
falls
falls
falls
a, b ∈ B
a ∈ B und b ∈
/B
.
b ∈ B und a ∈
/B
a, b ∈
/B
Insgesamt lässt sich PX (B) für ein beliebiges B ∈ B(R) dann auch in der Form
PX (B) = p · δa (B) + (1 − p) · δb (B)
schreiben, wobei δa und δb gemäß des vorhergehenden Beispiels die auf a bzw. b
konzentrierten Dirac-Maße bezeichnen. Man sagt auch, dass X eine diskrete
Zufallsvariable ist, da X nur endlich viele reelle Zahlen als Werte annehmen
kann.
Beispiel 3.13. Die Verteilung einer jeden diskreten Zufallsvariablen X


a1 mit Wahrscheinlichkeit p1



a2 mit Wahrscheinlichkeit p2
X(ω) = .
..
..

.



a mit Wahrscheinlichkeit p
n
n
mit a1 , a2 , . . . , an ∈ R und pi ≥ 0 für alle i = 1, . . . , n und
gegeben durch
n
X
PX (B) =
pi · δai (B),
Pn
i=1
pi = 1 ist
i=1
wobei B ∈ B(R) beliebig ist.
Das obige Beispiel klassifiziert bereits die Verteilungen aller diskreten Zufallsvariablen. Wir werden im folgenden desweilen auf dieses elementare Beispiel
zurückkommen.
Der Begriff der “Unabhängigkeit” ist in der Stochastik von großer Bedeutung.
An dieser Stelle mag die folgende Definition ein wenig unmotiviert erscheinen.
Später, wenn wir z.B. auf Momente von Zufallsvariablen zu sprechen kommen,
werden wir sehen, dass im Fall von unabhängigen Zufallsvariablen häufig viel
einfachere “Rechenregeln” gelten.
Definition 3.14. Sei (Ω, F, P) ein Wahrscheinlichkeitsraum. Zwei Zufallsvariablen X : Ω → R und Y : Ω → R heißen unabhängig, wenn für alle B, C ∈ B(R)
gilt:
P(X −1 (B) ∩ Y −1 (C)) = P(X −1 (B)) · P(Y −1 (C)).
56
KAPITEL 3. ANWENDUNGEN IN DER STOCHASTIK
Beispiel 3.15. Betrachte den Wahrscheinlichkeitsraum ([0, 1], B([0, 1]), λ) und
die Zufallsvariablen X = 1[0, 1 ] und Y = 1[ 1 , 3 ] . Seien B, C ∈ B(R). Dann gilt:
2
4 4

∅



[0, 1 ]
2
X −1 (B) =
1

(
,
1]


 2
[0, 1]
falls
falls
falls
falls
und ganz analog erhalten wir

∅



[ 1 , 3 ]
4 4
Y −1 (C) =
1

[0,
) ∪ ( 34 , 1]

4


[0, 1]
0, 1 ∈
/B
1 ∈ B und 0 ∈
/B
0 ∈ B und 1 ∈
/B
0, 1 ∈ B
falls
falls
falls
falls
0, 1 ∈
/C
1 ∈ C und 0 ∈
/C
.
0 ∈ C und 1 ∈
/C
0, 1 ∈ C
Man rechnet nun leicht nach, dass für jede mögliche Kombination von Urbildmengen X −1 (B) und Y −1 (C) die Bedingung λ(X −1 (B)∩Y −1 (C)) = λ(X −1 (B))·
λ(Y −1 (C)) erfüllt ist.
3.3
Integration bezüglich Wahrscheinlichkeitsverteilungen
Das erste Resultat in diesem Abschnitt, das wir behandeln, ist von fundamentaler Wichtigkeit für die Wahrscheinlichkeitstheorie. Es zeigt uns, wie wir bei der
Integration bezüglich von Wahrscheinlichkeitsverteilungen das Maß “wechseln”
können:
Satz 3.16. Sei X : Ω → R eine beliebige Zufallsvariable und g ∈ L1 eine
integrierbare Funktion. Dann gilt
Z
Z
g(X(ω)) d P(ω) =
g(x) d PX (x).
Ω
R
Beweis. Wir betrachten zunächst den einfachen Fall g = 1A , A ⊆ B(R). Dann
gilt für die linke Seite der behaupteten Identität
Z
Z
g(X(ω)) d P(ω) =
1A (X(ω)) d P(ω) = P(X −1 (A)).
Ω
Ω
3.4. ABSOLUT-STETIGE MASSE UND VERTEILUNGSFUNKTIONEN 57
Für die rechte Seite erhalten wir
Z
Z
Z
g(x) d PX (x) =
1A d PX (x) =
1 d PX (x) = PX (A) = P(X −1 (A)),
R
A
R
per Definition der Verteilung von X. Dies zeigt die Behauptung im Fall der Funktion 1A . Da alle nichtnegativen meßbaren Funktionen g über Treppenfunktionen
approximiert werden können (auf diese Weise haben wir das Lebesgue-Integral
definiert), lässt sich mit Hilfe der Grenzwertsätze zur monotonen Konvergenz
die Identität auf alle nichtnegativen meßbaren Funktionen ausweiten. Ist g eine
beliebige meßbare Funktion, so zerlegen wir g wieder in Positiv- und Negativteil
g + und g − mit g = g + − g − und erhalten dann aus der Linearität des Integrals
die Behauptung im allgemeinen.
Beispiel 3.17. Wir betrachten wieder die konstante Zufallsvariable X ≡ a für
ein a ∈ R. Wir hatten gesehen, dass gilt PX = δa . Die linke Seite der Identität
aus Satz 3.16 ist dann gegeben durch
Z
Z
Z
g(X(ω)) d P(ω) =
g(a) d P(ω) = g(a) · 1 d P(ω) = g(a) · P(Ω) = g(a)
Ω
Ω
Ω
sowie die rechte Seite durch
Z
Z
g(x) d δa ,
g(x) d PX (x) =
R
R
d.h. es gilt
Z
g(x) d δa = g(a).
R
Integration der Funktion g bezüglich des Dirac-Maßes bewirkt also die Auswertung von g im Punkt a.
3.4
Absolut-stetige Maße und Verteilungsfunktionen
In Satz und Definition 2.14 im Rahmen des Kapitels zur Integrationstheorie
fiel bereits der Begriff der Dichte, auf den wir in diesem Abschnitt nun wieder
zurückkommen werden. Die Maße der Form
Z
A 7→
f dλ
A
58
KAPITEL 3. ANWENDUNGEN IN DER STOCHASTIK
mit nicht-negativer integrierbarer Funktion f heißen absolut-stetig und die Funktion f ihre Dichte bezüglich des Lebesgue-Maßes λ oder kurz einfach Dichte.
Im KontextRvon wahrscheinlichkeitstheoretischen Überlegungen ist sicherlich die
Forderung f d λ = 1 sinnvoll. Die (kumulative) Verteilungsfunktion zu einer
Dichte f ist gegeben durch
Z y
F (y) :=
f (x) d x,
−∞
wobei das Integral wie üblich das Lebesgue-Integral sei. Im folgenden definieren
wir die (kumulative) Verteilungsfunktion einer Zufallsvariable:
Definition 3.18. Sei (Ω, F, P) ein Wahrscheinlichkeitsraum und X : Ω → R
eine Zufallsvariable. Dann heißt
FX (y) := P({ω ∈ Ω | X(ω) ≤ y}) = PX ((−∞, y])
die (kumulative) Verteilungsfunktion der Zufallsvariable X.
Satz 3.19. Sei (Ω, F, P) ein Wahrscheinlichkeitsraum und X : Ω → R eine
Zufallsvariable. Dann gilt:
(i) FX ist monoton nicht fallend, d.h. aus y1 ≤ y2 folgt FX (y1 ) ≤ FX (y2 ).
(ii) limy→∞ FX (y) = 1 und limy→−∞ FX (y) = 0.
(iii) FX ist rechtsseitig stetig, d.h. aus y → y0 , y ≥ y0 , folgt stets FX (y) →
FX (y0 ).
Beweis. (i) Aus y1 ≤ y2 folgt {ω ∈ Ω | X(ω) ≤ y1 } ⊆ {ω ∈ Ω | X(ω) ≤ y2 },
also
FX (y1 ) = P({ω ∈ Ω | X(ω) ≤ y1 }) ≤ P({ω ∈ Ω | X(ω) ≤ y2 }) = FX (y2 ).
(ii) Betrachte An := {ω ∈ Ω | X(ω) ≤ n} für alle n ∈ N. Dann gilt A1 ⊆
A2 ⊆ A3 ⊆ . . ., d.h. (An )n∈N ist eine monoton wachsende Mengenfolge in F,
und An ↑ Ω. Nach Satz 1.38 gilt dann, da P ein Maß ist: P(An ) ↑ P(Ω) = 1.
Wegen P(An ) = P({ω ∈ Ω | X(ω) ≤ n}) = FX (n) folgt damit FX (n) → 1 für
n → ∞. Für die zweite Behauptung betrachtet man die Mengen Bn := {ω ∈
Ω | X(ω) ≤ −n} für alle n ∈ N. Dann gilt B1 ⊇ B2 ⊇ B3 ⊇ . . . und Bn ↓ ∅.
Daher erhalten wir nach Satz 1.38 die Konvergenzaussage P(Bn ) ↓ P(∅) = 0.
Es folgt wegen P(Bn ) = P({ω ∈ Ω | X(ω) ≤ −n}) = FX (−n) die Behauptung.
3.4. ABSOLUT-STETIGE MASSE UND VERTEILUNGSFUNKTIONEN 59
(iii) Sei (yn )n∈N eine Folge reeller Zahlen mit yn → y0 , yn ≥ y0 . Betrachte
An := {ω ∈ Ω | X(ω) ≤ yn }. Dann gilt A1 ⊇ A2 ⊇ A3 ⊇ . . . und
lim FX (yn ) = lim P(An )
n→∞
n→∞
=P
∞
\
An
n=1
= P({ω ∈ Ω | X(ω) ≤ y0 })
= FX (y0 ).
Korollar 3.20. Sei (Ω, F, P) ein Wahrscheinlichkeitsraum und X : Ω → R
eine Zufallsvariable. Dann ist FX stetig genau dann, wenn PX ({y}) = 0 für alle
y ∈ R gilt.
Beweis. Sei (an )n∈N eine Folge reeller Zahlen mit an ≥ 0 für alle n ∈ N und
an → 0 für n → ∞. Dann gilt:
PX ({y}) = lim PX ((y − an , y])
n→∞
= lim (FX (y) − FX (y − an ))
n→∞
= FX (y) − lim FX (y − an ).
n→∞
Daraus folgt die behauptete Äquivalenz.
Den folgenden Satz zitieren wir ohne Beweis:
Satz 3.21. (Banach & Kuratowksi, 1929) Unter der Voraussetzung der
Gültigkeit der Kontinuumshypothese der Mengentheorie gibt es keine auf ganz
℘(R) definierte σ-additive Funktion P : ℘(R) → R mit P(R) = 1, die jeder
Einpunktmenge {y}, y ∈ R, den Wert P({y}) = 0 zuordnet.
Bemerkung 3.22. Der Satz von Banach und Kuratowski besagt, dass es keinen
Sinn macht, als σ-Algebra auf R die gesamte Potenzmenge zu betrachten, denn
jedes auf ganz ℘(R) definierte Wahrscheinlichkeitsmaß ist diskret, d.h. es ordnet
Einpunktmengen eine von Null verschiedene Wahrscheinlichkeit zu. Wir haben
aber im letzten Korollar gesehen, dass für alle Wahrscheinlichkeitsmaße PX mit
stetiger Verteilungsfunktion FX gilt: PX ({y}) = 0 für alle y ∈ R.
60
KAPITEL 3. ANWENDUNGEN IN DER STOCHASTIK
Satz 3.23. Ist PX ein absolut-stetiges Wahrscheinlichkeitsmaß auf R mit Dichte
fX : R → R sowie g : R → R integrierbar, so gilt:
Z
Z
g(x) d PX (x) =
g(x) · fX (x) d x.
R
R
Beweis. Betrachte g(x) = 1A , A ⊆ B(R). Dann liefert die linke Seite der behaupteten Identität:
Z
Z
Z
g(x) d PX (x) =
1A d PX (x) =
1 d PX (x) = PX (A)
R
A
R
und die rechte Seite
Z
Z
Z
g(x) · fX (x) d x =
1A · fX (x) d x =
fX (x) d x = PX (A)
R
A
R
per Definition der Dichte fX von PX . Die allgemeine Behauptung folgt wie
üblich, da man jede meßbare Funktion durch Treppenfunktionen approximieren
kann und mit Hilfe der Sätze von der monotonen Konvergenz.
Korollar 3.24. Ist PX ein absolut-stetiges Wahrscheinlichkeitsmaß auf R mit
Dichte fX : R → R sowie g : R → R integrierbar, so gilt:
Z
Z
g(X(ω)) d P(ω) =
g(x) · fX (x) d x.
Ω
R
Beweis. Folgt sofort aus Satz 3.16 und Satz 3.23.
3.5
Erwartungswerte von Zufallsvariablen
Der Begriff des Erwartungswertes ist von zentraler Bedeutung für die Stochastik. In allen folgenden Abschnitten dieses Kapitels wird er uns immer wieder
begegnen.
Definition 3.25. Sei (Ω, F, P) ein Wahrscheinlichkeitsraum und X : Ω → R
eine Zufallsvariable. Dann heißt das abstrakte Integral
Z
E(X) :=
X(ω) d P(ω)
Ω
der Erwartungswert der Zufallsvariable X.
3.5. ERWARTUNGSWERTE VON ZUFALLSVARIABLEN
61
Bemerkung 3.26. Mit den Resultaten des vorhergehenden Abschnitts erhalten
wir die alternativen Darstellungen
Z ∞
x d PX (x)
E(X) =
−∞
sowie, falls PX absolut-stetig mit Dichte fX ist
Z ∞
E(X) =
x · fX (x) d x.
−∞
Beispiel 3.27. Betrachte die Verteilung PX = 12 · P1 + 12 · P2 , wobei P1 = δa und
P2 die Dichte f2 habe. Dann gilt
Z ∞
Z ∞
1
1
xd
x d PX (x) =
· P1 + · P2 (x)
E(X) =
2
2
−∞
Z−∞
Z ∞
1
1
∞
=
xd
· P1 (x) +
xd
· P2 (x)
2
2
−∞
Z ∞
Z−∞
∞
1
1
x d δa (x) + ·
x d P2 (x)
= ·
2 −∞
2 −∞
Z ∞
1
1
= ·a+ ·
x · f2 (x) d x.
2
2 −∞
Dabei haben wir stillschweigend die Linearität des Lebesgue-Maßes in der “zweiten Variable” verwendet. Die Gültigkeit dieser Linearität bezüglich der “Integrationsvariablen” ergibt sich aber sofort aus der Definition des Lebesgue-Integrals
über Treppenfunktionen: Ersetzt man in der ursprünglichen Definition 2.8 das
Maß µ durch die Summe zweier Maße µ1 und µ2 , so sieht man die behauptete
Linearität leicht ein.
Bemerkung 3.28. Da der Erwartungswert schlicht als Lebesgue-Integral definiert ist, “erbt” er alle Eigenschaften des entsprechenden Lebesgue-Integrals.
Z.B. ist der Erwartungswert stets linear, denn
Z
E(α · X + β · Y ) = (α · X(ω) + β · Y (ω)) d P(ω)
Ω Z
Z
= α · X(ω) d P(ω) + β · Y (ω) d P(ω)
Ω
= α · E(X) + β · E(Y ).
Ω
62
KAPITEL 3. ANWENDUNGEN IN DER STOCHASTIK
Beispiel 3.29. Mit Hilfe der erarbeiteten Theorie können wir nun im Handumdrehen die “Schuldefinition” des Erwartungswertes einer diskreten Zufallsvariablen herleiten: Betrachte die Zufallsvariable X mit


a1 mit Wahrscheinlichkeit p1



a2 mit Wahrscheinlichkeit p2
X(ω) = .
.
..
..

.



a mit Wahrscheinlichkeit p
n
n
Pn
Der Erwartungswert von X wird dann gemeinhin als i=1 ai · pi “definiert”. In
unserer Situation ergibt sich diese spezielle Formel in ganz natürlicher Weise.
Wir hatten schon
dass die Wahrscheinlichkeitsverteilung von X gegeben
Pgesehen,
n
ist durch PX = i=1 pi · δai , wobei δai wie üblich das auf ai konzentrierte DiracMaß bezeichne. Dann gilt:
Z
Z
Z
n
X
E(X) =
X(ω) d P(ω) =
x d PX (x) =
xd
pi · δai (x)
Ω
=
n
X
R
Z
pi ·
i=1
x d δai (x) =
R
R
n
X
i=1
p i · ai ,
i=1
also die obige Formel.
3.6
Allgemeine p-te Momente von Zufallsvariablen
Neben der Kenngröße des Erwartungswertes lassen sich auf ganz analoge Weise
auch weitere aussagekräftige Kenngrößen definieren.
Definition 3.30. Sei (Ω, F, P) ein Wahrscheinlichkeitsraum und X : Ω → R
eine Zufallsvariable mit X ∈ Ln (Ω, P). Dann heißt
Z
n
E(X ) =
X n (ω) d P(ω)
Ω
für n ∈ N das n-te Moment der Zufallsvariable X.
Bemerkung 3.31. Wie schon im letzten Abschnitt, wo wir verschiedene Darstellungen für den Erwartungswert betrachtet hatten, erhalten wir auch hier
ganz analog:
Z
∞
E(X n ) =
xn d PX (x)
−∞
3.6. ALLGEMEINE P -TE MOMENTE VON ZUFALLSVARIABLEN
63
bzw. im Fall, dass PX absolut-stetig stetig mit Dichte fX ist
Z ∞
n
E(X ) =
xn · fX (x) d x.
−∞
Satz 3.32. Sei (Ω, F, P) ein Wahrscheinlichkeitsraum und X : Ω → R eine
Zufallsvariable. Ist E(X n ) endlich für ein n ∈ N, so ist auch E(X k ) endlich für
alle k ≤ n. Ist ferner E(X n ) nicht endlich, so auch E(X l ) für alle l ≥ n.
Beweis. Die Behauptung folgt sofort aus Satz 2.39, wo wir entsprechende Aussagen über Inklusionen der Lp -Räume eingesehen hatten.
Definition 3.33. Sei (Ω, F, P) ein Wahrscheinlichkeitsraum und X : Ω → R
eine Zufallsvariable. Dann heißt
Var(X) := E(X − E(X))2
die Varianz der Zufallsvariablen X und
p
σ(X) := Var(X)
die Standardabweichung der Zufallsvariablen X.
Bemerkung 3.34. In der Notation von oben gilt mit µ := E(X) gerade
Var(X) = E(X − µ)2 = E(X 2 − 2 · µ · X + µ2 ) = E(X 2 ) − 2 · µ · E(X) + µ2 =
E(X 2 ) − E(X)2 , also
Var(X) = E(X 2 ) − E(X)2 .
Ferner gilt für a ∈ R also stets Var(a·X) = E((a·X)2 )−E(a·X)2 = a2 ·(E(X 2 )−
E(X)2 ) = a2 · Var(X). Auf analoge Weise lassen sich noch weitere elementare
Rechenregeln für die Varianz und die Standardabweichung einer Zufallsvariablen
zeigen.
Beispiel 3.35. Sei X gleichverteilt auf [a, b], d.h. fX =
Z ∞
1
· 1[a,b] d x
E(X) =
x·
b−a
−∞
Z b
1
=
·
xdx
b−a a
1
b 2 − a2
=
·
b−a
2
a+b
=
2
1
b−a
· 1[a,b] . Dann gilt
64
KAPITEL 3. ANWENDUNGEN IN DER STOCHASTIK
und
Z
2
∞
x2 ·
E(X ) =
−∞
1
· 1[a,b] d x
b−a
Z b
1
=
·
x2 d x
b−a a
b 3 − a3
1
·
=
b−a
3
a2 + a · b + b 2
=
,
3
also Var(X) = E(X 2 ) − E(X)2 =
(b−a)2
.
12
Beispiel 3.36. Betrachte die Gaußsche Glockenkurve, d.h. die Dichte der Normalverteilung gegeben durch
ϕµ,σ (x) = √
(x − µ)2 1
· exp −
.
2 · σ2
2·π·σ
Ist X eine Zufallsvariable mit Dichte ϕµ,σ , so gilt
E(X) = µ und
Var(X) = σ 2 .
Die Behauptung ergibt sich mittels trickreichem Integrieren. Es lässt sich sogar
zeigen, dass alle p-ten Momente für p ≥ 1 existieren, wenn X “normalverteilt”
ist.
Beispiel 3.37. Ist X eine Zufallsvariable mit der Dichtefunktion
fX (x) =
1
1
·
π 1 + x2
(man sagt auch: X ist gemäß der Cauchy-Verteilung verteilt), so ist E(X n ) nicht
endlich für alle n ∈ N.
Wir kommen nun auf den Begriff der Unabhängigkeit zurück:
Satz 3.38. Sei (Ω, F, P) ein Wahrscheinlichkeitsraum und X, Y : Ω → R Zufallsvariablen. Dann sind X und Y unabhängig genau dann, wenn
E(f (X) · g(Y )) = E(f (X)) · E(g(Y ))
für alle meßbaren, beschränkten Funktionen f, g : R → R.
3.6. ALLGEMEINE P -TE MOMENTE VON ZUFALLSVARIABLEN
65
Beweis. Es gelte E(f (X) · g(Y )) = E(f (X)) · E(g(Y )). Seien B1 , B2 ∈ B(R).
Betrachte f := 1B1 und g := 1B2 . Dann gilt nach Voraussetzung
Z
1B1 (X(ω)) · 1B2 (Y (ω)) d P(ω)
E(f (X) · g(Y )) =
ZΩ
Z
=
1B1 (X(ω)) d P(ω) · 1B2 (Y (ω)) d P(ω)
Ω
Ω
= E(f (X)) · E(g(Y )).
Ferner gilt
Z
Z
1B1 (X(ω)) · 1B2 (Y (ω)) d P(ω) =
1B1 ×B2 (X(ω), Y (ω)) d P(ω)
Ω
Ω
= P(X −1 (B1 ) ∩ Y −1 (B2 ))
und andererseits
Z
Z
1B1 (X(ω)) d P(ω) · 1B2 (Y (ω)) d P(ω) = P(X −1 (B1 )) · P(Y −1 (B2 )),
Ω
Ω
d.h. X und Y sind in der Tat unabhängig. Nun zeigen wir die umgekehrte Implikation: Seien X und Y unabhängig. Nach dem obigen Argument gilt dann die
Identität E(f (X) · g(Y )) = E(f (X)) · E(g(Y )) bereits für alle Elementarfunktionen der Form f = 1B1 und g = 1B2 . Die Linearität
P liefert
P des Erwartungswertes
dann die Behauptung für alle Funktionen ϕ := i bi · 1Bi und ψ := j cj · 1Cj .
Da sich alle beschränkten meßbaren Funktionen f und g durch solche Treppenfunktionen approximieren lassen, folgt die Behauptung wie üblich mit Hilfe des
Satzes von Lebesgue über dominanten Konvergenz 2.25 (f ,g sind beschränkt
nach Voraussetzung).
Satz 3.39. Sei (Ω, F, P) ein Wahrscheinlichkeitsraum und X1 , . . . , Xn : Ω → R
unabhängige Zufallsvariablen. Dann gilt:
Var
n
X
i=1
Xi =
n
X
Var(Xi )
i=1
und insbesondere im Fall n = 2 gerade Var(X1 + X2 ) = Var(X1 ) + Var(X2 ), falls
X1 und X2 unabhängige Zufallsvariablen sind.
66
KAPITEL 3. ANWENDUNGEN IN DER STOCHASTIK
Beweis. Wir zeigen die Behauptung zunächst für den Fall n = 2. Es ergibt sich
mit Hilfe der vorausgesetzten Unabhängigkeit nach dem vorhergehenden Satz
Var(X1 + X2 ) = E(X1 + X2 )2 − (E(X1 + X2 ))2
= E(X12 ) + 2 · E(X1 · X2 ) + E(X22 )
− (E(X1 ))2 − 2 · E(X1 ) · E(X2 ) − (E(X2 ))2
= E(X12 ) + 2 · E(X1 ) · E(X2 ) + E(X22 )
− (E(X1 ))2 − 2 · E(X1 ) · E(X2 ) − (E(X2 ))2
= E(X12 ) − (E(X1 ))2 + E(X22 ) − (E(X2 ))2 = Var(X1 ) + Var(X2 ),
also die Behauptung. Für n > 2 folgt die Behauptung vermöge
Var
n
X
Xi = Var X1 +
n
X
i=1
i=2
=
n
X
Xi
= Var(X1 ) + Var
n
X
Xi = . . .
i=2
Var(Xi ),
i=1
also insgesamt alles gezeigt.
3.7
Grenzwertsätze und Anwendungen
Auch in diesem Abschnitt bezeichne (Ω, F, P) wieder einen Wahrscheinlichkeitsraum und (Xn )n∈N eine Folge von Zufallsvariablen Xi : Ω → R für alle i ∈ N.
Wir erinnern uns, dass die “Funktionswerte” der Xi uns die Ausgänge eines
Zufallsexperiments mitteilen. Stellen wir uns nun vor, die Zufallsvariablen Xi
haben die gleiche Verteilung. Dann können wir uns die Sequenz (Xn )n∈N als eine
Folge von Wiederholungen ein und desselben Experiments vorstellen. Wir wollen
im folgenden vor allem den Fall betrachten, dass diese Wiederholungen voneinander unabhängig sind (so z.B. das Würfeln mit einem Würfel oder das Ziehen
aus einer Urne mit Zurücklegen der jeweils gezogenen Kugel). Dazu müssen wir
unsere Definition von Unabhängigkeit von endlich vielen Zufallsvariablen auf
eine Sequenz der Form (Xn )n∈N ausdehnen.
Definition 3.40. Wir sagen, dass (Xn )n∈N eine Sequenz von unabhängigen
Zufallsvariablen ist, wenn für jedes n ∈ N die Zufallsvariablen X1 , . . . , Xn unabhängig sind.
Diese Definition ist äquivalent zu der sonst üblichen: (Xn )n∈N ist eine Sequenz von unabhängigen Zufallsvariablen, wenn je endlich viele Xi1 , . . . , Xin
3.7. GRENZWERTSÄTZE UND ANWENDUNGEN
67
unabhängig sind. Wir wollen uns nun ein wenig mit Sequenzen der Form
Sn := X1 + . . . + Xn
beschäftigen. Haben alle Xi die gleiche Verteilung und sind sie unabhängig, so
ist Snn der durchschnittliche Wert von Xn (oder auch Xn−1 , . . . , X1 , da alle Xi die
gleiche Verteilungsfunktion haben und somit die eine Zufallsvariable stets eine
Kopie der anderen ist). Wir wollen versuchen, die folgende Frage zu beantworten:
Wann konvergieren die Zufallsvariablen Sn und, wenn ja, gegen welchen Wert?
In welchem Sinne findet diese Konvergenz statt? Wir werden zunächst einen
geeigneten Konvergenzbegriff einführen:
Definition 3.41. Die Folge von Zufallsvariablen (Xn )n∈N konvergiert in Wahrscheinlichkeit gegen die Zufallsvariable X, wenn für alle ε > 0 gilt:
lim P(|Xn − X| > ε) = 0.
n→∞
Definition 3.42. Die Folge von Zufallsvariablen (Xn )n∈N konvergiert fast sicher
gegen die Zufallsvariable X, wenn es eine Nullmenge N ⊆ Ω gibt derart, dass
lim Xn (ω) = X(ω)
n→∞
für alle ω ∈ Ω \ N gilt.
Bemerkung 3.43. Konvergenz “fast sicher” von (Xn )n∈N gegen X bedeutet
also, dass Xn überall bis auf einer Nullmenge punktweise gegen X konvergiert.
Konvergenz in Wahrscheinlichkeit ist lediglich ein Spezialfall der Konvergenz
dem Maße nach, die wir in Definition 2.5 eingeführt hatten. Wir werden nun
sehen, dass Konvergenz “fast sicher” stets Konvergenz “in Wahrscheinlichkeit”
impliziert.
Satz 3.44. Konvergiert die Folge von Zufallsvariablen (Xn )n∈N fast sicher gegen
die Zufallsvariable X, so konvergiert (Xn )n∈N auch in Wahrscheinlichkeit gegen
X.
Beweis. Folgt sofort aus der allgemeineren Formulierung des Satzes von Lebesgue 2.6.
Bemerkung 3.45. Dass aus Konvergenz dem Maße nach (also hier: Konvergenz in Wahrscheinlichkeit) nicht fast überall punktweise Konvergenz (also hier:
Konvergenz fast sicher) folgt, haben wir in einem Beispiel im Anschluß an den
Beweis von Satz 2.6 gesehen. Dort haben wir auf Ω = [0, 1) das Lebesgue-Maß
λ betrachtet, dass wir auch als Wahrscheinlichkeitsmaß interpretieren können.
Somit ist das Beispiel auch im stochastischen Kontext relevant.
68
KAPITEL 3. ANWENDUNGEN IN DER STOCHASTIK
Satz 3.46. (Ungleichung von Chebyshev) Sei Y : Ω → R+
0 eine nichtnegative Zufallsvariable, ε > 0 und 0 < p < ∞. Dann gilt
P(Y ≥ ε) ≤
E(Y p )
.
εp
Beweis. Der Beweis ist sehr einfach. Sei A := {ω ∈ Ω | Y (ω) ≥ ε}. Dann gilt:
Z
Z
Z
p
p
p
p
E(Y ) =
Y (ω) d P(ω) ≥
Y (ω) d P(ω) ≥ ε ·
1(ω) d P(ω) ≥ εp · P(A),
Ω
A
A
woraus nach Divison durch εp sofort die Behauptung folgt.
Bemerkung 3.47. Die Ungleichung von Chebyshev zeigt uns, dass Konvergenz
in Lp (Ω, P) bezüglich der Norm k · kp stets Konvergenz in Wahrscheinlichkeit
impliziert, denn gilt kYn − Y kp → 0 für n → ∞, wobei (Yn )n∈N eine Folge von
Zufallsvariablen und Y eine Zufallsvariable ist, so gilt auch kYn − Y kpp → 0, also
Z
p
E(|Yn − Y | ) =
|Yn (ω) − Y (ω)|p d P(ω) = kYn − Y kpp → 0,
Ω
für n → ∞. Die Ungleichung von Chebyshev liefert nun
P(|Yn − Y | ≥ ε) ≤
E(|Yn − Y |p )
→0
εp
für n → ∞ und für jedes feste ε > 0. Dies bedeutet aber, dass Yn gegen Y in
Wahrscheinlichkeit konvergiert.
Wir kommen nun zu dem zentralen Resultat dieses Abschnitts, dem schwachen
Gesetz der großen Zahlen.
Satz 3.48. (Schwaches Gesetz der großen Zahlen) Sei X1 , X2 , . . . eine
Folge unabhängiger, identisch verteilter Zufallsvariablen mit E(Xi ) = m und
Var(Xi ) ≤ K < ∞ für alle i ∈ N. Setze Sn := X1 + . . . + Xn für alle n ∈ N.
Dann konvergiert Snn gegen den Erwartungswert m sowohl im L2 -Sinne als auch
in Wahrscheinlichkeit.
Beweis. Es ist E(Sn ) = E(X1 ) + . . . + E(Xn ) = n · m für alle n ∈ N nach der
Linearität des Erwartungswertes. Damit erhalten wir
E
S n
n
=m
und
E
S
n
n
−m
2
= Var
S n
n
.
3.8. SCHWACHES GESETZ DER GROSSEN ZAHLEN
69
Nach Satz 3.39 folgt nun, da X1 , X2 , . . . unabhängig sind,
Var
S n
n
1
n2
1
= 2
n
1
≤ 2
n
K
=
n
=
· Var(Sn )
· (Var(X1 ) + . . . + Var(Xn ))
·n·K
→0
für n → ∞. Es folgt E( Snn − m)2 → 0 für n → ∞, also die behauptete
L2 -Konvergenz. Da wir in der obigen Bemerkung gesehen hatten, dass Lp Konvergenz stets Konvergenz in Wahrscheinlichkeit impliziert, folgt hieraus die
Behauptung.
3.8
Anwendungen des schwachen Gesetzes der
großen Zahlen
Wir werden in diesem letzten Abschnitt im wesentlichen zwei Anwendungen
für das schwache Gesetz der großen Zahlen 3.48 kennenlernen. Die erste ist
der sogenannte Approximationssatz von Bernstein-Weierstrass und die zweite
eine Monte-Carlo-Methode zur Berechnung von bestimmten Integralen “schwieriger Funktionen” (d.h. Funktionen, von denen wir keine Stammfunktion kennen
oder berechnen können). Letztere Methode werden wir jedoch nicht in aller Allgemeinheit, sondern nur für einen sehr speziellen Fall andeuten.
Satz 3.49. (Approximationssatz von Bernstein-Weierstrass) Ist f :
[0, 1] → R eine stetige Funktion, so konvergiert die Folge der BernsteinPolynome
n k
X
n
fn (x) :=
· xk · (1 − x)n−k · f
k
n
k=0
gleichmäßig gegen die Funktion f .
Beweis. Wir definieren eine Folge von Zufallsvariablen (Xi )i∈N vermöge
(
1 mit Wahrscheinlichkeit x
Xi :=
0 mit Wahrscheinlichkeit 1 − x
70
KAPITEL 3. ANWENDUNGEN IN DER STOCHASTIK
sowie Sn := X1 + . . . + Xn für alle n ∈ N. Nun betrachten wir die Zufallsvariable
f ( Snn ). Die Zufallsvariable Sn kann die Werte 0, 1, 2, . . . , n annehmen, da Sn die
Summe der Xi ist und jedes Xi nur den Wert 0 oder 1 annehmen kann.
Die
n
Wahrscheinlichkeit, dass Sn den Wert k annimmt ist gegeben durch k · xk ·
(1 − x)n−k . Folglich kann die Zufallsvariable f ( Snn ) die Werte f ( nk ) annehmen
für k = 0, . . . , n und nimmt jeden dieser Werte ebenfalls mit Wahrscheinlichkeit
n
· xk · (1 − x)n−k an. Damit ergibt sich für ihren Erwartungswert
k
n k
S X
n
n
k
n−k
=
· x · (1 − x)
·f
= fn (x).
E f
n
k
n
k=0
Es folgt:
S n
− f (x)
sup |fn (x) − f (x)| ≤ sup E f
n
x∈[0,1]
x∈[0,1]
S n
− f (x) .
≤ sup E f
n
x∈[0,1]
Da f : [0, 1] → R als stetige Funktion auf dem kompakten Intervall [0, 1] automatisch gleichmäßig-stetig ist, gibt es zu jedem ε > 0 ein δ > 0 mit |f (x)−f (y)| ≤ 2ε
für alle x, y ∈ [0, 1] mit |x − y| ≤ δ. Damit folgt dann aber:
Z
S S n
n
− f (x) =
−
f
(x)
E f
f
d P(ω)
Sn
n
n
{ω|| n −x|<δ}
Z
S n
+
− f (x) d P(ω).
f
n
{ω|| Snn −x|≥δ}
Das erste Integral können wir nach oben durch 2ε abschätzen. Für das zweite
Integral erhalten wir
Z
S S
n
n
− f (x) d P(ω) ≤ 2 · sup |f (x)| · P − x ≥ δ .
f
n
n
x∈[0,1]
{ω|| Snn −x|≥δ}
Wegen E( Snn ) = E(Xi ) = x liefert das schwache Gesetz der großen Zahlen 3.48
S
n
P − x ≥ δ → 0
n
für n → ∞, denn Var( Snn ) ist endlich. Es handelt sich sogar um in x gleichmäßige
Konvergenz, denn mit 4·x·(1−x) ≤ 1 und Var(Sn ) = n·Var(Xi ) = n·(E(Xi2 )−
3.8. SCHWACHES GESETZ DER GROSSEN ZAHLEN
71
(E(Xi ))2 ) = n · (x − x2 ) = n · x · (1 − x) folgt mit der Ungleichung von Chebyshev
3.46 (setze dort p = 2):
E(| Sn − x|2 )
S
Var( Snn )
x · (1 − x)
1
n
n
P − x ≥ δ ≤
=
≤
≤
.
2
2
2
n
δ
δ
n·δ
4 · n · δ2
Für hinreichend große n wird also die linke Seite der letzten Ungleichung beliebig
klein, also das Gesamtintegral ≤ 2ε . Insgesamt folgt damit
sup |fn (x) − f (x)| ≤ ε,
x∈[0,1]
was die behauptete gleichmäßige Konvergenz beweist.
Der Approximationssatz von Bernstein-Weierstraß ist ein klassisches Resultat
der Analysis und findet nicht nur dort, sondern auch in der Funktionalanalysis
Anwendnung. Die Aussage über die gleichmäßige Konvergenz besagt im wesentlichen nichts anderes, als dass die Menge der Bernstein-Polynome dicht in
C([0, 1]) mit der Supremumsnorm liegt.
Als zweite Anwendung kommen wir dazu, wie man Werte von schwierigen bestimmten Integralen über dem Einheitsintervall [0, 1] mit stochastischen Mitteln
berechnen kann:
Satz 3.50. (Monte-Carlo-Methode zur Berechnung von Integralen) Sei
f : [0, 1] → R eine integrierbare Funktion und (Xn )n∈N eine Folge unabhängiger
Zufallsvariablen auf [0, 1], die der Gleichverteilung unterliegen. Definiere die
Folge der Zufallsvariablen
In :=
n
1 X
·
f (Xk )
n k=1
für alle n ∈ N. Dann gilt:
Z
1
In →
f (x) d x
0
für n → ∞ in Wahrscheinlichkeit.
Beweis. Die Verteilung der Zufallsvariablen Xk ist das Lebesgue-Maß auf [0, 1].
Also gilt nach Satz 3.16
Z
Z
Z
Z
E(f (Xk )) =
f (Xk (ω)) d P(ω) =
f (x) d PXk (x) =
f (x) d λ =
f (x) d x.
Ω
[0,1]
[0,1]
[0,1]
72
KAPITEL 3. ANWENDUNGEN IN DER STOCHASTIK
Es folgt:
Z
n
X
1
1
f (x) d x.
E(In ) = · E
f (Xk ) = · n · E(f (Xk )) =
n
n
[0,1]
k=1
Das schwache Gesetz der großen Zahlen 3.48 liefert daher mit
Z 1
P In −
f (x) d x ≥ ε → 0
0
die gewünschte Konvergenz in Wahrscheinlichkeit.
Herunterladen