Ergänzungen zur Maßtheorie

Anhang A
Ergänzungen zur Maßtheorie
A.1 Beweis des Maßerweiterungssatzes und Folgerungen
Der Beweis des Maßerweiterungssatzes 2.10 bedarf zunächst einiger Vorbereitungen, vor allem der Einführung des äußeren Maßes. Wir folgen hierbei weitgehend
der Darstellung in [5, §5].
Sei R ein Ring über einer nichtleeren Menge Ω und µ ein Prämaß µ über
(Ω , R). Für jedes C ⊂ Ω bezeichne U (C) die Menge aller Überdeckungen von C
durch Mengen aus R, also aller Folgen (An )n≥1 derart, dass An ∈ R für jedes n ≥ 1
S
und C ⊂ n≥1 An gilt. Wegen 0/ ∈ R kann man jede endliche C überdeckende Familie {A1 , ..., An } ⊂ R durch (A1 , ..., An , 0,
/ ...) zu einer Folge aus U (C) erweitern.
Das zu µ assoziierte äußere Maß µ ∗ : P(Ω ) → R> wird definiert durch
( inf ∑n≥1 µ(An ) : (An )n≥1 ∈ U (C) , falls U (C) 6= 0,
/
∗
µ (C) :=
(A.1)
∞, sonst
und besitzt die folgenden leicht nachweisbaren Eigenschaften:
µ ∗ (0)
/ = 0,
∗
µ∗
∗
µ (C1 ) ≤ µ (C2 ),
!
[
n≥1
Cn
≤
(A.2)
falls C1 ⊂ C2 ,
∑ µ ∗ (Cn )
n≥1
für alle C1 ,C2 , .. ⊂ Ω ,
µ ∗ (A) = µ(A) für alle A ∈ R.
(A.3)
(A.4)
(A.5)
Die vorletzte Bedingung (Subadditivität von µ ∗ ) liefert insbesondere
µ ∗ (C) ≤ µ ∗ (C ∩ A) + µ ∗ (C ∩ Ac ) für alle A,C ⊂ Ω .
(A.6)
Eine Menge A ⊂ Ω heißt µ ∗ -messbar, falls auch die umgekehrte Ungleichung und
somit Gleichheit für alle C ⊂ Ω gilt, also
225
226
A Ergänzungen zur Maßtheorie
µ ∗ (C) = µ ∗ (C ∩ A) + µ ∗ (C ∩ Ac ) für alle C ⊂ Ω .
(A.7)
Es bezeichne A∗ das System der µ ∗ -messbaren Mengen. Der folgende Satz, der auf
C. C ARATHEODORY zurückgeht, ebnet den Weg zur Erweiterung von µ zu einem
Maß auf der von R erzeugten σ -Algebra.
Satz A.1. (von Caratheodory) In der gegebenen Situation gilt:
(a)
(b)
A∗ ist eine σ -Algebra, die R enthält.
Die Einschränkung von µ ∗ auf A∗ ist ein Maß.
Beweis. (a1) Wir zeigen als erstes R ⊂ A∗ . Seien dazu A ∈ R und C ⊂ Ω beliebig gewählt und o.B.d.A. µ ∗ (C) < ∞ angenommen, da sonst wegen (A.6) nichts
zu zeigen ist. Fixiere irgendein ε > 0 und wähle (An )n≥1 ∈ U (C) derart, dass
∑n≥1 µ(An ) ≤ µ ∗ (C) + ε. Unter Beachtung von An ∩ A, An ∩ Ac ∈ R, der Additivität von µ auf R sowie (An ∩ A)n≥1 ∈ U (C ∩ A), (An ∩ Ac )n≥1 ∈ U (C ∩ Ac ) folgt
dann
µ ∗ (C) + ε ≥
∑ µ(An )
n≥1
=
∑ µ(An ∩ A) + ∑ µ(An ∩ Ac )
n≥1
∗
n≥1
∗
≥ µ (C ∩ A) + µ (C ∩ Ac )
und somit (A.7).
(a2) Als nächstes zeigen wir, dass A∗ eine Algebra und daher insbesondere ∩stabil ist [+ Anm. 2.2]. Daß A∗ die Menge Ω enthält und unter der Bildung von
Komplementen abgeschlossen ist, sieht man sofort. Nachzuweisen bleibt deshalb
nur, dass mit A, B auch A ∪ B ∈ A∗ liegt. Zunächst erhält man für alle C ⊂ Ω durch
zweimalige Benutzung von (A.7)
µ ∗ (C) = µ ∗ (C ∩ A) + µ ∗ (C ∩ Ac )
= µ ∗ (C ∩ A ∩ B) + µ ∗ (C ∩ A ∩ Bc ) + µ ∗ (C ∩ Ac ∩ B) + µ ∗ (C ∩ Ac ∩ Bc )
und dann nach Ersetzen von C durch C ∩ (A ∪ B)
µ ∗ (C ∩ (A ∪ B)) = µ ∗ (C ∩ A ∩ B) + µ ∗ (C ∩ A ∩ Bc ) + µ ∗ (C ∩ Ac ∩ B).
(A.8)
Subtrahiert man diese Gleichung von der vorherigen, so ergibt sich die gewünschte
Beziehung
µ ∗ (C) = µ ∗ (C ∩ (A ∪ B)) + µ ∗ (C ∩ (A ∪ B)c ) für alle C ⊂ Ω
und somit A ∪ B ∈ A∗ .
(a3) Wir beenden den Beweis von (a) mit dem Nachweis, dass A∗ ein ∩-stabiles Dynkin-System und daher dank Satz 1.14 eine σ -Algebra ist. Gegeben p.d.
A.1 Beweis des Maßerweiterungssatzes und Folgerungen
227
A1 , A2 , ... ∈ A∗ , müssen wir hierfür noch ∑n≥1 An ∈ A∗ zeigen. Wählen wir A = A1
und B = A2 in (A.8), so folgt
µ ∗ (C ∩ (A1 ∪ A2 )) = µ ∗ (C ∩ A1 ) + µ ∗ (C ∩ A2 ) für alle C ⊂ Ω
und daraus per Induktion
!
n
µ ∗ C ∩ ∑ Ak
n
=
k=1
Wegen µ ∗ C ∩
∗
n
µ (C) =
∑µ
T
c
k≥1 Ak
∗
k=1
∑ µ ∗ (C ∩ Ak )
≤ µ∗ C ∩
(C ∩ Ak ) + µ
für alle C ⊂ Ω und n ≥ 1.
k=1
∗
Tn
C∩
c
k=1 Ak
n
\
k=1
Ack
!
vermöge (A.3) liefert dies
n
≥
∑µ
k=1
∗
(C ∩ Ak ) + µ
∗
für alle C ⊂ Ω und n ≥ 1, was schließlich unter Benutzung von (A.4)
!
µ ∗ (C) ≥
∑ µ ∗ (C ∩ Ak ) + µ ∗
k≥1
!
C∩
\
k≥1
k≥1
Ack
!
Ack
k≥1
≥ µ ∗ C ∩ ∑ Ak + µ ∗ C ∩
C∩
\
\
k≥1
Ack
!
(A.9)
für alle C ⊂ Ω
und so ∑k≥1 Ak ∈ A∗ impliziert, da die umgekehrte Ungleichung gemäß (A.6) immer
erfüllt ist.
(b) Da (A.9) mit dem letzten Hinweis de facto eine Gleichung ist, folgt bei Wahl
von C = Ω offenbar µ ∗ (∑k≥1 Ak ) = ∑k≥1 µ ∗ (Ak ), d.h. die σ -Additivität von µ ∗ auf
A∗ . Zusammen mit (A.2) beweist dies, dass µ ∗ auf A∗ ein Maß bildet.
t
u
Beweis (des Maßerweiterungssatzes). Für die Existenzaussage genügt der Verweis
auf den vorherigen Satz, denn µ ∗ bildet eine Maßfortsetzung von µ auf σ (R) ⊂ A∗ .
Der Beweis der Eindeutigkeitsaussage bietet eine willkommene Gelegenheit, das
in Satz 1.22 formulierte DS-Argument zu verwenden: Seien also µ1 und µ2 zwei
Fortsetzungen des Prämaßes µ auf die σ -Algebra A := σ (R), d.h. µ1 (A) = µ2 (A) =
µ(A) für alle A ∈ R. Nach Voraussetzung existieren Ω1 , Ω2 , ... ∈ R derart, dass
Ωn ↑ Ω und µ(Ωn ) < ∞ für alle n ≥ 1 gilt. Da R ∩-stabil und jedes RΩn eine Algebra ist [+ Anm. 2.3], bildet jedes µi,n := µi (· ∩ Ωn ) (i = 1, 2) eine Fortsetzung von
µ(· ∩ Ωn ). Damit reicht es offenbar, die Eindeutigkeitsaussage unter den Voraussetzungen, dass R eine Algebra und µ ein endliches Prämaß auf R ist, zu zeigen.
Sei also nun R eine Algebra und µ(Ω ) < ∞. Wir definieren das Mengensystem
D := {A ∈ A : µ1 (A) = µ2 (A)},
welches natürlich R als Teilsystem enthält, und behaupten, dass D ein DynkinSystem bildet. Wegen Ω ∈ R folgt Ω ∈ D, und da Ac = Ω \A, folgt weiter für
228
A∈D
A Ergänzungen zur Maßtheorie
µ1 (Ac ) = µ1 (Ω ) − µ1 (A) = µ2 (Ω ) − µ2 (A) = µ2 (A),
was Ac ∈ D zeigt. Sei schließlich A1 , A2 , ... eine Folge p.d. Elemente von D. Unter
Benutzung der σ -Additivität von µ1 und µ2 erhalten wir dann
!
!
µ1
∑ Aj
=
j≥1
∑ µ1 (A j )
=
∑ µ2 (A j )
j≥1
j≥1
= µ2
∑ Aj
j≥1
und somit ∑ j≥1 A j ∈ D. Folglich bildet D in der Tat ein Dynkin-System, das wegen
R ⊂ D auch δ (R) enthält. Da R ∩-stabil ist, folgt weiter δ (R) = σ (R) = A
vermöge Satz 1.21 und damit D = A. Also sind µ1 und µ2 auf ganz A identisch. t
u
Beweis (des Approximationssatzes 2.12). Da R eine Algebra bildet und somit Ω
enthält, ist U (A) wegen (Ω , 0,
/ ...) ∈ U (A) für alle A ⊂ Ω nicht leer. Ferner entspricht µ auf A dem in (A.1) definierten äußeren Maß µ ∗ und ist endlich. Folglich existiert zu jedem A ∈ A und jedem ε > 0 eine Folge (Rn )n≥1 aus R mit
S
S
A ⊂ C := k≥1 Rk und |µ(A) − µ(C)| < ε. Setzt man nun Cn := nk=1 Rk für n ≥ 1,
so gilt Cn ∈ R, da R eine Algebra ist, µ(Cn ) ↑ µ(C), da µ stetig von unten ist, und
folglich
inf µ(A4B) ≤ inf µ(A4Cn ) < ε,
B∈R
was offenbar die Behauptung zeigt.
n≥1
t
u
Zum Abschluss geben wir zwei Beispiele, die zeigen sollen, dass bei Verzicht
auf die σ -Endlichkeit des Prämaßes µ im Maßerweiterungssatz in der Tat unendlich
viele Maßfortsetzungen von µ existieren können.
Beispiel A.2. Wie in Anm. 2.3 erwähnt, ist jede Algebra und folglich auch jede σ Algebra R über einer Teilmenge Λ ⊂ Ω zugleich ein Ring über Ω . Sei nun (Ω , A)
irgendein messbarer Raum mit |Ω | ≥ 2 und Λ ∈ A eine echte, nichtleere Teilmenge
von Ω . Sei ferner R die Spur von A unter Λ sowie µ irgendein endliches Maß
auf (Λ , R), das in kanonischer Weise durch µ(A) := µ(A ∩ Λ ) zu einem Maß
auf (Ω , A) fortgesetzt wird. Schließlich sei ν = δx für ein x ∈ Λ c . Dann stimmt
µc := µ + cν für jedes c ≥ 0 mit µ auf R überein und definiert dort ein Prämaß.
Gleichzeitig ist aber offenbar jedes µc als Maß auf (Ω , A) eine Fortsetzung von
µ mit c = µc (Λ c ) 6= µ(Λ c ). Beachte bei diesem Beispiel, dass µ ungeachtet der
Endlichkeit von µ(Λ ) kein σ -endliches Prämaß auf (Ω , R) bildet, weil R keine Ω
ausschöpfende Folge enthält. Und weil außerdem Ω 6∈ R sowie µc (Λ ) < ∞ für alle
c ≥ 0 gilt, zeigt dieses Beispiel ferner, dass in Satz 2.11 die Voraussetzung Ω ∈ R
nicht ersatzlos gestrichen werden kann.
Beispiel A.3. Als zweites Beispiel [+ auch [36, Bem. (2.40)]] betrachten wir dass
Prämaß µ := ∑n≥1 δ−1/n auf dem Ring F = F 1 der eindimensionalen dyadischen
Figuren gemäß (2.6) über R. Dieses ist nicht σ -endlich, da jede R ausschöpfende
isotone Folge (Ωn )n≥1 in F für hinreichend große n ein dyadisches Intervall der
Form (−2−m , 0] (m ∈ N) enthält, was µ(Ωn ) = ∞ für solche n impliziert. Beachtet
A.2 Vitali-Mengen und Beweis von Satz 2.18
229
man ferner, dass 0 ∈ A und A ∈ R stets A = (−2−m , 0] für ein m ∈ N und deshalb
|A ∩ {−1/n : n ∈ N}| = ∞ impliziert, so folgt, dass alle µc := µ + cδ0 (c ≥ 0) auf
R mit µ übereinstimmen, aber als Maße auf (R, B(R)) paarweise verschiedene
Fortsetzungen definieren.
A.2 Vitali-Mengen und Beweis von Satz 2.18
Beweis (von Satz 2.18). Nehmen wir an, dass B(Rd ) = P(Rd ) gilt und somit λλ d
auf der ganzen Potenzmenge von Rd ein translationsinvariantes Maß bildet. Durch
x ∼ y :⇔ x − y ∈ Qd wird eine Äquivalenzrelation auf Rd definiert, die folglich eine
Partition des Raumes in p.d. Äquivalenzklassen der Form x + Qd für ein x ∈ Rd
induziert. Vermöge des Auswahlaxioms können wir aus jeder dieser Klassen einen
Vertreter wählen, die zusammen eine Menge V ergeben. Diese kann o.B.d.A. als
Teilmenge von (0, 1]d gewählt werden, denn zu jedem x ∈ Rd gibt es genau ein
n ∈ Zd ⊂ Qd mit x + n ∈ (0, 1]d . Damit gilt Rd = ∑x∈V (x + Qd ), aber auch
Rd =
∑ (q +V ),
(A.10)
q∈Qd
denn die q+V für q ∈ Qd sind ebenfalls p.d. Aus (q+V )∩(r+V ) 6= 0/ folgt nämlich
q + x = r + y für geeignete x, y ∈ V , also x − y ∈ Qd , was nach Wahl der Menge V
schon x = y und dann weiter q = r impliziert. Da Qd abzählbar ist, sichert die σ Additivität von λλ d in (A.10)
∑
λλ d (q +V ) = λλ d (Rd ) = ∞,
q∈Qd
also λλ d (q+V ) > 0 für ein und dann vermöge der Translationsinvarianz alle q ∈ Qd ,
insbesondere natürlich λλ d (V ) > 0. Nun gilt aber wegen V ⊂ (0, 1]d offenbar
∑
q∈Qd ∩(0,1]d
(q +V ) ⊂ (0, 2]d ,
was unmöglich ist, weil einserseits λλ d ((0, 2]d ) = 2d < ∞, andererseits
∑
q∈Qd ∩(0,1]d
λλ d (q +V ) = |Qd ∩ (0, 1]d | λλ d (K) = ∞
unter nochmaliger Benutzung der Translationsinvarianz sowie λλ d (V ) > 0 gilt. Also
ist V keine Borel-Menge und B(Rd ) 6= P(Rd ).
t
u
Anmerkung A.4. Eine nicht Borelsche Menge V der zuvor konstruierten Form unter
Verwendung des Auswahlaxioms wird als Vitali-Menge bezeichnet, benannt nach
dem ital. Mathematiker G. V ITALI.
230
A Ergänzungen zur Maßtheorie
Anmerkung A.5. (Vervollständigung) Ein Maßraum (Ω , A, µ) heißt vollständig, die
σ -Algebra A entsprechend vollständig bezüglich µ oder µ-vollständig, wenn aus
A ∈ A mit µ(A) = 0 schon B ∈ A für alle B ⊂ A folgt, wenn also Teilmengen von
µ-Nullmengen ebenfalls messbar und damit µ-Nullmengen bilden. Umgekehrt lässt
sich zu jeder σ -Algebra A deren µ-Vervollständigung Aµ in folgender Weise definieren: Sei
Nµ := {N ∈ P(Ω ) : N ⊂ A für ein A ∈ A mit µ(A) = 0}.
der Ring aller Teilmengen von µ-Nullmengen, der sogar abgeschlossen ist unter
abzählbaren Vereinigungen. Dann lässt sich leicht zeigen, dass
Aµ : = {A ∪ N : A ∈ A, N ∈ Nµ }
wieder eine σ -Algebra definiert, die zum einen µ-vollständig ist und zum anderen offensichtlich Aµ = σ (A ∪ Nµ ) erfüllt. Sie wird als Vervollständigung von A
bezüglich µ bezeichnet.Vermöge der kanonischen Festlegung µ(A ∪ N) := µ(A) für
alle N ∈ Nµ erhält man schließlich eine Fortsetzung von µ als Maß auf der Vervollständigung Aµ .
Die λλ d -Vervollständigung von B(Rd ) wird Lebesguesche σ -Algebra genannt
und mit L (Rd ) bezeichnet, ihre Elemente heißen Lebesgue-Mengen. Wie man
sofort sieht, ist das L-Maß auf L (Rd ) weiterhin translationsinvariant, und dies
zeigt weiter, dass die im Beweis von Satz 2.18 konstruierte Menge V auch keine
Lebesgue-Menge sein kann, dass also auch L (Rd ) kleiner als P(Rd ) ist.
A.3 Regularität von Borel-Maßen
Ein Maß µ auf (Rd , B(Rd )) heißt regulär, wenn es die beiden folgenden Bedingungen erfüllt:
µ(B) = sup{µ(K) : K ⊂ B, K kompakt}
µ(B) = inf{µ(G) : B ⊂ G, G offen}
für alle B ∈ B(Rd ),
für alle B ∈ B(R ).
d
(A.11)
(A.12)
Die Eigenschaften (A.11) und (A.12) für sich genommen nennt man auch innere
bzw. äußere Regularität. Ein Maß ist demnach regulär, wenn es sowohl von innen
als auch von außen regulär ist.
Satz A.6. Jedes endliche Borel-Maß µ auf Rd ist regulär.
Beweis. Wir benutzen ein DS-Argument. Sei E das System der beschränkten links
halboffenen Teilintervalle von Rd , das bekanntlich einen ∩-stabilen Erzeuger von
A.4 Zerlegung von Borel-Maßen auf R
231
B(Rd ) bildet. Jedes I ∈ E erfüllt offenkundig die beiden Bedingungen (A.11) und
(A.12). Betrachten wir nun das System
D := {B ∈ B(Rd ) : B erfüllt (A.11) und (A.12)}.
Wir müssen zeigen, dass D ein Dynkin-System ist:
(1) Es gilt Rd ∈ D, weil Rd durch kompakte Mengen ausgeschöpft werden kann.
(2) Falls B ∈ D, so existieren zu jedem ε > 0 ein Kompaktum K ⊂ B und eine
offene Menge G ⊃ B, so dass µ(B) − ε ≤ µ(K) ≤ µ(G) ≤ µ(B) + ε. Es folgt Gc ⊂
Bc ⊂ K c und ferner, da µ endlich ist,
µ(Bc ) − ε ≤ µ(Gc ) ≤ µ(K c ) ≤ µ(Bc ) + ε.
Außerdem ist K c offen und Gc abgeschlossen. Wählt man nun n ≥ 1 so groß, dass
µ(Rd \[−n, n]d ) < ε, so folgt für die kompakte Menge K ∗ := Gc ∩ [−n, n]d offenbar
K ∗ ⊂ Bc und µ(K ∗ ) ≥ µ(Gc ) − ε ≥ µ(Bc ) − 2ε. Dies zeigt Bc ∈ D.
(3) Gegeben eine Folge (Bn )n≥1 p.d. Elemente aus D, fixiere ein beliebiges ε > 0
und wähle kompakte Mengen Kn sowie offene Mengen Gn derart, dass Kn ⊂ Bn ⊂ Gn
und µ(Bn ) − ε2−n ≤ µ(Kn ) ≤ µ(Gn ) ≤ µ(Bn ) + ε2−n für alle n ≥ 1 gilt. Beachte,
dass die Kn ebenfalls p.d. sind. Setzen wir B := ∑n≥1 Bn , B[n] := ∑nj=1 B j , G :=
S
n
n≥1 Gn und K[n] := ∑ j=1 K j , so folgt K[n] ⊂ B[n] ⊂ B ⊂ G und
µ(B[n] ) − ε ≤ µ(K[n] ) ≤ µ(G) ≤ µ(B) + ε
für alle n ≥ 1. Ferner ist G offen und jedes K[n] kompakt. Da µ(B[n] ) → µ(B), können
wir n so groß wählen, dass µ(B[n] ) ≥ µ(B) − ε. Dies zeigt offenbar B ∈ D.
Somit ist D in der Tat ein Dynkin-System, welches E enthält und folglich bereits
mit B(Rd ) übereinstimmt.
t
u
A.4 Zerlegung von Borel-Maßen auf R
Ergänzend zu den Ausführungen über Borel-Maße auf R in Unterabschnitt 2.4.1,
dessen Bezeichnungen hier beibehalten seien, wird im Anschluss gezeigt, dass sich
jedes solche Maß in eindeutiger Weise in einen stetigen und einen diskreten Anteil
zerlegen lässt. Zu beliebiger maßerzeugender Funktion F definieren wir
F d (x) :=
∑
y∈D(F)∩(−∞,x]
und zeigen zunächst:
∆F (y) und
F c (x) := F(x) − F d (x)
(A.13)
232
A Ergänzungen zur Maßtheorie
Lemma A.7. Die Funktionen F d , F c sind ebenfalls maßerzeugend und F c außerdem stetig.
Beweis. Für F d ergibt sich die Monotonie direkt aus der Definition, während die
rechtsseitige Stetigkeit aus F d (x + ε) − F d (x) = ∑y∈D(F)∩(x,x+ε] ∆F (y) und D(F) ∩
(x, x + ε] ↓ 0/ für ε ↓ 0 folgt. Als Differenz zweier rechtsseitig stetiger Funktionen ist
aber auch F c rechtsseitig stetig, so dass nur noch die Monotonie und die linksseitige Stetigkeit von F c zu zeigen bleiben. Hierfür notieren wir als erstes, dass unter
Benutzung von (2.10)
F d (y) − F d (x) =
∑
z∈D(F)∩(x,y]
µF ({z}) = µF (D(F) ∩ (x, y]).
für alle x, y ∈ R mit x < y gilt. Es folgt die Monotonie von F c aus
F c (y) − F c (x) = (F(y) − F(x)) − (F d (y) − F d (x))
= µF ((x, y]) − µF (D(F) ∩ (x, y]) = µF (C(F) ∩ (x, y]) ≥ 0
für alle x, y ∈ R mit x < y. Per Grenzübergang und Beachtung von (2.11) liefert dies
weiter
∆F c (y) = lim(F c (y) − F c (x)) = µF (C(F) ∩ {y}) = 0
x↑y
und somit auch die linksseitige Stetigkeit von F c .
t
u
Wir sind nun in der Lage, den angekündigten Zerlegungssatz zu beweisen, und
erinnern daran, dass µF genau dann diskret bzw. stetig ist, falls µF = ∑x∈D(F) ∆F (x)δx
bzw. µF ({x}) = 0 für alle x ∈ R gilt. Wegen Lemma A.7 ist klar, dass µF d immer
ein diskretes und µF c ein stetiges Borel-Maß bildet.
Satz A.8. (Zerlegung von Borel-Maßen) Jedes Borel-Maß µ besitzt eine eindeutige Zerlegung µ = µ d + µ c in ein diskretes Borel-Maß µ d und ein stetiges BorelMaß µ c . Falls µ = µF für eine maßerzeugende Funktion F, so gilt weiter
µ d = µF d =
∑
∆F (x) δx
x∈D(F)
und µ c = µF c .
Beweis. Sei µ ein Borel-Maß und F eine maßerzeugende Funktion mit µ = µF , die
gemäß Satz 2.21 stets existiert. Dann impliziert F = F d + F c sofort µF = µF d + µF c
auf dem ∩-stabilen Mengensystem E der links halboffenen Intervalle (a, b]. Es folgt
die Gleichheit auf ganz B(R) = σ (E ) mittels eines einfachen DS-Arguments.
Sei nun µ = µ1 + µ2 eine weitere Zerlegung in ein diskretes Borel-Maß µ1 und
ein stetiges Borel-Maß µ2 . Es folgt µF d − µ1 = µ2 − µF c , wobei (µ2 − µF c )({x}) = 0
für alle x ∈ R und
A.4 Zerlegung von Borel-Maßen auf R
µF d − µ1 =
233
∑ p(x) δx
x∈I
für eine abzählbare Menge I ⊂ R und eine Funktion p : I → R gelten muss. Dies ist
aber offenbar nur möglich, wenn p(x) ≡ 0, also µF d = µ1 und µF c = µ2 gilt.
t
u
Anmerkung A.9. Für eine W-Verteilung µ auf (R, B(R)) lässt sich der Zerlegungssatz auch folgendermaßen formulieren: Entweder ist µ selbst diskret oder stetig,
oder es existieren eine diskrete Verteilung µ d , eine stetige Verteilung µ c und ein
α ∈ (0, 1) derart, dass
(A.14)
µ = α µ d + (1 − α)µ c .
M.a.W., µ lässt sich in eindeutiger Weise als konvexe Kombination oder Mischung
einer diskreten und einer stetigen Verteilung darstellen. Ist nämlich µ = µ d + µ c
gemäß Satz A.8 mit µ d 6≡ 0 und µ c 6≡ 0, so wähle µ u := µ u (R)−1 µ u für u ∈ {d, s}
und α = µ d (R). Eine weitere Verfeinerung dieser Zerlegung, die sich aus der
Lebesgue-Zerlegung ergibt, findet der Leser in Abschnitt B.5.
Anhang B
Ergänzungen zur Integrationstheorie
B.1 Eigenschaften des Maßintegrals
Beweis (von Satz 3.41). Wir beschränken uns auf den Beweis der Teil (a)–(e) und
überlassen (f), (g) dem Leser als einfache Übung.
(a) Diese Aussage ergibt sich unmittelbar aus der Definition (3.13) des Integrals
bezüglich µ, angewendet auf f1+ , f2+ und f1− , f2− , für die f1+ ≤ f2+ bzw. f1− ≥ f2−
gilt.
(c) Gegebenenfalls nach Übergang zu ( fn − f1− )n≥1 dürfen wir o.B.d.A. voraussetzen, dass alle fn nichtnegativ sind. Gemäß Teil (a) folgt direkt
Z
R
f1 dµ ≤
R
Z
f2 dµ ≤ ... ≤
Z
fn dµ ≤ ... ≤
Z
f dµ,
also limn→∞ fn dµ ≤ f dµ. Für die umgekehrte Ungleichung genügt es unter erneutem Hinweis auf (3.13),
inf f (ω) · µ(Ai ) ≤ lim
∑ ω∈Ai
i∈I
n→∞
Z
fn dµ
für jede endliche Zerlegung (Ai )i∈I ∈ Z(Ω , A) zu zeigen. Seien daher eine solche
Zerlegung und ein beliebiges x < ∑i∈I αi µ(Ai ) vorgegeben, wobei αi := infω∈Ai f (ω).
Wir wählen Konstanten βi , i ∈ I mit folgenden Eigenschaften: 0 < βi < αi , falls
αi > 0, βi = αi , falls αi = 0 und x < ∑i∈I βi µ(Ai ). Wegen fn ↑ f existiert dann für
jedes i ∈ I und ω ∈ Ai ein n0 = n0 (ω) derart, dass fn (ω) ≥ βi für alle n ≥ n0 . Als
nächstes definieren wir
Ai,n := { fn ≥ βi } ∩ Ai ∈ A
(i ∈ I, n ∈ N),
für die Ai,n ↑ Ai und daher µ(Ai,n ) ↑ µ(Ai ) für jedes i ∈ I folgt. Wir erhalten
235
236
B Ergänzungen zur Integrationstheorie
Z
fn dµ ≥
≥
inf fn (ω) · µ(Ai,n ) + ∑ inf c
∑ ω∈A
ω∈Ai ∩A
i,n
i∈I
i∈I
i,n
fn (ω) · µ(Ai ∩ Aci,n )
∑ βi µ(Ai,n )
i∈I
und schließlich
lim
n→∞
Z
fn dµ ≥ lim
n→∞
∑ βi µ(Ai,n )
=
i∈I
∑ βi µ(Ai )
> x,
i∈I
was den Beweis von (3.17) abschließt.
(d) Es seien gn := supk≥n fk und hn := infk≥n fk , die offenbar gn ↓ f , hn ↑ f ,
hn ≤ fn ≤ gn für alle n ≥ 1 sowie
sup |hn | ≤ sup |gn | ≤ f ∗ ∈ L1 (µ)
n≥1
n≥1
erfüllen. Per Anwendung des Satzes von der monotonen Konvergenz ergibt sich nun
lim
n→∞
Z
gn dµ = lim
n→∞
Z
hn dµ =
Z
f dµ
und daraus wegen hn ≤ fn ≤ gn und der Monotonie des Integrals auch (3.17).
(b) Für den Nachweis der Linearität des Maßintegrals wähle zuerst f , g ∈ E(Ω , A)
in Normaldarstellung, d.h. f = ∑i∈I αi 1Ai und g = ∑ j∈J β j 1B j mit (Ai )i∈I , (B j ) j∈J ∈
Z(Ω , A) und reellen Konstanten αi , β j . Es folgt
α f +βg =
∑
i∈I, j∈J
(ααi + β β j ) 1Ai ∩B j
mit (Ai ∩B j )i∈I, j∈J ∈ Z(Ω , A). Wie man sofort einsieht, gilt Satz 3.40 auch für reelle
primitive Funktionen (Elemente von E(Ω , A)). Es folgt
Z
(α f + β g) dµ =
∑
i∈I, j∈J
=
(ααi + β β j ) µ(Ai ∩ B j )
∑ ααi ∑ µ(Ai ∩ B j ) + ∑ β β j ∑ µ(Ai ∩ B j )
i∈I
j∈J
j∈J
= α ∑ αi µ(Ai ) + β
i∈I
= α
Z
f dµ + β
Z
i∈I
∑ β j µ(B j )
j∈J
g dµ.
Seien schließlich f , g beliebige integrierbare Funktionen. Wähle fn , gn ∈ E(Ω , A)
+
−
−
mit fn+ ↑ f + , fn− ↓ f − , g+
n ↑ g und gn ↓ g , also f n → f , gn → g sowie α f n +β gn →
α f + β g. Die Existenz solcher fn , gn sichert Lemma 3.37. Wegen
sup | fn | ≤ f1− + f + ∈ L1 (µ) und
n≥1
+
1
sup |gn | ≤ g+
1 + g ∈ L (µ)
n≥1
B.1 Eigenschaften des Maßintegrals
237
erhalten wir vermöge des soeben Gezeigten und des Satzes von der majorisierten
Konvergenz
Z
Z
(α fn + β gn ) dµ
Z
Z
= lim α fn dµ + β gn dµ
(α f + β g) dµ = lim
n→∞
n→∞
also die Behauptung in voller Allgemeinheit.
(e) Hier ergibt sich die Behauptung leicht unter Hinweis auf
0 ≤ lim inf fn = lim inf fk ,
n→∞
n→∞ k≥n
was wie behauptet
Z
lim inf fn dµ = lim
n→∞
n→∞
Z
inf fk dµ ≤ lim inf
n→∞
k≥n
Z
fn dµ
mit dem Satz von der monotonen Konvergenz impliziert.
t
u
Satz B.1. Sei (Ω , A, µ) ein Maßraum und f ∈ L0 (Ω , A) eine messbare numerische
Funktion. Dann gilt für
(a) nichtnegatives f :
(b) quasi-integrierbares f :
R
f dµ = 0 ⇔ f = 0 µ-f.ü.
R
A
f dµ = 0 für alle A ∈ A ⇔ f = 0 µ-f.ü.
Beweis. (a) Wir setzen N := { f 6= 0} = { f > 0}.
R
“⇒” Sei f dµ = 0. Es gilt N ∈ A, weil f messbar ist, und wir müssen µ(N) = 0
zeigen. Für n ≥ 1 setzen wir An := { f ≥ 1n } und bemerken, dass An ∈ A, f ≥ n−1 1An
sowie An ↑ N, also µ(An ) ↑ µ(N) gelten. Wir erhalten dann
0 =
Z
f dµ ≥
Z
n−1 1An dµ = n−1 µ(An ) ≥ 0,
also µ(An ) = 0 für alle n ≥ 1, was µ(N) = 0 impliziert.
“⇐” RSei nun f = 0 µ-f.ü., also µ(N) = 0 vorausgesetzt. Setzen wir gn := n · 1N ,
so folgt gn dµ = 0 und 0 ≤ f ≤ g := limn→∞ gn und deshalb unter Benutzung des
Satzes von der monotonen Konvergenz
0 ≤
Z
f dµ ≤
Z
g dµ = lim
n→∞
Z
gn dµ = 0.
(b) Die Beweisrichtung “⇐” ist mit Teil (a) trivial, da f = 0 µ-f.ü. dasselbe
für die nichtnegativen Funktionen f + und f − impliziert. Für die Umkehrung “⇒”
238
B Ergänzungen zur Integrationstheorie
R
R
notieren wir, dass nach Voraussetzung { f ≥0} f dµ = 0 und { f ≤0} | f | dµ = 0 wegen
R
{ f ≥ 0}, { f ≤ 0} ∈ A gilt. Es folgt | f | dµ = 0 und somit f = 0 µ-f.ü. wiederum
gemäß Teil (a).
t
u
Als nützliche Folgerung aus Satz B.1 notieren wir:
Korollar B.2. Es seien f , g zwei quasi-integrierbare numerische Funktionen auf
einem Maßraum (Ω , A, µ). Dann gilt:
R
A
f dµ ≤
R
Ag
dµ für alle A ∈ A ⇔ f ≤ g µ-f.ü.
Insbesondere folgt aus f = g µ-f.ü. stets
R
R
f dµ = g dµ.
Beweis. “⇒” Für n ≥ 1 betrachte die nichtnegative
Funktion hRn := ( f − g)1Bn mit
R
Bn := { f > g, f ≥ −n,
g
≤
n}
∈
A.
Dann
gilt
f
dµ
> −∞,
BR
Bn g dµ < ∞ sowie
n
R
R
R
nach Voraussetzung
h
dµ
=
(
f
−
g)
dµ
=
f
dµ
−
g
n
Bn
Bn
Bn dµ ≤ 0. AndererR
seits muss
h
dµ
aber
nichtnegativ
sein,
da
h
≥
0
ist.
Für
alle
n ≥ 1 erhalten wir
n
n
R
somit hn dµ = 0, also hn = 0 µ-f.ü. gemäß Satz B.1, und dies impliziert schließlich
µ({ f > g}) = limn→∞ µ(Bn ) = 0.
R
R
“⇐” Hier sei
kontrapositorisch
> A g dµR für ein A ∈ A angenommen,
A f dµ
R
R
R
was offenbar A f + dµ > A g+ dµ oder A f − dµ < A g− dµ impliziert. Im ersten
Fall setze Bn := { Rf + > g+ , f + ≤Rn} und folgere mit dem Satz von der monotonen
Konvergenz, dass A∩Bn f + dµ > A∩Bn g+ dµ ≥ 0 für ein hinreichend großes n gelten muss. Dies liefert µ({ f > g}) ≥ µ({ f + > g+ }) ≥ µ(Bn ) > 0. Im zweiten Fall
erhält man auf dieselbe Weise µ({ f > g}) ≥ µ({ f − < g− }) > 0, was in beiden
Fällen µ({ f > g}) > 0 zeigt.
t
u
B.2 Lebesgue- versus Riemann-Integral
Der besonderen Bedeutung des L-Maßes λλ d als Volumenmaß auf (Rd , B(Rd ))
Rechnung tragend, diskutieren wir in diesem Abschnitt kurz das zugehörige Integral und seine Beziehung zum R(iemann)-Integral. Obgleich die anschließenden
Ausführungen auch in höherer Dimension richtig sind, beschränken wir uns der einfacheren Darstellung halber auf den Fall d = 1, der für unsere Belange ausreichend
ist.
R
b
Vereinbarung. Hier wie auch
im ganzen Text bezeichnet
a f (x) dx immer das
R
R
R-Integral von f , während [a,b] f (x) λλ (dx) oder einfach [a,b] f dλλ für das entsprechende L-Integral verwendet wird.
B.2 Lebesgue- versus Riemann-Integral
239
Ein kurzer Blick auf das Riemann-Integral. Gegeben ein kompaktes Intervall
[a, b] ⊂ R, sei Z[a, b] die Menge aller endlichen Zerlegungen z = [z0 , ..., zn ], a =
z0 < z1 < ... < zn = b. Für eine beliebige Funktion f : [a, b] → R wird definiert
n
Obersumme( f , z) :=
∑
sup
∑
inf
j=1 z j−1 ≤x≤z j
n
Untersumme( f , z) :=
z ≤x≤z j
j=1 j−1
f (x) · (z j − z j−1 ),
f (x) · (z j − z j−1 ).
Offensichtlich gilt dann
sup Untersumme( f , z) ≤
z∈Z[a,b]
inf
z∈Z[a,b]
Obersumme( f , z),
und f heißt (eigentlich) R(iemann)-integrierbar, wenn beide Werte übereinstimmen.
Man definiert in diesem Fall den gemeinsamen
Wert als das R(iemann)-Integral von
R
f auf [a, b], symbolisch ausgedrückt durch ab f (x) dx. Aus der Analysis ist bekannt,
dass jede auf [a, b] stetige Funktion R-integrierbar ist. Insbesondere gilt natürlich
Z b
a
1 dx = b − a = λλ ([a, b]) =
Z
[a,b]
1 λλ (dx),
d.h. für Intervalle repräsentiert das R-Integral ebenso wie das L-Integral den geometrischen Längenbegriff. Leider erweist sich jedoch die R-Integrierbarkeit für viele
Funktionen als zu restriktiv, denn es werden bereits sehr einfache messbare Funktionen wie etwa f = 1[0,1]∩Q ausgeschlossen. Für das genannte Beispiel gilt offenkundig
Untersumme( f , z) = 0
und
für alle z ∈ Z[0, 1].
Obersumme( f , z) = 1
Gleichzeitig stellt sich die Frage, welche L-integrierbaren Funktionen auch Rintegrierbar sind, und ob für diese R-Integral und L-Integral immer übereinstimmen.
Im Folgenden wollen wir auch uneigentliche R-Integrale zulassen: Gegeben ein
offenes Intervall (a, b), wobei −∞ ≤ a < b ≤ ∞, heißt f : (a, b) → R uneigentlich
R-integrierbar, falls f auf jedem [α, β ] ⊂ (a, b) eigentlich R-integrierbar ist und
R
der Limes für α ↓ a und β ↑ b in R existiert. Dieser wird wiederum mit ab f (x) dx
bezeichnet und stimmt natürlich mit dem eigentlichen R-Integral überein, wenn f
sogar auf [a, b] im eigentlichen Sinn R-integrierbar ist. Wir erinnern daran, dass
wegen λλ ({x}) = 0 für alle x ∈ R
Z
[a,b]
f dλλ =
Z
(a,b]
f dλλ =
Z
[a,b)
f dλλ =
Z
(a,b)
f dλλ
für jedes auf (a, b) L-integrierbare f gilt.
Die nachfolgenden drei Sätze beinhalten die wesentlichen Informationen über
den Zusammenhang von Lebesgue- und Riemann-Integrierbarkeit.
240
B Ergänzungen zur Integrationstheorie
Satz B.3. Sei I ein Teilintervall von R mit Randpunkten a, b ∈ R (a < b) und f :
I → R eine messbare reelle Funktion. Dann gilt:
(a)
Ist I = [a, b] (a, b ∈ R) kompakt und f eigentlich R-integrierbar auf I, so ist
f auch L-integrierbar auf I, und die Integrale stimmen überein, d.h., es gilt
Z
(b)
f dλλ =
Z
Z b
f dλλ =
I
f (x) dx.
(B.1)
a
Ist f L-integrierbar auf I und auf jedem kompakten Teilintervall eigentlich
R-integrierbar, so ist f auch uneigentlich R-integrierbar auf I, und es gilt
wiederum (B.1).
Beweis. (a) Für jedes n ≥ 1 definiere zn,0 = a und zn,k := a + k(b − a)2−n für
k = 1, ..., 2n . Seien ferner In,1 := [zn,0 , zn,1 ] und In,k := (zn,k−1 , zn,k ] für k = 2, ..., 2n
die resultierende Zerlegung von [a, b] der Feinheit 2−n sowie αn,k , βn,k das Infimum bzw. Supremum von f auf In,k . Schließlich definiere die Treppenfunktionen
n
n
gn (x) := ∑2k=1 αn,k 1In,k (x) und hn (x) := ∑2k=1 βn,k 1In,k (x), die natürlich primitive
Borel-messbare
Funktionen sind und deren R-Integrale gerade die Unter- bzw. OberR
summe von ab f (x) dx zur Zerlegung (In,k )1≤k≤2n bilden und mit ihren jeweiligen LIntegralen übereinstimmen. Weiter gilt offensichtlich gn ↑, hn ↓ und gn ≤ f ≤ hn für
alle n ≥ 1. Setzen wir g := limn→∞ gn und h := limn→∞ hn , so folgt also g ≤ f ≤ h,
und per Kombination der R-Integrierbarkeit von f mit dem Satz von der monotonen
Konvergenz weiter
Z
g dλλ = lim
Z b
n→∞ a
I
R
gn (x) dx =
Z b
f (x) dx = lim
Z b
n→∞ a
a
hn (x) dx =
Z
h dλλ . (B.2)
I
Da somit I (h − g) dλλ = 0 und ferner h − g ≥ 0, liefert Satz B.1(a) f = g = h λλ -f.ü.,
was insbesondere die L-Integrierbarkeit von f sowie (B.1) beweist.
R
R
(b) Nach Teil (a) gilt hier [α,β ] f dλλ = αβ f (x) dx für alle [α, β ] ⊂ I, während
der Satz von der majorisierten Konvergenz (beachte hierfür, dass | f |1[α,β ] ≤ | f |1I )
lim
Z
α↓a, β ↑b [α,β ]
f dλλ =
Z
f dλλ
I
garantiert und folglich die behauptete uneigentliche R-Integrierbarkeit von f auf I
sowie (B.1) impliziert.
t
u
Nur wenig Mühe bereitet nunmehr die folgende exakte Charakterisierung der messbaren eigentlich R-integrierbaren Funktionen.
B.2 Lebesgue- versus Riemann-Integral
241
Satz B.4. Eine messbare reelle Funktion f : [a, b] → R (a, b ∈ R, a < b) ist genau dann eigentlich R-integrierbar, wenn sie beschränkt und außerhalb einer λλ Nullmenge stetig ist.
Beweis. Wir übernehmen die Bezeichnungen aus dem Beweis des vorherigen Satzes. Sei R die abzählbare Menge aller Randpunkte der Zerlegungsintervalle In,k ,
also R = {zn,k : n ≥ 1, k = 1, ..., 2n }, und D( f ) die Menge der Unstetigkeitsstellen
von f .
Ist f auf [a, b] R-integrierbar, so ist sie nach unten und oben durch Treppenfunktionen mit endlichem Integral beschränkt und folglich selbst eine beschränkte
Funktion. Darüber hinaus gilt offenbar B([a, b]) 3 {g < h} ⊂ D( f ) ⊂ R ∪ {g < h} ∈
B([a, b]). Wegen g = f λλ -f.ü. folgt die Stetigkeit von f außerhalb der λλ -Nullmenge
R ∪ {g < h}.
Ist umgekehrt f beschränkt und außerhalb einer λλ -Nullmenge N ⊂ [a, b] stetig,
so folgt λλ ({ f < g}) = 0 aus {g < h} ⊂ D( f ) ⊂ N und damit die R-Integrierbarkeit
von f auf [a, b] vermöge (B.2).
t
u
Satz B.5. Sei I ein Teilintervall von R und f : I → R eine messbare reelle Funktion,
die auf jedem kompakten Teilintervall von I eigentlich R-integrierbar ist. Dann sind
äquivalent:
(1)
(2)
f ist L-integrierbar auf I.
| f | ist uneigentlich R-integrierbar auf I.
Beweis. “(1)⇒(2)” Gemäß Satz 3.41(d) ist die L-Integrierbarkeit von f 1I mit der
von | f | 1I äquivalent. Ferner ist vermöge Satz B.4 auch | f | auf jedem kompakten
Teilintervall von I eigentlich R-integrierbar. Bezeichnen wieder a, b die Randpunkte
von I, so folgt mit (B.1) und dem Satz von der monotonen Konvergenz
lim
Z β
α↓a, β ↑b α
| f (x)| dx =
lim
Z
α↓a, β ↑b [α,β ]
| f | dλλ =
R
Z
I
| f | dλλ ,
(B.3)
also die uneigentliche R-Integrierbarkeit von f auf I, da | f | dλλ < ∞.
“(2)⇒(1)” Liest man (B.3) von rechts nach links, wobei in diesem Fall der Limes
auf der ganz linken Seite nach Voraussetzung endlich ist, so folgt offenbar die LIntegrierbarkeit von | f | und damit von f .
t
u
Beispiele B.6. (a) Die weiter
oben erwähnte Funktion f := 1Q∩[0,1] ist natürlich LR
integrierbar auf [0, 1] mit [0,1] f dλλ = λλ (Q ∩ [0, 1]) = 0. Andererseits ist f auch
nirgends stetig auf [0, 1] und folglich dort nicht R-integrierbar gemäß Satz B.4.
(b) Dagegen erhält man durch folgende Modifikation von f eine auf [0, 1] λλ -f.ü.
p(x)
stetige und folglich R-integrierbare Funktion: Bezeichnet q(x)
für x ∈ Q ∩ [0, 1] die
242
B Ergänzungen zur Integrationstheorie
eindeutige Darstellung von x mit teilerfremden p(x), q(x) ∈ N, und definieren wir
1
dann f (x) := q(x)
für x ∈ Q ∩ [0, 1] sowie weiterhin f (x) := 0 für alle anderen x, so
ist f in allen irrationalen x ∈ [0, 1] stetig.
(c) Die Funktion f (x) = sinx x 1R> (x) mit der stetigen Fortsetzung sin0 0 := 1 bildet
das Standardbeispiel einer uneigentlich R-integrierbaren, aber nicht L-integrierbaren
Funktion. Zum einen gilt nämlich
Z kπ
Z nπ n
2 n 1 n→∞
sin x dx ≥ ∑ 1
|
sin
x|
dx
=
∑ k −→ ∞,
x π k=2
0
k=2 πk (k−1)π
zum anderen folgt per partieller Integration für a > π/2
Z ∞
Z a
Z a
− cos x a
cos x
cos x
sin x
a→∞
dx =
dx
−→
−
dx,
−
2
x
x
x2
π/2
π/2
π/2 x
π/2
wobei der Limes wegen
lich ist.
R ∞ cos x
R∞ 1
2
π/2 x2 dx ≤ π/2 x2 dx = π tatsächlich existiert und end-
B.3 Der Raum L2 (µ): Beweis von Satz 6.21 (Projektions- und
Zerlegungssatz) und der Darstellungssatz von Riesz
Beweis (von Satz 6.21). (a) Für beliebig fixiertes f sei γ := infg∈K k f − gk2 und
(gn )n≥1 eine Folge in K mit k f − gn k2 → γ. Dann liefert die Parallelogrammgleichung für alle m, n ∈ N
2
gm − gn 2
= 1 k f − gn k22 + k f − gm k22 − gm + gn − f 2 2
2
2
2
1
≤
k f − gn k22 + k f − gm k22 − γ 2 ,
2
2
n
n
wobei in der letzten Zeile gm +g
− f 2 ≥ γ 2 wegen gm +g
∈ K benutzt wurde.
2
2
Lässt man m, n gegen ∞ streben, folgt kgm −gn k2 → 0. Also ist (gn )n≥1 eine CauchyFolge in dem abgeschlossenen Teilraum K und konvergiert deshalb gegen ein g ∈ K.
Aus der Stetigkeit der Norm k · k2 ergibt sich schließlich k f − gk2 = limn→∞ k f −
gn k2 = γ. Bezeichnet h ∈ K ein weiteres Element mit k f − hk2 = γ, so liefert eine
nochmalige Anwendung der Parallelogrammgleichung (ersetze oben einfach gm , gn
durch g, h)
g − h 2
1
2
2
2
2 ≤ 2 k f − gk2 + k f − hk2 − γ = 0
2
und somit g = h.
B.3 Der Raum L2 (µ): Beweis von Satz 6.21 (Projektions- und Zerlegungssatz) und der Darstellungssatz von Riesz
243
(b) Sei f ∈ L2 (µ) beliebig. Da g durch h f − g, hi = 0 für alle h ∈ K eindeutig bestimmt ist, wie man leicht sieht, genügt es h f − PK ( f ), hi = 0 für alle h ∈ K
nachzuweisen. Es gilt aber für alle 0 6= h ∈ K und λ > 0 unter Beachtung der definierenden Eigenschaft von PK ( f )
0 < k f − PK ( f ) ± λ hk22 − k f − PK ( f )k2 = λ 2 khk22 ± 2λ h f − PK ( f ), hi,
was 2|h f − PK ( f ), hi| = infλ >0 λ khk22 = 0 impliziert.
(c) Die Linearität von PK folgt direkt aus (b), und da trivialerweise PK ( f ) = f
f ür f ∈ K gilt, folgt auch PK = PK2 .
(d) Aus (b) folgt I − PK ( f ) ∈ K ⊥ . Da außerdem
h f − ( f − PK ( f )), hi = hPK ( f ), hi = 0
für alle h ∈ K ⊥ ,
liefert wiederum (b), dass f − PK ( f ) = PK ⊥ ( f ) und somit f = PK ( f ) + PK ⊥ ( f ) gilt.
Diese Zerlegung von f ist eindeutig, denn aus f = g + h für g ∈ K und h ∈ K ⊥ ergibt
sich offenkundig PK ( f ) − g = h − PK ⊥ ( f ) ∈ K ∩ K ⊥ = {0}. Die letzte Behauptung
des Satzes erhält man nun durch einfaches Nachrechnen.
t
u
Mit Hilfe des Projektions- und Zerlegungssatzes 6.21 kann man nun ein wichtiges Ergebnis zeigen, welches im nächsten Abschnitt im Beweis des Satzes von
Radon-Nikodym benötigt wird. Dabei geht es um die Charakterisierung der reellen
stetigen Linearformen auf L2 (µ), d.h. der stetigen linearen Abbildungen von L2 (µ)
nach R, deren Gesamtheit den (topologischen)
Dualraum L2 (µ)0 ergibt. OffensichtR
lich ist jedes Φg , definiert durch Φg ( f ) := f g dµ für ein festes g ∈ L2 (µ), eine
solche Abbildung, denn vermöge der Cauchy-Schwarz-Ungleichung gilt
|Φg ( f )| = k f gk1 ≤ k f k2 kgk2
für alle f ∈ L2 (µ),
also
kΦg k :=
sup |Φg ( f )| = kgk2 .
k f k2 =1
Das angekündigte Ergebnis besagt, dass bereits jede reelle stetige Linearform von
dieser Gestalt ist und folglich mit einem g ∈ L2 (µ) identifiziert werden kann. Dies
bedeutet, dass L2 (µ)0 und L2 (µ) vermöge der Zuordnung Φg 7→ g isometrisch isomorph sind. Zum Beweis verweisen wir erneut auf Abschnitt ?? des Anhangs.
Satz B.7. (Darstellungssatz von Riesz) Zu jeder stetigen Linearform Φ : L2 (µ) →
R existiert eine eindeutig bestimmte Funktion g ∈ L2 (µ) derart, dass Φ( f ) = h f , gi
für alle f ∈ L2 (µ).
Beweis. Falls Φ( f ) = 0 für alle f ∈ L2 (µ), wähle g = 0. Andernfalls ist der Kern
von Φ, d.h. K := { f : Φ( f ) = 0} ein echter abgeschlossener Teilraum von L2 (µ),
244
B Ergänzungen zur Integrationstheorie
und es existiert ein eindeutig bestimmtes g∗ ∈ L⊥ mit Φ(g∗ ) = 1. Während die Existenz klar ist, notieren wir hinsichtlich der Eindeutigkeit, dass aus Φ(g∗ ) = Φ(h) =
1 zunächst g∗ − h ∈ K, dann weiter
kg∗ − hk22 = hg∗ − h, g∗ − hi = hg∗ , g∗ − hi − hh, g∗ − hi = 0
und schließlich g∗ = h folgt. Insbesondere gilt Φ(h)−1 h = g∗ für jedes h ∈ K ⊥ .
Gegeben ein beliebiges f ∈ L2 (µ) mit orthogonaler Zerlegung f = f1 + f2 , f1 ∈ K
⊥
und f2 ∈ K ⊥ , ergibt sich nun nach Definition von g := kg∗ k−2
2 ∈K
h f , gi = h f2 , gi =
Φ( f2 ) ∗ ∗
hg , g i = Φ( f2 ) = Φ( f ),
kg∗ k22
also die Existenzaussage des Satzes. Da ferner h f , gi = h f , hi für alle f ∈ L2 (µ)
gleichbedeutend ist mit h f , g − hi = 0 für alle f ∈ L2 (µ), folgt bei Wahl von f =
g − h offenbar g = h.
t
u
B.4 Maße mit Dichten: Beweise der Sätze 6.28–6.30
Beweis (des Satzes 6.28 von Radon-Nikodym). Wie schon bemerkt, folgt die Aussage “(a)⇒(b)” direkt aus Anm. 3.43. Wir wenden uns deshalb gleich dem Beweis der
Umkehrung “(b)⇒(a)” zu. Da zudem nach Voraussetzung Mengen Ωn ∈ A (n ≥ 1)
existieren mit Ωn ↑ Ω und µ(Ωn ) + ν(Ωn ) < ∞ für alle n ≥ 1, dürfen wir o.B.d.A.
µ und ν als endlich voraussetzen. Wir setzen ρ := µ + ν.
Das folgende Argument unter Benutzung des Darstellungssatzes B.7 von Riesz
für L2 (ρ) geht auf J OHN VON N EUMANN zurück. Es gilt trivialerweise ν ρ.
Außerdem ist die kanonische Einbettung von L2 (ρ) in L2 (ν) wegen
R
R
k f k2,ν = ( f 2 dν)1/2 ≤ ( f 2 dρ)1/2 = k f k2,ρ
stetig. Dies impliziert L2 (ν)0 ⊂ L2 (ρ)0 , denn für Φ ∈ L2 (ν)0 gilt
kΦkρ =
sup
f ∈L2 (ρ)
|Φ( f )|
≤
k f k2,ρ
Nun ist aber
Φν ( f ) :=
Z
f dν
sup
f ∈L2 (ν)
|Φ( f )|
= kΦkν .
k f k2,ν
( f ∈ L2 (ν))
wegen der aus der Hölder-Ungleichung folgenden Abschätzung
|Φν ( f )| ≤ k f k2,ν ν(Ω )1/2
ein stetiges lineares Funktional auf L2 (ν) und somit auch auf L2 (ρ). Der Darstellungssatz von Riesz impliziert deshalb die Existenz einer reellen Funktion g ∈ L2 (ρ)
B.4 Maße mit Dichten: Beweise der Sätze 6.28–6.30
derart, dass für alle f ∈ L2 (ρ)
Z
Z
f dν =
oder nach Umstellung
Z
f g dρ =
Z
f (1 − g) dν =
245
f g dµ +
Z
Z
f g dν.
f g dµ.
(B.4)
Wegen ρ(Ω ) < ∞ sind insbesondere alle Indikatorfunktionen in L2 (ρ), so dass mit
f = 1A
Z
Z
A
(1 − g) dν =
für alle A ∈ A
g dµ
A
(B.5)
folgt. Wählt man speziell A = {g < 0}, so ergibt sich weiter
0 ≤
Z
{g<0}
(1 − g) dν =
Z
{g<0}
g dµ ≤ 0
und so ρ({g < 0}) = 0 vermöge Satz B.1, da die Integranden beider Integrale betragsmäßig positiv sind auf {g < 0}. Ein analoges Argument zeigt ρ({g > 1}) = 0,
so dass insgesamt 0 ≤ g ≤ 1 ρ-f.ü. und weiter (1 − g)ν = gµ per (B.5) folgt. Insbesondere gilt (B.4) nun für alle f ∈ L1 ((1 − g)ν) = L1 (gµ). Wählen wir schließlich
A = {g = 1} in (B.5), so ergibt sich
0 =
Z
{g=1}
(1 − g) dν =
Z
g dµ,
{g=1}
(B.6)
und folglich, wiederum mit Satz B.1, µ({g = 1}) = 0. An dieser Stelle benutzen
wir nun die Voraussetzung ν µ, die uns ν({g = 1} = 0 und so ρ({g = 1}) = 0
beschert, was insgesamt 0 ≤ g < 1 ρ-f.ü. beweist. Die Funktion 1/(1−g) ist folglich
ρ-f.ü. reellwertig und außerdem trivialerweise integrierbar bezüglich (1−g)ν = gµ.
Dasselbe gilt offenbar für jedes f = 1A /(1 − g) (A ∈ A), so dass (B.4) für solche f
schließlich
Z
g
dµ für alle A ∈ A
ν(A) =
A 1−g
liefert. Die Funktion h := g/(1 − g) ist demnach die gesuchte µ-Dichte von ν.
t
u
Beweis (der Lebesgue-Zerlegung (Satz 6.29)). Folgen wir dem obigen Beweis bis
(B.6) und definieren
ν c (A) := ν(A ∩ {0 ≤ g < 1}) und
ν s (A) := ν(A ∩ {g = 1}) (A ∈ A),
so leisten diese beiden Maße das Verlangte, wie man leicht einsieht.
t
u
Beweis (von Satz 6.30). “⇒” Nach dem Satz von Radon-Nikodym ist µ = gν für
ein g ∈ L0+ (Ω , A). Es folgt deshalb unter Verwendung von Satz 6.24
µ(A) =
Z
A
g dν =
Z
A
g f dµ
für alle A ∈ A,
246
B Ergänzungen zur Integrationstheorie
also µ = (g f )µ, was g f = 1 µ-f.ü. gemäß Satz 6.23 und dann µ({0 < f < ∞}c ) = 0
sowie g = 1/ f µ-f.ü. impliziert.
“⇐” Gegeben ν = f µ und
µ({0 < f < ∞}c ) = 0, folgern wir für jede µ-positive
R
Menge A ∈ A, dass ν(A) = A f dµ ≥ ε µ(A ∩ { f > ε} > 0 für hinreichend kleines
ε > 0 gilt. Es folgt µ ν und insgesamt die Äquivalenz von µ und ν.
t
u
B.5 Verfeinerte Zerlegung von Borel-Maßen auf R
Mittels der Lebesgue-Zerlegung lässt sich der Zerlegungssatz A.8 für Borel-Maße
auf R noch verfeinern. Erinnern wir uns: Jedes Borel-Maß µ = µF , F die assoziierte
maßerzeugende Funktion, lässt sich auf eindeutige Weise in einen diskreten Anteil
µ d = µF d und einen stetigen Anteil µ c = µF c zerlegen, wobei µ d als Träger die
Menge D(F) der Sprungstellen von F besitzt, die als abzählbare Menge natürlich
eine λλ -Nullmenge bildet. Damit folgt µ d ⊥ λλ . Wollen wir also µ hinsichtlich seines
L-stetigen Anteils weiter zerlegen, reicht es, dies für µ c zu tun. Der folgende Zerlegungssatz bildet eine direkte Konsequenz der Lebesgue-Zerlegung von µ c bezüglich
λλ und Satz A.8.
Satz B.8. Jedes Borel-Maß µ besitzt eine eindeutige Zerlegung
µ = µ d + µ s + µ ac
in ein diskretes Borel-Maß µ d , ein λλ -singuläres, stetiges Borel-Maß µ s und ein
L-stetiges Borel-Maß µ ac .
Abschließend geben wir ein Beispiel für ein stetiges, aber λλ -singuläres Borel-Maß.
Ein solches Maß konzentriert seine Masse per definitionem auf eine λλ -Nullmenge,
die notwendig überabzählbar ist, weil das Maß andernfalls diskret wäre. Unser Beispiel gibt demnach zugleich eine positive Antwort auf die Frage nach der Existenz
überabzählbarer λλ -Nullmengen.
Beispiel B.9. [Cantorsche Ternärmenge und Cantor-Verteilung] Wir betrachten den W-Raum ([0, 1], B([0, 1]), λλ ). Die Cantorsche Ternärmenge C, hier kurz
Cantor-Menge genannt, wird wie folgt durch sukzessives Ausdünnen konstruiert:
Entferne aus C0 := [0, 1] im ersten Schritt das mittlere Drittel, d.h. das offene Intervall ( 31 , 23 ), und behalte
C1 := C0 \( 31 , 23 ) = 0, 31 + 23 , 1 .
Wende im nächsten Schritt dasselbe Verfahren auf die beiden Teilintervalle von C1
an. Dies liefert
C2 := 0, 19 + 29 , 13 + 32 , 59 + 89 , 1
B.5 Verfeinerte Zerlegung von Borel-Maßen auf R
247
als verbleibende Menge. So fortfahrend erhält man nach n Schritten als verbleibende
Menge
2n x
n,k xn,k + 1
,
,
(B.7)
Cn = ∑
n
3n
k=1 3
wobei die Menge Dn := {xn,k : 1 ≤ k ≤ 2n }, 0 = xn,1 < ... < xn,2n = 1, aus den
Elementen
n
yk
y = ∑ k mit yk ∈ {0, 2}
3
k=1
besteht, also denjenigen Elementen des Einheitsintervalls, die eine Ternärdarstellung y = 0, y1 y2 ...yn der Länge n ohne die Ziffer 1 besitzen. Dann gilt offenbar Cn ↓,
Dn ↑ und Dn ⊂ Cm für alle m, n ≥ 1. Wir definieren schließlich
C := lim Cn =
n→∞
\
Cn
und
D := lim Dn =
n→∞
n≥1
[
Dn .
n≥1
Als Durchschnitt kompakter Mengen ist C selbst kompakt und wegen D ⊂ C nicht
leer. Sie wird als Cantorsche Ternärmenge bezeichnet. Der topologische Abschluß
D von D besteht offenbar aus allen y, die eine unendliche Ternärdarstellung ohne
die Ziffer 1 besitzen, d.h.
)
(
yk
(B.8)
D = ∑ k : yk ∈ {0, 2} für alle k ≥ 1 .
k≥1 3
Beachte, dass dies alle y ∈ [0, 1] mit einer endlichen Ternärdarstellung der Form
0, y1 ...yn 1 einschließt, da diese auch die alternative Ternärdarstellung 0, y1 ...yn 222...
besitzen. Z.B. gilt 13 = 0, 1 = 0, 222.... Andererseits besteht die Gesamtheit aller
entfernten Intervalle gerade aus allen anderen y ∈ [0, 1], in deren Ternärdarstellung
0, y1 y2 ... mindestens ein yk den Wert 1 hat. Dies zeigt insgesamt
C = D,
und wir folgern die Überabzählbarkeit von C aus der Tatsache, dass die Abbildung
Φ : C → [0, 1],
yk
∑ 3k
k≥1
7→
yk /2
k
k≥1 2
∑
offensichtlich bijektiv ist. Unter Hinweis auf (B.7) erhalten wir λλ (Cn ) = (2/3)n für
alle n ≥ 1 und deshalb
λλ (C) = 0.
(B.9)
Wir werden nun wie angekündigt auf [0, 1] eine W-Verteilung P konstruieren
derart, dass P(C) = 1 und somit P ⊥ λλ gilt. Für n ≥ 0 sei Fn die VFkt. des stetigen
W-Maßes λλ (Cn )−1 λλ (· ∩Cn ), genannt Gleichverteilung auf Cn , d.h.
248
B Ergänzungen zur Integrationstheorie
Fn (x) :=
λλ ((−∞, x] ∩Cn )
λλ (Cn )
(x ∈ R).
Unter Hinweis auf (B.7) sieht man, dass für n ≥ 1

0,
falls x ≤ 0,



k 2−n , falls (x + 1)3−n ≤ x ≤ x
−n (k = 1, ..., 2n − 1),
n,k
n,k+1 3
Fn (x) :=

linear, falls xn,k 3−n < x < (xn,k + 1)3−n (k = 1, ..., 2n ),



1,
falls x ≥ 1,
wobei die linearen Fortsetzungen auf den Intervallen (xn,k 3−n , (xn,k + 1)3−n ) durch
die Stetigkeit von Fn eindeutig sind. Abb. B.1 zeigt exemplarisch den Graphen von
Fn für n = 3 und n = 6.
1.0
1.0
0.8
0.8
0.6
0.6
0.4
0.4
0.2
0.2
0.2
0.4
0.6
0.8
1.0
x
0.2
0.4
0.6
0.8
1.0
x
Abb. B.1 Die Funktionen F3 (links) und F6 (rechts).
Wie man dann leicht auch ohne formalen Beweis erkennt, gilt
sup |Fn (x) − Fn−1 (x)| = sup |Fn (x) − Fn−1 (x)| ≤
x∈R
x∈[0,1]
1
2n
für alle n ≥ 1.
Die Reihe ∑n≥1 (Fn (x) − Fn−1 (x)) ist also für alle x ∈ [0, 1] absolut und gleichmäßig
konvergent, die Funktion
n
∑ (Fk (x) − Fk−1 (x))
n→∞
F(x) := lim Fn (x) = F0 (x) + lim
n→∞
k=1
(x ∈ R)
folglich eine monoton wachsende und wiederum stetige Funktion mit F(x) = 0 für
x ≤ 0 und F(x) = 1 für x ≥ 1. Außerdem existiert für jedes x ∈ Cc eine offene
Umgebung (x − ε, x + ε) ⊂ Cc , auf der F konstant ist, was F 0 (x) = 0 für alle x ∈ Cc ,
also F 0 = 0 λλ -f.ü. impliziert. Die Funktion F heißt Cantor-Funktion, das zugehörige
stetige Borel-Maß µF auf [0, 1] Cantor-Verteilung. Wie gerade festgestellt, gilt
µF ((a, b]) = F(b) − F(a) = 0
für alle (a, b] ⊂ Cc
und folglich µF (Cc ) = 0. Damit ist gezeigt, dass µF nur Masse auf der λλ -Nullmenge
C besitzt und deshalb λλ -singulär ist.
B.6 Differentiation L-stetiger Borel-Maße und absolut stetige Funktionen
249
B.6 Differentiation L-stetiger Borel-Maße und absolut stetige
Funktionen
Betrachten wir zur Einstimmung ein L-stetiges Borel-Maß µ auf Rd (d ≥ 1) mit
stetiger L-Dichte f . Für r > 0 und x ∈ Rd bezeichne B(x, r) := {y ∈ Rd : |x−y| < r}
die offene Kugel um x mit Radius r und B(x, r) deren topologischen Abschluß. Dann
gilt offensichtlich die Mittelwerteigenschaft
lim
r→0
1
d
λλ (B(x, r))
Z
B(x,r)
| f − f (x)| dλλ d = 0
(B.10)
sowie a fortiori
lim
r→0
1
µ(B(x, r))
= lim d
r→0 λ
λλ d (B(x, r))
λ (B(x, r))
Z
f dλλ d = f (x)
(B.11)
B(x,r)
für alle x ∈ Rd . Für allgemeines f ∈ L1 (λλ d ) ist dagegen nicht klar, ob (B.10)
überhaupt für gewisse x, genannt Lebesgue-Punkte von f , erfüllt ist. Aus diesem
Grund darf man Satz B.13 weiter unten als erstaunliches Ergebnis ansehen. Er besagt nämlich, dass für eine L1 -Funktion λλ d -fast alle x Lebesgue-Punkte sind. Um
dies zu beweisen, sind allerdings einige Vorbereitungen notwendig, wobei wir uns
an [35, Kap. 7] orientiert haben. Wir beginnen mit einem einfachen Lemma.
S
Lemma B.10. Sei B = nk=1 B(xk , rk ) eine endliche Vereinigung von offenen Kugeln. Dann existiert eine Teilmenge I ⊂ {1, ..., n} derart, dass gilt:
(a)
(b)
(c)
Die Kugeln
B(xi , ri ), i ∈ I, sind p.d.
S
B ⊂ i∈I B(xi , 3ri ).
λλ d (B) ≤ 3d ∑i∈I λλ d (B(xi , ri )).
Beweis. O.B.d.A. gelte r1 ≥ r2 ≥ ... ≥ rn . Definiere i1 := 1 und dann i2 als den
kleinsten Index ∈ {2, ..., n} derart, dass B(xi2 , ri2 ) und B(x1 , r1 ) disjunkt sind, sofern
ein solcher existiert. Als nächstes wähle i3 als den kleinsten Index ∈ {i2 + 1, ..., n}
derart, dass B(xi3 , ri3 ) weder B(xi2 , ri2 ) noch B(xi1 , ri1 ) schneidet, sofern ein solcher
Index existiert. So fortfahrend erhält man eine Menge I = {i1 , ..., ik } ⊂ {1, ..., n}, so
dass offensichtlich (a) erfüllt ist. Die Gültigkeit von (b) ergibt sich aus der Tatsache,
dass aus s ≤ r und B(y, s) ∩ B(x, r) 6= 0/ die Inklusion B(y, s) ⊂ B(x, 3r) folgt, und
für (c) genügt der Hinweis, dass
λλ d (B(x, 3r)) = λλ d (3 B(0, r)) = 3d λλ d (B(0, r)) = 3d λλ d (B(x, r))
für alle x ∈ Rd gilt [+ Satz 2.17].
t
u
Für ein beliebiges Borel-Maß µ auf Rd definieren wir als nächstes dessen Maximalfunktion Mµ : Rd → [0, ∞] durch
250
B Ergänzungen zur Integrationstheorie
(Mµ)(x) := sup
r>0
µ(B(x, r))
µ(B(x, r))
= sup d
d
λλ (B(x, r))
λ (B(0, r))
r>0 λ
(x ∈ Rd ).
Diese Funktion ist unterhalbstetig, d.h. lim infy→x (Mµ)(y) ≥ (Mµ)(x) für alle x ∈
Rd , denn
µ(B(x, r))
µ(B(x, r))
inf sup d
≥ sup inf
λ (B(0, r))
λ d (B(0, r))
y∈B(x,ε) r>0 λ
r>0 y∈B(x,ε) λ
für alle ε > 0. Wie man leicht sieht, ist eine unterhalbstetige Funktion f dadurch
charakterisiert, dass { f > t} für alle t ∈ R offen ist, was vermöge Satz 6.1 ihre
Borel-Messbarkeit garantiert. Wir folgern also die Borel-Messbarkeit von Mµ, und
die Menge {Mµ > t} ist offen für jedes t ∈ R.
Lemma B.11. Für jedes Borel-Maß µ auf Rd und jedes t > 0 gilt die Ungleichung
λλ d ({Mµ > t}) ≤ 3d t −1 µ(Rd ).
Beweis. Wir dürfen natürlich gleich µ als endlich voraussetzen, weil sonst nichts
zu zeigen ist. Aufgrund der Unterhalbstetigkeit von Mµ gilt (Mµ)(x) ≥ t auf dem
Abschluß von {Mµ > t}, den wir mit Bt bezeichnen. Für beliebiges N ≥ 1 ist dann
die Menge Bt,N := Bt ∩ B(0, N) abgeschlossen und beschränkt, also kompakt. Aus
diesem Grund finden wir eine endliche Überdeckung {B(xk , rk ) : 1 ≤ k ≤ n} von
Bt,N durch Kugeln mit Zentren xk in Bt,N und Radien rk > 0 derart, dass
λλ d (B(xk , rk )) ≥ t −1 µ(B(xk , rk )) für k = 1, ..., n.
Gemäß Lemma B.10 existiert dann eine Teilfamilie {B(xi , ri ) : i ∈ I} p.d. Kugeln
S
derart, dass i∈I B(xi , ri ) ⊂ Bt,N sowie
λλ d (Bt,N ) ≤ 3d ∑ λλ d (B(xi , ri )) ≤ 3d t −1 ∑ µ(B(xi , ri )) ≤ 3d t −1 µ(Rd )
i∈I
i∈I
gilt. Lässt man nun N gegen ∞ streben und beachtet Bt,N ↑ Bt ⊃ {Mµ > t}, so folgt
die Behauptung.
t
u
Schließlich benötigen wir noch das folgende, auch für sich interessante Ergebnis.
Satz B.12. Für jedes 0 < p < ∞ liegt die Menge C (Rd ) der reellen stetigen Funktionen auf Rd dicht in (L p (λλ d ), k · k p ), d.h., zu jedem f ∈ L p (λλ d ) und jedem ε > 0
existiert ein p-fach L-integrierbares g ∈ C (Rd ) mit k f − gk p < ε.
Beweis. Da nach Korollar 6.19 die primitiven Funktionen eine dichte Teilmenge
von L p (λλ d ) bzgl. k · k p bilden, reicht es zu zeigen, dass sich jede primitive Funktion
bzgl. k · k p durch stetige Funktionen approximieren lässt.
B.6 Differentiation L-stetiger Borel-Maße und absolut stetige Funktionen
251
Sei zuerst g = 1I für ein beliebiges beschränktes Intervall I ⊂ Rd mit Abschluß
I. Definiere gI,n ∈ C (Rd ) durch
gI,n (x) := e−nρ(x,I) ,
wobei ρ(x, I) := min |y − x|.
y∈I
Dann folgt kg − gI,n k p → 0 mit dem Satz von der majorisierten Konvergenz.
Als nächstes sei g = 1F für eine d-dimensionale dyadische Figur F ∈ F d , also
für die p.d. Vereinigung von dyadischen Würfeln I1 , ..., Im ⊂ Rd [+ Bsp. 2.5]. Dann
m
d
gilt 1F = ∑m
k=1 1Ik , ∑k=1 gIk ,n ∈ C (R ) und unter Benutzung des zuvor Gezeigten
m
m
lim g − ∑ gIk ,n ≤ lim ∑ k1Ik − gIk ,n k p = 0.
n→∞
n→∞ k=1
k=1
p
Sei schließlich g = 1B für ein beliebiges B ∈ B(Rd ). Da F d eine Algebra bildet,
die B(Rd ) erzeugt, gibt es nach dem Approximationssatz 2.12 zu jedem n ≥ 1 ein
Fn ∈ F d derart, dass λλ d (B4Fn ) ≤ 1/n, was wegen 1B4Fn = |1B − 1Fn | offenkundig
k1B − 1An k p → 0 impliziert. Damit ist klar, dass sich jede Indikatorfunktion 1B und
folglich auch jede primitive Funktion bzgl. k · k p durch stetige Funktionen approximieren lässt.
t
u
Wir sind nun in der Lage, den angekündigten Beweis über die Existenz von
Lebesgue-Punkten einer L1 -Funktion zu zeigen.
Satz B.13. Für f ∈ L1 (λλ d ) (d ≥ 1) sind λλ d -fast alle x ∈ Rd Lebesgue-Punkte.
Beweis. Für r > 0 und x ∈ Rd definieren wir
(Dr f )(x) :=
1
λλ d (B(0, r))
Z
B(x,r)
| f − f (x)| dλλ d
und weiter
(D f )(x) := lim sup (Dr f )(x),
r→0
so dass D f = 0 λλ d -f.ü. zu zeigen ist. Sei außerdem
(M f )(x) :=
1
λλ d (B(0, r))
Z
B(x,r)
| f | dλλ d
die Maximalfunktion von f , die offensichtlich der zuvor eingeführten Maximalfunktion des endlichen Borel-Maßes | f |λλ d mit Gesamtmase k f k1 entspricht und somit
gemäß Lemma B.11 der Ungleichung
λλ d ({M f > t}) ≤ 3d t −1 k f k1
für alle t > 0
(B.12)
252
B Ergänzungen zur Integrationstheorie
genügt.
Dank des vorherigen Satzes existiert zu jedem n ≥ 1 eine stetige Funktion gn ∈
C (Rd ) derart, dass k f − gn k1 ≤ 1/n. Wir setzen hn := f − gn und notieren Dgn = 0
wegen der Stetigkeit von gn [+ (B.10)]. Vermöge der einfachen Abschätzung
1
(Dr hn )(x) ≤ d
λλ (B(0, r))
Z
B(x,r)
|hn | dλλ d + |hn (x)|
erhalten wir Dhn ≤ Mhn + |hn |. Da außerdem D f ≤ Dgn + Dhn = Dhn gilt, erhalten
wir die entscheidende Ungleichung
D f ≤ Mhn + |hn |
für alle n ≥ 1. Nun folgt nämlich weiter
λλ d ({|hn | > t}) ≤
1
t
Z
{|hn |>t}
|hn | dλλ d ≤
1
1
khn k1 ≤
,
t
tn
was in Kombination mit (B.12) für hn die für alle t > 0 und n ≥ 1 gültige Abschätzung
λλ d ({D f > 2t}) ≤ λλ d ({Mhn > t}) + λλ d ({|hn | > t}) ≤
3d + 1
n
liefert, also D f = 0 λλ d -f.ü.
t
u
Ein Blick auf (B.11) legt nahe, den dortigen Limes als Ableitung von µ bzgl. λλ d
im Punkt x aufzufassen, die nach dem gerade bewiesenen Satz λλ d -f.ü. existiert. Dies
erklärt, warum die L-Dichte f häufig auch als Radon-Nikodym-Ableitung bezeichnet
wird. Wegen seiner Bedeutung halten wir diese Feststellung in einem Korollar fest.
Korollar B.14. Ist µ ein L-stetiges Borel-Maß auf Rd mit L-Dichte f , so existiert
(Dµ)(x) := lim
r→0
µ(B(x, r))
λλ d (B(x, r))
für λλ d -fast alle x ∈ Rd , und es gilt f = Dµ λλ d -f.ü.
Als weiteres Korollar notieren wir, dass der Limes in (B.10) weiterhin existiert,
wenn man dort die Kugeln B(x, r) durch Teilmengen ersetzt, die Volumina gleicher
Größenordnung besitzen. Wie in [35] nennen wir eine Mengenfolge (Bn )n≥1 regulär
fallend gegen x ∈ Rd , wenn es ein α > 0 und gegen 0 fallende Radien rn (n ≥ 1)
gibt derart, dass Bn ⊂ B(x, rn ) und λλ d (Bn ) ≥ αλλ d (B(x, rn )) für alle n ≥ 1 gilt.
B.6 Differentiation L-stetiger Borel-Maße und absolut stetige Funktionen
253
Korollar B.15. Sei f ∈ L1 (λλ d ). Dann gilt in jedem Lebesgue-Punkt x von f und
für jede gegen x fallende Mengenfolge (Bn )n≥1
1
lim d
n→∞ λ
λ (Bn )
Z
| f − f (x)| dλλ d = 0
Bn
sowie a fortiori
1
n→∞ λ
λ d (Bn )
lim
Z
f dλλ d = f (x).
Bn
Beweis. Mit α > 0 und rn wie oben beschrieben ergibt sich die Behauptung aus der
Abschätzung
α
λλ d (Bn )
Z
Bn
| f − f (x)| dλλ d ≤
1
λλ d (B(x, rn ))
Z
B(x,rn )
| f − f (x)| dλλ d ,
da die rechte Seite für n → ∞ gegen 0 konvergiert.
t
u
L-stetige Borel-Maße auf R und absolute Stetigkeit. Wir wenden uns nun
wieder dem eindimensionalen Fall (d = 1) zu, und zwar der noch offenen Frage,
wie sich die maßerzeugende Funktion eines L-stetigen Borel-Maßes charakterisieren lässt. Mittels der zuvor erzielten Resultate können wir eine erste Teilantwort
geben.
Satz B.16. Ein Borel-Maß µ auf R mit maßerzeugender Funktion F ist genau dann
L-stetig, wenn F λλ -f.ü. differenzierbar ist und mit F 0 = f
F(b) − F(a) =
Z
(a,b)
f (x) λλ (dx) für alle − ∞ ≤ a < b ≤ ∞
(B.13)
gilt.
Beweis. Zu zeigen sind offenbar nur die Aussagen bzgl. F, falls µ L-stetig ist. Sei
f die L-Dichte von µ und L f die Menge der Lebesgue-Punkte von f . Es reicht zu
zeigen, dass F in jedem x ∈ L f differenzierbar ist mit F 0 (x) = f (x). Für x ∈ L f gilt
aber
lim
r↓0
F(x + r) − F(x)
F(x) − F(x − r)
F(x + r) − F(x − r)
= lim
= lim
= f (x)
r↓0
r↓0
r
r
2r
gemäß Korollar B.15, denn hier ist B(x, r) = (x − r, x + r), und die Mengenfolgen
((x − rn , x))n≥1 und ((x, x + rn ))n≥1 sind für jede Wahl von rn ↓ 0 regulär fallend
gegen x.
t
u
254
B Ergänzungen zur Integrationstheorie
Da auch jede λλ -singuläre Verteilung eine λλ -f.ü. differenzierbare maßerzeugende
Funktion besitzt, besteht der entscheidende Zusatz in Satz B.16 gerade in der Gültigkeit von (B.13), also der Gültigkeit des Hauptsatzes der Differential- und Integralrechnung für die dortige Funktion F. Die damit noch zu beantwortende Frage lautet,
für welche F dies der Fall ist. Die Antwort hierauf führt uns zum Begriff der absoluten Stetigkeit, der als nächstes definiert wird.
Definition B.17. Seien a, b ∈ R mit a < b. Eine Funktion F : [a, b] → R heißt absolut stetig (auf [a, b]), wenn es zu jedem ε > 0 ein δ > 0 gibt, so dass
n
∑ |F(yk ) − F(xk )|
< ε
k=1
für jede Auswahl p.d. Intervalle (xk , yk ) ⊂ [a, b] (1 ≤ k ≤ n) gilt, die der Bedingung
∑nk=1 (yk − xk ) < δ genügen. In diesem Fall heißt
n
Va F(x) :=
sup
∑ |F(zk ) − F(zk−1 )|
[z0 ,...,zn ]∈Z[a,x] k=1
(x ∈ [a, b])
die Totalvariation von F auf [a, b]
Anmerkung B.18. (a) Wählt man n = 1 in der obigen Definition, folgt sofort, dass
jede absolut stetige Funktion insbesondere stetig im gewöhnlichen Sinne ist.
(b) Aus der Definition der Totalvariation ergibt sich leicht die Gleichung
n−1
Va F(x) =
∑ Vzk F(zk+1 − zk )
k=0
für alle [z0 , ..., zn ] ∈ Z[a, x].
(B.14)
Fixiert man dann ε = 1 und dazu δ > 0 gemäß der obigen Definition, so folgt offenbar Vzk F(zk+1 − zk ) < 1, sofern z ∈ Z[a, x] der Bedingung max0≤k<n (zk+1 − zk ) < δ
genügt (was offenbar n ≥ (x − a)/δ erzwingt) und folglich mit (B.14) die Endlichkeit von Va F auf ganz [a, b].
(c) Ist F monoton wachsend, so gilt offensichtlich Va F = F − F(a).
Mithilfe der Totalvariation können wir eine absolut stetige Funktion als Differenz
zweier monoton wachsender absolut stetiger Funktionen schreiben, wie das folgende Lemma zeigt. Da letztere zugleich maßerzeugende Funktionen bilden, können
wir im Anschluß zum Teil auf Satz B.16 zurückgreifen.
Lemma B.19. Sei F : [a, b] → R eine absolut stetige Funktion (a, b ∈ R). Dann gilt:
B.6 Differentiation L-stetiger Borel-Maße und absolut stetige Funktionen
(a)
(b)
255
Die Funktionen Va F, Va F + F und Va − F sind monoton wachsend und ebenfalls absolut stetig auf [a, b].
Es existieren monoton wachsende, absolut stetige Funktionen auf [a, b] derart, dass F = F1 − F2 .
Beweis. (a) Seien x, y ∈ [a, b] mit x < y beliebig gewählt. Wegen [z0 , ..., zn , y] ∈
Z[a, y], falls [z0 , ..., zn ] ∈ Z[a, x], folgt
Va F(y) ≥ Va F(x) + |F(y) − F(x)|
und daraus weiter
Va F(y) ≥ Va F(x) + F(y) − F(x) und Va F(y) ≥ Va F(x) + F(x) − F(y).
Dies zeigt die Monotonie der drei angegebenen Funktionen. Da Summen absolut
stetiger Funktionen offenkundig wieder absolut stetig sind, müssen wir nur noch
die absolute Stetigkeit von Va F nachweisen. Fixiere dazu ein beliebiges ε > 0 und
wähle dazu δ > 0 gemäß Definition B.17 für die absolut stetige Funktion F. Aus
(B.14) folgt für alle x, y ∈ [a, b] mit x < y
n
0 ≤ Va F(y) −Va F(x) = Vx (y − x) =
sup
∑ | f (zk ) − f (zk−1 )|,
[z0 ,...,zn ]∈Z[x,y] k=1
wobei ∑nk=1 (zk − zk−1 ) = y − x für jede Zerlegung von [z0 , ..., zn ] ∈ Z[x, y] gilt. Folglich ergibt sich für jede Auswahl p.d. (xk , yk ) ⊂ [a, b] (1 ≤ k ≤ m) mit ∑m
k=1 (yk −
xk ) < δ
m
0 ≤
∑ (Va F(yk ) −Va F(xk ))
< ε
k=1
und so die absolute Stetigkeit von Va F auf [a, b].
(b) Hier genügt der Hinweis, dass F1 := (Va F + f )/2 und F2 := (Va F − f )/2 das
Verlangte leisten.
t
u
Der jetzt folgende Satz beinhaltet über Satz B.16 hinaus die noch fehlende Charakterisierung derjenigen maßerzeugenden Funktionen, die zu L-stetigen BorelMaßen führen.
Satz B.20. Sei µ ein Borel-Maß auf R mit maßerzeugender Funktion F. Dann sind
äquivalent:
(a)
(b)
(c)
µ ist L-stetig mit λλ -Dichte f .
F ist λλ -f.ü. differenzierbar, und mit F 0 = f gilt (B.13).
F ist absolut stetig auf jedem Intervall [a, b] für −∞ < a < b < ∞.
256
B Ergänzungen zur Integrationstheorie
Beweis. Unter Hinweis auf Satz B.16 ist nur noch die Äquivalenz von (a) und (c)
nachzuweisen.
“(a)⇒(c)” Wir fixieren ein [a, b], a < b, und ein ε > 0. Gemäß Satz 6.27 existiert
dann ein δ > 0 derart, dass µ(A) < ε für alle A ∈ B(R) mit λλ (A) < δ . Wählt man
speziell A = ∑nk=1 (xk , yk ) mit p.d. (xk , yk ) ⊂ [a, b] und ∑nk=1 (yk − xk ) = λλ (A) < δ ,
folgt demnach
n
0 ≤
∑ (F(yk ) − F(xk ))
= µ(A) < ε,
k=1
was die absolute Stetigkeit von F auf [a, b] beweist.
“(c)⇒(a)” Wir zeigen, dass µ auf jedem beschränkten offenen Intervall (a, b)
L-stetig ist. Sei dazu irgendein (a, b) fixiert und N ⊂ (a, b) eine beliebige LNullmenge. Sei ferner ε > 0 beliebig und dazu δ > 0 gemäß Definition B.17 für die
Funktion F gewählt. Nach Satz A.6 existiert eine offene Menge A ⊂ (a, b) derart,
dass N ⊂ A und λλ (A) = λλ (A\N) < δ . Da Rd separabel ist, gibt es eine abzählbare Familie p.d. Intervalle {(xn , yn ) : n ≥ 1} derart, dass A = ∑n≥1 (xn , yn ). Aus
∑n≥1 (yn − xn ) = λλ (A) < δ folgt dann
µ(N) ≤ µ(A) =
∑ (F(yn ) − F(xn ))
< ε
n≥1
und somit µ(N) = 0, da ε > 0 beliebig vorgegeben war.
t
u
Auf der Grundlage der vorhergehenden Ergebnisse ergibt sich schließlich der
Hauptsatz der Differential- und Integralrechnung für absolut stetige Funktionen quasi als einfache Zugabe. In Einführungskursen über Analysis wird dieser Satz üblicherweise nur für stetig differenzierbare und folglich R-integrierbare Funktionen
bewiesen.
Satz B.21. (Hauptsatz der Differential- und Integralrechnung) Jede absolut stetige Funktion F : [a, b] → R (a, b ∈ R) ist λλ -f.ü. differenzierbar mit L-intgerierbarer
Ableitung F 0 = f , und es gilt
F(x) − F(a) =
Z
(a,x)
f dλλ
für alle x ∈ [a, b].
(B.15)
Beweis. Dank Lemma B.19 können wir F als Differenz von zwei monoton wachsenden absolut stetigen Funktionen F1 und F2 schreiben, die folglich maßerzeugende Funktionen von endlichen L-stetigen Borel-Maßen µ1 , µ2 auf [a, b] bilden. Diese
Maße können wir natürlich in der üblichen Weise auch als Borel-Maße auf R auffassen, deren maßerzeugenden Funktion dann weiterhin F1 , F2 bilden, sofern wir
Fi (x) = Fi (a) für x < a und Fi (x) = Fi (b) für x > b definieren (i = 1, 2). Alle Aussagen ergeben sich nun unter Berufung auf Satz B.16 für (µ1 , F1 ) und (µ2 , F2 ) und
der Linearität des Maßintegrals.
t
u
B.7 Die Transformationsformel für L-Integrale
257
B.7 Die Transformationsformel für L-Integrale
Hauptziel dieses Abschnitts bildet die Herleitung der in der Überschrift genannten Transformationsformel für L-Integrale, die auch als Substitutionsregel im Rd
bezeichnet wird. Obgleich eine Formel zur Berechnung von Integralen, macht sie
letztendlich eine Aussage über das Bild des L-Maßes λλ d unter bijektiven stetig
differenzierbaren Abbildungen Φ : U → V für offene Mengen U,V ⊂ Rd . Da der
Beweis dieser Formel im wesentlichen auf der lokalen Approximation von Φ durch
lineare Abbildungen beruht, kehren wir nochmals zurück zu einem Studium der
Transformationseigenschaften des L-Maßes unter allgemeinen linearen Bijektionen
des Rd , die sich bekanntlich durch reguläre Matrizen und Translationen beschreiben
lassen.
Im Folgenden bezeichne GL(d, R) die multiplikative Gruppe der regulären reellen d × d-Matrizen sowie I die d-dimensionale Einheitsmatrix. Es sei ferner
SL(d, R) die Untergruppe derjenigen T mit | det T| = 1, die insbesondere alle orthogonalen Matrizen enthält. Die Hintereinanderschaltung einer orthogonalen Abbildung und einer Translation heißt Bewegung. Die Gesamtheit all dieser Abbildungen bildet wiederum eine Gruppe, genannt Bewegungsgruppe und bezeichnet mit
Bew(Rd ). Wie in der linearen Algebra gezeigt wird, ist eine Bijektion T : Rd → Rd
genau dann eine Bewegung, wenn sie den euklidischen Abstand erhält, d.h.
|T(x) − T(y)| ≤ |x − y| für alle x, y ∈ Rd .
Die nächsten zwei Ergebnisse klären, wie sich das Bild von λλ d unter den zuvor
genannten Abbildungen verhält, und stellen zugleich eine Erweiterung der in Satz
2.17 und Beispiel 3.17 gefundenen Eigenschaften dar.
Satz B.22. Für jedes T ∈ GL(d, R) gilt (λλ d )T = | det T|−1 λλ d .
Beweis. Wir notieren vorab, dass T(B), T−1 (B) ∈ B(Rd ) für alle B ∈ B(Rd ) gilt,
und schreiben der Kürze halber λ für λλ d . Der Beweis vollzieht sich in vier Schritten:
(1) Das Maß λ T ist wieder translationsinvariant, denn
λ T (a + B) = λ T (Tb + B) = λ (b + T−1 (B)) = λ (T−1 (B)) = λ T (B)
für alle a ∈ Rd und B ∈ B(Rd ). Dabei gilt a = Tb für ein eindeutig bestimmtes
b ∈ Rd , weil T bijektiv ist. Aus der Stetigkeit von T−1 und der Kompaktheit von
[0, 1]d folgt, dass T−1 ([0, 1]d ) kompakt ist und deshalb c(T) := λ T ([0, 1]d ) < ∞ gilt.
Vermöge Satz 2.17(b) folgern wir nun λ T = c(T)λ . Zu zeigen bleibt also c(T) =
| det T|−1 , wobei
S
d) ≤
∞ = λ T (Rd ) = λ T
(q
+
[0,
1]
d
∑q∈Qd λ T (q + [0, 1]d )
q∈Q
258
B Ergänzungen zur Integrationstheorie
offenbar c(T) > 0 garantiert.
(2) Für S, T ∈ GL(d, R) gilt c(ST) = c(S)c(T), denn
λ ST (B) = λ T (S−1 (B)) = c(T)λ (S−1 (B)) = c(T)λ S (B) = c(S)c(T)λ (B)
für alle B ∈ B(Rd ). Insbesondere ist c(T−1 ) = c(T)−1 wegen 1 = c(I) = c(T−1 )c(T)
und damit außerdem c(T1 ) = c(T2 ), falls T1 = ST2 S−1 für ein S ∈ GL(d, R). Die
Funktion c(·) ist also ebenso wie | det(·)| ein Homomorphismus von der multiplikativen Gruppe GL(d, R) in die multiplikative Gruppe R> .
>
(3) Bezeichnet T> ∈ GL(d, R) die Transponierte von T, so gilt λ T = λ T , d.h.
c(T) = c(T> ). Zum Beweis sei n ≥ 1 so groß gewählt, dass
0 < λ (B) < ∞
für B := T−1 ([−n, n]d ) ∩ (T> )−1 ([−n, n]d ).
Dann gilt offenkundig T−1 (B) = (T> )−1 (B), was
>
c(T)λ (B) = λ T (B) = λ T (B) = c(T> )λ (B)
und somit c(T) = c(T> ) impliziert.
(4) Schließlich betrachten wir T> T ∈ GL(d, R), die als symmetrische Matrix
diagonalisierbar ist, also T> T = SDS−1 für eine geeignete Diagonalmatrix D ∈
GL(d, R) und ein S ∈ GL(d, R) erfüllt. Unter Berufung auf (2) und (3) ergibt sich
nun
c(T)2 = c(T> )c(T) = c(T> T) = c(D),
also c(T) = c(D)1/2 , und ganz entsprechend | det T| = | det D|1/2 . Wie aber in Bsp.
3.17 bereits gezeigt wurde, gilt c(D) = | det D|−1/2 [+ (3.4)]. Vermöge c(T) =
c(D)1/2 = | det D|−1/2 = | det T|−1 folgt daher die Behauptung .
t
u
Hinsichtlich der anderen zu Beginn des Abschnitts genannten Abbildungen erhalten wir nun leicht das folgende Ergebnis.
Korollar B.23. Das L-Maß λλ d ist
(a)
(b)
invariant unter SL(d, R), d.h. (λλ d )S = λλ d für alle S ∈ SL(d, R).
bewegungsinvariant, d.h. (λλ d )T = λλ d für alle T ∈ Bew(Rd ).
Beweis. Teil (a) ergibt sich sofort aus dem vorherigen Satz, da | det S| = 1 für alle
S ∈ SL(d, R). Für Teil (b) benötigen wir zusätzlich die Translationsinvarianz von
λλ d , denn jede Bewegung ist die Hintereinanderschaltung Tc ◦ S für eine Translation
Tc (c ∈ Rd ) und eine orthogonale Abbildung S. Dies liefert dann wie verlangt
(λλ d )Tc ◦S (B) = (λλ d )S (Tc−1 (B)) = λλ d (Tc−1 (B)) = (λλ d )Tc (B) = λλ d (B)
für alle B ∈ B(Rd ).
t
u
B.7 Die Transformationsformel für L-Integrale
259
Als weitere Folgerung notieren wir die folgende Erweiterung von Satz 2.17(d).
Korollar B.24. Jede affine Hyperebene des Rd ist eine λλ d -Nullmenge.
Beweis. Gemäß Satz 2.17(d) wissen wir, dass λλ d (Hc,i ) = 0 für jedes Hc,i = {a : ai =
c} (c ∈ R und i = 1, ..., d) gilt. Bezeichnet nun H eine beliebige affine Hyperebene
des Rd , so existiert ein T ∈ Bew(Rd ) derart, dass T−1 (Hc,1 ) = H. Unter Benutzung
der Bewegungsinvarianz von λλ d ergibt sich daher
λλ d (H) = λλ d (T−1 (Hc,1 )) = (λλ d )T (Hc,1 ) = λλ d (Hc,1 ) = 0
t
u
und somit die Behauptung.
Wir kommen nun zur angekündigten Transformationsformel für L-Integrale. Seien
U und V offene Teilmengen des Rd . Φ : U → V heißt C1 -Diffeomorphismus oder
C1 -invertierbar, wenn sowohl Φ als auch Ψ := Φ −1 stetig (partiell) differenzierbar
ist. Wir bezeichnen dann mit DΦ die Funktionalmatrix von Φ = (Φ1 , ..., Φd ), d.h.

 ∂Φ
∂ Φ1
1
∂ u1 (u) . . . ∂ ud (u)
 .
.. 
..

DΦ (u) = 
.
.  (u ∈ U).
 ..
∂ Φd
∂ Φd
∂ u (u) . . . ∂ u (u)
1
d
Für einen C1 -Diffeomorphismus Φ ist DΦ in jedem Punkt u ∈ U invertierbar, und
es folgt
(DΦ (u))−1 = DΨ (v) mit v := Φ(u).
(B.16)
Satz B.25. (Transformationsformel für L-Integrale) Seien U und V zwei offene
Teilmengen des Rd und Φ : U → V ein C1 -Diffeomorphismus. Eine meßbare numerische Funktion g : (V, B(V )) → (R, B(Rq )) ist genau dann über V L-integrierbar,
wenn | det DΦ | g ◦ Φ über U L-integrierbar ist, und es gilt in diesem Fall
Z
g dλλ d =
V
Z
U
g ◦ Φ | det DΦ | dλλ d .
(B.17)
Die linke Seite der Formel (B.17) lässt sich mittels des Transformationssatzes
3.46 auch in der Form
Z
g ◦ Φ d(λλ d )Ψ
U
schreiben, und dank desselben Satzes wissen wir, dass g ◦ Φ genau dann (λλ d )Ψ integrierbar ist, wenn g L-integrierbar ist. Auch kann man jede meßbare Funktion
h : (U, B(U)) → (R, B(R)) vermöge (h ◦Ψ ) ◦ Φ nach Φ faktorisieren. Mit diesen
260
B Ergänzungen zur Integrationstheorie
Beobachtungen entpuppt sich Satz B.25 aber als nichts anderes als eine äquivalente
Variante des folgenden Satzes über das Bild von λλ d unter Ψ .
Satz B.26. Unter den Voraussetzungen von Satz B.25 gilt auf (U, B(U))
(λλ d )Ψ = | det DΦ | λλ d
d.h., (λλ d )Ψ ist L-stetig auf U mit λλ d -Dichte | det DΦ |.
Statt Satz B.25 werden wir diese äquivalente Version beweisen, wofür das folgende Lemma den Schlüssel liefert.
Lemma B.27. Unter den Voraussetzungen von Satz B.25 gilt für jedes u ∈ U
(λλ d )Ψ (B(u, r))
= 1,
r→0 (λ
λ d )DΨ (v) (B(0, r))
lim
wobei v := Φ(u).
Beweis. Wir fixieren ein u ∈ U und wählen r0 > 0 so klein, dass B(u, r0 ) ⊂ U. Aus
der stetigen Differenzierbarkeit von Φ folgt, dass
|Φ(x) − v − DΦ (u)(x − u)| ≤ γ(|x − u|)
für alle x ∈ B(u, r0 ) und eine Funktion γ : (0, r0 ) → R> mit limr→0 r−1 γ(r) = 0 gilt.
Die Funktion
|Φ(x) − v|
(B.18)
[0, r0 ) 3 r 7→ ϕu (r) := max
|x−u|≤r |x − u|
ist deshalb stetig mit ϕu (0) = kDΦ (u)k > 0, wobei an kDk = max|x|≤1 |Dx|/|x|
erinnert sei. Weiter folgt nun die Inklusion
Ψ −1 (B(u, r)) = Φ(B(u, r)) ⊂ B(v, ϕ(r)) für alle r ∈ (0, r0 ).
Eine Taylor-Entwicklung von Ψ (y) in v liefert (wie zuvor für Φ) für eine geeignete
Funktion ρ : (0, r1 ) → R> mit limr→0 r−1 ρ(r) = 0, dass
|Ψ (y) − u − DΨ (v)(y − v)| ≤ ρ(|y − v|) für alle y ∈ B(v, r1 ),
wobei r1 > 0 so gewählt wird, dass B(v, r1 ) ⊂ V . Mit w := DΨ (v)v impliziert dies
|Ψ (y) − u| − ρ(r) ≤ |DΨ (v)y − w| ≤ |Ψ (y) − u| + ρ(r) für alle y ∈ B(v, r1 ).
Setzen wir schließlich κ := ρ ◦ ϕ und notieren, dass limr→0 r−1 κ(r) = 0, so ergibt
sich für alle hinreichend kleinen r die entscheidende Inklusionskette
B.7 Die Transformationsformel für L-Integrale
261
(DΨ (v))−1 (B(w, r − κ(r))) ⊂ Ψ −1 (B(u, r)) ⊂ (DΨ (v))−1 (B(w, r + κ(r))).
Da DΨ (v) ∈ GL(d, R), erhalten wir nun nämlich unter Benutzung von Satz B.22
(λλ d )DΨ (v) (B(w, r ± κ(r)))
λλ d (B(0, r ± κ(r)))
=
=
λλ d (B(0, r))
(λλ d )DΨ (v) (B(w, r))
κ(r) d
1±
→ 1,
r
falls r → 0, und dann
(λλ d )Ψ (B(u, r))
(λλ d )Ψ (B(u, r))
=
lim
= 1,
r→0 (λ
r→0 (λ
λ d )DΨ (v) (B(0, r))
λ d )DΨ (v) (B(w, r))
lim
t
u
was zu beweisen war.
Lemma B.28. Unter den Voraussetzungen von Satz B.25 gilt (λλ d )Ψ λλ d .
Beweis. Sei N ∈ B(U) eine beliebige, o.B.d.A. beschränkte L-Nullmenge, für die
nun (λλ d )Ψ (N) = λλ d (Φ(N)) = 0 gezeigt wird. Wir fixieren dazu ein beliebiges
ε > 0 und definieren die stetige Funktion ΓΦ : U ×U → R durch
( |Φ(y)−Φ(x)|
, falls x 6= y,
|y−x|
ΓΦ (x, y) :=
DΦ (x),
falls x = y.
Für k, n ∈ N sei dann
En,k :=
n
x∈U :
sup
y∈B(x,1/k)∩U
o
ΓΦ (x, y) < n .
Wie man leicht
einsieht, ist jedes En,k eine offene Menge und deshalb meßbar. FerS
ner gilt U = k,n≥1 En,k . Folglich reicht es, (λλ d )Ψ (N ∩ En,k ) = 0 für alle k, n ∈ N zu
zeigen.
Wir fixieren nun n, k ∈ N und wählen Kugeln B(xi , ri ) (i ∈ I) für eine höchstens
abzählbare Indexmenge I derart, dass
sup ri < 1/k,
i
N ∩ En,k ⊂
[
i
B(xi , ri ) und
∑ λλ d (B(xi , ri )) < ε.
i
Dies ist möglich, weil λλ d regulär ist und N ∩ En,k deshalb bzgl. λλ d von außen beliebig genau durch eine offene Menge G ⊂ En,k approximiert werden kann, die sich
ihrerseits als abzählbare, p.d. Vereinigung von d-dimensionalen, links halboffenen
dyadischen Würfeln An,i [+ (2.4)] darstellen lässt. Für jedes x ∈ G gibt es nämlich
genau einen solchen dyadischen Würfel Q maximaler Kantenlänge mit x ∈ Q ⊂ G.
Jeder Würfel mit Kantenlänge 2−n ist aber seinerseits in der Kugel mit dem gleichen
Zentrum und dem Radius d 1/2 2−n−1 enthalten.
Aus xi ∈ En,k und ri < 1/k folgern wir |Φ(x) − Φ(xi )| < n|x − xi | < nri für alle
x ∈ B(xi , ri ) und daraus weiter
262
B Ergänzungen zur Integrationstheorie
Φ(B(xi , ri )) ⊂ B(Φ(xi ), nri )
für jedes i ∈ I. Also gilt
Φ(N ∩ En,k ) ⊂
[
i∈I
Φ(B(xi , ri )) ⊂
[
B(Φ(xi ), nri ),
i∈I
was uns schließlich unter Benutzung der Transformationseigenschaften des LMaßes
(λλ d )Ψ (N ∩ En,k ) = λλ d (Φ(N ∩ En,k ))
≤
∑ λλ d (B(Φ(xi ), nri ))
i∈I
=
∑ nd λλ d (B(xi , ri ))
< nd ε
i∈I
und somit (λλ d )Ψ (N ∩ En,k ) = 0 beschert, da ε > 0 beliebig vorgegeben war.
t
u
Beweis (von Satz B.26). Wir müssen jetzt nur noch die zuvor gezeigten Ergebnisse
in geeigneter Weise zusammenfügen. Wie gerade gezeigt, gilt (λλ d )Ψ λλ d , d.h.,
(λλ d )Ψ besitzt nach dem Satz von Radon-Nikodym eine λλ d -Dichte f . Für diese gilt
wiederum gemäß Korollar B.14 sowie Korollar B.27
(λλ d )Ψ (B(u, r))
(λλ d )DΨ (v) (B(0, r))
= lim
d
r→0 λ
r→0
λ (B(u, r))
λλ d (B(u, r))
f (u) = lim
für λλ d -fast alle u ∈ U, wobei v = Φ(u). Eine Kombination von Satz B.22 und
Korollar B.14 liefert aber
(λλ d )DΨ (v) (B(u, r))
1
(λλ d )DΨ (v) (B(0, r))
= lim
=
d
r→0
r→0
| det DΨ (v)|
λλ (B(u, r))
λλ d (B(u, r))
lim
für λλ d -fast alle u ∈ U, und da | det DΨ (v)|−1 = | det DΦ (u)| gemäß (B.16) gilt, folgt
schließlich wie behauptet f = | det DΦ | λλ d -f.ü.
t
u
Anhang C
Requisiten der W-Theorie
C.1 Eine Übersicht nützlicher Integralformeln
In diesem Abschnitt sind einige nützliche Integrationsformeln, die sich direkt aus
Satz 6.45 ergeben, zusammengestellt. Wir geben das Ergebnis in seiner wahrscheinlichkeitstheoretisch relevanten Form nochmals an:
Satz C.1. Seien X eine nichtnegative ZG auf einem W-Raum (Ω , A, P) und ϕ :
R> → R> eine stetige, monoton wachsende und auf R> stetig differenzierbare
Funktion mit ϕ(0) = 0. Dann gilt für alle A ∈ A
Z
ϕ(X) dP =
Z ∞
0
A
ϕ 0 (t) P(A ∩ {X > t}) dt.
(C.1)
Das anschließende Korollar stellt die wichtigsten Spezialfälle von (C.1) zusammen.
Korollar C.2. Für jede nichtnegative ZG X und a, p > 0 gilt:
EX =
EX p =
Z
{X>a}
X p dP =
Z ∞
Z0 ∞
0
Z ∞
P(X > t) dt,
(C.2)
pt p−1 P(X > t) dt,
(C.3)
0
pt p−1 P(X > t ∨ a) dt
p
p−1
= a P(X > a) +
E (X − a)+
p
=
Z ∞
a
Z ∞
a
pt
(C.4)
P(X > t) dt,
p(t − a) p−1 P(X > t) dt,
(C.5)
263
264
C Requisiten der W-Theorie
Z a
E(X ∧ a) p =
0
Z ∞
E(eaX − 1) =
0
Z ∞
E(1 − e−aX ) =
0
pt p−1 P(X > t) dt,
(C.6)
aeat P(X > t) dt,
(C.7)
ae−at P(X > t) dt.
(C.8)
Ist X außerdem P-f.s. ganzzahlig, so gilt weiter:
EX =
∑ P(X > n),
(C.9)
n≥0
EX 2 =
∑ (2n + 1) P(X > n),
(C.10)
n≥0
sowie für a ∈ R
E(eaX − 1) = (ea − 1)
∑ ean P(X > n).
(C.11)
n≥0
Als Ergänzung notieren wir die für p ≥ 1 direkt aus (C.3) folgende Ungleichung
∑ p(n − 1) p−1 P(X > n)
n≥1
≤ EX p ≤
∑ p(n + 1) p−1 P(X > n)
(C.12)
n≥0
Es ist offensichtlich, das Ungleichungen vom selben Typ auch für p ∈ (0, 1) und für
jede der übrigen Integrationsformeln (C.4)–(C.8) angegeben werden können.
Durch Zerlegung von X in Positiv- und Negativteil lassen sich weitere Formeln
aus (C.1) für reelle ZG herleiten. Herausgreifen wollen wir hier nur die für Erwartungswert und Varianz.
Korollar C.3. Für jede quasi-integrierbare ZG X gilt
EX =
Z ∞
0
P(X > t) − P(X < −t) dt.
(C.13)
Existiert auch ihre Varianz Var X, so gilt für diese
Var X =
wobei µ = EX.
Z ∞
0
(2t − µ)P(X > t) + (2t + µ)P(X < −t) dt,
(C.14)