Ergänzungen zur Maßtheorie

Werbung
Anhang A
Ergänzungen zur Maßtheorie
A.1 Beweis des Maßerweiterungssatzes und Folgerungen
Der Beweis des Maßerweiterungssatzes 2.10 bedarf zunächst einiger Vorbereitungen, vor allem der Einführung des äußeren Maßes. Wir folgen hierbei weitgehend
der Darstellung in [5, §5].
Sei R ein Ring über einer nichtleeren Menge Ω und µ ein Prämaß µ über
(Ω , R). Für jedes C ⊂ Ω bezeichne U (C) die Menge aller Überdeckungen von C
durch Mengen aus R, also aller Folgen (An )n≥1 derart, dass An ∈ R für jedes n ≥ 1
S
und C ⊂ n≥1 An gilt. Wegen 0/ ∈ R kann man jede endliche C überdeckende Familie {A1 , ..., An } ⊂ R durch (A1 , ..., An , 0,
/ ...) zu einer Folge aus U (C) erweitern.
Das zu µ assoziierte äußere Maß µ ∗ : P(Ω ) → R> wird definiert durch
( inf ∑n≥1 µ(An ) : (An )n≥1 ∈ U (C) , falls U (C) 6= 0,
/
∗
µ (C) :=
(A.1)
∞, sonst
und besitzt die folgenden leicht nachweisbaren Eigenschaften:
µ ∗ (0)
/ = 0,
∗
µ∗
∗
µ (C1 ) ≤ µ (C2 ),
!
[
n≥1
Cn
≤
(A.2)
falls C1 ⊂ C2 ,
∑ µ ∗ (Cn )
n≥1
für alle C1 ,C2 , .. ⊂ Ω ,
µ ∗ (A) = µ(A) für alle A ∈ R.
(A.3)
(A.4)
(A.5)
Die vorletzte Bedingung (Subadditivität von µ ∗ ) liefert insbesondere
µ ∗ (C) ≤ µ ∗ (C ∩ A) + µ ∗ (C ∩ Ac ) für alle A,C ⊂ Ω .
(A.6)
Eine Menge A ⊂ Ω heißt µ ∗ -messbar, falls auch die umgekehrte Ungleichung und
somit Gleichheit für alle C ⊂ Ω gilt, also
225
226
A Ergänzungen zur Maßtheorie
µ ∗ (C) = µ ∗ (C ∩ A) + µ ∗ (C ∩ Ac ) für alle C ⊂ Ω .
(A.7)
Es bezeichne A∗ das System der µ ∗ -messbaren Mengen. Der folgende Satz, der auf
C. C ARATHEODORY zurückgeht, ebnet den Weg zur Erweiterung von µ zu einem
Maß auf der von R erzeugten σ -Algebra.
Satz A.1. (von Caratheodory) In der gegebenen Situation gilt:
(a)
(b)
A∗ ist eine σ -Algebra, die R enthält.
Die Einschränkung von µ ∗ auf A∗ ist ein Maß.
Beweis. (a1) Wir zeigen als erstes R ⊂ A∗ . Seien dazu A ∈ R und C ⊂ Ω beliebig gewählt und o.B.d.A. µ ∗ (C) < ∞ angenommen, da sonst wegen (A.6) nichts
zu zeigen ist. Fixiere irgendein ε > 0 und wähle (An )n≥1 ∈ U (C) derart, dass
∑n≥1 µ(An ) ≤ µ ∗ (C) + ε. Unter Beachtung von An ∩ A, An ∩ Ac ∈ R, der Additivität von µ auf R sowie (An ∩ A)n≥1 ∈ U (C ∩ A), (An ∩ Ac )n≥1 ∈ U (C ∩ Ac ) folgt
dann
µ ∗ (C) + ε ≥
∑ µ(An )
n≥1
=
∑ µ(An ∩ A) + ∑ µ(An ∩ Ac )
n≥1
∗
n≥1
∗
≥ µ (C ∩ A) + µ (C ∩ Ac )
und somit (A.7).
(a2) Als nächstes zeigen wir, dass A∗ eine Algebra und daher insbesondere ∩stabil ist [+ Anm. 2.2]. Daß A∗ die Menge Ω enthält und unter der Bildung von
Komplementen abgeschlossen ist, sieht man sofort. Nachzuweisen bleibt deshalb
nur, dass mit A, B auch A ∪ B ∈ A∗ liegt. Zunächst erhält man für alle C ⊂ Ω durch
zweimalige Benutzung von (A.7)
µ ∗ (C) = µ ∗ (C ∩ A) + µ ∗ (C ∩ Ac )
= µ ∗ (C ∩ A ∩ B) + µ ∗ (C ∩ A ∩ Bc ) + µ ∗ (C ∩ Ac ∩ B) + µ ∗ (C ∩ Ac ∩ Bc )
und dann nach Ersetzen von C durch C ∩ (A ∪ B)
µ ∗ (C ∩ (A ∪ B)) = µ ∗ (C ∩ A ∩ B) + µ ∗ (C ∩ A ∩ Bc ) + µ ∗ (C ∩ Ac ∩ B).
(A.8)
Subtrahiert man diese Gleichung von der vorherigen, so ergibt sich die gewünschte
Beziehung
µ ∗ (C) = µ ∗ (C ∩ (A ∪ B)) + µ ∗ (C ∩ (A ∪ B)c ) für alle C ⊂ Ω
und somit A ∪ B ∈ A∗ .
(a3) Wir beenden den Beweis von (a) mit dem Nachweis, dass A∗ ein ∩-stabiles Dynkin-System und daher dank Satz 1.14 eine σ -Algebra ist. Gegeben p.d.
A.1 Beweis des Maßerweiterungssatzes und Folgerungen
227
A1 , A2 , ... ∈ A∗ , müssen wir hierfür noch ∑n≥1 An ∈ A∗ zeigen. Wählen wir A = A1
und B = A2 in (A.8), so folgt
µ ∗ (C ∩ (A1 ∪ A2 )) = µ ∗ (C ∩ A1 ) + µ ∗ (C ∩ A2 ) für alle C ⊂ Ω
und daraus per Induktion
!
n
µ ∗ C ∩ ∑ Ak
n
=
k=1
Wegen µ ∗ C ∩
∗
n
µ (C) =
∑µ
T
c
k≥1 Ak
∗
k=1
∑ µ ∗ (C ∩ Ak )
≤ µ∗ C ∩
(C ∩ Ak ) + µ
für alle C ⊂ Ω und n ≥ 1.
k=1
∗
Tn
C∩
c
k=1 Ak
n
\
k=1
Ack
!
vermöge (A.3) liefert dies
n
≥
∑µ
k=1
∗
(C ∩ Ak ) + µ
∗
für alle C ⊂ Ω und n ≥ 1, was schließlich unter Benutzung von (A.4)
!
µ ∗ (C) ≥
∑ µ ∗ (C ∩ Ak ) + µ ∗
k≥1
!
C∩
\
k≥1
k≥1
Ack
!
Ack
k≥1
≥ µ ∗ C ∩ ∑ Ak + µ ∗ C ∩
C∩
\
\
k≥1
Ack
!
(A.9)
für alle C ⊂ Ω
und so ∑k≥1 Ak ∈ A∗ impliziert, da die umgekehrte Ungleichung gemäß (A.6) immer
erfüllt ist.
(b) Da (A.9) mit dem letzten Hinweis de facto eine Gleichung ist, folgt bei Wahl
von C = Ω offenbar µ ∗ (∑k≥1 Ak ) = ∑k≥1 µ ∗ (Ak ), d.h. die σ -Additivität von µ ∗ auf
A∗ . Zusammen mit (A.2) beweist dies, dass µ ∗ auf A∗ ein Maß bildet.
t
u
Beweis (des Maßerweiterungssatzes). Für die Existenzaussage genügt der Verweis
auf den vorherigen Satz, denn µ ∗ bildet eine Maßfortsetzung von µ auf σ (R) ⊂ A∗ .
Der Beweis der Eindeutigkeitsaussage bietet eine willkommene Gelegenheit, das
in Satz 1.22 formulierte DS-Argument zu verwenden: Seien also µ1 und µ2 zwei
Fortsetzungen des Prämaßes µ auf die σ -Algebra A := σ (R), d.h. µ1 (A) = µ2 (A) =
µ(A) für alle A ∈ R. Nach Voraussetzung existieren Ω1 , Ω2 , ... ∈ R derart, dass
Ωn ↑ Ω und µ(Ωn ) < ∞ für alle n ≥ 1 gilt. Da R ∩-stabil und jedes RΩn eine Algebra ist [+ Anm. 2.3], bildet jedes µi,n := µi (· ∩ Ωn ) (i = 1, 2) eine Fortsetzung von
µ(· ∩ Ωn ). Damit reicht es offenbar, die Eindeutigkeitsaussage unter den Voraussetzungen, dass R eine Algebra und µ ein endliches Prämaß auf R ist, zu zeigen.
Sei also nun R eine Algebra und µ(Ω ) < ∞. Wir definieren das Mengensystem
D := {A ∈ A : µ1 (A) = µ2 (A)},
welches natürlich R als Teilsystem enthält, und behaupten, dass D ein DynkinSystem bildet. Wegen Ω ∈ R folgt Ω ∈ D, und da Ac = Ω \A, folgt weiter für
228
A∈D
A Ergänzungen zur Maßtheorie
µ1 (Ac ) = µ1 (Ω ) − µ1 (A) = µ2 (Ω ) − µ2 (A) = µ2 (A),
was Ac ∈ D zeigt. Sei schließlich A1 , A2 , ... eine Folge p.d. Elemente von D. Unter
Benutzung der σ -Additivität von µ1 und µ2 erhalten wir dann
!
!
µ1
∑ Aj
=
j≥1
∑ µ1 (A j )
=
∑ µ2 (A j )
j≥1
j≥1
= µ2
∑ Aj
j≥1
und somit ∑ j≥1 A j ∈ D. Folglich bildet D in der Tat ein Dynkin-System, das wegen
R ⊂ D auch δ (R) enthält. Da R ∩-stabil ist, folgt weiter δ (R) = σ (R) = A
vermöge Satz 1.21 und damit D = A. Also sind µ1 und µ2 auf ganz A identisch. t
u
Beweis (des Approximationssatzes 2.12). Da R eine Algebra bildet und somit Ω
enthält, ist U (A) wegen (Ω , 0,
/ ...) ∈ U (A) für alle A ⊂ Ω nicht leer. Ferner entspricht µ auf A dem in (A.1) definierten äußeren Maß µ ∗ und ist endlich. Folglich existiert zu jedem A ∈ A und jedem ε > 0 eine Folge (Rn )n≥1 aus R mit
S
S
A ⊂ C := k≥1 Rk und |µ(A) − µ(C)| < ε. Setzt man nun Cn := nk=1 Rk für n ≥ 1,
so gilt Cn ∈ R, da R eine Algebra ist, µ(Cn ) ↑ µ(C), da µ stetig von unten ist, und
folglich
inf µ(A4B) ≤ inf µ(A4Cn ) < ε,
B∈R
was offenbar die Behauptung zeigt.
n≥1
t
u
Zum Abschluss geben wir zwei Beispiele, die zeigen sollen, dass bei Verzicht
auf die σ -Endlichkeit des Prämaßes µ im Maßerweiterungssatz in der Tat unendlich
viele Maßfortsetzungen von µ existieren können.
Beispiel A.2. Wie in Anm. 2.3 erwähnt, ist jede Algebra und folglich auch jede σ Algebra R über einer Teilmenge Λ ⊂ Ω zugleich ein Ring über Ω . Sei nun (Ω , A)
irgendein messbarer Raum mit |Ω | ≥ 2 und Λ ∈ A eine echte, nichtleere Teilmenge
von Ω . Sei ferner R die Spur von A unter Λ sowie µ irgendein endliches Maß
auf (Λ , R), das in kanonischer Weise durch µ(A) := µ(A ∩ Λ ) zu einem Maß
auf (Ω , A) fortgesetzt wird. Schließlich sei ν = δx für ein x ∈ Λ c . Dann stimmt
µc := µ + cν für jedes c ≥ 0 mit µ auf R überein und definiert dort ein Prämaß.
Gleichzeitig ist aber offenbar jedes µc als Maß auf (Ω , A) eine Fortsetzung von
µ mit c = µc (Λ c ) 6= µ(Λ c ). Beachte bei diesem Beispiel, dass µ ungeachtet der
Endlichkeit von µ(Λ ) kein σ -endliches Prämaß auf (Ω , R) bildet, weil R keine Ω
ausschöpfende Folge enthält. Und weil außerdem Ω 6∈ R sowie µc (Λ ) < ∞ für alle
c ≥ 0 gilt, zeigt dieses Beispiel ferner, dass in Satz 2.11 die Voraussetzung Ω ∈ R
nicht ersatzlos gestrichen werden kann.
Beispiel A.3. Als zweites Beispiel [+ auch [36, Bem. (2.40)]] betrachten wir dass
Prämaß µ := ∑n≥1 δ−1/n auf dem Ring F = F 1 der eindimensionalen dyadischen
Figuren gemäß (2.6) über R. Dieses ist nicht σ -endlich, da jede R ausschöpfende
isotone Folge (Ωn )n≥1 in F für hinreichend große n ein dyadisches Intervall der
Form (−2−m , 0] (m ∈ N) enthält, was µ(Ωn ) = ∞ für solche n impliziert. Beachtet
A.2 Vitali-Mengen und Beweis von Satz 2.18
229
man ferner, dass 0 ∈ A und A ∈ R stets A = (−2−m , 0] für ein m ∈ N und deshalb
|A ∩ {−1/n : n ∈ N}| = ∞ impliziert, so folgt, dass alle µc := µ + cδ0 (c ≥ 0) auf
R mit µ übereinstimmen, aber als Maße auf (R, B(R)) paarweise verschiedene
Fortsetzungen definieren.
A.2 Vitali-Mengen und Beweis von Satz 2.18
Beweis (von Satz 2.18). Nehmen wir an, dass B(Rd ) = P(Rd ) gilt und somit λλ d
auf der ganzen Potenzmenge von Rd ein translationsinvariantes Maß bildet. Durch
x ∼ y :⇔ x − y ∈ Qd wird eine Äquivalenzrelation auf Rd definiert, die folglich eine
Partition des Raumes in p.d. Äquivalenzklassen der Form x + Qd für ein x ∈ Rd
induziert. Vermöge des Auswahlaxioms können wir aus jeder dieser Klassen einen
Vertreter wählen, die zusammen eine Menge V ergeben. Diese kann o.B.d.A. als
Teilmenge von (0, 1]d gewählt werden, denn zu jedem x ∈ Rd gibt es genau ein
n ∈ Zd ⊂ Qd mit x + n ∈ (0, 1]d . Damit gilt Rd = ∑x∈V (x + Qd ), aber auch
Rd =
∑ (q +V ),
(A.10)
q∈Qd
denn die q+V für q ∈ Qd sind ebenfalls p.d. Aus (q+V )∩(r+V ) 6= 0/ folgt nämlich
q + x = r + y für geeignete x, y ∈ V , also x − y ∈ Qd , was nach Wahl der Menge V
schon x = y und dann weiter q = r impliziert. Da Qd abzählbar ist, sichert die σ Additivität von λλ d in (A.10)
∑
λλ d (q +V ) = λλ d (Rd ) = ∞,
q∈Qd
also λλ d (q+V ) > 0 für ein und dann vermöge der Translationsinvarianz alle q ∈ Qd ,
insbesondere natürlich λλ d (V ) > 0. Nun gilt aber wegen V ⊂ (0, 1]d offenbar
∑
q∈Qd ∩(0,1]d
(q +V ) ⊂ (0, 2]d ,
was unmöglich ist, weil einserseits λλ d ((0, 2]d ) = 2d < ∞, andererseits
∑
q∈Qd ∩(0,1]d
λλ d (q +V ) = |Qd ∩ (0, 1]d | λλ d (K) = ∞
unter nochmaliger Benutzung der Translationsinvarianz sowie λλ d (V ) > 0 gilt. Also
ist V keine Borel-Menge und B(Rd ) 6= P(Rd ).
t
u
Anmerkung A.4. Eine nicht Borelsche Menge V der zuvor konstruierten Form unter
Verwendung des Auswahlaxioms wird als Vitali-Menge bezeichnet, benannt nach
dem ital. Mathematiker G. V ITALI.
230
A Ergänzungen zur Maßtheorie
Anmerkung A.5. (Vervollständigung) Ein Maßraum (Ω , A, µ) heißt vollständig, die
σ -Algebra A entsprechend vollständig bezüglich µ oder µ-vollständig, wenn aus
A ∈ A mit µ(A) = 0 schon B ∈ A für alle B ⊂ A folgt, wenn also Teilmengen von
µ-Nullmengen ebenfalls messbar und damit µ-Nullmengen bilden. Umgekehrt lässt
sich zu jeder σ -Algebra A deren µ-Vervollständigung Aµ in folgender Weise definieren: Sei
Nµ := {N ∈ P(Ω ) : N ⊂ A für ein A ∈ A mit µ(A) = 0}.
der Ring aller Teilmengen von µ-Nullmengen, der sogar abgeschlossen ist unter
abzählbaren Vereinigungen. Dann lässt sich leicht zeigen, dass
Aµ : = {A ∪ N : A ∈ A, N ∈ Nµ }
wieder eine σ -Algebra definiert, die zum einen µ-vollständig ist und zum anderen offensichtlich Aµ = σ (A ∪ Nµ ) erfüllt. Sie wird als Vervollständigung von A
bezüglich µ bezeichnet.Vermöge der kanonischen Festlegung µ(A ∪ N) := µ(A) für
alle N ∈ Nµ erhält man schließlich eine Fortsetzung von µ als Maß auf der Vervollständigung Aµ .
Die λλ d -Vervollständigung von B(Rd ) wird Lebesguesche σ -Algebra genannt
und mit L (Rd ) bezeichnet, ihre Elemente heißen Lebesgue-Mengen. Wie man
sofort sieht, ist das L-Maß auf L (Rd ) weiterhin translationsinvariant, und dies
zeigt weiter, dass die im Beweis von Satz 2.18 konstruierte Menge V auch keine
Lebesgue-Menge sein kann, dass also auch L (Rd ) kleiner als P(Rd ) ist.
A.3 Regularität von Borel-Maßen
Ein Maß µ auf (Rd , B(Rd )) heißt regulär, wenn es die beiden folgenden Bedingungen erfüllt:
µ(B) = sup{µ(K) : K ⊂ B, K kompakt}
µ(B) = inf{µ(G) : B ⊂ G, G offen}
für alle B ∈ B(Rd ),
für alle B ∈ B(R ).
d
(A.11)
(A.12)
Die Eigenschaften (A.11) und (A.12) für sich genommen nennt man auch innere
bzw. äußere Regularität. Ein Maß ist demnach regulär, wenn es sowohl von innen
als auch von außen regulär ist.
Satz A.6. Jedes endliche Borel-Maß µ auf Rd ist regulär.
Beweis. Wir benutzen ein DS-Argument. Sei E das System der beschränkten links
halboffenen Teilintervalle von Rd , das bekanntlich einen ∩-stabilen Erzeuger von
A.4 Zerlegung von Borel-Maßen auf R
231
B(Rd ) bildet. Jedes I ∈ E erfüllt offenkundig die beiden Bedingungen (A.11) und
(A.12). Betrachten wir nun das System
D := {B ∈ B(Rd ) : B erfüllt (A.11) und (A.12)}.
Wir müssen zeigen, dass D ein Dynkin-System ist:
(1) Es gilt Rd ∈ D, weil Rd durch kompakte Mengen ausgeschöpft werden kann.
(2) Falls B ∈ D, so existieren zu jedem ε > 0 ein Kompaktum K ⊂ B und eine
offene Menge G ⊃ B, so dass µ(B) − ε ≤ µ(K) ≤ µ(G) ≤ µ(B) + ε. Es folgt Gc ⊂
Bc ⊂ K c und ferner, da µ endlich ist,
µ(Bc ) − ε ≤ µ(Gc ) ≤ µ(K c ) ≤ µ(Bc ) + ε.
Außerdem ist K c offen und Gc abgeschlossen. Wählt man nun n ≥ 1 so groß, dass
µ(Rd \[−n, n]d ) < ε, so folgt für die kompakte Menge K ∗ := Gc ∩ [−n, n]d offenbar
K ∗ ⊂ Bc und µ(K ∗ ) ≥ µ(Gc ) − ε ≥ µ(Bc ) − 2ε. Dies zeigt Bc ∈ D.
(3) Gegeben eine Folge (Bn )n≥1 p.d. Elemente aus D, fixiere ein beliebiges ε > 0
und wähle kompakte Mengen Kn sowie offene Mengen Gn derart, dass Kn ⊂ Bn ⊂ Gn
und µ(Bn ) − ε2−n ≤ µ(Kn ) ≤ µ(Gn ) ≤ µ(Bn ) + ε2−n für alle n ≥ 1 gilt. Beachte,
dass die Kn ebenfalls p.d. sind. Setzen wir B := ∑n≥1 Bn , B[n] := ∑nj=1 B j , G :=
S
n
n≥1 Gn und K[n] := ∑ j=1 K j , so folgt K[n] ⊂ B[n] ⊂ B ⊂ G und
µ(B[n] ) − ε ≤ µ(K[n] ) ≤ µ(G) ≤ µ(B) + ε
für alle n ≥ 1. Ferner ist G offen und jedes K[n] kompakt. Da µ(B[n] ) → µ(B), können
wir n so groß wählen, dass µ(B[n] ) ≥ µ(B) − ε. Dies zeigt offenbar B ∈ D.
Somit ist D in der Tat ein Dynkin-System, welches E enthält und folglich bereits
mit B(Rd ) übereinstimmt.
t
u
A.4 Zerlegung von Borel-Maßen auf R
Ergänzend zu den Ausführungen über Borel-Maße auf R in Unterabschnitt 2.4.1,
dessen Bezeichnungen hier beibehalten seien, wird im Anschluss gezeigt, dass sich
jedes solche Maß in eindeutiger Weise in einen stetigen und einen diskreten Anteil
zerlegen lässt. Zu beliebiger maßerzeugender Funktion F definieren wir
F d (x) :=
∑
y∈D(F)∩(−∞,x]
und zeigen zunächst:
∆F (y) und
F c (x) := F(x) − F d (x)
(A.13)
232
A Ergänzungen zur Maßtheorie
Lemma A.7. Die Funktionen F d , F c sind ebenfalls maßerzeugend und F c außerdem stetig.
Beweis. Für F d ergibt sich die Monotonie direkt aus der Definition, während die
rechtsseitige Stetigkeit aus F d (x + ε) − F d (x) = ∑y∈D(F)∩(x,x+ε] ∆F (y) und D(F) ∩
(x, x + ε] ↓ 0/ für ε ↓ 0 folgt. Als Differenz zweier rechtsseitig stetiger Funktionen ist
aber auch F c rechtsseitig stetig, so dass nur noch die Monotonie und die linksseitige Stetigkeit von F c zu zeigen bleiben. Hierfür notieren wir als erstes, dass unter
Benutzung von (2.10)
F d (y) − F d (x) =
∑
z∈D(F)∩(x,y]
µF ({z}) = µF (D(F) ∩ (x, y]).
für alle x, y ∈ R mit x < y gilt. Es folgt die Monotonie von F c aus
F c (y) − F c (x) = (F(y) − F(x)) − (F d (y) − F d (x))
= µF ((x, y]) − µF (D(F) ∩ (x, y]) = µF (C(F) ∩ (x, y]) ≥ 0
für alle x, y ∈ R mit x < y. Per Grenzübergang und Beachtung von (2.11) liefert dies
weiter
∆F c (y) = lim(F c (y) − F c (x)) = µF (C(F) ∩ {y}) = 0
x↑y
und somit auch die linksseitige Stetigkeit von F c .
t
u
Wir sind nun in der Lage, den angekündigten Zerlegungssatz zu beweisen, und
erinnern daran, dass µF genau dann diskret bzw. stetig ist, falls µF = ∑x∈D(F) ∆F (x)δx
bzw. µF ({x}) = 0 für alle x ∈ R gilt. Wegen Lemma A.7 ist klar, dass µF d immer
ein diskretes und µF c ein stetiges Borel-Maß bildet.
Satz A.8. (Zerlegung von Borel-Maßen) Jedes Borel-Maß µ besitzt eine eindeutige Zerlegung µ = µ d + µ c in ein diskretes Borel-Maß µ d und ein stetiges BorelMaß µ c . Falls µ = µF für eine maßerzeugende Funktion F, so gilt weiter
µ d = µF d =
∑
∆F (x) δx
x∈D(F)
und µ c = µF c .
Beweis. Sei µ ein Borel-Maß und F eine maßerzeugende Funktion mit µ = µF , die
gemäß Satz 2.21 stets existiert. Dann impliziert F = F d + F c sofort µF = µF d + µF c
auf dem ∩-stabilen Mengensystem E der links halboffenen Intervalle (a, b]. Es folgt
die Gleichheit auf ganz B(R) = σ (E ) mittels eines einfachen DS-Arguments.
Sei nun µ = µ1 + µ2 eine weitere Zerlegung in ein diskretes Borel-Maß µ1 und
ein stetiges Borel-Maß µ2 . Es folgt µF d − µ1 = µ2 − µF c , wobei (µ2 − µF c )({x}) = 0
für alle x ∈ R und
A.4 Zerlegung von Borel-Maßen auf R
µF d − µ1 =
233
∑ p(x) δx
x∈I
für eine abzählbare Menge I ⊂ R und eine Funktion p : I → R gelten muss. Dies ist
aber offenbar nur möglich, wenn p(x) ≡ 0, also µF d = µ1 und µF c = µ2 gilt.
t
u
Anmerkung A.9. Für eine W-Verteilung µ auf (R, B(R)) lässt sich der Zerlegungssatz auch folgendermaßen formulieren: Entweder ist µ selbst diskret oder stetig,
oder es existieren eine diskrete Verteilung µ d , eine stetige Verteilung µ c und ein
α ∈ (0, 1) derart, dass
(A.14)
µ = α µ d + (1 − α)µ c .
M.a.W., µ lässt sich in eindeutiger Weise als konvexe Kombination oder Mischung
einer diskreten und einer stetigen Verteilung darstellen. Ist nämlich µ = µ d + µ c
gemäß Satz A.8 mit µ d 6≡ 0 und µ c 6≡ 0, so wähle µ u := µ u (R)−1 µ u für u ∈ {d, s}
und α = µ d (R). Eine weitere Verfeinerung dieser Zerlegung, die sich aus der
Lebesgue-Zerlegung ergibt, findet der Leser in Abschnitt B.5.
Anhang B
Ergänzungen zur Integrationstheorie
B.1 Eigenschaften des Maßintegrals
Beweis (von Satz 3.41). Wir beschränken uns auf den Beweis der Teil (a)–(e) und
überlassen (f), (g) dem Leser als einfache Übung.
(a) Diese Aussage ergibt sich unmittelbar aus der Definition (3.13) des Integrals
bezüglich µ, angewendet auf f1+ , f2+ und f1− , f2− , für die f1+ ≤ f2+ bzw. f1− ≥ f2−
gilt.
(c) Gegebenenfalls nach Übergang zu ( fn − f1− )n≥1 dürfen wir o.B.d.A. voraussetzen, dass alle fn nichtnegativ sind. Gemäß Teil (a) folgt direkt
Z
R
f1 dµ ≤
R
Z
f2 dµ ≤ ... ≤
Z
fn dµ ≤ ... ≤
Z
f dµ,
also limn→∞ fn dµ ≤ f dµ. Für die umgekehrte Ungleichung genügt es unter erneutem Hinweis auf (3.13),
inf f (ω) · µ(Ai ) ≤ lim
∑ ω∈Ai
i∈I
n→∞
Z
fn dµ
für jede endliche Zerlegung (Ai )i∈I ∈ Z(Ω , A) zu zeigen. Seien daher eine solche
Zerlegung und ein beliebiges x < ∑i∈I αi µ(Ai ) vorgegeben, wobei αi := infω∈Ai f (ω).
Wir wählen Konstanten βi , i ∈ I mit folgenden Eigenschaften: 0 < βi < αi , falls
αi > 0, βi = αi , falls αi = 0 und x < ∑i∈I βi µ(Ai ). Wegen fn ↑ f existiert dann für
jedes i ∈ I und ω ∈ Ai ein n0 = n0 (ω) derart, dass fn (ω) ≥ βi für alle n ≥ n0 . Als
nächstes definieren wir
Ai,n := { fn ≥ βi } ∩ Ai ∈ A
(i ∈ I, n ∈ N),
für die Ai,n ↑ Ai und daher µ(Ai,n ) ↑ µ(Ai ) für jedes i ∈ I folgt. Wir erhalten
235
236
B Ergänzungen zur Integrationstheorie
Z
fn dµ ≥
≥
inf fn (ω) · µ(Ai,n ) + ∑ inf c
∑ ω∈A
ω∈Ai ∩A
i,n
i∈I
i∈I
i,n
fn (ω) · µ(Ai ∩ Aci,n )
∑ βi µ(Ai,n )
i∈I
und schließlich
lim
n→∞
Z
fn dµ ≥ lim
n→∞
∑ βi µ(Ai,n )
=
i∈I
∑ βi µ(Ai )
> x,
i∈I
was den Beweis von (3.17) abschließt.
(d) Es seien gn := supk≥n fk und hn := infk≥n fk , die offenbar gn ↓ f , hn ↑ f ,
hn ≤ fn ≤ gn für alle n ≥ 1 sowie
sup |hn | ≤ sup |gn | ≤ f ∗ ∈ L1 (µ)
n≥1
n≥1
erfüllen. Per Anwendung des Satzes von der monotonen Konvergenz ergibt sich nun
lim
n→∞
Z
gn dµ = lim
n→∞
Z
hn dµ =
Z
f dµ
und daraus wegen hn ≤ fn ≤ gn und der Monotonie des Integrals auch (3.17).
(b) Für den Nachweis der Linearität des Maßintegrals wähle zuerst f , g ∈ E(Ω , A)
in Normaldarstellung, d.h. f = ∑i∈I αi 1Ai und g = ∑ j∈J β j 1B j mit (Ai )i∈I , (B j ) j∈J ∈
Z(Ω , A) und reellen Konstanten αi , β j . Es folgt
α f +βg =
∑
i∈I, j∈J
(ααi + β β j ) 1Ai ∩B j
mit (Ai ∩B j )i∈I, j∈J ∈ Z(Ω , A). Wie man sofort einsieht, gilt Satz 3.40 auch für reelle
primitive Funktionen (Elemente von E(Ω , A)). Es folgt
Z
(α f + β g) dµ =
∑
i∈I, j∈J
=
(ααi + β β j ) µ(Ai ∩ B j )
∑ ααi ∑ µ(Ai ∩ B j ) + ∑ β β j ∑ µ(Ai ∩ B j )
i∈I
j∈J
j∈J
= α ∑ αi µ(Ai ) + β
i∈I
= α
Z
f dµ + β
Z
i∈I
∑ β j µ(B j )
j∈J
g dµ.
Seien schließlich f , g beliebige integrierbare Funktionen. Wähle fn , gn ∈ E(Ω , A)
+
−
−
mit fn+ ↑ f + , fn− ↓ f − , g+
n ↑ g und gn ↓ g , also f n → f , gn → g sowie α f n +β gn →
α f + β g. Die Existenz solcher fn , gn sichert Lemma 3.37. Wegen
sup | fn | ≤ f1− + f + ∈ L1 (µ) und
n≥1
+
1
sup |gn | ≤ g+
1 + g ∈ L (µ)
n≥1
B.1 Eigenschaften des Maßintegrals
237
erhalten wir vermöge des soeben Gezeigten und des Satzes von der majorisierten
Konvergenz
Z
Z
(α fn + β gn ) dµ
Z
Z
= lim α fn dµ + β gn dµ
(α f + β g) dµ = lim
n→∞
n→∞
also die Behauptung in voller Allgemeinheit.
(e) Hier ergibt sich die Behauptung leicht unter Hinweis auf
0 ≤ lim inf fn = lim inf fk ,
n→∞
n→∞ k≥n
was wie behauptet
Z
lim inf fn dµ = lim
n→∞
n→∞
Z
inf fk dµ ≤ lim inf
n→∞
k≥n
Z
fn dµ
mit dem Satz von der monotonen Konvergenz impliziert.
t
u
Satz B.1. Sei (Ω , A, µ) ein Maßraum und f ∈ L0 (Ω , A) eine messbare numerische
Funktion. Dann gilt für
(a) nichtnegatives f :
(b) quasi-integrierbares f :
R
f dµ = 0 ⇔ f = 0 µ-f.ü.
R
A
f dµ = 0 für alle A ∈ A ⇔ f = 0 µ-f.ü.
Beweis. (a) Wir setzen N := { f 6= 0} = { f > 0}.
R
“⇒” Sei f dµ = 0. Es gilt N ∈ A, weil f messbar ist, und wir müssen µ(N) = 0
zeigen. Für n ≥ 1 setzen wir An := { f ≥ 1n } und bemerken, dass An ∈ A, f ≥ n−1 1An
sowie An ↑ N, also µ(An ) ↑ µ(N) gelten. Wir erhalten dann
0 =
Z
f dµ ≥
Z
n−1 1An dµ = n−1 µ(An ) ≥ 0,
also µ(An ) = 0 für alle n ≥ 1, was µ(N) = 0 impliziert.
“⇐” RSei nun f = 0 µ-f.ü., also µ(N) = 0 vorausgesetzt. Setzen wir gn := n · 1N ,
so folgt gn dµ = 0 und 0 ≤ f ≤ g := limn→∞ gn und deshalb unter Benutzung des
Satzes von der monotonen Konvergenz
0 ≤
Z
f dµ ≤
Z
g dµ = lim
n→∞
Z
gn dµ = 0.
(b) Die Beweisrichtung “⇐” ist mit Teil (a) trivial, da f = 0 µ-f.ü. dasselbe
für die nichtnegativen Funktionen f + und f − impliziert. Für die Umkehrung “⇒”
238
B Ergänzungen zur Integrationstheorie
R
R
notieren wir, dass nach Voraussetzung { f ≥0} f dµ = 0 und { f ≤0} | f | dµ = 0 wegen
R
{ f ≥ 0}, { f ≤ 0} ∈ A gilt. Es folgt | f | dµ = 0 und somit f = 0 µ-f.ü. wiederum
gemäß Teil (a).
t
u
Als nützliche Folgerung aus Satz B.1 notieren wir:
Korollar B.2. Es seien f , g zwei quasi-integrierbare numerische Funktionen auf
einem Maßraum (Ω , A, µ). Dann gilt:
R
A
f dµ ≤
R
Ag
dµ für alle A ∈ A ⇔ f ≤ g µ-f.ü.
Insbesondere folgt aus f = g µ-f.ü. stets
R
R
f dµ = g dµ.
Beweis. “⇒” Für n ≥ 1 betrachte die nichtnegative
Funktion hRn := ( f − g)1Bn mit
R
Bn := { f > g, f ≥ −n,
g
≤
n}
∈
A.
Dann
gilt
f
dµ
> −∞,
BR
Bn g dµ < ∞ sowie
n
R
R
R
nach Voraussetzung
h
dµ
=
(
f
−
g)
dµ
=
f
dµ
−
g
n
Bn
Bn
Bn dµ ≤ 0. AndererR
seits muss
h
dµ
aber
nichtnegativ
sein,
da
h
≥
0
ist.
Für
alle
n ≥ 1 erhalten wir
n
n
R
somit hn dµ = 0, also hn = 0 µ-f.ü. gemäß Satz B.1, und dies impliziert schließlich
µ({ f > g}) = limn→∞ µ(Bn ) = 0.
R
R
“⇐” Hier sei
kontrapositorisch
> A g dµR für ein A ∈ A angenommen,
A f dµ
R
R
R
was offenbar A f + dµ > A g+ dµ oder A f − dµ < A g− dµ impliziert. Im ersten
Fall setze Bn := { Rf + > g+ , f + ≤Rn} und folgere mit dem Satz von der monotonen
Konvergenz, dass A∩Bn f + dµ > A∩Bn g+ dµ ≥ 0 für ein hinreichend großes n gelten muss. Dies liefert µ({ f > g}) ≥ µ({ f + > g+ }) ≥ µ(Bn ) > 0. Im zweiten Fall
erhält man auf dieselbe Weise µ({ f > g}) ≥ µ({ f − < g− }) > 0, was in beiden
Fällen µ({ f > g}) > 0 zeigt.
t
u
B.2 Lebesgue- versus Riemann-Integral
Der besonderen Bedeutung des L-Maßes λλ d als Volumenmaß auf (Rd , B(Rd ))
Rechnung tragend, diskutieren wir in diesem Abschnitt kurz das zugehörige Integral und seine Beziehung zum R(iemann)-Integral. Obgleich die anschließenden
Ausführungen auch in höherer Dimension richtig sind, beschränken wir uns der einfacheren Darstellung halber auf den Fall d = 1, der für unsere Belange ausreichend
ist.
R
b
Vereinbarung. Hier wie auch
im ganzen Text bezeichnet
a f (x) dx immer das
R
R
R-Integral von f , während [a,b] f (x) λλ (dx) oder einfach [a,b] f dλλ für das entsprechende L-Integral verwendet wird.
B.2 Lebesgue- versus Riemann-Integral
239
Ein kurzer Blick auf das Riemann-Integral. Gegeben ein kompaktes Intervall
[a, b] ⊂ R, sei Z[a, b] die Menge aller endlichen Zerlegungen z = [z0 , ..., zn ], a =
z0 < z1 < ... < zn = b. Für eine beliebige Funktion f : [a, b] → R wird definiert
n
Obersumme( f , z) :=
∑
sup
∑
inf
j=1 z j−1 ≤x≤z j
n
Untersumme( f , z) :=
z ≤x≤z j
j=1 j−1
f (x) · (z j − z j−1 ),
f (x) · (z j − z j−1 ).
Offensichtlich gilt dann
sup Untersumme( f , z) ≤
z∈Z[a,b]
inf
z∈Z[a,b]
Obersumme( f , z),
und f heißt (eigentlich) R(iemann)-integrierbar, wenn beide Werte übereinstimmen.
Man definiert in diesem Fall den gemeinsamen
Wert als das R(iemann)-Integral von
R
f auf [a, b], symbolisch ausgedrückt durch ab f (x) dx. Aus der Analysis ist bekannt,
dass jede auf [a, b] stetige Funktion R-integrierbar ist. Insbesondere gilt natürlich
Z b
a
1 dx = b − a = λλ ([a, b]) =
Z
[a,b]
1 λλ (dx),
d.h. für Intervalle repräsentiert das R-Integral ebenso wie das L-Integral den geometrischen Längenbegriff. Leider erweist sich jedoch die R-Integrierbarkeit für viele
Funktionen als zu restriktiv, denn es werden bereits sehr einfache messbare Funktionen wie etwa f = 1[0,1]∩Q ausgeschlossen. Für das genannte Beispiel gilt offenkundig
Untersumme( f , z) = 0
und
für alle z ∈ Z[0, 1].
Obersumme( f , z) = 1
Gleichzeitig stellt sich die Frage, welche L-integrierbaren Funktionen auch Rintegrierbar sind, und ob für diese R-Integral und L-Integral immer übereinstimmen.
Im Folgenden wollen wir auch uneigentliche R-Integrale zulassen: Gegeben ein
offenes Intervall (a, b), wobei −∞ ≤ a < b ≤ ∞, heißt f : (a, b) → R uneigentlich
R-integrierbar, falls f auf jedem [α, β ] ⊂ (a, b) eigentlich R-integrierbar ist und
R
der Limes für α ↓ a und β ↑ b in R existiert. Dieser wird wiederum mit ab f (x) dx
bezeichnet und stimmt natürlich mit dem eigentlichen R-Integral überein, wenn f
sogar auf [a, b] im eigentlichen Sinn R-integrierbar ist. Wir erinnern daran, dass
wegen λλ ({x}) = 0 für alle x ∈ R
Z
[a,b]
f dλλ =
Z
(a,b]
f dλλ =
Z
[a,b)
f dλλ =
Z
(a,b)
f dλλ
für jedes auf (a, b) L-integrierbare f gilt.
Die nachfolgenden drei Sätze beinhalten die wesentlichen Informationen über
den Zusammenhang von Lebesgue- und Riemann-Integrierbarkeit.
240
B Ergänzungen zur Integrationstheorie
Satz B.3. Sei I ein Teilintervall von R mit Randpunkten a, b ∈ R (a < b) und f :
I → R eine messbare reelle Funktion. Dann gilt:
(a)
Ist I = [a, b] (a, b ∈ R) kompakt und f eigentlich R-integrierbar auf I, so ist
f auch L-integrierbar auf I, und die Integrale stimmen überein, d.h., es gilt
Z
(b)
f dλλ =
Z
Z b
f dλλ =
I
f (x) dx.
(B.1)
a
Ist f L-integrierbar auf I und auf jedem kompakten Teilintervall eigentlich
R-integrierbar, so ist f auch uneigentlich R-integrierbar auf I, und es gilt
wiederum (B.1).
Beweis. (a) Für jedes n ≥ 1 definiere zn,0 = a und zn,k := a + k(b − a)2−n für
k = 1, ..., 2n . Seien ferner In,1 := [zn,0 , zn,1 ] und In,k := (zn,k−1 , zn,k ] für k = 2, ..., 2n
die resultierende Zerlegung von [a, b] der Feinheit 2−n sowie αn,k , βn,k das Infimum bzw. Supremum von f auf In,k . Schließlich definiere die Treppenfunktionen
n
n
gn (x) := ∑2k=1 αn,k 1In,k (x) und hn (x) := ∑2k=1 βn,k 1In,k (x), die natürlich primitive
Borel-messbare
Funktionen sind und deren R-Integrale gerade die Unter- bzw. OberR
summe von ab f (x) dx zur Zerlegung (In,k )1≤k≤2n bilden und mit ihren jeweiligen LIntegralen übereinstimmen. Weiter gilt offensichtlich gn ↑, hn ↓ und gn ≤ f ≤ hn für
alle n ≥ 1. Setzen wir g := limn→∞ gn und h := limn→∞ hn , so folgt also g ≤ f ≤ h,
und per Kombination der R-Integrierbarkeit von f mit dem Satz von der monotonen
Konvergenz weiter
Z
g dλλ = lim
Z b
n→∞ a
I
R
gn (x) dx =
Z b
f (x) dx = lim
Z b
n→∞ a
a
hn (x) dx =
Z
h dλλ . (B.2)
I
Da somit I (h − g) dλλ = 0 und ferner h − g ≥ 0, liefert Satz B.1(a) f = g = h λλ -f.ü.,
was insbesondere die L-Integrierbarkeit von f sowie (B.1) beweist.
R
R
(b) Nach Teil (a) gilt hier [α,β ] f dλλ = αβ f (x) dx für alle [α, β ] ⊂ I, während
der Satz von der majorisierten Konvergenz (beachte hierfür, dass | f |1[α,β ] ≤ | f |1I )
lim
Z
α↓a, β ↑b [α,β ]
f dλλ =
Z
f dλλ
I
garantiert und folglich die behauptete uneigentliche R-Integrierbarkeit von f auf I
sowie (B.1) impliziert.
t
u
Nur wenig Mühe bereitet nunmehr die folgende exakte Charakterisierung der messbaren eigentlich R-integrierbaren Funktionen.
B.2 Lebesgue- versus Riemann-Integral
241
Satz B.4. Eine messbare reelle Funktion f : [a, b] → R (a, b ∈ R, a < b) ist genau dann eigentlich R-integrierbar, wenn sie beschränkt und außerhalb einer λλ Nullmenge stetig ist.
Beweis. Wir übernehmen die Bezeichnungen aus dem Beweis des vorherigen Satzes. Sei R die abzählbare Menge aller Randpunkte der Zerlegungsintervalle In,k ,
also R = {zn,k : n ≥ 1, k = 1, ..., 2n }, und D( f ) die Menge der Unstetigkeitsstellen
von f .
Ist f auf [a, b] R-integrierbar, so ist sie nach unten und oben durch Treppenfunktionen mit endlichem Integral beschränkt und folglich selbst eine beschränkte
Funktion. Darüber hinaus gilt offenbar B([a, b]) 3 {g < h} ⊂ D( f ) ⊂ R ∪ {g < h} ∈
B([a, b]). Wegen g = f λλ -f.ü. folgt die Stetigkeit von f außerhalb der λλ -Nullmenge
R ∪ {g < h}.
Ist umgekehrt f beschränkt und außerhalb einer λλ -Nullmenge N ⊂ [a, b] stetig,
so folgt λλ ({ f < g}) = 0 aus {g < h} ⊂ D( f ) ⊂ N und damit die R-Integrierbarkeit
von f auf [a, b] vermöge (B.2).
t
u
Satz B.5. Sei I ein Teilintervall von R und f : I → R eine messbare reelle Funktion,
die auf jedem kompakten Teilintervall von I eigentlich R-integrierbar ist. Dann sind
äquivalent:
(1)
(2)
f ist L-integrierbar auf I.
| f | ist uneigentlich R-integrierbar auf I.
Beweis. “(1)⇒(2)” Gemäß Satz 3.41(d) ist die L-Integrierbarkeit von f 1I mit der
von | f | 1I äquivalent. Ferner ist vermöge Satz B.4 auch | f | auf jedem kompakten
Teilintervall von I eigentlich R-integrierbar. Bezeichnen wieder a, b die Randpunkte
von I, so folgt mit (B.1) und dem Satz von der monotonen Konvergenz
lim
Z β
α↓a, β ↑b α
| f (x)| dx =
lim
Z
α↓a, β ↑b [α,β ]
| f | dλλ =
R
Z
I
| f | dλλ ,
(B.3)
also die uneigentliche R-Integrierbarkeit von f auf I, da | f | dλλ < ∞.
“(2)⇒(1)” Liest man (B.3) von rechts nach links, wobei in diesem Fall der Limes
auf der ganz linken Seite nach Voraussetzung endlich ist, so folgt offenbar die LIntegrierbarkeit von | f | und damit von f .
t
u
Beispiele B.6. (a) Die weiter
oben erwähnte Funktion f := 1Q∩[0,1] ist natürlich LR
integrierbar auf [0, 1] mit [0,1] f dλλ = λλ (Q ∩ [0, 1]) = 0. Andererseits ist f auch
nirgends stetig auf [0, 1] und folglich dort nicht R-integrierbar gemäß Satz B.4.
(b) Dagegen erhält man durch folgende Modifikation von f eine auf [0, 1] λλ -f.ü.
p(x)
stetige und folglich R-integrierbare Funktion: Bezeichnet q(x)
für x ∈ Q ∩ [0, 1] die
242
B Ergänzungen zur Integrationstheorie
eindeutige Darstellung von x mit teilerfremden p(x), q(x) ∈ N, und definieren wir
1
dann f (x) := q(x)
für x ∈ Q ∩ [0, 1] sowie weiterhin f (x) := 0 für alle anderen x, so
ist f in allen irrationalen x ∈ [0, 1] stetig.
(c) Die Funktion f (x) = sinx x 1R> (x) mit der stetigen Fortsetzung sin0 0 := 1 bildet
das Standardbeispiel einer uneigentlich R-integrierbaren, aber nicht L-integrierbaren
Funktion. Zum einen gilt nämlich
Z kπ
Z nπ n
2 n 1 n→∞
sin x dx ≥ ∑ 1
|
sin
x|
dx
=
∑ k −→ ∞,
x π k=2
0
k=2 πk (k−1)π
zum anderen folgt per partieller Integration für a > π/2
Z ∞
Z a
Z a
− cos x a
cos x
cos x
sin x
a→∞
dx =
dx
−→
−
dx,
−
2
x
x
x2
π/2
π/2
π/2 x
π/2
wobei der Limes wegen
lich ist.
R ∞ cos x
R∞ 1
2
π/2 x2 dx ≤ π/2 x2 dx = π tatsächlich existiert und end-
B.3 Der Raum L2 (µ): Beweis von Satz 6.21 (Projektions- und
Zerlegungssatz) und der Darstellungssatz von Riesz
Beweis (von Satz 6.21). (a) Für beliebig fixiertes f sei γ := infg∈K k f − gk2 und
(gn )n≥1 eine Folge in K mit k f − gn k2 → γ. Dann liefert die Parallelogrammgleichung für alle m, n ∈ N
2
gm − gn 2
= 1 k f − gn k22 + k f − gm k22 − gm + gn − f 2 2
2
2
2
1
≤
k f − gn k22 + k f − gm k22 − γ 2 ,
2
2
n
n
wobei in der letzten Zeile gm +g
− f 2 ≥ γ 2 wegen gm +g
∈ K benutzt wurde.
2
2
Lässt man m, n gegen ∞ streben, folgt kgm −gn k2 → 0. Also ist (gn )n≥1 eine CauchyFolge in dem abgeschlossenen Teilraum K und konvergiert deshalb gegen ein g ∈ K.
Aus der Stetigkeit der Norm k · k2 ergibt sich schließlich k f − gk2 = limn→∞ k f −
gn k2 = γ. Bezeichnet h ∈ K ein weiteres Element mit k f − hk2 = γ, so liefert eine
nochmalige Anwendung der Parallelogrammgleichung (ersetze oben einfach gm , gn
durch g, h)
g − h 2
1
2
2
2
2 ≤ 2 k f − gk2 + k f − hk2 − γ = 0
2
und somit g = h.
B.3 Der Raum L2 (µ): Beweis von Satz 6.21 (Projektions- und Zerlegungssatz) und der Darstellungssatz von Riesz
243
(b) Sei f ∈ L2 (µ) beliebig. Da g durch h f − g, hi = 0 für alle h ∈ K eindeutig bestimmt ist, wie man leicht sieht, genügt es h f − PK ( f ), hi = 0 für alle h ∈ K
nachzuweisen. Es gilt aber für alle 0 6= h ∈ K und λ > 0 unter Beachtung der definierenden Eigenschaft von PK ( f )
0 < k f − PK ( f ) ± λ hk22 − k f − PK ( f )k2 = λ 2 khk22 ± 2λ h f − PK ( f ), hi,
was 2|h f − PK ( f ), hi| = infλ >0 λ khk22 = 0 impliziert.
(c) Die Linearität von PK folgt direkt aus (b), und da trivialerweise PK ( f ) = f
f ür f ∈ K gilt, folgt auch PK = PK2 .
(d) Aus (b) folgt I − PK ( f ) ∈ K ⊥ . Da außerdem
h f − ( f − PK ( f )), hi = hPK ( f ), hi = 0
für alle h ∈ K ⊥ ,
liefert wiederum (b), dass f − PK ( f ) = PK ⊥ ( f ) und somit f = PK ( f ) + PK ⊥ ( f ) gilt.
Diese Zerlegung von f ist eindeutig, denn aus f = g + h für g ∈ K und h ∈ K ⊥ ergibt
sich offenkundig PK ( f ) − g = h − PK ⊥ ( f ) ∈ K ∩ K ⊥ = {0}. Die letzte Behauptung
des Satzes erhält man nun durch einfaches Nachrechnen.
t
u
Mit Hilfe des Projektions- und Zerlegungssatzes 6.21 kann man nun ein wichtiges Ergebnis zeigen, welches im nächsten Abschnitt im Beweis des Satzes von
Radon-Nikodym benötigt wird. Dabei geht es um die Charakterisierung der reellen
stetigen Linearformen auf L2 (µ), d.h. der stetigen linearen Abbildungen von L2 (µ)
nach R, deren Gesamtheit den (topologischen)
Dualraum L2 (µ)0 ergibt. OffensichtR
lich ist jedes Φg , definiert durch Φg ( f ) := f g dµ für ein festes g ∈ L2 (µ), eine
solche Abbildung, denn vermöge der Cauchy-Schwarz-Ungleichung gilt
|Φg ( f )| = k f gk1 ≤ k f k2 kgk2
für alle f ∈ L2 (µ),
also
kΦg k :=
sup |Φg ( f )| = kgk2 .
k f k2 =1
Das angekündigte Ergebnis besagt, dass bereits jede reelle stetige Linearform von
dieser Gestalt ist und folglich mit einem g ∈ L2 (µ) identifiziert werden kann. Dies
bedeutet, dass L2 (µ)0 und L2 (µ) vermöge der Zuordnung Φg 7→ g isometrisch isomorph sind. Zum Beweis verweisen wir erneut auf Abschnitt ?? des Anhangs.
Satz B.7. (Darstellungssatz von Riesz) Zu jeder stetigen Linearform Φ : L2 (µ) →
R existiert eine eindeutig bestimmte Funktion g ∈ L2 (µ) derart, dass Φ( f ) = h f , gi
für alle f ∈ L2 (µ).
Beweis. Falls Φ( f ) = 0 für alle f ∈ L2 (µ), wähle g = 0. Andernfalls ist der Kern
von Φ, d.h. K := { f : Φ( f ) = 0} ein echter abgeschlossener Teilraum von L2 (µ),
244
B Ergänzungen zur Integrationstheorie
und es existiert ein eindeutig bestimmtes g∗ ∈ L⊥ mit Φ(g∗ ) = 1. Während die Existenz klar ist, notieren wir hinsichtlich der Eindeutigkeit, dass aus Φ(g∗ ) = Φ(h) =
1 zunächst g∗ − h ∈ K, dann weiter
kg∗ − hk22 = hg∗ − h, g∗ − hi = hg∗ , g∗ − hi − hh, g∗ − hi = 0
und schließlich g∗ = h folgt. Insbesondere gilt Φ(h)−1 h = g∗ für jedes h ∈ K ⊥ .
Gegeben ein beliebiges f ∈ L2 (µ) mit orthogonaler Zerlegung f = f1 + f2 , f1 ∈ K
⊥
und f2 ∈ K ⊥ , ergibt sich nun nach Definition von g := kg∗ k−2
2 ∈K
h f , gi = h f2 , gi =
Φ( f2 ) ∗ ∗
hg , g i = Φ( f2 ) = Φ( f ),
kg∗ k22
also die Existenzaussage des Satzes. Da ferner h f , gi = h f , hi für alle f ∈ L2 (µ)
gleichbedeutend ist mit h f , g − hi = 0 für alle f ∈ L2 (µ), folgt bei Wahl von f =
g − h offenbar g = h.
t
u
B.4 Maße mit Dichten: Beweise der Sätze 6.28–6.30
Beweis (des Satzes 6.28 von Radon-Nikodym). Wie schon bemerkt, folgt die Aussage “(a)⇒(b)” direkt aus Anm. 3.43. Wir wenden uns deshalb gleich dem Beweis der
Umkehrung “(b)⇒(a)” zu. Da zudem nach Voraussetzung Mengen Ωn ∈ A (n ≥ 1)
existieren mit Ωn ↑ Ω und µ(Ωn ) + ν(Ωn ) < ∞ für alle n ≥ 1, dürfen wir o.B.d.A.
µ und ν als endlich voraussetzen. Wir setzen ρ := µ + ν.
Das folgende Argument unter Benutzung des Darstellungssatzes B.7 von Riesz
für L2 (ρ) geht auf J OHN VON N EUMANN zurück. Es gilt trivialerweise ν ρ.
Außerdem ist die kanonische Einbettung von L2 (ρ) in L2 (ν) wegen
R
R
k f k2,ν = ( f 2 dν)1/2 ≤ ( f 2 dρ)1/2 = k f k2,ρ
stetig. Dies impliziert L2 (ν)0 ⊂ L2 (ρ)0 , denn für Φ ∈ L2 (ν)0 gilt
kΦkρ =
sup
f ∈L2 (ρ)
|Φ( f )|
≤
k f k2,ρ
Nun ist aber
Φν ( f ) :=
Z
f dν
sup
f ∈L2 (ν)
|Φ( f )|
= kΦkν .
k f k2,ν
( f ∈ L2 (ν))
wegen der aus der Hölder-Ungleichung folgenden Abschätzung
|Φν ( f )| ≤ k f k2,ν ν(Ω )1/2
ein stetiges lineares Funktional auf L2 (ν) und somit auch auf L2 (ρ). Der Darstellungssatz von Riesz impliziert deshalb die Existenz einer reellen Funktion g ∈ L2 (ρ)
B.4 Maße mit Dichten: Beweise der Sätze 6.28–6.30
derart, dass für alle f ∈ L2 (ρ)
Z
Z
f dν =
oder nach Umstellung
Z
f g dρ =
Z
f (1 − g) dν =
245
f g dµ +
Z
Z
f g dν.
f g dµ.
(B.4)
Wegen ρ(Ω ) < ∞ sind insbesondere alle Indikatorfunktionen in L2 (ρ), so dass mit
f = 1A
Z
Z
A
(1 − g) dν =
für alle A ∈ A
g dµ
A
(B.5)
folgt. Wählt man speziell A = {g < 0}, so ergibt sich weiter
0 ≤
Z
{g<0}
(1 − g) dν =
Z
{g<0}
g dµ ≤ 0
und so ρ({g < 0}) = 0 vermöge Satz B.1, da die Integranden beider Integrale betragsmäßig positiv sind auf {g < 0}. Ein analoges Argument zeigt ρ({g > 1}) = 0,
so dass insgesamt 0 ≤ g ≤ 1 ρ-f.ü. und weiter (1 − g)ν = gµ per (B.5) folgt. Insbesondere gilt (B.4) nun für alle f ∈ L1 ((1 − g)ν) = L1 (gµ). Wählen wir schließlich
A = {g = 1} in (B.5), so ergibt sich
0 =
Z
{g=1}
(1 − g) dν =
Z
g dµ,
{g=1}
(B.6)
und folglich, wiederum mit Satz B.1, µ({g = 1}) = 0. An dieser Stelle benutzen
wir nun die Voraussetzung ν µ, die uns ν({g = 1} = 0 und so ρ({g = 1}) = 0
beschert, was insgesamt 0 ≤ g < 1 ρ-f.ü. beweist. Die Funktion 1/(1−g) ist folglich
ρ-f.ü. reellwertig und außerdem trivialerweise integrierbar bezüglich (1−g)ν = gµ.
Dasselbe gilt offenbar für jedes f = 1A /(1 − g) (A ∈ A), so dass (B.4) für solche f
schließlich
Z
g
dµ für alle A ∈ A
ν(A) =
A 1−g
liefert. Die Funktion h := g/(1 − g) ist demnach die gesuchte µ-Dichte von ν.
t
u
Beweis (der Lebesgue-Zerlegung (Satz 6.29)). Folgen wir dem obigen Beweis bis
(B.6) und definieren
ν c (A) := ν(A ∩ {0 ≤ g < 1}) und
ν s (A) := ν(A ∩ {g = 1}) (A ∈ A),
so leisten diese beiden Maße das Verlangte, wie man leicht einsieht.
t
u
Beweis (von Satz 6.30). “⇒” Nach dem Satz von Radon-Nikodym ist µ = gν für
ein g ∈ L0+ (Ω , A). Es folgt deshalb unter Verwendung von Satz 6.24
µ(A) =
Z
A
g dν =
Z
A
g f dµ
für alle A ∈ A,
246
B Ergänzungen zur Integrationstheorie
also µ = (g f )µ, was g f = 1 µ-f.ü. gemäß Satz 6.23 und dann µ({0 < f < ∞}c ) = 0
sowie g = 1/ f µ-f.ü. impliziert.
“⇐” Gegeben ν = f µ und
µ({0 < f < ∞}c ) = 0, folgern wir für jede µ-positive
R
Menge A ∈ A, dass ν(A) = A f dµ ≥ ε µ(A ∩ { f > ε} > 0 für hinreichend kleines
ε > 0 gilt. Es folgt µ ν und insgesamt die Äquivalenz von µ und ν.
t
u
B.5 Verfeinerte Zerlegung von Borel-Maßen auf R
Mittels der Lebesgue-Zerlegung lässt sich der Zerlegungssatz A.8 für Borel-Maße
auf R noch verfeinern. Erinnern wir uns: Jedes Borel-Maß µ = µF , F die assoziierte
maßerzeugende Funktion, lässt sich auf eindeutige Weise in einen diskreten Anteil
µ d = µF d und einen stetigen Anteil µ c = µF c zerlegen, wobei µ d als Träger die
Menge D(F) der Sprungstellen von F besitzt, die als abzählbare Menge natürlich
eine λλ -Nullmenge bildet. Damit folgt µ d ⊥ λλ . Wollen wir also µ hinsichtlich seines
L-stetigen Anteils weiter zerlegen, reicht es, dies für µ c zu tun. Der folgende Zerlegungssatz bildet eine direkte Konsequenz der Lebesgue-Zerlegung von µ c bezüglich
λλ und Satz A.8.
Satz B.8. Jedes Borel-Maß µ besitzt eine eindeutige Zerlegung
µ = µ d + µ s + µ ac
in ein diskretes Borel-Maß µ d , ein λλ -singuläres, stetiges Borel-Maß µ s und ein
L-stetiges Borel-Maß µ ac .
Abschließend geben wir ein Beispiel für ein stetiges, aber λλ -singuläres Borel-Maß.
Ein solches Maß konzentriert seine Masse per definitionem auf eine λλ -Nullmenge,
die notwendig überabzählbar ist, weil das Maß andernfalls diskret wäre. Unser Beispiel gibt demnach zugleich eine positive Antwort auf die Frage nach der Existenz
überabzählbarer λλ -Nullmengen.
Beispiel B.9. [Cantorsche Ternärmenge und Cantor-Verteilung] Wir betrachten den W-Raum ([0, 1], B([0, 1]), λλ ). Die Cantorsche Ternärmenge C, hier kurz
Cantor-Menge genannt, wird wie folgt durch sukzessives Ausdünnen konstruiert:
Entferne aus C0 := [0, 1] im ersten Schritt das mittlere Drittel, d.h. das offene Intervall ( 31 , 23 ), und behalte
C1 := C0 \( 31 , 23 ) = 0, 31 + 23 , 1 .
Wende im nächsten Schritt dasselbe Verfahren auf die beiden Teilintervalle von C1
an. Dies liefert
C2 := 0, 19 + 29 , 13 + 32 , 59 + 89 , 1
B.5 Verfeinerte Zerlegung von Borel-Maßen auf R
247
als verbleibende Menge. So fortfahrend erhält man nach n Schritten als verbleibende
Menge
2n x
n,k xn,k + 1
,
,
(B.7)
Cn = ∑
n
3n
k=1 3
wobei die Menge Dn := {xn,k : 1 ≤ k ≤ 2n }, 0 = xn,1 < ... < xn,2n = 1, aus den
Elementen
n
yk
y = ∑ k mit yk ∈ {0, 2}
3
k=1
besteht, also denjenigen Elementen des Einheitsintervalls, die eine Ternärdarstellung y = 0, y1 y2 ...yn der Länge n ohne die Ziffer 1 besitzen. Dann gilt offenbar Cn ↓,
Dn ↑ und Dn ⊂ Cm für alle m, n ≥ 1. Wir definieren schließlich
C := lim Cn =
n→∞
\
Cn
und
D := lim Dn =
n→∞
n≥1
[
Dn .
n≥1
Als Durchschnitt kompakter Mengen ist C selbst kompakt und wegen D ⊂ C nicht
leer. Sie wird als Cantorsche Ternärmenge bezeichnet. Der topologische Abschluß
D von D besteht offenbar aus allen y, die eine unendliche Ternärdarstellung ohne
die Ziffer 1 besitzen, d.h.
)
(
yk
(B.8)
D = ∑ k : yk ∈ {0, 2} für alle k ≥ 1 .
k≥1 3
Beachte, dass dies alle y ∈ [0, 1] mit einer endlichen Ternärdarstellung der Form
0, y1 ...yn 1 einschließt, da diese auch die alternative Ternärdarstellung 0, y1 ...yn 222...
besitzen. Z.B. gilt 13 = 0, 1 = 0, 222.... Andererseits besteht die Gesamtheit aller
entfernten Intervalle gerade aus allen anderen y ∈ [0, 1], in deren Ternärdarstellung
0, y1 y2 ... mindestens ein yk den Wert 1 hat. Dies zeigt insgesamt
C = D,
und wir folgern die Überabzählbarkeit von C aus der Tatsache, dass die Abbildung
Φ : C → [0, 1],
yk
∑ 3k
k≥1
7→
yk /2
k
k≥1 2
∑
offensichtlich bijektiv ist. Unter Hinweis auf (B.7) erhalten wir λλ (Cn ) = (2/3)n für
alle n ≥ 1 und deshalb
λλ (C) = 0.
(B.9)
Wir werden nun wie angekündigt auf [0, 1] eine W-Verteilung P konstruieren
derart, dass P(C) = 1 und somit P ⊥ λλ gilt. Für n ≥ 0 sei Fn die VFkt. des stetigen
W-Maßes λλ (Cn )−1 λλ (· ∩Cn ), genannt Gleichverteilung auf Cn , d.h.
248
B Ergänzungen zur Integrationstheorie
Fn (x) :=
λλ ((−∞, x] ∩Cn )
λλ (Cn )
(x ∈ R).
Unter Hinweis auf (B.7) sieht man, dass für n ≥ 1

0,
falls x ≤ 0,



k 2−n , falls (x + 1)3−n ≤ x ≤ x
−n (k = 1, ..., 2n − 1),
n,k
n,k+1 3
Fn (x) :=

linear, falls xn,k 3−n < x < (xn,k + 1)3−n (k = 1, ..., 2n ),



1,
falls x ≥ 1,
wobei die linearen Fortsetzungen auf den Intervallen (xn,k 3−n , (xn,k + 1)3−n ) durch
die Stetigkeit von Fn eindeutig sind. Abb. B.1 zeigt exemplarisch den Graphen von
Fn für n = 3 und n = 6.
1.0
1.0
0.8
0.8
0.6
0.6
0.4
0.4
0.2
0.2
0.2
0.4
0.6
0.8
1.0
x
0.2
0.4
0.6
0.8
1.0
x
Abb. B.1 Die Funktionen F3 (links) und F6 (rechts).
Wie man dann leicht auch ohne formalen Beweis erkennt, gilt
sup |Fn (x) − Fn−1 (x)| = sup |Fn (x) − Fn−1 (x)| ≤
x∈R
x∈[0,1]
1
2n
für alle n ≥ 1.
Die Reihe ∑n≥1 (Fn (x) − Fn−1 (x)) ist also für alle x ∈ [0, 1] absolut und gleichmäßig
konvergent, die Funktion
n
∑ (Fk (x) − Fk−1 (x))
n→∞
F(x) := lim Fn (x) = F0 (x) + lim
n→∞
k=1
(x ∈ R)
folglich eine monoton wachsende und wiederum stetige Funktion mit F(x) = 0 für
x ≤ 0 und F(x) = 1 für x ≥ 1. Außerdem existiert für jedes x ∈ Cc eine offene
Umgebung (x − ε, x + ε) ⊂ Cc , auf der F konstant ist, was F 0 (x) = 0 für alle x ∈ Cc ,
also F 0 = 0 λλ -f.ü. impliziert. Die Funktion F heißt Cantor-Funktion, das zugehörige
stetige Borel-Maß µF auf [0, 1] Cantor-Verteilung. Wie gerade festgestellt, gilt
µF ((a, b]) = F(b) − F(a) = 0
für alle (a, b] ⊂ Cc
und folglich µF (Cc ) = 0. Damit ist gezeigt, dass µF nur Masse auf der λλ -Nullmenge
C besitzt und deshalb λλ -singulär ist.
B.6 Differentiation L-stetiger Borel-Maße und absolut stetige Funktionen
249
B.6 Differentiation L-stetiger Borel-Maße und absolut stetige
Funktionen
Betrachten wir zur Einstimmung ein L-stetiges Borel-Maß µ auf Rd (d ≥ 1) mit
stetiger L-Dichte f . Für r > 0 und x ∈ Rd bezeichne B(x, r) := {y ∈ Rd : |x−y| < r}
die offene Kugel um x mit Radius r und B(x, r) deren topologischen Abschluß. Dann
gilt offensichtlich die Mittelwerteigenschaft
lim
r→0
1
d
λλ (B(x, r))
Z
B(x,r)
| f − f (x)| dλλ d = 0
(B.10)
sowie a fortiori
lim
r→0
1
µ(B(x, r))
= lim d
r→0 λ
λλ d (B(x, r))
λ (B(x, r))
Z
f dλλ d = f (x)
(B.11)
B(x,r)
für alle x ∈ Rd . Für allgemeines f ∈ L1 (λλ d ) ist dagegen nicht klar, ob (B.10)
überhaupt für gewisse x, genannt Lebesgue-Punkte von f , erfüllt ist. Aus diesem
Grund darf man Satz B.13 weiter unten als erstaunliches Ergebnis ansehen. Er besagt nämlich, dass für eine L1 -Funktion λλ d -fast alle x Lebesgue-Punkte sind. Um
dies zu beweisen, sind allerdings einige Vorbereitungen notwendig, wobei wir uns
an [35, Kap. 7] orientiert haben. Wir beginnen mit einem einfachen Lemma.
S
Lemma B.10. Sei B = nk=1 B(xk , rk ) eine endliche Vereinigung von offenen Kugeln. Dann existiert eine Teilmenge I ⊂ {1, ..., n} derart, dass gilt:
(a)
(b)
(c)
Die Kugeln
B(xi , ri ), i ∈ I, sind p.d.
S
B ⊂ i∈I B(xi , 3ri ).
λλ d (B) ≤ 3d ∑i∈I λλ d (B(xi , ri )).
Beweis. O.B.d.A. gelte r1 ≥ r2 ≥ ... ≥ rn . Definiere i1 := 1 und dann i2 als den
kleinsten Index ∈ {2, ..., n} derart, dass B(xi2 , ri2 ) und B(x1 , r1 ) disjunkt sind, sofern
ein solcher existiert. Als nächstes wähle i3 als den kleinsten Index ∈ {i2 + 1, ..., n}
derart, dass B(xi3 , ri3 ) weder B(xi2 , ri2 ) noch B(xi1 , ri1 ) schneidet, sofern ein solcher
Index existiert. So fortfahrend erhält man eine Menge I = {i1 , ..., ik } ⊂ {1, ..., n}, so
dass offensichtlich (a) erfüllt ist. Die Gültigkeit von (b) ergibt sich aus der Tatsache,
dass aus s ≤ r und B(y, s) ∩ B(x, r) 6= 0/ die Inklusion B(y, s) ⊂ B(x, 3r) folgt, und
für (c) genügt der Hinweis, dass
λλ d (B(x, 3r)) = λλ d (3 B(0, r)) = 3d λλ d (B(0, r)) = 3d λλ d (B(x, r))
für alle x ∈ Rd gilt [+ Satz 2.17].
t
u
Für ein beliebiges Borel-Maß µ auf Rd definieren wir als nächstes dessen Maximalfunktion Mµ : Rd → [0, ∞] durch
250
B Ergänzungen zur Integrationstheorie
(Mµ)(x) := sup
r>0
µ(B(x, r))
µ(B(x, r))
= sup d
d
λλ (B(x, r))
λ (B(0, r))
r>0 λ
(x ∈ Rd ).
Diese Funktion ist unterhalbstetig, d.h. lim infy→x (Mµ)(y) ≥ (Mµ)(x) für alle x ∈
Rd , denn
µ(B(x, r))
µ(B(x, r))
inf sup d
≥ sup inf
λ (B(0, r))
λ d (B(0, r))
y∈B(x,ε) r>0 λ
r>0 y∈B(x,ε) λ
für alle ε > 0. Wie man leicht sieht, ist eine unterhalbstetige Funktion f dadurch
charakterisiert, dass { f > t} für alle t ∈ R offen ist, was vermöge Satz 6.1 ihre
Borel-Messbarkeit garantiert. Wir folgern also die Borel-Messbarkeit von Mµ, und
die Menge {Mµ > t} ist offen für jedes t ∈ R.
Lemma B.11. Für jedes Borel-Maß µ auf Rd und jedes t > 0 gilt die Ungleichung
λλ d ({Mµ > t}) ≤ 3d t −1 µ(Rd ).
Beweis. Wir dürfen natürlich gleich µ als endlich voraussetzen, weil sonst nichts
zu zeigen ist. Aufgrund der Unterhalbstetigkeit von Mµ gilt (Mµ)(x) ≥ t auf dem
Abschluß von {Mµ > t}, den wir mit Bt bezeichnen. Für beliebiges N ≥ 1 ist dann
die Menge Bt,N := Bt ∩ B(0, N) abgeschlossen und beschränkt, also kompakt. Aus
diesem Grund finden wir eine endliche Überdeckung {B(xk , rk ) : 1 ≤ k ≤ n} von
Bt,N durch Kugeln mit Zentren xk in Bt,N und Radien rk > 0 derart, dass
λλ d (B(xk , rk )) ≥ t −1 µ(B(xk , rk )) für k = 1, ..., n.
Gemäß Lemma B.10 existiert dann eine Teilfamilie {B(xi , ri ) : i ∈ I} p.d. Kugeln
S
derart, dass i∈I B(xi , ri ) ⊂ Bt,N sowie
λλ d (Bt,N ) ≤ 3d ∑ λλ d (B(xi , ri )) ≤ 3d t −1 ∑ µ(B(xi , ri )) ≤ 3d t −1 µ(Rd )
i∈I
i∈I
gilt. Lässt man nun N gegen ∞ streben und beachtet Bt,N ↑ Bt ⊃ {Mµ > t}, so folgt
die Behauptung.
t
u
Schließlich benötigen wir noch das folgende, auch für sich interessante Ergebnis.
Satz B.12. Für jedes 0 < p < ∞ liegt die Menge C (Rd ) der reellen stetigen Funktionen auf Rd dicht in (L p (λλ d ), k · k p ), d.h., zu jedem f ∈ L p (λλ d ) und jedem ε > 0
existiert ein p-fach L-integrierbares g ∈ C (Rd ) mit k f − gk p < ε.
Beweis. Da nach Korollar 6.19 die primitiven Funktionen eine dichte Teilmenge
von L p (λλ d ) bzgl. k · k p bilden, reicht es zu zeigen, dass sich jede primitive Funktion
bzgl. k · k p durch stetige Funktionen approximieren lässt.
B.6 Differentiation L-stetiger Borel-Maße und absolut stetige Funktionen
251
Sei zuerst g = 1I für ein beliebiges beschränktes Intervall I ⊂ Rd mit Abschluß
I. Definiere gI,n ∈ C (Rd ) durch
gI,n (x) := e−nρ(x,I) ,
wobei ρ(x, I) := min |y − x|.
y∈I
Dann folgt kg − gI,n k p → 0 mit dem Satz von der majorisierten Konvergenz.
Als nächstes sei g = 1F für eine d-dimensionale dyadische Figur F ∈ F d , also
für die p.d. Vereinigung von dyadischen Würfeln I1 , ..., Im ⊂ Rd [+ Bsp. 2.5]. Dann
m
d
gilt 1F = ∑m
k=1 1Ik , ∑k=1 gIk ,n ∈ C (R ) und unter Benutzung des zuvor Gezeigten
m
m
lim g − ∑ gIk ,n ≤ lim ∑ k1Ik − gIk ,n k p = 0.
n→∞
n→∞ k=1
k=1
p
Sei schließlich g = 1B für ein beliebiges B ∈ B(Rd ). Da F d eine Algebra bildet,
die B(Rd ) erzeugt, gibt es nach dem Approximationssatz 2.12 zu jedem n ≥ 1 ein
Fn ∈ F d derart, dass λλ d (B4Fn ) ≤ 1/n, was wegen 1B4Fn = |1B − 1Fn | offenkundig
k1B − 1An k p → 0 impliziert. Damit ist klar, dass sich jede Indikatorfunktion 1B und
folglich auch jede primitive Funktion bzgl. k · k p durch stetige Funktionen approximieren lässt.
t
u
Wir sind nun in der Lage, den angekündigten Beweis über die Existenz von
Lebesgue-Punkten einer L1 -Funktion zu zeigen.
Satz B.13. Für f ∈ L1 (λλ d ) (d ≥ 1) sind λλ d -fast alle x ∈ Rd Lebesgue-Punkte.
Beweis. Für r > 0 und x ∈ Rd definieren wir
(Dr f )(x) :=
1
λλ d (B(0, r))
Z
B(x,r)
| f − f (x)| dλλ d
und weiter
(D f )(x) := lim sup (Dr f )(x),
r→0
so dass D f = 0 λλ d -f.ü. zu zeigen ist. Sei außerdem
(M f )(x) :=
1
λλ d (B(0, r))
Z
B(x,r)
| f | dλλ d
die Maximalfunktion von f , die offensichtlich der zuvor eingeführten Maximalfunktion des endlichen Borel-Maßes | f |λλ d mit Gesamtmase k f k1 entspricht und somit
gemäß Lemma B.11 der Ungleichung
λλ d ({M f > t}) ≤ 3d t −1 k f k1
für alle t > 0
(B.12)
252
B Ergänzungen zur Integrationstheorie
genügt.
Dank des vorherigen Satzes existiert zu jedem n ≥ 1 eine stetige Funktion gn ∈
C (Rd ) derart, dass k f − gn k1 ≤ 1/n. Wir setzen hn := f − gn und notieren Dgn = 0
wegen der Stetigkeit von gn [+ (B.10)]. Vermöge der einfachen Abschätzung
1
(Dr hn )(x) ≤ d
λλ (B(0, r))
Z
B(x,r)
|hn | dλλ d + |hn (x)|
erhalten wir Dhn ≤ Mhn + |hn |. Da außerdem D f ≤ Dgn + Dhn = Dhn gilt, erhalten
wir die entscheidende Ungleichung
D f ≤ Mhn + |hn |
für alle n ≥ 1. Nun folgt nämlich weiter
λλ d ({|hn | > t}) ≤
1
t
Z
{|hn |>t}
|hn | dλλ d ≤
1
1
khn k1 ≤
,
t
tn
was in Kombination mit (B.12) für hn die für alle t > 0 und n ≥ 1 gültige Abschätzung
λλ d ({D f > 2t}) ≤ λλ d ({Mhn > t}) + λλ d ({|hn | > t}) ≤
3d + 1
n
liefert, also D f = 0 λλ d -f.ü.
t
u
Ein Blick auf (B.11) legt nahe, den dortigen Limes als Ableitung von µ bzgl. λλ d
im Punkt x aufzufassen, die nach dem gerade bewiesenen Satz λλ d -f.ü. existiert. Dies
erklärt, warum die L-Dichte f häufig auch als Radon-Nikodym-Ableitung bezeichnet
wird. Wegen seiner Bedeutung halten wir diese Feststellung in einem Korollar fest.
Korollar B.14. Ist µ ein L-stetiges Borel-Maß auf Rd mit L-Dichte f , so existiert
(Dµ)(x) := lim
r→0
µ(B(x, r))
λλ d (B(x, r))
für λλ d -fast alle x ∈ Rd , und es gilt f = Dµ λλ d -f.ü.
Als weiteres Korollar notieren wir, dass der Limes in (B.10) weiterhin existiert,
wenn man dort die Kugeln B(x, r) durch Teilmengen ersetzt, die Volumina gleicher
Größenordnung besitzen. Wie in [35] nennen wir eine Mengenfolge (Bn )n≥1 regulär
fallend gegen x ∈ Rd , wenn es ein α > 0 und gegen 0 fallende Radien rn (n ≥ 1)
gibt derart, dass Bn ⊂ B(x, rn ) und λλ d (Bn ) ≥ αλλ d (B(x, rn )) für alle n ≥ 1 gilt.
B.6 Differentiation L-stetiger Borel-Maße und absolut stetige Funktionen
253
Korollar B.15. Sei f ∈ L1 (λλ d ). Dann gilt in jedem Lebesgue-Punkt x von f und
für jede gegen x fallende Mengenfolge (Bn )n≥1
1
lim d
n→∞ λ
λ (Bn )
Z
| f − f (x)| dλλ d = 0
Bn
sowie a fortiori
1
n→∞ λ
λ d (Bn )
lim
Z
f dλλ d = f (x).
Bn
Beweis. Mit α > 0 und rn wie oben beschrieben ergibt sich die Behauptung aus der
Abschätzung
α
λλ d (Bn )
Z
Bn
| f − f (x)| dλλ d ≤
1
λλ d (B(x, rn ))
Z
B(x,rn )
| f − f (x)| dλλ d ,
da die rechte Seite für n → ∞ gegen 0 konvergiert.
t
u
L-stetige Borel-Maße auf R und absolute Stetigkeit. Wir wenden uns nun
wieder dem eindimensionalen Fall (d = 1) zu, und zwar der noch offenen Frage,
wie sich die maßerzeugende Funktion eines L-stetigen Borel-Maßes charakterisieren lässt. Mittels der zuvor erzielten Resultate können wir eine erste Teilantwort
geben.
Satz B.16. Ein Borel-Maß µ auf R mit maßerzeugender Funktion F ist genau dann
L-stetig, wenn F λλ -f.ü. differenzierbar ist und mit F 0 = f
F(b) − F(a) =
Z
(a,b)
f (x) λλ (dx) für alle − ∞ ≤ a < b ≤ ∞
(B.13)
gilt.
Beweis. Zu zeigen sind offenbar nur die Aussagen bzgl. F, falls µ L-stetig ist. Sei
f die L-Dichte von µ und L f die Menge der Lebesgue-Punkte von f . Es reicht zu
zeigen, dass F in jedem x ∈ L f differenzierbar ist mit F 0 (x) = f (x). Für x ∈ L f gilt
aber
lim
r↓0
F(x + r) − F(x)
F(x) − F(x − r)
F(x + r) − F(x − r)
= lim
= lim
= f (x)
r↓0
r↓0
r
r
2r
gemäß Korollar B.15, denn hier ist B(x, r) = (x − r, x + r), und die Mengenfolgen
((x − rn , x))n≥1 und ((x, x + rn ))n≥1 sind für jede Wahl von rn ↓ 0 regulär fallend
gegen x.
t
u
254
B Ergänzungen zur Integrationstheorie
Da auch jede λλ -singuläre Verteilung eine λλ -f.ü. differenzierbare maßerzeugende
Funktion besitzt, besteht der entscheidende Zusatz in Satz B.16 gerade in der Gültigkeit von (B.13), also der Gültigkeit des Hauptsatzes der Differential- und Integralrechnung für die dortige Funktion F. Die damit noch zu beantwortende Frage lautet,
für welche F dies der Fall ist. Die Antwort hierauf führt uns zum Begriff der absoluten Stetigkeit, der als nächstes definiert wird.
Definition B.17. Seien a, b ∈ R mit a < b. Eine Funktion F : [a, b] → R heißt absolut stetig (auf [a, b]), wenn es zu jedem ε > 0 ein δ > 0 gibt, so dass
n
∑ |F(yk ) − F(xk )|
< ε
k=1
für jede Auswahl p.d. Intervalle (xk , yk ) ⊂ [a, b] (1 ≤ k ≤ n) gilt, die der Bedingung
∑nk=1 (yk − xk ) < δ genügen. In diesem Fall heißt
n
Va F(x) :=
sup
∑ |F(zk ) − F(zk−1 )|
[z0 ,...,zn ]∈Z[a,x] k=1
(x ∈ [a, b])
die Totalvariation von F auf [a, b]
Anmerkung B.18. (a) Wählt man n = 1 in der obigen Definition, folgt sofort, dass
jede absolut stetige Funktion insbesondere stetig im gewöhnlichen Sinne ist.
(b) Aus der Definition der Totalvariation ergibt sich leicht die Gleichung
n−1
Va F(x) =
∑ Vzk F(zk+1 − zk )
k=0
für alle [z0 , ..., zn ] ∈ Z[a, x].
(B.14)
Fixiert man dann ε = 1 und dazu δ > 0 gemäß der obigen Definition, so folgt offenbar Vzk F(zk+1 − zk ) < 1, sofern z ∈ Z[a, x] der Bedingung max0≤k<n (zk+1 − zk ) < δ
genügt (was offenbar n ≥ (x − a)/δ erzwingt) und folglich mit (B.14) die Endlichkeit von Va F auf ganz [a, b].
(c) Ist F monoton wachsend, so gilt offensichtlich Va F = F − F(a).
Mithilfe der Totalvariation können wir eine absolut stetige Funktion als Differenz
zweier monoton wachsender absolut stetiger Funktionen schreiben, wie das folgende Lemma zeigt. Da letztere zugleich maßerzeugende Funktionen bilden, können
wir im Anschluß zum Teil auf Satz B.16 zurückgreifen.
Lemma B.19. Sei F : [a, b] → R eine absolut stetige Funktion (a, b ∈ R). Dann gilt:
B.6 Differentiation L-stetiger Borel-Maße und absolut stetige Funktionen
(a)
(b)
255
Die Funktionen Va F, Va F + F und Va − F sind monoton wachsend und ebenfalls absolut stetig auf [a, b].
Es existieren monoton wachsende, absolut stetige Funktionen auf [a, b] derart, dass F = F1 − F2 .
Beweis. (a) Seien x, y ∈ [a, b] mit x < y beliebig gewählt. Wegen [z0 , ..., zn , y] ∈
Z[a, y], falls [z0 , ..., zn ] ∈ Z[a, x], folgt
Va F(y) ≥ Va F(x) + |F(y) − F(x)|
und daraus weiter
Va F(y) ≥ Va F(x) + F(y) − F(x) und Va F(y) ≥ Va F(x) + F(x) − F(y).
Dies zeigt die Monotonie der drei angegebenen Funktionen. Da Summen absolut
stetiger Funktionen offenkundig wieder absolut stetig sind, müssen wir nur noch
die absolute Stetigkeit von Va F nachweisen. Fixiere dazu ein beliebiges ε > 0 und
wähle dazu δ > 0 gemäß Definition B.17 für die absolut stetige Funktion F. Aus
(B.14) folgt für alle x, y ∈ [a, b] mit x < y
n
0 ≤ Va F(y) −Va F(x) = Vx (y − x) =
sup
∑ | f (zk ) − f (zk−1 )|,
[z0 ,...,zn ]∈Z[x,y] k=1
wobei ∑nk=1 (zk − zk−1 ) = y − x für jede Zerlegung von [z0 , ..., zn ] ∈ Z[x, y] gilt. Folglich ergibt sich für jede Auswahl p.d. (xk , yk ) ⊂ [a, b] (1 ≤ k ≤ m) mit ∑m
k=1 (yk −
xk ) < δ
m
0 ≤
∑ (Va F(yk ) −Va F(xk ))
< ε
k=1
und so die absolute Stetigkeit von Va F auf [a, b].
(b) Hier genügt der Hinweis, dass F1 := (Va F + f )/2 und F2 := (Va F − f )/2 das
Verlangte leisten.
t
u
Der jetzt folgende Satz beinhaltet über Satz B.16 hinaus die noch fehlende Charakterisierung derjenigen maßerzeugenden Funktionen, die zu L-stetigen BorelMaßen führen.
Satz B.20. Sei µ ein Borel-Maß auf R mit maßerzeugender Funktion F. Dann sind
äquivalent:
(a)
(b)
(c)
µ ist L-stetig mit λλ -Dichte f .
F ist λλ -f.ü. differenzierbar, und mit F 0 = f gilt (B.13).
F ist absolut stetig auf jedem Intervall [a, b] für −∞ < a < b < ∞.
256
B Ergänzungen zur Integrationstheorie
Beweis. Unter Hinweis auf Satz B.16 ist nur noch die Äquivalenz von (a) und (c)
nachzuweisen.
“(a)⇒(c)” Wir fixieren ein [a, b], a < b, und ein ε > 0. Gemäß Satz 6.27 existiert
dann ein δ > 0 derart, dass µ(A) < ε für alle A ∈ B(R) mit λλ (A) < δ . Wählt man
speziell A = ∑nk=1 (xk , yk ) mit p.d. (xk , yk ) ⊂ [a, b] und ∑nk=1 (yk − xk ) = λλ (A) < δ ,
folgt demnach
n
0 ≤
∑ (F(yk ) − F(xk ))
= µ(A) < ε,
k=1
was die absolute Stetigkeit von F auf [a, b] beweist.
“(c)⇒(a)” Wir zeigen, dass µ auf jedem beschränkten offenen Intervall (a, b)
L-stetig ist. Sei dazu irgendein (a, b) fixiert und N ⊂ (a, b) eine beliebige LNullmenge. Sei ferner ε > 0 beliebig und dazu δ > 0 gemäß Definition B.17 für die
Funktion F gewählt. Nach Satz A.6 existiert eine offene Menge A ⊂ (a, b) derart,
dass N ⊂ A und λλ (A) = λλ (A\N) < δ . Da Rd separabel ist, gibt es eine abzählbare Familie p.d. Intervalle {(xn , yn ) : n ≥ 1} derart, dass A = ∑n≥1 (xn , yn ). Aus
∑n≥1 (yn − xn ) = λλ (A) < δ folgt dann
µ(N) ≤ µ(A) =
∑ (F(yn ) − F(xn ))
< ε
n≥1
und somit µ(N) = 0, da ε > 0 beliebig vorgegeben war.
t
u
Auf der Grundlage der vorhergehenden Ergebnisse ergibt sich schließlich der
Hauptsatz der Differential- und Integralrechnung für absolut stetige Funktionen quasi als einfache Zugabe. In Einführungskursen über Analysis wird dieser Satz üblicherweise nur für stetig differenzierbare und folglich R-integrierbare Funktionen
bewiesen.
Satz B.21. (Hauptsatz der Differential- und Integralrechnung) Jede absolut stetige Funktion F : [a, b] → R (a, b ∈ R) ist λλ -f.ü. differenzierbar mit L-intgerierbarer
Ableitung F 0 = f , und es gilt
F(x) − F(a) =
Z
(a,x)
f dλλ
für alle x ∈ [a, b].
(B.15)
Beweis. Dank Lemma B.19 können wir F als Differenz von zwei monoton wachsenden absolut stetigen Funktionen F1 und F2 schreiben, die folglich maßerzeugende Funktionen von endlichen L-stetigen Borel-Maßen µ1 , µ2 auf [a, b] bilden. Diese
Maße können wir natürlich in der üblichen Weise auch als Borel-Maße auf R auffassen, deren maßerzeugenden Funktion dann weiterhin F1 , F2 bilden, sofern wir
Fi (x) = Fi (a) für x < a und Fi (x) = Fi (b) für x > b definieren (i = 1, 2). Alle Aussagen ergeben sich nun unter Berufung auf Satz B.16 für (µ1 , F1 ) und (µ2 , F2 ) und
der Linearität des Maßintegrals.
t
u
B.7 Die Transformationsformel für L-Integrale
257
B.7 Die Transformationsformel für L-Integrale
Hauptziel dieses Abschnitts bildet die Herleitung der in der Überschrift genannten Transformationsformel für L-Integrale, die auch als Substitutionsregel im Rd
bezeichnet wird. Obgleich eine Formel zur Berechnung von Integralen, macht sie
letztendlich eine Aussage über das Bild des L-Maßes λλ d unter bijektiven stetig
differenzierbaren Abbildungen Φ : U → V für offene Mengen U,V ⊂ Rd . Da der
Beweis dieser Formel im wesentlichen auf der lokalen Approximation von Φ durch
lineare Abbildungen beruht, kehren wir nochmals zurück zu einem Studium der
Transformationseigenschaften des L-Maßes unter allgemeinen linearen Bijektionen
des Rd , die sich bekanntlich durch reguläre Matrizen und Translationen beschreiben
lassen.
Im Folgenden bezeichne GL(d, R) die multiplikative Gruppe der regulären reellen d × d-Matrizen sowie I die d-dimensionale Einheitsmatrix. Es sei ferner
SL(d, R) die Untergruppe derjenigen T mit | det T| = 1, die insbesondere alle orthogonalen Matrizen enthält. Die Hintereinanderschaltung einer orthogonalen Abbildung und einer Translation heißt Bewegung. Die Gesamtheit all dieser Abbildungen bildet wiederum eine Gruppe, genannt Bewegungsgruppe und bezeichnet mit
Bew(Rd ). Wie in der linearen Algebra gezeigt wird, ist eine Bijektion T : Rd → Rd
genau dann eine Bewegung, wenn sie den euklidischen Abstand erhält, d.h.
|T(x) − T(y)| ≤ |x − y| für alle x, y ∈ Rd .
Die nächsten zwei Ergebnisse klären, wie sich das Bild von λλ d unter den zuvor
genannten Abbildungen verhält, und stellen zugleich eine Erweiterung der in Satz
2.17 und Beispiel 3.17 gefundenen Eigenschaften dar.
Satz B.22. Für jedes T ∈ GL(d, R) gilt (λλ d )T = | det T|−1 λλ d .
Beweis. Wir notieren vorab, dass T(B), T−1 (B) ∈ B(Rd ) für alle B ∈ B(Rd ) gilt,
und schreiben der Kürze halber λ für λλ d . Der Beweis vollzieht sich in vier Schritten:
(1) Das Maß λ T ist wieder translationsinvariant, denn
λ T (a + B) = λ T (Tb + B) = λ (b + T−1 (B)) = λ (T−1 (B)) = λ T (B)
für alle a ∈ Rd und B ∈ B(Rd ). Dabei gilt a = Tb für ein eindeutig bestimmtes
b ∈ Rd , weil T bijektiv ist. Aus der Stetigkeit von T−1 und der Kompaktheit von
[0, 1]d folgt, dass T−1 ([0, 1]d ) kompakt ist und deshalb c(T) := λ T ([0, 1]d ) < ∞ gilt.
Vermöge Satz 2.17(b) folgern wir nun λ T = c(T)λ . Zu zeigen bleibt also c(T) =
| det T|−1 , wobei
S
d) ≤
∞ = λ T (Rd ) = λ T
(q
+
[0,
1]
d
∑q∈Qd λ T (q + [0, 1]d )
q∈Q
258
B Ergänzungen zur Integrationstheorie
offenbar c(T) > 0 garantiert.
(2) Für S, T ∈ GL(d, R) gilt c(ST) = c(S)c(T), denn
λ ST (B) = λ T (S−1 (B)) = c(T)λ (S−1 (B)) = c(T)λ S (B) = c(S)c(T)λ (B)
für alle B ∈ B(Rd ). Insbesondere ist c(T−1 ) = c(T)−1 wegen 1 = c(I) = c(T−1 )c(T)
und damit außerdem c(T1 ) = c(T2 ), falls T1 = ST2 S−1 für ein S ∈ GL(d, R). Die
Funktion c(·) ist also ebenso wie | det(·)| ein Homomorphismus von der multiplikativen Gruppe GL(d, R) in die multiplikative Gruppe R> .
>
(3) Bezeichnet T> ∈ GL(d, R) die Transponierte von T, so gilt λ T = λ T , d.h.
c(T) = c(T> ). Zum Beweis sei n ≥ 1 so groß gewählt, dass
0 < λ (B) < ∞
für B := T−1 ([−n, n]d ) ∩ (T> )−1 ([−n, n]d ).
Dann gilt offenkundig T−1 (B) = (T> )−1 (B), was
>
c(T)λ (B) = λ T (B) = λ T (B) = c(T> )λ (B)
und somit c(T) = c(T> ) impliziert.
(4) Schließlich betrachten wir T> T ∈ GL(d, R), die als symmetrische Matrix
diagonalisierbar ist, also T> T = SDS−1 für eine geeignete Diagonalmatrix D ∈
GL(d, R) und ein S ∈ GL(d, R) erfüllt. Unter Berufung auf (2) und (3) ergibt sich
nun
c(T)2 = c(T> )c(T) = c(T> T) = c(D),
also c(T) = c(D)1/2 , und ganz entsprechend | det T| = | det D|1/2 . Wie aber in Bsp.
3.17 bereits gezeigt wurde, gilt c(D) = | det D|−1/2 [+ (3.4)]. Vermöge c(T) =
c(D)1/2 = | det D|−1/2 = | det T|−1 folgt daher die Behauptung .
t
u
Hinsichtlich der anderen zu Beginn des Abschnitts genannten Abbildungen erhalten wir nun leicht das folgende Ergebnis.
Korollar B.23. Das L-Maß λλ d ist
(a)
(b)
invariant unter SL(d, R), d.h. (λλ d )S = λλ d für alle S ∈ SL(d, R).
bewegungsinvariant, d.h. (λλ d )T = λλ d für alle T ∈ Bew(Rd ).
Beweis. Teil (a) ergibt sich sofort aus dem vorherigen Satz, da | det S| = 1 für alle
S ∈ SL(d, R). Für Teil (b) benötigen wir zusätzlich die Translationsinvarianz von
λλ d , denn jede Bewegung ist die Hintereinanderschaltung Tc ◦ S für eine Translation
Tc (c ∈ Rd ) und eine orthogonale Abbildung S. Dies liefert dann wie verlangt
(λλ d )Tc ◦S (B) = (λλ d )S (Tc−1 (B)) = λλ d (Tc−1 (B)) = (λλ d )Tc (B) = λλ d (B)
für alle B ∈ B(Rd ).
t
u
B.7 Die Transformationsformel für L-Integrale
259
Als weitere Folgerung notieren wir die folgende Erweiterung von Satz 2.17(d).
Korollar B.24. Jede affine Hyperebene des Rd ist eine λλ d -Nullmenge.
Beweis. Gemäß Satz 2.17(d) wissen wir, dass λλ d (Hc,i ) = 0 für jedes Hc,i = {a : ai =
c} (c ∈ R und i = 1, ..., d) gilt. Bezeichnet nun H eine beliebige affine Hyperebene
des Rd , so existiert ein T ∈ Bew(Rd ) derart, dass T−1 (Hc,1 ) = H. Unter Benutzung
der Bewegungsinvarianz von λλ d ergibt sich daher
λλ d (H) = λλ d (T−1 (Hc,1 )) = (λλ d )T (Hc,1 ) = λλ d (Hc,1 ) = 0
t
u
und somit die Behauptung.
Wir kommen nun zur angekündigten Transformationsformel für L-Integrale. Seien
U und V offene Teilmengen des Rd . Φ : U → V heißt C1 -Diffeomorphismus oder
C1 -invertierbar, wenn sowohl Φ als auch Ψ := Φ −1 stetig (partiell) differenzierbar
ist. Wir bezeichnen dann mit DΦ die Funktionalmatrix von Φ = (Φ1 , ..., Φd ), d.h.

 ∂Φ
∂ Φ1
1
∂ u1 (u) . . . ∂ ud (u)
 .
.. 
..

DΦ (u) = 
.
.  (u ∈ U).
 ..
∂ Φd
∂ Φd
∂ u (u) . . . ∂ u (u)
1
d
Für einen C1 -Diffeomorphismus Φ ist DΦ in jedem Punkt u ∈ U invertierbar, und
es folgt
(DΦ (u))−1 = DΨ (v) mit v := Φ(u).
(B.16)
Satz B.25. (Transformationsformel für L-Integrale) Seien U und V zwei offene
Teilmengen des Rd und Φ : U → V ein C1 -Diffeomorphismus. Eine meßbare numerische Funktion g : (V, B(V )) → (R, B(Rq )) ist genau dann über V L-integrierbar,
wenn | det DΦ | g ◦ Φ über U L-integrierbar ist, und es gilt in diesem Fall
Z
g dλλ d =
V
Z
U
g ◦ Φ | det DΦ | dλλ d .
(B.17)
Die linke Seite der Formel (B.17) lässt sich mittels des Transformationssatzes
3.46 auch in der Form
Z
g ◦ Φ d(λλ d )Ψ
U
schreiben, und dank desselben Satzes wissen wir, dass g ◦ Φ genau dann (λλ d )Ψ integrierbar ist, wenn g L-integrierbar ist. Auch kann man jede meßbare Funktion
h : (U, B(U)) → (R, B(R)) vermöge (h ◦Ψ ) ◦ Φ nach Φ faktorisieren. Mit diesen
260
B Ergänzungen zur Integrationstheorie
Beobachtungen entpuppt sich Satz B.25 aber als nichts anderes als eine äquivalente
Variante des folgenden Satzes über das Bild von λλ d unter Ψ .
Satz B.26. Unter den Voraussetzungen von Satz B.25 gilt auf (U, B(U))
(λλ d )Ψ = | det DΦ | λλ d
d.h., (λλ d )Ψ ist L-stetig auf U mit λλ d -Dichte | det DΦ |.
Statt Satz B.25 werden wir diese äquivalente Version beweisen, wofür das folgende Lemma den Schlüssel liefert.
Lemma B.27. Unter den Voraussetzungen von Satz B.25 gilt für jedes u ∈ U
(λλ d )Ψ (B(u, r))
= 1,
r→0 (λ
λ d )DΨ (v) (B(0, r))
lim
wobei v := Φ(u).
Beweis. Wir fixieren ein u ∈ U und wählen r0 > 0 so klein, dass B(u, r0 ) ⊂ U. Aus
der stetigen Differenzierbarkeit von Φ folgt, dass
|Φ(x) − v − DΦ (u)(x − u)| ≤ γ(|x − u|)
für alle x ∈ B(u, r0 ) und eine Funktion γ : (0, r0 ) → R> mit limr→0 r−1 γ(r) = 0 gilt.
Die Funktion
|Φ(x) − v|
(B.18)
[0, r0 ) 3 r 7→ ϕu (r) := max
|x−u|≤r |x − u|
ist deshalb stetig mit ϕu (0) = kDΦ (u)k > 0, wobei an kDk = max|x|≤1 |Dx|/|x|
erinnert sei. Weiter folgt nun die Inklusion
Ψ −1 (B(u, r)) = Φ(B(u, r)) ⊂ B(v, ϕ(r)) für alle r ∈ (0, r0 ).
Eine Taylor-Entwicklung von Ψ (y) in v liefert (wie zuvor für Φ) für eine geeignete
Funktion ρ : (0, r1 ) → R> mit limr→0 r−1 ρ(r) = 0, dass
|Ψ (y) − u − DΨ (v)(y − v)| ≤ ρ(|y − v|) für alle y ∈ B(v, r1 ),
wobei r1 > 0 so gewählt wird, dass B(v, r1 ) ⊂ V . Mit w := DΨ (v)v impliziert dies
|Ψ (y) − u| − ρ(r) ≤ |DΨ (v)y − w| ≤ |Ψ (y) − u| + ρ(r) für alle y ∈ B(v, r1 ).
Setzen wir schließlich κ := ρ ◦ ϕ und notieren, dass limr→0 r−1 κ(r) = 0, so ergibt
sich für alle hinreichend kleinen r die entscheidende Inklusionskette
B.7 Die Transformationsformel für L-Integrale
261
(DΨ (v))−1 (B(w, r − κ(r))) ⊂ Ψ −1 (B(u, r)) ⊂ (DΨ (v))−1 (B(w, r + κ(r))).
Da DΨ (v) ∈ GL(d, R), erhalten wir nun nämlich unter Benutzung von Satz B.22
(λλ d )DΨ (v) (B(w, r ± κ(r)))
λλ d (B(0, r ± κ(r)))
=
=
λλ d (B(0, r))
(λλ d )DΨ (v) (B(w, r))
κ(r) d
1±
→ 1,
r
falls r → 0, und dann
(λλ d )Ψ (B(u, r))
(λλ d )Ψ (B(u, r))
=
lim
= 1,
r→0 (λ
r→0 (λ
λ d )DΨ (v) (B(0, r))
λ d )DΨ (v) (B(w, r))
lim
t
u
was zu beweisen war.
Lemma B.28. Unter den Voraussetzungen von Satz B.25 gilt (λλ d )Ψ λλ d .
Beweis. Sei N ∈ B(U) eine beliebige, o.B.d.A. beschränkte L-Nullmenge, für die
nun (λλ d )Ψ (N) = λλ d (Φ(N)) = 0 gezeigt wird. Wir fixieren dazu ein beliebiges
ε > 0 und definieren die stetige Funktion ΓΦ : U ×U → R durch
( |Φ(y)−Φ(x)|
, falls x 6= y,
|y−x|
ΓΦ (x, y) :=
DΦ (x),
falls x = y.
Für k, n ∈ N sei dann
En,k :=
n
x∈U :
sup
y∈B(x,1/k)∩U
o
ΓΦ (x, y) < n .
Wie man leicht
einsieht, ist jedes En,k eine offene Menge und deshalb meßbar. FerS
ner gilt U = k,n≥1 En,k . Folglich reicht es, (λλ d )Ψ (N ∩ En,k ) = 0 für alle k, n ∈ N zu
zeigen.
Wir fixieren nun n, k ∈ N und wählen Kugeln B(xi , ri ) (i ∈ I) für eine höchstens
abzählbare Indexmenge I derart, dass
sup ri < 1/k,
i
N ∩ En,k ⊂
[
i
B(xi , ri ) und
∑ λλ d (B(xi , ri )) < ε.
i
Dies ist möglich, weil λλ d regulär ist und N ∩ En,k deshalb bzgl. λλ d von außen beliebig genau durch eine offene Menge G ⊂ En,k approximiert werden kann, die sich
ihrerseits als abzählbare, p.d. Vereinigung von d-dimensionalen, links halboffenen
dyadischen Würfeln An,i [+ (2.4)] darstellen lässt. Für jedes x ∈ G gibt es nämlich
genau einen solchen dyadischen Würfel Q maximaler Kantenlänge mit x ∈ Q ⊂ G.
Jeder Würfel mit Kantenlänge 2−n ist aber seinerseits in der Kugel mit dem gleichen
Zentrum und dem Radius d 1/2 2−n−1 enthalten.
Aus xi ∈ En,k und ri < 1/k folgern wir |Φ(x) − Φ(xi )| < n|x − xi | < nri für alle
x ∈ B(xi , ri ) und daraus weiter
262
B Ergänzungen zur Integrationstheorie
Φ(B(xi , ri )) ⊂ B(Φ(xi ), nri )
für jedes i ∈ I. Also gilt
Φ(N ∩ En,k ) ⊂
[
i∈I
Φ(B(xi , ri )) ⊂
[
B(Φ(xi ), nri ),
i∈I
was uns schließlich unter Benutzung der Transformationseigenschaften des LMaßes
(λλ d )Ψ (N ∩ En,k ) = λλ d (Φ(N ∩ En,k ))
≤
∑ λλ d (B(Φ(xi ), nri ))
i∈I
=
∑ nd λλ d (B(xi , ri ))
< nd ε
i∈I
und somit (λλ d )Ψ (N ∩ En,k ) = 0 beschert, da ε > 0 beliebig vorgegeben war.
t
u
Beweis (von Satz B.26). Wir müssen jetzt nur noch die zuvor gezeigten Ergebnisse
in geeigneter Weise zusammenfügen. Wie gerade gezeigt, gilt (λλ d )Ψ λλ d , d.h.,
(λλ d )Ψ besitzt nach dem Satz von Radon-Nikodym eine λλ d -Dichte f . Für diese gilt
wiederum gemäß Korollar B.14 sowie Korollar B.27
(λλ d )Ψ (B(u, r))
(λλ d )DΨ (v) (B(0, r))
= lim
d
r→0 λ
r→0
λ (B(u, r))
λλ d (B(u, r))
f (u) = lim
für λλ d -fast alle u ∈ U, wobei v = Φ(u). Eine Kombination von Satz B.22 und
Korollar B.14 liefert aber
(λλ d )DΨ (v) (B(u, r))
1
(λλ d )DΨ (v) (B(0, r))
= lim
=
d
r→0
r→0
| det DΨ (v)|
λλ (B(u, r))
λλ d (B(u, r))
lim
für λλ d -fast alle u ∈ U, und da | det DΨ (v)|−1 = | det DΦ (u)| gemäß (B.16) gilt, folgt
schließlich wie behauptet f = | det DΦ | λλ d -f.ü.
t
u
Anhang C
Requisiten der W-Theorie
C.1 Eine Übersicht nützlicher Integralformeln
In diesem Abschnitt sind einige nützliche Integrationsformeln, die sich direkt aus
Satz 6.45 ergeben, zusammengestellt. Wir geben das Ergebnis in seiner wahrscheinlichkeitstheoretisch relevanten Form nochmals an:
Satz C.1. Seien X eine nichtnegative ZG auf einem W-Raum (Ω , A, P) und ϕ :
R> → R> eine stetige, monoton wachsende und auf R> stetig differenzierbare
Funktion mit ϕ(0) = 0. Dann gilt für alle A ∈ A
Z
ϕ(X) dP =
Z ∞
0
A
ϕ 0 (t) P(A ∩ {X > t}) dt.
(C.1)
Das anschließende Korollar stellt die wichtigsten Spezialfälle von (C.1) zusammen.
Korollar C.2. Für jede nichtnegative ZG X und a, p > 0 gilt:
EX =
EX p =
Z
{X>a}
X p dP =
Z ∞
Z0 ∞
0
Z ∞
P(X > t) dt,
(C.2)
pt p−1 P(X > t) dt,
(C.3)
0
pt p−1 P(X > t ∨ a) dt
p
p−1
= a P(X > a) +
E (X − a)+
p
=
Z ∞
a
Z ∞
a
pt
(C.4)
P(X > t) dt,
p(t − a) p−1 P(X > t) dt,
(C.5)
263
264
C Requisiten der W-Theorie
Z a
E(X ∧ a) p =
0
Z ∞
E(eaX − 1) =
0
Z ∞
E(1 − e−aX ) =
0
pt p−1 P(X > t) dt,
(C.6)
aeat P(X > t) dt,
(C.7)
ae−at P(X > t) dt.
(C.8)
Ist X außerdem P-f.s. ganzzahlig, so gilt weiter:
EX =
∑ P(X > n),
(C.9)
n≥0
EX 2 =
∑ (2n + 1) P(X > n),
(C.10)
n≥0
sowie für a ∈ R
E(eaX − 1) = (ea − 1)
∑ ean P(X > n).
(C.11)
n≥0
Als Ergänzung notieren wir die für p ≥ 1 direkt aus (C.3) folgende Ungleichung
∑ p(n − 1) p−1 P(X > n)
n≥1
≤ EX p ≤
∑ p(n + 1) p−1 P(X > n)
(C.12)
n≥0
Es ist offensichtlich, das Ungleichungen vom selben Typ auch für p ∈ (0, 1) und für
jede der übrigen Integrationsformeln (C.4)–(C.8) angegeben werden können.
Durch Zerlegung von X in Positiv- und Negativteil lassen sich weitere Formeln
aus (C.1) für reelle ZG herleiten. Herausgreifen wollen wir hier nur die für Erwartungswert und Varianz.
Korollar C.3. Für jede quasi-integrierbare ZG X gilt
EX =
Z ∞
0
P(X > t) − P(X < −t) dt.
(C.13)
Existiert auch ihre Varianz Var X, so gilt für diese
Var X =
wobei µ = EX.
Z ∞
0
(2t − µ)P(X > t) + (2t + µ)P(X < −t) dt,
(C.14)
Herunterladen