Anhang A Ergänzungen zur Maßtheorie A.1 Beweis des Maßerweiterungssatzes und Folgerungen Der Beweis des Maßerweiterungssatzes 2.10 bedarf zunächst einiger Vorbereitungen, vor allem der Einführung des äußeren Maßes. Wir folgen hierbei weitgehend der Darstellung in [5, §5]. Sei R ein Ring über einer nichtleeren Menge Ω und µ ein Prämaß µ über (Ω , R). Für jedes C ⊂ Ω bezeichne U (C) die Menge aller Überdeckungen von C durch Mengen aus R, also aller Folgen (An )n≥1 derart, dass An ∈ R für jedes n ≥ 1 S und C ⊂ n≥1 An gilt. Wegen 0/ ∈ R kann man jede endliche C überdeckende Familie {A1 , ..., An } ⊂ R durch (A1 , ..., An , 0, / ...) zu einer Folge aus U (C) erweitern. Das zu µ assoziierte äußere Maß µ ∗ : P(Ω ) → R> wird definiert durch ( inf ∑n≥1 µ(An ) : (An )n≥1 ∈ U (C) , falls U (C) 6= 0, / ∗ µ (C) := (A.1) ∞, sonst und besitzt die folgenden leicht nachweisbaren Eigenschaften: µ ∗ (0) / = 0, ∗ µ∗ ∗ µ (C1 ) ≤ µ (C2 ), ! [ n≥1 Cn ≤ (A.2) falls C1 ⊂ C2 , ∑ µ ∗ (Cn ) n≥1 für alle C1 ,C2 , .. ⊂ Ω , µ ∗ (A) = µ(A) für alle A ∈ R. (A.3) (A.4) (A.5) Die vorletzte Bedingung (Subadditivität von µ ∗ ) liefert insbesondere µ ∗ (C) ≤ µ ∗ (C ∩ A) + µ ∗ (C ∩ Ac ) für alle A,C ⊂ Ω . (A.6) Eine Menge A ⊂ Ω heißt µ ∗ -messbar, falls auch die umgekehrte Ungleichung und somit Gleichheit für alle C ⊂ Ω gilt, also 225 226 A Ergänzungen zur Maßtheorie µ ∗ (C) = µ ∗ (C ∩ A) + µ ∗ (C ∩ Ac ) für alle C ⊂ Ω . (A.7) Es bezeichne A∗ das System der µ ∗ -messbaren Mengen. Der folgende Satz, der auf C. C ARATHEODORY zurückgeht, ebnet den Weg zur Erweiterung von µ zu einem Maß auf der von R erzeugten σ -Algebra. Satz A.1. (von Caratheodory) In der gegebenen Situation gilt: (a) (b) A∗ ist eine σ -Algebra, die R enthält. Die Einschränkung von µ ∗ auf A∗ ist ein Maß. Beweis. (a1) Wir zeigen als erstes R ⊂ A∗ . Seien dazu A ∈ R und C ⊂ Ω beliebig gewählt und o.B.d.A. µ ∗ (C) < ∞ angenommen, da sonst wegen (A.6) nichts zu zeigen ist. Fixiere irgendein ε > 0 und wähle (An )n≥1 ∈ U (C) derart, dass ∑n≥1 µ(An ) ≤ µ ∗ (C) + ε. Unter Beachtung von An ∩ A, An ∩ Ac ∈ R, der Additivität von µ auf R sowie (An ∩ A)n≥1 ∈ U (C ∩ A), (An ∩ Ac )n≥1 ∈ U (C ∩ Ac ) folgt dann µ ∗ (C) + ε ≥ ∑ µ(An ) n≥1 = ∑ µ(An ∩ A) + ∑ µ(An ∩ Ac ) n≥1 ∗ n≥1 ∗ ≥ µ (C ∩ A) + µ (C ∩ Ac ) und somit (A.7). (a2) Als nächstes zeigen wir, dass A∗ eine Algebra und daher insbesondere ∩stabil ist [+ Anm. 2.2]. Daß A∗ die Menge Ω enthält und unter der Bildung von Komplementen abgeschlossen ist, sieht man sofort. Nachzuweisen bleibt deshalb nur, dass mit A, B auch A ∪ B ∈ A∗ liegt. Zunächst erhält man für alle C ⊂ Ω durch zweimalige Benutzung von (A.7) µ ∗ (C) = µ ∗ (C ∩ A) + µ ∗ (C ∩ Ac ) = µ ∗ (C ∩ A ∩ B) + µ ∗ (C ∩ A ∩ Bc ) + µ ∗ (C ∩ Ac ∩ B) + µ ∗ (C ∩ Ac ∩ Bc ) und dann nach Ersetzen von C durch C ∩ (A ∪ B) µ ∗ (C ∩ (A ∪ B)) = µ ∗ (C ∩ A ∩ B) + µ ∗ (C ∩ A ∩ Bc ) + µ ∗ (C ∩ Ac ∩ B). (A.8) Subtrahiert man diese Gleichung von der vorherigen, so ergibt sich die gewünschte Beziehung µ ∗ (C) = µ ∗ (C ∩ (A ∪ B)) + µ ∗ (C ∩ (A ∪ B)c ) für alle C ⊂ Ω und somit A ∪ B ∈ A∗ . (a3) Wir beenden den Beweis von (a) mit dem Nachweis, dass A∗ ein ∩-stabiles Dynkin-System und daher dank Satz 1.14 eine σ -Algebra ist. Gegeben p.d. A.1 Beweis des Maßerweiterungssatzes und Folgerungen 227 A1 , A2 , ... ∈ A∗ , müssen wir hierfür noch ∑n≥1 An ∈ A∗ zeigen. Wählen wir A = A1 und B = A2 in (A.8), so folgt µ ∗ (C ∩ (A1 ∪ A2 )) = µ ∗ (C ∩ A1 ) + µ ∗ (C ∩ A2 ) für alle C ⊂ Ω und daraus per Induktion ! n µ ∗ C ∩ ∑ Ak n = k=1 Wegen µ ∗ C ∩ ∗ n µ (C) = ∑µ T c k≥1 Ak ∗ k=1 ∑ µ ∗ (C ∩ Ak ) ≤ µ∗ C ∩ (C ∩ Ak ) + µ für alle C ⊂ Ω und n ≥ 1. k=1 ∗ Tn C∩ c k=1 Ak n \ k=1 Ack ! vermöge (A.3) liefert dies n ≥ ∑µ k=1 ∗ (C ∩ Ak ) + µ ∗ für alle C ⊂ Ω und n ≥ 1, was schließlich unter Benutzung von (A.4) ! µ ∗ (C) ≥ ∑ µ ∗ (C ∩ Ak ) + µ ∗ k≥1 ! C∩ \ k≥1 k≥1 Ack ! Ack k≥1 ≥ µ ∗ C ∩ ∑ Ak + µ ∗ C ∩ C∩ \ \ k≥1 Ack ! (A.9) für alle C ⊂ Ω und so ∑k≥1 Ak ∈ A∗ impliziert, da die umgekehrte Ungleichung gemäß (A.6) immer erfüllt ist. (b) Da (A.9) mit dem letzten Hinweis de facto eine Gleichung ist, folgt bei Wahl von C = Ω offenbar µ ∗ (∑k≥1 Ak ) = ∑k≥1 µ ∗ (Ak ), d.h. die σ -Additivität von µ ∗ auf A∗ . Zusammen mit (A.2) beweist dies, dass µ ∗ auf A∗ ein Maß bildet. t u Beweis (des Maßerweiterungssatzes). Für die Existenzaussage genügt der Verweis auf den vorherigen Satz, denn µ ∗ bildet eine Maßfortsetzung von µ auf σ (R) ⊂ A∗ . Der Beweis der Eindeutigkeitsaussage bietet eine willkommene Gelegenheit, das in Satz 1.22 formulierte DS-Argument zu verwenden: Seien also µ1 und µ2 zwei Fortsetzungen des Prämaßes µ auf die σ -Algebra A := σ (R), d.h. µ1 (A) = µ2 (A) = µ(A) für alle A ∈ R. Nach Voraussetzung existieren Ω1 , Ω2 , ... ∈ R derart, dass Ωn ↑ Ω und µ(Ωn ) < ∞ für alle n ≥ 1 gilt. Da R ∩-stabil und jedes RΩn eine Algebra ist [+ Anm. 2.3], bildet jedes µi,n := µi (· ∩ Ωn ) (i = 1, 2) eine Fortsetzung von µ(· ∩ Ωn ). Damit reicht es offenbar, die Eindeutigkeitsaussage unter den Voraussetzungen, dass R eine Algebra und µ ein endliches Prämaß auf R ist, zu zeigen. Sei also nun R eine Algebra und µ(Ω ) < ∞. Wir definieren das Mengensystem D := {A ∈ A : µ1 (A) = µ2 (A)}, welches natürlich R als Teilsystem enthält, und behaupten, dass D ein DynkinSystem bildet. Wegen Ω ∈ R folgt Ω ∈ D, und da Ac = Ω \A, folgt weiter für 228 A∈D A Ergänzungen zur Maßtheorie µ1 (Ac ) = µ1 (Ω ) − µ1 (A) = µ2 (Ω ) − µ2 (A) = µ2 (A), was Ac ∈ D zeigt. Sei schließlich A1 , A2 , ... eine Folge p.d. Elemente von D. Unter Benutzung der σ -Additivität von µ1 und µ2 erhalten wir dann ! ! µ1 ∑ Aj = j≥1 ∑ µ1 (A j ) = ∑ µ2 (A j ) j≥1 j≥1 = µ2 ∑ Aj j≥1 und somit ∑ j≥1 A j ∈ D. Folglich bildet D in der Tat ein Dynkin-System, das wegen R ⊂ D auch δ (R) enthält. Da R ∩-stabil ist, folgt weiter δ (R) = σ (R) = A vermöge Satz 1.21 und damit D = A. Also sind µ1 und µ2 auf ganz A identisch. t u Beweis (des Approximationssatzes 2.12). Da R eine Algebra bildet und somit Ω enthält, ist U (A) wegen (Ω , 0, / ...) ∈ U (A) für alle A ⊂ Ω nicht leer. Ferner entspricht µ auf A dem in (A.1) definierten äußeren Maß µ ∗ und ist endlich. Folglich existiert zu jedem A ∈ A und jedem ε > 0 eine Folge (Rn )n≥1 aus R mit S S A ⊂ C := k≥1 Rk und |µ(A) − µ(C)| < ε. Setzt man nun Cn := nk=1 Rk für n ≥ 1, so gilt Cn ∈ R, da R eine Algebra ist, µ(Cn ) ↑ µ(C), da µ stetig von unten ist, und folglich inf µ(A4B) ≤ inf µ(A4Cn ) < ε, B∈R was offenbar die Behauptung zeigt. n≥1 t u Zum Abschluss geben wir zwei Beispiele, die zeigen sollen, dass bei Verzicht auf die σ -Endlichkeit des Prämaßes µ im Maßerweiterungssatz in der Tat unendlich viele Maßfortsetzungen von µ existieren können. Beispiel A.2. Wie in Anm. 2.3 erwähnt, ist jede Algebra und folglich auch jede σ Algebra R über einer Teilmenge Λ ⊂ Ω zugleich ein Ring über Ω . Sei nun (Ω , A) irgendein messbarer Raum mit |Ω | ≥ 2 und Λ ∈ A eine echte, nichtleere Teilmenge von Ω . Sei ferner R die Spur von A unter Λ sowie µ irgendein endliches Maß auf (Λ , R), das in kanonischer Weise durch µ(A) := µ(A ∩ Λ ) zu einem Maß auf (Ω , A) fortgesetzt wird. Schließlich sei ν = δx für ein x ∈ Λ c . Dann stimmt µc := µ + cν für jedes c ≥ 0 mit µ auf R überein und definiert dort ein Prämaß. Gleichzeitig ist aber offenbar jedes µc als Maß auf (Ω , A) eine Fortsetzung von µ mit c = µc (Λ c ) 6= µ(Λ c ). Beachte bei diesem Beispiel, dass µ ungeachtet der Endlichkeit von µ(Λ ) kein σ -endliches Prämaß auf (Ω , R) bildet, weil R keine Ω ausschöpfende Folge enthält. Und weil außerdem Ω 6∈ R sowie µc (Λ ) < ∞ für alle c ≥ 0 gilt, zeigt dieses Beispiel ferner, dass in Satz 2.11 die Voraussetzung Ω ∈ R nicht ersatzlos gestrichen werden kann. Beispiel A.3. Als zweites Beispiel [+ auch [36, Bem. (2.40)]] betrachten wir dass Prämaß µ := ∑n≥1 δ−1/n auf dem Ring F = F 1 der eindimensionalen dyadischen Figuren gemäß (2.6) über R. Dieses ist nicht σ -endlich, da jede R ausschöpfende isotone Folge (Ωn )n≥1 in F für hinreichend große n ein dyadisches Intervall der Form (−2−m , 0] (m ∈ N) enthält, was µ(Ωn ) = ∞ für solche n impliziert. Beachtet A.2 Vitali-Mengen und Beweis von Satz 2.18 229 man ferner, dass 0 ∈ A und A ∈ R stets A = (−2−m , 0] für ein m ∈ N und deshalb |A ∩ {−1/n : n ∈ N}| = ∞ impliziert, so folgt, dass alle µc := µ + cδ0 (c ≥ 0) auf R mit µ übereinstimmen, aber als Maße auf (R, B(R)) paarweise verschiedene Fortsetzungen definieren. A.2 Vitali-Mengen und Beweis von Satz 2.18 Beweis (von Satz 2.18). Nehmen wir an, dass B(Rd ) = P(Rd ) gilt und somit λλ d auf der ganzen Potenzmenge von Rd ein translationsinvariantes Maß bildet. Durch x ∼ y :⇔ x − y ∈ Qd wird eine Äquivalenzrelation auf Rd definiert, die folglich eine Partition des Raumes in p.d. Äquivalenzklassen der Form x + Qd für ein x ∈ Rd induziert. Vermöge des Auswahlaxioms können wir aus jeder dieser Klassen einen Vertreter wählen, die zusammen eine Menge V ergeben. Diese kann o.B.d.A. als Teilmenge von (0, 1]d gewählt werden, denn zu jedem x ∈ Rd gibt es genau ein n ∈ Zd ⊂ Qd mit x + n ∈ (0, 1]d . Damit gilt Rd = ∑x∈V (x + Qd ), aber auch Rd = ∑ (q +V ), (A.10) q∈Qd denn die q+V für q ∈ Qd sind ebenfalls p.d. Aus (q+V )∩(r+V ) 6= 0/ folgt nämlich q + x = r + y für geeignete x, y ∈ V , also x − y ∈ Qd , was nach Wahl der Menge V schon x = y und dann weiter q = r impliziert. Da Qd abzählbar ist, sichert die σ Additivität von λλ d in (A.10) ∑ λλ d (q +V ) = λλ d (Rd ) = ∞, q∈Qd also λλ d (q+V ) > 0 für ein und dann vermöge der Translationsinvarianz alle q ∈ Qd , insbesondere natürlich λλ d (V ) > 0. Nun gilt aber wegen V ⊂ (0, 1]d offenbar ∑ q∈Qd ∩(0,1]d (q +V ) ⊂ (0, 2]d , was unmöglich ist, weil einserseits λλ d ((0, 2]d ) = 2d < ∞, andererseits ∑ q∈Qd ∩(0,1]d λλ d (q +V ) = |Qd ∩ (0, 1]d | λλ d (K) = ∞ unter nochmaliger Benutzung der Translationsinvarianz sowie λλ d (V ) > 0 gilt. Also ist V keine Borel-Menge und B(Rd ) 6= P(Rd ). t u Anmerkung A.4. Eine nicht Borelsche Menge V der zuvor konstruierten Form unter Verwendung des Auswahlaxioms wird als Vitali-Menge bezeichnet, benannt nach dem ital. Mathematiker G. V ITALI. 230 A Ergänzungen zur Maßtheorie Anmerkung A.5. (Vervollständigung) Ein Maßraum (Ω , A, µ) heißt vollständig, die σ -Algebra A entsprechend vollständig bezüglich µ oder µ-vollständig, wenn aus A ∈ A mit µ(A) = 0 schon B ∈ A für alle B ⊂ A folgt, wenn also Teilmengen von µ-Nullmengen ebenfalls messbar und damit µ-Nullmengen bilden. Umgekehrt lässt sich zu jeder σ -Algebra A deren µ-Vervollständigung Aµ in folgender Weise definieren: Sei Nµ := {N ∈ P(Ω ) : N ⊂ A für ein A ∈ A mit µ(A) = 0}. der Ring aller Teilmengen von µ-Nullmengen, der sogar abgeschlossen ist unter abzählbaren Vereinigungen. Dann lässt sich leicht zeigen, dass Aµ : = {A ∪ N : A ∈ A, N ∈ Nµ } wieder eine σ -Algebra definiert, die zum einen µ-vollständig ist und zum anderen offensichtlich Aµ = σ (A ∪ Nµ ) erfüllt. Sie wird als Vervollständigung von A bezüglich µ bezeichnet.Vermöge der kanonischen Festlegung µ(A ∪ N) := µ(A) für alle N ∈ Nµ erhält man schließlich eine Fortsetzung von µ als Maß auf der Vervollständigung Aµ . Die λλ d -Vervollständigung von B(Rd ) wird Lebesguesche σ -Algebra genannt und mit L (Rd ) bezeichnet, ihre Elemente heißen Lebesgue-Mengen. Wie man sofort sieht, ist das L-Maß auf L (Rd ) weiterhin translationsinvariant, und dies zeigt weiter, dass die im Beweis von Satz 2.18 konstruierte Menge V auch keine Lebesgue-Menge sein kann, dass also auch L (Rd ) kleiner als P(Rd ) ist. A.3 Regularität von Borel-Maßen Ein Maß µ auf (Rd , B(Rd )) heißt regulär, wenn es die beiden folgenden Bedingungen erfüllt: µ(B) = sup{µ(K) : K ⊂ B, K kompakt} µ(B) = inf{µ(G) : B ⊂ G, G offen} für alle B ∈ B(Rd ), für alle B ∈ B(R ). d (A.11) (A.12) Die Eigenschaften (A.11) und (A.12) für sich genommen nennt man auch innere bzw. äußere Regularität. Ein Maß ist demnach regulär, wenn es sowohl von innen als auch von außen regulär ist. Satz A.6. Jedes endliche Borel-Maß µ auf Rd ist regulär. Beweis. Wir benutzen ein DS-Argument. Sei E das System der beschränkten links halboffenen Teilintervalle von Rd , das bekanntlich einen ∩-stabilen Erzeuger von A.4 Zerlegung von Borel-Maßen auf R 231 B(Rd ) bildet. Jedes I ∈ E erfüllt offenkundig die beiden Bedingungen (A.11) und (A.12). Betrachten wir nun das System D := {B ∈ B(Rd ) : B erfüllt (A.11) und (A.12)}. Wir müssen zeigen, dass D ein Dynkin-System ist: (1) Es gilt Rd ∈ D, weil Rd durch kompakte Mengen ausgeschöpft werden kann. (2) Falls B ∈ D, so existieren zu jedem ε > 0 ein Kompaktum K ⊂ B und eine offene Menge G ⊃ B, so dass µ(B) − ε ≤ µ(K) ≤ µ(G) ≤ µ(B) + ε. Es folgt Gc ⊂ Bc ⊂ K c und ferner, da µ endlich ist, µ(Bc ) − ε ≤ µ(Gc ) ≤ µ(K c ) ≤ µ(Bc ) + ε. Außerdem ist K c offen und Gc abgeschlossen. Wählt man nun n ≥ 1 so groß, dass µ(Rd \[−n, n]d ) < ε, so folgt für die kompakte Menge K ∗ := Gc ∩ [−n, n]d offenbar K ∗ ⊂ Bc und µ(K ∗ ) ≥ µ(Gc ) − ε ≥ µ(Bc ) − 2ε. Dies zeigt Bc ∈ D. (3) Gegeben eine Folge (Bn )n≥1 p.d. Elemente aus D, fixiere ein beliebiges ε > 0 und wähle kompakte Mengen Kn sowie offene Mengen Gn derart, dass Kn ⊂ Bn ⊂ Gn und µ(Bn ) − ε2−n ≤ µ(Kn ) ≤ µ(Gn ) ≤ µ(Bn ) + ε2−n für alle n ≥ 1 gilt. Beachte, dass die Kn ebenfalls p.d. sind. Setzen wir B := ∑n≥1 Bn , B[n] := ∑nj=1 B j , G := S n n≥1 Gn und K[n] := ∑ j=1 K j , so folgt K[n] ⊂ B[n] ⊂ B ⊂ G und µ(B[n] ) − ε ≤ µ(K[n] ) ≤ µ(G) ≤ µ(B) + ε für alle n ≥ 1. Ferner ist G offen und jedes K[n] kompakt. Da µ(B[n] ) → µ(B), können wir n so groß wählen, dass µ(B[n] ) ≥ µ(B) − ε. Dies zeigt offenbar B ∈ D. Somit ist D in der Tat ein Dynkin-System, welches E enthält und folglich bereits mit B(Rd ) übereinstimmt. t u A.4 Zerlegung von Borel-Maßen auf R Ergänzend zu den Ausführungen über Borel-Maße auf R in Unterabschnitt 2.4.1, dessen Bezeichnungen hier beibehalten seien, wird im Anschluss gezeigt, dass sich jedes solche Maß in eindeutiger Weise in einen stetigen und einen diskreten Anteil zerlegen lässt. Zu beliebiger maßerzeugender Funktion F definieren wir F d (x) := ∑ y∈D(F)∩(−∞,x] und zeigen zunächst: ∆F (y) und F c (x) := F(x) − F d (x) (A.13) 232 A Ergänzungen zur Maßtheorie Lemma A.7. Die Funktionen F d , F c sind ebenfalls maßerzeugend und F c außerdem stetig. Beweis. Für F d ergibt sich die Monotonie direkt aus der Definition, während die rechtsseitige Stetigkeit aus F d (x + ε) − F d (x) = ∑y∈D(F)∩(x,x+ε] ∆F (y) und D(F) ∩ (x, x + ε] ↓ 0/ für ε ↓ 0 folgt. Als Differenz zweier rechtsseitig stetiger Funktionen ist aber auch F c rechtsseitig stetig, so dass nur noch die Monotonie und die linksseitige Stetigkeit von F c zu zeigen bleiben. Hierfür notieren wir als erstes, dass unter Benutzung von (2.10) F d (y) − F d (x) = ∑ z∈D(F)∩(x,y] µF ({z}) = µF (D(F) ∩ (x, y]). für alle x, y ∈ R mit x < y gilt. Es folgt die Monotonie von F c aus F c (y) − F c (x) = (F(y) − F(x)) − (F d (y) − F d (x)) = µF ((x, y]) − µF (D(F) ∩ (x, y]) = µF (C(F) ∩ (x, y]) ≥ 0 für alle x, y ∈ R mit x < y. Per Grenzübergang und Beachtung von (2.11) liefert dies weiter ∆F c (y) = lim(F c (y) − F c (x)) = µF (C(F) ∩ {y}) = 0 x↑y und somit auch die linksseitige Stetigkeit von F c . t u Wir sind nun in der Lage, den angekündigten Zerlegungssatz zu beweisen, und erinnern daran, dass µF genau dann diskret bzw. stetig ist, falls µF = ∑x∈D(F) ∆F (x)δx bzw. µF ({x}) = 0 für alle x ∈ R gilt. Wegen Lemma A.7 ist klar, dass µF d immer ein diskretes und µF c ein stetiges Borel-Maß bildet. Satz A.8. (Zerlegung von Borel-Maßen) Jedes Borel-Maß µ besitzt eine eindeutige Zerlegung µ = µ d + µ c in ein diskretes Borel-Maß µ d und ein stetiges BorelMaß µ c . Falls µ = µF für eine maßerzeugende Funktion F, so gilt weiter µ d = µF d = ∑ ∆F (x) δx x∈D(F) und µ c = µF c . Beweis. Sei µ ein Borel-Maß und F eine maßerzeugende Funktion mit µ = µF , die gemäß Satz 2.21 stets existiert. Dann impliziert F = F d + F c sofort µF = µF d + µF c auf dem ∩-stabilen Mengensystem E der links halboffenen Intervalle (a, b]. Es folgt die Gleichheit auf ganz B(R) = σ (E ) mittels eines einfachen DS-Arguments. Sei nun µ = µ1 + µ2 eine weitere Zerlegung in ein diskretes Borel-Maß µ1 und ein stetiges Borel-Maß µ2 . Es folgt µF d − µ1 = µ2 − µF c , wobei (µ2 − µF c )({x}) = 0 für alle x ∈ R und A.4 Zerlegung von Borel-Maßen auf R µF d − µ1 = 233 ∑ p(x) δx x∈I für eine abzählbare Menge I ⊂ R und eine Funktion p : I → R gelten muss. Dies ist aber offenbar nur möglich, wenn p(x) ≡ 0, also µF d = µ1 und µF c = µ2 gilt. t u Anmerkung A.9. Für eine W-Verteilung µ auf (R, B(R)) lässt sich der Zerlegungssatz auch folgendermaßen formulieren: Entweder ist µ selbst diskret oder stetig, oder es existieren eine diskrete Verteilung µ d , eine stetige Verteilung µ c und ein α ∈ (0, 1) derart, dass (A.14) µ = α µ d + (1 − α)µ c . M.a.W., µ lässt sich in eindeutiger Weise als konvexe Kombination oder Mischung einer diskreten und einer stetigen Verteilung darstellen. Ist nämlich µ = µ d + µ c gemäß Satz A.8 mit µ d 6≡ 0 und µ c 6≡ 0, so wähle µ u := µ u (R)−1 µ u für u ∈ {d, s} und α = µ d (R). Eine weitere Verfeinerung dieser Zerlegung, die sich aus der Lebesgue-Zerlegung ergibt, findet der Leser in Abschnitt B.5. Anhang B Ergänzungen zur Integrationstheorie B.1 Eigenschaften des Maßintegrals Beweis (von Satz 3.41). Wir beschränken uns auf den Beweis der Teil (a)–(e) und überlassen (f), (g) dem Leser als einfache Übung. (a) Diese Aussage ergibt sich unmittelbar aus der Definition (3.13) des Integrals bezüglich µ, angewendet auf f1+ , f2+ und f1− , f2− , für die f1+ ≤ f2+ bzw. f1− ≥ f2− gilt. (c) Gegebenenfalls nach Übergang zu ( fn − f1− )n≥1 dürfen wir o.B.d.A. voraussetzen, dass alle fn nichtnegativ sind. Gemäß Teil (a) folgt direkt Z R f1 dµ ≤ R Z f2 dµ ≤ ... ≤ Z fn dµ ≤ ... ≤ Z f dµ, also limn→∞ fn dµ ≤ f dµ. Für die umgekehrte Ungleichung genügt es unter erneutem Hinweis auf (3.13), inf f (ω) · µ(Ai ) ≤ lim ∑ ω∈Ai i∈I n→∞ Z fn dµ für jede endliche Zerlegung (Ai )i∈I ∈ Z(Ω , A) zu zeigen. Seien daher eine solche Zerlegung und ein beliebiges x < ∑i∈I αi µ(Ai ) vorgegeben, wobei αi := infω∈Ai f (ω). Wir wählen Konstanten βi , i ∈ I mit folgenden Eigenschaften: 0 < βi < αi , falls αi > 0, βi = αi , falls αi = 0 und x < ∑i∈I βi µ(Ai ). Wegen fn ↑ f existiert dann für jedes i ∈ I und ω ∈ Ai ein n0 = n0 (ω) derart, dass fn (ω) ≥ βi für alle n ≥ n0 . Als nächstes definieren wir Ai,n := { fn ≥ βi } ∩ Ai ∈ A (i ∈ I, n ∈ N), für die Ai,n ↑ Ai und daher µ(Ai,n ) ↑ µ(Ai ) für jedes i ∈ I folgt. Wir erhalten 235 236 B Ergänzungen zur Integrationstheorie Z fn dµ ≥ ≥ inf fn (ω) · µ(Ai,n ) + ∑ inf c ∑ ω∈A ω∈Ai ∩A i,n i∈I i∈I i,n fn (ω) · µ(Ai ∩ Aci,n ) ∑ βi µ(Ai,n ) i∈I und schließlich lim n→∞ Z fn dµ ≥ lim n→∞ ∑ βi µ(Ai,n ) = i∈I ∑ βi µ(Ai ) > x, i∈I was den Beweis von (3.17) abschließt. (d) Es seien gn := supk≥n fk und hn := infk≥n fk , die offenbar gn ↓ f , hn ↑ f , hn ≤ fn ≤ gn für alle n ≥ 1 sowie sup |hn | ≤ sup |gn | ≤ f ∗ ∈ L1 (µ) n≥1 n≥1 erfüllen. Per Anwendung des Satzes von der monotonen Konvergenz ergibt sich nun lim n→∞ Z gn dµ = lim n→∞ Z hn dµ = Z f dµ und daraus wegen hn ≤ fn ≤ gn und der Monotonie des Integrals auch (3.17). (b) Für den Nachweis der Linearität des Maßintegrals wähle zuerst f , g ∈ E(Ω , A) in Normaldarstellung, d.h. f = ∑i∈I αi 1Ai und g = ∑ j∈J β j 1B j mit (Ai )i∈I , (B j ) j∈J ∈ Z(Ω , A) und reellen Konstanten αi , β j . Es folgt α f +βg = ∑ i∈I, j∈J (ααi + β β j ) 1Ai ∩B j mit (Ai ∩B j )i∈I, j∈J ∈ Z(Ω , A). Wie man sofort einsieht, gilt Satz 3.40 auch für reelle primitive Funktionen (Elemente von E(Ω , A)). Es folgt Z (α f + β g) dµ = ∑ i∈I, j∈J = (ααi + β β j ) µ(Ai ∩ B j ) ∑ ααi ∑ µ(Ai ∩ B j ) + ∑ β β j ∑ µ(Ai ∩ B j ) i∈I j∈J j∈J = α ∑ αi µ(Ai ) + β i∈I = α Z f dµ + β Z i∈I ∑ β j µ(B j ) j∈J g dµ. Seien schließlich f , g beliebige integrierbare Funktionen. Wähle fn , gn ∈ E(Ω , A) + − − mit fn+ ↑ f + , fn− ↓ f − , g+ n ↑ g und gn ↓ g , also f n → f , gn → g sowie α f n +β gn → α f + β g. Die Existenz solcher fn , gn sichert Lemma 3.37. Wegen sup | fn | ≤ f1− + f + ∈ L1 (µ) und n≥1 + 1 sup |gn | ≤ g+ 1 + g ∈ L (µ) n≥1 B.1 Eigenschaften des Maßintegrals 237 erhalten wir vermöge des soeben Gezeigten und des Satzes von der majorisierten Konvergenz Z Z (α fn + β gn ) dµ Z Z = lim α fn dµ + β gn dµ (α f + β g) dµ = lim n→∞ n→∞ also die Behauptung in voller Allgemeinheit. (e) Hier ergibt sich die Behauptung leicht unter Hinweis auf 0 ≤ lim inf fn = lim inf fk , n→∞ n→∞ k≥n was wie behauptet Z lim inf fn dµ = lim n→∞ n→∞ Z inf fk dµ ≤ lim inf n→∞ k≥n Z fn dµ mit dem Satz von der monotonen Konvergenz impliziert. t u Satz B.1. Sei (Ω , A, µ) ein Maßraum und f ∈ L0 (Ω , A) eine messbare numerische Funktion. Dann gilt für (a) nichtnegatives f : (b) quasi-integrierbares f : R f dµ = 0 ⇔ f = 0 µ-f.ü. R A f dµ = 0 für alle A ∈ A ⇔ f = 0 µ-f.ü. Beweis. (a) Wir setzen N := { f 6= 0} = { f > 0}. R “⇒” Sei f dµ = 0. Es gilt N ∈ A, weil f messbar ist, und wir müssen µ(N) = 0 zeigen. Für n ≥ 1 setzen wir An := { f ≥ 1n } und bemerken, dass An ∈ A, f ≥ n−1 1An sowie An ↑ N, also µ(An ) ↑ µ(N) gelten. Wir erhalten dann 0 = Z f dµ ≥ Z n−1 1An dµ = n−1 µ(An ) ≥ 0, also µ(An ) = 0 für alle n ≥ 1, was µ(N) = 0 impliziert. “⇐” RSei nun f = 0 µ-f.ü., also µ(N) = 0 vorausgesetzt. Setzen wir gn := n · 1N , so folgt gn dµ = 0 und 0 ≤ f ≤ g := limn→∞ gn und deshalb unter Benutzung des Satzes von der monotonen Konvergenz 0 ≤ Z f dµ ≤ Z g dµ = lim n→∞ Z gn dµ = 0. (b) Die Beweisrichtung “⇐” ist mit Teil (a) trivial, da f = 0 µ-f.ü. dasselbe für die nichtnegativen Funktionen f + und f − impliziert. Für die Umkehrung “⇒” 238 B Ergänzungen zur Integrationstheorie R R notieren wir, dass nach Voraussetzung { f ≥0} f dµ = 0 und { f ≤0} | f | dµ = 0 wegen R { f ≥ 0}, { f ≤ 0} ∈ A gilt. Es folgt | f | dµ = 0 und somit f = 0 µ-f.ü. wiederum gemäß Teil (a). t u Als nützliche Folgerung aus Satz B.1 notieren wir: Korollar B.2. Es seien f , g zwei quasi-integrierbare numerische Funktionen auf einem Maßraum (Ω , A, µ). Dann gilt: R A f dµ ≤ R Ag dµ für alle A ∈ A ⇔ f ≤ g µ-f.ü. Insbesondere folgt aus f = g µ-f.ü. stets R R f dµ = g dµ. Beweis. “⇒” Für n ≥ 1 betrachte die nichtnegative Funktion hRn := ( f − g)1Bn mit R Bn := { f > g, f ≥ −n, g ≤ n} ∈ A. Dann gilt f dµ > −∞, BR Bn g dµ < ∞ sowie n R R R nach Voraussetzung h dµ = ( f − g) dµ = f dµ − g n Bn Bn Bn dµ ≤ 0. AndererR seits muss h dµ aber nichtnegativ sein, da h ≥ 0 ist. Für alle n ≥ 1 erhalten wir n n R somit hn dµ = 0, also hn = 0 µ-f.ü. gemäß Satz B.1, und dies impliziert schließlich µ({ f > g}) = limn→∞ µ(Bn ) = 0. R R “⇐” Hier sei kontrapositorisch > A g dµR für ein A ∈ A angenommen, A f dµ R R R was offenbar A f + dµ > A g+ dµ oder A f − dµ < A g− dµ impliziert. Im ersten Fall setze Bn := { Rf + > g+ , f + ≤Rn} und folgere mit dem Satz von der monotonen Konvergenz, dass A∩Bn f + dµ > A∩Bn g+ dµ ≥ 0 für ein hinreichend großes n gelten muss. Dies liefert µ({ f > g}) ≥ µ({ f + > g+ }) ≥ µ(Bn ) > 0. Im zweiten Fall erhält man auf dieselbe Weise µ({ f > g}) ≥ µ({ f − < g− }) > 0, was in beiden Fällen µ({ f > g}) > 0 zeigt. t u B.2 Lebesgue- versus Riemann-Integral Der besonderen Bedeutung des L-Maßes λλ d als Volumenmaß auf (Rd , B(Rd )) Rechnung tragend, diskutieren wir in diesem Abschnitt kurz das zugehörige Integral und seine Beziehung zum R(iemann)-Integral. Obgleich die anschließenden Ausführungen auch in höherer Dimension richtig sind, beschränken wir uns der einfacheren Darstellung halber auf den Fall d = 1, der für unsere Belange ausreichend ist. R b Vereinbarung. Hier wie auch im ganzen Text bezeichnet a f (x) dx immer das R R R-Integral von f , während [a,b] f (x) λλ (dx) oder einfach [a,b] f dλλ für das entsprechende L-Integral verwendet wird. B.2 Lebesgue- versus Riemann-Integral 239 Ein kurzer Blick auf das Riemann-Integral. Gegeben ein kompaktes Intervall [a, b] ⊂ R, sei Z[a, b] die Menge aller endlichen Zerlegungen z = [z0 , ..., zn ], a = z0 < z1 < ... < zn = b. Für eine beliebige Funktion f : [a, b] → R wird definiert n Obersumme( f , z) := ∑ sup ∑ inf j=1 z j−1 ≤x≤z j n Untersumme( f , z) := z ≤x≤z j j=1 j−1 f (x) · (z j − z j−1 ), f (x) · (z j − z j−1 ). Offensichtlich gilt dann sup Untersumme( f , z) ≤ z∈Z[a,b] inf z∈Z[a,b] Obersumme( f , z), und f heißt (eigentlich) R(iemann)-integrierbar, wenn beide Werte übereinstimmen. Man definiert in diesem Fall den gemeinsamen Wert als das R(iemann)-Integral von R f auf [a, b], symbolisch ausgedrückt durch ab f (x) dx. Aus der Analysis ist bekannt, dass jede auf [a, b] stetige Funktion R-integrierbar ist. Insbesondere gilt natürlich Z b a 1 dx = b − a = λλ ([a, b]) = Z [a,b] 1 λλ (dx), d.h. für Intervalle repräsentiert das R-Integral ebenso wie das L-Integral den geometrischen Längenbegriff. Leider erweist sich jedoch die R-Integrierbarkeit für viele Funktionen als zu restriktiv, denn es werden bereits sehr einfache messbare Funktionen wie etwa f = 1[0,1]∩Q ausgeschlossen. Für das genannte Beispiel gilt offenkundig Untersumme( f , z) = 0 und für alle z ∈ Z[0, 1]. Obersumme( f , z) = 1 Gleichzeitig stellt sich die Frage, welche L-integrierbaren Funktionen auch Rintegrierbar sind, und ob für diese R-Integral und L-Integral immer übereinstimmen. Im Folgenden wollen wir auch uneigentliche R-Integrale zulassen: Gegeben ein offenes Intervall (a, b), wobei −∞ ≤ a < b ≤ ∞, heißt f : (a, b) → R uneigentlich R-integrierbar, falls f auf jedem [α, β ] ⊂ (a, b) eigentlich R-integrierbar ist und R der Limes für α ↓ a und β ↑ b in R existiert. Dieser wird wiederum mit ab f (x) dx bezeichnet und stimmt natürlich mit dem eigentlichen R-Integral überein, wenn f sogar auf [a, b] im eigentlichen Sinn R-integrierbar ist. Wir erinnern daran, dass wegen λλ ({x}) = 0 für alle x ∈ R Z [a,b] f dλλ = Z (a,b] f dλλ = Z [a,b) f dλλ = Z (a,b) f dλλ für jedes auf (a, b) L-integrierbare f gilt. Die nachfolgenden drei Sätze beinhalten die wesentlichen Informationen über den Zusammenhang von Lebesgue- und Riemann-Integrierbarkeit. 240 B Ergänzungen zur Integrationstheorie Satz B.3. Sei I ein Teilintervall von R mit Randpunkten a, b ∈ R (a < b) und f : I → R eine messbare reelle Funktion. Dann gilt: (a) Ist I = [a, b] (a, b ∈ R) kompakt und f eigentlich R-integrierbar auf I, so ist f auch L-integrierbar auf I, und die Integrale stimmen überein, d.h., es gilt Z (b) f dλλ = Z Z b f dλλ = I f (x) dx. (B.1) a Ist f L-integrierbar auf I und auf jedem kompakten Teilintervall eigentlich R-integrierbar, so ist f auch uneigentlich R-integrierbar auf I, und es gilt wiederum (B.1). Beweis. (a) Für jedes n ≥ 1 definiere zn,0 = a und zn,k := a + k(b − a)2−n für k = 1, ..., 2n . Seien ferner In,1 := [zn,0 , zn,1 ] und In,k := (zn,k−1 , zn,k ] für k = 2, ..., 2n die resultierende Zerlegung von [a, b] der Feinheit 2−n sowie αn,k , βn,k das Infimum bzw. Supremum von f auf In,k . Schließlich definiere die Treppenfunktionen n n gn (x) := ∑2k=1 αn,k 1In,k (x) und hn (x) := ∑2k=1 βn,k 1In,k (x), die natürlich primitive Borel-messbare Funktionen sind und deren R-Integrale gerade die Unter- bzw. OberR summe von ab f (x) dx zur Zerlegung (In,k )1≤k≤2n bilden und mit ihren jeweiligen LIntegralen übereinstimmen. Weiter gilt offensichtlich gn ↑, hn ↓ und gn ≤ f ≤ hn für alle n ≥ 1. Setzen wir g := limn→∞ gn und h := limn→∞ hn , so folgt also g ≤ f ≤ h, und per Kombination der R-Integrierbarkeit von f mit dem Satz von der monotonen Konvergenz weiter Z g dλλ = lim Z b n→∞ a I R gn (x) dx = Z b f (x) dx = lim Z b n→∞ a a hn (x) dx = Z h dλλ . (B.2) I Da somit I (h − g) dλλ = 0 und ferner h − g ≥ 0, liefert Satz B.1(a) f = g = h λλ -f.ü., was insbesondere die L-Integrierbarkeit von f sowie (B.1) beweist. R R (b) Nach Teil (a) gilt hier [α,β ] f dλλ = αβ f (x) dx für alle [α, β ] ⊂ I, während der Satz von der majorisierten Konvergenz (beachte hierfür, dass | f |1[α,β ] ≤ | f |1I ) lim Z α↓a, β ↑b [α,β ] f dλλ = Z f dλλ I garantiert und folglich die behauptete uneigentliche R-Integrierbarkeit von f auf I sowie (B.1) impliziert. t u Nur wenig Mühe bereitet nunmehr die folgende exakte Charakterisierung der messbaren eigentlich R-integrierbaren Funktionen. B.2 Lebesgue- versus Riemann-Integral 241 Satz B.4. Eine messbare reelle Funktion f : [a, b] → R (a, b ∈ R, a < b) ist genau dann eigentlich R-integrierbar, wenn sie beschränkt und außerhalb einer λλ Nullmenge stetig ist. Beweis. Wir übernehmen die Bezeichnungen aus dem Beweis des vorherigen Satzes. Sei R die abzählbare Menge aller Randpunkte der Zerlegungsintervalle In,k , also R = {zn,k : n ≥ 1, k = 1, ..., 2n }, und D( f ) die Menge der Unstetigkeitsstellen von f . Ist f auf [a, b] R-integrierbar, so ist sie nach unten und oben durch Treppenfunktionen mit endlichem Integral beschränkt und folglich selbst eine beschränkte Funktion. Darüber hinaus gilt offenbar B([a, b]) 3 {g < h} ⊂ D( f ) ⊂ R ∪ {g < h} ∈ B([a, b]). Wegen g = f λλ -f.ü. folgt die Stetigkeit von f außerhalb der λλ -Nullmenge R ∪ {g < h}. Ist umgekehrt f beschränkt und außerhalb einer λλ -Nullmenge N ⊂ [a, b] stetig, so folgt λλ ({ f < g}) = 0 aus {g < h} ⊂ D( f ) ⊂ N und damit die R-Integrierbarkeit von f auf [a, b] vermöge (B.2). t u Satz B.5. Sei I ein Teilintervall von R und f : I → R eine messbare reelle Funktion, die auf jedem kompakten Teilintervall von I eigentlich R-integrierbar ist. Dann sind äquivalent: (1) (2) f ist L-integrierbar auf I. | f | ist uneigentlich R-integrierbar auf I. Beweis. “(1)⇒(2)” Gemäß Satz 3.41(d) ist die L-Integrierbarkeit von f 1I mit der von | f | 1I äquivalent. Ferner ist vermöge Satz B.4 auch | f | auf jedem kompakten Teilintervall von I eigentlich R-integrierbar. Bezeichnen wieder a, b die Randpunkte von I, so folgt mit (B.1) und dem Satz von der monotonen Konvergenz lim Z β α↓a, β ↑b α | f (x)| dx = lim Z α↓a, β ↑b [α,β ] | f | dλλ = R Z I | f | dλλ , (B.3) also die uneigentliche R-Integrierbarkeit von f auf I, da | f | dλλ < ∞. “(2)⇒(1)” Liest man (B.3) von rechts nach links, wobei in diesem Fall der Limes auf der ganz linken Seite nach Voraussetzung endlich ist, so folgt offenbar die LIntegrierbarkeit von | f | und damit von f . t u Beispiele B.6. (a) Die weiter oben erwähnte Funktion f := 1Q∩[0,1] ist natürlich LR integrierbar auf [0, 1] mit [0,1] f dλλ = λλ (Q ∩ [0, 1]) = 0. Andererseits ist f auch nirgends stetig auf [0, 1] und folglich dort nicht R-integrierbar gemäß Satz B.4. (b) Dagegen erhält man durch folgende Modifikation von f eine auf [0, 1] λλ -f.ü. p(x) stetige und folglich R-integrierbare Funktion: Bezeichnet q(x) für x ∈ Q ∩ [0, 1] die 242 B Ergänzungen zur Integrationstheorie eindeutige Darstellung von x mit teilerfremden p(x), q(x) ∈ N, und definieren wir 1 dann f (x) := q(x) für x ∈ Q ∩ [0, 1] sowie weiterhin f (x) := 0 für alle anderen x, so ist f in allen irrationalen x ∈ [0, 1] stetig. (c) Die Funktion f (x) = sinx x 1R> (x) mit der stetigen Fortsetzung sin0 0 := 1 bildet das Standardbeispiel einer uneigentlich R-integrierbaren, aber nicht L-integrierbaren Funktion. Zum einen gilt nämlich Z kπ Z nπ n 2 n 1 n→∞ sin x dx ≥ ∑ 1 | sin x| dx = ∑ k −→ ∞, x π k=2 0 k=2 πk (k−1)π zum anderen folgt per partieller Integration für a > π/2 Z ∞ Z a Z a − cos x a cos x cos x sin x a→∞ dx = dx −→ − dx, − 2 x x x2 π/2 π/2 π/2 x π/2 wobei der Limes wegen lich ist. R ∞ cos x R∞ 1 2 π/2 x2 dx ≤ π/2 x2 dx = π tatsächlich existiert und end- B.3 Der Raum L2 (µ): Beweis von Satz 6.21 (Projektions- und Zerlegungssatz) und der Darstellungssatz von Riesz Beweis (von Satz 6.21). (a) Für beliebig fixiertes f sei γ := infg∈K k f − gk2 und (gn )n≥1 eine Folge in K mit k f − gn k2 → γ. Dann liefert die Parallelogrammgleichung für alle m, n ∈ N 2 gm − gn 2 = 1 k f − gn k22 + k f − gm k22 − gm + gn − f 2 2 2 2 2 1 ≤ k f − gn k22 + k f − gm k22 − γ 2 , 2 2 n n wobei in der letzten Zeile gm +g − f 2 ≥ γ 2 wegen gm +g ∈ K benutzt wurde. 2 2 Lässt man m, n gegen ∞ streben, folgt kgm −gn k2 → 0. Also ist (gn )n≥1 eine CauchyFolge in dem abgeschlossenen Teilraum K und konvergiert deshalb gegen ein g ∈ K. Aus der Stetigkeit der Norm k · k2 ergibt sich schließlich k f − gk2 = limn→∞ k f − gn k2 = γ. Bezeichnet h ∈ K ein weiteres Element mit k f − hk2 = γ, so liefert eine nochmalige Anwendung der Parallelogrammgleichung (ersetze oben einfach gm , gn durch g, h) g − h 2 1 2 2 2 2 ≤ 2 k f − gk2 + k f − hk2 − γ = 0 2 und somit g = h. B.3 Der Raum L2 (µ): Beweis von Satz 6.21 (Projektions- und Zerlegungssatz) und der Darstellungssatz von Riesz 243 (b) Sei f ∈ L2 (µ) beliebig. Da g durch h f − g, hi = 0 für alle h ∈ K eindeutig bestimmt ist, wie man leicht sieht, genügt es h f − PK ( f ), hi = 0 für alle h ∈ K nachzuweisen. Es gilt aber für alle 0 6= h ∈ K und λ > 0 unter Beachtung der definierenden Eigenschaft von PK ( f ) 0 < k f − PK ( f ) ± λ hk22 − k f − PK ( f )k2 = λ 2 khk22 ± 2λ h f − PK ( f ), hi, was 2|h f − PK ( f ), hi| = infλ >0 λ khk22 = 0 impliziert. (c) Die Linearität von PK folgt direkt aus (b), und da trivialerweise PK ( f ) = f f ür f ∈ K gilt, folgt auch PK = PK2 . (d) Aus (b) folgt I − PK ( f ) ∈ K ⊥ . Da außerdem h f − ( f − PK ( f )), hi = hPK ( f ), hi = 0 für alle h ∈ K ⊥ , liefert wiederum (b), dass f − PK ( f ) = PK ⊥ ( f ) und somit f = PK ( f ) + PK ⊥ ( f ) gilt. Diese Zerlegung von f ist eindeutig, denn aus f = g + h für g ∈ K und h ∈ K ⊥ ergibt sich offenkundig PK ( f ) − g = h − PK ⊥ ( f ) ∈ K ∩ K ⊥ = {0}. Die letzte Behauptung des Satzes erhält man nun durch einfaches Nachrechnen. t u Mit Hilfe des Projektions- und Zerlegungssatzes 6.21 kann man nun ein wichtiges Ergebnis zeigen, welches im nächsten Abschnitt im Beweis des Satzes von Radon-Nikodym benötigt wird. Dabei geht es um die Charakterisierung der reellen stetigen Linearformen auf L2 (µ), d.h. der stetigen linearen Abbildungen von L2 (µ) nach R, deren Gesamtheit den (topologischen) Dualraum L2 (µ)0 ergibt. OffensichtR lich ist jedes Φg , definiert durch Φg ( f ) := f g dµ für ein festes g ∈ L2 (µ), eine solche Abbildung, denn vermöge der Cauchy-Schwarz-Ungleichung gilt |Φg ( f )| = k f gk1 ≤ k f k2 kgk2 für alle f ∈ L2 (µ), also kΦg k := sup |Φg ( f )| = kgk2 . k f k2 =1 Das angekündigte Ergebnis besagt, dass bereits jede reelle stetige Linearform von dieser Gestalt ist und folglich mit einem g ∈ L2 (µ) identifiziert werden kann. Dies bedeutet, dass L2 (µ)0 und L2 (µ) vermöge der Zuordnung Φg 7→ g isometrisch isomorph sind. Zum Beweis verweisen wir erneut auf Abschnitt ?? des Anhangs. Satz B.7. (Darstellungssatz von Riesz) Zu jeder stetigen Linearform Φ : L2 (µ) → R existiert eine eindeutig bestimmte Funktion g ∈ L2 (µ) derart, dass Φ( f ) = h f , gi für alle f ∈ L2 (µ). Beweis. Falls Φ( f ) = 0 für alle f ∈ L2 (µ), wähle g = 0. Andernfalls ist der Kern von Φ, d.h. K := { f : Φ( f ) = 0} ein echter abgeschlossener Teilraum von L2 (µ), 244 B Ergänzungen zur Integrationstheorie und es existiert ein eindeutig bestimmtes g∗ ∈ L⊥ mit Φ(g∗ ) = 1. Während die Existenz klar ist, notieren wir hinsichtlich der Eindeutigkeit, dass aus Φ(g∗ ) = Φ(h) = 1 zunächst g∗ − h ∈ K, dann weiter kg∗ − hk22 = hg∗ − h, g∗ − hi = hg∗ , g∗ − hi − hh, g∗ − hi = 0 und schließlich g∗ = h folgt. Insbesondere gilt Φ(h)−1 h = g∗ für jedes h ∈ K ⊥ . Gegeben ein beliebiges f ∈ L2 (µ) mit orthogonaler Zerlegung f = f1 + f2 , f1 ∈ K ⊥ und f2 ∈ K ⊥ , ergibt sich nun nach Definition von g := kg∗ k−2 2 ∈K h f , gi = h f2 , gi = Φ( f2 ) ∗ ∗ hg , g i = Φ( f2 ) = Φ( f ), kg∗ k22 also die Existenzaussage des Satzes. Da ferner h f , gi = h f , hi für alle f ∈ L2 (µ) gleichbedeutend ist mit h f , g − hi = 0 für alle f ∈ L2 (µ), folgt bei Wahl von f = g − h offenbar g = h. t u B.4 Maße mit Dichten: Beweise der Sätze 6.28–6.30 Beweis (des Satzes 6.28 von Radon-Nikodym). Wie schon bemerkt, folgt die Aussage “(a)⇒(b)” direkt aus Anm. 3.43. Wir wenden uns deshalb gleich dem Beweis der Umkehrung “(b)⇒(a)” zu. Da zudem nach Voraussetzung Mengen Ωn ∈ A (n ≥ 1) existieren mit Ωn ↑ Ω und µ(Ωn ) + ν(Ωn ) < ∞ für alle n ≥ 1, dürfen wir o.B.d.A. µ und ν als endlich voraussetzen. Wir setzen ρ := µ + ν. Das folgende Argument unter Benutzung des Darstellungssatzes B.7 von Riesz für L2 (ρ) geht auf J OHN VON N EUMANN zurück. Es gilt trivialerweise ν ρ. Außerdem ist die kanonische Einbettung von L2 (ρ) in L2 (ν) wegen R R k f k2,ν = ( f 2 dν)1/2 ≤ ( f 2 dρ)1/2 = k f k2,ρ stetig. Dies impliziert L2 (ν)0 ⊂ L2 (ρ)0 , denn für Φ ∈ L2 (ν)0 gilt kΦkρ = sup f ∈L2 (ρ) |Φ( f )| ≤ k f k2,ρ Nun ist aber Φν ( f ) := Z f dν sup f ∈L2 (ν) |Φ( f )| = kΦkν . k f k2,ν ( f ∈ L2 (ν)) wegen der aus der Hölder-Ungleichung folgenden Abschätzung |Φν ( f )| ≤ k f k2,ν ν(Ω )1/2 ein stetiges lineares Funktional auf L2 (ν) und somit auch auf L2 (ρ). Der Darstellungssatz von Riesz impliziert deshalb die Existenz einer reellen Funktion g ∈ L2 (ρ) B.4 Maße mit Dichten: Beweise der Sätze 6.28–6.30 derart, dass für alle f ∈ L2 (ρ) Z Z f dν = oder nach Umstellung Z f g dρ = Z f (1 − g) dν = 245 f g dµ + Z Z f g dν. f g dµ. (B.4) Wegen ρ(Ω ) < ∞ sind insbesondere alle Indikatorfunktionen in L2 (ρ), so dass mit f = 1A Z Z A (1 − g) dν = für alle A ∈ A g dµ A (B.5) folgt. Wählt man speziell A = {g < 0}, so ergibt sich weiter 0 ≤ Z {g<0} (1 − g) dν = Z {g<0} g dµ ≤ 0 und so ρ({g < 0}) = 0 vermöge Satz B.1, da die Integranden beider Integrale betragsmäßig positiv sind auf {g < 0}. Ein analoges Argument zeigt ρ({g > 1}) = 0, so dass insgesamt 0 ≤ g ≤ 1 ρ-f.ü. und weiter (1 − g)ν = gµ per (B.5) folgt. Insbesondere gilt (B.4) nun für alle f ∈ L1 ((1 − g)ν) = L1 (gµ). Wählen wir schließlich A = {g = 1} in (B.5), so ergibt sich 0 = Z {g=1} (1 − g) dν = Z g dµ, {g=1} (B.6) und folglich, wiederum mit Satz B.1, µ({g = 1}) = 0. An dieser Stelle benutzen wir nun die Voraussetzung ν µ, die uns ν({g = 1} = 0 und so ρ({g = 1}) = 0 beschert, was insgesamt 0 ≤ g < 1 ρ-f.ü. beweist. Die Funktion 1/(1−g) ist folglich ρ-f.ü. reellwertig und außerdem trivialerweise integrierbar bezüglich (1−g)ν = gµ. Dasselbe gilt offenbar für jedes f = 1A /(1 − g) (A ∈ A), so dass (B.4) für solche f schließlich Z g dµ für alle A ∈ A ν(A) = A 1−g liefert. Die Funktion h := g/(1 − g) ist demnach die gesuchte µ-Dichte von ν. t u Beweis (der Lebesgue-Zerlegung (Satz 6.29)). Folgen wir dem obigen Beweis bis (B.6) und definieren ν c (A) := ν(A ∩ {0 ≤ g < 1}) und ν s (A) := ν(A ∩ {g = 1}) (A ∈ A), so leisten diese beiden Maße das Verlangte, wie man leicht einsieht. t u Beweis (von Satz 6.30). “⇒” Nach dem Satz von Radon-Nikodym ist µ = gν für ein g ∈ L0+ (Ω , A). Es folgt deshalb unter Verwendung von Satz 6.24 µ(A) = Z A g dν = Z A g f dµ für alle A ∈ A, 246 B Ergänzungen zur Integrationstheorie also µ = (g f )µ, was g f = 1 µ-f.ü. gemäß Satz 6.23 und dann µ({0 < f < ∞}c ) = 0 sowie g = 1/ f µ-f.ü. impliziert. “⇐” Gegeben ν = f µ und µ({0 < f < ∞}c ) = 0, folgern wir für jede µ-positive R Menge A ∈ A, dass ν(A) = A f dµ ≥ ε µ(A ∩ { f > ε} > 0 für hinreichend kleines ε > 0 gilt. Es folgt µ ν und insgesamt die Äquivalenz von µ und ν. t u B.5 Verfeinerte Zerlegung von Borel-Maßen auf R Mittels der Lebesgue-Zerlegung lässt sich der Zerlegungssatz A.8 für Borel-Maße auf R noch verfeinern. Erinnern wir uns: Jedes Borel-Maß µ = µF , F die assoziierte maßerzeugende Funktion, lässt sich auf eindeutige Weise in einen diskreten Anteil µ d = µF d und einen stetigen Anteil µ c = µF c zerlegen, wobei µ d als Träger die Menge D(F) der Sprungstellen von F besitzt, die als abzählbare Menge natürlich eine λλ -Nullmenge bildet. Damit folgt µ d ⊥ λλ . Wollen wir also µ hinsichtlich seines L-stetigen Anteils weiter zerlegen, reicht es, dies für µ c zu tun. Der folgende Zerlegungssatz bildet eine direkte Konsequenz der Lebesgue-Zerlegung von µ c bezüglich λλ und Satz A.8. Satz B.8. Jedes Borel-Maß µ besitzt eine eindeutige Zerlegung µ = µ d + µ s + µ ac in ein diskretes Borel-Maß µ d , ein λλ -singuläres, stetiges Borel-Maß µ s und ein L-stetiges Borel-Maß µ ac . Abschließend geben wir ein Beispiel für ein stetiges, aber λλ -singuläres Borel-Maß. Ein solches Maß konzentriert seine Masse per definitionem auf eine λλ -Nullmenge, die notwendig überabzählbar ist, weil das Maß andernfalls diskret wäre. Unser Beispiel gibt demnach zugleich eine positive Antwort auf die Frage nach der Existenz überabzählbarer λλ -Nullmengen. Beispiel B.9. [Cantorsche Ternärmenge und Cantor-Verteilung] Wir betrachten den W-Raum ([0, 1], B([0, 1]), λλ ). Die Cantorsche Ternärmenge C, hier kurz Cantor-Menge genannt, wird wie folgt durch sukzessives Ausdünnen konstruiert: Entferne aus C0 := [0, 1] im ersten Schritt das mittlere Drittel, d.h. das offene Intervall ( 31 , 23 ), und behalte C1 := C0 \( 31 , 23 ) = 0, 31 + 23 , 1 . Wende im nächsten Schritt dasselbe Verfahren auf die beiden Teilintervalle von C1 an. Dies liefert C2 := 0, 19 + 29 , 13 + 32 , 59 + 89 , 1 B.5 Verfeinerte Zerlegung von Borel-Maßen auf R 247 als verbleibende Menge. So fortfahrend erhält man nach n Schritten als verbleibende Menge 2n x n,k xn,k + 1 , , (B.7) Cn = ∑ n 3n k=1 3 wobei die Menge Dn := {xn,k : 1 ≤ k ≤ 2n }, 0 = xn,1 < ... < xn,2n = 1, aus den Elementen n yk y = ∑ k mit yk ∈ {0, 2} 3 k=1 besteht, also denjenigen Elementen des Einheitsintervalls, die eine Ternärdarstellung y = 0, y1 y2 ...yn der Länge n ohne die Ziffer 1 besitzen. Dann gilt offenbar Cn ↓, Dn ↑ und Dn ⊂ Cm für alle m, n ≥ 1. Wir definieren schließlich C := lim Cn = n→∞ \ Cn und D := lim Dn = n→∞ n≥1 [ Dn . n≥1 Als Durchschnitt kompakter Mengen ist C selbst kompakt und wegen D ⊂ C nicht leer. Sie wird als Cantorsche Ternärmenge bezeichnet. Der topologische Abschluß D von D besteht offenbar aus allen y, die eine unendliche Ternärdarstellung ohne die Ziffer 1 besitzen, d.h. ) ( yk (B.8) D = ∑ k : yk ∈ {0, 2} für alle k ≥ 1 . k≥1 3 Beachte, dass dies alle y ∈ [0, 1] mit einer endlichen Ternärdarstellung der Form 0, y1 ...yn 1 einschließt, da diese auch die alternative Ternärdarstellung 0, y1 ...yn 222... besitzen. Z.B. gilt 13 = 0, 1 = 0, 222.... Andererseits besteht die Gesamtheit aller entfernten Intervalle gerade aus allen anderen y ∈ [0, 1], in deren Ternärdarstellung 0, y1 y2 ... mindestens ein yk den Wert 1 hat. Dies zeigt insgesamt C = D, und wir folgern die Überabzählbarkeit von C aus der Tatsache, dass die Abbildung Φ : C → [0, 1], yk ∑ 3k k≥1 7→ yk /2 k k≥1 2 ∑ offensichtlich bijektiv ist. Unter Hinweis auf (B.7) erhalten wir λλ (Cn ) = (2/3)n für alle n ≥ 1 und deshalb λλ (C) = 0. (B.9) Wir werden nun wie angekündigt auf [0, 1] eine W-Verteilung P konstruieren derart, dass P(C) = 1 und somit P ⊥ λλ gilt. Für n ≥ 0 sei Fn die VFkt. des stetigen W-Maßes λλ (Cn )−1 λλ (· ∩Cn ), genannt Gleichverteilung auf Cn , d.h. 248 B Ergänzungen zur Integrationstheorie Fn (x) := λλ ((−∞, x] ∩Cn ) λλ (Cn ) (x ∈ R). Unter Hinweis auf (B.7) sieht man, dass für n ≥ 1 0, falls x ≤ 0, k 2−n , falls (x + 1)3−n ≤ x ≤ x −n (k = 1, ..., 2n − 1), n,k n,k+1 3 Fn (x) := linear, falls xn,k 3−n < x < (xn,k + 1)3−n (k = 1, ..., 2n ), 1, falls x ≥ 1, wobei die linearen Fortsetzungen auf den Intervallen (xn,k 3−n , (xn,k + 1)3−n ) durch die Stetigkeit von Fn eindeutig sind. Abb. B.1 zeigt exemplarisch den Graphen von Fn für n = 3 und n = 6. 1.0 1.0 0.8 0.8 0.6 0.6 0.4 0.4 0.2 0.2 0.2 0.4 0.6 0.8 1.0 x 0.2 0.4 0.6 0.8 1.0 x Abb. B.1 Die Funktionen F3 (links) und F6 (rechts). Wie man dann leicht auch ohne formalen Beweis erkennt, gilt sup |Fn (x) − Fn−1 (x)| = sup |Fn (x) − Fn−1 (x)| ≤ x∈R x∈[0,1] 1 2n für alle n ≥ 1. Die Reihe ∑n≥1 (Fn (x) − Fn−1 (x)) ist also für alle x ∈ [0, 1] absolut und gleichmäßig konvergent, die Funktion n ∑ (Fk (x) − Fk−1 (x)) n→∞ F(x) := lim Fn (x) = F0 (x) + lim n→∞ k=1 (x ∈ R) folglich eine monoton wachsende und wiederum stetige Funktion mit F(x) = 0 für x ≤ 0 und F(x) = 1 für x ≥ 1. Außerdem existiert für jedes x ∈ Cc eine offene Umgebung (x − ε, x + ε) ⊂ Cc , auf der F konstant ist, was F 0 (x) = 0 für alle x ∈ Cc , also F 0 = 0 λλ -f.ü. impliziert. Die Funktion F heißt Cantor-Funktion, das zugehörige stetige Borel-Maß µF auf [0, 1] Cantor-Verteilung. Wie gerade festgestellt, gilt µF ((a, b]) = F(b) − F(a) = 0 für alle (a, b] ⊂ Cc und folglich µF (Cc ) = 0. Damit ist gezeigt, dass µF nur Masse auf der λλ -Nullmenge C besitzt und deshalb λλ -singulär ist. B.6 Differentiation L-stetiger Borel-Maße und absolut stetige Funktionen 249 B.6 Differentiation L-stetiger Borel-Maße und absolut stetige Funktionen Betrachten wir zur Einstimmung ein L-stetiges Borel-Maß µ auf Rd (d ≥ 1) mit stetiger L-Dichte f . Für r > 0 und x ∈ Rd bezeichne B(x, r) := {y ∈ Rd : |x−y| < r} die offene Kugel um x mit Radius r und B(x, r) deren topologischen Abschluß. Dann gilt offensichtlich die Mittelwerteigenschaft lim r→0 1 d λλ (B(x, r)) Z B(x,r) | f − f (x)| dλλ d = 0 (B.10) sowie a fortiori lim r→0 1 µ(B(x, r)) = lim d r→0 λ λλ d (B(x, r)) λ (B(x, r)) Z f dλλ d = f (x) (B.11) B(x,r) für alle x ∈ Rd . Für allgemeines f ∈ L1 (λλ d ) ist dagegen nicht klar, ob (B.10) überhaupt für gewisse x, genannt Lebesgue-Punkte von f , erfüllt ist. Aus diesem Grund darf man Satz B.13 weiter unten als erstaunliches Ergebnis ansehen. Er besagt nämlich, dass für eine L1 -Funktion λλ d -fast alle x Lebesgue-Punkte sind. Um dies zu beweisen, sind allerdings einige Vorbereitungen notwendig, wobei wir uns an [35, Kap. 7] orientiert haben. Wir beginnen mit einem einfachen Lemma. S Lemma B.10. Sei B = nk=1 B(xk , rk ) eine endliche Vereinigung von offenen Kugeln. Dann existiert eine Teilmenge I ⊂ {1, ..., n} derart, dass gilt: (a) (b) (c) Die Kugeln B(xi , ri ), i ∈ I, sind p.d. S B ⊂ i∈I B(xi , 3ri ). λλ d (B) ≤ 3d ∑i∈I λλ d (B(xi , ri )). Beweis. O.B.d.A. gelte r1 ≥ r2 ≥ ... ≥ rn . Definiere i1 := 1 und dann i2 als den kleinsten Index ∈ {2, ..., n} derart, dass B(xi2 , ri2 ) und B(x1 , r1 ) disjunkt sind, sofern ein solcher existiert. Als nächstes wähle i3 als den kleinsten Index ∈ {i2 + 1, ..., n} derart, dass B(xi3 , ri3 ) weder B(xi2 , ri2 ) noch B(xi1 , ri1 ) schneidet, sofern ein solcher Index existiert. So fortfahrend erhält man eine Menge I = {i1 , ..., ik } ⊂ {1, ..., n}, so dass offensichtlich (a) erfüllt ist. Die Gültigkeit von (b) ergibt sich aus der Tatsache, dass aus s ≤ r und B(y, s) ∩ B(x, r) 6= 0/ die Inklusion B(y, s) ⊂ B(x, 3r) folgt, und für (c) genügt der Hinweis, dass λλ d (B(x, 3r)) = λλ d (3 B(0, r)) = 3d λλ d (B(0, r)) = 3d λλ d (B(x, r)) für alle x ∈ Rd gilt [+ Satz 2.17]. t u Für ein beliebiges Borel-Maß µ auf Rd definieren wir als nächstes dessen Maximalfunktion Mµ : Rd → [0, ∞] durch 250 B Ergänzungen zur Integrationstheorie (Mµ)(x) := sup r>0 µ(B(x, r)) µ(B(x, r)) = sup d d λλ (B(x, r)) λ (B(0, r)) r>0 λ (x ∈ Rd ). Diese Funktion ist unterhalbstetig, d.h. lim infy→x (Mµ)(y) ≥ (Mµ)(x) für alle x ∈ Rd , denn µ(B(x, r)) µ(B(x, r)) inf sup d ≥ sup inf λ (B(0, r)) λ d (B(0, r)) y∈B(x,ε) r>0 λ r>0 y∈B(x,ε) λ für alle ε > 0. Wie man leicht sieht, ist eine unterhalbstetige Funktion f dadurch charakterisiert, dass { f > t} für alle t ∈ R offen ist, was vermöge Satz 6.1 ihre Borel-Messbarkeit garantiert. Wir folgern also die Borel-Messbarkeit von Mµ, und die Menge {Mµ > t} ist offen für jedes t ∈ R. Lemma B.11. Für jedes Borel-Maß µ auf Rd und jedes t > 0 gilt die Ungleichung λλ d ({Mµ > t}) ≤ 3d t −1 µ(Rd ). Beweis. Wir dürfen natürlich gleich µ als endlich voraussetzen, weil sonst nichts zu zeigen ist. Aufgrund der Unterhalbstetigkeit von Mµ gilt (Mµ)(x) ≥ t auf dem Abschluß von {Mµ > t}, den wir mit Bt bezeichnen. Für beliebiges N ≥ 1 ist dann die Menge Bt,N := Bt ∩ B(0, N) abgeschlossen und beschränkt, also kompakt. Aus diesem Grund finden wir eine endliche Überdeckung {B(xk , rk ) : 1 ≤ k ≤ n} von Bt,N durch Kugeln mit Zentren xk in Bt,N und Radien rk > 0 derart, dass λλ d (B(xk , rk )) ≥ t −1 µ(B(xk , rk )) für k = 1, ..., n. Gemäß Lemma B.10 existiert dann eine Teilfamilie {B(xi , ri ) : i ∈ I} p.d. Kugeln S derart, dass i∈I B(xi , ri ) ⊂ Bt,N sowie λλ d (Bt,N ) ≤ 3d ∑ λλ d (B(xi , ri )) ≤ 3d t −1 ∑ µ(B(xi , ri )) ≤ 3d t −1 µ(Rd ) i∈I i∈I gilt. Lässt man nun N gegen ∞ streben und beachtet Bt,N ↑ Bt ⊃ {Mµ > t}, so folgt die Behauptung. t u Schließlich benötigen wir noch das folgende, auch für sich interessante Ergebnis. Satz B.12. Für jedes 0 < p < ∞ liegt die Menge C (Rd ) der reellen stetigen Funktionen auf Rd dicht in (L p (λλ d ), k · k p ), d.h., zu jedem f ∈ L p (λλ d ) und jedem ε > 0 existiert ein p-fach L-integrierbares g ∈ C (Rd ) mit k f − gk p < ε. Beweis. Da nach Korollar 6.19 die primitiven Funktionen eine dichte Teilmenge von L p (λλ d ) bzgl. k · k p bilden, reicht es zu zeigen, dass sich jede primitive Funktion bzgl. k · k p durch stetige Funktionen approximieren lässt. B.6 Differentiation L-stetiger Borel-Maße und absolut stetige Funktionen 251 Sei zuerst g = 1I für ein beliebiges beschränktes Intervall I ⊂ Rd mit Abschluß I. Definiere gI,n ∈ C (Rd ) durch gI,n (x) := e−nρ(x,I) , wobei ρ(x, I) := min |y − x|. y∈I Dann folgt kg − gI,n k p → 0 mit dem Satz von der majorisierten Konvergenz. Als nächstes sei g = 1F für eine d-dimensionale dyadische Figur F ∈ F d , also für die p.d. Vereinigung von dyadischen Würfeln I1 , ..., Im ⊂ Rd [+ Bsp. 2.5]. Dann m d gilt 1F = ∑m k=1 1Ik , ∑k=1 gIk ,n ∈ C (R ) und unter Benutzung des zuvor Gezeigten m m lim g − ∑ gIk ,n ≤ lim ∑ k1Ik − gIk ,n k p = 0. n→∞ n→∞ k=1 k=1 p Sei schließlich g = 1B für ein beliebiges B ∈ B(Rd ). Da F d eine Algebra bildet, die B(Rd ) erzeugt, gibt es nach dem Approximationssatz 2.12 zu jedem n ≥ 1 ein Fn ∈ F d derart, dass λλ d (B4Fn ) ≤ 1/n, was wegen 1B4Fn = |1B − 1Fn | offenkundig k1B − 1An k p → 0 impliziert. Damit ist klar, dass sich jede Indikatorfunktion 1B und folglich auch jede primitive Funktion bzgl. k · k p durch stetige Funktionen approximieren lässt. t u Wir sind nun in der Lage, den angekündigten Beweis über die Existenz von Lebesgue-Punkten einer L1 -Funktion zu zeigen. Satz B.13. Für f ∈ L1 (λλ d ) (d ≥ 1) sind λλ d -fast alle x ∈ Rd Lebesgue-Punkte. Beweis. Für r > 0 und x ∈ Rd definieren wir (Dr f )(x) := 1 λλ d (B(0, r)) Z B(x,r) | f − f (x)| dλλ d und weiter (D f )(x) := lim sup (Dr f )(x), r→0 so dass D f = 0 λλ d -f.ü. zu zeigen ist. Sei außerdem (M f )(x) := 1 λλ d (B(0, r)) Z B(x,r) | f | dλλ d die Maximalfunktion von f , die offensichtlich der zuvor eingeführten Maximalfunktion des endlichen Borel-Maßes | f |λλ d mit Gesamtmase k f k1 entspricht und somit gemäß Lemma B.11 der Ungleichung λλ d ({M f > t}) ≤ 3d t −1 k f k1 für alle t > 0 (B.12) 252 B Ergänzungen zur Integrationstheorie genügt. Dank des vorherigen Satzes existiert zu jedem n ≥ 1 eine stetige Funktion gn ∈ C (Rd ) derart, dass k f − gn k1 ≤ 1/n. Wir setzen hn := f − gn und notieren Dgn = 0 wegen der Stetigkeit von gn [+ (B.10)]. Vermöge der einfachen Abschätzung 1 (Dr hn )(x) ≤ d λλ (B(0, r)) Z B(x,r) |hn | dλλ d + |hn (x)| erhalten wir Dhn ≤ Mhn + |hn |. Da außerdem D f ≤ Dgn + Dhn = Dhn gilt, erhalten wir die entscheidende Ungleichung D f ≤ Mhn + |hn | für alle n ≥ 1. Nun folgt nämlich weiter λλ d ({|hn | > t}) ≤ 1 t Z {|hn |>t} |hn | dλλ d ≤ 1 1 khn k1 ≤ , t tn was in Kombination mit (B.12) für hn die für alle t > 0 und n ≥ 1 gültige Abschätzung λλ d ({D f > 2t}) ≤ λλ d ({Mhn > t}) + λλ d ({|hn | > t}) ≤ 3d + 1 n liefert, also D f = 0 λλ d -f.ü. t u Ein Blick auf (B.11) legt nahe, den dortigen Limes als Ableitung von µ bzgl. λλ d im Punkt x aufzufassen, die nach dem gerade bewiesenen Satz λλ d -f.ü. existiert. Dies erklärt, warum die L-Dichte f häufig auch als Radon-Nikodym-Ableitung bezeichnet wird. Wegen seiner Bedeutung halten wir diese Feststellung in einem Korollar fest. Korollar B.14. Ist µ ein L-stetiges Borel-Maß auf Rd mit L-Dichte f , so existiert (Dµ)(x) := lim r→0 µ(B(x, r)) λλ d (B(x, r)) für λλ d -fast alle x ∈ Rd , und es gilt f = Dµ λλ d -f.ü. Als weiteres Korollar notieren wir, dass der Limes in (B.10) weiterhin existiert, wenn man dort die Kugeln B(x, r) durch Teilmengen ersetzt, die Volumina gleicher Größenordnung besitzen. Wie in [35] nennen wir eine Mengenfolge (Bn )n≥1 regulär fallend gegen x ∈ Rd , wenn es ein α > 0 und gegen 0 fallende Radien rn (n ≥ 1) gibt derart, dass Bn ⊂ B(x, rn ) und λλ d (Bn ) ≥ αλλ d (B(x, rn )) für alle n ≥ 1 gilt. B.6 Differentiation L-stetiger Borel-Maße und absolut stetige Funktionen 253 Korollar B.15. Sei f ∈ L1 (λλ d ). Dann gilt in jedem Lebesgue-Punkt x von f und für jede gegen x fallende Mengenfolge (Bn )n≥1 1 lim d n→∞ λ λ (Bn ) Z | f − f (x)| dλλ d = 0 Bn sowie a fortiori 1 n→∞ λ λ d (Bn ) lim Z f dλλ d = f (x). Bn Beweis. Mit α > 0 und rn wie oben beschrieben ergibt sich die Behauptung aus der Abschätzung α λλ d (Bn ) Z Bn | f − f (x)| dλλ d ≤ 1 λλ d (B(x, rn )) Z B(x,rn ) | f − f (x)| dλλ d , da die rechte Seite für n → ∞ gegen 0 konvergiert. t u L-stetige Borel-Maße auf R und absolute Stetigkeit. Wir wenden uns nun wieder dem eindimensionalen Fall (d = 1) zu, und zwar der noch offenen Frage, wie sich die maßerzeugende Funktion eines L-stetigen Borel-Maßes charakterisieren lässt. Mittels der zuvor erzielten Resultate können wir eine erste Teilantwort geben. Satz B.16. Ein Borel-Maß µ auf R mit maßerzeugender Funktion F ist genau dann L-stetig, wenn F λλ -f.ü. differenzierbar ist und mit F 0 = f F(b) − F(a) = Z (a,b) f (x) λλ (dx) für alle − ∞ ≤ a < b ≤ ∞ (B.13) gilt. Beweis. Zu zeigen sind offenbar nur die Aussagen bzgl. F, falls µ L-stetig ist. Sei f die L-Dichte von µ und L f die Menge der Lebesgue-Punkte von f . Es reicht zu zeigen, dass F in jedem x ∈ L f differenzierbar ist mit F 0 (x) = f (x). Für x ∈ L f gilt aber lim r↓0 F(x + r) − F(x) F(x) − F(x − r) F(x + r) − F(x − r) = lim = lim = f (x) r↓0 r↓0 r r 2r gemäß Korollar B.15, denn hier ist B(x, r) = (x − r, x + r), und die Mengenfolgen ((x − rn , x))n≥1 und ((x, x + rn ))n≥1 sind für jede Wahl von rn ↓ 0 regulär fallend gegen x. t u 254 B Ergänzungen zur Integrationstheorie Da auch jede λλ -singuläre Verteilung eine λλ -f.ü. differenzierbare maßerzeugende Funktion besitzt, besteht der entscheidende Zusatz in Satz B.16 gerade in der Gültigkeit von (B.13), also der Gültigkeit des Hauptsatzes der Differential- und Integralrechnung für die dortige Funktion F. Die damit noch zu beantwortende Frage lautet, für welche F dies der Fall ist. Die Antwort hierauf führt uns zum Begriff der absoluten Stetigkeit, der als nächstes definiert wird. Definition B.17. Seien a, b ∈ R mit a < b. Eine Funktion F : [a, b] → R heißt absolut stetig (auf [a, b]), wenn es zu jedem ε > 0 ein δ > 0 gibt, so dass n ∑ |F(yk ) − F(xk )| < ε k=1 für jede Auswahl p.d. Intervalle (xk , yk ) ⊂ [a, b] (1 ≤ k ≤ n) gilt, die der Bedingung ∑nk=1 (yk − xk ) < δ genügen. In diesem Fall heißt n Va F(x) := sup ∑ |F(zk ) − F(zk−1 )| [z0 ,...,zn ]∈Z[a,x] k=1 (x ∈ [a, b]) die Totalvariation von F auf [a, b] Anmerkung B.18. (a) Wählt man n = 1 in der obigen Definition, folgt sofort, dass jede absolut stetige Funktion insbesondere stetig im gewöhnlichen Sinne ist. (b) Aus der Definition der Totalvariation ergibt sich leicht die Gleichung n−1 Va F(x) = ∑ Vzk F(zk+1 − zk ) k=0 für alle [z0 , ..., zn ] ∈ Z[a, x]. (B.14) Fixiert man dann ε = 1 und dazu δ > 0 gemäß der obigen Definition, so folgt offenbar Vzk F(zk+1 − zk ) < 1, sofern z ∈ Z[a, x] der Bedingung max0≤k<n (zk+1 − zk ) < δ genügt (was offenbar n ≥ (x − a)/δ erzwingt) und folglich mit (B.14) die Endlichkeit von Va F auf ganz [a, b]. (c) Ist F monoton wachsend, so gilt offensichtlich Va F = F − F(a). Mithilfe der Totalvariation können wir eine absolut stetige Funktion als Differenz zweier monoton wachsender absolut stetiger Funktionen schreiben, wie das folgende Lemma zeigt. Da letztere zugleich maßerzeugende Funktionen bilden, können wir im Anschluß zum Teil auf Satz B.16 zurückgreifen. Lemma B.19. Sei F : [a, b] → R eine absolut stetige Funktion (a, b ∈ R). Dann gilt: B.6 Differentiation L-stetiger Borel-Maße und absolut stetige Funktionen (a) (b) 255 Die Funktionen Va F, Va F + F und Va − F sind monoton wachsend und ebenfalls absolut stetig auf [a, b]. Es existieren monoton wachsende, absolut stetige Funktionen auf [a, b] derart, dass F = F1 − F2 . Beweis. (a) Seien x, y ∈ [a, b] mit x < y beliebig gewählt. Wegen [z0 , ..., zn , y] ∈ Z[a, y], falls [z0 , ..., zn ] ∈ Z[a, x], folgt Va F(y) ≥ Va F(x) + |F(y) − F(x)| und daraus weiter Va F(y) ≥ Va F(x) + F(y) − F(x) und Va F(y) ≥ Va F(x) + F(x) − F(y). Dies zeigt die Monotonie der drei angegebenen Funktionen. Da Summen absolut stetiger Funktionen offenkundig wieder absolut stetig sind, müssen wir nur noch die absolute Stetigkeit von Va F nachweisen. Fixiere dazu ein beliebiges ε > 0 und wähle dazu δ > 0 gemäß Definition B.17 für die absolut stetige Funktion F. Aus (B.14) folgt für alle x, y ∈ [a, b] mit x < y n 0 ≤ Va F(y) −Va F(x) = Vx (y − x) = sup ∑ | f (zk ) − f (zk−1 )|, [z0 ,...,zn ]∈Z[x,y] k=1 wobei ∑nk=1 (zk − zk−1 ) = y − x für jede Zerlegung von [z0 , ..., zn ] ∈ Z[x, y] gilt. Folglich ergibt sich für jede Auswahl p.d. (xk , yk ) ⊂ [a, b] (1 ≤ k ≤ m) mit ∑m k=1 (yk − xk ) < δ m 0 ≤ ∑ (Va F(yk ) −Va F(xk )) < ε k=1 und so die absolute Stetigkeit von Va F auf [a, b]. (b) Hier genügt der Hinweis, dass F1 := (Va F + f )/2 und F2 := (Va F − f )/2 das Verlangte leisten. t u Der jetzt folgende Satz beinhaltet über Satz B.16 hinaus die noch fehlende Charakterisierung derjenigen maßerzeugenden Funktionen, die zu L-stetigen BorelMaßen führen. Satz B.20. Sei µ ein Borel-Maß auf R mit maßerzeugender Funktion F. Dann sind äquivalent: (a) (b) (c) µ ist L-stetig mit λλ -Dichte f . F ist λλ -f.ü. differenzierbar, und mit F 0 = f gilt (B.13). F ist absolut stetig auf jedem Intervall [a, b] für −∞ < a < b < ∞. 256 B Ergänzungen zur Integrationstheorie Beweis. Unter Hinweis auf Satz B.16 ist nur noch die Äquivalenz von (a) und (c) nachzuweisen. “(a)⇒(c)” Wir fixieren ein [a, b], a < b, und ein ε > 0. Gemäß Satz 6.27 existiert dann ein δ > 0 derart, dass µ(A) < ε für alle A ∈ B(R) mit λλ (A) < δ . Wählt man speziell A = ∑nk=1 (xk , yk ) mit p.d. (xk , yk ) ⊂ [a, b] und ∑nk=1 (yk − xk ) = λλ (A) < δ , folgt demnach n 0 ≤ ∑ (F(yk ) − F(xk )) = µ(A) < ε, k=1 was die absolute Stetigkeit von F auf [a, b] beweist. “(c)⇒(a)” Wir zeigen, dass µ auf jedem beschränkten offenen Intervall (a, b) L-stetig ist. Sei dazu irgendein (a, b) fixiert und N ⊂ (a, b) eine beliebige LNullmenge. Sei ferner ε > 0 beliebig und dazu δ > 0 gemäß Definition B.17 für die Funktion F gewählt. Nach Satz A.6 existiert eine offene Menge A ⊂ (a, b) derart, dass N ⊂ A und λλ (A) = λλ (A\N) < δ . Da Rd separabel ist, gibt es eine abzählbare Familie p.d. Intervalle {(xn , yn ) : n ≥ 1} derart, dass A = ∑n≥1 (xn , yn ). Aus ∑n≥1 (yn − xn ) = λλ (A) < δ folgt dann µ(N) ≤ µ(A) = ∑ (F(yn ) − F(xn )) < ε n≥1 und somit µ(N) = 0, da ε > 0 beliebig vorgegeben war. t u Auf der Grundlage der vorhergehenden Ergebnisse ergibt sich schließlich der Hauptsatz der Differential- und Integralrechnung für absolut stetige Funktionen quasi als einfache Zugabe. In Einführungskursen über Analysis wird dieser Satz üblicherweise nur für stetig differenzierbare und folglich R-integrierbare Funktionen bewiesen. Satz B.21. (Hauptsatz der Differential- und Integralrechnung) Jede absolut stetige Funktion F : [a, b] → R (a, b ∈ R) ist λλ -f.ü. differenzierbar mit L-intgerierbarer Ableitung F 0 = f , und es gilt F(x) − F(a) = Z (a,x) f dλλ für alle x ∈ [a, b]. (B.15) Beweis. Dank Lemma B.19 können wir F als Differenz von zwei monoton wachsenden absolut stetigen Funktionen F1 und F2 schreiben, die folglich maßerzeugende Funktionen von endlichen L-stetigen Borel-Maßen µ1 , µ2 auf [a, b] bilden. Diese Maße können wir natürlich in der üblichen Weise auch als Borel-Maße auf R auffassen, deren maßerzeugenden Funktion dann weiterhin F1 , F2 bilden, sofern wir Fi (x) = Fi (a) für x < a und Fi (x) = Fi (b) für x > b definieren (i = 1, 2). Alle Aussagen ergeben sich nun unter Berufung auf Satz B.16 für (µ1 , F1 ) und (µ2 , F2 ) und der Linearität des Maßintegrals. t u B.7 Die Transformationsformel für L-Integrale 257 B.7 Die Transformationsformel für L-Integrale Hauptziel dieses Abschnitts bildet die Herleitung der in der Überschrift genannten Transformationsformel für L-Integrale, die auch als Substitutionsregel im Rd bezeichnet wird. Obgleich eine Formel zur Berechnung von Integralen, macht sie letztendlich eine Aussage über das Bild des L-Maßes λλ d unter bijektiven stetig differenzierbaren Abbildungen Φ : U → V für offene Mengen U,V ⊂ Rd . Da der Beweis dieser Formel im wesentlichen auf der lokalen Approximation von Φ durch lineare Abbildungen beruht, kehren wir nochmals zurück zu einem Studium der Transformationseigenschaften des L-Maßes unter allgemeinen linearen Bijektionen des Rd , die sich bekanntlich durch reguläre Matrizen und Translationen beschreiben lassen. Im Folgenden bezeichne GL(d, R) die multiplikative Gruppe der regulären reellen d × d-Matrizen sowie I die d-dimensionale Einheitsmatrix. Es sei ferner SL(d, R) die Untergruppe derjenigen T mit | det T| = 1, die insbesondere alle orthogonalen Matrizen enthält. Die Hintereinanderschaltung einer orthogonalen Abbildung und einer Translation heißt Bewegung. Die Gesamtheit all dieser Abbildungen bildet wiederum eine Gruppe, genannt Bewegungsgruppe und bezeichnet mit Bew(Rd ). Wie in der linearen Algebra gezeigt wird, ist eine Bijektion T : Rd → Rd genau dann eine Bewegung, wenn sie den euklidischen Abstand erhält, d.h. |T(x) − T(y)| ≤ |x − y| für alle x, y ∈ Rd . Die nächsten zwei Ergebnisse klären, wie sich das Bild von λλ d unter den zuvor genannten Abbildungen verhält, und stellen zugleich eine Erweiterung der in Satz 2.17 und Beispiel 3.17 gefundenen Eigenschaften dar. Satz B.22. Für jedes T ∈ GL(d, R) gilt (λλ d )T = | det T|−1 λλ d . Beweis. Wir notieren vorab, dass T(B), T−1 (B) ∈ B(Rd ) für alle B ∈ B(Rd ) gilt, und schreiben der Kürze halber λ für λλ d . Der Beweis vollzieht sich in vier Schritten: (1) Das Maß λ T ist wieder translationsinvariant, denn λ T (a + B) = λ T (Tb + B) = λ (b + T−1 (B)) = λ (T−1 (B)) = λ T (B) für alle a ∈ Rd und B ∈ B(Rd ). Dabei gilt a = Tb für ein eindeutig bestimmtes b ∈ Rd , weil T bijektiv ist. Aus der Stetigkeit von T−1 und der Kompaktheit von [0, 1]d folgt, dass T−1 ([0, 1]d ) kompakt ist und deshalb c(T) := λ T ([0, 1]d ) < ∞ gilt. Vermöge Satz 2.17(b) folgern wir nun λ T = c(T)λ . Zu zeigen bleibt also c(T) = | det T|−1 , wobei S d) ≤ ∞ = λ T (Rd ) = λ T (q + [0, 1] d ∑q∈Qd λ T (q + [0, 1]d ) q∈Q 258 B Ergänzungen zur Integrationstheorie offenbar c(T) > 0 garantiert. (2) Für S, T ∈ GL(d, R) gilt c(ST) = c(S)c(T), denn λ ST (B) = λ T (S−1 (B)) = c(T)λ (S−1 (B)) = c(T)λ S (B) = c(S)c(T)λ (B) für alle B ∈ B(Rd ). Insbesondere ist c(T−1 ) = c(T)−1 wegen 1 = c(I) = c(T−1 )c(T) und damit außerdem c(T1 ) = c(T2 ), falls T1 = ST2 S−1 für ein S ∈ GL(d, R). Die Funktion c(·) ist also ebenso wie | det(·)| ein Homomorphismus von der multiplikativen Gruppe GL(d, R) in die multiplikative Gruppe R> . > (3) Bezeichnet T> ∈ GL(d, R) die Transponierte von T, so gilt λ T = λ T , d.h. c(T) = c(T> ). Zum Beweis sei n ≥ 1 so groß gewählt, dass 0 < λ (B) < ∞ für B := T−1 ([−n, n]d ) ∩ (T> )−1 ([−n, n]d ). Dann gilt offenkundig T−1 (B) = (T> )−1 (B), was > c(T)λ (B) = λ T (B) = λ T (B) = c(T> )λ (B) und somit c(T) = c(T> ) impliziert. (4) Schließlich betrachten wir T> T ∈ GL(d, R), die als symmetrische Matrix diagonalisierbar ist, also T> T = SDS−1 für eine geeignete Diagonalmatrix D ∈ GL(d, R) und ein S ∈ GL(d, R) erfüllt. Unter Berufung auf (2) und (3) ergibt sich nun c(T)2 = c(T> )c(T) = c(T> T) = c(D), also c(T) = c(D)1/2 , und ganz entsprechend | det T| = | det D|1/2 . Wie aber in Bsp. 3.17 bereits gezeigt wurde, gilt c(D) = | det D|−1/2 [+ (3.4)]. Vermöge c(T) = c(D)1/2 = | det D|−1/2 = | det T|−1 folgt daher die Behauptung . t u Hinsichtlich der anderen zu Beginn des Abschnitts genannten Abbildungen erhalten wir nun leicht das folgende Ergebnis. Korollar B.23. Das L-Maß λλ d ist (a) (b) invariant unter SL(d, R), d.h. (λλ d )S = λλ d für alle S ∈ SL(d, R). bewegungsinvariant, d.h. (λλ d )T = λλ d für alle T ∈ Bew(Rd ). Beweis. Teil (a) ergibt sich sofort aus dem vorherigen Satz, da | det S| = 1 für alle S ∈ SL(d, R). Für Teil (b) benötigen wir zusätzlich die Translationsinvarianz von λλ d , denn jede Bewegung ist die Hintereinanderschaltung Tc ◦ S für eine Translation Tc (c ∈ Rd ) und eine orthogonale Abbildung S. Dies liefert dann wie verlangt (λλ d )Tc ◦S (B) = (λλ d )S (Tc−1 (B)) = λλ d (Tc−1 (B)) = (λλ d )Tc (B) = λλ d (B) für alle B ∈ B(Rd ). t u B.7 Die Transformationsformel für L-Integrale 259 Als weitere Folgerung notieren wir die folgende Erweiterung von Satz 2.17(d). Korollar B.24. Jede affine Hyperebene des Rd ist eine λλ d -Nullmenge. Beweis. Gemäß Satz 2.17(d) wissen wir, dass λλ d (Hc,i ) = 0 für jedes Hc,i = {a : ai = c} (c ∈ R und i = 1, ..., d) gilt. Bezeichnet nun H eine beliebige affine Hyperebene des Rd , so existiert ein T ∈ Bew(Rd ) derart, dass T−1 (Hc,1 ) = H. Unter Benutzung der Bewegungsinvarianz von λλ d ergibt sich daher λλ d (H) = λλ d (T−1 (Hc,1 )) = (λλ d )T (Hc,1 ) = λλ d (Hc,1 ) = 0 t u und somit die Behauptung. Wir kommen nun zur angekündigten Transformationsformel für L-Integrale. Seien U und V offene Teilmengen des Rd . Φ : U → V heißt C1 -Diffeomorphismus oder C1 -invertierbar, wenn sowohl Φ als auch Ψ := Φ −1 stetig (partiell) differenzierbar ist. Wir bezeichnen dann mit DΦ die Funktionalmatrix von Φ = (Φ1 , ..., Φd ), d.h. ∂Φ ∂ Φ1 1 ∂ u1 (u) . . . ∂ ud (u) . .. .. DΦ (u) = . . (u ∈ U). .. ∂ Φd ∂ Φd ∂ u (u) . . . ∂ u (u) 1 d Für einen C1 -Diffeomorphismus Φ ist DΦ in jedem Punkt u ∈ U invertierbar, und es folgt (DΦ (u))−1 = DΨ (v) mit v := Φ(u). (B.16) Satz B.25. (Transformationsformel für L-Integrale) Seien U und V zwei offene Teilmengen des Rd und Φ : U → V ein C1 -Diffeomorphismus. Eine meßbare numerische Funktion g : (V, B(V )) → (R, B(Rq )) ist genau dann über V L-integrierbar, wenn | det DΦ | g ◦ Φ über U L-integrierbar ist, und es gilt in diesem Fall Z g dλλ d = V Z U g ◦ Φ | det DΦ | dλλ d . (B.17) Die linke Seite der Formel (B.17) lässt sich mittels des Transformationssatzes 3.46 auch in der Form Z g ◦ Φ d(λλ d )Ψ U schreiben, und dank desselben Satzes wissen wir, dass g ◦ Φ genau dann (λλ d )Ψ integrierbar ist, wenn g L-integrierbar ist. Auch kann man jede meßbare Funktion h : (U, B(U)) → (R, B(R)) vermöge (h ◦Ψ ) ◦ Φ nach Φ faktorisieren. Mit diesen 260 B Ergänzungen zur Integrationstheorie Beobachtungen entpuppt sich Satz B.25 aber als nichts anderes als eine äquivalente Variante des folgenden Satzes über das Bild von λλ d unter Ψ . Satz B.26. Unter den Voraussetzungen von Satz B.25 gilt auf (U, B(U)) (λλ d )Ψ = | det DΦ | λλ d d.h., (λλ d )Ψ ist L-stetig auf U mit λλ d -Dichte | det DΦ |. Statt Satz B.25 werden wir diese äquivalente Version beweisen, wofür das folgende Lemma den Schlüssel liefert. Lemma B.27. Unter den Voraussetzungen von Satz B.25 gilt für jedes u ∈ U (λλ d )Ψ (B(u, r)) = 1, r→0 (λ λ d )DΨ (v) (B(0, r)) lim wobei v := Φ(u). Beweis. Wir fixieren ein u ∈ U und wählen r0 > 0 so klein, dass B(u, r0 ) ⊂ U. Aus der stetigen Differenzierbarkeit von Φ folgt, dass |Φ(x) − v − DΦ (u)(x − u)| ≤ γ(|x − u|) für alle x ∈ B(u, r0 ) und eine Funktion γ : (0, r0 ) → R> mit limr→0 r−1 γ(r) = 0 gilt. Die Funktion |Φ(x) − v| (B.18) [0, r0 ) 3 r 7→ ϕu (r) := max |x−u|≤r |x − u| ist deshalb stetig mit ϕu (0) = kDΦ (u)k > 0, wobei an kDk = max|x|≤1 |Dx|/|x| erinnert sei. Weiter folgt nun die Inklusion Ψ −1 (B(u, r)) = Φ(B(u, r)) ⊂ B(v, ϕ(r)) für alle r ∈ (0, r0 ). Eine Taylor-Entwicklung von Ψ (y) in v liefert (wie zuvor für Φ) für eine geeignete Funktion ρ : (0, r1 ) → R> mit limr→0 r−1 ρ(r) = 0, dass |Ψ (y) − u − DΨ (v)(y − v)| ≤ ρ(|y − v|) für alle y ∈ B(v, r1 ), wobei r1 > 0 so gewählt wird, dass B(v, r1 ) ⊂ V . Mit w := DΨ (v)v impliziert dies |Ψ (y) − u| − ρ(r) ≤ |DΨ (v)y − w| ≤ |Ψ (y) − u| + ρ(r) für alle y ∈ B(v, r1 ). Setzen wir schließlich κ := ρ ◦ ϕ und notieren, dass limr→0 r−1 κ(r) = 0, so ergibt sich für alle hinreichend kleinen r die entscheidende Inklusionskette B.7 Die Transformationsformel für L-Integrale 261 (DΨ (v))−1 (B(w, r − κ(r))) ⊂ Ψ −1 (B(u, r)) ⊂ (DΨ (v))−1 (B(w, r + κ(r))). Da DΨ (v) ∈ GL(d, R), erhalten wir nun nämlich unter Benutzung von Satz B.22 (λλ d )DΨ (v) (B(w, r ± κ(r))) λλ d (B(0, r ± κ(r))) = = λλ d (B(0, r)) (λλ d )DΨ (v) (B(w, r)) κ(r) d 1± → 1, r falls r → 0, und dann (λλ d )Ψ (B(u, r)) (λλ d )Ψ (B(u, r)) = lim = 1, r→0 (λ r→0 (λ λ d )DΨ (v) (B(0, r)) λ d )DΨ (v) (B(w, r)) lim t u was zu beweisen war. Lemma B.28. Unter den Voraussetzungen von Satz B.25 gilt (λλ d )Ψ λλ d . Beweis. Sei N ∈ B(U) eine beliebige, o.B.d.A. beschränkte L-Nullmenge, für die nun (λλ d )Ψ (N) = λλ d (Φ(N)) = 0 gezeigt wird. Wir fixieren dazu ein beliebiges ε > 0 und definieren die stetige Funktion ΓΦ : U ×U → R durch ( |Φ(y)−Φ(x)| , falls x 6= y, |y−x| ΓΦ (x, y) := DΦ (x), falls x = y. Für k, n ∈ N sei dann En,k := n x∈U : sup y∈B(x,1/k)∩U o ΓΦ (x, y) < n . Wie man leicht einsieht, ist jedes En,k eine offene Menge und deshalb meßbar. FerS ner gilt U = k,n≥1 En,k . Folglich reicht es, (λλ d )Ψ (N ∩ En,k ) = 0 für alle k, n ∈ N zu zeigen. Wir fixieren nun n, k ∈ N und wählen Kugeln B(xi , ri ) (i ∈ I) für eine höchstens abzählbare Indexmenge I derart, dass sup ri < 1/k, i N ∩ En,k ⊂ [ i B(xi , ri ) und ∑ λλ d (B(xi , ri )) < ε. i Dies ist möglich, weil λλ d regulär ist und N ∩ En,k deshalb bzgl. λλ d von außen beliebig genau durch eine offene Menge G ⊂ En,k approximiert werden kann, die sich ihrerseits als abzählbare, p.d. Vereinigung von d-dimensionalen, links halboffenen dyadischen Würfeln An,i [+ (2.4)] darstellen lässt. Für jedes x ∈ G gibt es nämlich genau einen solchen dyadischen Würfel Q maximaler Kantenlänge mit x ∈ Q ⊂ G. Jeder Würfel mit Kantenlänge 2−n ist aber seinerseits in der Kugel mit dem gleichen Zentrum und dem Radius d 1/2 2−n−1 enthalten. Aus xi ∈ En,k und ri < 1/k folgern wir |Φ(x) − Φ(xi )| < n|x − xi | < nri für alle x ∈ B(xi , ri ) und daraus weiter 262 B Ergänzungen zur Integrationstheorie Φ(B(xi , ri )) ⊂ B(Φ(xi ), nri ) für jedes i ∈ I. Also gilt Φ(N ∩ En,k ) ⊂ [ i∈I Φ(B(xi , ri )) ⊂ [ B(Φ(xi ), nri ), i∈I was uns schließlich unter Benutzung der Transformationseigenschaften des LMaßes (λλ d )Ψ (N ∩ En,k ) = λλ d (Φ(N ∩ En,k )) ≤ ∑ λλ d (B(Φ(xi ), nri )) i∈I = ∑ nd λλ d (B(xi , ri )) < nd ε i∈I und somit (λλ d )Ψ (N ∩ En,k ) = 0 beschert, da ε > 0 beliebig vorgegeben war. t u Beweis (von Satz B.26). Wir müssen jetzt nur noch die zuvor gezeigten Ergebnisse in geeigneter Weise zusammenfügen. Wie gerade gezeigt, gilt (λλ d )Ψ λλ d , d.h., (λλ d )Ψ besitzt nach dem Satz von Radon-Nikodym eine λλ d -Dichte f . Für diese gilt wiederum gemäß Korollar B.14 sowie Korollar B.27 (λλ d )Ψ (B(u, r)) (λλ d )DΨ (v) (B(0, r)) = lim d r→0 λ r→0 λ (B(u, r)) λλ d (B(u, r)) f (u) = lim für λλ d -fast alle u ∈ U, wobei v = Φ(u). Eine Kombination von Satz B.22 und Korollar B.14 liefert aber (λλ d )DΨ (v) (B(u, r)) 1 (λλ d )DΨ (v) (B(0, r)) = lim = d r→0 r→0 | det DΨ (v)| λλ (B(u, r)) λλ d (B(u, r)) lim für λλ d -fast alle u ∈ U, und da | det DΨ (v)|−1 = | det DΦ (u)| gemäß (B.16) gilt, folgt schließlich wie behauptet f = | det DΦ | λλ d -f.ü. t u Anhang C Requisiten der W-Theorie C.1 Eine Übersicht nützlicher Integralformeln In diesem Abschnitt sind einige nützliche Integrationsformeln, die sich direkt aus Satz 6.45 ergeben, zusammengestellt. Wir geben das Ergebnis in seiner wahrscheinlichkeitstheoretisch relevanten Form nochmals an: Satz C.1. Seien X eine nichtnegative ZG auf einem W-Raum (Ω , A, P) und ϕ : R> → R> eine stetige, monoton wachsende und auf R> stetig differenzierbare Funktion mit ϕ(0) = 0. Dann gilt für alle A ∈ A Z ϕ(X) dP = Z ∞ 0 A ϕ 0 (t) P(A ∩ {X > t}) dt. (C.1) Das anschließende Korollar stellt die wichtigsten Spezialfälle von (C.1) zusammen. Korollar C.2. Für jede nichtnegative ZG X und a, p > 0 gilt: EX = EX p = Z {X>a} X p dP = Z ∞ Z0 ∞ 0 Z ∞ P(X > t) dt, (C.2) pt p−1 P(X > t) dt, (C.3) 0 pt p−1 P(X > t ∨ a) dt p p−1 = a P(X > a) + E (X − a)+ p = Z ∞ a Z ∞ a pt (C.4) P(X > t) dt, p(t − a) p−1 P(X > t) dt, (C.5) 263 264 C Requisiten der W-Theorie Z a E(X ∧ a) p = 0 Z ∞ E(eaX − 1) = 0 Z ∞ E(1 − e−aX ) = 0 pt p−1 P(X > t) dt, (C.6) aeat P(X > t) dt, (C.7) ae−at P(X > t) dt. (C.8) Ist X außerdem P-f.s. ganzzahlig, so gilt weiter: EX = ∑ P(X > n), (C.9) n≥0 EX 2 = ∑ (2n + 1) P(X > n), (C.10) n≥0 sowie für a ∈ R E(eaX − 1) = (ea − 1) ∑ ean P(X > n). (C.11) n≥0 Als Ergänzung notieren wir die für p ≥ 1 direkt aus (C.3) folgende Ungleichung ∑ p(n − 1) p−1 P(X > n) n≥1 ≤ EX p ≤ ∑ p(n + 1) p−1 P(X > n) (C.12) n≥0 Es ist offensichtlich, das Ungleichungen vom selben Typ auch für p ∈ (0, 1) und für jede der übrigen Integrationsformeln (C.4)–(C.8) angegeben werden können. Durch Zerlegung von X in Positiv- und Negativteil lassen sich weitere Formeln aus (C.1) für reelle ZG herleiten. Herausgreifen wollen wir hier nur die für Erwartungswert und Varianz. Korollar C.3. Für jede quasi-integrierbare ZG X gilt EX = Z ∞ 0 P(X > t) − P(X < −t) dt. (C.13) Existiert auch ihre Varianz Var X, so gilt für diese Var X = wobei µ = EX. Z ∞ 0 (2t − µ)P(X > t) + (2t + µ)P(X < −t) dt, (C.14)