Maßtheorie - Mathematisches Seminar

Werbung
Maßtheorie
Vorlesungsmitschrift
Kiel WS2008/09
Professor Dr.Uwe Rösler
20. Dezember 2016
Kapitel 1
Objekte und Morphismen
Wir beschreiben im folgenden die hier behandelten Objekte, die Maßräume, und ihre Morphismen (strukturerhaltende Abbildungen), die meßbaren Abbildungen.
1.1
Mengensysteme
Sei Ω stets eine nichtleere Menge. Ein Mengensystem A ist eine Teilmenge der Potenzmenge
P(Ω). Ein Mengensystem heißt abgeschlossen unter einer Mengenoperation (P(Ω))I → P (Ω)
oder stabil , falls diese Operation angewandt auf Mengen aus A wieder ein Element aus A
liefert. Beispiele für Mengenoperationen sind:
S S S
- (endliche, abzählbare, beliebige) Vereinigung e , a , ,
T T T
- (endliche, abzählbare, beliebige) Durchschnitte e , a , ,
S
- Vereinigung paarweiser disjunkter Mengen ◦ ,
- Komplementbildung Ac = {ω ∈ Ω | ω 6∈ A},
- Differenz A\B = A ∩ B c ,
- symmetrische Differenz A△B = (A\B) ∪ (B\A),
- aufsteigender (absteigender) Limes,
T
S
- Limes superior lim supn∈IN An := m∈IN n≥m An = {ω | |{n | ω ∈ An }| = ∞},
S
T
- der Limes inferior lim inf n∈IN An := m∈IN n≥m An = {ω | |{n | ω 6∈ An }| < ∞}
- der Limes falls lim sup = lim inf usw..
- Obermengen (A ∈ A, A ⊂ B ⇒ B ∈ A)
Besonders wichtige Mengensysteme sind Topologien und σ-Algebren. Eine Topologie ist
ein Mengensystem, welches die Grundmenge enthält und abgeschlossen ist bezüglich beliebiger
Vereinigung und endlichem Durchschnitt.
Not: (Ω, τ ) für einen topologischen Raum.
Eine Menge heißt offen, genau dann wenn sie Element der Topologie ist. Das Komplement
einer offenen Menge heißt abgeschlossen. Topologien sind grundlegend für Konvergenzen.
(Alle) Konvergenzbegriffe beruhen auf Topologien (siehe Pedersen [9]). (Ω ∋ xn →n→∞ x ∈
Ω ⇔ ∀U ∈ τ, x ∈ U ∃n0 ∈ IN ∀n ≥ n0 : xn ∈ U .) Die Morphismen (=strukturerhaltenden
Abbildungen) sind die stetigen Funktionen (f : (Ω, τ ) → (Ω′ , τ ′ ) stetig ⇔ ∀x ∈ Ω ∀V ′ ∈
τ ′ , f (x) ∈ V ′ ∃U ∈ τ, x ∈ U : f (U ) ⊂ V ).
Eine σ-Algebra A ist ein nichtleeres Mengensystem abgeschlossen bezüglich Komplementbildung und abzählbarer Vereinigung. Eine Menge heis̈t mes̈bar, genau dann wenn sie Element der σ-Algebra ist. Die Morphismen sind die mes̈baren Funktionen bzw. Zufallsgrös̈en
1
WS10/11
Maßtheorie
(f : (Ω, A) → (Ω′ , A′ ) meßbar ⇔ ∀A′ ∈ A′ : f −1 (A′ ) ∈ A).
Not: (Ω, A) ist ein mes̈barer Raum.
σ-Algebren sind grundlegend für die Mas̈theorie und die Wahrscheinlichkeitstheorie. Weitere Beispiele sind Filter . Ein Filter ist ein nichtleeres Mengensystem ungleich der Potenzmenge, welches abgeschlossen ist bzgl. endlichem Durchschnitt und Obermengen.
In diesem Skript erscheinen weiterhin Algebren und Ringe . Eine Algebra ist ein nicht
leeres Mengensysteme, welches abgeschlossen ist bzgl. Komplement und endlicher Vereinigung.
Ein Ring ist ein Mengensystem mit der leeren Menge und abgeschlossen bzgl. endlichem
Durchschnitt und der symmetrischen Differenz.
Bemerkung: Die Namensgebung Ring, siehe Elstrodt, stammt von dem algebraischen
Ring der Funktionen 11A , A aus dem Mengenring, über dem binären Körper, versehen mit
der Addition 11A + 11B := 11A△B und der Multiplikation 11A 11B := 11A∩B .
Der Zusatz σ deutet auf etwas abzählbares hin, vgl. Algebra und σ-Algebra.
Erzeuger: Mengensysteme A werden oft nicht explizit angegeben, sondern als kleinstes
Mengensystem charakterisiert, welches ein Mengensystem E enthält und abgeschlossen ist
bzgl. gewisser Mengenoperationen. Dieses kleinste Mengensystem A, wenn es existiert, ist der
Durchschnitt aller Mengensysteme, abgeschlossen bzgl. der Operationen und E enthaltend.
Das Mengensystem E heis̈t Erzeuger von A (bzgl. den Operationen ...) und A heis̈t das von
E erzeugte Mengensystem.
Beispiele: Die Borelsche σ-Algebra für einen topologischen Raum (Ω, τ ) ist die kleinste
von der Topologie erzeugten σ-Algebra. Die übliche Topologie auf den reellen Zahlen wird
erzeugt von allen offenen Intervallen.
1.1.1
σ-Algebren
Eine σ-Algebra A ist ein nichtleeres Mengensystem abgeschlossen bezüglich Komplementbildung und abzählbarer Vereinigung. Ausführlicher: A ⊂ P(Ω) erfüllt
i) A =
6 ∅
ii) A ∈ A ⇒ Ac ∈ A
S
iii) An ∈ A, n ∈ IN ⇒ n An ∈ A.
Ein mes̈barer Raum ist ein Tupel (Ω, A). Hierbei ist Ω eine nichtleere Menge und A eine
σ-Algebra darüber. Eine mes̈bare Menge ist ein Element der σ-Algebra.
Proposition 1 Jede σ-Algebra enthält die leere Menge und die Grundmenge Ω. Sie ist abgeschlossen bzgl. endlicher und abzählbarer Vereinigung, endlichem und abzählbarem Durchschnitt, Differenz, symmetrischer Differenz, aufsteigenden oder absteigenden Folgen, Limes
superior und dem Limes inferior.
Beweis: Ist A aus der σ-Algebra, so auch das Komplement Ac . Die Vereinigung über aller
Glieder der Folge A, Ac , Ac , Ac . . . ist in A. Damit ist die Grundmenge Ω in der σ-Algebra.
Die leere Menge ist das Komplement der Grundmenge Ω.
Jede endliche Folge läs̈t sich zu einer abzählbaren Folge erweitern durch hinzunehmen der
leeren Menge. Daher ist A abgeschlossen bzgl. endlicher Vereinigung.
T
S
Für den Durchschnitt argumentiere ( An )c = Acn ist mes̈bar. Der Rest ist Übung. q.e.d.
Für E ∈ P(Ω) sei σ(E) die kleinste σ-Algebra, die E enthält. Formaler ausgedrückt:
\
σ(E) :=
E⊂A σ−Algebra
2
A.
WS10/11
U. Rösler
(Übung: Dies ist die kleinste E enthaltende σ-Algebra.) Ein Erzeuger E einer σ−Algebra A ist
ein Mengensystem mit σ(E) = A. Der Operator σ hat u.a. die Eigenschaften σ(σ(E)) = σ(E)
und E ⊂ E ′ ⇒ σ(E) ⊂ σ(E ′ ).
Beispiele: – Die kleinste σ-Algebra ist stets {∅, Ω}, die nächst grös̈ere ist {∅, A, Ac , Ω}
für ein A 6= ∅, Ω. (Übung: Nächstgrös̈ere?)
– Die Potenzmenge P(Ω) ist die grös̈te σ-Algebra.
– Die Menge {A ⊂ Ω | A oder Ac abzählbar} ist eine σ-Algebra.
– Sei A eine σ-Algebra und B eine beliebige Menge aus Ω. Die eingeschränkte σ-Algebra
ist A|B := {A ∩ B | A ∈ A}.
– Die Borel σ-Algebra B = σ(τ ) wird von einer Topologie τ auf Ω erzeugt. Die Baire
σ-Algebra wird erzeugt von der kleinsten Topologie, so das̈ alle stetigen Funktionen (bzgl. τ )
mit kompaktem Träger stetig sind.
Spezialisierung auf IR : Der euklidische Abstand definiert eine Metrik auf den reellen
Zahlen. Die offenen Kugeln bezüglich dieser Metrik sind die offenen Intervalle ]a, b[, a, b ∈ IR.
Diese erzeugen die (metrische) Topologie auf den reellen Zahlen. Jede offene Menge in IR ist
darstellbar als Vereinigung abzählbar vieler offener Intervalle. Daher wird die Borel σ-Algebra
auch von allen offenen Intervallen erzeugt.
Andere Erzeuger für die Borel σ-Algebra B auf IR sind die Topologie selber, das Mengensystem aller kompakten Mengen, die Mengensysteme E[,] := {[a, b] | a, b ∈ IR} aller abgeschlossenen Intervalle oder analog E],] , E[,[ aller halboffenen Intervalle. Es reicht hier a, b aus
einer dichten Teilmenge von IR, z.B. Ql, zu fordern. Ebenso reichen einseitige Intervalle, denn
es kann stets a = −∞ oder auch b = ∞ gesetzt werden.
Stellvertretend zeigen wir nur die Richtung σ(E],[ ) ⊂ σ(E[,[ ). Es reicht zu zeigen ]a, b[∈
σ(E[,] ) für jedes a, b. Dies folgt aus E[,] ∋ ∪n [a + 1/n, b[=]a, b[.
Die Borel σ-Algebra auf den reellen Zahlen wird erzeugt von allen Kompakta.
Diverses: – Eine σ−Algebra A heis̈t separierend, falls es für alle ω 6= ω ′ eine mes̈bare
Mengen A ∈ A gibt mit ω ∈ A und ω ′ 6∈ A. Durch Äquivalenzklassenbildung auf dem Grundraum Ω können wir eine σ-Algebra überführen in eine separierende σ-Algebra. Betrachte auf
dem Grundraum Ω die Äquivalenzrelation ω ∼ ω ′ ⇔6 ∃A ∈ A : ω ∈ A, ω ′ 6∈ A. Seien [ω] die
Äquivalenzklassen. Dann ist A/ ∼:= {{[a] | a ∈ A} | A ∈ A}) eine separierende σ−Algebra
bezüglich Ω/ ∼:= {[ω] | ω ∈ Ω}.
– Ein Atom einer σ−Algebra ist eine mes̈bare Menge, die nicht in echt kleinere meßbare
Mengen zerlegt werden kann. (∀ B ∈ A, B ⊂ A ⇒ B = ∅ ∨ B = A)
Im Regelfall sind die Atome genau die Punktmengen {ω}. Jede separierende σ−Algebra
über einem abzählbaren Grundraum ist die Potenzmenge. Die Atome sind die einelementigen
Mengen {ω}.
1.1.2
Nachweis einer σ-Algebra
Zum Nachweis eines Mengensystems als σ-Algebra sind zwei Methoden wichtig, über Dynkinsysteme und über monotone Klassen.
Dynkinsystem: Ein Dynkinsystem D ist ein nicht leeres Mengensystem abgeschlossen
bzgl. der Differenz aufsteigender Mengen und bzgl. der abzählbaren Vereinigung paarweise
disjunkter Mengen. (Ausführlicher: ∅ =
6 D ⊂ P(Ω) erfüllt
i) D ∋ A ⊂ B ∈ D ⇒ B\A ∈ D
S
ii) An ∈ D, n ∈ IN, paarweise disjunkt ⇒ ◦ n An ∈ D.
3
WS10/11
Maßtheorie
Lemma 2 Ein Dynkinsystem D ist genau dann eine σ-Algebra, wenn D den Grundraum Ω
enthält und bzgl. endlichem Durchschnitt abgeschlossen ist.
Beweis: Jede σ-Algebra ist ein Dynkinsystem, welches abgeschlossen ist bzgl. endlichem
Durchschnitt. Für die Umkehrung sind die drei Eigenschaften einer σ-Algebra zu zeigen. Für
die dritte argumentiere: Zu Dn ∈ D definiere Bn := Dn \∪i<n Di . Diese Mengen sind paarweise
S
S
S
disjunkt und erfüllen Bn = Dn ∩ ∩i<n Dic ∈ D und ◦ n≤N Bn = n≤N Dn für N ∈ IN {∞}.
S
q.e.d.
Hieraus folgt n∈IN Dn ∈ D.
T
Bezeichne D(E) das kleinste von E erzeugte Dynkinsystem. (Formaler: D(E) := E⊂B Dynkinsystem B
tut’s.) Ein Erzeuger eines Dynkinsystems D ist ein Mengensystem E mit D(E) = D.
Lemma 3 Ein Dynkinsystem mit Ω ist genau dann eine σ-Algebra, wenn es einen Erzeuger
abgeschlossen bzgl. endlichem Durchschnitt besitzt.
Beweis: Ist das Dynkinsystem D eine σ-Algebra, so ist D selbst ein Erzeuger und abgeschlossen
bzgl. endlichem Durchschnitt. Für die Umkehrung betrachte DA := {B ∈ D | A ∩ B ∈ D} mit
A ∈ D. Dies ist ein Dynkinsystem (Übung). Für jedes Element E aus dem durchschnittstabilen
Erzeuger E von D enthält DE den Erzeuger E. Damit gilt E ⊂ DE ⊂ D und wegen der
Sandwichposition D(E) = DE = D.
Als direkte Folgerung enthält jedes DA , A ∈ D den Erzeuger E und die Sandwichposition
impliziert gilt D(E) = DA = D.
Damit ist D durchschnittstabil und nach Lemma 2 eine σ-Algebra.
q.e.d.
Monotone Klasse: Eine monotone Klasse ist ein Mengensystem abgeschlossen bzgl.
aufsteigenden und absteigenden Folgen. Sei M(E) die von E erzeugte kleinste monotone
Klasse. Hierbei ist M(E) die kleinste monotone Klasse welche E enthält. (Formaler: M(E) :=
T
E⊂B monotone Klasse B.)
Eine Algebra ist ein Mengensystem welches Ω enthält und abgeschlossen ist bzgl. Komplement und endlicher Vereinigung.
Lemma 4 Eine monotone Klasse erzeugt von einer Algebra ist eine σ-Algebra.
Beweis: Sei A die Algebra und M = M(A) die erzeugte monotone Klasse.
• M ist komplementabgeschlossen.
Das Mengensystem {A ∈ M | Ac ∈ M} ist eine monotone Klasse und enthält die Algebra
A (Übung). Damit ist das Mengensystem bereits M selbst.
• M ist eine Algebra.
Wir haben nur die endliche Durchsschnittsabgeschlossenheit zu zeigen. Für A ∈ M betrachte
MA := {B ∈ M | A ∪ B ∈ M}.
Dies ist eine monotone Klasse. Für A aus der Algebra enthält MA das Erzeugersystem A und
ist damit M selber (Sandwichposition). Die Menge {A ∈ M | MA = M} ist eine monotone
Klasse und enthält die Algebra. Damit ist dies M selbst.
• Eine Algebra, die auch eine monotone Klasse ist, ist eine σ-Algebra.
Nur die Abgeschlossenheit gegenüber abzählbarer Vereinigung ist zu zeigen. Sei An eine
Folge aus der Algebra. Die Folge ∪i≤n Ai ist aus der Algebra und konvergiert aufsteigend
gegen ∪i Ai . Der Grenzwert ist in der monotonen Klasse.
q.e.d.
4
WS10/11
1.2
U. Rösler
Meßbare Abbildungen
Meßbare Abbildungen sind die Morphismen, d.h. die strukturerhaltenden Abbildungen bezüglich
mes̈barer Räume.
Eine Abbildung zwischen meßbaren Räumen heißt meßbar , falls das Urbild jeder meßbaren
Menge meßbar ist. Formaler formuliert, eine Abbildung f : Ω → Ω′ von einem meßbaren Raum
(Ω, A) in einen anderen meßbaren Raum (Ω′ , A′ ) ist meßbar, falls für jede Menge A ∈ A gilt
f −1 (A′ ) ∈ A. Kürzer formuliert f −1 (A′ ) ⊂ A.
Merkregel:
Die mengentheoretische Struktur wird durch Funktionen zurückgeholt.
Das Urbild einer σ-Algebra ist stets eine σ-Algebra. Das Bild f (A) einer σ-Algebra ist im
allgemeinen keine σ-Algebra.
Bemerkung: Die Morphismen für topologische Räume sind die stetigen Funktionen. Eine
Funktion auf topologischen Räumen heißt stetig, falls das Urbild offener Mengen offen ist.
Proposition 5 Die Komposition meßbarer Funktionen ist meßbar.
Beweis: Mit entsprechender Notation (f ◦ g)−1 (A′′ ) = g −1 (f −1 (A′′ )) ⊂ A.
q.e.d.
Proposition 6 Eine Funktion ist genau dann meßbar, wenn das Urbild eines (und dann
jedes) Erzeugers in der σ-Algebra liegt.
Beweis: Nur die Rückrichtung ist zu zeigen. Sei f : Ω 7→ Ω′ die Funktion und E ′ ein Erzeuger
von A′ . Dann ist {A′ ∈ A′ | f −1 (A′ ) ∈ A} eine E ′ enthaltende σ-Algebra und damit gleich A′ .
q.e.d.
Folgerung: Jede stetige Funktion ist Borel meßbar. (Per Definition der Stetigkeit ist das
Urbild jeder offenen Menge offen ist). Jede stetige Funktion mit kompaktem Träger ist meßbar
bezüglich der Baire σ-Algebra. (Die kleinste Topologie, bzgl. der alle stetigen Funktionen mit
kompaktem Träger stetig sind, ist ein Erzeugendensystem der Baire σ-Algebra.)
Notation: F((Ω, A), (Ω′ , A′ )) bezeichne die Menge aller A − A′ meßbaren Funktionen
f : Ω 7→ Ω′ . Der Einfachheit halber benutzen wir auch F(Ω, A) oder aber F.
Notation: Anstelle der korrekten Schreibweise {ω ∈ Ω | f (ω) ∈ A′ } für das Urbild von A′
unter f benutzen wir {f ∈ A′ } oder auch f ∈ A′ . Allgemein wird die Realisierung ω weggelassen wenn immer möglich. Dies ist ein allgemein akzeptierter (kleiner) Notationsmißbrauch.
Spezialisierung auf IR: Die reellen Zahlen seien stets mit der Borel σ-Algebra B versehen. Sei f : Ω 7→ IR eine Funktion. In Formeln unterdrücken wir nach Möglichkeit das ω
aus Gründen der Übersichtlichkeit. Dies führt zuweilen zu einem Notationsmißbrauch. Wir
schreiben z.B.
{f ≥ x} für {ω ∈ Ω | f (ω) ≥ x}.
Eine Funktion f : Ω 7→ IR ist genau dann meßbar, wenn eine der äquivalenten Kriterien
erfüllt ist:
- ∀x ∈ IR : {f ≥ x} ∈ A,
- ∀x ∈ IR : {f > x} ∈ A,
- ∀x ∈ IR : {f ≤ x} ∈ A,
- ∀x ∈ Ql : {f < x} ∈ A.
Die Aussage gilt auch, falls obiges nur für x aus einer dichten Teilmenge von IR gefordert
wird.
5
WS10/11
Maßtheorie
Proposition 7 Seien fn : Ω 7→ IR, n ∈ IN, mes̈bare Funktionen. Dann sind meßbar, sofern
wohldefiniert und endlich, f1 +f2 , −f1 , f1 f2 , 1/f1 , supn fn , inf n fn , lim supn fn , lim inf n fn , limn fn .
S
Beweis: Die Kernpunkte für die Meßbarkeit sind {f + g < x} = q∈Ql{f < x + q, g < −q},
S
{−g < x} = {g > −x}. Bezüglich der Multiplikation argumentiere {f g < x} = q∈Ql{f <
x/q, g < q} ist meßbar für f, g überall strikt grös̈er als 0. Allgemeine f, g zerlege in Positivund Negativteil. {lim supn fn > x} = lim supn {fn > x}, lim sup fn = − lim inf −fn , lim fn =
S
11lim sup fn =lim inf fn lim sup fn , {supn fn > x} = n {fn > x}, inf fn = − sup(−fn ).
q.e.d
Warnung: In obiger Proposition ist die Abzählbarkeit der Operationen wichtig. Das Supremum überabzählbar vieler meßbarer Funktionen ist im allgemeinen nicht mehr meßbar.
Jedoch ist es schwer, eine nicht messbare Funktion anzugeben. Dies ist (im ZFC-Axiomensystem)
nur mit Hilfe des Auswahlaxiomes möglich.
Wir erweitern die reellen Zahlen um +∞, −∞ zu IR. Sei eine isotone (ordnungserhalx
tende) und bijektive Abbildung von IR auf (−1, 1) gegeben, etwa x 7→ 1+|x|
. Erweitere diese
Abbildung durch Zuordnung von +∞, −∞ nach +1, −1. Versehe IR mit der zurückgeholten
Topologie und entsprechenden Borel σ-Algebra. (Diese ist unabhängig von der gegebenen Bijektion.) Wir benutzen ebenso IN , Ql und ZZ. Die obigen Aussagen gelten sinngemäß auch für
erweiterte Funktionen f : Ω 7→ IR.
Der Raum der meßbaren, reellwertigen Funktion ist ein Vektorraum. Dies gilt nicht, falls
wir die Werte +∞, −∞ zulassen.
Die Baire σ-Algebra ist gleich der Borel σ-Algebra für die reellen Zahlen.
1.3
Mengenfunktionen
Wir betrachten Mengenfunktionen von einem Mengensystem in die reellen oder erweiterten
reellen Zahlen.
Eine Mengenfunktion µ : A 7→ IR oder erweiterte Mengenfunktion µ : A 7→ IR heißt
- positiv , falls µ(A) ≥ 0 für alle A ∈ A,
- isoton bzw. ordnungserhaltend , falls µ(A) ≤ µ(B) für A ⊂ B,
S
- additiv , falls µ(A ◦ B) = µ(A) + µ(B)
S
P
- σ-additiv , falls µ( ◦ n∈IN An ) = n∈IN µ(An ),
- σ-stetig von unten , falls limn µ(An ) = µ(limn An ) für aufsteigende An ,
- σ-stetig von oben, falls limn µ(An ) = µ(limn An ) für absteigende An ,
- σ-stetig in der leeren Menge, falls µ(An ) ց µ(∅) für An ց ∅,
P
S
- subadditiv , falls µ( i∈I Ai ) ≤ i∈I µ(Ai ) gilt für I endlich.
- σ-subadditiv , falls obiges gilt für abzählbare Indexmengen I abzählbar.
S
S
Hierbei sind A, B, A B, An , n An aus dem Mengensystem.
Bemerkung: σ steht stets für etwas Abzählbares.
1.3.1
Maße
Ein Maß ist eine positive, σ-additive, erweiterte Mengenfunktion nicht identisch unendlich
auf einer σ-Algebra. Die Eigenschaften in äquivalenten (Übung), formelmäßigen Aussagen,
sind
i) µ(∅) = 0
ii) ∀A ∈ A ⇒ µ(A) ≥ 0
6
WS10/11
S
U. Rösler
P
iii) An ∈ A, n ∈ IN, paarweise disjunkt ⇒ µ( ◦ n An ) = n µ(An ).
Ein Maßraum (Ω, A, µ) ist ein meßbarer Raum versehen mit einem Maß. Ein endliches
Maß ist ein Maß µ(Ω) < ∞. Ein Wahrscheinlichkeitsmaß ist ein Maß mit µ(Ω) = 1. Ein
Wahrscheinlichkeitsraum ist ein Maßraum mit einem Wahrscheinlichkeitsmaß. Jedes endliche Maß µ läßt sich zu einem W-maß transformieren via cµ mit c = 1/µ(Ω). Notation: P
(=Probability) für ein W-maß.
Proposition 8 (Mas̈eigenschaften) Jedes Maß ist additiv, isoton, endlich subadditiv und
σ-subadditiv.
Beweis: • Additiv
Erweitere die endliche Folge durch die leere Menge zu einer abzählbaren Folge und verwende die σ-Additivität.
• Isoton
Für mes̈bare Mengen A ⊂ B gilt µ(B) = µ(A) + µ(B\A) ≥ µ(A).
• Subadditiv und σ-Subadditiv
Wir verwenden die Disjunktifizierung. Für eine Folge An mes̈barer Mengen definiere rekurS
S
siv B1 = A1 und Bn = An \ ∪i<n Ai . Dann sind die Bn paarweise disjunkt, ◦ i≤n Bi = i≤n Ai
und es gilt
X
[
X
µ(An ).
µ(Bn ) ≤
µ(∪n An ) = µ( ◦ Bn ) =
n
n
n
q.e.d.
Ein Punktmaß auf ω ∈ Ω ist ein W-maß δω mit δω (A) = 11A (ω). Ein diskretes Maß ist
eine positiv gewichtete Summe von Punktmaßen. Jedes diskrete Maß hat eine Darstellung
P
+
µ = ω∈Ω f (ω)δω mit einer Funktion f : Ω → R . Die Abbildung zwischen diskreten Maßen
und erweiterten Funktionen f wie oben ist bijektiv (vorausgesetzt die σ−Algebra umfaßt alle
Punktmengen {ω}). Es gilt
X
f (ω).
µ(A) =
ω∈A
Ein diskreter Wahrscheinlichkeitsraum ist ein Maßraum mit diskretem W-maß.
Ein Laplaceraum ist ein diskreter Wahrscheinlichkeitsraum mit endlicher Grundmenge
und dem Maß
|A|
P (A) =
.
|Ω|
Das Zählmaß ist das Maß µ mit µ(A) = |A|.
Hier einige Beispiele und Standardkonstruktionen
Bernoulliverteilung Ber(p) zum Parameter 0 ≤ p ≤ 1. Ω = {0, 1}, A = Pot(Ω), µ({1}) =
p = 1 − µ({0}) =: 1 − q.
Geometrische Verteilung Geo(p) zum Parameter 0 ≤ p ≤ 1. Ω = IN0 , A = Pot(Ω), µ({k}) =
qpk.
Poissonverteilung Poi(λ) zum Parameter λ > 0. Ω = IN0 , A = Pot(Ω), µ({k}) =
k
e−λ λk! .
Binomialverteilung Bin(n,p) zu den Parametern n ∈ IN und p ∈ [0, 1]. Der W-raum ist
(Ω = {0, 1, . . . , n}, P(Ω), P ) mit
P (k) =
!
n k
p (1 − p)n−k
k
7
WS10/11
Maßtheorie
für k ∈ Ω.
Beispiel: Sei Ω überabzählbar. Das Mengensystem der Teilmengen A ⊂ Ω mit A abzählbar oder Ac abzählbar ist eine σ-Algebra. Die Mengenfunktion µ mit µ(A) = 0 falls A abzählbar und ∞ anderenfalls ist ein Maß.
Eingeschränktes Maß: Sei Q eine meßbare Menge. Die Einschränkung
(Q, A|Q ) := {Q ∩ A | A ∈ A}),
µ|Q := µ)
mit µ|Q : A|Q → IR die Einschränkung, ist ein Maßraum.
bedingte Wahrscheinlichkeit: Ist P ein W-mass und P (Q) > 0, so sprechen wir von
A ∋ A 7→ P (A | Q) :=
P (A ∩ Q)
P (Q)
als bedingte W-keit von P unter Q.
Erweitertes Maß: Durch Umkehrung obiger Konstruktion läßt sich ein Maß erweitern.
Übung.
Mit M = M (Ω, A) bezeichnen wir den Raum der Maße über dem meßbaren Raum (Ω, A).
Dies ist ein konvexer Kegel (= eine konvexe Menge, die positive Vielfache enthält). (Die
Addition ist gegeben durch (µ + ν)(·) = µ(·) + ν(·) und die Multiplikation durch (cµ)(·) =
c(µ(·)) für c ≥ 0). Die W-maße bilden eine konvexe Menge.
Die Menge V := {µ − ν | µ, ν endliche Maße } ist ein Vektorraum. Die Element heißen
Ladungsverteilung .
Bildmaß: Sei f : Ω 7→ Ω′ eine meßbare Funktion, (Ω, A, µ) ein Maßraum und (Ω′ , A′ ) ein
meßbarer Raum. Die Mengenfunktion µf , definiert durch
A′ ∋ A′ 7→ µ(f −1 (A′ ))
ist ein Maß auf A′ . Es heißt transportiertes Maß oder auch Bildmaß .
Eine maßerhaltende Abbildung ist eine messbare Funktion f : Ω 7→ Ω′ auf Maßräumen
(Ω, A, µ), (Ω′ , A′ , µ′ ) mit µf = µ′ .
Isomorphismen Die Isomorphismen auf Mas̈räumen sind mas̈erhaltende Isomorphismen
der mes̈baren Räumen. (Isomorphismen der meßbaren Räume sind meßbare bijektive Funktionen der Grundräume, deren Inverses meßbar ist.
1.3.2
Warum σ-Additivität?
Die σ−Additivität ist äquivalent zu einer σ-Stetigkeit. Grundlegend ist das
Theorem 9 Sei (Ω, A) ein meßbarer Raum und µ : A 7→ IR eine positive, additive, erweiterte
Mengenfunktion mit µ(∅) = 0. µ ist ein Maß genau dann, wenn es σ-stetig von unten ist. Ist
µ endlich, so sind äquivalent:
i) µ ist σ-stetig von unten.
ii) µ ist σ-stetig von oben.
iii) µ ist σ-stetig in der leeren Menge.
iv) µ ist σ-stetig.
8
WS10/11
U. Rösler
Beweis: ’⇒’ War schon beweisen.
’⇐’ Sei An ∈ A, n ∈ IN eine Folge paarweise disjunkter meßbarer Menge. Dann ist
Bn := ∪i≤n Ai aufsteigend gegen B = ∪n An . Es folgt
µ(B) = lim µ(Bn ) = lim
n
n
n
X
µ(An ) =
i=1
X
µ(An ).
n
i) ⇒ ii) Sei Bn ց B ∈ A. Betrachte Bnc ր B c und verwende
µ(Ω) − µ(Bn ) = µ(Bnc ) ր µ(B c ) = µ(Ω) − µ(B).
ii) ⇒ i) Für An ր A betrachte Acn ց Ac und argumentiere analog.
ii) ⇒ iii) Spezialisierung.
iii) ⇒ ii) Für An ց A betrachte An \A ց ∅.
i) ⇔ iv) Benutze ii) und Definition.
1.3.3
q.e.d.
Vollständige und σ-endliche Mas̈räume
Sei (Ω, A, µ) ein Maßraum. Eine µ-Nullmenge ist eine Menge aus dem Grundraum, für die es
eine meßbare Obermenge A mit µ(A) = 0 gibt. Eine Nullmenge braucht nicht mes̈bar zu sein.
Die Menge N aller Nullmengen (bzgl. µ) ist abgeschlossen bzgl. abzählbarer Vereinigung und
Teilmengen. Ein Maßraum heis̈t vollständig falls die σ-Algebra alle Nullmengen enthält. Die
kleinste σ-Algebra Av erzeugt von A und allen µ-Nullmengen heißt Vervollständigung von A
bzgl. µ.
Proposition 10
Av = {A ∪ N | A ∈ A, N ∈ N }
= {B ⊂ Ω | ∃A, C ∈ A : A ⊂ B ⊂ C, µ(C\A) = 0}
Beweis: Einfach. Die Mengensysteme sind σ-Algebren und enthalten A und N . Sie sind auch
nicht größer.
q.e.d.
Wir können stets das Maß µ auf die vervollständigte σ-Algebra Av als Maß fortsetzen
durch
µv (Av ) = µ(A)
mit Av = A ∪ N, Av ∈ Av , A ∈ A, N ∈ N . Übung.
Eine Aussage A über Realisierungen ω gilt fast sicher , (f.s.), falls sie bis auf eine Nullmenge
für alle Realisierungen gilt.
σ-Endlichkeit: Viele Aussagen über Mas̈e werden zuerst für endliche Mas̈e gezeigt und
dann für σ-endliche. Ein Mas̈ µ heißt σ-endlich, falls es eine gegen Ω aufsteigende Folge von
Mengen An ∈ A endlichen Mas̈es gibt. Äquivalent ist die Existenz einer Zerlegung (Bn )n von Ω
S
in abzählbar viele Mengen endlichen Maßes gibt. (∃Bn ∈ A, n ∈ IN ◦ n Bn = Ω, µ(Bn ) < ∞.)
(Die Äquivalenz ersieht man aus Bn = An \An−1 .) Der Schritt von endlichem Mas̈ auf σendliches Mas̈ beruht in der Regel auf der abzählbaren disjunkten Zerlegung Bn . Zeige die
Eigenschaft auf jedem Bn und setze dann zusammen. (Genauer, erst für das Mas̈ A ∋ A →
P
µ(A ∩ Bn ) und dann für A ∋ A 7→ µ(A) = n µ(A ∩ Bn ).)
Der Schritt von endlichem Mas̈ auf beliebiges, nicht σ-endliches Mas̈ beruht häufig auf
einer lokalen Form der Aussage. Argumentiere die Eigenschaft gilt lokal, d.h. in allen (geeigneten) Mengen von endlichem Mas̈, wobei hierauf angewandt das Mas̈ endlich ist. Der Satz
von Caratheodory ist von dieser Struktur.
9
WS10/11
10
Maßtheorie
Kapitel 2
Über die Existenz von Maßen
Dieser Abschnitt zeigt die Existenz von nicht diskreten Maßen via der Caratheodory Maßerweiterung. Anschließend betrachten wir Maße auf den reellen Zahlen, insbesonders das
Lebesguemaß, und zeigen einige Eigenschaften.
Heuristik: Es geht um die Existenz von allgemeinen Maßen. Dazu wird auf einem speziellen Mengensystem einfacher Struktur eine additive Mengenfunktion konstruiert und dann
zu einem Maß fortgesetzt. Der (vielleicht) mathematisch natürlichere Zugang ist eine Erweiterung über Kapazitäten, siehe Meyer [8]. Wir benutzen den elementareren Zugang über das
äußere Maß. Standardbeispiele sind das Lebesgue Maß und Maße auf Produkträumen.
Ein Ring ist ein Mengensystem mit der leeren Menge und abgeschlossen bzgl. endlichem
Durchschnitt und der symmetrischen Differenz. (Äquivalent ist, enthält die leere Menge und
ist abgeschlossen bzgl. endlicher Vereinigung und der Differenz.) Ein Inhalt auf einem Ring
ist eine positive, additive und erweiterte Mengenfunktion. Ein Prämaß auf einem Ring ist ein
von unten σ-stetiger Inhalt. Ein Prämaß auf einer σ-Algebra ist ein Maß.
Satz 11 (Caratheodory) Jedes Prämaß auf einem Ring läßt sich fortsetzen zu einem Maß
auf die vom Ring erzeugte σ-Algebra.
2.0.4
Beweis und Eindeutigkeit von Caratheodory
Ein äußeres Maß ist eine isotone, σ-subadditive, erweiterte Mengenfunktion auf der Potenzmenge, die die leere Menge auf die Null abbildet. In Formeln, µ∗ : P(Ω) 7→ IR mit
i) µ∗ (∅) = 0
ii) A ⊂ B ⇒ µ∗ (A) ≤ µ∗ (B)
Isotonie
P
S
Subadditivität.
iii) An ∈ P(Ω), n ∈ IN ⇒ µ∗ ( n An ) ≤ n µ∗ (An )
Hierbei wird die Konvention inf ∅ = ∞ benutzt. Eine µ∗ -meßbare Menge ist eine Menge
A ⊂ Ω, die
µ∗ (Q) ≥ µ∗ (Q ∩ A) + µ∗ (Q ∩ Ac )
(2.1)
für alle Q ⊂ Ω erfüllt. Wegen der σ-Subadditivität folgt dann Gleichheit. Sei A∗ die Menge
aller µ∗ -meßbaren Menge.
Lemma 12 Für jedes äußere Maß µ∗ ist (Ω, A∗ , µ∗ ) ein Maßraum.
Beweis: • A∗ ist eine Algebra.
11
WS10/11
Maßtheorie
Das Mengensystem A∗ enthält Ω und ist komplementabgeschlossen. Seien A, B ∈ A∗ .
Dazu etabliere
µ∗ (Q) = µ∗ (Q ∩ A) + µ∗ (Q ∩ Ac )
= µ∗ (Q ∩ A ∩ B) + µ∗ (Q ∩ A ∩ B c ) + µ∗ (Q ∩ Ac ∩ B) + µ∗ (Q ∩ Ac ∩ B c )
Q durch Q ∩ (A ∪ B) ersetzt in (2.1) ergibt
µ∗ (Q ∩ (A ∪ B)) = µ∗ (Q ∩ A ∩ B) + µ∗ (Q ∩ A ∩ B c ) + µ∗ (Q ∩ Ac ∩ B).
Die Subtraktion beider Zeilen ergibt die Behauptung.
• µ∗ ist ein Inhalt auf A∗ .
S
Setze Q = A ◦ B in (2.1).
• A∗ ∋ An ր A ⇒ µ∗ (Q ∩ An ) ր µ∗ (Q ∩ A)
Definiere Bn := An \An−1 . Bn , n ∈ IN, ist eine Folge paarweiser disjunkter Mengen aus
S
∗
A mit ◦ ni=1 Bi = An . Per Induktion nach n zeige
n
X
i=1
µ∗ (Q ∩ Bi ) = µ∗ (Q ∩ An ).
Dies ist leicht. Damit folgt die obere Behauptung via
lim µ∗ (Q ∩ An ) =
n
X
n
µ∗ (Q ∩ Bn ) ≥ µ∗ (Q ∩ (
[
n
Bn )) = µ∗ (Q ∩ A).
• A∗ ist σ-Algebra.
Mit An wie oben
µ∗ (Q) = µ∗ (Q ∩ An ) + µ∗ (Q ∩ Acn ) ≥ µ∗ (Q ∩ An ) + µ∗ (Q ∩ Ac )
liefert das gewünschte µ∗ (Q) ≥ µ∗ (Q ∩ A) + µ∗ (Q ∩ Ac ).
• µ∗ ist ein Maß auf A∗ .
µ∗ ist Inhalt auf A∗ und σ-Stetigkeit von unten.
q.e.d.
Proposition 13 Die σ-Algebra A∗ ist vollständig bzgl. dem äußeren Maß µ∗ .
Bew: Sei N eine µ∗ -Nullmenge, d.h. ∃A ∈ A∗ : N ⊂ A ∈ A∗ , µ∗ (A) = 0. Dann impliziert
µ∗ (Q ∩ N ) + µ∗ (Q ∩ N c ) ≤ µ∗ (A) + µ∗ (Q) die Aussage.
Über die Eindeutigkeit gibt der folgende Satz Auskunft.
Satz 14 Seien µ, ν zwei Maße, die auf einem Erzeuger der σ-Algebra A übereinstimmen. Der
Erzeuger sei abgeschlossen bzgl. endlichem Durchschnitt und es gebe eine gegen Ω aufsteigende
Folge En aus dem Erzeuger mit endlichem µ-Maß. Dann sind µ und ν identisch.
Beweis: Sei E aus dem Erzeuger mit µ(E) < ∞ und
DE := {A ∩ E | A ∈ A, µ(A ∩ E) = ν(A ∩ E)}.
• DE ist die Einschränkung A|E der σ-Algebra A auf E.
12
WS10/11
U. Rösler
Das Mengensystem DE ist ein Dynkinsystem (leicht) und enthält den ∩-stabilen Erzeuger
eingeschränkt auf E. Nach (Lemma 2) ist DE eine σ-Algebra und damit = A|E .
•µ=ν
Argumentiere µ(A) = limn µ(A ∩ En ) = limn ν(A ∩ En ) = ν(A).
q.e.d.
Bem: Ohne die σ-Endlichkeit auf dem Erzeuger ist die Eindeutigkeit nicht gegeben. Betrachte als Erzeuger die Menge aller halboffenen Intervalle (a, b] mit a < b. Als Mas̈e wähle
das Zählmaß und das triviale Maß, welches jeder Menge ungleich der leeren Menge den Wert
∞ zuordnet. Beide Maße sind gleich auf dem Erzeuger, aber verschieden auf der erzeugten
σ-Algebra, hier die Borel σ-Algebra. (Auch die Hausdorffmaße tun’s.)
Proposition 15 Sei M ein Mengensystem mit der leeren Menge und µ eine positive, erweiterte Mengenfunktion auf M mit µ(∅) = 0. Dann ist die Mengenfunktion µ∗ : P(Ω) 7→ IR
definiert durch
X
[
µ∗ (Q) := inf{
µ(Mn ) | Vn ∈ M, Q ⊂ Mn }
n
n∈IN
ein positives äußeres Maß.
Beweis: Nur die dritte Eigenschaft ist zu zeigen. Sei Q = ∪n Qn . Wähle zu vorgegebenen ǫn > 0
P
eine Überdeckung Mn,m ∈ M, m ∈ IN, von Qn mit µ∗ (Qn ) ≤ m µ(Mn,m ) ≤ µ∗ (Qn ) + ǫn .
S
S
Aus Q ⊂ n Qn ⊂ n,m Mn,m folgt
µ∗ (Q) ≤
X
n,m
µ(Mn,m ) ≤
X
(µ∗ (Qn ) + ǫn ).
n
P
Dies gilt für alle Folgen ǫn , d.h. µ∗ (Q) ≤ n µ∗ (Qn ).
q.e.d.
Beweis von Caratheodory: Sei µ das Prämaß auf dem Ring R und sei µ∗ das äußere
Maß dazu (Proposition 15).
• µ = µ∗ auf R.
Die Richtung µ∗ ≤ µ auf dem Ring folgt aus der Definition des äußeren Maßes. Für die
P
Umkehrung sei R ∈ R und Rn ∈ R eine Überdeckung von R mit µ∗ (R) ≤ n µ(Rn ) ≤
µ ∗ (R) + ǫ für gegebenes ǫ > 0.
µ(R) = lim µ(R ∩ ∪i≤n Rn ) ≤ lim µ(∪i≤n Rn ) ≤ lim
n→∞
n
n
X
i≤n
µ(Ri ) ≤
X
n
µ(Rn ) ≤ µ∗ (R) + ǫ
• R ⊂ A∗
P
Sei R ∈ R und Rn ∈ R, n ∈ IN eine Überdeckung von Q mit µ∗ (Q) ≤ n µ(Rn ) ≤
µ ∗ (Q) + ǫ.
µ∗ (Q) + ǫ ≥
X
n
µ(Rn ) =
X
n
(µ(Rn ∩ R) + µ(Rn ∩ Rc ) ≥ µ∗ (Q ∩ R) + µ∗ (Q ∩ Rc )
Dies gilt für alle ǫ > 0. Mit σ(R) ⊂ A∗ endet der Beweis.
q.e.d.
Bem: Die µ∗ -meßbaren Mengen A sind genau diejenigen, so dass für jedes R aus dem
Ring von endlichem Maß und jedes ǫ ein Ringelement S existiert mit µ∗ ((A ∩ R)△S) < ǫ gilt.
Noch anders ausgedrückt,
∪i ∩n Rn,i ⊂ A ∩ R ⊂ ∩i ∪n Sn,i
mit R· , s· Ringelemente und die rechte Menge minus der linken ist eine µ∗ -Nullmenge.
13
WS10/11
2.0.5
Maßtheorie
Wann ist ein Inhalt ein Prämaß
Wann ist ein Inhalt σ-stetig von unten?
Eine kompakte Klasse oder ein Mengensystem mit der endlichen Durchschnittseigenschaft ist ein Mengensystem, sodaß jede abzählbare Auswahl mit gemeinsamem leeren
Durchschnitt bereits eine endliche Teilauswahl mit leerem Durchschnitt enthält. In Formeln,
K ⊂ P(Ω) ist ein kompaktes Mengensystem genau dann, wenn
T
T
* ∀Kn ∈ K, n ∈ IN : ( n∈IN Kn = ∅) ⇒ ∃J ⊂ IN |J| < ∞ : j∈J Kj = ∅.
Durch Negation erhalten wie die äquivalente Bedingung
T
T
* ∀Kn ∈ K, n ∈ IN : (∀J ⊂ IN |J| < ∞ j∈J Kj 6= ∅) ⇒ n∈IN Kn 6= ∅.
Anstelle der endlichen Teilmengen J reicht es {1, . . . , n0 } mit n0 ∈ IN zu nehmen.
Ein Beispiel, vielleicht das einzig wichtige, ist die Menge der kompakten Mengen eines
topologischen Raumes. (Siehe auch 8.2.) (Diese erfüllen etwas mehr, da wir uns auf abzählbare
Folgen beschränken.)
Lemma 16 Sei R ein Ring, µ ein endlicher Inhalt darauf und K ein kompaktes System. Falls
es für alle R ∈ R und alle ǫ > 0 eine Menge K ∈ K und ein B ∈ R gibt mit
B⊂K⊂R
µ(R\B) < ǫ
gibt, so ist µ ein Prämaß auf dem Ring.
Beweis: Wir zeigen, vergleiche Satz (9), die σ-Stetigkeit in der leeren Menge, d.h. R ∋ Rn ց
∅ ⇒ µ(Rn ) ցn 0. Dies reicht.
P
Zu obigen Rn wähle Bn ∈ R, Kn ∈ K mit Bn ⊂ Kn ⊂ Rn und n µ(Rn \Bn ) hinreichend
T
T
T
T
klein. Wegen n Kn ⊂ n Rn = ∅ gibt es ein n0 mit n≤n0 Kn = ∅. Dies impliziert n≤n0 Bn =
∅. Es folgt
µ(Rn0 ) = µ(Rn0 \
= µ(
[
n≤n0
≤
X
n≤n0
\
Bn )
n≤n0
Rn0 \Bn ) ≤ µ(
µ(Rn \Bn ) ≤
X
n
\
n≤n0
Rn \Bn )
µ(Rn \Bn )
Die rechte Seite ist hinreichend klein.
q.e.d.
Die Standardanwendung dieses Lemmas betrifft einen topologischen Raum Ω und das
kompakte System der kompakten Mengen.
2.0.6
Konstruktion von Inhalten und Algebren
Ein Halbring ist ein Mengensystem mit der leeren Menge, abgeschlossen bzgl. endlichem
Durchschnitt und die Differenz zweier Halbringmengen ist darstellbar als endliche Vereinigung
von paarweise disjunkten Halbringmengen.
Proposition 17 Der von einem Halbring erzeugte Ring besteht genau aus den endlichen,
paarweise disjunkten Vereinigungen von Halbringmengen.
14
WS10/11
U. Rösler
In Formeln, für einen Halbring H gilt
[
R(H) = { ◦
n≤N
Hn | N ∈ IN, Hn ∈ H paarweise disjunkt }.
Beweis: Zeige die bestimmenden Eigenschaft für einen Ring, hier abgeschlossen bzgl. der
Differenz endlicher Vereinigung und enthält die leere Menge. Der Rest ist nachrechnen. q.e.d.
Standardbeispiel: Das Mengensystem aller halboffenen Rechtecke (a, b], 0 < a ≤ b < 1
in (0, 1] ist ein Halbring. (Übung). Dasselbe gilt für alle halboffenen Rechtecke (a1 , b1 ]×(a2 , b2 ]
im (0, 1]2 mit 0 < ai ≤ bi ≤ 1. Dies läßt sich auf höhere Dimensionen und ganz IRd ausdehnen.
Proposition 18 Eine positive, additive, erweiterte Mengenfunktion auf einem Halbring hat
eine eindeutige additive Fortsetzung auf den vom Halbring erzeugten Ring.
Beweis: Die einzig mögliche additive Fortsetzung der Mengenfunktion µ auf den Ring ist
[n
µ̃( ◦
i=1
Ai ) =
n
X
µ(Ai ).
i=1
µ̃ tut’s.
S
S
Die Abbildung ist wohldefiniert wegen ◦ i Ai = ◦ j Bj
X
i
µ(Ai ) =
X
i
[
µ( ◦ Ai ∩ Bj ) =
j
XX
i
j
µ(Ai ∩ Bj ) =
XX
j
und offensichtlich additiv.
2.0.7
i
µ(Ai ∩ Bj ) =
X
µ(Bj )
j
q.e.d.
Beispiele
Wir zeigen das Zusammenspiel der Resultate und Strukturen an zwei Beispielen.
Borelmaß: Das Maß auf dem Einheitsintervall versehen mit der Borel σ-Algebra, welches
jedem Intervall darin seine Länge zuordnet, heißt Borelwahrscheinlichkeitsmaß .
Satz 19 Das Borelwahrscheinlichkeitsmaß auf (0, 1] existiert. Es ordnet jeder einelementigen
Menge das Maß 0 zu.
Beweis: Betrachte das Mengensystem H aller halboffenen Intervalle (a, b] mit 0 ≤ a ≤ b ≤ 1.
Dies ein Halbring bzgl. Ω = (0, 1]. Definiere die Mengenfunktion µ auf H durch
µ(a, b] := b − a.
µ ist ein Inhalt auf der vom Halbring erzeugten Ring, Proposition 18.
• Der Inhalt µ ist ein Prämaß.
Wir verwenden das Lemma (16). Als kompakte Klasse nehmen wir alle kompakten Mengen
in (0, 1]. Die Einschachtelung für ein Intervall (a, b) mit a < b ist
(a + ǫ, b] ⊂ [a + ǫ, b] ⊂ (a, b]
mit µ((a, b]\(a + ǫ, b]) ≤ ǫ. Für die disjunkte Vereinigung endlich vieler läuft dies analog.
Die Fortsetzung µ des Prämaßes auf die von H erzeugte σ-Algebra ist eindeutig, Satz von
Caratheodory (11) und (14).
µ tut’s.
15
WS10/11
Maßtheorie
Ein Nachrechnen liefert µ ist ein Wahrscheinlichkeitsmaß und
µ({a}) = lim µ((a −
n→∞
1
1
, a]) = lim = 0
n n
n
und µ(I) ist die Länge des Intervall.
q.e.d.
Um das Borelmaß µ auf den gesamten reellen Zahlen zu definieren, betrachte die reellen
Zahlen als disjunkte Vereinigungen von den Intervallen In = (n, n + 1], n ∈ ZZ. Sei µn das
Borelmas̈ auf In versehen mit der Borel σ-Algebra Bn hierauf. Beachte, jede Borelmenge
B ∈ B schreibt sich als disjunkte Vereinigung von Mengen B ∩ In ∈ Bn . Dann tut es µ(B) :=
P
n∈ZZ µn (B ∩ In ).
Das Lebesguemaß ist die Erweiterung des obigen Borelmaßes auf die vervollständigte
Borel σ-Algebra. Die Standardnotation ist λ. Das Lebesguemaß auf einem Intervall I ist die
Einschränkung λI des Lebesguemaßes auf dieses Intervall.
Maße auf endlichen Produkträumen: Seien (Ωi , Ai , µi ), 1 ≤ i ≤ n, endliche Maßräume.
Der Produktraum ist
n
Y
i=1
Ωi := Ω1 × Ω2 × . . . × Ωn = {f : {1, . . . , n} 7→
n
[
i=1
Ωi | f (j) ∈ Ωj , j ∈ {1, . . . , n}}.
Eine Rechteckmenge ist eine Menge
A1 × A2 × . . . × An ,
Ai ∈ Ai .
Sei H die Menge aller Rechteckmengen. Die hiervon erzeugte σ-Algebra σ(H) heißt Produkt
σ-Algebra.
N
Notation i Ai := A1 ⊗ A2 ⊗ . . . ⊗ An .
N
Ein Maß µ : i Ai 7→ IR mit
µ(A1 × A2 × . . . × An ) = µ1 (A1 )µ2 (A2 ) . . . µn (An ),
Ai ∈ Ai , 1 ≤ i ≤ n, heißt Produktmaß .
Q
N
Notation i µi = µ1 ⊗ µ2 ⊗ . . . ⊗ µn = i µi .
Proposition 20 Das Produktmaß existiert und ist eindeutig.
Beweisskizze: Das Mengensystem der Rechteckmengen ist kein Halbring, aber der davon
erzeugte Ring besteht aus allen endlichen disjunkten Vereinigungen von Rechteckmengen.
Definiere auf den Rechteckmengen die Mengenfunktion µ : R → IR durch
µ(A1 × A2 × . . . × An ) := µ1 (A1 )µ2 (A2 ) . . . µn (An ).
µ ist additiv auf dem Halbring H. Erweitere µ additiv auf dem von den Rechteckmengen
erzeugten Ring, Proposition 18. Wenn wir zeigen könnten, daß diese Mengenfunktion ein
Prämaß ist, (genauen Beweis später, vgl. auch Fubini) dann impliziert der Satz von Caratheodory 11 eine Erweiterung zum Maß auf σ(R). Die Eindeutigkeit folgt aus Satz 14.
q.e.d.
Q
N
N
Das Tripel ( i Ωi , i Ai , i µi ) heißt Produktmaßraum oder Produktraum. Der Produktraum von W-räumen ist ein W-raum.
Später betrachten wir Produkträume über beliebige Indexmengen.
16
WS10/11
2.1
U. Rösler
Maße auf den reellen Zahlen
Wieviele Maße gibt es auf den reellen Zahlen versehen mit der Borel σ−Algebra B?
Sei f eine Funktion von den reellen Zahlen in die reellen Zahlen. Wir benutzen die Notation
f (x+) für den Grenzwert limyցx f (y). Eine Funktion f : IR → IR heißt rechtsstetig in x, falls
f (x+) = f (x) gilt. Sie heißt rechtsstetig, falls sie rechtsstetig in jedem Punkt x ist. Analog
definiert man f (x−) und linksstetig.
Ein Radonmaß auf den reellen Zahlen ist ein Maß auf der Borel σ-Algebra mit endlichem
Maß für jedes Kompaktum.
Satz 21 Es gibt eine bijektive Abbildung zwischen isotonen, rechtsstetigen Funktionen F :
IR 7→ IR mit F (0) = 0 und Radonmaßen µ auf den reellen Zahlen. Diese Bijektion kann durch
F (b) − F (a) = µ((a, b]),
(2.2)
a < b ∈ IR gegeben werden.
Beweis: Jedes Radonmaß definiert eindeutig durch die obige Bijektion 2.2 eine Funktion wie
oben beschrieben. Die Umkehrung folgt dem Beweis von Satz 19. Jede Funktion wie oben liefert eine additive und isotone erweiterte Mengenfunktion µ auf dem Halbring aller halboffenen
Intervalle {(a, b] | a ≤ b ∈ IR}. Die Mengenfunktion µ wird (eindeutig) zu einem Inhalt auf
dem erzeugten Ring erzeugten Ring fortgesetzt, Proposition 18. Dieser Inhalt ist ein Prämaß
nach Lemma 16. Wähle dazu als kompakte Klasse das Mengensystem C der kompakten MenS
gen. Für vorgegebenes A = ◦ ni=1 (ai , bi ] und µ(A) < ∞ wähle die Mengen Bi := (ai +ǫi , bi ] ∈ E
und Ci = [ai + ǫi , bi ]. Dann erfüllen B := ∪i Bi und C := ∪i Ci ∈ C die Bedingung B ⊂ C ⊂ A
und
X
(F (ai + ǫi ) − F (ai )
µ(A\B) =
i
wird beliebig klein für geeignet gewählte ǫi .
Der Satz von Caratheodory 11 liefert die Existenz und der Satz 14 die Eindeutigkeit. q.e.d.
Bem: Es mag einfacher erscheinen, erst auf Ω = (z, z + 1], z ∈ ZZ die Konstruktion zu
machen, da dann das Maß endlich ist. Anschließend wird via der Partition IR = ∪z∈ZZ (z, z +1]
P
q.e.d.
das Maß µ = z∈ZZ µz definiert. Dies tut’s.
Lebesguemaß: Die Lebesgue σ-Algebra ist die Vervollständigung der Borel σ-Algebra
unter dem Borelmaß, welches jedem Interval seine Länge zuordnet. Die zugehörige Funktion
F ist die Identität. Die Standardnotation ist λ. Der Sprachgebrauch zieht das Lebesguemaß
dem Borelmaß vor und unterscheidet i.a. nicht dazwischen.
Verteilungsfunktion: Eine Verteilungsfunktion ist eine rechtsstetige, aufsteigende Funktion F : IR 7→ IR mit F (−∞) := limx→−∞ F (x) = 0, F (∞) := limx→∞ F (x) = 1.
Korollar 22 Es gibt eine bijektive Abbildung zwischen Verteilungsfunktionen und W-Maßen
auf der Borel σ-Algebra über IR. Diese Bijektion kann durch
F (b) − F (a) = µ((a, b])
a < b ∈ IR gegeben werden.
17
WS10/11
Maßtheorie
Beweis: Einfach aus Satz 21.
d-dimensionaler Raum: Die Konstruktion des Lebesguemaßes auf IRd verläuft ganz
analog. Die halboffenen Intervalle (a1 , b1 ] × ... × (ad , bd ], 0 ≤ ai ≤ bi ≤ 1 im Einheitswürfel
einen bilden einen Halbring. Die Mengenfunktion
λ((a1 , b1 ] × ... × (ad , bd ]) :=
d
Y
i=1
(bi − ai )
ist ein Prämaß auf dem Hiervon erzeugten Ring. Der Satz von Caratheodory liefert eine
Fortsetzung als Maß auf dem Einheitsintervall. Anschließend erweitere dieses Maß translationsinvariant auf ganz IRd durch Partitionierung. Übung.
Notation: λd bezeichnet das Lebesguemaß auf IRd versehen mit der Lebesgue σ-Algebra,
der Vervollständigung der Borel σ-Algebra.
Bemerkung: Im IRd ist die Charakterisierung von Maßen über (Verteilungs-)Funktionen
schwieriger. Wie würde die Charakterisierung lauten? (Siehe Gänzler-Stute [5])
2.1.1
Hausdorff Maße und Cantor Menge
Haufsdorffmaß: Es gibt andere Maße auf den reellen Zahlen von Interesse, die eventuell
einer kompakten Menge keinen endlichen Wert zuordnen. Wir geben als Beispiel Hausdorff
Maße an. Sei 0 < α. Definiere
µα (Q) = lim inf{
ǫց0
X
n∈IN
diamα (Bn ) | diam(Bn ) < ǫ, Q ⊂ ∪n Bn }.
B. bezeichnet offene Kugeln und diam steht für den Durchmesser der Kugel. (Der Limes
existiert, da die Folge monoton steigend ist in ǫ. Siehe Falconer [4].) µα ist ein äußeres Maß.
Das Maß µα auf der σ-Algebra A∗α der µα -meßbaren Mengen heißt Hausdorffmaß zum Index α. Das Hausdorffmaß ist ein translationsinvariantes Maß auf A∗α . A∗α enthält die Borel
σ−Algebra. Alle offenen, nicht leeren Mengen U in IRd haben den Wert µα (U ) = ∞ für
0 < α < d. Das Lebesguemaß λd ist ein Vielfaches des Hausdorffmaßes µd auf IRd .
Die Hausdorff Dimension einer Menge ist das Infimum der α mit endlichem Hausdorffmaß
µα (Q) < ∞ [4]. Offene, beschränkte, reelle Mengen in IRd haben die Hausdorff Dimension d.
Das Hausdorffmaß einer Menge C ist das Maß µα (C ∩ ·) : A∗α → IR mit α die Hausdorff
Dimension der Menge C.
Cantormenge: Als Beispiel wollen wir die Cantormenge und das Cantormaß , das Hausdorffmaß zu der Cantormenge, betrachten.
0r
♣
♣
♣ ♣ ♣ ♣
♣♣♣♣ ♣♣♣♣
r1/3
♣
♣
♣ ♣ ♣ ♣
♣♣♣♣ ♣♣♣♣
r2/3
♣
♣
♣ ♣ ♣ ♣
♣♣♣♣ ♣♣♣♣
Cantorset Cantorset Can
r1
♣
♣
♣ ♣ ♣ ♣
♣♣♣♣ ♣♣♣♣
Cantorset Cantorset Can
Die formale Definition der Cantormenge C lautet:
Cn := {x =
∞
X
xi
i=1
3i
| xi ∈ {0, 1, 2}, xj 6= 1 für j ≤ n, i ∈ IN }
18
WS10/11
C :=
\
n
Cn = {x =
∞
X
xi
i=1
3i
U. Rösler
| xi ∈ {0, 2}}.
Die Cantormenge hat interessante Eigenschaften:
• Die Cantor Menge ist überabzählbar, abgeschlossen, kompakt, nirgends dicht (=das
Innere vom Abschluß ist leer) und perfekt (=jeder Punkt ist Häufungspunkt). (Übung)
• Die Cantor Menge ist Borel meßbar und das Lebesgue Maß der Cantor Menge ist 0.
Übung
2
• Die Hausdorff Dimension ist α = ln
ln 3 < 1. (Keine Übung)
• Die Abbildung ϕ : C 7→ [0, 1]
x=
∞
X
xi
i=1
3i
7→ ϕ(x) =
∞
1X
xi
2 i=1 2i
(2.3)
ist isoton, stetig, und surjectiv. Seien B3 und B2 diejenigen reellen Zahlen, deren Trialdarstellung bzw. Dualdarstellung nicht eindeutig ist. Dann ist ϕ : C\B3 → [0, 1]\B2 bijektiv. (ϕ
bildet z.B. die Punkte 1/3 und 2/3 beide auf 1/2 ab.) B3 und B2 sind abzählbar.
• Das Cantor Maß ist ein Wahrscheinlichkeitmaß mit der stetigen, fast überall (bis auf C)
unendlich oft differenzierbaren Verteilungsfunktion
F (x) = inf{1, ϕ(y) | C ∋ y ≥ x}
mit Ableitung 0 f.s. (Die Ableitung auf C ist ∞.) Ein Bild ist sehr hilfreich. (Übung) Das
Bildmaß des Cantor Maßes unter ϕ bzw. F ist das Lebesgue Maß.
• Die Cantormenge ist die größte kompakte invariante Menge bzgl. der Funktion f : IR 7→
IR, f (x) = 11x≤1/2 3x+11x>1/2 (3−3x). (Eine Menge A heißt invariant unter f, falls f −1 (A) = A
gilt.) (Übung: Benutze die Trialdarstellung einer reellen Zahl.) Die Iteration f n (x), n ∈ IN
eines Punktes x unter f bleibt beschränkt genau dann, wenn x aus C ist.
2.1.2
Translationsinvariante Maße
Ein Maß auf (IR, +) heißt translationsinvariant, falls es invariant ist bezüglich aller Translationen. (D.h. µ(A + x) = µ(A) für alle x ∈ IR, A ∈ A).
Beispiele translationsinvarianter Mäse sind
(i) das triviale Maß auf der Potenzmenge, welches jeder nichtleeren Menge ∞ zuordnet,
(ii) das Maß auf der Potenzmenge, welches genau den abzählbaren Mengen den Wert 0
zuordnet, ansonsten aber ∞ ist
(iii) das Zählmaß auf der Potenzmenge,
(iv) das Hausdorffmaß auf der Hausdorff σ-Algebra zu vorgegebenem α ∈ (0, 1)
(v) das Lebesguemaß auf der Borel- bzw. Lebesgue σ-Algebra.
Proposition 23 Das Lebesgue Maß ist bis auf Vielfache das einzige translationsinvariante
Radonmaß auf den reellen Zahlen versehen mit der Borel σ-Algebra.
19
WS10/11
Maßtheorie
Beweis: • Das Lebesguemaß ist translationsinvariant.
Betrache D := {A ∈ B | ∀x ∈ IR : λ(A) = λ(A + x)}. Dies ist ein Dynkin System
und enthält den durchschnittabgeschlossenen Erzeuger der halboffenen Intervalle (a, b]. Nach
Lemma 3 gilt D = B.
Eindeutigkeit: Durch den Wert µ((0, 1]) wird, verwende Additivität und Translationsinvarianz das Maßes µ, das Maß für alle halboffenen Intervalle (p, q], p, q ∈ Ql festgelegt. Diese
bilden ein Erzeugersystem der Borel σ-Algebra.
q.e.d.
2.1.3
Nichtmeßbare Mengen
Lemma 24 Es gibt nicht lebesguemeßbare Mengen auf dem Einheitsintervall.
Beweis: Definiere auf den reellen Zahlen die Äquivalenzrelation
x ∼ y ⇔ x − y ∈ Ql.
Aus jeder Äquivalenzklasse [x] := {y ∈ IR | x ∼ y} wähle einen Repräsentanten aus [0, 1].
Dies ist möglich nach dem Auswahlaxiom. A tut’s.
Angenommen A ist lebesguemeßbar. Die Mengen A + q, q ∈ Ql, sind paarweise disjunkt.
S
Das Lebesguemaß von B := ◦ q∈Ql ∩[−1,1] (A + q) berechnet sich via der Translationsinvarianz
zu
X
X
λ(B) =
λ(A + q) =
λ(A + q) = ∞λ(A)
q∈Q
l ∩[−1,1]
q∈Q
l ∩[−1,1]
mit den möglichen Werten 0 oder ∞. Andererseits gilt [0, 1] ⊂ B ⊂ [−1, 2] und damit 1 ≤
λ(B) = ∞λ(A) ≤ 3. Dies ist ein Widerspruch.
q.e.d.
Proposition 25 Es gibt lebesguemeßbare Mengen, die nicht borelmeßbar sind.
Bew: Betrachte dazu die Cantorabbildung ϕ : C\B3 → [0, 1]\B2 aus (2.3). ϕ ist bijektiv und
wegen der Monotonie sind ϕ und ϕ−1 borelmeßbar.
Sei A eine nicht lebesguemeßbare Menge. Dann ist ϕ−1 (A) ⊂ C als Nullmenge lebesguemeßbar, aber nicht borelmeßbar.
q.e.d.
Bemerkung: Auch nicht meßbare Mengen sind manchmal nützlich. Sei (Ω, A, µ) ein
beliebiger Maßraum und C eine eventuell nicht meßbare Menge. Dann ist die Einschränkung
(Ω|C = C, A|C = {A∩C | A ∈ A}, µ∗|C ) mit µ∗|C (A) := µ∗ (A∩C) = inf{µ(B) | B ∈ A, A∩C ⊂
B} ein Maßraum. Ist µ ein W-maß und hat C das äußere Maß 1, so ist µ∗C ein W-maß.
2.2
2.2.1
Diverses
Regularität∗
Sei (Ω, A, µ) ein Maßraum. Ein Maß µ heißt von außen regulär oder von oben regulär
bzgl. einem Mengensystem C, falls für alle meßbaren Mengen A gilt
µ(A) = inf{µ(C) | A ⊂ C ∈ C}.
Analog definiert man von innen regulär oder unten durch
µ(A) = sup{µ(C) | C ∋ C ⊂ A}.
20
WS10/11
U. Rösler
µ heißt regulär bzgl. C, falls es von außen und innen regulär ist.
Ein Maß µ heißt von außen σ−regulär oder von oben bzgl. einem Mengensystem C,
falls für alle meßbaren Mengen A gilt
µ(A) = inf{
X
n
µ(Cn ) | A ⊂ ∪n Cn , Cn ∈ C}.
Regularität ist eine Art σ-Stetigkeit des Maßes bzgl. gewisser Mengensysteme.
Lemma 26 Jedes Radonmaß auf den reellen Zahlen ist regulär von innen bzgl. kompakten
Mengen, regulär von außen bzgl. offenen Mengen und σ−regulär von außen bzgl. kompakten
Mengen.
Beweis: Sei zuerst µ ein endliches Maß. Betrachte die Menge D aller meßbaren Mengen,
die sich dem Maße nach beliebig gut von außen durch offene Mengen und von innen durch
abgeschlossene Mengen approximieren lassen.
• D enthält alle abgeschlossenen beschränkte Intervalle.
Das Intervall [a, b] ist abgeschlossen und enthalten in der offenen Menge (a − ǫ, b + ǫ). Die
σ-Stetigkeit des Maßes liefert µ((a − ǫ, b + ǫ)) →ǫ→ µ([a, b]).
• D ist ein Dynkinsystem mit IR.
D enthält die reellen Zahlen und ist abgeschlossen bzgl. der Differenz aufsteigender Mengen
ist einfaach zu zeigen. Für die Abgeschossenheit bzgl. abzählbarer disjunkter Vereinigung seien
Dn ∈ D paarweise disjunkt. Wähle zu vorgegebenem ǫ abgeschlossene Mengen An und offene
P
Mengen Un mit An ⊂ Dn ⊂ Un und µ(Un \An ) ≤ ǫn und n ǫn < ǫ. Sei N ∈ IN. Dann sind
A = ∪n≤N An abgeschlossen, U = ∪n Un offen und erfüllen A ⊂ ∪n Dn ⊂ U und
µ(U \A) ≤ µ(
[
n
Un \
[
m
Am ) + µ(
[
m
Am \A) ≤
X
n
µ(Un \An ) +
X
µ(Dm ) < 2ǫ.
m>N
P
Die zweite Summe ist klein für große N wegen der Endlichkeit des Maßes ( n µ(Dn ) <
∞)).
• D ist die Borel σ-Algebra.
Die Menge der abgeschlossenen Intervalle erzeugen die Borel σ-Algebra, sind durchschnittstabil und in D. Damit ist das Dynkinsystem eine σ-Algebra.
• µ ist regulär von oben durch offenen und von unten durch abgeschlossene.
Folgt aus obigem.
• µ ist regulär von unten durch kompakte.
Die abgeschlossenen beschränkten Mengen sind nach dem Satz von Heine-Borel genau
die kompakten Mengen. Zu jeder abgeschlossenen Menge A gibt es eine enthaltene kompakte
Menge K mit µ(A\K) beliebig klein wählbar. (A ∩ [−n, n] ist kompakt und aufsteigend gegen
A.)
• Jedes µ ist σ−regulär von oben durch kompakte.
Jede offene Menge U läßt sich schreiben als höchstens abzählbare disjunkte Vereinigung
von offenen Intervallen. Jedes offene Intervall I läßt sich beliebig gut durch höchstens abzählbar viele Kompakta [a, b] ⊂ I überdecken mit µ(a) = 0 = µ(b). Fertig. (Formal: Zu vorgebenem B ∈ B wähle eine offene Obermenge U mit µ(U \B) < ǫ. U ist darstellbar als disjunkte
S
Vereinigung ◦ In von abzählbar vielen offenen Intervallen In . Überdecke jedes Intervall In wie
oben beschrieben durch abzählbar viele kompakte Intervalle Kn,m = [an,m , an,m+1 ], m ∈ ZZ
mit µ(an,m ) = 0, deren Innere alle disjunkt sind. Dies ist möglich, da {x | µ({x}) > 0}
P
höchstens abzählbar ist (Übung). Es gilt 0 ≤ m µ(Kn,m ) − µ(In ) = 0.
21
WS10/11
Maßtheorie
Damit folgt B ⊂ U ⊂ ∪n,m Kn,m und
P
n µ(In ) = µ(U ) ≤ µ(B) + ǫ.)
n,m µ(Kn,m ) =
• Der Satz gilt auch für nichtendliche Maße.
Finde eine Folge xn ∈ IR mit xn →n→∞ = ∞ und xn →n→−∞ −∞ und µ({xn }) = 0. dies
ist möglich. Dann zerlege IR in die disjunkten Intervalle (xn , xn+1 ], n ∈ ZZ und das Maß in
die Summe abzählbar vieler eingeschränkte Maße µn = µ(· ∩ (xn , xn+1 ). Der Rest ist Übung.
q.e.d.
P
Das folgende Lemma besagt in Worten, jede Borelmenge ist irgendwo dick.
Lemma 27 Sei λ das Lebesguemaß auf IR und B eine Borelmenge von strikt positivem Lebesguemaß. Dann existiert für alle ǫ > 0 ein offenes, nichtleeres Intervall I mit
λ(I ∩ B)
≥ 1 − ǫ.
λ(I)
Beweis: OEdA sei B beschränkt. Wähle eine offene Obermenge U von B mit λ(U \B) < δ.
S
Die offene Menge hat eine Darstelllung U = ◦ n∈IN In mit In offene Intervalle. Schätze ab
λ(B) =
X λ(In ∩ B)
n
λ(In )
λ(In ) ≤ sup
m
λ(Im ∩ B) X
λ(Im ∩ B)
(λ(B) + δ).
λ(In ) ≤ sup
λ(Im )
λ(Im )
m
n
Für δ hinreichend klein muß das Supremum dicht bei 1 liegen.
q.e.d.
Proposition 28 Sei B eine Borelmenge von strikt positivem Lebesguemaß. Dann ist 0 ein
innerer Punkt von B − B = {x − y | x, y ∈ B}.
Beweis. Sei I ein Intervall mit λ(I ∩ B) > 34 λ(I) > 0. Sei A := I ∩ B. Hieraus folgt
λ(A ∩ (A + ǫ)) = λ(A) + λ(A + ǫ) − λ(A ∪ (A + ǫ))
≥ 2λ(A) − λ(I ∪ (I + ǫ)) ≥ 2λ(A) − λ(I) − ǫ ≥
λ(I)
−ǫ
2
Für hinreichend kleine ǫ hat A ∩ (A + ǫ) strikt positives Maß und ist daher nicht leer. Daher
enthält B − B ⊃ A − A die Werte ǫ und auch −ǫ. Dies reicht.
q.e.d.
2.2.2
Isomorphien und standard Lebesgueräume*
Weshalb spielen Maße auf den reellen Zahlen versehen mit der Borel-σ-Algebra solch eine prominente Rolle? Antwort: Abzählbar erzeugte σ-Algebren sind isomorph zur Borel σ-Algebra
auf den rellen Zahlen eingeschränkt auf eine Teilmenge.
Zwei meßbare Räume heißen isomorph, falls es eine bimeßbare Bijektion der Grundräume
gibt. (Eine Funktion heißt bimeßbar, falls sie bijektiv ist und sie und ihre Inverse meßbar
sind.) Beachte, die σ-Algebren sind isomorph als geordnete Räume bzgl. der Mengeninklusion.
(Der Isomorphiebegriff von σ-Algebren bezieht sich nur auf eine bijektive, strukturerhaltende
Abbildung zwischen den σ-Algebren. Für meßbare Räume nimmt man den Grundraum mit
hinzu.)
Ein Borelraum ist eine Borelmenge versehen mit der induzierten Borel-σ-Algebra eines
topologischen Raumes. Ein meßbarer Raum heißt separabel oder abzählbar erzeugt, falls es
einen abzählbaren Erzeuger gibt. Ein meßbarer Raum heißt punktetrennend oder hausdorffsch
falls es zu jedem ω 6= ω ′ eine meßbare Menge A gibt, die ω, aber nicht ω ′ enthält.
22
WS10/11
U. Rösler
Durch Äquivalenzbildung läßt sich jeder meßbare Raum hausdorffsch machen. Die Relation ω ∼ ω‘ ⇔ ∃A ∈ A : ω ∈ A, ω ′ 6∈ A ist eine Äquivalenzrelation auf Ω. Der Raum Ω/∼
der Äquivalenzklassen versehen mit der σ-Algebra
A/∼ := {{[ω] | ω ∈ A} | A ∈ A})
ist ein Hausdorffscher meßbarer Raum.
Satz 29 Sei (Ω, A) ein separabler, hausdorffscher, meßbarer Raum. Dann ist (Ω, A) isomorph
zu einer (nicht notwendig meßbaren) Menge in IR versehen mit der eingeschränkten Borel σAlgebra. Diese Bijektion kann gegeben werden durch
f :=
X
3−n 211En .
n∈IN
Hierbei ist {En ∈ A | n ∈ IN } ein abzählbarer Erzeuger für A. Die Abbildung f : E → f (E)
ist bimeßbar.
Beweis: f ist wohldefiniert und bijektiv. Für die Bimeßbarkeit argumentiere über Erzeuger
und der Trialdarstellung f (En ) = {x ∈ f (Ω) | xn = 2}.
q.e.d.
Alle separablen metrischen Räume sind isomorph bzgl. der meßbaren Struktur zu einer
Teilmenge der reellen Zahlen versehen mit der Borel σ-Algebra. Wählen wir als abzählbaren
Erzeuger der σ-Algebra einen abzählbaren Erzeuger der Topologie, z.B. die offenen Bälle mit
rationalem Radius, so erhält obige Konstruktion zwar die Topologie, nicht aber die Metrik.
Zwei Maßräume heißen isomorph, falls es eine maßerhaltende Isomorphie der meßbaren
Räume gibt.
Maße werden durch einen Isomorphismus der meßbaren Struktur eindeutig transportiert.
Für alle abzählbar erzeugten σ-Algebren reicht es daher Maße auf reellen Zahlen genauer zu
studieren.
Wir sprechen von einem Standardlebesgueraum, falls die meßbaren Räume vollständig sind
und, nach eventueller Entfernung einer Nullmenge, maßtheoretisch isomorph zur Lebesgueσ-Algebra auf IR versehen mit dem Lebesguemaß und eingeschränkt auf eine Menge ist.
Bemerkung: Die Konstruktion von Satz 29 geht auch mit der Binär- anstelle der Trialdarstellung. Es treten dabei abzählbar viele Punkte auf, deren Dualdarstellung nicht eindeutig
ist. Dies ist eine Lebesguenullmenge. Der Vorteil der Konstruktion per Binärdarstellung ist
eine zusammenhängendere Menge als in der Trialdarstellung.)
23
WS10/11
24
Maßtheorie
Kapitel 3
Integrale
Ziel dieser Sektion ist der Integralbegriff als lineare und σ-stetige Fortsetzung I des Maßes µ
auf Funktionen.
Ein Maß µ fassen wir als eine Abbildung auf Indikatorfunktionen 11A auf, I(11A ) = µ(A).
Diese Abbildung setzen wir linear fort zu einer Abbildung I auf der Menge T + der positiven
P
Treppenfunktionen f = ni=1 ai 11Ai via
I(f ) :=
X
ai µ(Ai ).
i
Damit ist die algebraische Erweiterung beendet.
Wir erweitern die Abbildung I zu I˜ durch einen geeigneten Konvergenzbegriff via
˜ ) = lim I(fn )
I(f
n
mit Treppenfunktionen fn konvergiert gegen f. Als Konvergenzbegriff benutzen wir Ordnungskonvergenz, fn konvergiert aufsteigend punktweise gegen f .
Mengentheoretischer Zugang: Eine Alternative ist der mengentheoretische Zugang.
Wir identifizieren eine positive Funktion f : Ω 7→ IR+ mit der Menge {(ω, x) | 0 ≤ x ≤ f (ω)}
auf dem Produktraum Ω × IR und definieren das Integral als das Mas̈ dieser Menge bezüglich
dem Produktmas̈. (IR ist versehen mit der Borel σ-Algebra und dem Lebesguemaäß.)
Vektorraumstruktur Ein anderer gern gewählter Zugang ist es, die Menge T der Treppenfunktionen als Vektorraum zu betrachten, mit einer Norm zu versehen, bezüglich dieser
Norm T abzuschließen und dann das Funktional I auf den Abschluß von T stetig zu erweitern.
Wir kommen hierauf bei banachraumwertigen Funktionen zurück.
3.0.3
Algebraische Erweiterung
Eine Treppenfunktion ist eine Funktion der Form
f=
n
X
ai 11Ai
(3.1)
i=1
mit reellen Zahlen a1 , . . . , an und meßbaren Mengen A1 , . . . , An . Die Standarddarstellung
einer Treppenfunktion ist eine Darstellung wie oben mit der zusätzlichen Forderung alle
a1 , . . . , an sind verschieden und die die Mengen A1 , . . . , An bilden eine meßbare Zerlegung
25
WS10/11
Maßtheorie
(=Partition) des Stichprobenraumes Ω. (Zerlegung=Menge von Teilmengen, die paarweise
disjunkt sind und deren Vereinigung der ganze Raum ist. Wir sprechen von meßbarer Zerlegung, falls die Mengen stets meßbar sind.)
Proposition 30 Die Treppenfunktionen sind genau die meßbaren Funktionen mit endlichem
Bildraum. Jede mb. Treppenfunktion hat eine eindeutige Standarddarstellung gegeben durch
f=
n
X
ai 11f −1 (ai )
(3.2)
i=1
mit a1 , . . . , an die verschiedenen Werte von f .
Beweis: Eine Treppe a1 11A1 ist meßbar und die endliche Summe meßbarer Funktionen ist
meßbar. Damit nimmt jede Treppenfunktion nur endlich viele Werte an und ist meßbar.
Die Darstellung (3.2) ist eindeutig für eine meßbare Funktion mit endlichem Bildraum.
Dies ist die Standarddarstellung einer Treppenfunktion.
q.e.d.
Die Menge T = T (Ω, IR) der Treppenfunktionen ist ein Vektorraum. Wir betrachten den
positiven Kegel T + der positiven Treppenfunktionen. (OEdA sind die Koeffizienten positiv.)
Definiere auf T + die Abbildung I
I(f ) :=
n
X
ai µ(f −1 (ai ))
i=1
mit Hilfe der Standarddarstellung von f.
Proposition 31 Die Funktion I : T + → IR ist eine additive, skalare, isotone und erweiterte
Funktion.
Beweis: I ist wohldefiniert, da die Standarddarstellung eindeutig ist. Mit entsprechender Notation zeigen wir die Additivität.
I(f + g) =
X
ci µ((f + g)−1 (ci )) =
XX
j
=
k
XX
j
(aj + bk )µ(f
k
−1
X
ci
i
i
=
X
(aj ) ∩ g
{j,k|aj +bk =ci }
−1
(bk ))
aj µ(f −1 (aj ) ∩ g −1 (bk )) +
= I(f ) + I(g)
µ(f −1 (aj ) ∩ g −1 (bk ))
XX
j
k
bk µ(f −1 (aj ) ∩ g −1 (bk ))
Die Skalarität und die Isotonie (die Differenz von Treppenfunktion ist eine Treppenfunktion)
sind einfach.
q.e.d.
Bemerkung: Für einen additiven Operator auf einem Vektorraum ist Isotonie und Positivität dasselbe.
P
Folgerung: Für jede Darstellung m
i=1 bi 11Bi einer Treppenfunktion f gilt (nachrechnen)
I(f ) :=
m
X
i=1
26
bi µ(Bi )
(3.3)
WS10/11
U. Rösler
Hintergrund Ordnungsstruktur
Sei A eine Menge. Eine Relation ist eine Teilmenge R von A × A. Die Komposition oder
Verknüpfung zweier Relationen R, Q ist gegeben durch
R ◦ Q =: {(a, c) | ∃b ∈ A : (a, b) ∈ R, (b, c) ∈ Q}.
Das Inverse einer Relation ist R−1 := {(b, a) | (a, b) ∈ R}. Eine Relation heißt reflexiv, falls
die Relation die Diagonale {(a, a) | a ∈ A} enthält. Eine Relation heißt symmetrisch, falls die
Relation gleich ihrer Inversen ist. Eine Relation heißt antisymmetrisch, falls der Durchschnitt
der Relation mit der Inversen genau die Diagonale ist. Eine Relation heißt transitiv, falls die
Relation unter Komposition abgeschlossen ist (R ◦ R ⊂ R).
Eine Teilordnung oder partielle Ordnung oder Ordnung auf einer Menge A ist eine reflexive, antisymmetrische und transitive Relation. Wir schreiben a b für (a, b) ∈ R und
sprechen von b dominiert oder majorisiert a oder auch b ist größer als a. Analog benutzen
wir Minorante und kleiner. Ein Tupel (A, ) heißt geordnete Menge .
Sei (A, ) eine partielle Ordnung. Ein Element a ∈ A heißt obere Schranke von B ⊂ A
falls b ≤ a für alle b ∈ B gilt. Eine Menge B ⊂ A heißt nach oben (unten) beschränkt, falls es
eine obere (untere) Schranke von A gibt. Wir sprechen von einer kleinsten oberen Schranke a
von B falls a eine obere Schranke ist und für alle anderen oberen Schranken x gilt a ≤ x.
W
Notation: a = supb∈B b = b∈B b.
Eine kleinste obere Schranke a heißt Maximum von B, falls zusätzlich a ∈ B gilt.
Notation: x = maxb∈B b.
V
Analog verwenden wir das Infimum inf b∈B = b∈B b und Minimum.
Notation: a ∨ b := sup{a, b}
a ∧ b := inf{a, b}.
Ein Verband ist eine geordnete Menge abgeschlossen bzgl. endlichem Supremum und endlichem Infimum. Wir schreiben (A, ≺, ∧, ∨) in der Notation wie oben. Ein Verband heißt von
oben (unten) vollständig falls jede nach oben (unten) beschränkte Teilmenge ein Supremum
(Infimum) besitzt. Er heißt vollständig, falls er von unten und oben vollständig ist. Analog verwenden wir σ-vollständig falls jede beschränkte abzählbare Menge ein Supremum und
Infimum besitzt.
Eine isotone Funktion ist eine ordnungserhaltende Funktion. Eine isotone Funktion f heißt
von unten σ-stetig, falls für jede aufsteigende abzählbare Folge an ∈ M mit supn an ∈ M gilt
∨n f (an ) = f (∨n an ). Analog verwenden wir von oben σ-stetig und σ-stetig für beides.
Bemerkung: Jeder Verband läßt sich σ-vervollständigen, (von unten, von oben, vervollständigen). Darunter verstehen wir eine kleinste, ordnungserhaltende und injektive Einbettung des Verbandes in einen σ-vollständigen (von unten, von oben, vollständigen) Verband. Bis auf Isomorphie (ordnungserhaltende Bijektion) ist diese eindeutig. (Keine Übung:
Dies ist eine mathematische Standardkonstruktion. Z.B. lassen sich so die reellen Zahlen aus
den rationalen Zahlen konstruieren.) Weiterhin: jede isotone, von unten σ-stetige Abbildung
I : V 7→ IR∪{∞} läßt sich eindeutig von unten σ-stetig fortsetzen auf die σ-Vervollständigung
des Verbandes durch
˜ = lim I(vn ).
I(v)
n
Hierbei ist vn ∈ M, n ∈ IN, eine Folge mit vn րn v. Dies bildet den abstrakten Hintergrund
unserer folgenden Argumentation.
Bemerkung: Eine σ-Algebra ist ein Verband mit der Ordnung induziert durch die Enthaltensrelations, A ≺ B ⇔ A ⊂ B, A∨B = A∪B, A∧B = A∩B. Dieser Verband ist vollständig.
27
WS10/11
Maßtheorie
Ein Maß ist von unten σ-stetig, eine endliches Maß sogar σ-stetig. Der Satz von Caratheodory
ist die σ-stetige Erweiterung einer σ-stetigen, additiven und isotonen Abbildung auf einem
Verband. Der Ring (=Verband) wird erweitert zur σ-Algebra (Verbandsvervollständigung)
und das Prämaß zum Maß.
Das Integral
Der Raum der reellwertigen, positiven, erweiterten Treppenfunktionen T + = T (IR+ ) versehen mit der punktweisen Ordnung ist ein Verband. Die Vervollständigung von T + bzgl. σ+
Stetigkeit von unten ist der Raum F der erweiterten reellwertigen, meßbaren und positiven
+
Funktionen. Zu gegebener Funktion f ∈ F konvergieren zum Beispiel die Treppenfunktionen
fn
n
n2
X i
fn (x) :=
11 i
i+1
2n 2n ≤f (x)< 2n
i=0
aufsteigend gegen f.
Die Erweiterung von I kann nur funktionieren, falls I auf T + bereits σ-stetig von unten
ist. Dies liefert die nächste Proposition.
Proposition 32 Die Funktion I (3.3) ist eine additive, skalare, isotone, von unten σ-stetige
erweiterte Funktion. Die Abbildung I eingeschränkt auf I −1 (IR) ist σ-stetig.
Beweis: Die Wohldefiniertheit, Linearität, Skalarität und Isotonie wurde in Proposition 31
gezeigt.
Für die σ-Stetigkeit von unten betrachte eine aufsteigende Folge fn ր f aus T + . Seien
0 ≤ a1 < a2 < ... < aN die Werte von f und Ai = f −1 (ai ).
• I(fn 11Ai ) ր I(f 11Ai ) für alle i = 1..N.
Dies folgt aus der σ-Stetigkeit des Maßes,
ai µ(Ai ) = I(ai 11Ai ) ≥ I(fn 11Ai ) ≥ (ai − ǫ)µ(Ai ∩ {fn ≥ ai − ǫ}) →n (ai − ǫ)µ(Ai ).
Mit ǫ → 0 erhalten wir die Teilbehauptung.
• σ-Stetigkeit von unten.
I(fn ) =
X
i
I(fn 11Ai ) ր
X
I(f 11Ai ) = I(f ).
i
• I eingeschränkt auf I −1 (IR) ist σ-stetig.
Für eine Folge fn ց f ∈ T + betrachte f1 − fn ր f1 − f und argumentiere wie oben. q.e.d.
+
Definiere die Abbildung I˜ von F in die erweiterten reellen Zahlen via
˜ ) = lim I(fn ).
I(f
nր∞
für irgendeine Folge fn von positiven Treppenfunktionen punktweise aufsteigend gegen f.
+
Satz 33 Die Abbildung I˜ : F → IR ist wohldefiniert. Sie ist als additive und σ-stetige
Fortsetzung des Maßes µ eindeutig und ist additiv, skalar, isoton und σ-stetig von unten. Die
Fortsetzung I˜ eingeschränkt auf I˜−1 (IR) ist σ-stetig.
28
WS10/11
U. Rösler
Beweis: • I˜ ist wohldefiniert.
Seien fn und gm zwei monoton gegen f aufsteigende Folgen von Treppenfunktionen. Dann
gilt
lim I(fn ) ≥ lim I(fn ∧ gm ) = I(gm ).
n
n
Dies ergibt limn I(fn ) ≥ limm I(gm ). Aus Symmetriegründen gilt auch die andere Ungleichung.
• I˜ ist additiv, skalar und isoton.
Einfach.
• I˜ ist σ-stetig.
+
Sei F ∋ fn ր f. Seien T + ∋ fi,n րi fn . Dann konvergieren die Treppenfunktionen
W
gn := i,m≤n fi,m ≤ fn isoton gegen f. Aus der Sandwichposition
˜ ) = lim I(gn ) ≤ lim I(f
˜ n ) ≤ I(f
˜ )
I(f
n
ergibt sich die Behauptung.
• Die Fortsetzung I˜ eingeschränkt auf I˜−1 (IR) ist σ-stetig.
Verwende σ-Stetigkeit von unten und fn ց f ⇔ f1 − fn ր f1 − f.
Es verbleibt die Eindeutigkeit der Fortsetzung zu zeigen. Dies ist einfach.
q.e.d.
+
Bem: F ist die σ-Vervollständigung von unten bzgl. der (punktweisen) Ordnung von
T + . I˜ ist die einzig mögliche σ-stetige Fortsetzung von I.
Jede Funktion f : Ω 7→ IR hat eine eindeutige Zerlegung f = f + − f − mit f + := f ∨
˜ + ) oder
0, f − = (−f )+ . Sei Fe der Raum alle meßbaren erweiterten Funktionen f mit I(f
−
˜
˜
I(f ) endlich. Erweitere I auf Fe durch
˜ ˜ ) := I(f
˜ + ) − I(f
˜ − ).
I(f
Dies Objekt nennen wir Integral bzw. genauer Lebesgueintegral.
Dies ist (fast) der allgemeinste Integralbegriff.
Gebräuchliche Notationen für das Integral I˜˜ sind
˜˜ ) =: µ(f ) =:
I(f
Z
f (ω)dµ(ω) =:
Z
f (ω)µ(dω) =:
Ω
Z
f dµ =:
Z
Für eine meßbare Menge A verwenden wir
Z
Speziell auf IR verwenden wir
f dµ :=
Z
f dµ :=
Z
A
Z
b
a
f 11A dµ.
f dµ.
(a,b]
Hat µ keine Punktmaße (∀x ∈ IR : µ(x) = 0), so benutzen wir auch
Z
b
f dµ :=
a
Z
[a,b]
f dµ =: −
29
Z
a
f dµ.
b
f = µ(f ) = µf.
WS10/11
Maßtheorie
Ist µ das Lebesguemaß λ auf IR so schreiben wir
Z
Für W-mas̈e P ist
R
f (x)λ(dx) =
Z
f (x)dx.
f dP =: E(f ) =: Ef der Erwartungswert von f.
Eine integrierbare Funktion f ist eine meßbare Funktion mit endlichem Wert
Der Raum L1 der integrierbaren Funktionen ist ein Vektorraum.
R
|f |dµ < ∞.
R
Korollar 34 Das Integral
auf den integrierbaren Funktionen ist eine additive, skalare,
isotone und σ-stetige Abbildung.
Üblicherweise wird nicht der Raum der integrierbaren Funktionen verwendet, sondern der
Raum L1 der Äquivalenzklassen [f ] bzgl. der Äquivalenzrelation
f ∼g⇔
Z
|f − g|dµ = 0.
Aus der Äquivalenzklasse werden dann Repräsentanten benutzt. (Der Integralwert ist unbeeinflußt von der Auswahl des Repräsentanten.) Der Sprachgebrauch unterscheidet nicht
zwischen Funktionen und Äquivalenzklassen.
Korollar 35 Es gibt eine Bijektion zwischen erweiterten, additiven, skalaren, positiven und
von unten σ-stetigen Abbildungen I auf den positiven mes̈baren Funktionen und Mas̈en µ.
Diese Bijektion kann gegeben werden durch I(11A ) = µ(A).
Bew: Die so definierte Abbildung ist ein Mas̈ und I die eindeutige Erweiterung im obigen
Sinne.
q.e.d.
Bemerkung: Sei A ein linearer Operator auf eine Vektorraum von Funktionen mit Werten
in den reellen Zahlen. Dann ist A positiv genau dann wenn A isoton ist.
Bsp: Dichte: Sei µ ein Maß und f ≥ 0 eine meßbare Funktion. Dann ist die Mengenfunktion ν : A 7→ IR, definiert durch
ν(A) :=
Z
f dµ,
A
ein Maß.
Notation dν = f dµ oder auch ν = f µ.
dν
.
Die Funktion f heißt Radon-Nikodym Dichte von ν bzgl. µ. Geschrieben g = dµ
Bsp: Radon-Nikodym Dichte bzgl. dem Lesbesguemaß: Wir betrachten ein W-Maß
µ auf (IR, B). Die zugehörige Verteilungsfunktion F sei stetig differenzierbar. Die Behauptung
ist
Z
Z
g(x)dµ(x) = g(x)F ′ (x)dx
für alle integrierbarenR Funktionen g. Die Behauptung ist richtig für eine Treppe g = 11A mit
A = (a, b]. (µ(A) = A F ′ (x)dx = F (b) −RF (a).) Damit ist sie richtig für jede A-meßbare
Menge. (Die Menge M = {A ∈ A | µ(A) = A F ′ (x)dx} ist eine σ-Algebra,die einen Erzeuger
enthält.) Da beide Seiten additiv und σ-stetig sind, gilt Gleichheit für alle positiven meßbaren
Funktionen. Dann aber auch für alle integrierbaren Funktionen.
Die Funktion F ′ ist die Radon-Nikodym Dichte aus obigem Beispiel.
30
WS10/11
U. Rösler
Bsp: Diskrete Räume: Sei Ω endlich oder abzählbar versehen mit der Potenzmenge und
P
sei µ ein Maß. Dann ist µ = ω∈Ω f (ω)δω mit f (ω) = µ({ω}). Das Integral ist die Summe,
Z
gdµ =
X
g(ω)f (ω).
ω∈Ω
Die Abbildung ω 7→ f (ω) läßt sich als Radon-Nikodym Dichte von µ bzgl. dem Zählmaß
auffassen.
3.0.4
Konvergenzsätze
R
Sei
das oben definierte Integral für einen beliebigen Maßraum (Ω, A, µ). Wir benutzen
R
R
f = f dµ.
Satz 36 (Monotone Konvergenz)R Sei fn , n ∈R IN, eine steigende (fallende) Folge erweiterter meßbarer Funktionen und sei f1 > −∞ ( f1 < ∞.) Dann gilt
Z
lim fn = lim
n
n
Z
fn .
Beweis: Dies ist die σ-Stetigkeit des Integrals.
q.e.d.
Lemma 37 (Lemma von Fatou) Sei fn , n ∈ IN, eine Folge erweiterter, meßbarer Funktionen. Sind die fn gleichmäßig nach unten beschränkt durch eine integrierbare Funktion, so
gilt
Z
Z
fn ≥
lim inf
lim inf fn .
Sind die fn gleichmäßig nach oben beschränkt durch eine integrierbare Funktion, so gilt
lim sup
Z
fn ≤
Z
lim sup fn .
V
Beweis: Definiere gm := m≤n fn . Die Folge gm , m ∈ IN, konvergiert aufsteigend gegen
lim inf n fn . Mit dem Satz von der monotonen Konvergenz erhalten wir
Z
fm ≥
Z
gm րm
Z
lim inf fn .
n
Für die zweite Aussage betrachte die Folge −fn und beachte lim inf(−fn ) = − lim sup fn .
q.e.d.
Satz 38 (Dominierte Konvergenz) Sei fn , n ∈ IN, eine punktweise konvergente Folge erweiterter, meßbarer Funktionen. Weiterhin sei |fn |, n ∈ IN, gleichmäßig durch eine integrierbare Funktion beschränkt. Dann gilt
lim
n
Z
fn =
Z
lim fn .
Beweis: Folgerung aus dem Lemma von Fatou.
lim sup
Z
fn ≤
Z
lim sup fn =
Z
lim inf fn ≤ lim inf
31
Z
fn ≤ lim sup
Z
fn .
WS10/11
Maßtheorie
q.e.d.
Die Forderung einer Schranke ist essentiell. Als Beispiel betrachten wir: Ω = (0, 1] versehen
mit der Borel σ-Algebra und dem Lebesguemaß λ. Sei fn := n11(0,1/n] . Es gilt limn fn ≡ 0,
lim
Z
fn dλ = 1 > 0 =
Z
lim fn dλ.
n
Der Satz über dominierte Konvergenz ist nicht anwendbar. Das Lemma von Fatou ist anwendbar und die Ungleichung strikt.
3.0.5
Transformationssatz
Satz 39 (Transformationssatz) Sei (Ω, A, µ) ein Maßraum und (Ω′ , A′ ) ein meßbarer Raum.
Sei T : Ω 7→ Ω′ eine meßbare Abbildung. Dann gilt für meßbare (erweiterte) Funktionen
f : Ω′ 7→ IR, sofern eine Seite wohldefiniert ist,
Z
f ◦ T dµ =
Z
f d(µT )
Beweis: Die Aussage ist leicht nachzurechnen für f = 11A′ , A′ ∈ A′ . (Übung). Beide Seiten
sind lineare, σ-stetige Fortsetzungen (einer Mengenfunktion). Diese sind eindeutig.
q.e.d.
Beispiel: Sei T eine stetig differenzierbare Funktion auf den reellen Zahlen mit strikt
positiver Ableitung T ′ und sei µ das Lebesguemaß. Es gilt die Transformationsformel mit
y = T (x), f integrierbar,
Z
Z
f (y)
dy = f (T (x))dx.
T ′ (T −1 (y))
Hierbei ist das Maß T µ gegeben durch
T
(µ )((a, b]) =
Z
1
[a,b]
T ′ (T −1 (y))
Z.B. f (x) = ex , T (x) = x2 = y, µ(dx) = dx, x2 = y, dx =
Z
ey
√ dy =
2 y
Z
dy.
dy
√
2 y,
2
ex dx.
Für weitere und genauere Rechenregeln siehe Lehrbücher über Differential und Integralrechnung.
Fubini
Der wesentliche Satz dieses Abschnittes ist der Satz von Fubini.
Seien (Ω, A, µ) und (Ω′ , A′ , µ′ ) meßbare Räume. Ein Maß ν auf dem Produktraum Ω × Ω′
N
versehen mit der Produkt σ-Algebra A A′ = σ(E), E = {A × A′ | A ∈ A, A′ ∈ A′ } heißt
Produktmaß zu µ, µ′ falls ν(A × A′ ) = µ(A)µ′ (A′ ) gilt für alle A × A′ ∈ E.
32
WS10/11
U. Rösler
Der Schnitt Bω einer Menge B ⊂ Ω×Ω′ bzgl. ω ist die Menge {ω ′ ∈ Ω′ | (ω, ω ′ ) ∈ A
✬
N
A′ }.
✩
B
Bω
ω
✫
✪
Satz 40 Zu zwei Mas̈en gibt es ein Produktmas̈. Sind die Mas̈e σ-endlich, so ist das Produktmas̈ eindeutig.
Beweis: Wir definieren ν durch
ν(B) =
Z Z
11Bω (ω ′ )µ′ (dω ′ )µ(dω).
(
Die Menge D aller B für die obiges wohldefiniert ist, ist ein Dynkinsystem. Dies System
enthält den durchschnittstabilen Erzeuger E der Produkt σ-Algebra. Damit ist D die Produkt
σ-Algebra.
Die Eindeutigkeit folgt aus Satz 14.
q.e.d.
N
Notation: µ µ′ ist das Produktmaß, falls eindeutig definiert.
N
Bem: Sind µ, µ′ σ-endlich, so auch das Proktmaß µ µ′ .
Satz 41 (Fubini) Seien µ, µ′ σ-endliche Maße. Dann gilt
Z Z
(
′
′
′
f (ω, ω )dµ(ω))dµ (ω ) =
Z
′
′
′
f (ω, ω )d(µ × µ )(ω, ω ) =
Z Z
(
f (ω, ω ′ )dµ′ (ω ′ ))dµ(ω).
Beweis: Aus Symmetrie und Eindeutigkeitsgründen reicht es nur das zweite Gleichheitszeichen
zu zeigen. Sei OEdA f positiv.
Für f eine Treppe 11B mit B ∈ E gilt die Gleichheit. Da beide Seiten lineare und von
unten σ-stetige Abbildungen auf mes̈baren Funktionen sind, gilt die Gleichheit für Treppenfunktionen und den aufsteigenden Grenzwert von Treppenfunktionen. Das war’s.
q.e.d.
Bemerkung: Die σ-Endlichkeit ist wichtig. Als Beispiel betrachten wir µ das Lebesguemaß
und µ′ das Zählmaß auf dem Einheitsintervall. Die Funktion (x, y) 7→ f (x, y) = 11x=y ist
meßbar. Es gilt
Z Z
(
Z Z
′
f (x, y)dµ(x))dµ (y) = 0
(
f (x, y)dµ′ (y))dµ(x) = 1.
Diese Bemerkung zeigt, das̈ man die Eindeutigkeit des Produktmaßes nicht σ-endliche Maße
und die Vertauschbarkeit der Integrale verliert (vgl. Halmos [7] page 145, Hahn-Rosenthal
SET FUCTIONS 1948 chap IV,§16[6]).
33
WS10/11
34
Maßtheorie
Kapitel 4
Ungleichungen
Für Ungleichungen gibt es im wesentlichen zwei Quellen, über die Monotonie und über konvexe
Funktionen. Ungleichungen mit Hilfe der Monotonie werden Markoffungleichungen genannt.
Wesentliche bessere Ungleichungen ergeben sich durch konvexe Funtionen. Die Jensenungleichung in ihrer Grundform gilt jedoch nur für Wahrscheinlichkeitsmaße.
Röslers Metatheorem:
Alle guten Integralungleichungen beruhen auf Konvexität.
4.1
Markoff Ungleichung
Die Ungleichungen in diesem Abschnitt beruhen auf Monotonie.
Lemma 42 (Markoff Ungleichung) Sei ϕ : IR 7→ IR eine isotone, positive Funktion. Es
gilt für alle a ∈ IR
Z
ϕ(f )dµ ≥ ϕ(a)µ(f ≥ a)
Beweis: Beachte ϕ(a)11ϕ(f )≥ϕ(a) ≤ ϕ(f ) und verwende die Isotonie des Integrals.
Wichtige Spezialfälle sind die Momentabschätzungen für ϕ(x) = xp , x, p ≥ 0
Z
q.e.d.
|f |p dµ ≥ ap µ(|f | ≥ a)
und die exponentiellen (=Chernoff) Abschätzungen, ϕ(x) = exp(λx), λ ≥ 0
Z
exp(λf )dµ ≥ exp(λa)µ(f ≥ a).
Für W-maße ist ein praktischer und wichtiger Spezialfall die Tchebyscheff Ungleichung:
Z
(f − e)2 dµ ≥ a2 µ(|f − e| ≥ a)
R
mit dem Erwartungswert e = f dµ.
Bemerkung: – In der Regel werden die Momentenabschätzungen besser für zentrierte
Momente.
35
WS10/11
Maßtheorie
– Die Momentenabschätzungen sind besser als die Chernoff Abschätzungen, da gilt, (Übung
Reihenentwicklung)
R
R
exp (λf )dµ
|f |p dµ
≤ inf
.
inf
p
p>0
λ>0
a
exp (λa)
Da sich höhere Momente schlecht berechnen lassen, werden gerne exponentiellen Abschätzungen genommen. Diese sind in der Regel gut.
Proposition 43
R
|f |dµ = 0 ⇔ µ(|f | > 0) = 0.
R
Beweis: Die Markoff
Ungleichung aµ(|f | > a) ≤ |f |dµ liefert die Hinrichtung.
Für die
R
R
Rückrichtung sei |f |dµ > 0. Folglich gibt es eine Treppenfunktion 0 ≤ g ≤ |f | mit gdµ > 0.
Für diese gilt 0 < µ(g > 0) ≤ µ(|f | > 0)).
q.e.d.
4.2
Jensen Ungleichung
Die Ungleichungen in diesem Abschnitt beruhen auf Konvexität.
Eine reellwertige Funktion ϕ auf einem Intervall I heißt konvex, falls für alle t ∈ (0, 1)
und x 6= y ∈ I gilt
ϕ(tx + (1 − t)y) ≤ tϕ(x) + (1 − t)ϕ(y).
(4.1)
Sie heis̈t strikt konvex, falls in 4.1 stets echt kleiner gilt.
Satz 44 (Jensen) Sei P ein W-mas̈ und ϕ eine konvexe Funktion. Dann gilt für jede integrierbare Funktion f , sofern alles wohldefiniert ist,
Z
ϕ ◦ X dP ≥ ϕ(
Z
f dP ).
Gleichheit gilt genau dann, wenn die Funktion ϕ eine Gerade ist, P f −1 fast überall.
Beweis: Ohne Beweis sei angeführt, daß es für jedes x0 ∈ IR eine lineare Funktion l, l(x) =
ax + b) (=Tangente) gibt mit l ≤ ϕ und l(x0 ) = ϕ(x0 ). Es gilt mit x0 = inf f dP
Z
ϕ ◦ f dP ≥
Z
l ◦ f dP = l(
Z
f dP ) = l(x0 ) = ϕ(x0 ).
(4.2)
• Gleichheit.
R
Gilt überall Gleichheit in (4.2), so folgt (ϕ − l) d(P f −1 ) = 0 und daraus nach (43) die
| {z }
≥0
Bedingung. Umgekehrt, die Bedingung impliziert die Gleichheit in (4.2).
q.e.d.
Merkregel Meine Eselsbrücke ist Falscher Effee für Eϕ ≥ ϕE.
Bemerkung: – Für strikt konvexe Funktionen gilt Gleichheit genau dann, wenn f fast
sicher konstant ist.
– Die Jensen-Ungleichung gilt auch, sofern EX wohldefiniert ist. (Der Positivteil oder der
Negativteil von X ist integrierbar.)
– Die Jensen-Ungleichung gilt auch für konvexe Funktionen ϕ : I → IR auf einem Intervall
I.
Warnung: Die Jensenungleichung gilt nur für Wahrscheinlichkeitsmaße.
36
WS10/11
U. Rösler
Beispiel: p-te Momente Für 1 ≤ p < ∞ gilt für W-maße
P
Z
P
|f |p dP ≥ (
Z
|f |dP )p .
Aber es gilt n∈IN |xn |p ≤ ( n |xn |)p für das Zählmas̈.
Mehrere interessante Ungleichungen folgen aus der Jensen Ungleichung in folgender verallgemeinerter Form:
Korollar 45 (Jensen) Sei ϕ eine konvexe Funktion und µ ein Maß auf den reellen Zahlen.
Seien f, g meßbare Funktionen und sei g integrierbar und überall strikt positiv. Dann gilt,
Wohldefiniertheit vorausgesetzt,
R
R
f
gϕ(f /g)
R
ϕ( R ) ≤
.
g
g
Beweis: Das W-maß ν, gegeben durch ν(A) :=
W-maß. Die Jensenungleichung ergibt
linke Seite = ϕ
Z
f
dν ≤
g
Z
1R
a A gdµ,
A ∈ A, und a :=
R
gdµ ist ein
f
ϕ( )dν = rechte Seite.
g
Lp -Ungleichungen: Definiere für 1 ≤ p < ∞ die Abbildung k.kp auf meßbaren Funktionen
durch
Z
kf kp := ( |f |p dµ)1/p .
(4.3)
Die Abbildung ist wohldefiniert.
Satz 46 (Hölder Ungleichung) Sei 1 < p < ∞ und q definiert durch 1/p + 1/q = 1. Für
meßbare Funktionen f, g gilt
kf gk1 ≤ kf kp kgkq .
(4.4)
Sind obige Ausdrücke endlich und ungleich 0, so gilt Gleichheit genau für |f |p und |g|q sind
echte Vielfache voneinander fast sicher.
Beweis: Sei die rechte Seite endlich. Nehme in Korollar 45 die konvexe Funktion ϕ(x) = −x1/p
und die Funktionen |f |p , |g|q . Es ergibt sich die Hölderungleichung. Da ϕ strikt konvex ist,
gilt Gleichheit genau im Fall |f |p /|g|q eine Konstante.
q.e.d.
Corollary 47 (Cauchy-Schwarz Ungleichung)
Z
|f g|dµ ≤
sZ
f 2 dµ
Z
g 2 dµ.
Beweis: Spezialfall der Hölderungleichung für p = 2.
Corollary 48 Für 1 < p, q, r und 1/p + 1/q = 1/r gilt
kf gkr ≤ kf kp kgkq .
Satz 49 (Minkowski) Für 1 ≤ p < ∞ gilt
kf + gkp ≤ kf kp + kgkp .
Gleichheit gilt genau für f und g sind fast sicher positive Vielfache voneinander f.s..
37
q.e.d.
WS10/11
Maßtheorie
Beweis: Für die Minkowskiungleichung verwende IR+ ∋ x 7→ ϕ(x) = −(1 + x1/p )p und die
Funktionen |f |p und |g|p . Die Gleichheit ergibt sich genau für |f | und |g| Vielfache voneinander
und |f + g| = |f | + |g| fast sicher.
q.e.d.
Die letzten 4 Aussagen gelten auch für 1 ≤ p, q, r ≤ ∞, wenn wir
kf k∞ := inf{a > 0 | µ(|f | > a) = 0}
setzen. kf k∞ heißt essentielles Supremum esssupf von |f | oder L∞ -Norm.
38
Kapitel 5
Orlicz und Lp-Räume
Besonders schöne Räume von meßbaren Funktionen sind Lp -Räume, eine Unterklasse der
Orlicz Räume. Hiervon wiederum sind die L2 -Räume als Hilberträume besonders interessant.
Jeder Hilbertraum ist isomorph zu einem L2 -Raum.
5.1
Orlicz-Räume
Eine Orliczfunktion ist eine unterhalbstetige positive konvexe Funktion ϕ : IR+ 7→ IR+ mit
ϕ(0) = 0 ungleich der 0-Funktion. Eine erweiterte Orliczfunktion ist eine unterhalb stetige,
+
positive, konvexe, erweiterte Funktion ϕ : IR+ 7→ IR mit ϕ(0) = 0 und die Endlichkeitsmenge
D = ϕ−1 (IR) hat ein nichtleeres Inneres.
Orlicz Funktionen sind monoton steigend, links stetig und stetig bis auf eventuell in
dem rechten Randpunkt dr > 0 von D. Sie besitzen eine rechtsseitige Ableitung D+ ϕ(x) =
limy↓x ϕ(y)−ϕ(x)
und eine linksseitige Ableitung D− ϕ(x) = limy↑x ϕ(y)−ϕ(x)
im Inneren von D.
y−x
y−x
Erweitere die rechtsseitige (links-) Ableitung rechtsstetig (links-) zu einer erweiterten Funktion via dem Wert ∞ auf (dr , ∞). Die Ableitungen sind jeweils monoton wachsend und rechtsbzw. linksstetig. Die linksseitige Ableitung ist stets kleiner gleich der rechtsseitigen und sie
stimmen überein bis auf eventuell abzählbar viele Punkte.
Jede erweiterte Orliczfunktion ϕ hat die Darstellung
ϕ(x) =
Z
Dϕ(dy) =
[0,x[
Z
(x − y)+ µ(dy)
mit µ ist ein Radonmaß auf D (zu DDϕ mit µ({0}) = 0). (Es ergibt sich dasselbe Maß für
die links- bzw. rechtseitige Ableitung.)
Sei (Ω, A, µ) ein Maßraum und ϕ eine erweiterte Orlicz Funktion. Definiere die Abbildung
d = dϕ : F × F → IR auf meßbaren Funktionen f, g via
dϕ (f, g) := inf{c > 0 |
R
Z
|f − g|
dµ ≤ 1}.
ϕ
c
−g|
Proposition 50 Es gilt ϕ d|f
dµ ≤ 1.
ϕ (f,g)
dϕ ist symmetrisch, erfüllt die Dreiecksungleichung
dϕ (f, g) ≤ dϕ (f, h) + dϕ (h, g)
und ist ideal, d.h. dϕ (f + h, g + h) = dϕ (f, g) und dϕ (af, ag) = adϕ (f, g), a > 0.
39
WS10/11
Maßtheorie
Bew: Die erste Aussage folgt aus monotoner Konvergenz.
Wir rechnen nur die Dreiecksungleichung nach. OEdA sei die rechte Seite endlich. Sei
a > dϕ (f, h) und b > dϕ (g, h). Dann gilt
Z
|f − g|
ϕ
dµ ≤
a+b
Z
b |g − h|
a |f − h|
+
ϕ
dµ
a+b a
a+b b
Z
Z
b
a
|f − h|
|g − h|
ϕ
ϕ
≤
dµ +
dµ
a+b
a
a+b
b
a
b
≤
+
= 1.
a+b a+b
q.e.d.
Die letzte Eigenschaft führt auf Vektorräume. Sei k · kϕ : F → IR definiert durch kf kϕ =
dϕ (f, 0). Definiere Lϕ als die Menge aller f mit kf kϕ endlich. (Dies ist die Menge aller f mit
R
ϕ( |fc | )dµ < ∞ für ein c > 0.)
Lϕ ist ein Vektorraum. Sei Lϕ der Raum der Äquivalenzklassen bzgl. der Äquivalenzrelation ∼ϕ ,
f ∼ϕ g ↔ dϕ (f, g) = 0
Diese stimmt überein mit f ∼ g ⇔ µ(f 6= g) = 0. In Lϕ benutzen wir die übliche Addition +
+([f ], [g]) := [f ] + [g] := [f + g]
die Skalarmultiplikation · : IR × Lϕ → Lϕ
·(c, [f ]) := c[f ] := [cf ]
und die Abbildung dϕ ([f ], [g]) = dϕ (f, g) und k · kϕ : Lϕ 7→ IR
k[f ]kϕ := dϕ (f, 0).
Lϕ heißt Orlicz Raum und k.kϕ die Orlicz Norm.
Warnung: Wir unterscheiden in der Regel notationsmäßig nicht zwischen Funktionen und
ihren Äquivalenzklassen. Ebenso interessiert in der Regel nicht, wie groß die Äquivalenzklassen
wirklich sind.
Bem: Das Verhalten der konvexen Funktion am rechten Endpunkt dr spielt keine Rolle
in der Definition des Orliczraumes. Wir könnten daher auch die Forderung unterhalbstetig
weglassen.
Satz 51 Für jede erweiterte Orlicz Funktion ϕ ist (Lϕ , k.kϕ ) ein Banachraum.
Beweis: Alle genannten Objekte sind wohldefiniert. Lϕ ist ein Vektorraum und k.kϕ ist eine
Norm (wird nachgerechnet). Beachte hierbei
1
1
ϕ(|f − g|) ≤ ϕ(|f |) + ϕ(|g|).
2
2
Wir kommen jetzt zur Vollständigkeit. Sei [fn ] ∈ Lϕ eine Cauchyfolge. Wir können eine
Teilfolge ni →i ∞ wählen mit k[fni+1 ] − [fni ]kϕ = bi < 2−i . Es reicht den Satz für die
Teilfolge zu zeigen. Also können wir oEdA annehmen, die Teilfolge ist die Originalfolge. Nehme
P
Funktionen fn als Representanten der Äquivalenzklasse [fn ]. Sei g = n∈IN |fn+1 − fn |
40
WS10/11
U. Rösler
• kgkϕ ≤ 1.
P
Für vorgegebenes ǫ = i ǫi < ∞ mit ǫi > 0 argumentiere
Z
|g|
ϕ
dµ ≤
1+ǫ
≤
Z
ϕ
X bn + ǫn |fn+1 − fn |
1+ǫ
n
X bn + ǫ n Z
ϕ
1+ǫ
n
≤ 1
bn + ǫn
!
dµ
|fn+1 − fn |
dµ
bn + ǫ n
Mit ǫ → 0 folgt die Teilbehauptung.
• g is f.s. endlich.
Wende die Markoffungleichung an auf die konvexe Funktion x 7→ ϕ( xc ) mit c = kf kϕ
µ(g > a) ≤
R
≤
ϕ
P
ϕ
ϕ
1
a
c
|g|
c
a
c
dµ
→a→∞ 0.
• fn →n f = f1 + i∈IN (fi+1 − fi ) in Orlicznorm.
P
f ist wohldefiniert und endlich fast sicher. Aus der Teleskopdarstellung f = fn + i≥n (fi+1 −
fi ) folgt
X
X
kf − fn kϕ ≤ k
(fi+1 − fi )kϕ ≤
kfi+1 − fi kϕ →n 0.
i≥n
i≥n
Es verbleibt zu zeigen, dass die Äquivalenzklasse von [f ] unabhängig ist von der Auswahl
der Repräsentanten. (Wir überschlagen dies.)
q.e.d.
Eine Orliczfunktion erfüllt die ∇−Bedingung falls es ein a > 1 und b < ∞ gibt mit
ϕ(ax) ≤ bϕ(x)
für alle x ≥ 0.
Satz 52 Sei ϕ eine Orlicz Funktion mit der ∇−Bedingung. Dann ist (Lϕ , k.kϕ ) separabel für
jedes Radon Maß auf Ω = IR.
Beweis: Sei zuerst µ ein endliches Maß. Die Menge T aller Treppenfunktionen
N
X
qn 11(rn ,sn )
n=1
mit rationalen Zahlen qn , rn , sn ∈ Ql, N ∈ IN tut’s.
• T ist abzählbar.
• 1A , A ∈ A liegt in dem Abschluß T von T bezüglich k.kϕ .
Wegen der Regularität des Maßes können wir A durch eine offene Menge U von oben
dem Maße nach approximieren. Jede offenen Menge können wir als abzählbare Vereinigung
disjunkter offener Intervalle Un , n ∈ IN, schreiben. Jedes Un approximieren wir von oben
41
WS10/11
Maßtheorie
durch offene Intervalle Vn mit rationalen Koeffizienten. Sei V := ∪N
n=1 Vn . Damit ist für jedes
vorgegebene c > 0
Z
ϕ
|11A − 11V |
dµ =
c
Z
1
|11A − 11V |dµ
c
1
≤ ≤ϕ
(µ(U \A) + µ(V \U ))
c
ϕ
beliebig klein durch Wahl geeigneter Approximationen.
• Alle Treppenfunktionen liegen in T .
• Alle positiven f ∈ Lϕ liegen in T und dann auch ganz Lϕ .
Hier muss man aufpasssen. Approximiere f von unten durch Treppenfunktionen fn . Dies
kann geschehen mit f − fn ≤ {f rac1n auf einer Menge An mit µ(Acn ) klein. Wir erhalten
Z
ϕ(
f − fn
1
) ≤ ϕ( )µ(An ) +
c
nc
Z
f
ϕ( )
c
An
Der erste Term ist klein in n für festes c. Der zweite wird abgeschätzt mit Hilfe der ∇−Bedingung
durch µ(An )bm mit m so gewählt, dass cam ≥ kf kϕ gilt. Dies wird beliebig klein für n hinreichend gross.
• Lϕ liegt in T .
Zerlegung in Positiv und Negativteil.
• T tut’s auch für nicht endliche Maße.
Zerlege den Raum Ω geeignet durch eine Partition und ’klebe’ aneinander. Puh.
q.e.d.
Bem: Ohne die ∇−Bedingung gibt es Gegenbeispiele zur Separabilität.
Lp -Räume Das Standardbeispiel ist die Orlicz Funktion ϕp (x) = xp für ein 1 ≤ p < ∞.
Die Orlicznorm wird
Z
kf kϕp = ( |f |p dµ)1/p .
Der Orlicz-Raum Lϕp heißt Lp -Raum und die zugehörige Orlicz-Norm k.kp := k.kϕp heißt
Lp -norm.
Bemerkung: Die L∞ -Norm wird definiert durch
kf k∞ := esssup|f | := inf{α ∈ IR | µ(|f | > α) = 0}
(5.1)
und L∞ analog dazu. Die L∞ -Norm und der L∞ -Raum ist die Orlicz Norm und der Orlicz
Raum zur erweiterten Orlicz Funktion ϕ = ∞11(1,∞) . Der Raum L∞ ist vollständig, aber im
allgemeinen nicht separabel.
Proposition 53 Sei µ ein W-maß und 1 ≤ p ≤ q ≤ ∞. Dann gilt kf kp ≤ kf kq und Lp ⊃ Lq .
Beweis: Jensen angewandt auf die konkave Funktion x 7→ xp/q , x ≥ 0 ergibt
kf kp =
Z
|f |
p
1/p
Z
≤
|f |
pq/p
p/qp
= kf kq .
Die erste Aussage impliziert die zweite Aussage.
q.e.d.
Bemerkung Sei 1 ≤ p < ∞. Sei L∗p der Dualraum, d.h. der Raum der linearen und
stetigen Funktionale auf Lp . Der Satz von Fischer-Riesz besagt L∗p = Lq mit 1/p
+ 1/q = 1.
R
Für jedes lineare stetige Funktional B : Lp → IR gibt es ein g ∈ Lq mit B(f ) = f gdµ.
⊃
Warnung: Im allgemeinen gilt L∗∞ 6= L1 .
Hilberträume Besonders wichtig sind die L2 -Räume, da sie Hilberträume sind.
42
WS10/11
U. Rösler
Lemma 54 L2 versehen mit der Bilinearform
< f, g >:=
und der Norm
√
Z
f g dµ
< f, f > = kf k2 ist ein Hilbertraum.
Hilberträume sind selbstdual. Jeder Hilbertraum hat eine Orthonormalbasis. Hilberträume
mit gleicher Kardinalität der Orthonormalbasis sind isomorph. Hilberträume mit vorgegebener Basiskardinalität lassen sich über Zählmaße konstruieren. (D eine Menge, µ(A) = |D ∩ A|
11d , d ∈ D bildet Orthonormalbasis mit der gleichen Kardinalität wie D. ) Die Separabilität
eines Hilbertraumes ist äquivalent zur Existenz einer höchstens abzählbaren Basis.
Die Hilberträume sind genau die L2 -Räume.
⊃
Warnung: Im allgemeinen gilt L∗∞ 6= L1 .
Die Hilberträume sind genau die L2 -Räume.
43
WS10/11
44
Maßtheorie
Kapitel 6
Konvergenz und Topologie
Wir betrachten verschiedene Konvergenzarten auf dem Raum der Maße und auf dem Raum
der Zufallsgrößen.
Beachte, daß fast jede Konvergenzart eine Konvergenz im topologischen Sinne ist und
umgekehrt, (Pedersen [9]). (Ein topologischer Raum ist ein Tupel (E, τ ), wobei E eine Menge
ist und τ eine Teilmenge der Potenzmenge ist, die E enthält und abgeschlossen ist bezüglich
endlichem Durchschnitt und beliebiger Vereinigung. Eine Folge en ∈ E, n ∈ IN, konvergiert
gegen e ∈ E, falls für alle U ∈ τ mit e ∈ U es ein n0 gibt, sodaß für alle n ≥ n0 gilt en ∈ U.)
Die fast sichere Konvergenz ist eine Aussnahme, dies ist keine topologische Konvergenzart.
6.1
Konvergenz von W-maßen
R
Für ein Maß µ und eine Funktion f benutzen wir µ(f ) := f dµ, falls dies wohldefiniert ist.
Eine Folge µn von Maßen konvergiert bzgl. einer Klasse F von Funktionen, falls für alle
f ∈ F gilt
µn (f ) →n µ(f ).
K
Notation: µn →n µ.
Die zugehörige Topologie wird erzeugt von den Mengen
Z
Z
Uǫ,f (µ) := {ν | f dν − f dµ < ǫ},
ǫ > 0, f ∈ F.
Für F bestehend aus den Treppen 11A , A ∈ A, erhalten wir die punktweise Konvergenz
von Maßen.
Ab jetzt sei (Ω, τ ) ein topologischer Raum. Wir sprechen von schwacher Konvergenz
für die Konvergenz bezüglich aller stetigen beschränkten Funktionen.
C
w
d
Notation: µn →n µ oder µn →n µ oder µn →bn µ. Hierbei steht w für weak , d für distribution und Cb für die Funktionenklasse. (Die W-theoretische schwache Konvergenz ist die
funktionalytische schwach* Konvergenz.)
Wir sprechen von vager Konvergenz für die Konvergenz bzgl. allen stetigen Funktionen
mit kompaktem Träger. (Der Träger supp(f ) einer Funktion ist die kleinste abgeschlossene
Menge f 6= 0 enthaltend.)
v
Notation: µn →n µ.
45
WS10/11
Maßtheorie
Eine Familie M von Maßen heißt straff, falls es für alle ǫ > 0 eine kompakte Menge K
gibt mit µ(K c ) ≤ ǫ für alle µ ∈ M.
Lemma 55 Eine Folge von W-maßen konvergiert schwach genau dann, wenn sie vage konvergiert und die Familie straff ist.
d
v
µn →n µ ⇔ µn →n µ und {µn , n ∈ IN } straff.
Beweis: ⇒‘ Sei K ein kompaktes Intervall und Kǫ := {x ∈ IR | ∃y ∈ K : |x − y| ≤ ǫ}. Es
’
gibt eine stetige Funktion f, die auf dem Kompaktum K stets 1 ist, außerhalb von Kǫ stets
0 und ansonsten von unten durch 0, von oben durch 1 beschränkt ist (Lemma von Urysohn,
[3]). Es gilt
µn (Kǫc ) ≤ µn (1 − f ) →n µ(1 − f ) ≤ µ(K c ).
Wählen wir K mit µ(K) ≥ 1 − ǫ so gilt µn (Kǫc ) < ǫ bis auf endlich viele n. Wir vergrößern
K entsprechend, um die restlichen n’s mit einzuschließen.
⇐‘ Sei g stetig, beschränkt, und f, K wie oben. Argumentiere g = f g + (1 − f )g,
’
|µn (g) − µ(g)| = |µn (f g) − µn (f g)| + |µn ((1 − f )g) − µ((1 − f )g)|.
Der erste Term wird klein für n hinreichend groß. Der zweite Term wird abgeschätzt durch
≤ kgk∞ (µn (K c ) + µ(K c )) und klein für K hinreichend groß.
q.e.d.
Beispiel: µn = δn auf den reellen Zahlen konvergiert vage (gegen Null), aber nicht
schwach.
Für eine Verteilungsfunktion F sei F −1 die linksstetige Inverse
F −1 (u) := inf{x | F (x) ≥ u}.
Lemma 56 Seien µ, µn , n ∈ IN, W-maße auf den reellen Zahlen. Äquivalent sind die Aussagen
i) Die Folge µn konvergiert schwach gegen µ.
ii) Die Folge konvergiert bezüglich einer der Klassen Cc , Cb∞ , Cc∞ .
iii) Die zugehörigen Verteilungsfunktionen Fn konvergieren gegen F für alle Stetigkeitspunkte
von F.
iv) Die Inversen Fn−1 konvergieren gegen F −1 für alle Stetigkeitspunkte von F −1 .
Beweis: i) ⇔ ii). Konvergenz bzgl. Cb ist hier gleichbedeutend, Lemma 55, mit Konvergenz
bzgl. Cc . Jede Funktion aus Cc läßt sich in Supremumsnorm beliebig gut durch eine Cc∞
Funktion approximieren. Dies reicht.
i)⇒ iii) Sei fa diejenige stetige Funktion,die 1 auf (−∞, a], 0 auf [a + ǫ, ∞) und sonst
linear ist. Es gilt
F (a − ǫ) ≤ µ(fa−ǫ ) ←n µn (fa−ǫ ) ≤ Fn (a) ≤ µn (fa ) →n µ(fa ) ≤ F (a + ǫ).
Anders geschrieben,
F (a − ǫ) ≤ lim inf Fn (a) ≤ lim sup Fn (a) ≤ F (a + ǫ).
n
n
Dies gilt für alle ǫ > 0.
46
WS10/11
U. Rösler
iii) ⇐ i) Die Menge S der Stetigkeitspunkte von F ist dicht. (Eine monoton steigende
Funktion hat höchstens abzählbar viele Unstetigkeitspunkte und ides sind Sprungstellen.)
Betrachte die Menge aller meßbarer beschränkter Funktionen f mit µn (f ) →n µ(f ). Diese
Menge ist abgeschlossen bzgl. Addition und gleichmäßiger Konvergenz. Sie enthält alle Treppen 11(−∞,s] mit s ∈ S ein Stetigkeitspunkt. Die Menge enthält alle stetigen Funktion mit
kompaktem Träger, da diese sich gleichmäßig durch Treppenfunktionen obiger Treppen approximieren lassen. Folglich konvergiert µn vage. Zusammen mit Straffheit der Folge, siehe
gleich, folgt schwache Konvergenz.
• µn , n ∈ IN, ist straff.
Wähle Stetigkeitspunkte s1 , s2 mit F (s1 ) < ǫ, F (s2 ) > 1 − ǫ. Für K = [s1 , s2 ] gilt
µn (K c ) ≤ Fn (s1 ) + 1 − Fn (s2 ) →n F (s1 ) + 1 − F (s2 ) < 2ǫ.
Daher gilt µn (K c ) < 2ǫ bis auf endlich viele n. Wir vergrößern jetzt K entsprechend, um
diese n mit einzuschließen.
iii) ⇔ iv) Dies ist einfach für F stetig und strikt steigend. Der allgemeine Fall ist eine
unschöne Übung.
q.e.d.
Eine Familie F von Funktionen heißt separabel oder trennend bzgl. einer Familie M
von Maßen, falls je zwei Maße aus der Familie sich für mindestens eine Funktion f aus der
Funktionenfamilie unterscheiden. (∀µ 6= ν ∈ M∃f ∈ F : µ(f ) 6= ν(f ).)
Cc ist W-maß trennend, Lemma 56 und Eindeutigkeit der Verteilungsfunktion.
6.1.1
Gleichgradige Integrierbarkeit
Gleichgradige Integrierbarkeit ist eine Eigenschaft von Maßen. Wir werden die w-theoretische
Sprache mit Zgn verwenden.
Eine Familie F von Zgn heißt gleichmäßig integrierbar oder gleichgradig integrierbar, falls
gilt
Z
g(c) := sup
X∈F
{|X|>c}
|X|dP −→c→∞ 0.
Für eine Funktion f heißt die Familie F gleichmäßig f -integrierbar oder gleichgradig f integrierbar, falls die Familie f (X), X ∈ F gleichmäßig integrierbar ist. Eine Familie F von
Zgn heißt p-gleichmäßig integrierbar 1 ≤ p < ∞, oder gleichmäßig p-integrierbar , falls
sie gleichgradig f -integrierbar ist für die Funktion f (x) = |x|p .
Bem: Gleichgradige Integrierbarkeit ist eine Eigenschaft der Verteilungen der Zgn und
hängt nicht von der Realisation der Zgn ab.
Bem: Eine Familie gleichgradig integrierbarer Zgn erfüllt stets supX E|X| ≤ c+g(c) < ∞.
Für eine Zg X definiere H = HX : [0, 1] 7→ IR
Z
HX (t) := sup{
A
|X|dP | P (A) ≤ t}.
Für eine Familie F von Zgn benutzen wir
HF (t) := sup HX (t).
X∈F
Falls der W-raum reichhaltig genug ist und eine gleichförmig verteilte Zg besitzt, (was wir
stets annehmen,) so gilt
HX (t) =
Z
1
1−t
47
F −1 (u)du,
WS10/11
Maßtheorie
mit F die Verteilungsfunktion zu |X|. (Übung)
Satz 57 Für eine Familie F von Zgn sind die folgenden beiden Aussagen äquivalent:
(i) F ist gleichgradig integrierbar.
(ii) Für alle ǫ > 0 gibt es eine integrierbare Zg Y mit supX∈F
(iii) HF : [0, 1] → IR ist stetig in 0.
R
|X|>Y
|X|dP < ǫ.
(iv) Es gibt eine aufsteigende Funktion ϕ : IR+ → IR+ mit limx→∞
gleichgradig ϕ| · |-integrierbar.
ϕ(x)
x
= ∞ und F ist
Beweis: i)⇒ ii) Wähle Y als eine Konstante.
ii) ⇒ iii) In der Zerlegung
Z
A
|X| =
Z
A∩{|X|>Y }
|X| +
Z
A∩{|X|≤Y }
|X| ≤
Z
|X|>Y
|X| +
Z
A
|Y |
ist der erste Term klein durch Wahl des Y glm. in X. Der zweite Term ist klein in P (A) klein
glm. in X.
iii) ⇒ i) Zu vorgegebenem ǫ > 0 wähle ein p > 0 mit HF (p) < ǫ. Wähle eine Partition
1
(Ai )N
i=1 von Ω in N ≤ p + 1 Mengen vom Maß ≤ p. Dann gilt gleichmäßig in X ∈ F
Z
|X| ≤
Z
∪i A i
|X| ≤
XZ
i
Ai
|X| ≤ HF (p)N < ∞.
Die Markoffungleichung liefert
sup P (|X| > c) ≤ sup
X
X
R
ǫN
|X|
≤
→c→∞ 0
c
c
Es folgt
sup
X
Z
|X|>c
|X| ≤ sup HX (P (|X| > c) ≤ sup HF (P (|X| > c) ≤ HF (sup(P (|X| > c)) →c→∞ 0
X
iv) ⇒ i)
Z
|X|>c
X
|X| =
Z
|X|>c
X
|x|
|X|
ϕ(|X|) ≤ sup
Eϕ(|X|).
ϕ(|X|)
x≥c ϕ(|x|)
Der erste Faktor konvergiert mit c → ∞ gegen 0 glm. in X ∈ F und der zweite ist endlich
gleichmäßig für X ∈ F.
i) ⇒ iv) Wähle aufsteigende Folge 0 = e0 < en →n ∞ mit g(en ) ≤ 2−n . Definiere die
P
Funktion ϕ durch ϕ(x) = n∈IN0 (|x| − en )+ . ϕ ist symmetrisch und auf IR+ strikt monoton
steigend gegen unendlich. Es gilt
X
X (x − en )+
ϕ(x)
(x − en )+
lim inf
= lim
≥
= n0 →n0 ∞
x→∞ x
x
x
x
x
n
n≤n
lim
0
48
WS10/11
U. Rösler
Zu vorgegebenem n0 sei c gross mit ϕ(en0 ) < c
Z
XZ
ϕ(|X|) =
ϕ|X|>c
n
ϕ(|X|)>c
X Z
≤
(|X| − en )+
+
n≥n0 |X|>en0
X Z
≤
n≥n0 |X|≥en
X
≤
2−n +
(|X| − en ) +
|Xn | +
X
n<n0
n≥n0
X
X Z
n<n0 ϕ(|X|)>c
|X|
g(ϕ−1 (c))
n<n0
g(ϕ−1 (c)) →c→∞ 0
gleichmäßig für X ∈ F.
q.e.d.
Bemerkung: Die hier konstruierte Funktion ϕ ist eine Orlicz Funktion (ϕ ist positiv, konvex und ϕ(0) = 0). Zusätzlich ließe sich ϕ glatt wählen, eventuell unendlich oft differenzierbar
und ϕ(x) > 0 für x > 0.
Der wesentliche Einsatz gleichgradiger Integrierbarkeit besteht in folgendem Lemma.
Lemma 58 Die Folge (Xn )n konvergiere in Verteilung
gegen X∞
. . Dann ist gleichgradige
R
R
Integrierbarkeit der Familie Xn , n ∈ IN äquivalent zu |Xn | →n |X| < ∞.
Bew: Hinrichtung: Sei stets c ∈ IR.
R
R
• |X| ≤ lim inf n |Xn | < ∞
Z
|X| ∨ c = lim
n
Z
|Xn | ∨ c ≤ lim inf
n
Mit dem Grenzwert c → ∞ folgt die Teilbehauptung.
R
R
• lim supn |Xn | ≤ |X|
Z
|X| ≥
Z
|X| ∨ c = lim
n
Z
|Xn | ∨ c = lim(
n
≥ lim sup
n
Z
Z
|Xn | −
|Xn | − lim sup
n
R
Z
R
Z
Z
|Xn |
(|Xn | − c)+
(6.1)
(|Xn | − c)+ ) ≥ lim sup
n
Z
|Xn | − g(c)
(6.2)
R
Mit c → ∞ erhalten wir lim sup |Xn | ≤ |X| ≤ lim inf |Xn | und damit die Hinrichtung.
Für die Rückrichtung verwenden wir die Funktion gc mit gc (x) = 11x≥c +(x−c+1)11c−1≤x<c .
Z
|Xn |>c
|Xn |
=
Z
≤
|
Z
+|
|Xn | −
Z
|Xn | −
Z
|Xn |≤c
Z
|Xn |
|X|| + |
gc (|Xn |) −
Z
Z
|X| −
gc (|X|)| +
=: I + II + III + IV + V
Z
Z
|X| ∨ c| + (
Z
|Xn |≤c
|Xn | −
Z
gc (|Xn |))
gc (|X|)
Zu vorgegebenem ǫ gibt es ein c0 und ein n0 so, dass für alle n ≥ n0 jeder der Terme kleiner
als ǫ/5 wird. Zu jedem festen n < n0 gibt es ein cn so, dass die linke Seite kleiner als ǫ wird.
Dann folgt mit c = sup0≤i<n0 die gewünschte Aussage g(c) < ǫ.
49
WS10/11
Maßtheorie
Korollar 59 Sei Xn , n ∈ IN eine gegen X in Verteilung konvergierende Folge von Zgn. Ist
die Familie (Xn )n gleichgradig integrierbar, so vertauschen für jede stetige Funktion f mit
lim sup
|x|→∞
das Integral und der Limes,
lim
n
Z
|f (x)|
<∞
|x|
f (Xn ) =
Z
(6.3)
f (X).
Bew: Die Familie f (Xn ), n ∈ IN ist gleichgradig integrierbar und konvergiert in Verteilung.
q.e.d.
Das folgende Korollar ist eine W-theoretische Aussage.
Korollar 60 Die L1 -Konvergenz einer Folge (Xn )n von Zgn ist äquivalent zur stochastischen Konvergenz und gleichgradiger Integrierbarkeit. Beide Grenzwerte stimmen fast sicher
überein.
Bew: Hinrichtung: Die L1 -Konvergenz impliziert stochastische Konvergenz und diese Konvergenz in Verteilung. Das obige Lemma liefert wegen kXn k → kXk1 die gleichgradige Integrierbarkeit.
Für die Rückrichtung argumentiere
Z
|Xn − X| ≤
Z
|X−Xn |<ǫ
... +
Z
ǫ≤|X−Xn |<c
≤ ǫ + cP (|X − Xn | ≥ ǫ) + 2
Z
... +
Z
|Xn |<c/2
c≤|X−Xn |
|Xn | + 2
...
Z
|X|>c/2
|X|
alle drei Terme werden beliebig klein für kleine ǫ, große c und n hinreichend groß.
q.e.d.
Korollar 61 Seien Xn , n ∈ IN , p-integrierbare Zgn, 1 ≤ p < ∞. Dann sind äquivalent
• Xn konvergiert in Lp .
• Xn → X stochastisch und kXn kp → kXkp < ∞.
• Xn konvergiert stochstisch und die Familie Xn , n ∈ IN ist gleichgradig p-integrierbar.
Im Konvergenzfalle sind der stochastische und der Lp -Limes gleich.
Der Beweis ist einfach aus Obigem.
..........................................................................
6.1.2
Weitere Metriken
Metriken für Verteilungsfunktionen: Weitere Metriken lassen sich aus den Verteilungsfunktionen konstruieren. Hintergrund ist die eineindeutige Zuordnung von Maßen und Verteilungsfunktionen. Beispiele auf dem Raum der Verteilungsfunktionen sind
d(F, G) := kF − Gk∞
d(F, G) = inf {ǫ | ∀x ∈ IR : |F (x) − G(x + ǫ)| < ǫ und |F (x) − G(x − ǫ)| < ǫ}
50
WS10/11
d(F, G) =
Z
U. Rösler
|F (x) − G(x)|dx.
Diese Metriken auf den Verteilungsfunktionen sind auch Metriken auf W-maßen, durch Identifizierung von Verteilungsfunktion und W-maß. (d(µ, ν) = d(Fµ , Fν ).)
Wasserstein Metrik: Sei d eine Metrik auf dem Werteraum E und µ, ν W-maße auf
(E, B(E)). Definiere
D(µ, ν) := inf Ed(X, Y ).
Hierbei wird das Infimum über alle X mit Verteilung µ und alle Y mit Verteilung ν auf einem
beliebigen W-raum genommen. Dies ist eine Metrik auf dem Raum der W-maße.
Mallows Metrik: Ein Abstandsbegriff für Maße impliziert in natürlicher Weise einen
Abstandsbegriff für Zgn via der Verteilung. Umgekehrt, haben wir einen Abstandsbegriff d
für Zufallsgrößen gegeben, so definieren wir einen (potentiellen) Abstandsbegriff d auf Maßen
durch
d(µ, ν) := inf d(X, Y ).
Hierbei wird das Infimum über alle X mit Verteilung µ und alle Y mit Verteilung ν auf einem
beliebigen W-raum genommen.
Ein Beispiel ist die Mallows Metrik lp : Mp × Mp 7→ IR, 1 ≤ p ≤ ∞,
lp (µ, ν) = inf kX − Y kp
R
auf dem Raum Mp := {µ | |x|p µ(dx) < ∞} der p-fach integrierbaren Maße auf IR. Ohne
Beweis sei angeführt, das Infimum wird angenommen mit
lp (µ, ν) = kFµ−1 (U ) − Fν−1 (U )kp ,
U eine gleichförmig verteilte Zg (siehe [2]).
Satz 62 Der Raum (Mp , lp ), 1 ≤ p ≤ ∞, ist ein vollständiger, metrischer Raum. Er ist
separabel für 1 ≤ p < ∞.
Beweis: • Separabilität.
Sei D eine dichte abzählbare Teilmenge in Lp . Dann ist die Menge aller Verteilungen dazu
dicht in Mp .
• Vollständigkeit.
(U ), U
Für die Vollständigkeit sei µn eine Cauchyfolge in lp -Mallow Metrik. Dann ist Fµ−1
n
−1
gleichförmig verteilt, eine Lp -Cauchyfolge. Diese konvergiert punktweise gegen ein F (U ).
Das zugehörige W-maß µ tut’s.
q.e.d.
Eine Folge Xn ist lp konvergent, falls die Verteilungen in Mallows lp Metrik konvergieren.
lp
Notation: Xn →n X.
Proposition 63 lp Konvergenz ist äquivalent zur schwachen Konvergenz plus Konvergenz
des p-ten absoluten Momentes. (=p-gleichmäßige Integrierbarkeit.)
Beweis: Wir benutzen die Version Fn−1 (U ) = Xn und d(Fn , Fm ) = kFµ−1 (U ) − Fν−1 (U )kp .
Dann verwende den Satz 65.
Bemerkung: Beachte auch die gleichmäßige Integrierbarkeit, Korollar ??.
51
WS10/11
6.2
Maßtheorie
Konvergenz von Zufallsgrößen
Konvergenzen der Verteilungen: Viele Eigenschaften übertragen sich von den Verteilungen nach folgendem allgemeinen Prinzip: Eine Folge, bzw. Familie von Zgn Xn hat die
Eigenschaft ∗, falls die zugehörigen Verteilungen die Eigenschaft ∗ besitzt. In diesem Sinne
sprechen wir von schwacher und vager Konvergenz oder von einer straffen Familie von
Zgn. Wir verwenden dieselben Symbole, z.B.
d
d
Notation: Xn → X ⇔ P Xn → P X .
Konvergenzen der Zgn: Nun zu Konvergenzarten der Zgn selbst. Eine Folge Xn , n ∈ IN,
von Zgn konvergiert stochastisch oder in Wahrscheinlichkeit gegen eine Zg X, falls
lim P (|Xn − X| > ǫ) = 0
n
s
P
für alle ǫ > 0 gilt. Wir schreiben Xn →n X oder Xn →n X. s steht für stochastic und P für
probability.
Diese Konvergenz entspricht Konvergenz bzgl. der Topologie auf den Zgn erzeugt durch
die Metrik
d1 (X, Y ) := inf{ǫ ∈ IR | P (|X − Y | > ǫ) < ǫ}
oder der Metrik
d2 (X, Y ) := E(
|X − Y |
).
1 + |X − Y |
Eine Folge Xn von Zgn konvergiert fast sicher, falls
P (lim Xn = X) = 1
n
gilt.
f.s.
Notation: Xn →n X.
Eine Folge Xn ist Lp konvergent bzw. konvergiert im p-ten Mittel, 1 ≤ p ≤ ∞, gegen X,
Lp
falls kXn − Xkp →n 0. Wir schreiben Xn →n X und sprechen auch von Konvergenz im p-ten
Mittel.
Hier eine Übersicht. p-te Moment steht für Konvergenz des p-ten absoluten Moments.
52
WS10/11
U. Rösler
L∞
❅
❅
❅
❅
❘
❅
Lp , 1 ≤ p < ∞
✻
+ p-te Moment
✠
+ 1-te Moment
fast sicher
■
❅
❅
✲
❄
L1
✛
❅
❅
Version
❅
❅
❅
✒
Version
❅
❅
❅
+ 1-te Moment
❅
❘
❅
✠
stochastisch
✻
✻W-theorie
❄Maßtheorie
Version
❄
schwach
✻
straff
❄
vage
Satz 64
Der Beweis erfogt in einer Reihe von Aussagen.
• Stochastische Konvergenz impliziert schwache Konvergenz.
v
Wir zeigen zuerst Xn → X. Sei f ∈ Cc .
|Ef (Xn ) − Ef (X)| ≤ E(|f (Xn ) − f (X)|(11|Xn −X|≥ǫ + 11|Xn −X|<ǫ ))
≤ 2kf k∞ P (|Xn − X| ≥ ǫ) + sup |f (x) − f (y)|.
|x−y|<ǫ
Der erste Term ist klein für n groß, der zweite ist klein in ǫ, da eine stetige Funktion auf
einem Kompaktum gleichmäßig stetig ist.
Als nächstes zeigen wir Straffheit.
P (|Xn | > c) ≤ P (|Xn | > c, |Xn − X| < ǫ) + P (|Xn | > c, |Xn − X| ≥ ǫ)
≤ P (|X| > c − ǫ) + P (|Xn − X| ≥ ǫ).
Beide Terme sind klein für ǫ, c, n geeignet.
• Fast sichere Konvergenz impliziert stochastische Konvergenz.
P (|Xn − X| > ǫ) ≤ P ({∃N ≥ n : |XN − X| > ǫ}) →n 0.
53
WS10/11
Maßtheorie
• L1 -Konvergenz impliziert stochastische Konvergenz.
Dies folgt aus der Markoff Ungleichung
E|Xn − X|
→n 0.
ǫ
• Lq -Konvergenz impliziert Lp -Konvergenz für 1 ≤ p ≤ q ≤ ∞.
Die Jensen Ungleichung ergibt kY kp ≤ kY kq .
• L∞ -Konvergenz impliziert fast sichere Konvergenz. Einfach.
Gegenbeispiele: Alle Beispiele sind auf dem W-raum ([0, 1], B, λ).
• Schwache Konvergenz impliziert nicht stochastische Konvergenz.
Seien Xn , n ∈ IN, uiv Zgn und keine Konstante. Diese Folge konvergiert schwach. Würde sie
auch stochastisch konvergieren, so würde gelten,
P (|Xn − X| > ǫ) ≤
P (|Xn − Xm | > ǫ) ≤ P (|Xn − X| > ǫ/2) + P (|Xm − X| > ǫ/2) →n,m 0.
Andererseits P (|Xn − Xm | > ǫ) = P (|X1 − X2 | > ǫ) > 0 ist eine strikt positive Konstante für
n 6= m und ǫ hinreichend klein. Widerspruch.
• Stochastische Konvergenz impliziert nicht fast sichere Konvergenz.
X1 = 11[0,1] , X2 = 11[0,1/2] , X3 = 11[1/2,1] , X4 = 11[0,1/4] , X5 = 11[1/4,1/2] , ..., X8 = 1[0,1/8] , ... usw.
Formaler Xn := 11[i/2m ,(i+1)/2m ] mit n = 2m + i, 0 ≤ i < 2m . (Zeichnung machen!). Diese
tut’s.
• Lp -Konvergenz, 1 ≤ p < ∞ impliziert nicht fast sichere Konvergenz.
Siehe oben.
• Fast sichere Konvergenz impliziert nicht Lp -Konvergenz.
Die Folge Xn := an 11[0,1/n] konvergiert fast sicher gegen 0, aber nicht in Lp für geeignet
gewählte an .
• Lp -Konvergenz impliziert nicht Lq -Konvergenz, 1 ≤ p < q ≤ ∞.
P
Wähle eine Folge Xn = ni=1 11( 1 , 1 ] ai mit ai geeignet. Übung.
i+1 i
Nun zu den verbleibenden positive Aussagen mit Zusatzbedingungen.
Version: Eine Version einer Zg ist eine Zg mit derselben Verteilung. Beliebt ist folgende
Konstruktion. Sei U eine Zg mit gleichmäßiger Verteilung auf [0, 1]. Dann ist F −1 (U ) eine
Version von X. Übung.
• Sei Xn schwach konvergent gegen X. Dann existiert eine Version Yn der Xn mit Yn ist
fast sicher konvergent gegen eine Version von X.
Seien Fn , F die zugehörigen Verteilungsfunktionen und U eine gleichmäßig verteilte Zg. Dann
tut’s die Folge Yn = Fn−1 (U ). Die Aussage beruht auf Lemma 56. (F bzw F −1 hat höchstens
abzählbar viele Unstetigkeitspunkte.)
q.e.d.
Bemerkung: Schwache und stochastische Konvergenz stimmen überein für Zgn Xn , die
gegen eine Konstante konvergieren. Auf diskreten W-räumen stimmen stochastische Konvergenz und fast sichere überein.
Teilfolgenprinzip: Jede stochastisch konvergente Folge hat eine fast sicher konvergente
Teilfolge. Der Grenzwert ist derselbe. (Übung)
Den folgenden Satz vergleiche mit dem Korollar ??.
Satz 65 Seien Xn , n ∈ IN , p-integrierbare Zgn, 1 ≤ p < ∞. Xn konvergiert in Lp gegen X
genau dann, wenn Xn stochastisch gegen X konvergiert und kXn kp → kXkp < ∞ gilt.
Lp
s
Xn → X ⇔ Xn → X und kXn kp →n kXkp < ∞.
54
WS10/11
U. Rösler
Beweis: ⇒‘ Lp Konvergenz impliziert stochastische Konvergenz. Die umgekehrte Dreiecksun’
gleichung liefert
|kXn kp − kXkp | ≤ kXn − Xkp →n 0.
⇐‘ Sei A die Menge |Xn − X| > ǫ konvergiert mit n dem Maße nach gegen 0.
’
kXn − Xk ≤ k(Xn − X)11A k + kXn − X11Ac k
≤ kXn 11A k + kX11A k + ǫ
≤ kXn k − kXn 11Ac k + kX11A k + ǫ
≤ kXn k − kX11Ac k + kX11A k + 2ǫ
≤ kXn k − kXk + 2kX11A k + 2ǫ →n 2ǫ →ǫ→0 0
55
WS10/11
56
Maßtheorie
Kapitel 7
Radon-Nikodym Dichte
Ein Maß ν heißt absolut stetig bezüglich µ, falls die µ-Nullmengen auch ν-Nullmengen sind.
Wir sprechen auch von µ dominiert ν dominiert.
Notation: µ << ν.
Für ein Maß µ und eine positive meßbare Funktion f definiere das Maß ν durch
A ∋ A 7→ ν(A) =
Z
f dµ.
A
dν
. Die Funktion f heißt Radon-Nikodym
Wir schreiben ν = f µ oder dν = f dµ oder auch f = dµ
Ableitung oder Radon-Nikodym Dichte von ν bzgl. µ. Das Maß ν ist absolut stetig bzgl. µ.
Quasi die Umkehrung obigen Beispiels ist der Satz von Radon-Nikodym.
Satz 66 (Radon-Nikodym) Seien µ, ν σ-endliche Maße. Dann ist ν absolut stetig bzgl. µ
dν
. Diese ist µ f.s. eindeutig.
äquivalent zur Existenz einer Radon-Nikodym Ableitung f = dµ
Die σ-Endlichkeit ist wichtig, wie das Beispiel ν das Lebesguemaß und µ das Zählmaß zeigt.
Zwei Maße µ, ν heißen singulär zueinander oder orthogonal, falls es eine meßbare Menge
A gibt mit µ(A) = 0 und ν(Ac ) = 0. Notation: µ⊥ν.
Die Orthogonalität ist symmetrisch, die absolute Stetigkeit jedoch nicht.
Satz 67 (Lebesgue) Seien µ, ν σ-endliche Maße. Dann ist ν eindeutig darstellbar als die
Summe eines zu µ absolut stetigen Maßes νc und eines zu µ orthogonalen Maßes ν⊥ .
Die obigen Sätze werden wir für endliche Maße beweisen und dann mit Hilfe der σ-Endlichkeit
standardmäßig ausdehnen. (Dies überschlagen wir.) Zur Wiederholung, ein Maß heißt σendlich, falls es eine gegen Ω aufsteigende Folge (An )n von Mengen endlichen Maßes gibt.
Verwendet wird gerne die äquivalente Bedingung, es gibt eine Partition Bn , n ∈ IN, von Ω in
Mengen endlichen Maßes. Die Äquivalenz ersieht man aus ∪ni=1 Bn = An (bzw. Bn = An \An−1
mit A0 = ∅). Viele Sätze über endliche Maße lassen sich auch für σ-endliche Maße zeigen,
P
indem man µ(·) = n µ(Bn ∩ ·) benutzt oder einen Grenzwert µ(·) = limn µ(An ∩ ·) benutzt.
7.1
Hahn-Jordan Zerlegung∗
Lemma 68 Sei λ die Differenz µ − ν zweier endlicher Maße. Dann gibt es zueinander orthogonale endliche Maße λ+ , λ− mit λ = λ+ − λ− . Die Zerlegung ist eindeutig.
57
WS10/11
Maßtheorie
S
S
Ferner gibt es eine µ + ν eindeutige Partition A+ ◦ A0 ◦ A− = Ω so dass für alle A,die
keine (µ + ν)-Nullmengen sind, gilt
λ(A) =


 >0
falls
=0

 <0
A ∈ A+
A ∈ A0
A ∈ A−
Beweis: Das Supremum α aller Werte λ(A), A ∈ A, ist endlich. Sei An ∈ A eine Folge
P
meßbarer Ereignisse mit λ(An ) ≥ α − ǫn und n ǫn < ∞. Setze A := lim inf n An = ∪m ∩n≥m
An . Dann tun’s λ+ , λ− als Einschränkungen von λ auf A bzw. Ac .
M := T
Die Folge Bm
m≤n≤M An , m ≤ M ∈ IN, ist monoton fallend in M bei festem m
∞ und diese ist monoton steigend in m gegen A.
gegen eine Menge Bm
M ) ≥ α − PM
• λ(Bm
n=m ǫn für alle m, M ∈ IN.
Dies ergibt sich durch Induktion nach M für festes m. Der Induktionsanfang ist trivial.
Der wesentliche Induktionsschritt folgt aus
λ(B ∩ C) = λ(B) + λ(C) − λ(B ∪ C) ≥ λ(B) + λ(C) − α.
Der Rest ist standard.
∞) ≥ α − P
• λ(Bm
n≥m ǫn .
Verwende den Satz über monotone Konvergenz.
• λ(A) = α
Verwende erneut monotone Konvergenz.
• λ(B) ≤ 0 für alle B ⊂ Ac und λ(C) ≥ 0 für alle C ⊂ A.
S
Ansonsten wäre λ(A ◦ B) > α oder λ(A\C) > α
• λ+ ≤ µ, λ− ≤ ν.
Einfach.
• Eindeutigkeit. Einfach, wird überschlagen.
Sei M = {A ∈ A | λ(A) = α} und β = supA∈M (µ + ν)(A).
• M ist abgeschlossen bzgl. Infimum und Supremum.
Folgt aus
λ(B ∩ C) + λ(B ∪ C) = λ(B) + λ(C)
und der Definition von α.
• β wird angenommen durch ein µ + ν eindeutiges bestimmtes Ω+ ∈ M.
Nehme Folge An ∈ M mit absteigendem µ+ν-Maß. OEdA können wir An selbst absteigend
wählen. Der Grenzwert Ω+ tut es.
• Für A ⊂ Ω+ keine (µ + ν)-Nullmenge gilt λ(A) > 0.
Leicht.
Definiere Ω− entsprechend für ν − µ und Ω0 := Ωc+ ∩ Ωc− . Ω+ , Ω0 , Ω− ist eine meßbare
Partition und es gelten die obigen Aussagen. Die Zerlegung ist eindeutig.
q.e.d.
Def: Die obige Zerlegung des signierten Maßes λ bzw. des Grundraumes heißt HahnJordan Zerlegung .
Lemma 69 Seien µ, ν σ-endliche Maße. Dann gibt es eine µ-fast sicher größte, positive,
meßbare Funktion f mit f µ ≤ ν punktweise. Diese ist µ-fast sicher eindeutig.
58
WS10/11
U. Rösler
Beweis: Wir zeigen das Lemma für µ, ν endliche Maße. Betrachte
F := {f : Ω → IR+ | meßbar, f µ ≤ ν}
R
und α := supf ∈F f dµ. F versehen mit der punktweisen Ordnung und dem punktweisen
Infimum, Supremum ist ein Verband. Der wichtige Punkt ist: f, g ∈ F impliziert f ∨ g ∈ F.
Dies folgt aus, B = {f < g}, A ∈ A
Z
A
f ∨ g dµ =
Z
gdµ +
A∩B
Z
A∩B c
f dµ ≤ ν(A ∩ B) + ν(A ∩ B c ) = ν(A)
• α wird für ein f ∈ F angenommen.
R
Die Menge F ist nicht leer. Sei fn ∈ F eine Folge mit fn dν → α. OEdA sei fn aufsteigend.
(Gehe über zur Folge ∨i≤n fi ∈ F .) Der aufsteigende Grenzwert f der Folge tut’s. Er ist aus
F (Satz von der monotonen Konvergenz)
R
R
Z
f dµ = lim
A
n
Z
A
fn dµ ≤ ν(A)
und A f dµ = limn A fn dµ = α.
R
R
• f ist größte. Waere g ∈ F. So folgt α ≥ f ∨ gdµ ≥ f d mu = α und damit 0 ≤
g ∨ f − f ≤ 0 f.s.
Die Eindeutigkeit folgt aus demselben Grunde.
q.e.d.
Beweis des Lebesgue Satzes: Seien µ, ν endlich und f die maximale Funktion mit
f µ ≤ ν. Dann tun’s νc = f µ und ν⊥ = ν − νc .
Beides sind Maße und νc ist absolut stetig bzgl. µ. Zu zeigen verbleibt ν⊥ ⊥µ.
Betrachte λt := ν⊥ − tµ, Ql ∋ t > 0, und sei Ωt der strikte Positivteil aus der Hahn-Jordan
Zerlegung von λt .
• Die Abbildung Ql> ∋ t 7→ Ωt ist (µ + ν⊥ )-f.s. antiton.
Es reicht zu zeigen s < t ⇒ Ωs ⊃ Ωt µ + ν⊥ f.s.
Die Menge A = Ωt \Ωs erfüllt λs (A) ≥ λt (A). Wäre A keine (µ + ν⊥ )-Nullmenge, so gilt
λt (A) > 0. Dies wäre ein ist ein Widerspruch zur λs -Maximalität von Ωs .
• µ(Ωt ) = 0 für t > 0.
Auf Ωt gilt ν⊥ ≥ tµ und damit ν⊥ ≥ gµ mit g = t11Ωt . Wäre µ(Ωt ) > 0 so wäre ν ≥ (f +g)µ
im Widerspruch zur Maximalität von f.
• ν⊥ (Ωc0 ) = 0
ν⊥ (Ω0 ) = limt→0 ν⊥ (Ωt ) = limt λt (Ω) = λ(Ω) = ν⊥ (Ω)
• Eindeutigkeit
Sei ν = ν1 + ν2 eine weitere Zerlegung, ν1 << µ, ν2 ⊥µ. Auf der µ-Nullmenge Ω0 wie oben
stimmen die beiden Maße ν⊥ und ν2 überein. Auf der Menge Ωc0 gilt ν1 + ν2 = ν = νc << µ.
Folglich ν2 orthogonal und absolut stetig bzgl. µ auf dieser Menge und damit identisch 0.
Damit sind auch νc und ν1 gleich.
Die Ausdehnung von endlichen Maßen auf σ-endliche ist Standard.
q.e.d.
Beweis Radon-Nikodym: Benutze die Lebesgue Zerlegung νc = f µ wie oben. ν⊥ ist
gleichzeitig orthogonal und absolut stetig bzgl. µ. Dies bedeutet ν⊥ ist identisch 0.
Die Umkehrung ist offensichtlich. Anwendung: Mit Hilfe der Radon-Nikodym Dichte
dµ
dν
läßt sich unsere Beweisführung besser verstehen. Seien f = dm
, g = dm
die Radon-Nikodym
Ableitungen zum Referenzmaß m = µ + ν. Dann hat λ = µ − ν die Darstellung λ = f m − gm.
f − g heißt auch Radon-Nikodym Dichte von λ zum Referenzmaß m. Dann sind Ω+ , Ω0 , Ω−
die Mengen f − g strikt größer 0, gleich 0 und strikt kleiner 0.
59
WS10/11
Maßtheorie
Korollar 70 (Radon-Nikodym Bijektion) Sei µ ein σ-endliches Maß. Es gibt eine Bijektion zwischen den endlichen, absolut stetigen Maßen ν bezüglich µ und den Äquivalenzklassen
µ-integrierbarer positiver Funktionen f . Diese Bijektion kann gegeben werden durch die Zuordnung eines Maßes zu der Äquivalenzklasse der Radon-Nikodym Dichte,
[f ] 7→ f µ
Dies ist eine direkte Folgerung aus dem Satz von Radon-Nikodym.
Ein Vektorraumverband ist ein Objekt (V, +, ·, ≤) mit (V, +, ·) ein reeller Vektorraum,
(V, ≤) ein Verband und die algebraische und die Ordnungsstruktur sind verträglich (d.h.
(ax − z) ∨ (ay − z) = a(x ∨ y) und (ax − z) ∧ (ay − z) = a(x ∧ y) für alle x, y, z ∈ V, a ∈ IR+ ).
Folgerung: Sei m ein Maß und V der Raum der m-integrierbaren Funktionen. Dies ist ein
Vektorraumverband. Sei L(m) der Raum der Ladungsverteilungen µ − ν mit µ + ν << m. Die
Abbildung V ∋ f → f m ∈ L(m) ist ein Vektorraumverbandsisomorphismus. Das Supremum
auf M (m) ist definiert durch
λ ∧ ρ = (f ∧ g)m
λ ∨ ρ = (f ∨ g)µ
mit den Radon-Nikodym Ableitungen f, g von λ, ρ bzgl. m.
Ladungsverteilung: Sei M die Menge aller endlichen Maße auf einem meßbaren Raum
(Ω, A). Die Menge
L = M − M = {µ − ν | µ, ν ∈ M }
der Differenzen endlicher Maße heißt Vektorraum der signierten Maße bzw. der Ladungsverteilungen.. Elemente daraus heißen signiertes Maß oder Ladungsverteilung. L ist ein Vektorraumverband. Die Ordnung ist die punktweise Ordnung und das Infimum, Supremum wird
gegeben durch
(ρ ∧ λ)(A) = inf (ρ(B) + λ(A\B))
(ρ ∨ λ)(A) = sup (ρ(B) + λ(A\B))
B⊂A
B⊂A
(Direktes Nachrechnnen oder leichter mit Hilfe der Radon-Nikodym Ableitung.)
Auf dem Raum der Ladungsverteilungen ist die Abbildung k · ktot : V → IR
kλktot := sup (λ(A) − λ(B)).
(7.1)
A,B∈A
eine Norm, ganannt die Totalvariationsnorm. Für ein signiertes Mass λ = µ − µ berechnet
sich diese zu
Z
kλktot =
|f − g|d(µ + µ) = kλ+ ktot + kλ− ktot
mit f, g die Radon-Nikodym Ableitungen von µ, ν bzgl. m = µ + ν. Die Ladungsverteilung λ
eingeschränkt auf Ω+ ist das Maß λ+ = µ − µ ∧ ν bzw. (f − g)+ m.
Bem: Ladungsverteilungen werden manchmal auch eingeführt als Abbildungen λ von
einer σ-Algebra A in die erweiterten reellen Zahlen, die σ-stetig ist. (D.h. für jede aufsteigende
(absteigende) Folge An ∈ A gilt λ(An ) → λ(A).) Hat λ endliche Totalvariationsnorm (7.1) so
ist λ eine Differenz endlicher Maße.
60
WS10/11
7.1.1
U. Rösler
Satz von Fischer-Riesz∗
Sei L∗p (µ) der Raum der stetigen und linearen Abbildungen von Lp in die reellen Zahlen.
Satz 71 (Fischer-Riesz) Sei µ ein σ-endliches Maß. Dann ist L∗p (µ) isometrisch zu Lq (µ)
mit p1 + 1q = 1, 1 < p, q < ∞. Genauer, für jede Abbildung B ∈ L∗p (µ) gibt es ein g ∈ Lq (µ)
R
mit B(f ) = f gdµ und kBk = kgkq .
Beweis: Sei zuerst µ endlich. Die Abbildung λ : A → IR definiert durch λ(A) = B(11A ) hat
eine endliche Totalvariationsnorm,
kλktot := sup (λ(A) − λ(Ac )) ≤ sup(kBkk11A kp + kBkk11Ac kp ) ≤ kBk2µ(Ω) < ∞.
A∈A
A
Die Operatornorm kBk von B ist endlich wegen der Stetigkeit des Operators. Damit ist λ ein
signiertes Maß. Sei λ = λ+ − λ− die Hahn-Jordan Zerlegung. λ+ und λ− sind absolut stetig
relativ zu µ. (Nachrechnen.) Die Funktion
g=
dλ+ dλ−
−
dµ
dµ
tut’s. R
• gf dµ = B(f ) für alle beschränkten f ∈ Lp
Zeige dies erst für eine Treppe, dann für eine positive Treppenfunktion (Linearität), dann
durch Approximation für positive beschränkte f ∈ Lp (σ-Stetigkeit von unten) und schließlich
für beschränkte f ∈ Lp .
• Die Lq -Norm von g ist beschränkt durch die Operatornorm kBk von B.
q
Sei fN := |g|g 11|g|≤N . Dies ist eine beschränkte Funktion, daher in Lp , und es gilt
|kfN kpp | =
Z
|B(fN )| = |
∞ > kBk ≤
Z
|g|q 11|g|≤N dµ
fN gdµ| =
Z
|g|q 11|g|≤N dµ = kg11|g|≤N kqq
|B(fN )|
= kg11|g|≤N kqq−q/p → kgkq
kfN kp
R
• gf dµ = B(f ) für alle f ∈ Lp .
R
R
Die Ausdehnung erfolgt (durch σ-Stetigkeit) auf alle f ∈ Lp da | f gdµ| ≤ |f g|dµ ≤
kf kp kgkq endlich ist.
• kBk ≤ |gkq .
kBk = sup
L∗p
f 6≡0
kf gk1
|B(f )|
≤ sup
≤ kgkq .
kf kp
kf kp
f
• Die Abbildung
∋ B 7→ g ∈ Lq ist wohldefiniert, injektiv und surjektiv.
Leicht.
• OEdA sei µ ein endliches Maß.
Sei An ∈ A, n ∈ IN, eine disjunkte Zerlegung mit µ(An ) < ∞. Sei B ∈ L∗p und fn ∈ Lq
P
die zugehörige Darstellung, eingeschränkt auf die Menge An . Dann tut es f := ∞
n=1 fn 11An .
q.e.d.
61
WS10/11
Maßtheorie
Spezialisierung auf IR : Jedem Radonmaß µ (µ(K) < ∞ für Kompakta K) hatten
wir bijektiv eine aufsteigende und rechtsstetige Funktion F mit F (0) = 0 zugeordnet via
µ((a, b]) = F (b) − F (a). Wir behandeln das Äquivalent für Ladungsverteilungen.
P
Eine Funktion F : IR 7→ IR heißt absolut stetig, falls sup i |F (ti+1 − F (ti )| < ∞ gilt.
Hierbei ist das Supremum über alle Zerlegungen t0 < t1 < . . . < tn genommen.
Proposition 72 Es gibt eine Bijektion zwischen Ladungsverteilungen λ und rechtsstetigen,
absolut stetigen Funktionen F mit F (0) = 0. Diese Bijektion kann durch
λ((a, b]) = F (b) − F (a)
(7.2)
gegeben werden.
Beweis: ⇒ Seien F + , F − die entsprechenden Funktionen für λ+ , λ− . Dann ist die Zuordnung
λ = λ+ − λ− 7→ F + − F − = F
eindeutig.
⇐ Umgekehrt für gegebenes F definiere F via
F (b) := sup
X
i
|F (ti+1 − F (ti )|
Das Supremum ist über alle Zerlegungen 0 = t0 < t< . . . < tn = b bzw. b = t0 < t1 < . . . <
tn = 0. Die Funktion F ist rechtstetig und aufsteigend. Die Funktionen F + := F +F
und
2
F − := F −F
sind aufsteigend und rechtsstetig und erfüllen F = F + − F − . Seien λ+ , λ− die
2
zugehörigen Maße. Wir erhalten die Zuordnung
F = F + − F − → λ+ − λ− =: λ
von Funktionen in Ladungsverteilungen.
7.1.2
q.e.d.
Totalstetig ∗
Ein Maß ν heißt totalstetig bzgl. µ, falls
∀ǫ > 0 ∃δ > 0
∀A ∈ A
µ(A) < δ ⇒ ν(A) < ǫ.
Proposition 73 Ist ν totalstetig bzgl. µ, so ist ν absolut stetig bzgl. µ. Die Umkehrung gilt
für endliche Maße ν.
Beweis: Nur die Umkehrung ist zu zeigen. Sei ν nicht totalstetig bzgl. µ. Dann gibt es ein
P
ǫ > 0 und eine Folge An ∈ A mit ν(An ) > ǫ und µ(An ) →n 0. Wir können n µ(An ) < ∞
annehmen. Die Eigenschaften der Menge A := lim supn An ergeben nun einen Widerspruch.
• ν(A) ≥ ǫ.
S
T
Beachte A = m Bm und Bm := i≥m Ai fällt monoton gegen A. Mit Fatou ν(A) =
ν(limm Bm ) ≥ limm ν(Bm ) ≥ limm ǫ = ǫ.
• µ(A) = 0.
P
q.e.d.
µ(A) = limm µ(Bm ) ≤ limm n≥m µ(An ) = 0.
62
WS10/11
7.2
U. Rösler
Bedingte Erwartungen
Die bedingte W-keit einer Menge A unter B ist P (A | B) = P P(A∩B)
(B) für P (B) > 0. Wie groß
ist die W-keit von A, gegeben die Information ω ∈ B oder nicht. Dies wird beschrieben durch
die Funktion
f = 11B P (A | B) + 11B c P (A | B c )
von Ω → IR. Nehmen wir eine meßbare Partition (Bn )n des Grundraumes, so ergibt sich eine
meßbare Funktion
X
f=
11Bn P (A | Bn )
n
Diese erfüllt
Z
f dP =
B
Z
B
11A dP
für alle B ∈ σ(Bn , n ∈ IN ). Die Interpretation von f ist als die W-keit von A gegeben die
Information der σ-Algebra σ(Bn , n ∈ IN ).
Jetzt die Verallgemeinerung auf allgemeine σ-Algebren. Sei (Ω, A, µ) ein Maßraum und
A0 ⊂ A eine Unter-σ-Algebra. Eine A0 − B meßbare Funktion g : Ω 7→ IR heißt bedingte
Erwartung von f unter A0 , falls gilt
Z
f dµ =
A0
Z
g dµ
(7.3)
A0
für alle A0 ∈ A0 und beide Seiten sind wohldefiniert im Lebesgueschen Sinne.
Notation: E(f | A0 ) oder E A0 (f ).
Satz 74 (Existenz der bedingten Erwartung) Sei A0 ⊂ A eine Unter-σ-Algebra von
A0 und µ ein σ-endliches Maß. Dann existiert die bedingte Erwartung für positive, erweiterte
und meßbare Funktionen f : Ω → IR+ . Sie ist µ fast sicher eindeutig.
Beweis: OEdA sei µ ein endliches Maß. Betrachte für positives und integrierbares f das
endliche Maß ν := f · µ. Seien ν0 , µ0 die Einschränkungen der Maße ν, µ auf (Ω, A0 ). Es gilt
dν0
. Sei erfüllt die definierende
ν0 << µ0 . Dann tut’s die Radon-Nikodym Dichte 70 g = dµ
0
Eigenschaft der bedingten Erwartung
Z
g dµ =
A0
Z
A0
g dµ0 =
Z
A0
dν0 =
Z
dν =
A0
Z
f dµ
A0
Sei jetzt f positiv, erweitert und meßbar. Dann gibt es eine Folge von positiven integrierbaren Funktionen fn , n ∈ IN , die monoton aufsteigend sind gegen f. Dann tut’
E(f | A0 ) = lim E(fn | A0 ).
n→∞
• Wohldefiniertheit.
Da die fn punktweise aufsteigend in n sind, können wir Funktionen E(fn | A0 ) punktweise
aufsteigend in n wählen. (Z.B. wähle erst bedingte Erwartungen E(fn | A0 ) und verwende
dann ∨i≤n E(fi | A0 ) als bedingte Erwartung von fn .)
Der Rest ist nachrechnen.
Z
A0
E(f | A0 )dµ = lim
n
Z
A0
E(fn | A0 )dµ = lim
n
63
Z
fn dµ =
Z
f dµ
WS10/11
Maßtheorie
• Eindeutigkeit
R
Seien g, h bedingte Erwartungen von f und A0 die Menge g > h. Es gilt A0 (g − h)dµ =
R
q.e.d.
A0 (f − f )dµ = 0 und damit µ(A0 ) = 0. Mit Symmetrie foglt g = h.
Die Definition für positive Funktionen erweitern wir zu allgemeinen meßbaren Funktionen.
f hat eine eindeutige Darstellung f = f+ − f− als Differenz des Positivteils f+ = f ∨ 0 und
des Negativteils f− = (−f ) ∨ 0. Setze
E(f | A0 ) = E(f+ | A0 ) − E(f− | A0 )
sofern die rechte Seite f.s. wohldefiniert ist. (Wir muessen ∞ − ∞ vermeiden.)
Satz 75 (Existenz der bedingten Erwartung 2) Sei A0 ⊂ A eine Unter-σ-Algebra von
A und µ ein σ-endliches Maß. Dann existiert die bedingte Erwartung auf L1 (A) und ist eine
positive, additive, skalare, σ-stetige Abbildung von L1 (A) nach L1 (A0 ).
Beweis: Die Aussagen sind leicht bis auf die letzte, die aus dem nächsten Satz folgt. q.e.d.
Mit der bedingten Erwartung können wir umgehen wie mit dem Lebesgueintegral. Insbesonders gelten die Konvergenzsätze und die Standardungleichungen.
Satz 76 Es gelten die drei Konvergenzsätze und die Jensen Ungleichung jeweils µ fast sicher:
• MonotoneR Konvergenz:
fn րn f, R f1 dµ > −∞ ⇒ E(fn | A0 ) րn E(f | A0 )
fn ցn f, f1 dµ < ∞ ⇒ E(fn | A0 ) ցn E(f | A0 )
• Fatou:
R
inf n fn > −∞ ⇒ lim inf n E(fn | A0 ) ≥ E(lim inf n fn | A0 )
R
supn fn < ∞ ⇒ lim supn E(fn | A0 ) ≤ E(lim supn fn | A0 )
• Dominierte Konvergenz:
fn →n f, supn |fn | ∈ L1 ⇒ E(fn | A0 ) →n E(f | A0 )
• Jensen Ungleichung: Für eine konvexe Funktion ϕ und ein W-maß µ gilt, sofern
wohldefiniert,
E(ϕ(f ) | A0 ) ≥ ϕ(E(f | A0 ))
Wir überschlagen den Beweis, der analog zum Lebesgueintegral verläuft.
Hier noch einige häufig benutzte Eigenschaften.
Lemma 77 Sei alles wohldefiniert. Die folgenden Aussagen gelten alle µ-fast sicher.
• |E(f | A0 )| ≤ E(|f | | A0 )
• E(f h | A0 ) = hE(f | A0 ) für A0 -meßbare Funktionen h.
• Towerproperty: Für A0 ⊂ A1 ⊂ A Unter-σ-Algebren gilt
E(E(f | A0 ) | A1 ) = E(f | A0 ) = E(E(f | A1 ) | A0 )
• supn E(fn | A0 ) ≤ E(supn fn | A0 )
64
WS10/11
U. Rösler
Beweis: Standard.
Beachte, die bedingten Erwartungen sind nur µ-fast sicher definiert und sind, mathematisch gesehen, eher Äquivalenzklassen bzgl. µ-Nullmengen. Wir rechnen damit allerdings wie
mit Funktionen, die nichts anderes als Repräsentanten der Äquivalenzklasse sind. Im Folgenden unterscheiden wir (einfachheitshalber) nicht zwischen Funktionen und Äquivalenzklassen
(falls nicht notwendig).
Korollar 78 (Eigenschaften der bedingten Erwartung) Unter den Voraussetzungen des
obigen Satzes ist die bedingte Erwartung ein linearer, positiver, projektiver, stetiger und σstetiger Vektorraumhomomorphismus, der die 1 auf die 1 abgebildet.
Beweis: Nach dem obigen Satz ist die bedingte Erwartung wohldefiniert. Die Eigenschaften
werden nachgerechnet. (Eine Projektion ist eine idempotente, lineare Abbildung auf einem
Vektorraum in sich selbst.)
q.e.d.
R
Bsp: Sei A0 die triviale σ-Algebra {∅, Ω}. Dann gilt E(f | A0 ) = f dµ.
Bsp: Sei A0 eine Unter-σ-Algebra erzeugt von einer abzählbaren, meßbaren Partition
Bn , n ∈ IN, mit 0 < µ(Bn ) < ∞. Dann ist die bedingte Erwartung
E(f | A0 ) =
X
11Bn
n
R
f dµ
µ(Bn )
Bn
Bsp: Gruppenmittelwert Sei G eine endliche Gruppe von meßbaren, maßerhaltenden
Abbildungen g : Ω 7→ Ω, d.h. µg −1 = µ. Sei A0 die σ-Algebra aller G-invarianter Ereignisse,
A0 = {B ∈ A | ∀g ∈ G : g −1 (B) = B}. Dann gilt für f ≥ 0
E(f | A0 ) =
1 X
f ◦ g.
|G| g∈G
Beweis: Benutze eine Variablentransformation um
ist leicht.
R
B
f dµ =
R
B
f ◦ gdµ zu zeigen. Der Rest
q.e.d.
Korollar 79 Sei µ ein W-maß. Die bedingte Erwartung E(· | A0 ) : Lp (A) → Lp (A0 ), 1 ≤
p ≤ ∞ ist ein linearer, positiver, σ-stetiger Operator mit Operatornorm 1. Die Fixpunkte der
bedingten Erwartung sind die A0 -meßbaren und p-integrierbaren Funktionen.
Beweis: Für 1 ≤ p < ∞ verwende die Jensen-Ungleichung für IR+ ∋ x 7→ xp ,
Z
p
|E(f | A0 )| dµ ≤
Z
|E(|f |p | A0 )dµ = kf kpp .
Analog für p = ∞,
esssup |E(f | A0 )| ≤ esssup E(|f | | A0 )| ≤ esssup |f |.
Der Rest ist Übung.
Folgerung: Die bedingte Erwartung ist eine stetige Funktion auf Lp .
65
WS10/11
Lemma 80 Seien 1 ≤ p, q ≤ ∞ dual,
1
p
+
1
q
Maßtheorie
= 1. Dann definiert
Lp (A) × Lq (A) ∋ (f, g) 7→ E(f g | A0 ) ∈ L1 (A0 )
eine Bilinearform. Es gilt die bedingte Hölder Ungleichung
E(|f g| | A0 ) ≤ (E(|f |p | A0 ))1/p (E(|g|q | A0 ))1/q .
Beweis: Der bedingte Erwartungswert als Operator ist wohldefiniert, da
Z
Z
|E(f g | A0 )| ≤
E(|f g| | A0 ) = kf gk1 ≤ kf kp kgkq < ∞.
Der Operator ist bilinear.
Sei zur Abkürzung X = (E(|f |p | A0 ))1/p und Y = (E(|g|q | A0 ))1/q . Es reicht zu zeigen
f g
E(| X
Y | | A0 ) ≤ 1 auf jeder Menge A0 ∈ A0 .
Z
f g
| | A0 ) dµ ≤
E(|
XY
A0
≤
Z
|f | |g|
11A0
dµ ≤
X Y
Z
A0
Z
E(|f |p | A0 )
dµ
Xp
= µ(A0 )
1/p+1/q
11A0 |f |p
dµ
Xp
1/p Z
A0
1/p Z
11A0 |g|q
dµ
Yq
E(|g|q | A0 )
dµ
Yq
1/q
1/q
= µ(A0 )
Alternative Einführung der bedingten Erwartung über Hilberträume.
Eine Projektion auf einem Hilbertraum H ist eine lineare Abbildung A : H 7→ H mit A ◦ A =
A. Eine orthogonale Projektion ist eine selbstadjungierte (A = A∗ ) Projektion. Orthogonale
N
Projektionen gestatten die Hilbertraumorthogonalzerlegung H = H0 H0⊥ mit H0 = AH
und H0⊥ der Orthogonalraum. Dieses setzen wir als bekannt voraus.
Lemma 81 Es gibt genau eine surjektive orthogonale Projektion H 7→ H0 .
Beweis: Für f ∈ H betrachte die Abbildung Tf : H0 → IR definiert durch Tf (h) =< f, h > .
Die Abbildung Tf eingeschränkt auf H0 ist aus dem stetigen Dualraum H0∗ von H0 . Da H0
selbstdual ist, siehe Satz von Riesz, gibt es genau eine Funktion g ∈ H0 mit < f, h >=< g, h >
für alle h ∈ H0 . Definiere die Abbildung A : H → H0 durch A(f ) = g. A tut’s.
A ist wohldefiniert. Der Bildraum ist H0 , da A auf H0 die Identität ist. Hieraus folgt die
Surjektivität und dann die Projektionseigenschaft. Die Orthogonalität rechnen wir nach,
< A∗ f, f >=< f, Af >=< Af, Af >=< Af, f >
für alle f, f ∈ H.
q.e.d.
In
unserem
Fall
sei
der
Hilbert
Raum
H
=
L
(A)
versehen
mit
der
Bilinearform
<
f,
g >=
2
R
f gdµ. Für eine Unter-σ-Algebra A0 ist H0 := L2 (A0 ) ⊂ H ein Unterhilbertraum. Dann ist
die orthogonale Projektion A auf H0 die bedingte Erwartung. Es verbleibt nachzurechnen in
Hilbertraumnotation
< A(f ), 11A0 >=< f, 11A0 >
für alle A0 ∈ A0 . Dies ist erfüllt.
Der Definitionsbereich von A kann dann auf positive Funktionen und auf Lp Funktionen
ausgedehnt werden.
66
WS10/11
U. Rösler
Umgekehrt, die bedingte Erwartung wie vormals definiert, liefert auf dem Hilbertraum
die eindeutige surjektive orthogonale Projektion nach H0 . Die Surjektivität und Projektionseigenschaft ergibt sich durch E(f | A0 ) = f für f ∈ H0 . Die Orthogonalität folgt aus
Z
E(f | A0 )gdµ =
Z
f gdµ =
Z
f E(g | A0 )dµ
erst für eine Treppe g = 11A , dann eine Treppenfunktion und mit σ-Stetigkeit für g aus dem
Hilbertraum H.
7.2.1
Faktorisierung
Seien f : Ω → Ω′ und g : Ω → Ω′′ meßbare Funktionen. f heißt g-meßbar, falls f meßbar ist
bezüglich der von g erzeugten σ-Algebra über Ω. In Formeln, falls f −1 (A′ ) ⊂ g −1 (A′′ ).
Hintergrund ist das
Lemma 82 (Faktorisierungslemma) Seien f : Ω → Ω′ und g : Ω → Ω′′ meßbare Funktionen. Die σ-Algebren A′ , A′′ seien abzählbar erzeugt. Dann gilt
f ist g meßbar ⇔ ∃h : Ω′′ 7→ Ω′ meßbar mit f = h ◦ g.
Beweis: Die Rueckrichtung folgt aus f −1 (A′ ) = g −1 (h−1 (A′ )) ⊂ g −1 (A′′ ).
Für die Hinrichtung betrachte zuerst einen Grundraum Ω′ ⊂ IR in den reellen Zahlen. Für
eine g-meßbare Treppenfunktion f gilt der Satz. Ein allgemeines g-meßbares f approximiere
von unten durch Treppenfunktionen fn . Das zugehörige hn ist monoton steigend gegen ein h.
Dies tut’s.
Die Ausdehnung auf allgemeinere W-Räume ergibt sich aus folgendem Lemma.
q.e.d.
Lemma 83 Jede abzählbar erzeugte σ-Algebra A besitzt einen abzählbaren, isotonen Erzeuger.
Ist A abzählbar erzeugt so gibt es eine Menge C in den rellen Zahlen versehen mit der
induzierten Borel σ−Algebra B ∩ C, so dass A isomorph (bijektiv und strukturerhaltend) ist
zu B ∩ C. Ist A punktetrennend (∀ω1 6= ω2 ∈ Ω∃A ∈ A : ω1 ∈ A, ω2 6∈ A) so gibt es eine
Bijektion ϕ : Ω → C die bimeßbar (ϕ and ϕ−1 sind meßbar) ist.
Bew: Nehme zuerst an, A sei punktetrennend.
Sei En ∈ A, n ∈ IN ein abzählbares Erzeugendensystem der σ-Algebra A. Definiere die
Abbildung ϕ1 : Ω → {0, 1}IN ,
ϕ1 (ω)(i) := 11Ei (ω)
und definiere ϕ2 : {0, 1}IN 7→ [0, 1] via
ϕ2 ((x1 , x2 , . . .)) =
∞
X
2xi 3−i .
i=1
Sei ϕ := ϕ2 ◦ ϕ1 . Die Mengen Aq := ϕ−1 (Bq ), Bq = (−∞, q]), q ∈ Ql tun’s.
Die Abbildung ϕ ist injektiv, da ϕ1 , ϕ2 injektiv sind. Sei C das Bild von ϕ und definiere
die σ-Algebra C auf C durch C = ϕ(A). Da ϕ : Ω → C eine bijektive Abbildung ist, liefert ϕ
auch eine Bijektion der σ-Algebren.
• Jeder Erzeuger von A wird unter ϕ auf einen Erzeuger von C abgebildet und umgekehrt.
67
WS10/11
Maßtheorie
Sei E ′ ein Erzeuger von A und A′ stets σ-Algebren. Dann gilt
ϕ(A) = ϕ(∩E ′ ⊂A′ A′ ) = ∩ϕ(E ′ )⊂ϕ(A′ ) ϕ(A′ ) = σ(E ′ ) = C
• C = B ∩ C mit B die Borel σ-Algebra.
C wird erzeugt durch die ϕ(En ) = Fn ∩C, n ∈ IN, mit Fn = {y ∈ IR | yn = 2 in der Trialdarstellung y =
P
−i
i∈IN yi 3 }. Die Borelsche σ-Algebra wird von allen Fn , n ∈ IN erzeugt. Damit gilt C =
σ(Fn ∩ C, n ∈ IN ) = σ(Fn , n ∈ IN ) ∩ C = B ∩ C.
Die Mengen Bq , q ∈ Ql bilden einen Erzeuger der Borelschen σ-Algebra und Bq ∩ C, q ∈ Ql
einen Erzeuger von C. Daher sind die Urbilder Aq , q ∈ Ql ein Erzeuger von A.
Ist A nicht punktetrennend, so betrachte die Äquivalenzrelation ∼ auf Ω
ω ∼ ω ′ ⇔6 ∃A ∈ A : ω ∈ A, ω ′ 6∈ A.
Gehe über zu dem Raum Ω∼ der Äquivalenzklassen [ω], nehme hierauf die σ-Algebra A∼
der Mengen [A], A ∈ A. Diese ist isomorph zu A. Mit entsprechender Notation ist ϕ∼ eine
Bijektion von Ω∼ auf ein C ⊂ IR. Diese ist eine Isomorphie der σ-Algebren.
q.e.d.
Bem: Die obige Menge C ⊂ IR kann auch nicht meßbar sein! Wichtig bei dieser Betrachtung ist die Isomorphie der σ-Algebren.
Bem: Zwei meßbare Räume (Ωi , Ai ), i ∈ {1, 2}, heißen isomorph zueinander, falls es eine
bijektive, meßbare Abbildung ϕ : Ω1 → Ω2 gibt, deren Inverse meßbar ist. Ein meßbarer
Raum heißt Standard-Borel, falls er isomorph ist zu einer Borelmenge in IR versehen mit
der induzierten Borel σ-Algebra. Zwei Maßräume (Ωi , Ai , µi ), i ∈ {1, 2}, heißen isomorph
zueinander, falls es eine bijektive, meßbare Abbildung ϕ : Ω1 → Ω2 gibt, die das Maß erhält
(µ2 = µ1 ϕ−1 ) und deren Inverse meßbar ist. In der W-theorie spielen Standard-Borelw-räume
eine besondere Rolle, siehe z.B. bedingte W-keiten. Dies umfaßt z.B. alle polnischen Räume.
Sei jetzt (Ω, A, µ) ein Maßraum. In der bedingten Erwartung notieren wir die Teil-σAlgebra A0 durch deren Charakterisierung wie z.B. durch ein Erzeugendensystem oder auch
Funktionen.
Notation: E(f | E) oder E(f | X) für E(f | A0 ) wobei A0 = σ(E) oder σ(X) gesetzt ist.
(σ(X) ist die kleinste σ-Algebra, bezüglich der die Funktion X meßbar ist.)
Sei X : Ω → IR, f ∈ F + meßbar und E(f | X) eine Version (Repräsentant) der bedingten
Erwartung und damit eine feste σ(X) − B-meßbare Funktion Ω → R. Nach dem Faktorisierungslemma gibt es eine reelle Funktion h mit E(f | X) = h ◦ X. Wir benutzen E(f | X = x)
für die Abbildung h(x) = E(f | X) ◦ X −1 (x).
Sprache: E(f | X = x) heißt bedingte Erwartung von f (bedingt) unter X = x.
Beachte, in der Regel ist {X = x} eine Nullmenge. Die obige Funktion h ist µX fast sicher
wohldefiniert. Mit der bedingten Erwartung bedingt nach X = x läßt sich rechnen wie mit
bedingten Erwartungen.
Sei jetzt (Ω, A, µ) ein Maßraum. Das Faktorisierungslemma gilt auch für Äquivalenzklassen
(bzgl f.s. Gleichheit), mit den entsprechenden Modifikationen. Die Äquivalenzklasse [f ] ist
meßbar bzgl. der Äquivalenzklasse [g] falls für alle f ∈ [f ], g ∈ [g], A′ ∈ A′′ es ein A′′ ∈ A′′
gibt mit der symmetrischen Differenz f −1 (A′ )△g −1 (A′′ ) als Nullmenge. Wir überschlagen die
technischen Details.
7.2.2
Weitere Beziehungen *
Wir zeigen einige Beispiele aus der Wahrscheinlichkeitstheorie. (Wir setzen den Begriff der
Unabhängigkeit voraus. Ein W-maß bezeichnen wir stets mit P.)
68
WS10/11
U. Rösler
Proposition 84 Für unabhängige Zgn X, Y gilt P X fast sicher
E(f (X, Y ) | X = x) = E(f (x, Y ))
Beweis: Sei M die Menge aller Funktionen mit obiger Eigenschaft. M enthält alle Funktionen
der Form f (x, y) = 11x∈A 11y∈B
Z
X
C
E(f (X, Y ) | X = x)P (dx) =
=
Z
X
E(f (x, Y ))P (dx) =
C
=
Z
11X∈C E(f (X, Y ) | X)dP
Z
11X∈C f (X, Y )dP =
Z
ZC
11x∈A (
Z
Z Z
11x∈C f (x, y)P X (dx)P Y (dy)
11Y ∈B dP )P X (dx)
f (x, y)P Y (dy)P X (dx)
C
für alle Borelmengen C.
Weiterhin ist M abgeschlossen bezüglich Treppenfunktionen und monotoner Grenzwerte.
Dies reicht.
q.e.d.
Beispiel: Ebene Seien X, Y : Ω → IR Zufallsgrößen
mit der gemeinsamen Verteilung
R
gemäß der Dichte f : IRR2 7→ IR, d.h. P ((X, Y ) ∈ ·) = · f (x, y)dxdy.
Dann ist g, g(x) := f (x, y)dy, die Dichte von X. g ist meßbar und
P (X ∈ A) =
Z Z
11x∈A f (x, y)dxdy =
Z
g(x)dx.
A
Ferner gilt
E(h(Y ) | X) =
R
h(y)f (X, y)dy
,
g(X)
E(h(Y ) | X = x) =
R
h(y)f (x, y)dy
g(x)
für jede integrierbare oder positive meßbare Funktion h.
Sei dazu h = 11B und A, B borelsch.
Z
X −1 (A)
E(h(Y ) | X)dP
= E(11X∈A 11Y ∈B ) = P ((X, Y ) ∈ (A, B))
=
Z Z
f (x, y)dydx =
A B
=
Z
Z R
B
A
X −1 (A)
R
f (x, y)dy
g(x)dx
g(x)
h(y)f (X, y)dy
dP.
g(X)
Hieraus folgt die erste Behauptung wegen der fast sicheren Eindeutigkeit der bedingten Erwartung.
Alle meßbaren Treppenfunktionen h erfüllen die Behauptung und alle monotonen Grenzwerte hiervon wegen der σ-Stetigkeit.
q.e.d..
Lemma 85 Seien A0 und A1 Unter-σ-Algebren und f integrierbar oder positiv und meßbar.
Falls σ(A0 , f ) unabhängig von A1 ist, gilt P -f.s.
E(f | A0 , A1 ) = E(f | A0 ).
69
WS10/11
Beweis:
D := {D ∈ σ(A0 , A1 ) |
Z
D
E(f | A0 , A1 )dP =
Maßtheorie
Z
D
E(f | A0 )dP }.
Man rechnet leicht nach, daß D ein Dynkin-System ist. E := {A0 ∩ A1 |A0 ∈ A0 , A1 ∈ A1 } ist
ein Erzeuger von σ(A0 , A1 ). Für A0 ∈ A0 , A1 ∈ A1 ist
Z
A0 ∩A1
E(f | σ(A0 , A1 ))dP = P ((11A0 f )11A1 ) = P (11A0 f )P (11A1 )
= P (11A0 E(f | A0 ))P (11A1 ) = P (11A0 E(f | A0 )11A1 ) =
Z
A0 ∩A1
E(f | A0 )dµ.
Daher gilt E ⊂ D.
q.e.d.
Man beachte hier den Spezialfall A0 trivial: Aus σ(f ) unabhängig von A0 folgt E(f |
A1 ) = E(f ).
7.3
Bedingte Wahrscheinlichkeiten∗
Mit der bedingten Erwartung E(. | A0 )(ω) oder auch E(. | X = x) läßt sich rechnen wie
mit Erwartungen oder bedingten Wahrscheinlichkeiten. Wann ist für festes ω die bedingte
Erwartung E(. | A0 )(ω) als eine Abbildung auf Funktionen darstellbar als ein Integral?
Das Problem besteht darin eine Festlegung K(ω, A) von E(11A | A0 )(ω) als Funktion zu
finden, die es bis auf eine Nullmenge simultan für alle meßbaren Mengen A tut. Und diese
Festlegung soll all die guten Eigenschaften der bedingten Erwartung haben, wie linear, scalar,
σ-stetig. Mathematisch ist dies ein Lifting von Äquivalenzklassen zu Funktionen.
7.3.1
Kerne aus bedingten Erwartungen
Seien (Ω, A) und (Ω′ , A′ ) meßbare Räume. Ein Kern ist eine Abbildung K : Ω × A′ 7→ IR
mit den Eigenschaften
(i) für alle ω ist K(ω, ·) : A′ 7→ IR ein Maß,
(ii) für alle A′ ∈ A′ ist K(·, A′ ) : Ω 7→ IR meßbar.
Ein Wahrscheinlichkeitskern ist ein Kern mit K(ω, ·) ein W-maß für jedes ω. Ein Subwahrscheinlichkeitskern ist ein Kern mit K(ω, Ω′ ) ≤ 1 für jedes ω.
Sprache: Wir sprechen von einem Kern von (Ω, A) nach (Ω′ , A′ ).
R
Wir benutzen die Notation K(ω, f ) := f (x)K(ω, dx) falls das Integral wohldefiniert ist.
Satz 86 Sei (Ω, A, P ) ein Standard Borelw-raum. Sei A0 eine Unter-σ-Algebra von A. Dann
gibt es einen W-kern K : Ω × A → IR, so daß für alle positiven meßbaren Funktionen f die
Funktion K(., f ) : Ω → R fast sicher gleich der bedingten Erwartung E(f | A0 ) ist.
Beweis: Der Standard Borelw-raum ist isomorph zu einer Borelmenge versehen mit der Borel
σ-Algebra (siehe Lemma (83). Wir führen den Beweis auf den reellen Zahlen.
Betrachte den abzählbaren Erzeuger Aq := (−∞, q], q ∈ Ql der Borel σ-Algebra. Wähle für
jedes q ∈ Q eine Funktion F (., q) : Ω → IR aus, die fast sicher gleich der bedingten Erwartung
E(Aq | A0 ) ist.
• Die Funktionen F (., p) sind punktweise aufsteigend in p bis auf ω in einer Nullmenge
N1 .
70
WS10/11
U. Rösler
Für festes p < q gilt F (., p) ≤ F (., q) bis auf ein Nullmenge. Es gibt nur abzählbar viele
rationale Paare p ≤ q und die Vereinigung abzählbar vieler Nullmengen ist eine Nullmenge.
• lim inf Ql∋q→−∞ F (ω, q) = 0 bis auf eine Nullmenge N2 .
Leicht.
• lim inf Ql∋q→∞ F (ω, q) = 1 bis auf eine Nullmenge N3 .
Leicht.
Sei N = N1 ∪ N2 ∪ N3 . Definiere G : Ω × IR 7→ IR durch
G(ω, x) = inf F (ω, q).
Q
l∋q≥x
• G(ω, .) ist eine Verteilungsfunktion für alle ω 6∈ N.
Nachrechnen. Übung.
Sei µω , ω ∈ N c , das W-maß zur Verteilungsfunktion G(ω, ·) via
µω (Bq ) = G(ω, q),
q ∈ Ql. Dies W-maß ist eindeutig. Sei µω das Punktmaß in 0 für ω ∈ N. Dann tut’s K(ω, A) :=
µω (A).
• K ist ein Kern.
Für festes ω ist K(ω, .) ein Maß. Es verbleibt zu zeigen:
D := {A ∈ A | K(., A) : Ω 7→ IR ist meßbar }
ist gleich A. Zeige hierzu D ist ein Dynkinsystem. (Ω ∈ D, D ist abgeschlossen bzgl. dem
Komplement und disjunkter abzählbarer Vereinigung.) D enthält das durchschnittsstabile
Erzeugendensystem Aq , q ∈ Q von A.
.
Notation: µω (·) heißt bedingte Wahrscheinlichkeit.
Folgerung 87 Bis auf eineR gemeinsame Nullmenge gilt µω (A) = E(1A | A0 )(ω) für alle
A ∈ A und E(f | A0 )(ω) = f dµω .
Beweis: Dies gilt für f eine Treppe, f eine Treppenfunktion, per σ-Stetigkeit für positive f
und per Zerlegung f = f + − f − für alle f , sofern die Ausdrücke wohldefiniert sind.
q.e.d.
Bemerkung: Es existieren nicht immer bedingte Maße, sogar für Teilmengen der reellen
Zahlen versehen mit der Borel σ-Algebra. (Wenn der Grundraum zu ’perforiert’ ist. ) Für
jede Zg mit Werten in (IR, B) existiert die bedingte W-keit.
Bsp: Für ein meßbares B sei 0 < P (B) < 1 und A0 := {∅, B, B c , Ω}. Die bedingte
Wahrscheinlichkeit, bedingt auf B, ist das W-maß P (· | B) := PP(·∩B)
(B) wohldefiniert. Es gilt
P (A | A0 ) = 11B P (A | B) + 11B c P (A | B c ).
Sei nun (Bn )n∈IN eine meßbare Partition von Ω, stets 0 < P (Bn ) < 1. Sei A0 die kleinste
σ-Algebra erzeugt von der Partition. Die bedingte Erwartung wird durch bedingte W-maße
gegeben,
X
P (A | A0 ) :=
P (A | Bn )11Bn : Ω → IR
n
E(f | A0 ) =
Z
f dP (· | A0 ) =
XZ
n
f dP (· | Bn )11Bn
fast sicher.
Bedingte W-keit unter X = x sind die Verallgemeinerungen von bedingten W-keiten
bedingt auf Ereignisse vom Maß 0.
71
WS10/11
72
Maßtheorie
Kapitel 8
Produkträume *
Ziel dieses Paragraphen sind Maße auf allgemeinen Produkträumen und der Existenzsatz
von Kolmogoroff für Produkträume. Diese werden für die Existenz stochastischer Prozesse
benötigt, z.B. für die Existenz einer Folge von unabhängigen Zufallsgrößen.
8.1
Produkträume
Wir starten mit dem mengentheoretischen Produktraum. Seien Ωi , i ∈ I, beliebige Mengen,
I ein beliebiges Indexsystem. Das kartesische Produkt
ΩI :=
Y
Ωi
i∈I
dieser Mengen ist die Menge aller Funktionen ω : I 7→ ∪i∈I Ωi mit ω(i) ∈ Ωi für alle i ∈ I.
Sind alle Ωi , i ∈ I, gleich, etwa E, so benutzen wir die gebräuchliche Notation ΩI = E I .
Q
Ebenso benutzen wir ΩJ = j∈J Ωj für J ⊂ I. Dies entspricht allen Funktionen ω|J , ω ∈ ΩI
eingeschränkt auf J.
Projektion: Für K ⊂ J ⊂ I sei
ΦJ,K : ΩJ → ΩK
die Projektion auf die K-Koordinaten. Formal ist dies die Einschränkung der Funktionen aus
ΩJ auf K. Wir benutzen die Notation ΦK := ΦI,K wenn möglich. Die Abbildung Φi := Φ{i}
heißt i-te Koordinatenabbildung .
Die Menge der Projektionsabbildungen ist transitiv, d.h. sie erfüllen
ΦK,L ◦ ΦJ,K = ΦJ,L
(8.1)
für L ⊂ K ⊂ J.
Bsp. Endliche Tupel: Für endliche Mengen I und eine fest vorgegebene Numerierung
i1 , i2 , . . . , in der Elemente von I identifizieren wir den Produktraum ΩI mit
Ωi1 × Ωi2 × . . . × Ωin .
Ein Element ist ein Tupel (ω1 , ..., ωn ). In dieser Darstellung als Tupel ist stets die Reihenfolge
der Aufzählung implizit enthalten.
Definiere die Abbildung πJ := Φ−1
J ΦJ : ΩI → ΩI .
73
WS10/11
Maßtheorie
Proposition 88 Es gilt
– die Abbildung J → πJ ist antiton (bzgl. der Enthaltensordung f ’ür Mengen und der
punktweisen für Funktionen)
– πJ ◦ πK = πJ∩K = πK ◦ πJ für alle K, J ⊂ I.
– die Projektionseigenschaft πJ ◦ πJ = πJ für alle J,
Beweis: Übung mit Wertebereichen von Funktionen.
Zylindermengen: Eine Zylindermenge in ΩI ist eine Menge der Form Φ−1
J (AJ ) mit
AJ ⊂ ΩJ , J ⊂ I. Die Koordinatenmenge J heißt Basis des Zylinders.
Jede Menge A ⊂ ΩI ist eine Zylindermenge wegen A = Φ−1
I (A) mit Basis I. Interessant sind kleinere Basen, im Sinne der Enthaltenrelations. Dies Beispiel zeigt die Basis eines
Zylinders ist nicht eindeutig. (Übung).
Proposition 89 Sind J und K zwei Basen einer Zylindermenge, so auch J ∩ K.
−1
Beweis: Die Zylindermenge Z habe zwei Darstellungen Φ−1
J (AJ ) = ΦK (AK ) mit J 6= K.
Dann gilt πJ (Z) = Z und πK (Z) = Z. Hieraus folgt πJ∩K (Z) = Z und damit Z = Φ−1
J∩K (A)
für A ∈ ΩJ∩B . (Ohne Beweis A = ΦJ,J∩K (AJ ) = ΦK,J∩K (AK ).)
Rechteckmengen: Eine Rechteckmenge oder auch Rechteckzylinder ist eine Menge der
Form
\
Φ−1
j (Aj )
j∈J
mit Aj ⊂ Ωj , j ∈ J ⊂ I. Ist I endlich, etwa I = {1, 2, . . . , n}, so schreiben wir die
Rechteckmengen in der prägnanteren Form A1 × A2 × . . . × An . Beachte die Reihenfolge des
Index.
Schnitt: Der Schnitt einer Menge A ∈ ΩI in Richtung x ∈ ΩJ c ist
x
SI,J
(A) := ΦJ (A ∩ Φ−1
J c (x)).
Eine alternative Beschreibung ist {ω|J | ω ∈ A, ω|J c = x} durch Einschränkung der Funktionen bestimmtes Verhalten auf J c .
✬
✩
B
Bω
ω
✫
8.1.1
✪
Produkt σ-Algebra
Wir kommen jetzt zu Produkträumen mit meßbarer Struktur. Seien (Ωi , Ai ), i ∈ I, beliebige
meßbare Räume. Die Produkt σ-Algebra AI ist die kleinste σ-Algebra auf ΩI , bezüglich der
alle Koordinatenabbildungen Φi , i ∈ I, meßbar sind. Wir benutzen die Notation
AI =:
O
i∈I
74
Ai
WS10/11
U. Rösler
N
Wir benutzen , da AI nicht das mengentheoretische Produkt ist, sondern eine Struktur
enthält. Das Tupel (ΩI , AI ) heißt Produktraum (der meßbaren Räume (Ωi , Ai ), i ∈ I.) Analog
verwenden wir AJ für J ⊂ I.
Proposition 90 Die Abbildungen ΦI,J , J ⊂ I, sind AI − AJ meßbar.
−1
Beweis: i) Die Urbilder ΦJ,{j}
(Aj ), Aj ∈ Aj , j ∈ J, bilden ein Erzeugersystem E für die
Produkt σ-Algebra AJ . Das Urbild Φ−1
I,J (E) des Erzeugersystems ist in AI wegen der Projek−1
−1
tionseigenschaft (8.1) ΦI,{j} (E) = ΦI,J (Φ−1
J,{j} (E)). Dies reicht im Hinblick auf Proposition 6.
q.e.d.
Proposition 91 Die Produkt σ-Algebra AI ist gleich der Menge aller meßbarer Zylindermengen mit abzählbarer Basis. Jede meßbare Zylindermenge hat eine Darstellung Φ−1
J (AJ )
mit abzählbarem J und meßbarem AJ ∈ AJ .
Beweis: • M ist eine σ-Algebra.
c
−1
c
M ist nicht leer und komplementabgeschlossen, (Φ−1
· (A)) = Φ· (A ). Sie ist abgeschlossen bzgl. der abzählbaren Vereinigung. Dies folgt aus Jn ⊂ I (höchstens) abzählbar,
J := ∪n Jn , (höchstens) abzählbar,
(
[
n
c
Φ−1
=
Jn (AJn ))
=
\
n
\
n
c
Φ−1
Jn (AJn )
−1
−1
c
Φ−1
J (ΦJ,Jn (AJn )) = ΦJ (
\
n
c
Φ−1
J,Jn (AJn )) ∈ M
• AI ⊂ M
M enthält alle Mengen Φ−1
i (Ai ), die wiederum einen Erzeuger E der Produkt σ-Algebra
bilden. Aus E ⊂ M folgt AI = σ(E) ⊂ σ(M) = M
• M ⊂ AI
Einfach, da ΦJ meßbar ist.
Daraus folgt M = AI .
q.e.d.
Die meßbaren Rechteckmengen sind (genau diejenigen) von der Form
\
Φ−1
j (Aj )
j∈J
mit
Aj ∈ Aj , j ∈ J ⊂ I höchstens abzählbar.
x (A), x ∈ Ω c , meßbar
Proposition 92 Sei J ⊂ I endlich. Für A ∈ AI ist jeder Schnitt SI,J
J
bzgl. der Produkt σ-Algebra AJ .
Beweis: Betrachte die Menge M aller Mengen A ∈ AI mit obiger Eigenschaft. Die Menge
M ist eine σ-Algebra. (Nachrechnen, der wesentliche Punkt ist ΦJ (Ac ∩ Φ−1
J c (x)) = ΦJ (A ∩
c .) M enthält einen Erzeuger, da die erzeugenden Abbildungen Φ meßbar sind bezüglich
Φ−1
(x))
c
i
J
M − Ai . Damit folgt M = AI .
q.e.d.
Proposition 93 Rechteckmengen mit höchstens abzählbarer Basis sind genau dann meßbar,
wenn in der Darstellung jedes Aj meßbar ist Aj ∈ Aj ist.
75
WS10/11
Maßtheorie
I\j,x
Beweis: Die Rückrichtung ist einfach. Für die Hinrichtung zeige SI
x ∈ ΩI\j und vorgegebenes j ∈ J. Aj muß meßbar sein.
= Aj für ein geeignetes
q.e.d.
Lemma 94 Die Menge R′ der meßbaren Rechteckzylinder mit endlicher Basis bilden einen
Semiring.
Beweis: Die Eigenschaften eines Semiringes sind nachzuprüfen. ∅ ∈ R0 ist offensichtlich. Die
endliche Durchschnittsabgeschlossenheit folgt aus
−1
−1
∩n≤N ∩j∈Jn Φ−1
j (Aj,n ) = ∩j∈I ∩{n|j∈Jn } Φj (Aj,n ) = ∩j∈I Φj (∩{n|j∈Jn } Aj,n ).
Daß die Differenz als disjunkte endliche Summe von Semiringmengen darstellbar ist, ist eine
unangenehme Schreibarbeit. Wir begnügen uns mit einem Bild im IR2 .
B
A
Dies reicht.
8.2
q.e.d.
Maße auf Produkträumen.
Wir kommen jetzt zu maßtheoretischen Produkträumen.
Ein Produktmaß auf dem Produktraum (ΩI , AI ) ist ein Maß µ darauf mit
µ(
\
Φ−1
j (Aj )) =
j∈J
Y
µ(Φ−1
j (Aj ))
(8.2)
j∈J
für alle meßbaren Rechteckmengen.
Das Produktmaß induziert ein Maß µi auf (Ωi , Ai ), i ∈ I, via µi (Ai ) = µ(Φ−1
i Ai ), Ai ∈ Ai .
Umgekehrt, zumindest für Wahrscheinlichkeitsmaße, wie wir gleich zeigen werden, gibt es zu
vorgegebenen µi genau ein Produktmaß µ. Daher verwenden wir die Notation µ = µI =:
N
i∈I µi .
Das Tripel (ΩI , AI , µI ) heißt Produktmaßraum oder auch nur Produktraum (bezüglich der
Maßräume (Ωi , Ai , µi )i ).
Wir kommen jetzt zur Existenz des Produktmaßes.
Satz 95 Seien (Ωi , Ai , µi ), i ∈ I, W-Räume. Es gibt genau ein Produktwahrscheinlichkeitsmaß auf dem Produktraum.
76
WS10/11
U. Rösler
Beweis: Fall: I bestehe aus den zwei Elementen 1 und 2. Setze für Rechteckmengen
µ(A1 × A2 ) = µ1 (A1 )µ2 (A2 ).
In Funktionenschreibweise mit Funktionen f = 11A1 ×A2 .
Z
f (x, y)µ(d(x, y)) =
Z Z
f (x, y)µ1 (dx)µ2 (dy).
Die rechte Seite hängt nicht von der Reihenfolge der Integration ab Satz 41. Dehne die rechte
Seiten linear aus auf Treppenfunktionen und dann
σ-stetig auf meßbare positive Funktionen.
R
(Übung.) Dann tut’s µ definiert durch µ(A) = 11A µ1 (dx)µ2 (dy).
Fall: I endlich. Argumentiere induktiv über n = |I|.
Fall: I abzählbar, oEdA I = IN. Der Beweis folgt obiger Konstruktion mit einem zusätzlichen Kompaktheitsargment. Sei R0 der Semiring aller Rechteckmengen mit endlicher Basis.
Definiere µ : R0 7→ IR wie in (8.2)
µ(∩j∈J Φ−1
j (Aj ) =
Y
µj (Aj )
j∈J
• Die Mengenfunktion µ ist wohldefiniert und ein Inhalt.
Übung. Dies ist keine Trivialität und benötigt die Projektionseigenschaft.
Setze diese Mengenfunktion auf den von R0 erzeugten Ring R additiv fort.
• µ : R 7→ IR ist ein Prämaß.
Wir zeigen die σ-Stetigkeit bei der leeren Menge, welches hinreichend ist. Annahme: An ∈ R0
ist fallend gegen die leere Menge und limn µ(An ) > 0.
Nach Fubini gilt
Z
x1
µ2 (SI\1
(An ))µ1 (dx1 )
µ(An ) =
Q
x1
(An ) ist der Schnitt von An in
mit µ2 der analoge entsprechende Inhalt auf i≥2 Ωi . SI\1
2
Richtung erster Koordinate an der Stelle x1 . (Beachte µ (B2 ×B3 ×. . .) = µ(Ω1 ×B2 ×B3 ×. . .)
wie für endliches I.)
Der Satzes von der monotonen Konvergenz impliziert
lim µ(An ) =
n
Z
x1
(An ))µ1 (dx1 ).
lim µ2 (SI\1
n
x∗
1
(An )) > 0. (Wir integrieren über eine echte
Folglich gibt es ein x∗1 ∈ Ω1 mit limn µ2 (SI\1
Funktion, keine Äquivalenzklasse.)
Ebenfalls nach Fubini und monotoner Konvergenz
lim µ
n
2
x∗1
(SI\1
(An ))
mit µ3 der analoge Inhalt auf
Q
i≥3 Ωi .
=
Z
(x∗ ,x )
1 2
lim µ3 (SI\{1,2}
(An ))µ2 (dx2 )
n
Es gibt ein x∗2 ∈ Ω2 mit limn µ3 (SI\{1,2}(x∗1 ,x∗2 ) (An )) > 0.
Analog wähle x∗3 , x∗4 , . . . usw. Dann liegt x∗ := (x∗1 , x∗2 , ...) in dem Durchschnitt aller An .
(Übung.) Widerspruch.
• Für höchstens abzählbare J ⊂ K gilt µK Φ−1
K,J = µJ .
Die Aussage gilt für alle Rechteckmengen in AJ mit endlichem Träger. Die bilden einen
Erzeuger der Produkt σ-Algebra AJ .
77
WS10/11
Maßtheorie
• Die eindeutige Caratheodory Erweiterung liefert das gewünschte Produktwahrscheinlichkeitsmaß µ = µI .
Fall: I beliebig. Definiere µI : AI 7→ IR durch
µI (A) = µJ (AJ )
Für Zylindermengen A = Φ−1 (AJ ), AJ ∈ AJ mit höchstens abzählbarer Basis J ⊂ I. µI tut’s.
• Wohldefiniertheit.
−1
A habe die beiden Darstellungen A = Φ−1
J (AJ ) = ΦK (AK ) mit höchstens abzählba−1
rer Basis J, K. Dann gilt ΦJ∪K (A) = Φ−1
J∪K,J (AJ ) = ΦJ∪K,K (AK ) und damit µJ (AJ ) =
−1
µJ∪K (Φ−1
J∪K,J (AJ )) = µJ∪K (ΦJ∪K,K (AK )) = µK (AK ).
• µI ist ein W-maß. Nachrechnen.
q.e.d.
Korollar 96 Voraussetzungen wie im obigen Satz. Es gilt für J ⊂ K ⊂ I µK Φ−1
K,J = µJ
Nachrechnen.
Bsp. Lebesguemaß: Sei Ωi = {0, 1} und µi (1) = 1/2 für alle i ∈ I = IN. Betrachte die
Abbildung ϕ : ΩI → [0, 1] mit
ϕ(ω) =
∞
X
ωi 2−1
i=1
Die Abbildung ϕ ist surjektiv und, wenn wir eine µI Nullmenge herausnehmen, injektiv. (Die
Dualdarstellung ist eindeutig.) Dann ist ϕ(AI ) die Borel σ-Algebra auf [0, 1] und µI ϕ−1 ist
das Borelmaß darauf.
Projektiver Limes*
Wir betrachten eine Klasse O von Objekten derselben mathematischen Struktur, wie Vektorräume, meßbare Räume, Gruppen, oder anderes. Weiterhin gebe es gewisse strukturerhaltende Abildungen zwischen den Objekten, z.B. lineare Abbildungen, meßbare Abbildungen,
Gruppenhomomorphismen, usw.. Diese Abbildungen heißen Morphismen.
Ein projektives System ist ein Tupel (O, M) einer Menge O von mathematischen Objekten
und einer transitiven Menge M von Morphismen. (Transitiv bedeutet, falls ϕα,β : α → β und
ϕβ,γ : β → γ Morphismen aus M sind, so auch ϕα,γ = ϕβ,γ ◦ ϕα,β .) Anders formuliert, das
folgende Diagramm kommutiert:
✉
△
✲✉
α
✧
ϕα,β
✲✉
β
ϕβ,γ
ϕα,γ
✲✉
✻
✦
γ
✲✉
✲
Auf O ist eine transitive Relation durch die Morphismen vorgegeben via,
α β ⇔ ∃ϕ ∈ M ϕ : α → β.
Der projektive Limes eines projektiven Systems (O, M) ist ein weiteres Objekt △ mit
dieser mathematischen Struktur und folgenden Eigenschaften.
78
WS10/11
U. Rösler
(i) Es gibt Morphismen ϕ△,α : γ → α für alle α ∈ O, so daß
(O ∪ {△}, M ∪ {ϕ△,α | α ∈ O})
ein projektives System derselben mathematischen Struktur bildet.
(ii) △ ist das kleinste derartige Objekt. Sei δ ein weiteres Objekt mit Morphismen ϕδ,. wie
in (i). Dann gibt es einen Morphismus ϕ : δ → △ mit
ϕδ,α = ϕ△,α ◦ ϕδ,△ .
Die erste Bedingung fordert die Verträglichkeit der Morphismen ϕ△,α mit der Projektionsstruktur. Sehr einprägsam ist die graphische Darstellung als links abgeschlosser Graph (der
nicht linear sein muß):
✉
δ′
ϕδ,△
✧
✲✉
δ
ϕδ,α
ϕδ,α
✲✉
✻
✦
α
✲✉
✲
Beispiel: Produktmaß Der Produktraum von W-räumen ist der projektive Limes eines
projektiven Systems. Betrachte die Objekte (ΩJ , AJ , µJ ), für J ⊂ I abzählbar. Dies sind
Wahrscheinlichkeitsräume. Die Morphismen sind die Projektionsabbildungen ΦK,J für J ⊂ K.
Diese erfüllen die Verträglichkeitsbedingung (8.1),
ΦK,L ◦ ΦJ,K = ΦJ,L
ΦJ,K µJ = µK
J ⊂ K ⊂ L. Das Objekt (ΩI , AI , µI ) mit den Morphismen ΦJ für höchstens abzählbare
Teilmengen J ⊂ I ist der projektive Grenzwert.
Dies ist das kleinste Objekt mit Morphismen, welches das projektive System projektiv
abschließt. Wäre δ = (Ω, A, µ) ein weiterer W-Raum mit den Morphismen Φδ,J , der das
projektive System projektiv abschließt. Dann tut es die Abbildung
Ω ∋ ω 7→ ϕδ,I (ω) =
Y
i
Φi (ω) ∈ ΩI .
Kompakte Klassen *
Dieser Abschnitt ist nur der Vollständigkeit halber gegeben und kann beim ersten Lesen
überschlagen werden.
Eine Teilmenge K ⊂ P(Ω) der Potenzmenge heißt kompakte Klasse, bzw. hat die endliche
T
Durchschnittseigenschaft, falls für jede abzählbare Folge Kn ∈ K mit N
n=1 Kn 6= ∅ für jedes
T
N ∈ IN auch n∈IN Kn 6= ∅ gilt.
T
T
Äquivalent ist die Forderung n Kn = ∅ für eine Folge impliziert N
n=1 Kn = ∅ für ein
N ∈ IN.
In topologischen Räumen ist die Menge der kompakten Mengen eine kompakte Klasse. (Dies
ist das Hauptbeispiel und vielleicht das einzig relevante.)
Lemma 97 Ist K eine kompakte Klasse, so auch die Menge der abzählbaren Durchschnitte
und die Menge der endlichen Vereinigungen von Mengen aus K.
79
WS10/11
Beweis: Für Durchschnitte ist die Behauptung einfach. Sei nun Dn :=
T
und N
n=1 Dn 6= ∅ für alle N ∈ IN. Definiere den Produktraum
L :=
∞
Y
Maßtheorie
Sin
n
i=1 Ki
mit Kin ∈ K
{1, 2, . . . , in } = {1, 2, . . . , i1 } × {1, 2, . . . , i2 } × . . .
n=1
n
LN := {(l1 , l2 , . . .) ∈ L | ∩N
n=1 Kln 6= ∅}.
• LN , N ∈ IN, sind nicht leer und die Folge LN ist fallend.
• ∩N LN ist nicht leer.
Wähle aus jedem LN ein lN aus. Nach dem Schubfachprinzip gibt es ein 1 ≤ l1∗ ≤ i1 mit
#{N ∈ IN | l1∗ = l1N } = ∞. Ebenso findet man ein l2∗ mit #{N ∈ IN | l1∗ = l1N , l2∗ = l2N } = ∞
usw. Damit gilt (l1∗ , l2∗ , l3∗ , . . .) ∈ ∩N LN .
Damit gilt ∩n≤N Klnn∗ 6= ∅ für alle N ∈ IN. K ist eine kompakte Klasse, also ∩n Klnn∗ 6= ∅.
Hieraus folgt ∩n Dn 6= ∅.
q.e.d.
Lemma 98 Sei I eine beliebige Indexmenge, Ki ⊂ P(Ωi ), i ∈ I, kompakte Klassen. Dann ist
K := {Φ−1
i (Ki ) | i ∈ I, Ki ∈ Ki }
eine kompakte Klasse.
−1
n
n
n
Beweis: Sei K n eine Folge aus K mit ∩N
n=1 K 6= ∅ für alle N ∈ IN. Für K = Φin (Kin ) ∈
K, n ∈ IN, in ∈ I, Kinn ∈ Kin . gilt
−1
−1
n
n
n
∩N
n=1 K = ∩i ∩{n≤N |in =i} Φi (Ki ) = ∩i Φi (∩{n≤N |in =i} Ki ).
Der Durchschnitt wird über alle i ∈ I genommen, mit {n ≤ N | in = i} nicht leer.
Für jedes solche i sind die endlichen Durchschnitte ∩{n≤N |in =i} Kin nicht leer (wegen
n 6= ∅.) Da K eine kompakte Klasse ist, ist der abzählbare Durchschnitt A :=
∩N
i
i
n=1 K
n = ∩ Φ−1 (A ) nicht.
K
q.e.d.
∩{n|in =i} Kin nicht leer. Folglich auch ∩∞
i
i
n=1
i
8.2.1
Die Kolmogoroffschen Erweiterungssätze
Seien (Ωi , Ai ), i ∈ I, meßbare Räume und (ΩJ , AJ ), J ⊂ I endlich, der Produktraum versehen
mit der Produkt σ-Algebra.
Eine maßerhaltende Abbildung ist eine Abbildung zwischen Maßräumen, die die Maße
erhält.
Satz 99 (Daniell-Kolmogoroff ) Seien (Ωi , Ai , µi ), i ∈ I W-räume mit beliebiger Indexmenge I. Für jedes i ∈ I gebe es ein kompaktes System Ki derart, daß
∀ǫ > 0 ∀Bi ∈ Ai ∃Ki ∈ Ki ∃Ai ∈ Ai : Ai ⊂ Ki ⊂ Bi und µi (Bi \Ai ) < ǫ.
Seien (ΩJ , AJ ) die Produkträume für endliches J ⊂ I. Seien µJ W-maße auf (ΩJ , AJ ) so
dass (ΩJ , AJ , µJ ), J ⊂ I endlich mit den Projektionen Φ.,. ein projektives System bilden bzgl.
W-räumen und maßerhaltenden Abbildungen.
Dann gibt es einen projektiven Grenzwert und dieser ist (ΩI , AI , µI ) zusammen mit den
Projektionsabbildungen als Morphismen.
80
WS10/11
U. Rösler
Dieser Satz wird häufig in folgender Form verwendet.
Satz 100 (Kolmogoroff ) Sei E ein polnischer Raum mit der Borelschen σ-Algebra B. Seien
(E J , B J , µJ ), J ⊂ I endlich, W-räume und die Projektionsabbildungen seien maßerhaltend.
Dann ist der projektive Limes (ΩI , B I , µI ) mit einem W-maß µI .
Beweis erste Version: Sei R0 die Menge aller meßbarer Rechteckzylinder mit endlicher Basis.
R0 ist ein Semiring, Proposition 94. Auf R0 betrachten wir die additive Mengenfunktion
µ : R0 7→ IR definiert durch
µ(Φ−1
J (AJ )) := µJ (AJ )
für meßbare Rechteckzylinder AJ . (Die Wohldefiniertheit von µ verwendet die Verträglichkeitsbedingung und ist keine Trivialität.) Erweitere µ (eindeutig) zur additiven Mengenfunktion auf dem von R0 erzeugten Ring R, Lemma 16.
Die additive Mengenfunktion µ auf R ist ein Prämaß, d. h. σ-stetig bei der leeren Menge.
Dazu zeigen wir:
K := {∩j∈J Φ−1
j (Kj ) | |J| < ∞, Kj ∈ Kj , j ∈ J}
ist ein kompaktes System, siehe vorhergenden Abschnitt.
• Für alle ǫ > 0 und alle meßbaren Rechteckzylinder B mit endlichen Zylinder J gibt es
eine Menge K ∈ K mit Basis J und einen meßbaren Rechteckzylinder A mit A ⊂ K ⊂ B und
µ(B\A) < ǫ.
Sei B = ∩j∈J Φ−1
j (Bj ) ∈ R0 . Wähle zu vorgegebenen ǫj , Bj Mengen Kj ∈ Kj und Aj ∈ Aj
−1
mit Aj ⊂ Kj ⊂ Bj und µj (Bj \Aj ) < ǫj . Setze K = ∩j∈J Φ−1
j (Kj ) ∈ K, A = ∩j∈J Φj (Aj ) und
P
P
schließe und schließe µ(B\A) ≤ j µj (Bj \Aj ) ≤ j ǫj kann beliebig klein gewählt werden.
Sei oEdA J = {1, 2, . . . , n}. (Ansonsten wähle eine Indizierung j1 , j2 , . . . , jn der Elemente von
−1
J.) Betrachte C0 = B, Cl = (∩0<i≤l Φ−1
1 (Ai )) ∩n>i>l Φi (Bi ) für l ∈ IN≤n . Dann gilt
[n
B\A = ◦
i=1
[n
Ci \Ci−1 ⊂ ◦
i=1
Φ−1
i (Bi \Ai )
(Mache ein Bild für eine zweielementige Menge J.)
Unter Anwendung von Caratheodory erhalten wir eine Fortsetzung von µ zu einem Maß
auf der σ-Algebra σ(R0 ) = AI .
Die Eindeutigkeit ist einfach. Ebenso, daß dies das kleinste projektive Objekt ist. q.e.d.
Beweis zweite Version: Nehme als kompakte Klasse Ki die Menge aller kompakten Mengen
in E. Diese tun’s.
q.e.d.
Bemerkung: Der Satz von Kolmogoroff gibt nicht nur die Existenz des projektiven Limes,
sondern auch die Produktgestalt des meßbaren Raumes (ΩI , AI ).
Beispiel von Jessen*: Ohne Kompaktheitsbedingung können wir für den projektiven
Limes nicht den Produktraum nehmen.
Betrachte Ω = [0, 1) mit der Borel σ-Algebra B und dem Lebesguemaß λ. Für eine Menge
A betrachten wir den eingeschränkten Raum ΩA := Ω ∩ A versehen mit der eingeschränkten σ-Algebra B|A := {B ∩ A | B ∈ B} und dem eingeschränkten Maß λ|A auf B|A mit
λ|A (C) = inf{λ(B) | B ∈ B, C ⊂ B} (Nachrechnen, dies ist ein Maß. Es ist das äußere Maß
λ∗ eingeschränkt auf B|A .)
Betrachte die Reellen Zahlen als Vektorraum über den rationalen Zahlen. Definiere die
Äquivalenzrelation x ∼ y ⇔ x − y ∈ Ql auf [0, 1). Sei A ⊂ [0, 1) ein Representantensystem der
Äquivalenzklassen. Die Mengen Aq = A + q modulo 1 für q ∈ Ql ∩ [0, 1) bilden eine paarweise
disjunkte Zerlegung von [0, 1). Für jedes q ∈ Ql ist Aq nicht Lebesguemeßbar, Abschnitt 2.1.3.
81
WS10/11
Maßtheorie
Das innere Lebesguemaß von jedem Aq ist 0. (B ∋ B ⊂ Aq ⇒ λ(B) = 0.) Das innere
Lebesguemaß von jeder endlichen Vereinigung von Aq ist 0. (Übung).
Sei Ωq := Acq versehen mit der σ-Algebra Aq := B|Ωq und dem W-maß µq := λ|Ωq . Auf
dem Produktraum (ΩJ , AJ ), J ⊂ Ql endlich, definiere die W-Maße µJ durch
µJ (C) = λ∗ ({x ∈ [0, 1] | ∩j∈J Φ−1
j (x) ∈ C}).
(Nachrechen, dies ist ein wohldefiniertes W-maß.) Die W-räume (ΩJ , AJ , µJ ), J ⊂ Ql endlich,
bilden eine projektive Familie (bezüglich den Objekten der W-räume und den Projektionsabbildungen als maßerhaltende Morphismen.) (Übung).
Angenommen, der projektive Limes wäre (ΩQl, AQl, µ). Sei q1 , q2 , . . . eine Abzählung der
rationalen Zahlen. Die Mengen
Dn := {ω ∈ ΩQl | ω(qi ) = ω(qj ) für 1 ≤ i, j ≤ n}
konvergieren fallend gegen die Diagonale {ω ∈ ΩQl | ω(q) = ω(r) ∈ [0, 1) für alle q, r ∈ Ql in
ΩQl}. Dies ist die leere Menge, da es für jedes x ∈ [0, 1) ein q ∈ Q gibt mit x 6∈ Ωq . Dies ergibt
den Widerspruch, Jn := {q1 , . . . , qn },
lim µ(Dn ) = lim µJn (ΦJn (Dn )) = 1 6= 0 = µ(lim Dn ) = lim µ(Dn )
n
n
n
im Widerspruch zur σ-Stetigkeit von µ.
8.3
n
q.e.d.
Maße aus Kernen
Bedingte W-keiten lassen sich als Kerne interpretieren und umgekehrt, zu vorgegebenen Kernen lassen sich W-Maße mit zugehörigen bedingten W-verteilungen konstruieren.
8.3.1
Kerne
Seien (Ω, A), (Ω′ , A′ ) meßbare Räume. Ein Kern ist eine Abbildung K : Ω × A′ → IR mit
i) K(x, .) : A′ → IR ist ein Maß für alle x ∈ E,
ii) K(., A′ ) : Ω → IR ist eine meßbare Funktion für alle A′ ∈ A′ .
Wir sprechen von einem endlichen Kern, falls alle Maße K(e, .) endlich sind. Ein Kern
heißt Wahrscheinlichkeitskern oder auch Markoff Kern oder Übergangskern, falls alle Maße
in i) W-Maße sind. Ebenso sprechen wir von σ-endlichen Kernen usw.
Ein Kern K induziert eine lineare, σ-stetige Abbildung F(Ω′ , IR+ ) → F(Ω, IR+ ) auf positiven, erweiterten und meßbaren Funktionen via
f 7→
Z
f (y)K(., dy).
Wir benutzen die Notation K(., f ). Diese Abbildung läst sich via K(x, f ) = K(x, f + ) −
K(x, f − ) ausdehnen.
Ebenso induziert ein Kern eine isotone, lineare Abbildung von Maßen auf A nach Maßen
auf A′ via
Z
µ 7→
K(x, .)µ(dx).
E
Wir benutzen die Notation K(µ, .) und K(µ, f ) analog.
82
WS10/11
U. Rösler
Die Komposition von Kernen K : Ω × A′ 7→ IR und L : Ω′ × A′′ 7→ IR ist gegeben durch
KL = K ◦ L : Ω × A′′ → IR
′′
KL(e, A ) :=
Z
L(e′ , A′′ )K(e, de′ ).
E′
Lemma 101 Die Komposition von Kernen ist ein Kern. Die Komposition ist assoziativ.
Beweis: • KL ist ein wohldefinierter Kern.
KL ist wohldefiniert. Für festes x ist KL(x, .) ein Maß. Für die zweite Eigenschaft eines Kerns approximiere L(x′ , A′′ ) von unten durch Treppenfunktionen, für die wiederum die
Aussage gilt.
• Assoziativitäet.
Zu zeigen ist (K ◦ L) ◦ M = K ◦ (L ◦ M ). Dies folgt aus Fubini KLM (x, A′′′ ) :=
R R
( M (x′′ , A′′′ )L(x′ , dx′′ ))K(x, dx′ ) durch vertauschen der Integrationsreihenfolge.
q.e.d.
Hier sind einige Beispiele von Kernen K.
Maß: Sei µ′ ein Maß auf A′ . Definiere
K(x, A′ ) := µ′ (A′ ).
Der Kern K ist unabhängig von der ersten Koordinate.
Faltungskern: Wir betrachten die reellen Zahlen und ein Maß µ auf der Borelschen
σ-Algebra B. Definiere für x ∈ IR, B ∈ B
K(x, B) := µ(B − x).
Matrizen: Sei M eine positive n × n Matrix, M : ⌊1, n⌋ × ⌊1, n⌋ 7→ IR. Definiere
K(i, A) :=
X
M (i, j).
j∈A
M ist eine stochastische Matrix genau dann wenn K ein W-kern ist.
Bedingte Erwartung: Sei (Ω, A) = (Ω′ , A′ ) und An ∈ A, n ∈ IN, eine disjunkte meßbare
Zerlegung von E. Alle Ereignisse haben strikt positives endliches Maß µ(An ) > 0. Definiere
K(ω, A) :=
X
n
11ω∈An µ(A | An )
mittels der bedingten Maße µ(A | B) := µ(A ∩ B)/µ(B). K ist gleichzeitig die bedingte
Erwartung
K(ω, A) = E(11A | σ(An , n ∈ IN ))(ω)
bezüglich der von (An )n aufgespannten σ-Algebra.
Integralkern: Sei k : Ω × Ω′ 7→ IR+ eine positive meßbare Funktion bzgl. der Produkt
σ-Algebra A ⊗ A′ . Sei µ′ ein σ-endliches Maß auf A′ . Dann ist K
K(x, A′ ) :=
Z
A′
ein Kern.
83
k(x, y)µ′ (dy)
WS10/11
Maßtheorie
W-Maße aus Kernen
Zur weiteren Orientierung zeigen wir beispielhaft die Konstruktion von W-Maßen durch
Kerne. Dies entspricht der Vorstellung eines Wahrscheinlichkeitsbaums mit bedingten Wahrscheinlichkeiten in elementarer Notation.
Proposition 102 Seien (Ω1 , A1 , µ) ein W-raum, (Ω2 , A2 ) ein meßbarer Raum und K : Ω1 ×
A2 → IR ein W-kern. Dann ist P, definiert durch
Z
f dP =
Z Z
f (x, y)K(x, dy)µ(dx)
für positive meßbare Funktionen f ein W-maß auf dem Produktraum (Ω = Ω1 × Ω2 , A =
A1 ⊗ A2 ).
Die bedingte Erwartung unter der σ-Algebra Φ−1
1 (A1 ) =: A0 ⊂ A ist E(11A | A0 )(ω) =
Φ1 (ω)
K(Φ1 (ω), S2
(A)) f.s. und die bedingte W-keit
P (A | Φ1 = x)(x) = K(x, S2x (A))
für A ∈ A.
Beweis: • P ist wohldefiniert.
Ist f eine meßbare Funktion, so ist f (x, .) : Ω2 → IR meßbar. (Dies entspricht dem Schnitt
x
S{1,2},2
(A) einer meßbaren Menge A.)
• P ist ein W-maß. Einfach.
• P Φ−1
1 =µ
Für die bedingte Erwartung berechne durch Variablenwechsel, A0 ∋ B = Φ−1 (C), C ∈
A1 ,
Z
B
Φ (ω)
K(Φ1 (ω), S2 1 (A))P (dω)
= =
Z
C
K(x, S2x (A))µ(dx)
= P (B ∩ A) =
Z
B
=
Z
11C (x)11A (x, y)K(x, dy)µ(dx)
E(11A | A0 )dP
Die fast sichere Eindeutigkeit der bedingten Erwartung liefert die Behauptung.
q.e.d.
Dies Beispiel läßt sich erweitern auf endliche Produkte durch die Hintereinanderschaltung
mehrerer Kerne. Das Maß P wird sinngemäß definiert durch
Z
f dµ =
Z
...
Z
f (x1 , . . . , xn )K n−1 ((x1 , . . . , xn−1 ), dxn ) . . . K 1 (x1 , dx2 )µ1 (dx1 ).
(8.3)
Der Kern hat wieder die Interpretation als bedingte W-keit. (Genaue Formulierung als Übung.)
Beispiel: Polyas Urnenmodell Aus einer Urne mit S schwarzen und W weißen Kugeln
wird zufällig mit Gleichverteilung eine Kugel gezogen, die Farbe angesehen und anschließend
werden insgesamt c + 1 ∈ IN Kugeln derselben Farbe zurückgelegt. Wie groß ist die Wahrscheinlichkeit, daß im dritten Ziehen eine schwarze Kugel gezogen wird, gegeben die erste
Kugel war weiß und die zweite schwarz? Oder wie groß ist die Wahrscheinlichkeit als dritte
Kugel eine schwarze zu ziehen gegeben die erste war weiß.
Als meßbare Räume wählen wir Ω1 = Ω2 = Ω3 = {0, 1} jeweils versehen mit der Potenzmenge als σ-Algebra. 0 entspricht einer weißen Kugel und 1 einer schwarzen. Das WS
Maß µ1 auf (Ω1 , P(Ω1 )) ist gegeben durch µ1 (1) = S+W
= 1 − µ(0). Die Übergangskerne
1
2
K : Ω1 × P(Ω2 ) 7→ IR und K : Ω1 × Ω2 × P(Ω3 ) 7→ IR sind gegeben durch
K 1 (1, {1}) =
S+c
= 1 − K 1 (1, {0})
W +S+c
84
WS10/11
K 1 (0, {1}) =
U. Rösler
S
= 1 − K 1 (0, {0})
W +S+c
und für das dritte Ziehen
K 2 ((1, 1), {1}) =
S + 2c
W + S + 2c
S+c
= K 2 ((0, 1), {1})
W + S + 2c
S
K 2 ((0, 0), {1}) =
W + S + 2c
K 2 ((1, 0), {1}) =
Q
Q
usw. Das W-Maß P auf dem Produktraum ( i Ωi , P( i Ωi ) i ∈ I = {1, 2, 3} sei das Kernmaß
µ aus (8.3). Die Projektionsabbildungen Φi geben die Farbe der i-ten gezogenen Kugel an.
Damit ist die erste gesuchte Wahrscheinlichkeit
P (Φ3 = 1 | Φ1 = 0, Φ2 = 1) =
=
P (Φ1 = 0, Φ2 = 1, Φ3 = 1)
P (Φ1 = 0, Φ2 = 1)
S+c
µ1 (0)K 1 (0, {1})K 2 ((0, 1), {1})
= K 2 ((0, 1), {1}) =
1
µ1 (0)K (0, {1})
S + W + 2c
und die zweite
P (Φ3 = 1 | Φ1 = 0) =
P
i P (Φ1
= 0, Φ2 = i, Φ3 = 1)
P (Φ1 = 0)
= K 1 (0, {0})K 2 ((0, 0), {1}) + K 1 (0, {1})K 2 ((0, 1), {1}) =
S
.
S+W +c
Halbgruppen
Seien (Ωt , At ), t ∈ T meßbare Räume nd (T, ≤) sei eine halbgeordente Menge. Eine Halbgruppe
von Kernen ist eine transitive Familie K s,t : Ωs ×At 7→ IR von Übergangskernen für s < t ∈ T.
Transitiv bedeutet
K s,t ◦ K t,u = K s,u
für alle s < t < u ∈ T . Sind alle meßbaren Räume (Ωt , At ) = (E, {E}) gleich, so sprechen wir
von einer Halbgruppe von Kernen über E.
Jede solche Familie läßt sich stets erweitern um K t,t , t ∈ T durch K t,t (x, A) = 11A (x).
Wir betrachten nur erweiterte Familien und nehmen dies mit in die Definition hinein.
Im folgenden betrachten wir nur Halbgruppen über E. Sei (T, +) selbst eine Halbgruppe
(+ : T × T → T ist assoziativ). Eine Halbgruppe von Kernen über E heißt zeitlich homogen
oder zeittranslationsinvariant (bezüglich (T, +)) falls mit s, t, u, s + u, s + t ∈ T gilt
K s,t = K s+u,t+u
Wir schreiben, falls möglich, dann K t für K s,s+t .
Analog sei (E, +) eine Halbgruppe mit einer meßbaren Verknüpfung + : E × E → E. Eine
Halbgruppe von Kernen über E heißt räumlich homogen oder raumtranslationsinvariant falls
für alle x, y ∈ E, A ∈ E
K .,. (x, A) = K .,. (x + y, A + y)
gilt.
85
WS10/11
Maßtheorie
T hat in den meisten Fällen die Interpretation als Zeit und heißt daher Zeitparameterraum.
Insbesondere ist für T ⊂ IR dies eine gängige Interpretation. Wir können auch andere Objekte
zulassen, z.B. Bäume. E hat die Bedeutung eines Raumes und heißt Zustandsraum.
Kompositionshalbgruppe: Sei K ein Kern auf E. Definiere induktiv K n , n ∈ IN, durch
K n+1 := KK n = K n K.
Die Familie K m,n := K n−m , m ≤ n ∈ IN, ist eine Halbgruppe von Kernen. Diese heißt
Kompositionshalbgruppe von K. Diese ist zeittranslationsinvariant. K wird gerne als eine
Matrix M geschrieben mit Einträgen K(i, {j}). Dann ist K n die Matrixmultiplikation M n .
Faltungshalbgruppen: Sei E eine additive Gruppe (E, +) mit meßbaren Gruppenoperationen + und −. Eine Faltungshalbgruppe von Maßen ist eine Familie µs,t , s < t ∈ T ⊂ IR+
von Wahrscheinlichkeitsmaßen mit
µs,t ⋆ µt,u = µs,u ,
⋆ bezeichne die Faltung
Z
f (x + y)µ(dx)ν(dy) = inf f (z)(µ ∗ ν)(dz)(dz)
Mit K s,t (x, A) = µs,t (A − x) ergibt dies eine räumlich homogene Faltungshalbgruppe von
Kernen. (Übung).
Gauß Halbgruppe: Sei E = IR, E = B, T = IR+ . Die Gaußsche Halbgruppe wird gegeben
durch
Z
K s,t (x, B) :=
ϕx,t−s (y)dy
B
für s < t. Hierbei ist ϕm,σ2 die Dichte der Normalverteilung mit Erwartung m ∈ R und
Varianz 0 < σ 2 < ∞,
1
(y − m)2
.
ϕm,σ2 (y) := √
exp −
2σ 2
2πσ 2
(Hier ist einiges nachzurechnen.) Sie ist eine räumlich und zeitlich invariante Faltungshalbgruppe. K s,t ist ein Integralkern mit der Dichte k s,t (x, y) = ϕx,t−s (y − x) bzgl. dem Lebesguemaß.
Poisson Halbgruppe: Sei E = ZZ + , E = P(E), T = IR+ . Definiere für s < t
K s,t (x, A) :=
∞
X
n=0
exp(−(t − s))
(t − s)n
11x+n∈A = P ois(t − s)(A − x).
n!
Diese Markoffsche Halbgruppe heißt Poisson Halbgruppe. Sie ist eine räumlich und zeitlich
invariante Faltungshalbgruppe.
8.4
Maße aus Kernen
Seien (Ei , Ei ), i ∈ I = IN0 meßbare Räume und K n,n+1 : En × En+1 → IR Übergangskerne.
Durch Komposition erhalten wir hieraus eine Halbgruppe K s,t , s ≤ t. Für i < j1 < j2 <
. . . < jl , J := {j1 , . . . , jl } sei der Übergangskern K i,J : Ei × EJ → IR gegeben durch
K i,J (e, f ) :=
Z
...
Z
f (x1 , . . . , xl )K jl−1 ,jl (xl−1 , dxl )K jl−2 ,jl−1 (xl−2 , dxl−1 ) . . . K jl ,j2 (x1 , dx2 )K i,j1 (e, x1 )
analog wie das Kernmaß für positive meßbare Funktionen f .
86
WS10/11
U. Rösler
Satz 103 (Ionescu-Tulcea) In obigem Set-up gibt es einen W-Kern K : E0 × EIN → IR mit
0,J
K(e0 , Φ−1
(e0 , AJ )
J (AJ )) = K
(8.4)
für alle J = {1, 2, . . . , n}, AJ ∈ EJ .
Beweis: • Die Objekte der Übergangskerne K 0,⌊1,n⌋ ⌊1, n⌋ := {1, . . . , n} mit den Projektionen
Φ : E⌊1,n⌋ → E⌊1,m⌋ bilden ein projektives System.
Das wesentliche hierbei benötigte Argument ist
K 0,⌊1,n+1⌋ (e0 , A1 × . . . × An × En+1 ) = K 0,⌊1,n⌋ (e0 , A1 × . . . × An )
für alle n ∈ IN.
Sei R0 die Menge aller Rechteckmengen in EIN . Definiere die Abbildung K : E0 ×R0 7→ IR
wie in (8.4)
• K ist wohldefiniert.
Dies ist die projektive Eigenschaft des Systems.
Die Menge R0 der Rechteckmengen ist ein Semiring. Erweitere für jedes feste e0 ∈ E0 die
Abbildung K zu einer additiven Mengenfunktion auf dem von R0 erzeugten Ring R, Lemma
(18).
• Für jedes A ∈ R gibt es ein n ∈ IN mit K(e, A) = K 0,⌊1,n⌋ (e0 , Φn (A)) für alle e0 ∈ E0 .
Die Behauptung gilt für jede Rechteckmengen A. Da jede Menge A ∈ R eine disjunkte
endliche Vereinigung von Rechteckmengen ist und beide Seiten additiv sind, folgt die Behauptung.
• Der Inhalt K(e0 , .) ist für jedes e0 ∈ E0 ein Prämaß.
Wir zeigen die σ-Stetigkeit in der leeren Menge. Dazu sei An ∈ R, n ∈ IN, eine Folge von
Ringmengen aus R monoton fallend gegen die leere Menge. Wir haben limn K(e0 , An ) = 0 zu
zeigen.
Nehmen wir an limn K(e0 , An ) > 0 wäre strikt positiv. OEdA durch Umnummerierung
sei An = (Φn )−1 Φn An und damit K(., An ) = K 0,⌊1,n⌋ (., Φn (An )) an. Wir benutzen hier fn für
11Φn (An ) .
K(e0 , An ) =
Z
E1
Z
fn (e1 , . . . , en )K 1,⌊2,n⌋ (e1 , d(e2 , . . . , en ))K 0,1 (e0 , de1 )
Wegen monotoner Konvergenz
n
0 < lim K(e0 , A ) =
n
Z
lim
n
Z
fn (e1 , . . . , en )K 1,⌊2,n⌋ (e1 , d(e2 , . . . , en ))K 0,1 (e, de1 )
können wir ein e∗1 ∈ E1 finden mit strikt positivem Integranden an der Stelle (e0 , e∗1 ). Analog
können wir wegen
0 < lim
n
=
Z
Z
fn (e1 , . . . , en )K 1,⌊2,n⌋ (e1 , d(e2 , . . . , en ))
lim fn (e∗1 , . . . , en )K 2,⌊3,n⌋ (e2 ), d(e3 , . . . , en ))K 1,2 (e∗1 , de2 )
E2 n
ein e∗2 ∈ E2 finden mit strikt positivem Integranden an der Stelle (e0 , e∗1 , e∗2 ).
87
WS10/11
Maßtheorie
Fahren wir so fort, so finden wir induktiv ein e∗ := (e0 , e∗1 , e∗2 , e∗3 , ...). Dies e∗ ist Element
von jedem An . (Konstruktion). Dies ist ein Widerspruch.
Wir erweitern K(e0 , .) mit Caratheodory eindeutig zu einem W-Maß auf EIN .
Es verbleibt zu zeigen, daß die Abbildung K(., A) meßbar ist für jedes A ∈ EIN . Die Menge
der A’s mit dieser Eigenschaft bildet ein Dynkin-System. Dieses Dynkin-System enthält den
durchschnittstabilen Erzeuger der Rechteckmengen R0 . Damit ist dies die Produkt σ-Algebra
selber.
q.e.d.
Wir erweitern dies zu überabzählbar vielen vorgegebenen Kernen. Wir beschränken uns
der Einfachheit halber auf den Zeitparameter T ⊂ IR+ .
Satz 104 Sei K s,t , 0 ≤ s ≤ t ∈ T = IR+ , eine Markoff Halbgruppe auf einem polnischen
Raum E versehen mit der Borel σ-Algebra. Dann existiert ein Markoff Kern K : E × EIR+ 7→
IR mit
0,t
K(e, Φ−1
t (At )) = K (e, At )
s ≤ t, At ∈ E, e ∈ E.
Beweis: Sei e fest. Betrachte die W-Maße K 0,J (e, .) für J ⊂ T auf den meßbaren Räumen
(EJ , EJ ). Mit den Projektionen bilden diese ein projektives System. Das wesentliche Argument
ist wieder von der Bauart
K 0,{j1 ,j2 ,j3 } (e, Aj1 × Ej2 × Aj3 ) = K 0,{j1 ,j3 } (e, Aj1 × Aj3 )
(Bachte, das neue Element j2 wurde zwischen die anderen eingefügt, nicht notwendigerweise
am Schluss.) Nach dem Satz von Kolmogoroff 100 existiert das projektive Maß K(e, .) auf
+ N
(E IR , t∈T E) mit den Koordinatenabbildungen als Morphismen.
Dieses konstruierte Maß K(e, .) tut‘s. Die Kerneigenschaft wird standardmäßig nachgerechnet ({A ∈ . | K(., A) ist meßbar} = ...)
q.e.d.
Bem: Wir haben hier die kompakten Mengen des polnischen Raumes als kompakte Klasse
benutzt. Sollte auch ohne gehen(?).
Brownsche Maß und Brownsche Bewegung: Das Brownsche Maß ist das Maß (auf
+
dem Produktraum IRIR versehen mit der Produkt σ-Algebra zu der Gaußschen Halbgruppe
K s,t (x, B) :=
Z
B
ϕx,t−s (y)dy.
Eine Zufallsvariablen mit dieser Verteilung und (zusätzlich) stetigen Pfaden heißt Brownsche
Bewegung.
Poisson Prozess: Zu der Poissson Halbgruppe
K s,t (x, A) :=
∞
X
exp(−t + s)
n=0
+
(t − s)n
11x+n∈A = P ois(t − s)(A − x)
n!
+
gibt es ein Maß auf ZZ IR bzw. IRIR . Eine Zufallsgröße mit diesem (Markoff) Maß als Verteilung und (zusätzlich) rechtsstetigen Pfaden heißt Poisson Prozess.
Beide Prozesse haben räumlich und zeitlich invariante Übergangskerne. Mehr über die
inhaltliche Bedeutung dazu in der Sektion über Prozesse.
Bemerkung: Die Existenz von stetigen bzw. rechtsstetigen Versionen muß bewiesen werden und ist keine Trivialität.
88
WS10/11
U. Rösler
Beispiel: Produktmaße Produktmaße auf endlichen Produkträumen lassen sich als Spezialfall der Konstruktion durch Kerne sehen. Der Kern hängt nicht von der ersten Koordinate
ab. In der Sprache der Wahrscheinlichkeitstheorie liefert dies die Existenz einer Folge von
unabhängigen Zufallsgrößen Xi , i ∈ IN, mit den µi als Verteilung der Xi . Die Projektionsabbildung Φi auf dem Produktraum spielt die Rolle von Xi .
Markoffketten: Der Satz von Ionescu-Tulcea hat Anwendung in der Konstruktion von
Markoff Ketten auf einem endlichen (oder abzählbaren) Zustandsraum E. Gegeben sei eine
stochastische Matrix (positive Einträge und Zeilensumme stets 1) und eine Startwahrscheinlichkeit π auf (E, E). Die Kompositionen P n , n ∈ ZZ + bilden eine Halbgruppe. Die Zufallsgrößen Φi = Xi , i ∈ IN, auf dem Produktraum E IN mit der Produkt σ-Algebra ist eine Markoff
Kette mit den Übergangswahrscheinlichkeiten
P (Xn+1 = j | Xn = i) = P (i, j).
n
Bsp. Baumindex: Sei V = ∪∞
n=0 IN die Menge endlicher Folgen einschließlich der leeren
Folge. Diese Menge ist ein gerichteter Graph mit den Kanten (v, vi), v ∈ V, i ∈ IN. Jedem
N
Knoten v ∈ V ordnen wir einen meßbaren Raum (Ev , Av ) zu. Sei K v,(vi)i : Ev × i∈IN Avi →
IR ein Übergangskern für alle (v, (vi)i ). Solche Kerne können wir hintereinanderschalten im
Sinne
K
v,(vi)i
(L
vi,(vij)j
)i (x, A) =
Z
11A ((yi,j )i,j )
Y
Lvi,(vij)j (yi , d(yij )j )K v,(vi)i (x, d(yi )i )
i∈IN
Wir erhalten W-Kerne auf K v,(vVn ) : Ev × AvVn → IR mit Vn die Menge der Folgen der Länge
n. Dann ist für jedes x ∈ E∅ das Tupel (ΩVn , AVn , K ∅,Vn (x, .)), n ∈ IN, versehen mit den
Projektionen ΦVn ,Vm , m ≤ n ein projektives maßerhaltendes System. Dieses hat, analog zu
Ionescu-Tulcea, einen projektiven Grenzwert (ΩV , AV , K(x, .)).
89
WS10/11
8.5
Maßtheorie
Prozesse
Durchgehend benutzen wir denselben W-raum (Ω, A, P ). Alle Prozesse sind auf diesem Wraum definiert.
Ein stochastischer Prozess ist eine Familie von Zufallsgrößen Xt : Ω 7→ Et , t ∈ T. Die
Indexmenge T ist in der Regel eine geordnete Menge. Sehr häufig ist die Indexmenge eine
Teilmenge der reellen Zahlen und erhält dann die Interpretation als Zeitparameterraum. In
vielen Fällen ist (Et , Et ) = (E, E) für alle t ∈ T. Wir sprechen dann von einem Prozess mit
Zustandsraum E.
In diesem Sinne ist jede deterministische Funktion f : T 7→ E ein (degenerierter) stochastischer Prozeß. Allgemein ist die Abbildung T ∋ t 7→ Xt (ω) ein Pfad des Prozesses (zu
ω).
Q
Sei ET = t∈T Et der Produktraum. Jeder stochastische Prozeß X = (Xt )t∈T ist eine Zufallsgröße X : Ω 7→ ET , meßbar bzgl. der Produkt-σ-Algebra ET definiert durch Φt (X(ω)) =
(X(ω))(t) = Xt (ω). Die Verteilung eines Prozesses X ist das Maß P X = P (X −1 (·)) auf dem
Produktraum (ET , ET ). Eine Marginalverteilung zur Basis S ⊂ T ist das W-Maß P ΦS X =
P (XS ∈ ·) auf ES . Wir sprechen von eindimensionanlen, endlich dimensionalen (usw. ) Marginalverteilungen für S einelementig, mit endlich vielen Elementen usw.. Die endlich dimensionalen Verteilungen bestimmen im Regelfall (Kolmogoroff oder Ionescu-Tulcea) die Verteilung
des Prozesses.
Zwei Zgn X und Y, nicht unbedingt auf demselben W-raum definiert, heißen Kopien
voneinander, falls deren Verteilung übereinstimmt, P X = P Y . Durch Vergrößern, (=Produktbildung) des zugrunde liegenden W-raumes könnten wir X, Y auf demselben W-raum
betrachten. Dies ist der Regelfall. Zwei Zgn X und Y auf demselben W-Raum heißen Version voneinander, falls sie fast sicher ununterscheidbar sind auf dem Bildraum. In Formeln,
P ({X ∈ A}△{Y ∈ A}) = 0 für alle meßbaren Mengen A. Sie heißen fast sicher gleich oder
ununterscheidbar, falls P (X 6= Y ) = 0 gilt.
Der Begriff Kopie betrifft die Verteilung einer Zg, Version und Gleichheit die Ausprägung
der Zgn, einmal bzgl. dem Bildraum und einmal auf dem Definitionsraum. Gleichheit impliziert Version und Version impliziert Kopie, aber im allgemeinen nicht umgekehrt.
Betrachten wir jetzt Prozesse X, Y : Ω → ET . Diese sind Kopien voneinander, falls alle
endlich dimensionalen Marginalverteilungen übereinstimmen. Sie sind Versionen voneinander,
falls P (Xt 6= Yt ) = 0 für alle t ∈ T gilt. (Argumentiere über das Erzeugendensystem Φ−1
t (.)
der Produkt-σ-Algebra. Die Produkt-σ-Algebra ist die Menge aller meßbaren Zylindermengen
mit abzählbarer Basis.) Für die Ununterscheidbarkeit sei angemerkt, dass die Menge X 6= Y
eventuell garnicht ET meßbar ist.
Standardbeispiel: Sei Ω das Einheitsintervall, B die Borel σ-Algebra darauf, λ das Lebesgue Maß. Definiere die Prozesse Xt (ω) = 11t=ω und Yt ≡ 0, t ∈ T = [0, 1]. Diese Prozesse
sind Versionen voneinander, da P ({ω | Xt (ω) 6= Yt (ω)}) = 0 für alle t ∈ T gilt. Sie sind nicht
fast sicher gleich, die Menge X 6= Y ist der gesamte Raum Ω.
Warnung: Die Menge {X 6= Y } = {ω ∈ Ω | ∀t ∈ T | Xt (ω) 6= Yt (ω)} ist im allgemeinen nicht meßbar. Dazu sei, (Ω, B, λ, T ) wie im obigen Beispiel und A ⊂ [0, 1] eine nicht
Lebesgue meßbare Menge. Die Prozesse Xt (ω) := 11A (t)11t (ω), Yt ≡ 0, t ∈ T sind Versionen
voneinander, aber X 6= Y ist die nicht meßbare Menge A.
90
WS10/11
8.5.1
U. Rösler
Pfadmengen
Sei X : Ω → E T , Xt (ω) = X(ω)(t) ein stochastischer Prozesss mit Zeitparametermenge T in
den reellen Zahlen. Die Funktion ω 7→ supt∈T Xt (ω) ist eventuell nicht meßbar. Das Problem
taucht nur für überabzählbare T auf. Für T abzählbar ist das obige Supremum und auch
Y : Ω × T → E mit Y (ω, t) := Xt (ω) meßbar bzgl. A ⊗ ET − E, jedoch im allgemeinen
nicht für überabzählbere T. Das Meßbarkeitsproblem ließe sich umgehen, wenn jeder Pfad
ω
T ∋ t 7→ Xt (ω) durch abzählbar viele Werte Xt (ω) mit t aus einer abzählbaren Menge
bestimmt wäre. Eine derartige Theorie separabler Prozesse wurde von Doob ausgeführt (siehe
Meyer [8]).
Wir sind nicht ganz so anspruchsvoll. Unser Ziel sind zwei wichtige Prozesse, die Brownsche
Bewegung und der Poissonsche Zählprozess.
Die Brownsche Bewegung
Ein Prozess Xt , t ∈ T ⊂ IR, mit unabhängigen Zuwächsen ist ein Prozess mit Xti − Xti−1 , i =
1, ..., n, unabhängig für alle t0 < t1 < ... < tn ∈ T.
Eine Brownsche Bewegung zu σ 2 > 0 ist ein stochastischer Prozeß Xt : Ω 7→ IR, t ∈ T =
IR+ , mit den Eigenschaften
i) Die Zuwächse sind unabhängig.
ii) Xt − Xs hat eine N (0, σ(t − s)) Normalverteilung für alle s < t.
iii) X0 ≡ 0.
iv) Die Pfade T ∋ t 7→ Xt (ω) sind stetig.
Die Standard Brownsche Bewegung ist eine Brownsche Bewegung (BB) mit σ 2 = 1. Die
Standardnotation ist Bt oder Wt . (Norbert Wiener hat als erster die BB mathematisch exakt
definiert, Brown war Physiker.)
Satz 105 Die Brownsche Bewegung existiert.
Beweis: Sei µs,t die Normalverteilung N (0, (t − s)σ 2 ) für s < t. Sei K s,t , s < t ∈ IR+ , die
Gaußsche Halbgruppe,
K s,t (x, A) = µs,t (A − x).
Nach Kolmogoroff existiert zu dieser Halbgruppe ein W-Kern K T : IR × B T → IR als projektiver Limes. Nehme als Xt die Projektionen Φt auf die t-te Koordinate zu dem Maß K T (0, ·)
auf RT . Es gilt X0 = 0.
Die ersten zwei Eigenschaften werden nachgerechnet, die dritte ist einfach. Die Idee zum
Nachweis der vierten und letzten Eigenschaft besteht in der Einschränkung dieses Maßes
auf stetige Funktionen. Beachte, die Menge C der stetigen Funktionen ist nicht Produkt-σAlgebra meßbar (da sie keine Zylindermenge mit abzählbarer Basis ist). Eine entsprechende
Theorie entwickeln wir jetzt allgemein.
Sei (Ω, A, P ) ein W-raum. Das äußere Maß zu P ist die Abbildung P ∗ von der Potenzmenge über Ω in die erweiterten reellen Zahlen definiert durch
P ∗ (Q) = inf{P (A) | Q ⊂ A ∈ A}.
Das äußere Maß ist wohldefiniert, isoton und ist eine Erweiterung des Maßes (=stimmt mit
µ auf der σ-Algebra A überein).
91
WS10/11
Maßtheorie
Proposition 106 Sei (Ω, A, P ) ein W-Raum und Q ⊂ Ω eine Menge von P -äußeren Maß
1. Dann ist die Einschränkung P|Q von P auf Q, definiert durch P|Q (A ∩ Q) = P (A) für alle
A ∈ A, ein W-maß auf (Q, A|Q = {A ∩ Q | A ∈ A}).
Beweis: • P|Q ist wohldefiniert.
Sei A ∩ Q = B ∩ Q mit A, B ∈ A. Es folgt A△B ⊂ Qc . Dies impliziert Q ⊂ (A△B)c . Aus
der Istonie des äußeren Maßes folgt 1 = P ∗ (Q) ≤ P ∗ ((A△B)c ) = P ((A△B)c ) ≤ 1 und damit
P (A△B) = 0 und P (A) = P (B).
Der Rest ist einfach.
q.e.d.
Für Produktw-räume (IRT , B T , P ) ist Q eine Menge von P -äußerem Maß 1 genau dann,
wenn P (A) = 1 gilt für alle Zylindermengen A mit abzählbarer Basis, die Q ⊂ A erfüllen.
(Die Produkt-σ-Algebra ist die Menge aller Zylindermengen mit abzählbarer Basis.)
Wir werden diese Aussage anwenden auf hölderstetige Funktionen. Für 0 ≤ γ ≤ 1, d > 0
sei Hγ,d (S) die Menge der Funktionen f : S → IR mit
|f (x) − f (y)| ≤ d|x − y|γ
für alle x, y ∈ S ⊂ T. Wir verwenden zur Abkürzung Φ−1
T,S (H. (S)) = H. (S, T ).
Die Abbildung
d 7→ Hγ,d (S, T )
ist isoton (für festes γ, S) und die Abbildung
S 7→ Hγ,d (S, T )
ist antiton (für festes γ, d) und σ-stetig von unten (=für aufsteigende Mengen Sn , n ∈ IN,
gegen S gilt Hγ,d (Sn ) →n Hγ,d (S, T )).
Ein Element aus Hγ (S) := ∪d>0 Hγ,d (S) heißt (gleichmäßig) γ-hölderstetig auf S. Beachte,
Hγ (S) ist der aufsteigende Grenzwert der Mengen Hγ,dn (S), n ∈ IN, einer gegen ∞ aufsteigenden, abzählbaren Folge (dn )n . Hölderstetige Funktionen sind stetig. Die 1-Hölderstetigkeit
wird auch Lipschitzstetigkeit genannt.
Warnung, die Abbildung
S 7→ Hγ (S, T )
ist antiton, aber im allgemeinen nicht mehr σ-stetig von unten.
Proposition 107 Sei S eine Teilmenge der reellen Zahlen und sei f : S → IR (γ, d)-hölderstetig. Dann gibt es eine (γ, d)-hölderstetige Fortsetzung von f auf den reellen Zahlen. Ist S
dicht in den reellen Zahlen, so ist die Erweiterung eindeutig.
Bew: Definiere eine Fortsetzung g : S → IR von f auf dem Abschluss S von S durch g(t) =
limS∈s→t f (s). g ist wohldefiniert als Funktion, ist (γ, d)-hölderstetig und die einzige mögliche
Fortsetzung in Hγ,c (S). (Nachrechnen.)
c
c
Für x ∈ S gibt es ein größtes offenes Intervall in der offenen Menge S mit x als innerem
Punkt. Sei (a, b) dies Intervall und a, b ∈ S. Setze g linear fort auf dem Intervall [a, b] mit den
x−a
Stützwerten g(a) auf a und g(b) auf b, formal h(x) := b−x
b−a g(a) + b−a g(b). Ist a = −∞ oder
b = ∞ so wähle h(x) = g(b) bzw. = g(a). Die Fortsetzung h : IR → IR tut’s.
q.e.d.
Lemma 108 Sei P ein W-Maß auf (IRT , B T ), T ⊂ IR. Dann hat die Menge Hγ (T, T ) der γhölderstetigen Funktionen auf T äußeres Maß 1 genau dann, wenn für jede abzählbare Menge
S ⊂ T gilt P (Hγ (S, T )) = 1.
92
WS10/11
U. Rösler
S
Beweis: • Hγ (S, T ) ∈ Φ−1
S (B ) für höchstens abzählbare S.
Sei S abzählbar und ϕ : S → IN eine Abzählung von S (=ϕ ist bijektiv) und Sn =
Sn
ϕ−1 ({1, 2, . . . , n}). Die Menge Hγ,d (Sn , T ) ist in Φ−1
Sn (B ) und konvergiert gegen Hγ,d (S, T ) ∈
S
Φ−1
S (B ),
−1 −1
−1
Sn
S
Sn
Hγ,d (Sn , T ) ∈ Φ−1
Sn (B ) = ΦS ΦS,Sn (B ) ∈ ΦS (B ).
Mit einer abzählbaren Folge 0 < di րi ∞ folgt die Behauptung.
• ’Hinrichtung’:
Die ’Hinrichtung’ folgt aus der Isotonie des äußeren Maßes,
1 ≤ P ∗ (Hγ (T, T )) ≤ P ∗ (Hγ (S, T )) = P (Hγ (S, T )) ≤ 1
für S wie oben.
• ’Rückrichtung’: Sei Hγ (T, T ) ⊂ A ∈ B T . Dann ist A = Φ−1
S (Z) eine Zylindermenge
mit (höchstens) abzählbarer Basis S, Z ∈ B S . Es reicht zu zeigen Hγ (S, T ) ⊂ A, denn dies
impliziert P (A) = 1.
Sei f ∈ Hγ (S, T ). Dann existiert eine Funktion g ∈ Hγ (T, T ) mit f|S = g|S , Proposition
108. Damit
−1
−1
−1
−1
−1
−1
f ∈ Φ−1
S (f|S ) = ΦS (g|S ) = ΦS ΦS (g) ⊂ ΦS ΦS (A) = ΦS ΦS ΦS (Z) = ΦS (Z) = A.
q.e.d.
Theorem 109 Sei P ein W-maß auf dem Produktraum (IRT , B T ) mit T = [0, 1]. Falls es
Konstanten 0 < α, 1 < β und a gibt mit
Z
|f (t) − f (s)|α P (df ) ≤ a|t − s|β
für alle s < t ∈ T , so hat Hγ (T ) äußeres P -maß 1 für alle γ <
β−1
α .
Beweis: Sei Dn die Menge der reellen Zahlen 2in , 0 ≤ i ≤ 2n , und D der Grenzwert der
n
i
aufsteigenden Folge Dn . Definiere Bd = ∩n∈IN ∩2i=1 Hγ,d ({ i−1
2n , 2n }, T ) und B = ∪d>0 Bd .
• P (B) = 1.
Die Markoffungleichung liefert, δ := β − 1 − γα > 0,
c
P (Hγ,d
({s, t}, T ))
P (Bdc )
≤
R
≤
2
X X
≤
≤
=
a
|f (t) − f (s)|α P (df )
≤ αγ |t − s|β−αγ
α
α
γ
(d |t − s| )
d
n
c
P (Hγ,d
({
n∈IN i=1
i−1 i
, }, T ))
2n 2n
n
2
a X X
2−n(β−αγ)
dαγ n∈IN i=1
a X −nδ
2
dαγ n∈IN
1
a2−δ
→d→∞ 0
dαγ 1 − 2−δ
Die Abbildung d → Bd ist aufsteigend, die Bd sind meßbar und damit auch der Grenzwert B.
93
WS10/11
Maßtheorie
• ∀d > 0 ∃d′ ≥ d ∀S ⊂ T, D ⊂ S : Bd ∩ C(S, T ) ⊂ Hγ,d′ (S, T ) mit C(S, T ) = {f : T →
IR | f|S stetig }.
P
Sei f ∈ Bd , s < t ∈ S. Wir benutzen die Dualdarstellung x = i∈IN xi 2−i , xi ∈ {0, 1}
P
und nicht alle Koordinaten sind 1 ab einer gewissen Stelle. Für t = i ti 2−i und entsprechend
s sei i0 das kleinste i ∈ IN mit si 6= ti . Aktuell gilt si0 = 0 < 1 = ti0 . Sei i1 das kleinste
i > i0 mit ti = 1 und ∞, falls keine solches i existiert. Definiere die aufsteigende Folge tn =
Pn
−i ∈ D , n ∈ IN reeller Zahlen. Es gilt tn ↑ t, ti −ti−1 = t 2−i , t−u = P∞ (ti+1 −ti )
n
i
i=i0
i=1 ti 2
P
für u = ti0 und f (t) − f (u) = i=i0 (f (ti+1 ) − f (ti )) wegen der Stetigkeit. Es folgt
|f (t) − f (u)| ≤
∞
X
|f (ti+1 ) − f (ti )|
i=i0
∞
X
≤ d
≤ d
i=i0
∞
X
|ti+1 − ti |γ = d
2−iγ = d2−i1 γ
∞
X
ti+1 2−(i+1)γ
i=i0
∞
X
2−iγ
i=0
i=i1
1
d
≤
|t − u|γ
1 − 2−γ
1 − 2−γ
≤ c1 |t − u|γ
= d2−i1 γ
P
mit einer Konstanten c1 . Mit einem symmetrischen Argument, schreibe u − s = i xi 2−i in
P
der Dualdarstellung und mit der Folge xn = ni=0 xi 2−i →n u − s erhalten wir |f (u) − f (s)| ≤
c2 |u − s|γ mit eventuell einer anderen Konstanten c2 . Dies ergibt
|f (t) − f (s)| ≤ |f (t) − f (u)| + |f (u) − f (s)| ≤ c1 |t − u|γ + c2 |u − s|γ ≤ c3 |t − s|γ
mit einer Konstanten c3 ≥ d.
Die oben angeführten Abschätzungen gelten gleichmäßig in S ⊃ D.
• Bd ⊂ C(D, T )
Hölderstetigkeit impliziert Stetigkeit.
• Hγ (D, T ) = B
Aus Hγ,d (D, T ) ⊂ Bd ∩ C(D, T ) ⊂ Hγ,d′ (D, T ) folgt die Teilaussage mit d → ∞.
• ∀S ⊂ T, D ⊂ S : Hγ (S, T ) = B ∩ C(S, T )
Die Aussage folgt aus Hγ,d (S, T ) ⊂ Bd ∩ C(S, T ) ⊂ Hγ,d′ (S, T ) mit d → ∞ für eine Folge.
• P (B ∩ C(S, T )) = 1 für höchstens abzählbare S.
OEdA gilt D ⊂ S. Für jedes s ∈ S\D sei dn ∈ D eine Folge mit |dn − s| → 0 schnell
genug. Sei As,m = ∩n≥m Hγ,d ({dn , s}) und As der Grenzwert der aufsteigenden Folge As,m in
m. Wegen
X
|dn − s|β−γα < ∞
P (Acs,m ) ≤ c3
n≥m
mit c3 eine Konstante und Wahl der dn , konvergiert P (Acs,m ) in m gegen 0. Damit gilt
P (As,m ) →m P (As ) = 1. Damit ist A := ∩s∈S\D As meßbar und hat Maß 1. Aus B ∩ A ⊂
B ∩ C(S, T ) folgt die Behauptung.
• P (Hγ (S, T )) = 1 für höchstens abzählbare S.
OEdA sei D ⊂ S. Aus Hγ,d (S, T ) ⊂ Bd ∩ C(S, T ) ⊂ Hγ,d′ (S, T ) folgt B ∩ C(S, T ) =
Hγ (S, T ) und damit die Teilaussage.
Mit der Proposition 107 ergibt sich der Satz.
q.e.d.
Jetzt in stochastischer Schreibweise die stochastische Formulierung:
94
WS10/11
U. Rösler
Korollar 110 Sei X = (Xt )t∈T =[0,1] ein reellwertiger Prozeß. Falls es Konstanten 0 < α, 1 <
β und a gibt mit E|Xt − Xs |α ≤ a|t − s|β für alle s < t ∈ T , so gibt es eine γ-hölderstetige
Kopie von X für alle γ < β−1
α .
Beweis: Die ω’s ersetzen die Funktionen. Nehme die Einschränkung von P auf die Menge
{ω ∈ Ω | ∃d > 0 ∀s, t ∈ T : |Xt (ω) − Xs (ω)| ≤ d|t − s|γ }.
Diese tut’s, Proposition 106 und Satz 109.
q.e.d.
Der obige Satz und das Korollar lassen sich schnell ausdehnen auf kompakte T, nicht
jedoch auf ganz IR+ .
Bsp: Brownsche Bewegung Die Pfade der Brownschen Bewegung √
auf [0, 1] sind fast
sicher γ-hölderstetig für jedes γ < 1/2. Es gilt Xt − Xs ∼ N (0, t − s) ∼ t − sN (0, 1) und
damit
E|Xt − Xs |α ≤ aα |t − s|α/2
1
für α > 2. γ < α/2−1
= α−2
α
α →α→∞ ↑ 2 .
Insbesondere ist die Menge C der stetigen Funktionen eine 1-Menge für das äußere Maß.
Die Menge Hγ (T ) ist nicht B T meßbar, hat äußeres Maß 1 und ist in C enthalten. Standardmäßig nimmt man in die Definition der BB bereits die Stetigkeit der Pfade mit hinein,
nicht die Hölderstetigkeit.
Fortsetzung des Existenzbeweises der BB: Zu n ∈ IN sei Wtn : Ωn → IR eine BB auf dem
Intervall t ∈ Tn = [n − 1, n] mit stetigen Pfaden. Sei Pn das W-maß dazu. Durch Übergang
auf den Produktraum Ω = ΩIN versehen mit der Produkt-σ-Algebra und dem Produktmaß
können wir von unabhängigen Zgn (Wtn )t∈Tn : Ω → IRTn , n ∈, IN definiert auf demselben
W-raum ausgehen. Definiere für t ∈ IR+ , n = ⌊t⌋, die untere Gaussklammer
n+1
Wt = Wt−n
+
n
X
W1i
i=1
Dies ist eine standard Brownsche Bewegung. (Hier ist einiges Nachzurechnen.)
q.e.d.
Alternative Konstruktion: Für die Konstruktion des Prozesses ergeben sich gute Alternativen durch stetige (oder hölderstetige) Funktionen. Wir könnten einen Prozess konstruieren bzgl. der vorgegebenen Halbgruppe K s,t , s ≤ t ∈ D auf einer dichten und abzählbaren
Teilmenge D von T, wie zum Beispiel das oben verwendete D. Zeige dann µD (C(D)) = 1
oder µD (Hγ (D)) = 1 und erweitere das Maß µD von (IRD , B D ) auf (IRT , B T ). (Hintergrund
ist, jede stetige (hölderstetige) Funktion auf S kann zu genau einer auf T erweitert werden.)
Noch einmal abstrakt die (gemachte) Konstruktion. Sei (IRT , B T , µ) ein W-raum und die
Menge C(T ) der stetigen Funktionen auf T habe äußeres Maß 1. Dann ist die Abbildung
T
T
T
ϕ1 : (C(T ), B|C(T
) , µ|C(T ) ) → (R , B , µ)
definiert als Einbettung ein Maßraummorphismus, d.h. meßbar und maßerhaltend (µϕ−1 =
µ|C(T ) ). Sei D eine dichte, abzählbare Teilmenge von T. Die Abbildung
D
T
ϕ2 : (C(D), B|C(D)
, µ|C(D) ) → (C(T ), B|C(T
) , µ|C(T ) )
definiert durch die Einbettung ist ein Maßraumisomorphismus, d.h. ϕ2 ist bijektiv ϕ2 , ϕ−1
2
sind Maßraummorphismen.
95
WS10/11
Maßtheorie
Proposition 111 Sei Xt , t ∈ T = IR+ ein stochastischer Prozess auf (Ω, A, P ) mit stetigen
Pfaden. Dann ist X ′ : Ω × T → IR definiert durch X ′ (ω, t) = Xt (ω) meßbar bzgl. der ProduktN
σ-Algebra A B und der Borelschen.
Bew: OEdA sei T = [0, 1). Sei S eine dichte, abzählbare Teilmenge von T. Wie oben dargelegt
(allerdings für Ω = IRT ), ist XT : Ω → IRT A − B T -meßbar äquivalent zu XS : Ω → (IRS , B S )
meßbar wegen der Pfadstetigkeit. Die letztgenannte Zg ist genau dann meßbar, wenn X̃ :
Ω × S → IR, definiert durch X̃(ω, s) = Xs (ω), meßbar ist bzgl. der Produkt-σ-Algebra. (Die
Hinrichtung ist offensichtlich. Für die Rückrichtung verwende, für A ∈ A × Pot(S) ist jeder
Schnitt {ω ∈ Ω | (ω, s) ∈ A} in Richtung s ∈ S meßbar in A.)
Eigenschaften
Proposition 112 Sei Wt , t ∈ IR+ , eine Brownsche Bewegung zu σ 2 = VarW1 .
• Für a > 0 ist Wat , t ∈ IR+ , eine Brownsche Bewegung zum Parameter aσ 2 .
• Für a > 0 ist aWt , t ∈ IR+ , eine Brownsche Bewegung zum Parameter a2 σ 2 .
• Für s > 0 ist Xt+s − Xs , t ∈ IR+ , eine Brownsche Bewegungvzu σ 2 .
• Yt := tX1/t für t > 0 und Y0 := 0 ist f.s. eine Brownsche Bewegung zu σ 2 .
Beweis: Die ersten drei Aussagen sind einfach. Nur die vierte Aussage benötigt eine Argumentation.
Die Unabhängigheit der Zuwächse von Yt = tX1/t ist etwas Schreibarbeit, läßt sich jedoch
auf die Unabhängigkeit der Zuwächse des X-Prozesses zurückführen.
Der Zuwachs Yt − Ys = tX1/t − sX1/s = −s(X1/s − X1/t ) + (t − s)(X1/t − 0) ist eine
Summe von zwei unabhängigen Zgn mit Gaussverteilung zu den Parametern (0, s2 σ 2 ( 1s − 1t ))
2
und (0, (t − s)2 σt ). Diese ist Gaussverteilt mit Parameter die Summe der Einzelparameter
(=(0, σ 2 (t − s))).
Es verbliebe zu zeigen limt→0 tX1/t = 0 = limt→∞ Wt t . Verwende für n2 ≤ t < (n + 1)2
Wt = Wn2 + (Wt − Wn2 ) und
Borel-Cantelli gilt
W
limn→∞ nn22
X
P(
n
n
≤
|Wn2 |
n2
+
An
n2
= 0 f.s. wegen
mit An := supn2 ≤s≤(n+1)2 |Ws − Wn2 |. Mit
X EW 22
X 1
Wn2
n
≥
a)
≤
=
<∞
2
4
2
2 2
n
n n a
n n a
Borel-Cantelli liefert ebenfalls
X
|Wt |
t
An
n2
P(
D
D
→ 0 wegen An = sup0≤t≤2n+1 |Wt | =
X
An
>
a)
≤
n2
n
√
√
2n + 1A0 und
2n + 1
EA0 < ∞.
n2
q.e.d.
96
WS10/11
8.5.2
U. Rösler
Der Poissonsche Zählprozess
Ein Poissonprozess oder auch Poisson Zählprozess λ > 0 ist ein stochastischer Prozeß Xt :
Ω 7→ IR, t ∈ T = [0, ∞), mit den Eigenschaften
• Die Zuwächse sind unabhängig.
• Xt − Xs hat eine P oi(λ(t − s)) Poissonverteilung für alle s < t.
• Die Pfade t 7→ Xt (ω) sind rechtsstetig, isoton und haben nur Sprünge der Größe 1.
• X0 = 0.
Der Standard Poissonprozess ist ein Poissonprozess mit λ = 1.
Lemma 113 Der Poissonprozess existiert.
Beweis: Sei µs,t die Poissonverteilung P oi(λ(t−s)) für s < t. Sei K s,t , s < t ∈ IR+ , die Poisson
Halbgruppe,
K s,t (x, A) = µs,t (A − x).
+
Nach Kolmogoroff existiert zu dieser Halbgruppe ein W-Maß P = K T (0, ·) auf IRIR als
projektiver Limes. Nehme als Xt die Projektionen auf die t-te Koordinate. Es gilt X0 = 0.
Ersten beiden Eigenschaften: Für 0 = t0 < t1 < ... < tn , Ai ∈ B, ist zu zeigen
P (Xti − Xti−1 ∈ Ai , i = 1, ..., n) =
n
Y
µti ,ti−1 (Ai ).
i=1
Dies folgt durch die Konstruktion via den Kernen.
Zum Nachweis der dritten und letzten Eigenschaft werden wir den Prozess Xs : Ω 7→
+
ZZ , s ∈ S abzählbar mit obigen Eigenschaften betrachten und dann fortsetzen mittels X̃t =
limS∋sցt Xs punktweise. X̃t tut’s.
Sei S die Menge der dyadischen Zahlen { 2in | i ∈ IN, n ∈ IN.}. Dies ist eine dichte und
abzählbare Menge in T .
• Fast alle Pfade s 7→ Xs (ω), s ∈ S, sind stückweise konstant und haben nur Sprünge
aufwärts der Größe 1.
n
i
i−1
Eine Funktion f : IR+ 7→ IR mit f ∈ limn ∪n2
i=1 {g | g( 2n ) − g( 2n ) 6∈ {0, 1}} ist stückweise
konstant und hat nur Sprüngen aufwärts der Größe 1. (Übung). Wir schätzen ab
n
P (∪n2
i=1 {X
i
2n
6∈ {0, 1}} ≤
− X i−1
n
2
≤
≤
≤
n
n2
X
i=1
n
n2
X
i=1
n
n2
X
i=1
n
n2
X
i=1
Dies zeigt die Behauptung.
97
P (X
i
2n
6∈ {0, 1})
− X i−1
n
2
−n
exp(−λ2
)
∞
X
(λ2−n )j
j=2
j!
exp(−λ2−n )(λ2−n )2
∞
X
(λ2−n )j
j=0
j!
(λ2−n )2 ≤ nλ2 2−n →n→∞ 0.
WS10/11
Maßtheorie
• X̃t ist wohldefiniert wegen der Isotonie der Pfade.
• X̃t hat die richtige Verteilung.
Die Verteilung P oi(λs) konvergiert mit s → t gegen P oi(λt). Wegen Xs →S∋sցt X̃t hat
X̃t eine P oi(λt) Verteilung. Analog erhält man
D
(Xt1 , ..., Xtn ) = (X̃t1 , ..., X̃tn ).
q.e.d.
Beachte, wir benötigen hier nicht T = [0, 1) und die Aneinandersetzung des Prozesses.
Wir können die schöne“Version auch sofort einfacher angeben.
”
Sei Sn eine Summe von uiv Zgn zu einer Exponentialverteilung mit Parameter λ. Definiere
Nt als das größte n ∈ IN0 mit Sn ≤ t.
Lemma 114 Der Prozess (Nt )t∈IR+ ist eine Version des PP zum Parameter
Pfadeigenschaften.
1
λ
mit obigen
(Für die Gleichheit der endlich dimensionalen Verteilungen zeigt man die Markoffeigenschaft
von N und die bedingte Verteilung von Nt unter Ns ist die von Nt−s . Dies liegt an der altwie-neu-Eigenschaft einer exponentialverteilten Zg: P (X > t | X > s) = P (X < t − s) für
s < t. [?])
Eigenschaften
Proposition 115 Sei Xt : Ω → IN0 , t ∈ IR+ , ein Poissonprozess zum Parameter λ. Es gilt
• Für a > 0 ist Xat , t ∈ IR+ , ein Poissonprozess zum Parameter aλ.
• Für s > 0 ist Xt+s − Xs , t ∈ IR+ , ein Poissonprozess zu λ.
• Die Abbildung T ∋ t 7→ Xt (ω) ist fast sicher stetig in jedem t ∈ T.
• Fast alle Pfade haben unendlich viele Sprünge.
Beweis: Die ersten beiden Eigenschaften sind einfach. Für die dritte verwende die Abschätzung
P(
sup
t−ǫ≤s≤t+ǫ
|Xt − Xs | > 0) ≤ P (|Xt+ǫ − Xt−ǫ | > 0) ≤ 1 − Poi(2λǫ)(0) = 1 − e−2λǫ →ǫ 0.
Für die vierte Eigenschaft verwende
lim P (Xt ≤ n) = Poi(λt)({0, ..., n}) =
t
n
X
j=0
exp(−λ)
(λt)j
→t→∞ 0.
j!
q.e.d.
98
WS10/11
8.5.3
U. Rösler
Punktprozesse
Ein Punktprozess auf den reellen Zahlen versehen mit der Borel σ-Algebra B zum Radon Maß
µ auf den reellen Zahlen als Parameter ist ein stochastischer Prozeß Xt : Ω 7→ IN0 , t ∈ T = B,
mit den Eigenschaften
• Für paarweise disjunkte Mengen Bi ∈ B, i = 1, . . . n sind die XBi , ı = 1, . . . n unabhängig.
• XB hat eine Poi(µ(B))-Verteilung für B ∈ B.
• X∅ = 0.
• Die Pfade t 7→ Xt (ω) sind isoton bzgl. der Enthaltensordnung auf T.
Hierbei benutzen wir die Konvention, die Poissonverteilung zum Paramter ∞ ist das
Punktmaß auf unendlich.
Das Maß µ heißt Intensitätsmas̈. Das Intensitätsmaß eines Punktprozesses ist festgelegt
durch die Erwartungswerte XI von Intervallen. Der standard Punktprozess hat das Lebesmaß
als Intensitätsmaß. Damit ist X[0,t] , t ∈ IR+ ein Poisson Prozess zu λ = 1.
Existenz: Sei µ ein endliches Mas̈. Seien Zn , n ∈ IN uiv Zgn mit Verteilung µ(IµR) und N
P
sei Poi(µ(IR)) verteilt. Sei ν = N
i=1 δZi ein zufälliges Maß. Dann tut es XA := ν(A).
Die Ausdehnung auf σ-endliche Maße ist standard.
Wir können jetzt noch einen Schritt weitergehen. Seien Yn , n ∈ IN weitere uiv Zgn unP
abhängig von allem anderen. Setze ν = i∈IN δ(Zi ,Yi ) . Dann ist ν ein zufälliges Maß auf IR2
mit besonderen, schönen Eigenschaften. Wir gehen nicht in die Einzelheiten.
Bild
99
WS10/11
100
Maßtheorie
Literaturverzeichnis
[1] H. Bauer Wahrscheinlichkeitstheorie und Grundzüge der Maßtheorie De Gruyter, Berlin
1968
[2] P.J. Bickel and D.A. Freedman Some asymptotic theory for the bootstrap. Annals of
Probability 9 1196-1217, 1981.
[3] N. Dunford und J. Schwartz Linear Operators, Part I to III Wiley Interscience 1988.
[4] K.J. Falconer The Geometry of Fractal Sets. Cambridge University Press 1985
[5] P. Gaenssler und W. Stute, Seminar on empirical processes. DMV Seminar, Bd. 9, Birkhuser Verlag.
[6] Hahn-Rosenthal Set Functions Albuquerque, New Mexico 1948.
[7] P. R. Halmos Measure Theory Springer-Verlag 1974.
[8] P. A. Meyer Probability and Potentials Waltham-Toronto-London 1966
[9] Pedersen Analysis Now Springer-Verlag 1988,
101
WS10/11
102
Maßtheorie
Herunterladen