159 9 Multiplikationsoperatoren. Dichten. Lebesgueräume Wir haben festgestellt, daß die eigentlich interessanten Größen Maße sind. Gleichungen, die physikalische Größen beschreiben sollten also Gleichungen sein, dessen Lösungen Maße sind. Wenn wir uns die üblichen Gleichungen anschauen, stellen wir fest, daß sie immer Funktionen beschreiben, keine Maße. Auch werden die Gleichungen selten in C und nie in C∗ betrachtet. Man betrachtet Gleichungen in Lebesgueräumen oder Sobolevräumen. Wie hängt das mit unserem mathematischen Rahmen zusammen? Die zugrunde liegenden physikalischen Probleme sind ja weitestgehend dieselben. Die Funktionen, nach denen in Lebesgue- oder Sobolevräumen gesucht wird sind Dichten von Maßen. Das ist eine sehr gute Idee, denn Dichten sind Funktionen von Punkten, mit denen man viel besser arbeiten kann als mit Maßen. Wie immer in der Mathematik, wenn man denkt, man erleichtert sich das Leben, hat das eine Kehrseite. Deshalb ist es wichtig, genau zu untersuchen, was der Übergang von Maßen zu Dichten bedeutet. Formal gesprochen ist eine Dichte der Quotient zweier Maße. Aus physikalischer Sicht bedeutet das, man betrachtet anstelle zweier extensiver Größen eine intensive Größe, ihren Quotient. Hier sieht man schon, daß man zur Definition einer Dichte zwei Maße braucht. Mathematisch sagt man auch, man betrachtet die Dichte eines Maßes bezüglich eines anderen, gegebenen Maßes. Wenn man Dichten betrachtet, muß man also als erstes ein Maß wählen bezüglich dessen man Dichten von anderen Maße finden will. Es ist – wie immer in der Mathematik – sinnvoll, wenn diese Wahl kanonisch erfolgt, wenn also das betrachtete Problem die Wahl vornimmt. 9.1 9.1.1 Multiplikationsoperatoren Der Operator Pg und sein adjungierter Die Multiplikation reeller Zahlen induziert in C(Z) die Struktur einer kommutativen Banachalgebra: (f · g)(z) = f (z)g(z). Folglich hat der Ausdruck hf · g, pi, f, g ∈ C, p ∈ C∗ einen Sinn. Je nach dem welches Element man festhält lassen sich die anderen als Wirkung dieses Elements auf ein anderes betrachten. Damit lassen sich verschiedene Multiplikationsoperatoren definieren. Es sei Pg : C(Z) − → C(Z), Pg f = f · g, (Pg f )(z) = f (z) · g(z) Dieser Operator hat folgende weitgehend offensichlichen Eigenschaften: • Pg f = Pf g • Pg ≥ 0 ⇐⇒ g ≥ 0 • kPg k = kgk • Pg 1 = g Im endlichdimensionalen Fall entspricht Pg eine Diagonalmatrix. Zu Pg läßt sich der adjungierte und biadjungierte definieren: P∗g : C∗ (Z) − → C∗ (Z) P∗∗ : C∗∗ (Z) − → C∗∗ (Z) g 160 9 MULTIPLIKATIONSOPERATOREN. DICHTEN. LEBESGUERÄUME Es ist hPg f, pi = hf, P∗g pi = hP∗∗ g f, pi Auf der rechten Seite ist die stetige Funktion f als Element aus C∗∗ (Z) aufzufassen. Offensichtlich ist Pg = P∗∗ g auf C. P∗∗ ist auf ganz C∗∗ (Z) definiert und wirkt auf charakteristischen Funktionen auch als Multig plikationsoperator: P∗∗ g 1B = g · 1B was die Einschränkung von g auf B bedeutet. Damit kann man die Wirkung von P∗g beschreiben. Es sei q = P∗g p, dann ist Z ∗ ∗ ∗∗ q(B) = (Pg p)(B) = h1B , Pg pi = hPg 1B , pi = hg · 1B , pi = g(z)p(dz) B Dieser Ausdruck wird formal auch häufig q = g · p geschrieben. Er definiert ein neues Maß als Produkt eines Maßes mit einer stetigen Funktion. Da P∗g ein beschränkter Operator auf C∗ ist, liefert diese Konstruktion stets wieder ein Radonmaß. g wird Dichte des Maßes q bezüglich des Maßes p genannt. Es sei Ip = q ∈ C∗ | ∃g ∈ C, q = P∗g p} Ip ist die Menge aller Maße, die bezüglich des gegebenen Maßes p eine stetige Dichte haben. ÜA 28) Bestimme das Spektrum von Pg in C. 9.1.2 Der Operator Qp und der Satz von Radon-Nikodym Wir betrachten für gegebenes p ∈ C∗ den Operator C(Z) − → C∗ (Z), Qp g = P∗g p Z (Qp g)(B) = g(z)p(dz) Qp : B ÜA Als beschränkter Operator läßt sich Qp als Integraloperator darstellen: Z (Qp g)(B) = g(z)a(B, dz) B Bestimme des Integralkern a(B, A). Lösung: Es gilt a(B, A) = (Q∗p 1A )(B) = h1A , Qp 1B i = h1A · 1B , pi = h1A∩B , pi = p(A ∩ B) Dieser Operator hat folgende weitgehend offensichlichen Eigenschaften: • Qp ≥ 0 ⇐⇒ p ≥ 0 • kQp k = kpk • Qp 1 = p 161 9.1 Multiplikationsoperatoren • Q∗p : C∗∗ (Z) − → C∗ (Z), Q∗p |C = Qp (weil f · g = g · f ) • p(B) = 0 =⇒ q(B) = (Qp g)(B) = 0, g ∈ Ip . Von besonderem Interesse ist das umgekehrte Problem: Es sei ein Maß p gegeben. Wann hat ein Maß q eine Dichte bezüglich p. Die letzte der eben betrachteten Eigenschaften zeigt, daß das nicht für jedes Maß q der Fall ist sondern eine notwendige Bedingung ist, daß die Nullmengen bezüglich p auch Nullmengen bezüglich q sein müssen. Tatsächlich ist diese bedingung in gewissem Sinne auch hinreichend. Es gilt der berühmte Satz von Radon-Nikodym: Es seien p und q aus P (wir betrachten hier nur positive Maße) mit der Eigenschaft p(B) = 0 =⇒ q(B)R = 0 für alle B ∈ B. Dann existiert eine eindeutig definierte Funktion h ∈ L1 (p) mit q(B) = B h(z)p(dz). Der Beweis des Satzes läßt sich in DS I nachlesen. Er ist nicht konstruktiv und benutzt das Auswahlaxiom. Darauf wird in vielen Büchern nicht explizit hingewiesen, weshalb der Beweis in DS I sehr empfehlenswert ist. Bemerkungen: • Die Dichte wird auch Radon-Nikodym Ableitung genannt und mit h = q/p oder h = dq/dp bezeichnet. • Gilt die Beziehung p(B) = 0 =⇒ q(B) = 0, so sagt man auch, daß q absolut stetig bezügl. p ist und schreibt q ≪ p. • Aus der Integraldarstellung folgt h(z) = q(B) , z∈B p(B) falls h auf B konstant ist. Damit erinnert diese Formel stark an die Definition einer intensiven Größe als Quotient zweier extensiven Größen. • Hat q bezüglich p die Dichte h und r bezüglich q die Dichte g, so hat r bezüglich p die Dichte g · h. Es gilt Z Z r(B) = h(z)q(dz) = h(z)g(z)p(dz) B B • Die Eindeutigkeit der Dichte bezieht sich nur auf Dichten in L1 (p). Auf Nullmengen von p ist es egal, welchen Wert die Dichte annimmt. Der Satz von Radon-Nikodym ist ein reiner Existenzsatz und hilft oft nicht weiter, wenn man eine Dichte aus zwei gegebenen Maßen tatsächlich berechnen möchte. Der Satz behauptet die eindeutige Existenz einer Dichte im Lebesgueraum L1 (p). Wir sind allerdings an stetigen Dichten interessiert, worüber der Satz keine Auskunft gibt. Die Stetigkeit ist einerseits wichtig, damit das Konzept der Dichte in unseren mathematischen Rahmen paßt und andererseits, da wir ausgehend von physikalischen Überlegungen wissen, daß eine intensive Größe sinnvollerweise ststig sein soll. Wir betrachten im weitern nur solche Maße p, q ∈ P mit einer stetigen Dichte g = q/p ≥ 0. Ausgehend von der Gleichung q = P∗g p = Qp g ist es natürlich, die Dichte g formal als g = Q−1 p q 162 9 MULTIPLIKATIONSOPERATOREN. DICHTEN. LEBESGUERÄUME zu definieren. Um diese Darstellung zu rechtfertigen ist der Definitionsbereich von Q−1 p zu be−1 schreiben (er ist offensichtlich eine Teilmenge von Ip ) und zu untersuchen, wann Qp überhaupt eindeutig definiert ist. Es ist klar, daß auf offenen Mengen U mit p(U) = 0 auch q(U) = 0 gilt und deshalb g auf dieser Menge unbestimmt ist. Das ist für Funktionen aus L1 irrelevant, für stetige Funktionen auf Z aber wichtig. Andererseits ist klar, daß im endlichdimensionalen Fall Q−1 p stets auf dem ganzen raum eindeutig definiert ist, falls alle Komponenten von p echt positiv sind. Eine Verallgemeinerung hierfür wäre die Forderung, daß für alle U ∈ O, p(U) > 0 gilt. In diesem Fall läßt sich die Dichte auch am Punkt z definieren. Es sei Un eine Folge offener Mengen mit den Eigenschaften • p(Un ) > 0. • Un+1 ⊂ Un T • ∞ n=1 Un = {z} dann definieren wir g(z) als q(Un ) n→∞ p(Un ) g(z) = lim Es sei A die Menge aller Punkte, für die dieser Grenzwert existiert. Wie schreiben g = Q−1 p q, falls sich g von A zu einer stetigen Funktion auf Z fortsetzen läßt. Die entscheidende Voraussetzung ist hier, daß man die abgeschlossene Menge {z} als Durchschnitt offener Mengen darstellen kann. Das ist stets der Fall, da Z metrisierbar ist. In einem metrisierbaren Raum ist jede abgeschlossene Menge eine Gδ -Menge. Wir werden uns mit der Frage der Definition von Q−1 p nicht weiter beschäftigen. Es stellt sich heraus, daß wir die Probleme, in der wir den Operator Q−1 p eigentlich benötigen würden, auch −1 formulieren können, ohne die Verwendung von Qp . 163 9.2 Lebesgueräume 9.2 Lebesgueräume Wir betrachten für ein reelles r mit 1 < r < ∞ und ein µ ∈ P den Ausdruck Z r1 D E 1r r r = |f | , µ |f (z)| µ(dz) kf kr := kf kLr := kf kLr (µ) := Z Dieser Ausdruck ist für alle f ∈ C definiert und ist ein Norm. Wir bezeichnen den Banach-Raum, der durch die Vervollständigung von C in dieser Norm entsteht als Lr (µ)-Raum (Lebesgueraum). Der zu Lr duale Raum ist der Lr′ mit 1r + r1′ = 1. Die duale Paarung zwischen Lr (µ)- und Lr′ (µ)-Räumen bezeichnen wir mit runden Klammern Z (f, g)µ = hf · g, µi = f (z)g(z)µ(dz) . Z Die Elemente eines solchen Raumes werden üblicherweise als punktweise (bezüglich µ) gegebene Funktionen interpretiert. Es ist konsistenter, sich die Elemente in Lr (µ)-Räumen als Grenzwerte von Folgen stetiger Funktionen bezüglich dieser Norm vorzustellen. In diesem Sinn ist nicht klar, ob sich die Grenzwerte auch als Funktionen auf Z betrachten lassen. Streng genommen sind die Funktionen nur in solchen Punkten z definiert, für die µ({z}) 6= 0 gilt. Üblicherweise werden die Elemente in Lr (µ)-Räumen deshalb als “Klassen von Funktionen” bezeichnet, deren Vertreter – bis auf Werte auf Mengen vom Maß = 0 – übereinstimmen. In diesem Sinn ist nicht ganz klar, was denn Lr (µ) ∩ C ist. Für uns sind stetige Funktionen aus Lr (µ) solche, die Grenzwerte konstanter Folgen stetiger Funktionen sind. Diese Vorstellung entspricht der, die man sich von den reellen Zahlen als Grenzwerte von Folgen rationaler Zahlen macht. Diese Grenzwerte kann man sich natürlich nicht mehr als “rationale Zahlen” vorstellen. Sie benötigen ein völlig andere Darstellung. Unter den Folgen rationaler Zahlen gibt es natürlich auch solche, die gegen rationale Zahlen konvergieren, z.B. konstante Folgen. Es gelten folgende Eigenschaften: • Für stetige f gilt kf kr ≤ kf kC . Das folgt aus der Ungleichung r kf krr = h|f |r , µi ≤ supz∈Z |f (z)|r h1, µi = supz∈Z |f (z)| · 1 = kf krC • Konvergente Folgen in C konvergieren auch in Lr (µ) • Eine dichte Menge in C ist auch dicht in Lr (µ). • Die Fortsetzung eines in C dicht definierten Operators ist auch in Lr1 (µ) dicht definiert. • Zwei Räume Lr1 (µ) ⊂ Lr2 (µ) sind ineinader eingebettet gdw. r1 ≤ r2 . Wenn man ein Maß µ ausgezeichnet hat, dann kann man die Aufgabe in einem Lr (µ) betrachten (wir beschränken uns im weiteren auf den Hilbertraum L2 (µ). C ist per Definition dicht in L2 (µ) (er wurde ja als Abschluß definiert). Man kann die in C definierten Operatoren jetzt nach L2 (µ) erweitern. Frage: Welcher L2 (µ) ist für ein gegebenen Operatoren besonders gut geeignet? Natürlich der, indem der Operator besonders gute Eigenschaften hat. Was sind besonders gute Eigenschaften: • Beschränktheit, bzw, besonders kleine Norm. Wenn der Operator z.B. kontraktiv ist (Norm kleiner gleich 1), dann kann man ihn mehrfach anwenden. Wenn das nicht der Fall ist, besteht die Gefahr, daß das mehrfache Anwenden aus dem Raum herausführt. 164 9 MULTIPLIKATIONSOPERATOREN. DICHTEN. LEBESGUERÄUME • Symmetrie (Selbstadjungiertheit). Symmetrische Operatoren lassen sich diagonalisieren, mit ihnen kann man gut rechnen. • Falls Symmetrie prinzipiell nicht möglich ist (weil das Spektrum nicht reell ist), sollte der Operator wenigstens normal sein. Ein Operator ist normal, wenn er mit seinem adjungierten kommutiert. Es stellt sich heraus, daß der richtige Raum der über dem stationären Maß ist. Auf diese Idee kann man folgendermaßen kommen: Wir betrachten eine Trajektorie p(t) für 0 ≤ t ≤ ∞ und nehmen an, daß sie gegen einen Gleichgewichtszustand p(∞) konvergiert. Weiter nehmen wir an, daß p(t) eine Dichte h(t) bezüglich eines gegebenen Maßes µ hat. Frage: Wann (für welches µ) liegt die Trajektorie der Dichte – oder wenigstens ein großer Teil – in L2 (µ)? Es ist klar, daß h(∞) in L2 (µ) liegt, wenn µ das stationäre Maß ist, denn dann ist h(∞) = 1 und das liegt überall. Wenn die Dichte im Gleichgewicht in L2 (µ) liegt, dann liegt sie vielleicht auch kurz davon drin oder sogar insgesamt, wenn p0 entsprechend gewählt wurde. 9.2.1 Markowoperatoren in Lr Satz: Die bekannte Kontraktivität von Markowoperatoren in C gilt auch für die Lr (µ)-Norm, falls M∗ µ = µ. Beweis: Das folgt aus der Karamata-Ungleichung (32) mit p = µ und der konvexen Funktion F (x) = |x|r . Es sei g ∈ C, dann gilt kMgkrLr = h|Mg|r , µi ≤ hM|g|r , µi = h|g|r , M∗ µi = h|g|r , µi = kgkrLr Aus L1 = M1 = 1 und k1kLr = 1 folgt die Gleichheit. Das ergibt die gesuchte Gleichheit 1 1 kMgkLr = h|Mg|r , µi r = h|g|r , µi r = kgkLr (37) Wie bekannt lassen sich beschränkte Operatoren mit der selben Norm fortsetzen. Es gilt also kLkLr = kMkLr = kMkC = 1 9.2.2 Der Raum L2 (µ) Von besonderer Bedeutung ist der (reelle) Hilberraum L2 (µ). Das Skalarprodukt in diesem Raum ist Z (g, f )µ = (f, g)µ = hf · g, µi = hf, Qµ gi = hg, Qµf i = f (z)g(z)µ(dz) . Z Die Fortsetzung eines Markowoperators M in L2 (µ) ist kontraktiv. Das folgt aus der Ungleichung (??) mit der speziellen konvexen Funktion F (x) = x2 . Es gilt kMgk2L2 = (Mg)2 , µ ≤ Mg 2 , µ = g 2, M∗ µ = g 2, µ = kgk2L2 Damit ist bewiesen, daß die Fortsetzung eines Markowoperators M in L2 (µ) die Norm 1 hat (weil neben der Ungleichung auch noch M1 = 1 und k1kL2 = 1 gilt. 9.2 Lebesgueräume 9.2.3 165 Operatoren in L2 (µ) und ihre adjungierten Es sei M : C −→ C ein Markowoperator und L seine Fortsetzung in L2 (µ). Als Operator im Hilberraum können wir seinen adjungierten Operator L∗ betrachten. Er ist durch die Gleichung (Lf, g)µ = (f, L∗ g)µ, f, g ∈ L2 (µ) definiert. Es seien f, g ∈ C. Für die linke Seite gilt dann (Lf, g)µ = hg · Mf, µi, f, g ∈ C Angenommen, auch L∗ ist die Fortsetzung eines beschränkten Operators X : C − → C, dann ist L∗ g = Xg (im allgemeinen ist nicht klar, ob L∗ g ∈ C für g ∈ C) und auch das Skalarprodukt auf der rechten Seite läßt sich als duale Paarung schreiben. Es gilt dann (Lf, g)µ = hg · Mf, µi = hf · Xg, µi = (f, L∗ g)µ , f, g ∈ C Sollte L = L∗ gelten, dann ist die Existenz eines entsprechenden X klar, es gilt X = M. Dieser Fall, daß die Fortsetzung eines Markowoperators in einen L2 ein selbstadjungierter Operator ist, ist ein besonderer Fall, was aus folgendem Satz klar wird: Satz: Die Fortsetzung eines Markowoperators M in einen L2 (µ) sei selbstadjungiert, dann ist das Maß, das den L2 -Raum gebildet hat, ein stationäres Maß von M∗ . Beweis: Die Fortsetzung von M sei L. Da L = L∗ , gilt hg · Mf, µi = hf · Mg, µi, f, g ∈ C Wir setzen f = 1. Das ergibt hg, µi = hMg, µi = hg, M∗µi, g ∈ C Aus der Beliebigkeit von g folgt M∗ µ = µ. Bemerkungen: Unter allen Operatoren in einem Hilbertraum spielen die selbstadjungierten eine besondere Rolle. Sie haben z.B. reelles Spektrum und lassen sich diagonalisieren. Diese besondere Eigenschaft erlangen Markowoperatoren also nur dann, wenn man sie in einem L2 über dem stationären Maß betrachtet. In allen anderen L2 -Räumen ist das nicht der Fall. Wenn man also ein Problem in einem L2 -Raum betrachten will, muß der richtige gewählt werden, nämlich der über einem stationären Maß. Es ist klar, daß ein Operator, der in C kein rein reelles Spektrum hat, in keinem L2 -Raum selbstadjungiert sein kann. Auch in diesem Fall, ist es sinnvoll den L2 -Raum über einem stationären Maß zu wählen. Der Operator kann sich dann als normal (kommutiert mit seinem adjungierten) herausstellen. Nicht jeder Operator mit rein reellem Spektrum ist selbstadjungiert in L2 (µ). Man kann sogar diagonalisierbare Matrizen finden, die diese Eigenschaft nicht haben. Der Fall, daß die Fortsetzung eines Markowoperators im L2 über einem seiner stationären Maße selbstadjungiert ist, wird detailierte Balance genannt und spielt eine wichtige Rolle in der Theorie der Markowprozesse und ihren physikalischen Anwendungen. Oft wird gerade dieser Fall behandelt, da sich hier relativ einfach Aussagen erzielen lassen. 166 9.2.4 9 MULTIPLIKATIONSOPERATOREN. DICHTEN. LEBESGUERÄUME Der Operator X Wir nehmen im weiteren an daß es zu einem Markowoperator M und einem seiner stationären Maße µ einen beschränkten Operator X gibt, der die Gleichung hg · Mf, µi = hf · Xg, µi, f, g ∈ C (38) erfüllt und wollen seine Eigenschaften untersuchen. Die Ausdrücke auf der linken und rechten Seite von (38) lassen sich äquivalent umschreiben. Es gilt hg · Mf, µi = hMf, Qµ gi = hf, M∗ Qµ gi hf · Xg, µi = hXg, Qµ f i = hf, Qµ Xgi Zusammen mit (38) ergibt das die zu (38) äquivalente Gleichung hf, M∗ Qµ gi = hf, Qµ Xgi, f, g ∈ C (39) die wiederum zur Gleichung M∗ Qµ g = Qµ Xg, g ∈ C (40) als Gleichung in C∗ und diese wiederum äquivalent zur Operatorgleichung M∗ Qµ = Qµ X, ∈ L(C, C∗ ) (41) ist. Eine formale Lösung dieser Gleichung wäre ∗ X = Q−1 µ M Qµ (42) Aus der letzten Darstellung lassen sich formal folgende Eigenschaften herleiten: • X≥0 ∗ Beweis: Folgt aus der Positivität jedes einzelnen der Operatoren Q−1 µ , M und Qµ . ∗ −1 ∗ −1 • X1 = 1. Beweis: X1 = Q−1 µ M Qµ 1 = Qµ M µ = Qµ µ = 1 • X∗ µ = µ. Beweis: ∗ ∗ ∗ ∗∗ −1 −1 X∗ µ = (Q−1 µ M Qµ ) µ = Qµ M Qµ µ = Qµ MQµ µ = Qµ M1 = Qµ 1 = µ ∗ X ist also ein Markowoperator, dessen adjungierter dasselbe stationäre Maß hat. Diese Eigenschaften lassen sich streng aus (38) herleiten, wenn man folgende Bedingung an µ stellt: µ(U) > 0, U ∈ O(Z) Diese Bedingung entspricht der Bedingung µi > 0 im endlichdimensionalen Fall. ÜA 35) Beispiel: Es sei M = Mϕ ein deterministischer Markowoperator mit stetig invertierbarer Funktion ϕ. Berechne den entsprechenden Operator X.