8.4 Markowoperatoren 8.4 137 Markowoperatoren Im Gegensatz zu dynamischen Systemen, bei denen ϕ : Z − → Z′ eine beliebige stetige, vorwärts in der Zeit abbildende Abbildung war, sind im C − P-Kontext nur lineare Abbildungen (lineare Operatoren) als Zustandsänderung von Interesse. Mit den heuristischen Betrachtungen im Abschnitt 8.2 auf Seite 130 haben wir uns klargemacht, daß physikalsich sinnvolle Zustandsänderungen lineare Operatoren sind, die P(Z) nach P(Z′ ) abbilden. Diese Eigenschaft haben Operatoren M∗ , die adjungierte von Operatoren M : C(Z′ ) − → C(Z) mit den Eigenschaften M ≥ 0 und M1′ = 1, sind. Solche Operatoren heißen Markowoperatoren. Es zeigt sich, daß auch die Umkehrung in folgendem Sinne gilt: Falls ein Operator der adjungierte eines Operators ist und P(Z) nach P(Z′ ) abbildet, dann ist er der adjungierte eines Markowoperators. Es gibt Operatoren, die P(Z) nach P(Z′ ) abbilden und nicht adjungierte Operatoren sind (also keinen präadjungierten besitzen). Es ist aus verschiedenen Gründen sinnvoll, solche Operatoren nicht zu betrachten. Im weiteren werden wir stets ohne es explizit zu erwähnen, annehmen, daß ein Operator aus L C∗ (Z), C∗ (Z′ ) einen präadjungierten aus L C(Z′ ), C(Z) besitzt. 8.4.1 Definition und wichtigste Eigenschaften Markowoperatoren sind positive und 1 erhaltende Operatoren. Wir bezeichen die Menge der Markowoperatoren mit M Z′ ), Z = M ∈ L C(Z′ ), C(Z) | M ≥ 0, M1′ = 1 Im Falle Z′ = Z bezeichnen wir die Menge der Markowoperatoren mit M(Z). Wo klar ist, ′ zwischen welchen Räumen die Operatoren wirken, schreiben wir M anstelle von M Z ), Z oder M(Z). Wir fassen die wichtigsten Eigenschaften von Markowoperatoren zusammen und beweisen sie anschließend in einzelnen Sätzen, die zum Teil allgemeiner sind und insbesondere Umkehrungen enthalten. • • • • • M ∈ M ⇐⇒ M∗ P ⊂ P |Mg| ≤ M|g| kMk = 1 M ist konvex. M(Z) bildet eine Halbgruppe. Die Identität I ist die Einheit. Satz: M ≥ 0 ⇐⇒ M∗ ≥ 0. Beweis(=⇒): Es sei p ≥ 0, es ist zu zeigen, daß hg, M∗pi ≥ 0 für alle g ≥ 0. Es sei g ≥ 0 beliebig. Dann ist auch Mg ≥ 0, da M ≥ 0. Es folgt hMg, pi ≥ 0, weil p ≥ 0. Aber hMg, pi = hg, M∗ pi. Beweis(⇐=): Analog. Satz: M1′ = 1 ⇐⇒ h1, pi = 1 =⇒ h1, M∗ pi = 1, p ∈ P . Beweis(=⇒): Es sei M1′ = 1 und h1, pi = 1. Dann gilt 1 = h1, pi = hM1, pi = h1, M∗ pi Beweis(⇐=): Sei umgekehrt h1, pi = 1 und h1, M∗ pi = 1 für p ∈ P. Dann folgt hM1 − 1, pi = 0 für alle p ∈ P. Da P total in C∗ ist, folgt M1 − 1 = 0. Folgerung: M ≥ 0, M1 = 1 ⇐⇒ M∗ P ⊂ P′ . 138 8 ZUSTANDSÄNDERUNGEN Satz: (1184 S.135) |Mg| ≤ M|g| ⇐⇒ M ≥ 0 Beweis(=⇒): g ≥ 0, 0 ≤ |Mg| ≤ M|g| = Mg Beweis(⇐=): |Mg| = |M(g+ − g− )| = |Mg+ − Mg− | ≤ |Mg+ | + |Mg− | = Mg+ + Mg− = M(g+ + g− ) = M|g|. Die Positivität wurde im Schritt |Mg± | = Mg± benutzt. Satz: (siehe 1184 S.169) Es sei M1 = 1. Dann ist M ≥ 0 ⇐⇒ kMk ≤ 1 Beweis(=⇒): M ≥ 0 =⇒ |Mg| ≤ M|g| ≤ Mkgk · 1 = kgk =⇒ supg |Mg| ≤ kgk =⇒ kMk ≤ 1. Tatsächlich gilt kMk = 1, wenn man g = 1 setzt. Beweis(⇐=): Zum Beweis benutzen wir die Äquivalenz kg − f k ≤ r ⇐⇒ f − r 1 ≤ g ≤ f + r 1 Es sei 0 ≤ g ≤ 2 =⇒ −1 ≤ g − 1 ≤ 1 =⇒ kg − 1k ≤ 1 Jetzt gilt kMg − 1k = kMg − M1k = kM(g − 1)k ≤ kg − 1k ≤ 1 =⇒ −1 ≤ Mg − 1 ≤ 1 =⇒ 0 ≤ Mg ≤ 2. Satz: M ist konvex. Beweis: Es sei M1 , M2 ∈ M und α1 , α2 ∈ R mit α1 ≥ 0, α2 ≥ 0 und α1 + α2 = 1. Wir beweisen α1 M1 + α2 M2 ∈ M: Da α1 ≥ 0, α2 ≥ 0 und die Menge der positiven Operatoren einen Kegel bilden, ist auch α1 M1 + α2 M2 ≥ 0. Weiter gilt (α1 M1 + α2 M2 )1′ = α1 M1 1′ + α2 M2 1′ = α1 1 + α2 1 = (α1 + α2 )1 = 1. Satz: M(Z) bildet eine Halbgruppe. Die Identität I ist die Einheit. Beweis: Es sei M1 , M2 ∈ M(Z). Wir beweisen M2 M1 ∈ M(Z). Es sei g ≥ 0, dann ist M1 g ≥ 0 und M2 (M1 g) ≥ 0, weil M1 , M2 positive Operatoren sind. Es sei Mi 1 = 1. Dann ist M2 M1 1 = M2 1 = 1. Zum Beweis, daß I die Einheit ist, ist zu zeigen, daß I Markowoperator ist, was wegen Ig = g für alle g ∈ C(Z) offensichtlich ist. 8.4.2 Beispiele → R eine stetig differenzierbare, monoton nicht ÜA 28) Es sei Z = Z′ = [0, 1]. und h : [0, 1] − fallende Funktion mit h(0) = 0 und h(z) > 0 für z > 0. Wir definieren einen Operator M : C(Z′ ) − → C(Z) durch Z z 1 (Mg)(z) = h′ (z ′ )g(z ′ )dz ′ h(z) 0 Beweisen Sie, daß es sich um einen Markowoperator handelt. Bestimmen Sie den adjungierten Operator. ÜA 29) Es sei (Z, C, P) (Z′ , C′ , P′ ) gegeben. Es seien h1 , ..., hn ∈ C. Weiter seien A1 , ..., An disjunkte abgeschlossene Teilmengen von Z′ und p1 , ..., pn W-Maße aus P′ mit pi (Ai ) = 1. Welche Eigenschaften müssen die hi haben, damit der Operator Xn hg, pi ihi Mg = i=1 ein Markovoperator M : C(Z′ ) − → C(Z) ist? Wann ist M ein Projektor? 139 8.4 Markowoperatoren 8.4.3 Darstellung von Markowoperatoren. Bedeutung des Integralkerns Wie jeder beschränkten Operator kann man auch Markowoperatoren auf eindeutige Weise als Integraloperatoren mit einem Integralkern ω(B ′ , z) darstellen. Es gilt Z (Mg)(z) = g(z ′ )ω(dz ′ , z) = hg, ω(·, z)i (26) ′ Z Z ∗ ′ (M p)(B ) = ω(B ′ , z)p(dz) = hω(B ′, ·), pi (27) Z Der Integralkern ω hat folgende speziellen Eigenschaften, die aus den Eigenschaften von Markowoperatoren folgen. • ω(B ′ , z) ≥ 0 (folgt aus M ≥ 0) • ω(Z′ , ·) = 1 (folgt aus M1′ = 1) • ω : B′ × Z − → [0, 1] • ω(·, z) ∈ P(Z′ ) • ω(B ′ , ·) ∈ C(Z) Offenbar ist ω(B ′ , z) = (M∗ δz )(B ′ ). Die Funktion ω(B ′, z) läßt sich für festes z als Wahrscheinlichkeit interpretieren, nämlich als Wahrscheinlichkeit, daß sich das System nachher (nach der Zustandsänderung) in einem Zustand aus B ′ befindet, wenn es sich vorher im Zustand z befand. Daher wird der Integralkern ω(B ′, z) oft auch als Übergangswahrscheinlichkeit bezeichnet. Die Menge der Markovoperatoren M(Z) ist eine konvexe Untermenge der Algebra L(C) und bildet eine nichtkommutative Halbgruppe weil M = M2 M1 wieder Markovoperator ist. Hieraus folgt, daß für die Kerne (das seien entsprechend ω, ω2, ω1 ) Z ω(B, z) = ω2 (B, ·), ω1 (·, z) = ω2 (B, z ′ )ω1 (dz ′ , z) Z gilt. Diese Eigenschaft heißt manchmal auch Markowbedingung. Hier ist sie eine Folge davon, daß M eine Halbgruppe ist und keine zu fordernde Bedingung. 8.4.4 Ungleichungen mit Markowoperatoren Markowoperatoren genügen einer Vielzahl von fundamentalen Ungleichungen, die relativ einfach zu beweisen sind. • |Mg| ≤ M|g| (siehe Satz auf S. 148). • gmin ≤ (Mg)(z) ≤ gmax Beweis: Folgt aus gmin 1 ≤ g ≤ gmax 1 nach Anwendung von M auf diese Ungleichung. Bemerkung: Diese Ungleichung wird häufig “Maximumprinzip” genannt und bezeichnet die Eigenschaft von gewissen Differentialgleichungen, daß der Wertebereich der Lösung innerhalb gewisser Grenzen bleibt. Das hängt damit zusammen, daß die Lösungsoperatoren dieser Differentialgleichungen Markowoperatoren sind. • MC[a,b] ⊂ C[a,b] (ist einen andere Formulierung des Maximumprinzips). 140 8 ZUSTANDSÄNDERUNGEN • (M − I)g (zmax ) ≤ 0 ≤ (M − I)g (zmin ). Beweis: Folgt aus gmin = g(zmin ) ≤ (Mg)(zmin ) und (Mg)(zmax ) ≤ g(zmax ) ≤ gmax Des weiteren gibt es viele Ungleichungen, die für reelle Zahlen bekannt sind und sich wörtlich auf Markowoperatoren übertragen lassen. Der Beweis kann häufig nach der selben Methode ablaufen, die gleich für die Tschebyschew-Ungleichung demonstriert wird. Der Beweis basiert darauf, daß zwischen Ungleichungen für reelle Zahlen wie g(z) ≥ 0 und Ungleichungen für Funktionen g ≥ 0 hin- und hergesprungen wird, indem man die Argumente fixiert bez. beweglich läßt. Das ist möglich, weil Markowoperatoren positive Operatoren sind und deshalb auf Ungleichungen angewendet werden können. Außerdem bewirkt die 1-Erhaltung, daß Markowoperatoren Skalare nicht verändern, indem Sinn, daß M(c1) = cM1 = c1 gilt. • Tschebyschew-Ungleichung: Es seien f und g gleichsinnig monoton, dann gilt Mg · Mf ≤ M(g · f ). Beweis: Zwei Funktionen f und g heißen gleichsinnig monoton, wenn für alle z, z ′ ∈ Z gilt (beachte, daß die Funktionen selbst nicht monoton sein müssen): f (z) − f (z ′ ) g(z) − g(z ′ ) ≥ 0 In dieser Ungleichung fixieren wir als erstes z ′ und wenn dann M auf die Ungleichung mit beweglichem z an. Anschließend wird dasselbe nochmal für z durchgeführt. Das ergibt folgende Ungleichungskette: 0 ≤ f (z) − f (z ′ ) g(z) − g(z ′ ) = f (z)g(z) − f (z ′ )g(z) − g(z ′ )f (z) + f (z ′ )g(z ′ ) 0 ≤ f · g − f (z ′ ) · g − g(z ′ ) · f + f (z ′ )g(z ′ ) · 1 0 ≤ M(f · g) − f (z ′ ) · Mg − g(z ′ ) · Mf + f (z ′ )g(z ′ ) · 1 0 ≤ M(f · g) (z) − f (z ′ ) · (Mg)(z) − g(z ′ ) · (Mf )(z) + f (z ′ )g(z ′ ) 0 ≤ M(f · g) (z) · 1 − (Mg)(z) · f − (Mf )(z) · g + f · g 0 ≤ M(f · g) (z) · 1 − (Mg)(z) · (Mf ) − (Mf )(z) · Mg + M(f · g) 0 ≤ M(f · g) · 1 − (Mg) · (Mf ) − (Mf ) · (Mg) + M(f · g) 0 ≤ 2 M(f · g) − 2(Mg) · (Mf ) • Cauchy-Bunjakowski-Schwarz-Ungleichung: 2 M(f · g) ≤ Mf 2 · Mg 2 Beweis: Wie eben erhalten wir ausgehend von einer offensichtlichen Ungleichung für reelle Zahlen eine Ungleichung für Markowoperatoren: 2 0 ≤ f (z)g(z ′ ) − f (z ′ )g(z) = f 2 (z)g 2 (z ′ ) + f 2 (z ′ )g 2 (z) − 2f (z)g(z)f (z ′ )g(z ′ ) 0 ≤ g 2 (z ′ ) · f 2 + f 2 (z ′ ) · g 2 − 2f (z ′ )g(z ′ ) · f · g 0 ≤ g 2 (z ′ ) · Mf 2 + f 2 (z ′ ) · Mg 2 − 2f (z ′ )g(z ′ ) · M(f · g) 0 ≤ g 2 (z ′ ) · (Mf 2 )(z) + f 2 (z ′ ) · (Mg 2 )(z) − 2f (z ′ )g(z ′ ) · M(f · g) (z) 0 ≤ (Mf 2 )(z) · g 2 + (Mg 2 )(z) · f 2 − 2 M(f · g) (z) · f · g 0 ≤ (Mf 2 )(z) · (Mg 2 ) + (Mg 2 )(z) · (Mf 2 ) − 2 M(f · g) (z) · M(f · g) 0 ≤ 2(Mf 2 ) · (Mg 2 ) − 2 M(f · g) · M(f · g) 8.4 Markowoperatoren 141 Bemerkung: Im endlich dimensionalen Fall sind das Ungleichungen für Matrizen, die man explizit beweisen kann. Dabei wird deutlich, wie die Beweise “im Inneren” ablaufen. 8.4.5 Die Jensensche Ungleichung in C × P Im weiteren sei stets F : R − → R ∪ {+∞} eine konvexe Funktion. Satz: Es sei g ∈ C(Zn ) und p ∈ P(Zn ). Dann gilt ! n n X X pi F (zi ) ≥ F pi zi i=1 i=1 Satz: Es sei z1 , ..., zn ∈ Z und p ∈ P(Zn ). Dann gilt hF (g), pni ≥ F (hg, pni) (28) Satz: Es sei g ∈ C(Z) und p ∈ P(Z). Dann gilt hF (g), pi ≥ F (hg, pi) (29) Satz: Es sei g ∈ C(Z) und M ∈ M(Z). Dann gilt MF (g) ≥ F (Mg) (30) Satz: Es sei g ∈ C(Z), p ∈ P(Z) und M ∈ M(Z). Dann gilt hF (g), M∗ pi = hMF (g), pi ≥ hF (Mg) , pi (31) Die letzte Ungleichung heißt Karamata-Ungleichung und kann auch äquivalent als hF (g ′ ), p′i ≥ hF (g), pi mit p′ = M∗ p und g = Mg ′ , geschrieben werden. 8.4.6 Markowketten Findet in jedem Zeittakt dieselbe Zustandsänderung statt, erhält man eine Folge von Zuständen, die Markowkette genannt wird. • Definition 1: Eine Folge von Maßen (p0 , p1 , ...) heißt Markowkette, falls es einenMarkowoperator M gibt, sodaß pn+1 = M∗ pn . • Definition 2: Eine Markowkette ist ein Paar (M, p0 ). Die Trajektorie der Markowkette heißt die Folge (p0 , M∗ p0 , (M∗ )2 p0 , ...) • Wir sagen einfach: Ein Markowoperator generiert eine M-Kette und interessieren uns für die Folge der Potenzen eines gegebenen Markowoperators. Insbesondere interessiert uns, ob es ein M∞ = lim Mn gibt. n→∞ 142 8.4.7 8 ZUSTANDSÄNDERUNGEN Beispiel. Der Fall n = 2 Für Z = {1, 2} gibt es vier mögliche Funktionen ϕ : Z − → Z. Ihnen entsprechen die 4 deterministischen M-Operatoren 0 1 1 0 0 1 1 0 , M11 = , M10 = , M01 = M00 = 1 0 1 0 0 1 0 1 Invertierbar sind M00 und M11 . Ein allgemeiner Markowoperator hat die Matrix 1−a a 1 0 −a a M= = + =I+B b 1−b 0 1 b −b mit a, b ∈ [0, 1]. D.h., jedem Punkt aus [0, 1] × [0, 1] kann eineindeutig ein Markowoperator zugeordnet werden. Die deterministischen Markowoperatoren sind die extremalen Elemente dieser Menge. Wie berechnen Mn . Dazu zerlegen wir M. Es ist 1 1 −a 1 0 1−a a b a −1 −1 , C = C , C= =C M= 1 b 0 1−a−b b 1−b a + b −1 1 Hieraus folgt 1 b + a(1 − a − b)n a − a(1 − a − b)n 1 0 −1 n C = M =C 0 (1 − a − b)n a + b b − b(1 − a − b)n a + b(1 − a − b)n Man sieht, daß genau im Fall |1 − a − b| = β < 1 ein Grenzwert 1 b a ∞ P=M = a+b b a existiert. Es ist 1 p1 b b ∗ = P p= p2 a+b a a b a+b a a+b =µ P∗ ist ein Projektor auf den von µ aufgespannten Unterraum. Die Gleichung, die zu M∗ = I∗ + B∗ gehört ist p1 (n + 1) = p1 (n) − ap1 (n) + bp2 (n) p2 (n + 1) = p2 (n) + ap1 (n) − bp2 (n) Man kann diese Gleichung auf zwei Weisen interpretieren: • Es wird mit Wahrscheinlichkeit a vom Zustand 1 in den Zustand 2 und mit Wahrscheinlichkeit b vom Zustand 2 in den Zustand 1 gewechselt. Die Komplemente 1 − a und 1 − b bedeuten, daß kein Zustandswechsel stattfindet. • Es findet zwischen den beiden Zuständen 1 und 2 ein Austausch statt. Zu dem Anteil, der schon da ist, wird der a-te Anteil 1 − → 2 und der b-te Anteil 2 − → 1 transportiert. 143 8.4 Markowoperatoren 8.4.8 Ereignisketten und Markowketten Änderungen im Raum der physikalischen Zustände P werden durch adjungierte von Markowoperatoren beschrieben. Die Trajektorie eines physikalischen System, das im Zustand p0 startet, kann dann beschrieben werden durch eine Abfolge von Operatoren, die von einer diskreten (Zeitsprünge t0 → t1 , t1 → t2 , t3 → t4 ) oder kontinuierlichen Zeit (t2 ≤ t ≤ t3 ) abhängen: p0 M∗ (t0 →t1 ) → − p1 M∗ (t1 →t2 ) → − p2 M∗ (t2 ≤t≤t3 ) → − p3 M∗ (t3 →t4 ) → − p4 ... Ziel ist es, bei gegebenen Operatoren (Zustandsänderungen) die möglichen Zustände zu berechnen. Die einfachsten solchen Ketten mit diskreter Zeit sind Markowketten. 8.4.9 Markowprozesse Wir hatten Markowketten als Folgen von Maßen (p0 , p1 , p2 , ...) ⊂ P mit pn+1 = M∗ pn definiert mit einem Markowoperator M. Betrachtet man seine Potenzen als Funktion des Exponentes T(n) = Mn , dann ist T : N − → M wegen T(n + m) = T(n)T(m) = T(m)T(n) und T(0) = I ein Homomorphismus der kommutativen Halbgruppe N bezüglich der Addition. Analog kann man Homomorphismen der kommutativen Halbgruppe R+ bezüglich der Addition betrachten: T : R − → M. T(t) ist eine Operatorenhalbgruppe mit den Eigenschaften T(0) = I T(t1 + t2 ) = T(t1 )T(t2 ) = T(t2 )T(t1 ) Die Trajektorie p(t) = T∗ (t)p0 in P wird Markowprozeß genannt. Analog dazu, wie ein Markowoperator M (als erster Schritt) zusammen mit eimen Anfangswert p0 eine gesamte Markowkette T(n) = Mn definiert, definiert der Operator A (genannt Generator) durch die Differentialgleichung ṗ(t) = A∗ p(t), p(0) = p0 einen Markowprozeß T(t) = eAt . Während bei Markowketten M = T(1) gilt, gilt bei Markowprozessen A = T′ (0). Allerdings ist der Zusammenhang zwischen Generator, Differentialgleichung und Halbgruppe nicht trivial (im Gegensatz zu Markowketten) und wird durch relativ komplizierte Theoreme hergestellt. Damit beschäftigen wir uns im Kapitel 11. Ist eine Operatorhalbgruppe T(t) gegeben, so ist für alle t2 > t1 ≥ 0 der Operator T(t2 − t1 ) ein Markowoperator und beschreibt durch p(t2 ) = T∗ (t2 − t1 )p(t1 ) eine Zustandsänderung. Die Logik ist folgende: Wenn ich annehme, daß meine Trajektorie aus irgendeinem Grund eine Halbgruppe ist, stellt sich heraus, daß sie mit eine Diffgl. beschrieben werden kann. Es ist nicht so, daß diese Gleichung die einzig sinnvolle ist und deshalb alle Trajektorien Halbgruppen sind. Wenn heute häufig solche Gleichungen untersucht werden, dann liegt das nicht an ihrer physikalischen Unversalität sondern daran, daß sich diese Gleichung besonders einfach behandeln läßt und es eine ausgearbeitet Theorie dazu gibt. Und die Grundlagen dieser Theorie liegen gerade in der Halbgruppeneigenschaft. 144 8.4.10 8 ZUSTANDSÄNDERUNGEN Generatoren von Ketten ⇐⇒ Generatoren von Prozessen Kette Prozeß B A Halbgruppe M(n) = (I + B)n T(t) = exp(At) Anfangswert M(0) = I T(0) = I Generator B = M(1) − M(0) A = T′ (0) Gleichung g(n) − g(n − 1) = Bg(n − 1) g ′ (t) = Ag(t) Generator g(n) = Mg(n − 1) Gleichung Reihe Resolvente M(n) − M(n − 1) = BM(n − 1) n P M(n) = Bk k=0 ∞ P F(x) = (1 − x) n k xn M(n) T′ (t) = AT′(t) T(t) = k=0 S(λ) = λ n=0 = (1 − x)(I − x − xB)−1 = (I − ∞ P = x B)−1 1−x k=0 x= ∞ P R∞ k Ak tk! e−λt T(t)dt 0 = λ(λ − A)−1 = (I − λ1 A)−1 xB k 1−x = ∞ P k=0 1 1+λ λ= A k λ 1−x x F(x) = (1 − x)(I − xM)−1 =I+ ∞ P xn BMn−1 n=1 Randwerte F(0) = I S(∞) = I F(1) = M(∞) S(0) = T(∞) Hilbert- F(x)F(y)(x − y) = S(λ)S(µ)(µ − λ) = Identität = x(1 − y)F(x) − y(1 − x)F(y) = µS(λ) − λS(µ) Spektrum Kreis C−1 (1) linke Halbebene W-Dichte p(n) = (1 − x)xn p(t) = λe−λt Moment ∞ P n=0 n k p(n) = xk (1−x)k R∞ 0 tk p(t) = k! λk