Institut für Numerische Mathematik und Optimierung Numerische Simulation mathematischer Modelle Sommersemester 2014 Michael Eiermann 1 Numerische Simulation mathematischer Modelle Themen dieser Vorlesung Die Vorlesung besteht aus zweiTeilen: In Teil I werden Modelle der Populationsdynamik vorgestellt, die auf gewöhnlichen Differentialgleichungen und Differenzengleichungen basieren. Teil II ist der Untersuchung von Markoff-Ketten gewidmet, mit denen man sehr viele Prozesse modellieren kann, bei denen der Zufall eine Rolle spielt. Wir werden uns unter anderem mit Kapazitätsproblemen bei Netzwerken befassen. In allen Teilen wird die numerische Behandlung der jeweiligen Modelle betont. Organisation Technische Universität Bergakademie Freiberg 2 Numerische Simulation mathematischer Modelle Literatur • Edward Beltrami. Von Krebsen und Kriminellen. Mathematische Modelle in Biologie und Soziologie. Friedr. Vieweg & Sohn Verlagsgesellschaft mbH, Braunschweig 1993. • Martin Braun. Differentialgleichungen und ihre Anwendungen. Springer-Verlag, Berlin 1979. • Andrew C. Fowler. Mathematical Models in the Applied Sciences. Cambridge University Press, Cambridge 1997. • Franz-Josef Fritz, Bertram Huppert und Wolfgang Willems. Stochastische Matrizen. Springer-Verlag, Berlin 1979. • Glenn Fullford, Peter Forrester und Arthur Jones. Modeling with Differential and Difference Equations. Cambridge University Press, Cambridge 1997. Organisation Technische Universität Bergakademie Freiberg 3 Numerische Simulation mathematischer Modelle • Guy Latouche und V. Ramaswami. Introduction to Matrix Analytic Methods in Stochastic Modeling. SIAM, Philadelphia (PA) 1999. • C. C. Lin und L. A. Segal. Mathematics Applied to Deterministic Problems in the Natural Sciences. SIAM, Philadelphia (PA) 1988. • Douglas D. Mooney und Randall J. Swift. A Course in Mathematical Modeling. The Mathematical Association of America, 1999. • James D. Murray. Mathematical Biology, 2nd corrected edition. Springer-Verlag, Berlin 1993. • James R. Norris. Markov Chains. Cambridge University Press, Cambridge 1996. • Thomas Sonar. Angewandte Mathematik, Modellbildung und Informatik. Friedr. Vieweg & Sohn Verlagsgesellschaft mbH, Braunschweig 2001. Organisation Technische Universität Bergakademie Freiberg 4 Numerische Simulation mathematischer Modelle Leistungspunkte und Noten Die Modulprüfung besteht aus einer Klausurarbeit im Umfang von 120 Minuten, die in der Prüfungsperiode nach dem Sommersemesters 2014 statt findet [genauer Termin liegt noch nicht fest]. Eine weitere Klausur findet in der Prüfungsperiode nach dem Wintersemester 2014/2015 statt. Im Modul werden 6 Leistungspunkte erworben. Die Modulnote ergibt sich aus der Note der schriftlichen Prüfung (Wichtung 1). Der Zeitaufwand beträgt 180 h und setzt sich aus 60 h Präsenzzeit und 120 h Selbststudium zusammen. Letzteres umfasst die Vor- und Nachbereitung der Lehrveranstaltungen, Vorbereitung und Bearbeiten der Klausur sowie das Lösen von Übungsaufgaben. Organisation Technische Universität Bergakademie Freiberg 5 Numerische Simulation mathematischer Modelle 1 Mathematische Modellbildung und numerische Simulation am Beispiel eines Wasserkreislaufs Simulation ist die Nachbildung eines dynamischen Prozesses in einem ” Modell, um zu Erkenntnissen zu gelangen, die auf die Wirklichkeit übertragbar sind“ (VDI-Richtlinie 3633). Zum einen ist die rechnerische Simulation dann unumgänglich, wenn reale Experimente mit den Untersuchungsobjekten undurchführbar sind: Denken Sie etwa an die Entstehung von Galaxien oder an Untersuchungsobjekte, die erst geplant sind, also noch gar nicht existieren. Aber auch wenn reale Experimente möglich sind, ist es oft kostengünstiger und ressourcenschonender, stattdessen numerische Simulationen einzusetzen. Modellbildung und numerische Simulation Technische Universität Bergakademie Freiberg Numerische Simulation mathematischer Modelle Modellbildung und numerische Simulation 6 Technische Universität Bergakademie Freiberg 7 Numerische Simulation mathematischer Modelle A. Physikalische Grundlagen. Evangelista Torricelli (1608–1647): Abflussgeschwindigkeit v = p 2gh, g = 9.81 (Gravitationsbeschleunigung), h = Höhe des Wasserspiegels. Abflussrate als Funktion des im Behälter befindlichen Wasservolumens V (falls es sich um einen Zylinder mit Grundfläche A handelt) p p √ mit c := a 2g/A . f = a 2gV /A = c V Der Parameter c kann über a variiert werden, wenn der Abfluss einen Hahn besitzt. Wir sprechen von einem Steuerungsparameter. Modellbildung und numerische Simulation Technische Universität Bergakademie Freiberg 8 Numerische Simulation mathematischer Modelle B. Mathematisches Modell. U (t), V (t), W (t), R(t) : Wassermengen zur Zeit t in den Behältern. f1 , . . . , f 5 : Abflussfunktionen mit den Steuerungsparametern c1 , . . . , c5 . p = p(t) : Pumpenfunktion“ ” Änderungsraten der Wasservolumina: Zuflüsse weniger Abflüsse, d.h. U 0 (t) = p(t) − f1 (U (t)) − f2 (U (t)) V 0 (t) = f1 (U (t)) − f3 (V (t)) − f4 (V (t)) 0 W (t) = f2 (U (t)) + f4 (V (t)) − f5 (W (t)) R0 (t) = (1.1) f3 (V (t)) + f5 (W (t)) − p(t). Diese Gleichungen, sog. (gewöhnliche) Differentialgleichungen, heißen die Kontinuitätsgleichungen unseres Systems. Modellbildung und numerische Simulation Technische Universität Bergakademie Freiberg 9 Numerische Simulation mathematischer Modelle Anfangszustand: Wassermengen in Behältern zu einem festen Zeitpunkt, etwa für t = 0. Das Verhalten unseres Systems ist für alle Zeiten t > 0 durch die obigen Differentialgleichungen eindeutig bestimmt. Die Aufgabe, eine Lösung des Systems (1.1) zu bestimmen, welche gegebene Anfangsbedingungen erfüllt, nennt man ein Anfangswertproblem. Addiert man alle Gleichungen, so ergibt sich U 0 (t) + V 0 (t) + W 0 (t) + R0 (t) = 0, ein globales Erhaltungsprinzip, welches besagt, dass sich die Gesamtwassermenge in unserer Apperatur nicht verändert. (Es handelt sich hier um ein geschlossenes System.) Modellbildung und numerische Simulation Technische Universität Bergakademie Freiberg 10 Numerische Simulation mathematischer Modelle C. Algorithmus. Anfangswertprobleme lassen sich nur in Ausnahmefällen geschlossen lösen (reine Mathematik: in unserem Fall gibt es genau eine Lösung). Aufgabe der Numerik: Bereitstellung von Näherungslösungen. Idee: Wir betrachten die Gleichungen nicht mehr für jeden beliebigen Zeitpunkt, sondern nur noch zu bestimmten diskreten Zeitpunkten, etwa für t0 = 0, t1 = 1, . . . (Diskretisierung). Un := U (tn ), . . . , Rn := R(tn ) (Volumina, die sich zum Zeitpunkt tn in den Behältern U, . . . , R befinden). Änderungsrate U 0 (tn ) wird durch U (tn+1 ) − U (tn ) = Un+1 − Un approximiert (wir nähern hier eine Tangentensteigung durch eine Sekantensteigung an). Modellbildung und numerische Simulation Technische Universität Bergakademie Freiberg 11 Numerische Simulation mathematischer Modelle Un+1 = Un + pn − f1 (Un ) − f2 (Un ) Vn+1 = Vn + f1 (Un ) − f3 (Vn ) − f4 (Vn ) Wn+1 = Wn + f2 (Un ) + f4 (Vn ) − f5 (Wn ) Rn+1 = Rn + f3 (Vn ) + f5 (Wn ) − pn . (1.2) Diese vier Gleichungen heißen die diskreten Kontinuitätsgleichungen unserer Kreislaufs (System von vier Differenzengleichungen). Addition liefert globales Erhaltungsprinzip Un+1 + Vn+1 + Wn+1 + Rn+1 = Un + Vn + Wn + Rn . Legt man noch einen Anfangszustand fest (etwa U0 = V0 = W0 = 0 sowie R0 = Gesamtwassermenge = 100) √ und wählt geeignete Werte für die Parameter, √ etwa c1 = 12, c2 = c4 = 2, c3 = 1, c5 = 2 sowie p = 17, so können wir unser Modell laufen lassen“. ” Modellbildung und numerische Simulation Technische Universität Bergakademie Freiberg 12 Numerische Simulation mathematischer Modelle 100 Un V n Wn Rn 90 80 Wassermenge 70 60 50 40 30 20 10 0 0 Modellbildung und numerische Simulation 5 10 15 Zeit 20 25 30 Technische Universität Bergakademie Freiberg 13 Numerische Simulation mathematischer Modelle D. Gleichgewichtswerte. Simulation: Jede der Größen Un , Vn , Wn und Rn nähert sich mit zunehmendem n einem Gleichgewichtswert U∞ , V∞ , W∞ , R∞ , wenn wir die Steuerungsparameter nicht ändern. Bestimme Gleichgewichtswerte ohne (zeitaufwendige) Simulation: p = f1 (U∞ ) + f2 (U∞ ) f1 (U∞ ) = f3 (V∞ ) + f4 (V∞ ) f5 (W∞ ) = f2 (U∞ ) + f4 (V∞ ). Die vierte Gleichung (p = f3 (V∞ ) + f5 (W∞ )) ist redundant. Hier – im Gegensatz zur Praxis“ – Gleichungen einfach (Dreiecksform). ” Vorsicht: Die theoretisch ermittelten Gleichgewichtswerte können, aber müssen nicht im Fassungsbereich der Behälter liegen (Nebenbedingungen). Modellbildung und numerische Simulation Technische Universität Bergakademie Freiberg 14 Numerische Simulation mathematischer Modelle E. Steuerung. Wesentliches Ziel von Simulationen: Optimierung des Systemverhaltens bzw. Entscheidungshilfen für die Steuerung des Systems. In unserem Beispiel etwa: Wie muss man die Steuerungsparameter wählen, damit sich ein erwünschter (vorgegebener) Gleichgewichtszustand einstellt (auch hier: Nebenbedingungen, man kann z.B. die Hähne nicht beliebig weit öffnen). Fixiert man p, so führt dies in unserem Fall zu drei Bedingungen für die fünf Parameter c1 , . . . , c5 : p c1 = −c2 + p/ U∞ p p c4 = −c3 + c1 U∞ / V∞ p p p p c5 = c2 U∞ / W∞ + c4 V∞ / W∞ . In realen Systemen ist ein solches Steuerungsproblem nicht explizit lösbar, man wird es nur näherungsweise und iterativ lösen können. Modellbildung und numerische Simulation Technische Universität Bergakademie Freiberg 15 Numerische Simulation mathematischer Modelle F. Kritik. Realität → mathematisches Modell → Algorithmus → numerische Simulation der Realität. Bei jedem dieser drei Übergänge haben wir Fehler begangen, — Modellierungsfehler. Unser Modell setzt wirbelfreien Wasserfluss voraus; in der Realität werden sich aber Wirbel bilden. Die Torricellische Ausflussformel ist nur gültig, wenn sich die Spiegelhöhe langsam ändert und keine Druckdifferenz zwischen Spiegel und Austrittsöffnung besteht, Voraussetzungen, die in der Realität nicht immer erfüllt sind. — Diskretisierungsfehler. Wir haben den stetigen Strom des Wassers durch Durchschnittswerte“ (bez. Zeit und Raum) ersetzt. ” — Rundungsfehler. Computer rechnen falsch“. ” Modellbildung und numerische Simulation Technische Universität Bergakademie Freiberg 16 Numerische Simulation mathematischer Modelle 2 2.1 Populationsdynamik Zwei einfache Modelle Sei N (t) die Population einer Spezies zur Zeit t. Alle Modelle basieren auf dem Erhaltungssatz dN = Geburten − Todesfälle + Migration. dt a. Das einfachste Modell (T. R. Malthus, 1766–1834) Vernachlässige Migration. Geburts- und Todesfälle seien proportional zu N , d.h. dN = bN − dN = rN mit r = b − d. (2.1) dt Die allgemeine Lösung dieser gewöhnlichen Differentialgleichung (gDG) ist N (t) = N0 exp(rt) Populationsdynamik mit N0 = N (0). Technische Universität Bergakademie Freiberg 17 Numerische Simulation mathematischer Modelle Exponentielles Wachstum: N(t) = N0 exp(rt) N r>0 r=0 r<0 N0 0 t Exponentielles Wachstum ist i. Allg. natürlich ziemlich unrealistisch und nur in sehr speziellen Situationen zu beobachten (etwa bei Bakterienkulturen mit i. W. unbeschränkten Ressourcen). Populationsdynamik Technische Universität Bergakademie Freiberg 18 Numerische Simulation mathematischer Modelle b. Ein modifiziertes Modell (P. F. Verhulst, 1804–1849) dN N = rN 1 − mit positiven Konstanten r und K. dt K (2.2) K heißt Trägerkapazität und hängt etwa von den verfügbaren Nahrungsressourcen ab. Die Reproduktionsrate [hier r(1 − N/K)] ist jetzt von N abhängig: ( > 0, N < K, N r 1− K < 0, N > K. Die allgemeine Lösung von (2.2) ist N (t) = N0 K exp(rt) . K + N0 (exp(rt) − 1) Man spricht von logistischem Wachstum. Offenbar gilt: limt→∞ N (t) = K. Populationsdynamik Technische Universität Bergakademie Freiberg 19 Numerische Simulation mathematischer Modelle Logistisches Wachstum N K K/2 N >K 0 K > N0 > K/2 N0 < K/2 t Beachte, dass sich die Lösungen für 0 < N0 < K/2 und K/2 < N0 < K qualitativ unterscheiden. Populationsdynamik Technische Universität Bergakademie Freiberg 20 Numerische Simulation mathematischer Modelle 2.2 Elementares aus der Theorie gDGen Wir betrachten Systeme von expliziten gDGen erster Ordnung: y10 = f1 (t, y1 , y2 , . . . , yn ) y20 = f2 (t, y1 , y2 , . . . , yn ) (2.3) .. .. . = . yn0 = fn (t, y1 , y2 , . . . , yn ) mit den n unbekannten Funktionen y1 = y1 (t), y2 = y2 (t), . . . , yn = yn (t). Sei I ein Intervall. Jedes System von n Funktionen y1 = y1 (t), . . . , yn = yn (t) ∈ C 1 (I), das (2.3) für alle t ∈ I erfüllt, heißt Lösung von (2.3) über I. Populationsdynamik Technische Universität Bergakademie Freiberg 21 Numerische Simulation mathematischer Modelle ( Beispiel. Das System y10 y20 =1 = 2y1 ) besitzt die Lösungen y1 (t) = t + α, y2 (t) = t2 + 2αt + β (α, β ∈ R) über (−∞, ∞). Für eine eindeutige Lösung sind Anfangsbedingungen erforderlich. Z.B. y1 (0) = 1, y2 (0) = 2. Dann ist y1 (t) = t + 1, y2 (t) = t2 + 2t + 2 die einzige Lösung. Allgemein: Das Problem, eine Lösung von (2.3) zu finden, die die Anfangsbedingung y1 (t0 ) = y0,1 , . . . , yn (t0 ) = y0,n (2.4) erfüllt, heißt Anfangswertproblem (AWP) für die gDG (2.3). Populationsdynamik Technische Universität Bergakademie Freiberg 22 Numerische Simulation mathematischer Modelle Mit y1 . .. , y := yn f1 . .. , f := fn y0,1 . .. y0 := y0,n führen wir für (2.3), (2.4) folgende Kurzschreibweise ein: y0 = f (t, y ), y (t0 ) = y0 . Populationsdynamik (2.3’) (2.4’) Technische Universität Bergakademie Freiberg 23 Numerische Simulation mathematischer Modelle Satz 2.1 (Existenz- und Eindeutigkeitssatz von Picard-Lindelöf) Gegeben ist das AWP (2.3’), (2.4’). f sei stetig im ‘Quader’ Q := {(t, y ) : |t − t0 | ≤ a, ky − y0 k ≤ b} ⊆ Rn+1 und es sei M := max{kf (t, y )k : (t, y ) ∈ Q}. Außerdem erfülle f in Q die Lipschitz-Bedingung e )k ≤ Lky − y e k ∀ (t, y ), (t, y e ) ∈ Q. kf (t, y ) − f (t, y (2.5) Dann besitzt das AWP genau eine Lösung über I := [t0 − α, t0 + α], wobei α = min{a, b/M }. Populationsdynamik Technische Universität Bergakademie Freiberg 24 Numerische Simulation mathematischer Modelle Bemerkungen. 1. Das AWP (2.3), (2.4) besitzt in [t0 − a, t0 + a] eine eindeutige Lösung, wenn f die Lipschitz-Bedingung (2.5) in e = {(t, y ) : |t − t0 | ≤ a, ky k < ∞} erfüllt. Q 2. Ist f auf Q bez. y stetig differenzierbar und bezeichnet fy0 = [∂fi /∂yj ]1≤,i,j≤n die zugehörige Jacobi-Matrix, dann folgt aus dem Mittelwertsatz, dass die Voraussetzungen von Satz 2.1 erfüllt sind mit L = sup kfy0 (t, y )k < ∞. (t,y )∈Q Populationsdynamik Technische Universität Bergakademie Freiberg 25 Numerische Simulation mathematischer Modelle Satz 2.2 (Stetige Abhängigkeit von den Daten) Die Voraussetzungen von Satz 2.1 seien erfüllt. Sind y , z Lösungen der AWPe y 0 = f (t, y ), y (t0 ) = y0 , bzw. z 0 = g (t, z ), z (t0 ) = z0 über I (g sei stetig in Q) und gilt ky0 − z0 k ≤ γ sowie kf (t, y ) − g (t, y )k ≤ δ (∀ (t, y ) ∈ Q), dann folgt für t ∈ I δ ky (t) − z (t)k ≤ γ eL(t−t0 ) + eL(t−t0 ) − 1 . L Die folgenden Seiten behandeln ein wichtiges Beispiel für gDGen... Populationsdynamik Technische Universität Bergakademie Freiberg 26 Numerische Simulation mathematischer Modelle 2.2.1 Lineare Systeme von gDGen mit konstanten Koeffizienten y 0 = Ay + b(t) mit A = [ai,j ] ∈ Rn×n (unabhängig von t). (2.6) Das System heißt homogen, falls b = 0 , sonst inhomogen. Es gelten: • Sind b1 (t), b2 (t), . . . , bn (t) stetig in I = [t0 − a, t0 + a], dann besitzt (2.6) mit der Anfangsbedingung y (t0 ) = y0 genau eine Lösung in I. • Sind y und z zwei Lösungen von (2.6), dann löst w = y − z das homogene System y 0 = Ay . • Die Lösungen von y 0 = Ay bilden einen Vektorraum der Dimension n. Populationsdynamik Technische Universität Bergakademie Freiberg 27 Numerische Simulation mathematischer Modelle Noch spezieller (n = 2): " # a b 0 y = Ay mit A = ∈ R2×2 c d bzw. Die Eigenwerte von A sind p (a + d) ± (a + d)2 − 4 det A λ1,2 = 2 y10 = ay1 + by2 , y20 = cy1 + dy2 . (2.7) (det A = ad − bc). Lösungen (und ihr Verhalten in der Phasenebene = (y1 , y2 )-Ebene): Fall 1: A besitzt zwei linear unabhängige Eigenvektoren v1 , v2 (z.B. wenn die Eigenwerte λ1 , λ2 von A verschieden sind). Die allgemeine Lösung der gDG (2.7) ist dann y (t) = α exp(λ1 t)v1 + β exp(λ2 t)v2 Populationsdynamik (α, β ∈ R). Technische Universität Bergakademie Freiberg 28 Numerische Simulation mathematischer Modelle Fall 1a: λ1,2 sind verschieden und reell und haben das gleiche Vorzeichen. Sei etwa λ2 < λ1 < 0. Jede Lösung strebt gegen 0 (für t → ∞) und, wenn α 6= 0, " # y1 (t) y (t) = ∼ α exp(λ1 t)v1 (t → ∞). y2 (t) D.h.: Genügend nahe am Ursprung streben alle Lösungen gegen (0, 0) entlang sign(α)v1 (in der Phasenebene), falls α 6= 0. Wenn α = 0 und β 6= 0, streben sie auf sign(β)v2 gegen (0, 0). Wir sprechen von einem Knotenpunkt (Typ I). Ist λ2 < λ1 ≤ 0, so ist der Knotenpunkt stabil, weil alle Kurven (y1 (t), y2 (t))0≤t<∞ gegen (0, 0) streben für t → ∞. Ist λ1 > λ2 > 0, so ist der Knotenpunkt instabil, denn (y1 (t), y2 (t))0≤t<∞ → (∞, ∞) für t → ∞. Populationsdynamik Technische Universität Bergakademie Freiberg 29 Numerische Simulation mathematischer Modelle Fall 1b: λ1,2 sind reell und haben verschiedene Vorzeichen. Sei etwa λ1 < 0 < λ2 . Dann exp(λ1 t)v1 → 0 für t → ∞ und exp(λ2 t)v2 → ∞ für t → ∞. D.h. y (t) → ∞ für t → ∞ (entlang v2 ), falls β 6= 0. Wenn β = 0 und α 6= 0, dann y (t) → 0 für t → ∞ auf v1 . Man spricht von einem Sattelpunkt. Er ist immer instabil. Fall 1c: λ1,2 = λ sind gleich und damit reell (es gibt aber zwei linear unabhängige Eigenvektoren). In diesem Fall ist A = λI2 und jeder Vektor v 6= 0 ist ein Eigenvektor von A. Die Lösungen streben für t → ∞ auf Geraden gegen (0, 0), falls λ < 0 (stabiler Fall), bzw. von (0, 0) weg, falls λ > 0 (instabiler Fall). Man spricht von einem Stern. Populationsdynamik Technische Universität Bergakademie Freiberg 30 Numerische Simulation mathematischer Modelle Sind λ1,2 = µ1 ± iµ2 (µ1 , µ2 ∈ R) konjugiert komplex, so ist die obige Lösungsformel zwar korrekt, liefert aber komplexe (d.h. für uns unbrauchbare) Lösungen. Ist v1 = w1 + iw2 (w1 , w2 ∈ R2 ) Eigenvektor von A zum Eigenwert λ1 = µ1 + iµ2 , dann ist v2 = w1 − iw2 Eigenvektor zu λ2 = µ1 − iµ2 . Damit konstruieren wir eine reelle Basis des Lösungsraums und erhalten als allgemeine Lösung von (2.7) (mit α, β ∈ R) y (t) = exp(µ1 t) {α [cos(µ2 t)w1 − sin(µ2 t)w2 ] + β [sin(µ2 t)w1 + cos(µ2 t)w2 ]} . Fall 1d: λ1,2 = µ1 ± iµ2 sind konjugiert komplex mit µ1 6= 0. Man spricht von einem Strudelpunkt, der stabil ist für µ1 < 0 und instabil für µ1 > 0. Populationsdynamik Technische Universität Bergakademie Freiberg 31 Numerische Simulation mathematischer Modelle Fall 1e: λ1,2 = µ1 ± iµ2 sind konjugiert komplex mit µ1 = 0 (µ2 6= 0). Die Singularität ist weder stabil noch instabil. Man nennt sie manchmal neutral stabil und spricht von einem Zentralpunkt. Die Phasenkurven sind Ellipsen mit Mittelpunkt (0, 0). Fall 2: A besitzt nur einen linear unabhängigen Eigenvektor (und folglich nur einen Eigenwert λ). Die allgemeine Lösung von (2.7) ist in diesem Fall y (t) = α exp(λ1 t)v1 + β exp(λ1 t) (tv1 + v2 ) (α, β ∈ R). Dabei ist v1 ein Eigenvektor von A (Av1 = λv1 ) und v2 ein zugehöriger Hauptvektor (Av2 = λv2 + v1 ). Man spricht von einem Knotenpunkt (Typ II), der stabil (λ1 < 0) oder instabil (λ1 ≥ 0) sein kann. Populationsdynamik Technische Universität Bergakademie Freiberg 32 Numerische Simulation mathematischer Modelle 2.2.2 Phasenportraits Knotenpunkt (Typ I), hier stabil y2 v1 v2 y2 y1 v1 v2 Strudelpunkt, hier stabil y2 y1 y1 Zentralpunkt (immer neutral stabil) y2 Knotenpunkt (Typ II), hier stabil y2 y1 Populationsdynamik Sternpunkt, hier stabil Sattelpunkt (immer instabil) y2 y1 v 1 y1 Technische Universität Bergakademie Freiberg 33 Numerische Simulation mathematischer Modelle 2.2.3 Gleichgewichtslösungen dN dt Beim logistischen Wachstumsmodell = rN 1 − e (t) ≡ 0 und N1 (t) ≡ K. ausgezeichnet: N N K sind zwei Lösungen Man nennt sie die Gleichgewichtslösungen (GGL) oder Gleichgewichtspunkte N e ist eine instabile und erhält sie durch Lösen der Gleichung rN (1 − K ) = 0. N e , so strebt die Lösung weg von N e ). N1 ist eine stabile GGL GGL (stört man N (stört man N1 , so strebt die Lösung wieder gegen N1 ). Für das allgemeinere Populationsmodell dN = f (N ) dt mit einer (nichtlinearen) Funktion f (2.8) (man spricht hier von einer autonomen gDG, d.h. f hängt nicht explizit von t ab) ist N ∗ eine GGL, wenn f (N ∗ ) = 0. Sie ist instabil, wenn f 0 (N ∗ ) > 0 gilt, und stabil, wenn f 0 (N ∗ ) < 0 gilt. Populationsdynamik Technische Universität Bergakademie Freiberg 34 Numerische Simulation mathematischer Modelle Allgemein heißt eine beliebige Lösung N = N (t) von (2.8) stabil, wenn für e , die zur Zeit t = 0 genügend nahe bei N (t) startet, für t → ∞ jede Lösung N gegen N (t) strebt. e von (2.8) mit Genauer: ∀ε > 0 ∃δ = δ(ε) > 0, so dass für alle Lösungen N e (0)| < δ immer |N (t) − N e (t)| < ε ∀t ∈ I folgt. |N (0) − N Satz 2.3 (Stabilität bei linearen gDGen) Es gelten: • Jede Lösung von y 0 = Ay ist stabil, wenn alle Eigenwerte von A negativen Realteil haben. • Jede Lösung von y 0 = Ay ist instabil, wenn mindestens ein Eigenwert von A positiven Realteil hat. Populationsdynamik Technische Universität Bergakademie Freiberg 35 Numerische Simulation mathematischer Modelle 2.2.4 Qualitative Analyse in Rezeptform Wir betrachten die autonome gDG y 0 = f (y ). Sie ist i.a. n-dimensional, wir konzentrieren uns hier auf den Fall n = 2: du = f (u, v) dt und dv = g(u, v). dt (2.9) 1. Bestimme Gleichgewichtslösungen (Gleichgewichtspunkte), d.h. die Lösungen von (2.9), die nicht mit t variieren. Löse das Gleichungssystem (in zwei Unbekannten) f (u, v) = 0 und g(u, v) = 0. 2. Sind die Gleichgewichtspunkte stabil? Besitzen f und g stetige partielle Ableitungen zweiter Ordnung bez. u und v in einer Umgebung von (u∗ , v ∗ ), dann gibt es eine stetige Funktion H : R2 → R2 Populationsdynamik Technische Universität Bergakademie Freiberg 36 Numerische Simulation mathematischer Modelle mit limx →0 H(x )/kx k = 0 und " # " # " # ∗ ∗ ∗ ∗ f (u + h, v + k) f (u , v ) h = + A +H ∗ ∗ ∗ ∗ g(u + h, v + k) g(u , v ) k Dabei ist A = A(u∗ , v ∗ ) = ∂f (u∗ ,v ∗ ) ∂u ∂f (u∗ ,v ∗ ) ∂v ∗ ∗ ∗ ∂g(u ,v ) ∂u ∗ ∂g(u ,v ) ∂v " h k #! . . (2.10) Für uns bedeutet das, dass sich die Lösungen von (2.9) in einer Umgebung von (u∗ , v ∗ ) im wesentlichen wie die von y 0 = Ay verhalten. Populationsdynamik Technische Universität Bergakademie Freiberg 37 Numerische Simulation mathematischer Modelle Satz 2.4 (Stabilität von Gleichgewichtslösungen) Unter den obigen Voraussetzungen sei (u∗ , v ∗ ) eine Gleichgewichtslösung von (2.9). • (u∗ , v ∗ ) ist stabil, wenn alle Eigenwerte von A(u∗ , v ∗ ) negativen Realteil haben. • (u∗ , v ∗ ) ist instabil, wenn mindestens ein Eigenwert von A(u∗ , v ∗ ) positiven Realteil hat. • Im nichtlinearen Fall sind keine Aussagen möglich, wenn alle Eigenwerte einen Realteil ≤ 0 besitzen, aber mindestens einer verschwindenden Realteil besitzt. Um den Charakter des Gleichgewichtspunktes beim Übergang von y 0 = Ay nach y 0 = f (y ) zu erhalten (Knotenpunkt, Sattelpunkt etc.), müssen die Voraussetzungen an f verschärft werden (vgl. die folgenden Beispiele). Populationsdynamik Technische Universität Bergakademie Freiberg 38 Numerische Simulation mathematischer Modelle 3. Phasenportrait. Bestimme Bahnen oder Trajektorien {(u(t), v(t))}t≥0 , wobei u, v Lösungen von (2.9) sind, über g(u, v) dv = . du f (u, v) Satz 2.5 (Eigenschaften von Bahnen) Es gilt • Durch jeden Punkt (u0 , v0 ) läuft eine Bahn (außer durch Gleichgewichtspunkte, für die die Bahnen zu einem Punkt degenerieren). Haben zwei Bahnen einen gemeinsamen Punkt, so sind sie identisch. • Kehrt eine Bahn nach einer Zeit T > 0 zu ihrem Ausgangspunkt zurück, dann ist sie geschlossen (d.h. die zugehörigen Lösungen sind periodisch). Populationsdynamik Technische Universität Bergakademie Freiberg 39 Numerische Simulation mathematischer Modelle Satz 2.6 (Satz von Poincaré-Bendixson.) Bleibt eine Lösung (u, v) von (2.9) in einem beschränkten Gebiet der Ebene, das keine stabilen Gleichgewichtspunkte von (2.9) enthält, dann dreht sich ihre Bahn in eine einfach geschlossene Kurve hinein, die Bahn einer periodischen Lösung von (2.9) ist. Populationsdynamik Technische Universität Bergakademie Freiberg 40 Numerische Simulation mathematischer Modelle 2.3 Western spruce budworm (choristoneura occidentalis) einer der gefährlichsten Nadelwaldschädlinge in Nordamerika; periodische Ausbrüche (etwa alle 40 Jahre) mit dramatischen Folgen für die Forstwirtschaft. Populationsdynamik Technische Universität Bergakademie Freiberg 41 Numerische Simulation mathematischer Modelle 2.4 Modell für Populationswachstum dN = rB N dt N 1− KB − p(N ) mit BN 2 p(N ) = 2 . A + N2 (2.11) B ist ein Mass für die Räuber-Effektivität der Vögel, A heißt Schalterwert. B p(N) B/2 0 Populationsdynamik 0 A N Technische Universität Bergakademie Freiberg 42 Numerische Simulation mathematischer Modelle Dieses Problem enthält vier Parameter: A, KB [Einheit von N ], rB [1/t], B [Einheit von N/t]. Obligatorisch: Transformation auf dimensionslose Größen (dazu später mehr). Setze hier: u = N A, r= ArB B , q= KB A , τ= Bt A . Einsetzen liefert: du u u2 = ru 1 − − = f (u; r, q). dτ q 1 + u2 Gleichgewichtslösungen: f (u; r, q) = 0 ⇒ ru(1 − uq ) = u2 1+u2 ⇒ u = 0 ∨ r(1 − uq ) = u 1+u2 . r/(1−u/q) r f(u;r,q) u/(1+u2) (q,r)=(8,0.4) (q,r)=(8,0.5) (q,r)=(8,0.6) 0 0 Populationsdynamik N1 N1 N2 N3 q u 0 N2 N3 u Technische Universität Bergakademie Freiberg 43 Numerische Simulation mathematischer Modelle Quelle: James D. Murray. Mathematical Biology, 2nd corrected edition. Springer-Verlag, Berlin 1993 Hysterese Effekt: Fixiere q und variiere r entlang ABCD: Die Gleichgewichtswerte springen“ in C. Variiert man r entlang DCBA, so findet ” ein Sprung bei B statt. Populationsdynamik Technische Universität Bergakademie Freiberg 44 Numerische Simulation mathematischer Modelle 2.5 Modelle für zwei Populationen Genauer: Populationen, deren Größen N und P sich wechselweise beeinflussen. • Räuber-Beute-Modelle, • Wettbewerbs-Modelle, • Symbiose-Modelle. Umberto d’Ancona stellt 1925 den prozentualen Anteil der Haie am Gesamtfang (Speisefische und Haie) im Hafen von Triest fest: 40 35 30 25 20 15 10 5 0 1914 1915 1916 1917 1918 1919 1920 1921 1922 1923 Benachteiligt eingeschränkter Fischfang (1. Weltkrieg) die Speisefische? Populationsdynamik Technische Universität Bergakademie Freiberg 45 Numerische Simulation mathematischer Modelle N (t): Beutepopulation zur Zeit t (Speisefische), P (t): Räuberpopulation zur Zeit t (Haie). Annahmen (Volterra-Lotka-Modell): • Ohne Räuber würde die Beute exponentiell wachsen. • Räuber reduzieren Beute proportional zu N (t)P (t). • Ohne Beute würden die Räuber exponentiell abnehmen. • Räuber profitieren von der Beute proportional zu N (t)P (t). dN = a N (t) − b N (t)P (t) dt dP = −c P (t) + e N (t)P (t) dt Populationsdynamik (mit Konstanten a, b > 0) (2.12) (mit Konstanten c, e > 0) Technische Universität Bergakademie Freiberg 46 Numerische Simulation mathematischer Modelle Transformation τ = at, u(τ ) = eN (t) bP (t) c , v(τ ) = , α= c a a liefert dimensionslose Form du = u(1 − v), dτ dv = αv(u − 1). dτ (2.13) Wir bestimmen die Bahnen von (2.13), d.h. die Lösungen von dv v(u − 1) =α du u(1 − v) bzw. 1−v u−1 dv = α du v u (gDG mit getrennten Variablen) und erhalten log(v) − v + H = αu − α log(u) bzw. αu + v − log(uα v) = H (2.14) mit einer Konstanten H. Populationsdynamik Technische Universität Bergakademie Freiberg 47 Numerische Simulation mathematischer Modelle Es gelten: • Die Gleichung (2.14) hat nur für H ≥ 1 + α positive Lösungen u und v. • (2.14) beschreibt für H > 1 + α eine geschlossene Kurve in der Phasenebene. Folglich sind die Lösungen von (2.13) periodisch. (Beachte auch: u(τ ) = 1 ⇒ v 0 (τ ) = 0 und v(τ ) = 1 ⇒ u0 (τ ) = 0.) • Ist T die gemeinsame Periodenlänge von u bzw. v, dann Z T Z T 1 1 u(τ ) dτ = 1 und v(τ ) dτ = 1. T 0 T 0 Gleichgewichtslösungen: f (u, v) = g(u, v) Populationsdynamik = u(1 − v) = 0 αv(u − 1) = 0 ⇒ (u, v) = (0, 0) oder (u, v) = (1, 1). Technische Universität Bergakademie Freiberg 48 Numerische Simulation mathematischer Modelle Lineare Stabilitätsanalyse: ∂f ∂u ∂f ∂v ∂g ∂u ∂g ∂v = Das bedeutet ∂f ∂f ∂u ∂g ∂u ∂f ∂u ∂g ∂u " ∂v ∂g ∂v = ∂f ∂v ∂g ∂v " 1−v −u αv α(u − 1) # . # 1 0 0 −α mit Eigenwerten 1 und − α. (u,v)=(0,0) " = 0 −1 α 0 # mit Eigenwerten ± √ αi. (u,v)=(1,1) Also ist ein (0, 0) ein (instabiler) Sattelpunkt und (1, 1) ein Zentralpunkt. Populationsdynamik Technische Universität Bergakademie Freiberg 49 Numerische Simulation mathematischer Modelle Rücktransformation ergibt für (2.12) die Bahnen eN + bP − log(N c P a ) = K und die Mittelwerte Z 1 T c N (t) dt = T 0 e 1 und T Z 0 T a P (t) dt = . b Phasenebene Räuber N(t) c/e Mittelwert a/b a/b P(t) c/e Beute Populationsdynamik Technische Universität Bergakademie Freiberg 50 Numerische Simulation mathematischer Modelle Berücksichtige Fischfang: dN = a N − b N P − f N = (a − f ) N − b N P, dt dP = −c P + e N P − f P = −(c + f ) P + e N P (f > 0). dt Gleiches System mit neuen Koeffizienten: a → a − f und c → c + f . Mittelwerte: (c + f )/e > c/e (Beute), (a − f )/b < a/b (Räuber). ohne mit Raeuber Fischfang a/b (a−f)/b c/e (c+f)/e Populationsdynamik Volterras Prinzip: Angemessener Fischfang (f < a) steigert die durchschnittliche Zahl der Speisefische und reduziert die durchschnittliche Zahl der Haie. Beute Technische Universität Bergakademie Freiberg 51 Numerische Simulation mathematischer Modelle Ein realitätsnäheres Räuber-Beute-Modell hat die Form N kN P dN = Nr 1 − − (r, K, k, D > 0), dt K N +D dP hP = Ps 1 − (s, h > 0). dt N Nach Substitution u(τ ) = N (t)/K, v(τ ) = hP (t)/K, τ = rt, a = k/(hr), b = s/r, d = D/K ergibt sich auv dv v du = f (u, v) = u(1 − u) − und = g(u, v) = bv 1 − . dτ u+d dτ u (2.15) Der einzige Gleichgewichtspunkt mit positiven Komponenten ist p 1 − a − d + (1 − a − d)2 + 4d ∗ ∗ ∗ ∗ (u , v ) mit u = v = . 2 Populationsdynamik Technische Universität Bergakademie Freiberg 52 Numerische Simulation mathematischer Modelle Die zugehörige Funktionalmatrix ist ∂f ∂f ∂u ∂g ∂u ∂v ∂g ∂v u∗ = h ∗ au (u∗ +d)2 i −1 −au u∗ +d −b b (u,v)=(u∗ ,v ∗ ) ∗ . (u∗ , v ∗ ) ist genau dann instabil, wenn die Parameter (a, b, d) in der skizzierten Teilmenge des R3 liegen: 1 0.8 b=1/a b=2a−1 b 0.6 0.4 0.2 0 0 0.1 0.2 2 1/2 d(a)=(a +4a) 0.3 −(1+a) 0.4 0.5 0.6 0.7 0.8 d Populationsdynamik 0 0.5 1 1.5 2 2.5 a Technische Universität Bergakademie Freiberg 53 Numerische Simulation mathematischer Modelle a = 1, b = 0.05, d = 0.2 liefert z.B. ein instabiles Gleichgewicht u∗ = v ∗ ≈ .36: 1 0.9 0.8 0.7 u .7 0.6 g<0 g>0 0.5 0.4 v* 0.3 f<0 0.2 f>0 v 0.1 τ=rt 0 0 Populationsdynamik u* .8 1 0 0 50 100 150 200 250 300 Technische Universität Bergakademie Freiberg 54 Numerische Simulation mathematischer Modelle 2.6 Ein Konkurrenzmodell dN1 = r1 N1 1 − dt dN2 = r2 N2 1 − dt wird dimensionslos durch u1 = 1 b2 = a2 K r2 : N1 − a1 N1 N2 K1 N2 − a2 N1 N2 K2 N1 K1 , u2 = N2 K2 , (r1 , K1 , a1 > 0), (r2 , K2 , a2 > 0) τ = r1 t, ρ = r2 r1 , 2 b1 = a1 K r1 , du1 = f (u1 , u2 ) = u1 (1 − u1 ) − b1 u1 u2 , dτ du2 = g(u1 , u2 ) = ρu2 (1 − u2 ) − ρb2 u1 u2 . dτ Wir betrachten den Fall b1 > 1 und b2 > 1 (es gibt drei weitere Fälle, vgl. Übungsaufgaben). Populationsdynamik Technische Universität Bergakademie Freiberg 55 Numerische Simulation mathematischer Modelle 1. Gleichgewichtspunkte 1 u1 (1 − u1 ) − b1 u1 u2 = 0 ⇔ u1 = 0 ∨ u2 = (1 − u1 ) , b1 ρu2 (1 − u2 ) − ρb2 u1 u2 = 0 ⇔ u2 = 0 ∨ u2 = 1 − b2 u1 . Das bedeutet: Im ersten Quadranten gibt es vier Gleichgewichtspunkte; (0, 0), (1, 0), (0, 1) und einen weiteren mit positiven Komponenten (der Schnittpunkt b2 −1 der Nulllinien), nämlich ( b1b1b2−1 , −1 b1 b2 −1 ). 2. Stabilität A(u1 , u2 ) = " A(0, 0) = 1 0 0 ρ ∂f ∂u1 ∂f ∂u2 ∂g ∂u1 ∂g ∂u2 1 − 2u1 − b1 u2 −b1 u1 = # . −ρb2 u2 " , A(1, 0) = −1 0 ρ(1 − 2u2 − b2 u1 ) # " −b1 1 − b1 , A(0, 1) = ρ(1 − b2 ) −ρb2 0 # −ρ Also ist (0, 0) instabil, während (1, 0) und (0, 1) stabil sind. Populationsdynamik Technische Universität Bergakademie Freiberg . 56 Numerische Simulation mathematischer Modelle A b1 − 1 b2 − 1 , b1 b2 − 1 b1 b2 − 1 1 = 1 − b1 b2 " b1 − 1 b1 (b1 − 1) ρb2 (b2 − 1) ρ(b2 − 1) # mit Eigenwerten λ2 < 0 < λ1 . Es handelt sich also um einen instabilen Sattelpunkt. Interpretation: Die beiden Spezies konkurrieren so aggressiv, dass eine von beiden ausstirbt (Ausschluss durch Konkurrenz). Es gibt eine Bahn (Separatrix), die (theoretisch) gegen das instabile Gleichgewicht strebt. Alle anderen Punkte liegen im Einzugsbereich eines der beiden Attraktoren (1, 0) (d.h. Spezies 2 stirbt aus) oder (0, 1) (d.h. Spezies 1 stirbt aus). Populationsdynamik Technische Universität Bergakademie Freiberg 57 Numerische Simulation mathematischer Modelle 1 1/b_1 u_2* 0 0 Populationsdynamik u_1* 1/b_2 1 Technische Universität Bergakademie Freiberg 58 Numerische Simulation mathematischer Modelle 2.7 Diskrete Modelle Für viele Arten ist es sinnvoll anzunehmen, dass die Population in diskreten Zeitschritten wächst: Nt+1 = f (Nt ), hier f (Nt ) = Nt · F (Nt ). (2.16) (Oft ergibt sich die diskrete Form aber auch durch Diskretisierung einer gDG.) Beispiele sind: Nt+1 = rNt (für r > 0) ⇒ Nt = rt N0 (diskretes exponentielles Wachstum), Nt Nt+1 = rNt 1 − K (für r > 0, K > 0) (diskretes logistisches Wachstum). Nachteil des letzten Modells: Nt+1 < 0, wenn Nt > K. Gleichgewichtspunkte erhält man als Schnittpunkte N ∗ von Nt+1 = f (Nt ) mit der ersten Winkelhalbierenden“ Nt+1 = Nt . ” Der Gleichgewichtspunkt N ∗ ist stabil, wenn |f 0 (N ∗ )| < 1 gilt, und instabil, wenn |f 0 (N ∗ )| > 1 gilt. Im Fall von |f 0 (N ∗ )| = 1 spricht man von einem Verzweigungspunkt. Populationsdynamik Technische Universität Bergakademie Freiberg 59 Numerische Simulation mathematischer Modelle (( ( ! ! " " x1 x2 x3 0 < f 0 (N ∗ ) < 1 Populationsdynamik Technische Universität Bergakademie Freiberg 60 Numerische Simulation mathematischer Modelle c c Q Q Q x1 HH HH aa aa x3 a HH x2 −1 < f 0 (N ∗ ) < 0 Populationsdynamik Technische Universität Bergakademie Freiberg 61 Numerische Simulation mathematischer Modelle AA A A TT T S S e e e @ @ e e e x2 x1 S S x3 |f 0 (N ∗ )| > 1 Populationsdynamik Technische Universität Bergakademie Freiberg 62 Numerische Simulation mathematischer Modelle 2.8 Ein chaotisches“ Beispiel ” Normiere das diskrete logistische Modell durch ut = ut+1 = rut (1 − ut ) Nt K : (mit r > 0) und wähle u0 ∈ (0, 1). Gleichgewichtspunkte (bestimme Lösungen u∗ von f (u) = ru(1 − u) = u), Stabilität (bestimme λ = f 0 (u∗ )): r−1 r−1 = 2 − r. (2.17) u∗1 = 0, λ1 = f 0 (0) = r, und u∗2 = , λ2 = f 0 r r Populationsdynamik Technische Universität Bergakademie Freiberg 63 Numerische Simulation mathematischer Modelle 1. Für r ∈ (0, 1) ist u∗1 = 0 der einzige realistische (positive) Gleichgewichtspunkt, 2. Erster Bifurkationspunkt r = 1. 3. Für r ∈ [1, 3) ist u∗2 ein (realistischer) stabiler Gleichgewichtspunkt. 0.7 1 <= r <= 3 1 0.6 0.5 0.4 r = 0.5 r = 1.0 r = 2.0 r =2.8 0.3 ut+1 0.2 0.1 u 0 0 Populationsdynamik 2 4 6 8 10 12 14 16 18 20 0 0 t 1 Technische Universität Bergakademie Freiberg 64 Numerische Simulation mathematischer Modelle 4. Zweiter Bifurkationspunkt r = 3. 5. Für r ∈ [3, r4 ) existiert ein stabile 2-periodische Gleichtgewichtlösung. Betrachte ut+2 = f 2 (ut ) = r(rut (1 − ut ))(1 − rut (1 − ut )). Diese Iteration hat vier Gleichgewichtspunkte: u∗1,2 (beide instabil) und u∗3,4 (r + 1) ± [(r + 1)(r − 3)]1/2 = >0 2r mit |(f 2 )0 (u∗3,4 )| < 1. 1 r = 3.3 r = 3.0 r = 3.3 r = 3.5 0.9 1 0.8 0.7 ut+2 0.6 0.5 0.4 0.3 0 Populationsdynamik 5 10 15 20 25 30 35 40 0 0 ut 1 Technische Universität Bergakademie Freiberg 65 Numerische Simulation mathematischer Modelle 6. Der dritte Bifurkationspunkt r4 ist der (kleinste) Wert von r mit (f 2 )0 (u∗3,4 ) = −1. 7. Zwischen r4 und r8 gibt es eine stabile 4-periodische Gleichgewichtslösung u∗5,6,7,8 bis (f 4 )0 (u∗5,6,7,8 ) = −1. 8. Dieser Prozess (aus einer 2k -periodischen Gleichgewichtslösung wird eine 2k+1 -periodische) setzt sich fort bis zum Wert rc . r=r c 1 r = rc 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0 0.1 Populationsdynamik 0 10 20 30 40 50 60 70 0 1 80 Technische Universität Bergakademie Freiberg Numerische Simulation mathematischer Modelle Populationsdynamik 66 Technische Universität Bergakademie Freiberg Numerische Simulation mathematischer Modelle Populationsdynamik 67 Technische Universität Bergakademie Freiberg 68 Numerische Simulation mathematischer Modelle Ein Modell für Masernepidemien Die Kinderkrankheit Masern wird durch Viren übertragen. Ein typischer Krankheitsverlauf stellt sich (leicht vereinfacht) wie folgt dar: Ein Kind, das sich angesteckt hat, durchläuft zunächst eine einwöchige Inkubationszeit, in der es weder sichtbar krank ist noch andere Kinder anstecken kann. Danach wird es für eine Woche infektiös (d.h. es kann die Krankheit übertragen). Danach wird es sichtbar krank (Exanthem), aber nicht mehr (in Wirklichkeit deutlich weniger) infektiös, erholt sich wieder und ist in Zukunft immun gegen Masern. Man hat beobachtet, dass es in Industrieländern (U.S.A., U.K.) alle zwei bis drei Jahre zu epidemischen Ausbrüchen dieser Krankheit kommt. In sog. Dritte-Welt-Ländern ist der Zeitraum zwischen zwei Epidemien wesentlich kürzer. Warum? Populationsdynamik Technische Universität Bergakademie Freiberg 69 Numerische Simulation mathematischer Modelle Sei Sn die Anzahl der gesunden, aber nicht immunen Kinder in der Woche n. Sei In die Anzahl der infektiösen Kinder in der Woche n. Sei B > 0 die Anzahl der Neugeborenen pro Woche. Sei µ > 0 der Anteil der Kinder (aus Sn ), die pro Woche von einem infektiösen Kind angesteckt werden. In = f (In−1 , Sn−1 ) = µIn−1 Sn−1 Sn = g(In−1 , Sn−1 ) = Sn−1 − µIn−1 Sn−1 + B. Populationsdynamik Technische Universität Bergakademie Freiberg 70 Numerische Simulation mathematischer Modelle I0 = 20, S0 = 30000, µ = 0.3 · 10−4 , B = 120 (U.K.): 4 3.8 x 10 3.6 S n 3.4 3.2 3 2.8 0 50 100 150 200 250 300 150 200 250 300 700 600 500 In 400 300 200 100 0 Populationsdynamik 0 50 100 Technische Universität Bergakademie Freiberg 71 Numerische Simulation mathematischer Modelle I0 = 20, S0 = 30000, µ = 0.3 · 10−4 , B = 360 (Nigeria): 4 4.5 x 10 4 Sn 3.5 3 2.5 0 50 100 150 200 250 300 200 250 300 2000 In 1500 1000 500 0 Populationsdynamik 0 50 100 150 Technische Universität Bergakademie Freiberg 72 Numerische Simulation mathematischer Modelle Wir berechnen die Gleichgewichtspunkte aus f (I, S) = I und g(I, S) = S. Als einziger realistischer Gleichgewichtspunkt ergibt sich (I ∗ , S ∗ ) = (B, 1/µ), der wegen ∂f ∂f " # ∂I ∂S 1 µB = ∂g ∂g −1 1 − µB ∂I ∂S (I,S)=(I ∗ ,S ∗ ) ein Zentralpunkt ist (falls µB ≤ 4 sind die Eigenwerte der Funktionalmatrix konjugiert komplex und vom Betrag 1). Wir beobachten eine periodisches Verhalten mit Periodenlänge ≈ 126 im Fall B = 120 bzw. Periodenlänge ≈ 73 im Fall B = 360. Populationsdynamik Technische Universität Bergakademie Freiberg 73 Numerische Simulation mathematischer Modelle 3 Markoff-Ketten 3.1 Zwei Zufallsprozesse a. Rekursionen mit Zufallsmatrizen. Wähle • • • • • k ∈ N, k ≥ 2, ein Wahrscheinlichkeitsmaß π = [π1 , π2 , . . . , πk ] auf {1, 2, . . . , k}, k Matrizen A1 , A2 , . . . , Ak ∈ R2×2 , k Vektoren b1 , b2 , . . . , bk ∈ R2 , und einen Startvektor x0 ∈ R2 . Dann führe folgenden Algorithmus aus for m = 1 : M (M groß, z.B. M = 10000) wähle j ∈ {1, 2, . . . , k} nach π xm = Aj xm−1 + bj end Plotte xm , m = m0 , m0 + 1, . . . , M (mit z.B. m0 = 100). Markoff-Ketten Technische Universität Bergakademie Freiberg 74 Numerische Simulation mathematischer Modelle Ein Farnblatt k = 2, π = [.2993, .7007], " # +.4000 −.3733 A1 = , +.0600 +.6000 " # +0.3533 b1 = , +0.0000 " # −.8000 −.1867 A2 = , +.1371 +.8000 " # +1.1000 b2 = . +0.1000 Markoff-Ketten Technische Universität Bergakademie Freiberg 75 Numerische Simulation mathematischer Modelle k = 3, Sierpinski-Dreieck π = [1, 1, " # 1 0 1 A1 = 2 , 0 1 " # 0 b1 = , 0 1]/3, A2 = A1 , " # 1 b2 = , 0 A3 = A1 , " b3 = Markoff-Ketten 1 2 1 1 # . Technische Universität Bergakademie Freiberg 76 Numerische Simulation mathematischer Modelle b. Irrfahrt eines Springers. Stelle einen Springer in die Ecke eines ansonsten leeren Schachbretts und wähle zufällig einen der nach den Regeln erlaubten Züge. Jeder der möglichen Züge werde mit der gleichen Wahrscheinlickeit ausgewählt. Markoff-Ketten Technische Universität Bergakademie Freiberg 77 Numerische Simulation mathematischer Modelle Natürliche Fragen: 1. Wieviele Züge sind durchschnittlich notwendig, bis der Springer zu seiner Ausgangsposition zurückkehrt? 2. Wieviele Züge sind durchschnittlich notwendig, bis der Springer alle 64 Felder besucht hat? Um ein Gefühl für diese Größen zu entwickeln, simulieren wir 100 solche Irrfahrten mit dem Zufallszahlengenerator rand von Matlab. In genau 35 dieser Experimente ist der Springer nach weniger als 50 Zügen zu seiner Ausgangsposition zurückkehrt, während er in genau einem Experiment dazu k ∈ [1050, 1100) Züge benötigt. Die durchschnittliche first return time unserer Stichprobe ist 191.78, aber wir werden später beweisen, dass diese Frage ohne numerische Experimente beantwortet werden kann (der Erwartungswert der first return time beträgt 168). Eine ähnliche Simulation (mit wieder 100 Experimenten) liefert als Antwort auf die zweite Frage nach der cover time den Durchschnittswert 556.9 (auch hier kann die Antwort ohne numerische Experimente gegeben werden). Markoff-Ketten Technische Universität Bergakademie Freiberg 78 Numerische Simulation mathematischer Modelle 34 32 30 28 26 24 22 20 18 16 14 12 10 8 6 4 2 0 15 12 9 6 3 1 Markoff-Ketten 2 3 4 5 6 7 8 9 10 2 x10 0 2 3 4 5 6 7 8 9 10 11 12 x102 Technische Universität Bergakademie Freiberg 79 Numerische Simulation mathematischer Modelle 3.2 Elementares aus der Wahrscheinlichkeitstheorie Wir untersuchen folgendes Spiel: Nach Zahlung eines Einsatzes darf mit drei Würfeln gewürfelt werden. Für jede 4 wird 1 Euro, für jede 5 bzw. 6 werden 2 bzw. 3 Euro ausgezahlt. Wie hoch muss der Einsatz sein, damit das Spiel fair ist? zugehöriger Wahrscheinlichkeitsraum (Ω, A , W ): • Ergebnisraum Ω := {(w1 , w2 , w3 ) : wj ∈ {1, 2, ..., 6}} (63 = 216 Elementarereignisse), • Ereignisalgebra A := {A : A ⊆ Ω} (Potenzmenge von Ω, 2216 ≈ 1065 Ereignisse), • Wahrscheinlichkeitsmaß W (A) = Markoff-Ketten 1 216 card(A), A ∈ A . Technische Universität Bergakademie Freiberg 80 Numerische Simulation mathematischer Modelle Zufallsvariable X : Ω → R : Wurf 7→ Auszahlung, P P P X((w1 , w2 , w3 )) = wj =4 1 + wj =5 2 + wj =6 3. Offenbar: X(Ω) = {0, 1, ..., 9}. diskrete Dichtefunktion f (Wahrscheinlichkeitsverteilung) f (x) := W (X = x) = W ({(w1 , w2 , w3 ) ∈ Ω : X((w1 , w2 , w3 )) = x}), P9 x ∈ {0, 1, ..., 9}. Beachte x=0 f (x) = 1. Im folgenden steht χ für eine Augenzahl zwischen 1 und 3. Markoff-Ketten Technische Universität Bergakademie Freiberg 81 Numerische Simulation mathematischer Modelle x Markoff-Ketten W (X = x) 0 (χ, χ, χ) [27|216] 27/216 1 (χ, χ, 4) [27|216] 27/216 2 (χ, 4, 4) [9|216]; (χ, χ, 5) [27|216] 36/216 3 (4, 4, 4) [1|216]; (χ, 4, 5) [18|216]; (χ, χ, 6) [27|216] 46/216 4 (4, 4, 5) [3|216]; (χ, 4, 6) [18|216]; (χ, 5, 5) [9|216] 30/216 5 (4, 4, 6) [3|216]; (4, 5, 5) [3|216]; (χ, 5, 6) [18|216] 24/216 6 (4, 5, 6) [6|216]; (5, 5, 5) [1|216]; (χ, 6, 6) [9|216] 16/216 7 (4, 6, 6) [3|216]; (5, 5, 6) [3|216] 6/216 8 (5, 6, 6) [3|216] 3/216 9 (6, 6, 6) [1|216] 1/216 Technische Universität Bergakademie Freiberg 82 Numerische Simulation mathematischer Modelle Verteilungsfunktion F F (y) := W (X ≤ y) = W ({(w1 , w2 , w3 ) ∈ Ω : X((w1 , w2 , w3 )) ≤ y}) P = x≤y f (x), y ∈ R. Beachte limy→−∞ F (y) = 0, limy→+∞ F (y) = 1, F (y1 ) ≤ F (y2 ) für y1 ≤ y2 . Erwartungswert von X P9 E(X) = x=0 xf (x) = 3, d.h. 3 Euro Einsatz ⇒ faires Spiel. Markoff-Ketten Technische Universität Bergakademie Freiberg 83 Numerische Simulation mathematischer Modelle F(x)=W(X <= x) f(x)= W(X=x) 0.25 1 0.2 0.8 0.15 0.6 0.1 0.4 0.05 0 0.2 0 Markoff-Ketten 1 2 3 4 5 6 7 8 9 0 0 1 2 3 4 5 6 7 8 9 Technische Universität Bergakademie Freiberg 84 Numerische Simulation mathematischer Modelle Warteschlangen Zu den zufälligen Zeitpunkten t0 = 0, t1 , t2 , ... treffen Kunden in der Warteschlange vor einem Bedienungssystem ein. Wir setzen Sn := tn − tn−1 (n = 1, 2, ...) (Zwischenankunftszeiten). Die Zufallsvariablen Sn seien unabhängig und identisch verteilt (iid). Ihre Verteilung sei F (x) = W (Sn ≤ x). Beliebt ist die Exponentialverteilung F (x) = Eλ (x) := 1 − exp(−λx), x ≥ 0 (mit einem Parameter λ > 0). Fλ (x) besitzt eine Dichtefunktion, nämlich fλ (t) = λ exp(−λx) (für x ≥ 0) Rx (Fλ (x) = 0 fλ (t)dt). Die Exponentialverteilung besitzt kein Gedächtnis“: ” W (X > x + y | X > x) = W (X > y), x, y ≥ 0, was später noch sehr wichtig wird. Markoff-Ketten Technische Universität Bergakademie Freiberg 85 Numerische Simulation mathematischer Modelle Exponentialverteilung Dichte der Exponentialverteilung 1 2 0.9 1.8 λ=2 0.8 1.6 0.7 1.4 0.6 1.2 0.5 1 0.4 0.3 0.6 0.2 0.4 0.1 0.2 0 0 0.5 Markoff-Ketten 1 λ=2 0.8 λ = .75 1.5 2 2.5 3 3.5 4 4.5 5 0 λ = .75 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 Technische Universität Bergakademie Freiberg 86 Numerische Simulation mathematischer Modelle Zurück zur Warteschlange: Die wartenden Kunden werden vom Bedienungssystem in der Reihenfolge ihres Eintreffens bedient. Durch Tn wird die Bedienungszeit des Kunden n bezeichnet. Diese Zufallsvariable besitze die Verteilung G. Auch die Tn seien iie und unabhängig von Sn . Wir interessieren uns für die Länge der Warteschlange X(t). Sind auch die Tn exponentialverteilt (mit Parameter µ), spricht man von einem M/M/1/∞-System ( 1“ bedeutet: ein Server, ∞“ bedeutet: unendlich ” ” grosser Warteraum). Markoff-Ketten Technische Universität Bergakademie Freiberg 87 Numerische Simulation mathematischer Modelle Warteschlange X(t) 2 1 0 0 Markoff-Ketten 1 2 3 4 5 t 6 7 8 9 10 Technische Universität Bergakademie Freiberg 88 Numerische Simulation mathematischer Modelle 3.3 Diskrete Markoff-Ketten Ein System S , das sich in genau einem von n Zuständen Z1 , Z2 , . . . , Zn (oder kürzer 1, 2, . . . , n) befinden kann, wird einem stochastischen Prozess A unterworfen. Bekannt sind die Übergangswahrscheinlichkeiten A ai,j = W i −→ j (1 ≤ i, j ≤ n). ai,j hänge nicht davon ab, wie S in den Zustand i kam. Der zukünftige Zustand des Prozesses hängt also nur vom gegenwärtigen, aber nicht von den vergangenen ab (Markoff-Eigenschaft). Das Paar (S , A ) heißt (zeit-) diskrete homogene (d.h. ai,j ist zeitunabhängig) Markoff-Kette (mit endlichem Zustandsraum {1, 2, . . . , n}). Wir werden nur solche Markoff-Ketten betrachten. Die Übergangsmatrix A = [ai,j ] ∈ Rn×n beschreibt diesen Prozess. A ist eine stochastische Matrix, d.h. A ist nichtnegativ (ai,j ≥ 0, 1 ≤ i, j ≤ n) Pn mit Zeilensummen gleich 1 ( j=1 ai,j = 1, 1 ≤ i ≤ n, oder Ae = e mit e = [1, 1, . . . , 1]T ∈ Rn ). Markoff-Ketten Technische Universität Bergakademie Freiberg 89 Numerische Simulation mathematischer Modelle Zusammengesetzte Prozesse Sind A und B stochastische Vorgänge im System S mit den Übergangsmatrizen A bzw. B, dann besitzt der zusammengesetzte Prozess C = B ◦ A die Übergangsmatrix C = AB. (Insbesondere ist das Produkt zweier stochastischer Matrizen wieder stochastisch.) Hier sollen Prozesse A m mit den Übergangsmatrizen Am (m-Schritt-Übergangswahrscheinlichkeiten) und ihr Verhalten für m → ∞ untersucht werden: A A A A S −→ S −→ · · · −→ S −→ · · · Wird das System S im Zeitpunkt m = 0 durch das Wahrscheinlichkeitsmaß (0) (0) (0) (die Ausgangsverteilung) π (0) = [π1 , π2 , . . . , πn ] beschrieben (Wahrscheinlichkeitsvektoren sind hier stets Zeilenvektoren), dann beschreibt π (m) = π (0) Am das System S im Zeitpunkt m ≥ 0. Markoff-Ketten Technische Universität Bergakademie Freiberg 90 Numerische Simulation mathematischer Modelle Beispiel. Eine 1-bit Nachricht ( ja“ oder nein“ bzw. wahr“ oder falsch“ ” ” ” ” bzw. 0“ oder 1“) wird z.B. mündlich über viele Zwischenstationen verbreitet ” ” und dabei möglicherweise verfälscht: Mit Wahrscheinlichkeit p (0 ≤ p ≤ 1) wird 0“ als 1“ weitergereicht und folglich ist die Wahrscheinlichkeit 1 − p, ” ” dass 0“ korrekt als 0“ wiedergegeben wird. Die ” ” Verfälschungswahrscheinlichkeit von 1“ sei q (0 ≤ q ≤ 1) und deshalb wird ” 1“ mit Wahrscheinlichkeit 1 − q als 1“ weitergegeben. ” ” Markoff-Ketten Technische Universität Bergakademie Freiberg 91 Numerische Simulation mathematischer Modelle Unser Übertragungssystem besteht also aus zwei Zuständen, nämlich 0 und 1, und wird durch die vier Übergangswahrscheinlichkeiten W (0 → 0) = 1 − p, W (1 → 0) = q, W (0 → 1) = p, W (1 → 1) = 1 − q beschrieben, die wir in der Übergangsmatrix " # 1−p p A= ∈ R2×2 q 1−q zusammenfassen. Drei Fälle: 1. p = q = 0, dann Am = I2 ∀ m und limm→∞ Am = I2 . 2. p = q = 1, dann A2m+1 = A, A2m = I2 ∀ m und limm→∞ Am existiert nicht. 3. 0 < p, q < 1, dann limm→∞ Am = Markoff-Ketten 1 p+q [ qq pp ]. Technische Universität Bergakademie Freiberg 92 Numerische Simulation mathematischer Modelle Im Fall von p = q ∈ (0, 1) (unparteiische Verfälschung) ist lim Am = m→∞ 1 2 1 2 1 2 1 2 =: A∞ . Nach einer langen Reihe von Zwischenträgern kann die Ankunft der unverfälschten Ausgangsnachricht nur mit der Wahrscheinlichkeit 1/2 erwartet werden (und zwar unabhängig vom Wert von p = q). Was lange“ bedeutet, hängt aber vom Wert von p = q ab: ” kAm − A∞ k∞ = |1 − 2p|m , d.h. die Konvergenz ist umso schneller, je näher p bei 1/2 liegt. (Interessante Beobachtung: A besitzt die Eigenwerte 1 und 1 − 2p.) Markoff-Ketten Technische Universität Bergakademie Freiberg 93 Numerische Simulation mathematischer Modelle Markoff-Ketten können alternativ durch eine Folge {Xt }t=0,1,... von Zufallsvariablen beschrieben werden. Dabei ist Xt der Zustand, in dem sich das System zum Zeitpunkt t befindet. Die Markoff-Eigenschaft ist dann W (Xt+1 = it+1 |Xt = it , Xt−1 = it−1 , . . . , X0 = i0 ) = W (Xt+1 = it+1 |Xt = it ). Die Einträge der Übergangsmatrix A können als bedingte Wahrscheinlichkeiten ai,j = W (Xt+1 = j|Xt = i) interpretiert werden. Unter der Bedingung Xt = i besitzt die Zufallsvariable Xt+1 die Wahrscheinlichkeitsverteilung {W (Xt+1 = j) = ai,j }j=1,2,...,n . Xt+1 ist stochastisch unabhängig von X0 , X1 , . . . , Xt−1 . Markoff-Ketten Technische Universität Bergakademie Freiberg 94 Numerische Simulation mathematischer Modelle Beliebte Beispiele für Markoff-Ketten sind Irrfahrten wie die des Springers aus dem 1. Abschnitt. Dort besteht der Zustandsraum aus 64 Elementen, den Feldern des Schachbretts. Die folgenden Abbildungen zeigen die Übergangsmatrix für zwei Nummerierungen der Zustände (Felder). Bei der lexikografischen Ordnung werden die Felder von links unten (a1) nach rechts oben (h8) zeilenweise durchnummeriert. Bei der Schwarz/Weiss-Ordnung“ nummeriert man erst ” alle schwarzen und danach alle weissen Felder (jeweils lexikografisch). Lexikographische Ordnung "Schwarz/Weiß"−Ordnung 0 0 10 10 20 20 30 30 40 40 50 50 60 60 0 10 Markoff-Ketten 20 30 nz = 336 40 50 60 0 10 20 30 nz = 336 40 50 60 Technische Universität Bergakademie Freiberg 95 Numerische Simulation mathematischer Modelle Klassifizierung von Zuständen (und Markoff-Ketten) Erinnerung: Mit Am i h (m) = ai,j 1≤i,j≤n Am (m) ist W i −→ j = ai,j . Der Zustand j heißt vom Zustand i aus erreichbar (i → j), wenn es ein m ∈ N (m) gibt mit ai,j > 0. Gilt i → j und j → i, so kommunizieren die Zustände i und j (i ↔ j). ↔“ ist eine Äquivalenzrelation auf dem Zustandsraum {1, 2, . . . , n} und ” zerlegt ihn damit in Äquivalenzklassen (sog. Kommunikationsklassen). {1, 2, . . . , n} = K1 ∪ K2 ∪ · · · ∪ Ks , Kk 6= ∅, Kk ∩ K` = ∅ für k 6= `, wobei alle Zustände in Kk miteinander kommunizieren und kein Zustand aus Kk mit einem Zustand kommuniziert, der außerhalb von Kk liegt. Die Markoff-Kette heißt irreduzibel, wenn alle ihre Zustände miteinander kommunizieren, d.h. wenn es nur eine Kommunikationsklasse gibt. Sonst heißt sie reduzibel. Markoff-Ketten Technische Universität Bergakademie Freiberg 96 Numerische Simulation mathematischer Modelle 3.4 Reduzible und irreduzible Matrizen Ist π eine Permutation der Indexmenge {1, 2, . . . , n} dann ist die zugehörige Permutationsmatrix P = Pπ = [pi,j ] ∈ Rn×n durch ( 1, falls j = π(i), pi,j = 0, falls j 6= π(i), definiert. Es gilt Pπ−1 = Pπ−1 = PπT . Ist A = [ai,j ] ∈ Cn×n mit den Zeilen z1T , . . . , znT und Spalten s1 , . . . , sn , so T T besitzt P A die Zeilen zπ(1) , . . . , zπ(n) und AP T die Spalten sπ(1) , . . . , sπ(n) . Insbesondere ist P AP T = [aπ(i),π(j) ]. Markoff-Ketten Technische Universität Bergakademie Freiberg 97 Numerische Simulation mathematischer Modelle Eine Matrix A ∈ Cn×n heißt reduzibel (zerlegbar), falls eine Permutationsmatrix P existiert, so dass " # A1,1 O T P AP = A2,1 A2,2 mit quadratischen Matrizen A1,1 , A2,2 der Ordnung p > 0 und q > 0 (p + q = n). A heißt irreduzibel, wenn A nicht reduzibel ist. Wir ordnen der Matrix A = [ai,j ] ∈ Cn×n n Knoten N1 , N2 , . . . , Nn zu. Für jedes Element ai,j 6= 0 wird Ni mit Nj durch eine gerichtete Kante verbunden. Falls ai,i 6= 0 ist, so wird Ni mit einer geschlossenen Schleife versehen. Die Gesamtheit der Knoten und Kanten bildet den gerichteten Graph G(A) von A. Markoff-Ketten Technische Universität Bergakademie Freiberg 98 Numerische Simulation mathematischer Modelle 0 0 1 0 0 1/2 A= 1/3 1/3 1/3 1/3 1/3 0 0 1/2 0 173 N2 N1 I 6 @ 6@ @ @ @ @ ⇒ G(A) : @ @ ? @ R @ - N3 N4 Ein gerichteter Graph heißt vollständig zusammenhängend, wenn es für jedes geordnete Paar (Ni , Nj ) von Knoten einen gerichteten Weg (d.h. eine Folge von gerichteten Kanten) gibt, der von Ni nach Nj führt. Markoff-Ketten Technische Universität Bergakademie Freiberg 99 Numerische Simulation mathematischer Modelle Satz 3.1 (Charakterisierung von Irreduzibilität) Die folgenden Aussagen sind einander äquivalent: 1. Die Markoff-Kette (S , A ) ist irreduzibel. 2. Die zugehörige Übergangsmatrix A ist irreduzibel. 3. Der gerichtete Graph von A ist vollständig zusammenhängend. Äquivalent: A = [ai,j ] ist genau dann irreduzibel, wenn es für jede beliebige Zerlegung Z = S ∪ T der Indexmenge (hier: des Zustandraums) Z := {1, 2, . . . , n} mit S ∩ T = ∅, S 6= ∅, T 6= ∅ ein Element ai,j 6= 0 gibt mit i ∈ S und j ∈ T . Markoff-Ketten Technische Universität Bergakademie Freiberg 100 Numerische Simulation mathematischer Modelle Zu jeder Matrix A ∈ Cn×n gibt es A1,1 A2,1 > P AP = A3,1 . .. Ak,1 eine Permutationsmatrix P ∈ Rn×n , so dass 0 ··· ··· 0 A2,2 0 0 .. A3,2 A3,3 . .. .. . . Ak,2 Ak,3 · · · Ak,k untere Blockdreiecksform besitzt. Die quadratischen Diagonalblöcke Aj,j (j = 1, 2, . . . , k) sind dabei entweder irreduzibel oder eindimensionale Nullmatrizen (Normalform einer reduziblen Matrix). Markoff-Ketten Technische Universität Bergakademie Freiberg 101 Numerische Simulation mathematischer Modelle Sei (S , A ) eine Markoff-Kette mit Zustandsraum {1, 2, ..., n} . Die Zufallsvariable Tj sei die Zeit, zu der der Prozess zum ersten Mal in den Zustand j kommt und fi,j (k) = W (Tj = k|X0 = i) sei die Wahrscheinlichkeit, dass der Prozess, wenn er im Zustand i startet, zur Zeit k zum ersten Mal nach j kommt. Dann gelten k = 1, ai,j , δi,j (Kronecker-δ), k = 1, X (k) k X fi,j (k) = und a = i,j (k−l) ai,` f`,j (k − 1), k ≥ 2, f (`)a , k ≥ 2, i,j j,j l6=j `=1 Aus der ersten Formel folgt für k ≥ 2 X fi,j (k) = ai,`1 a`1 `2 · · · a`k−1 ,j , wobei über alle (k − 1)-Tupel (`1 , `2 , . . . , `k−1 ) summiert wird mit `s 6= j für alle s = 1, 2, . . . k − 1. P∞ ∗ Weiter ist fi,j = k=1 fi,j (k) die Wahrscheinlichkeit, dass der Prozess ausgehend vom Zustand i in endlich vielen Schritten nach j kommt. Markoff-Ketten Technische Universität Bergakademie Freiberg 102 Numerische Simulation mathematischer Modelle Der Zustand i heißt rekurrent, wenn fii∗ = 1, d.h. wenn mit Wahrscheinlichkeit 1 der Prozess ausgehend von i irgendwann wieder nach j zurückkehrt. Der Zustand i heisst transient, wenn fii∗ < 1, d.h. es gibt eine positive ∗ Wahrscheinlichkeit (1 − fi,i > 0) dafür, dass der Prozess nie mehr nach i zurückkehrt. Ein rekurrenter Zustand i heißt periodisch mit Periode p, falls (m) p = ggT{m : ai,i > 0}. Ist p = 1, so heißt der Zustand aperiodisch. Sei Ni die Anzahl, wie oft der Prozess in den Zustand i zurückkehrt, wenn er dort gestartet wird (Startpunkt wird mitgezählt.) Die Zufallsvariable Ni is geometrisch verteilt: ∗ m−1 ∗ W (Ni = m) = fi,i (1 − fi,i ) (m = 1, 2, . . .). Das bedeutet: W (Ni < ∞) = ∞ X m=1 Markoff-Ketten W (Ni = m) = ∞ X m=1 ∗ m−1 fi,i ∗ (1 − fi,i )= ( ∗ 0, fi,i = 1, ∗ 1, fi,i = 0. Technische Universität Bergakademie Freiberg 103 Numerische Simulation mathematischer Modelle Ein transienter Zustand i ist also dadurch charakterisiert, dass der Prozess mit Wahrscheinlichkeit 1 nur endlich oft nach i zurückkehrt, während ein rekurrenter Zustand mit Wahrscheinlichkeit 1 unendlich oft besucht wird. Satz 3.2 (Klasseneigenschaften bei (endlichen) Markoff-Ketten) 1. Nicht alle Zustände können transient sein. 2. Angenommen, die Zustände i und j kommunizieren. Dann gelten die Solidaritätsprinzipien: a) Ist i rekurrent, so auch j. b) Ist i transient, so auch j. c) Ist i aperiodisch, so auch j. d) Ist i periodisch mit Periode p ≥ 2, so auch j. 3. Jede (endliche) Markoff-Kette besitzt mindestens eine Kommunikationsklasse, in der alle Zustände rekurrent sind. 4. Ist die endliche Markoff-Kette irreduzibel, so sind alle Zustände rekurrent. Markoff-Ketten Technische Universität Bergakademie Freiberg Numerische Simulation mathematischer Modelle 104 Wir beschreiben die Struktur der Übergangsmatrix A: Der Zustandsraum von (S , A ) zerfalle in r1 rekurrente und r2 transiente Kommunikationsklassen. Dann kann A nach geeigneter Umnummerierung der Zustände in der folgenden Form dargestellt werden: 0 0 A1,1 0 .. . 0 Ar1 ,r1 0 0 A = Ar1 +1,1 · · · Ar1 +1,r1 Ar1 +1,r1 +1 0 .. .. .. .. .. . . . . . Ar1 +r2 ,1 · · · Ar1 +r2 ,r1 Ar1 +r2 ,r1 +1 · · · Ar1 +r2 ,r1 +r2 # " O AR,R . = AT,R AT,T Markoff-Ketten Technische Universität Bergakademie Freiberg 105 Numerische Simulation mathematischer Modelle Die quadratischen Matrizen Ak,k (1 ≤ k ≤ r1 ) sind irreduzible stochastische Matrizen. Insbesondere besitzen sie alle den Spektralradius 1. Die quadratischen Matrizen Ak,k (r1 + 1 ≤ k ≤ r1 + r2 ) sind entweder Nullmatrizen der Dimension 1 × 1 oder sie sind irreduzibel und substochastisch, d.h. ihre Zeilensummen sind ≤ 1, wobei für mindestens eine Zeile strikte Ungleichheit gilt. Das bedeutet, dass die Spektralradien ρ(Ak,k ) echt kleiner als 1 sind und daher limm→∞ Am k,k = 0 gilt (r1 + 1 ≤ k ≤ r1 + r2 ). Daraus folgt: limm→∞ Am T,T = 0. Markoff-Ketten Technische Universität Bergakademie Freiberg 106 Numerische Simulation mathematischer Modelle 3.5 Stationäre Verteilungen Sei (S , A ) eine diskrete Markoff-Kette mit Zustandsraum {1, 2, . . . , n} und Übergangsmatrix A. Ein Wahrscheinlichkeitsvektor π heißt stationär (invariant) bez. (S , A ), wenn π = πA gilt. Äquivalent: π ist linker Eigenvektor von A zum Eigenwert 1. Äquivalent: π T löst das homogene LGS (In − AT )x = 0 . Äquivalent: π T liegt in N (In − AT ), dem Nullraum von (In − AT ). Markoff-Ketten Technische Universität Bergakademie Freiberg 107 Numerische Simulation mathematischer Modelle • Existiert π = limm→∞ π 0 Am (für eine beliebige Anfangsverteilung π 0 ), dann ist π stationär. • Existiert limm→∞ Am = A∞ , dann ist π 0 A∞ stationär für jede Verteilung π0 . (m) • Gilt limm→∞ ai,j = πj (für alle i und j), m.a.W.: konvergiert die j-te Spalte von Am gegen πj e (m → ∞) für alle j, dann ist π = [π1 , π2 , . . . , πn ] stationär. Satz 3.3 (Satz von Perron (1908) und Frobenius (1912)) Ist A ∈ Rn×n nichtnegativ und irreduzibel, so gelten: 1. Der Spektralradius ρ(A) = max{|λ| : λ ist Eigenwert von A} > 0 ist ein (algebraisch) einfacher Eigenwert von A. 2. Der (bis auf skalare Vielfache eindeutige) Eigenvektor von A zum Eigenwert ρ(A) kann positiv gewählt werden. 3. Gilt Ax = λx für ein x ≥ 0 , x 6= 0 , so folgt λ = ρ(A). Markoff-Ketten Technische Universität Bergakademie Freiberg 108 Numerische Simulation mathematischer Modelle Satz 3.4 (Satz von Perron-Frobenius, Teil II) Ist A = [ai,j ] ∈ Rn×n nichtnegativ und irreduzibel, so gelten: 1. Besitzt A genau p verschiedene Eigenwerte λ1 , . . . , λp vom Betrag ρ(A), dann folgt (nach einer geeigneten Umnummerierung) 2πj i (j = 1, . . . , p). λj = ρ(A) exp p λ1 , . . . , λp sind einfache Eigenwerte von A. Außerdem ist das Spektrum von A ( = Menge aller Eigenwerte) invariant unter der Drehung um den Winkel 2π/p. 2. Ist p > 1, so gibt es eine Permutationsmatrix P ∈ Rn×n mit O A1,2 O A 2,3 . . > . . P AP = . . O Ap−1,p Ap,1 O (die Nulldiagonalblöcke sind quadratisch). 3. Ist wenigstens ein Diagonalelement von A positiv, so folgt p = 1. 4. Gibt es i, j ∈ {1, . . . , n} mit ai,j aj,i > 0, so folgt p ≤ 2. Markoff-Ketten Technische Universität Bergakademie Freiberg 109 Numerische Simulation mathematischer Modelle Sei A ∈ Rn×n nichtnegativ und irreduzibel. p sei die Anzahl der Eigenwerte von A vom Betrag ρ(A). Ist p = 1, so heißt A primitiv. Ist p > 1, so heißt A zyklisch vom Index p. Eine nichtnegative irreduzible Matrix A ∈ Rn×n ist genau dann primitiv, wenn es eine Potenz m gibt, so dass Am nur positive Einträge besitzt. Sei A zyklisch vom Index p. Liegt A in der Normalform von Satz 3.4 vor, so folgt: B1 B2 .. Ap = . B p−1 Bp , mit Bj = Aj,j+1 Aj+1,j+2 · · · Ap,1 A1,2 A2,3 · · · Aj−1,j . Alle Bj , j = 1, 2, . . . , p, sind quadratisch, nichtnegativ, irreduzibel und primitiv. Markoff-Ketten Technische Universität Bergakademie Freiberg 110 Numerische Simulation mathematischer Modelle Satz 3.5 (Romanovsky, 1936) Es sei G(A) der gerichtete Graph einer nichtnegativen irreduziblen Matrix A ∈ Rn×n . Für jeden Knoten Nj von G(A) sei Sj die Menge aller gerichteten Wege, die Nj mit sich selbst verbinden. Die Länge `(w) eines gerichteten Wegs w sei die Anzahl der beteiligten Kanten. Wir setzen pj = ggT {`(w) : w ∈ Sj }. Dann gilt p1 = p2 = · · · = pn =: p und p ist die Anzahl der Eigenwerte von A vom Betrag ρ(A), d.h. A ist zyklisch vom Index p. Markoff-Ketten Technische Universität Bergakademie Freiberg 111 Numerische Simulation mathematischer Modelle Synopsis Sei A = [ai,j ] ∈ Rn×n die Übergangsmatrix der Markoff-Kette (S , A ). 1. Immer existiert m 1 X k A . P := lim m→∞ m + 1 k=0 P ist stochastisch. Außerdem ist P eine Projektion, die mit A kommutiert, genauer: P = P 2 = P A = AP . Es gilt M N (P ) = N ((A − λI)n ). λ∈Λ(A)\{1} π 0 P ist stationär für jede Verteilung π 0 . Insbesondere besitzt jede Markoff-Kette (unter den hier üblichen Voraussetzungen) eine stationäre Verteilung. Markoff-Ketten Technische Universität Bergakademie Freiberg 112 Numerische Simulation mathematischer Modelle 2. Wenn Q := lim Am m→∞ existiert, so gilt Q = P . 3. Ist A primitiv, dann gibt es genau einen Vektor z = [z1 , z2 , . . . , zn ]> ∈ Rn mit z > 0 , kz k1 = 1 und z > A = z > . Der Grenzwert Q = limm→∞ Am existiert und es gilt z1 z2 · · · zn z1 z2 · · · zn Q= . . . . .. .. .. z1 z2 · · · zn Ist (S , A ) irreduzibel und aperiodisch, dann existiert genau eine stationäre Verteilung π. Jede Komponente von π ist positiv. Die Kette strebt für jede Ausgangsverteilung gegen π. Markoff-Ketten Technische Universität Bergakademie Freiberg 113 Numerische Simulation mathematischer Modelle 4. Ist A zyklisch vom Index p ≥ 2, so existiert limm→∞ Am nicht. Ist (S , A ) irreduzibel und periodisch, dann existiert genau eine stationäre Verteilung π, aber die Kette strebt nicht für jede Ausgangsverteilung gegen π. 5. Die (eindeutig bestimmte) stationäre Verteilung π einer p-periodischen Kette lässt sich wie folgt bestimmen: Ap = diag(B1 , B2 , . . . , Bp ) besitzt Blockdiagonalform (vgl. die Aussage auf Seite 109). Die Diagonalblöcke Bj sind stochastisch und primitiv, d.h. sie besitzen eine eindeutig bestimmte stationäre Verteilung π (j) , die nach Punkt 3 bestimmt werden kann. Es gilt h i π = p1 π (1) , π (2) , . . . , π (p) . Jede Komponente von π ist positiv. Markoff-Ketten Technische Universität Bergakademie Freiberg 114 Numerische Simulation mathematischer Modelle 6. Ist A reduzibel mit Normalform A1,1 A2,1 SAS T = . .. Ak,1 , A2,2 .. Ak,2 . ··· Ak,k so existiert Q = limm→∞ Am genau dann, wenn jeder Diagonalblock Ai,i primitiv ist, für den ρ(Ai,i ) = 1 gilt. limm→∞ Am existiert genau dann, wenn jede rekurrente Kommunikationsklasse aperiodisch ist. Markoff-Ketten Technische Universität Bergakademie Freiberg 115 Numerische Simulation mathematischer Modelle 7. Andere Formulierung: Die Übergangsmatrix A einer reduziblen Kette besitzt die Normalform 0 0 A1,1 0 .. . 0 Ar1 ,r1 0 0 A = Ar1 +1,1 · · · Ar1 +1,r1 Ar1 +1,r1 +1 0 .. .. .. .. .. . . . . . Ar1 +r2 ,1 · · · Ar1 +r2 ,r1 Ar1 +r2 ,r1 +1 · · · Ar1 +r2 ,r1 +r2 # " O AR,R , = AT,R AT,T wenn die Kette r1 rekurrente und r2 transiente Kommunikationsklassen besitzt. ... Markoff-Ketten Technische Universität Bergakademie Freiberg 116 Numerische Simulation mathematischer Modelle Der Grenzwert limm→∞ Am existiert genau dann, wenn alle rekurrenten Kommunikationsklassen aperiodisch sind, d.h. genau dann, wenn alle Ak,k (1 ≤ k ≤ r1 ) primitiv sind. Dann gelten: limm→∞ Ak,k = Qk (1 ≤ k ≤ r1 ), d.h. limm→∞ Am R,R = QR,R := diag(Q1 , Q2 , . . . , Qr1 ) und # " O QR,R lim Am = . −1 m→∞ (I − AT,T ) AT,R QR,R O Markoff-Ketten Technische Universität Bergakademie Freiberg 117 Numerische Simulation mathematischer Modelle 8. Eine reduzible Markoff-Kette besitzt i.a. (unendlich) viele stationäre Verteilungen. Zerfällt sie in r1 rekurrente und r2 transiente Kommunikationsklassen und sind π (1) , π (2) , . . . , π (r1 ) die (eindeutig bestimmten) stationären Verteilungen der rekurrenten Klassen, so sind π(α) = α1 π (1) , α2 π (2) , . . . , αr1 π (r1 ) , 0 , 0 , . . . , 0 {z } | r2 Nullvektoren (αj ≥ 0, Kette. Pr1 j=1 αj = 1) genau die stationären Verteilungen der gesamten ... Markoff-Ketten Technische Universität Bergakademie Freiberg 118 Numerische Simulation mathematischer Modelle Sind alle rekurrenten Kommunikationsklassen aperiodisch, dann gilt für die Anfangsverteilung (r ) (2) (1) π 0 (α) = α1 π 0 , α2 π 0 , . . . , αr1 π 0 1 , 0 , 0 , . . . , 0 | {z } r2 Nullvektoren (k) (π 0 ist eine beliebige Anfangsverteilung in der rekurrenten Pr1 Kommunikationsklasse Kk und αj ≥ 0, j=1 αj = 1) die Grenzbeziehung lim π 0 (α)Am = π(α). m→∞ Markoff-Ketten Technische Universität Bergakademie Freiberg 119 Numerische Simulation mathematischer Modelle 3.6 Absorbierende Ketten und Übergangszeiten Erinnerung: Tj ist die Zeit, in der die Kette zum ersten Mal in den Zustand j kommt und fi,j (k) ist die Wahrscheinlichkeit dafür, dass dies zur Zeit k geschieht, unter der Bedingung, dass der Prozess im Zustand i gestartet wird. P∞ ∗ fi,j = k=1 fi,j (k) ist die Wahrscheinlichkeit mit der ein Übergang von i nach j in endlicher Zeit stattfindet. Sei jetzt A eine Teilmenge des Zustandsraums, d.h. A ⊆ {1, 2, . . . , n}. Wir definieren TA := min{n ≥ 0 : Xn ∈ A} ∗ sowie fi,A := W (TA < ∞ | X0 = i). Die Zufallsvariable TA (erstmalige Übergangszeit, hitting time) gibt an, wann ∗ der Prozess zum ersten Mal einen der Zustände aus A erreicht. fi,A ist die Wahrscheinlichkeit dafür, dass der Prozess — ausgehend von i — in endlich vielen Schritten A erreicht. Ist A eine rekurrente Kommunikationsklasse, so ∗ nennt man fi,A eine Absorptionswahrscheinlichkeit (wenn diese Klasse erreicht ist, kann sie mit Wahrscheinlichkeit 1 nicht mehr verlassen werden). Markoff-Ketten Technische Universität Bergakademie Freiberg 120 Numerische Simulation mathematischer Modelle Besteht eine rekurrente Klasse aus genau einem Zustand j, so nennt man diesen absorbierend. Äquivalent: Ein Zustand j ist genau dann absorbierend, wenn aj,j = 1 gilt, d.h. wenn er mit Wahrscheinlichkeit 1 nicht mehr verlassen werden kann. Schließlich ist (falls A von i aus erreichbar ist) ki,A = E(TA | X0 = i) = ∞ X k W (TA = k | X0 = i) k=0 die durschschnittliche Zeit, die der Prozess benötigt, um von i erstmalig nach A zu kommen (mittlere (erstmalige) Übergangszeit). Ist A eine rekurrente Kommunikationsklasse, nennt man die durchschnittliche Zeit bis zur Absorption in A auch Kettenlänge. Markoff-Ketten Technische Universität Bergakademie Freiberg 121 Numerische Simulation mathematischer Modelle Im Folgenden sei A immer eine rekurrente Kommunikationsklasse. Ist i rekurrent, so gilt offenbar ( 1, i ∈ A, ∗ fi,A = und ki,A = 0, wenn i ∈ A. 0, i 6∈ A, Bevor wir diese Größen für transiente i bestimmen, betrachten wir einen wichtigen Spezialfall: Sei zunächst (S , A ) eine absorbierende Kette, d.h. • sie besitzt s ≥ 1 absorbierende Zustände, • die n − s nicht-absorbierenden Zustände sind transient, • alle transienten Zustände kommunizieren miteinander. Markoff-Ketten Technische Universität Bergakademie Freiberg 122 Numerische Simulation mathematischer Modelle Die Übergangsmatrix hat (nach eventueller Umnummerierung der Zustände) die Form " # Is O A= C B (In−s − B ist invertierbar) und es gilt " lim A m→∞ m = Is (In−s − B) O −1 C O # . Bezeichnet A = {1, 2, . . . , s} die Menge der absorbierenden Zustände, so gilt ∗ fi,A = 1 für alle i. (Die Wahrscheinlichkeit einer endgültigen Absorption ist 1.) Markoff-Ketten Technische Universität Bergakademie Freiberg 123 Numerische Simulation mathematischer Modelle Kanonische Fragestellungen bei absorbierenden Markoff-Ketten Frage 1. i und j seien transiente Zustände. ti,j bezeichne die durchschnittliche Anzahl, wie oft der Zustand j erreicht wird, wenn in i gestartet wird (der Ausgangszustand wird mitgezählt, falls i = j). Antwort: Setze T = [ti,j ]s+1≤i,j≤n ∈ R(n−s)×(n−s) , dann gilt T = (In−s − B)−1 . Frage 2. Der Prozess werde im transienten Zustand i gestartet. Wie groß ist die durchschnittliche Kettenlänge ki,A , das ist die durchschnittliche Anzahl der Schritte bis zur Absorption? Antwort: Setze e = [1, 1, . . . , 1]T ∈ Rn−s , dann gilt Pn ki,A = j=s+1 ti,j = [T e]i (i = s + 1, s + 2, . . . , n). Frage 3. Der Prozess werde im transienten Zustand i gestartet. Wie groß ist die Wahrscheinlichkeit qi,j für Absorption im Zustand j (j ≤ s)? Antwort: Setze Q = [qi,j ]s+1≤i≤n,1≤j≤s ∈ R(n−s)×s , dann gilt Q = (I − B)−1 C. Markoff-Ketten Technische Universität Bergakademie Freiberg 124 Numerische Simulation mathematischer Modelle Beispiel 1 (Vererbung bei reiner Inzucht [Pharaonen]) Eine vererbliche Eigenschaft werde durch zwei Gene (a und b) bestimmt. Jeder Mensch habe zwei solche Gene, was 6 Zustände bei der Genverteilung eines Paares ergibt: 1: aa × aa 2: aa × ab 3: aa × bb 4: ab × ab 5: ab × bb 6: bb × bb Beim Erbvorgang bekommt das Kind je ein Gen von beiden Eltern, und zwar jedes der Gene mit Wahrscheinlichkeit 1/2. Mit den Mendelschen Gesetzen ergibt sich aa × aa 7→ aa ab × ab 7→ 1 4 aa + 1 2 ab + 1 4 bb aa × ab 7→ 1 2 aa + 1 2 ab aa × bb 7→ ab ab × bb 7→ 1 2 ab + 1 2 bb bb × bb 7→ bb Die erstgeborene Tochter und der erstgeborene Sohn bilden das nächste Pharaonenpaar. (Wir nehmen an, dass es immer mindestens eine Tochter und einen Sohn gibt.) Markoff-Ketten Technische Universität Bergakademie Freiberg 125 Numerische Simulation mathematischer Modelle Wir erhalten als Übergangsmatrix 1 0 1/4 1/2 0 0 A= 1/16 1/4 0 0 0 Markoff-Ketten 0 0 0 0 0 0 1/4 0 0 0 1 0 0 1/8 1/4 1/4 1/16 0 1/4 1/2 1/4 0 0 0 1 Technische Universität Bergakademie Freiberg 126 Numerische Simulation mathematischer Modelle bzw. nach der Permutation (1, 6, 2, 3, 4, 5) 1 0 0 0 0 0 0 1 0 0 0 0 1/4 0 1/2 0 1/4 0 A= 0 0 0 0 1 0 1/16 1/16 1/4 1/8 1/4 1/4 0 Markoff-Ketten 1/4 0 0 1/4 " I2 = C O B # . 1/2 Technische Universität Bergakademie Freiberg 127 Numerische Simulation mathematischer Modelle 1. Durchschnittliche Anzahl der Besuche in j, wenn in i gestartet wird und 2. Kettenlänge `i bei Start in i. Markoff-Ketten i/j aa × ab aa × bb ab × ab ab × bb aa × ab 8 3 1 6 4 3 2 3 29 6 = 4.83 . . . aa × bb 4 3 4 3 8 3 4 3 20 3 = 6.66 . . . ab × ab 4 3 1 3 8 3 4 3 17 3 = 5.66 . . . ab × bb 2 3 1 6 4 3 8 3 29 6 = 4.83 . . . `i Technische Universität Bergakademie Freiberg 128 Numerische Simulation mathematischer Modelle 3. Wahrscheinlichkeit für Absorption im Zustand j, wenn in i gestartet wird. Markoff-Ketten i/j aa × aa bb × bb aa × ab 3 4 1 4 aa × bb 1 2 1 2 ab × ab 1 2 1 2 ab × bb 1 4 3 4 Technische Universität Bergakademie Freiberg 129 Numerische Simulation mathematischer Modelle Beispiel 2 (Bankrott eines Spielers) Zwei Spieler spielen mit einem Geldvorrat von insgesamt n Euro. Pro Spiel wird um einen Euro gespielt, der den Besitzer wechselt. Dabei gewinnt Spieler 1 mit Wahrscheinlichkeit p > 0, Spieler 2 mit Wahrscheinlichkeit q = 1 − p > 0. Der Zustand j liegt vor, wenn der erste Spieler genau j Euro besitzt. Das Spiel endet, wenn einer der Spieler bankrott ist. Markoff-Ketten Technische Universität Bergakademie Freiberg 130 Numerische Simulation mathematischer Modelle Die Übergangsmatrix 1 q 0 0 A= . .. 0 0 0 ist 0 0 0 ··· ··· 0 p 0 q 0 0 .. . q 0 0 0 0 0 0 0 0 0 0 ∈ R(n+1)×(n+1) . 0 0 0 p 0 0 0 0 0 0 .. . 0 .. . ··· 0 p 0 0 ··· q 0 p 0 ··· 0 0 1 .. . Die Zustände 0 und n sind absorbierend, alle anderen sind transient und kommunizieren miteinander. Markoff-Ketten Technische Universität Bergakademie Freiberg 131 Numerische Simulation mathematischer Modelle Es gilt lim A m m→∞ 1 s1 s2 = .. . s n−1 0 0 0 ··· ··· 0 .. . 0 0 1 − s1 0 .. . 1 − s2 .. . 0 0 ··· 0 1 − sn−1 0 ··· 0 1 mit sj = t n−1 X q p k " und t 1+q 1. Fall: p = q = 1/2. Dann folgt sj = Markoff-Ketten q p k # = q. k=2 k=j 2. Fall: p 6= q. Setze r = n−1 X q p. n−j n . Dann folgt sj = r n −r j r n −1 . Technische Universität Bergakademie Freiberg 132 Numerische Simulation mathematischer Modelle Interpretation: Sei Spieler 2 die Bank. Sie sorgt dafür, dass r (leicht) größer als 1 ist (Roulette). Die Bank beginne mit k Euro, Spieler 1 mit n − k Euro. Die Wahrscheinlichkeit für den Ruin von Spieler 1 ist also sn−k rn − rn−k rk − 1 . = > rn − 1 rk (rk−1)/rk 1 r=1.001 0.9 r=1.0001 0.8 0.7 r=1.01 0.6 0.5 0.4 0.3 0.2 0.1 0 0 0.5 1 1.5 2 2.5 3 3.5 4 4 x 10 Bei gegebenem r > 1 kann die Bank also ihren Geldvorrat k so bestimmen, dass die Wahrscheinlichkeit für den Ruin des Spielers deutlich höher als 1/2 ist (und zwar unabhängig vom Anfangskapital n − k des Spielers!). Markoff-Ketten Technische Universität Bergakademie Freiberg 133 Numerische Simulation mathematischer Modelle Satz 3.6 (Mittlere Übergangszeiten) Der Vektor [ki,A ]1≤i≤n der mittleren Übergangszeiten ist die minimale nichtnegative Lösung de linearen Gleichungssystems ( 0, i∈A ki,A = P 1 + j6=A ai,j kj,A , i 6= A. Markoff-Ketten Technische Universität Bergakademie Freiberg 134 Numerische Simulation mathematischer Modelle Satz 3.7 (Mittlere Übergangszeiten bei rekurrenten Zuständen) Sei " # O AR,R A= AT,R AT,T die Übergangsmatrix einer reduziblen Kette mit s rekurrenten und t transienten Zuständen (d.h. AR,R ∈ Rs×s und AT,T ∈ Rt,t ). Die mittlere Übergangszeit von einem transienten Zustand i in die VerPs+t einigung A aller rekurrenten Klassen ist ki,A = j=s+1 ti,j . Dabei ist T = [ti,j ]s+1≤i,j≤s+t = (I − AR,R )−1 . Die mittlere Übergangszeit von einem transienten Zustand i in eine feste rePs+t P kurrente Klasse K ist ki,K = ai,K j=s+1 ti,j . Dabei ist ai,K = j∈K ai,j . Markoff-Ketten Technische Universität Bergakademie Freiberg 135 Numerische Simulation mathematischer Modelle Beispiel 3 (Irrfahrt auf Graphen) Unter einem Graph verstehen wir jetzt einen vollständig zusammenhängenden ungerichteten Graphen mit n Knoten {1, 2 . . . , n} ohne Schleifen, also ohne Kanten, die einen Knoten mit sich selbst verbinden. Mit deg(i), dem Grad des Knoten i, bezeichnen wir die Anzahl der Kanten in i. In der Irrfahrt wechseln wir von einem Knoten i zu einem der Nachbarknoten über mit Wahrscheinlichkeit 1/deg(i), also zu jedem der Nachbarknoten mit gleicher Wahrscheinlichkeit. Der Prozess befindet sich im Zustand i, wenn die Irrfahrt im Knoten i angelangt ist. Ein solcher Markoff-Prozess ist irreduzibel, besitzt also eine eindeutig bestimmte stationäre Verteilung, nämlich π= 1 d [deg(1), deg(2), . . . , deg(n)] mit d = n X deg(i) = 2 card{Kanten}. i=1 Markoff-Ketten Technische Universität Bergakademie Freiberg 136 Numerische Simulation mathematischer Modelle Die Irrfahrt des Springers aus Abschnitt 3.1 ist beispielsweise eine Irrfahrt auf einem Graphen. Die Knoten des Graphen sind die Felder des Schachbretts. Zwei Felder sind durch eine Kante verbunden, wenn der Springer von einem dieser Felder zum anderen ziehen kann. (Die zugehörige Markoff-Kette ist periodisch mit der Periode 2.) Satz 3.8 (Mittlere Rückkehrzeit) Sei π = [π1 , π2 , . . . , πn ] die stationäre Verteilung einer irreduzibeln MarkoffP∞ Kette. Die mittlere Rückkehrzeit in den Zustand i, also k=1 k W (Ti = k | X0 = i), hat den Wert 1/πi . Markoff-Ketten Technische Universität Bergakademie Freiberg 137 Numerische Simulation mathematischer Modelle 2 3 4 4 4 4 3 2 3 4 6 6 6 6 4 3 4 6 8 8 8 8 6 4 4 6 8 8 8 8 6 4 4 6 8 8 8 8 6 4 4 6 8 8 8 8 6 4 3 4 6 6 6 6 4 3 2 3 4 4 4 4 3 2 Die mittlere Rückkehrzeit für den Springer in eine der vier Ecken des P64 Schachbretts ist also i=1 deg(i)/2 = 336/2 = 168. Markoff-Ketten Technische Universität Bergakademie Freiberg 138 Numerische Simulation mathematischer Modelle 3.7 Geschwindigkeit der Konvergenz zum Gleichgewicht. A sei die Übergangsmatrix einer Markoff-Kette. reduzibel irreduzibel primitiv irreduzibel zyklisch limk→∞ P k = ? ∃ limk→∞ P k 6 ∃ limk→∞ P k Frage: Angenommen A ist primitiv (wird ab jetzt immer vorausgesetzt), d.h. A∞ = limm→∞ Am = eπ existiert (π bezeichnet die eindeutig bestimmte stationäre Verteilung der Kette), wie schnell konvergiert dann Am gegen A∞ ? Oder: Wie schnell strebt die Markoff-Kette gegen ihre stationäre Verteilung? Markoff-Ketten Technische Universität Bergakademie Freiberg 139 Numerische Simulation mathematischer Modelle Irrfahrt auf Cn , dem zyklischen Graph mit n Knoten Zeit 0: W (X0 Zeit 1: W (X1 W (X1 W (X1 Zeit 2: W (X2 W (X2 W (X2 W (X2 W (X2 = 0) = 1. = n − 1) = 1/3, = 0) = 1/3, = 1) = 1/3. = n − 2) = 1/9, = n − 1) = 2/9, = 0) = 3/9, = 1) = 2/9, = 2) = 1/9. Offensichtlich ist die stationäre Verteilung π die Gleichverteilung π= 1 n [1, 1, . . . , 1]. Wie schnell strebt π m = π 0 Am (π 0 = [1, 0, . . . , 0]) gegen π? Markoff-Ketten Technische Universität Bergakademie Freiberg 140 Numerische Simulation mathematischer Modelle n=100, m=100 0.05 0.04 0.04 0.03 0.03 0.02 0.02 0.01 0.01 0 0 20 60 80 100 n=100, m=1000 0.05 0 0.04 0.03 0.03 0.02 0.02 0.01 0.01 0 20 40 60 0 20 80 100 0 40 60 80 100 80 100 n=100, m=2000 0.05 0.04 0 Markoff-Ketten 40 n=100, m=500 0.05 0 20 40 60 Technische Universität Bergakademie Freiberg 141 Numerische Simulation mathematischer Modelle Sei E := A − A∞ . Dann (beachte A∞ = A∞ A∞ = AA∞ = A∞ A) m Am − A∞ = (A − A∞ ) = Em (m = 1, 2, . . .). Seien π die stationäre Verteilung der Kette, π 0 eine beliebige Anfangsverteilung und π m = π 0 Am die Verteilung nach Schritt m. Dann (beachte A∞ = eπ) π m − π = π 0 (Am − A∞ ) = π 0 E m (m = 1, 2, . . .). Messe Abstand von Verteilungen durch kπ m − πk := sup {|π m (X) − π(X)| : X ⊆ {1, 2, . . . , n}} = 21 kπ m − πk1 (total variation distance). Beachte außerdem kM k = max kσM k = kM k∞ . kσk=1 Markoff-Ketten Technische Universität Bergakademie Freiberg 142 Numerische Simulation mathematischer Modelle Das bedeutet: Für jede Anfangsverteilung π 0 ist kπ m − πk = kπ 0 E m k ≤ kπ 0 kkE m k∞ = 12 kE m k∞ und es gibt ein π 0 (worst case), so dass hier Gleichheit gilt. Die Abschätzung kπ m − πk ≤ 21 kE m k∞ ≤ 12 kEkm ∞ ist oft zu grob, um brauchbar zu sein. Bei der Irrfahrt auf Cn gilt beispielsweise kEk∞ = 2 − n6 ≈ 2. Markoff-Ketten Technische Universität Bergakademie Freiberg 143 Numerische Simulation mathematischer Modelle Satz 3.9 Es seien A die Übergangsmatrix einer aperiodischen Kette mit stationärer Wahrscheinlichkeitsverteilung π, d.h. limm→∞ Am = eπ, und E = eπ − A. Dann folgt Λ(E) = {0} ∪ (Λ(A) \ {1}). Setzt man γ(A) := ρ(E) = max{|λ| : λ ∈ Λ(A) \ {1}}, dann gilt lim kπ m − πk1/m ≤ γ(A), m→∞ wobei für fast alle π 0 Gleichheit gilt. Die Markoff-Kette strebt also asymptotisch linear mit Konvergenzfaktor γ(A) gegen ihre stationäre Verteilung. Markoff-Ketten Technische Universität Bergakademie Freiberg 144 Numerische Simulation mathematischer Modelle Sn = 1 1 .. . ωn0 ωn1 = Fn 1 .. . ωnn−1 h i −1 (i−1)(j−1) F , F = ωn 1≤i,j≤n Sn ∈ Rn×n heißt zirkulanter Shift. Fn ∈ Cn×n ist die Fourier-Matrix. Die Eigenwerte von Sn sind die n-ten Einheitswurzeln: ωnj = exp(i 2 π nj ) = cos(2 π nj ) + i sin(2 π nj ) (j = 0, 1, . . . , n − 1) ω6 ω26 2 π/6 ω06=1 ω36=−1 ω46 Markoff-Ketten ω5 6 Technische Universität Bergakademie Freiberg 145 Numerische Simulation mathematischer Modelle Eine Matrix A ∈ Cn×n heißt zirkulant, wenn sie die Form A = p(Sn ) = α0 In + α1 Sn + α2 Sn2 + · · · + αn−1 Snn−1 α0 α1 · · · αn−2 αn−1 αn−1 α0 αn−3 αn−2 .. . . .. .. = . α3 α0 α1 α2 α1 α2 αn−1 α0 besitzt, d.h. wenn sie ein Polynom in Sn ist. Die Eigenwerte λj von A sind dann λj = p(ωnj ) = α0 +α1 ωnj +α2 ωn2j +· · ·+αn−1 ωn(n−1)j Markoff-Ketten (j = 0, 1, . . . , n−1). Technische Universität Bergakademie Freiberg 146 Numerische Simulation mathematischer Modelle Die Übergangsmatrix A der Irrfahrt auf Cn ist 13 (I + Sn + Snn−1 ), besitzt also die Eigenwerte (n−1)j λj = 13 (1 + ωnj + ωn ) = 13 (1 + 2 Real(ωnj )) = 13 (1 + 2 cos(2π nj )). Das 2 bedeutet γ(A) = 1 − 38 nπ2 + O( n14 ) (n → ∞). Für die Irrfahrt auf Cn kann man zeigen: 1/2 n−1 X √ j m m 2m 1 1 1 1 nγ(A) . γ(A) ≤ kπ − πk ≤ | (1 + 2 cos(2π ))| ≤ m 2 2 3 n 2 j=1 Markoff-Ketten Technische Universität Bergakademie Freiberg 147 Numerische Simulation mathematischer Modelle Irrfahrt auf C , n=100 n 0 log of total variation distance 10 untere Schranke Fehlerasymptotik obere Schranke schärfere obere Schranke Abstand −1 10 −2 10 −3 10 0 Markoff-Ketten 500 1000 1500 2000 2500 m 3000 3500 4000 4500 5000 Technische Universität Bergakademie Freiberg 148 Numerische Simulation mathematischer Modelle Irrfahrt auf HN , dem Hyperkubus in N Dimensionen Zeit 0: W (X0 Zeit 1: W (X1 W (X1 W (X1 W (X1 Zeit 2: W (X2 W (X2 W (X2 W (X2 W (X2 W (X2 W (X2 = (0, 0, 0)) = 1. = (0, 0, 0)) = 1/4, = (1, 0, 0)) = 1/4, = (0, 1, 0)) = 1/4, = (0, 0, 1)) = 1/4. = (0, 0, 0)) = 2/8, = (1, 0, 0)) = 1/8, = (0, 1, 0)) = 1/8, = (0, 0, 1)) = 1/8, = (1, 1, 0)) = 1/8, = (1, 0, 1)) = 1/8, = (1, 1, 0)) = 1/8. Die Kette besitzt n = 2N Zustände. Die stationäre Verteilung ist die Gleichverteilung. Markoff-Ketten Technische Universität Bergakademie Freiberg 149 Numerische Simulation mathematischer Modelle Ein cutoff“-Phänomen ” N=8, n=256 1 0.8 0.8 0.6 0.6 0.4 0.4 0.2 0.2 0 0 4 6 8 N=512, n=1.340781e+154 1 0 0.8 0.6 0.6 0.4 0.4 0.2 0.2 0 500 1000 0 1500 0 50 100 N −−> ∞ 1 0.8 0 Markoff-Ketten 2 N=64, n=1.844674e+019 1 0 n log(n)/4 n log(n)/2 Technische Universität Bergakademie Freiberg 150 Numerische Simulation mathematischer Modelle Semilogarithmisch N=8, n=256 N=64, n=1.844674e+019 0 10 0 −1 10 10 −1 10 γ = .969... γ = .777... 0 2 4 6 8 0 50 100 N=512, n=1.340781e+154 0 10 −1 10 γ = .996... 0 Markoff-Ketten 500 1000 1500 Technische Universität Bergakademie Freiberg 151 Numerische Simulation mathematischer Modelle kπ − π m k/kπ − π m−1 k N=8, n=256 1 N=64, n=1.844674e+019 1 0.99 0.9 0.98 0.8 0.97 0.96 0.7 0.6 0.95 0 2 4 6 8 0.94 0 50 100 N=512, n=1.340781e+154 1 0.999 0.998 0.997 0.996 0.995 0.994 0.993 0 Markoff-Ketten 500 1000 1500 Technische Universität Bergakademie Freiberg 152 Numerische Simulation mathematischer Modelle Die Anzahl der Zustände = dim(An ) = 2N = n wächst zu schnell mit N , um die Irrfahrt auf HN (selbst für moderate Werte von N ) nach dem klassischen Strickmuster analysierenzu können. Bilde durch Aggregation neue Kette mit nur (N + 1) neue Zuständen: Zj := {Knoten ∈ HN , deren Koordinaten genau j 1-Komponenten enthalten} N (card(Zj ) = j ). Liegt ein Knoten in Zj , so bedeutet das: Er hat j Nachbarn in Zj−1 , keine Nachbarn (außer sich selbst) in Zj und N − j Nachbarn in Zj+1 . Offensichtlich sind von Zj aus nur Übergänge nach Zj−1 , Zj und Zj+1 möglich. Die Übergangsmatrix der aggregierten Kette ist also 1 N N +1 BN +1 Markoff-Ketten 1 N +1 = N +1 1 N +1 2 N +1 N −1 N +1 1 N +1 N −2 N +1 .. .. . . N −1 N +1 .. . 1 N +1 N N +1 ∈ R(N +1)×(N +1) . 1 N +1 1 N +1 Technische Universität Bergakademie Freiberg 153 Numerische Simulation mathematischer Modelle Formale Bestimmung von BN +1 , zum Beispiel für N = 3, d.h. n = 8: 1 1 1 4 0 0 | 3 0 0 1 2 2 1 0 1 1 } 0 3 {z BN +1 = 0 0 0 | 0 0 0 0 0 1 3 1 3 1 3 0 0 0 0 0 0 1 3 1 3 1 3 0 0 0 0 0 0 {z N +1 In 0 0 0 1 } 1 1 1 1 0 0 0 0 1 4 1 1 0 0 1 1 0 1 0 1 0 1 0 1 1 0 0 1 0 1 1 0 1 1 0 1 0 0 0 1 0 1 0 1 0 0 0 1 1 0 0 1 0 0 0 1 1 1 0 0 0 0 1 {z 1 1 1 | Markoff-Ketten 0 1 An } | 1 0 0 0 0 1 0 0 1 0 0 1 0 0 0 1 0 0 1 0 0 1 0 0 0 . 0 0 0 0 0 0 1 {z n IN +1 } Technische Universität Bergakademie Freiberg 154 Numerische Simulation mathematischer Modelle n Allgemein: BN +1 = InN +1 An IN +1 mit der Klassen-Inzidenzmatrix ( 1 vi ∈ Zj n n×(N +1) IN +1 = [ki,j ] ∈ {0, 1} , ki,j = 0 sonst und der Klassen-Wahrscheinlichkeitsmatrix ( InN +1 (N +1)×n = [`i,j ] ∈ R , `i,j = 1/card(Zi ) 0 vj ∈ Zi sonst . Es gelten n n N +1 InN +1 IN = P ∈ Rn×n ist blockdiagonal, +1 = IN +1 und IN +1 In genauer P = diag(P1 , P2 , . . . , PN +1 ) mit Pj = 1 T ee ∈R N N N × j j . j Insbesondere ist P eine Projektion (P 2 = P ), die mit An kommutiert (An P = P An ) n n N +1 und P IN P = InN +1 erfüllt. +1 = IN +1 sowie In Markoff-Ketten Technische Universität Bergakademie Freiberg 155 Numerische Simulation mathematischer Modelle Weiter gelten: P ist eine Orthogonalprojektion (P = P T ) und R(P ) besteht aus genau den Vektoren, die in jeder Klasse Zj konstant sind (also im Fall N = 3 die Form [a, b, b, b, c, c, c, d] haben). m n m N +1 n = InN +1 Am BN +1 = In An IN +1 n IN +1 , h i π (B) = 2−N N0 , N1 , . . . , N . N (A) Ist schließlich π 0 ∈ Rn eine Ausgangsverteilung, die auf jeder Klasse Zj (A) (A) konstant ist (d.h. für die π 0 = π 0 P gilt), und ist (B) (A) n (B) N +1 π 0 = π 0 IN ∈ R (beachte, dass π ein Verteilungsvektor ist), so 0 +1 gilt (A) (B) kπ (A) − π 0 Am k = kπ (B) − π 0 B m k (m = 0, 1, 2, . . .). Markoff-Ketten Technische Universität Bergakademie Freiberg 156 Numerische Simulation mathematischer Modelle Beispiele Irrfahrt auf einer Geraden mit absorbierenden Rändern. Hier (aber nicht nur hier) treten tridiagonale Übergangswahrscheinlichkeitsmatrizen der Form 1 p1 q1 r1 p2 q2 r2 ∈ R(n+1)×(n+1) A= .. .. .. . . . pn−1 qn−1 rn−1 1 auf. Markoff-Ketten Technische Universität Bergakademie Freiberg 157 Numerische Simulation mathematischer Modelle Nach der üblichen Umnummerierung (absorbierende Zustände zuerst) ist " # I2 0 A= C B mit C= Markoff-Ketten q1 0 0 .. . 0 .. . 0 0 0 rn−1 p2 und B = p1 r1 q2 . p3 r2 .. . .. . .. . qn−2 rn−2 pn−1 qn−1 Technische Universität Bergakademie Freiberg 158 Numerische Simulation mathematischer Modelle A∞ = limm→∞ Am existiert beispielsweise, wenn pi > 0, ri > 0 (i = 1, 2, . . . , n − 1) gilt. Dann ist # " I2 0 ∞ mit S = (I − B)−1 C. A = S 0 Da A∞ stochastisch ist, besitzt S die Form s1 1 − s1 s2 1 − s2 S= . .. .. . sn−1 1 − sn−1 . Ein Koeffizientenvergleich in S = (I − B)−1 C bzw. in S − BS = C liefert Markoff-Ketten s1 = p1 + q1 s1 + r2 s2 , sj = pj sj−1 + qj sj + rj sj+1 sn−1 = pn−1 sn−2 + qn−1 sn−1 . (j = 2, 3, . . . , n − 2), Technische Universität Bergakademie Freiberg 159 Numerische Simulation mathematischer Modelle Pn−1 Setzt man jetzt sj = k=j tk , d.h. tn−1 = sn−1 und tj = sj − sj+1 (j = 1, 2, . . . , n − 2), so folgt (mit pj + qj + rj = 1) Pn−1 (1 − q1 )t1 + p1 k=2 tk = p1 , rj tj = pj tj−1 (j = 2, 3, . . . , n − 1), was für j = 2, 3, . . . , n − 1 wiederum pj pj pj−1 pj pj−1 · · · p2 tj = tj−1 = tj−2 = · · · = t1 rj rj rj−1 rj rj−1 · · · r2 impliziert. Den Wert von t1 bestimmt man aus Pn−1 p2 ···pk t1 1 − q1 + p1 k=2 r2 ···rk = p1 . Markoff-Ketten Technische Universität Bergakademie Freiberg 160 Numerische Simulation mathematischer Modelle Zwei Spieler spielen mit n ≥ 2 Karten. Im Elementarprozess wird eine dieser Karten (gleichverteilt) zufällig ausgewählt, die dann ihren Besitzer wechselt. Der Zustand j liegt vor, wenn der erste Spieler genau j Karten auf der Hand hat (der zweite Spieler hat dann also n − j Karten). Das Spiel endet, wenn einer der Spieler keine Karten mehr besitzt. Die Übergangsmatrix ist 1 1/n 0 (n − 1)/n 2/n 0 (n − 2)/n A= .. .. . . (n − 1)/n Markoff-Ketten .. 0 . ∈ R(n+1)×(n+1) . 1/n 1 Technische Universität Bergakademie Freiberg 161 Numerische Simulation mathematischer Modelle sj = t1 Pn−1 2·3···k k=j (n−2)(n−3)···(n−k) mit t1 (1 + 1 n Pn−1 2·3···k k=2 (n−2)(n−3)···(n−k) ) = 1 n ist die Wahrscheinlichkeit dafür, dass der erste Spieler alle seine Karten verliert unter der Bedingung, dass er das Spiel mit j ≥ 1 Karten beginnt. Für große n ist sj , nahezu unabhänig von j, etwa gleich 1/2: n+4 1 3 1 ≤ sj ≤ = + 2 2n + 2 2 2n + 2 Markoff-Ketten (1 ≤ j < n ) 2 Technische Universität Bergakademie Freiberg 162 Numerische Simulation mathematischer Modelle n=10 0.6 0.55 0.5 0.45 0.4 1 2 3 4 5 n=20 0.56 6 7 8 9 0.54 0.52 0.5 0.48 0.46 2 4 6 8 10 n=30 12 14 16 18 0.52 0.5 0.48 Markoff-Ketten 5 10 15 20 25 Technische Universität Bergakademie Freiberg 163 Numerische Simulation mathematischer Modelle Warteschlangen. Ein Sessellift kann pro Zeiteinheit eine Person abtransportieren. Die Wahrscheinlichkeit, dass in einer Zeiteinheit j Personen P∞ in der Talstation ankommen, sei pj ( j=0 pj = 1). Der Wartesaal fasse maximal n Personen. Personen, die einen vollen Wartesaal antreffen, kehren um. Der Zustand j liegt vor, wenn sich am Ende einer Zeiteinheit, d.h. in dem Moment, in dem der Lift abfährt, genau j Personen im Wartesaal aufhalten. Die Übergangsmatrix hat Hessenberg-Form p0 + p1 p2 · · · pn−1 p0 p1 · · · pn−2 p0 · · · pn−3 A= .. .. . . p0 pn pn−1 pn−2 j=n+1 pj P∞ j=n pj P∞ j=n−1 pj .. . p1 p0 Markoff-Ketten P∞ P∞ j=2 P∞ j=1 pj . pj Technische Universität Bergakademie Freiberg 164 Numerische Simulation mathematischer Modelle Um die Rechnung einfach zu halten, nehmen wir an, dass pj = qpj P∞ (j = 0, 1, . . .) gilt für ein p mit 0 < p < 1. (Aus der Normierung j=0 pj = 1 P∞ ergibt sich q = 1 − p.) Es folgt j=k pj = pk , so dass A jetzt eine einfachere Form besitzt: 2 n−1 n n+1 q + qp qp · · · qp qp p n−2 n−1 n q qp · · · qp qp p q · · · qpn−3 qpn−2 pn−1 A= .. .. .. . . . . q qp p2 q p Markoff-Ketten Technische Universität Bergakademie Freiberg 165 Numerische Simulation mathematischer Modelle A ist primitiv, d.h. es gibt eine eindeutig bestimmte stationäre Verteilung π = [π0 , π1 , . . . , πn ]. Ein Komponentenvergleich in π = πA ergibt π0 = (q + qp)π0 + qπ1 , πj = qpj+1 π0 + qpj π1 + · · · + qpπj + qπj+1 πn = pn+1 π0 + pn π1 + · · · + pπn−1 + pπn . (j = 1, 2, . . . , n − 1), Durch vollständige Induktion erhält man πj = Markoff-Ketten p j+1 qj π0 h (j = 1, 2, . . . , n) und π0 = 1 + 2 p q + 3 p q2 + ··· + p n+1 qn i−1 . Technische Universität Bergakademie Freiberg 166 Numerische Simulation mathematischer Modelle n=20, p=0.5 0.1 0.08 0.06 0.04 0 2 4 6 0 2 4 6 0 2 4 6 8 10 12 14 16 18 20 8 10 12 14 16 18 20 8 10 12 14 16 18 20 0.08 n=20, p=0.505 0.06 0.04 0.02 0.08 n=20, p=0.50845395... 0.06 0.04 0.02 Markoff-Ketten Technische Universität Bergakademie Freiberg 167 Numerische Simulation mathematischer Modelle n=20, p=0.51 0.08 0.06 0.04 0.02 0 2 4 6 8 0 2 4 6 8 0.2 10 12 14 16 18 20 10 12 14 16 18 20 n=20, p=0.55 0.15 0.1 0.05 0 pn+1 ≤1 (1 − p)n pn+1 ≥1 n (1 − p) Markoff-Ketten ⇒ leerer Wartesaal ist am wahrscheinlichsten ⇒ voller Wartesaal ist am wahrscheinlichsten Technische Universität Bergakademie Freiberg 168 Numerische Simulation mathematischer Modelle Lagerhaltung. Ein Lager fasst n Maschinen. Im Laufe einer Woche werden mit Wahrscheinlichkeit pj genau j Maschinen abgerufen (j = 0, 1, . . . , n − 1). Mit Wahrscheinlichkeit pn werden n oder mehr Maschinen nachgefragt Pn ( j=0 pj = 1). Sei m eine feste Zahl zwischen 1 und n. Im Lager wird folgende Strategie verfolgt. Sind zu Beginn einer Woche m + 1 oder mehr Maschinen vorhanden, so werden die im Laufe der Woche eingehenden Aufträge (soweit es möglich ist) erledigt. Sind am Anfang der Woche aber nur m oder weniger Maschinen verfügbar, so wird das Lager zunächst auf n Maschinen aufgefüllt und dann die Abrufe (soweit es möglich ist) bedient. Der Zustand j liege vor, wenn am Ende einer Woche genau j Maschinen (j = 0, 1, 2, . . . , n) im Lager sind. Die Übergangsmatrix hat die Blockstruktur " # A1,1 A1,2 A= ∈ R(n+1)×(n+1) A2,1 A2,2 mit Markoff-Ketten Technische Universität Bergakademie Freiberg 169 Numerische Simulation mathematischer Modelle A1,1 = pn pn−1 ··· pn .. . pn−1 .. . ··· pn pn−1 ··· A1,2 = 1 1 .. . h pn−m−1 pn−m 1 pn−m .. . = 1 .. . h pn pn−m pn−m−2 ··· pn−m i ∈ R(m+1)×(m+1) , 1 ··· p0 i ∈ R(m+1)×(n−m) , 1 A2,1 Markoff-Ketten = Pm+1 Pm+2 .. . Pn pm ··· p1 (n−m)×(m+1) , ∈R pm+1 .. . ··· p2 .. . pn−1 ··· pn−m Technische Universität Bergakademie Freiberg 170 Numerische Simulation mathematischer Modelle A2,2 = p0 p1 pn−m−1 Dabei ist Pj := Pn k=j ··· 0 p0 .. . .. pn−m−2 ··· 0 (n−m)×(n−m) . ∈R p0 0 . pk (j = m + 1, m + 2, . . . , n). Setzt man pj > 0 voraus (j = 1, 2, . . . , n), so ist A irreduzibel und primitiv. Es existiert eine (eindeutigh bestimmte) station äre Verteilung π = [πj ]0≤j≤n , die wir in i π (2) (mit π (1) ∈ Rm+1 und π (2) ∈ Rn−m ) Pm+1 zerlegen. Außerdem setzen wir t := j=0 πj = kπ (1) k1 . zwei Teilvektoren π = Markoff-Ketten π (1) Technische Universität Bergakademie Freiberg 171 Numerische Simulation mathematischer Modelle Aus π = πA folgt π (1) = π (1) A1,1 + π (2) A2,1 = t[pn , . . . , pn−m ] + π (2) A2,1 , π (2) = π (1) A1,2 + π (2) A2,2 = t[pn−m−1 , . . . , p0 ] + π (2) A2,2 . Aus der zweiten Gleichung ergibt sich π (2) = t[pn−m−1 , . . . , p0 ](In−m − A2,2 )−1 (beachte ρ(A2,2 ) = p0 < 1, so dass In−m − A2,2 invertierbar ist). Einsetzen in die erste Gleichung liefert π (1) = t[pn , . . . , pn−m ] + t[pn−m−1 , . . . , p0 ](In−m − A2,2 )−1 A2,1 . Schließlich ergibt sich t aus (t) 1 − t = π 2 e = t[pn−m−1 , . . . , p0 ](In−m − A2,2 )−1 et =: tγ (beachte, dass P −1 γ = [pn−m−1 , . . . , p0 ](In−m − A2,2 ) e = j=0 [pn−m−1 , . . . , p0 ]Aj2,2 e eine positive Zahl ist und dass damit t = 1/(γ + 1) ∈ (0, 1) gilt.) Für die Beispielrechnung setzen wir pj = qpj (j = 0, 1, . . . , n). Markoff-Ketten Technische Universität Bergakademie Freiberg 172 Numerische Simulation mathematischer Modelle n=20, m=5, p=.5 0.08 0.06 0.04 0.02 0 0 2 4 6 8 10 12 14 16 18 20 0 2 4 6 8 10 12 14 16 18 20 0 2 4 6 8 10 12 14 16 18 20 0.1 n=20, m=10, p=.5 0.05 0 0.2 n=20, m=15, p=.5 0.15 0.1 0.05 0 Markoff-Ketten Technische Universität Bergakademie Freiberg 173 Numerische Simulation mathematischer Modelle Labyrinthe. Gegeben ist ein Labyrinth, das aus n Kammern besteht. Die Kammer j besitzt wj > 0 Türen, die in beide Richtungen passierbar sind. Im Labyrinth befindet sich eine Maus. Der Zustand j liegt vor, wenn sich die Maus in Kammer j aufhält. Im Elementarprozess verweilt die Maus mit Wahrscheinlicheit b, 0 ≤ b < 1, in der Kammer, in der sie gerade ist, oder sie geht (mit gleicher Wahrscheinlichkeit) durch eine der verfügbaren Türen. Die Übergangsmatrix A = [ai,j ] ist i = j, b, ai,j = (1 − b)/wi , falls es zwischen i und j eine Tür gibt, 0 sonst. Ein Labyrinth heißt zusammenhängend, wenn jede Kammer von jeder anderen Kammer aus erreichbar ist (also genau dann, wenn A irreduzibel ist). A ist dann entweder primitiv (sicher dann, wenn b > 0) oder zyklisch vom Index 2 (genau dann, wenn man die Kammern in zwei disjunkte Klassen K1 und K2 zerlegen kann, so dass von Kammern aus K1 nur direkte Übergange nach K2 und von Kammern aus K2 nur direkte Übergange nach K1 möglich sind). Die stationäre Verteilung ist P (unabhängig von b) π = [w1 w2 · · · wn ] / n j=1 wj . Markoff-Ketten Technische Universität Bergakademie Freiberg 174 Numerische Simulation mathematischer Modelle Mischen von Spielkarten. Gegeben sind N Karten, der einfach halber seien sie von 1 bis N durchnummeriert. Als Zustände betrachten wir die n = N ! verschiedenen Reihenfolgen (Permutationen), in der diese Karten angeordnet werden können. Der Zustandsraum entspricht also der symmetrischen Gruppe SN , d.h. der Menge aller Permutationen {τ1 , τ2 , . . . , τn } von N Objekten (zusammen mit der üblichen Komposition von Abbildungen). Ist etwa N = 3, so besteht der Zustandsraum aus den n = 3! = 6 Permutationen τ1 = [1 2 3], τ2 = [1 3 2], τ3 = [2 1 3], τ4 = [2 3 1], τ5 = [3 1 2], τ6 = [3 2 1]. Sei außerdem p eine Wahrscheinlichkeitsverteilung auf SN , d.h. p : SN → [0, 1] mit P ) = 1. (Man kann p = [pi ]1≤i≤n , pi = p(τi ), als nichtnegativen Vektor τ ∈SN p(τ P aus Rn mit n i=1 pi = 1 auffassen.). Die Übergangswahrscheinlichkeit ai,j wird jetzt wie folgt definiert: Es gibt genau eine Permutation τ ∈ SN , die die Reihenfolge i (repräsentiert durch die Permutation τi ) in die Reihenfolge j (repräsentiert durch die Permutation τj ) überführt, nämlich τ = τj τi−1 . Wir setzen ai,j = p(τ ). Markoff-Ketten Technische Universität Bergakademie Freiberg 175 Numerische Simulation mathematischer Modelle Setzt man in unserem Beispiel p = 16 [3 1 0 0 1 1], 3 1 0 0 1 3 0 0 0 1 3 1 1 A= 6 1 0 1 3 0 1 1 1 1 0 1 1 so erhält man die Übergangsmatrix 1 1 1 1 1 0 . 0 1 3 0 0 3 A ist offensichtlich (und dies bezieht sich auf den allgemeinen Fall) doppelt stochastisch, d.h. wenn der Grenzwert limm→∞ Am existiert, so ist 1 1 ··· 1 1 1 1 1 T 1 m . lim A = ee = . .. .. m→∞ n n .. . . 1 1 ··· 1 Markoff-Ketten Technische Universität Bergakademie Freiberg 176 Numerische Simulation mathematischer Modelle Ein Mischverfahren (definiert durch p) heißt fair, wenn limm→∞ Am existiert (und der Mischprozess damit automatisch gegen die Gleichverteilung konvergiert). T (p) := {τ ∈ SN ; p(τ ) > 0} ⊆ SN heißt Träger von p. Markoff-Ketten Technische Universität Bergakademie Freiberg 177 Numerische Simulation mathematischer Modelle Satz 3.10 Mit den oben eingeführten Bezeichungen gilt: • A ist genau dann irreduzibel, wenn jede Permutation aus SN ein Produkt von Permutationen aus T (p) ist. (Man sagt dann, dass T (p) die Gruppe SN erzeugt.) • Ist A irreduzibel, so ist A entweder primitiv oder zyklisch vom Index 2. • Ist A zyklisch vom Index 2, so enthält T (p) nur ungerade Permutationen. Schließlich sind die folgenden Aussagen einander äquivalent: • Das Mischverfahren ist fair. • A ist primitiv. • T (p) erzeugt SN und enthält mindestens eine gerade Permutation. Markoff-Ketten Technische Universität Bergakademie Freiberg 178 Numerische Simulation mathematischer Modelle In unserem Beispiel ist T (p) = {[1 2 3], [1 3 2], [3 1 2], [3 2 1]}. T (p) erzeugt S3 ([2 1 3] = [3 1 2] ◦ [3 2 1], [2 3 1] = [1 3 2] ◦ [3 2 1]) und enthält gerade Permutationen ([1 2 3] und [3 1 2]). Unsere Mischverfahren ist daher fair. Markoff-Ketten Technische Universität Bergakademie Freiberg 179 Numerische Simulation mathematischer Modelle Für ein (etwas realistischeres) Beispiel sei T die Menge aller Permutationen, die wie folgt entstehen. Wir zerlegen die N Karten 1, 2, . . . , N in zwei oder drei Teilpakete (stets sei N ≥ 3): 1, . . . , k1 , k1 + 1, . . . , N , | {z } | {z } 1. Teilpaket 2. Teilpaket oder 1, . . . , k1 , k1 + 1, . . . , k2 , k2 + 1, . . . , N . {z } | {z } | {z } | 1. Teilpaket 2. Teilpaket 3. Teilpaket Im Fall von drei Teilen legen wir das oberste (erste) Paket zuunterst, darauf das mittlere und schließlich darauf das letzte: k2 + 1, . . . , N , k1 + 1, . . . , k2 , 1, . . . , k1 . | {z } | {z } | {z } 3. Teilpaket 2. Teilpaket 1. Teilpaket Im Fall von zwei Teilen wird das untere auf das obere Paket gelegt. Mit anderen Worten, wir erlauben alle Permutationen der Form [k2 + 1, . . . , N, k1 + 1, . . . , k2 , 1, . . . , k1 ] oder [k1 + 1, . . . , N, 1, . . . , k1 ] mit 1 < k1 < k2 < N (und nur diese). Markoff-Ketten Technische Universität Bergakademie Freiberg 180 Numerische Simulation mathematischer Modelle Diese Menge T erzeugt SN . Sei 2 ≤ j ≤ N − 2: [1, . . . , j − 1, j , j + 1, . . . , N ] | {z } |{z} | {z } 1. TP ↓ 2. TP 3. TP τ1 [j + 1, . . . , N , j , 1, . . . , j − 1] = [j + 1, . . . , N, j , 1, . . . , j − 1] {z } |{z} | {z } | {z } | {z } | 3. TP ↓ 2. TP 1. TP 1. TP 2. TP τ2 [1, . . . , j − 1, j + 1, . . . , N, j ] = [1, . . . , j − 1, j + 1, j + 2, . . . , N , j ] | {z } | {z } {z } | {z } |{z} | 2. TP ↓ 1. TP 2. TP 3. TP τ3 [ j , j + 2, . . . , N , 1, . . . , j − 1, j + 1] = [j, j + 2, . . . , N , 1, . . . , j − 1, j + 1] |{z} | {z } | {z } | {z } | {z } 3. TP ↓ 1. TP 2. TP 1. TP 1. TP 2. TP τ4 [1, . . . , j − 1, j + 1, j, j + 2, . . . , N ] = [1, . . . , j − 1, j + 1, j, j + 2, . . . , N ]. {z } | {z } | 2. TP Markoff-Ketten 1. TP Technische Universität Bergakademie Freiberg 181 Numerische Simulation mathematischer Modelle Wir haben gezeigt, dass die Vertauschung (j, j + 1) = τ4 ◦ τ3 ◦ τ2 ◦ τ1 als Produkt von Permutationen aus T geschrieben werden kann (die Beweise für die Vertauschungen (1, 2) und (N − 1, N ) sind leichte Modifikationen des vorgestellten Verfahrens). Die Vertauschungen der Form (j, j + 1), 1 ≤ j ≤ N − 1, erzeugen aber die Gruppe SN . Die Permutation τ , die dem Abheben der obersten N − 2 Karten entspricht, τ = [3, 4, . . . , N, 1, 2] ∈ T , ist gerade. Bemerkungen. 1. Lässt man zur Menge T alle Permutationen zu, die sich bei der Aufteilung der Karten in irgendeine Anzahl von Teilpaketen (nach dem oben skizzierten Verfahren) ergeben, so ist dieser Mischprozess erst recht fair. 2. Ist N ≥ 5, so kommt man — um einen fairen Mischprozess zu definieren — mit den Permutationen aus, die sich aus der Aufteilung der Karten in drei Pakete ergeben. 3. Ein Verfahren mit T = {[2, 1, 3, . . . , N ], [2, 3, . . . , N, 1]} ist fair, wenn N ungerade ist. Ein Verfahren mit T = {[2, 1, 3, . . . , N ], [1, 3, . . . , N, 2]} ist fair, wenn N gerade ist. Markoff-Ketten Technische Universität Bergakademie Freiberg 182 Numerische Simulation mathematischer Modelle 4 4.1 Nichtnegative Matrizen Der Ergodensatz Problem: Sei A ∈ Cn×n . Wann existieren die Grenzwerte lim Am m→∞ und Bezeichnung. (Jordan-Block) λ J = J(λ) = m−1 1 X j lim A ? m→∞ m j=0 1 λ 1 .. . .. . λ ∈ Cn×n 1 λ Nichtnegative Matrizen Technische Universität Bergakademie Freiberg 183 Numerische Simulation mathematischer Modelle Lemma 1 [Konvergenz von Jordan-Blöcken]. (a) Sei |λ| < 1. Dann gilt limm→∞ mk [J(λ)]m = O für jedes k ∈ N0 . (b) Der Grenzwert limm→∞ [J(λ)]m existiert genau dann, wenn die beiden folgenden Bedingungen erfüllt sind: 1. |λ| ≤ 1, 2. Für |λ| = 1 muss λ = 1 und n = 1 folgen, d.h. J(λ) = 1(∈ R1×1 ). Lemma 2 [Permanenz der Cesàro-Mittel]. Sei {Am }m≥0 eine Folge aus Cn×n . Existiert limm→∞ Am , dann existiert Pm−1 1 auch limm→∞ m j=0 Aj und es gilt m−1 1 X lim Aj = lim Am . m→∞ m m→∞ j=0 Nichtnegative Matrizen Technische Universität Bergakademie Freiberg 184 Numerische Simulation mathematischer Modelle Lemma 3 [Cesàro-Mittel für Potenzen von Jordan-Blöcken]. Pm−1 1 (a) Ist |λ| < 1, dann gilt limm→∞ m j=0 [J(λ)]j = O. (b) Sind |λ| = 1 und n = 1 (d.h. J(λ) ist ein Skalar vom Betrag 1), dann gilt ( m−1 0, falls λ 6= 1, 1 X lim [J(λ)]j = m→∞ m 1, falls λ = 1. j=0 1 limm→∞ m Pm−1 j (c) Ist |λ| ≥ 1 und existiert [J(λ)] , dann gelten |λ| = 1 j=0 und n = 1, d.h. J(λ) ist ein Skalar vom Betrag 1. Bezeichnungen. Für A ∈ Cn×n heißen Λ(A) := {λ ∈ C : det(A − λI) = 0} das Spektrum von A und ρ(A) := max{|λ| : λ ∈ Λ(A)} der Spektralradius von A. Nichtnegative Matrizen Technische Universität Bergakademie Freiberg 185 Numerische Simulation mathematischer Modelle Satz 4 [Ergodensatz, Teil I]. Die Matrix A ∈ Cn×n besitze die Jordansche Normalform J1 (λ1 ) J2 (λ2 ) T −1 AT = .. . Jr (λr ) λk 1 r .. .. X . . nk = n. mit Jk (λk ) = ∈ Cnk ×nk , λk 1 k=1 λk Für λ ∈ Λ(A) sei d(A, λ) := max{nk : λ = λk , k = 1, 2, . . . , r} die Dimension des größten Jordan-Blocks zum Eigenwert λ. Dann gelten: Nichtnegative Matrizen Technische Universität Bergakademie Freiberg 186 Numerische Simulation mathematischer Modelle (a) Ist ρ(A) < 1, dann folgt für alle k ∈ N0 lim mk Am m→∞ m−1 1 X j A = O. = lim m→∞ m j=0 (b) Ist ρ(A) > 1, dann divergieren die beiden Folgen {Am }m≥0 und Pm−1 j 1 {m j=0 A }m≥1 . (c) Ist ρ(A) = 1, dann existiert limm→∞ Am genau dann, wenn λ = 1 der einzige Eigenwert von A mit |λ| = 1 ist und darüberhinaus d(A, 1) = 1 gilt. Pm−1 j 1 (d) Ist ρ(A) = 1, dann existiert limm→∞ m j=0 A genau dann, wenn d(A, 1) = 1 für alle λ ∈ Λ(A) mit |λ| = 1 gilt. Nichtnegative Matrizen Technische Universität Bergakademie Freiberg 187 Numerische Simulation mathematischer Modelle Satz 5 [Ergodensatz, Teil II]. Für die Matrix A ∈ Cn×n existiere P = limm→∞ Dann gelten: 1 m Pm−1 j=0 Aj . (a) P 2 = P = P A = AP , d.h. der Grenwert P ist eine Projektion, die mit A kommutiert. (b) R(P ) = N (A − I) = N ((A − I)m ) für alle m = 1, 2, . . . , M N ((A − λI)n ) . N (P ) = λ∈Λ(A)\{1} Nichtnegative Matrizen Technische Universität Bergakademie Freiberg 188 Numerische Simulation mathematischer Modelle Lemma 6 [Approximation des Spektralradius durch Matrixnormen]. Sei A ∈ Cn×n . Dann gibt es zu jedem ε > 0 eine Matrixnorm k · k = k · kε auf Cn×n mit kAk − ε ≤ ρ(A) ≤ kAk. Es gibt genau dann eine Matrixnorm k · k auf Cn×n mit kAk = ρ(A), wenn d(A, λ) = 1 für alle λ ∈ Λ(A) mit |λ| = ρ(A) erfüllt ist. Das ist insbesondere dann der Fall, wenn A diagonalisierbar ist. Satz 7 [Ergodensatz, Teil III]. Bezeichne k · k eine Matrixnorm auf Cn×n und sei A ∈ Cn×n mit kAk ≤ 1. Dann gelten: Pm−1 j 1 (a) Der Grenzwert P = limm→∞ m j=0 A existiert. (b) Enthält die Menge {ζ ∈ C : |ζ| = 1} \ {1} keine Eigenwerte von A, dann existiert auch limm→∞ Am . Nichtnegative Matrizen Technische Universität Bergakademie Freiberg 189 Numerische Simulation mathematischer Modelle Lemma 8 [Satz von Gerschgorin]. Für A = [ai,j ] ∈ Cn×n sind die Gerschgorin-Kreisscheiben durch n X Di := ζ ∈ C : |ζ − ai,i | ≤ |ai,j | (i = 1, 2, . . . , n) j=1 j6=i definiert. Dann gilt Λ(A) ⊆ n [ Di . i=1 Sind k der Gerschgorin-Kreisscheiben, etwa D1 , D2 , . . . , Dk , disjunkt von den restlichen n − k, d.h. ∪ki=1 Di ∩ ∪ni=k+1 Di = ∅, so enthält ∪ki=1 Di genau k Eigenwerte von A (algebraische Vielfachheiten mitzählen!). Nichtnegative Matrizen Technische Universität Bergakademie Freiberg 190 Numerische Simulation mathematischer Modelle Satz 9 [Ergodensatz für stochastische Matrizen]. Es sei A = [ai,j ] ∈ Rn×n eine stochastische Matrix. Dann gelten: (a) 1 ∈ Λ(A) und ρ(A) = 1. (b) Die Matrix P = limm→∞ 1 m Pm−1 j=0 Aj existiert und ist stochastisch. (c) Ist λ = 1 der einzige Eigenwert von A mit |λ| = 1, dann existiert auch limm→∞ Am , und es gilt limm→∞ Am = P . (d) Gilt ai,i > 0 für i = 1, 2, . . . , n, dann ist λ = 1 der einzige Eigenwert von A mit |λ| = 1. (e) Ist N (A − I) eindimensional, dann gilt P = ey T . Dabei ist e = [1, 1, . . . , 1]T ∈ Rn und y ∈ Rn , y ≥ 0 , ist eindeutig bestimmt durch y T A = y T und ky k1 = 1. (f) Ist N (A − I) eindimensional und ist A doppelt-stochastisch (d.h. A und AT sind stochastisch), dann gilt P = n1 ee T . Nichtnegative Matrizen Technische Universität Bergakademie Freiberg 191 Numerische Simulation mathematischer Modelle Satz 10 [Ergänzung zum Satz von Gerschgorin]. Es sei A ∈ Cn×n irreduzibel. Mit D1 , D2 , . . . , Dn werden die zugehörigen Gerschgorin-Kreisscheiben bezeichnet. Liegt ein Eigenwert λ von A auf dem Rand der Vereinigung aller Gerschgorin-Kreisscheiben, so liegt λ auf dem Rand jeder Gerschgorin-Kreisscheibe: n [ λ ∈ Λ(A), λ ∈ δ Dj ⇒ λ ∈ δDj ∀ j = 1, 2, . . . , n. j=1 Korollar. Die Matrix A = [ai,j ] ∈ Cn×n heißt irreduzibel diagonaldominant, wenn (a) A irreduzibel ist und Pn (b) j=1,j6=i |ai,j | ≤ |ai,i | für alle i = 1, 2, . . . , n gilt, wobei für mindestens ein i Ungleichheit vorliegt. Für eine solche Matrix gilt dann ρ(A) kAk∞ . Nichtnegative Matrizen Technische Universität Bergakademie Freiberg 192 Numerische Simulation mathematischer Modelle 4.2 Die Perron-Frobenius-Theorie nichtnegativer Matrizen Bezeichnungen. Für A = [ai,j ], B ∈ Cm×n seien A ≥ O :⇔ ai,j ≥ 0 (1 ≤ i ≤ m, 1 ≤ j ≤ n), A > O :⇔ ai,j > 0 (1 ≤ i ≤ m, 1 ≤ j ≤ n), A ≥ B :⇔ A − B ≥ O, A > B :⇔ A − B > O. Außerdem setzen wir |A| = [|ai,j |] ∈ Rm×n (Betrag von A). Lemma 11. Es seien A, B, C, D ∈ Cm×n . Dann gelten: (a) |A| = O ⇔ A = O. (b) |αA| = |α||A| ≥ O ∀ α ∈ C. (c) |A + B| ≤ |A| + |B|. (d) A, B ≥ O und α, β ≥ 0 ⇒ αA + βB ≥ O. (e) A ≥ B und C ≥ D ⇒ A + C ≥ B + D. (f) A ≥ B und B ≥ C ⇒ A ≥ C. Lemma 12. Es seien A, B, C, D ∈ Cn×n und x , y ∈ Cn . Dann gelten: (a) |Ax | ≤ |A||x |. (b) |AB| ≤ |A||B|, insbesondere |Am | ≤ |A|m . Nichtnegative Matrizen Technische Universität Bergakademie Freiberg 193 Numerische Simulation mathematischer Modelle (c) O ≤ A ≤ B, O ≤ C ≤ D ⇒ O ≤ AC ≤ BD, insbesondere O ≤ Am ≤ B m . (d) A > O, x ≥ 0 , x 6= 0 ⇒ Ax > 0 . (e) A ≥ O, x > 0 , Ax = 0 ⇒ A = O. (f) |A| ≤ |B| ⇒ kAkF ≤ kBkF . (g) kAkF = k|A|kF . Satz 13. Es seien A, B ∈ Cn×n mit |A| ≤ B. Dann gilt ρ(A) ≤ ρ(|A|) ≤ ρ(B). Korollar. Ist B eine beliebige Hauptuntermatrix der nichtnegativen Matrix A = [ai,j ] ∈ Rn×n , so folgt ρ(B) ≤ ρ(A). Insbesondere gilt ai,i ≤ ρ(A) für i = 1, 2, . . . , n. Sind A, B ∈ Rn×n mit O ≤ A < B, so folgt ρ(A) < ρ(B). Nichtnegative Matrizen Technische Universität Bergakademie Freiberg 194 Numerische Simulation mathematischer Modelle Lemma 14. Sei A ∈ Rn×n , A ≥ O. Sind die Zeilensummen von A alle identisch, dann gilt kAk∞ = ρ(A). Sind die Spaltensummen von A alle identisch, dann gilt kAk1 = ρ(A). Satz 15. Sei A = [ai,j ] ∈ Rn×n nichtnegativ. Dann gelten min 1≤i≤n min 1≤j≤n Nichtnegative Matrizen n X j=1 n X i=1 ai,j ≤ ρ(A) ≤ max n X 1≤i≤n ai,j ≤ ρ(A) ≤ max 1≤j≤n ai,j j=1 n X und ai,j . i=1 Technische Universität Bergakademie Freiberg 195 Numerische Simulation mathematischer Modelle Satz 16 [Quotientensatz von Collatz]. Seien A = [ai,j ] ∈ Rn×n nichtnegativ und x = [x1 , . . . , xn ]> ∈ Rn positiv. Dann gelten Pn Pn a x [Ax ]i [Ax ]i j=1 ai,j xj j=1 i,j j = min ≤ ρ(A) ≤ max = max min 1≤i≤n xi 1≤i≤n xi 1≤i≤n 1≤i≤n xi xi und Pn min xj 1≤j≤n j=1 ai,j xi Pn ≤ ρ(A) ≤ max xj 1≤j≤n j=1 xi ai,j . Lemma 17. Ist A ∈ Rn×n nichtnegativ und irreduzibel, dann ist (I + A)n−1 positiv. Nichtnegative Matrizen Technische Universität Bergakademie Freiberg 196 Numerische Simulation mathematischer Modelle Lemma 18. Es seien A ∈ Rn×n nichtnegativ und irreduzibel und M := {x ∈ Rn : x 6= 0 , x ≥ 0 }. Für x ∈ M definieren wir Pn [Ax ]i j=1 ai,j xj g(x ) := min = min . xi 6=0 xi 6=0 xi xi Dann existiert r = maxx ∈M g(x ). Satz 19. [Satz von Perron (1908) und Frobenius (1912)] Ist A ∈ Rn×n nichtnegativ und irreduzibel, so gelten: (a) Die Zahl r = maxx ∈M g(x ) (vgl. Lemma 18) ist positiv. Außerdem ist r ein (algebraisch) einfacher Eigenwert von A und es gilt r = ρ(A). (b) Gilt r = g(y ) für ein y ≥ 0 , so folgt y > 0 und Ay = ry . Der (bis auf skalare Vielfache eindeutige) Eigenvektor von A zum Eigenwert r kann also positiv gewählt werden. (c) Gilt Ax = λx für ein x ≥ 0 , x 6= 0 , so folgt λ = r = ρ(A). Nichtnegative Matrizen Technische Universität Bergakademie Freiberg 197 Numerische Simulation mathematischer Modelle Korollar. Seien A ∈ Rn×n nichtnegativ und irreduzibel und B ∈ Cn×n mit |B| ≤ A. Gilt ρ(A) = ρ(B), so gibt es einen Winkel ϕ ∈ [0, 2π) und eine Diagonalmatrix D = diag(δ1 , . . . δn ) ∈ Cn×n mit |δj | = 1 (j = 1, . . . , n), so dass B = eiϕ DAD−1 gilt (insbesondere folgt |B| = A). Satz 20. Ist A = [ai,j ] ∈ Rn×n nichtnegativ und irreduzibel, so gelten: (a) Besitzt A genau k verschiedenen Eigenwerte λ1 , . . . , λk vom Betrag ρ(A), dann folgt (nach einer geeigneten Umnummerierung) 2πj i (j = 1, . . . , k). λj = ρ(A) exp k λ1 , . . . , λk sind einfache Eigenwerte von A. Außerdem ist das Spektrum von A invariant unter der Drehung um den Winkel 2π/k, 2π Λ(A) = Λ(A) exp i . k Nichtnegative Matrizen Technische Universität Bergakademie Freiberg 198 Numerische Simulation mathematischer Modelle (b) Ist k > 1, so gibt es eine Permutationsmatrix P ∈ Rn×n mit O A1,2 O A2.3 . . .. .. P AP > = O Ak−1,k Ak,1 O (die Diagonalblöcke sind quadratisch). (c) Ist wenigstens ein Diagonalelement von A positiv, so folgt k = 1. (d) Gibt es i, j ∈ {1, . . . , n} mit ai,j aj,i > 0, so folgt k ≤ 2. Sei A ∈ Rn×n nichtnegativ und irreduzibel. k sei die Anzahl der Eigenwerte von A vom Betrag ρ(A). Ist k = 1, so heißt A primitiv. Ist k > 1, so heißt A zyklisch vom Index k. Nichtnegative Matrizen Technische Universität Bergakademie Freiberg 199 Numerische Simulation mathematischer Modelle Satz 21 [Romanovsky, 1936]. Es sei G(A) der gerichtete Graph einer nichtnegativen irreduziblen Matrix A ∈ Rn×n . Für jeden Knoten Pj von G(A) sei Sj die Menge aller gerichteten Wege, die Pj mit sich selbst verbinden. Die Länge `(w) eines gerichteten Wegs w sei die Anzahl der beteiligten Kanten. Wir setzen kj = größter gemeinsamer Teiler von {`(w) : w ∈ Sj }. Dann gilt k1 = k2 = · · · = kn =: k und k ist die Anzahl der Eigenwerte von A vom Betrag ρ(A). Lemma 22. Seien A ∈ Rn×n nichtnegativ und m ∈ N. Der gerichtete Graph G(Am ) von Am enthält die Kante Pi Pj genau dann, wenn es in G(A) einen gerichteten Weg der Länge m gibt, der von Pi auf Pj führt. Lemma 23. Sei A ∈ Rn×n nichtnegativ. A ist genau dann primitiv, wenn es ein m ∈ N gibt mit Am > O. (Die kleinste Zahl m = m(A) mit Am > O heißt Primitivitätsindex von A.) Nichtnegative Matrizen Technische Universität Bergakademie Freiberg 200 Numerische Simulation mathematischer Modelle Bemerkung: m(A) ≤ n2 − 2n + 2 und diese Abschätzung ist scharf. Satz 24. Sei A ∈ Rn×n primitiv. Seien z = [z1 , . . . , zn ]> und y = [y1 , . . . , yn ]> positive linke bzw. rechte Eigenvektoren von A zum Eigenwert r = ρ(A) mit y > z = 1 (Az = rz und y > A = ry"> ). Dann folgen: # z1 y1 ··· z1 yn (a) P = limm→∞ r−m Am existiert und es gilt P = zy > = .. . .. . . zn y1 ··· zn yn n (b) Für beliebige nichtnegative Vektoren v , w ∈ R \ {0 } gelten y >v [Am v ]j = > lim m→∞ [Am w ]j y w (j = 1, 2, . . . , n) und yi [Am v ]i lim = m→∞ [Am v ]j yj Nichtnegative Matrizen (i, j = 1, 2, . . . , n). Technische Universität Bergakademie Freiberg 201 Numerische Simulation mathematischer Modelle 4.3 Stochastische Komplemente Gegeben ist eine Markoff-Kette mit n = k1 + k2 + · · · + k` Zuständen, die wir zu ` Aggregaten zusammenfassen, z1 , . . . , zk , zk +1 , . . . , zk2 , . . . zk`−1 +1 , . . . , zk` , | {z 1} | 1 {z } | {z } Z1 Z2 Z` und der irreduziblen Übergangswahrscheinlichkeitsmatrix A ∈ Rn×n . Als Beispiel betrachten wir im folgenden immer A= Nichtnegative Matrizen .85 .0 .149 .0009 .0 .00005 .0 .00005 .1 .65 .249 .0 .0009 .00005 .0 .1 .8 .0996 .0003 .0 .0 .0001 .0 .0004 .0 .7 .2995 .0 .0001 .0005 .0 .0004 .399 .6 .0001 .0 .0 .00005 .0 .0 .00005 .6 .2499 .00003 .0 .00003 .00004 .0 .1 .8 .00005 .0 .0 .0 .15 .0999 .0 .00005 .0 .0 .00005 .1999 .25 .55 Technische Universität Bergakademie Freiberg 202 Numerische Simulation mathematischer Modelle mit den drei Aggregaten Z1 = {1, 2, 3}, Z2 = {4, 5}, Z3 = {6, 7, 8}. Aggregation führt innerhalb der Aggregate auf ` Ketten mit ÜWM’n Sj := A(Kj , Kj ) + A(Kj , Lj )(I − A(Lj , Lj ))−1 A(Lj , Kj ), wobei Kj := [kj−1 + 1 : kj ] (k0 := 0) und Lj := [1 : n] \ Kj (j = 1, 2 . . . , `) (stochastisches Komplement von A(Kj , Kj ) in A). In unserem Beispiel 0.8503 S1 = 0.1003 0.1001 0.6000 S3 = 0.1000 0.1999 Nichtnegative Matrizen 0.0004 0.1493 0.6504 0.2493 , S2 = 0.8002 0.0997 0.2499 0.1500 0.8000 0.0999 . 0.2500 0.5500 " 0.7003 0.2997 0.3995 0.6005 # , Technische Universität Bergakademie Freiberg 203 Numerische Simulation mathematischer Modelle Satz 25. Sj , j = 1, 2, . . . , `, ist stochastisch und irreduzibel. Sj besitzt daher eine (eindeutig bestimmte) stationäre Wahrscheinlichkeitsverteilung h i (j) (j) (j) π (j) = πkj−1 +1 , πkj−1 +2 , . . . , πkj . Bemerkung. Ist A primitiv, so ist Sj nicht notwendig primitiv. Ist aber A(Kj , Kj ) primitiv (z.B. wenn mindestens ein Hauptdiagonalelement von 0 verschieden ist), so ist auch Sj primitiv. Nichtnegative Matrizen Technische Universität Bergakademie Freiberg 204 Numerische Simulation mathematischer Modelle Zwischen den Aggregaten wird eine Markoff-Kette mit ÜWM (1) (1) (1) π A(K1 , K1 )e π A(K1 , K2 )e . . . π A(K1 , K` )e (2) π A(K2 , K1 )e π (2) A(K2 , K2 )e . . . π (2) A(K2 , K` )e C= .. .. .. . . . π (`) A(K` , K1 )e π (`) A(K` , K2 )e . . . π (`) A(K` , K` )e (Koppelungsmatrix) induziert. In 9.9911 · 10−1 −4 C= 6.1433 · 10 5.5556 · 10−5 Nichtnegative Matrizen unserem Beispiel 7.9083 · 10−4 9.9929 · 10 −1 4.4444 · 10−5 1.0000 · 10−4 1.0000 · 10 −4 9.9990 · 10−1 Technische Universität Bergakademie Freiberg 205 Numerische Simulation mathematischer Modelle Satz 26 [Koppelungssatz]. C ist stochastisch und irreduzibel. C besitzt daher eine (eindeutig bestimmte) stationäre Wahrscheinlichkeitsverteilung γ = [γ1 , γ2 , . . . , γ` ] . Die stationäre Wahrscheinlichkeitsverteilung von A ist durch h i (1) (2) (`) γ1 π , γ2 π , . . . , γ` π gegeben. Abweichung von der vollständigen Reduzibilität: δ(A) := 2 max kA(Kj , Lj )k∞ 1≤j≤` In unserem Beispiel: δ(A) = 2 max{10−3 , 10−3 , 10−4 } = 2 · 10−3 . Nichtnegative Matrizen Technische Universität Bergakademie Freiberg 206 Numerische Simulation mathematischer Modelle 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 1 2 3 4 5 6 7 8 1 2 3 4 5 6 7 8 0.8 0.6 0.4 0.2 0 Nichtnegative Matrizen Technische Universität Bergakademie Freiberg 207 Numerische Simulation mathematischer Modelle Λ(A) Λ(S1) Nichtnegative Matrizen Λ(S2) Λ(S3) Technische Universität Bergakademie Freiberg 208 Numerische Simulation mathematischer Modelle Satz 27. Sei S := diag(S1 , S2 , . . . , S` ) ∈ Rn×n mit Eigenwerten λ1 = λ2 = · · · = λ` = 1 > |λ`+1 | ≥ |λ`+2 | ≥ · · · ≥ |λn |. Dabei seien alle Si primitiv und S sei diagonalisierbar (T −1 ST = diag(λ1 , λ2 , . . . , λn )). Seien τ (0) eine beliebige Anfangsverteilung und τ (m) = τ (0) Am (m = 1, 2, . . . ). Außerdem sei X (0) X (0) X (0) (1) (2) σ := τj π , τj π , . . . , τj π (`) j∈K1 = j∈K2 j∈K` lim τ (0) S m . m→∞ Dann gilt für alle m = 1, 2, . . . kτ (m) − σk1 ≤ mδ(A) + cond∞ (T )|λ`+1 |m . Nichtnegative Matrizen Technische Universität Bergakademie Freiberg 209 Numerische Simulation mathematischer Modelle Dynamik einer fast vollständig reduziblen Kette (δ(A) ‘klein’) Kurzfristig: Falls |λ`+1 |m 1 und m 1/δ(A): h i X (m) (1) (2) (`) τ ≈ σ = β1 π , β2 π , . . . , β` π mit βj := τν(0) . ν∈Kj Kurzfristiges Stabilitätsintervall (Niveau ε): n o I(ε) := m : kτ (m) − σk1 < ε wird geschätzt durch E(ε) := {m : f (m) < ε} mit f (x) := δ(A)x + cond∞ (T )|λ`+1 |x : log(ε/(2cond∞ (T ))) ε m : <m< ⊆ E(ε) ⊆ I(ε). log |λ`+1 | 2δ(A) Nichtnegative Matrizen Technische Universität Bergakademie Freiberg 210 Numerische Simulation mathematischer Modelle τ(m)./σ, (m=0,2,...,10) 0.7 0.65 0.6 0.55 0.5 0.45 0.4 0.35 0.3 0.25 0.2 Nichtnegative Matrizen 1 2 3 4 5 6 7 8 Technische Universität Bergakademie Freiberg 211 Numerische Simulation mathematischer Modelle Mittelfristig: Sei ε > 0 mit I(ε) 6= ∅. Dann gibt es zu jedem m ≥ m0 := {k : k ∈ I(ε)} Konstanten α1 (m), α2 (m), . . . , α` (m) mit h i (m) − α1 (m)π (1) , α2 (m)π (2) , . . . , α` (m)π (`) < ε. τ 1 Dies gilt etwa für α bj (m) = X τν(m−m0 ) (j = 1, 2, . . . , `). ν∈Kj Langfristig: Falls A primitiv, lim α bj (m) = γj (j = 1, 2, . . . , `) m→∞ (linear mit asymptotischem Konvergenzfaktor max{|λ| : λ ∈ Λ(A) \ {1}} = 0.9998 in unserem Beispiel). Nichtnegative Matrizen Technische Universität Bergakademie Freiberg 212 Numerische Simulation mathematischer Modelle 0.55 0.5 n=∞ n=10 n=100 n=1000 n=10000 0.45 0.4 0.35 0.3 0.25 0.2 Nichtnegative Matrizen 1 2 3 4 5 6 7 8 Technische Universität Bergakademie Freiberg