128 5.7 Kapitel 5. Lineare Algebra Exkurs: Stochastische Matrizen Nehmen wir an, wir beobachten ein System, das eine endliche Anzahl n von Zuständen annehmen kann und im Lauf der Zeit unter dem Einfluss von Zufall seinen Zustand ändert. Man spricht dann von einem stochastischen Vorgang oder auch einem Markov-Prozess. Unter der Übergangsmatrix dieses Vorgangs versteht man die Matrix A = (pij ) , wobei pij die Wahrscheinlichkeit dafür angibt, dass das System vom Zustand i in den Zustand j wechselt. 5.7.1 Beispiel Die Entwicklung des Wetters unterliegt zu einem gewissen Grad dem Zufall, und die Veränderung von heute auf morgen lässt sich als stochastischer Vorgang auffassen. Wenn wir drei Zustände unterscheiden, nämlich (1) sonnig, (2) bewölkt, und (3) regnerisch, dann ist die Übergangsmatrix eine 3 × 3-Matrix. Der Eintrag p11 gibt die Wahrscheinlichkeit dafür an, dass es sonnig bleibt, der Eintrag p12 gibt die Wahrscheinlichkeit dafür an, dass die Sonne hinter Wolken verschwindet, usw. Die Übergangsmatrix eines stochastischen Prozesses enthält nur Einträge, die zwischen 0 und 1 liegen, weil es sich dabei um Wahrscheinlichkeiten handelt. Ausserdem addieren sich die Einträge jeder Zeile zu 1. Denn die Einträge in der Zeile mit der Nummer i sind jeweils die Wahrscheinlichkeiten dafür, dass der Zustand i in einen der Zustände 1, 2, . . . , n übergeht. Also ist pi1 + pi2 + . . . + pin = 1 für alle i. Diese Beobachtung führt zum folgenden Begriff. 5.7.2 Definition Eine quadratische Matrix A = (aij ) vom Typ n × n heisst stochastisch, wenn sämtliche Einträge grösser oder gleich Null sind und für alle i gilt: P n j=1 aij = 1. Die Matrix A heisst doppelt stochastisch, wenn zusätzlich auch alle Spaltensummen gleich 1 sind. 8 1 1 1 Zum Beispiel ist die Matrix A = 10 2 5 3 stochastisch. 3 5 2 5.7.3 Satz 1. Sind A, B Übergangsmatrizen zweier stochastischer Vorgänge im System S, so ist AB die Übergangsmatrix des zusammengesetzten Vorgangs. 2. Sind A, B stochastische n × n-Matrizen, so ist auch das Produkt AB eine stochastische Matrix. Beweis. Nehmen wir an, der erste Vorgang wird durch die Matrix A = (aij ) und der zweite Vorgang durch die Matrix B = (bij ) beschrieben. Ein Wechsel vom Zustand i in zwei Schritten in den Zustand j kann auf n verschiedene Arten erfolgen, nämlich von i nach 1 und dann nach j, oder von i nach 2 und dann nach j usw. Die Wahrscheinlichkeit für den Wechsel von i via k nach j beträgt aik bkj . Summiert man all diese Wahrscheinlichkeiten auf, erhält man die Wahrscheinlichkeit cij dafür, dass in 5.7. Exkurs: Stochastische Matrizen 129 P zwei Schritten ein Wechsel von i nach j stattfindet, das heisst: cij = nk=1 aik bkj . Die Übergangsmatrix C = (cij ) des zusammengesetzten Vorgangs stimmt also überein mit dem Produkt der Matrizen AB. q.e.d. Nehmen wir jetzt an, die Wahrscheinlichkeiten für die Zustandsänderungen seien zeitlich stabil und wir beobachten einen Vorgang in k Schritten. Die entsprechende Übergangsmatrix ist dann gerade die k-te Potenz der stochastischen Matrix A des Einzelvorgangs. Der Grenzwert limk→∞ Ak beschreibt also (wenn er existiert) die Entwicklung des Prozesses, wenn man die Zeit t gegen unendlich gehen lässt. 5.7.4 Beispiel Nehmen wir an, eine Nachricht der Form ”ja” oder ”nein” werde durch einen Kurier weitergegeben, aber nicht hundertprozentig zuverlässig. Mit Wahrscheinlichkeit p werde die Nachricht ”ja” in ein ”nein” verfälscht, und mit Wahrscheinlichkeit q werde die Nachricht ”nein” in ein ”ja”verfälscht. Dann lautet 1−p p . Dabei die Übergangsmatrix der Nachrichtenübermittlung: A = q 1−q sind 0 < p, q < 1. Hier gilt: q p k p+q p+q . lim A = p q k→∞ p+q p+q Also ist die Wahrscheinlichkeit dafür, dass nach einer sehr langen Kette von Inq formanten schliesslich ein ”ja” übermittelt wird, gleich p+q , und zwar unabhängig davon, um welche Nachricht es sich ursprünglich handelte. Ist p = q, so erhalten wir 1 1 k lim A = 21 12 . k→∞ 2 2 Das bedeutet also, dass schliesslich nach Weitergabe durch viele Zwischenkuriere die Chance auf eine korrekte Übermittlung der Ausgangsnachricht noch 50% beträgt. Für dies und auch für das folgende Beispiel ist es nützlich zu wissen, dass unter bestimmten Voraussetzungen auch für Matrizen ein binomischer Lehrsatz gilt. 5.7.5 Satz Sind A, B quadratische Matrizen vom Typ n×n derart, dass AB = BA, dann ist für alle n ∈ N n X n k n−k n A B . (A + B) = k k=0 Dabei ist nach Definition A0 = E = B 0 . Beweis. Durch vollständige Induktion ganz ähnlich wie im Fall von Zahlen. Allerdings ist hier entscheidend, dass A und B miteinander kommutieren. Wenn das nicht der Fall ist, stimmt auch die binomische Formel nicht. q.e.d. 130 Kapitel 5. Lineare Algebra Nun können wir die Begründung für die in Beispiel 5.7.4 behauptete Aussage nachtragen: Wir zerlegen die Matrix A in −p p A = E + B, wobei B = . q −q Dann folgt durch vollständige Induktion " # n n X X n −1 n Bk = An = (p + q)k (−1)k B + E , k p+q k k=0 k=1 und daraus An = 1 −1 [(1 − (p + q))n − 1]B + E −→ E + B. n→∞ p+q p+q q.e.d. 5.7.6 Beispiel Nehmen wir jetzt an, ein Versuchstier werde mit n Türen konfrontiert, hinter denen sich jeweils Futter befindet. Bei jeder Fütterung hat das Tier die Möglichkeit, eine der Türen auszuwählen. Das Tier habe nur ein kurzes Gedächtnis und wähle mit Wahrscheinlichkeit a dieselbe Tür wie bei der vorigen Fütterung und 1−a jeweils irgendeine der anderen Türen. Dann lautet mit Wahrscheinlichkeit b = n−1 a b ... b b a ... b . Dabei sind 0 < a < 1 und die n × n-Übergangsmatrix dazu: A = .. ... . b b ... a a + (n − 1)b = 1. Hier gilt: 1 1 n 1 n 1 n n 1 n lim Ak = ... k→∞ ... ... .. . 1 n 1 n ... 1 n . Beweis. Wir bezeichnen mit F diejenige n × n-Matrix, deren sämtliche Einträge gleich 1 sind. Dann ist nach dem binomischen Lehrsatz (weil EF = F E): k X k (a − b)k−j bj F j . A = ((a − b)E + bF ) = j j=0 k k Durch vollständige Induktion kann man ausserdem zeigen: F j = nj−1 F für alle j ∈ N. Also folgt k 1 X k (a − b)k−j bj nj )F = A = (a − b) E + ( n j=1 j k k 5.7. Exkurs: Stochastische Matrizen 131 1 1 1 ((a − b + nb)k − (a − b)k )F = (a − b)k (E − F ) + F . n n n q.e.d. Weil |a − b| < 1, ist limk→∞ (a − b)k = 0, und daher limk→∞ Ak = n1 F . (a − b)k E + Auf lange Sicht wird also jede Tür mit derselben Wahrscheinlichkeit ausgewählt. 5.7.7 Beispiel Hier ist ein einfaches Modell eines Waldbestandes. Nehmen wir an, der Wald bestehe aus drei Baumarten, die alle etwa die gleiche Lebensdauer haben. Die Erneuerung des Waldes durch das Nachwachsen einer neuen Generation sei der stochastische Vorgang, den wir beschreiben wollen. Der Eintrag pij der Übergangsmatrix P gebe an, mit welcher Wahrscheinlichkeit die Baumart i durch Baumart j ersetzt wird. Wir gehen wieder davon aus, dass diese Übergangswahrscheinlichkeiten sich nicht ändern. Ausserdem halten wir in einem Zeilenvektor (ak , bk , ck ) fest, welchen prozentualen Anteil am Gesamtbestand die drei Baumarten in der k-ten Generation haben. Multipliziert man diesen Zeilenvektor von rechts mit der Übergangsmatrix, erhält man die prozentualen Anteile der Baumarten in der (k + 1)-ten Generation: (ak+1 , bk+1 , ck+1) = (ak , bk , ck )P . Denn das Produkt des Zeilenvektors mit der ersten Spalte von P lautet ak p11 + bk p21 + ck p31 . Die hier vorkommenden Einträge von P geben Wahrscheinlichkeiten dafür an, dass jeweils der erste Baumtyp nachwächst. Wenn wir nun annehmen, dass sich der Bestand anteilsmässig genau so entwickelt, wie es die Wahrscheinlichkeiten vorhersagen, dann ist ak p11 + bk p21 + ck p31 = ak+1 . Entsprechendes können wir über das Produkt mit der zweiten und dritten Spalte von P sagen. Durch Iteration erhalten wir schliesslich: (ak , bk , ck ) = (a0 , b0 , c0 )P k für alle k. . Wir stellen nun die Frage, ob es eine Verteilung (a0 , b0 , c0 ) gibt, die über die Generationen hinweg stabil bleibt. Gesucht ist also ein Vektor (x, y, z) (mit x, y, z > 0 und x + y + z = 1), so dass (x, y, z)P = (x, y, z). Um einen solchen Vektor zu finden (wenn er denn existiert), ist ein lineares Gleichungssystem zu lösen. Ist etwa 1 4 5 1 1 konkret P = 10 3 3 4 , so ist 157 (35, 71, 51) ein solcher stabiler Vektor. Das 2 7 1 bedeutet also, dass in dem entsprechenden Wald eine Aufteilung der Baumarten in circa (22,3%,45,2%,32,5%) ein stabiles Ökosystem darstellt.