Mathematik für Biologen 2 Dr. Maria Neuss-Radu Universität Heidelberg Sommersemester 2007 Inhaltsverzeichnis 1 Diskrete Modelle 1.1 Lineare Rekursionsgleichungen . . . . . . . . . . . . . . . . . 1.1.1 Graphische Methode für die Darstellung der Lösung . 1.2 Die komplexen Zahlen . . . . . . . . . . . . . . . . . . . . . 1.2.1 Die komplexe Struktur auf R2 . . . . . . . . . . . . . 1.2.2 Zusammenhang zwischen den komplexen Zahlen und metrischen Funktionen . . . . . . . . . . . . . . . . . 1.3 Nichtlineare Rekursionsgleichungen . . . . . . . . . . . . . . 1.3.1 Kriterien für die Stabilität von Fixpunkten . . . . . . 1.3.2 Die (diskrete) logistische Gleichung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . den trigono. . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 Lineare Gleichungssysteme 2.1 Berechnen von Konzentrationen . . . . . . . . . . . . . . . . . . . . . . . 2.2 Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.1 Motivation und Beispiele . . . . . . . . . . . . . . . . . . . . . . . 2.2.2 Definition und Rechenregeln für Matrizen . . . . . . . . . . . . . 2.3 Grundbegriffe für lineare Gleichungssysteme . . . . . . . . . . . . . . . . 2.4 Die Gauß’sche Eliminationsmethode . . . . . . . . . . . . . . . . . . . . . 2.5 Lösungstheorie linearer Gleichungssysteme . . . . . . . . . . . . . . . . . 2.5.1 Lösungstheorie homogener linearer Gleichungssysteme . . . . . . . 2.5.2 Lösungstheorie inhomogener linearer Gleichungssysteme . . . . . . 2.6 Cramer’sche Regel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.6.1 Determinante einer Matrix . . . . . . . . . . . . . . . . . . . . . . 2.6.2 Die Cramer’sche Regel zur Lösung von quadratischen linearen Gleichungssystemen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.7 Eigenwerte und Eigenvektoren . . . . . . . . . . . . . . . . . . . . . . . . 3 Kontinuierliche Prozesse 3.1 Wachstumsraten . . . . . . . . . . . . . . . . . . . . 3.2 Gewöhnliche Differentialgleichungen. Grundbegriffe . 3.3 Differentialgleichungen der Form y 0 = ay + b . . . . . 3.3.1 Die Elektrische Aufladung einer Zellmembran. Frings, IZ) . . . . . . . . . . . . . . . . . . . . 3.4 Systeme von linearen Differentialgleichungen . . . . . 3.5 Systeme von nichtlinearen Differentialgleichungen . . 3.5.1 Herleitung der Michaelis-Menten-Kinetik . . . 2 . . . . . . . . . . . . (Prof. . . . . . . . . . . . . . . . . . . . . . . Dr. . . . . . . . . . . . . 3 3 4 9 9 . . . . 12 17 18 19 . . . . . . . . . . . 25 25 27 27 30 32 35 37 37 39 41 41 . 43 . 45 50 . . . . . . 50 . . . . . . 52 . . . . . . 53 Stephan . . . . . . 57 . . . . . . 58 . . . . . . 69 . . . . . . 75 Kapitel 1 Diskrete Modelle für die Dynamik biologischer Systeme In diesem Kapitel beschäftigen wir uns mit mathematischen Modellen für Populationen, deren zeitliche Entwicklung durch Messwerte zu bestimmten (diskreten) Zeitpunkten gegeben ist. Als Beispiele könnte man hier die Bevölkerungszahl eines Gebiets, jeweils zu Zeiten, zu denen diese aus historischen Quellen bestimmt werden kann, die Anzahl der in vitro gezüchteten Epithelzellen, täglich gemessen, oder die Größe eines wachsenden Kristalls, stündlich gemessen, nennen. In dem ersten Teil der Vorlesung haben wir solche biologischen Systeme mit den Methoden der Stochastik analysiert. Nun werden wir uns mit deterministischen Beschreibungen befassen. Sei (xj )j=0,1,2,... die Folge der Messwerte zu den Zeitpunkten (tj )j=0,1,2,... . Oft ist es möglich diese Messwerte mithilfe von Rekursionsgleichungen mathematisch zu beschreiben. Diese sind Gleichungen der Gestalt xn+1 = f (xn , xn−1 , . . .). Sie erlauben es, ausgehend von ein oder mehreren Anfangsglieder, das Folgeglied xn+1 aus seinen Vorgängern xn , xn−1 , . . . zu berechnen. 1.1 Lineare Rekursionsgleichungen Die einfachste Art von Rekursionsgleichungen ist in den folgenden zwei Beispielen gegeben. Beispiel 1 Wir betrachten eine Zellkolonie, von der wir annehmen, dass sich alle Zellen gleichzeitig teilen und jede Zelle im Schnitt a > 0 Tochterzellen produziert. Sei xn die Anzahl der Zellen in der n−ten Generation. Dann ist xn+1 = axn . (1.1) Wenn wir annehmen, dass anfangs x0 Zellen existieren, so können wir die Evolution der Zellpopulation einfach berechnen: xn+1 = axn = a(axn−1 ) = . . . = an+1 x0 , 3 4 KAPITEL 1. DISKRETE MODELLE also für die n−te Generation x n = an x 0 . (1.2) xn gegeben durch (1.2) heißt Lösung der Rekursionsgleichung (1.1) zum Anfangswert x0 . Wir bemerken, dass der Wert von a für das langfristige Verhalten der Population bestimmend ist, d.h. wir erhalten für • a>1 exponentielles Wachstum • a<1 Aussterben • a=1 konstante Population. 1.1.1 Graphische Methode für die Darstellung der Lösung Rekursionsgleichungen der Form xn+1 = f (xn ), bei denen zur Berechnung von xn+1 nur der unmittelbare Vorgänger xn nötig ist, heißen Rekursionsgleichungen erster Ordnung. Für solche Rekursionsgleichungen kann folgende graphische Methode für die Darstellung der Lösung benutzt werden: In ein Koordinatensystem werden auf der horizontalen Achse die Werte von xn und auf der vertikalen Achse die von xn+1 aufgetragen. In diesem Koordinatensystem zeichnet man den Graph der Funktion y = f (x) sowie die Diagonale y = x ein. Diese zwei Kurven werden nun benutzt, um die aufeinanderfolgenden Werte von xn , n = 0, 1, 2, . . . graphisch darzustellen. Wie dies funktioniert, veranschaulichen wir anhand der Gleichung (1.1) aus dem Beispiel 1, siehe Abb.1.1 und Abb.1.2. In diesem Beispiel ist f (xn ) = axn . Aus der graphischen Darstellung ist der Zusammenhang zwischen den Werten des Parameters a und der Evolution der Lösung sehr anschaulich zu erkennen. Beispiel 2 Wir betrachten eine Insektenpopulation mit folgenden Eigenschaften: Jedes erwachsene Weibchen produziert Nachkommen. Ein Teil dieser Nachkommen überlebt und erlangt das Reifestadium. Es seien also an − Anzahl der erwachsenen Weibchen in der n-ten Generation, kn − Anzahl der Nachkommen in der n-ten Generation, µ − Mortalitätsrate der Nachkommen, β − Reproduktionsrate der Weibchen, ρ − Anteil der Weibchen an der Gesamtpopulation. Es gelten also folgende Beziehungen kn+1 = β · an an+1 = ρ(1 − µ)kn+1 1.1. LINEARE REKURSIONSGLEICHUNGEN 5 Xn y = x y= ax Xn+1 X2 X2 X1 X1 11 00 1 0 0 1 X0 0 1 X0 X1 Xn 0 1 2 3 n Abbildung 1.1: Graphische Darstellung für xn+1 = axn mit a > 1. Xn+1 Xn 11 00 X0 00 11 = x 111111111111 000000000000 x 000000000000 111111111111 =a y 000000000000 111111111111 1111111 1111 0000 0 1 X1 0000000 000000000000 111111111111 0 1 1 0 000000000000 111111111111 0 1 0 1 000000000000 111111111111 0 1 0 1 000000000000 111111111111 0 1 0 1 000000000000 111111111111 X2 111111111111 0 1 0 1 0 1 111 000 0 1 000000000000 0 1 0 1 0 1 000000000000 111111111111 0 1 111 000 0 1 11 00 0 1 0 1 000000000000 111111111111 0 1 X3 111111111111 0 1 0 1 000000000000 0 1 1 0 0 1 0 1 000000000000 111111111111 0 1 0 1 000000000000 111111111111 0 1 0 1 000000000000 111111111111 0 1 0 1 000000000000 111111111111 0 1 0 1 000000000000 111111111111 0X0 Xn 1 X2 X1 y 1 0 0 1 X1 11 00 00 11 00 11 00 11 X2 X3 0 1 2 3 n Abbildung 1.2: Graphische Darstellung für xn+1 = axn mit a < 1. Wir fassen diese zwei Beziehungen in eine Rekurrenzgleichung, für die Anzahl der erwachsenen Weibchen zusammen: an+1 = [ρ(1 − µ)β]an . (1.3) Analog zum Beispiel (1) erhalten wir im Falle einer Anfangspopulation von a0 Weibchen, die Lösung: an = [ρ(1 − µ)β]n · a0 . Die in den zwei Beispielen betrachteten Rekursionsgleichungen (1.1) und (1.3) sind lineare Rekursionsgleichungen erster Ordnung, denn die in ihnen auftretenden Folgenglieder kommen nur in der 1. Potenz (d.h. linear) vor und zur Berechnung von xn+1 ist nur der unmittelbare Vorgänger xn nötig. Als nächstes werden wir ein Beispiel betrachten, in welchem lineare Rekursionsgleichungen zweiter Ordnung die Evolution der Population beschreiben. 6 KAPITEL 1. DISKRETE MODELLE Beispiel 3 (Kaninchenpopulation, Fibonacci - Zahlen) Leonardo Pisano (ca. 1170 - 1230, genannt Fibonacci) stellte einmal seinen Schülern folgende Aufgabe: Gewisse Kaninchen werden mit einem Monat erwachsen, d.h. geschlechtsreif. Wenn ein Pärchen erwachsen wird, dann bekommt es einen Monat später ein Pärchen als Nachwuchs und nach jedem weiteren Monat wieder ein Pärchen. Zum Zeitpunkt t = 0 kommt ein erwachsenes Pärchen in eine bisher noch nicht von Kaninchen bevölkerte Gegend. Zum Zeitpunkt t = 1 (nach einem Monat) sind es also zwei Pärchen (das alte und ein neugeborenes). Wie geht es weiter, d.h. wieviele Pärchen sind es nach 2, 3, 4, . . . Monaten, vorausgesetzt, dass keine Kaninchen sterben? Sei nun an die Anzahl der Pärchen nach n Monaten. Da keine Kaninchen sterben, sind die an Pärchen, die zum Zeitpunkt n da sind, auch zum Zeitpunkt n+1 noch da. Außerdem haben sich diejenigen vermehrt, die zum Zeitpunkt n erwachsen waren, und das sind die an−1 Pärchen, die zum Zeitpunkt n − 1 lebten. Also erhalten wir die Rekursionsgleichung: an+1 = an + an−1 , (1.4) mit Anfangsbedingungen a0 = 1, a1 = 2. Diese Gleichung kann auch als System geschrieben werden an+1 = an + bn bn+1 = an , (1.5) Die Matrix-Vektor-Form ist: an+1 bn+1 = 1 1 1 0 an bn . (1.6) Wie kann man nun die Anzahl der Kaninchenpaare zum Zeitpunkt n als Funktion der Anfangswerte berechnen? Wir suchen eine Lösung für das System (1.5) unter der Form, wie wir sie bei den Gleichungen 1.Ordnung schon angetroffen haben, d.h. an = Aλn (1.7) bn = Bλn . Einsetzen in (1.5) ergibt Aλn+1 = Aλn + Bλn Bλn+1 = Aλn . Wir kürzen nun durch λn und schreiben dann das System in Matrix-Vektor-Form um. (1 − λ) 1 A 0 = (1.8) 1 −λ B 0 Dies ist nun ein lineares Gleichungssystem in den Unbekannten A und B. Eine Lösung dieses Systems ist A = B = 0, doch diese ist trivial, denn sie führt zu an = 0 bn = 0. 1.1. LINEARE REKURSIONSGLEICHUNGEN 7 Um eine nichttriviale Lösung für A und B zu erhalten, muss die Determinante des Systems Null sein; 1−λ 1 det = 0 1 −λ Dies führt zu −(1 − λ)λ − 1 = 0 λ2 − λ − 1 = 0 π(λ) = λ2 − λ − 1 heißt charakteristisches Polynom der Matrix 1 1 1 0 (1.9) des Systems (1.6) und die Nullstellen von π(λ) heißen Eigenwerte der Matrix (1.9). Es stellt sich nun die Frage der Existenz reeller Eigenwerte. In unserem Fall sind die Eigenwerte λ1 und λ2 reell und λ1 6= λ2 , nämlich √ √ 1± 1+4 1± 5 = λ1,2 = 2 2 Zu den Werten λ1 , λ2 besitzt das System (1.8) die nichttrivialen Lösungen 1 A1 = α , α∈R B1 λ1 − 1 A2 1 = β , β ∈ R. B2 λ2 − 1 A1 A2 Die Lösungen B bzw. heißen Eigenvektoren der Matrix (1.9) zu den Eigenwerten λ1 B2 1 bzw. λ2 . Wir werden in einer späteren Vorlesung sehen, dass sich die Eigenvektoren in der obigen Form darstellen lassen. Aus (1.7) und wegen der Linearität der Rekursionsgleichung ist die allgemeine Form der Lösung von (1.4) √ !n √ !n 5 1 − 5 1 + +β . an = α(λ1 )n + β(λ2 )n = α 2 2 Die Koeffizienten α und β erhält man nun aus den Anfangsbedingungen a0 = 1 ⇒ α + β = 1 √ ⇔ β =1−α √ a1 = 2 ⇒ α · 1+2 5 + (1 − α) 1−2 √ √ 2 5α + 1 − 5 = 4 √ 3 5 α = 12 + 10 √ 1 3 β = 2 − 10 5 5 =2 Die zu unseren Anfangswerten gehörende Lösung lautet also √ !n √ !n 1 3√ 1+ 5 1 3√ 1− 5 an = + 5 + − 5 , n = 0, 1, 2, . . . 2 10 2 2 10 2 8 KAPITEL 1. DISKRETE MODELLE Dies ist die explizite Formel für die Folge der Fibonacci-Zahlen: 1, 2, 3, 5, 8, 13, 21, 34, . . . Die explizite Formel erlaubt uns nun, zu untersuchen, wie sich die Kaninchenpopulation langfristig verhält. Da lim an = ∞ n→∞ (siehe Übungsaufgabe) folgt daraus die Explosion“ der Kaninchenpopulation. ” Bemerkung 1 Die Fibonacci-Zahlen treten nicht nur bei den Kaninchen, sondern in vielen anderen Bereichen in der Biologie auf. Beim Studium der Anordnung von Blättern (Phyllotaxis) stößt man z.B. auch auf Fibonacci-Zahlen. Bezeichnet man mit r die Anzahl der Umläufe, die die Blätter um einen Stengel ausführen, bis wieder ein Blatt in derselben Richtung wie das erste vom Stengel wegweist, dann ist r bei vielen Pflanzen eine solche Fibonacci-Zahl und die Anzahl der Blätter einer solchen Periode ist dann oft die übernächste Fibonacci-Zahl. In der Abb.1.3 ist α = 144◦ . Die Anzahl r der Umläufe B1 1 0 B4 B2 0 1 000 111 0 1 000 111 0 1 000 111 α1 0 000 111 0 1 000 111 00 000 111 B11 6 00 11 000 111 00 11 000 111 B5 00 11 000 00111 11 Blätter B3 Stengel Abbildung 1.3: Schraubenförmige Anordnung von Blättern um einen Stengel (Ansicht von oben) ist a2 = 2 und die Anzahl der Blätter während dieser Periode ist a4 = 5. Dies ist z.B. bei Rosen, Kirschen und Weiden der Fall. Das Studium der Rekursionsgleichung (1.4) hat folgende Fragestellungen aufgeworfen: • Lösbarkeit von Gleichungssystemen, insbesondere Bestimmen von Eigenwerten und Eigenvektoren. Diese Thematik werden wir im nächsten Kapitel behandeln. • Lösbarkeit der charakteristischen Gleichung, oder allgemeiner, von polynomialen Gleichungen. Diese Fragestellung führt zur Erweiterung des Zahlenkörpers R und ist Thema des nächsten Paragraphen. 1.2. DIE KOMPLEXEN ZAHLEN 1.2 9 Die komplexen Zahlen Wir haben im vorigen Paragraphen gesehen, dass Eigenwerte von Matrizen für die Berechnung von expliziten Lösungen von Rekursionsgleichungen wichtig sind. Diese Eigenwerte sind Nullstellen von polynomialen Gleichungen: πm (λ) = m X aj λj = 0. j=0 Diese Gleichungen sind im Allgemeinen in R nicht lösbar. Ein Beispiel dafür ist λ2 + 1 = 0. Um Lösungen zu finden, muss der Zahlenbegriff so erweitert werden, dass folgende Zerlegung möglich ist: πm (λ) = (λ − λ1 )(λ − λ2 ) . . . (λ − λm ) 1.2.1 Die komplexe Struktur auf R2 Um den Zahlenkörper R zu erweitern, betten wir ihn zuerst nach R2 , der Menge aller Zahlenpaare (x, y), x, y ∈ R, ein, mittels der Abbildung R 3 x 7−→ (x, 0) ∈ R2 (1.10) Nun definieren wir in R2 eine Addition und eine Multiplikation durch: (x, y) + (x0 , y 0 ) = (x + x0 , y + y 0 ) (x, y) · (x0 , y 0 ) = (xx0 − yy 0 , x0 y + xy 0 ). Die Addition entspricht hierbei gerade der Vektoraddition in R2 , siehe Abb.1.4. Die geometrische Interpretation der Multiplikation werden wir später noch angeben. Bezüglich y (x + x , y + y ) (x , y ) (x , y ) x Abbildung 1.4: Geometrische Interpretation der Addition in R2 dieser Operationen kann man nach denselben Regeln rechnen, wie bei reellen Zahlen. Es gelten: 10 KAPITEL 1. DISKRETE MODELLE • Assoziativgesetz der Addition und Multiplikation (z + z 0 ) + z 00 = z + (z 0 + z 00 ) (z · z 0 ) · z 00 = z · (z 0 · z 00 ). Dies bedeutet gerade, dass Summen und Produkte von der Klammerung unabhängig sind. • Kommutativgesetz der Addition und Multiplikation z + z0 = z0 + z z · z0 = z0 · z • Distributivgesetz z(z 0 + z 00 ) = z · z 0 + z · z 00 • Die Null bezglich der Addition ist (0, 0), denn: (x, y) + (0, 0) = (x, y) • Das Negative von (x, y) ist −(x, y) = (−x, −y), denn: (x, y)+(−x, −y) = (x−x, y − y) = (0, 0) • Die Eins bezüglich der Multiplikation ist (1, 0), denn: (x, y) · (1, 0) = (x · 1 − y · 0, x · 0 + y · 1) = (x, y) −y x , , für (x, y) 6= (0, 0), denn: • Die Inverse von (x, y) ist (x, y)−1 = x2 +y 2 x2 +y 2 (x, y) · x −y , 2 2 2 x + y x + y2 = (1, 0) Die oben eingeführten Operationen definieren auf R2 eine komplexe Struktur. Wir nennen das so definierte Zahlensystem das System der komplexen Zahlen und bezeichnen es mit C. Die Elemente von C nennt man komplexe Zahlen und bezeichnet sie meist mit z, also z = (x, y). Im z Im z Re z Re Abbildung 1.5: Komplexe Zahlenebene Die obigen Rechenregeln zeigen, dass C alle Eigenschaften von R, mit Ausnahme der Ordnung, besitzt. Mittels Abbildung (1.10) ist R eine Teilmenge von C und man kann leicht nachweisen, dass reelle Zahlen in R genauso addiert und multipliziert werden wie in C. 1.2. DIE KOMPLEXEN ZAHLEN 11 Eine Besonderheit von C ist die Existenz der sogenannten imaginären Einheit, i = (0, 1), mit der Eigenschaft, dass (0, 1) · (0, 1) = (−1, 0) = −(1, 0). Die imaginäre Einheit, die von Euler eingeführt wurde, erlaubt uns nun jede komplexe Zahl z = (x, y) in der Form z = (x, y) = (x, 0) + (0, y) = (x, 0) + (0, 1)(y, 0) = x + iy (1.11) zu schreiben. Dabei haben wir noch (x, 0) bzw. (y, 0) durch x bzw. y ersetzt. Mit dieser Schreibweise gilt dann i2 = −1. (1.12) Es sei hier noch daran erinnert, dass bei reellen Zahlen x stets x2 ≥ 0. Schreibt man also z = (x, y) = x + iy, so nennt man x den Realteil von z, x = Re z, und y den Imaginärteil von z, y = Im z, und hat somit z = Re z + i Im z. (1.13) Dies führt dann auf die Darstellung komplexer Zahlen in der komplexen Zahlenebene, siehe Abb.1.5. Für eine komplexe Zahl z definiert man nun noch die komplex konjugierte Zahl z̄ durch z̄ = Re z − i Im z. In der Zahlenebene erhält man z̄ durch Spiegeln an der reellen Achse. Das komplexe Kon- Im z z’ Re z’ z Abbildung 1.6: Darstellung der komplex konjugierten Zahl. jugieren hat folgende Eigenschaften: 12 KAPITEL 1. DISKRETE MODELLE z + z 0 = z̄ + z¯0 , z · z 0 = z̄ · z¯0 ī = −i dann und nur dann, wenn z reell ist. (z̄) = z, z̄ = z (1.14) Schließlich kann man noch den Absolutbetrag oder Betrag der komplexen Zahl z durch 1 1 |z| = (x2 + y 2 ) 2 = ((Re z)2 + (Im z)2 ) 2 (1.15) definieren. |z| gibt also genau die Länge des Vektors z = Re z + i Im z an. Für den Betrag gilt z · z̄ = |z|2 , |z · z 0 | = |z| |z 0 | |z̄| = |z|, |z + z 0 | ≤ |z| + |z 0 | (1.16) z −1 = |z|z̄ 2 . 1.2.2 Zusammenhang zwischen den komplexen Zahlen und den trigonometrischen Funktionen Um den Zusammenhang zwischen komplexen Zahlen und trigonometrischen Funktionen zu untersuchen, stellen wir z wieder in der komplexen Zahlenebene dar. Sei ϕ der Winkel des Vektors z mit der reellen Achse. Dieser Winkel heißt Argument der komplexen Zahl z. Der Betrag und das Argument von z heißen Polarkoordinaten. Mit deren Hilfe kann eine komplexe Zahl z folgendermaen dargestellt werden: Im z |z| sin ϕ Re z = |z| · cos ϕ Im z = |z| · sin ϕ |z| ϕ |z| cos ϕ (1.17) Re und folglich z = |z|(cos ϕ + i sin ϕ) =: |z|eiϕ (1.18) (1.18) heißt Polardarstellung von z. Dabei gilt 1 | cos ϕ + i sin ϕ| = (cos2 ϕ + sin2 ϕ) 2 = √ 1 = 1. Mit dieser Polardarstellung läßt sich die Multiplikation von komplexen Zahlen geometrisch deuten. Ist nämlich z 0 = |z 0 |(cos ϕ0 + sin ϕ0 ), so sehen wir z · z0 = = = = |z||z 0 |(cos ϕ + i sin ϕ)(cos ϕ0 + i sin ϕ0 ) |z · z 0 |(cos ϕ cos ϕ0 − sin ϕ sin ϕ0 + i cos ϕ sin ϕ0 + i sin ϕ cos ϕ0 ) |z · z 0 |(cos(ϕ + ϕ0 ) + i sin(ϕ + ϕ0 )) |z · z 0 |ei(ϕ+ϕ0) 1.2. DIE KOMPLEXEN ZAHLEN 13 Bei der Multiplikation werden also die Beträge multipliziert und die Winkel (Argumente) addiert. Dies zeigt sofort z n = |z|n (cos nϕ + i sin nϕ). (1.19) Man kann nun (1.19) umgekehrt verwenden, um die n−te Wurzel aus komplexen √ 5 Zahlen zu ziehen. Wir wollen uns dies zunächst an dem Beispiel 1 + i verdeutlichen. Wir wollen also die Gleichung √ √ ! √ √ 2 2 +i = 2(cos 45◦ + i sin 45◦ ) z5 = 1 + i = 2 2 2 lösen. Dafür stellen wir z als z = |z|(cos ϕ + i sin ϕ) dar und suchen |z| ∈ R+ und ϕ ∈ [0, 2π[. Es gilt also √ |z|5 (cos 5ϕ + i sin 5ϕ) = 2(cos 45◦ + i sin 45◦ ). Vergleicht man beide Seiten, erhält man √ |z|5 = 2, cos 5ϕ = cos 45◦ , Dies gibt |z| = √ 10 sin 5ϕ = sin 45◦ . ϕ = 9◦ . 2 Dies ist aber nicht die einzige Lösung. Da der Sinus und Cosinus 2π-periodische Funkz2 z3 1 z1 9o 210 z4 z5 Abbildung 1.7: Geometrische Darstellung der Lösungen von z 5 = 1 + i. tionen sind, kommen die Winkel k · 360◦ ϕk = 9 + = 9◦ + k · 72◦ , 5 ◦ k = 1, 2, 3, 4 ebenfalls in Frage. Die Lösungen sind also in diesem Fall 1 zk = 2 10 (cos ϕk + i sin ϕk ), k = 0, 1, 2, 3, 4, 14 KAPITEL 1. DISKRETE MODELLE siehe auch Abb. 1.7. Geometrisch bilden diese 5 Lösungen gerade die Eckpunkte eines √ regelmäßigen Fünfecks, das dem Kreis mit Radius 10 2 eingeschrieben ist. Will man allgemeiner die Gleichung z n = c = r(cos ψ + i sin ψ) (1.20) lösen, so erhält man als Lösungen 1 ψ 360 · k ψ 360 · k n zk = r cos + + i sin + k = 0, 1, . . . , n − 1. n n n n (1.21) In diesem Fall bilden die n Lösungen gerade die Eckpunkte eines regelmäßigen n-Ecks, √ n das dem Kreis mit Mittelpunkt (0, 0) und Radius r einbeschrieben ist. Wir haben also gesehen, dass für eine gegebene komplexe Zahl c ∈ C die Gleichung zn = c genau n komplexe Lösungen hat. Viel allgemeiner gilt nun der Fundamentalsatz der Algebra Ein komplexes Polynom vom Grade n, p(z) = a0 + a1 z + . . . + an z n , an 6= 0, hat eine Darstellung der Form p(z) = an (z − z1 )(z − z2 ) . . . (z − zn ). (1.22) Spezielle Werte der trigonometrischen Funktionen 0 0◦ sin x cos x tan x cot x π 6 π 3 √ √ 30◦ 45◦ 60◦ 2 √2 2 2 1 0 √2 3 1 √2 3 0 √3 ±∞ 3 7π 6 π 4 1 1 5π 4 π 2 90◦ 3 2 1 √2 2π 3 120◦ √ sin x cos x tan x cot x 135◦ √ 5π 6 π 150◦ 180◦ 3 2 1 1 0 2 2√ 2√ 2 3 1 0 − 2 − 2 − √2 −1 √ 3 3 ±∞ − √ 3 −1 − 3 0 √ √ 3 3 0 −3 −1 − 3 ±∞ 3 4π 3 3π 2 5π 3 210◦ 225◦ 240◦ 270◦ 300◦ √ 3π 4 √ √ 7π 4 315◦ √ 11π 6 ◦ 330 2π 360◦ 1 −√12 − √22 − 23 −1 − 23 −√ 22 − 0 √2 3 2 2 3 1 1 −√ 2 − 2 −2 0 1 2 2 2√ √ √ 3 3 1 3 ±∞ − √ 3 −1 − 3 0 √ √3 √ 3 3 3 1 0 −3 −1 − 3 ±∞ 3 Nun wollen wir ein Beispiel betrachten, bei dem das charakteristische Polynom komplexe Wurzeln hat. 1.2. DIE KOMPLEXEN ZAHLEN 15 Beispiel 4 Wir betrachten eine Population, deren Entwicklung folgenden Gesetzen folgt: In jedem Jahr werden zwei Junge geboren, und von den zum Zeitpunkt n vorhandenen Individuen sterben bis zum Zeitpunkt n + 1 so viele, wie zum Zeitpunkt n − 1 vorhanden waren. Es seien die Anfangswerte x0 = 2, x1 = 3 gegeben. Wie entwickelt sich die Population weiter? Sei xn die Anzahl der Individuen zum Zeitpunkt n. Dann wird xn durch folgende Rekursionsgleichung bestimmt: xn+1 = xn − xn−1 + 2. (1.23) Anhand der Rekursionsgleichung können wir nun weitere Werte von xn berechnen: x2 = 3, x3 = 2, x4 = 1, x5 = 1, x6 = 2, x7 = 3, x8 = 3, . . . Aus der graphischen Darstellung, siehe Abb.1.8, erkennen wir, dass wir eine periodische 3 2 1 0 1 2 3 4 5 6 7 8 n Abbildung 1.8: Darstellung der ersten 9 Folgeglieder von (1.23). Lösung erhalten (da x6 = x0 , x7 = x1 ) mit der Periodenlänge 6, d.h. für alle n gilt xn+6 = xn . Frage: Ist diese Beobachtung richtig und gilt sie für beliebige Anfangswerte? Um diese Frage zu beantworten, müssen wir nun die explizite Darstellung der Lösung von (1.23) bestimmen. Wir werden versuchen, nach dem gleichen Muster wie in Beispiel 3 vorzugehen. Dafür werden wir zuerst eine ganz spezielle Lösung zu (1.23) suchen, nämlich eine konstante yn = α. Diese muss also erfüllen α = α − α + 2. (1.24) yn = 2 ist also die konstante Lösung zu (1.23). Sie ist allerdings keine Lösung für unser Problem, da sie die Anfangswerte x0 = 2, x1 = 3 nicht erfüllt! Ist nun xn eine beliebige Lösung zu (1.23), d.h. xn+1 = xn − xn−1 + 2 (1.25) so folgt durch Substraktion von (1.25) und (1.24): xn+1 − α = (xn − α) − (xn−1 − α). 16 KAPITEL 1. DISKRETE MODELLE Die Differenz zn = xn − α ist also eine Lösung von zn+1 = zn − zn−1 . (1.26) Für das Lösen von (1.26) benutzen wir nun den gleichen Ansatz wie für die Rekursionsgleichung (1.4). Sei also zn+1 = zn − hn hn+1 = zn die Umformung von (1.26) zu einem System. Der Ansatz zn = A · λn hn = B · λn führt zu folgendem Gleichungssystem für (A, B): (1 − λ)A − B = 0 A − λB = 0, oder in der Matrix-Vektor Form 1−λ 1 −1 −λ A B = 0 0 . (1.27) Dieses System besitzt nichttriviale Lösungen genau dann wenn die Determinante seiner Matrix gleich Null ist, d.h. (1 − λ)(−λ) + 1 = 0 λ2 − λ + 1 = 0 Diese Gleichung können wir nun in C lösen und erhalten √ √ 1+ 1−4 1±i 3 λ1,2 = = . 2 2 Die Lösungen der Rekursionsgleichung (1.23) sind dann xn = 2 + zn = 2 + A1 λn1 + A2 λn2 = 2 + A1 √ !n 1+i 3 + A2 2 √ !n 1−i 3 . 2 A1 und A2 können wir nun aus den Anfangsbedingungen berechnen: n = 0 ⇒ x 0 = 2 + A1 + A2 n = 1 ⇒ x 1 = 2 + A 1 λ 1 + A2 λ 2 (1.28) Das System (1.28) müssen wir nun in C lösen und erhalten: A1 = A2 = x0 −2 2 x0 −2 2 − + √ (2x1 −x0 −2) 3 6 √ (2x1 −x0 −2) 3 6 i i (1.29) 1.3. NICHTLINEARE REKURSIONSGLEICHUNGEN 17 A1 und A2 sind also konjugiert komplexe Zahlen, und da λ1 und λ2 konjugiert komplex sind, folgt, dass A1 λn1 und A2 λn2 auch zueinander konjugiert komplexe Zahlen sind. D.h. ihre Summe ist dann stets reell, was ja bei reellen Anfangswerten x0 und x1 auch erfüllt sein muss! Nun wollen wir sehen, woher die Oszillationen kommen. Dafür schreiben wir λ1 und λ2 in Polarkoordinaten um und erhalten xn = 2 + A1 rn (cos nϕ + i sin nϕ) + A2 rn (cos nϕ − i sin nϕ) = 2 + (A1 + A2 ) rn cos nϕ + i (A1 − A2 ) rn sin nϕ | {z } | {z } 2ReA1 n 2iImA1 = 2 + 2 · r (Re A1 cos nϕ − Im A1 sin nϕ). Da Sinus und Cosinus periodische Funktionen sind, folgt aus dieser Darstellung, dass xn Oszillationen aufweist, welche für |r| > 1 wachsende Amplitude, für |r| < 1 fallende Amplitude und für |r| = 1 konstante Amplitude haben. 1.3 Nichtlineare Rekursionsgleichungen Eine nichtlineare Rekursionsgleichung ist eine Gleichung der Form xn+1 = f (xn , xn−1 , . . .), (1.30) wobei die Funktion f eine nichtlineare Funktion, z.B. ein Polynom, die Exponentialfunktion usw. ist. In sehr wenigen Fällen kann man für nichtlineare Gleichungen eine explizite Lösung ausrechnen. Was man im Allgemeinen tun kann, ist mithilfe mathematischer Techniken Eigenschaften der Lösung herauszufinden oder mithilfe des Computers das Verhalten der Lösung zu verfolgen. In dieser Vorlesung wollen wir uns auf das Studium nichtlinearer Rekursionsgleichungen erster Ordnung, d.h. von Gleichungen der Gestalt xn+1 = f (xn ) (1.31) beschränken. Die einfachsten Lösungen von (1.31) sind die konstanten Lösungen oder Gleichgewichtszustände xn = x̄. Diese erfüllen die Beziehung x̄ = f (x̄) (1.32) und werden deswegen auch Fixpunkte von f genannt. Ein Gleichgewichts- zustand x̄ heißt stabil, wenn Lösungen, die in der Nachbarschaft von x̄ starten, gegen x̄ konvergieren. Sie heißt instabil, falls das Gegenteil gilt. Untersuchungen zur Stabilität von Fixpunkten geben uns also Information über das Verhalten von nichtkonstanten Lösungen. 18 1.3.1 KAPITEL 1. DISKRETE MODELLE Kriterien für die Stabilität von Fixpunkten In diesem Abschnitt werden wir für unsere Argumentation den Begriff der Ableitung einer Funktion benötigen. Deswegen wiederholen wir kurz: Definition: Es sei f : (a, b) → R eine reellwertige Funktion. f heißt differenzierbar in x0 ∈ (a, b), wenn f (x) − f (x0 ) = f 0 (x0 ) (1.33) lim x→x0 x − x0 existiert. In diesem Fall nennt man f 0 (x0 ) die erste Ableitung von f an der Stelle x0 . f heißt in (a, b) differenzierbar, wenn f in jedem Punkt aus (a, b) differenzierbar ist. Aus (1.33) folgt, dass f (x) − f (x0 ) = f 0 (x0 ) + A(x, x0 ) x − x0 oder f (x) = f (x0 ) + f 0 (x0 )(x − x0 ) + A(x, x0 )(x − x0 ), (1.34) wobei die Abweichung A(x, x0 ) sehr klein ist und für x → x0 gegen 0 konvergiert. Die Relation (1.34) bedeutet, dass in unmittelbarer Nähe von x0 der Funktionsverlauf von f, bis auf einen kleinen Fehler, durch die Gerade fapp (x) = f (x0 ) + f 0 (x0 )(x − x0 ) gegeben ist. Dies ist aber gerade die Tangente im Punkt x0 an den Graph von f ! Eine in x0 differenzierbare Funktion lässt sich also in der Nachbarschaft von x0 gut durch die Tangente im Punkt x0 approximieren, siehe auch Abb. 1.9. Sei nun x̄ ein Fixpunkt der nichtlinearen y fapp(x) f(x) f(x0) x − x0 x0 x x Abbildung 1.9: Approximation von f durch die Tangente Gleichung xn+1 = f (xn ), (1.35) d.h. x̄ ist eine Lösung von (1.32). Wir wollen folgende Frage beantworten: Wenn für ein gegebenes n das Folgeglied xn nahe bei x̄ liegt, konvergiert dann die Lösung (xn )n≥0 gegen x̄ oder nicht? Dafür schreiben wir xn = x̄ + zn , (1.36) 1.3. NICHTLINEARE REKURSIONSGLEICHUNGEN 19 wobei zn klein ist. Wir nennen ein solches zn eine Störung von x̄. Dann gilt zn+1 := xn+1 − x̄ = f (xn ) − x̄ = f (x̄ + zn ) − x̄ = f (x̄) + f 0 (x̄)zn + A(zn + x̄, x̄)zn −x̄ {z } | sehr kleiner T erm 0 ≈ f (x̄) − x̄ +f (x̄)zn . | {z } =0 Wir erhalten also eine lineare Rekursionsgleichung für die Störung zn , zn+1 = azn , wobei a = f 0 (x̄). Im Beispiel 1 haben wir aber gesehen, dass zn → 0, falls |a| < 1. Aus (1.36) folgt dann aber, dass xn → x̄, falls |a| < 1. Wir haben also folgendes Kriterium für die Stabilität: x̄ ist ein stabiler Fixpunkt von (1.35) ⇔ |f 0 (x̄)| < 1. 1.3.2 Die (diskrete) logistische Gleichung Eine der einfachsten nichtlinearen Rekursionsgleichungen, auch als (diskrete) logistische Gleichung bekannt, ist die folgende xn+1 = rxn (1 − xn ), r ∈ [1, 4]. (1.37) (1.37) könnte eine Population beschreiben, deren Reproduktionsrate von der Population selbst abhängt. Wir wollen nun das Verhalten der Lösungen von (1.37) untersuchen. Dazu bestimmen wir zuerst die Fixpunkte x̄ als Lösungen von x̄ = rx̄(1 − x̄) und erhalten 1 r Der nichttriviale Fixpunkt x̄2 hängt vom Parameter r ab, und das obige Kriterium liefert, dass dieser Fixpunkt für 1 < r < 3 stabil ist (siehe Übungsaufgabe). Wir werden nun mithilfe der graphischen Methode das Verhalten der nichtkonstanten Lösungen untersuchen. Dazu stellen wir in einem Koordinatensystem die Funktionen x̄1 = 0, x̄2 = 1 − y = x und y = fr (x) = rx(1 − x) dar. Die Parabel y = fr (x) ist vom Parameter r abhängig. Für r = 1 ist sie tangent an die Diagonale y = x. Die Fixpunkte x̄1 und x̄2 fallen zusammen. Mit wachsenden Werten von r wird die Parabel immer steiler, und der nichttriviale Fixpunkt x̄2 wandert entlang der x-Achse von 0 bis 43 . Die Abhängigkeit vom Parameter r wird das Verhalten der Lösung sehr stark beeinflussen. In den folgenden Abbildungen werden wir für verschiedene Werte von r ∈ [1, 4] den Verlauf der Lösung graphisch verfolgen. Wir werden feststellen, dass für 1 < r < 3 die 20 KAPITEL 1. DISKRETE MODELLE y = x x n+1= f(x n ) 0 x2 x2 1 xn y = x(1−x) y = 2x(1−x) y = 3x(1−x) Abbildung 1.10: Die Parabel y = rx(1 − x) für r = 1, r = 2, r = 3. Lösungen, die in einer Umbebung des Fixpunktes starten, gegen den Fixpunkt konvergieren (was mit der Stabilität des Fixpunktes übereinstimmt). Für r = 1 konvergieren die Lösungen zu positiven Anfangswerten gegen den Fixpunkt. Die Lösungen zu negativen Anfangswerten konvergieren aber gegen −∞. Daher ist der Fixpunkt x̄1 = x̄2 = 0 nicht stabil. Auch für r ≥ 3 geht die Lösung weg vom Fixpunkt und oszilliert zwischen verschiedenen Zuständen. Die Anzahl dieser Zustände wächst mit wachsenden Werten des Parameters r. 1.3. NICHTLINEARE REKURSIONSGLEICHUNGEN 21 0.2 0.15 0.1 0.05 0 0 0.05 0.1 0.15 0.2 Abbildung 1.11: r = 1. Die Fixpunkte fallen zusammen. Die Lösung zum Anfangswert x0 = 0, 1 konvergiert gegen den Fixpunkt x̄2 = 0 monoton von oben. Würde man aber in x0 = −0, 1 starten, so würde die Lösung gegen −∞ konvergieren. 0.2 0.15 0.1 0.05 0 0 0.05 0.1 0.15 0.2 Abbildung 1.12: r = 1, 07. Die Lösung zum Anfangswert x0 = 0, 1 konvergiert gegen den 1 Fixpunkt x̄2 = 1 − 1,07 = 0, 0654 monoton von oben. 22 KAPITEL 1. DISKRETE MODELLE 0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 Abbildung 1.13: r = 1, 5. Die Lösung zum Anfangswert x0 = 0, 1 konvergiert gegen den 1 Fixpunkt x̄2 = 1 − 1,5 = 0, 3333 monoton von unten 0.6 0.5 0.4 0.3 0.2 0.1 0 0 0.1 0.2 0.3 0.4 0.5 0.6 Abbildung 1.14: r = 2. Die Lösung zum Anfangswert x0 = 0, 1 konvergiert gegen den Fixpunkt x̄2 = 0, 5 monoton von unten. 1.3. NICHTLINEARE REKURSIONSGLEICHUNGEN 23 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 Abbildung 1.15: r = 2, 5. Die Lösung zum Anfangswert x0 = 0, 1 spiralt gegen den Fixpunkt x̄2 = 0, 6. 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 Abbildung 1.16: r = 2, 8. Die Lösung zum Anfangswert x0 = 0, 1 spiralt gegen den 1 Fixpunkt x̄2 = 1 − 2,8 = 0, 6428. 24 KAPITEL 1. DISKRETE MODELLE 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 0 0.1 0.2 0.3 0.4 0.5 Abbildung 1.17: r = 3, 3. Der Fixpunkt x̄2 = 1 − springt zwischen zwei Werten hin und her. 0.6 1 3,3 0.7 0.8 0.9 = 0, 6969 ist instabil. Die Lösung 1 0.8 0.6 0.4 0.2 0 0 0.2 0.4 Abbildung 1.18: r = 3, 8. Der Fixpunkt x̄2 = 1 − weist ein chaotisches Verhalten auf. 0.6 1 3,8 0.8 1 = 0, 7368 ist instabil. Die Lösung Kapitel 2 Lineare Gleichungssysteme 2.1 Berechnen von Konzentrationen Beispiel 5 Es sind zwei Lösungen vorhanden. In der ersten Lösung sind 40% Methanol und 20% Formaldehyd enthalten. In der zweiten Lösung sind 30% Methanol und 10% Formaldehyd enthalten. Welche Mengen der beiden Lösungen und Wasser müssen zusammengemischt werden, um 1 Liter Endlösung mit 15% Methanol und 6% Formaldehyd zu erhalten? Um diese Frage zu beantworten, bezeichnen wir mit x − Menge [in Liter] der ersten Lösung y − Menge [in Liter] der zweiten Lösung z − Menge [in Liter] Wasser die nötig sind, um 1 Liter Endlösung mit der verlangten Zusammensetzung zu erhalten. Diese drei Mengen sollen sich zu 1 Liter addieren, d. h. x + y + z = 1. Die Menge von Methanol in einer Lösung, die durch das Zusammenmischen von x Liter der ersten Lösung, y Liter der zweiten Lösung und z Liter Wasser entsteht, berechnet sich zu x · 40% + y · 30% + z · 0%. Diese Methanolmenge stellt 15% von 1 Liter Endlösung dar. Wir erhalten also die Gleichung 40x + 30y = 15. Analog ergibt die Bilanz der Formaldehydmenge in 1 Liter Endlösung die Gleichung: 20x + 10y = 6. Wir erhalten also das Gleichungssystem x + y + 40x + 30y 20x + 10y 25 z = 1 = 15 = 6 26 KAPITEL 2. LINEARE GLEICHUNGSSYSTEME Um dieses Gleichungssystem zu lösen multiplizieren wir die zweite Gleichung mit subtrahieren sie von der dritten Gleichung. Wir erhalten x + y + 40x + 30y 20 x 3 z = 1 = 15 = 1 1 3 und (2.1) Die Lösung unserer Aufgabe lautet 3 20 3 15 − 40 · 20 6 = y = 30 20 3 6 11 z = 1− − = 20 20 20 x = 3 6 Es müssen also 20 Liter der ersten Lösung, 20 Liter der zweiten Lösung und 11 Liter 20 Wasser zusammengemischt werden. Aus dem Lösungsverfahren des Systems (2.1) ist klar, dass dies auch die einzige Lösung ist. Beispiel 6 Wir betrachten nun die gleichen Lösungen wie im Beispiel 5. Welche Mengen der beiden Lösungen müssen zusammengemischt werden, um 1 Liter Endlösung mit 15% Methanol und 6% Formaldehyd zu erhalten? Mit den Bezeichnungen aus Beispiel 5 lautet das Gleichungssystem nun x + y = 1 40x + 30y = 15 20x + 10y = 6 (2.2) Aus den letzten zwei Gleichungen kann man wie oben die Lösung 3 20 6 y = 20 x = berechnen. Diese erfüllt aber die erste Gleichung nicht. Es ist also nicht möglich, 1 Liter Endlösung mit der gewünschten Zusammensetzung zu erhalten. Das System (2.2) hat keine Lösung. Beispiel 7 Seien nun zwei Lösungen mit den folgenden Zusammensetzungen gegeben: In der ersten Lösung sind 40% Methanol und 20% Formaldehyd, in der zweiten Lösung sind 30% Methanol und 15% Formaldehyd enthalten. Welche Mengen der beiden Lösungen müssen zusammengemischt werden, um eine Endlösung mit 36% Methanol und 18% Formaldehyd zu erhalten? Wenn wir wieder mit x und y die Mengen der zwei Lösungen, die zusammengemischt werden, bezeichnen, so müssen diese folgendes Gleichungssystem lösen. 40x 20x + + 30y 15y = 36(x+y) = 18(x+y) (2.3) 2.2. MATRIZEN 27 oder äquivalent 4x 2x - 6y 3y = = 0 0 , α) als Lösung. Für unsere Anwendung Das System (2.3) hat alle Zahlenpaare (x, y) = ( 3α 2 kommen natürlich nur positive Lösungen in Frage, d.h. (x, y) = ( 3α , α), mit α > 0. Eine 2 mögliche Wahl der gesuchten Mengen wäre also, 1,5 Liter der ersten Lösung und 1 Liter der zweiten Lösung zusammenzumischen. 2.2 Matrizen 2.2.1 Motivation und Beispiele Beispiel 8 Ein Forscher führe ein Experiment unter verschiedenen Versuchsbedingungen durch. Die Resultate seiner Messungen trägt er in die folgende Tabelle ein: Versuchsbed.\Messung 1 2 .. . m 1 x11 x21 .. . 2 x12 x22 .. . 3 x13 x23 .. . ... ... ... n x1n x2n .. . xm1 xm2 xm3 ... xmn xij stellt also das Resultat der Messung Nummer j unter der Versuchsbedingung Nummer i dar. Beispiel 9 (Graphen) Es kommt häufig vor, dass bestimmte Objekte in Beziehung zueinander stehen und wir diese Beziehungen zu untersuchen haben. Ein Beispiel dafür sind die chemischen Strukturformeln. Wir stellen diese mithilfe von Graphen dar, in denen die Knoten die Atome und die Kanten die chemischen Bindungen sind. 28 KAPITEL 2. LINEARE GLEICHUNGSSYSTEME 2 5 1 4 3 0 1 1 1 1 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 0 1 0 0 1 1 0 1 0 0 0 1 0 1 0 0 0 1 0 1 1 0 0 1 0 1 5 2 3 4 Abbildung 2.1: Adjazenzmatrizen von Graphen Die Information über die bestehenden Bindungen kann mithilfe eines quadratischen Zahlenfeldes wiedergegeben werden: Die Atome werden in beliebiger Reihenfolge nummeriert. Falls zwei Atome miteinander verbunden sind, setzen wir die Zahl Eins, sonst die Zahl Null, siehe Abb. (2.1). Beispiel 10 (Nahrungskette) (Thrall et al. 1967) Es ist bekannt, dass giftige Schadstoffe in Nahrungsketten angereichert werden. Wir betrachten folgende Nahrungskette aus drei Gliedern: 1. Die Vegetation liefert Nahrung für Pflanzenfresser. Die verschiedenen Pflanzenarten seien mit p1 , p2 , . . . , pr bezeichnet. 2. Pflanzenfresser ernähren sich von den Pflanzen des ersten Gliedes. Die verschiedenen Arten von Pflanzenfressern seien mit a1 , a2 , . . . , as bezeichnet. 3. Fleischfressende Tiere leben von den in Glied 2 beschriebenen Pflanzenfressern und werden mit c1 , c2 , . . . , ct bezeichnet. Wir können nun fragen: Welche Menge an Pflanzen der Art p1 wird indirekt von den Fleischfressern der Art c2 aufgenommen? (Oder allgemeint: Welche Menge an Pflanzen der Art pi wird indirekt von den Fleischfressern der Art cj aufgenommen?) Um diese Frage zu beantworten stellen wir mithilfe zweier Zahlenfelder die Information, die wir haben, übersichtlich dar. 2.2. MATRIZEN 29 p1 p2 .. . a1 x11 x21 .. . a2 x12 x22 .. . . . . as . . . x1s . . . x2s .. . pr xr1 xr2 ... xrs a1 a2 .. . c1 y11 y21 .. . c2 y12 y22 .. . ... ... ... ct y1t y2t .. . as ys1 ys2 ... yst Abbildung 2.2: Nahrungsketten In Abb.(2.2) ist im ersten Tableau xik die Menge der Pflanzenart pi , die von jedem Individuum der Art ak gefressen wurde. ykj stellt die Anzahl der Individuen der Art ak dar, die von allen Individuen der Art cj gefressen wurden. Die Antwort auf unsere Frage ist nun folgende: Die gesuchte Menge an Pflanzen der Art p1 welche von den Fleischfressern der Art c2 aufgenommen wird ist x11 · y12 + x12 · y22 + . . . + x1s · ys2 und wird erhalten in dem wir sozusagen die erste Zeile aus dem ersten Tableau mit der zweiten Spalte aus dem zweiten Tableau multiplizieren. Beispiel 11 (Metabolische Netzwerke) Ein wichtiges Merkmal biochemischer Reaktionsnetzwerke ist ihre Stöchiometrie. Sie gibt an, in welchen molekularen Verhältnissen die Reaktanten und die Produkte in die Reaktionen eingehen. Für die Katalase-Reaktion 2H2 O2 −→ 2H2 O + O2 haben Wasserstoffperoxid, Wasser und Sauerstoff die stöchiometrischen Koeffezienten −2, 2 beziehungsweise 1. Das Vorzeichen der stöchiometrischen Koeffizienten ist positiv für die Produkte und negativ für die Reaktanten. Für die Analyse der Netzwerke werden die stöchiometrischen Koeffizienten in die stöchiometrische Matrix angeordnet. Dabei entsprechen die Zeilen den Substanzen und die Spalten den Reaktionen. Zum Beispiel entspricht dem Reaktionssystem: (1) Glukose + AT P −→ Glukose − 6 − P hosphat + ADP (2) Glukose − 6 − P hosphat −→ Glukose − 1 − P hosphat folgende stöchiometrische Matrix: (1) (2) −1 0 1 −1 0 1 −1 0 1 0 Glukose G−6−P G−1−P AT P ADP 30 KAPITEL 2. LINEARE GLEICHUNGSSYSTEME 2.2.2 Definition und Rechenregeln für Matrizen Eine m × n Matrix, m, n ∈ N, ist ein geordnetes Zahlenschema der Form a11 a12 . . . a1n a21 a22 . . . a2n A = (aij ) i=1,...,m = .. j=1,...,n . am1 am2 . . . amn (ai1 ai2 . . . ain ) heißt die i−te Zeile von A. a1j a..2j heißt die j−te Spalte von A. . amj aij heißt (i, j)−tes Element von A. Die Menge der m × n Matrizen mit reellen Elementen bezeichnen wir mit Rm×n . Matrizen bestehend aus einer Zeile bzw. einer Spalte werden Zeilenvektoren bzw. Spaltenvektoren genannt. Rechenoperationen Für Matrizen können, wie auch für Zahlen, Rechenoperationen definiert werden. • Addition von Matrizen Seien A, B zwei Matrizen mit der gleichen Zeilen- und Spaltenzahl, d.h. A, B ∈ Rm×n . Dann ist die Summe von A und B definiert durch A + B = (aij + bij ) i=1,...,m j=1,...,n Beispiel 12 Häufigkeitstafeln Bei einer statistischen Erhebung werden die Körperlänge und das Körpergewicht von Personen ermittelt. aij sei nun die absolute Häufigkeit von Personen mit dem Gewicht bi und der Körperlänge aj . Diese Häufigkeiten werden in folgende Häufigkeitstafel eingetragen: 150 cm 160 cm 170 cm 90 kg 0 0 0 =A. 80 kg 0 1 1 70 kg 3 12 18 Ist (bij ) i=1,...,m die Häufigkeitstafel bei einer anderen Zählstelle über die gleichen Merkmale, j=1,...,n 0 0 1 0 2 1 =B 4 11 17 so ergibt sich für beide Zählstellen zusammen die Häufigkeitstafel 0 0 1 0 3 2 = A + B. 7 23 35 2.2. MATRIZEN 31 • Multiplikation einer Matrix mit einer rellen Zahl. Sei α ∈ R, dann wird bei der Multiplikation einer Matrix A mit der rellen Zahl α jedes Element der Matrix mit dieser Zahl multipliziert, d.h. αA = (αaij ) i=1,...,m j=1,...,n • Multiplikation von Matrizen Seien A = (aik ) i=1,...,m , B = (bkj ) k=1,...,s zwei Matrizen mit der Eigenschaft, dass die k=1,...,s j=1,...,n Spaltenzahl von A gleich der Zeilenzahl von B ist, d.h. A ∈ Rm×s , B ∈ Rs×n . Das Produkt von A · B ∈ Rm×n ist definiert als ! s X A·B = aik bkj . k=1 i=1,...,m j=1,...,n Als Beispiel betrachten wir die Anwendung aus Beispiel 10. Dort sollte bestimmt werden, welche Menge an Pflanzen der Art pi indirekt von den Fleischfressern der Art cj aufgenommen wird. Wir bezeichnen nun die gesuchte Menge mit zij und berechnen sie als zij = xi1 · y1j + xi2 · y2j + . . . + xis · ysj = s X xik ykj . k=1 Das heißt, die Matrix Z = (zij ) i=1,...,r ist gegeben durch das Matrizenprodukt zwischen j=1,...,t den zwei Matrizen der Nahrungskette: Z = X · Y. Achtung: Die Multiplikation von Matrizen ist nicht kommutativ! Ein Gegenbeispiel für die Kommutativität ist folgendes: 0 −1 0 1 0 0 A= 1 0 0 B = 0 0 −1 0 0 1 0 1 0 0 0 1 A·B = 1 0 0 0 1 0 0 −1 0 B · A = 0 0 −1 1 0 0 Rechenregeln für Matrizen: • Assoziativgesetz der Addition und Multiplikation A + (B + C) = (A + B) + C A · (B · C) = (A · B) · C • Kommutativgesetz der Addition (nicht für Multiplikation!) A+B =B+A A · B 6= B · A • Distributivgesetz A · (B + C) = A · B + A · C 32 KAPITEL 2. LINEARE GLEICHUNGSSYSTEME • Die Null bezüglich der Addition ist die Nullmatrix 0 ... 0 .. O= . . 0 ... 0 • Das Negative von A = (aij ) i=1,...,m ist −A = (−aij ) i=1,...,m . j=1,...,n j=1,...,n • Die Eins (d.h. das neutrale Element) bezüglich der Multiplikation von quadratischen Matrizen ist die sogenannte Einheitsmatrix, deren Diagonalelemente Einsen sind, während außerhalb der Diagonalen lauter Nullen stehen. Diese Matrix wird mit I bezeichnet: 1 0 ... 0 0 1 ... 0 I= ∈ Rn×n . . . 0 0 ... 1 Sie erfüllt für jede Matrix A ∈ Rn×n die Beziehung: I ·A=A·I =A • Die inverse Matrix A−1 einer quadratischen Matrix A kann für bestimmte Matrizen berechnet werden. Wir werden in einem der nächsten Paragraphen sehen, für welche Matrizen sie existiert. A−1 ist diejenige Matrix, für welche gilt: A−1 · A = A · A−1 = I. • Die transponierte Matrix AT erhält man, wenn man einer Matrix vertauscht, d.h. a11 a12 . . . a1n a11 a21 a22 . . . a2n a12 A = .. AT = .. . . am1 am2 . . . amn a1n 2.3 die Zeilen und die Spalten a21 . . . am1 a22 . . . am2 . a2n . . . amn Grundbegriffe für lineare Gleichungssysteme Wir betrachten ein lineares Gleichungssystem a11 x1 + a12 x2 + . . . + a1n xn = b1 a21 x1 + a22 x2 + . . . + a2n xn = b2 .................................. am1 x1 + am2 x2 + . . . + amn xn = bm (2.4) von m Gleichungen in den n Unbekannten x1 , x2 , . . . xn . Die aij (i = 1, . . . , m; j = 2.3. GRUNDBEGRIFFE FÜR LINEARE GLEICHUNGSSYSTEME 33 1, 2, . . . , n) bezeichnet man als die Koeffizienten des Gleichungssystems. Die Koeffizienten des Gleichungssystems (2.4) ordnet man zweckmäßig in der m × n Matrix a11 a12 . . . a1n a21 a22 . . . a2n A = .. . am1 am2 . . . amn an. Ordnen wir die Unbekannten x1 , x2 , . . . , xn in den Spaltenvektor x1 b1 x b x = ..2 , und die rechten Seiten b1 , b2 , . . . , bm in den Spaltenvektor b = ..2 . . xn bm an, so können wir aufgrund der Matrizenmultiplikation das System (2.4) in der MatrixVektor-Form b1 a11 a12 . . . a1n x1 a21 a22 . . . a2n x2 b2 .. .. = .. (2.5) . . . bm am1 am2 . . . amn xn oder kürzer Ax = b schreiben. Bezeichnet man die Spalten von A mit a11 a12 a1n a a a .. v1 = ..21 , v2 = ..22 , . . . , vn = 2n . . . am1 am2 amn und benutzt die Definition der Addition von Matrizen (in unserem Fall m × 1 Matrizen) und die Multiplikation einer Matrix mit einer Zahl, so können wir dem System (2.4) folgende übersichtliche Form geben x1 v1 + x2 v2 + . . . + xn vn = b. (2.6) x1 x Wir nennen ein x = ..2 , für welches (2.4) bzw. (2.5) bzw. (2.6) gilt, eine Lösung . xn des linearen Gleichungssystems. Die linearen Gleichungssysteme, bei welchen auf der rechten Seite nur Nullen stehen, nennt man homogene lineare Gleichungssysteme. Das zugehörige homogene Gleichungssystem zu (2.4) ist also a11 x1 + a12 x2 + . . . + a1n xn = 0 a21 x1 + a22 x2 + . . . + a2n xn = 0 ................................ am1 x1 + am2 x2 + . . . + amn xn = 0 (2.7) oder in Matrix-Vektor-Form Ax = O, (2.8) 34 KAPITEL 2. LINEARE GLEICHUNGSSYSTEME oder x1 v1 + x2 v2 + . . . + xn vn = O, (2.9) 0 0 .. mit O = . . 0 Ein beliebiges (nicht von vornherein als homogen vorausgesetztes) lineares Gleichungssystem nennt man ein inhomogenes lineares Gleichungssystem. Bemerkung 2 Ein homogenes Gleichungssystem besitzt immer die Lösung x = O. Diese Lösung nennt man triviale Lösung. Die Fragen, die wir uns nun stellen, sind folgende: Wann ist ein lineares Gleichungssystem lösbar und wie sieht die Lösungsmenge aus? Die Beispiele aus Paragraph 2.1 zeigen, dass lineare Gleichungssysteme nicht immer eindeutig lösbar sind. Mit der allgemeinen Lösungstheorie linearer Gleichungssysteme werden wir uns in den nächsten Paragraphen befassen. An dieser Stelle halten wir noch folgendes fest: Satz 1 Man erhält alle Lösungen eines inhomogenen linearen Gleichungssystems, indem man zu einer speziellen Lösung dieses Gleichungssystems alle Lösungen des zugehörigen homogenen Systems addiert. In Formeln wird das folgendermaßen ausgedrückt: Wir bezeichnen mit L die Gesamtheit der Lösungen von (2.4) und mit L0 die Gesamtheit aller Lösungen des zugehörigen homogenen Systems. Ist dann x0 eine Lösung von (2.4), so gilt L = x 0 + L0 . Beweis: Nehmen wir an, dass (2.4) lösbar ist, und sei x0 = (x01 , x02 , . . . , x0n ) eine Lösung. Dann gilt für jede beliebige Lösung x = (x1 , x2 , . . . , xn ) von (2.4) und für x0 die Beziehung (2.6), d.h.: x1 v1 + x2 v2 + . . . + xn vn = b, x01 v1 + x02 v2 + . . . + x0n vn = b. Zieht man diese beiden Identitäten voneinander ab, so erhält man: (x1 − x01 ) v1 + (x2 − x02 ) v2 + . . . + (xn − x0n ) vn = O. Dies besagt aber, dass der Vektor x1 − x010 x −x y = x − x0 = 2 .. 2 . xn − x0n eine Lösung des zu (2.4) gehörigen homogenen Systems ist. Also ist jede Lösung x des Systems (2.4) von der behaupteten Gestalt x = x0 + y. (2.10) y1 y2 .. Ist umgekehrt y = eine beliebige Lösung des zugehörigen homogenen Systems, . yn so ist jedes x der Gestalt (2.10) eine Lösung von (2.6) (siehe Übungsaufgabe). Folgerung 1 Ein lösbares inhomogenes Gleichungssystem ist genau dann eindeutig lösbar, falls das zugehörige homogene System nur die triviale Lösung besitzt. 2.4. DIE GAUSS’SCHE ELIMINATIONSMETHODE 2.4 35 Die Gauß’sche Eliminationsmethode Die Gauß’sche Eliminationsmethode besteht darin, dass man ein Gleichungssystem durch geeignete Umformungen in ein äquivalentes, sogenanntes gestaffeltes System, überführt. Für dieses System kann dann die Frage nach der Existenz von Lösungen und der Struktur des Lösungsraumes beantwortet werden. Es werden folgende elementare Umformungen erlaubt: I Addition eines Vielfachen einer Gleichung zu einer anderen Gleichung II Vertauschung zweier Gleichungen Nun ist das gesamte System (2.4) durch die Angabe seiner sogenannten erweiterten Koeffizientenmatrix a11 a12 . . . a1n b1 a21 a22 . . . a2n b2 (2.11) C = .. . am1 am2 . . . amn bm bestimmt. Die Umformungen von Typ I und II spiegeln sich in entsprechende Umformungen der Zeilen von (2.11) wider. Um die Unbekannten xi nicht immer mitzuschleppen, betrachten wir daher allgemein elementare Zeilenumformungen von Matrizen. Der größeren Übersichtlichkeit halber und um unsere Ergebnisse bequemer aufschreiben zu können, lassen wir im folgenden gegebenenfalls auch noch Spaltenvertauschungen, welche die Spalte der bi nicht betreffen, als erlaubte Umformungen zu. Spaltenvertauschungen der Matrix (2.11), welche nicht die Spalte aus den bi betreffen, entsprechen einfach einer Umbenennung (Umnummerierung) der Unbekannten x1 , x2 , . . . , xn des Gleichungssystems (2.4). Durch mehrfache Anwendung geeigneter elementarer Zeilenumformungen sowie geeigneter Spaltenvertauschungen lässt sich die Matrix C in eine Matrix D der Gestalt . . . d1n b01 d11 d12 d13 . . . d1r 0 d22 d23 . . . d2r . . . d2n b02 0 . . . d3n b03 0 d33 . . . d3r . .. .. .. .. . . . . . . . . (2.12) D= . . . . drn b0r 0 0 . . . drr 0 b0r+1 .. O O . 0 bm bringen. Das Verfahren funktioniert folgendermaßen: Wir setzen voraus a11 6= 0. (Falls diese Bedingung nicht erfüllt ist, vertauschen wir die erste Zeile mit einer Zeile aus der Matrix C, für welche ai1 6= 0 ist. Falls dies nicht möglich ist, vertauschen wir die erste Zeile mit einer Zeile in der Matrix C, in der ein Element verschieden von Null existiert, 36 KAPITEL 2. LINEARE GLEICHUNGSSYSTEME und dann die erste Spalte mit einer Spalte aus der Matrix C, so dass schließlich in der erhaltenen Matrix das Element a11 6= 0 ist.) Um den Term ai1 in der Zeile i (i = 2, . . . , m) zu eliminieren, subtrahieren wir von der Zeile i ein Vielfaches der unveränderten Zeile 1 und erhalten für i = 2, . . . , m die Zeilen (ai2 − li1 a12 ) {z } | (ai1 − li1 a11 ) {z } | =a0i2 =0 ... (a − l a ) | in {zi1 1n} =a0in bi − li1 bi | {z } =b0i i1 Aus ai1 − li1 a11 = 0 folgt sofort li1 = aa11 , i = 2, . . . , m. Damit ist der erste Eliminationsschritt unter der Annahme a11 6= 0 ausführbar. Nach diesem ersten Schritt bleibt in den Zeilen 2 bis m und in den Spalten 2 bis n + 1 eine (m − 1, n)- Restmatrix“ stehen. ” Auf diese Matrix wenden wir nun die Eliminationsvorschrift erneut an. (Dabei werden beim Vertauschen von Zeilen und Spalten immer die ganzen Zeilen bzw. Spalten aus der (m, n + 1)-Matrix vertauscht und nicht nur die Zeilen und Spalten aus der Restmatrix!) Wir wiederholen diese Prozedur so lange, bis wir in der Restmatrix kein von Null verschiedenes aij mehr finden. Die Anzahl der durchgeführten Eliminationsschritten bezeichnen wir mit r − 1, wobei 0 ≤ r ≤ m, n. Mit Hilfe von Umformungen vom Typ I können wir dann in der Matrix (dij ) i=1,...,r j=1,...,r oberhalb der Diagonalen Nullen erzeugen. Lassen wir nun auch Umformungen vom Typ III Multiplikation einer Zeile mit einer Zahl, die nicht Null ist zu, so kann die Matrix D in die Form 1 0 0 .. . 0 1 0 .. . 0 0 1 .. . ... 0 ... 0 ... 0 .. . 0 D = 0 0 0 ... 1 O d01,r+1 . . . d01,n d02,r+1 . . . d02,n d03,r+1 . . . d03,n .. . b001 b002 b003 .. . d0r,r+1 . . . d0r,n b00r O b00r+1 .. . (2.13) b00m übergeführt werden. Es stellt sich nun die Frage nach dem Charakter der auftretenden Zahl r. Hängt diese allein von der Ausgangsmatrix C ab? Tritt also jedes mal die gleiche Zahl r auf, wenn man die vorgelegte Matrix C in verschiedener Weise durch elementare Zeilenumformungen und Spaltenvertauschungen in eine Matrix der Gestalt (2.13) transformiert? Die Antwort finden wir im folgenden Satz. Satz 2 Jeder Matrix A ∈ Rm×n kann man auf eindeutige Weise eine ganze Zahl 0 ≤ r ≤ m, n zuordnen, so dass sich diese Zahl bei elementaren Zeilenumformungen nicht ändert. Diese Zahl wird Rang der Matrix A genannt und ist genau die Zahl r, die in der transformierten Matrix der Gestalt (2.13) vorkommt. Wir schreiben r = Rang A. 2.5. LÖSUNGSTHEORIE LINEARER GLEICHUNGSSYSTEME 37 Der Matrix D0 entspricht nun - gegebenenfalls nach geeigneter Umnummerierung der Unbekannten - das zu (2.4) äquivalente System: x1 x2 x3 .. . xr + d01,r+1 xr+1 + . . . + d01,n xn + d02,r+1 xr+1 + . . . + d02,n xn + d03,r+1 xr+1 + . . . + d03,n xn .. .. . . 0 + dr,r+1 xr+1 + . . . + d0r,n xn 0 .. . 0 = = = b001 b002 b003 = b00r = b00r+1 .. . = (2.14) b00m Die Lösbarkeit dieses Systems können wir nun leichter untersuchen. Wir fangen dabei mit den homogenen Systemen an. 2.5 2.5.1 Lösungstheorie linearer Gleichungssysteme Lösungstheorie homogener linearer Gleichungssysteme Wir untersuchen also das System (2.7). Durch elementare Zeilenumformungen vom Typ I, II und III sowie Spaltenvertauschungen in der Matrix des Systems, erhalten wir das äquivalente System der Form (2.14), wobei nun alle b00i gleich Null sind. Dann kann man aber die letzten m − r trivialen Gleichungen 0 = 0 einfach weglassen, so dass wir auf folgende Gestalt kommen: x1 x2 x3 .. . xr + d01,r+1 xr+1 + . . . + d01,n xn + d02,r+1 xr+1 + . . . + d02,n xn + d03,r+1 xr+1 + . . . + d03,n xn .. .. . . 0 + dr,r+1 xr+1 + . . . + d0r,n xn = 0 = 0 = 0 (2.15) = 0 Satz 3 Ist r = n, so ist x = O die einzige Lösung von (2.15) und damit auch von (2.7). Ist r < n, so kann man aus (2.15) folgendes erkennen: Wählt man beliebige Zahlen xr+1 = t1 , xr+2 = t2 , . . . , xn = tn−r und bestimmt x1 , x2 , . . . , xr aus (2.15) durch xi = −d0i,r+1 t1 − . . . − d0i,n tn−r , für i = 1, 2, . . . , r, so ist x1 x2 .. . x = xr xr+1 . .. xn = −d01,r+1 t1 − . . . − d01,n tn−r −d02,r+1 t1 − . . . − d02,n tn−r .. . 0 −dr,r+1 t1 − . . . − d0r,n tn−r t1 .. . tn−r (2.16) 38 KAPITEL 2. LINEARE GLEICHUNGSSYSTEME eine Lösung von (2.15). Um die Gestalt der Lösungen von (2.7) noch etwas übersichtlicher darzustellen, schreiben wir die Formel (2.16) folgendermaßen um: Seien −d01,r+1 −d01,r+2 −d01,n −d0 −d0 −d0 2,r+1 2,r+2 .2,n . . .. .. .. 0 0 −d −d −d0 r,r+1 r,r+2 r,n l1 = , l2 = , . . . , ln−r = 0 . 1 0 0 0 1 0 0 0 .. .. .. . . . 0 0 1 Dann ist (2.16) äquivalent zu: x = t1 l1 + t2 l2 + . . . + tn−r ln−r , (2.17) wobei t1 , . . . , tn−r beliebige reelle Zahlen sind. Wir haben also folgende Charakterisierung des Lösungsraumes von (2.7) erhalten. Satz 4 Ist r < n, so gibt es Elemente l1 , l2 , . . . , ln−r aus L0 mit der Eigenschaft, dass sich jede beliebige Lösung x aus L0 in der Form (2.17) ausdrücken lässt. Umgekehrt ist für beliebige Zahlen t1 , t2 , . . . , tn−r jeder Ausdruck der Gestalt (2.17) eine Lösung von (2.14). Ein derartiges System l1 , l2 , . . . , ln−r von Elementen von L0 heißt Basis von L0 . Beispiel 13 Vorgelegt sei x1 −x1 2x1 x1 das homogene lineare Gleichungssystem: + − + + 2x2 2x2 4x2 2x2 + x3 − 2x3 + 3x3 + 2x3 + x4 + x5 + 2x4 + x5 − x4 − 2x4 − x5 = = = = 0 0 0 0 von m = 4 Gleichungen in n = 5 Unbekannten. Seine Koeffizientenmatrix transformieren wir mittels elementarer Umformungen wie folgt: 1 2 1 1 1 1 2 1 1 1 −1 −2 −2 3 2 2 1 → 0 0 −1 → 0 0 2 1 −3 −2 4 3 −1 0 1 2 2 −2 −1 0 0 1 −3 −2 2 1 1 1 1 1 1 2 1 1 0 −1 0 0 3 2 3 2 → → 0 −1 → 0 0 1 0 −3 −2 0 0 0 0 0 1 0 −3 −2 0 0 0 0 0 1 0 2 4 3 1 0 2 4 3 0 3 2 → 0 1 0 −3 −2 → 0 −1 O O O O In diesem Fall ist r = 2, also r < n. Die Lösungsmenge L0 besitzt also auch nichttriviale Lösungen. Diese können mithilfe der Basis {l1 , l2 , l3 } dargestellt werden. Beim Bestimmen 2.5. LÖSUNGSTHEORIE LINEARER GLEICHUNGSSYSTEME 39 der Basisvektoren müssen wir nun berücksichtigen, dass wir bei den Umformungen im zweiten Schritt eine Spaltenvertauschung vorgenommen haben. Man erhält also −2 1 l1 = 0 , 0 0 −4 0 l2 = 3 , 1 0 −3 0 l3 = 2 . 0 1 Die Lösungen haben also die Form: −3 −4 −2 x1 0 0 1 x2 = t1 0 + t2 3 + t3 2 , t1 , t2 , t3 ∈ R. x x= 3 0 1 0 x4 1 0 0 x5 2.5.2 Lösungstheorie inhomogener linearer Gleichungssysteme Um das allgemeine System (2.4) zu lösen, bringen wir es durch elementare Zeilenumformungen vom Typ I, II und III und eventuell auch Spaltenvertauschungen auf die Gestalt (2.14). Das System (2.14) ist also genau dann lösbar, wenn b00r+1 = b00r+2 = . . . = b00m = 0. Ist das der Fall, so sieht man, dass speziell 0 x = b001 b002 .. . b00r 0 0 .. . 0 (2.18) eine Lösung von (2.14) ist. Gemäß Satz 1 ist dann die Menge L aller Lösungen von (2.14) gegeben durch L = x 0 + L0 , wobei L0 die Lösungsmenge des zugehörigen homogenen Systems ist. Satz 5 Das inhomogene Gleichungssystem (2.4) sei lösbar, und es sei x0 gegeben durch (2.18) eine spezielle Lösung. Ist dann {l1 , l2 , . . . , ln−r } eine Basis des Lösungsraumes L0 , so lässt sich jede Lösung von (2.4) eindeutig darstellen in der Form x = x0 + t1 l1 + t2 l2 + . . . + tn−r ln−r , wobei t1 , t2 , . . . , tn−r ∈ R. Umgekehrt ist jeder solche Ausdruck eine Lösung von (2.4). 40 KAPITEL 2. LINEARE GLEICHUNGSSYSTEME Folgerung 2 (Lösbarkeitskriterien) Es gelten: (a) Ist r = m, so ist (2.4) stets lösbar. (b) Ist r = m = n, so ist (2.4) eindeutig lösbar. Beispiel 14 Gegeben sei das Gleichungssystem x1 + 3x2 + 3x1 + 9x2 + 2x2 + 2x1 + 8x2 + Elementare 1 3 0 2 5x3 10x3 7x3 12x3 = = = = 1 0 3 1 Zeilenumformungen in der erweiterten Koeffizientenmatrix ergeben 1 1 1 1 3 5 1 3 5 3 5 0 0 −5 0 2 0 −3 −1 2 9 10 → → 0 2 0 2 3 3 3 7 7 2 7 1 −1 −3 0 2 2 0 0 −5 8 12 1 0 → 0 0 3 5 2 2 0 5 0 −5 1 3 1 0 2 −1 → 0 0 4 −3 0 0 5 2 5 0 1 −1 . 4 1 Wir haben also r = n = 3, das System ist aber nicht lösbar, denn die letzte Gleichung lautet 0 = 1. Bemerkung 3 Da r = n, folgt aus Satz 3, dass das zugehörige homogene Gleichungssystem eindeutig lösbar ist. Trotzdem ist das inhomogene System nicht lösbar! 2.6. CRAMER’SCHE REGEL 2.6 2.6.1 41 Lösen von linearen Gleichungssystemen mit der Cramer’schen Regel Determinante einer Matrix In der Folgerung 2 haben wir schon gesehen, dass man mithilfe des Ranges der Koeffizientenmatrix eines linearen Gleichungssystems Aussagen über die Lösbarkeit des Systems machen kann. Insbesondere gilt für quadratische Gleichungssysteme von n Gleichungen mit n Unbekannten folgender Satz 6 Ein lineares Gleichungssystem mit m = n ist genau dann eindeutig lösbar, wenn r = m = n gilt. Frage: Wann ist für ein quadratisches Gleichungssystem m = n = r? Beispiel 15 (Lineares Gleichungssystem in zwei Dimensionen) a11 x1 + a12 x2 = b1 a21 x1 + a22 x2 = b2 In den Übungen wurde gezeigt, dass das zugehörige homogene System genau dann nur die triviale Lösung besitzt, falls a11 a22 − a21 a12 6= 0 a11 a12 = 2, denn die Matrix läßt sich mittels ist. Ist das der Fall, so ist Rang a21 a22 elementarer Umformungen transformieren zu −→ a11 a12 a11 a12 0 a22 − a12 aa21 a21 a22 − aa21 · Z1 + Z2 11 11 a11 a12 0 a11 a22 − a12 a21 . | {z } −→ a11 · Z2 6=0 a11 a12 = 2, so folgt, dass a11 a22 − a12 a21 6= a21 a22 0. Wir haben also eine Größe gefunden, die genau dann nicht Null ist, wenn a11 a12 r = Rang = 2 = n. a21 a22 Umgekehrt lässt sich zeigen: Falls Rang Wir bezeichnen det A = det a11 a12 a21 a22 a a = 11 12 a21 a22 := a11 a22 − a12 a21 und nennen det A die Determinante von A. Eine andere wichtige Eigenschaft der Determinante ist folgende: Die Lösung des Systems lässt sich (im Falle detA 6= 0) angeben 42 KAPITEL 2. LINEARE GLEICHUNGSSYSTEME als x = x1 x2 mit: b1 det b2 x1 = a11 det a21 a11 det a21 x2 = a11 det a21 a12 a22 a12 a22 b1 b2 . a12 a22 (2.19) Unser Ziel ist es nun, für beliebiges n jeder quadratischen Matrix A ∈ Rn×n eine Determinante mit den obigen Eigenschaften zuzuordnen. Definition Sei A = (aij ) i=1,...,n . Sei Aij die Teilmatrix von A, welche aus A durch Streichen der Zeile j=1,...,n i und Spalte j erhalten wird. Definiere nun die Determinante von A durch: det A = = n X j=1 n X aij (−1)i+j det (Aij ) Entwicklung nach der i − ten Zeile aij (−1)i+j det (Aij ) Entwicklung nach der j − ten Spalte i=1 Das Element (−1)i+j det (Aij ) wird Minor zu aij genannt. Das bedeutet, dass man die Determinante einer Matrix dadurch berechnen kann, dass man für alle Elemente einer Zeile (Spalte) die Elemente mit ihren Minoren multipliziert und diese Produkte aufsummiert. Das lässt sich am besten anwenden, wenn in der entsprechenden Zeile (Spalte) schon viele Nullen stehen! Beispiel 16 Gegeben sei die Matrix: a11 a12 a13 A = a21 a22 a23 . a31 a32 a33 Um det A zu berechnen, entwickeln wir nach der ersten Zeile: a11 a12 a13 det a21 a22 a23 = a31 a32 a33 a22 a23 a21 a23 a21 a22 1+1 1+2 1+3 (−1) a11 det +(−1) a12 det +(−1) a13 det = a32 a33 a31 a33 a31 a32 a11 a22 a33 + a12 a23 a31 + a13 a21 a32 − a11 a23 a32 − a12 a21 a33 − a13 a22 a31 . 2.6. CRAMER’SCHE REGEL 43 Wir bemerken, dass man den letzten Ausdruck mit folgender Regel erhält: Wir schreiben unter die Matrix noch einmal die erste und die zweite Zeile. Danach addieren wir die Produkte mit den in Abb.2.3 angezeigten Vorzeichen auf. Diese Regel nennt man SarrusRegel. Sie gilt nur für 3 × 3 Matrizen! a11 a21 a − − − 31 a 12 a13 a22 a23 a a 32 33 a11 a 12 a 13 + a21 a22 a 23 + + Abbildung 2.3: Die Sarrus-Regel Rechenregeln für Determinanten • Die Determinante ist linear in jeder Komponente, d.h. det(v1 , . . . , αvj + βwj , . . . , vn ) = αdet(v1 , . . . , vj , . . . , vn ) + βdet(v1 , . . . , wj , . . . , vn ) • Die Determinante ändert ihren Wert nicht, wenn das Vielfache einer Zeile (Spalte) zu einer anderen Zeile (Spalte) addiert wird, d.h. det(v1 , . . . , vj , . . . , vk , . . . , vn ) = det(v1 , . . . , vj , . . . , αvj + vk , . . . , vn ) • Die Determinante ändert ihr Vorzeichen, wenn zwei Zeilen oder zwei Spalten vertauscht werden, d.h. det(v1 , . . . , vj , . . . , vk , . . . , vn ) = −det(v1 , . . . , vk , . . . , vj , . . . , vn ) 2.6.2 Die Cramer’sche Regel zur Lösung von quadratischen linearen Gleichungssystemen Sei A = (aij ) i=1,...,n . Wir definieren die adjunkte Matrix A = (aij ) i=1,...,n durch j=1,...,n j=1,...,n aij = (−1)i+j det (Aji ). Mithilfe der adjunkten Matrix können wir nun die Inverse von A konstruieren, denn es gilt folgender Satz: 44 KAPITEL 2. LINEARE GLEICHUNGSSYSTEME Satz 7 Sei A die adjunkte Matrix zu A. Dann gilt: 1 0 ... 0 0 1 ... 0 A · A = A · A = detA .. .. . . 0 0 ... 1 (2.20) Folgerung 3 Ein lineares Gleichungssystem Ax = b mit m = n ist genau dann eindeutig lösbar, falls detA 6= 0. Ist dieses der Fall, dann ist A die Inverse von A und die det A eindeutige Lösung des Gleichungssystems ist gegeben durch x= Ab . det A Beweis 1 Die erste Aussage beweisen wir nicht. Dies würde Kenntnisse über die Theorie der Vektorräume voraussetzen, die wir im Rahmen dieser Vorlesung nicht durchgenommen haben. Unter der Annahme, dass detA 6= 0, gehen wir nun folgendermaßen vor: Wir multiplizieren (2.20) mit 1 und erhalten det A 1 0 ... 0 0 1 ... 0 1 1 A = A · A = .. A· ... det A det A . 0 0 ... 1 d.h. 1 A. det A Nun multiplizieren wir das System Ax = b mit A−1 und erhalten A−1 = A−1 · (Ax) = A−1 · b −1 −1 (A | {z· A})x = A · b I x = A−1 b = 1 Ab. det A (2.21) Die Cramer’sche Regel Bezeichnen wir nun die ! Spalten von A mit v1 , . . . , vn und den Spaltenvektor der rechten b1 .. Seiten mit b = , so ergibt sich aus (2.21) folgende Formel für die Berechnung des . bn ! x1 . .. Lösungsvektors x = : xn n xj 1 X 1 (Ab)j = ajk bk = det A det A k=1 = det (v1 , v2 , . . . , vj−1 , b, vj+1 , . . . , vn ) , j = 1, . . . , n. det A 2.7. EIGENWERTE UND EIGENVEKTOREN 45 Bemerkung 4 Diese Formel haben wir für 2 × 2 Gleichungssysteme auf gewöhnlichem Rechenweg erhalten, siehe (2.19). Beispiel 17 Wir betrachten folgendes 3x1 + 2x1 − x1 + Gleichungssystem: 2x2 − x3 = 18 5x2 − 7x3 = −5 4x2 + x3 = 2 3 2 −1 det 2 −5 −7 = −15 − 14 − 8 − 5 + 84 − 4 = 84 − 46 = 38 1 4 1 Durch Verwenden der Cramer’schen Regel erhalten wir: 18 2 −1 −5 −5 −7 2 4 1 1 406 = (18 · 23 + 5 · 6 − 2 · 19) = x1 = 38 38 38 3 18 −1 2 −5 −7 1 2 1 144 x2 = =− 38 38 3 2 18 2 −5 −5 1 4 2 246 = x3 = 38 38 2.7 Eigenwerte und Eigenvektoren Beispiel 18 (Populationsdynamik) Bei der Beschreibung von Populationen ist es oft notwendig, deren Altersstruktur zu berücksichtigen: sowohl die Geburten- als auch die Sterberaten sind altersabhängig. Die Altersstruktur kann durch eine Einteilung in Altersklassen modelliert werden: [0, ∆t[, [∆t, 2∆t[, ..., [m∆t, (m + 1)∆t[. Wir wählen die Zeiteinheiten so, dass ∆t = 1 ist, und haben die Altersklassen [0, 1[, [1, 2[, ..., [m, m + 1[. Die Entwicklung wird in den gleichen Zeitabständen verfolgt, nach denen auch die Altersklassen gebildet sind, also zu den Zeiten tj = j · ∆t = j (da ∆t = 1 angenommen). Für j = 0, . . . , m bezeichnet xnj = die Anzahl der Individuen der Altersklasse j zum Zeitpunkt n. 46 KAPITEL 2. LINEARE GLEICHUNGSSYSTEME Der Vektor x = xn0 xn1 .. . xnm = (xn0 , xn1 , . . . , xnm )T beschreibt die Altersstruktur der Population zum Zeitpunkt n. Die Population entwickelt sich wie folgt: Von den Individuen xnj im Alter j zum Zeitpunkt n wird ein Anteil Pj · xnj im nächsten Zeitpunkt n + 1 in der Altersklasse j + 1 sein. Pj ∈ [0, 1], j = 0, 1, . . . , m, heißt Überlebensfaktor oder Vitalitätskoeffizient der Altersklasse j. Dabei nehmen wir an, dass Pm = 0, d.h. die Individuen überleben die Klasse m nicht. Dann ist also n xn+1 j+1 = Pj · xj , j = 0, 1, . . . , m − 1 Um xn+1 zu bestimmen, müssen wir die Geburten im Zeitraum [n, n + 1[ berücksichtigen. 0 Es sei Fj ≥ 0, j = 0, . . . , m, die Anzahl der Nachkommen eines Individuums vom Alter j im Zeitraum [n, n + 1[, die mindestens bis zum Zeitpunkt n + 1 überleben. (Fj hängt also nicht von n ab und bleibt für jedes Zeitintervall ∆t = 1 unverändert). In die Altersklasse 0 gehören also zum Zeitpunkt n + 1 xn+1 = F0 xn0 + F1 xn1 + . . . + Fm xnm 0 Individuen. Aus diesen Annahmen ergibt sich für den Übergang von einer Generation zur nächsten folgendes System von linearen Rekursionsgleichungen: xn+1 0 xn+1 1 xn+1 2 ... n+1 xm oder mithilfe von Matrizen n+1 x0 xn+1 1n+1 x2 n+1 x = .. . . .. xn+1 m = F0 xn0 + F1 xn1 + . . . + Fm xnm = P0 xn0 = P1 xn1 = Pm−1 xnm−1 , = F0 F1 F2 . . . P0 0 0 . . . 0 P1 0 . . . .. .. . . . . . ... 0 0 0 . . . Pm−1 Fm 0 0 0 xn0 xn1 xn2 .. . .. . xnm oder kurz xn+1 = Lxn . L heißt Leslie-Matrix und das ganze Modell heißt Leslie-Modell nach P.H. Leslie (1945). Wenn wir nun die Anfangspopulation x0 kennen, so können wir die Anzahl der Individuen und die Altersstruktur zum Zeitpunkt n berechnen durch xn = Lxn−1 = L(Lxn−2 ) = . . . = Ln x0 . 2.7. EIGENWERTE UND EIGENVEKTOREN 47 Wir sind nun an folgender Frage interessiert: Gibt es Altersverteilungen, die im Laufe der Zeit konstant bleiben? Konstante Altersverteilung bedeutet, dass für alle j gilt xn+1 xnj j Pm n+1 = Pm n , j=0 xj j=0 xj für alle n, Pm n+1 j=0 xj = Pm n xnj , j=0 xj für alle n. d.h. xn+1 j Eine solche Altersverteilung existiert, falls es eine Zahl λ ∈ R, λ > 0 gibt, mit Pm n+1 xj Pj=0 =λ m n j=0 xj und entsprechend xn+1 = λ xnj , j = 0, . . . , m, j oder xn+1 = λ xn gilt. Die Entwicklung einer Population mit konstanter Altersverteilung dann durch die Gleichung Lxn = λ xn (2.22) beschrieben. Um die Struktur dieser Population zu finden, müssen wir nun das System (2.22) lösen. Zunächst schreiben wir es mithilfe der Regeln der Matrizenrechnung folgendermaßen um: Lxn = λ xn Lxn − λ xn = O Lxn − λIxn = O (L − λI) xn = O (2.23) Definition Sei A ∈ Rn×n eine Matrix. Eine Zahl λ, für welche es ein x ∈ Rn , x 6= O, gibt mit der Eigenschaft, dass (A − λI) x = O, (2.24) heißt Eigenwert der Matrix A. x ist dann ein zum Eigenwert λ gehöriger Eigenvektor. Bemerkung 5 Ein Eigenvektor ist immer nur bis auf eine multiplikative Konstante bestimmt, d.h. ist x ein Eigenvektor zum Eigenwert λ, so ist auch cx ein Eigenvektor zum Eigenwert λ, für alle c 6= 0. Eigenwerte und Eigenvektoren existieren genau dann, wenn das System (2.24) nichttriviale Lösungen besitzt. Dieses System ist ein lineares homogenes Gleichungssystem mit 48 KAPITEL 2. LINEARE GLEICHUNGSSYSTEME n Gleichungen und n Unbekannten. Ein solches System besitzt nach Folgerung 3 genau dann nichttriviale Lösungen, wenn det(A − λI) = 0. (2.25) Die Gleichung (2.25) heißt charakteristische Gleichung. Ihre linke Seite ist ein Polynom n−ten Grades. Dieses heißt charakteristisches Polynom von A. Die Eigenwerte sind also die Nullstellen des charakteristischen Polynoms. Daher gibt es höchstens n verschiedene Eigenwerte, von denen manche komplex sein können! Hat man einen Eigenwert λ gefunden, so erhält man alle Eigenvektoren zu λ durch Auflösen des homogenen linearen Gleichungssystems (A − λI) x = 0. Wir können nun zu unserem Beispiel zurückkehren und die Antwort auf die Frage nach konstanten Altersverteilungen folgendermaßen geben: Eine konstante Alterverteilung entspricht einem Eigenvektor der Leslie-Matrix L und existiert, falls ein positiver Eigenwert λ der Matrix L existiert. In den Übungen wird ein Zahlenbeispiel zu diesem Modell behandelt. Weitere Anwendungen zu Eigenwerten und Eigenvektoren von Matrizen werden wir im nächsten Kapitel über gewöhnliche Differentialgleichungen antreffen. Kapitel 3 Gewöhnliche Differentialgleichungen und kontinuierliche, räumlich homogene Prozesse 3.1 Wachstumsraten Im folgenden werden wir den Begriff der Wachstumsrate (Reaktionsrate, Zufallsrate) oder allgemein der Änderungsrate anhand von Beispielen erläutern. Beispiel 19 (Wachstum einer Zelle) Eine Zelle habe zum Zeitpunkt t = 0 die Masse m0 . In einer idealen Umgebung wächst die Zelle. Ihre Masse ist also eine Funktion der Zeit, und wir können schreiben m = m(t) m = m0 , zur Zeit t = 0. Es seien nun 0 < t1 < t2 zwei verschiedene Zeitmomente. Dann sind m(t1 ), m(t2 ) die entsprechenden Massen. Die Differenz ∆m = m(t2 ) − m(t1 ) ist die totale Änderung der Masse im Zeitintervall von t1 nach t2 . Um entscheiden zu können, wie stark sich die Masse im entsprechenden Zeitintervall verändert hat, müssen wir die Länge des Intervalls ∆t = t2 − t1 berücksichtigen. Das Verhältnis m(t2 ) − m(t1 ) ∆m = ∆t t2 − t1 (3.1) gibt an, um wieviel sich die Masse bezogen auf die Zeit geändert hat. Genauer ausgedrückt ist es die mittlere Änderung der Masse pro Zeiteinheit im Zeitintervall von t1 nach t2 . Diese Größe wird mittlere Änderungsrate oder im Falle unseres Beispiels mittlere Wachstumsrate genannt. 49 50 KAPITEL 3. KONTINUIERLICHE PROZESSE Es ist jedoch nicht immer befriedigend, nur die mittlere Änderungsrate einer Funktion zu betrachten. Man hätte gern einen Begriff, der die aktuelle“ Änderungsrate beschreibt. ” Zu diesem Zweck müssen wir das Zeitintervall zu einem Punkt verkleinern. Dazu lassen wir x1 fest und x2 gegen x1 streben. Wir erhalten m(t2 ) − m(t1 ) dm (t1 ) = m0 (t1 ) = lim . t2 →t1 dt t2 − t1 (3.2) m0 (t1 ) ist die momentane Änderungsrate oder in unserem Beispiel die momentane Wachstumsrate von m zur Zeit t1 . Gemäß Paragraph 1.3.1 ist die momentane Änderungsrate zur Zeit t = t1 genau die Ableitung der Funktion m an der Stelle t = t1 . Haben wir nun zu einem Zeitpunkt t die momentane Wachstumsrate gegeben, so können wir uns fragen, ob die Wachstumsrate groß oder klein ist. Die Antwort hängt sehr stark von der gegenwärtigen Masse m(t) der Zelle ab. Den Quotienten m0 (t) m(t) nennen wir spezifische oder relative Wachstumsrate. Um eine Vorstellung von der spezifischen Wachstumsrate zu bekommen, betrachten wir folgendes Beispiel: Eine momentane Wachstumsrate von m0 (t) = 0, 5 g/h wäre für eine Pflanze mit einer Masse von m(t) = 10 g gewaltig. 0, 5 m0 (t) = = 0, 5 · 10−1 [h−1 ]. m(t) 10 Für einen Baum mit einer Masse von m(t) = 1000 kg hingegen wäre eine solche Wachstumsrate winzig 0, 5 m0 (t) = = 0, 5 · 10−6 [h−1 ]. m(t) 1000 · 103 Beispiel 20 (Reaktionsrate) Beim Stoffwechsel interessieren wir uns für die Geschwindigkeit einer chemischen Reaktion. M (t) sei die Menge eines Nährstoffs als Funktion der Zeit. Wir setzen voraus, dass sich der Nährstoff chemisch zersetzt und M somit abnimmt. Der Quotient ∆M M (t2 ) − M (t1 ) = ∆t t2 − t1 wird als mittlere Reaktionsrate im Zeitintervall von t1 bis t2 bezeichnet. Unter unseren Voraussetzungen ist ∆M negativ. ∆t Beispiel 21 (Zerfallsrate) Sei N (t) die Anzahl radioaktiver Atome in einer Probe zur Zeit t, dann ist ∆N N (t2 ) − N (t1 ) = ∆t t2 − t1 die mittlere Zerfallsrate im Zeitintervall von t1 nach t2 . 3.2. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN. GRUNDBEGRIFFE 51 Bemerkung 6 Für das Beispiel aus der Kernphysik scheint es anfangs unmöglich, eine momentane Zufallsrate zu definieren, da die Kernspaltung spontan und nicht kontinuierlich verläuft. Jedoch ist die Anzahl radioaktiver Atome in einer Probe im allgemeinen so groß, dass wir den Graphen des unstetigen Zerfalls durch eine glatte“ Kurve gut appro” ximieren können. Bemerkung 7 Die Bedeutung der Änderungsrate in der Biologie liegt darin, dass man die Änderungsrate einer gesuchten Größe mit der Größe selbst in Beziehung setzen kann und dadurch Gesetze erhält, die die Berechnung der gesuchten Größe ermöglichen. 3.2 Gewöhnliche Differentialgleichungen. Grundbegriffe Beginnen wir wieder mit dem Beispiel 19. Wir nehmen an, dass das Wachstum der Zelle nur durch die Geschwindigkeit des inneren Stoffwechsels bestimmt wird. Da die Masse der Endprodukte des Stoffwechsels von der Masse der beteiligten Moleküle abhängt, ist zu erwarten, dass die Wachstumsrate proportional zur Masse in jedem Zeitpunkt ist, d.h. dm = am dt (3.3) mit einer gewissen positiven Konstante a. Wir haben also eine Gleichung erhalten, welche neben der unbekannten Funktion auch deren Ableitung enthält. Eine derartige Gleichung nennt man eine Differentialgleichung. Das Problem besteht nun darin, eine geeignete Funktion zu finden, welche die Differentialgleichung erfüllt. Eine solche Funktion heißt Lösung der Differentialgleichung. Graphische Konstruktion einer Lösung. Richtungsfelder Betrachten wir die Gleichung y 0 = y − t3 . (3.4) In jedem Punkt (t, y) ∈ R2 ist durch (3.4) eine Steigung y 0 definiert. Folglich können wir in jedem Punkt (t, y) eine Gerade mit der Steigung y 0 = y − t3 zeichnen. Auf diese Weise erhalten wir ein Gebiet der Ebene voller Steigungen oder Richtungen. Ein solches Gebiet nennen wir Richtungsfeld. Abb. 3.1 zeigt das Richtungsfeld der Gleichung (3.4). Für (t, y) = (0, 0) erhalten wir y 0 = 0 (t, y) = (0, 1) ist die Steigung y 0 = 1 − 0 = 1 (t, y) = (1.5, 1) ist die Steigung y 0 = 1 − 1.53 = −2.375. Zeichnen wir nun ausgehend von einem Punkt (t0 , y0 ) die Kurve deren Steigung in jedem Punkt durch das Richtunsfeld gegeben ist, so heißt diese Kurve Integralkurve oder Stromlinie der Differentialgleichung. Wird eine Stromlinie durch die Funktion y = y(t) dargestellt, so gilt y 0 (t) = y(t) − t3 , 52 KAPITEL 3. KONTINUIERLICHE PROZESSE Abbildung 3.1: Das Richtungsfeld für die Gleichung y 0 = y − t3 . woraus folgt, dass die Stromlinie eine Lösung der Differentialgleichung ist. Somit haben wir auf graphischem Wege eine Lösung erhalten. In den nächsten Paragraphen werden wir für spezielle Typen von gewöhnlichen Differentialgleichungen, explizite, analytische Lösungen berechnen. 3.3 Differentialgleichungen der Form y 0 = ay + b Die homogene Gleichung y 0 = ay Eine Differentialgleichung dieser Art haben wir bei der Beschreibung des Wachstumsprozesses einer Zelle, siehe (3.3), schon angetroffen. Weitere Beispiele werden wir im Folgenden noch behandeln. Zuerst wollen wir aber eine Lösungsmethode für diese Gleichung lernen, welche auch in vielen anderen Situationen sehr nützlich ist. Diese Methode heißt Separation der Variablen und beruht darauf, dass wir die Gleichung so umformen, dass 3.3. DIFFERENTIALGLEICHUNGEN DER FORM Y 0 = AY + B 53 auf der linken Seite nur die Variable y, auf der rechten Seite nur die Variable t erscheint. dy = ay. dt (3.5) Die Multiplikation der Gleichung mit dt ergibt dy = ay dt. Nach Division durch y wird die Gleichung zu dy = a dt y (y 6= 0). Jetzt sind die Variablen separiert. Integration ergibt Z Z dy = a dt, y oder ln |y| = at + c. Auf diese Gleichung wenden wir nun die Exponentialfunktion an: |y| = eat+c = eat · ec = C · eat . Ist C ∈ R eine beliebige Konstante können wir die Betragsstriche weglassen und erhalten als allgemeine Lösung der Gleichung (3.5) y(t) = C · eat , C ∈ R. Wenn der Wert der Lösung zum Zeitpunkt t = 0 gegeben ist, y(0) = y0 , dann können wir die Konstante C so bestimmen, dass die Lösung diese Anfangsbedingung erfüllt y0 = y(0) = C · ea·0 = C. Die Lösung zum Anfangswert y0 ist also y(t) = y0 · eat . Für y0 = 5 und a = 1, 5, a = −1, 5 sind die Lösungen y(t) = 5e1,5t , y(t) = 5e−1,5t (3.6) in der Abbildung 3.2 dargestellt. Das Verhalten der Lösung hängt vom Vorzeichen von a ab. Für a > 0 erhalten wir ein normales (d.h. positives) Wachstum. Für a < 0 ergibt sich ein negatives“ Wachstum (Abnahme, Zerfall). ” Kommen wir nun zurück zu dem Beispiel des Zellenwachstums, so hat also die Gleichung (3.3) zum Anfangswert m0 die Lösung m(t) = m0 · eat . 54 KAPITEL 3. KONTINUIERLICHE PROZESSE Abbildung 3.2: Die Lösungen y(t) = 5e1,5t und y(t) = 5e−1,5t aus (3.6). Beispiel 22 (Radioaktiver Zerfall) Nehmen wir an, eine Substanz enthalte eine bestimmte Sorte radioaktiver Atome. Die einfachste Annahme für den Zerfall besagt, dass es keine bevorzugte Zeit für den Zerfall gibt und dass die Atome die gleiche Zerfallswahrscheinlichkeit besitzen, und zwar unabhängig voneinander. Das heißt also, dass wir doppelt so viele Szintillationen (spontane Zerfälle) pro Zeiteinheit erwarten können, wenn wir doppelt so viele Atome zur Verfügung stellen. Deshalb können wir annehmen, dass die Zerfallsrate zur Anzahl N radioaktiver Atome proportional ist, d.h. wir erhalten folgende Gleichung dN = −λN, dt (3.7) mit einer gewissen positiven Konstante λ, Zerfallskonstante genannt. Da λ nach Definition positiv ist und dN negativ sein muss, schreibt man in (3.7) ein Minuszeichen. Die dt Lösung der Gleichung zum Anfangswert N0 ist gegeben durch N (t) = N0 · e−λt . 3.3. DIFFERENTIALGLEICHUNGEN DER FORM Y 0 = AY + B 55 Die inhomogene Gleichung y 0 = ay + b Wir lösen wieder durch Separation der Variablen dy = ay + b dt dy b = a y+ dt a dy = a dt y + ab Integration ergibt Z dy = a dt y + ab b ln y + = at + c a Z y+ b = C · eat a y = Ceat − b a Für einen gegebenen Anfangswert y(0) = y0 erhalten wir die Lösung: b b y(t) = y0 + eat − a a (3.8) Beispiel 23 (Beschränktes Wachstum) Kein Organismus und keine Population wächst unbeschränkt, so wie es z.B. die Lösung der Gleichung (3.5) für a > 1 tut. Futterknappheit, Raumnot oder irgendwelche Kontrollmechanismen setzen dem Wachstum Grenzen. Nehmen wir an, es existiert eine feste obere Grenze für die Größe y eines Individuums, einer Population o.ä. Wir bezeichnen diese obere Grenze mit B. Dann nähert sich, mit gegen fortschreitender Zeit, die Größe y dem Wert B. Dabei strebt die Wachstumsrate dy dt Null, während B − y kleiner und kleiner wird. Ein plausibles mathematisches Modell dafür ist durch folgende Differentialgleichung gegeben y 0 = k(B − y). (3.9) Die Wachstumsrate ist also proportional zur Differenz B − y, mit einer festgelegten positiven Konstanten k. Die Gleichung (3.9) kann man in die Form y 0 = −ky + kB (3.10) schreiben und hat laut (3.8) die Lösung y(t) = (y0 − B)e−kt + B. (3.11) Als konkretes Beispiel für ein beschränktes Wachstum betrachten wir folgende Anwendung aus der Elektrophyiologie. 56 KAPITEL 3. KONTINUIERLICHE PROZESSE Abbildung 3.3: Die Lösung der Gleichung y 0 = 0.6(5 − y) zum Anfangswert y(0) = 0. 3.3.1 Die Elektrische Aufladung einer Zellmembran. (Prof. Dr. Stephan Frings, IZ) Injiziert man einen Strom I in eine Zelle, ändert sich das Membranpotential V von Null auf den Wert V = I · R, wobei R = der elektrische Widerstand der Zellmembran ist. Diese Änderung geschieht nicht sofort sondern mit einer Verzögerung, die durch die Membrankapazität bestimmt ist. Die Änderungsrate V 0 (t) für das Membranpotential ist proportional zu I · R − V (t), mit einer Proportionalitätskonstanten τ1m , mit τm = Cm · Rm . Hierbei ist Cm die spezifische Membrankapazität (typischer Wert Cm = 1µF cm−2 ) und Rm der spezifische Widerstand der Membran (typischer Wert Rm = 1000 Ωcm2 ). Der Widerstand der Zellmembran R ist gegeben durch R = Rm /A, wobei A die Fläche der Zellmembran ist. (Der Index m kommt von Membran.) 3.4. SYSTEME VON LINEAREN DIFFERENTIALGLEICHUNGEN 57 Die elektrische Aufladung der Zellmembran kann also mithilfe folgender Differentialgleichung beschrieben werden 1 dV = (IR − V ). (3.12) dt τm Der Zeitverlauf des Membranpotentials für V (0) = 0 ist, gemäß (3.11), gegeben durch − τt m V (t) = IR 1 − e . (3.13) Bemerkung 8 Die Zeitkonstante τm ist ein zentraler Parameter bei der Funktion neuronaler Netzwerke. Viele Leistungen solcher Netzwerke (Rückkopplungshemmung, oszillierende Aktivität, etc.) beruhen darauf, dass Nervenzellen mit zeitlicher Verzögerung auf einen aktivierenden Stimulus (injizierten Strom) reagieren. Die Konstante τm stellt die Zeit dar, für die gilt IR . V (τm · ln 2) = 2 D.h. nach t = τm · ln 2 hat das Membranpotential die Hälfte seines maximalen Wertes IR erreicht. 3.4 Systeme von linearen Differentialgleichungen In physiologischen Systemen wie auch bei Populationen betrachtet man gewöhnlich zwei oder mehrere zeitabhängige Größen, die miteinander in Wechselwirkung stehen. Die Evolution solcher Größen in der Zeit wird mithilfe von Systemen von Differentialgleichungen beschrieben. Beispiel 24 (Aufnahme eines Medikaments) Die Aufnahmerate von Medikamenten in Geweben und Organen ist für die Festlegung des medikamentösen Regimes von großer Bedeutung. Folgende Fragen sind in diesem Zusammenhang wichtig: • Mit welcher Rate werden Substanzen von den Geweben aufgenommen? • Mit welchen Raten werden Substanzen aus dem Blutkreislauf (z.B. durch die Niere) oder aus den Geweben (z.B. durch biochemischen Zerfall) ausgeschieden? Im allgemeinen ist es aber nicht möglich, Konzentrationen von Substanzen in Geweben zu messen. Der einzige Ort, wo man Messungen durchführen kann, ist der Blutkreislauf. Anhand dieser Messungen kann man dann, mithilfe eines mathematischen Modells, Rückschlüsse auf die Prozesse in den Geweben ziehen. Sei also D (engl. drug) ein Medikament, von dem zum Zeitpunkt t = 0 die Masse Q0 in den Blutkreislauf eines Patienten eingespritzt wird. Das Medikament diffundiert dann aus dem Blut in die Gewebe und wird außerdem auch durch die Niere in den Urin ausgeschieden. Wir betrachten das Blut und das Gewebe als zwei miteinander verbundene Kompartimente, siehe Abb. 3.4. Seien Q1 (t) Q2 (t) Masse von D in Gewebe Masse von D in Blutplasma. 58 KAPITEL 3. KONTINUIERLICHE PROZESSE Q1 Q2 Gewebe Blut Urin Abbildung 3.4: Ein System von zwei Kompartimenten für die Aufnahme und Ausscheidung eines Medikaments Während eines gegebenen Zeitintervalls ∆t können wir den Austauschprozess folgendermaßen beschreiben: Zuwachs durch Eintreten Abnahme durch Eintreten von D-Molekülen aus dem von D-Molekülen aus dem ∆Q1 = + Blut ins Gewebe Gewebe ins Blut Zuwachs durch Eintreten Abnahme durch Eintreten von D-Molekülen aus dem von D-Molekülen aus dem + ∆Q2 = Blut ins Gewebe Gewebe ins Blut Abnahme durch Ausscheidung + durch die Niere Wir dividieren beide Gleichungen durch ∆t und lassen anschließend ∆t gegen Null gehen. dQ1 = Zuwachsrate + Abnahmerate dt dQ2 = Zuwachsrate + Abnahmerate + Ausscheidungsrate. dt Unter vereinfachenden Annahmen werden nun die Änderungsraten proportional zu Q1 bzw. Q2 angenommen. Man erhält dann folgendes System von Differentialgleichungen: dQ1 = k2 Q2 − k1 Q1 dt dQ2 = k1 Q1 − k2 Q2 − k3 Q2 = k1 Q1 − (k2 + k3 )Q2 dt (3.14) mit positiven Konstanten k1 , k2 und k3 . Es gilt Q1 (0) = 0 und Q2 (0) = Q0 . Das obige System gehört zu der Klasse der linearen, homogenen Systeme von Differentialgleichungen der Form: dy1 = a11 y1 + a12 y2 dt dy2 = a21 y1 + a22 y2 . dt 3.4. SYSTEME VON LINEAREN DIFFERENTIALGLEICHUNGEN 59 Das System kann auch in der Form dy = Ay dt (3.15) geschrieben werden, wobei dy = dt dy1 dy2 , dt dt T a11 a12 a21 a22 , A= , y= y1 y2 . In Anlehnung an die Gestalt der Lösung der linearen homogenen Differentialgleichungen suchen wir die Lösung des Systems (3.15) in der Gestalt y(t) = veλt , λ ∈ C, v = (v1 , v2 )T ∈ C2 (3.16) oder ausgeschrieben y1 (t) y2 (t) = v1 v2 λt e = v1 eλt v2 eλt . Einsetzen in (3.15) ergibt λv1 eλt λv2 eλt =A v1 eλt v2 eλt = Aveλt oder λveλt = Aveλt . Nach Kürzen durch eλt ergibt sich für die unbekannte Zahl λ und dem unbekannten Vektor v folgende Beziehung Av = λv. Damit also y(t) der Gestalt (3.16) eine Lösung des Differntialgleichungssystems (3.15) ist, muss λ ein Eigenwert und v ein zugehöriger Eigenvektor der Matrix A sein. Um die Eigenwerte und Eigenvektoren der Matrix A zu bestimmen gehen wir wie im Paragraph 2.5 vor, d.h. wir lösen die charakteristische Gleichung det(A − λI) = 0. Wir erhalten zwei Eigenwerte λ1 , λ2 (welche auch komplex sein können). Fall 1. λ1 , λ2 ∈ R, λ1 6= λ2 . Die Eigenvektoren sind für a12 6= 0 gegeben als (sh. Übungsaufgabe) 1 v1 Eigenvektor zu λ1 v= = λ1 −a11 v2 a12 0 v = v10 v20 = 1 λ2 −a11 a12 Eigenvektor zu λ2 . Damit können wir nun zwei Lösungen für das System (3.15) angeben: z(t) = veλ1 t und z 0 (t) = v 0 eλ2 t . 60 KAPITEL 3. KONTINUIERLICHE PROZESSE Man kann aber allgemein zeigen, dass alle Lösungen des Systems (3.15) durch Linearkombinationen der Lösungen z und z 0 erhalten werden. D.h. y(t) = c1 veλ1 t + c2 v 0 eλ2 t , c 1 , c2 ∈ R (3.17) ist die allgemeine Lösung des Systems (3.15). Das qualitative Verhalten der Lösungen für verschiedene Vorzeichen von λ1 und λ2 ist in Abb.3.5 skizziert. Sind wir nun an einer Lösung interessiert, welche zum Zeitpunkt t = 0 den Wert 0 y1 y0 = annimt, so kann man in der Darstellung (3.17) die Konstanten c1 und c2 y20 ausrechnen und erhällt somit die Lösung zu den Anfangsbedingung y(0) = y 0 . Kommen wir nun zurück auf unser Modellsystem (3.14) für die Aufnahme eines Medikaments. Wir setzen 5 3 3 , k2 = , k3 = . k1 = 400 400 100 Zur Zeit t = 0 seien Q0 = 10 mg eines Medikaments ins Blut gespritzt worden. Wir wollen nun den zeitlichen Verlauf der Medikamentenmenge im Blut und im Gewebe berechnen. Die Matrix A des Systems ist 3 5 1 − 400 −3 5 400 A= = . 3 17 − 400 3 −17 400 400 Die Eigenwerte bestimmen wir aus der charakteristischen Gleichung det(A − λI) = 0 3 −λ d.h. − 400 17 − 400 −λ − 15 160000 = 0. Wir erhalten 1 200 9 = − . 200 λ1 = − λ2 Wir sehen also, dass beide Eigenwerte negativ sind und folglich gehen sowohl die Konzentration von D im Blut als auch im Gewebe gegen Null (was man ja auch erwartet!). Die Eigenvektoren berechnen sich aus 1 5 v1 5 − v1 + v2 = 0, v = = v2 1 400 400 0 15 0 5 0 v1 1 0 v + v = 0, v = = . v20 −3 400 1 400 2 Die allgemeine Lösung ergibt sich also als 1 9 1 5 − 200 t Q(t) = c1 e + c2 e− 200 t . 1 −3 3.4. SYSTEME VON LINEAREN DIFFERENTIALGLEICHUNGEN 61 Zwei reelle negative Eigenwerte Zwei reelle Eigenwerte, davon einer negativ und der andere positiv Zwei reelle positive Eigenwerte Abbildung 3.5: Qualitatives Verhalten der Lösungen von (3.15) im Falle zweier reeller, verschiedener Eigenwerte. 62 KAPITEL 3. KONTINUIERLICHE PROZESSE Wenn wir nun verlangen, dass erhalten wir Daraus folgt c1 = 10 ,c 16 2 Q1 (0) Q2 (0) = 0 10 5c1 + c2 = 0 c1 − 3c2 = 10 = − 50 . Die Lösung unseres Problems ist also (sh. auch Abb.3.6) 16 50 − 1 t e 200 − 16 10 − 1 t Q2 (t) = e 200 + 16 Q1 (t) = 50 − 9 t e 200 16 150 − 9 t e 200 16 Abbildung 3.6: Der zeitliche Verlauf der Medikamentenmenge im Blut und im Gewebe Fall 2. λ1 , λ2 ∈ R, λ1 = λ2 . Dieser Fall wird im Rahmen dieser Vorlesung nicht behandelt, da grundlegende Begriffe über Vektorräume nicht vorausgesetzt werden können. 3.4. SYSTEME VON LINEAREN DIFFERENTIALGLEICHUNGEN 63 Fall 3. λ1 , λ2 ∈ C. In diesem Fall sind λ1 und λ2 konjugiert komplexe Zahlen λ1,2 = a±b i. Diesen Eigenwerten entsprechen konjugiert komplexe Eigenvektoren (sh. Übungsaufgabe), d.h. v1 w1 v = +i Eigenvektor zu λ1 v2 w2 v1 w1 0 v = v̄ = −i Eigenvektor zu λ2 . v2 w2 Analog zu Fall 1 kann die allgemeine Lösung des Systems (3.15) folgendermaßen dargestellt werden: y(t) = c1 ve(a+bi)t + c2 v 0 e(a−bi)t . Benutzen wir nun die Relation e(a+bi)t = eat (cos(bt) + i sin(bt)) so erhalten wir: y(t) = + = + = + c1 (Re v + i Im v)eat (cos(bt) + i sin(bt)) (3.18) at c2 (Re v − i Im v)e (cos(−bt) + i sin(−bt)) c1 eat (Re v cos(bt) − Im v sin(bt) + i(Im v cos(bt) + Re v sin(bt))) c2 eat (Re v cos(bt) − Im v sin(bt) − i(Im v cos(bt) + Re v sin(bt))) (c1 + c2 )eat (Re v cos(bt) − Im v sin(bt)) i(c1 − c2 )eat (Im v cos(bt) + Re v sin(bt)) Im allgemeinen ist der obige Ausdruck für y(t) eine komplexe Zahl. Für unser System (3.15) erwarten wir aber im Falle von reellen Anfangswerten auch eine reellwertige Lösung. Diese ist gegeben im folgenden Satz 8 Die allgemeine Form einer reellen Lösung des Systems (3.15) ist gegeben durch y(t) = c1 eat (Re v cos(bt) − Im v sin(bt)) + c2 eat (Im v cos(bt) + Re v sin(bt)) (3.19) mit reellen Konstanten c1 , c2 ∈ R. Beweis Um zu zeigen, dass die Summe aus dem Realteil und dem Imaginärteil der allgemein komplexen Lösung (3.18) eine reelle Lösung von (3.15) ist, benutzen wir die Eigenschaft, dass v 0 = v̄. Daraus folgt, dass A(Re v) = aRe v − bIm v A(Im v) = bRe v + aIm v (3.20) ist. Einsetzen von (3.19) in (3.15) und Ausnutzen von (3.20) liefert den Beweis. Wir sehen also, dass komplexe Eigenwerte auch im Falle von Systemen von gewöhnlichen Differentialgleichungen mit oszillierenden Lösungen verbunden sind. Dabei bestimmt der Realteil des Eigenwertes das Verhalten der Amplitude der Oszillationen (a > 0 Amplitude wächst, a < 0 Amplitude fällt, a = 0 Amplitude bleibt konstant), während der 64 KAPITEL 3. KONTINUIERLICHE PROZESSE Imaginärteil die Frequenz der Oszillation angibt. Dieses qualitative Verhalten der Lösungen ist auch im Abb. 3.7 dargestellt. Zwei komplexe Eigenwerte mit positivem Realteil Zwei rein imaginäre Eigenwerte Zwei komplexe Eigenwerte mit negativem Realteil Abbildung 3.7: Qualitatives Verhalten der Lösungen von (3.15) im Falle komplexer Eigenwerte Nichthomogene lineare Systeme von Differentialgleichungen Beispiel 25 (Ein Räuber-Beute-Modell) Wir betrachten ein mathematisches Modell zur Populationsdynamik, in dem zwei Spezies vorkommen: die eine besteht aus den Räubern, die andere aus den Beutetieren. Die Räuber ernähren sich von den Beutetieren. Sei x(t) die Anzahl der Individuen der Beutepopulation und y(t) die Anzahl der Individuen der Räuberpopulation zum Zeitpunkt t. Wir nehmen an, dass sich die beiden 3.4. SYSTEME VON LINEAREN DIFFERENTIALGLEICHUNGEN 65 Populationen in einem bestimmten Lebensraum im Gleichgewicht befinden x(t) = x∗ und y(t) = y ∗ . Wird nun die Räuberpopulation - etwa durch Jagd - verkleinert, so wird die Beutepopulation beginnen zu wachsen, da die Beutetiere nicht mehr so häufig von den Raubtieren gejagt werden. Die Beutepopulation wird um so mehr wachsen, je mehr Räuber geschossen wurden. Die einfachste Modellierung hierfür ist, dass die Wachstumsrate der Beutepopulation proportional zur Anzahl der erlegten Räuber gesetzt wird: x0 = p(y ∗ − y), p > 0. Setzen wir andererseits zusätzliche Beutetiere aus, so wird die Räuberpopulation wegen des erhöhten Nahrungsangebotes beginnen zu wachsen, und zwar um so schneller, je größer das zusätzliche Nahrungsangebot ist. Die einfachste Modellierung hierfür ist, die Wachstumsgeschwindigkeit der Räuberpopulation proportional zum zusätzlichen Nahrungsangebot x − x∗ zu setzen: y 0 = q(x − x∗ ), q > 0. Dies legt nahe, jedenfalls für kleine Schwankungen von x um x∗ und y um y ∗ , das RäuberBeute-System durch das folgende System von inhomogenen linearen Differentialgleichungen zu modellieren: x0 = −py + py ∗ y 0 = qx − qx∗ . (3.21) Satz 9 Die allgemeine Lösung eines inhomogenen Systems erhält man indem man zur allgemeinen Lösung des zugehörigen homogenen Systems eine spezielle Lösung des inhomogenen Systems addiert. Das zugehörige homegene System zu (3.21) ist x0 = −py y 0 = qx (3.22) Wir betrachten nun das System (3.21) für folgende Werte der Parameter x∗ = 0, 8, y ∗ = 0, 5, p = 1, q = 0, 5. Die Anfangswerte seien x(0) = 1, 4, y(0) = 0, 5, d.h. wir nehmen an, dass zum Zeitpunkt t = 0 eine zusätzliche Menge Beutetiere ausgesetzt werden. Um die Lösung des Systems zu bestimmen, lösen wir zuerst das homogene System x0 = −y y 0 = 0, 5x dessen Matrix durch A= 0 −1 0, 5 0 66 KAPITEL 3. KONTINUIERLICHE PROZESSE gegeben ist. Die Eigenwerte von A sind die konjugiert komplexen Zahlen p p λ1 = 0, 5 i, λ2 = − 0, 5 i. Die dazugehörigen Eigenvektoren sind 1 √ v= − 0, 5 i 0 v = v̄ = √1 0, 5 i Eigenvektor zu λ1 = p 0, 5 i p Eigenvektor zu λ2 = − 0, 5 i. Die Zerlegung in Realteil und Imaginärteil liefert 1 0 √ v= + i 0 − 0, 5 und nach Satz 8 ist die allgemeine Lösung des homogenen Systems gegeben durch p p x(t) 0 1 √ sin( 0, 5 t) + = c1 cos( 0, 5 t) − y(t) − 0, 5 0 p p 1 0 √ c2 sin( 0, 5 t) + cos( 0, 5 t) 0 − 0, 5 Als nächstes suchen wir eine spezielle Lösung des inhomogenen Systems. Die einfachste Lösung wäre eine konstante. Da eine solche Lösung nicht von t abhängt, erfüllt sie das System 0 = −y + 0, 5 0 = 0, 5x − 0, 4. x 0, 8 D.h. = ist eine spezielle Lösung von (3.21) für unser Rechenbeispiel. y 0, 5 Die allgemeine Lösung des inhomogenen Systems ist dann p p x(t) 1 0 √ = c1 cos( 0, 5 t) − sin( 0, 5 t) y(t) 0 − 0, 5 p p 1 0 √ + c2 sin( 0, 5 t) + cos( 0, 5 t) 0 − 0, 5 0, 8 + . 0, 5 Nun müssen wir die Konstanten c1 und c2 aus den Anfangsbedingungen bestimmen. Es gilt x(0) 1 0 0, 8 1, 4 √ = c1 + c2 + = . y(0) 0 − 0, 5 0, 5 0, 5 3.4. SYSTEME VON LINEAREN DIFFERENTIALGLEICHUNGEN 67 Abbildung 3.8: Die zeitlichen Entwicklung der Populationsgröße der Räuber und der Beute Daraus folgt c1 = 0, 6 und c2 = 0. Der zeitliche Verlauf der Anzahl der Individuen der beiden Populationen ist also gegeben durch x(t) y(t) = √ 0, 6√ cos( 0, 5√ t) + 0, 8 . 0, 6 0, 5 sin( 0, 5 t) + 0, 5 Die Populationsgrößen verändern sich also nach einem periodischen Muster, was auch in Abb 3.8 zu sehen ist. Bemerkung 9 Das klassische Räuber-Beute-Modell wurde von Volterra (1926) (italienischer Mathematiker) und Lotka (1925) (amerikanischer Biophysiker) aufgestellt. Dieses ist ein nichtlineares System der Gestalt x0 = ax − bxy y 0 = cxy − dy. Differentialgleichungen von diesem Typ werden wir im nächsten Paragraphen behandeln. 68 3.5 KAPITEL 3. KONTINUIERLICHE PROZESSE Systeme von nichtlinearen Differentialgleichungen Beispiel 26 (Bakterienwachstum in einem Chemostaten) Bei den Experimenten über das Wachstum von Mikroorganismen unter verschiedenen Laborbedingungen ist es oft nötig, einen Grundstock von der Kultur, die untersucht wird, vorrätig zu haben. Eine Möglichkeit dafür wäre eine latente Form der Mikroorganismen zu benutzen, die zum Zeitpunkt eines Experiments aktiviert wird. Eine bessere Alternative ist es jedoch, eine aktive Dauerkultur zu züchten, von der man zu jeder Zeit aktive Proben entnehmen kann. Eine Vorrichtung, in der eine solche Kultur gezüchtet wird, ist der Chemostat. Der Chemostat siehe Abb.3.9 besteht aus einer Wachstumskammer, in der die Mikroorganismen (z.B. Bakterien) kultiviert werden, einem Einfluss, durch den die Nährlösung zugeführt wird und einem Abfluss, durch den Kultur entnommen wird. Die Einfluss- und Abflussraten sind gleich, so dass das Volumen konstant bleibt. Um das Wachstum der F Einfluss Wachstumskammer F Abfluss Abbildung 3.9: Der Chemostat Kultur kontrollieren zu können, müssen wir die Evolution der Bakteriendichte und der Nährstoffkonzentration in der Zeit beschreiben. Unbekannten des Modells: N (t) C(t) Bakteriendichte [Anzahl Bakterien/Volumen] die Nährstoffkonzetration [Masse/Volumen] Charakteristische Größen des Chemostats: C0 V F Nährstoffkonzentration, die zugeführt wird Volumen der Wachstumskammer Einfluss-/Abflussrate [Volumen/Zeit] Die Änderungsraten für die Bakteriendichte N (t) und die Nährstoffkonzentration C(t) sind gegeben durch 3.5. SYSTEME VON NICHTLINEAREN DIFFERENTIALGLEICHUNGEN dN dt = O Änderungsrate der Bakteriendichte dC dt −αk(C)N = (3.23) O Reproduktionsrate der Bakterien Abnahmerate wegen Entnahme durch den Abfluss FC V − Änderungsrate der Nährstoff -konzentration F N V − k(C) N 69 + F C0 V (3.24) O Abnahmerate Abnahmerate Zunahmerate wegen Ernährung wegen Entnahme durch Zufluss der Bakterien durch den Abfluss Die Reproduktionsrate der Bakterien hängt von der Nährstoffkonzentration in der Wachstumskammer ab. Für eine niedrige Nährstoffkonzentration wächst die Reproduktionsrate mir wachsender Nährstoffkonzentration. Im Falle eines Überflusses an Nahrung wird die Reprodunktionsrate aber nicht unbeschränkt wachsen, sondern es wird sich eine maximale (limitierende) Rate einstellen. Eine Funktion k, mit welcher dieser Sätigungseffekt modelliert werden kann, ist gegeben durch k(C) = Kmax C Kn + C (3.25) Diese Funktion ist auch als Michaelis-Menten-Kinetik bekannt. Kmax stellt den maximalen Wert für k(C) dar, und für C = Kn erreicht die Funktion k(C) die Hälfte ihres maximalen Wertes, d.h. k(Kn ) = 21 Kmax . Der Verlauf von k(C) für Kmax = 4 und Kn = 1, 5 ist in Abb.3.10 gegeben k(C) K max 3 K max 2 1 0 1 Kn 2 3 4 5 6 7 8 Abbildung 3.10: Der Verlauf der Funktion k(C) = 9 Kmax C Kn +C 10 11 12 13 14 C für Kmax = 4 und Kn = 1, 5 Für die Modellierung der Abnahmerate der Nährstoffe durch den Verzehr durch die Bakterien gehen wir davon aus, dass α Einheiten des Nährstoffs gebraucht werden, um einen Zuwachs der Bakterienpopulation um eine Einheit zu erzielen. Wenn sich also die 70 KAPITEL 3. KONTINUIERLICHE PROZESSE Bakterien mit einer Rate k(C)N reproduzieren, so wird die Abnahmerate der Nährstoffe infolge des Verzehrs durch die Bakterien gegeben sein durch −α k(C) N. Setzen wir nun für die Funktion k den Ausdruck (3.25) in (3.23) und (3.24) ein, so erhalten wir folgendes Modell für das Bakterienwachstum und dem Nährstoffverzehr: C F dN = Kmax N− N dt Kn + C V (3.26) dC C F C F C0 = −αKmax N− + (3.27) dt Kn + C V V Dieses ist ein System von nichtlinearen Differentialgleichungen, da es nichtlineare Terme wie C · N enthält. Dieses System enthält sechs Parameter: F, C0 , V, α, Kmax und Kn . Die ersten drei Parameter können wir im Experiment einstellen, während die letzten drei von dem Bakterien- und Nährstofftyp, der verwendet wird, abhängen. Es ist von Interesse, zu verstehen in welcher Weise sich eine Änderung des Parametersatzes auf die Bakteriendichte und Nährstoffkonzentration auswirkt. Zum Beispiel könnte eine erhöhte Nährstoffkonzentration C0 für eine gefräßigere“ Bakteriensorte das ganze System unverändert ” lassen, so dass also das System als ganzes weniger als 6 Freiheitsgrade hat. Um diese Idee präziser darzustellen, werden wir als nächstes eine Dimensionsanalyse unseres Systems durchführen. Dimensionsanalyse der Gleichungen Wie wir wissen, können die Größen, die in einem Experiment gemessen werden, in verschiedenen Maßeinheiten gemessen werden. Z.B. kann man eine Bakteriendichte von N = 105 Zellen pro Liter auch ausdrücken als: N = 105 Zellen / Liter = 1 (Einheit von 105 Zellen)/Liter = 100 Zellen/Milliliter b = N ∗N Im letzten Schritt haben wir die zu messende Größe in zwei Teile geteilt: eine Zahl N ∗ , b , welche die Maßeinheit enthält, und die phywelche dimensionslos ist, und eine Größe N sikalische Dimension beinhaltet. Die Werte 105 , 1, 100, N ∗ aus dem obigen Beispiel beschreiben alle denselben Messwert, aber auf verschiedenen Mess-Skalen. Seien nun im Beispiel des Chemostaten die Größen folgendermaßen gegeben: b N = N ∗N b C = C ∗C t = t∗ τ. Um zu sehen, welchen Vorteil diese Schreibweise bringt, setzen wir in den Gleichungen b , C ∗ C, b und t∗ τ ein und nutzen die (3.26) und (3.27) anstatt N, C, t die Ausdrücke N ∗ N 3.5. SYSTEME VON NICHTLINEAREN DIFFERENTIALGLEICHUNGEN 71 b , C, b τ zeitunabhängige Größen sind. Wir erhalten Tatsache, dass N b) b Kmax d(N ∗ N C ∗C b b − F N ∗N = N ∗N ∗ b d(t τ ) V Kn + C ∗ C b b Kmax b F C0 d(C ∗ C) C ∗C F C ∗C ∗ b = −α − N − N b d(t∗ τ ) V V Kn + C ∗ C b, Wir multiplizieren beide Gleichungen mit τ und dividieren die erste Gleichung durch N b die zweite durch C. dN ∗ C∗ τF ∗ ∗ N = τ K N − max Kn ∗ ∗ dt V b +C C ∗ dC dt∗ = b −α τ Kmax N · b C C∗ τ F ∗ τ F C0 N∗ − C − Kn ∗ b V VC b +C C An dieser Stelle können wir nun die Mess-Skalen so wählen, dass unser System von Differentialgleichungen einfacher aussieht. Wenn wir z.B. τ= V , F b = Kn , C b= N Kn α τ Kmax festlegen, so hat unser System folgende Form dN dt dC dt C N −N 1+C C = − N − C + α2 , 1+C = α1 (3.28) wobei wir aus Notationsgründen die Sternchen nun weggelassen haben. Die Gleichungen enthalten jetzt nur noch zwei dimensionslose Parameter α1 und α2 (anstatt der anfänglichen 6). Diese sind gegeben durch V Kmax F τ F C0 C0 = = . b Kn VC α1 = τ Kmax = α2 (3.29) Daraus folgt, dass es nur zwei Parameter gibt, welche den Chemostaten beinflussen, wir sagen also: unser Modell für den Chemostaten hat zwei Freiheitsgrade. Gleichgewichtslösungen Da das Modell (3.28) nichtlinear ist, gibt es wenig Hoffnung die allgemeine Lösung explizit berechnen zu können. Man kann aber spezielle Lösungen suchen. Zum Beispiel ist man beim Chemostaten daran interessiert eine Bakterienkultur zu erzeugen, welche stets dieselbe Dichte aufweist. In mathematischen Termini bedeutet dies, dass man nach konstanten oder Gleichgewichtslösungen sucht. 72 KAPITEL 3. KONTINUIERLICHE PROZESSE Eine Gleichgewichtslösung ist eine Lösung, die sich im Laufe der Zeit nicht ändert (obwohl in dem System Prozesse wie Einfluss von Nährlösung, Abfluss von Bakterien oder Verzehr der Nährstoffe durch die Bakterien stattfinden). Da Gleichgewichtslösungen nicht von der Zeit abhängen, erfüllen Sie die Bedingungen: dN dt dC dt = 0 (3.30) = 0 (3.31) Daher reduzieren sich die Gleichungen (3.28) zu: C̄ α1 N̄ − N̄ = 0 1 + C̄ C̄ N̄ − C̄ + α2 = 0 − 1 + C̄ (3.32) (3.33) Diese zwei Gleichungen können wir nun lösen. (Achtung, dieses ist ein System von nichtlinearen Gleichungen!) Aus der ersten Gleichung folgt, dass entweder N̄ = 0 C̄ 1 oder = ; α1 1 + C̄ (3.34) d.h. C = 1 α1 − 1 (3.35) Falls N = 0, so folgt aus der zweiten Gleichung, dass C = α2 . Falls N = 6 0, so folgt aus der zweiten Gleichung, dass N̄ = 1 + C̄ 1 (α2 − C̄) = α1 (α2 − C̄) = α1 (α2 − ) α1 − 1 C̄ Die zwei möglichen Gleichgewichtslösungen sind also: 1 1 (N̄1 , C̄1 ) = α1 α2 − , α1 − 1 α1 − 1 (N̄2 , C̄2 ) = (0, α2 ) (3.36) (3.37) (3.38) Die zweite Lösung (N̄2 , C̄2 ) beschreibt eine Situation, welche für die Experimentatoren nicht interessant ist: die Bakterien sind ausgestorben und die Nährstoffkonzentration ist C0 gleich der Konzentration α2 = K , welche durch den Einfluss zugeführt wird. (Beachte, n dass C jetzt in der Skala Ĉ = Kn gemessen wird.) Die erste Gleichgewichtslösung (N̄1 , C̄1 ) ist interessanter, aber sie existiert nicht immer aus biologischer Sicht. Falls z.B. α1 < 1, erhalten wir negative Werte für die Nährstoffkonzentration. Ein biologisch sinnvolles Gleichgewicht existiert also nur dann, wenn α1 > 1 und α2 > 1 α1 − 1 (3.39) 3.5. SYSTEME VON NICHTLINEAREN DIFFERENTIALGLEICHUNGEN 73 Abbildung 3.11: Der zeitliche Verlauf der Bakteriendichte und der Nährstoffkonzentration in dem Chemostat Was bedeuten nun die Restriktionen (3.39) aus biologischer Sicht? Es gilt: α1 > 1 ⇐⇒ Kmax > F V 1 Da beide Seiten der Ungleichung die Dimension Zeit haben, ist es sinnvoller zu schreiben 1 Kmax < V F (3.40) Kmax ist die maximale Ratenkonstante für die Reproduktionsrate der Bakterien. Daher 1 ist Kmax ln2 die Zeit, die die Bakterienpopulation braucht, um sich zu verdoppeln (in der Situation eines Überschusses an Nährstoff). VF ist die Zeit, die benötigt wird, um die Wachstumskammer einmal zu leeren. Bedingung (3.40) sagt uns also, dass die Verdopplungszeit der Baktereriendichte kleiner sein muss als die Zeit die man braucht, um die Wachstumskammer einmal zu leeren, damit die Bakterien nicht ausgewaschen werden, bevor sie sich vermehren können. Untersuchen wir die Bedingung α2 > α11−1 , so führt diese auf die Beziehung C̄ < C0 . Kn Diese spiegelt einen einleuchtenden Sachverhalt wider, und zwar, dass die Nährstoffkonzentration in der Wachstumskammer nicht höher sein kann, als die Nährstoffkonzentration C0 /Kn (bezüglich der Skala Kn ) beim Einfluss. 74 KAPITEL 3. KONTINUIERLICHE PROZESSE Für das System (3.28) mit α1 = 2 und α2 = 4 und Anfangsbedingungen N (0) = C(0) = 1 ist der zeitliche Verlauf der Bakteriendichte und der Nährstoffkonzentration in Abb. 3.11 dargestellt. In diesem Fall ist die Gleichgewichtslösung (N̄1 , C̄1 ) = (6, 1). Die Abbildung zeigt, dass sich das System in den Gleichgewichtszustand einspielt. 3.5.1 Herleitung der Michaelis-Menten-Kinetik Um die Abhängigkeit der Reproduktionsrate der Bakterien von der Nährstoffkonzentration zu verstehen, müssen wir den Prozess der Nahrungsaufnahme auf molekularer Ebene betrachten. Organische Substanzen, wie z.B. Glukose, können die hydrophobe Umgebung der Zellmembran nicht direkt durchdringen und müssen mithilfe von Rezeptoren, die in der Zellmembran eingebettet sind, durch die Membran transportiert werden. Diese Rezeptoren verbinden sich mit den Molekülen des Nährstoffs zu einem losen Komplex, transportieren die Nährstoffmoleküle durch die Membran und geben sie im Innern der Zelle wieder frei. Danach ist der Rezeptor wieder frei und kann ein neues Nährstoffmolekül transportieren. Sättigungseffekte treten wegen der beschränkten Anzahl der Rezeptoren und der gebundener Rezeptor freier Rezeptor Abbildung 3.12: Transport von Nährstoffen in eine Bakterienzelle mittels Rezeptoren. beschränkten Geschwindigkeit, mit der sie Nährstoffmoleküle transportieren, auf. Wir wollen nun die oben beschriebenen Prozesse in Form von chemischen Gleichungen aufschreiben. Seien dazu C P X0 X1 Nahrungsmittelmolekül außerhalb der Zelle aufgenommenes Nahrungsmittelmolekül freier Rezeptor gebundener (besetzter) Rezeptor Dann gilt folgende Reaktionsschema k2 k1 C + X0 X1 → P + X0 k−1 3.5. SYSTEME VON NICHTLINEAREN DIFFERENTIALGLEICHUNGEN 75 Ein solches Schema kann in ein System von gewöhnlichen Differentialgleichungen übertragen werden, wenn wir z.B. die Annahme machen, dass die Reaktionsraten im Falle zweier Reaktanten proportional sind zu dem Produkt der Konzentrationen der beiden Reaktanten. Dabei sind k1 , k−1 , k2 die Ratenkonstanten. Seien also c, x0 , x1 , p die Konzentrationen von C, X0 , X1 , P. Dann gilt dc = −k1 cx0 + k−1 x1 (3.41) dt dx0 = −k1 cx0 + k−1 x1 + k2 x1 dt dx1 = k1 cx0 − k−1 x1 − k2 x1 dt dp = k2 x 1 dt Bemerkung 10 Das System (3.41) erhält man auch bei der Beschreibung von enzymgesteuerten Reaktionen. Diese sind Reaktionen, bei denen ein Enzym an ein Substrat bindet und einen Komplex bildet. Durch die Aktivität des Enzyms wird das Substrat in das Produkt P umgesetzt, und das Enzym wird wieder frei. Die Bedeutung der vier Größen c, x0 , x1 und p sind in dem Fall: c p x0 x1 Konzentration Konzentration Konzentration Konzentration des des der der Substrats Produktes freien Enzyme gebundenen Enzyme (3.41) ist ein System von vier nichtlinearen Differentialgleichungen und daher sehr schwer zu untersuchen. Allerdings kann dieses System folgendermaßen reduziert werden: Wenn wir die Gleichungen für x0 und x1 addieren, so erhalten wir dx0 dx1 + = 0. dt dt Dies bedeutet, dass die Summe aus freien und gebundenen Rezeptoren zeitlich konstant ist. Dieses ist auch biologisch richtig, denn Rezeptoren werden während des Prozesses weder erzeugt noch verbraucht. Falls wir also mit einer Anfangskonzentration r starten, dann gilt während des gesamten Prozesses x0 (t) + x1 (t) = r. (3.42) Der Erhaltungssatz (3.42) für die Rezeptoren erlaubt uns in dem System (3.41), die Gleichung für x0 zu eliminieren. Weiterhin können wir erstmal auch die Gleichung für p beiseite lassen, da p in den Gleichungen für c und x1 nicht vorkommt. Die Gleichung für p kann unabhängig von den anderen Gleichungen gelöst werden, sobald die Funktion x1 (t) bekannt ist. Das System (3.41) reduziert sich also zu dc = −k1 c (r − x1 ) + k−1 x1 dt dx1 = k1 c (r − x1 ) − k−1 x1 − k2 x1 dt 76 KAPITEL 3. KONTINUIERLICHE PROZESSE oder dc = −k1 rc + (k−1 + k1 c)x1 dt dx1 = k1 rc − (k−1 + k2 + k1 c)x1 . dt Um das System weiter reduzieren zu können, müssen wir es zuerst in dimensionslose Form bringen. Dieses erfolgt nach dem gleichen Muster wie bei den Gleichungen für den Chemostaten. Wenn wir also folgende Skalen festlegen 1 τ = k1 r x̂1 = r = Anfangskonzentration der freien Rezeptoren ĉ = c0 = Anfangskonzentration des Nahrungsmittels so erhalten wir die Gleichungen für die dimensionslosen Variablen c∗ , x∗1 , t∗ : dc∗ k−1 ∗ ∗ = −c + + c x∗1 dt∗ k1 c 0 dx∗1 c0 ∗ c0 k−1 + k2 ∗ = c − + c x∗1 . dt∗ r r k1 c0 Aus Notationsgründen verzichten wir nun auf die Sternchen. Außerdem bezeichnen wir mit k−1 + k2 k2 r K= , λ= . ε= , c0 k1 c 0 k1 c 0 Die Gleichungen lauten nun dc = −c + (K − λ + c)x1 dt dx1 ε = c − (K + c)x1 . dt In dem Fall, in dem die Rezeptorkonzentration r viel kleiner ist als die Anfangskonzentration der Nährstoffe c0 , gilt r 1. ε= c0 1 Daher kann man den Term ε dx durch Null approximieren. Folglich wird auf der Zeitskala dt 1 τ = k1 r der Prozess der Nahrungsaufnahme durch folgendes System beschrieben: dc = −c + (K − λ + c)x1 dt 0 = c − (K + c)x1 . Daraus folgt x1 = c K +c dc = −c + (K + c)x1 − λx1 dt c c = −c + x1 − λ x1 K +c c = −λ K +c 3.5. SYSTEME VON NICHTLINEAREN DIFFERENTIALGLEICHUNGEN 77 Wenn wir nun zu den dimensionsbehafteten Variablen c = c∗ ĉ, t = t∗ τ übergehen, so erhalten wir für die Änderungsrate der Nährstoffkonzentration die Michaelis-Menten-Kinetik: c dc = −Kmax , dt Kn + c wobei Kmax = k−1 +k2 k1 und Kn = k2 r ist. 78 KAPITEL 3. KONTINUIERLICHE PROZESSE Formelsammlung Komplexe Zahlen und Trigonometrie sin2 ϕ + cos2 ϕ = 1 z = |z|(cos ϕ + i sin ϕ) =: |z|eiϕ z · z 0 = |z · z 0 |(cos(ϕ + ϕ0 ) + i sin(ϕ + ϕ0 )) Charakteristische Gleichung einer Matrix det(A − λI) = 0 Allgemeine Form einer reellen Lösung von y 0 = A y 1. reelle Eigenwerte: y(t) = c1 veλ1 t + c2 v 0 eλ2 t , c1 , c2 ∈ R 2. komplexe Eigenwerte: y(t) = c1 eat (Re v cos(bt) − Im v sin(bt)) + c2 eat (Im v cos(bt) + Re v sin(bt)), c1 , c2 ∈ R Spezielle Werte der trigonometrischen Funktionen 0 0◦ sin x cos x tan x cot x π 6 π 4 ◦ 30 7π 6 ◦ 60 2 √2 2 2 3 2 1 √2 1 1 5π 4 π 3 45 √ 1 0 √2 3 1 √2 3 0 √3 ±∞ 3 ◦ √ π 2 ◦ 90 2π 3 120 √ sin x cos x tan x cot x 3π 4 ◦ 135 √ 5π 6 π 150◦ 180◦ 3 2 1 1 0 2 2√ 2√ 2 3 1 0 − 2 − 2 − √2 −1 √ 3 3 ±∞ − √ 3 −1 − 3 0 √ √ 3 3 0 −3 −1 − 3 ±∞ 3 4π 3 3π 2 5π 3 210◦ 225◦ 240◦ 270◦ 300◦ √ ◦ √ √ 7π 4 315◦ √ 11π 6 ◦ 330 2π 360◦ 1 −√12 − √22 − 23 −1 − 23 −√ 22 − 0 √2 3 2 2 3 1 1 −√ 2 − 2 −2 0 1 2 2 2√ √ √ 3 3 1 3 ±∞ − √ 3 −1 − 3 0 √ √ √3 3 3 3 1 0 −3 −1 − 3 ±∞ 3