Albert-Ludwigs Universität Freiburg Skriptum zur Vorlesung Mathematik für Studierende der Naturwissenschaften Susanne Knies 12. Juni 2017 Dieses Skript soll nicht die Vorlesung ersetzen. Es erhebt auch keinen Anspruch auf Vollständigkeit. Es soll den Studierenden lediglich ein Hilfe sein, anhand einer Zusammenfassung die Vorlesung nachzuarbeiten. Falls Sie beim Lesen Fehler finden, einfach eine Email an susanne.knies at math.uni-freiburg.de. Vielen Dank. 2 Inhaltsverzeichnis 1 Grundbegriffe und Grundlagen der Kombinatorik 1.1 Grundbegriffe . . . . . . . . . . . . . . . . . . 1.1.1 Mengennotation . . . . . . . . . . . . 1.1.2 Quantoren . . . . . . . . . . . . . . . . 1.2 Grundlagen der Kombinatorik . . . . . . . . . 1.2.1 Permutationen (Anordnungen) . . . . 1.2.2 Variationen . . . . . . . . . . . . . . . 1.2.3 Kombinationen . . . . . . . . . . . . . 1.2.4 Allgemeine binomische Formel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 6 6 9 10 10 11 12 13 2 Folgen und Reihen 2.1 Folgen . . . . . . . . . . . . . . 2.1.1 Konvergenz von Folgen 2.1.2 Die Fibonacci-Folge . . 2.2 Reihen . . . . . . . . . . . . . . 2.2.1 Endliche Reihen . . . . 2.2.2 Unendliche Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 17 19 24 26 26 27 . . . . . . . . . . . 32 32 32 34 36 38 41 42 43 44 46 49 . . . . . . . . 50 50 53 53 55 60 60 60 63 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 Funktionen 3.1 Grundlagen . . . . . . . . . . . . . . . . . . 3.1.1 Elementare Begriffe . . . . . . . . . 3.1.2 Umkehrfunktion und Verkettung von 3.2 Polynome . . . . . . . . . . . . . . . . . . . 3.3 Rationale Funktionen . . . . . . . . . . . . 3.4 Die allgemeine Potenzfunktion . . . . . . . 3.5 Die allgemeine Exponentialfunktion . . . . . 3.5.1 Exponentialfunktion zur Basis e . . 3.6 Die allgemeine Logarithmusfunktion . . . . 3.7 Trigonometrische Funktionen . . . . . . . . 3.8 Sigmoidfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 Differentialrechnung 4.1 Grenzwert einer Funktion, Stetigkeit . . . . . 4.2 Ableitung einer Funktion . . . . . . . . . . . 4.2.1 Definition der Ableitung . . . . . . . . 4.2.2 Ableitung der elementaren Funktionen 4.3 Anwendungen der Differentialrechnung . . . . 4.3.1 Lokale Extrema . . . . . . . . . . . . . 4.3.2 Mittelwertsatz/Monotonie . . . . . . . 4.3.3 Die Regel von de l’Hospital . . . . . . 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Inhaltsverzeichnis 4.3.4 4.3.5 Taylorpolynome . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Anwendung auf Extremwerte . . . . . . . . . . . . . . . . . . . . . . . . 5 Integralrechnung 5.1 Definition und Eigenschaften des Integrals . . . . 5.2 Hauptsatz der Differential- und Integralrechnung 5.2.1 Der Hauptsatz . . . . . . . . . . . . . . . 5.2.2 Stammfunktionen elementarer Funktionen 5.3 Integrationsregeln . . . . . . . . . . . . . . . . . . 5.3.1 Partielle Integration . . . . . . . . . . . . 5.3.2 Integration durch Substitution . . . . . . 5.3.3 Der ln - Trick . . . . . . . . . . . . . . . . 5.3.4 Integration rationaler Funktionen . . . . . 5.4 Uneigentliche Integrale . . . . . . . . . . . . . . . 5.5 Die Kreisfläche . . . . . . . . . . . . . . . . . . . 66 69 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72 72 76 76 78 79 80 82 83 84 85 87 6 Stochastik 6.1 Vorüberlegungen . . . . . . . . . . . . . . . . . . . . . . . 6.1.1 Relative Häufigkeit (Empirischer Ansatz) . . . . . 6.1.2 Laplace-Wahrscheinlichkeit (Theoretischer Ansatz) 6.2 Endliche Ergebnismengen . . . . . . . . . . . . . . . . . . 6.2.1 Notation . . . . . . . . . . . . . . . . . . . . . . . . 6.2.2 Bedingte Wahrscheinlichkeit . . . . . . . . . . . . . 6.2.3 Zufallsvariable . . . . . . . . . . . . . . . . . . . . 6.2.4 Erwartungswert, Varianz und Standardabweichung 6.2.5 Die Binomialverteilung . . . . . . . . . . . . . . . . 6.2.6 Die Poissonverteilung . . . . . . . . . . . . . . . . 6.3 Stetige Zufallsvariablen, die Normalverteilung . . . . . . . 6.3.1 Stetige Zufallsvariablen . . . . . . . . . . . . . . . 6.3.2 Die Gaußsche Normalverteilung . . . . . . . . . . . 6.3.3 Die N (µ; σ 2 ) - Verteilung . . . . . . . . . . . . . . 6.3.4 Die σ - Regeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 89 89 89 91 91 94 97 100 104 106 109 109 110 113 118 7 Lineare Algebra 7.1 Vektoren . . . . . . . . . . . . . . . . . . . . . . . . 7.1.1 Rechnen mit Vektoren . . . . . . . . . . . . 7.1.2 Winkel und Skalarprodukt . . . . . . . . . 7.1.3 Der Korrelationskoeffizient . . . . . . . . . 7.1.4 Lineare Unterräume des Rn . . . . . . . . . 7.2 Lineare Gleichungssysteme . . . . . . . . . . . . . . 7.2.1 Lösungsmengen linearer Gleichungssysteme 7.2.2 Das Gaußsche Eliminationsverfahren . . . . 7.3 Matrizen . . . . . . . . . . . . . . . . . . . . . . . . 7.3.1 Einführung . . . . . . . . . . . . . . . . . . 7.3.2 Rechnen mit Matrizen . . . . . . . . . . . . 7.3.3 Die Determinante einer Matrix . . . . . . . 7.3.4 Eigenwerte und Eigenvektoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121 121 121 124 127 129 131 131 134 136 136 139 143 146 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Inhaltsverzeichnis 7.4 Das Leslie-Modell . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151 7.4.1 Das Modell . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151 7.4.2 Das Leslie-Modell für 2 Altersklassen . . . . . . . . . . . . . . . . . . . . 152 8 Komplexe Zahlen 8.1 Einführung . . . . . . . . . . . . . . . . . . . . . . . . 8.1.1 Die Zahl i . . . . . . . . . . . . . . . . . . . . . 8.1.2 Die komplexe Zahlenebene . . . . . . . . . . . . 8.1.3 Division in C . . . . . . . . . . . . . . . . . . . 8.1.4 Quadratische Gleichungen in C . . . . . . . . . 8.2 Polardarstellung im Komplexen . . . . . . . . . . . . . 8.2.1 Umrechnung der Koordinaten . . . . . . . . . . 8.2.2 Geometrische Interpretation der Multiplikation 8.2.3 Die Exponentialfunktion im Komplexen . . . . 8.2.4 Flächenberechnung und Determinante . . . . . 8.3 Fundamentalsatz der Algebra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154 154 154 157 160 162 164 165 167 168 169 172 9 Gewöhnliche Differentialgleichungen 9.1 Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.2 Differentialgleichungen 1. Ordnung . . . . . . . . . . . . . . . . . 9.2.1 Konstantes und exponentielles Wachstum . . . . . . . . . 9.2.2 Logistisches Wachstum . . . . . . . . . . . . . . . . . . . . 9.2.3 Trennung der Variablen . . . . . . . . . . . . . . . . . . . 9.2.4 Lineare Differentialgleichungen 1.Ordnung . . . . . . . . . 9.2.5 Richtungsfelder . . . . . . . . . . . . . . . . . . . . . . . . 9.2.6 Stationäre Punkte . . . . . . . . . . . . . . . . . . . . . . 9.3 Lineare Differentialgleichungen 2.Ordnung . . . . . . . . . . . . . 9.3.1 Beispiel: Der harmonische Oszillator . . . . . . . . . . . . 9.3.2 Lösung der linearen Differentialgleichung 2.Ordnung . . . 9.4 Systeme von Differentialgleichungen . . . . . . . . . . . . . . . . 9.4.1 Lineare Systeme 1.Ordnung mit konstanten Koeffizienten 9.4.2 Komplexwertige Lösungen . . . . . . . . . . . . . . . . . . 9.4.3 Nichtlineare Systeme, das Räuber-Beute-Modell . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174 174 175 175 176 181 182 189 192 195 195 195 202 202 204 207 5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 Grundbegriffe und Grundlagen der Kombinatorik 1.1 Grundbegriffe In der Mathematik werden häufig Aussagen über Zusammenfassungen gemacht: - „Alle Dreiecke haben die Winkelsumme 180◦ .“ - „x2 ≥ 0 für alle reellen Zahlen x.“ Um Aussagen präzise formulieren zu können, brauchen wir den Begriff der „Menge“. 1.1.1 Mengennotation 1.1 Definition Eine Menge ist eine Zusammenfassung unterscheidbarer Objekte zu einem Ganzen. Die Objekte x, die zu einer Menge M gehören, heißen Elemente von M , geschrieben x ∈ M . Ist x nicht Element von M , so schreiben wir x ∈ / M . Mit ∅ := { } bezeichnet man die leere Menge, die keine Elemente enthält. Eine Menge wird definiert, indem man ihre Elemente aufzählt oder durch Eigenschaften eindeutig beschreibt. Aufzählende Darstellung einer Menge: A = {0, 1, 2, 3} B = {0, 1, ..., 9} N = {0, 1, 2, . . .} Menge der natürlichen Zahlen Z = {0, +1, −1, +2, −2, +3, −3, . . .} Menge der ganzen Zahlen D = {rot,grün,blau} Beschreibende Darstellung einer Menge: P = {p ∈ N | p ist eine Primzahl} B = {n ∈ N | n < 10} L = {x ∈ R | x2 − 1 = 0} M = {x ∈ R | x2 + 1 = 0} 6 1 Grundbegriffe und Grundlagen der Kombinatorik Bei der beschreibenden Darstellung wird immer zunächst die Grundmenge notiert, aus der die Elemente auszuwählen sind, („n ∈ N“, „ x ∈ R“ ) und dann eine Eigenschaft angegeben, durch welche die Elemente der Menge eindeutig beschrieben werden. 1.2 Definition Seien M , N Mengen. i) M heißt Teilmenge von N , wenn jedes Element von M auch Element von N ist: x ∈ M ⇒ x ∈ N. Schreibweise: M ⊆ N . ii) Es ist M = N , genau dann wenn M ⊆ N und N ⊆ M . iii) Sei N eine endliche Menge, so heißt |N | = „Betrag von N“ und bezeichnet die Anzahl der Elemente von N . iv) Die Menge aller Teilmengen einer Menge M wird bezeichnet mit P (M ) := {A A ⊆ M } und heißt Potenzmenge von M. 1.3 Bemerkung Der Betrag einer reellen Zahl x ∈ R (geschrieben |x|) ist definiert durch: ( |x| = falls x ≥ 0 falls x < 0. x −x 1.4 Definition Für Mengen M, N definieren wir die Mengenoperationen Differenz: M ∩ N := {x | x ∈ M und x ∈ N } M ∪ N := {x | x ∈ M oder x ∈ N } M \ N := {x | x ∈ M und x ∈ / N} Produkt: M × N := {(x, y) | x ∈ M und y ∈ N }. Durchschnitt: Vereinigung: Insbesondere bezeichnet R \ {0} die Menge der reellen Zahlen ohne die 0. 7 1 Grundbegriffe und Grundlagen der Kombinatorik 1.5 Definition Abgeschlossene, offene und halboffene Intervalle in R werden notiert durch [a, b] := {x ∈ R| a ≤ x ≤ b} (a, b) := {x ∈ R| a < x < b} abgeschlossenes Intervall [a, b) := {x ∈ R| a ≤ x < b} (a, b] := {x ∈ R| a < x ≤ b} halboffenes Intervall offenes Intervall halboffenes Intervall. Hierbei sind a, b ∈ R mit a < b. Uneigentliche Intervalle sind definiert durch [a, ∞) := {x ∈ R| a ≤ x < ∞} (a, ∞) := {x ∈ R| a < x < ∞} (−∞, b) := {x ∈ R| − ∞ < x < b} (−∞, b] := {x ∈ R| − ∞ < x ≤ b}. 1.6 Beispiele a) Für die obigen Beispielmengen gilt A ⊆ B ⊆ N und M = ∅. b) Sei D = {r, g, b}. Dann ist die Potenzmenge von D P (D) = {{r}, {g}, {b}, {r, g}, {r, b}, {g, b}, {r, g, b}, ∅}. c) Es ist R die Menge der reellen Zahlen und R≥0 := {x ∈ R | x ≥ 0} R≤0 := {x ∈ R | x ≤ 0}. d) Bei einem Zufallsexperiment heißt die Menge der möglichen Ergebnisse Ergebnismenge und wird mit Ω bezeichnet. Wird ein Würfel geworfen so ist die Ergebnismenge Ω1 = {1, 2, 3, 4, 5, 6} und es ist der Betrag von Ω1 |Ω1 | = 6. Eine Teilmenge E der Ergebnismenge Ω1 heißt Ereignis. Es ist zum Beispiel das Ereignis E = „ Die gewürfelte Zahl ist größer als 2 “ = {3, 4, 5, 6} und daher ist |E| = 4. e) Betrachten wir in obigem Zufallsexperiment als weiteres Ereignis G = „ Die gewürfelte Zahl ist gerade “ = {2, 4, 6}, 8 1 Grundbegriffe und Grundlagen der Kombinatorik so können wir die Schnittmenge von E und G bilden: E ∩ G = {4, 6}. Diese bezeichnet das Ereignis „ E und G “, in dem die gewürfelte Zahl größer als 2 und gerade ist. Bilden wir hingegen die Vereinigung E ∪ G = {2, 3, 4, 5, 6}, so erhalten wir das Ereignis E oder G, in welchem die gewürfelte Zahl größer als 2 oder gerade ist. Mittels einer Skizze kann man sich verdeutlichen, dass allgemein gilt: |E ∪ G| = |E| + |G| − |E ∩ G| . f) Würfeln wir 2-mal hintereinander (oder gleichzeitig mit zwei unterscheidbaren Würfeln), so ist die Ergebnismenge eine Menge geordneter Paare, nämlich das Produkt Ω2 = Ω1 × Ω1 = {(a1 , a2 ) | a1 , a2 ∈ {1, 2, ..., 6}} 1.1.2 Quantoren Die Notation mathematischer Aussagen wird häufig vereinfacht durch die Verwendung der Quantoren: ∃ ∀ Existenzquantor: Allquantor: „Es gibt ein . . . “ „Für alle . . . “ 1.7 Beispiele a) ∀ n ∈ N gilt: n ≥ 0. „Für alle natürlichen Zahlen n gilt: n ≥ 0.“ b) ∀ n ∈ N gilt: ∃ pn ∈ N, pn ist Primzahl und pn > n. „Für alle natürlichen Zahlen n gilt: zu n gibt es eine Primzahl pn mit pn > n.“ c) ∃ x ∈ R : x2 = 2. „Es gibt eine reelle Zahl x, für die x2 = 2 gilt.“ d) ∀ ∈ R mit > 0: ∃ n ∈ N, so dass n1 < . „Für alle reellen Zahlen mit > 0 gilt: es gibt eine natürliche Zahl n, so dass 1 n < .“ e) Vertauschen wir in Beispiel b) die Reihenfolge der Quantoren, so wird aus der obigen wahren Aussage eine falsche Aussage: ∃ p ∈ N : p ist Primzahl, so dass ∀n ∈ N gilt: p > n. „Es existiert eine Primzahl p, so dass für alle natürlichen Zahlen n gilt: p > n.“ Dieses zeigt uns, dass die Reihenfolge der Quantoren wesentlich für den Inhalt der Aussage ist. 9 1 Grundbegriffe und Grundlagen der Kombinatorik 1.2 Grundlagen der Kombinatorik 1.8 Definition Für natürliche Zahlen n, k ∈ N mit k ≤ n definieren wir: n ! := n · (n − 1) · . . . · 2 · 1 i) ii) “ n Fakultät ” 0 ! := 1 n k iii) ! := n! k ! (n − k) ! “ n über k ” und für k > n wird festegelgt n k iv) ! := 0. 1.9 Beispiel Aus dieser Definition folgt für natürliche Zahlen n, k ∈ N mit k ≤ n: und n n ! n n−1 ! n n−k ! ! = n 0 ! = n 1 = n . k = 1, = n, ! Wir betrachten nun drei Grundaufgaben der Kombinatorik, wobei stets zwischen den Situationen mit oder ohne Wiederholungen unterschieden wird und immer n Objekte gegeben sind. 1.2.1 Permutationen (Anordnungen) Permutationen sind Umordnungen gegebener Objekte, es wird die Reihenfolge der anzuordnenden Objekte beachtet: 1.) ohne Wiederholungen: (Alle Objekte sind unterscheidbar.) Sollen n Objekte auf n Plätzen angeordnet werden, so stehen für den ersten Platz n Objekte zur Auswawhl, für den zweiten Platz noch (n − 1) usw. : 1. 2. 3. ··· (n − 1). n. Platz n (n − 1) (n − 2) ··· 2 1 Möglichkeiten. Das heißt es ergeben sich n · (n − 1) · (n − 2) · . . . · 2 · 1 = n ! Möglichkeiten, n unterscheidbare Objekte anzuordnen. 10 (1.1) 1 Grundbegriffe und Grundlagen der Kombinatorik 2.) mit Wiederholungen: (Einige Objekte sind nicht unterscheidbar.) Zur Herleitung betrachten wir die Situation mit drei Objekten, die zunächst unterscheidbar seien und notieren in Tabelle 1.1 alle Möglichkeiten, diese anzuordnen. Dann notieren wir, welche Permutationen nicht mehr unterscheidbar sind, wenn die 1 und die 2 identifiziert werden. Allgemein: Treten unter n Objekten k Objekte mehrfach auf mit den Häufigkeiten n1 , n2 , . . . , nk , Drei verschiedene Objekte 1 2 3 3 2 1 2 1 2 1 3 3 Objekte „1“ und „2“ sind indentfiziert 3 3 1 2 1 2 1 1 3 3 1 1 3! = 6 Permutationen 1 1 1 1 3 3 3 3 1 1 1 1 Die Anordnungen, die durch Vertauschen von „1“ und „2“ entstehen, sind nicht mehr unterscheidbar, d.h. je 2! Möglichkeiten fallen zusammen. 3! 2! Permutationen Tabelle 1.1: Permutationen mit und ohne Wiederholungen so gibt es n! n1 ! · n2 ! · . . . · nk ! (1.2) Permutationen. 1.10 Beispiel Wie viele (nicht umbedingt sinnvolle) verschiedene Wörter lassen sich aus den Buchstaben des Wortes „BIOLOGIE“ bilden? Das Wort hat 8 Buchstaben, es ist also n = 8, die Buchstaben I und O treten dabei doppelt auf, so dass 2 mal „I“ 2 mal „O“ ⇒ ⇒ n1 = 2 n2 = 2 Die Anzahl der Permutationen der Buchstaben ist also: 8! 8·7·6·5·4·3·2·1 = = 10.080. 2! · 2! 2·1·2·1 1.2.2 Variationen Aus n unterscheidbaren Objekten werden k Objekte unter Beachtung der Reihenfolge ausgewählt: 1.) ohne Wiederholungen: (Die Objekte werden nicht zurückgelegt.) Für den ersten Platz stehen n Objekte zur Auswahl, für den zweiten nur noch (n − 1) usw. Insgesamt erhalten wir 11 1 Grundbegriffe und Grundlagen der Kombinatorik 1. 2. 3. ··· (n − 1). k. n (n − 1) (n − 2) ··· n−k+2 n−k+1 Platz Möglichkeiten. Das heißt es ergeben sich n · (n − 1) · (n − 2) · . . . · (n − k + 1) = n! (n − k)! (1.3) Möglichkeiten, k aus n Objekten unter Beachtung der Reihenfolge auszuwählen. 2.) mit Wiederholungen (Die Objekte werden zurückgelegt.) Für jeden Platz stehen alle n Objekte zur Auswahl. Es ergeben sich dann n · n · n · . . . · n = nk (1.4) Möglichkeiten. 1.2.3 Kombinationen Aus n unterscheidbaren Objekten werden k Objekte ohne Beachtung der Reihenfolge ausgewählt: 1.) ohne Wiederholungen: (Die ausgewählten Objekte werden nicht zurückgelegt.) n! Auswahlen, solange die Reihenfolge beachtet wird (s. Variationen 1.2.2). Nun Es gibt (n−k)! ist die Reihenfolge egal, so dass je k! Möglichkeiten die gleichen k Objekte unterschiedlich anzuordnen, nicht mehr unterscheidbar sind: n! 1 n! · = = (n − k)! k! (n − k)! · k! Es gibt also n k ! n . k (1.5) (gesprochen: „n über k“) Möglichkeiten. 2.) mit Wiederholungen: (Die Objekte werden zurückgelegt.) Werden beim Auswählen Wiederholungen zugelassen, so betrachten wir folgendes Modell: Vor uns stehe ein Bücherregal mit n = 6 Büchern B1 , ...., B6 : Wir nehmen k = 3 Mal ein Buch heraus und stellen es zurück an seinen Platz. Es kann ein Buch mehrmals herausgenommen werden. Jede Auswahl markieren wir mit einem „+“. Diese Auswahl kann auch dargestellt werden durch: B1 B2 ++ B3 B4 + B5 B6 Tabelle 1.2: B2 wird zweimal ausgewählt, B4 einmal. Dies kann ebenso, ohne Informationsverlust, dargestellt werden durch: ++ + d.h. alle möglichen Auswahlen entsprechen genau einer Anordnung der n − 1 = 6 − 1 = 5 Striche „|“ und k = 3 Kreuze „+“. Da die Striche und die Kreuze jeweils untereinander nicht 12 1 Grundbegriffe und Grundlagen der Kombinatorik unterscheidbar sind, gibt es nach Formel (1.2) mit n = 5 + 3, n1 = 5 und n2 = 3 gerade Möglichkeiten diese anzuordnen. Allgemein gibt es (n − 1 + k)! (n − 1 + k)! = = (n − 1)! · k! (n − 1 + k − k)! · k! n−1+k k (5+3)! 5! · 3! ! (1.6) Möglichkeiten, k aus n Objekten auszuwählen, wenn Wiederholungen zugelassen sind. Zusammenfassung alle Objekte unterscheidbar mit Wiederholungen n! n! n1 ! · ... · nk ! Permutationen (Anordnungen, Reihenfolge wichtig) Variationen (Auswahl, Reihenfolge wichtig) n! (n−k)! Kombinationen (Auswahl, Reihenfolge unwichtig) mit Zurücklegen nk n k n−1+k k 1.2.4 Allgemeine binomische Formel Gesucht ist eine Formel für (x + y)n , n ∈ N. Ist n = 2, so erhält man durch einfaches Ausmultiplizieren die bekannte binomische Formel: (x + y)2 = (x + y)(x + y) = x2 + 2xy + y 2 . Für n = 3 erhält man: (x + y)3 = (x + y)(x + y)(x + y) = x3 + 3x2 y + 3xy 2 + y 3 . Wollen wir für beliebiges n ∈ N den Term (x + y)n = (x + y)(x + y) · . . . · (x + y) | {z n Faktoren } ausmultiplizieren, so trägt jeder der n Faktoren entweder ein x oder ein y bei. Daher hat jeder der entstehenden Summanden die Form xk y n−k , wobei 0 ≤ k ≤ n ist, d. h. die Summe der Exponenten ist gleich n. Der Term xk y n−k entsteht beim Ausmultiplizieren n n k -mal, denn es gibt nach (1.5) gerade k Möglichkeiten, aus den n-Faktoren (x + y) genau k-mal das x auszuwählen. Alle anderen (n − k) Faktoren tragen ein y bei, so dass nk -mal 13 1 Grundbegriffe und Grundlagen der Kombinatorik xk y n−k entsteht. Daher erhalten wir die allgemeine binomische Formel: ! (x + y)n = = ! ! ! ! n 0 n n 1 n−1 n 2 n−2 n n n 0 x y + x y + x y + ... + xn−1 y 1 + x y 0 1 2 n−1 n n X ! n k n−k x y . k k=0 1.11 Bemerkung Die Zahlen (1.7) n k heißen auch Binominalkoeffizienten. Wollen wir die Formel für n = 3 überprüfen, so erhalten wir: ! 3 (x + y) = ! ! ! 3 0 3 3 1 2 3 2 1 3 3 0 x y + x y + x y + x y = y 3 + 3xy 2 + 3x2 y + x3 . 0 1 2 3 Für die Binomialkoeffizienten gelten die folgenden wichtigen Rechenregeln, die sich anschaulich gut verstehen lassen, wenn man sich nk immer gleich als Anzahl der k-elementigen Teilmengen einer n-elementigen Menge vorstellt: 1.12 Folgerungen Eine n - elementige Menge hat Symmetrie: Es gilt n k = n n−k n n−k , ! n k Teilmengen mit k Elementen. denn n! n! = = = (n − k)! (n − (n − k))! (n − k)! k! ! n . k (1.8) Anschaulich bedeutet das: Eine n - elementige Menge hat genau so viele k - elementige wie (n − k) - elementige Teilmengen. Denn sei mit n = 10 M = {A, B, C, D, E, F, G, H, I, J}. eine 10-elementige Menge gegeben, so legt die Auswahl der k = 3 Elemente {B, F, H} eindeutig die n − k = 7 - elementige Teilmenge N durch N := M \{B, F, H} = {A, C, D, E, G, I, J} fest. Daher gibt es gleich viele 3 - und 7 - elementige Teilmengen von M . Rekursionsformel für n k : Man kann direkt nachrechnen, dass n+1 k+1 ! ! = n n + k k+1 ! (1.9) gilt. (Was wir hier nicht ausführen.) Anschaulich bedeutet diese Formel: Fügt man zu einer n - elementigen Menge {a1 , ..., an } ein neues Element an+1 hinzu, und wählt (k + 1) - elementige Teilmengen aus, so gibt es zwei Möglichkeiten: 1) Die (k + 1) - elementige Teilmenge enthält das neue Element an+1 , so hat man Möglichkeiten, die restlichen k Elemente aus {a1 , . . . , an } auszuwählen. n k 2) Die (k + 1) - elementige Teilmenge enthält das neue Element an+1 nicht, so hat man n k+1 Möglichkeiten (k + 1) Elemente aus der alten n - elementigen Menge {a1 , ...., an } 14 1 Grundbegriffe und Grundlagen der Kombinatorik auszuwählen. Zusammen erhält man also n+1 k+1 = n k n k+1 + Teilmengen mit (k + 1) Elementen: Abbildung 1.1: (k + 1) = 3 - elementige Teilmengen mit n = 8, k = 2 1.13 Beispiele a) Wählen wir in der binomischen Formel (1.7) x = y = 1, so erhalten wir: n n X n k=0 n X (1 + 1) = ⇔ 2 = ! n k n−k 1 1 k ! n . k k=0 (1.10) b) Sei M = {a1 , ..., an } eine Menge mit n Elementen. Dann gilt für den Betrag der Potenzmenge P (M ): |P (M )| = 2n , denn nach (1.10) gilt n 2 = n X n k k=0 ! ! = ! ! n n n + + ... + . 0 1 n Dieses ist die Anzahl der 0, 1, 2, . . . , n - elementigen (also aller) Teilmengen von M . c) Pascalsches Dreieck: n n Aus der Rekursionsformel n+1 k+1 = k + k+1 ergibt sich eine einfache Möglichkeit, die Binominalkoeffizienten nk zu berechnen. Dazu notieren wir zunächst 0 0 1 3 0 2 0 0 2 1 3 1 .. . 15 1 1 3 2 2 2 3 3 1 Grundbegriffe und Grundlagen der Kombinatorik n n Nun ist nn = n0 = 1, woraus sich mit n+1 k+1 = k + k+1 ergibt, dass jedes Summe der beiden im Dreieck darüber stehenden Binominalkoeffizienten ist: 1 1 1 1 2 1 1 3 3 1 .. . d) Ein Basketballtrainer hat 9 5 n+1 k+1 die Möglichkeiten aus 9 Spielern 5 Startspieler auszuwählen. e) Wird eine Münze 5 mal geworfen und stets das Resultat „Kopf“ oder „Zahl“ notiert, so 5 5 gibt es 2 = 32 mögliche Ergebnisse. In 3 = 10 dieser Ergebnisse fällt genau 3 mal „Zahl“. f) Wie viele Möglichkeiten haben 10 nicht unterscheidbare Vögel, sich auf 6 Telegrafenleitungen niederzulassen? Da mehrere Vögel auf einer Leitung sitzen können, ist die Formel (1.6) anzuwenden mit n = 6 und k = 10. Es gibt also 6 − 1 + 10 10 ! ! = 15 10 = 15 · 14 · 13 · 12 · 11 = 3003 5·4·3·2·1 Möglichkeiten, wenn nicht beachtet wird, in welcher Reihenfolge die Vögel auf den Leitungen sitzen. g) Wie viele Möglichkeiten gibt es, 12 Probanden in 2 gleich große Gruppen aufzuteilen? 16 2 Folgen und Reihen 2.1 Folgen 2.1 Definition Unter einer Folge reeller Zahlen versteht man eine Abbildung N → R. Jedem n ∈ N wird eine reelle Zahl x(n) ∈ R zugeordnet. Man schreibt xn := x(n) für die Folgenglieder und (xn )n∈N oder auch x0 , x1 , x2 , ... für die Folge. 2.2 Beispiele a) Arithmetische Folge: Seien a, b ∈ R, dann definieren wir: x0 := a x1 := a + b x2 := x1 + b = a + 2b .. . xn := xn−1 + b = a + nb Die Folge beschreibt lineares Wachstum, z.B. ein Konto mit Anfangsguthaben a und monatlicher Zinszahlung b (ohne Zinseszins). Der Name der Folge kommt daher, dass ein Folgenglied das arithmetische Mittel seines Vorgängers und seines Nachfolgers ist: xn = xn+1 + xn−1 2 b) Geometrische Folge: Dies ist das einfachste Modell für das Wachstum von Populationen: a Bakterien werden in eine Nährlösung eingesetzt. Unter der Annahme stündlicher Verdopplung, ist die Anzahl xn der Bakterien nach n Stunden: x0 := a x1 := a · 2 x2 := x1 · 2 = a · 2 · 2 = a · 22 .. . xn := xn−1 · 2 = a · 2n−1 · 2 = a · 2n 17 2 Folgen und Reihen Die allgemeine geometrische Folge ist definiert durch xn := a q n , für a, q ∈ R, q > 0. (2.1) Der Name der Folge kommt daher, dass ein Folgenglied das geometrische Mittel seines Vorgängers und seines Nachfolgers ist: xn = √ xn+1 · xn−1 c) Harmonische Folge: Die harmonische Folge ist definiert durch xn := 1 . n Die ersten Folgenglieder sind 1, 12 , 31 , . . .. Der Name der Folge kommt daher, dass ein Folgenglied das harmonische Mittel seines Vorgängers und seines Nachfolgers ist: 1 1 = xn 2 1 xn+1 + 1 xn−1 denn: 1 2 1 xn+1 + 1 xn−1 1 = 2 1 1 n+1 + 1 1 n−1 ! = 1 1 1 (n + 1 + n − 1) = n = 1 = 2 x n n d) Zinseszins: K0 sei ein Anfangskapital, das Sie zu fantastischen 100% jährlichem Zinssatz anlegen können. Nach einem Jahr beträgt das Kapital dann K1 = 2K0 . Wie verändert sich das Kapital am Ende des Jahres, wenn statt dessen während des Jahres zweimal, dreimal, viermal, . . . jeweils 12 , 13 , 41 , . . . des aktuellen Kapitals als Zinsen gezahlt werden? Definieren wir eine Folge (xn )n∈N entsprechend des oben beobachteten Wachstums durch 1-malige Zinszahlung: (jährliche) 2-malige Zinszahlung: (6-monatige) 3-malige Zinszahlung (4-monatige) .. . K1 = K0 + K0 = 2K0 n-maliger Zinszahlung Kn = K0 (1 + n1 )n K2 = K0 (1 + 21 )(1 + 21 ) = K0 (1 + 12 )2 K3 = K0 (1 + 31 )(1 + 31 )(1 + 13 ) = K0 (1 + 13 )3 Tabelle 2.1: Zinseszinsentwicklung bei unterjähriger Zinszahlung xn := 1 + 1 n n . so können wir später zeigen, dass diese Folge für immer größer werdendes n gegen die 18 2 Folgen und Reihen Eulersche Zahl e strebt: e := lim n→∞ 1 1+ n n = 2,71828 . . . (2.2) e) Logistische Folge: Die logistische Folge wird verwendet um beschränktes Wachstum zu beschreiben. Es wird ein Anfangswert x0 ∈ (0, 1) vorgegeben, die weiteren Folgenglieder werden dann berechnet aus xn+1 = rxn (1 − xn ) Hierbei ist r ∈ R>0 ein Parameter des zu beschreibenden Wachstumsprozesses. 2.3 Bemerkung Berechnet eine Zuordnungsvorschrift für eine Folge ein Folgenglied xn aus dem vorhergehenden Folgenglied xn−1 , so heißt diese Vorschrift rekursiv, kann das Folgenglied ohne Kenntnis der vorhergehenden Folgenglieder berechnet werden, so heißt die Vorschrift explizit. Beispielweise ist für die arithmetische Folge xn := xn−1 + b eine rekursive Vorschrift und xn := a + nb eine explizite Vorschrift. 2.1.1 Konvergenz von Folgen Mit Folgen können Wachstums- und Zerfallsprozesse wie zum Beispiel Zellteilung und radioaktiver Zerfall in diskreten Zeitschritten beschrieben werden. Für immer größer werdende Indizes n werden die Glieder der arithmetischen Folge (für b > 0) unbeschränkt wachsen, die Glieder der harmonischen Folge gegen 0 gehen, während die Entwicklung der geometrischen Folge von dem Wert von q abhängt. Mathematisch beschreibt man dieses unterschiedliche Verhalten durch die Begriffe Divergenz und Konvergenz. 2.4 Definition: Konvergenz von Folgen i) Eine Folge (xn )n∈N heißt konvergent gegen den Grenzwert x, wenn für jede beliebig kleine Schranke > 0 ein Index n existiert, so dass ab diesem n die Folgenglieder um weniger als von dem Grenzwert x abweichen: |x − xn | < ∀n ≥ n (2.3) Diese Bedingung ist äquivalent zu x − < xn < x + für alle n ≥ n . Man sagt: xn konvergiert gegen x und schreibt hierfür: lim xn = x. n→∞ 19 2 Folgen und Reihen ii) Eine Folge (xn )n∈N heißt divergent, wenn sie nicht konvergent ist. iii) Eine Folge (xn )n∈N heißt divergent bestimmt gegen +∞, wenn zu jeder beliebig großen Schranke C > 0 ein Index nC existiert, so dass ∀n > nC . xn > C Schreibweise: limn→∞ xn = ∞. iv) Die Folge (xn )n∈N divergiert bestimmt gegen −∞, wenn es zu jeder beliebig großen Schranke C > 0 ein Index nC existiert, so dass xn < − C ∀n ≥ nC . Schreibweise: limn→∞ xn = −∞. 2.5 Beispiele a) arithmetische Folge: xn := a + bn. Das Konvergenzverhalten der Folge hängt von dem Vorzeichen von b ab: b > 0 ⇒ limn→∞ xn = ∞ b = 0 ⇒ limn→∞ xn = a b < 0 ⇒ limn→∞ xn = −∞. b) harmonische Folge: xn = n1 Behauptung: (xn )n∈N konvergiert gegen den Grenzwert x = 0. Beweis. Sei > 0 beliebig gegeben. Für Konvergenz gegen x = 0 lautet die Bedingung (2.3): |xn − 0| < ⇔ |xn | < 1 < , n ⇔ dieses ist erfüllt für n > 1 . Wähle also für n eine natürliche Zahl größer als 1 , dann ist 1 − 0 < n ∀ n ≥ n , also konvergiert die Folge gegen Null. c) geometrische Folge: Es sei xn := q n . Wir unterscheiden die Fälle q > 1 und 0 < q < 1: i) Es sei q > 1, dann ist die geometrische Folge bestimmt divergent: lim xn = lim q n = ∞. n→∞ n→∞ Beweis. Nach Definition 2.4 iii) müssen wir zeigen, dass die Folgenglieder größer werden als jede beliebig große Schranke C ∈ R. Da q > 1 vorausgesetzt ist, können 20 2 Folgen und Reihen wir q schreiben als q = 1 + p mit einem p > 0. Nun wenden wir die allgemeine binomische Formel (1.7) an und beachten, dass n0 = 1 und n1 = n gilt: n n xn = q = (1 + p) = n X k=0 ! n k n−k p 1 k ! ! ! n n n n 0 · p0 · 1n + p · 1n−1 + ... + p ·1 0 1 n = = 1 + np + . . . + 1 · pn | {z } Summanden>0 > 1 + np, wobei in der letzten Zeile durch das Weglassen positiver Summanden der Term nach unten abgeschätzt wird. Sei nun eine Schranke C ∈ R, C > 0 beliebig vorgegeben, dann ist ⇔ 1 + np > C n> C −1 , p d.h. wir wählen zu gegebener Schranke C einen festen Index nC , so dass nC > C −1 p und dann gilt: xn = q n = (1 + p)n > 1 + np ∀n ≥ nC , >C womit die Behauptung bewiesen ist. ii) Es sei 0 < q < 1, dann konvergiert die geometrische Folge gegen Null: lim xn = lim q n = 0. n→∞ Beweis. Es ist folgt. 1 q n→∞ > 1 so dass die Behauptung aus Teil v) des folgenden Satzes 2.9 Um allgemeine Aussagen über die Konvergenz von Folgen treffen zu können und nicht für jede konkrete Folge das -Kriterium der Definition 2.4 i) überprüfen zu müssen, sind die folgenden Begriffe monoton und beschränkt hilfreich. 21 2 Folgen und Reihen 2.6 Definition: Monotonie von Folgen Eine reelle Folge (xn )n∈N heißt i) monoton wachsend, wenn für alle Folgenglieder xn gilt: xn ≤ xn+1 ii) monoton fallend, wenn für alle Folgenglieder xn gilt: xn ≥ xn+1 iii) beschränkt, wenn es eine Schranke K ∈ R gibt, so dass für alle n ∈ N |xn | < K. . 2.7 Bemerkung Eine Folge heißt monoton, wenn sie monoton wachsend oder monoton fallend ist. Nun können wir ein Kriterium dafür formulieren, wann eine monotone Folge konvergent ist. 2.8 Satz: 1. Konvergenzsatz, Monotoniekriterium Ist die reelle Folge (an )n∈N monoton und beschränkt, so ist sie konvergent gegen ein x ∈ R. Wichtig ist jedoch zu beachten, dass nicht jede konvergente Folge monoton sein muss, die Umkehrung dieses Satzes also nicht gilt! Werden zwei konvergente Folgen miteinander verknüpft,so entsteht unter geeigneten Voraussetzungen wieder eine konvergente Folge. Mit Hilfe des folgenden Satzes kann daher die Konvergenz einer Folge überprüft werden, indem sie in Folgen „zerlegt“ wird, deren Konvergenzverhalten bereits bekannt ist. 2.9 Satz: 2. Konvergenzsatz, Grenzwertsatz Seien (an )n∈N und (bn )n∈N konvergente Folgen mit limn→∞ an = a und limn→∞ bn = b. Sei k ∈ R eine Konstante, dann gilt: i) Die Folge cn := k · an ist konvergent mit limn→∞ cn = k · a. ii) Die Folge cn := an + bn ist konvergent mit limn→∞ cn = a + b. iii) Die Folge cn := an · bn ist konvergent mit limn→∞ cn = a · b. 22 2 Folgen und Reihen iv) Falls bn 6= 0 ∀n ∈ N und b 6= 0, so ist die Folge cn := a b. an bn konvergent mit limn→∞ cn = v) Falls bn 6= 0 ∀n ∈ N und limn→∞ bn = ∞, so ist die Folge cn := limn→∞ cn = 0. 1 bn konvergent mit 2.10 Beispiele 1 a) xn = n(n+1) ist monoton fallend und beschränkt, also konvergent nach dem 1. Konvergenzsatz. b) xn := n3 , wende Satz 2.9 i) an mit k = 3: lim n→∞ 3 1 = 3 · lim = 3·0 = 0 n→∞ n n c) xn := 2 + n7 , wende Satz 2.9 i) und ii) an: lim n→∞ d) xn := 2 + (2.2) 7 n · 1+ lim n→∞ 1 n n 7 2+ n 7 2+ n = lim 2 + 7 · lim n→∞ n→∞ 1 =2 n , wende Satz 2.9 iii) an, dann ist zusammen mit dem Grenzwert · 1 1+ n n ! = lim n→∞ 7 2+ n · lim n→∞ 1 1+ n n = 2e e) Mit Satz 2.9 iv) erhalten wir: n · n3 + 2 3 + 2n = xn = = 5 + 4n n n5 + 4 ⇒ lim n→∞ 3 n 5 n +2 +4 3 + 2n 2 1 = = . 5 + 4n 4 2 f) Durch x0 = 2 und 1 2 xn+1 = (xn + ) 2 xn (2.4) für n ∈ N und n ≥ 1 wird rekursiv eine Folge definiert, die konvergent ist mit √ lim xn = 2. n→∞ Insbesondere erhalten wir auf diese Weise eine Folge rationaler Zahlen, es ist xn ∈ Q, ∀n ∈ N, mit einem √ nicht rationalen Grenzwert x ∈ R\Q. Davon dass der Grenzwert dieser Folge tatsächlich 2 können Sie sich auf die folgende Weise überzeugen: Stellen Sie sich vor, dass der Unterschied zwischen xn und xn+1 für sehr große n sehr, sehr klein geworden ist, so 23 2 Folgen und Reihen dass Sie diese beiden Zahlen kaum noch unterscheiden können. Setzen Sie daher in der Rekursiongleichung (2.4) einfach x ein an Stelle von xn , xn+1 , so erhalten Sie x = 21 (x+ x2 ). √ Wenn Sie diese Gleichung nach x auflösen erhalten Sie x = 2. 2.1.2 Die Fibonacci-Folge Die Folge (Fn )n∈N der Fibonacci-Zahlen wird definiert durch die Anfangsbedingungen F1 := 1 und F2 := 1 (AB) für die ersten beiden Folgenglieder und die Rekursionsformel Fn+2 := Fn+1 + Fn . (RF) Die ersten Folgenglieder sind dann 1, 1, 2, 3, 5, 8, 13, 21, 34, 55 . . . . Man sieht sofort, dass die Folge (Fn )n∈N monoton wachsend ist und bestimmt divergent: lim Fn = ∞ n→∞ Gesucht ist nun eine explizite Darstellung (s. Bemerkung 2.3) der Folge (Fn )n∈N . Die Herleitung dieser Formel erfolgt in zwei Schritten: − 1. Es werden explizite Darstellungen für zwei Folgen (G+ n )n∈N und (Gn )n∈N bestimmt, welche der Rekursionsformel (RF) genügen. Da die Gleichung (RF) linear ist, erfüllen dann auch alle Folgen (Mn )n∈N , welche durch − Mn := a G+ n + b Gn a, b ∈ R definiert sind die Rekursionsbedingung (RF). (Zum Begriff “linear” siehe Definition 3.5.) 2. Die Koeffizienten a, b ∈ R werden so bestimmt, dass die Anfangsbedingungen (AB) von − Mn = aG+ n + bGn für n = 1 und n = 2 erfüllt werden. zu 1.) Die Folge ist monoton wachsend, daher wählen wir den Ansatz Gn := λn und versuchen ein λ ∈ R\{0} zu finden, so das die so definierte Folge (Gn )n∈N die Rekursionsformel (RF) erfüllt. Es muss also gelten: ⇔ ⇔ Gn+2 = Gn+1 + Gn | Gn = λ n λn+2 = λn+1 + λn | : λn , λ 6= 0 λ2 = λ + 1 Dieses ist eine quadratische Gleichung für λ mit den beiden Lösungen: √ √ 1+ 5 1− 5 λ+ = und λ− = , 2 2 24 (2.5) 2 Folgen und Reihen − d.h. wir haben nun zwei Folgen (G+ n )n∈N und (Gn )n∈N , definiert durch: √ !n 1+ 5 + n Gn := λ+ = 2 √ !n 1− 5 − n , Gn := λ− = 2 welche die Rekursionsbedingung (RF) erfüllen. zu 2.) Gesucht sind nun a, b ∈ R, so dass die durch die Linearkombination − Fn := a G+ n + b Gn definierte Folge (Fn )n∈N der Anfangsbedingung (AB) genügt: ! − F1 = aG+ 1 + bG1 = a λ+ + b λ− = 1 ! − 2 2 F2 = aG+ 2 + bG2 = a λ+ + b λ− = 1 Dieses sind 2 lineare Gleichungen für a und b, welche sich lösen lassen. Wir erhalten (ohne die Rechung hier auszuführen) 1 a= √ , 5 1 b = −√ . 5 Es ist also 1 − 1 n 1 n Fn := √ G+ n − √ Gn = √ (λ+ − λ− ) 5 5 5 eine Folge, welche sowohl die Rekursionsformel (RF) und die Anfangsbedingung (AB) der Fibonacci-Zahlen erfüllt. Indem wir für λ+ und λ− die in (2.5) berechneten Werte einsetzen, können wir die n-te Fibonacci-Zahl berechnen aus: √ !n √ !n ! 1+ 5 1 1− 5 Fn = √ − . 2 2 5 Es ist nicht offensichtlich, dass die rechte Seite dieser Gleichung immer eine natürliche Zahl ergibt. Tipp: Sie durch Nachrechnen, dass mit dieser Formel F1 = 1 und F2 = 1. √ Überprüfen √ Wenn Sie 53 = 5 · 5 beachten, können Sie auch F3 = 2 nachrechnen. 25 2 Folgen und Reihen 2.2 Reihen Aus einer Folge x0 , x1 , x2 , . . . kann man eine neue Folge konstruieren, indem man die Folge der Partialsummen bildet: S0 := x0 S1 := x0 + x1 S2 := x0 + x1 + x2 .. . Sn := x0 + x1 + . . . + xn = n X xk k=0 Eine so definierte Folge (Sn )n∈N heißt Reihe. 2.2.1 Endliche Reihen Für endliche Reihen lässt sich in einigen Fällen eine Summenformel herleiten, mit der sich die n-te Partialsumme Sn (die Summe der ersten n Folgenglieder) berechnen lässt. 2.11 Beispiele a) Ist xn = n, dann ist S0 := x0 = 0 S1 := x0 + x1 = 0 + 1 = 1 S2 := x0 + x1 + x2 = 0 + 1 + 2 = 3 .. . Sn := x0 + x1 + . . . + xn = 0 + 1 + . . . + n = n X k k=0 Für Sn können wir eine Summenformel herleiten, denn Sn = 1 + 2 + ... + (n − 1) + n Sn = n + (n − 1) + ... + 2 + 1 ⇒ ⇒ 2Sn = (n + 1) + (n + 1) + .... + (n + 1) + (n + 1) = n(n + 1) n(n + 1) Sn = 2 also ist Sn = n X k=0 k= n(n + 1) 2 26 (2.6) 2 Folgen und Reihen b) Geometrische Reihe: Mit xn = q n ist n X Sn = q k = 1 + q + ... + q n . (2.7) k=0 Eine Summenformel können wir herleiten, indem wir Gleichung (2.7) mit q multiplizieren und die Differenz zwischen Sn und q Sn bilden: q Sn = q + q 2 + .... + q n+1 Sn − q Sn = 1 − q n+1 ⇒ so dass wir insgesamt Sn = n X 1 − q n+1 1−q qk = k=0 (2.8) als Summenformel für die geometrische Reihe im Falle q 6= 1 erhalten. 2.2.2 Unendliche Reihen 2.12 Definition Wenn für eine Folge (xn )n∈N die Folge der Partialsummnn (Sn )n∈N , Sn := n → ∞ gegen S ∈ R konvergiert, so setzen wir ∞ X k=0 xk , für xk := S = lim Sn n→∞ k=0 und sagen, die unendliche Reihe Pn P∞ k=0 xk konvergiert gegen S. Wichtig: Eine Reihe (Sn )n∈N kann höchstens dann konvergieren, wenn die zugrundeliegende Folge (xn )n∈N gegen 0 konvergiert, diese Bedingung ist aber nicht hinreichend! (Siehe weiter unten das Beispiel der harmonischen Reihe.) 2.13 Beispiele d) Arithmetische Reihe: xn = a + n · b Sn = n X (a + kb) = a(n + 1) + b k=0 n(n + 1) . 2 (Sn )n∈N kann nicht konvergieren (außer falls a = b = 0). e) Geometrische Reihe: Bilden wir die geometrische Folge xn = q n mit einem q mit |q| < 1, so wissen wir aus Beispiel c) im Abschnitt 2.1.1, dass die geometrische Folge gegen 0 konvergiert: limn→∞ q n = 0 für |q| < 1. Daher gilt für die Folge der Partialsummen mit 27 2 Folgen und Reihen Hilfe des 2. Konvergenzsatzes 2.9: Sn = n X qk = k=0 1 − q n+1 n→∞ 1 −−−→ . 1−q 1−q In diesem Fall konvergiert also auch die geometrische Reihe und wir können den Grenzwert berechnen: S = lim Sn = n→∞ 1 1−q Speziell gilt für q = 21 : Sn = 1 + 1 1 1 1 + + + ... + n 2 4 8 2 (2.9) und lim Sn = n→∞ ∞ X 1 k=0 2k = 1 1− 1 2 = 2. (2.10) Die Summe der Flächen der Quadrate und Rechtecke ist offenbar in einem Rechteck der Fläche 2 enthalten und konvergiert gegen dessen Fläche: 1 1 1/2 1 1/2 1 1/8 1/4 1/16 1/2 1/4 Abbildung 2.1: Die geometrische Reihe f) Harmonische Reihe: Es ist xn = Sn := 1 n für n ≥ 1. Um die Reihe n X 1 k k=1 =1+ 28 1 1 + ... + 2 n 2 Folgen und Reihen auf Konvergenz zu untersuchen, betrachten wir die 16. Partialsumme S16 = 1 + 1 1 1 1 1 1 1 1 1 + + + + + + + + ... + 2 |3 {z 4} |5 6 {z 7 8} |9 {z 16} 1 1 1 >2 · 4 >4 · 8 >8 · 16 1 =2 =1 2 1 =2 und können hier immer Gruppen von Summanden bilden, deren Summe größer ist als 12 . Beachten wir nun noch dass 16 = 24 , so sehen wir, dass für die 16. Partialsumme gilt: S24 > 1 + 4 · 1 2 und genau wie oben, kann man allgemein für S2m zeigen, dass S2m > 1 + m · 1 2 woraus folgt: lim S2m = ∞ m→∞ ∞ X 1 ⇔ k=0 k = ∞. Hier sehen wir, dass limn→∞ xn = 0 offenbar eine notwendige Vorraussetzung dafür ist, P dass die unendliche Reihe ∞ k=0 xk konvergiert aber offensichtlich keine hinreichende. Um Reihen auf Konvergenz zu untersuchen, stehen uns aber die folgenden Kriterien zur Verfügung: 2.14 Satz: Konvergenz von Reihen i) (Monotoniekriterium) Eine monotone und beschränkte Reihe ist konvergent. ii) (Vergleichskriterium) Seien (xn )n∈N und (yn )n∈N Folgen mit 0 ≤ x n ≤ yn und ist P∞ k=0 yn konvergent, so ist auch ∞ X P∞ xk ≤ k=0 k=0 xk ∞ X (2.11) konvergent und es gilt yk . k=0 2.15 Beispiele 1 g) Die Reihe Sn := nk=0 k! ist konvergent. Um dieses zu beweisen schätzen wir für k ≥ 2 die 1 1 Folgenglieder xk = k! nach oben durch yk = 2k−1 ab und wenden das Vergleichskriterium P 29 2 Folgen und Reihen aus Satz 2.14 ii) an: 1 1 1 1 = ≤ = k−1 k! 1·2·3· ... ·k 1·2·2· ... ·2 2 1 und da offensichtlich 0 ≤ k! gilt, folgt, dass die Reihe konvergiert, da (2.11) erfüllt ist und die Sn durch die Glieder der geometrischen Reihe abgeschätzt werden können: 1 1 1 1 + + + ... + 0! 1! 2! n! 1 1 1 ≤ 1 + 0 + 1 + . . . + n−1 2 2 2 n−1 X 1 k =1+ . 2 k=0 Sn = Mit dem Grenzwert für die geometrische Reihe (2.9) erhalten wir lim Sn = n→∞ ∞ X 1 k=0 n! ≤1+ ∞ k X 1 k=0 2 h) Im Beispiel 2.2 d) (Zinseszins) haben wir die Folge 1 + Zahl e definiert als deren Grenzwert: e = limn→∞ lim 1+ n→∞ 1 n n = ∞ X 1 k=0 k! 1+ = 3. n 1 n n 1 . n betrachtet und die Eulersche Nun können wir zeigen, dass . woraus nmit dem Ergebnis aus dem vorhergehenden Beispiel die Konvergenz der Folge 1 1+ n folgt. Es ist nach der allgemeinen binomischen Formel (1.7) (mit x = n1 und y = 1) 1 1+ n n = n X ! n 1 k nk k=0 und die Summanden der rechten Seite lassen sich abschätzen durch ! n 1 n · (n − 1) · . . . · (n − k + 1) 1 = k k n k! nk n · (n − 1) · . . . · (n − k + 1) 1 n·n· ... ·n k! n−k+1 1 n−1 = 1· · ... · · n } n } k! | {z | {z = <1 1 ≤ . k! 30 <1 2 Folgen und Reihen Also gilt für jedes einzelne Folgenglied 1 1+ n n = n X n X n 1 1 ≤ k k n k! k=0 ! k=0 und daher auch für den Grenzübergang n → ∞ lim n→∞ 1 1+ n n ≤ ∞ X 1 k=0 (2.12) k! Auf ähnliche Weise lässt sich zeigen, dass ∞ X 1 k=0 k! ≤ lim n→∞ 1 1+ n n+1 . (2.13) Da aber limn→∞ (1 + n1 ) = 1 ist lim n→∞ 1 1+ n n+1 1 n 1 = lim 1 + lim (1 + ) n→∞ n n→∞ n 1 n = lim 1 + n→∞ n und es folgt nun aus (2.12) und (2.13) dass lim n→∞ 1 1+ n n ≤ n X 1 k=0 ≤ lim k! n→∞ 1 1+ n n+1 = lim n→∞ 1 1+ n n . Es muss insgesamt gelten: ∞ X 1 k=0 k! 1 1+ n = lim n→∞ 31 n = e. (2.14) 3 Funktionen 3.1 Grundlagen 3.1.1 Elementare Begriffe 3.1 Definition: Abbildung Eine Abbildung f von einer Menge D in eine Menge W ordnet jedem Element x ∈ D genau ein Element f (x) ∈ W zu. Es wird x das Urbild und f (x) das Bild von x genannt. Es heißt D der Definitionsbereich und W die Wertemenge der Abbildung, welche notiert wird durch f :D→W x 7→ f (x). Eine Abbildung wird also festgelegt durch drei Angaben: Definitionsbereich, Wertebereich und Zuordnungsvorschrift. Wie wir im Folgenden sehen werden, gehören Defintions- und Wertebereich genauso zu einer Abbildung wie ihre Zuordnungsvorschrift, da sie wesentlich für wichtige Eigenschaften der Abbildung sind. Abbildungen, deren Definitionsbereich und Wertebereich Teilmengen der reellen Zahlen sind, werden als Funktionen bezeichnet. 3.2 Definition: Funktion Eine Funktion ist eine Abbildung f , die jedem Element x ihres Definitionsbereiches D ⊆ R genau ein Bild f (x) ∈ W ⊂ R zuordnet. Hierbei heißt f (D) := {y ∈ R | ∃ x ∈ D mit f (x) = y} das Bild von f über D. 3.3 Beispiel (Kugelvolumen) Wir definieren die Funktion V V : R≥0 → R 4 r 7→ πr3 , 3 welche aus dem Radius r einer Kugel ihr Volumen berechnet. Da wir keine negativen Radien betrachten, schränken wir den Definitionsbereich D auf R≥0 ein. In diesem Beispiel ist also 4 D = R≥0 , V (D) = R≥0 , V (r) = πr3 . 3 Für die genauere Beschreibung von Funktionen definieren wir die folgenden Begriffe: 32 3 Funktionen 3.4 Definition: Monotonie einer Funktion Sei f : D → R eine Funktion. f heißt i) streng monoton wachsend genau dann, wenn ∀x1 , x2 ∈ D mit x1 < x2 gilt: f (x1 ) < f (x2 ) ii) monoton wachsend genau dann, wenn ∀x1 , x2 ∈ D mit x1 < x2 gilt: f (x1 ) ≤ f (x2 ) iii) streng monoton fallend genau dann, wenn ∀x1 , x2 ∈ D mit x1 < x2 gilt: f (x1 ) > f (x2 ) iv) monoton fallend genau dann, wenn ∀x1 , x2 ∈ D mit x1 < x2 gilt: f (x1 ) ≥ f (x2 ) v) f : (−a, a) → R heißt gerade (symmetrisch zur y - Achse) genau dann, wenn gilt: f (−x) = f (x) ∀x ∈ (−a, a) vi) f : (−a, a) → R heißt ungerade (punktsymmetrisch zum Ursprung) genau dann, wenn gilt: f (−x) = −f (x) ∀x ∈ (−a, a) In den Teilen v) und vi) ist der Definitionsbereich D von f entweder ein endliches symmetrisches Intervall (−a, a) oder ganz R. Ein in vielen Bereichen der Mathematik wichtiger Begriff ist der der “Linearität”. Hier wird er für Abbildungen nach R erklärt. 3.5 Definition: Linearität Eine Abbildung L : R → R heißt linear, genau dann wenn für alle x, y ∈ R und c ∈ R gilt: L(x + y) = L(x) + L(y) L(cx) = cL(x) (3.1) (3.2) 3.6 Beispiele a) Eine Gerade durch den Koordinatenursprung, gegeben durch f (x) = ax ist eine lineare 33 3 Funktionen Funktion. b) Eine um eine Konstante verschobenen Gerade, gegeben durch f (x) = ax+b ist nach obiger Defintion nicht linear, auch wenn sie häufig so bezeichnet wird. Die korrekte Bezeichnung ist “affin linear”. c) Eine quadratische Funktion ist nicht linear. Als Beispiel sei f (x) = 3x2 betrachtet. Dann ist f (x) + f (y) = 3x2 + 3y 2 hingegen ist f (x + y) = 3(x + y)2 = 3x2 + 6xy + 3y 2 . Bedingung (3.1) ist offensichtlich nicht erfüllt, also ist f nicht linear. Dass Bedingung (3.2) ebenfalls nicht erfüllt ist, sieht man auf die gleiche Weise durch nachrechnen. d) Wird einer Funktion f ihre Ableitung f 0 oder eine Stammfunktion F zugeordnet, so sind dieses Abbildungen ebenfalls linear, siehe hierzu Satz 4.12 und Folgerung 5.3. 3.1.2 Umkehrfunktion und Verkettung von Funktionen 3.7 Definition: Umkehrfunktion Sei f : D → R und sei D0 ⊆ D. f heißt umkehrbar über D0 , wenn zu jedem y ∈ f (D0 ) die Gleichung y = f (x) genau eine Lösung x ∈ D0 hat. Hierdurch wird die Umkehrfunktion f −1 : f (D0 ) → D0 y 7→ x = f −1 (y) definiert, welche jedem y ∈ f (D0 ) das durch y = f (x) eindeutig definierte x ∈ D0 zuordnet. Die Zuordnungsvorschrift der Umkehrfunktion f −1 erhält man, indem man die Gleichung f (x) = y nach x auflöst. 3.8 Beispiel Wir betrachten die Funktion f : R → R mit x 7→ x2 . Hier ist D = R und W = R. Wollen wir die Umkehrfunktion f −1 berechnen, so müssen, damit die Gleichung x2 = y stets eindeutig lösbar ist, Wertebereich und Definitionsbereich von f verkleinert werden zu W = R≥0 und D = R≥0 . Den Graphen der Umkehrfunktion erhält man durch Spiegelung des Funktionsgraphen an der Winkelhalbierenden: 34 3 Funktionen y 4 y = x2 3 2 y= √ x 1 x 1 2 3 4 Abbildung 3.1: Graph der Umkehrfunktion Verkettung von Funktionen Werden zwei Funktionen betrachtet, welche die Eigenschaft haben, dass der Wertebereich der einen Funktion im Definitionsbereich der anderen enthalten ist, so können diese Funktionen nacheinander ausgeführt werden. 3.9 Definition: Verkettung von Funktionen Seien f : D → R und g : E → R Funktionen mit D, E ⊆ R und g(E) ⊆ D, dann wird die Verkettung von f und g, gesprochen „f nach g“, definiert durch: (f ◦ g) : E → R (f ◦ g)(x) := f (g(x)). 3.10 Bemerkung Die Operation „Verkettung“ ist nicht kommutativ. Im Allgemeinen ist (f ◦ g)(x) 6= (g ◦ f )(x), wie wir an diesem einfachen Beispiel sehen: Seien zwei Funktionen f, g gegeben durch f :R→R g : R≥0 → R≥0 √ g(x) = x. f (x) = 3x + 7 Dann ist f ◦ g : R≥0 → R≥0 √ √ (f ◦ g)(x) = f (g(x)) = f ( x) = 3 x + 7 35 3 Funktionen und g ◦ f : {x ∈ R | x ≥ − 73 } → R≥0 √ (g ◦ f )(x) = g(f (x)) = g(3x + 7) = 3x + 7 , welches offensichtlich verschiedene Funktionen sind. 3.2 Polynome Ein Polynom n-ten Grades ist eine Funktion vom Typ f (x) = an xn + an−1 xn−1 + ... + a1 x + a0 mit a0 , ..., an ∈ R und an 6= 0. Man schreibt grad(f ) = n. Kennt man eine Nullstelle eines Polynoms, so kann man diese als Linearfaktor „abspalten“. Hierzu betrachten wir zunächst ein Polynom 2. Grades: f2 (x) = ax2 + bx + c (3.3) und nehmen an, dieses habe eine Nullstelle in x1 : f2 (x1 ) = ax21 + bx1 + c = 0. Dann ist f2 (x) = f2 (x) − f2 (x1 ) für jedes x ∈ R, also ist f2 (x) = f2 (x) − f2 (x1 ) (1) = ax2 + bx + c − (ax21 + bx1 + c) = a(x2 − x21 ) + b(x − x1 ) (2) = a(x − x1 )(x + x1 ) + b(x − x1 ) = (x − x1 ) · (a(x + x1 ) + b) | {z } Linearf aktor | {z =:f1 (x) } wobei wir in (1) die Funktionsgleichung (3.3) von f2 und in (2) die binomische Formel verwendet haben. f1 (x) = ax + (ax1 + b) ist ein Polynom 1. Grades, wir haben also f2 zerlegt in einen Linearfaktor und ein Polynom f1 mit grad f1 = 1. Ist nun allgemein fn (x) ein Polynom n-ten Grades und ist x1 eine Nullstelle von fn (x), so gibt es ein Polynom fn−1 (x) mit grad fn−1 = (n − 1), so dass fn (x) = (x − x1 ) · fn−1 (x). 36 3 Funktionen Hat fn−1 (x) eine Nullstelle in einem x2 ∈ R, so kann man diesen Schritt wiederholen und erhält schließlich die Darstellung fn (x) = (x − x1 ) · . . . · (x − xk ) · fn−k (x), wobei fn−k (x) ein Polynom vom Grad (n − k) ist und keine reellen Nullstellen hat. 3.11 Satz Ist fn (x) ein Polynom n-ten Grades, so gilt i) fn hat höchstens n Nullstellen. ii) Sind x1 , . . . , xk ∈ R Nullstellen von fn (x), so gibt es ein Polynom fn−k (x), mit grad(fn−k ) = n − k, welches keine reellen Nullstellen hat und fn (x) = (x − x1 )(x − x2 ) · . . . · (x − xk )fn−k (x). Man beachte, dass die x1 , . . . , xk nicht verschieden sein müssen. iii) fn (x) konvergiert für x → ±∞: ( a) falls n gerade ⇒ limx→±∞ fn (x) = +∞ limx→±∞ fn (x) = −∞ ( b) falls n ungerade ⇒ limx→±∞ fn (x) = ±∞ limx→±∞ fn (x) = ∓∞ falls an > 0 falls an < 0 falls an > 0 falls an < 0 iv) fn hat für ungerades n mindestens eine Nullstelle. Spezialfälle: 1. Für n = 1 ist f (x) = ax + b mit a 6= 0, f ist eine Gerade (nicht parallel zur x-Achse) und hat genau eine Nullstelle in x1 = − ab . 2. Für n = 2 ist f2 eine quadratische Funktion f2 (x) = ax2 + bx + c mit den möglichen Nullstellen v u 2 u b b c x1,2 = − ± u − 2a u 2a a t | {z } =:D ⇒ f2 hat 2 reelle Nullstellen, 1 reelle Nullstelle, keine reelle Nullstelle, falls D > 0 falls D = 0 falls D < 0. Hieraus ergibt sich insbesondere, dass im Falle zweier Nullstellen x1 , x2 gilt (s. Abbildung 37 3 Funktionen 3.2) f2 (x) = a(x − x1 )(x − x2 ) und falls f2 (x) genau eine Nullstelle x1 hat, gilt: f2 (x) = a(x − x1 )2 . Formt man f2 (x) = ax2 + bx + c zur Scheitelpunktform f2 (x) = a(x + b 2 b2 ) − +c 2a 4a um, so sieht man, dass der Graph von f stets eine verschobene und um den Faktor a gestreckte Standardparabel ist, welcher also symmetrisch ist zur Parallelen zur y - Achse, welche durch den Scheitelpunkt der Parabel verläuft. R R x1 b − 2a x2 2 b - 4a +c Abbildung 3.2: Symmetrieachse, Nullstellen und Scheitelpunkt einer Parabel 3.3 Rationale Funktionen Sind p(x), q(x) Polynome mit grad(p) = n, grad(q) = m und m ≥ 1, so heißt der Quotient f (x) = p(x) an xn + an−1 xn−1 + . . . a1 x + a0 = q(x) bm xm + bm−1 xm−1 + . . . + b1 x + b0 rationale Funktion. Der Definitionsbereich D von f ist ganz R ohne die Nullstellen des Nenners q(x): D(f ) = {x ∈ R | q(x) 6= 0}. Nullstellen von f sind die Nullstellen von p welche in D(f ) liegen. Um den Verlauf des Graphen von f skizzieren zu können, untersuchen wir das asymptotische Verhalten für x → ±∞ und die Polstellen von f : 38 3 Funktionen I. Asymptotisches Verhalten für x → ±∞ Es sind die 3 Fälle n < m, n = m und n > m zu untersuchen: I.1 Ist der Grad des Zählerpolynoms kleiner als der des Nennerpolynoms, n < m, so dominiert für große Werte von x die Nennerfunktion, und es ist lim x→±∞ p(x) =0 q(x) was wir an der Funktion f (x) = f (x) = x−1 3x2 +x+1 beispielhaft beobachten: 1 1 x2 x−1 x − x2 = · 3x2 + x + 1 x2 3 + x1 + x12 −→ x→±∞ 0 =0 3 I.2 Stimmen Zählergrad und Nennergrad überein, n = m, so ist lim x→±∞ p(x) an . = q(x) bn was wir uns wiederrum an einem Beispiel verdeutlichen: 2x3 + x2 + 1 4x3 + 10x2 + x 2 + x−1 + x−3 = 4 + 10x−1 + x−2 2 1 −→ = . x→±∞ 4 2 f (x) = | : x3 ∼ I.3 Ist der Zählergrad größer als der Nennergrad, n > m, dann existiert ein Polynom p(x) ∼ mit grad( p) = n − m und ein Polynom r(x) mit grad(r) < m, so dass p(x) ∼ r(x) = p(x) + . q(x) q(x) Hierzu betrachten wir als Beispiel p(x) 2x3 − x − 1 = q(x) x2 − 1 Mittels Polynomdivision erhält man =r(x) 2x3 z }| { x−1 −x−1 = |{z} 2x + 2 . −1 x − 1} ∼ | {z = p(x) x2 =q(x) ∼ 3 2x −x−1 Für x → ±∞ verhält sich p(x) wie die Gerade p(x) = 2x. da aus I.1 folgt, q(x) = x2 −1 x−1 dass limx→±∞ x2 −1 = 0 da grad(r) < grad(q) ist. Wir sehen hier, dass für große Werte 39 3 Funktionen von x wiederum in p(x) und q(x) die Terme höchster Ordnung dominieren, so dass sich f verhält wie eine Polynom vom Grad (n − m). II. Polstellen: Mögliche Polstellen sind die Nullstellen der Nennerfunktion. Hat q(x) in x0 eine Nullstelle, q(x0 ) = 0, so können wir q(x) schreiben als ∼ q(x) = (x − x0 )k · q(x), (3.4) ∼ wobei q(x0 ) 6= 0 ist und k die Vielfachheit der Nullstelle angibt. Zu untersuchen ist nun, ob auch die Zählerfunktion p(x) in x0 eine Nullstelle hat oder nicht: II.1 Ist p(x0 ) 6= 0, dann ist p(x) 1 p(x) = ·∼ , k q(x) (x − x0 ) q(x) wobei p(x0 ) q (x0 ) ∼ 6= 0 ist. Dann hat p(x) q(x) in x0 einen Pol der Ordnung k, der Pol ist mit Vorzeichenwechsel, ohne Vorzeichenwechsel, falls k ungerade falls k gerade ist. ∼ ∼ II.2 Ist p(x0 ) = 0, dann ist analog zu (3.4) p(x) = (x − x0 )j p(x0 ) mit p(x0 ) 6= 0, so dass ∼ (x − x0 )j p(x) p(x) = · , q(x) (x − x0 )k ∼ q(x) ∼ ∼ wobei q(x0 ) 6= 0 und p(x0 ) 6= 0. Nun sind die Fälle j ≥ k und j < k zu unterscheiden: i) j ≥ k: x0 ist eine hebbare Singularität, denn es ist f (x) = ∼ p(x) (x − x0 )j−k · ∼ p(x) = ∼ p(x) q(x) ∼ q (x) falls j > k falls j = k, q (x) ∼ so dass f (x0 ) = 0 im Falle j > k und f (x0 ) = p(x0 ) q (x0 ) ∼ im Falle j = k gilt. ii) j < k: x0 ist ein Pol der Ordnung k − j ∼ f (x) = p(x) 1 p(x) = ·∼ . k−j q(x) (x − x0 ) q(x) 3.12 Beispiel Gegeben sei die Funktion f (x) = p(x) 2x3 − x − 1 = . q(x) x2 − 1 Hier hat q(x) zwei Nullstellen, x1 = 1 und x2 = −1. 40 3 Funktionen 1. x1 = 1: Es ist q(1) = 0 und p(1) = 0, ∼ p(x) x − 1 2x2 + 2x + 1 x − 1 p(x) = · = · , q(x) x−1 x+1 x−1 ∼ q(x) ∼ ∼ und da p(1) 6= 0 und q(1) 6= 0, liegt der Fall k = j, also II.2 i) vor. Daher hat f in x0 = 1 eine hebbare Singularität und wir setzen ∼ f (1) = p(1) ∼ q(1) = 5 2+2+1 = . 1+1 2 2. x2 = −1: Es ist q(−1) = 0 und p(−1) = −2. Da q(x) = (x − 1)(x + 1) ist, ist x2 = −1 eine Polstelle der Ordnung 1: p(x) 1 2x3 − x − 1 , = · q(x) x+1 x − 1 | {z } ∼ = q (x) es liegt also der Fall II.1 vor mit k = 1, daher ist x2 = −1 eine Polstelle mit Vorzeichenwechsel. 3.4 Die allgemeine Potenzfunktion Zunächst ist die Potenzfunktion f (x) = xα durch xα := |x · .{z . . · x} (3.5) α−mal nur definiert für positive ganze Zahlen α ∈ N. Diese Definition wollen wir verallgemeinern für √ − 25 2 und x definiert sind. Wir gehen schrittweise vor: α ∈ R, so dass auch Terme vom Typ x 1.) Für Werte α ∈ Z und α < 0 definieren wir xα = 1 . x−α (3.6) Beachte hierbei, dass −α > 0 ist, also durch Gleichung (3.5) erklärt. Für diese Erweiterung muss x ∈ R \ {0} gelten. 1 2.) Es wird x n definiert als das Urbild der umkehrbaren Funktion f : [0, ∞) → [0, ∞), √ 1 f (x) = xn . Man schreibt hierfür auch x n = n x. Diese Defintion ist nur möglich für x ∈ R>0 . 3.) Für α = m n ,m ∈ Z, n ∈ N definieren wir m 1 xa = x n = (x m )n . Jetzt ist der Ausdruck xα definiert für alle α ∈ Q und x ∈ R>0 . 41 3 Funktionen 4.) Nun sei α ∈ R. Wir nähern α durch Brüche an, wie wir es in Beispiel 2.10 f) getan haben. Sei (an )n∈N eine Folge aus Q, mit limn→∞ an = α, so setzen wir xα = lim xan . n→∞ Damit ist die Potenzfunktion f (x) = xα definiert für jede Potenzα ∈ R und Argumente x ∈ R. R a>1 4 a<0 a=1 3 2 0<a<1 1 a=0 R 1 2 3 4 Abbildung 3.3: Qualitativer Verlauf der Graphen von xa 3.13 Bemerkung Für die oben definierten Potenzfunktionen gelten die folgenden Rechenregeln: xα+β = xα xβ α β αβ (x ) = x α α (3.7) (3.8) α (x y) = x y . (3.9) 3.5 Die allgemeine Exponentialfunktion Nun vertauschen wir in Gleichung (3.5) die Rollen von Exponent und Basis. Zu einer festen Basis a sei der Exponent das Argument der Funktion, so definieren wir durch expa : R → R>0 x 7→ a (3.10) x die Exponentialfunktion zur Basis a. Aus den Rechenregeln (3.7) der Potenzfunktion ergibt sich unmittelbar die Funktionalgleichung der Exponentialfunktion expa (x + y) = expa (x) expa (y). 42 (3.11) 3 Funktionen Ferner folgen aus (3.8) und (3.9) die Rechenregeln (expa (x))y = expa (x y) (3.12) expa (x) expb (x) = expa b (x). (3.13) Die Exponentialfunktion ist definiert für Basen a ∈ R>0 und Argumente x ∈ R. In Abbildung 3.4 der Verlauf des Graphen der Exponentialfunktion für verschiedene Werte der Basis a dargestellt. R 0<a<1 a>1 a=1 R Abbildung 3.4: Der Graph der allgemeinen Exponentialfunktion expa (x) 3.5.1 Exponentialfunktion zur Basis e Stellen wir uns nun vor, wie sich der Graph der allgemeinen Exponentialfunktion verändert, wenn ausgehend von a = 1 die Basis a immer größer wird, dann sehen wir, dass es gerade eine Basis ã gibt, für die der Graph expã (x) immer oberhalb der Funktion f (x) = 1 + x liegt, siehe hierzu Abbildung 3.5. Diese Basis bezeichnen wir mit e und wir werden später sehen, dass die so definierte Zahl e übereinstimmt mit der Eulerschen Zahl e, die wir in den Beispielen 2.2 d) und 2.15 g) kennengelernt haben als Grenzwert einer unendlichen Reihe. R ex 1+x R Abbildung 3.5: Es ist expe (x) ≥ 1 + x für alle x ∈ R 43 3 Funktionen Wäre die Basis der Exponentialfunktion in Abbildung 3.5 kleiner, so verliefe der Graph flacher und für einige x > 1 wäre ex < 1 + x. Wäre hingegen die Basis größer, so verliefe der Graph steiler und es wäre ex < 1 + x für einige x < 0. 3.14 Folgerungen 1) Die Exponentialfunktion ist positiv, dieses folgt aus ihrer Definition mittels der allgemeinen Potenzfunktion in Abschnitt 3.4. 2) Da ex > 1 + x gilt, ist ex > 1 für x > 0. 3) Die Exponentialfunktion ist streng monoton wachsend, denn aus x < y folgt ex < ey : x x ey = e(y−x)+x = e| y−x {z } · e > e , >1 da y − x > 0, so dass nach Folgerung 2) ey−x > 1 gilt. 4) Für das asymptotische Verhalten der Exponentialfunktion gilt lim ex = ∞, lim x→∞ x→−∞ ex = 0. 3.6 Die allgemeine Logarithmusfunktion Aus den Folgerungen 3.14 3) und 4) folgt, dass die Exponentialfunktion expa : R → R>0 für a 6= 1 umkehrbar ist. Die Umkehrfunktion heißt Logarithmusfunktion zur Basis a und wird notiert durch: loga : R>0 → R (3.14) y 7→ loga (y) mit a > 0 und a 6= 1. Es gilt also ⇐⇒ x = loga (y) ax = y. (3.15) Dieses impliziert insbesondere dass aloga (y) = y ∀y ∈ R>0 (3.16) loga (ax ) = x ∀x ∈ R. (3.17) und Funktionalgleichung: Aus der Funktionalgleichung der Exponentialfunktion (3.11) lässt sich eine Funktionalgleichung für den Logarithmus herleiten: loga (x y) = loga (x) + loga (y), 44 (3.18) 3 Funktionen denn es ist loga (x y) = loga (aloga (x) aloga (y) ) = loga (a loga (x)+loga (y) | folgt aus (3.16) | folgt aus (3.11) ) | folgt aus (3.17) = loga (x) + loga (y) Als verallgemeinerung der Funktionalgleichung (3.18) gilt das Logarithmengesetz loga (xα ) = α loga (x) (3.19) 3.15 Folgerungen 1) Es ist loga (1) = 0, was aus a0 = 1 folgt. 2) Eine wichtige Folgerung aus der Funktionalgleichung und Folgerung 1) ist: ⇐⇒ ⇐⇒ ⇐⇒ loga (1) = 0 x loga ( ) = 0 x 1 loga (x) + loga = 0 x 1 loga ( ) = − loga (x). x x einsetzen x | (3.18) anwenden |1= (3.20) 3) Aus der Funktionalgleichung (3.18) und Folgerung a) folgt x loga ( ) = loga (x) − loga (y). y (3.21) 4) Ein Spezialfall des Logarithmengesetzes (3.19) ist loga (xn ) = loga (x · . . . · x) = loga (x) + . . . + loga (x) = n loga (x) für natürliche Zahlen n ∈ N. Der natürliche Logarithmus Dir Logarithmusfunktion zur Basis e heißt natürlicher Logarithmus: ln : R>0 → R y 7→ ln (y) und es ist ln (y) = x, für das x, für welches ex = y gilt. Dann ist: eln (y) = y ∀y ∈ R>0 (3.22) ln (ex ) = x ∀x ∈ R. (3.23) und 45 3 Funktionen Basiswechsel der Logarithmusfunktion Möchte man die Basis eines Logarithmus wechseln, so erhält man wie folgt eine Formel: Ist ay = x, so ist y = loga (x). Also erhält man mit ln(ay ) = y ln(a) dass ay = x | logb anwenden y | folgt aus (3.19) ⇐⇒ logb (a ) = logb (x) ⇐⇒ y logb (a) = logb (x) logb (x) y= logb (a) ⇐⇒ so dass wir mit y = loga (x) eine Formel zum Basiswechsel erhalten: ⇐⇒ loga (x) = logb (x) . logb (a) (3.24) 3.7 Trigonometrische Funktionen Die Winkelfunktionen sin(t) und cos(t) lassen sich geometrisch definieren. Betrachten wir den Einheitskreis S = {(x, y) ∈ R2 | x2 + y 2 = 1} und tragen auf dem Kreisbogen die Bogenlänge t entgegen dem Uhrzeigersinn ab, so erhalten wir den Punkt (x(t), y(t)). Die Winkelfunktionen werden nun über dessen x - und y - Koordinaten definiert: cos(t) := x(t), sin(t) := y(t). (3.25) y(t) cos(t) 1 1 sin(t) t sin(t) x(t) -1 cos(t) 1 t −2π -1 − 32 π −π − π2 + π2 -1 Abbildung 3.6: Definition von cos(t) und sin(t) Aus dieser Definition ergeben sich unmittelbar die folgenden Eigenschaften: 46 π 3 2π 2π 3 Funktionen 3.16 Folgerungen a) Aus dem Satz des Pythagoras folgt cos2 (t) + sin2 (t) = 1 (3.26) für jedes t ∈ R. b) Die Funktionen sin(t) und cos(t) sind 2π - periodisch, es ist cos(t + 2π) = cos(t), sin(t + 2π) = sin(t) (3.27) woraus wegen sin(0) = 0 und Gleichung cos( π2 ) = 0 insbesondere sin(t) = 0 ⇔ t = kπ für ein k ∈ Z (3.28) cos(t) = 0 π ⇔ t = kπ + 2 für ein k ∈ Z (3.29) folgt. c) Ebenfalls aus der Definition (3.25) folgen die Symmetrieeigenschaften (Vergleiche hierzu auch Definition 3.4 v) und vi).) sin(−t) = − sin(t), cos(−t) = cos(t). (3.30) d) Die Graphen von cos(t) und sin(t) sind gegeneinander verschoben (s. Abbildung 3.6): cos(t + π ) = − sin(t), 2 sin(t + π ) = cos(t) 2 e) Elementargeometrisch lassen sich die Additionstheoreme sin(t + s) = sin(t) cos(s) + sin(s) cos(t) (3.31) cos(t + s) = cos(t) cos(s) − sin(t) sin(s) (3.32) beweisen. Die Funktionen tan(t) und cot(t) werden definiert durch π tan : R \ {(2k + 1) | k ∈ Z} → R, 2 cot : R \ {kπ | k ∈ Z} → R, sin(t) cos(t) cos(t) cot(t) = , sin(t) tan(t) = (3.33) (3.34) die Einschränkungen der Definitionsbereiche ergben sich aus den Nullstellen der sin - und cos - Funktionen, s. (3.28). Aus ihrer Definition ergibt sich, dass die tan - und cot - Funktion periodisch sind mit Periode π. Da die trigonometrischen Funktionen periodisch sind, sind sie 47 3 Funktionen nicht umkehrbar ohne dass zuvor die Definitionsbereiche geeignet eingeschränkt werden. π π sin : [− , ] → [−1, 1] 2 2 cos : [0, π] → [−1, 1] π π tan : (− , ) → R 2 2 cot : (0, π) → R R π π arcsin : [−1, 1] → [− , ] 2 2 ist umkehrbar mit arccos : [−1, 1] → [0, π] π π ist umkehrbar mit arctan : R → (− , ) 2 2 ist umkehrbar mit arccot : R → (0, π). ist umkehrbar mit tan(t) R + π2 R − 32 π − π2 + π2 R 3 2π arctan(t) − π2 Abbildung 3.7: tan(t) und arctan(t) R R + π2 1 R R − π2 + π2 -1 -1 1 − π2 Abbildung 3.8: sin(t) und arcsin(t) 48 3 Funktionen 3.8 Sigmoidfunktionen Von besonderem Interesse in Biologie und Chemie sind Funktionen, mit denen sich Sättigungsprozesse beschreiben lassen. Hierzu gibt es einerseits Funktionen, wie zum Beispiel f (t) = S − c e−kt , (3.35) welche mit den Parametern S, c ∈ R und k ∈ R>0 gegen den Sättigungswert S streben. Ist c > 0, so beschreibt diese Funktion einen Zerfallsprozess, ist c < 0, so beschreibt sie einen Wachstumsprozess, siehe hierzu Abbildung 3.9. Der Verlauf dieser Kurve berücksichtigt f (t) c<0 S c>0 t Abbildung 3.9: Beschränktes Wachstum, beschränkter Zerfall nun jedoch noch nicht, dass viele Prozesse auch zu Beginn nur eine kleine Änderungsrate (bzw. Wachstumsrate) haben, diese ansteigt und ein Maximum erreicht, die Änderungsrate dann aber wieder abnimmt und die Funktion sich einem Sättigungswert nähert. Funktionen, deren Verlauf ein solches Verhalten wiedergeben, werden als Sigmoidfunktionen bezeichnet, ihr Graph erinnert an ein langgestrecktes, liegendes „S“. Beispiele hierfür sind die Funktion arctan(x) (siehe Abbildung 3.7) oder auch die Funktion P (t) = K 1+ K−P0 −cKt P0 e , deren Graph in Abbilung 3.10 dargestellt ist. P (t) K t Abbildung 3.10: Qualitativer Verlauf des logistischen Wachstums 49 4 Differentialrechnung 4.1 Grenzwert einer Funktion, Stetigkeit Sei I ⊆ R ein offenes Intervall mit einem Punkt a ∈ I und f eine Funktion die auf I, eventuell mit Ausnahme des Punktes a, definiert ist: f : I\{a} → R 4.1 Definition: Grenzwert einer Funktiom Eine Funktion f : I\{a} → R hat in a den Grenzwert c ∈ R, wenn für jede beliebige Folge (xn )n∈N aus I mit limn→∞ xn = a gilt: lim f (xn ) = c. n→∞ Hierfür schreibt man auch lim f (x) = c, x→a wobei durch die Notation x → a zum Ausdruck kommt, dass der Grenzwert c nicht von der Wahl einer speziellen Folge (xn )n∈N abhängig sein darf. 4.2 Beispiele a) Wähle I = (−1, 1) und untersuche f (x) = lim n→∞ 1 x an der Stelle a = 0. Für xn := 1 n ist 1 = lim n = ∞, xn n→∞ also hat f keinen Grenzwert in a = 0, da ∞ ∈ / R. b) Wähle I = (−2, 2) und untersuche f (x) = x2 an der Stelle a = 1, 5. Es sei (xn )n∈N eine 50 4 Differentialrechnung beliebige Folge mit limn→∞ xn = a. Zu zeigen, ist, dass limn→∞ f (xn ) existiert: lim f (xn ) = lim x2n n→∞ n→∞ (∗) = lim xn lim xn n→∞ n→∞ = 1, 52 = 2, 25. Wir sehen, dass unabhängig von der gewählten Folge (xn )n∈N die Folge der Funktionswerte gegen den gleichen Grenzwert konvergiert. Die Funktion f (x) = x2 hat daher in a = 1, 5 den Grenzwert 2, 25. 4.3 Definition: Stetigkeit i) Eine Funktion f : I → R heißt stetig an der Stelle a ∈ I genau dann wenn lim f (x) = f (a). x→a ii) f : I → R heißt stetig auf dem Intervall I genau dann wenn f stetig in jedem a ∈ I ist. 4.4 Satz: Stetige Funktionen i) Sind f und g auf einem Intervall I ⊆ R stetige Funtkionen und α ∈ R, so sind auch die Funktionen (f + g), (f · g) und αf stetig auf I. fg ist stetig in allen x ∈ I mit g(x) 6= 0. ii) Sind f : I → R, g : D → R stetig und g(D) ⊆ I, dann ist auch die Verkettung h = f ◦ g, h: D→R h(x) = f (g(x)) stetig auf D. 4.5 Beispiele a) f (x) = x ist stetig auf ganz R: Sei a ∈ R beliebig und (xn )n∈N eine Folge mit limn→∞ xn = a. Dann ist lim f (xn ) = lim xn = a = f (a). n→∞ n→∞ 51 4 Differentialrechnung Also ist lim f (xn ) = f (a). n→∞ b) Aus Beispiel a) folgt zusammen mit dem Satz 4.4, dass alle Polynome auf R stetig sind und alle rationalen Funktionen auf ihrem Definitionsbereich stetig sind. c) sin (x), cos (x) und ex sind stetig auf R, ln(x) ist stetig auf R>0 . (ohne Beweis) 4.6 Satz Seien a, b ∈ R, a < b, und f : [a, b] → R eine auf dem abgeschlossenen Intervall [a, b] stetige Funktion. i) (Zwischenwertsatz) Dann nimmt f jeden Wert zwischen f (a) und f (b) an. Zu jedem c ∈ R mit f (a) ≤ c ≤ f (b), bzw. f (a) ≥ c ≥ f (b), gibt es ein x ∈ [a, b] so dass f (x) = c. ii) (Existenz von Minimum und Maximum) Es existieren x− , x+ ∈ [a, b], so dass f in diesen Punkten ihren größten bzw. kleinsten Funtionswert auf dem Intervall [a, b] annimmt: f (x− ) ≤ f (x) ≤ f (x+ ) ∀x ∈ [a, b]. 4.7 Bemerkung Aus i) folgt speziell: Ist f : [a, b] → R stetig und f (a) < 0 und f (b) > 0, dann hat f hat eine Nullstelle in [a, b]: ∃ y ∈ [a, b] mit f (y) = 0. Um die Aussage von Satz 4.6 Teil ii) zu veranschaulichen, betrachten wir die folgenden Beispiele: 4.8 Beispiele a) Sei f (x) = x2 auf dem Intervall [a, b] = [−2, 3]. Dann ist 0 ≤ x2 ≤ 9 für alle x ∈ [−2, 3] und da f (0) = 0 und f (3) = 9 ist x− = 0 und x+ = 3. b) Die Funktion ( f (x) = 1 , x2 0, x 6= 0 x=0 ist auf dem Intervall I = [−1, 1] nicht stetig und es gibt kein x+ , denn limx→0 52 1 x2 =∞ 4 Differentialrechnung c) Sei I = [0, 4] und ( f (x) = 3x, 1, x<2 x ≥ 2. Es gibt kein x+ an welchem das Maximum der Funktionswerte auf I = [0, 4] angenommen wird, denn es müsste f (x+ ) = 6 sein, so ein x+ gibt es nicht, da f (2) = 1. 4.2 Ableitung einer Funktion 4.2.1 Definition der Ableitung 4.9 Definition Sei f : I → R, I = (a, b) sei ein offenes Intervall und x0 ∈ I. i) f heißt an der Stelle x0 ∈ I differenzierbar, falls der Grenzwert der Differenzen(x0 ) quotienten f (x)−f existiert. Der Grenzwert heißt Ableitung von f an der Stelle x−x0 x0 und man schreibt f 0 (x0 ) = lim x→x0 f (x) − f (x0 ) . x − x0 (4.1) ii) Ist f in jedem x0 ∈ I differenzierbar, so heißt f differenzierbar auf I und f 0 heißt Ableitung von f . Eine äquivalente Formulierung zu obiger Definition ist durch f 0 (x0 ) = lim h→0 f (x0 + h) − f (x0 ) h gegeben, was man aus (4.1) erhält, wenn man h = x − x0 setzt. Legen wir an den Graphen von f eine Tangente tx0 (x) an, so ist diese eine Gerade mit Steigung f 0 (x0 ), welche den Graphen von f in x0 berührt (tx0 (x0 ) = f (x0 )) und wird beschrieben durch Gleichung tx0 (x) = f (x0 ) + f 0 (x0 )(x − x0 ) (4.2) siehe hierzu Abb. 4.1. Die Tangente ist eine lineare Approximation von f in der Nähe von x0 : f (x) = f (x0 ) + f 0 (x0 )(x − x0 ) +rx0 (x). | {z linear in x (4.3) } Hier ist rx0 eine sogenannte Fehlerfunktion, welche die Abweichung der Funktion f (x) von der Tangente tx0 (x) beschreibt. 4.10 Bemerkung Ist f differenzierbar in x0 , dann ist f auch stetig in x0 . 53 4 Differentialrechnung R f (x) tx0 (x) rx0 (x) R -3 -2 -1 1 x0 3 Abbildung 4.1: Funktion f (x) und Tangente tx0 (x) in x0 = 2 4.11 Beispiele a) f (x) = c ist differenzierbar in jedem x0 ∈ R: =⇒ f (x) − f (x0 ) c−c = =0 x − x0 x − x0 f (x) − f (x0 ) f 0 (x0 ) = lim =0 x→x0 x − x0 b) f (x) = mx + c ist differenzierbar in jedem x0 ∈ R: mx + c − (mx0 + c) f (x) − f (x0 ) = =m x − x0 x − x0 f (x) − f (x0 ) ⇒ f 0 (x0 ) = lim =m x→x0 x − x0 c) f (x) = x2 ist differenzierbar in jedem x0 ∈ R: f (x) − f (x0 ) x2 − x20 (x − x0 )(x + x0 ) = = = x + x0 −→ 2x0 x→x0 x − x0 x − x0 x − x0 0 ⇒ f (x0 ) = 2x0 54 4 Differentialrechnung 4.2.2 Ableitung der elementaren Funktionen 4.12 Satz: Elementare Ableitungsregeln Seienf, g : I → R aus I differenzierbar. Dann ist auch i) (f + g) : I → R differenzierbar, mit (f + g)0 (x) = f 0 (x) + g 0 (x) (Summenregel) ii) (f · g) : I → R differenzierbar, mit (f · g)0 (x) = f 0 (x)g(x) + f (x)g 0 (x) iii) f g (Produktregel) : I → R differenzierbar (falls g(x) 6= 0), mit 0 f g (x) = f 0 (x)g(x) − f (x)g 0 (x) (g(x))2 (Quotientenregel) iv) Ist g : I → I, so ist auch (f ◦ g) : I → R differenzierbar, mit (f ◦ g)0 (x) = f 0 (g(x)) · g 0 (x) Beweis. (Kettenregel) i) Wir wenden Definition 4.9 auf die Summe f + g an und erhalten (f (x) + g(x)) − (f (x0 ) + g(x0 )) x→x0 x − x0 f (x) − f (x0 ) g(x) − g(x0 ) (∗) = lim + x→x0 x − x0 x − x0 0 0 = f (x0 ) + g (x0 ), (f + g)0 (x0 ) = lim wobei wir in (∗) lediglich die Summanden im Zähler umgestellt haben. ii) Wiederum wenden wir Definition 4.9 an und fügen in der Umformung (∗) im Zähler −f (x0 )g(x) + f (x0 )g(x) ein: (f (x)g(x)) − (f (x0 )g(x0 )) x − x0 f (x)g(x) − f (x0 )g(x) + f (x0 )g(x) − f (x0 )g(x0 ) = lim x→x0 x − x0 (f · g)0 (x0 ) = lim x→∞ (∗) f (x) − f (x ) g(x) − g(x0 ) 0 g(x) +f (x0 ) x→x0 | {z } x − x0 x − x0 | {z } →g(x0 ) | {z } = lim →f 0 (x0 ) 0 →g 0 (x0 ) 0 = f (x0 )g(x0 ) + f (x0 )g (x0 ) Hier folgt limx→x0 g(x) = g(x0 ) aus der Stetigkeit von g. 55 4 Differentialrechnung iv) Wir wenden Definition 4.9 auf die Verkettung an und erweitern den Differenzenquotienten mit g(x) − g(x0 ): f (g(x)) − f (g(x0 )) x − x0 f (g(x)) − f (g(x0 )) g(x) − g(x0 ) = lim · x→x0 x − x0 g(x) − g(x0 ) f (g(x)) − f (g(x0 )) g(x) − g(x0 ) = lim · x→x0 g(x) − g(x0 ) x − x0 0 0 = f (g(x0 )) · g (x0 ). (f ◦ g)0 (x0 ) = lim x→x0 Hiermit können wir die ersten elementaren Funktionen ableiten: 1. Polynome: Aus (xk )0 = k xk−1 folgt für allgemeine Polynome f (x) = an xn +an−1 xn−1 + . . . + a1 x + a0 f 0 (x) = n an xn−1 + (n − 1)an−1 xn−2 + . . . + a1 2. Rationale Funktionen: Rationale Funktionen f (x) = abgeleitet werden durch f 0 (x) = p(x) q(x) können mit der Kettenregel q(x)p0 (x) − q 0 (x)p(x) , (q(x))2 wobei p0 (x) und q 0 (x) nach der Regel a) für Polynome abgeleitet werden. Speziell gilt für p(x) = 1: 1 q(x) 0 p (x) = 0 f (x) = ⇒ ⇒ 1 q(x) 0 =− q 0 (x) , (q(x))2 womit wir beispielsweise ( x1 )0 = − x12 erhalten. 3. Exponentialfunktion zur Basis e: Die Exponentialfunktion zur Basis e, welche wir hier durch exp(x) notieren, wurde in Abschnitt 3.5.1 eingeführt als diejenige Exponentialfunktion, deren Tangente im Punkt x = 0 die Gerade t0 (x) = 1 + x ist, siehe hierzu Abbildung 3.5. Hieraus ergibt sich, dass die Ableitung der Exponentialfunktion in der Stelle x = 0 gleich der Steigung der Tangente t0 (x) ist: exp0 (0) = 1 56 4 Differentialrechnung es gilt also für den Differenzenquotienten exp(h) − exp(0) = 1. h→0 h lim Wollen wir nun die Exponentialfunktion an einer anderen Stelle x ∈ R ableiten, so verwenden wir die Ableitung an der Stelle 0 und die Funktionalgeleichung der Exponentialfunktion: exp(h) − exp(0) exp(x + h) − exp(x) = lim exp(x) h→0 h→0 h h exp(h) − exp(0) = exp(x) lim = exp(x). h→∞ h exp0 (x) = lim 4. Trigonometrische Funktionen: Für alle x ∈ R gilt (ohne Beweis) sin0 (x) = cos(x), sin (x) cos (x) Aus hieraus folgt für tan (x) := cos0 (x) = − sin(x) mit der Quotientenregel: cos (x) cos (x) + sin (x)(− sin (x)) cos2 (x) cos2 (x) + sin2 (x) (∗) = = 1 + tan2 (x), cos2 (x) tan0 (x) = wobei in (∗) ebenso zu tan0 (x) = 1 cos2 (x) (4.4) umgeformt werden kann. 4.13 Beispiele a) Summenregel: f (x) = x2 + sin (x) ⇒ f 0 (x) = 2x + cos (x) b) Produktregel: f (x) = x2 · sin (x) ⇒ f 0 (x) = 2x · sin (x) + x2 · cos (x) c) Die Funktion h(x) = sin (x2 ) leiten wir mit der Kettenregel ab, in dem wir in h(x) = f (g(x)) als äußere Funktion f (y) = sin (y) und als innere Funktion g(x) = x2 einsetzen. 57 4 Differentialrechnung Dann ist h0 (x) = f 0 (g(x)) · g 0 (x) = sin0 (g(x)) · (x2 )0 = cos(g(x)) · 2x = cos (x2 ) · 2x. Die Logarithmusfunktion, die allgemeine Potenzfunktion und die Umkehrungen der trigonometrischen Funktionen können wir bisher nicht ableiten. Hier hilt der folgende Satz weiter, der sich aus der Kettenregel folgern lässt. 4.14 Satz: Ableitung der Umkehrfunktion Ist f differenzierbar und umkehrbar auf I, und ist f 0 (x0 ) 6= 0, so ist die Umkehrfunktion f −1 differenzierbar und (f −1 )0 (f (x0 )) = 1 . f 0 (x0 ) (4.5) Mit y0 := f (x0 ) und x0 := f −1 (y0 ) erhält Gleichung (4.5) die Form (f −1 )0 (y0 ) = 1 f 0 (f −1 (y 0 )) . (4.6) Beweis. Zum Beweis betrachten wir die Identität (f −1 ◦ f )(x) = x und leiten diese Gleichung auf beiden Seiten ab. Dann ist mit der Kettenregel ( Satz 4.12 iv)) (f −1 ◦ f )0 (x) = 1 ⇐⇒ (f −1 )0 (f (x)) · f 0 (x) = 1 (f −1 )0 (f (x)) = ⇐⇒ 1 f 0 (x) Nun ergeben sich weitere Möglichkeiten, uns bekannte Funktionen abzuleiten: 1. Logarithmusfunktion: Da ln (y) als Umkehrfunktion von ex definiert ist, berechnen wir die Ableitung (ln (y))0 mit Satz 4.14. Es ist f (x) = ex zu wählen so dass f −1 (y) = ln (y) ist und (ln (y))0 = (f −1 (y))0 gilt. Also ist nach (4.6) (ln(y))0 = 1 f 0 (f −1 (y)) = = 1 ef −1 (y) 1 eln (y) = 1 . y (4.7) 2. Umkehrungen der trigonometrischen Funktionen: Die Ableitung von arctan (y) 58 4 Differentialrechnung können wir nun ebenfalls berechnen. Nach Satz 4.14 ist arctan0 (y) = = 1 tan0 (arctan (y)) 1 1 = . 1 + y2 1 + tan2 (arctan (y)) (4.8) Wollen wir arcsin (x) ableiten, so erhalten wir: arcsin0 (x) = 1 sin0 (arcsin (x)) Wobei im Schritt (∗) cos (y) = = 1 1 (∗) = √ cos (arcsin (x)) 1 − x2 (4.9) p 1 − (sin (y))2 verwendet wurde mit y = arcsin (x). 3. Allgemeine Potenzfunktion: Nicht nur für c ∈ N, sondern auch für allgemeine Exponenten c ∈ R gilt: f (x) = xc ⇒ f 0 (x) = c · xc−1 . c Um diese Regel herzuleiten schreiben wir xc = eln(x ) und wenden das Logarithmengesetz (3.19) an, so dass wir xc = ec ln(x) erhalten. Diesen Term können wir mit der Kettenregel und Beispiel 4.7 ableiten: (ec ln (x) )0 = (c ln (x))0 · ec ln (x) 1 = c · xc x = c · xc−1 4. Allgemeine Exponentialfunktion: Die Ableitung folgt ebenfalls aus der Darstellung ax = ex ln (a) und der Kettenregel: (ax )0 = (ex ln (a) )0 = ln (a) · ex ln (a) = ln (a) · ax 5. Allgemeiner Logarithmus: Die Ableitung folgt aus Beispiel 4.7 und der Formel (3.24) für den Basiswechsel der Logarithmusfunktion: (loga (x))0 = ( 1 1 1 ln x)0 = · . ln(a) ln (a) x 59 4 Differentialrechnung 4.3 Anwendungen der Differentialrechnung 4.3.1 Lokale Extrema 4.15 Definition Die Funktion f : (a, b) → R hat in x0 ∈ (a, b) ein lokales Maximum genau dann, wenn es eine Umgebung U = (x0 − , x0 + ) von x0 gibt, so dass f (x) ≤ f (x0 ) ∀x ∈ U . Entsprechend hat f in x0 ein lokales Minimum, wenn f (x) ≥ f (x0 ) für alle x ∈ U gilt. 4.16 Satz Hat f : (a, b) → R in x0 ∈ (a, b) ein lokales Maximum oder Minimum und ist f in x0 differenzierbar, so ist f 0 (x0 ) = 0. Beweis. Hat f in x0 ein lokales Maximum, so gilt für ein > 0, dass alle x ∈ (a, b), deren Abstand von x geringer ist als Funktionswerte kleiner als f (x0 ) haben: |x − x0 | < ⇒ f (x) − f (x0 ) ≤ 0. Also wechselt der Differenzenquotient in x0 sein Vorzeichen, f (x) − f (x0 ) x − x0 ( ≤ 0 falls x ≥ x0 ≥ 0 falls x ≤ x0 , so dass für den Grenzwert gelten muss f 0 (x0 ) = lim x→x0 f (x) − f (x0 ) = 0. x − x0 Hat f in x0 ein lokales Minimum, so verläuft der Beweis ananlog. 4.3.2 Mittelwertsatz/Monotonie 4.17 Satz: Mittelwertsatz der Differentialrechnung Ist f : [a, b] → R differenzierbar, so existiert ein x0 ∈ (a, b) in welchem die Steigung des Graphen von f gerade gleich der Steigung der Sekante durch die Punkte (a, f (a)) und (b, f (b)) ist: f 0 (x0 ) = f (b) − f (a) . b−a 60 4 Differentialrechnung Wie man in Abbildung 4.2 sieht, kann es auch mehrere x0 , x1 geben in denen f 0 (x0 ) = f 0 (x1 ) = gilt. Hier ist a = 0 und b = Steigung. 9 2 f (b) − f (a) b−a und es gibt zwei Tangenten (grün) mit zur Sekante (blau) gleicher R 2 1 R 1 2 3 b= 9 2 Abbildung 4.2: Mittelwertsatz der Differentialrechnung Beweis. Wir betrachten die folgende Hilfsfunktion: f (b) − f (a) (x − b) + f (b) b − a | {z } g(x) := f (x) − (4.10) Gleichung der Sekante Aus der Definition von g(x) folgt, dass g(a) = 0 und g(b) = 0, und dass g differenzierbar ist mit g 0 (x) = f 0 (x) − f (b) − f (a) . b−a (4.11) Außerdem ist g stetig, weshalb aus Satz 4.6 b) über Existenz von Minimum und Maximum folgt, dass es Punkte x+ , x− ∈ [a, b] gibt, für welche gilt g(x− ) ≤ g(x) ≤ g(x+ ) ∀x ∈ [a, b]. (4.12) Wir unterscheiden nun 2 Fälle: 1. Fall: Mindestens einer der Punkte x− , x+ liegt im Inneren von [a, b]. Angenommen dieses 61 4 Differentialrechnung sei x− , dann hat g in x− ein lokales Minimum, also ist g 0 (x− ) = 0. Damit folgt aber aus (4.11) dass f 0 (x− ) − f (b)−f (a) b−a f 0 (x− ) = = 0, was äquivalent ist zu f (b) − f (a) b−a Dann ist x− der gesuchte Punkt x0 . 2. Fall: x− und x+ sind beides Randpunkte des Intervalls [a, b], d.h. x+ und x− können nur die Punkte a, b sein (x− , x+ ∈ {a, b}). Da g(a) = g(b) = 0, folgt g(x− ) = 0 und g(x+ ) = 0. Somit folgt aus (4.12) dass g(x) = 0 ist für alle x ∈ [a, b]. Also ist g konstant, so dass g 0 (x) = 0 ∀x ∈ [a, b], weshalb aus (4.11) wiederum für alle x ∈ [a, b] f 0 (x) = f (b) − f (a) b−a folgt. 4.18 Folgerungen a) Monotonie: Ist die Funktion f : [a, b] → R stetig, auf dem offenen intervall I = (a, b) differenzierbar und die Ableitung f 0 (x) > 0 für alle x ∈ (a, b), dann ist f streng monoton wachsend. Beweis. Seien x1 , x2 ∈ (a, b), x1 < x2 , dann gibt es ein x0 ∈ (x1 , x2 ) mit ⇒ f (x2 ) − f (x1 ) = f 0 (x0 ) x2 − x1 f (x2 ) − f (x1 ) = f 0 (x0 ) · (x2 − x1 ) > 0 | {z } >0 | {z >0 } Also ist f (x2 ) > f (x1 ), was bedeutet, dass f ist streng monoton wachsend ist (s.Definition 3.4). Ebenso lässt sich zeigen: f 0 (x) ≥ 0 ∀x ∈ (a, b) ⇒ f ist monoton wachsend. f 0 (x) ≤ 0 ∀x ∈ (a, b) ⇒ f ist monoton fallend. f 0 (x) < 0 ∀x ∈ (a, b) ⇒ f ist streng monoton fallend. 62 4 Differentialrechnung b) Konstante Funktionen: Aus 1) folgt insbesondere eine Aussage über konstante Funktionen: f 0 (x) = 0 ∀x ∈ (a, b) ⇔ f ist konstant auf [a, b]: f (x) = c ∀x ∈ [a, b]. Dieses folgt, da nach 1) die Funktion gleichzeitig monoton fallend und wachsend sein muss. c) Extremwerte: Ist die zweite Ableitung f 00 (x) > 0, so ist die erste Ableitung f 0 (x) streng monoton wachsend, also ist f konvex. Die Aussagen aus Satz 4.16 lassen sich also dahingehend präzisieren, dass aus f 0 (x0 ) = 0 und f 00 (x0 ) > 0 folgt, dass f ein lokales Minimum in x0 hat. Analog gilt: ist f 0 (x0 ) = 0 und f 00 (x0 ) < 0, so hat f ein lokales Maximum in x0 . Ist auch f 00 (x0 ) = 0, so ist noch keine Aussage möglich (hierzu siehe Abschnitt 4.3.4). 4.3.3 Die Regel von de l’Hospital Seien f, g : (a, b) → R Funktionen, x0 ∈ (a, b) und f (x0 ) = g(x0 ) = 0. Dann ist der Quotient f (x0 ) g(x0 ) nicht definiert. Es kann aber sein, das der Grenzwert des Quotienten existiert und daher eine sinnvolle Fortsetzung der Funktion tiert limx→x0 f (x) g(x) f g in den Punkt x0 definiert werden kann. Wann exis- und wie berechnet man ihn? 4.19 Satz: Regel von de l’Hospital Seien f, g differenzierbar auf (a, b) und stetig auf [a, b], x0 ∈ (a, b) und f (x0 ) = g(x0 ) = 0. 0 (x) existiert, dann gilt: Wenn der Grenzwert des Quotienten der Ableitungen limx→x0 fg0 (x) Der Grenzwert limx→x0 f (x) g(x) existiert ebenfalls und es ist lim x→x0 f (x) f 0 (x) = lim 0 g(x) x→x0 g (x) Beweis. (Beweisidee) Die Ableitungen f 0 , g 0 existieren nach Voraussetzung, also ist nach dem Mittelwertsatz f (x) − f (x0 ) = f 0 (x1 ) x − x0 für ein x1 ∈ (x, x0 ) g(x) − g(x0 ) = g 0 (x2 ) x − x0 für ein x2 ∈ (x, x0 ). und 63 4 Differentialrechnung Da f (x0 ) = 0 und g(x0 ) = 0 ist, gilt: f (x) f (x) − f (x0 ) = g(x) g(x) − g(x0 ) x − x0 f (x) − f (x0 ) · = x − x0 g(x) − g(x0 ) f 0 (x1 ) = 0 g (x2 ) für Punkte x1 , x2 ∈ (x, x0 ). Somit gilt für den Grenzwert x → x0 f (x) = g(x) lim x→x0 lim x→x0 x1 ,x2 ∈(x,x0 ) f 0 (x1 ) g 0 (x2 ) f (x0 ) f 0 (x0 ) = 0 , g(x0 ) g (x0 ) ⇒ sofern der Limes von f 0 (x1 ) g 0 (x2 ) existiert. 4.20 Bemerkung Analog zu Satz 4.19 gilt: 1) Ist limx→x0 f (x) = ∞ und limx→x0 g(x) = ∞ und existiert der Grenzwert des Quotienten 0 (x) , so ist der Ableitungen limx→x0 fg0 (x) lim x→x0 f (x) f 0 (x) = lim 0 . g(x) x→x0 g (x) 2) Für den Fall I = (a, ∞) und x → ∞ (statt x → x0 ) gelten analoge Aussagen: Wenn lim f (x) = 0 und lim g(x) = 0, oder x→∞ x→∞ lim f (x) = ∞ und lim g(x) = ∞, x→∞ x→∞ und der Grenzwert des Quotienten der Ableitungen limx→∞ auch limx→∞ f (x) g(x) f 0 (x) g 0 (x) existiert, dann existiert und es ist lim x→∞ f 0 (x) f (x) = lim 0 g(x) x→∞ g (x) Entsprechendes gilt für I = (−∞, b) und x → −∞. 4.21 Beispiele a) Seien f (x) = sin(x) und g(x) = 2x + x2 . Dann ist g(0) = 0 und f (0) = 0, der Grenzwert (x) limx→0 fg(x) ist also zunächst nicht bekannt. Nun ist aber f 0 (x) = cos(x), g 0 (x) = 2 + 2x ⇒ f 0 (0) = 1, g 0 (0) = 2 64 4 Differentialrechnung so dass die Regel von L’Hospital angewendet werden darf und es folgt f 0 (x) 1 = 0 x→0 g (x) 2 cos(x) 1 sin(x) = lim = . ⇒ lim x→0 2 + 2x x→0 2x + x2 2 lim b) Wir betrachten als Beispiel in dem die Regel nicht angewendet werden kann die Funktion sin(x) f (x) g(x) = x2 in x0 = 0: f 0 (x) = cos(x) ⇒ f 0 (0) = 1 g 0 (x) = 2x ⇒ g 0 (0) = 0. Also ist die Regel von L’Hospital nicht anwendbar, da limx→0 f 0 (x) g 0 (x) nicht existiert. 2 c) Gesucht ist limx→∞ xex . Also ist f (x) = x2 und g(x) = ex und es ist limx→∞ x2 = ∞ und limx→∞ ex = ∞ Die Grenzwerte der Ableitungen sind lim (x2 )0 = lim 2x = ∞, x→∞ lim (ex )0 = lim ex = ∞ x→∞ x→∞ x→∞ Also ist l’Hospital nicht anwendbar, da beide Grenzwerte wiederum unendlich sind. Wir untersuchen daher die 2.Ableitungen: lim (2x)0 = lim 2 = 2, x→∞ lim (ex )0 = lim ex = ∞ x→∞ x→∞ x→∞ Nun kann L’Hospital zunächst auf die ersten Ableitungen und dann auf die Funktion angewendet werden: x2 ex 2 f 00 (x) = lim x = 0 00 x→∞ e x→∞ g (x) f (x) f 0 (x) f 00 (x) ⇒ lim = lim 0 = lim 00 = 0. x→∞ g(x) x→∞ g (x) x→∞ g (x) lim Wichtig ist, dass der Grenzwert limx→∞ d) Wir suchen den Grenzwert limx→∞ f 00 (x) g 00 (x) existiert! x+cos(x) x−sin(x) . x + cos(x) f 0 (x) 1 + sin(x) f (x) = ⇒ 0 = g(x) x − sin(x) g (x) 1 + cos(x) Also folgt, da limx→∞ bar ist. 1+sin(x) 1+cos(x) nicht existiert, dass die Regel von l’Hospital nicht anwend- 65 4 Differentialrechnung 4.3.4 Taylorpolynome 4.22 Satz Sei f : [a, b] → R in x0 ∈ (a, b) n-mal differenzierbar, dann existiert genau ein Polynom n n (x ) Pf,x vom Grad höchstens n so dass nicht nur die Funktionswerte f (x0 ) und Pf,x 0 0 0 n sondern auch die ersten n Ableitungen von Pf,x0 und f in x0 übereinstimmen: n (Pf,x )0 (x0 ) = f 0 (x0 ), 0 n Pf,x (x0 ) = f (x0 ), 0 ..., n (Pf,x )(n) (x0 ) = f (n) (x0 ). 0 n Das Polynom Pf,x ist gegeben durch 0 n Pf,x (x) = f (x0 ) + f 0 (x0 )(x − x0 ) + 0 = n X f (k) (x0 ) k=0 k! f (n) (x0 ) f 00 (x0 ) (x − x0 )2 + ... + (x − x0 )n 2! n! (x − x0 )k . (4.13) n n Man sagt „ Pf,x approximiert f nahe x0 von n-ter Ordnung“. Pf,x heißt „Taylorpolynom 0 0 n-ter Ordnung zu f am Entwicklungspunkt x0 “. Beweis. Den Beweis führen wir, indem wir in Gleichung (4.13) den Wert x = x0 einsetzen. Für n = 1 wird (4.13) zu 1 Pf,x (x) = f (x0 ) + f 0 (x0 )(x − x0 ), 0 (4.14) 1 (x ) = f (x ) ist. Leiten wir (4.14) nach x so dass man durch Einsetzen von x0 sieht dass Pf,x 0 0 0 ab, so sehen wir dass (Pf,1 x0 )0 (x) = f 0 (x0 ), woraus insbesondere P 0 (x0 ) = f 0 (x0 ) folgt. Für n = 2 ist 2 Pf,x (x) = f (x0 ) + f 0 (x0 )(x − x0 ) + 0 f 00 (x0 ) (x − x0 )2 2 woraus P (x0 ) = f (x0 ) folgt und für die Ableitungen gilt 2 (Pf,x )0 (x) = f 0 (x0 ) + f 00 (x0 ) · (x − x0 ) 0 2 (Pf,x )00 (x) = f 00 (x0 ) 0 2 )0 (x ) = f 0 (x ) und Hier erkennt man wiederum durch Einsetzen von x = x0 dass (Pf,x 0 0 0 2 00 00 (Pf,x0 ) (x0 ) = f (x0 ). Für die Polynome mit Ordnung n ≥ 3 verfährt man analog. 4.23 Beispiel Reihendarstellung der Exponentialfunktion: Als erste Anwendung berechnen wir die Taylorreihe der Exponentialfunktion exp(x) am Entwicklungspunkt x0 = 0. Wie wir wissen ist die n-te Ableitung exp(n) (x) = exp(x) für jedes n ∈ N, so dass immer 66 4 Differentialrechnung exp(n) (0) = 1 gilt. Setzen wir diese Ableitungen in die Formel (4.13) ein, so erhalten wir n Pexp,0 (x) = n X 1 k=0 k! (x − 0)k = n X xk k=0 k! (4.15) Berechnet man diese Taylorpolynome für immer größer werdende Ordnungen n, so konvergiert die Folge der Taylorpolynome gegen die Exponentialfunktion und wir erhalten ex = ∞ X xk k=0 k! und speziell aus x = 1 die Beziehung e= ∞ X 1 k=0 k! über welche wir bereits in (2.14) die Eulersche Zahl e definiert hatten. 4.24 Beispiel Wir betrachten die Funktion f (x) = ln (x) am Entwicklungspunkt x0 = 1 und berechnen das Taylorpolynom 3. Ordnung. f (x) = ln (x) 1 f 0 (x) = x 1 f (2) (x) = − 2 x 2 (3) f (x) = 3 x f (x0 ) = ln(1) = 0 1 f 0 (x0 ) = = 1 1 1 f (2) (x0 ) = − 2 = −1 1 2 (3) f (x0 ) = 3 = 2 1 Setzen wir diese Werte in die Formel (4.13) ein, so erhalten wir −1 2 (x − 1)2 + (x − 1)3 2! 3! 1 1 2 = (x − 1) − (x − 1) + (x − 1)3 2 3 3 Pln ,1 (x) = 0 + 1(x − 1) + Abschätzung der Differenz: Natürlich interessiert man sich nun dafür, wie groß der Fehler ist, den man macht, wenn man eine Funktion f in der Nähe eines Punktes x0 durch ihr Taylorpolynom ersetzt. Sei rn (x) der auftretende Fehler bei Approximation der Funktion f durch das Taylorpolynom n-ter Ordnung: n rn (x) := f (x) − Pf,x (x). 0 67 4 Differentialrechnung R 3 (x) Pln,1 1 ln(x) R 1 2 (x) Pln,1 -1 Abbildung 4.3: Taylorpolynome von ln(x) für n = 2 und n = 3 um x0 = 1 4.25 Satz: Lagrange’sche Restglieddarstellung Es sei f : (a, b) → R eine (n + 1)-mal differenzierbare Funktion und x, x0 ∈ (a, b), dann existiert ein x zwischen x und x0 , so dass der Fehler rn (x) gegeben ist durch: n rn (x) = f (x) − Pf,x (x) = f (x) − 0 n X f (k) (x0 ) k=0 k! (x − x0 )k = f (n+1) (x) (x − x0 )n+1 (4.16) (n + 1)! Der Beweis erfolgt mit dem Mittelwertsatz, wird hier aber nicht ausgeführt. 4.26 Beispiel Wir wollen abschätzen, wie stark die Funktion f (x) = ln (x) auf dem Intervall 9 11 , 10 ] um den Entwicklungspunkt x0 = 1 von seinem Taylorpolynom 3. Ordnung abweicht. [ 10 Nach Beispiel 4.24 ist 1 1 3 2 3 Pln ,1 (x) = (x − 1) − (x − 1) + (x − 1) . 2 3 Um die Abweichung mit dem Lagrangeschen Restglied (4.16) berechnen zu können, benötigen wir die 4. Ableitung von ln (x): ln(4) (x) = − 6 . x4 68 4 Differentialrechnung Dann ist der Betrag des Lagrangeschen Restglieds gegeben durch 3 | r3 (x) | =| ln (x) − Pln ,1 (x) |=| 6 x4 1 = 4 x = ln(4) (x) (x − 1)4 | 4! 1 (x − 1)4 4! 1 · (x − 1)4 4 · für ein x zwischen x und x0 . Die Funktion x14 ist auf R≥0 monoton fallend, daher können wir den Faktor x14 abschätzen, wenn wir die Fälle x < 1 und x > 1 getrennt betrachten. 1 1 < 4, 4 x x 1 ≤ 1, x4 9 <x<1: 10 11 und für 1 < x < : 10 Es gilt für also ist mit (4.17) für 9 10 da x < x < 1 (4.17) da 1 < x < x. (4.18) < x < 1: 1 1 · · (x − 1)4 4 x4 1 1 ≤ · 4 · (x − 1)4 4 x 1 1 = (1 − )4 4 x 1 10 1 1 ≤ (1 − )4 = · 4 . 4 9 4 9 |r3 (x)| = Mit (4.18) für 1 < x < 11 10 (4.19) können wir r3 (x) abschätzen durch 1 1 · (x − 1)4 4 x4 1 ≤ · (x − 1)4 4 1 11 1 1 < ( − 1)4 = · 4 . 4 10 4 10 |r3 (x)| = Aus den Abschätzungen (4.19) und (4.20) folgt nun, da 1 1 3 · ln x − Pln ,1 (x) < 4 94 1 4 · 914 > (4.20) 1 4 für x ∈ [ · 1014 : 9 11 ; ] 10 10 4.3.5 Anwendung auf Extremwerte Es ist nun eine allgemeine Aussage darüber möglich, wann eine Funktion in einem Punkt x0 , in dem die ersten (n − 1) Ableitungen gleich 0 sind, einen Sattelpunkt oder ein lokales Maximum oder Minimum hat. 69 4 Differentialrechnung 4.27 Satz: Lokale Extrema Sei n ∈ N und die Funktion f : (a, b) → R sei n-mal differenzierbar. Es gelte: f 0 (x0 ) = f 00 (x0 ) = ... = f (n−1) (x0 ) = 0 und f (n) (x0 ) 6= 0. Dann gilt: i) Ist n gerade und f (n) (x0 ) < 0 ⇒ f hat an der Stelle x0 ein lokales Maximum. ii) Ist n gerade und f (n) (x0 ) > 0 ⇒ f hat an der Stelle x0 ein lokales Minimum. iii) Ist n ungerade, so hat f an der Stelle x0 kein lokales Extremum sondern einen Sattelpunkt. Beweis. Zum Beweis von i) und i) betrachten wir die Differenz von der Funktion f und ihrem n−1 Taylorpolynom Pf,x . Es ist einerseits 0 n−1 f (x) − Pf,x (x) = f (x) − 0 n−1 X f (k) (x0 ) (x − x0 )k k! k=0 = f (x) − f (x0 ), (4.21) da f (k) (x0 ) = 0 für k = 1, . . . , n − 1 vorausgesetzt wurde und andererseits wissen wir aus der Lagrangeschen Restglied Darstellung (4.16) dass n−1 f (x) − Pf,x (x) = 0 f (n) (x) (x − x0 )n . n! (4.22) Vergleichen wir die rechten Seiten von (4.21) und (4.22) so erhalten wir f (x) − f (x0 ) = f (n) (x) (x − x0 )n . n! (4.23) Da f (n) (x0 ) < 0 ist und f (n) stetig ist, ist f (n) (x) < 0 in einer ganzen Umgebung von x0 , insbesondere auch in x, so dass, da bei geradem Exponenten n stets (x − x0 )n > 0 gilt, aus (4.21) und (4.22) folgt dass f (x) − f (x0 ) ≤ 0 ist in einer Umgebung von x0 was bedeutet, dass f in x0 ein lokales Maximum hat. Ist nun aber f (n) (x0 ) > 0, so folgt mit der gleichen Argumentation f (x) − f (x0 ) = f (n) (x) (x − x0 )n > 0, n! was beutet, dass f in x0 ein lokales Minimum hat. Um iii) zu beweisen, beachten wir dass im Falle dessen dass n ungerade ist, der Term (x − x0 )n 70 4 Differentialrechnung in x0 sein Vorzeichen wechselt, weshalb auch f (x) − f (x0 ) = f (n) (x) (x − x0 )n n! das Vorzeichen bei x0 wechselt. Daher hat f in x0 kein lokales Extremum, da f von größeren zu kleineren Werten als in x0 wechselt. f hat in x0 einen Sattelpunkt. 4.28 Beispiel Die Funktion f (x) = xn hat für gerade n in x0 = 0 ein lokales Minimum und für ungerade n einen Sattelpunkt. Die Funktion f (x) = −xn hat für gerade n ein lokales Maximum und für ungerade n einen Sattelpunkt. 71 5 Integralrechnung 5.1 Definition und Eigenschaften des Integrals Sei f : [a, b] → R eine stetige Funktion und x0 , x1 , ..., xn eine Zerlegung des Intervalls [a, b]: a = x0 < x1 < ... < xn = b f (x) a = x0 ξ1 x1 ξ2 x2 ξ3 x3 ξ4 x4 = b x Abbildung 5.1: Eine Riemannsche Summe mit n = 4 Dann approximiert Zn := n X f (ξk )(xk − xk−1 ) k=1 die Fläche unter dem Graphen von f . Zn heißt „Riemannsche Summe“. Bezeichnen wir mit (x0 , x1 , ..., xn ) := max |xi − xi−1 | i=1,...,n den maximalen Abstand zweier benachbarter Unterteilungspunkte, welchen wir die Feinheit der Zerlegung x0 , x1 , ..., xn nennen, so kann man zeigen, dass der Grenzwert der Riemannschen 72 5 Integralrechnung Summen n X lim (x0 ,...,xn )→0 f (ξi )(xi − xi−1 ) k=1 existiert, wenn die Feinheit der Zerlegung gegen 0 geht. Überdies ist für stetige Funktionen der Grenzwert unabhängig von den gewählten Zerlegungen, so dass wir den gemeinsamen Grenzwert als Integral über f definieren können. 5.1 Definition: Riemannintegral Sei f eine auf dem Intervall [a, b] definierte stetige Funktion. Dann heißt bestimmte Integral von f über [a, b] und ist definiert durch n X Z b f (x) dx := lim n→∞ a Rb a f (x) dx das f (ξi )(xi − xi−1 ) i=1 für Zerlegungen mit (x0 , ..., xn ) → 0. Die Randpunkte a, b heißen Integrationgrenzen. 5.2 Beispiel f (x) = const = c Zn = n X f (ξi )(xi − xx−i ) = i=1 n X c(xi − xx−i ) = c(a − b) i=1 für beliebige Zerlegungen (x0 , ..., xn ) mit Randpunkten x0 = a, xn = b. Also ist Z b c dx = c(b − a). a Aus der Definition ergeben sich folgende Eigenschaften des Integrals: 5.3 Folgerungen 1) Linearität: Z b Z b Z b a g(x) dx f (x) dx + (f (x) + g(x)) dx = a a Z b Z b c(f (x)) dx = c f (x) dx. a a Eine solche Gleichung gilt nicht für Produkte Rb a f (x) · g(x) dx! 2) Positivität: Ist f (x) ≤ g(x) für alle x ∈ [a, b], so ist Z b f (x) dx ≤ a Z b g(x) dx. a 73 (5.1) 5 Integralrechnung Insbesondere gilt: Z b min f (x)(b − a) ≤ x∈[a,b] f (x) dx ≤ max f (x)(b − a) x∈[a,b] a und falls g(x) ≥ 0 auf dem Intervall [a, b] ist, gilt das auch für das Integral: Z b g(x) dx ≥ 0. a 3) Zerlegung des Integrationsgebietes: Ist a < c < b, so gilt Z b Z b Z c f (x) dx. f (x) dx = f (x) dx + (5.2) a c a Definiert man Z a f (x) dx := − Z b f (x) dx, a b so gilt (5.2) für alle a, b, c. 5.4 Definition Der Mittelwert f einer Funktion f auf dem Intervall [a, b] ist definiert durch f := 1 b−a Z b f (x) dx a 5.5 Satz: Mittelwertsatz der Integralrechnung Ist f : [a, b] → R stetig, so existiert ein c ∈ (a, b) > 0, so dass: 1 f (c) = f = b−a Z b f (x) dx. a Dies bedeutet anschaulich, dass in Abbildung 5.2 die Fläche unter dem Graphen von f genauso groß ist wie das Rechteck unter der grünen Linie. Insbesondere gibt es einen Punkt c, so dass f = f (c). In Abbildung 5.2 ist x− = 0. Der Punkt c ist im allgemeinen nicht eindeutig bestimmt. Beweis. f ist stetig, dann folgt aus Satz 4.6 über Existenz von Minimum und Maximum dass es zwei Punkte x− , x+ ∈ [a, b] gibt, so dass min f (x) = f (x− ) max f (x) = f (x+ ). x∈[a,b] x∈[a,b] 74 5 Integralrechnung R f (x+ ) f = f (c) f (x− ) R c x+ 3 Abbildung 5.2: Mittelwertsatz der Integralrechnung für f (x) = 12 x3 −3x2 +5x+ 12 auf I = [0, 3] Mit Eigenschaft (5.1) des Integrals folgt: f (x− )(b − a) ≤ Z b f (x) dx ≤ f (x+ )(b − a) a ⇔ f (x− ) ≤ 1 (b − a) Z b | {z f (x) dx ≤ f (x+ ). a } f Also liegt f zwischen f (x− ) und f (x+ ), so dass aus dem Zwischenwertsatz 4.6 folgt, dass es ein c ∈ [a, b] mit f (c) = f gibt. 5.6 Bemerkung Die Integration entspricht anschaulich der Flächenberechnung. Es werden oberhalb der x-Achse liegende Flächen positiv „bewertet“ und unterhalb der x-Achse liegende Flächen negativ. So kann es also negative Integrale geben und auch eine Funktion, deren Integral über ein Intervall gleich Null ist, kann dort ein Gebiet mit der x-Achse einschließen. R + + R π − 75 2π 5 Integralrechnung 5.2 Hauptsatz der Differential- und Integralrechnung 5.2.1 Der Hauptsatz Sei f auf dem Intervall I ⊆ R stetig, a ∈ I. Wir bezeichnen mit F die Intergralfunktion F : I → R, welche definiert ist durch Z x f (t) dt. F (x) := (5.3) a 5.7 Satz: Hauptsatz der Differential- und Integralrechnung F ist differenzierbar auf I und für alle x ∈ I gilt: F 0 (x) = f (x). Beweis. Wir berechnen die Ableitung von F , indem wir den Differenzenquotienten untersuchen: Z x+h F (x + h) − F (x) 1 = h h f (t) dt − a ! Z x f (t) dt a 1 x+h = f (t) dt h x (∗∗) 1 · f (τ ) · ((x + h) − x) = h = f (τ ) (∗) Z für ein τ ∈ [x, x + h] wobei in (∗) die Eigenschaft über die Zerlegbarkeit des Integrationsintervalls (5.2) verwendet wurde und (∗∗) aus dem Mittelwertsatz 5.5 folgt. Da f stetig ist, kann nun der Grenzwert h → 0 gebildet werden, wobei τ ∈ [x, x + h] beachtet werden muss, und es folgt F (x + h) − F (x) = lim f (τ ) = f (x). h→0 h→0 h lim Die letzte Gleichheit gilt, da f stetig vorausgesetzt wurde. 5.8 Definition: Stammfunktion Eine differenzierbare Funktion G : I → R heißt (eine) Stammfunktion von f , falls für alle x ∈ I gilt: G0 (x) = f (x). 76 5 Integralrechnung 5.9 Folgerungen a) Aus dem Hauptsatz folgt, dass die Intergalfunktion Z x f (t) dt F (x) = a eine Stammfunktion von f (x) ist. Jede weitere Stammfunktion G von f unterscheidet sich dann von F nur durch eine Konstante c: G(x) = F (x) + c. b) Ist G eine Stammfunktion von f auf einem Intervall I, so gilt für alle Punkte a, b ∈ I: Z b f (t) dt = G(b) − G(a). a Beweis. zu a): Sei F wie oben als Integralfunktion von f definiert und sei G eine weitere Stammfunktion von f . Dann gilt nach dem Hauptsatz für die Ableitungen Dann ist G0 (x) = f (x) und F 0 (x) = f (x). Also gilt in jedem x ∈ I für die Differenz (G − F )0 (x) = 0, weshalb nach Folgerung 4.18 2) die Differenz konstant ist: G(x) − F (x) = const. = c. zu b): Aus Folgerung a) wissen wir, dass G(x) = F (x) + c, weshalb G(b) − G(a) = (F (b) + c) − (F (a) + c) = F (b) − F (a) = Z b f (t) dt. a 77 5 Integralrechnung 5.2.2 Stammfunktionen elementarer Funktionen Mit Hilfe des Hauptsatzes der Differential- und Integralrechnung können wir die Stammfunktionen einiger elementarer Funktionen angeben: Funktion f Stammfunktion F 1 n+1 n+1 x xn Bestimmtes Integral (Beispiele) R1 n 1 n+1 ]1 0 0 x dx = [ n+1 x +c n 6= −1 sin (x) = Rπ − cos (x) + c 0 1n+1 n+1 −0= 1 n+1 sin (x) dx = [− cos (x)]π0 = −(−1) + 1 = 2 cos (x) Rπ sin (x) + c 0 cos (x) dx = [sin (x)]π0 =0−0=0 ex R1 x x 1 0 e dx = [e ]0 ex + c = e1 − e0 = e1 − 1 1 cos2 (x) R tan (x) + c π 4 0 1 cos2 π dx = [tan (x)]04 (x) = tan ( π4 ) − tan (0) = 1 − 0 = 1 (s. (4.4)) √ 1 1−x2 R arcsin (x) + c 1 2 − 21 √ 1 1−x2 1 dx = [arcsin (x)]−2 1 (s. (4.9)) 1 1+x2 2 = π 6 − − π6 = π 3 arctan (x) + c (s. (4.8)) Integration von f (x) = x1 : Aus Beispiel 4.7 wissen wir, dass der Logarithmus eine Stammfunktion von f (x) = x1 ist. Allerdings darf ein Integrationsintervall I = [a, b] den Punkt x = 0 nicht enthalten, da die Funktion dort eine Polstelle hat. Wir unterscheiden also die Fälle 0 < a < b und a < b < 0: 1. Fall: 0 < a < b: Es ist F (x) = ln (x) eine Stammfunktion von f (x) = x1 , also ist Z b 1 a b dx = ln (b) − ln (a) = ln ( ). x a 2. Fall: a < b < 0: Wir definieren F (x) = ln (−x), dann ist F definiert für x ∈ R<0 und mit der Kettenregel folgt F 0 (x) = 1 1 · (−1) = , −x x 78 5 Integralrechnung 1 x also ist F : R<0 → R eine Stammfunktion von f (x) = Z b 1 x a auf R<0 , so dass dx = F (b) − F (a) = ln (−b) − ln (−a) −b b = ln ( ) = ln ( ). −a a Jede Stammfunktion F (x) von f (x) = 1 x ist also von der Form F (x) = ln |x| + c (5.4) und es ist zu beachten, dass x = 0 nicht im Integrationsintervall liegt. 5.10 Beispiele a) Wir integrieren f (x) = x1 auf den zum Punkt x = 0 symmetrisch liegenden Intervallen I1 = [1, 2] und I2 = [−2, −1]: Z 2 1 dx = [ln (x)]21 x 1 = ln (2) − ln (1) = ln (2) I1 = und Z −1 1 dx = [ln |−x|]−1 −2 x = ln |−(−1)| − ln |−(−2)| = ln (1) − ln (2) I2 = −2 = − ln (2). Also ist I2 = −I1 , was auch der Anschauung entspricht. b) Die Gravitationskraft K(x) = G · mM x2 leistet entlang des Weges [a, b] die Arbeit Z b A= K(x) dx = GmM Z b 1 dx x2 1 b 1 1 = GmM · − = GmM − . x a a b a a 5.3 Integrationsregeln Um auch komplexere als die elementaren Funktionen integrieren zu können, sind die folgenden Regeln nützlich. Die „partielle Integration“ wird aus der Produktregel der Differentiation hergeleitet und die „Integration durch Substitution“ aus der Kettenregel der Differentiation. 79 5 Integralrechnung 5.3.1 Partielle Integration 5.11 Satz: Partielle Integration Sind u, v : [a, b] → R stetig differenzierbare Funktionen, so gilt Z b 0 u (x)v(x) dx = a [u(x)v(x)]ba − Z b u(x)v 0 (x) dx, (5.5) a und für das unbestimmte Integral Z 0 u (x)v(x) dx = u(x)v(x) − Z u(x)v 0 (x) dx. (5.6) Beweis. Die Produktregel für die Differentiation, (s. Satz 4.12), besagt dass (u(x)v(x))0 = u0 (x)v(x) + u(x)v 0 (x). Stellen wir diese Gleichung um, so erhalten wir u0 (x)v(x) = (u(x)v(x))0 − u(x)v 0 (x) woraus durch Integration folgt: Z u(x)0 v(x) dx = Z Z u0 (x)v(x) dx = u(x)v(x) − (u(x)v(x))0 dx − Z u(x)v 0 (x) dx so dass Z u(x)v 0 (x) dx Diese Regel ist anwendbar, wenn ein Produkt f (x) = g1 (x) · g2 (x) integriert werden soll und wenn eine der Funktionen als u0 (x) und die andere als v(x) aufgefasst werden kann. 5.12 Beispiele a) Wir wollen f (x) = x ex integrieren, wofür wir f partiell integrieren mit v(x) = x und u0 (x) = ex . Es ist dann v 0 (x) = 1 und u(x) = ex , was eingesetzt in (5.6) Z xex dx = xex − Z 1 · ex dx = xex − ex + c = (x − 1) · ex + c 80 5 Integralrechnung als Stammfunktion ergibt. Für ein bestimmtes Integral folgt mit (5.5) also z.B. Z 2 1 xex dx = [(x − 1)ex ]21 = (2 − 1)e2 − 0 = e2 . b) Mittels partieller Integration lässt sich auch die Stammfunktion von v(x) = ln (x) berechnen: Z Z 1 · ln (x) dx |{z} | {z } u0 v Z ln (x) dx = = |{z} x · ln (x) − | {z } u v = x ln (x) − 1 x · dx |{z} x |{z} u v0 Z 1 dx = x ln (x) − x + c = x(ln (x) − 1) + c. c) Die Stammfunktion von cos2 (x) berechnet man durch Z cos (x) · cos (x) dx = sin (x) cos (x) − | {z } u Z sin (x) (− sin (x)) dx | {z } | {z } | {z } u v0 | {z } | v {z v u0 Z (∗) = sin (x) cos (x) + } (1 − cos2 (x)) dx. In (∗) wurde sin2 (x) = 1−cos2 (x) verwendet. Addiert man nun auf beiden Seiten cos2 (x) dx, so erhält man R Z 2 cos2 (x) dx = sin (x) cos (x) + x. d) Es kann, wie in (∗), eine zweite partielle Integration notwendig sein: Z 2 2 x sin (x) − x · cos (x) dx = |{z} |{z} | {z } | {z } u u v0 Z 2x sin (x) dx |{z} | {z } u0 v = x2 sin (x) − 2 v Z x sin (x) dx |{z} | {z } g h0 (∗) = x2 sin (x) − 2 |{z} x (− cos (x)) − g | {z h } 2 Z 1 (− cos (x)) dx |{z} | {z } = x sin (x) + 2x cos (x) − 2 sin (x) + c = (x2 − 2) sin (x) + 2x cos (x) + c. 81 g0 h 5 Integralrechnung 5.3.2 Integration durch Substitution 5.13 Satz: Substitutionsregel Ist g : [a, b] → I ⊆ R stetig differenzierbar und f : I → R stetig, so gilt: Z b Z g(b) f (t) dt = f (g(x))g 0 (x) dx. (5.7) a g(a) Beweis. Ist F eine Stammfunktion von f , d.h. F 0 (x) = f (x), so folgt aus der Kettenregel: (F ◦ g)0 (x) = F 0 (g(x)) · g 0 (x) = f (g(x)) · g 0 (x), d.h. (F ◦ g)(x) ist eine Stammfunktion von f (g(x)) · g 0 (x). Also ist Z b f (g(x)) · g 0 (x) dx = (F ◦ g)(b) − (F ◦ g)(a) a = F (g(b)) − F (g(a)). (5.8) Anderseits ist F nach Vorraussetzung eine Stammfunktion von f , so dass wenn wir g(a) und g(b) als Integrationsgrenzen auffassen Z g(b) f (t) dt = F (g(b)) − F (g(a)) (5.9) g(a) folgt. Vergleichen wir nun die linken Seiten von (5.8) und (5.9), so erhalten wir Z b Z g(b) f (t) dt = f (g(x)) · g 0 (x) dx. a g(a) 5.14 Beispiele 2 a) Wir möchten die Funktion (lnxx) auf dem Intervall [1, 2] integrieren. Um die Substitutionsregel anwenden zu können, setzen wir f (t) = t2 und g(x) = ln (x), woraus g 0 (x) = x1 folgt. Das Integral hat dann die Strukur (Beachte f (g(x)) = (ln (x))2 !) Z 2 I= 1 1 (ln (x)) dx = x 2 Z 2 f (g(x)) · g 0 (x) dx. 1 Also ist nach Gleichung (5.7) und da ln(1) = 0: Z g(2) I= Z ln (2) f (t) dt = g(1) " = t3 3 ln (1) #ln (2) = 0 (ln (2))3 . 3 82 t2 dt 5 Integralrechnung b) Es soll esin (x) cos (x) auf dem Intervall [0, π2 ] integriert werden. Mit f (t) = et und g(x) = sin (x) ist g 0 (x) = cos (x), so dass wiederum mit Gleichung (5.7) folgt Z I= π 2 e sin (x) Z cos (x) dx = 0 = π 2 f (g(x)) · g 0 (x) dx 0 Z g( π ) 2 f (t) dt = Z sin ( π ) 2 g(0) et dt sin (0) = e1 − e0 = e − 1. c) Wir betrachten den Fall dass die „innere Funtkion“ linear ist, d. h. g(x) = mx + c g 0 (x) = m dann wird Gleichung (5.7) mit g(a) = ma + c, g(b) = mb + c und g 0 (x) = m zu Z mb+c Z b f (t) dt = ma+c f (mx + c)m dx a und mit einer Stammfunktion F von f folgt 1 (F (mb + c) − F (ma + c)) = m Z b f (mx + c) dx. a 5.3.3 Der ln - Trick 0 (x) ln -Trick“ Hat die zu intergrierende Funktion die Form gg(x) , so lässt sich der sogennante „ln anwenden, welcher ein einfacher Spezialfall der Substitutionsregel ist. Sei g : [a, b] → R stetig differenzierbar und g(x) 6= 0 für alle x ∈ [a, b]. Wir berechnen das Integral über [a, b] mit der 1 Substitution f (t) = 1t . Da nun f (g(x)) = g(x) ist, folgt I= Z b 0 g (x) a g(x) Z b dx = f (g(x)) · g 0 (x) dx a Z g(b) f (t) dt = = g(a) Z g(b) 1 g(a) t dt (∗) = ln |g(b)| − ln |g(a)| |g(b)| = ln . |g(a)| In (∗) wurde Gleichung (5.4) verwendet. 5.15 Beispiel Mit Hilfe des ln -Tricks können wir z. B. tan (x) integrieren: Z I= π 4 Z tan (x) dx = 0 0 83 π 4 sin (x) dx cos (x) (5.10) 5 Integralrechnung Mit g(x) = − cos (x) ist g 0 (x) = sin (x) also ist π 4 sin (x) dx − cos (x) 0 Z π 0 4 g (x) =− dx g(x) 0 − cos ( π ) 4 = − ln |− cos (0)| √ 1 = − ln ( √ ) = ln ( 2). 2 I=− Z 5.3.4 Integration rationaler Funktionen Rationale Funktionen f (x) = p(x) q(x) , wobei p(x) und q(x) Polynome sind, können immer integriert werden, wenn die Nullstellen der Nennerfunktion bekannt sind. Wir betrachen nur einige Fälle: 1) f (x) = 1 x−a : Wir können den „ln -Trick“ (5.10) anwenden und erhalten Z 1 dx = ln |x − a| + c. x−a (5.11) Es muss x 6= a im Integrationsgebiet sein! 2) f (x) = 1 (x+a)k für k > 1: Z 1 1 1 dx = − · + c. (x + a)k k − 1 (x + a)k−1 1 für 4q − p2 < 0: Der Nenner hat 2 reelle Nullstellen x0 , x1 so dass 3) f (x) = x2 +px+q 2 x + px + q = (x − x0 )(x − x1 ) und es ist mit Partialbruchzerlegung 1 1 f (x) = = · (x − x0 )(x − x1 ) (x0 − x1 ) 1 1 − x − x0 x − x1 Diese Funktionen kann mit (5.11) integriert werden: Z 1 1 1 1 dx = · − dx 2 x + px + q x0 − x1 x − x0 x − x1 1 = · (ln |x − x0 | − ln |x − x1 |) + c x0 − x1 1 |x − x0 | = · ln + c. x0 − x1 |x − x1 | Z 0 (x) 4) f (x) = qq(x) : Ist das Zählerpolynom gerade die Ableitung des Nennerpolynoms, so lässt sich wieder der „ln -Trick“ anwenden: Z q 0 (x) dx = ln |q(x)| + c q(x) 84 5 Integralrechnung 5.16 Beispiele a) Das Polynom q(x) = x2 − 4x + 3 hat die Nullstellen x0 = 3 und x1 = 1, also ist q(x) = (x − 3)(x − 1) und Z 1 1 1 1 dx dx = · − 2 x − 4x + 3 3−1 x−3 x−1 1 = · (ln |x − 3| − ln |x − 1|) + c 2 1 |x − 3| = · ln +c 2 |x − 1| Z b) Das Polynom q(x) = x2 + 3x + 4 hat die Ableitung q 0 (x) = 2x + 3 so dass mit 4) folgt: Z 2 1 h i2 2x + 3 2 dx = ln |x + 3x + 4| 1 x2 + 3x + 4 4+6+4 = ln 1+3+4 7 = ln . 4 5.4 Uneigentliche Integrale Hat die Funktion f an einer der Integrationsgrenzen keinen endlichen Wert oder ist eine der Integrationsgrenzen nicht endlich, so sprechen wir von einer kritischen Grenze und das Integral muss durch einen Grenzübergang bestimmt werden. Wir betrachten 3 Fälle: 1) Eine Integrationsgrenze ist unendlich. 2) Der Integrand ist an einer Integrationsgrenze nicht definiert. 3) Beide Grenzen sind kritisch. Das Vorgehen ist immer, dass der Intergrationsbereich so eingeschränkt wird, dass das Integral berechnet werden kann und dann (wenn möglich!) ein Grenzwert bestimmt wird: 1) Sei f : R → R stetig und a ∈ R. Gesucht ist das uneigentliche Integral Z ∞ f (x) dx. I= a Falls Z R f (x) dx lim R→∞ a existent, so existiert das uneigentliche Integral und wir setzen Z ∞ I= Z R f (x) dx := lim R→∞ a 85 f (x) dx a 5 Integralrechnung 2) Sei f : (a, b) → R stetig und f (a) nicht definiert. Gesucht ist das uneigentliche Integral Z b f (x) dx. I= a Falls Z b f (x) dx lim &0 a+ existiert, so existiert das uneigentliche Integral und wir setzen Z b Z b f (x) dx. f (x) dx = lim I= &0 a a+ 3) Sind beide Integrationsgrenzen kritisch oder liegt ein kritischer Punkt im Integrationsgebiet, so muss das Integrationsgebiet in Teilintervalle zerlegt werden, die den Fällen 1) und 2) entsprechen. Es dürfen nicht 2 Grenzprozesse gleichzeitig ausgeführt werden. 5.17 Beispiele a) Die Funktion f (x) = x1S mit S > 1 soll auf I = [1, ∞) integriert werden. Es ist f auf [1, R] integrierbar für 1 < R < ∞ mit 1 1 R dx = − · xS S − 1 xS−1 1 1 1 ( S−1 −1). =− S − 1 |R{z } Z R 1 1 → 0 R→∞ Also existiert lim R→∞ Z R 1 1 xS dx = − 1 S−1 für S > 1 und es ist Z ∞ 1 1 xS dx = 1 . S−1 b) Die Funktion f (x) = x1s mit 0 ≤ s < 1 soll auf I = [0, 1] intergriert werden. Es ist f auf [, 1] integrierbar für 0 < < 1 mit Z 1 1 xs 1 1 1 · s−1 s−1 x 1 1−s = (1 − |{z}). 1−s dx = − →0 →0 86 5 Integralrechnung Also existiert lim Z 1 1 & xs dx = 1 1−s dx = 1 . 1−s für 0 ≤ s < 1 und es ist Z 1 1 xs 0 5.5 Die Kreisfläche Wir wollen die Fläche A(R) eines √ Kreises mit Radius R berechnen. Der Bogen des Halbkreises ist durch die Funktion f (t) = R2 − t2 auf t ∈ [−R, R] beschrieben. f (t) f (t) t t R Abbildung 5.3: Kreisfläche mit Radius R Wählen wir zunächst als Radius R = 1, so ist die Fläche F (1) des Halbkreises gegeben durch das Integral F (1) = Z 1 p 1 − t2 dt. −1 Wählen wir in der Substitutionsregel (Satz 5.13) g(x) = sin x, so dass g 0 (x) = cos (x), so erhalten wir Z bq 1 − sin2 (x) cos (x) dx = a ⇔ Z b cos2 (x) dx = a Z g(b) p g(a) Z g(b) p g(a) 87 1 − t2 dt 1 − t2 dt. 5 Integralrechnung R Aus Beispiel 5.12 c) kennen wir die Stammfunktion müssen also noch die Integrationsgrenzen berechnen: cos2 (x) dx = sin (x) cos (x) + x. Wir g(b) = 1 ⇒ sin (b) = 1 ⇒ g(a) = −1 ⇒ sin (a) = −1 ⇒ π 2 π wähle a = − . 2 wähle b = Damit ist mit Beispiel 5.12 c) 1 A(1) = 2 ⇒ π 2 Z − π2 cos2 (x) dx = π 2 A(1) = π. Sei nun der Radius R > 0 beliebig, dann ist f (t) = 1 A(R) = 2 Z R p √ R2 − t2 und R2 − t2 dt −R Z R s =R 1− −R t R 2 dt. Wieder verwenden wir die Substitutionsregel, dieses Mal mit t = g(x) = R sin (x), d.h. g 0 (x) = R cos (x) und t R = sin (x). Einsetzen in Z b f (g(x)) · g 0 (x) dx = Z g(b) f (t) dt g(a) a ergibt Z b q R 1 − sin2 (x) · R cos (x) dx = ⇐⇒ R s R 1− −R a 2 Z R Z π 2 − π2 | q 1− sin2 (x) · Z R s cos (x) dx = R −R {z } π 2 π 1 = A(R) 2 2 A(R) = πR2 . R2 · ⇐⇒ ⇐⇒ 88 t R 1− 2 t R dt 2 dt 6 Stochastik 6.1 Vorüberlegungen Bezeichnen wir mit E ein Ereignis, das mit einer gewissen Wahrscheinlichkeit eintritt, so wird mit P (E) die Wahrscheinlichkeit bezeichnet, dass das Ereignis E eintritt. Es ist 0 ≤ P (E) ≤ 1. Wie kann P (E) bestimmt werden? 6.1.1 Relative Häufigkeit (Empirischer Ansatz) Es wurden 960 Personen betragt, ob sie im vergangenen Winter an Grippe erkrankt waren. Das Ergebnis war: erkrankt: nicht erkrankt: Gesamt n = 406 554 960. Dann ist die relative Häufigkeit hn (E) des Ereignisses E = „an Grippe erkrankt“ gegeben durch hn (E) = 406 ≈ 0,42. 960 Hier ist hn (E) abhängig von der gewählten Stichprobe, d. h. hn (E) liegt nur mit einer gewissen Wahrscheinlichkeit in der Nähe von P (E). 6.1.2 Laplace-Wahrscheinlichkeit (Theoretischer Ansatz) Die Laplace-Wahrscheinlichkeit ist anwendbar bei Experimenten mit endlich vielen, gleich wahrscheinlichen Ergebnissen. n = Anzahl der möglichen Ergebnisse n(E) = Anzahl der Ergebnisse, bei denen das Ereignis E eintritt. 6.1 Beispiele a) Wurf mit einem idealen Würfel. Die Anzahl der Augen ist n = 6, mögliche Ergebnisse sind {1, 2, ..., 6}. Da jedes mögliche Ergebnis mit gleicher Wahrscheinlichkeit gewürfelt 89 6 Stochastik wird, ist die Wahrscheinlichkeit P (1) eine 1 zu würfeln gegeben durch 1 P (1) = . 6 Betrachten wir nun E = {1, 3, 5}, („Es wird eine ungerade Zahl gewürfelt“), so ist wiederum n = 6 aber die Anzahl der günstigen Ergebnisse für das Ereignis E ist n(E) = 3. Also ist P (E) = 3 1 n(E) = = . n 6 2 b) Wir betrachten eine Urne mit 10 gleichförmigen Kugeln, so ist n = 10. Es seien 3 rote, 2 grüne und 5 schwarze Kugeln in der Urne und es werde eine Kugel gezogen. E1 = „Kugel rot“ n(E1 ) = 3 ⇒ E2 = „Kugel grün“ n(E2 ) = 2 ⇒ E3 = „Kugel schwarz“ n(E3 ) = 5 ⇒ E4 = „Kugel rot oder grün“ n(E4 ) = 3 + 2 ⇒ 3 10 2 1 P (E2 ) = = 10 5 1 5 = P (E3 ) = 10 2 5 1 P (E4 ) = = 10 2 P (E1 ) = c) Eine symmetrische Münze hat beim Werfen die möglichen Ergebnisse „Kopf“= 0 und „Zahl“= 1. Werden 5 Würfe ausgeführt so gibt es nach Formel (1.5) n = 25 = 32 mögliche Ergebnisse. Betrachten wir das Ereignis E = „genau 3-mal ‚Zahl‘ bei 5 Würfen“, so ist n(E) = 53 = Menge. Dann ist 5! 3! 2! = 10 die Anzahl der 3-elementigen Teilmenge einer 5-elementigen P (E) = n(E) 10 5 = = . n 32 16 d) Es wird 2-mal gewürfelt. Es ist n = 36, denn mögliche Ergebnisse sind die Paare {(a1 , a2 ) | a1 , a2 ∈ {1, ..., 6}}. Die Augensumme wird beobachtet, das Ereignis E sei E = „Augensumme ist 5“ = {(a1 , a2 ) | a1 + a2 = 5} = {(1, 4), (2, 3), (3, 2), (4, 1)}. Also ist n(E) = 4 und P (E) = n(E) 4 1 = = . n 36 9 90 6 Stochastik e) Gemeinsamer Geburtstag: Wie groß ist die Wahrscheinlichkeit des Ereignisses E, dass von 30 Personen 2 am gleichen Tag Geburtstag haben? Es ist n = 36530 die Anzahl der Möglichkeiten, 30 Geburtstage auf 365 Tage im Jahr zu verteilen. E ist aufwändig zu formulieren, also betrachten wir das Gegenereignis: E := „Alle Personen haben an verschiedenen Tagen Geburtstag“ Dann ist n(E) = 365 · 364 · ... · 336 ⇒ ⇒ n(E) = 36530 − 365 · 364 · ... · 336 n(E) 365 · 364 · ... · 336 P (E) = ≈ 0,706 =1− n 36530 Es ist P (E) > 0,5 bereits für n ≥ 23, d.h. bereits bei 23 Personen haben mit mehr als 50%iger Wahrscheinlichkeit zwei am gleichen Tag Geburtstag. 6.2 Endliche Ergebnismengen 6.2.1 Notation Eine endliche Ergebnismenge mit n Elementen wird notiert durch Ω = {ω1 , ..., ωn }, deren Elemente ω ∈ Ω heißen Elementarereignisse. Eine Teilmenge der Ergebnismenge E⊆Ω heißt Ereignis. Ein Ereignis E tritt ein, wenn ein Elementarereignis ω ∈ E eingetreten ist. Ist jedes der Elementarereignisse gleich wahrscheinlich, so ist P (ω) = 1 1 = |Ω| n (6.1) die Wahrscheinlichkeit mit der es eintritt (Laplace - Wahrscheinlichkeit) und P (E) = |E| |Ω| (6.2) die Wahrscheinlichkeit mit der ein Ereignis E eintritt. In den obigen Beispielen bedeutet dieses: 91 6 Stochastik 6.2 Beispiele a) Für das Zufallsexperiment einmaliges Würfeln erhält man mit diesen Begriffen, dass die Ergebnismege Ω = {1, 2, ..., 6} ist und n = |Ω| = 6. Im Falle eines idealen Würfels liegt ein Laplace - Experiment vor mit P (ω) = 16 . Betrachten wir nun das Ereignis E = „Augenzahl kleiner als 3“ so ist E = {1, 2} |E| = 2 |E| 2 1 P (E) = = = |Ω| 6 3 b) Beim Experiment mit 10 gleichförmigen Kugeln (3 rote, 2 grüne, 5 schwarze) muss jede einzelne Kugel als mögliches Elementarereignis betrachtet werden, damit ein Laplace Experiment vorliegt. Wird das Ereignis „Kugel ist rot oder grün“ betrachtet, so ist Ω = {r1 , r2 , r3 , g1 , g2 , s1 , s2 , ..., s5 } n = |Ω| = 10 E = {r1 , r2 , r3 , g1 , g2 } |E| = 5 5 1 |E| = = P (E) = |Ω| 10 2 Bemerkung: Man kann Ω = {r, g, s} wählen, allerdings handelt es sich dann nicht um 3 2 5 ein Laplace-Experiment, denn P (r) = 10 , P (g) = 10 und P (s) = 10 . c) Bezeichnen wir beim 5-fachen Münzwurf wiederum die Resultate der einzelnen Würfe mit 0 und 1 so ist ein Elementarereignis z. B. von der Form ω = (1, 0, 0, 1, 1) und es ist Ω = {(a1 , a2 , a3 , a4 , a5 ) | ai ∈ {0, 1} für i = 1, 2, . . . , 5} n = |Ω| = 25 = 32 und für das oben betrachtete Ereignis E = „Genau 3 mal Zahl“ ist ! 5 3 |E| = P (E) = da es nach (1.5) genau = 5! = 10 3! 2! 10 5 |E| = = , |Ω| 32 16 5 3 Möglichkeiten gibt, bei 5 Würfen genau 3 mal Zahl zu erhalten. d) 2-mal Würfeln (unter Beachtung der Reihenfolge oder mit unterscheidbaren Würfeln) ergibt Ω = {(a1 , a2 ) | a1 , a2 ∈ {1, 2, ..., 6}} |Ω| = 36. 92 6 Stochastik Sind nicht alle Elementarereignisse gleich wahrscheinlich, so kann keine Laplace - Wahrscheinlichkeit (6.1) zugrunde gelegt werden. Es wird der allgemeine Begriff der Wahrscheinlichkeitsverteilung benötigt. 6.3 Definition: Wahrscheinlichkeitsverteilung Eine Wahrscheinlichkeitsverteilung über einer Ergebnismenge Ω = {ω1 , ω2 , ..., ωn } ist eine Funktion P : Ω → [0.1] ω 7→ P (ωi ) = „Wahrscheinlichkeit, dass das Elementarereignis ωi eintritt“ mit der Eigenschaft: P (ω1 ) + ... + P (ωn ) = n X P (ωi ) = 1. (6.3) i=1 Ist P : Ω → [0, 1] mit der Eigenschaft (6.3) gegeben, so definiert man für jedes Ereignis E ⊆ Ω: P (E) := X P (ω). ω∈E 6.4 Beispiel Wir betrachten wieder die Urne mit 3 roten, 2 grünen und 5 schwarzen Kugeln 3 2 5 und wählen nun Ω = {r, g, s}. Dann ist P (r) = 10 , P (g) = 10 und P (s) = 10 . Für das Ereignis E = „rot oder grün“ = {r, g} folgt dann P (E) = P (r) + P (g) = 3 2 1 + = . 10 10 2 6.5 Satz Für eine Wahrscheinlichkeitsverteilung P über einer Ergebnismenge Ω gelten die folgenden Rechenregeln: i) P (∅) = 0 und P (Ω) = 1 ii) Für jedes Ereignis E ⊆ Ω ist 0 ≤ P (E) ≤ 1 iii) Sind E1 , E2 ⊆ Ω Ereignisse, so ist P (E1 ∪ E2 ) = P (E1 ) + P (E2 ) − P (E1 ∩ E2 ) 93 6 Stochastik E1 ∪ E2 bedeutet, dass E1 oder E2 eintritt (oder auch E1 und E2 ), E1 ∩ E2 bedeutet dass E1 und E2 eintreten. iv) Ist E ⊆ Ω ein Ereignis, so bezeichnet E := Ω \ E (siehe Definition 1.4) das Komplementärereignis („E tritt nicht ein“) und es gilt P (E) = 1 − P (E). Beweis: Es folgt iv) aus iii) und i), wenn man beachtet, dass E ∪ E = Ω und E ∩ E = ∅. Dann ist P (E ∪ E) = 1 und P (E ∩ E) = 0, so dass aus iii) folgt: 1 = P (E ∪ E) = P (E) + P (E) − P (E ∩ E) = P (E) + P (E). 6.2.2 Bedingte Wahrscheinlichkeit Bei einem Glücksspiel mit einem Würfel sollen Sie, nachdem der Würfel geworfen wurde aber ohne dass Sie ihn sehen können, tippen, ob das Ergebnis kleiner als 3 ist. Die Wahrscheinlichkeit, dass F = {1, 2} eintritt, beträgt 31 . Nun erhalten Sie vorab die Information, dass das Ergebnis des Wurfes kleiner oder gleich 3 ist, d. h. das Ereignis E = {1, 2, 3} ist eingetreten. Dadurch verändert sich für Sie die Wahrscheinlichkeit dass das Ereignis F ebenfalls eingetreten ist, diese beträgt nun 32 . In formaler Notation ist Ω = {1, 2, ..., 6} und F = {1, 2}, 1 3 1 P (E) = . 2 P (F ) = E = {1, 2, 3}, Wissen Sie nun, dass eine der 3 Zahlen aus E = {1, 2, 3} geworfen wurde, so ist für Sie die Wahrscheinlichkeit, dass das Ereignis F = {1, 2} eingetreten ist gegeben durch |F ∩ E| 2 = . |E| 3 (6.4) Dieses führt zu der folgenden Begriffsbildung. 6.6 Definition: Bedingte Wahrscheinlichkeit Sei P eine Wahrscheinlichkeitsverteilung über Ω und seien E ⊆ Ω, F ⊆ Ω Ereignisse und sei P (E) > 0. Die bedingte Wahrscheinlichkeit P (F | E) für das Eintreten von F unter der Vorraussetzung, dass E eintritt, ist durch P (F | E) = P (F ∩ E) P (E) (6.5) definiert. Die Ereignisse E und F heißen unabhängig, wenn die Information über das Eintreten von E die Wahrscheinlichkeit für F nicht verändert, d. h. wenn P (F | E) = P (F ) 94 (6.6) 6 Stochastik gilt. P (F ) ist die a-priori-Wahrscheinlichkeit für das Eintreten von F , P (F | E) ist die a-posterioriWahrscheinlichkeit für F , wenn die Information vorliegt, dass E eingetreten ist. 6.7 Beispiel In dem Eingangsbeispiel ist E ∩ F = {1, 2}, also ist P (E ∩ F ) = 13 , also folgt mit P (E) = 21 nach obiger Definition (6.5) P (E ∩ F ) = P (F | E) = P (E) 1 3 1 2 2 = . 3 Da aber P (F ) = 31 ist, sind E und F nicht unabhängig, Bedingung (6.6) ist nicht erfüllt. Betrachten wir hingegen das Ereignis G = {2, 4}, so ist P (G) = 13 und E ∩ G = {2}. Also ist P (E ∩ G) = 61 , so dass P (G | E) = P (E ∩ G) = P (E) 1 6 1 2 = 2 1 = 6 3 Also sind E und G unabhängige Ereignisse, die Kenntnis dass E eingetreten ist beeinflusst die Wahrscheinlichkeit das G ebenfalls eintritt nicht, (6.6) ist erfüllt. 6.8 Bemerkung Liegt, wie in dem Eingangsbeispiel mit denm Würfel, ein Laplace-Experiment |E∩F | zugrunde, so ist P (E) = |E| |Ω| und P (E ∩ F ) = |Ω| , so wird (6.5) zu P (F ∩ E) P (F | E) = = P (E) |E∩F | |Ω| |E| |Ω| = |F ∩ E| , |E| was in den Vorüberlegungen (siehe (6.4)) bereits verwendet wurde. Die bedingten Wahrscheinlichkeiten P (F | E) und P (E | F ) dürfen nicht verwechselt werden. Ihr Zusammenhang wird durch die Formel von Bayes bschrieben. 6.9 Satz: Formel von Bayes Seien E, F ⊆ Ω Ereignisse mit P (E) 6= 0 und P (F ) 6= 0. Dann ist P (F | E) = P (E | F ) · P (F ). P (E) (6.7) Beweis. Es sind nach (6.5) die bedingten Wahrscheinlichkeiten gegeben durch P (F | E) = P (F ∩ E) P (E) und P (E | F ) = P (E ∩ F ) P (F ) so dass P (F ∩ E) = P (F | E) · P (E) und 95 P (E ∩ F ) = P (E | F ) · P (F ) 6 Stochastik Nun ist aber P (F ∩ E) = P (E ∩ F ), so dass aus diesen beiden Gleichungen P (F | E) · P (E) = P (E | F ) · P (F ), folgt, wass gerade die zu zeigende Gleichung (6.7) ist. 6.10 Beispiel Der Eliza-HIV-Test: Der Unterschied von P (E | F ) zu P (F | E) sei am Beispiel des Eliza-HIV-Tests demonstriert. Der Test soll feststellen, ob Antikörper im Blut vorhanden sind, hierbei sind Fehler möglich. Es werden also in einer Testgruppe Ω die folgenden 4 Ergebnisse betrachtet A+ A− B+ B− Es sind Antikörper vorhanden. Es sind keine Antikörper vorhanden. Testbefund ist positiv. Testbefund ist negativ. Die Qualität des Test wird durch die Kenngrößen P (B + | A+ ) (Sensitivität), welche die Wahrscheinlichkeit dafür angibt, dass das Vorhandensein von Antikörpern zu einem positiven Testergebnis führt, und P (B − | A− ) (Spezifität), welche umgekehrt wie Wahrscheinlichkeit dafür ist, dass bei einer Probe die frei von Antikörpern ist, ein negatives Testergebnis erzielt wird, beschrieben. Für den Eliza-Test gilt: P (B + | A+ ) = 0,999 − Sensitivität − P (B | A ) = 0,995 Spezifität. Zudem sei die a-priori-Wahrscheinlichkeit mit der eine Person der Testgruppe infiziert sei aufgrund von Erfahrungswerten angenommen als P (A+ ) = 0,001. Trotz der augenscheinlich sehr guten Werte für Sensitivität und Spezifität sind die meisten positiven Befunde falsch positiv: Ω P (A− ) P (A+ ) A− A+ P (B + | A+ ) 1 − P (B + | A+ ) B− B+ 1 − P (B − | A− ) P (B − | A− ) B+ B− Wie man der Skizze entnimmt ist die Wahrscheinlichkeit für einen positiven Befund P (B + ) = P (A+ ) · P (B + | A+ ) + P (A− ) · (1 − P (B − | A− )) = 0,001 · 0,999 + 0,999 · 0,005 = 0,00599. 96 6 Stochastik Die Wahrscheinlichkeit, bei einem positiven Befund auch tatsächlich infiziert zu sein, ist nun P (A+ | B + ) = 0,999 P (B + | A+ ) · P (A+ ) = · 0,001 = 0,1667. P (B + ) 0,00599 Dieses bedeutet, dass bei einem positiven Testbefund die Wahrscheinlichkeit einer tatsächlichen Infektion nur bei ca. 16,7 % liegt. Die Wahrscheinlichkeit bei positivem Befund nicht infiziert zu sein ist hingegen P (A− | B + ) = 1 − P (A+ | B + ) ≈ 83,3%. Ein negatives Testergebnis tritt auf mit Wahrscheinlichkeit P (B − ) = 1 − P (B + ) = 0,99401 und sagt mit hoher Wahrscheinlichkeit aus, dass tatsächlich keine Infektion vorliegt: P (B − | A− ) · P (A− ) P (B − ) 0,995 = · 0,999 = 0,999999. 0,99401 P (A− | B − ) = 6.2.3 Zufallsvariable Häufig interessiert man sich bei einem Zufallsexperiment nicht unmittelbar für die Beobachtungsgröße und deren Wahrscheinlichkeit, sondern für eine aus der Beobachtung abgeleitete Größe und die Wahrscheinlichkeit mit der diese eintritt. Beim Roulette interessiert uns beispielsweise nicht vorrangig ob “rot” oder “schwarz” eintritt, sondern mit welcher Wahrscheinlichkeit wir einen hieraus resultierenden Gewinn erwarten können. Um diese Fragestellung zu formulieren, benötigen wir den Begriff der Zufallsvariablen. 6.11 Definition: Zufallsvariable Eine Zufallsvariable (Zufallsgröße) auf einer Ergebnismenge Ω ist eine Funktion X: Ω→R ω 7→ X(ω), die jedem möglichen Elementarereignis ω eine relle Zahl X(ω) zuordnet. Die Elemente der Wertemenge der Zufallsvariablen X(Ω) = {X(ω) | ω ∈ Ω} ⊆ R werden mit x ∈ X(Ω) bezeichnet. Es ist {ω | X(ω) = x} ⊆ Ω die Menge der Elementarereignisse ω, für die die Zufallsvariable X den Wert x annimmt. 97 6 Stochastik 6.12 Beispiel Beim 2-maligen Würfeln wird die Augensumme beobachtet (siehe Beispiel 6.1 d)). Dann ist die Ergebnismenge Ω = {(a1 , a2 ) | a1 , a2 ∈ {1, 2, . . . , 6}} und die Zufallsvariable X =“Augensumme” wird definiert durch X: Ω→R (a1 , a2 ) 7→ a1 + a2 . Diese zufallsvariable hat die Wertemenge X(Ω) = {2, 3, ..., 12} ⊆ R Die Zufallsvariable “Augensumme” nimmt den Wert 5 an auf der Menge {(1, 4), (2, 3), (3, 2), (4, 1)}. Nun möchten wir die Wahrscheinlichkeit berechnen, mit der die Augensumme 5 gewürfelt wird. Dies führt zu der 6.13 Definition: Induzierte Wahrscheinlichkeit Die induzierte Wahrscheinlichkeitsverteilung P X auf X(Ω) ist gegeben durch P X (x) := P ({ω | X(ω) = x}). (6.8) Formal bedeutet dieses: P Ω [0, 1] X X(Ω) PX [0, 1] Im Beispiel mit 2-mal Würfeln heißt das: Wählen wir x = 5 ∈ X(Ω) aus dem Wetrebereich der Zufallsvariablen “Augensumme”, dann wird dieser Wert realisiert durch die 4 Elementarereignisse {ω | X(ω) = 5} = {(1, 4), (2, 3), (3, 2), (4, 1)} so dass die induzierte Wahrscheinlichkeit P X (5) = P ({(1, 4), (2, 3), (3, 2), (4, 1)}) 1 4 = = 36 9 ist. Die Wahrscheinlichkeit, beim Wurf mit zwei Würfeln die Augensumme 5 zu erhalten ist also 19 . Die induzierte Wahrscheinlichkeit notiert man auch durch P (X = x) = P X (x) oder 98 6 Stochastik P (x) = P X (x). In obigem Beispiel ist also: P X (5) = P (X = 5) = P (5). Für eine Teilmenge E ⊆ X(Ω) definiert man: P X (E) := P ({ω | X(ω) ∈ E}) = P (x ∈ E) 6.14 Beispiel Für das Ereignis E = „Augensumme kleiner als 4“ = {(1, 1), (1, 2), (2, 1)}, ist P X (E) = P (X < 4) 1 3 = . = 36 12 Darstellung einer Zufallsvariablen im Histogramm: Wir bleiben bei dem Experiment 2-maliges Würfeln und betrachten weiterhin die Augensumme. Es ist Ω = {(a1 , a2 ) | a1 , a2 ∈ {1, ..., 6}}, X(ω) = a1 + a2 , |Ω| = 36, X(Ω) = {2, 3, ..., 12}. Um die induzierte Wahrscheinlichkeit zu berechnen überlegen wir uns zunächst, dass {ω | X(ω) = 2} = {(1, 1)} {ω | X(ω) = 3} = {(1, 2), (2, 1)} {ω | X(ω) = 4} = {(1, 3), (2, 2), (3, 1)} {ω | X(ω) = 5} = {(1, 4), (4, 1), (3, 2), (2, 3)} {ω | X(ω) = 6} = {(1, 5), (2, 4), (3, 3), (4, 2), (5, 1)} (6.9) {ω | X(ω) = 7} = {(1, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1)} {ω | X(ω) = 8} = {(2, 6), (3, 5), (4, 4), (5, 3), (6, 2)} .. . {ω | X(ω) = 12} = {(6, 6)}. Da für das Würfelexperiment eine Laplace-Verteilung angenommen werden kann, berechnet sich die induzierte Wahrscheinlichkeit P X (x) durch P X (x) = P ({ω | X(ω) = x}) = |{ω | X(ω) = x}| , |Ω| woraus wir mit den Werten aus (6.9) die induzierten Wahrscheinlichkeiten erhalten. Diese Wahrscheinlichkeitsverteilung kann einerseits tabellarisch, aber auch in einem Histogramm dargestellt werden. In einem Histogramm wird die induzierte Wahrscheinlichkeit über dem Wertebereich der Zufallsvariablen aufgetragen. 99 6 Stochastik x 2 3 4 5 6 7 8 9 10 11 12 P X (x) 1 36 2 36 3 36 4 36 5 36 6 36 5 36 4 36 3 36 2 36 1 36 Tabelle 6.1: Wahrscheinlichkeitsverteilung der Zufallsvariablen “Augensumme” 1 P (x) [ 36 ] 6 5 4 3 2 1 1 2 3 4 5 6 7 8 9 10 11 12 x= Augensumme Abbildung 6.1: Histogramm der Zufallsvariablen “Augensumme” 6.2.4 Erwartungswert, Varianz und Standardabweichung 6.15 Definition: Erwartungswert Ist X : Ω → R eine Zufallsvariable und P eine Wahrscheinlichkeitsverteilung auf Ω, so heißt E(X) := X X(ω) · P (ω) (6.10) ω∈Ω = X x · P (X = x) (6.11) x∈X(Ω) der Erwartungswert von X. 6.16 Beispiel Es soll der Erwartungswert für das Werfen zweier Würfel bestimmt werden. Um deutlich zu machen, dass die Formeln (6.10) und (6.11) übereinstimmen, werden wir beide Formeln auswerten. Es ist Ω = {(a1 , a2 ) | a1 , a2 ∈ {1, ..., 6}} und für die Elementarereignisse ω gilt P (ω) = 1 36 und 100 X(ω) = a1 + a2 . 6 Stochastik Also können wir den Erwartungswert mit Formel (6.10) berechnen durch E(X) = X X(ω) · ω∈Ω 1 36 1 · X(1, 1) + X(1, 2) + X(2, 1) + X(1, 3) + X(3, 1) + ... + X(5, 6) + X(6, 6) 36 =2 =3 =3 =4 =4 =11 =12 1 = · [1 · 2 + 2 · 3 + 3 · 4 + 4 · 5 + 5 · 6 + 6 · 7 + 5 · 8 + 4 · 9 + 3 · 10 + 2 · 11 + 1 · 12] 36 =7 = oder, in dem wir die Werte P (X = x) Tabelle 6.1 entnehmen, mit Formel (6.11) durch: E(X) = X x · P (X = x) x∈X(Ω) 2 3 4 5 6 1 + 3· + 4· + 5· + 6· + 7· 36 36 36 36 36 36 5 4 3 2 1 + 8· + 9· + 10 · + 11 · + 12 · 36 36 36 36 36 =7 = 2· Zufallsvariablen sehr unterschiedlicher “Streubreite” können den gleichen Erwartungswert haben. Daher ist neben dem Erwartungswert selber die durchschnittliche Abweichung einer Zufallsvariablen von ihrem Erwartungswert eine wichtige Kenngröße. 6.17 Definition: Varianz, Standardabweichung Die Varianz Var(X) einer Zufallsvariablen X : Ω → R mit Erwartungswert E(X) bezüglich einer Wahrscheinlichkeitsverteilung P ist Var(X) := X (X(ω) − E(X))2 · P (ω). (6.12) ω∈Ω Die Standardabweichung ist definiert durch σ(X) := q Var(x). (6.13) σ(X) ist ein Maß für die durchschnittliche Abweichung von X vom Erwartungswert E(X). 6.18 Folgerung Äquivalent zu (6.12) lässt sich die Varianz auch definieren durch Var(X) = X (x − E(X))2 · P (X = x) (6.14) x∈X(ω) = E (X − E(X))2 . 6.19 Beispiel Sei X die Augensumme beim Wurf mit zwei Würfeln. Es ist der Erwartungswert E(X) = 7, so dass mit X(Ω) = {2, ..., 12} und den Werten für P (x) aus Tabelle 6.1 die Varianz 101 6 Stochastik mit Gleichung (6.14) berechnet werden kann. Var(X) = (x − E(X))2 · P (X = x) X x∈X(Ω) 1 1 + (12 − 7)2 · 36 36 2 2 + (3 − 7)2 · + (11 − 7)2 · 36 36 2 3 2 3 + (4 − 7) · + (10 − 7) · 36 36 4 4 + (5 − 7)2 · + (9 − 7)2 · 36 36 2 5 2 5 + (6 − 7) · + (8 − 7) · 36 36 2 6 + (7 − 7) · 36 1 = · (2 · 52 + 2 · 42 · 2 + 2 · 32 · 3 + 2 · 22 · 4 + 2 · 12 · 5) 36 210 = ≈ 5,83. 36 = (2 − 7)2 · Damit erhält man für die Standardabweichung σ(X) = p 5,83 ≈ 2,41. Betrachten wir den Bereich, in dem die Zufallsvariable “Augensumme” um höchstens σ von ihrem Erwartungswert abweicht, E(X) − σ ≤ X ≤ E(X) + σ, so entnehmen wir obigem Histogramm die Wahrscheinlichkeit dafür, dass ein Ereignis in einer σ-Umgebung des Erwartungswerts liegt: P (7 − 2,4 ≤ X(ω) ≤ 7 + 2,4) = P (5 ≤ X(ω) ≤ 9) 4 5 6 5 4 = + + + + 36 36 36 36 36 24 2 = = . 36 3 Bei vielen Würfen werden etwa 23 um höchstens den Wert 2 vom Erwartungswert 7 abweichen. Siehe hierzu auch Abbildung 6.2 auf Seite 109. 6.20 Satz i) Für jede Zufallsvariable X : Ω → R gilt: E (|X − E(X)|) ≤ σ(X). 102 6 Stochastik ii) Sei eine weitere Zufallsvariable Y definiert durch Y : Ω→R ω 7→ Y (ω) = αX(ω) + β mit α, β ∈ R, α 6= 0, dann sind der Erwartungswert und die Varianz von Y gegeben durch E(Y ) = α E(X) + β Var(Y ) = α2 Var(X) σ(Y ) = α σ(X). iii) Für zwei Zufallsvariablen X, Y : Ω → R gilt: E(X + Y ) = E(X) + E(Y ). Beweis. von ii): Nach der Definition des Erwartungswertes durch Gleichung (6.10) ist X E(Y ) = Y (ω) · P (ω) ω∈Ω X = (αX(ω) + β) · P (ω) ω∈Ω =α X X(ω) · P (ω) + β ω∈Ω X P (ω) ω∈Ω | {z =1 } = α E(X) + β. Die Varianz ist definiert durch Gleichung (6.12), so dass Var(Y ) = (Y (ω) − E(Y ))2 · P (ω) X ω∈Ω = (αX(ω) + β − (α E(X) + β))2 · P (ω) X ω∈Ω X 2 (X(ω) − E(X))2 · P (ω) =α ω∈Ω 2 = α Var(X) und für die Standardabweichung folgt σ(Y ) = q Var(Y ) = q α2 Var(X) = α σ(X). Wichtig: Im Allgemeinen ist E(X · Y ) 6= E(X) · E(Y ) und Var(X · Y ) 6= Var(X) · Var(Y ). 103 6 Stochastik 6.21 Satz Für die Varianz gilt: (Ohne Beweis) Var(X) = E (X − E(X))2 = E(X 2 ) − E(X)2 6.2.5 Die Binomialverteilung Es werden Zufallsexperimente mit genau 2 möglichen Ergebnissen untersucht, d.h. der Ergebnisraum kann stets als Ω = {0, 1} aufgefasst werden. Beispiele hierzu sind in Tabelle 6.2 aufgeführt. Eine Wahrscheinlichkeitsverteilung auf Ω ist gegeben durch p := P (1) q := P (0) = 1 − p. und Wird eines dieser Experimente 5-mal hintereinander ausgeführt, so ist die Ergebnismenge Ω5 = {(a1 , a2 , ..., a5 ) | a1 , ..., a5 ∈ {0, 1}} = {(0, 0, 0, 0, 0), (1, 0, 0, 0, 0), (0, 1, 0, 0, 0), ...} Gesucht sei nun die Wahrscheinlichkeit für genau 2-mal die „1“. Wie wir aus der Kombinatorik wissen (siehe (1.5), gibt es 52 Möglichkeiten für 2-mal die „1“. Hat ein Elementarereignis ω ∈ Ω5 2-mal die „1“, so dessen Wahrscheinlichkeit P (ω) = p2 · q 5−2 . Ist also X : Ω5 → R die Zufallsvariable mit X(ω) = „Anzahl der ‚1‘ in ω“, so gibt es 5 2 Elemente ω ∈ Ω mit X(ω) = 2 und es ist ! P (X = 2) = 5 2 5−2 p ·q . 2 1 0 P (1) Kopf Zahl 1 2 Geschlecht Neugeborenes w m 0,484 Roulette rot nicht rot 2 Würfel Pasch kein Pasch 18 37 1 6 Münzwurf Tabelle 6.2: Beispiele binomialverteilter Zufallsexperimente 104 6 Stochastik Allgemein gilt bei n Ausführungen des Experiments: Ωn = {(a1 , ..., an ) | a1 , ..., an ∈ {0, 1}} und es ist die Wahrscheinlichkeit für genau k-mal die „1“: ! P (X = k) = n k n−k p ·q . k 6.22 Bemerkung Durch P wird eine Wahrscheinlichkeitsverteilung auf Ωn definiert, da die Summe der Wahrscheinlichkeiten aller möglichen Ereignisse 1 ergibt: X P (ω) = ω∈Ω = = n X P (X = k) k=0 n X ! n k n−k p ·q k k=0 n X ! n k p · (1 − p)n−k k k=0 = (p + (1 − p))n = 1. 6.23 Definition: Binomialverteilung Eine Zufallsvariable X : Ω → R heißt binomialverteilt mit den Parametern n, p, wenn sie die Werte X(Ω) = {0, 1, ..., n} annimmt und wenn ! P (X = k) = n k n−k p ·q k (6.15) für 0 ≤ k ≤ n gilt, wobei 0 < p < 1 und q = 1 − p. Man schreibt auch X ∼ B(n, p). Erwartungswert und Varianz der Binomialverteilung: Es sei X eine binomialverteilte Zufallsvariable, X ∼ B(n, p). Wir betrachten als Hilfsgröße die Zufallsvariable Xi := „Treffer im i-ten Experiment“. Dann ist P (Xi = 1) = p und 105 P (Xi = 0) = 1 − p, 6 Stochastik so dass der Erwartungswert der Hilfsgröße Xi nach (6.10) E(Xi ) = 1 · p + 0 · (1 − p) = p ist. Aus X = Pn i=1 Xi und Satz 6.20 iii) folgt für den Erwartungswert von X E(X) = n X E(Xi ) = i=1 n X p = np. i=1 Für die Varianz der Xi gilt: Var(Xi ) = (0 − p)2 · (1 − p) + (1 − p)2 · p = p2 (1 − p) + (1 − p)2 · p = p(1 − p)(p + 1 − p) = p · q. Da die Zufallsvariablen Xi unabhängig sind, gilt: (∗) Var(X) = n X Var(Xi ) i=1 = npq. (Ohne Beweis. Die Gleicheit (∗) gilt nur für unabhängige Zufallsvariablen und nicht allgemein!) 6.24 Satz: Binomialverteilung Für eine B(n, p)-verteilte Zufallsvariable X gilt: E(X) = np Var(X) = npq √ σ(X) = npq 6.2.6 Die Poissonverteilung Anwendung findet die Poissonverteilung zur Beschreibung vieler gleichartiger Ereignisse, die jeweils nur mit geringer Wahrscheinlichkeit p eintreten, z. Bsp. - Verteilung von Bakterien in einer Suspension - Anzahl der zerfallenen Atome pro Zeiteinheit in einem radioaktiven Material. Sie wird auch verwendet als Approximation der Binomialverteilung B(n, p) für große n und kleine p, da die Binomialverteilung dann schlecht zu berechnen ist. Betrachten wir ! B(n, p, k) := n k p (1 − p)n−k k 106 6 Stochastik für festen Erwartungswert µ = np. Setzen wir in dieser Gleichung p = µ B(n, , k) = n n k ! k µ k µ n n−k µ n 1− = n! µk · k· k! (n − k)! n n! µk · · (n − k)! nk k! = | | {z } (1) 1− 1− µ n ein, so erhalten wir n−k µ n n {z } (2) µ n −k {z } · 1− | (3) Die Terme (1), (2) und (3) konvergieren für n → ∞, da (1): n! n · (n − 1) · (n − 2) · ... · (n − k + 1) (n − k)! = · k (n − k)! n n · n · n · ... · n (n − k)! 2 k+1 1 · 1− · ... · 1 − = 1· 1 − n n n | {z } k Faktoren −→ 1. n→∞ (2): µ 1− n n −→ e n→∞ −µ x 1+ n , da lim n→∞ n = ex . (3): 1− µ n −→ 1, n→∞ also auch 1− µ n −k −→ 1. n→∞ Insgesamt folgt also: µ µk −µ lim B(n, , k) = ·e . n→∞ n k! 6.25 Definition: Poissonverteilung Eine Zufallsvariable X mit der Wahrscheinlichkeitsverteilung P (X = k) = µk −µ ·e k! heißt poissonverteilt mit Parameter µ , geschrieben auch als P (µ; k) ∼ X. 107 (6.16) 6 Stochastik 6.26 Satz: Poissonverteilung Für eine mit Parameter µ poissonverteilte Zufallsvariable X gilt: i) E(X) = µ ii) Var(X) = µ √ σ(X) = µ. iii) Beweis von i): Nach der Definition des Erwartungswerts ist E(X) = = X k · P (X = k) k∈X(Ω) ∞ X µk k· k=1 = µe−µ · = µe = µe −µ k! · e−µ ∞ X µk−1 (k − 1)! k=1 ∞ X µk k=0 −µ µ k! e = µ. 6.27 Beispiel In einer Glasschmelze seien Einschlüsse (z.B. Bläschen, Körner) verteilt. 1 Kilogramm Glasschmelze enthalte im Schnitt λ = 10 Einschlüsse. Es werden 2 g schwere Linsen gegossen. Dann ist der Erwartungswert der Einschlüsse pro Linse µ = E(X) = 0,002 kg · 10 = 0,02, kg die Zufallsvariable X = „Einschlüsse pro Linse“ ist P (0,02; k)-verteilt: X ∼ P (0,02; k) und die Wahrscheinlichkeit genau keinen, einen oder mindestens zwei Einschlüsse in einer Linse zu finden ist 0,020 −0,02 ·e = 0,98 0! 0,021 −0,02 P (X = 1) = ·e = 0,0196 1! P (X ≥ 2) = 1 − P (X = 0) − P (X = 1) = 0,0004. P (X = 0) = D.h. es werden 98% der Linsen fehlerfrei sein, 1,96% werden genau einen Fehler und 0,04% zwei oder mehr Fehler haben. 108 6 Stochastik 6.3 Stetige Zufallsvariablen, die Normalverteilung 6.3.1 Stetige Zufallsvariablen Bisher haben wir Zufallsvariablen mit diskreten Werten in N oder Z behandelt. Diese ließen sich darstellen in einem Histogramm. 1 P (x) [ 36 ] P (5 ≤ x ≤ 9) 6 5 4 3 2 1 1 2 3 4 5 6 7 8 9 10 11 12 x= Augensumme Abbildung 6.2: Der Bereich P (5 ≤ x ≤ 9) einer diskreten Zufallsvariablen Die Wahrscheinlichkeit dafür, dass die Zufallsvariable Werte in einem Intervall [a, b] annimmt wird gegeben durch die Summe P (a ≤ X ≤ b) = b X P (X = k). k=a Der schraffierten Fläche im Histogramm entspricht die Wahrscheinlichkeit, dass die Augensumme beim Wurf mit 2 Würfeln 5 bis 9 beträgt (siehe Beispiel 6.19). Kann nun die Zufallsvariable X Werte in R annehmen, so wird die Wahrscheinlichkeit P (X = x) = 0 sein für die „meisten“ x ∈ R. Sinnvoller ist die Frage danach, mit welcher Wahrscheinlichkeit die Zufallsvariable X Werte in einem Intervall [a, b] annimmt und das Histogramm durch die Fläche unter einer Kurve zu ersetzen, siehe hierzu Abb. 6.3 Die Wahrscheinlichkeitsverteilung einer stetigen Zufallsvariable X ist dann durch eine Funktion p : R → R≥0 gegeben: P (a ≤ X ≤ b) = Z b p(x) dx. (6.17) a Wegen P (−∞ < X < ∞) = 1 muss die Funktion p normiert sein, Z ∞ p(x) dx = 1. (6.18) −∞ Die Funktion p heißt Dichtefunktion oder auch Wahrscheinlichkeitsdichte der Zufallsvariablen X, wenn (6.17) gilt. Analog zum diskreten Fall (siehe Definitionen 6.15 und 6.17) 109 6 Stochastik 0.5 R R a b Abbildung 6.3: Der Bereich P (a ≤ X ≤ b) einer stetigen Zufallsvariablen definiert man den Erwartungswert und die Varianz von X durch: Z ∞ E(X) := −∞ Z ∞ Var(X) := x · p(x) dx (6.19) (x − µ)2 p(x) dx, (6.20) −∞ sofern die uneigentlichen Integrale existieren. Wir verwenden die Abkürzung µ := E(X) und es ist weiterhin σ(X) = q Var(X). 6.3.2 Die Gaußsche Normalverteilung Ein wichtiges Beispiel einer stetigen Zufallsvariablen ist die Gaußsche Normalverteilung. 6.28 Definition: Gaußsche Normalverteilung Eine Zufallsvariable X heißt standardnormalverteilt, wenn sie die Wahrscheinlichkeits2 dichte ϕ(x) = x √1 e− 2 2π hat, so dass für alle a, b ∈ R mit a ≤ b gilt 1 P (a ≤ X ≤ b) = √ 2π Z b e− x2 2 dx. (6.21) a 6.29 Satz: Gaußsche Normalverteilung Für eine Zufallsvariable X mit Wahrscheinlichkeitsverteilung (6.21) ist E(X) = 0 und Var(X) = 1. Man schreibt hierfür auch X ∼ N (0; 1). 110 6 Stochastik Definition 6.28 ist sinnvoll, da die Normierungsbedingung (6.18) für die Funktion ϕ(x) gilt, was hier nicht bewiesen wird: 1 √ 2π Z ∞ e− x2 2 dx = 1. (6.22) −∞ Beweis. Satz 6.29 beweisen wir, indem wir verwenden, dass ϕ(x) eine gerade Funktion ist, und daher x · ϕ(x) ungerade ist. Der Erwartungswert E(X) ist also nach (6.19) Z ∞ E(X) = x · ϕ(x) dx = Z 0 x · ϕ(x) dx + Z ∞ −∞ −∞ x · ϕ(x) dx = 0. (6.23) 0 Die Varianz ist nach Gleichung (6.20) mit Erwartugswert µ = 0 durch das folgende Integral gegeben, welches mit partieller Integration (siehe (5.5)) berechnet werden kann: Z ∞ Var(X) = 1 (x − 0)2 · ϕ(x) dx = √ 2π −∞ Z ∞ x2 − 2 x · |xe{z |{z} } −∞ v u0 1 = √ [−xe ]∞ −∞ + {z } 2π | 2 − x2 Z ∞ e 2 − x2 −∞ dx (6.24) =0 1 =√ 2π Z ∞ e− x2 2 dx −∞ (∗) = 1, wobei in (∗) Gleichung (6.22) verwendet wurde. In den Rechungen (6.23) und (6.24) wurde nicht darauf eingegangen, dass es sich um uneigentliche Integrale handelt, somit zusätzlich eine Grenwertbetrachtung nach Abschnitt 5.4 erfolgen müsste. Wissen wir nun, dass das Ergebnis X bei einer Messung N (0; 1)-verteilt ist, so möchten wir berechnen können, mit welcher Wahrscheinlichkeit wir einen Messergebnis im Intervall (−∞, 21 ] erwarten können. Zur Berechnung von P (−∞ < X ≤ 12 ) bräuchten wir die Stammfunktion von ϕ(x). Diese heißt Verteilungsfunktion von ϕ und wird für die Standardnormalverteilung mit 1 Φ(x) := √ 2π Z x e− y2 2 dy (6.25) −∞ bezeichnet. Es ist Φ(x) die „Fläche unter ϕ bis x“, siehe Abb. 6.4 Φ ist keine elementare Funktion, es gibt keine explizite Darstellung, aber Φ ist tabelliert, einige Werte sind in Tabelle 6.3 angegeben. Den Verlauf der Verteilungsfunktion Φ kann man x Φ(x) 0 0,5 0,2 0,579 0,5 0,691 0,75 0,77 1 0,841 1,25 0,89 1,5 0,933 1,96 0,975 2 0,977 2,5 0,994 3,0 0,999 Tabelle 6.3: Wertetabelle der Φ - Funktion 2 skizzieren, indem man den Zuwachs der Fläche unter ϕ(x) = ϕ(x) = ϕ(−x) beachtet: 111 x √1 e− 2 2π und die Symmetrie 6 Stochastik 0.5 R ϕ(y) Φ(x) R x Abbildung 6.4: Die Verteilungsfunktion Φ(x) = P (−∞ ≤ X ≤ x) der Gaußverteilung R 1 Φ(a) Φ(a)+Φ(−a)=1 Φ(−a) R a −a Abbildung 6.5: Die Verteilungsfunktion Φ(x) der Normalverteilung Es ist offenbar limx→−∞ Φ(x) = 0 und wegen der Normierung (6.22) gilt limx→∞ Φ(x) = 1. Ferner ist der Anstieg von Φ(x) in der Nähe der 0 am größten und Φ hat in 0 einen Wendepunkt. Veranschaulichen Sie sich die Aussagen des folgenden Satzes an den Abbildungen 6.4 und 6.5. 6.30 Satz: Rechenregeln zur Gaußschen Normalverteilung Sei X ∼ N (0; 1), dann gilt für die Verteilungsfunktion Φ(x) := P (X ≤ x): P (a ≤ X ≤ b) = Φ(b) − Φ(a) (6.26) P (X ≥ x) = 1 − Φ(x) 1 Φ(0) = 2 Φ(−x) = 1 − Φ(x) (6.27) P (X ≥ −x) = 1 − Φ(−x) = 1 − (1 − Φ(x)) = Φ(x) P (−x ≤ X ≤ x) = Φ(x) − Φ(−x) = 2Φ(x) − 1 (6.28) (6.29) (6.30) (6.31) 6.31 Bemerkungen 1) Gleichung (6.26) verwendet nur die Definition (6.25) der Verteilungsfunktion Φ und Glei- 112 6 Stochastik chung (6.27) verwendet zusätzlich nur die Normierung der Wahrscheinlichkeitsdichte ϕ, sie gelten also für Verteilungsfunktionen zu beliebigen Wahrscheinlichkeitsdichten. Gleichungen (6.28), (6.29), (6.30) und (6.31) setzen die Symmetrie der Wahrscheinlichkeitsdichte und der daraus resultierenden Punktsymmetrie der Verteilungsfunktion bezüglich des Punktes (0, 12 ) voraus. Sie gelten daher für alle Verteilungsfunktionen symmetrischer Wahrscheinlichkeitsdichten und nicht nur speziell die der Gaußverteilung. Gleichung (6.27) hat insbesondere zur Folge, dass es ausreicht, die Verteilungsfunktion Φ für Werte x ≥ 0 zu tabellieren. 2 ) Mit Hilfe der Tabelle 6.3 können wir nun berechnen, dass 1 x2 2 1 1 e− 2 dx P (−∞ < X ≤ ) = √ 2 2π −∞ 1 = 0,691. =Φ 2 Z Gleichzeitig ist natürlich 1 1 P ( ≤ X < ∞) = 1 − P (−∞ < X ≤ ) 2 2 = 1 − 0,691 = 0,309 die Wahrscheinlichkeit für ein Messergebnis größer als 1 2 in obigem Beispiel. 6.3.3 Die N (µ; σ 2 ) - Verteilung Viele Zufallsvariablen X haben eine Dichtefunktion, die aus der ϕ - Funktion Gaußschen Normalverteilung durch Streckung und Verschiebung entlang der x- Achse hervorgeht. 6.32 Definition: Gaußverteilung Eine Zufallsvariable X̃ heißt normalverteilt mit Parametern µ, σ (µ ∈ R, σ > 0) wenn sie die Wahrscheinlichkeitsdichte ϕµ,σ (x) = √ 1 x−µ 2 1 e− 2 ( σ ) 2πσ (6.32) hat, das heißt wenn für alle a ≤ b mit a, b ∈ R gilt: P (a ≤ X̃ ≤ b) = √ 1 2πσ Z b 1 e− 2 ( x−µ 2 σ ) dx (6.33) a Man schreibt auch: X̃ ∼ N (µ; σ 2 ). Wie die Veränderung des Parameters µ die Glockenkurve ϕµ,σ verschiebt, wird dargestellt in Abbildung 6.6, die Stauchung bzw. Streckung der Kurve durch verändertes σ in Abbildung 6.7. 113 6 Stochastik R σ= 1 2 0.5 σ=1 σ= -3 -2 -1 1 3 2 R 2 Abbildung 6.7: Gaußsche Glockenkurven mit µ = 0 und σ = 21 , σ = 1 bzw. σ = 3 2 R µ = −2 0.5 µ=2 R -3 -2 -1 1 2 3 Abbildung 6.6: Gaußsche Glockenkurve mit µ = −2, µ = 0 bzw. µ = 2 und σ = 1 Man sieht, dass µ den Erwartungswert der Verteilung verändert und σ die Streubreite, also die Varianz, beeinflusst. Durch eine lineare Transformation können Zufallsvariable mit der Wahrscheinlichkeitsdichte (6.32) auf normalverteilte Zufallsvariable umgerechnet werden. Dass ermöglicht es dann einerseits, Erwartungswert und Varianz zu berechnen und andererseits die Wahrscheinlichkeit eines Ereignisses auf die Φ - Funktion der N (0; 1)-Verteilung zurück zu führen. 6.33 Satz: Transformationsregel i) Sei X eine Zufallsvariable mit Wahrscheinlichkeitsdichte p : R → R≥0 und seien α, β ∈ R und α > 0. Die Zufallsvariable X̃ := αX + β hat dann die Wahrscheinlichkeitsdichte 1 x−β p α α p̃(x) = und es gilt für Erwartungswert und Varianz von X̃ E(X̃) = α E(X) + β Var(X̃) = α2 · Var(X). 114 6 Stochastik ii) Für die durch Definition 6.32 erklärte Zufallsvariable X gilt E(X) = µ Var(X) = σ 2 . und 1 α Beweis. zu i): Wir zeigen nur, dass p̃(x) = p x−β α Wahrscheinlichkeitsdichte von X̃ ist. Die Aussagen zu E(X̃) und Var(X̃) ergeben sich dann aus den definierenden Formeln für Erwartungswert (6.19) und Varianz (6.20) analog zu den entsprechenden Rechnungen im dirkreten x−β 1 Fall (siehe Satz 6.20). Wenn p̃(x) = α p α die Wahrscheinlichkeitsdichte von X̃ sein soll, muss gelten: P (a ≤ X̃ ≤ b) = Z b p̃(x) dx. a Also berechnen wir das Integral mittels der Substitutionsregel (Satz 5.13) mit g(x) = g 0 (x) = α1 : Z b p̃(x) dx = Z b x−β p α a a Z b = · x−β α und 1 dx α p(g(x)) · g 0 (x) dx a Z g(b) p(y) dy = g(a) Z = b−β α a−β α p(y) dy b−β a−β ≤X≤ ) α α = P (a ≤ αX + β ≤ b) (∗) = P( = P (a ≤ X̃ ≤ b). Wobei die Gleichheit (∗) gilt, da p(y) Wahrscheinlichkeitsdichte von X ist. zu ii): Es ist ϕµ,σ (x) = σ1 ϕ( x−µ σ ), wobei ϕ die Wahrscheinlichkeitsdichte der N (0; 1) - Verteilung ist. Daher folgt aus Teil i) des Satzes dass E(X̃) = σ E(X) + µ = µ Var(X̃) = σ 2 · Var(X) = σ 2 , da E(X) = 0 und Var(X) = 1. Ist nun eine N (µ; σ 2 ) - Verteilte Zufallsvariable X gegeben, so können wir durch die inverse Transformation eine N (0; 1) - verteilte Zufallsvariable X ? erhalten. Hierfür wählen wir 1 1 α := p = σ Var(X) und 115 µ β := − E(X) = − , σ 6 Stochastik und es für die transformierte Zufallsvariable X ? = σ1 (X − µ) = σ1 X − µ σ 1 µ E(X) − = 0 σ σ 1 Var(X ? ) = 2 Var(X) = 1. σ E(X ? ) = 6.34 Bemerkungen 1) X ist standardnormalverteilt, wenn µ = 0 und σ = 1. 2) Ist X ∼ N (µ; σ 2 ), dann ist E(X) = µ und σ(x) = σ bzw. Var(X) = σ 2 . 3) Es gelten die Transformationsregeln X ∼ N (0; 1) ⇒ X ∼ N (µ; σ 2 ) ⇒ X̃ = σX + µ ∼ N (µ; σ 2 ) X −µ ∼ N (0; 1). X? = σ (6.34) (6.35) Hiermit können wir eine N (µ; σ 2 )-verteilte Zufallsvariable X berechnen: 6.35 Satz Sei X ∼ N (µ; σ 2 ), dann ist P (a ≤ X ≤ b) = Φ b−µ σ −Φ a−µ , σ (6.36) wobei Φ(x) die in (6.25) definierte Verteilungsfunktion der N (0; 1)-Verteilung ist. Beweis: Für den Beweis nutzen wir aus, dass Äquivalenzumformungen der Ungleichungskette im Argument der Funktion P deren Wert nicht ändern, so dass aus a≤X≤b ⇔ a−µ X −µ b−µ ≤ ≤ , σ σ σ folgt, dass a−µ X −µ b−µ P (a ≤ X ≤ b) = P ≤ ≤ σ σ σ a−µ b−µ =P ≤ X? ≤ σ σ a−µ b−µ (∗) =Φ −Φ . σ σ In (∗) konnte Regel (6.26) verwendet werden, da nach (6.35) die Zufallsvariable X ? := σ1 (X −µ) standardnormalverteilt ist. 6.36 Beispiel Die Zufallsvariable X=„Körperlänge von Neugeborenen“ sei N (µ; σ 2 ) - verteilt mit µ = 51 cm und σ = 4 cm. Mit welcher Wahrscheinlichkeit ist ein Neugeborenes a) zwischen 54cm und 56cm lang? 116 6 Stochastik b) über 57cm lang? zu a): Gesucht ist P (54 ≤ X ≤ 56): 54 − 51 X − 51 56 − 51 ≤ ≤ 4 4 4 3 5 =P ≤ X̃ ≤ 4 4 P (54 ≤ X ≤ 56) = P (∗) = Φ(1,25) − Φ(0, 75) = 0,89 − 0,77 = 0,12 = 12% wobei (∗) gilt, da X ? := X−51 N (0; 1)-verteilt ist, so dass Φ die Verteilungsfunktion von X ? 4 ist, deren Werte Tabelle 6.3 entnommen werden können. zu b): Gesucht ist P (X > 57): P (X > 57) = 1 − P (X ≤ 57) 57 − 51 X − 51 ≤ =1−P 4 4 6 = 1 − P X? ≤ 4 = 1 − Φ(1,5) = 1 − 0,933 = 0,067. 6.37 Bemerkung Ein Beispiel einer anderen stetigen Zufallsverteilung als der Gaußverteilung ist die Exponentialverteilung. Sie wird mit einem Parameter λ ∈ R>0 beschrieben durch die Wahrscheinlichkeitsdichte ( pλ (x) = λ e−λx 0 falls x ≥ 0 falls x < 0. ∞ Dass auch hier die Normierungsbedingung (6.18) p (x) dx = 1 erfüllt ist, rechnet man R x −∞ λ leicht nach. Die Verteilungsfunktion Fλ (x) = −∞ pλ (y) dy lässt sich in diesem Fall explizit berechnen, sie lautet R ( Fλ (x) = 1 − e−λ x 0 falls x ≥ 0 falls x < 0. Da die Wahrscheinlichkeitsdichte pλ nicht symmetrisch ist, gelten die Rechenregeln (6.28) (6.31) der Φ - Funktion nicht für die Verteilungsfunktion Fλ . Lediglich (6.26) und (6.27) bleiben richtig. In diesem Beispiel sieht man auch, dass eine Wahrscheinlichkeitsdichte durchaus Funktionswerte größer als 1 annehmen kann. Bei einer Wahrscheinlichkeitsverteilung mit endlicher Ergebnismenge ist dieses nicht möglich! Mit der Exponentialverteilung wird beispielsweise die Lebensdauer von Atomen beim radioaktiven Zerfall beschreiben. 117 6 Stochastik R 2 1.5 1 pλ (x) Fλ (x) 0.5 R -1 1 2 Abbildung 6.8: W-dichte und -verteilung der Exponentialverteilung mit λ = 2 6.3.4 Die σ - Regeln 6.38 Satz Die Zufallsvariable X sei N (µ; σ 2 )-verteilt, dann gilt: P (µ − σ ≤ X ≤ µ + σ) ≈ 0,683 P (µ − 2σ ≤ X ≤ µ + 2σ) ≈ 0,955 P (µ − 3σ ≤ X ≤ µ + 3σ) ≈ 0,997. Zur Veranschaulichung der Aussagen von Satz 6.38 siehe Abbildung 6.9. Beweis: Sei X ? = X−µ σ , dann ist X ? ∼ N (0; 1) so dass aus µ − kσ ≤ X ≤ µ + kσ X −µ ⇔ −k ≤ ≤k σ ⇔ −k ≤ X ? ≤ k folgt, dass P (µ − kσ ≤ X ≤ µ + kσ) = P (−k ≤ X ? ≤ k) = 2Φ(k) − 1. Damit folgt für k = 1, 2, 3: P (µ − σ ≤ X ≤ µ + σ) = 2Φ(1) − 1 ≈ 0,683 P (µ − 2σ ≤ X ≤ µ + 2σ) = 2Φ(2) − 1 ≈ 0,955 P (µ − 3σ ≤ X ≤ µ + 3σ) = 2Φ(3) − 1 ≈ 0,997 Die Werte Φ(k) entnimmt man Tabelle 6.3. 118 6 Stochastik 0.5 R 95% 68% 99% R −3σ −2σ σ −σ 2σ 3σ Abbildung 6.9: Die σ - Bereiche der N (0, 1) - Verteilung 6.39 Beispiel Pipetten werden vom Hersteller vertrieben mit der Angabe Volumen µ = 10 ml, σ = 0,01 ml. Mit welcher Wahrscheinlichkeit hat eine Pipette ein Volumen, dass um mehr als 0,02 ml von dem Nennvolumen 10 ml abweicht? P (10 − 0,02 ≤ X ≤ 10 + 0,02) = P (µ − 2σ ≤ X ≤ µ + 2σ) = 0,955 Das Volumen der Pipette weicht also mit Wahrscheinlichkeit P = 1 − 0,955 = 0,045 = 4,5% um mehr als 0,02 ml ab. Wir interessieren uns nun für die umgekehrte Fragestellung: Wie groß muss bei einer N (0; 1)verteilten Zufallsvariablen ein symmetrisches Intervall [−τ, τ ] sein, damit 95% der Werte in diesem Bereich liegen? 0.5 R 95% 2,5% 2,5% R −τ −τ Aufgrund der Regel (6.31) können wir diese Aufgabe schreiben als P (−τ < X < τ ) = 2Φ(τ ) − 1 = 0,95 119 (6.37) 6 Stochastik d.h. es ist Φ(τ ) = 0,95+1 , 2 also (siehe Tabelle 6.3): τ = Φ−1 0,95 + 1 2 = Φ−1 (0,975) = 1,96. (6.38) Es liegen also 95% aller Werte einer N (0; 1) - verteilten Zufallsvariablen im Intervall [−1, 96; 1, 96]. Verallgemeinern wir obige Fragestellung, indem wir in Gleichung (6.37) den Wert 0, 95 durch ein allgemeines α ∈ [0, 1) ersetzen, so erhalten wir, dass Zufallsvariable X mit Wahrscheinlichkeit α in dem zu µ symmetrischen Intervall der Breite τ = Φ−1 α+1 2 (6.39) liegt. Sei nun X̃ ∼ N (µ; σ 2 ) (also nicht mehr standardnormalverteilt), dann wissen wir, dass man X̃ schreiben kann als X̃ = σX + µ, wobei X ∼ N (0; 1). Also ist P (−τ ≤ X ≤ τ ) = P (−στ + µ ≤ σX + µ ≤ στ + µ) = P (−στ + µ ≤ X̃ ≤ στ + µ) d.h. wegen (6.37) und (6.38) liegen für τ = 1, 96 somit 95% aller Ergebnisse einer N (µ; σ 2 ) verteilten Zufallsvariablen im Intervall [−στ + µ; στ + µ]. 120 7 Lineare Algebra 7.1 Vektoren Viele Beobachtungsgrößen lassen sich alleine durch ihren Betrag bereits vollständig beschreiben, wie z.B. Energie, Masse, Länge oder Volumen. Diese heißen skalare Größen. Im Gegensatz hierzu haben Größen wie Beschleunigung, Geschwindigkeit und Kraft neben einem Betrag immer auch eine Richtung. Sie heißen vektorielle Größen und werden dargestellt durch n-Tupel im Rn x1 .. (7.1) x = . ∈ Rn , xn wobei die Einträge x1 , . . . , xn reelle Zahlen sind. 7.1.1 Rechnen mit Vektoren Sofern keine Missverständnisse auftreten können, unterscheiden wir nicht zwischen der Spaltennotation (7.1) und der platzsparenden Zeilennotation x = (x1 , . . . , xn ) von Vektoren. Um Vektoren in der Notation von Skalaren zu unterscheiden, werden im Skriptum Vektoren stets fett gedruckt, es ist also x ∈ Rn ein Vektor und x ∈ R ein Skalar. 7.1 Definition i) Für zwei Vektoren x = (x1 , . . . , xn ) und y = (y1 , . . . , yn ) des Rn definieren wir die Summe durch x 1 + y1 y1 x1 .. x + y = ... + ... := . . x n + yn yn xn ii) Für einen Vektor x = (x1 , . . . , xn ) ∈ Rn und ein Skalar s ∈ R definieren wir die Multiplikation mit Skalaren durch x1 s · x1 .. .. s x = s . := . xn 121 s · xn 7 Lineare Algebra iii) Wir erklären −x durch −x1 .. −x := (−1)x = . −xn und die Differenz x − y zweier Vektoren durch x − y := x + (−y). iv) Der Nullvektor 0 ∈ Rn ist definiert durch 0 0 := ... . 0 Für die so definierten Verknüpfungen gelten die folgenden Rechenregeln. 7.2 Satz Für Vektoren x, y, z ∈ Rn und Skalare s, t ∈ R gilt: (x + y) + z = x + (y + z) Assoziativgesetz der Addition; x+y=y+x Kommutativgesetz der Addition; s(tx) = (s t)x Assoziativgesetz der Multiplikation mit Skalaren; (s + t)x = sx + tx s(x + y) = sx + sy Distributivgesetze. Vektoraddition, -subtraktion und die Multiplikation mit Skalaren lassen sich geometrisch interpretieren. x2 x2 2 2 x+y x 1 x−y x 1 y 1 x y x1 2 1 Abbildung 7.1: Addition und Subtraktion zweier Vektoren 122 x1 2 7 Lineare Algebra 7.3 Beispiele a) −3 1−2 2 1 3 2 − −1 = 3 2 + 1 = 9 . −3 3−4 4 3 b) Wirken auf einen Massenpunkt zwei Kräfte F und F̃ , so erhält man die resultierende Kraft Fres durch Vektoraddition: Fres = F + F̃ 7.4 Bemerkung Zwei Darstellungen eines Vektors, die durch Parallelverschiebung ineinander überführt werden können, repräsentieren den gleichen Vektor. Eine Darstellung eines Vektors, die ihren Ursprung im Nullpunkt des Koordinatensystems hat, bezeichnet man als Ortsvektor. Ein Punkt P = (p1 , . . . , pn ) ∈ Rn ist identisch mit seinem Ortsvektor p = (p1 , . . . , pn ). 7.5 Definition Sei x ∈ Rn ein Vektor, so ist der Betrag von x, geschrieben kxk, definiert durch kxk := q x21 + x22 + · · · + x2n . 7.6 Beispiele a) Ist x ∈ R2 gegeben durch x = (cos ϕ, sin ϕ) mit ϕ ∈ [0, 2π), so ist q kxk = cos2 ϕ + sin2 ϕ = 1. x liegt auf dem Einheitskreis im R2 . b) Ist x ∈ R2 gegeben durch x = (r cos ϕ, r sin ϕ), mit ϕ ∈ [0, 2π) und r ∈ R≥0 , so ist kxk = q r2 cos2 ϕ + r2 sin2 ϕ = r. x liegt auf dem Kreis mit Radius r und Mittelpunkt (0, 0) des R2 . Wir nennen (r, ϕ) Polarkoordinaten des Vektors x = (r cos ϕ, r sin ϕ). c) Ist x ∈ R3 gegeben durch cos ϕ sin ϑ x = r sin ϕ sin ϑ cos ϑ 123 (7.2) 7 Lineare Algebra mit ϕ ∈ [0, 2π), ϑ ∈ [0, π] und r ∈ R, so ist für r = 1 kxk = = q cos2 ϕ sin2 ϑ + sin2 ϕ sin2 ϑ + cos2 ϑ s (cos2 ϕ + sin2 ϕ) sin2 ϑ + cos2 ϑ {z | } =1 = 1. x liegt auf der Kugel mit Radius 1 und Mittelpunkt (0, 0, 0) des R3 . Für r 6= 1 ist kxk = r. (r, ϕ, ϑ) heißen Kugelkoordinaten des Vektors x ∈ R3 . Es gibt ϕ den Winkel in der x1 , x2 - Ebene an (den Längengrad) und ϑ den Winkel, den der Ortsvektor mit der x3 - Achse einschließt (siehe Abb. 7.2). Es gibt unterschiedliche Möglichkeiten, Kugelkoordinaten zu definieren, der Winkel ϑ lässt sich beispielsweise anstelle von der x3 - Achse auch von der x1 , x2 - Ebene aus messen (der Äquator - Ebene). x3 x ϑ x2 ϕ x1 Abbildung 7.2: Die Kugelkoordinaten Es ist auch möglich, den Winkel ϑ von der x1 /x2 - Ebene aus zu messen, Gleichung (7.2) ist die übliche Konvention. d) Für t ∈ R und x ∈ Rn gilt kt xk = |t| · kxk. 7.1.2 Winkel und Skalarprodukt 7.7 Definition Für zwei Vektoren x, y ∈ Rn definieren wir das Skalarprodukt von x und y durch x1 y1 .. .. x·y = . · . xn yn : = x1 y1 + · · · + xn yn . 124 7 Lineare Algebra 7.8 Bemerkungen 1. Für x · x schreiben wir abkürzend x · x = x2 . 2. Terme der Form x3 oder x−1 sind für Vektoren nicht definiert. 3. Aus dem Skalarprodukt lässt sich der Betrag eines Vektors berechnen: kxk2 = x · x. Für das Skalarprodukt gelten die folgenden Rechenregeln. 7.9 Satz: Rechenregeln Skalarprodukt Seien x, y, z ∈ Rn Vektoren und t ∈ R, dann gilt: x·y = y·x Kommutativgesetz; x · (y + z) = x · y + x · z Distributivgesetz; (tx) · y = t(x · y) = x · (ty). Nun soll der Winkel zwischen zwei Vektoren x und y berechnet werden. Hierzu betrachten wir ein allgemeines Dreieck mit den Seitenlängen a, b, c welches auch mittels der Vektoren x, y, z dargestellt werden kann, wobei kxk = a, kyk = b und kzk = kx + yk = c ist. x2 x2 4I 2 γ a 1 4II 2 b 1 c γ x y z=y−x x1 1 x1 2 1 2 Abbildung 7.3: Beschreibung eines Dreicks mittels Seitenlängen oder durch Vektoren Für das linke Dreieck 4I gilt der Cosinussatz c2 = a2 − 2ab cos γ + b2 , 125 (7.3) 7 Lineare Algebra welcher sich mit dem Satz des Pythagoras und der Definition des Cosinus beweisen lässt. Berechnen wir in dem rechten Dreieck 4II den Betrag von z, geschrieben kzk, durch kzk2 = ky − xk2 = (y − x) · (y − x) = (y · y) − (x · y) − (y · x) + (x · x) 2 (7.4) 2 = kyk − 2x · y + kxk und vergleichen wir (7.4) mit (7.3), so erhalten wir (mit a = kxk und b = kyk) −2ab cos γ = − 2x · y ⇐⇒ kxk kyk cos γ = − x · y. Damit ist cos γ = x·y , kxk kyk (7.5) d.h. der Winkel γ ∈ [0, π] zwischen x und y lässt sich berechnen durch γ = arccos( x·y ). kxk kyk Da −1 ≤ cos γ ≤ 1 gilt, folgt aus (7.5), dass −kxk kyk ≤ x · y ≤ kxk kyk, ein Ergebnis, das als Cauchy-Schwarzsche-Ungleichung bekannt ist. 7.10 Satz: Cauchy-Schwarzsche Ungleichung Für x, y ∈ Rn gilt |x · y| ≤ kxk kyk ⇐⇒ (x1 y1 + · · · + xn yn )2 ≤ (x21 + · · · + x2n ) · (y12 + · · · + yn2 ). (7.6) Hieraus folgt die Dreiecksungleichung. 7.11 Satz: Dreiecksungleichung Für x, y ∈ Rn gilt kx + yk ≤ kxk + kyk. Beweis. Wie in (7.4) berechnen wir kx + yk2 = kxk2 + 2 x · y + kyk2 . 126 (7.7) 7 Lineare Algebra x2 y x 2 1 z=x+y x1 1 2 Abbildung 7.4: Die Dreiecksungleichung Da nach (7.6) gilt, dass |x · y| ≤ kxk · kyk, können wir die rechte Seite abschätzen durch kxk2 + 2x · y + kyk2 ≤ kxk2 + 2kxk kyk + kyk2 = (kxk + kyk)2 . Also folgt kx + yk2 ≤ (kxk + kyk)2 so dass wir die Wurzel ziehen können und als Ergebnis erhalten kx + yk ≤ kxk + kyk. 7.12 Bemerkung Ist das Skalarprodukt zweier Vektoren x, y ∈ Rn gleich Null, x · y = 0, so ist (7.4) äquivalent zum Satz des Pythagoras kzk2 = kxk2 + kyk2 für z = x + y. Man definiert daher: 7.13 Definition: Orthogonal Zwei Vektoren x, y ∈ Rn heißen orthogonal (x ⊥ y) genau dann, wenn x · y = 0. 7.1.3 Der Korrelationskoeffizient Es soll festgestellt werden, ob zwischen zwei Merkmalen X und Y ein linearer Zusammenhang besteht. Hierzu liegen n Messwertpaare (xi , yi ), i = 1, . . . , n, vor. Zunächst standardisieren wir die Werte durch xi − x̄ yi − ȳ und ỹi = , x̃i = σx σy 127 7 Lineare Algebra wobei x̄, ȳ die Mittelwerte und σx , σy die Standardabweichung der xi , yi (i = 1, . . . , n) sind: v u n n u1 X 1X x̄ = xi , σx = t (xi − x̄)2 , n i=1 n i=1 ȳ, σy werden analog definiert. Hierbei bewirkt die Verschiebung der Werte um x̄, ȳ, dass die Messwerte der Paare (xi , yi ), i = 1, . . . , n, um den Nullpunkt zentriert werden und die Faktoren σ1x , σ1y bewirken Invarianz gegenüber der Skalierung. Es soll keinen Einfluss haben, ob eine Größe beispielsweise in Millimetern oder Metern gemessen wird. Das Produkt eines Wertepaares xi − x̄ yi − ȳ x̃i · y˜i = · σx σy hat ein positives Vorzeichen, wenn die Messpunkte xi , yi in gleicher Richtung von den Mittelwerten x̄, ȳ abweichen und ein negatives Vorzeichen, wenn die Abweichung in unterschiedlicher Richtung erfolgt. Dieses deutet auf einen linear wachsenden oder linear fallenden Zusammenhang hin. Mitteln wir dieses Produkt über alle Wertpaare, so erhalten wir den Korrelationskoeffizienten r(x, y) : n n 1X 1X xi − x̄ r(x, y) : = x̃i · y˜i = n i=1 n i=1 σx n P 1 n =s 1 n =s n P · yi − ȳ σy ! (xi − x̄) · (yi − ȳ) i=1 s 1 n (xi − x̄)2 · i=1 n P n P (yi − ȳ)2 i=1 (xi − x̄) · (yi − ȳ) i=1 n P s (xi − x̄)2 · i=1 n P (7.8) (yi − ȳ)2 . i=1 Fassen wir nur die zentrierten Messwerte in Datenvektoren x∗ , y∗ ∈ Rn zusammen, x∗ := (x1 − x̄, x2 − x̄, . . . , xn − x̄) y∗ := (y1 − ȳ, y2 − ȳ, . . . , yn − ȳ), so können wir (7.8) schreiben als r(x, y) = x ∗ · y∗ = cos α, kx∗ k · ky∗ k (7.9) wobei α der Winkel zwischen x∗ und y∗ ist. r(x, y) nimmt also nur Werte aus [−1, +1] an. Ein Wert nahe +1 oder −1 deutet auf einen linearen Zusammenhang hin, ein Wert nahe 0 auf keinen linearen Zusammenhang. Trotzdem kann natürlich ein nichtlinearer Zusammenhang vorliegen. Auch sagt ein Wert nahe ±1 nichts über einen kausalen Zusammenhang aus. 128 7 Lineare Algebra 7.1.4 Lineare Unterräume des Rn Sind im Rn Vektoren v1 , v2 , . . . , vk gegeben und ferner k skalare Koeffizienten s1 , . . . , sk ∈ R, so bezeichnet man den Vektor v = s1 v1 + s2 v2 + · · · + sk vk (7.10) als Linearkombination der Vektoren v1 , v2 , . . . , vk . Geraden und Ebenen des Rn die den Koordinatenursprung enthalten, haben die besondere Eigenschaft, dass Linearkombinationen ihrer Elemente wieder auf dieser Geraden bzw. Ebene liegen. Diese Struktur soll im Folgenden näher beschrieben werden. 7.14 Definition: Linear unabhängig i) Zwei Vektoren v, w ∈ Rn heißen linear unabhängig, wenn sie nicht die Nullvektoren sind, v 6= 0 und w 6= 0, und wenn w 6= sv, ∀s ∈ R gilt. ii) Je k Vektoren des Rn , v1 , v2 , . . . , vk , heißen linear unabhängig, wenn die Gleichung s1 v1 + s2 v2 + · · · + sk vk = 0 nur die Lösung s1 = 0, s2 = 0, ... , sk = 0 hat. iii) Vektoren, die nicht linear unabhängig sind, heißen linear abhängig. 7.15 Bemerkungen 1) Anschaulich bedeutet Bedingung i), dass die beiden Vektoren v, w nicht auf einer Geraden durch den Koordinatenursprung liegen. Im Falle dreier linear unabhängiger Vektoren im R3 bedeutet Bedingung ii), dass diese drei Vektoren nicht in einer Ebene durch den Koordinatenursprung des R3 liegen. 2) Definition 7.14 ii) bedeutet, dass sich keiner der Vektoren v1 , . . . , vk als Linearkombination der übrigen Vektoren darstellen lässt, was im Falle k = 2 gerade die Bedingung i) ist. 3) Im Rn kann es höchstens n linear unabhängige Vektoren geben. Sind n + 1 verschiedene Vektoren gegeben, so sind diese stets linear abhängig. 129 7 Lineare Algebra 7.16 Definition: Linearer Unterraum Eine Teilmenge L des Rn , L ⊆ Rn , heißt linearer Unterraum des Rn , wenn sie den Koordinatenursprung enthält und wenn Summen und skalare Vielfache ihrer Elemente wieder in der Teilmenge L liegen: 0 i) 0 = ... ∈ L 0 ii) v ∈ L und t ∈ R ⇒ tv ∈ L iii) v, w ∈ L ⇒ v + w ∈ L. Wiederholtes Anwenden von ii) und iii) ergibt, dass alle Linearkombinationen (7.10) von Elementen eines linearen Unterraumes wieder in diesem linearen Unterraum liegen. Lineare Unterräume haben offenbar immer unendlich viele Elemente, gesucht ist daher ein Maß, das ihre „Größe “ beschreibt, mit dem sich beispielsweise eine Gerade von einer Ebene unterscheiden lässt. Dieses Maß bezeichnet man als Dimension. 7.17 Definition: Dimension eines linearen Unterraumes Die Dimension eines linearen Unterraumes L des Rn , geschrieben dim L, ist die kleinste Anzahl k an Vektoren v1 , . . . , vk ∈ L, so dass sich jeder Vektor v ∈ L darstellen lässt als Linearkombination der v1 , . . . , vk ∈ L: v = s1 v1 + · · · + sk vk (7.11) mit Koeffizienten s1 , . . . , sk ∈ R. Man sagt, dass die Vektoren v1 , . . . , vk den linearen Unterraum L aufspannen. Die Vektoren v1 , . . . , vk sind nicht eindeutig bestimmt, aber sie sind immer linear unabhängig. Ließe sich nämlich einer der Vektoren als Linearkombination der restlichen Vektoren darstellen, so könnte man auch auch alle anderen Vektoren v ohne ihn darstellen, indem man ihn in Darstellung (7.11) einfach durch diese Linearkombination ersetzt. 7.18 Beispiele a) Sei u ∈ Rn fest. Dann ist G = {x | x = su, s ∈ R} eine Gerade durch den Ursprung des Rn . G ist ein linearer Unterraum des Rn , denn die drei Bedingungen aus Definition 7.16 sind erfüllt: i) 0 = 0 u, also ist 0 ∈ G. ii) Ist v ∈ G, so ist v = s u. Daher ist tv = t (su) = (t s)u ∈ G, 130 7 Lineare Algebra da (t s) ∈ R iii) Sind v, w ∈ G, so sind v = su und w = tu mit s, t ∈ R. Also ist auch v + w = su + tu = (s + t)u ∈ G, da s + t ∈ R. Da alle Elemente der Geraden G skalare Vielfache des Vektors u sind, ist G ein eindimensionaler linearer Unterraum des Rn , dim G = 1. b) Seien v1 , v2 ∈ R3 linear unabhängig (siehe Definition 7.14), so ist E = {x |x = s1 v1 + s2 v2 ; s1 , s2 ∈ R} (7.12) eine Ebene durch den Ursprung des R3 . E ist ein linearer Unterraum des R3 . Aus der Definition (7.12) von E folgt direkt, dass dim E = 2 gilt. c) Sind k linear unabhängige Vektoren im Rn gegeben, so ist die Mengen U ihrer Linearkombinationen U = {u |u = s1 v1 + . . . + sk vk ; s1 , . . . , sk ∈ R} ein linearer Unterraum der Dimension k, dim U = k. d) Der Rn ist ein n-dimensionaler linearer Unterraum von sich selbst. e) Wie wir im folgenden Abschnitt sehen werden, sind die Lösungsmengen homogener linearer Gleichungssysteme lineare Unterräume des Rn . 7.2 Lineare Gleichungssysteme 7.2.1 Lösungsmengen linearer Gleichungssysteme Betrachten wir zunächst eine lineare Gleichung mit 3 Unbekannten: a1 x1 + a2 x2 + a3 x3 = b, (7.13) mit gegebenen Zahlen a1 , a2 , a3 , b ∈ R und gesuchten Unbekannten x1 , x2 , x3 ∈ R. Wenn a1 6= 0 ist, so lässt sich die Gleichung nach x1 auflösen zu x1 = − a2 a3 b x2 − x3 + , a1 a1 a1 (7.14) wobei x2 , x3 ∈ R beliebig gewählt werden können. Dann ist (x1 , x2 , x3 ) eine Lösung zu (7.13), wenn x1 aus (7.14) errechnet wurde. Bezeichnen wir also mit s := x2 und t := x3 die freien 131 7 Lineare Algebra Parameter, so ist die Lösungsmenge Lb von (7.13) a3 b a2 s − t + , s, t | s, t ∈ R} a1 a a 1 1 b a2 a3 , 0, 0 +s − , 1, 0 +t − , 0, 1 | s, t ∈ R} ={ a1 a1 a1 Lb = { − | {z =:v0 | } {z } =:v1 | {z (7.15) } =:v2 = {v0 + s v1 + t v2 | s, t ∈ R}. Die Bezeichnung Lb bringt zum Ausdruck, dass die Lösungsmenge insbesondere auch von der sogenannten “rechten Seite” b abhängt. Man sieht, dass Lb eine Ebene im R3 ist. Ist b = 0, so ist v0 = 0 und L0 ein linearer Unterraum des R3 mit dimL = 2, der aufgespannt wird von den Vektoren a2 a3 v1 = − , 1, 0 und v2 = − , 0, 1 , a1 a1 siehe hierzu Beispiel 7.18 b). Ist b 6= 0 , so ist Lb kein linearer Unterraum und heißt stattdessen b affiner Unterraum, es ist der um den Vektor v0 = a1 , 0, 0 "verschobene" lineare Unterraum: x1 Lb = L0 + v0 b a1 ∈ Lb v0 v0 x2 x3 L0 Ist nun ein System von zwei linearen Gleichungen mit drei Unbekannten gegeben a11 x1 + a12 x2 + a13 x3 = b1 I a21 x1 + a22 x2 + a23 x3 = b2 II, (7.16) so haben Gleichung I und II jeweils eine Ebene im R3 als Lösungsmenge. Gemeinsame Lösungsmenge beider Gleichungen I und II ist die Schnittmenge dieser Ebenen. Sind die Ebenen parallel zueinander, so ist die Schnittmenge leer und das System hat keine Lösungen, anderenfalls ist die Schnittmenge eine Gerade im R3 . Gilt b1 = 0 und b2 = 0, so ist (x1 , x2 , x3 ) = (0, 0, 0) eine Lösung des Systems, die Gerade geht also durch den Ursprung des R3 , der Lösungsraum L0 ist daher nach Beispiel 7.18 a) ein linearer Unterraum des R3 . 132 7 Lineare Algebra 7.19 Beispiel Wir betrachten das System x1 + x2 + x3 = 1 I x1 − x2 + 2x3 = 2 II. Subtrahiert man I von II, so erhält man x1 + x2 + x3 = 1 I II0 . −2x2 + x3 = 1 Wählen wir in II0 t := x3 als freien Parameter, so erhalten wir durch Einsetzen 1 1 x2 = − + t 2 2 3 3 x1 = − t , 2 2 so dass 3 2 3 2 − 3t 1 21 L = {− 2 + 2 t | t ∈ R} t − 23 = {− 12 +t 12 | t ∈ R} 0 1 | {z } =:v0 | {z } =:v1 = {v0 + t v1 | t ∈ R}, 3 was offenbar die parametrisierte Darstellung einer Geraden im R mit Richtungsvektor v1 = − 23 , 12 , 1 ist. Sind drei Gleichungen mit drei Unbekannten gegegben, so ist die Lösungsmenge entweder leer oder ein Punkt, eine Gerade oder eine Ebene im R3 , je nachdem wie die Schnittmenge der drei Ebenen, welche die Lösungsmengen der drei Gleichungen sind, aussieht. Analoges gilt natürlich für Gleichungen mit zwei Unbekannten, hier ist die Lösungsmenge einer Gleichung eine Gerade im R2 . Bei einem System zweier Gleichungen hängt die Lösbarkeit davon ab, ob die Geraden einen Schnittpunkt besitzen. 7.20 Beispiel Betrachten wir das System x1 + 2x2 = 3 I 3x1 − 2x2 = 3 II x1 + 2x2 = 3 I welches wir umformen zu −8x2 = −6 133 II0 . 7 Lineare Algebra Dann erhalten wir aus II0 dass x2 = 34 , was wir in I einsetzen können und dann x1 = 3 − 2x2 = 3 − 2 · 3 3 = 4 2 erhalten. Das System I,II hat also die eindeutige Lösung x= 3 3 , , 2 4 während die einzelnen Gleichungen I und II die Geraden ! GI ! GII ! 3 −2 = { +t | t ∈ R} 0 1 2 1 = { +t 3 0 1 ! | t ∈ R} als Lösungsmengen haben. Rechnen Sie zur Übung nach, dass x = liegt und daher deren Schnittpunkt ist. 3 3 2, 4 auf beiden Geraden 7.2.2 Das Gaußsche Eliminationsverfahren Das Gaußsche Eliminationsverfahren ist ein systematisches Verfahren zum Lösen linearer Gleichungssysteme, kurz LGS, das darauf beruht, dass die zwei folgenden elementaren Umformungen die Lösungsmenge des LGS nicht ändern: (U1) Multiplikation einer Gleichung mit einer Zahl c 6= 0. Wählen wir z.B. in (7.13) c = so erhält man ⇐⇒ 1 a1 , a1 x1 + a2 x2 + a3 x3 = b a2 a3 b x1 + x2 + x3 = , a1 a1 a1 wobei sich die Lösungsmenge der Gleichung offensichtlich nicht ändert. (U2) Ersetzen einer Gleichung durch die Summe dieser Gleichung und einer anderen Gleichung des LGS. Liegt ein System von m Gleichungen mit n Unbekannten vor (m ≤ n), so kann durch sukzessives Anwenden der Regeln (U1) und (U2) das LGS a11 x1 + a12 x2 + · · · + a1n xn = b1 a21 x1 + a22 x2 + · · · + a2n xn = b2 .. . am1 x1 +am2 x2 + · · · + amn xn = bm 134 (LGS) 7 Lineare Algebra in ein LGS in Stufenform ã11 x1 +ã12 x2 + · · · +ã1m xm + · · · + ã1n xn = b̃1 ã22 x2 + · · · +ã2m xm + · · · + ã2n xn = b̃2 .. . (LGS0 ) ãmm xm + · · · + ãmn xn = b̃m umgeformt werden, welches die gleiche Lösungsmenge hat wie (LGS). Sind alle Koeffizienten ã11 , ã22 , . . . , ãmm 6= 0, so lässt sich das System beginnend mit der letzten durch Einsetzen lösen, wobei für den Fall m < n für die Unbekannten xm+1 , . . . , xn frei wählbare Parameter s1 , . . . , sn−m eingesetzt werden. Die Unbekannte xm erhält man aus xm = 1 amm (bm − amm+1 s1 − · · · − amn sn−m ). Nun können xm , s1 , . . . , sn−m eingesetzt werden, um xm−1 zu berechnen, bis schließlich alle x1 , . . . , xm in Abhängigkeit der freien Parameter s1 , . . . , sn−m berechnet sind. Die Lösungsmenge von (LGS0 ) können wir daher darstellen als L = {v0 + s1 v1 + . . . + sn−m vn−m | s1 , . . . , sn−m ∈ R}. Vergleiche hierzu auch (7.15). Ist m = n, so besitzt das System (LGS’) eine eindeutige Lösung, welche man durch "Rückwärtseinsetzen" erhält, sofern ã11 6= 0, . . . , ãnn 6= 0. Ist einer der Koeffizienten ã11 , . . . , ãn in (LGS0 ) gleich Null, so gibt es entweder keine Lösung oder einen zusätzlich freien Parameter. Betrachten wir hierzu als Beispiel das folgenden System, in welchem zunächst der Koeffizient a34 und der Wert für b3 variabel seien: 3x1 3x1 +x2 +x3 +2x2 +2x3 · (−2) +x4 =1 +x4 = 2 | · (−1) ← −+ 6x1 +3x2 +3x3 +a34 x4 = b3 (7.17) ←−−−−−−−−−− + Mittels der elementaren Umformungen U1 und U2 bringen wir (7.17) auf Diagonalgestalt: ⇐⇒ 3x1 +x2 +x3 +x4 = 1 +x3 x2 +x3 +(a34 − 2)x4 = b3 − 2 3x1 +x2 +x3 1 x2 +x4 ⇐⇒ = x2 +x3 · (−1) ← −+ = 1 = 1 . (7.18) +(a34 − 2)x4 = b3 − 3 In (7.18) ist nun ã33 = 0, ã34 = a34 − 2 und b̃3 = b3 − 3. Wir unterscheiden nun die Fälle ã34 = 0 und ã34 6= 0: 3 −3 1.Fall ã34 6= 0 (d. h. a34 6= 2): Es ist x4 = ab34 −2 und in der 2. Gleichung kann für x3 (oder x2 ) ein freier Parameter gewählt werden. (7.18) hat einen 1-dimensionalen Lösungsraum. 2.Fall ã34 = 0 (d. h. a34 = 2): Nun kommt es auf die rechte Seite der 3. Gleichung in (7.18) an : 135 7 Lineare Algebra i) Ist b3 − 3 6= 0, so hat die 3.Gleichung in (7.18) 0 · x4 = b3 − 3 keine Lösung, also hat das LGS (7.18) keine Lösung. Es ist L = ∅ ii) Ist b3 − 3 = 0, so ist 0 · x4 = 0 richtig für alle x4 ∈ R. Ferner kann x3 (oder x2 ) in der 2. Gleichung von (7.18) frei gewählt werden. Das System hat also einen 2-dimensionalen Lösungsraum: Mit b3 = 3 und a34 = 2 wird (7.18) zu 3x1 +x2 + x3 +x4 x2 + =1 x3 =1 (7.19) 0 · x4 = 0. Setzen wir x4 = s2 und x3 = s1 , so erhalten wir x2 = 1 − s1 1 1 x1 = (1 − x2 − x3 − x4 ) = − s2 . 3 3 Die Lösungsmenge von (7.19) ist also − 1 s2 1 −3 s 1 4 L= x∈R |x= , mit s1 , s2 ∈ R s1 s2 0 0 − 13 1 −1 0 4 = x ∈ R | x = + s1 + s2 , mit s1 , s2 ∈ R , 0 1 0 0 0 1 es ist dim L = 2. 7.3 Matrizen 7.3.1 Einführung Mit Hilfe von Matrizen lassen sich lineare Gleichungssysteme in einer kompakten, übersichtlicheren Schreibweise angeben. Sei ein LGS gegeben durch a11 x1 + a12 x2 + a13 x3 = b1 a21 x1 + a22 x2 + a23 x3 = b2 136 7 Lineare Algebra dann lässt sich dieses abkürzend schreiben durch a11 a12 a13 a21 a22 a23 | {z A ! x1 b1 x2 = b2 | {z } } x3 ! (7.20) b | {z } x Das mit dem Großbuchstaben A bezeichnete Zahlenschema heißt Matrix. In einer Matrix werden die Einträge doppelt indiziert, aij , wobei der erste Index für die Zeile und der zweite für die Spalte steht (“Zeilen zuerst, Spalten später”). Die Multiplikation einer Matrix mit einem Vektor, A x, ist definiert durch die Skalarprodukte aus den Zeilen von A mit dem Vektor x: a11 a12 a13 a21 a22 a23 ! x1 x2 := x3 ! a11 x1 + a12 x2 + a13 x3 . a21 x1 + a22 x2 + a23 x3 (7.21) Diese Multiplikation ist offensichtlich nur dann möglich, wenn der Vektor genau so viele Komponenten hat wie die Matrix Spalten hat. Eine Matrix A mit m Zeilen und n Spalten a11 a21 A= .. . a12 a22 .. . ··· ··· a1n a2n am1 am2 · · · amn heißt (m × n)-Matrix und der Raum aller (m × n)-Matrizen heißt Rm×n . Eine Matrix repräsentiert nicht nur wie oben beschrieben ein lineares Gleichungssystem. Durch Multiplikation mit einer (m × n)-Matrix wird ein Vektor x ∈ Rn auf einen Vektor b ∈ Rm abgebildet (s.(7.20)). Die hierdurch definierte Zuordnung ist eine lineare Abbildung (siehe Definition 3.5) und wird notiert durch A : Rn → Rm (7.22) x 7→ Ax = b. 7.21 Beispiele a) Zur Demonstration der in (7.21) erklärten Multiplikation berechnen wir 1 1·1 + 3·2 + 7·1 + 0·3 14 1 3 7 0 2 2 −3 4 1 = 2 · 1 + (−3) · 2 + 4 · 1 + 1 · 3 = 3 1 0 · 1 + 2 · 2 + (−1) · 1 + 4 · 3 15 0 2 −1 4 3 b) Die Matrix Dϕ ∈ R2×2 ! Dϕ = dreht einen Vektor x ∈ R2 cos ϕ − sin ϕ sin ϕ cos ϕ um den Winkel ϕ. Sei beispielsweise x = 137 (7.23) 0 1 ! ! und y = 1 0 , 7 Lineare Algebra so ist ! Dϕ x = cos ϕ − sin ϕ sin ϕ cos ϕ Dϕ y = cos ϕ − sin ϕ sin ϕ cos ϕ und ! 0 1 ! ! = − sin ϕ cos ϕ = cos ϕ , sin ϕ ! 0 1 ! was der Drehung um den Winkel ϕ gegen den Uhrzeigersinn entspricht, wie in Abbildung (7.5) verdeutlicht ist. R 1 cos(ϕ) ϕ ϕ R − sin(ϕ) Abbildung 7.5: Drehung von x = sin(ϕ) 0 1 1 0 und y = 1 um den Winkel ϕ gegen den Uhrzeigersinn c) Die Matrix T ∈ R2×2 ! T = t 0 0 t streckt einen Vektor x ∈ R2 um den Faktor t: Tx = t 0 0 t ! x1 x2 ! = t x1 t x2 ! = tx. d) Spezielle Matrizen: Im Rn×n wird mit 1 ··· ··· 0 .. 0 1 . In := . , . . .. . . . . 0 ··· ··· 1 die Matrix bezeichnet, deren Elemente auf der Diagonalen gleich 1, aii = 1, und sonst gleich 0 sind, d. h. aij = 0 für i 6= j. Es gilt In v = v ∀v ∈ R. In (oder auch I) heißt Einheitsmatrix im Rn×n . Mit 0 ∈ Rm×n wird die Nullmatrix bezeichnet, deren Elemente alle 0 sind, aij = 0 für i = 1, . . . , m und j = 1, . . . , n. 138 7 Lineare Algebra e) Die Matrix A ∈ R2×2 A= a b c d ! ! bildet die Einheitsvektoren e1 = 1 0 0 1 und e2 = ! ab auf die Spaltenvektoren der Matrix A: A e1 = a b c d ! 1 0 ! ! = a c A e2 = und a b c d ! ! 0 1 ! = b . d Daher wird das Einheitsquadrat, welches von den Vektoren e1 und e2 aufgespannt wird, unter auf das Parallelogramm, welches aufgespannt wird von den Vektoren ! A abgebildet ! a b und . c d R R 2 c+d A −−−−−→ 1 d c R 1 R 2 b a a+b Abbildung 7.6: Verzerrung des Einheitsquadrates durch die Matrix A 7.3.2 Rechnen mit Matrizen 7.22 Definition Seien A, B ∈ Rm×n zwei Matrizen mit den Elementen A = (aij ) und B = (bij ) und sei weiter t ∈ R. Summe und Differenz der Matrizen A und B werden durch Addition und Subtraktion der Elemente der Matrizen erklärt: A + B = (aij + bij ) A − B = (aij − bij ). Multiplikation einer Matrix mit einem Skalar t ∈ R: t A = (t aij ). 139 7 Lineare Algebra 3 0 1 2 0 1 7.23 Beispiel Sei A = 1 0 2, B = 3 2 1 und t = 3, dann erhalten wir 1 2 3 3 3 3 5 0 2 2+3 0+0 1+1 A + B = 1 + 3 0 + 2 2 + 1 = 4 2 3 , 4 5 6 3+1 3+2 3+3 −1 0 0 2−3 0−0 1−1 A − B = 1 − 3 0 − 2 2 − 1 = −2 −2 1 , 2 1 0 3−1 3−2 3−3 3·2 3·0 3·1 3 A = 3 · 1 3 · 0 3 · 2 3·3 3·3 3·3 6 0 3 = 3 0 6 . 9 9 9 Die Multiplikation zweier Matrizen kann nicht auf die gleiche Weise intuitiv und erklärt werden. Um zu einer sinnvollen Definition zu gelangen, stellen wir die folgende Überlegung an: Soll ein Vektor x ∈ R2 erst um den Winkel ϕ gedreht und dann um den Faktor t gestreckt werden, so muss zunächst Dϕ x berechnet und dann auf das Ergebnis die Matrix T (siehe Beispiel 7.21 b) und c)) angewendet werden. Daher soll die Multiplikation zweier Matrizen so definiert werden, dass ihr Produkt das Gleiche bewirkt, wie die Hintereinanderausführung der Mutliplikationen. Es soll für jeden Vektor x (T Dϕ )x = T (Dϕ x) und allgemein (AB)x = A(Bx) (7.24) gelten. Dieses ist nicht der Fall, wenn, analog zur Addition, einfach die Elemente der Matrizen multipliziert werden. Damit (7.24) gilt, wird AB = C erklärt durch Skalarmultiplikation der Zeilen von A mit den Spalten von B: cij = (i-te Zeile von A) · (j-te Spalte von B). ↑ Skalarprodukt Hierzu muss die Zeile von A genau so “lang” sein wie die Spalte von B. Die Multiplikation zweier Matrizen kann daher nur dann definiert werden, wenn die Spaltenzahl n der ersten Matrix gleich der Zeilenzahl der zweiten Matrix ist. 7.24 Definition: Multiplikation von Matrizen Seien A, B ∈ Rn×n , dann ist das Produkt A B =: C ∈ Rn×n erklärt durch C = (cij ) mit cij := n X k=1 140 aik bkj 7 Lineare Algebra für alle i = 1, . . . , m und j = 1, . . . , p. Das Matrixelement cij ist das Skalarprodukt der i-ten Zeile von A mit der j-ten Spalte von B: a11 . .. ai1 . . . an1 ··· ··· ··· a1n .. b11 . .. ain · . .. bn1 . ann ··· ··· b1j .. . ··· bnj ··· b1n .. = . bnn c11 .. . .. . .. . ··· ··· .. . ··· ··· cij .. . ··· cn1 ··· ··· ··· c1n .. . .. . .. . cnn 7.25 Beispiel Die Matrizen 1 2 1 A = −1 0 3 4 −3 2 und 1 2 −2 B = 2 1 5 3 1 0 sollen multipliziert werden. Zur einfacheren Darstellung verwenden wir das sogenannte FalkSchema, in welchem stets die links des zu berechnenden Elements stehende Zeile mit der darüberstehenden Spalte skalar multipliziert wird: B 1 -1 4 Es ist also A 2 0 -3 1 3 2 1 2 3 8 8 4 2 1 1 5 1 7 -2 5 0 8 2 -23 8 5 8 2 . A B = 8 1 4 7 −23 7.26 Satz Für die so definierten Verknüpfungen gelten die folgenden Rechenregeln: i) Seien A, B ∈ Rm×n , x, y ∈ Rn und s, t ∈ R. Dann gilt A+B =B+A s(tA) = (s t)A A + (B + C) = (A + B) + C (s + t)A = sA + tA s(A + B) = sA + sB (A + B)x = Ax + Bx A(x + y) = Ax + Ay. 141 7 Lineare Algebra ii) Seien A, B, C ∈ Rn×n und x ∈ Rn . Dann gilt: (AB)x = A(Bx) (AB)C = A(BC) A(B + C) = AB + AC (A + B)C = AC + BC AIn = In A = A In x = x. 7.27 Beispiele a) Die Multiplikation von Matrizen ist nicht kommutativ. Für ! A= 1 2 3 0 ! AB = 3 4 9 6 und B= 3 2 0 1 ! ist ! aber BA = 9 6 . 3 0 b) Gilt für zwei Matrizen A, B, dass AB = 0 ist,!so kann hieraus nicht! A = 0 oder B = 0 1 4 2 4 gefolgert werden. Sei beispielsweise A = und B = , dann gilt AB = 0 2 8 − 12 −1 (Hinweis: Es ist BA 6= 0). In den reellen Zahlen wird diese Schlussfolgerung beispielsweise beim Lösen quadratischer Gleichungen angewendet, wenn aus (x − a)(x − b) = 0 gefolgert wird, dass x = a oder x = b gelten muss. 7.28 Satz Die durch eine Matrix A ∈ Rm×n nach (7.22) definierte Abbildung ist linear. Beweis. Es muss nach Definition 3.5 überprüft werden, dass A(x + y) = Ax + Ay und A(tx) = tAx) für alle x, y ∈ Rn und t ∈ R gilt. Dieses folgt aber direkt aus Satz 7.26 i). 142 7 Lineare Algebra 7.3.3 Die Determinante einer Matrix 7.29 Definition Gibt es zu einer quadratischen Matrix A ∈ Rn×n eine Matrix A−1 ∈ Rn×n so dass AA−1 = A−1 A = In gilt, so heißt A−1 die zu A inverse Matrix. 7.30 Bemerkung Ist zu einer Matrix A ∈ Rn×n die inverse Matrix A−1 ∈ Rn×n bekannt, so kann das LGS Ax = b (7.25) für beliebige rechte Seiten b ∈ Rn gelöst werden durch x : = A−1 b. (7.26) Denn setzen wir (7.26) in (7.25) ein, erhalten wir Ax = A(A−1 b) = (AA−1 )b = b. Diese Lösung von (7.25) ist eindeutig, was man erkennt, wenn man annimmt, dass es eine weitere Lösung y von (7.25) gäbe. Dann wäre Ay = b und wenn wir diese Gleichung mit A−1 multiplizieren, erhalten wir A−1 (Ay) = A−1 b (A−1 A) y = A−1 b ⇐⇒ | {z } =In y = A−1 b ⇐⇒ d.h. y ist die bereits bekannte Lösung aus (7.26). Die zu A inverse Matrix A−1 kann mit dem an einem Beispiel dargstellten folgenden Verfahren berechnet werden. Wir notieren die gegebene Matrix A in einem um die Einheitsmatrix erweiterten Zahlenschema, d. h. es werden 1 0 1 A = 2 1 0 0 2 1 und 1 0 0 I3 = 0 1 0 0 0 1 zusammengefasst zu 1 0 1 | 1 0 0 2 1 0 | 0 1 0 . 0 2 1 | 0 0 1 143 (7.27) 7 Lineare Algebra Nun wird die Matrix A mit Umformungen wie im Gaußschen Eliminationsverfahren zur Einheitsmatrix I3 umgeformt und gleichzeitig werden alle Schritte dieser Umformungen ebenfalls an der rechten Seite in (7.27) vorgenommen: · (−2) 1 0 1 | 1 0 0 2 1 0 −+ 0 ← | 0 1 0 2 1 | 0 0 1 1 0 0 1 | 1 1 · (−2) 0 2 1 | 0 1 0 1 | 1 0 0 | 5 1 0 1 −2 | −2 0 0 1 0 | · 51 4 5 ←−−−−− + 0 0 1 0 −+ ← 2 5 1 5 | − 25 0 0 1 | 0 − 25 1 5 1 0 0 | 0 1 0 4 5 | 1 0 −2 1 4 | 1 ← −+ 0 1 −2 | −2 0 1 −2 | −2 1 0 0 1 0 0 − 25 1 5 − 51 2 5 1 5 · (2) · (−1) Auf der rechten Seite steht nun die inverse Matrix A−1 : 1 5 A−1 = − 25 4 5 2 5 1 5 − 25 Inverse ! einer (2 × 2)-Matrix a b ∈ R2×2 , dann ist Sei A := c d Die − 15 2 5 1 5 1 2 −1 1 2 . = −2 1 5 4 −2 1 lässt sich berechnen durch folgende Formel: ! A −1 1 d −b = . ad − bc −c a (7.28) Die Richtigkeit von (7.28) prüft man durch Nachrechnen von AA−1 = I2 und A−1 A = I2 nach. Offenbar ist die Inverse (7.28) zu einer 2 × 2−Matrix genau dann definiert, wenn ad − bc 6= 0 ist. Dieser Term heißt Determinante von A: 7.31 Definition: Determinante ! Sei A ∈ R2×2 mit A = a b . Dann wird durch c d det(A) = ad − bc 144 7 Lineare Algebra a11 a12 a13 die Determinante von A definiert. Für eine (3 × 3)−Matrix A = a21 a22 a23 ist die a31 a32 a33 Determinante definiert durch die Sarrus-Regel: Man schreibt die ersten beiden Spalten nochmals rechts neben die Matrix A a11 a12 a13 a21 a22 a23 a31 a32 a33 a11 a12 a21 a22 a31 a32 addiert die Produkte der Elemente auf den ersten 3 &-Diagonalen und subtrahiert die Produkte der Elemente auf den %-Diagonalen: det(A) = a11 a22 a33 + a12 a23 a31 + a13 a21 a32 − a31 a22 a13 − a32 a23 a11 − a33 a21 a12 . Wie man der Formel (7.28) für (2 × 2)−Matrizen entnimmt, so gilt auch allgemein: 7.32 Satz Eine Matrix A ist genau dann invertierbar, wenn det(A) 6= 0. 7.33 Beispiel Wie im Beispiel zur Drehmatrix (7.23) gesehen, beschreibt Dϕ die Drehung eines Vektors x ∈ R2 um den Winkel ϕ. Berechnen wir nun die inverse Matrix zu Dϕ , so erwarten wir natürlich, dass Dϕ−1 = D−ϕ ist, d.h. die Drehung um den Winkel −ϕ. Nach Formel (7.28) ist ! Dϕ−1 1 cos ϕ sin ϕ = cos ϕ cos ϕ − sin ϕ(− sin ϕ) − sin ϕ cos ϕ | (∗) = {z } =1 ! cos(−ϕ) − sin(−ϕ) sin(−ϕ) cos(−ϕ) = D−ϕ , wobei wir in (∗) die Symmetrieeigenschaften der cosinus- und sinus-Funktion verwendet haben: cos(−ϕ) = cos(ϕ) und sin(−ϕ) = − sin ϕ. Fassen wir nun unsere Ergebnisse über die Lösbarkeit linearer Gleichungssysteme in der MatrixNotation zusammen, so erhalten wir die folgenden Aussagen: 7.34 Satz: Lösungsmengen linearer Gleichungssysteme i) Sei A ∈ Rm×n und seien v1 , . . . , vk ∈ Rn Lösungen des homogenen LGS Ax = 0. 145 (7.29) 7 Lineare Algebra Dann sind auch alle Linearkombinationen v = λ1 v1 + · · · + λk vk (7.30) Lösungen von (7.29). ii) Sei w∗ ∈ Rn eine Lösung des inhomogenen LGS Ax = b (7.31) mit einem b ∈ Rm . Ist nun v eine Lösung des homogenen LGS (7.29), so ist jedes w = w∗ + v eine Lösung von (7.31). Ferner ist jede Lösung des inhomogenen Systems (7.31) darstellbar als Summe der speziellen Lösung w∗ von (7.31) und einer Lösung v des homogenen Systems (7.29). iii) Das inhomogene System (7.31) ist genau dann eindeutig lösbar, wenn das homogene System nur den Nullvektor 0 ∈ Rn als Lösung hat. iv) Ist A ∈ Rn×n quadratisch, so ist das LGS (7.31) genau dann eindeutig lösbar, wenn A invertierbar ist. Die Lösung w von (7.31) ist dann gegeben durch w = A−1 b. 7.3.4 Eigenwerte und Eigenvektoren Sei A ∈ Rn×n eine quadratische Matrix und x ∈ Rn nicht der Nullvektor, x 6= 0. Interessiert man sich für die Folge x, Ax, A2 x, A3 x, . . . so ist viel Rechenaufwand notwendig um die Vektoren vom Typ Ak x für k ∈ N zu berechnen und es ist schwierig zu erkennen, ob diese (für k → ∞) konvergieren. Wird ein Vektor x bei Multiplikation mit A jedoch auf ein skalares Vielfaches von sich selbst abgebildet, d. h. gilt Ax = λx für ein λ ∈ R, so ist A2 x = A(Ax) = A(λx) = λ(Ax) = λ2 x und entsprechend Ak x = λ k x für alle k ∈ N. Je nachdem ob |λ| > 1, |λ| < 1 oder |λ| = 1 ist, können wir nun Aussagen über das asymptotische Verhalten machen; ( k k kA xk = |λ |kxk → ∞ für |λ| > 1 0 für |λ| < 1 146 7 Lineare Algebra und ( k x (−1)k x k A x=λ x= für λ = 1 . für λ = −1 7.35 Definition: Eigenwerte/Eigenvektoren Ist A ∈ Rn×n , so heißt ein Vektor x ∈ Rn , x 6= 0, Eigenvektor der Matrix A zum Eigenwert λ ∈ R, wenn Ax = λx (7.32) gilt. 7.36 Beispiele a) Sei D ∈ Rn×n eine Diagonalmatrix: d1 0 . . . 0 0 d2 . . . 0 D=. . . .. . .. .. 0 0 . . . dn Dann sind die Diagonalelemente d1 , . . . , dn Eigenwerte von D mit zugehörigen Eigenvek 0 0 1 1 . .. 0 0 toren e1 = .. , e2 = , . . . , en = : . 0 . .. 1 0 0 Dek = dk ek für k = 1, . . . , n. b) Die Scherungsmatrix im R2 (s. Übungsaufgabe Blatt 4) lässt die Vektoren unverändert, die auf der x1 −Achse liegen: ! ! ! 1 a x1 x1 = 0 1 0 0 d.h. alle Vektoren vom Typ x1 0 ! sind Eigenvektoren zum Eigenwert λ = 1. 7.37 Bemerkungen a) Den Nullvektor 0 ∈ Rn in Definition 7.35 als möglichen Eigenvektor zuzulassen macht keinen Sinn, da der Nullvektor Gleichung (7.32) trivialerweise immer erfüllt. b) Ist x Eigenvektor von A zum Eigenwert λ, so ist tx für jedes t ∈ R \ {0} ebenfalls 147 7 Lineare Algebra Eigenvektor von A zum Eigenwert λ: A(tx) = tAx = tλx = λ(tx). c) Eigenvektoren v1 , v2 einer Matrix A zu verschiedenen Eigenwerten λ1 , λ2 sind linear unabhängig. Bisher ist unklar, wie Eigenwerte und Eigenvektoren einer gegebenen Matrix berechnet werden können. Entscheidendes Hilfsmittel hierfür ist der folgenden Satz. 7.38 Satz: Berechnung von Eigenwerten Sie A ∈ Rn×n . Es ist λ ∈ R genau dann Eigenwert von A, wenn det(A − λIn ) = 0. (7.33) Beweis. Ein λ ∈ R ist Eigenwert von A, wenn Ax = λx gilt, was äquivalent ist zu (A − λIn )x = 0, (7.34) d.h. λ ist genau dann Eigenwert von A, wenn das homogene LGS (7.34) eine Lösung x 6= 0 besitzt. Dieses ist nach Satz 7.34 genau dann der Fall, wenn die Matrix (A − λIn ) nicht invertierbar ist, d.h. wenn det(A − λIn ) = 0 gilt. Denn sonst wäre x = (A − λIn )−1 0 = 0 die einzige Lösung von (7.34). 7.39 Beispiele ! a b a) Sei A = eine (2 × 2)-Matrix, so ist λ ∈ R Eigenwert von A genau dann, wenn c d (A − λI2 ) keine Inverse Matrix besitzt. Dies ist nach (7.33) genau dann der Fall, wenn det(A − λI2 ) = 0, d.h. ! det a b λ 0 − c d 0 λ !! =0 ! ⇐⇒ a−λ b det c d−λ ⇐⇒ (a − λ)(d − λ) − bc = 0. =0 Die Eigenwerte λ von A sind also genau die Nullstellen der quadratischen Gleichung λ2 − (a + d)λ + ad − bc = 0. 148 (7.35) 7 Lineare Algebra Damit hat A höchstens 2 Eigenwerte 1 1q λ1/2 = (a + d) ± (a − d)2 + 4bc. 2 2 (7.36) Die zugehörigen Eigenvektoren v1 und v2 sind dann nach Gleichung (7.33) Lösungen des LGS (A − λi I2 )vi = 0, i = 1, 2. (7.37) b) Aus Beispiel a) folgt: Die Matrix ! A= a b 0 d hat die Eigenwerte λ1 = a und λ2 = d. 7.40 Definition: charakteristisches Polynom einer Matrix Zu einer Matrix A ∈ Rn×n heißt p(λ) = det(A − λIn ) das charakteristische Polynom von A. 7.41 Folgerungen Wie wir in (7.35) sehen, ist das charakteristische Polynom p(λ) einer (2 × 2)−Matrix vom Grad 2 in λ. Allgemein ist das charakteristische Polynom einer (n × n)−Matrix vom Grad n in λ, daher hat eine (n × n)−Matrix höchstens n Eigenwerte, da p(λ) höchstens n Nullstellen hat. 7.42 Beispiele a) Es sollen die Eigenwerte und Eigenvektoren von A = 1 2 2 1 ! bestimmt werden. Hierzu berechnen wir det(A − λI2 ) = 0 ! ⇐⇒ 1−λ 2 det 2 1−λ (1 − λ)2 − 4 = 0 ⇐⇒ ⇐⇒ =0 λ2 = −1. λ1 = 3 Um die Eigenvektoren zu diesen Eigenwerten zu berechnen, muss das Gleichungssystem 149 7 Lineare Algebra (7.37) mit λ1 , λ2 gelöst werden. Für λ1 = 3 muss gelten x1 x2 ! x1 x2 ! −2x1 + 2x2 2x1 − 2x2 ! ! 1 2 1 0 −3 2 1 0 1 !! 1−3 2 2 1−3 ⇐⇒ ⇐⇒ ! ! = 0 0 = 0 0 = 0 . 0 ! ! Wir erhalten 2 Gleichungen für x1 und x2 , −2x1 + 2x2 = 0 und 2x1 − 2x2 = 0, ! welche für x1 = x2 beide erfüllt sind. Der Eigenvektor v zu λ1 = 3 ist also v = 1 , oder 1 ! 1 in parametrisierter Form v = t 1 mit t ∈ R. Für λ2 = −1 muss gelten ! x1 x2 ! x1 x2 ! ⇐⇒ 2 2 2 2 ! ⇐⇒ 2x1 + 2x2 2x1 + 2x2 1 2 1 0 − (−1) 2 1 0 1 !! ! ! = 0 0 ! = 0 0 = 0 . 0 ! Wir erhalten zweimal die gleiche Gleichungen für x1 und x2 , 2x1 + 2x2 = 0, !welche für 1 x1 = −x2 erfüllt ist. Der Eigenvektor w zu λ2 = −1 ist daher w = , oder in −1 ! 1 parametrisierter Form w = t −1 für t ∈ R. ! b) Man sieht, dass die Eigenwerte einer symmetrischen Matrix A = a b b a stets gegeben sind durch λ1 = a + b und λ2 = a − b, wenn man sich das charakteristische Polynom p(λ) = (a − λ)2 − b2 notiert und davon überzeugt, dass λ1 , λ2 dessen Nullstellen sind. Die zugehörigen Eigenvektoren zu diesen Eigenwerten sind v1 = 1 1 ! ! und 150 v2 = 1 . −1 7 Lineare Algebra 7.4 Das Leslie-Modell 7.4.1 Das Modell Die Altersstruktur einer Population werde in gleich langen, diskreten Zeitabschnitten beobachtet. Zu einem Zeitpunkt seien in n gleich großen Altersklassen x1 , . . . , xn Individuen. Die Population wird also beschrieben durch den Vektor x = (x1 , . . . , xn ). Sei nun ai die Reproduktionsrate der i-ten Altersklasse pro Zeiteinheit, so ergibt sich nach einer Beobachtungsperiode für die neue jüngste Altersklasse y1 : y1 = a1 x1 + a2 x2 + · · · + an xn . Bezeichnet pi die Überlebensrate der Individuen in der i-ten Altersklasse, so ist yi = pi−1 xi−1 für i = 2, . . . , n und es ist pn = 0. Die Altersstruktur y errechnet sich demnach aus x durch a1 a2 p 1 0 0 p2 y= .. . ... .. an . pn−1 x1 x 2 x3 .. . 0 xn = Lx, L heißt Leslie-Matrix der Population. Betrachten wir nun die Population über mehrere Zeitabschnitte hinweg und bezeichnen wir die Altersstruktur zum Zeitpunkt t mit xt , so erhalten wir nach einem Startwert x0 die Entwicklung x0 → Lx0 → Lx1 = L2 x0 → Lx2 = L3 x0 . . . |{z} x1 | {z } =x2 | {z } =x3 Wie wir in Abschnitt (7.3.4) Eigenwerte und Eigenvektoren gesehen haben, lässt sich diese Entwicklung dann besonders gut beobachten, wenn die Leslie Matrix L Eigenvektoren v1 , . . . , vn zu Eigenwerten λ1 , . . . , λn hat und der Anfangszustand x0 der Population dargestellt werden kann als Linearkombination der Eigenvektoren. Ist nänlich x0 = α1 v1 + · · · + αn vn , so folgt Lk x0 = Lk (α1 v1 + · · · + αn vn ) = α1 Lk v1 + · · · + αn Lk vn = α1 λk1 v1 + · · · + αn λkn vn . 151 (7.38) 7 Lineare Algebra 7.4.2 Das Leslie-Modell für 2 Altersklassen Betrachten wir das Leslie-Modell für eine Population mit 2 Altersklassen, so ist die LeslieMatrix gegeben durch ! a b L= , p 0 wobei a ≥ 0, b ≥ 0 die Fertilitätsraten der beiden Altersklassen sind und 0 < p < 1 die Überlebensrate von der ersten zur zweiten Altersklasse ist. Die Eigenwerte dieser Matrix sind dann nach (7.36) q 1 a ± a2 + 4bp . 2 λ+/− = (7.39) Es ist a2 + 4bp > 0, denn da alle Parameter des Systems nichtnegativ sind, ist a2 + 4bp = 0 nur dann, wenn a = b = p = 0 ist, was offensichtlich nicht sinnvoll ist. Daher können wir folgern, dass 1. λ+ 6= λ− gilt, d.h. die Matrix hat zwei verschiedenen Eigenwerte 2. L hat daher 2 linear unabhängige Eigenvektoren v+ , v− ∈ R2 (s.(7.37)) Lv+ = λ+ v+ Lv− = λ− v− und jeder Anfangszustand x0 ist darstellbar als Linearkombination x0 = α+ v+ + α− v− (7.40) mit α+ , α− ∈ R. 3. Aus a2 + 4bp > 0 folgt ferner λ+ > a und λ− < 0, außerdem ist q 1 |λ− | = |a − a2 + 4bp| 2 q (∗) 1 ≤ (|a| + a2 + 4bp) 2 = λ+ , (7.41) wobei die Abschätzung (∗) mit der Dreiecksungleichung (s. Satz(7.11)) erfolgt ist. Ein Anfangszustand x0 entwickelt sich nun nach (7.38) und (7.40) zu Ln x0 = α+ λn+ v+ + α− λn− v− . Für eine Prognose sind wegen λ+ > |λ− | die Fälle λ+ > 1, λ+ = 1 und 0 < λ < 1 zu unterscheiden. λ+ > 1 : Dieses bedeutet, dass λk+ α+ → ∞, d.h. dass die Population unbegrenzt wächst. 152 7 Lineare Algebra Es ist nach (7.39) λ+ > 1 ⇐⇒ a + q ⇐⇒ q a2 + 4bp > 2 a2 + 4bp > 2 − a, was immer erfüllt ist, wenn a > 2. Wenn 0 < a < 2 gilt, kann die Ungleichung quadriert werden und wir erhalten a2 + 4bp > 4 − 4a + a2 ⇐⇒ a + bp > 1. Der Fall λ+ > 1 tritt also ein, wenn K := a + bp > 1. K heißt Kenngröße des Modells. λ+ = 1 : Nach analoger Rechnung zu oben ist λ+ = 1 Da nun wegen (7.41) und ⇐⇒ K = a + bp = 1. p a2 + 4bp > 0 |λ− | < λ+ folgt, so nähert sich jeder Anfangszustand einer festen Struktur: Lk x0 = λk− α− v− + 1k α+ v+ | {z } →0 (k→∞) d.h. es folgt Lk x0 → α+ v+ . 0 < λ < 1 : In diesem Fall ist auch |λ− | < 1, so dass die Population ausstirbt. Der Fall 0 < λ+ < 1 tritt ein, wenn K < 1. 153 8 Komplexe Zahlen 8.1 Einführung 8.1.1 Die Zahl i Quadratische Gleichungen können in den reellen Zahlen nicht immer gelöst werden, es gibt beispielsweise kein x ∈ R so dass x2 = −4. Es erweist sich aber für viele Anwendungen als sinnvoll, den Zahlenraum um Lösungen dieser Gleichungen zu erweitern. Hierzu definieren wir eine “imaginäre Einheit” i als die Lösung der Gleichung z 2 = −1: i2 := −1. (8.1) Wenn wir −i = (−1) i definieren, so ist auch (−i)2 = (−1)2 i2 = −1. Es ist offensichtlich i keine reelle Zahl, i ∈ / R. Ziel ist es, allgemein quadratische Gleichungen lösen zu können. Angenommen wir könnten mit der imaginären Einheit i rechnen wie mit den Symbolen physikalischer Einheiten (und natürlich unter Beachtung von Gleichung (8.1)), so können wir, zunächst als formale Überlegung, Lösungen der folgenden Gleichungen berechnen: a) Die Gleichung z 2 = −1 hat die beiden Lösungen z+ = i und z− = −i 2 b) z 2 = −4. Dann ist z2 = −1, was nach a) die beiden Lösungen Lösungen von z 2 = −4 sind also z+ = 2i und z 2 = i und z− = −2i. z 2 = −i hat. (8.2) c) (z − 3)2 = −1. Dann sind z − 3 = i und (z − 3) = −i Lösungen, so dass z+ = 3 + i und z− = 3 − i Lösungen von (z − 3)2 = −1 sind. Wie wir sehen, erhalten wir Terme der Form z = x + iy mit x, y ∈ R, weshalb wir unseren erweiterten Zahlenraum wie folgt definieren. 154 8 Komplexe Zahlen 8.1 Definition Die Menge C der komplexen Zahlen wird definiert durch C := {x + iy | x, y ∈ R}. Für eine komplexe Zahl z = x + iy ∈ C heißt Re(z) := x der Realteil von z und Im(z) := y der Imaginärteil von z. 8.2 Beispiel Um diese Begriffe zu erläutern, zerlegen wie die folgenden komplexen Zahlen Real- und Imaginärteil. z = 3 + 4i Re(z) = 3 Im(z) = 4 z =5−i Re(z) = 5 Im(z) = −1 z = 2i = 0 + 2i Re(z) = 0 Im(z) = 2 z = 2, 5 = 2, 5 + 0 · i Re(z) = 2, 5 Im(z) = 0 Insbesondere sind Re(z) und Im(z) immer reelle Zahlen! 8.3 Bemerkungen a) Für eine komplexe Zahl z = x + iy gilt z = 0 genau dann, wenn x = 0 und y = 0. b) Zwei Zahlen z1 = x1 + iy1 ∈ C und z2 = x2 + iy2 ∈ C sind genau dann gleich, wenn Realund Imaginärteil jeweils gleich sind. Dieses sieht man, wenn man x1 + iy1 = x2 + iy2 umstellt zu x − x = i (y − y ) | 1 {z 2} |{z} | 1 {z 2} ∈R / ∈R ∈R und beachtet, dass Gleichheit hier nur dann gelten kann, wenn auf beiden Seiten “0” steht: x1 = x2 und y1 = y2 (8.3) Diese zunächst simpel erscheinende Beobachtung hat weitreichende Anwendungen, da sie es ermöglicht, aus einer komplexwertigen Gleichung auf zwei reellwertige Gleichungen zu schließen. c) Es ist R ⊆ C, denn nach Beispiel 8.2 lässt sich jedes x ∈ R schreiben als x = x + i · 0. 155 8 Komplexe Zahlen 8.4 Definition Seien z1 , z2 ∈ C mit z1 = x1 + iy1 und z2 = x2 + iy2 . Dann werden Summe und Produkt von z1 und z2 erklärt durch z1 + z2 = (x1 + iy1 ) + (x2 + iy2 ) : = (x1 + x2 ) + i(y1 + y2 ) z1 · z2 = (x1 + iy1 ) · (x2 + iy2 ) : = x1 x2 + ix1 y2 + ix2 y1 + i2 y1 y2 | i2 = −1 = (x1 x2 − y1 y2 ) + i(x1 y2 + x2 y1 ). (8.4) 8.5 Satz: Rechengesetze in C Teil I Für die in Definition 8.4 erklärte Addition und Multiplikation komplexer Zahlen gelten das Kommutativ-, Assoziativ- und Disitributivgesetz, d.h. seien z1 , z2 , z3 ∈ C, dann gilt i) z1 + z2 = z2 + z1 und z1 · z2 = z2 · z1 (Kommutativgesetz) ii) (z1 + z2 ) + z3 = z1 + (z2 + z3 ) und (z1 · z2 )z3 = z1 (z2 · z3 ) (Assoziativgesetz) iii) z1 (z2 + z3 ) = z1 · z2 + z1 · z3 (Distributivgesetz) iv) Ferner gilt: z1 · z2 = 0 ⇐⇒ z1 = 0 oder z2 = 0. Beweis. Kommutativität, Assoziativität und Distributivität folgen direkt aus Definition 8.4. Aussage iv) folgt mit Fallunterscheidungen aus Gleichung (8.4). 8.6 Bemerkung Sei z ∈ C mit z = x + iy. Dann bezeichnen wir mit −z die komplexe Zahl −z : = −x + i(−y) = −x − iy und für z1 = x1 + iy1 , z2 = x2 + iy2 ∈ C folgt z1 − z2 = z1 + (−z2 ) = x1 + iy1 − x2 − iy2 = x1 − x2 + i(y1 − y2 ). 8.7 Beispiele a) Seien zwei komplexe Zahlen z1 = 3 + 2i und z2 = 1 + 3i gegeben. Dann ist z1 + z2 = 3 + 2i + 1 + 3i = (3 + 1) + i(2 + 3) = 4 + 5i 156 8 Komplexe Zahlen und z1 · z2 = (3 + 2i)(1 + 3i) = 3 + 9i + 2i + 6i2 | i2 = −1 = 3 + 9i + 2i − 6 = −3 + 11i. b) Seien die komplexen Zahlen z1 = 3 + 2i, z2 = 5 − i und z3 = 2i gegeben. Dann gilt z1 − z2 = 3 + 2i − (5 − i) = 3 + 2i − 5 + i = −2 + 3i und z1 (z2 + z3 ) = (3 + 2i)(5 − i + 2i) = (3 + 2i)(5 + i) = 15 + 3i + 10i + 2i2 | i2 = −1 = 13 + 13i. 8.1.2 Die komplexe Zahlenebene Jede komplexe Zahl z = x + iy ∈ C mit x, y ∈ R kann mit dem Tupel (x, y) ∈ R2 identifiziert werden. Weiter kann der Raum der komplexen Zahlen C mit dem R2 identifiziert werden. iR R 2 C 2 y z = x + iy ◦ y R2 (x, y) R R x 1 1 x Abbildung 8.1: Die Ebene C und der R2 8.8 ! Bemerkung Die Addition in C entspricht der Vektoraddition in R2 , denn sind einerseits ! x1 x , 2 Vektoren in R2 , dann ist y1 y2 ! x1 x2 + y1 y2 ! ! = x1 + x2 ← x − Komponente y1 + y2 ← y − Komponente 157 8 Komplexe Zahlen wohingegen andererseits für x1 + iy1 , x2 + iy2 ∈ C gilt (x1 + iy1 ) + (x2 + iy2 ) = (x1 + x2 ) +i (y1 + y2 ) . {z | Re } | {z Im } 8.9 Beispiel Seien die zwei komplexen Zahlen z1 = 1 + 2i und z2 = 1 + i gegeben. Dann ist ! z1 + z2 = 1 + 2i + 1 + i = 2 + 3i und 1 1 + 2 1 ! ! = 2 . 3 Anschaulich: iy 2 + 3i 3 2 1 + 2i 1 1+i x 1 2 3 ! p x k = x2 + y 2 . In der nächsten DefiniWir kennen in R2 den Betrag eines Vektors als k y tion werden wir sehen, dass der Betrag einer Zahl z ∈ C genauso definiert ist. 8.10 Definition: Betrag und komplex konjugierte Zahl Sei z = x + iy ∈ C. Dann definieren wir den Betrag |z| von z durch |z| = q x2 + y 2 ∈ R und die komplex konjugierte Zahl z durch z = x − iy, die anschaulich eine Spiegelung an der reellen Achse darstellt. 158 8 Komplexe Zahlen 8.11 Beispiele a) Sei die komplexe Zahl z = 1 + 2i gegeben. Dann gilt für ihren Betrag p √ √ |z| = 12 + 22 = 1 + 4 = 5 und die komplex konjugierte ist z = 1 − 2i. b) Es ist |z| = |z|, denn |z| = q x2 + (−y)2 = q x2 + y 2 = |z|. 8.12 Satz: Rechengesetze in C Teil II Seien z = x + iy, z1 , z2 ∈ C. Dann gilt z=z (8.5) z1 + z2 = z1 + z2 (8.6) z1 · z 2 = z 1 · z2 2 (8.7) 2 2 z · z = x + y = |z| |z1 · z2 | = |z1 ||z2 | 1 1 Re(z) = (z + z) Im(z) = (z − z). 2 2i √ Aus (8.8) folgt insbesondere z · z ∈ R und |z| = z · z (8.8) (8.9) (8.10) Beweis. Seien z = x + iy, z1 = x1 + iy1 , z2 = x2 + iy2 ∈ C. Die obigen Aussagen können durch direktes Nachrechnen gezeigt werden: zu (8.5): z = (x + iy) = (x − iy) = x + iy = z zu (8.6): z1 + z2 = (x1 + iy1 ) + (x2 + iy2 ) = x1 + x2 + i(y1 + y2 ) = x1 + x2 − i(y1 + y2 ) = x1 − iy1 + x2 − iy2 = z1 + z2 zu (8.7): Einerseits ist z1 · z2 = (x1 + iy1 ) · (x2 + iy2 ) = x1 x2 − y1 y2 + i(x1 y2 + x2 y1 ) = x1 x2 − y1 y2 − i(x1 y2 + x2 y1 ) 159 8 Komplexe Zahlen andererseits ist z1 · z2 = (x1 + iy1 ) · (x2 + iy2 ) = (x1 − iy1 )(x2 − iy2 ) = x1 x2 − ix1 y2 − ix2 y1 + i2 y1 y2 = x1 x2 − y1 y2 − i(x1 y2 + x2 y1 ) woraus z1 · z2 = z1 · z2 folgt. zu (8.8): Da |z| = p x2 + y 2 gilt, folgt z · z = (x + iy)(x − iy) = x2 − i2 y 2 = x2 + y 2 = |z|2 . Die Gleichungen (8.9) und (8.10) können ebenso durch Nachrechnen gezeigt werden. 8.1.3 Division in C Division in R entspricht der Multiplikation mit dem Multiplikationsinversen. Es ist für x ∈ R und y ∈ R \ {0} 1 x:y=x y wobei y1 das Multiplikationinverse y −1 von y bezeichnet. In C tritt nun das Problem auf, 1 dass ein Term der Form z1 = x+iy nicht von der Form “Realteil + i · Imaginärteil” ist, wir also noch nicht wissen, welche komplexe Zahl hiermit gemeint ist. Um die Division komplexer Zahlen zu erklären, verwenden wir Regel (8.8) aus Satz 8.12. Mit dieser können wir durch 1 geschicktes Erweitern in einem Bruch der Form x+iy einen reellwertigen Nenner erzeugen. Tritt die komplexe Einheit i nur noch im Zähler eines Bruches auf, so kann dieser in Realund Imaginärteil zerlegt werden. Sei beispielsweise z = 3 + 4i, dann ist durch Erweitern mit z = 3 − 4i 1 1 3 − 4i = · 3 + 4i 3 + 4i 3 − 4i 3 − 4i = 2 3 − (4i)2 3 4 3 − 4i = = − i. 9 + 16 25 25 1 Es ist also gelungen 3+4i in einen Term vom Typ a + ib umzuformen, mit dem nach den bisherigen Regeln gerechnet werden kann. Das es sich hierbei tatsächlich um das Multiplika- 160 8 Komplexe Zahlen tioninsverse von 3 + 4i handelt, überprüft man durch (3 + 4i)( 3 4 3 4 3 4 − i) = 3 + 3(− i) + 4i + 4i(− i) 25 25 25 25 25 25 9 + 16 −12 + 12 = +i 25 25 = 1. 8.13 Satz: Multiplikationsinverses in C Zu jedem z = x + iy ∈ C \ {0} existiert genau ein Multiplikationsinverses z −1 ∈ C, so dass z · z −1 = 1 (8.11) gilt. Das Multiplikationsinverse z −1 ist gegeben durch z −1 = y x −i 2 x2 + y 2 x + y2 (8.12) und wir schreiben auch 1 : = z −1 . z Beweis. Dass für das durch (8.12) definierte z −1 die Gleichheit (8.11) gilt, sieht man durch Nachrechnen wie in obigem Beispiel. Die Eindeutigkeit des Multiplikationsinversen folgt, wenn wir annehmen, es gäbe eine weitere Zahl w ∈ C mit z · w = 1. Dann wäre z · z −1 − z · w = 0 ⇐⇒ z(z −1 − w) = 0, also muss nach Satz 8.5 entweder z = 0 oder (z −1 −w) = 0 gelten. Da z ∈ C\{0} vorausgesetzt wurde, ist z −1 − w = 0, woraus z −1 = w folgt. Also ist z −1 eindeutig. 8.14 Definition: Division in C Sei w ∈ C und z ∈ C \ {0}. Dann erklären wir die Division w := w · z −1 . z 161 w z durch 8 Komplexe Zahlen 8.15 Beispiele a) Sei w = 3 + i und z = 2 + 3i. Dann ist nach Formel (8.12) z −1 = 3+i 3 2 −i 2 = (3 + i) 2 2 2 + 3i 2 +3 2 + 32 6 + 2i 9i + 3i2 = − 4+9 4+9 6 + 2i − 9i + 3 = 13 9 7 = −i . 13 13 2 22 +32 3 − i 22 +3 2 so das b) Die Formel (8.12) für z −1 erhalten wir formal auch durch Erweitern von z 1 1 z x − iy = · = 2 = 2 , z z z |z| x + y2 1 z mit z : (8.13) wobei wir Satz 8.12 Regel (8.8) verwendet haben. c) Das Multiplikationsinverse von i können wir mit (8.12) berechnen durch i = 0 + 1i: 0 1 1 = 2 −i 2 = −i 2 i 0 +1 0 + 12 oder auch mit (8.13) durch Erweitern mit i = −i : 1 1 (−i) −i = · = = −i. i i (−i) −i2 d) Auf der reellen Achse, z = x + 0i, stimmt die Formel (8.12) mit dem aus R bekannten Multiplikationsinversen überein: (x + 0i)−1 = x2 x 0 x 1 −i 2 = 2 = . 2 2 +0 x +0 x x 8.1.4 Quadratische Gleichungen in C Eine quadratische Gleichung mit reellen Koeffizienten p, q ∈ R x2 + px + q = 0 (8.14) konnten wir bisher in R lösen durch x+/− 2 p =− ± 2 s p 2 2 2 −q für den Fall dass p2 − q ≥ 0 ist. Ist nun p2 − q < 0, so gibt es offenbar keine Lösungen in R, aber Lösungen in C. Um diese Gleichung für komplexe Unbekannte zu formulieren, setzen 162 8 Komplexe Zahlen wir in (8.14) x = z ein und formen um: z 2 + pz + q = 0 ⇐⇒ 2 (8.15) 2 p p = −q 2 2 2 p 2 p z+ = −q 2 2 z 2 + pz + ⇐⇒ 2 mit rechter Seite p2 − q < 0. Genauso, wie wir in (8.2) aus z 2 = −4 gefolgert hatten, dass √ z+/− = ±i 4 = ±2i Lösungen sind, folgern wir nun s 2 p p z+ =± | 2 2 s = ±i q − wobei q − p 2 2 − q| 2 p 2 > 0 zu beachten ist. Also sind s z+/− p =− ±i q− 2 2 p (8.16) 2 zwei komplexwertige Lösungen der quadratischen Gleichung (8.15). Es ist zu beachten, dass die Koeffizienten p, q nach wie vor reellwertig sind: p, q ∈ R. 8.16 Beispiele a) Wir betrachten z 2 + 3z + 5 = 0, es ist also p = 3 und q = 5, also Lösungen p 2 2 −q = 9 4 s z+/− − 5 < 0. Formel (8.16) liefert nun die 3 =− ±i 5− 2 √ 11 3 =− ±i . 2 2 2 3 2 ! b) Wir berechnen die Eigenwerte der Matrix A = 3 2 . Zunächst bestimmen wir das −1 4 charakteristische Polynom von A durch 3−λ 2 p(λ) = det(A − λI2 ) = det −1 4 − λ = (3 − λ)(4 − λ) + 2 = λ2 − 7λ + 14. 163 ! 8 Komplexe Zahlen Es ist also p = −7 und q = 14, so dass 2 p 2 2 −q = 7 2 − 14 = 49 7 − 14 = − < 0. 4 4 Verwenden wir daher Formel (8.16), so erhalten wir als Nullstellen des charakteristischen Polynoms p(λ) und somit als Eigenwerte von A s λ+/− 7 = ± i 14 − 2 r 7 7 = ±i 2 √4 7 7 = ±i . 2 2 2 7 2 ! a b c) Eine Matrix der Form A = hat bei reellen Einträgen a, b ∈ R stets 2 kom−b a plexwertige Eigenwerte λ+/− ∈ C \ R. Wir berechnen das charakteristische Polynom von A: p(λ) = det(A − λI2 ) ! a−λ b = det −b a − λ = (a − λ)2 + b2 . Es ist λ genau dann Eigenwert von A, wenn p(λ) = 0, also wenn (a − λ)2 = −b2 . Hier könnte man ausmultiplizieren und die dadurch erhaltene quadratische Gleichung für λ wie in Beispiel b) lösen. Man kann aber auch direkt erkennen, dass λ+/− = a ± ib die Nullstellen von p(λ) sind. 8.2 Polardarstellung im Komplexen Anstelle der kartesischen Darstellung durch Real- und Imaginärteil, z = x + iy, lässt sich jeder Punkt z der Ebene auch beschreiben durch seinen Abstand r zum Nullpunkt und den Winkel ϕ, den sein Ortsvektor mit der postitiven reellen Achse einschließt (Orientierung hierbei gegen den Uhrzeigersinn). 164 8 Komplexe Zahlen iy ◦ y = r sin(ϕ) r= z = x + iy |z | ϕ x x = r cos(ϕ) Abbildung 8.2: Polarkoordinaten und cartesische Koordinaten Es ist r ∈ R≥0 und ϕ ∈ [0, 2π) und z = x + iy = r(cos ϕ + i sin ϕ). Weiter ist r = |z| der Betrag von z und der Winkel ϕ heißt Argument von z, arg(z) := ϕ. Das Paar (r, ϕ) heißt Polarkoordinaten von z. 8.2.1 Umrechnung der Koordinaten Sind die Polarkoordinaten (r, ϕ) von z ∈ C gegeben, so erhält man (wie in Abbildung 8.2) Real- und Imaginärteil durch z = r cos ϕ + ir sin ϕ, so dass die kartesischen Koordinatengegeben sind durch x = r cos ϕ und y = r sin ϕ. Ist hingegen z ∈ C in kartesischen Koordinaten gegeben durch z = px + iy und möchte man diese umrechnen in Polarkoordinaten, so erhält man r durch r = x2 + y 2 . Das Argument ϕ zu berechnen erfordert eine Fallunterscheidung, da (siehe Abbildung 8.2) tan(ϕ) = xy ist, so dass y ϕ = tan−1 ( ). x Nun bildet aber der Tangens das Intervall (− π2 , π2 ) auf ganz R ab, tan : (− π2 , π2 ) → R, so dass π π tan−1 : R → (− , ), 2 2 d.h. der Bildbereich der Umkehrfunktion tan−1 ist nicht das für die Polardarstellung von z gewünschte Intervall [0, 2π). 165 8 Komplexe Zahlen tan R R + π2 R − π2 R + π2 tan−1 − π2 Abbildung 8.3: Definitions - und Wertebereich von tan und tan−1 Der Abbildung 8.3 entnehmen wir: y π y ∈ (0, ) > 0 ⇒ tan−1 x x 2 π y −1 y < 0 ⇒ tan ∈ (− , 0). x x 2 Nun ist aber der Wertebereich von ϕ = arg(z) in den 4 Quadranten der Ebene C wie in Abbildung 8.4 dargestellt, II I ϕ ∈ ( π2 , π) ϕ ∈ (0, π2 ) x < 0, y>0 x > 0, y>0 x < 0, y<0 x > 0, y<0 ϕ ∈ (π, 3π 2 ) ϕ ∈ ( 3π 2 , 2π) III IV Abbildung 8.4: Wertebereich von ϕ = arg(z) in der Komplexen Ebene so dass der Wertebereich von tan−1 xy in den Quadranten II und III um +π und im Quadranten IV um +2π angepasst werden muss. Dann können wir ϕ für z = x + iy in den 166 8 Komplexe Zahlen Quadranten I - IV wie folgt berechnen: y x y II: x < 0, y > 0 ⇒ x y III: x < 0, y < 0 ⇒ x y IV: x > 0, y < 0 ⇒ x I: x > 0, y > 0 ⇒ y π π ∈ (0, ) ⇒ ϕ = tan−1 ∈ (0, ). x 2 x 2 π π −1 y −1 y ∈ (− , 0) ⇒ ϕ = tan + π ∈ ( , π). < 0 ⇒ tan x 2 x 2 y y π 3 ∈ (0, ) ⇒ ϕ = tan−1 + π ∈ (π, π). > 0 ⇒ tan−1 x 2 x 2 π 3 −1 y −1 y < 0 ⇒ tan ∈ (− , 0) ⇒ ϕ = tan + 2π ∈ ( π, 2π). x 2 x 2 > 0 ⇒ tan−1 y Auf den Koordinaten-Achsen ist ϕ gegeben durch ϕ=0 π ϕ= 2 ϕ=π 3 ϕ= π 2 für z = x mit x > 0 für z = iy mit y > 0 für z = x mit x < 0 für z = iy mit y < 0. Die so definierte Abbildung z 7→ ϕ := arg(z) ist stetig in z, unter Ausnahme von Werten auf der positiven reellen Achse. Hier macht die Abbildung einen Sprung um 2π. 8.17 Beispiele a) Sei z gegeben durch r = 4, ϕ = 30◦ = ˆ π6 . Dann ist sin ϕ = 1 2 √ und cos ϕ = 3 2 , so dass z = r(cos ϕ + i sin ϕ) √ 3 1 +i ) = 4( 2 2 √ = 2 3 + 2i. √ √ b) Sei z = −2 3 + 2i, so liegt z im II. Quadranten und es ist x = −2 3 und y = 2. Also sind die Polarkoordinaten √ (−2 3)2 + 22 = 4 2 1 √ ϕ = tan−1 + π = tan−1 − √ +π −2 3 3 π 5 = − +π = π= ˆ 150◦ . 6 6 r= q 8.2.2 Geometrische Interpretation der Multiplikation Seien zwei komplexe Zahlen z, w ∈ C in Polarkoordinaten gegeben: z = |z|(cos α + i sin α) w = |w|(cos β + i sin β), 167 8 Komplexe Zahlen so ist eine geometrische Interpretation der Multiplikation ermöglicht. Hierzu berechnen wir z · w = |z| |w|(cos α + i sin α)(cos β + i sin β) = |z| |w|(cos α cos β + i cos α sin β + i sin α cos β − sin α sin β) = |z| |w| [(cos α cos β − sin α sin β) + i(cos α sin β + sin α cos β)] . (8.17) Verwenden wir nun die Additionstheoreme für die cosinus- und sinus-Funktion cos(α + β) = cos α cos β − sin α sin β (8.18) sin(α + β) = cos α sin β + sin α cos β, so erhalten wir z · w = |z| |w| [cos(α + β) + i sin(α + β)] . (8.19) Bei der Multiplikation von z und w werden also die Beträge multipliziert und die Winkel addiert. 8.18 Beispiel Sei z = 1 + i und w = i. Dann ist |z| = √ |w| = 1, Also folgt |z| · |w| = √ 2, π 4 π β = arg(w) = . 2 α = arg(z) = 2 und α + β = 43 π. Berechnen wir nun z · w, so erhalten wir z · w = (1 + i)i = i + i2 = −1 + i. Dann ist |z · w| = √ (8.20) 2 und in der Skizze sehen wir arg(z · w) = 43 π, was gerade π 4 + π 2 ist: iy z · w = −1 + i z =1+i w=i x 1 Abbildung 8.5: Multiplikation z · w 8.2.3 Die Exponentialfunktion im Komplexen Es soll die Exponentialfunktion für komplexe Werte definiert werden. Wir setzen fü r ϕ ∈ R eiϕ := cos ϕ + i sin ϕ. 168 (8.21) 8 Komplexe Zahlen Dann folgt mit der gleichen Rechnung wie in (8.17), (8.18) und (8.19) eiϕ eiψ = (cos ϕ + i sin ϕ)(cos ψ + i sin ψ) = cos(ϕ + ψ) + i sin(ϕ + ψ) = ei(ϕ+ψ) , (8.22) d.h. wir erhalten die gleiche Funktionalgleichung für die durch (8.21) definierte Funktion wie für die reelle Exponentialfunktion (s.(3.3)). Die Additionstheoreme der sin- und cos-Funktionen (8.18) sind also äquivalent zu Gleichung (8.22) und durch (8.21) wird die Exponentialfunktion auf sinnvolle Weise für komplexe Argumente definiert. 8.19 Bemerkungen a) Es sind die cosinus- und sinus- Funktion (2π)-periodisch, cos(ϕ+2π) = cos ϕ und sin(ϕ+ 2π) = sin ϕ, also ist auch ei(ϕ+2π) = eiϕ und allgemein für k ∈ N ei(ϕ+2kπ) = eiϕ . (8.23) b) Es gilt die Eulersche Formel eiπ = cos π + i sin π = −1. c) Sei z ∈ C \ {0} in Polardarstellung gegeben mit Koordinaten (r, ϕ), so ist z = reiϕ und es ist z = re−iϕ . d) Die Multiplikation zweier komplexer Zahlen in der Polardarstellung wird nun besonders einfach durch z = reiϕ und w = seiψ ⇒ z · w = reiϕ · seiψ = rsei(ϕ+ψ) . Die geometrische Interpretation aus Abschnitt 8.2.2 lässt sich hier direkt ablesen. 8.2.4 Flächenberechnung und Determinante Seien zwei komplexe Zahlen z, w sowohl in kartesischer wie auch in Polardarstellung gegeben, z = a + ic = |z|eiϕ w = b + id = |w|eiψ , 169 (8.24) 8 Komplexe Zahlen iy z+w w d h = |w| sin(α) h c z α x a b Abbildung 8.6: Das von z, w aufgespannte Parallelogramm so muss dass Produkt z · w das gleiche sein, egal ob es in kartesischer oder in Polardarstellung berechnet wird: (a − ic)(b + id) = |z|e−iϕ |w|eiψ ⇐⇒ ⇐⇒ ab + iad − iac − i2 cd = |z||w|ei(ψ−ϕ) ab + cd + i(ad − bc) = |z||w| (cos(ψ − ϕ) + i sin(ψ − ϕ)) (8.25) Zwei komplexe Zahlen sind genau dann gleich, wenn Real- und Imaginärteil übereinstimmen (s.(8.3)), was zur Folge hat, dass eine Gleichung im Komplexen genau dann richtig ist, wenn die Gleichheit für Real- und Imaginärteil der Gleichung gilt. Vergleicht man die Imaginärteile der Gleichung (8.25), so erhält man ad − bc = |z||w| sin(ψ − ϕ). (8.26) Diese Gleichung lässt sich geometrisch interpretieren: ! a b ist die Determinante gegeben durch det(A) = ad − bc, was auf Zu einer Matrix A = c d der linken Seite von (8.26) steht. In den stehen die Vektoren, die den ! Spalten dieser Matrix ! b a Zahlen z, w entsprechen: a + ic = ˆ und b + id = ˆ , wenn C mit dem R2 identifiziert d c wird. Auf der rechten Seite von (8.26) steht die Fläche des von den Vektoren ! ! a c ! ! und b d a b aufgespannten Parallelogramms, da |z| = k k und |w| = k k, siehe hierzu Gleichung c d (8.24). Es ist die Fläche des Parallelogramms FP = “Grundfläche” · “Höhe” = | sin(ψ − ϕ)||z||w|, 170 8 Komplexe Zahlen was in Abbildung 8.6 dargestellt ist. Daher gibt det(A) die Fläche des Parallelogramms an, das von den Spaltenvektoren der Matrix A aufgespannt wird. Betrachten wir in R2 das Quadrat ! x Q = { | 0 ≤ x, y ≤ 1}, so sehen wir, dass die Punkte Q durch Mutliplikation mit der y Matrix A auf das Parallelogramm abgebildet werden, welches von den von ! Spaltenvektoren ! ! ! A 0 1 0 1 aufgespannt wird. Wir berechnen die Bildpunkte der Eckpunkte , , und : 0 0 1 1 ! 0 A 0 ! = a b c d ! = a b c d ! = a b c d ! = a b c d ! 1 A 0 ! 0 A 1 ! 1 A 1 0 0 ! 1 0 ! ! = 0 0 = a c = b d = a+b . c+d ! ! 0 1 ! ! 1 1 ! Diese Eckpunkte von Q werden also auf die Eckpunkte des Parallelogramms P abgebildet, das gleiche gilt auch für die Randpunkte und das Innere von Q. Also gilt, da FQ = 1 FP = det(A) · FQ , was sich auch für allgemeine Quadrate und allgemeine Flächen Q in R2 zeigen lässt. Daher heißt det(A) auch Flächenverzerrungsfaktor und Fläche (A(Q)) = det(A) · Fläche(Q) gilt für beliebige Flächen Q, nicht nur für Quadrate. 8.20 Beispiele a) Betrachte die Scherungsmatrix ! S= 1 a . 0 1 Es ist det(S) = 1, d.h. die Scherung lässt eine Fläche gleich groß. ! b) Die Drehmatrix Dϕ = c) Die Streckung mit T = cos ϕ − sin ϕ sin ϕ cos ϕ t 0 0 t ändert die Größe einer Fläche ebenfalls nicht. ! verändert eine Fläche um t2 , da det(T ) = t2 . 171 8 Komplexe Zahlen 8.3 Fundamentalsatz der Algebra Ein komplexes Polynom von Grad n ist eine Abbildung p : C → C der Form p(z) = c0 + c1 z + c2 z 2 + · · · + cn z n mit c0 , . . . , cn ∈ C und cn 6= 0. Wir nennen z0 ∈ C Nullstelle von p, falls p(z0 ) = 0 gilt. 8.21 Satz: Fundamentalsatz der Algebra Jedes Polynom vom Grad n ≥ 1 besitzt eine Nullstelle in C. Mit dieser Aussage können Polynome in C in Linearfaktoren zerlegt werden: 8.22 Satz Ist p ein Polynom vom Grad n ≥ 1, so existieren z1 , . . . , zn ∈ C (nicht notwendigerweise verschieden), so dass p(z) = c(z − z1 )(z − z2 ) · . . . · (z − zn ) gilt. Sei nun p ein Polynom mit reellen Koeffizienten a0 , . . . , an ∈ R p(z) = a0 + a1 z + a2 z 2 + · · · + an z n und an 6= 0. Dann ist das komplex konjugierte eines Funktionswertes p(z) p(z) = a0 + a1 z + · · · + an z n = a0 + a1 z + · · · + an z n = a0 + a1 z + · · · + an z n = p(z), (s. Satz 8.12) da speziell ai = ai für ai ∈ R gilt. Also folgt, dass zu einer komplexen Nullstelle z0 ∈ C von p auch das konjugiert komplexe z0 Nullstelle von p ist: p(z0 ) = 0 ⇐⇒ p(z0 ) = p(z0 ) = 0. 8.23 Folgerung Sei p ein reelles Polynom vom Grad n mit den reellen Nullstellen x1 , . . . , xk ∈ R. Dann ist n − k = 2l eine gerade Zahl und es existiert ein reelles Polynom p2l (z) vom Grad 2l, so dass p(z) = an (z − x1 ) · . . . · (z − xk )p2l (z), wobei p2l keine reellen Nullstellen hat. Die Nullstellen von p2l sind gegeben durch z1 , . . . , zl , z1 , . . . , zl , so dass p(z) = an (z − x1 ) · . . . · (z − xk ) · (z − z1 ) · . . . · (z − zl ) · (z − z1 ) · . . . · (z − zl ) 8.24 Bemerkungen 1) Es ist k + 2l = n. 172 8 Komplexe Zahlen 2) Weder die x1 , . . . , xk noch die z1 , . . . , zl müssen verschieden sein. 3) Für n =2 erkennt man diese Aussage an der pq-Formel. Das Polynomz 2 + pz + q hat im 2 Falle p2 − q < 0 die Nullstellen s p z+/− = − ± i q − 2 =x ˆ ± iy, man sieht also, dass z− = z+ . 173 2 p 2 9 Gewöhnliche Differentialgleichungen 9.1 Einleitung Bisher wurden Gleichungen untersucht, deren Lösungen Zahlen (aus R oder C) oder Vektoren sind: 5 3 x2 + 2x − 3 = 0 Lösungen: x1 = −3, x2 = 1 1 e3x = 5 Lösung: x = ln 5 3 Ax = b Lösung x ∈ Rn , falls A ∈ Rm×n , b ∈ Rm 3x = 5 Lösung: x = Mathematische Modelle für Vorgänge aus Biologie, Chemie, Physik, Ökonomie etc. geben im Allgemeinen nicht Gleichungen der o. g. Art für die untersuchten Größen an, sondern eine Beziehung zwischen der Änderung der Größe und ihrem aktuellen Wert. Das ergibt dann eine Differentialgleichung. Besteht der Zusammenhang nur zwischen der gesuchten Funktion u und ihrer ersten Ableitung, so ist das Problem gegeben durch eine Gleichung vom Typ u0 (t) = g(t, u(t)). (9.1) Ist zusätzlich der Funktionswert zu einem Anfangszeitpunkt t0 bekannt, u(t0 ) = u0 , so sprechen wir von einem Anfangswertproblem. Die Lösungen von Differentialgleichungen sind Funktionen. Merkmale einer Differentialgleichung sind: 1. Die Unbekannte der Gleichung ist eine Funktion. 2. Es treten Ableitungen der gesuchten Funktion auf. 3. Beim Lösen ist eine Integration notwendig. 4. Es taucht eine Integrationskonstante auf, die Lösung ist (ohne weitere Bedingungen) nicht eindeutig. Bereits bekannt ist das Problem der Suche nach Stammfunktionen, was als einfache Differentialgleichung verstanden weden kann. Zum Beispiel seien alle Stammfunktionen u(t) von sin(t) gesucht, d.h. alle u welche die Gleichung u0 (t) = sin(t), (9.2) erfüllen. Die Lösungen sind Funktionen der Form u(t) = − cos(t) + c 174 (9.3) 9 Gewöhnliche Differentialgleichungen wobei c ∈ R für eine Integrationskonstante steht. Da c frei wählbar ist, ist die Lösung von Gleichung (9.2) bis hierher noch nicht eindeutig bestimmt, denn Lösung (9.3) bezeichnet nicht eine spezielle Funktion sondern eine ganze Funktionenschaar. Wird die Problemstellung jetzt durch einen sogenannten Anfangswert ergänzt, soll also zu einem Zeitpunkt t0 u(t0 ) = u0 , (9.4) gelten, so erhalten wir, indem wir in Gleichung (9.3) t = t0 einsetzen, dass c = − cos(t0 ) + u0 gelten muss. Die eindeutige Lösung von (9.2) und (9.4) ist also u(t) = − cos(t) + cos(t0 ) + u0 . 9.1 Bemerkungen a) Eine kanonische Wahl für den Anfangszeitpunkt ist häufig t0 = 0, es ist aber jedes t0 ∈ R möglich. b) Die Variable t der gesuchten Funktion kann für beliebige Größen stehen, sie kann die Zeit, den Ort (allerdings nur eindimensional), die Konzentration eines Stoffes oder anderes bezeichnen. Da wir im weiteren Verlauf des Kapitels häufig Modelle für die zeitliche Entwicklung von Populationen untersuchen werden, interpretieren wir dieses Variable, wie oben bereits geschehen, meist als die Zeit. Die erzielten Ergebnisse sind natürlich bei allen Interpretationen richtig. 9.2 Differentialgleichungen 1. Ordnung Als Differentialgleichung 1. Ordnung wird eine Gleichung bezeichnet, die neben der gesuchten Funktion selbst auch ihre 1. Ableitung enthält. Ableitungen höherer Ordnung treten nicht auf. Die allgemeine Form ist Gleichung (9.1) und beschreibt mittels der Funktion g den Zusammenhang zwischen u0 und u. Die Methoden, mit denen sich diese Gleichungen lösen lassen, richten sich nach der Gestalt der Funktion g. In den Abschnitten 9.2.1 und 9.2.2 werden zunächst Beispiele für Wachstumsprozesse untersucht. 9.2.1 Konstantes und exponentielles Wachstum Konstantes Wachstum Ist die Änderungsrate einer gesuchten Größe u konstant, so hat sie eine konstante Ableitung, d. h. es gilt u0 (t) = a. Ausgehend von einem Anfangswert u(t0 ) = u0 zu einem Zeitpunkt t0 können wir mittels Intergration eine Lösung erhalten: Z t Z t 0 u (τ ) dτ = t0 =⇒ a dτ t0 u(t) = a(t − t0 ) + u0 . 175 9 Gewöhnliche Differentialgleichungen Die Lösung ist eine affin lineare Funktion mit u(t0 ) = u0 . Wenn der Anfangszeitpunkt t0 = 0 ist, so erhalten wir u(t) = at + u0 . Exponentielles Wachstum Beim radioaktiven Zerfall einer Probe P hingegen wird beobachtet, dass die Änderung während einer kleinen Zeiteinheit 4t nicht konstant ist, sondern proportional zur aktuellen Größe der Probe P (t): ⇐⇒ P (t + 4t) − P (t) = −aP (t)4t P (t + 4t) − P (t) = −aP (t), 4t wobei a > 0 eine Materialkonstante ist. Der Grenzübergang t → 0 führt zu der Differentialgleichung P 0 (t) = −aP (t), (9.5) die sich mittels des “ln - Tricks” ( siehe Abschnitt 5.3.3 ) integrieren lässt: P 0 (t) = −a P (t) Z ⇐⇒ ⇐⇒ (ln P (τ ))0 dτ = − Z a dτ ln P (t) = −at + c P (t) = ec e−at . ⇐⇒ (9.6) Unter der Annahme, dass P (0) = P0 gelten soll, folgt aus (9.6) ec = P0 , d.h. P (t) = P0 e−at . (9.7) Man sieht, dass für die Gleichung (9.5) zunächst unendlich viele Lösungen ec e−at (c ∈ R beliebig) existieren, durch den Anfangswert P (0) = P0 wird die Konstante c bestimmt und die Lösung eindeutig. Genauso lässt sich eine Population P beschreiben, deren Zuwachs proportional ist zur aktuellen Größe P (t) und deren Anfangswert P (0) = P0 ist: P 0 (t) = aP (t) ⇒ (9.8) at P (t) = P0 e . 9.2.2 Logistisches Wachstum Sollen Populationen beschrieben werden, so ist ein Nachteil von Gleichung (9.8), dass nicht berücksichtigt wird, dass auch Individuen sterben. Daher wählen wir nun als Ansatz P 0 (t) = (a − b)P (t), 176 (9.9) 9 Gewöhnliche Differentialgleichungen wobei a die Geburtenrate und b die Sterberate ist. Dann ist P 0 (t) = P0 e(a−b)t a > b exponentielles Wachstum was für a = b eine konstante Population a < b eine exponentielle Abnahme ergibt. Zur weiteren Verfeinerung des Modells hänge die Sterberate b von der Größe der Population P ab. Das einfachste Modell hierfür ist eine lineare Abhängigkeit, welche beschrieben wird mit dem Ansatz b(P ) = b0 + cP, mit einer Konstanten c > 0. Hierdurch kann beispielsweise ein beschränkter Lebensraum modelliert werden, in welchem die Sterberate bei wachsender Population zunimmt. Dann wird die Differentialgleichung (9.9) zu P 0 (t) = (a − b0 − cP (t))P (t) was durch Ausklammern von c zu P 0 (t) = c(K − P (t))P (t) (9.10) 0 wird. Die DGL (9.10) heißt logistische Differentialgleichung. Bevor wir diese mit K = a−b c Gleichung lösen, können wir den Verlauf möglicher Lösungen bereits qualitativ beschreiben: i) P (t) ≡ 0 ist eine Lösung, da dann P 0 (t) = 0 gilt und Gleichung (9.10) erfüllt ist. ii) P (t) ≡ K ist eine Lösung, da dann P 0 (t) = 0 und (K − P (t)) = 0 gilt, so dass Gleichung (9.10) wiederum erfüllt ist. iii) Für Werte P (t) mit 0 < P (t) < K folgt aus (9.10) dass die Ableitung positiv ist, P 0 (t) > 0, d.h. die Population wächst. Für Werte P (t) > K folgt aus (9.10) hingegen, dass die Ableitung negativ ist, P 0 (t) < 0, d.h. die Population schrumpft. K heißt daher Kapazität des Lebensraums der Population. Zu Anfangswerten P0 > K und 0 < P̃0 < K haben Lösungskurven einen qualitativen Verlauf wie in Abbildung 9.1. Nun lösen wir Gleichung (9.10) explizit. Es sei P (t) 6= 0, P (t) 6= K, dann ist (9.10) äquivalent zu P 0 (t) =c (K − P (t))P (t) (9.11) Schritt 1: Integration der Gleichung Wir führen eine Partialbruchzerlegung durch, um den Bruch in eine Summe aufzuspalten. Mit 1 1 = (K − P )P K 1 1 + P K −P 177 9 Gewöhnliche Differentialgleichungen P0 P (t) K P̃0 t Abbildung 9.1: Qualitativer Verlauf der Lösungskurven für P0 > K und P̃0 < K. erhalten wir aus (9.11) P 0 (t) P 0 (t) + = cK P (t) (K − P (t)) ⇐⇒ (ln P (t))0 − (ln(K − P (t)))0 = cK ⇐⇒ ⇐⇒ ⇐⇒ | “ln-Trick” anwenden | integrieren ln(P (t)) − ln(K − P (t)) = cKt + c1 ln( P (t) ) = cKt + c1 K − P (t) P (t) = ecKt |{z} ec1 . K − P (t) =:c a | ln(a) − ln(b) = ln( ) b | e-Funktion anwenden 0 Da die Integrationskonstante c1 in der Form ec1 auftritt führen wir hier c0 = ec1 als neue Konstante ein. Auflösen nach P (t) ergibt P (t) = c0 ecKt (K − P (t)) = c0 KecKt − c0 ecKt P (t) ⇐⇒ ⇐⇒ (1 + c0 ecKt )P (t) = c0 KecKt c0 Keckt c0 ecKt + 1 K = 1 −cKt . 1 + c0 e P (t) = (9.12) Schritt 2: Bestimmen der Integrationskonstanten In Schritt 1 haben wir eine Funktion P (t) errechnet, welche die logistische DGL (9.10) löst. Allerdings ist diese Lösung noch nicht eindeutig, sondern ernhält die Integrationskonstante c0 . Diese bestimmen wir jetzt wieder zu einem Anfangswert P (0) = P0 . Hierzu setzen wir in der 178 9 Gewöhnliche Differentialgleichungen allgemeinen Lösung (9.12) t = 0 ein und erhalten zu einem Anfangswert P0 : K 1 + c10 K 1 = ⇐⇒ 1 + c0 P0 1 K K − P0 ⇐⇒ = −1= . c0 P0 P0 P0 = Setzen wir dies für den Faktor 1 c0 in (9.12) ein, so erhalten wir als Lösung die Funktion P (t) = K 1+ K−P0 −cKt P0 e , (9.13) deren Verlauf in Abbildung 9.1 dargestellt ist. Interpretation der Lösung Man sieht in (9.13), dass sich die Größe der Population langfristig der Kapazitätsgrenze K 0 −cKt nähert, da lim K−P = 0 und daher P0 e t→∞ lim P (t) = K, t→∞ unabhängig von P0 > K oder 0 < P0 < K gilt. Dieses bestätigt das asymptotische Verhalten, das wir aufgrund des qualitativen Verlaufs der Lösungen in Abbildung 9.1 bereits vermutet hatten. Explosives Wachstum Betrachten wir nun ein verändertes Modell mit konstanter Sterberate b und einer Geburtenrate, welche proportional zur Populationsgröße wächst, a = d P (t), mit Propotionalitätsfaktor d > 0. Dieses ist z.B. ein Modell für Populationen geringer Dichte, in denen nicht die Sterbe- sondern die Geburtenrate mit der Größe der Population zunimmt. Es ist dann P 0 (t) = (dP (t) − b)P (t) = d(P (t) − S)P (t) (9.14) mit einem Parameter S = db , welcher die Bedeutung eines “Schwellenwertes” hat: Ist P (t) > S, so ist P 0 (t) > 0 und die Population wird wachsen. Ist P (t) < S, so ist P 0 (t) < 0 und die Population wird weiter schrumpfen. Wir können Gleichung (9.14) umformen zu P 0 (t) = −d(S − P (t))P (t) 179 9 Gewöhnliche Differentialgleichungen und erhalten die selbe Struktur wie in Gleichung (9.10) mit K = S und c = −d. Die Lösung von Gleichung (9.13) kann man also genau wie oben in Schritt 1 und Schritt 2 ausgeführt berechnen und erhält P (t) = S 1+ S−P0 dSt P0 e . (9.15) Diese Lösung ähnelt (9.13) stark, hat aber ein anderes asymptotisches Verhalten, welches vom veränderten Vorzeichen des Argumentes der e - Funktion im Nenner in Gleichung (9.15) herrührt. Es muss unterschieden werden zwischen Anfangswerten P0 < S und P0 > S. P0 < S: Es ist S−P0 P0 > 0, so dass lim t→∞ S−P0 dKt P0 e lim P (t) lim t→∞ t→∞ = ∞. Daraus folgt für P (t) S → 0. S − P0 dSt e 1+ P0 | {z →∞ } ∗ 0 P0 > S: Es ist S−P P0 < 0 so dass ein Wert t > 0 existiert, für den der Nenner aus (9.15) Null wird. Wir berechnen t∗ durch 1+ S − P0 dSt∗ e =0 P0 P0 P0 = S − P0 P0 − S P 0 ) dSt∗ = ln( P0 − S 1 P0 t∗ = ln( ). dS P0 − S ∗ edSt = −1 · ⇐⇒ ⇐⇒ ⇐⇒ Da für dieses t∗ gilt, dass lim∗ (1 + t→t S−P0 dSt ) P0 e = 0, folgt für P (t) lim P (t) = lim∗ t→t∗ t→t S 1+ S−P0 dSt P0 e = ∞. Ist der Anfangswert P0 größer als der Schwellenwert S, so wird in diesem Modell die Population explosionsartig wachsen, indem sie zu einem endlichen Zeitpunkt gegen unendlich strebt, siehe hierzu Abb. 9.2. Die logistische Differentialgleichung ist wichtig in der Biologie, sie beschreibt beispielsweise die Vermehrung von Bakterien in einer Nährlösung oder auch chemische Reaktionen. 9.2 Beispiel Ein anderes Beispiel einer Differentialgleichung, die wir mithilfe des “ln-Tricks” und direkter Integration lösen können, ist die Gleichung u0 = − u , 1+u 180 (9.16) 9 Gewöhnliche Differentialgleichungen P (t) P0 S P0 t t∗ Abbildung 9.2: Qualitativer Verlauf der Lösungskurven der Gleichung (9.14) welche ein Spezialfall der Michaelis-Mentengleichung u0 = − Vu Km + u ist. Hier bezeichnet V die maximale Reaktionsgeschwindigkeit, Km ist die Michaeliskonstante und u(t) die Substratkonzentration bei einer enzymatischer Reaktion. Wir lösen (9.16) durch u0 ⇐⇒ ⇐⇒ 1+u = −1 u u0 + u0 = −1 u ln u + u = −t, (9.17) d.h. die Michaelis-Menten Gleichung kann, wie die logistische Differentialgleichung (9.10), integriert werden, aber das Ergebnis (9.17) kann nicht nach u aufgelöst werden. Man erhält also keine explizite Darstellung einer Lösung u(t). 9.2.3 Trennung der Variablen Bisher war die Funktion g immer nur von der gesuchten Funktion u(t) ( bzw. P (t) ) und nicht explizit von t abhängig und wir konnten die Gleichungen direkt integrieren. Lassen wir nun für die rechte Seite in Gleichung (9.1) Funktionen der Form g(t, u) = a(t)f (u) zu, so können wir diesen Lösungsansatz weiterentwickeln, die Methode heißt “Trennung der Variablen”. (Es kommt darauf an, dass g(t, u) ein Produkt ist eines Termes der nur die Variable t enthält und eines Termes, der nur die Variable u enthält.) Die Differentialgleichung hat nun die Form du = a(t)f (u) dt 181 (9.18) 9 Gewöhnliche Differentialgleichungen und wir betrachten du dt als Bruch und bringen (formal) alle Terme mit u auf die linke Seite der Gleichung und alle Terme mit t auf die rechte Seite. Dann wird (9.18) zu du = a(t)dt, f (u) wobei f nun als Funktion einer Variablen u angesehen wird. Durch Integration erhalten wir Z 1 du = f (u) Z a(t)dt. (9.19) Sind für beide Integrale Stammfunktionen bekannt, so kann die Differentialgleichung (9.18) gelöst werden, indem man in (9.19) - wenn möglich - nach der gesuchten Funktion auflöst. Die Integrationskonstante c kann man bestimmen, wenn ein Anfangswert u(t0 ) = u0 gegeben ist. d 9.3 Bemerkung Selbstverständlich darf mit den Differentiationssymbolen dt im Allgemeinen nicht wie mit Brüchen gerechnet werden. Hier erhält man aber auf diese Weise eine einfache Merkregel für die Methode der “Trennung der Variablen”. Auf einen Beweis verzichten wir. 9.4 Beispiel Wir betrachten die Gleichung du(t) = t (u(t))2 , dt (9.20) hier ist a(t) = t und f (u) = u2 . Der Lösungsansatz (9.19) führt auf Z 1 du = u2 Z t dt, was wir integrieren und nach u auflösen können: − ⇐⇒ 1 t2 = +c u 2 2 u=− 2 . t + 2c (9.21) Sei nun als Anfangswert u(0) = a für t0 = 0 gegeben. Dann erhalten wir aus (9.21) die Bedingung u(0) = − 1c = a, d. h. es ist c = − a1 und die Lösung von (9.20) mit Anfangswert u(0) = a lautet u(t) = − t2 2 . − a2 9.2.4 Lineare Differentialgleichungen 1.Ordnung Ist die Funktion g in Gleichung (9.1) linear in ihrem zweiten Argument, so spricht man von einer inhomogenen linearen Differentialgleichung 1. Ordnung. Diese hat die Form u0 (t) + a(t)u(t) = b(t), 182 (9.22) 9 Gewöhnliche Differentialgleichungen d.h. es ist g(t, u(t)) = b(t) − a(t)u(t). Es kommt hier nicht darauf an, dass die Funktionen a(t) und b(t) lineare Funktionen sind, die Linearität bezieht sich allein auf das Auftreten von u und u0 . Die Gleichung (9.22) heißt homogen, falls b(t) ≡ 0, um Verwechslungen zu vermeiden bezeichnen wir in diesem Fall die gesuchten Lösungen mit h(t): h0 (t) + a(t)h(t) = 0. (9.23) 9.5 Bemerkung Zur Übung rechne man nach, dass wenn zwei Funktionen h1 (t) und h2 (t) Lösungen der homogenen Gleichung (9.23) sind, auch deren Linearkombinationen h(t) = c1 h1 (t) + c2 h2 (t) Gleichung (9.23) lösen. Lösungsmengen inhomogener linearer Differentialgleichungen sind - wie die Lösungsmengen linearer Gleichungssysteme - von einer speziellen Struktur, wie der folgende Satz besagt. 9.6 Satz: Struktur der Lösungen Ist u∗ (t) eine spezielle Lösung der linearen Differentialgleichung (9.22), so lässt sich jede andere Lösung u(t) von (9.22) schreiben als u(t) = u∗ (t) + h(t), wobei h(t) eine Lösung der homogenen linearen Gleichung (9.23) ist. Beweis. 1. Zunächst zeigen wir, dass für beliebige Lösungen u∗ von (9.22) und h von (9.23) gilt, dass u∗ + h Lösung von (9.22) ist. Hierzu setzen wir (u∗ + h) in die Gleichung ein: (u∗ (t) + h(t))0 + a(t)(u∗ (t) + h(t)) = (u∗ (t))0 + a(t)u∗ (t) + h(t) + a(t)h(t) | {z =b(t) } | {z =0 } = b(t). Also erfüllt u∗ + h Gleichung (9.22). 2. Seien nun u, u∗ zwei Lösungen von (9.22). Dann ist u0 (t) + a(t)u(t) = b(t) und (u∗ )0 (t) + a(t)u∗ (t) = b(t), für die Differenz (u − u∗ )0 (t) + a(t)(u − u∗ )(t) = 0, gilt, d.h. es ist h(t) := u(t) − u∗ (t) eine Lösung der homogenen Gleichung (9.23) und u lässt sich wie gewünscht schreiben als u = u∗ + h. 183 9 Gewöhnliche Differentialgleichungen Diese Struktur der Lösungen wird nun verwendet, um eine allgemeine Lösung des inhomogenen Problems (9.22) zu finden. Schritt 1: Lösung des homogenen Problems Es wird zunächst das homogene Probleme (9.23) explizit gelöst und danach das inhomogene Problem (9.22). Um (9.23) zu lösen, machen wir auf Grund der Ähnlichkeit zur Differentialgleichung (9.8), die exponentielles Wachstum beschreibt, die Annahme, dass die Lösung h(t) vom Typ h(t) = eϕ(t) (9.24) ist mit einer differenzierbaren Funktion ϕ(t). Wir setzen den Ansatz (9.24) in die Gleichung (9.23) ein und versuchen aus der resultierenden Gleichung ϕ(t) zu bestimmen. Es ist nach der Kettenregel h0 (t) = ϕ0 (t)eϕ(t) , so dass die homogene lineare Gleichung (9.23) zu ϕ0 (t)eϕ(t) + a(t)eϕ(t) = 0 wird. Dividieren wir nun durch eϕ(t) , so erhalten wir ϕ0 (t) + a(t) = 0 und daraus nach Integration ϕ(t) = − Zt a(τ )dτ + c̃ t0 mit einer Integrationskonstanten c̃. Diese setzen wir in den Ansatz (9.24) ein. Die gesuchte Lösung h(t) des homogenen Problems (9.23) ist also − Rt a(τ )dτ +c̃ = c e−A(t) t0 h(t) = e (9.25) mit den den Abkürzungen c̃ c := e Zt und A(t) = a(τ )dτ. t0 Die Konstante c in der Lösung (9.25) wird durch eine Anfangsbedingung für die Differentialgleichung (9.23) bestimmt. Ist h(t0 ) = h0 , so folgt, da A(t0 ) = 0 gilt, h(t0 ) = c e0 = c, so dass c = h0 gewählt werden muss. 184 9 Gewöhnliche Differentialgleichungen Schritt 2: Lösung des inhomogenen Problems Um die inhomogene Gleichung (9.22) zu lösen, verwenden wir die Methode der “Variation der Konstanten”. In der Lösung (9.25) für die homogene Gleichung ersetzen wir die Konstante c durch eine Funktion c(t) und setzen u(t) = c(t) e−A(t) (9.26) in die Gleichung (9.22) ein. Es ist mit der Produktregel u0 (t) = c0 (t) e−A(t) − c(t) A0 (t) e−A(t) = c0 (t) e−A(t) − c(t) a(t) e−A(t) (∗) 0 = c (t) e−A(t) − a(t) f (t) wobei A0 (t) = a(t) und in (∗) der Ansatz (9.26) für u(t) verwendet wurde. Damit wird (9.22) zu c0 (t)e−A(t) − a(t)u(t) + a(t)u(t) = b(t) c0 (t) = b(t)eA(t) ⇐⇒ Zt ⇐⇒ c(t) = b(τ )eA(τ ) dτ + c0 , t0 hier bezeichnet c0 die Integrationskonstante. Setzen wir dieses Ergebnis für c(t) in den Ansatz (9.26) für u ein, so erhalten wir als Lösung Zt u(t) = ( b(τ )eA(τ ) dτ + c0 ) e−A(t) t0 = c0 e −A(t) −A(t) Zt +e b(τ )eA(τ ) dτ (9.27) t0 und es bleibt lediglich die Integrationskonstante c0 zu bestimmen. Für einen gegebenen Anfangswert u(t0 ) = u0 ist nach (9.27) u(t0 ) = c0 e0 = c0 sodass c0 = u0 gewählt werden muss. Hierbei wurde wiederum Rt0 . . . dτ = 0 verwendet. Insge- t0 samt erhalten wir also: 9.7 Satz: Lösungsformel für lineare Differentialgleichungen Die homogene lineare Differentialgleichung h0 (t) + a(t)h(t) = 0 185 9 Gewöhnliche Differentialgleichungen hat zu einem Anfangswert h(t0 ) = h0 die Lösung h(t) = h0 e−A(t) (9.28) und zu jedem Anfangswert u0 ∈ R gibt es genau eine Lösung u der linearen Differentialgleichung u0 (t) + a(t)u(t) = b(t) mit u(t0 ) = u0 , nämlich u(t) = u0 e −A(t) −A(t) Zt +e eA(τ ) b(τ )dτ (9.29) t0 mit Zt A(t) = a(τ )dτ. t0 9.8 Bemerkung Man beachte, dass durch b(t) ≡ 0 in der Lösungsformel für das inhomogene Problem (9.29) die Lösung (9.28) der homogenen Differentialgleichung enthalten ist. Gleichzeitig ist die Lösung des inhomogenen Problems (9.29) zum Anfangswert u0 = 0 gegeben durch ∗ −A(t) Zt u (t) = e eA(τ ) b(τ )dτ, t0 sodass die allgemeine Lösung (9.29) tatsächlich von der Struktur u(t) = h(t) + u∗ (t) ist, wie in Satz 9.6 behauptet. 9.9 Beispiele a) In der physikalischen Chemie wird in der Reaktionskinetik die Geschwindigkeit chemischer Reaktionen untersucht. Bei einer Reaktion 1. Ordnung ist die Änderung der Konzentration eines Stoffes proportional zur Konzentration: − d [A] = k[A]. dt Wir erhalten also als Lösung [A](t) = A0 e−kt 186 9 Gewöhnliche Differentialgleichungen zu einem Anfangswert [A](0) = A0 . Betrachten wir nun Folgereaktionen k 1 −→ A k 2 −→ B C so werden diese beschrieben durch ein System linearer Differentialgleichungen [A]0 (t) = −k1 [A](t) [B]0 (t) = k1 [A](t) − k2 [B](t) [C]0 (t) = k2 [B](t) welche wir sukzessive lösen können, siehe Übungen. a b) Wir untersuchen eine Population der Größe P (t) mit zeitabhängiger Geburtenrate 1+t und konstanter Sterberate σ, es seien die Parameter a, σ > 0. Die Differentialgleichung zu diesem Modell lautet P 0 (t) = a − σ P (t) 1+t sodass in der Lösungsformel (9.28) für die homogene Gleichung a −σ a(t) = − 1+t zu wählen ist. Damit ist −A(t) = Zt a − σ dτ 1+τ 0 = [a ln(1 + τ ) − στ ]t0 = (a ln(1 + t) − σt) − (a ln(1)) a | ln(1) = 0 |a ln(x) = ln(xa ) = ln((1 + t) ) − σt (9.30) und für den Anfangswert P (0) = P0 erhalten wir die Lösung a −σt P (t) = P0 eln(1+t) = P0 (1 + t)a e−σt . (9.31) c) Erweitern wir nun das Modell für die Population um einen Term, der eine konstante Zuwanderungsrate z beschreibt, dann erhalten wir die Gleichung 0 P (t) = a − σ P (t) + z 1+t welche vom Typ der linearen Differentialgleichung (9.22) ist mit a(t) = − a −σ 1+t b(t) = z. 187 (9.32) 9 Gewöhnliche Differentialgleichungen Daher können wir eine Lösung von (9.32) mit der Formel (9.27) berechnen. Es ist A(t) wie in (9.30), so dass wiederrum e−A(t) = (1 + t)a · e−σt und eA(t) = (1 + t)−a · eσt ist. Bleibt also das Integral Rt 0 b(τ )eA(τ ) dτ zu bestimmen: Zt b(τ )e A(τ ) Zt dτ = 0 z(1 + τ )−a eστ dτ. 0 Dieses Integral können wir nicht explizit integrieren, wir lassen es stehen und erhalten als Lösung von (9.32) mit Anfangswert P (0) = P0 a −σt P (t) = P0 (1 + t) e a −σt + (1 + t) e Zt z (1 + τ )−a eστ dτ. (9.33) 0 d) Bei Populationsmodellen interessiert man sich häufig für die langfristige Entwicklung. In dem Modell ohne Zuwanderung erhalten wir aus (9.31) lim P (t) = lim P0 (1 + t)a e−σt t→∞ t→∞ = lim t→∞ P0 (1 + t)a eσt = 0, da die Exponentialfunktion stärker wächst als jede Potenz. Dass die Population ausstirbt, war aufgrund der zeitlich abnehmenden Geburtenrate auch zu erwarten. Um eine Vorhersage für das Modell (9.32) mit konstanter Zuwanderung z zu machen, betrachten wir die Lösung (9.33). Hier konvergiert der erste Summand wie gerade gesehen gegen 0, den zweiten können wir umformen zu dem Quotienten z u(t) = v(t) Rt + τ )−a eστ dτ , (1 + t)−a eσt 0 (1 auf den wir wegen lim u(t) = ∞ und lim v(t) = ∞ die Regel von de l’Hospital anwenden t→∞ t→∞ können. Die Ableitung von u(t) ist der Wert des Integranden an der oberen Integrationsgrenze u0 (t) = z(1 + t)−a eσt und mit der Produktregel ist v 0 (t) = −a(1 + t)−a−1 eσt + (1 + t)−a σeσt = (1 + t)−a eσt −a(1 + t)−1 + σ . 188 9 Gewöhnliche Differentialgleichungen Es ist also u0 (t) t→∞ v 0 (t) lim P (t) = lim t→∞ z(1 + t)−a eσt = lim −a (1 + t)−a eσt 1+t +σ z z = . = lim t→∞ − a + σ σ 1+t t→∞ Im Modell mit abnehmender Geburtenrate und konstanter Zuwanderung konvergiert die Größe der Population also gegen den Quotienten aus Zuwanderung und Sterberate. 9.2.5 Richtungsfelder Eine Differentialgleichung 1.Ordnung mit rechter Seite g, aufgefasst als Funktion von t und u, u0 = g(t, u) (9.34) kann auch verstanden werden als Gleichung, die zu möglichen Wertepaaren (u, t), bei unbekannter Lösung u(t), die Steigung u0 (t) angibt, indem g(t, u) berechnet wird. D. h. wir können - ohne die Gleichung (9.34) gelöst zu haben - in der (u, t)- Ebene in jedem beliebigen Punkt die Steigung einer Lösung u(t) skizzieren, die durch den Punkt verläuft, ohne die Lösung u(t) selbst zu kennen. 9.10 Beispiele a) Betrachten wir die Michaelis-Menten Gleichung (9.16), die sich nicht explizit lösen ließ. u Aus u0 = − 1+u können wir zu verschiedenen u die Steigung einer Lösung u0 (t) berechnen: u = 0 ⇒ u0 = 0, 1 1 ⇒ u0 = − , 2 3 1 0 u=1 ⇒ u =− , 2 u= 2 3 3 0 u =3 ⇒ u = − , 4 4 0 u =4 ⇒ u = − . 5 u =2 ⇒ u0 = − In der Michaelis-Menten Gleichung ist u0 stets unabhängig von t, es ist also für jede Lösungskurve, die den Wert 1 annimmt, dort die Steigung − 12 etc. Dieses können wir durch kleine Tangentenstücke in der (u, t)-Ebene veranschaulichen, siehe Abb. 9.3. Eine Lösung der Michaelis-Menten Gleichung muss einen solchen Verlauf haben, dass die Tangentenstücke aus Abbildung 9.3 stets die Steigung der Lösungskurve angeben. Die Funktion muss sich also in das Richtungsfeld aus Abbildung 9.3 einfügen, ohne die Tangenten zu schneiden. Auf diese Weise kann man zu verschiedenen Anfangswerten u(0) = u0 Lösungskurven skizzieren, ohne die Gleichung selbst zu lösen. b) Auch die qualitativen Überlegungen zur Lösung der logistischen Differentialgleichung (9.10) lassen sich in einem Richtungsfeld darstellen. c) In einigen Fällen lässt sich aus dem Richtungsfeld die Lösung u(t) der Differentialgleichung 189 9 Gewöhnliche Differentialgleichungen u(t) 5 4 3 2 1 t 1 2 3 4 5 Abbildung 9.3: Richtungsfeld der Michaelis-Menten Gleichung P (t) K t Abbildung 9.4: Richtungsfeld einer logistischen Differentialgleichung 190 9 Gewöhnliche Differentialgleichungen explizit erraten. Hierzu untersuchen wir als Beispiel die Differentialgleichung t u0 (t) = − . u (9.35) Die Tangenten im Richtungsfeld sind nun nicht nur von u, sondern auch von t abhängig. Wir können leicht erkennen, dass t = 0 ⇒ u0 =0 für alle u ∈ R, 0 u = 0 ⇒ u =∞ für alle t ∈ R, u=t ⇒ u0 = − 1, u = −t ⇒ u0 =1. Tragen wir diese Steigungen in der (u, t)-Ebene ein, so erhalten wir u(t) t Abbildung 9.5: Richtungsfeld der DGL u0 = − ut . weswegen wir vermuten, dass die Lösungskurven von (9.35) Kreise um den Nullpunkt sind. Die gesuchte Lösung u(t) hätte demnach die Form u(t) = p R2 − t2 , (9.36) da wegen u(t)2 + t2 = R2 der Graph dieser Funktion ein Halbkreis mit Radius R ist. Um zu prüfen, ob (9.36) auch der Differentialgleichung (9.35) genügt, berechnen wir u0 (t) (mit der Kettenregel) und erhalten u0 (t) = (9.36) = 1 √ · (−2t) 2 R 2 − t2 t − . u(t) Wir haben also durch Auswerten des Richtungsfeldes die Differentialgleichung (9.35) gelöst 9.11 Bemerkung Ebenfalls lösen lässt sich (9.35) durch die Methode der Trennung der Va- 191 9 Gewöhnliche Differentialgleichungen riablen. Es wird aus (9.19) und (9.35) udu = −tdt u2 t2 =− +c 2 p2 =⇒ u = 2c − t2 . ⇐⇒ Die Konstante 2c lässt sich durch einen Anfangswert bestimmen. Für einen Kreis vom Radius R ist u(0) = R, daher ist √ u(0) = 2c = R, sodass 2c = R2 folgt und wir (9.36) erhalten. 9.2.6 Stationäre Punkte Hat eine Differentialgleichung 1.Ordnung die Form u0 (t) = g(u(t)), d.h. hängt g nicht explizit von t ab, so sind konstante Funktionen u(t) ≡ ū, für die g(ū) = 0 gilt, Lösungen der Differentialgleichung, da für konstante Lösungen u(t) immer u0 (t) = 0 gilt. 9.12 Definition: Stationärer Punkt Ein ū ∈ R mit g(ū) = 0 heißt stationärer Punkt der Differentialgleichung u0 (t) = g(u(t)). 9.13 Beispiele a) Die logistische Differentialgleichung u0 (t) = c(K − u(t))u(t) hat die stationären Punkte ū1 = 0 und ū2 = K. b) Die homogene lineare Differentialgleichung u0 (t) = a u(t), in der a konstant ist, hat den stationären Punkt ū = 0. c) Die lineare Differentialgleichung u0 (t) = a u(t) + b, in der a und b konstant sind, hat den stationären Punkt b ū = − . a 9.14 Bemerkungen a) Im Richtungsfeld einer Differentialgleichung, siehe Abb.b) erkennt man stationäre Punkte daran, dass die Tangenten auf der Parallelen zur x-Achse waagerecht verlaufen: b) Da sich Lösungskurven nicht schneiden können, bleiben Lösungen zu Anfangswerten u0 192 9 Gewöhnliche Differentialgleichungen mit u0 > ū immer größer als ū u0 < ū immer kleiner als ū. Interessant ist nun zu wissen, wie sich Lösungen in der Nähe von stationären Punkten verhalten. Nähern sie sich diesen an, oder entfernen sie sich? 9.15 Definition: Stabilität stationärer Punkte Ein stationärer Punkt ū einer Differentialgleichung u0 = g(u) mit Anfangswert u0 “in der Nähe ” von ū heißt i) stabil, wenn die Lösung zu u0 “in der Nähe” von ū bleibt. ii) anziehend stabil, wenn für die Lösung zu u0 lim u(t) = ū t→∞ gilt. iii) instabil, wenn ū nicht stabil ist. Wenden wir uns nun wieder den Beispielen 9.13 zu. 9.16 Beispiele a) Im Richtungsfeld der logistischen Differentialgleichung sieht man, dass ū = K anziehend stabil ist und ū = 0 instabil. b) Die Lösungen der homogenen linearen Differentialgleichung sind u(t) = u0 eat . Daher gilt für den stationären Punkt ū = 0 i) falls a < 0, ist lim u0 eat = 0, d.h. ū = 0 ist anziehend stabil. t→∞ ii) falls a > 0, ist lim u0 eat = ∞, d.h. ū = 0 ist instabil. t→∞ iii) falls a = 0, ist jeder Punkt ū ∈ R stationärer Punkt. Da alle Funktionen ū ≡ const Lösungen der Differentialgleichung sind, sind die ū stabil, aber nicht anziehened stabil. c) Der stationäre Punkt ū = − ab der linearen Differentialgleichung u0 = au + b ist für a<0 anziehend stabil, a>0 instabil, wie man aus der Lösung u(t) = u0 + ab eat − tialgleichung keine stationären Punkte. 193 b a ersieht. Im Falle a = 0 hat die Differen- 9 Gewöhnliche Differentialgleichungen Aus diesen Ergebnissen für lineare Differentialgleichung lassen sich auch Aussagen für nichtlineare Differentialgleichungen ableiten. Angenommen in u0 (t) = g(u) (9.37) sei g(u) differenzierbar als Funktion von u. Dann kann die nichtlineare rechte Seite durch eine lineare Funktion approximiert werden, l(u) = g(a) + g 0 (a)(u − a) (9.38) beschreibt eine Tangente an g im Punkt a mit Steigung g 0 (a). In der Nähe von a beschreibt l(u) das Verhalten von g(u), sofern g(u) “glatt” ist, d.h. keine Sprünge oder Knicke hat. Sei nun ū ein stationärer Punkt von g, d.h. g(ū) = 0, so ersetzen wir in der Gleichung (9.37) die Funktion g(u) durch die Approximation (9.38) und erhalten als neue Differentialgleichung ũ0 (t) = g(ū) + g 0 (ū)(ũ − ū) = g 0 (ū)(ũ − ū), (9.39) da g(ū) = 0 ist. Die Differentialgleichung (9.39) hat ebenfalls ū als stationären Punkt und ist linear, d.h. wir können die Ergbenisse aus Beispiel c) übertragen, da sich die Lösungen von (9.37) in der Nähe des stationären Punktes so verhalten wie die Lösungen von (9.39). 9.17 Satz: Stabilität stationärer Punkte Ein stationärer Punkt ū einer Differentialgleichung u0 (t) = g(u) ist anziehend stabil, wenn g 0 (ū) < 0, instabil, wenn g 0 (ū) > 0. Für g 0 (ū) = 0 ist keine Aussage möglich. 9.18 Beispiel Wir betrachten wieder die logistische Differentialgleichung u0 = c(K −u)u, dann ist g(u) = c(K − u)u = cKu − cu2 und g 0 (u) = cK − c2u. Dann gilt für die stationären Punkte ū1 = 0: Es ist g 0 (ū1 ) = g 0 (0) = cK > 0, d.h. ū1 = 0 ist instabil; ū2 = K: Es ist g 0 (ū2 ) = g 0 (K) = −cK < 0, d.h. ū2 = K ist anziehend stabil. 194 9 Gewöhnliche Differentialgleichungen 9.3 Lineare Differentialgleichungen 2.Ordnung 9.3.1 Beispiel: Der harmonische Oszillator Wir betrachten lineare Differentialgleichungen von 2.Ordnung mit konstanten Koeffizienten. Ein Beispiel hierfür ist die Bewegung eines Massenpunktes mit Masse m, der an einer Spiralfeder aufgehängt ist und sich entlang der vertikalen y-Achse bewegt. Seine Bewegung wird beschrieben durch die Differentialgleichung mÿ = −ky(t), (9.40) wobei k > 0 die Federkonstante ist. Lösungen von (9.40) sind y1 (t) = cos(ωt) und y2 (t) = q k sin(ωt), wobei ω = m gesetzt wird. Da (9.40) eine lineare Gleichung ist, sind auch alle Linearkombinationen von y1 und y2 Lösungen dieser Gleichung, sodass y(t) = c1 cos(ωt) + c2 sin(ωt) (9.41) für c1 , c2 ∈ R die Differentialgleichung (9.40) löst. Die Linearfaktoren c1 , c2 ∈ R können eindeutig bestimmt werden, wenn zwei Anfangsbedingungen durch y(0) = y0 und y 0 (0) = y00 gegeben sind. Setzt man t = 0 in (9.41) und in die Ableitung dieser Funktion ein, so erhält man y(0) = c1 ⇒ c1 = y0 y 0 (0) = c2 ω ⇒ c2 = y00 , ω so dass die Lösung von (9.40) zu Anfangswerten y0 , y00 lautet: y(t) = y0 cos(ωt) + y00 sin(ωt). ω Es ist also ω die Kreisfrequenz der harmonischen Schwingung. 9.3.2 Lösung der linearen Differentialgleichung 2.Ordnung Es soll eine Lösung der allgemeinen homogenen linearen Differentialgleichung 2.Ordnung mit konstanten Koeffizienten y 00 (t) + ay 0 (t) + by(t) = 0 (9.42) hergeleitet werden. Hierfür wählen wir einen Exponentialansatz für die Funktion y(t) y(t) = eλt (9.43) für ein λ ∈ R. Für die Ableitungen folgt dann y 0 (t) = λeλt und y 00 (t) = λ2 eλt . Setzen wir diese in (9.42) ein, erhalten wir λ2 eλt + aλeλt + beλt = 0 195 9 Gewöhnliche Differentialgleichungen und nachdem wir durch eλt teilen λ2 + aλ + b = 0 was eine quadratische Gleichung für λ ist. 9.19 Definition: Charakteristisches Polynom Das Polynom p(λ) = λ2 + aλ + b (9.44) heißt charakteristisches Polynom der Differentialgleichung (9.42). q 2 a Ist λ = − a2 ± − b eine Nullstelle des charakteristischen Polynoms p(λ), so ist eλt eine 2 Lösung der Differentialgleichung (9.42). Um die allgemeine Lösung von (9.42) genau angeben 2 2 2 zu können, müssen die Fälle a2 − b > 0, a2 − b = 0 und a2 − b < 0 unterschieden werden: 1. Fall: Zwei reelle Nullstellen Ist a 2 2 − b > 0, so sind a λ1 = − + 2 s 2 a 2 a λ2 = − − 2 − b, s a 2 2 −b (9.45) zwei verschiedene reelle Nullstellen. Es sind y1 (t) = eλ1 t , y2 (t) = eλ2 t Lösungen von (9.42) und wegen der Linearität der Gleichung sind auch alle Linearkombinationen y(t) = c1 eλ1 t + c2 eλ2 t von y1 (t) und y2 (t) mit c1 , c2 ∈ R Lösungen. (Bemerkung: falls a > 0 ist, folgt λ1 < 0 und λ2 < 0. Was lässt sich in diesem Fall über das aymptotische Verhalten der Lösungen sagen?) 2. Fall: Genau eine reelle Nullstelle Ist a 2 2 − b = 0 so hat das charakteristische Polynom p(λ) λ=− a 2 als einzige Lösung, weshalb a y1 (t) = e− 2 t 196 (9.46) 9 Gewöhnliche Differentialgleichungen Lösung von (9.42) ist. Darüber hinaus kann man durch Nachrechnen zeigen, dass im Falle a 2 − b =0 2 a y2 (t) = te− 2 t ebenfalls (9.42) löst, sodass die allgemeine Lösung gegeben ist durch a a y(t) = c1 e− 2 t + c2 te− 2 t mit c1 , c2 ∈ R. 3. Fall: Zwei komplexwertige Nullstellen 2 Ist a2 − b < 0, so hat das charakteristische Polynom (9.44) die beiden komplex konjugierten Nullstellen s a λ1 = − + i b − 2 welche mit α := − a2 und β := q b− s 2 a 2 a 2 2 a λ2 = − − i b − 2 , 2 a 2 (9.47) als λ2 = α − iβ λ1 = α + iβ geschrieben werden können. Also sind y1 (t) = eλ1 t = e(α+iβ)t = eαt eiβt = eαt (cos(βt) + i sin(βt)) und y2 (t) = eλ2 t = e(α−iβ)t = e(αt) ei(−βt) = eαt (cos(−βt) + i sin(−βt)) = eαt (cos(βt) − i sin(βt)) Lösungen von (9.42), daher auch alle Linearkombinationen y(t) = c1 y1 (t) + c2 y2 (t) für c1 , c2 ∈ C. Nun interessieren uns reellwertige Lösungen. Eine spezielle reellwertige Lösung erhalten wir für c˜1 , c˜2 = 12 durch 1 1 ỹ(t) = eαt (cos(βt) + i sin(βt)) + eαt (cos(βt) − i sin(βt)) 2 2 = eαt cos(βt) und eine weitere für cˆ1 = 1 2i , cˆ2 1 = − 2i durch 1 1 αt e (cos(βt) + i sin(βt)) − eαt (cos(βt) − i sin(βt)) 2i 2i = eαt sin(βt). ŷ(t) = 197 9 Gewöhnliche Differentialgleichungen Wegen der Linearität der Gleichung (9.42) sind nicht nur ỹ und ŷ reellwertige Lösungen sondern auch alle Linearkombinationen mit reellen Linearfaktoren c1 , c2 : y(t) = c1 ỹ(t) + c2 ŷ(t) = eαt (c1 cos(βt) + c2 sin(βt)) ist die allgemeine reellwertige Lösung von (9.42) und die c1 , c2 ∈ R werden aus den reellen Anfangswerten bestimmt. 9.20 Satz: Lösungen der linearen DGL 2. Ordnung Sei y 00 + ay 0 + by = 0 (9.48) eine homogene lineare Differentialgleichung mit konstanten Koeffizienten a, b ∈ R. Dann ist die allgemeine reellwertige Lösung im Falle von i) a 2 2 − b > 0 durch y(t) = c1 eλ1 t + c2 eλ2 t mit λ1 = − a2 + ii) a 2 2 q a 2 2 − b und λ2 = − a2 − q a 2 2 (9.49) − b, − b = 0 durch y(t) = eλt (c1 + c2 t) (9.50) y(t) = eαt (c1 cos(βt) + c2 sin(βt)) (9.51) mit λ = − a2 , iii) a 2 2 − b < 0 durch mit α = − a2 und β = q b− a 2 2 gegeben, mit Konstanten c1 , c2 ∈ R. 9.21 Beispiel In der Physik wird die lineare gedämpfte Schwingung beschrieben durch die Differentialgleichung my 00 (t) + dy 0 (t) + ky(t) = 0, in welcher m für die Masse steht, d für die Dämpfung und k für die Federkonstante. Teilen wir d k und b = m . Da für die diese Gleichung durch m, so erhalten wir Gleichung (9.42) mit a = m physikalischen Parameter d ≥ 0 und m, k > 0 gilt, ist also auch a ≥ 0 und b > 0. Die drei oben unterschiedenen Fälle beschreiben nun unterschiedlich stark gedämpfte Schwingungen: 198 9 Gewöhnliche Differentialgleichungen 1. Fall: Starke Dämpfung oder auch Kriechfall Im Fall ( a2 )2 − b > 0 sind für a, b > 0 die beiden reellen Nullstellen negativ, vergleiche hierzu (9.45). Daher ist die Lösung stets eine Linearkombination zweier abfallender e - Funktionen. Betrachten wir y 00 (t) + 3y 0 (t) + 2y(t) = 0, (9.52) so ist a = 3 und b = 2 so dass ( a2 )2 − b = ( 32 )2 − 2 = 41 > 0 gilt. Die allgemeine Lösung ist nach Satz 9.20 i) gegeben durch (9.49) wobei λ1 , λ2 die Nullstellen des charakteristischen Polynoms p(λ) = λ2 + 3λ + 2 sind, d. h. es ist λ1 = −1 und λ2 = −2. Setzen wir diese Werte ein, so erhalten wir y(t) = c1 e−t + c2 e−2t . (9.53) Um die Linearfaktoren c1 , c2 zu bestimmen benötigen wir Anfangswerte, welche beispielsweise durch y(0) = 2 und y 0 (0) = 0 gegeben seien. Berechnen wir die Ableitung von (9.53), so erhalten wir y 0 (t) = c1 λ1 eλ1 t + c2 λ2 eλ2 t , was für t = 0 ausgewertet y 0 (0) = c1 λ1 + c2 λ2 ergibt. Gemeinsam mit der Anfangsbedingung für y welche durch Einsetzen in (9.53) y(0) = c1 + c2 = 2 ergibt, erhalten wir ein lineares Gleichungssystem c1 + c2 = 2 −c1 − 2c2 = 0 woraus wir c1 = 4 und c2 = −2 berechnen. Die Lösung der Gleichung (9.52) zu den gewählten Anfangswerten lautet also y(t) = 4e−t − 2e−2t , welche in Abb. 9.6 dargestellt ist. Man sieht, dass es zu keiner Schwingung kommt, das System konvergiert gegen die Ruhelage bei y = 0. 2.Fall: Aperiodischer Grenzfall Im Fall ( a2 )2 − b = 0 erhält man für a > 0 nach (9.46) genau eine negative Nullstelle des charakteristischen Polynoms, λ = − a2 < 0. Betrachten wir als Beispiel y 00 (t) + 2y(t) + y(t) = 0, so ist a = 2 und b = 1 so dass ( a2 )2 − b = 0 gilt. Die allgemeine Lösung ist dann nach Satz 9.20 ii) mit λ = − a2 = −1 gegeben durch y(t) = e−t (c1 + c2 t). Die Linearfaktoren c1 , c2 können nun aus Anfangsbedingungen berechnet werden. Seien y(0) = 2 und 199 y 0 (0) = −4 (9.54) 9 Gewöhnliche Differentialgleichungen gegeben. Es folgt mit t = 0 in (9.54) dass y(0) = c1 , also c1 = 2 zu wählen ist. Um die Anfangsbedingung für y 0 nutzen zu können leiten wir (9.54) ab und erhalten y 0 (t) = (c2 − c1 )e−t − c2 te−t . Setzen wir hier wiederum t = 0 ein, ergibt sich y 0 (0) = c2 − c1 , woraus folgt dass c2 = −2 ist. Die Lösung zu den gegebenen Anfangsbedingungen lautet also y(t) = e−t (2 − 2t) und ist dargestellt in Abb. 9.7. Durch Nachrechnen sieht man, dass die Lösung in diesem aperiodischen Grenzfall immer genau eine Nullstelle t∗ hat, es ist stets t∗ > 0, und genau ein Minimum. Daher kommt es auch in diesem Fall nicht zu einer Schwingung, sondern das System hat genau einen Nulldurchgang und konvergiert dann gegen die Ruhelage. 3. Fall: Schwingfall Im Fall ( a2 )2 − b < 0 hat das charakteristische Polynom nach (9.47) genau zwei konjugiert komplexe Nullstellen. Sei y 00 (t) + y 0 (t) + 3y(t) = 0, (9.55) so ist a = 1 und b = 3, so dass ( a2 )2 − b = ( 21 )2 − 3 < 0 gilt. Die allgemeine Lösung ist nach Satz 9.20 iii) gegeben durch (9.51) wobei α, β Real- und Imaginärteil der (komplexwertigen) Nullstellen des charakteristischen Polynoms sind, d. h. es ist α = − a2 = − 12 und β= q b − ( a2 )2 = q 3 − ( 12 )2 = √ 11 2 . Setzen wir diese Werte ein in (9.51), so erhalten wir √ 11 11 t) + c2 sin( t)). (c1 cos( 2 2 √ − 21 t y(t) = e (9.56) Um die Linearfaktoren c1 , c2 zu bestimmen benötigen wir Anfangswerte, welche beispielsweise durch y(0) = 2 und y 0 (0) = 0 gegeben seien. Zunächst folgt aus (9.56) mit t = 0 eingesetzt, dass y(0) = c1 , was c1 = 2 bedeutet. Berechnen wir die Ableitung der allgemeinen Lösung (9.51), so erhalten wir für t=0 y 0 (0) = α c1 + β c2 . Wenn wir nun noch t = 0 in (9.51) einsetzen erhalten wir mit den Werten dieses Beispiels das c2 = y 0 (0) − αc1 = β 1 22 √ 11 2 2 =√ . 11 Die Lösung der Gleichung (9.55) zu den gewählten Anfangswerten lautet also √ √ 11 2 11 − 12 t y(t) = e (2 cos( t) + √ sin( t)), 2 2 11 welche in Abb. 9.8 dargestellt ist. 200 9 Gewöhnliche Differentialgleichungen 9.22 Satz: Lösungen der inhomogenen linearen DGL 2. Ordnung Sei y 00 + ay 0 + by = c (9.57) die Gleichung aus Satz 9.20, nur ergänzt um eine konstante rechte Seite c ∈ R. Dann ist die konstante Funktion y ∗ (t) = c b eine spezielle Lösung von (9.57) und die allgemeine Lösung von ist gegeben durch die Summe aus der allgemeinen Lösung yh (t) der homogenen Gleichung (9.48) und y ∗ : y(t) = yh (t) + y ∗ (t), Beweis. Übung. R R Abbildung 9.6: starke Dämpfung: y(t) = 4e−t − 2e−2t . R R Abbildung 9.7: Aperiodischer Grenzfall y(t) = e−t (2 − 2t) 201 9 Gewöhnliche Differentialgleichungen R R Abbildung 9.8: Gedämpfte Schwingung 9.4 Systeme von Differentialgleichungen 9.4.1 Lineare Systeme 1.Ordnung mit konstanten Koeffizienten Wir betrachten ein System mit zwei unbekannten Größen u1 (t), u2 (t). Über die beiden Differentialgleichungen u01 (t) = au1 (t) + bu2 (t) u02 (t) = cu1 (t) + du2 (t) werden!diese Größen miteinander gekoppelt. Fassen wir u1 (t), u! 2 (t) zu einem Vektor u = u1 (t) a b und die Koeffizienten a, b, c, d zu einer Matrix A = zusammen, so können wir u2 (t) c d ! obiges System mit u0 (t) = u01 (t) u02 (t) auch schreiben als u01 (t) u02 (t) ! = a b c d ! u1 (t) u2 (t) ! oder noch kürzer als u0 (t) = A u(t) (9.58) Hierbei sind u(t), u0 (t) ∈ R2 für jedes feste t ∈ R. 9.23 Bemerkung Man sieht, dass (9.58) wieder eine lineare Struktur hat, d. h. dass mit zwei Lösungen u(t) und v(t) von (9.58) auch alle Linearkombinationen w(t) = c1 u(t) + c2 v(t) Lösungen von (9.58) sind. 202 9 Gewöhnliche Differentialgleichungen Beweis. w0 (t) = (c1 u(t) + c2 v(t))0 = c1 u0 (t) + c2 v0 (t) (∗) = c1 Au(t) + c2 Av(t) = A(c1 u(t) + c2 v(t)). In (∗) wurde verwendet, dass u(t), v(t) Lösungen von (9.58) sind. 9.24 Satz: Lösungen im Falle reeller Eigenwerte u01 u02 i) Ist λ ∈ R Eigenwert der Matrix A und u0 = ! Eigenvektor von A zum Eigen- wert λ, so ist u(t) = eλt u0 = u01 eλ t u02 eλ t ! Lösung von (9.58). ii) Hat die Sytemmatrix A ∈ R2×2 des Differentialgleichungssystems (9.58) zwei Eigenwerte λ1 , λ2 mit Eigenvektoren u0 , v0 so ist die allgemeine Lösung gegeben durch u(t) = c1 u0 (t) + c2 v0 (t). (9.59) Die Linearfaktoren c1 , c2 können aus gegebenen Anfangswerten bestimmt werden. Beweis. Es ist Au0 = λu0 und u0 ∈ R2 \ {0}. Dann gilt: u0 (t) = (eλt u0 )0 = λ eλt u0 = eλt λ u0 = eλt A u0 = A eλt u0 = A u(t). 9.25 Beispiel Gelöst werden soll das System u01 (t) = u1 (t) + 2u2 (t) u02 (t) = 2u1 (t) + u2 (t). In vektorieller Schreibweise lautet es ! 0 u (t) = 1 2 u(t). 2 1 203 (9.60) 9 Gewöhnliche Differentialgleichungen Die Eigenwerte λ der Matrix A = λ1 = 3 λ2 = −1 1 2 2 1 ! sind nach Beispiel 7.42 gegeben durch mit Eigenvektor u0 = u01 u02 mit Eigenvektor v01 v02 v0 = ! ! = 1 1 = 1 −1 ! ! Daher erhalten wir mit Satz 9.24 i) die beiden Lösungen u(t) = e 3t v(t) = e −t 1 1 ! e3t e3t = ! 1 −1 ! ! = e−t . −e−t Nach Satz 9.24 ii) ist die allgemeine Lösung gegeben durch w(t) = c1 u(t) + c2 v(t) ! mit Linearfaktoren c1 , c2 ∈ R. Ist nun als Anfangswert beispielsweise w(0) = 2 1 vorgegeben, so können c1 , c2 bestimmt werden: w(0) = c1 u(0) + c2 v(0) = c1 u0 + c2 v0 ! = c1 ! 1 1 + c2 . 1 −1 ! Soll nun w(0) = 2 1 gelten, so muss c1 + c2 = 2 c1 − c2 = 1 erfüllt sein. Diese Gleichungen!können wir auflösen zu c1 = 2 zu (9.60) mit Anfangswert gegeben ist durch 1 ! 3 2 und c2 = 12 , so dass die Lösung ! 3 1 1 1 w(t) = e3t + e−t . 1 −1 2 2 9.4.2 Komplexwertige Lösungen Es kann der Fall eintreten, dass die Eigenwerte der Matrix A in (9.58) nicht reell-, sondern komplexwertig sind. Ist also λ = α + iβ ∈ C \ R Eigenwert von A, so wissen wir, dass auch 204 9 Gewöhnliche Differentialgleichungen λ̄ = α − iβ Eigenwert von A ist, denn da A nur reelle Einträge hat, hat das charakteristische Polynom der Matrix reelle Koeffizienten und wir können Bemerkung 8.24 iii) anwenden. Ist nun z0 ∈ C2 \ {0} Eigenvektor von A zum Eigenwert λ so ist die Funktion z : R → C2 , welche definiert ist durch z(t) = eλt z0 eine Lösung der Differentialgleichung z0 (t) = Az(t) (9.61) Ziel ist es auch hier, reellwertige Lösungen zu finden. Dazu zerlegen wir Gleichung (9.61) in ihren Real - und Imaginärteil. Um z0 (t) zerlegen zu können, muss zunächst z(t) zerlegt werden. Hierzu bezeichnen wir Real - und Imaginärteil von z0 mit z0 = x0 + iy0 (beachte, dass x0 , y0 ∈ R2 !) und berechnen dann z(t) = eλt z0 = e(α+iβ)t (x0 + iy0 ) = eαt (cos(βt) + i sin(βt))(x0 + iy0 ) = eαt [cos(βt)x0 + i cos(βt)y0 + i sin(βt)x0 + i sin(βt)iy0 ] = eαt [cos(βt)x0 − sin(βt)y0 + i(cos(βt)y0 + sin(βt)x0 )] . (9.62) Bezeichnen wir nun den Real- und Imaginärteil von z(t) mit x(t) und y(t) so ist also x(t) = eαt [cos(βt)x0 − sin(βt)y0 ] y(t) = eαt [(cos(βt)y0 + sin(βt)x0 )] Setzen wir diese Zerlegungen in die Differentialgleichung ein, so ist z0 (t) = Az(t) ⇐⇒ x0 (t) + iy0 (t) = A(x(t) + iy(t)). (9.63) Eine Gleichung in C ist aber immer genau dann erfüllt, wenn sie für den Real- und Imaginärteil der Gleichung gilt, wir können also (9.63) zerlegen in zwei Gleichungen x0 (t) = Ax(t) y0 (t) = Ay(t) welche jeweils genau der Gleichung (9.61) entsprechen, nur dass wir mit x(t) und y(t) zwei reellwertige Lösungen gefunden haben. 9.26 Satz: Lösungen im Falle komplexwertiger Eigenwerte Sei eine Matrix A ∈ R2×2 gegeben mit Eigenwerten λ, λ̄ ∈ C \ R und einem Eigenvektor 205 9 Gewöhnliche Differentialgleichungen z0 = x0 + iy0 ∈ C2 zu λ = α + iβ, so sind durch x(t) = eαt (cos(βt)x0 − sin(βt)y0 ) y(t) = eαt (cos(βt)y0 + sin(βt)x0 ) zwei reelle Lösungen des Systems z0 (t) = Az(t) gegeben. Alle Linearkombinationen w(t) = c1 x(t) + c2 y(t) sind für c1 , c2 ∈ R ebenfalls reellwertige Lösungen des Systems. 9.27 Beispiel Gesucht sind Lösung in R2 des Systems u01 (t) = au1 (t) − bu2 (t) (9.64) u02 (t) = bu1 (t) + au2 (t) welches in vektorieller Schreibweise ! a −b u(t) b a 0 u (t) = (9.65) ! lautet. Die Eigenwerte der Koeffizientenmatrix A = Wir berechnen den Eigenvektor z0 = ! a −b b a sind nach Beispiel 8.16 c) λ2 = a − ib. λ1 = a + ib e1 e2 a −b b a ! zum Eigenwert λ1 = a + ib. Es muss gelten e1 e2 ! ! e = (a + ib) 1 . e2 (9.66) Betrachten wir in dieser Gleichung die erste Koordinate, so erhalten wir ae1 − be2 = (a + ib)e1 . (9.67) Zu beachten ist hier, dass in (9.66) auf der linken Seite das Produkt “Matrix · Vektor” zu berechnen ist und auf der rechten Seite “Zahl · Vektor”. Aus (9.67) erhalten wir zunächst ! 1 −be2 = ibe1 , was, wenn man e1 = 1 wählt, e2 = −i ergibt. Der Eigenvektor ist also z0 = , −i 206 9 Gewöhnliche Differentialgleichungen in Real- und Imaginärteil zerlegt wird dieses zu ! 1 −i z0 = ! ! 1 0 +i 0 −1 = = x0 + iy0 . Nach der Formel aus Satz 9.26 erhalten wir die beiden reellwertigen Lösungen ! x(t) = e 1 0 cos(b t) − sin(b t) 0 −1 at cos(b t) sin(b t) = eat !! ! ! !! y(t) = e at 0 1 cos(b t) + sin(b t) −1 0 =e at sin(b t) − cos(b t) ! so dass die allgemeine reelle Lösung u(t) von (9.64) gegeben ist durch u(t) = c1 x(t) + c2 y(t) ! " =e at c1 !# cos(bt) sin(bt) + c2 sin(bt) − cos(bt) mit c1 , c2 ∈ R. Zu reellen Anfangswerten u0 = u01 u02 (9.68) ! lassen sich nun aus (9.68) c1 , c2 ∈ R bestimmen: ! u(0) = c1 1 0 + c2 0 −1 !! = c1 −c2 ! ! = u01 , u02 es ist also c1 = u01 und c2 = −u02 . 9.28 Folgerung Insbesondere weiß man nun, dass das System (9.58) bei reellen Koeffizienten und reellen Anfangswerten auch reellwertige Lösungen hat. 9.4.3 Nichtlineare Systeme, das Räuber-Beute-Modell Man betrachte die folgende Situation: Beobachtet wird eine Beutepopulation x(t) und eine Räuberpopulation y(t) von denen Geburten- und Sterberate gegeben sind durch b y(t) : Sterberate von x d : Sterberate von y a : Geburtenrate von x c x(t) : Geburtenrate von y 207 9 Gewöhnliche Differentialgleichungen Drückt man diese Kopplung in Differentialgleichungen aus, so erhält man das System x0 (t) = ax(t) − by(t)x(t) = (a − by(t))x(t) y 0 (t) = cx(t)y(t) − dy(t) = (cx(t) − d)y(t). (9.69) 9.29 Bemerkung Allgemein kann man ein System aus zwei Differentialgleichungen notieren durch x0 (t) = F1 (x(t), y(t)) (9.70) y 0 (t) = F2 (x(t), y(t)) oder kürzer mit z(t) = x(t) y(t) ! ! und F = F1 (x, y) F2 (x, y) durch z0 (t) = F(x, y). Hier ist z : R → R2 und F : R2 → R2 . Solche Systeme wie explizit zu lösen ist im Allgemeinen nicht möglich, daher ist man wieder an geometrischen Veranschaulichungen und qualitativen Aussagen über deren Lösungskurven (x(t), y(t)) interessiert. Zunächst lassen sich stationäre Punkte des Systems bestimmen. 9.30 Definition Ein!Punkt (xs , ys ) ∈ R2 , der Nullstelle der Funktion F : R2 → R2 ist, d.h. F(xs , ys ) = 0 ∈ R2 , heißt stationärer Punkt der Differentialgleichung (9.70), denn dann gilt für 0 ts ∈ R mit x(ts ) = xs und y(ts ) = ys ! x0 (ts ) y 0 (ts ) ! = F(xs , ys ) = 0 . 0 In dem System (9.69) ist (xs , ys ) mit xs = d c und ys = a b (9.71) stationärer Punkt, wie man durch Einsetzen leicht überprüft. Damit können wir (9.69) auch schreiben als x0 (t) = b(ys − y(t))x(t) y 0 (t) = c(x(t) − xs )y(t). (9.72) Ähnlich wie wir für eine gewöhnliche Differentialgleichung ein Richtungsfeld skizzieren konnten, können wir für ein System ein Vektorfeld zeichnen. Eine Lösungskurve (x(t), y(t)) von (9.70) bzw. (9.72) ist eine Kurve in der 2-dimensionalen (x, y)-Ebene. Auch wenn wir nicht wissen, wie die Kurve verläuft, so können wir doch mittels (9.70) oder (9.72) zu jedem Punktepaar 208 9 Gewöhnliche Differentialgleichungen (x, y) ∈ R2 die Änderungen (x0 (t), y 0 (t)) durch das Differentialgleichungssystem berechnen. Wenn wir also in jedem Punkt (x, y) den Vektor (x0 , y 0 ) “anheften”, so sehen wir in welche Richtung eine Lösungskurve durch den Punkt (x, y) verlaufen würde. Dem Räuber-BeuteSystem (9.72) entnehmen wir, dass 1. Für x = xs gilt: y0 = 0 0 ∀y∈R x >0 ∀ y < ys x0 = 0 ∀x∈R x0 < 0 ∀ y > ys . y0 < 0 ∀ x < xs . 2. Für y = ys gilt: 0 y >0 ∀ x > xs 3. Für x = 0 folgt x0 = 0 und y 0 < 0 und für y = 0 folgt y 0 = 0 und x0 > 0. Dieses lässt sich veranschaulichen in einem Phasendiagramm: y ys xs x Abbildung 9.9: Phasendiagramm des Räuber-Beute Systems (9.69) In der Abbildung 9.9 kann man sehen, dass Lösungskurven in einer Linksdrehung um den Punkt (xs , ys ) herum verlaufen. Da sich die Kurven nicht schneiden können, gibt es die Möglichkeiten, dass sich Lösungskurven von (9.72) für t → ∞ a) spiralförmig auf den stationären Punkt (xs , ys ) zubewegen. b) spiralförmig von dem stationären Punkt (xs , ys ) wegbewegen. c) den stationären Punkt auf geschlossenen Bahnen umlaufen. Um diese Frage zu klären, betrachen wir die Funktion G : R2 → R, welche definiert ist durch G(x, y) = b(ys ln(y) − y) + c(xs ln(x) − x) 209 (9.73) 9 Gewöhnliche Differentialgleichungen für x, y > 0. Es gilt der folgende Satz. 9.31 Satz Für die durch (9.73) definierte Funktion G(x, y) gilt i) lim G(x, y) = lim G(x, y) = lim G(x, y) = lim G(x, y) = −∞ x→0 y→0 x→∞ y→∞ ii) (xs , ys ) ist globales Maximum von G und es gibt keine weiteren lokalen Extremwerte. iii) Die Funktion G(x, y) ist konstant entlang von Lösungskurven von (9.72): G(x(t), y(t)) = G(x(0), y(0)) = const. wenn (x(t), y(t)) Lösung von (9.72) ist. Beweis. iii) Wir betrachten die Hilfsfunktion g(t) := G(x(t), y(t)) und zeigen, dass g 0 (t) = 0 wenn (x(t), y(t)) Lösung von (9.72) ist. Dann folgt die Behauptung. g 0 (t) = [b(ys ln y(t) − y(t)) + c(xs ln x(t) − x(t))]0 y 0 (t) x0 (t) − y 0 (t)) + c(xs − x0 (t)) y(t) x(t) xs ys − 1) + cx0 (t)( − 1) = by 0 (t)( y(t) x(t) ys xs = bc(x(t) − xs )y(t)( − 1) + bc(ys − y(t))x(t)( − 1) y(t) x(t) = bc(x(t) − xs )(ys − y(t)) + bc(ys − y(t))(xs − x(t)) = b(ys (∗) = 0, wobei in (∗) für x0 (t) und y 0 (t) jeweils die rechte Seite von (9.72) eingesetzt wurde. i) Die Grenzwerte folgen aus lim (ln x − x) = −∞, x→∞ lim (ln x − x) = −∞. x→0 ii) Hat die Funktion G(x, y) ein lokales Maximum, so muss sie auch ein lokales Maximum haben wenn man sie nur als eine Funktion von x bei festem y und umgekehrt betrachtet. Also müssen die partiellen Ableitungen von G, für die G nur als Funktion von x oder von y betrachtet wird, ∂G Null sein. Diese werden bezeichnet mit ∂G ∂x und ∂y . Es ist ∂G 1 (x, y) = c(xs − 1) ∂x x ∂G 1 (x, y) = b(ys − 1). ∂y y 210 9 Gewöhnliche Differentialgleichungen Man sieht sofort, dass ∂G ∂G (x, y) = 0 und (x, y) = 0 ⇐⇒ ∂x ∂y (x, y) = (xs , ys ). Da G(x, y) daher nur einen Extremwert haben kann, folgt zusammen mit Satz 9.31 ii), dass es ein globales Maximum sein muss. Aus den Aussagen von Satz (9.31) können wir folgern, dass die Lösungskurven (x(t),y(t)) von (9.72) als Höhenlinien der Funktion G interpretiert werden können. Da G genau ein Maximum hat, also nur eine “Bergspitze” und keine “Nebengipfel”, müssen diese Höhenlinien geschlossene Kurven rund um die Bergspitze sein. Wir können also folgern, dass Fall c) eintritt, die Lösungskurven verlaufen auf geschlossenen Bahnen um den stationären Punkt (xs , ys ), die Fälle a) und b) können nicht eintreten. y ymax ys ymin xmin xs xmax x Abbildung 9.10: Lösungskurven des Räuber-Beute Modells (9.69) Die Interpretation ergibt also i) x(t) und y(t) schwanken periodisch. ii) Auf ein Maximum von y(t) folgt ein Minimum von x(t). iii) Auf ein Minimum von x(t) folgt ein Minimum von y(t). iv) Auf ein Minimum von y(t) folgt ein Maximum von x(t). v) Auf ein Maximum von x(t) folgt ein Maximum y(t). Ist T > 0 die unbekannte Periode der Lösungskurven x(t), y(t), so können die Mittelwerte x̄ 211 9 Gewöhnliche Differentialgleichungen und ȳ berechnet werden: 1 x̄ := T ZT 1 ȳ := T x(t)dt 0 ZT y(t)dt. (9.74) 0 Aus der 1.Gleichung von (9.72) folgt ⇐⇒ x0 (t) = b(ys − y(t)) x(t) (ln x(t))0 = b(ys − y(t)) ⇐⇒ ln(x(T )) − ln(x(0)) = b ZT (ys − y(t))dt 0 = b(ys T − ZT y(t)dt). (9.75) 0 Wegen der Periodizität ist x(T ) = x(0), sodass ln x(T ) − ln x(0) = 0 ist und aus (9.75) folgt 1 ys = T ZT y(t)dt, 0 sodass aus (9.74) folgt, dass ȳ = ys . Mit der 2. Gleichung von (9.72) zeigt man genauso, dass x̄ = xs . Für jede Lösungskurve des Räuber-Beute-Modells (9.72) folgt also, dass die Mittelwerte x̄, ȳ der Beute- und Räuberpopulation gegeben sind durch x̄ = xs = d c ȳ = ys = 212 a . b