Mathematik für Chemiker Vorlesungsskript Winter 2000/2001 und Sommer 2001 Achim Klenke Mathematisches Institut Johannes-Gutenberg Universität Mainz Staudingerweg 9 55099 Mainz Germany 2 Inhaltsverzeichnis Inhaltsverzeichnis Vorwort 7 1 Zahlen 9 1.1 Reelle Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 1.2 Reelle Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 1.3 Komplexe Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 1.4 Gauß’sche Zahlenebene . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 1.5 Funktionen auf C . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 1.6 Komplexe Exponentialfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 1.7 Wurzeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 1.8 Quadratische Gleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 1.9 Fundamentalsatz der Algebra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 2 3 4 Abbildungen 27 2.1 Allgemeines . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 2.2 Umkehrabbildung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 2.3 Reelle Funktionen einer Veränderlichen . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 2.4 Reelle Funktionen mehrerer Veränderlicher . . . . . . . . . . . . . . . . . . . . . . . . . 35 2.5 Vektorwertige Funktionen einer Veränderlichen . . . . . . . . . . . . . . . . . . . . . . . 37 Stetige Funktionen und Grenzwerte 41 3.1 Definition und Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 3.2 Zusammensetzungen stetiger Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 3.3 Zwischenwertsatz und Intervallschachtelung . . . . . . . . . . . . . . . . . . . . . . . . . 44 3.4 Grenzwerte von Zahlenfolgen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46 3.5 Grenzwerte von Funktionen 48 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Differentialrechnung von Funktionen einer Variablen 3 53 4 5 6 7 8 Inhaltsverzeichnis 4.1 Einführung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 4.2 Ableitungen einiger wichtiger Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . 56 4.3 Rechenregeln für Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57 4.4 Zwei Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 4.5 Die de L’Hospital’sche Regel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 4.6 Höhere Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 Kurvendiskussion von Funktionen einer Variablen 63 5.1 Extremalstellen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 5.2 Monotonie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 5.3 Bestimmung der Extremalstellen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 5.4 Krümmung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 5.5 Programm: Kurvendiskussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72 Potenzreihen 77 6.1 Taylorpolynome . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 6.2 Taylorreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 6.3 Ausblick: komplexe Argumente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86 Integration von Funktionen einer Variablen 89 7.1 Definition des Integrals . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 7.2 Hauptsatz der Differential- und Integralrechnung . . . . . . . . . . . . . . . . . . . . . . 91 7.3 Berechnung von Integralen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93 7.4 Uneigentliche Integrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 7.5 Komplexe Integranden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101 7.6 Partialbruchzerlegung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102 7.7 Wichtige Ungleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 Gewöhnliche Differentialgleichungen 109 8.1 Allgemeines . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109 8.2 Lösungsverfahren für DGL’en 1. Ordnung . . . . . . . . . . . . . . . . . . . . . . . . . . 111 8.2.1 Geometrische Interpretation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 8.2.2 Lösbarkeit und Eindeutigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112 8.2.3 Trennung der Variablen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112 8.2.4 Exakte Differentialgleichung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115 8.2.5 Integrierender Faktor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117 8.2.6 Lineare Differentialgleichung 1. Ordnung . . . . . . . . . . . . . . . . . . . . . . 118 Inhaltsverzeichnis 8.3 9 Lineare Differentialgleichung 2. Ordnung . . . . . . . . . . . . . . . . . . . . . . . . . . 119 Vektorräume und Grundlagen der Analytischen Geometrie 9.1 9.3 9.4 127 Vektorräume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127 9.1.1 9.2 5 Lineare Unabhängigkeit, Erzeugendensystem, Basis . . . . . . . . . . . . . . . . 129 Skalarprodukt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132 9.2.1 Grundlegendes zum Skalarprodukt . . . . . . . . . . . . . . . . . . . . . . . . . . 132 9.2.2 Orthogonalität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134 9.2.3 Zerlegung in parallelen und orthogonalen Anteil . . . . . . . . . . . . . . . . . . 136 Drehung in der Ebene und Vektorprodukt . . . . . . . . . . . . . . . . . . . . . . . . . . 137 9.3.1 Eine Spezialität der ebenen Geometrie . . . . . . . . . . . . . . . . . . . . . . . . 137 9.3.2 Eine Spezialität des dreidimensionalen Raums: Das Vektorprodukt . . . . . . . . . 138 9.3.3 Das Spatprodukt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139 Geraden und Ebenen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140 9.4.1 Parametrische und baryzentrische Darstellung . . . . . . . . . . . . . . . . . . . . 140 9.4.2 Hesse’sche Normalform . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142 10 Matrizen und lineare Abbildungen 147 10.1 Grundlegendes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147 10.2 Invertierbare Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150 10.3 Gauß Verfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151 10.4 Lineare Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154 10.5 Spezielle Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158 10.6 Basiswechsel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159 10.7 Lineare Gleichungssysteme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161 11 Eigenwerte und Determinanten 167 11.1 Determinanten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167 11.2 Eigenwerte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169 11.3 Der Quantenmechanische Harmonische Oszillator . . . . . . . . . . . . . . . . . . . . . . 175 12 Lineare Differentialgleichungen mit konstanten Koeffizienten 177 12.1 Systeme erster Ordnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177 12.2 Gleichungen höherer Ordnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182 13 Differentialrechnung von Funktionen mehrerer Veränderlicher 187 13.1 Partielle Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187 6 Inhaltsverzeichnis 13.2 Höhere partielle Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190 13.3 Extremalstellen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193 13.4 Anwendung: Lineare Regression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195 13.5 Vektorfelder . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 196 13.6 Rotation und Divergenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199 13.7 Implizite Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 200 14 Mehrdimensionale Integration 203 14.1 Volumenintegrale in der Ebene . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203 14.2 Volumenintegrale in höheren Dimensionen . . . . . . . . . . . . . . . . . . . . . . . . . . 208 14.3 Kurvenintegrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212 14.4 Oberflächenintegrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219 14.4.1 Der Quader . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219 14.4.2 Der Zylinder . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 222 14.4.3 Die Kugel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 224 14.4.4 Der Gauß’sche Integralsatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 225 15 Appendix: Alternativer Zugang zu Linearen Differentialgleichungen 227 15.1 Systeme erster Ordnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227 15.1.1 Lösung der homogenen linearen Differentialgleichung y’=A y . . . . . . . . . . . 230 15.1.2 Die inhomogene lineare Differentialgleichung y’=A y+b . . . . . . . . . . . . . . 233 15.2 Lineare Differentialgleichung en höherer Ordnung mit konstanten Koeffizienten . . . . . . 235 15.2.1 Die homogene Differentialgleichung . . . . . . . . . . . . . . . . . . . . . . . . . 236 15.2.2 Die homogene lineare Differenzialgleichung 2. Ordnung . . . . . . . . . . . . . . 237 15.2.3 Die inhomogene Differentialgleichung höherer Ordnung . . . . . . . . . . . . . . 242 Schlagwortverzeichnis 244 Vorwort Dieses Skript ist entstanden als Vorlesungsskript zu der dreistündigen zweisemestrigen Vorlesung Mathematik für Chemiker, die ich im Wintersemester 2000/2001 und im Sommersemester 2001 an der Friedrich Alexander Universität Erlangen-Nürnberg gehalten habe. Herr Kollege Jörn Lembcke aus Erlangen hat etliche Fehler dieses Skriptes ausmerzen geholfen. Außerdem hat er einen alternativen Zugang zu dem Matrizenkalkül, mit dem ich die linearen Differentialgleichungen behandelt habe, geliefert. Dieser Zugang ist als Anhang diesem Skript angefügt. Vielen Dank an Herrn Lembcke für die gründliche Durchsicht und die Verbeserungsvorschläge für dieses Skript! Mainz, 27.August 2004. Achim Klenke. 7 8 INHALTSVERZEICHNIS Kapitel 1 Zahlen Die Relevanz der Zahlen in den Naturwissenschaften muss an dieser Stelle nicht erläutert werden. Dieses Kapitel stellt die grundlegenden Zahlbegriffe der natürlichen, ganzen, rationalen und reellen Zahlen gestrafft dar und führt dann die komplexen Zahlen ein. Zu diesem Zweck wird zunächst noch eine Übersicht über die Exponentialfunktion sowie die Winkelfunktionen gegeben. 1.1 Reelle Zahlen Natürliche Zahlen Die Menge der natürlichen Zahlen wird mit N = {1, 2, 3, . . .} (1.1) bezeichnet. Die heute übliche positionelle Dezimalschreibweise“ entstand zwischen 300 v.Chr. und 600 ” n.Chr. in Indien. Die arabischen Rechentechniken gelangten im späten Mittelalter zum Beispiel über die Rechenbücher Adam Rieses nach Europa. Die Null wird als eigenständige, nützliche Größe erstmals 600 n.Chr. in Indien beschrieben. Die Menge der natürlichen Zahlen mit Null wird mit N0 = {0, 1, 2, 3, . . .} (1.2) bezeichnet. Operationen: Addition (+) und Multiplikation (·). Ganze Zahlen Mit Z = {0, −1, 1, −2, 2, . . .} (1.3) wird die Menge der ganzen Zahlen bezeichnet. Operationen: +, −, ·. Die ganzen Zahlen wurden seit dem späten Mittelalter in Europa als nützliche Größen anerkannt. Obwohl 9 10 Zahlen negative Zahlen keinen direkten Bezug zum Zählen realer Objekte haben, sind sie aus konzeptionellen Gründen hilfreich. So möchte man beispielsweise in dem Ausdruck (3 + 5) − 7 = 3 + (5 − 7) = 1 auch den Ausdruck (5 − 7) sinnvoll erklären und benötigt – zumindest als Zwischenergebnis der Rechnung – den Begriff 5 − 7 = −2. Die Mathematik stellt nicht die Frage danach, ob es die negativen Zahlen wirklich gibt“, sondern nur, ” (1) ob man einen konsistenten Kalkül aufbauen kann, (2) ob dieser Kalkül nützlich ist. Auf die Nützlichkeit muss der Leser zunächst vertrauen. Die Konsistenz wird in den Sätzen gezeigt und in den Übungen der praktische Umgang mit dem Kalkül gelernt. Rationale Zahlen (Brüche) Die Menge der rationalen Zahlen wird mit Q= p , p ∈ Z, q ∈ N . . . q (1.4) bezeichnet. Operationen: +, −, ·, ÷. Die (positiven) rationalen Zahlen sind schon im klassischen Griechenland geläufig – vor allem als Verhältnisgrößen in der Geometrie. Sie drücken Verhältnisse ganzer Zahlen aus, wie sie zum Beispiel auch in der Stöchiometrie auftreten. Reelle Zahlen Die Menge der reellen Zahlen ist die Menge der Zahlen mit unendlicher Dezimalentwicklung o n a2 a1 + . . . , mit a1 , a2 , . . . ∈ {0, 1, . . . , 9} R = k + r : k ∈ Z, r = 0, a1 a2 a3 . . . = 10 100 (1.5) Anschaulich ist R die Menge der Punkte auf der Zahlengeraden R0 Beispiele: 0,3,− 32 , √ 2, π, e. Dabei bezeichnet π = 3.1415 . . . die Kreiszahl und e = 2.7182 . . . die Euler’sche Zahl (nach Leonhard Euler (1707–1783)). Reelle Zahlen drücken kontinuierliche Größen aus. Das Konzept soll hier nicht mathematisch fundiert werden. Stattdessen wird an die Anschauung und an das Schulwissen appelliert. Satz 1.1 Brüche sind genau diejenigen reellen Zahlen, deren Dezimalentwicklung schließlich periodisch wird. 1.1 11 Reelle Zahlen Beispiel: 5.37614 614 614 . . . = 537 614 537 077 + = . 100 99 900 99 900 Die Zahlen, die reell sind, aber nicht rational, heißen irrational √ Beispiele: 2, π, 0.10 110 1110 11110 . . . sind irrational. √ Für e und π ist das etwas schwieriger nachzuweisen. Für 2 ist der Beweis nicht √ so schwer: Wir nehmen das Gegenteil an und führen dies zum Widerspruch. Wir nehmen also an, dass 2 = pq ist für teilerfremde p, q ∈ N. Die Teilerfremdheit heißt gerade, dass der Bruch gekürzt ist. Dann sind aber auch p2 und q 2 2 teilerfremd, also ist 2 = pq2 ein gekürzter Bruch und damit q = 1 und p2 = 2. Nun ist aber 12 = 1 und n2 ≥ 4 für alle n = 2, 3, 4, . . .. Damit ist die Annahme ad absurdum geführt und die Aussage bewiesen. Für die bisher eingeführten Zahlen gilt die Inklusionskette N ⊂ N0 ⊂ Z ⊂ Q ⊂ R. (1.6) Außerdem gelten die folgenden Rechenregeln: (1) Assoziativgesetz a + (b + c) = (a + b) + c und a · (b · c) = (a · b) · c. (2) Distributivgesetz a · (b + c) = (a · b) + a · c. (3) Kommutativgesetz a·b=b·a (4) Vollständigkeit a − b ist stets lösbar, und a b a + b = b + a. und ist lösbar, falls b 6= 0. Auf den reellen Zahlen ist eine Ordnung erklärt: x < y heißt, dass x kleiner als y ist, also weiter links auf dem Zahlenstrahl liegt. Wir schreiben x ≤ y, falls x < y oder x = y. Der Absolutbetrag einer reellen Zahl x ist definiert durch ( x, falls x ≥ 0, |x| = −x, falls x < 0. (1.7) Zusammenhängende Teilmengen der reellen Zahlen heißen Intervalle. Für Intervalle sind die folgenden Schreibweisen gebräuchlich: [a, b] = {x ∈ R : [a, b) = {x ∈ R : (a, b] = {x ∈ R : (a, b) = {x ∈ R : a ≤ x ≤ b} a ≤ x < b} a < x ≤ b} a < x < b} abgeschlossenes Intervall, rechtsoffenes Intervall, linksoffenes Intervall, offenes Intervall Ebenfalls gebräuchlich ist die Schreibweise [a, ∞) = {x ∈ R : a ≤ x}, (−∞, b] = {x ∈ R : x ≤ b}, R+ = [0, ∞), 12 Zahlen und analog (a, ∞) und (−∞, b). Manche Autoren, insbesondere in der deutschsprachigen Literatur, benutzen die Schreibweise mit umgedrehten eckigen Klammern, statt der runden, für offene Intervalle: [a, b[= [a, b) u.s.w. 1.2 Reelle Funktionen Definition 1.2 Ist D ⊂ R, so heißt eine Vorschrift f : D → R, x 7→ f (x), die jedem x ∈ D genau ein f (x) ∈ R zuordnet eine reelle oder reellwertige Funktion auf D. Wenn keine Unklarheiten entstehen können, sagt man auch nur kurz, dass f eine Funktion auf D ist. Die Menge D heißt der Definitionsbereich von f und die Menge der Werte, die tatsächlich von f angenommen werden, heißt der Wertebereich oder das Bild von f . Hier ein paar wichtige Beispiele. Algebraische Funktionen auf R Polynome x 7→ f (x) = a1 x + a0 , linear, 2 x 7→ f (x) = a2 x + a1 x + a0 , quadratisch, n x 7→ f (x) = an x + . . . + a1 x + a0 , Polynom vom Grad n, falls an 6= 0. Rationale Funktionen Sind P, Q Polynome und D = {x ∈ R : Q(x) 6= 0}, so können wir auf D eine Funktion erklären durch x 7→ f (x) = P (x) . Q(x) f heißt rationale Funktion. Wurzeln Schließlich zählen noch die (nichtnegativen) Wurzelfunktionen zu den algebraischen Funktionen, also die √ x und für natürliche Zahlen n ∈ N die n-te Wurzel [0, ∞) → R, Quadratwurzel [0, ∞) → R, x → 7 √ x 7→ n x. Jede endliche Kombination von Addition, Subtraktion, Multiplikation, Division oder Hintereinanderausführung von algebraischen Funktionen nennen wir auch wieder eine algebraische Funktion, also zum Beispiel √ 3 x4 + 1 p [0, ∞) → R, x 7→ − . √ x + 1 1 + 6 x2 + x5 + x3 Transzendente Funktionen auf R Transzendente Funktionen sind solche Funktionen, die nicht durch endliches Hintereinanderschalten von Addition, Multiplikation und Division, sowie von Wurzelfunktionen entstehen. Wichtige Beispiele, die 1.2 13 Reelle Funktionen 1 sin(x) tan(x) x cos(x) 1 schon aus der Schule bekannt sind, sind Exponential- und Logarithmusfunktion, sowie die Winkelfunktionen, ferner deren Umkehrfunktionen. Exponentialfunktion. exp(x) = ex , wobei e = 2.7182 . . . die Euler’sche Zahl ist. Der Wertebereich ist (0, ∞). Es gelten die wichtigen Rechenregeln: exp(0) = 1, exp(1) = e, exp(x + y) = exp(x) · exp(y). Diese Eigenschaften (und, genau genommen, die Stetigkeit, die wir später noch kennen lernen werden) bestimmen die Exponentialfunktion schon eindeutig. Logarithmusfunktion. Der Logarithmus ist die Umkehrfunktion der Exponentialfunktion. Das heißt, sein Definitionsbereich ist (0, ∞) und es gilt für jedes x ∈ (0, ∞): exp(log(x)) = x. Dadurch ist der Logarithmus implizit definiert. Es gelten die einfachen Regeln: log(1) = 0, log(e) = 1, log(x · y) = log(x) + log(y). Achtung: Der hier betrachtete Logarithmus ist immer der natürliche Logarithmus, den manche Autoren mit ln bezeichnen. Winkelfunktionen. Die Winkelfunktionen Sinus, Cosinus und Tangens können als (eventuell negativ gemessene) Längen in einem Dreieck im Einheitskreis mit gegebenem Winkel definiert werden. Dabei messen wir stets den Winkel im Bogenmaß, der Bereich der Winkel erstreckt sich also über [0, 2π) und nicht über [0◦ , 360◦ ). Eigenschaften Für jedes x ∈ R ist 14 Zahlen für jedes k ∈ Z, für jedes k ∈ Z, sin(x) = sin(x + 2πk) cos(x) = cos(x + 2πk) sin(x) = − sin(−x), cos(x) = cos(−x), π cos(x) = sin x + 2 o n sin(x) 1 tan(x) = π: k∈Z für jedes x 6∈ k+ cos(x) 2 (1.8) sin(x)2 + cos(x)2 = 1 (Pythagoras). Additionstheoreme. Für beliebige x, y ∈ R ist sin(x + y) = sin(x) cos(y) + sin(y) cos(x), cos(x + y) = cos(x) cos(y) − sin(x) sin(y). (1.9) 2 1 –8 –6 –4 –2 0 2 –1 –2 sin(x) cos(x) tan(x) 4 x 6 8 1.3 15 Komplexe Zahlen Man erhält durch einfache geometrische Überlegungen die folgende Tabelle mit einigen Werten der Sinusund Kosinusfunktion. x 0 π 6 π 4 π 3 π 2 2π 3 3π 4 5π 6 π 360◦ 2π 0◦ 30◦ 45◦ 60◦ 90◦ 120◦ 135◦ 150◦ 180◦ sin(x) 0 cos(x) 1 1 2 √ 1 3 2 1√ 2 2 1√ 2 2 1√ 3 2 1 2 1√ 3 2 1 − 2 1√ 2 2 1√ − 2 2 1 2 1√ − 3 2 x· 1.3 1 0 0 −1 Komplexe Zahlen Wenn wir einen Blick auf den Graphen der Funktion f (x) = x2 − 2 werfen, sehen wir, dass f (1) = −1 ist und f (2) = 2 sowie, dass es dazwischen einen Punkt x geben muss, für den f (x) = 0 ist. Was hier sofort einsichtig ist, hat die Einführung der reellen Zahlen erzwungen, weil wir wissen, dass ein solches x keine rationale Zahl sein kann. Wir mussten die rationalen Zahlen vervollständigen. Werfen wir einen Blick auf den Graphen der Funktion f (x) = x2 + 1, so vermissen wir sicherlich für das Erste keine Zahl mit der Eigenschaft f (x) = 0. Es ist jedoch für den Kalkül extrem nützlich, eine solche Zahl zu haben. Der geneigte Leser wird dies im Laufe seines Studiums noch einsehen. Im folgenden führen wir die neue Klasse der komplexen Zahlen ein, innerhalb der jede quadratische Gleichung auflösbar ist. Definition 1.3 Wir führen eine neue Zahl i ein, mit der Rechenregel i2 = −1. Wir nennen i die imaginäre Einheit Die Menge der komplexen Zahlen ist C = {z = u + v · i : u, v ∈ R}. Für z = u + v · i nennen wir Re(z) = u den Realteil und Im(z) = v den Imaginärteil von z. Auf C gelten die Rechenregeln (a + b · i) + (u + v · i) = (a + u) + (b + v) · i (a + b · i) · (u + v · i) = av + bu · i + av · i + bv · |{z} i2 (1.10) =−1 = (au − bv) + (bu + av) · i. Grob gesagt gelten für die Zahlen in C die üblichen Rechenregeln (Assoziativ-,Distributiv- und Kommu- 16 Zahlen tativgesetz) sowie die Extraregel, dass an jeder Stelle i2 durch −1 ersetzt werden kann und −1 durch i2 . 2 Beispielsweise ist 1i = − ii = −i und allgemeiner 1 u−v·i u−v·i , = = 2 u+v·i (u + v · i)(u − v · i) u + v2 falls u2 + v 2 > 0. Definition 1.4 Ist z = u + v · i ∈ C, so heißt z̄ = u − v · i die (komplex) konjugierte Zahl von z. Die Zahl p √ |z| = u2 + v 2 = z z̄ ≥ 0 heißt Betrag von z. Man bemerke, dass also, falls z2 6= 0 z1 z1 z̄2 . = z2 |z2 |2 (1.11) Insbesondere kann man in C also dividieren. Lemma 1.5 Die komplexe Konjugation hat folgende einfache Regeln. (i) z̄¯ = z (ii) z = z̄ genau dann, wenn z reell ist, also Im(z) = 0. (iii) Re(z) = z − z̄ z + z̄ und Im(z) = . 2 2i (iv) z1 + z2 = z̄1 + z̄2 und z1 · z2 = z̄1 · z̄2 . Beweis (i) und (ii) sind klar. z + z̄ Re(z) + i Im(z) + Re(z) − i Im(z) (iii) = = Re(z). 2 2 Re(z) + i Im(z) − Re(z) + i Im(z) z − z̄ = = Im(z). (iv) 2i 2i 2 Offenbar ist jede komplexe Zahl z mit Im(z) = 0 eine reelle Zahl und die Rechenregeln sind konsistent mit denen auf R. Die komplexen Zahlen sind also eine Verallgemeinerung der reellen Zahlen. 1.4 Gauß’sche Zahlenebene Die größte Schwierigkeit, die wir haben, wenn wir uns die komplexen Zahlen vorstellen wollen, rührt daher, dass wir sie nicht in der Zahlengeraden eintragen können. Diese ist ja schon mit den reellen Zahlen ausgeschöpft. Abhilfe schafft hier die Gauß’sche Zahlenebene: Wir tragen die komplexe Zahl z = u + v · i in ein ebenes Diagramm ein; den Realteil u nach rechts und den Imaginärteil v nach oben. 1.4 17 Gauß’sche Zahlenebene vi z=u+vi i −1 u 1 −i Aus dieser Darstellung wird sofort klar, dass der Betrag einer komplexen Zahl nichts anderes ist, als der Abstand vom Ursprung (Satz von Pythagoras). Die Addition von komplexen Zahlen wird zur Vektoraddition: z1+z 2 z1 i z2 −1 1 −i Aus dem Diagramm ist sofort ersichtlich, dass für den Betrag komplexer Zahlen die Dreiecksungleichung gilt. Satz 1.6 (Dreiecksungleichung) Sind z1 , z2 ∈ C, so gilt |z1 + z2 | ≤ |z1 | + |z2 |. Beweis Der etwas längliche Beweis wird hier ausgelassen. Stattdessen wird auf das Diagramm verwiesen. 2 18 Zahlen Statt eine Zahl z durch Real- und Imaginärteil anzugeben, kann man sie auch durch den Abstand |z| vom Ursprung und den Winkel arg(z) gegenüber der Abszisse (vulgo: x–Achse) bestimmen. Da der Winkel zunächst nur bis auf ganzzahlige Vielfache von 2π bestimmt ist, wollen wir festlegen, dass stets arg(z) ∈ (−π, π]. Wir haben also für Zahlen mit positivem Imaginärteil positive Winkel und für Zahlen mit negativem Imaginärteil negative Winkel. Ist z = 0, so kann man natürlich keinen Winkel angeben. Wir wollen dann der Einfachheit halber arg(0) = 0 setzen. z i |z| arg(z) −1 1 −i Klar ist, dass wir arg(z) als diejenige Zahl in (−π, π] definiert haben mit der Eigenschaft Re(z) = |z| cos(arg(z)) Im(z) = |z| sin(arg(z)). (1.12) An dieser Stelle kann man bemerken, dass die komplexe Konjugation das Vorzeichen der Argumentes ändert. Komplexe Konjugation entspricht also in der Zahlenebene der Spiegelung an der waagerechten Achse. Für alle z ∈ C, die nicht auf der negativen reellen Achse liegen (warum nur solche?), gilt daher: arg(z̄) = −arg(z). Satz 1.7 Sind z1 , z2 6= 0, so ist |z1 · z2 | = |z1 | · |z2 | arg(z1 · z2 ) = arg(z1 ) + arg(z2 ) (mod 2π). Wir benutzen die Schreibweise (mod 2π)“ um anzudeuten, dass die rechte Seite von der linken um ganz” zahlige Vielfache von 2π abweichen kann. Zum Beispiel ist (−i) · (−i) = −1 und arg(−1) = π sowie arg(−i) = −π/2. Also ist arg(−1) = 2arg(−i) + 2π. 1.5 19 Funktionen auf C vi z=u+vi i u −1 1 −i −vi z=u−vi Komplexe Konjugation durch Spiegelung an der reellen Achse Beweis (i) q (z1 z2 ) · (z1 z2 ) p = (z1 z̄1 ) · (z2 z̄2 ) p = |z1 |2 · |z2 |2 = |z1 | · |z2 |. |z1 · z2 | = (ii) Sei ϕ1 = arg(z1 ) und ϕ2 = arg(z2 ). Sei ferner z3 = u + v · i definiert durch u = |z1 | · |z2 | · cos(ϕ1 + ϕ2 ) v = |z1 | · |z2 | · sin(ϕ1 + ϕ2 ). Offenbar ist |z3 | = |z1 | · |z2 | und arg(z3 ) = arg(z1 ) + arg(z2 )(mod 2π). Wir müssen zeigen, dass z3 = z1 · z2 gilt. In der Tat gilt nach den Additionstheoremen für die Winkelfunktionen u = |z1 | · |z2 | · [cos(ϕ1 ) cos(ϕ2 ) − sin(ϕ1 ) sin(ϕ2 )] = Re(z1 )Re(z2 ) − Im(z1 )Im(z2 ) = Re(z1 · z2 ), v = |z1 | · |z2 | · [sin(ϕ1 ) cos(ϕ2 ) + cos(ϕ1 ) sin(ϕ2 )] = Re(z1 )Im(z2 ) + Im(z1 )Re(z2 ) = Im(z1 · z2 ). Damit ist der Beweis erbracht. 1.5 2 Funktionen auf C Bisher haben wir die Grundrechenarten als Operationen auf C kennen gelernt. Jetzt wollen wir, ähnlich dem Vorgehen für die reellen Zahlen, auch Abbildungen aus den komplexen Zahlen heraus, bzw. mit Werten in den komplexen Zahlen betrachten. 20 Zahlen Definition 1.8 (Komplexe Funktion) Ist D ⊂ C, so heißt eine Vorschrift f : D → C, (beziehungsweise D → R) z 7→ f (z), die jedem x ∈ D genau ein f (z) ∈ C (beziehungsweise in R) zuordnet eine komplexwertige, oder komplexe, Funktion auf D (beziehungsweise reelle oder reellwertige Funktion auf D). Die Menge D heißt der Definitionsbereich von f und die Menge der Werte, die von f tatsächlich angenommen werden, heißt Bild von f . Beispiele 1.9 1. Wie für die reellen Zahlen lassen sich auch für die komplexen Zahlen durch die Grundrechenarten die so genannten rationalen Funktionen definieren. Wir nehmen an, dass n ∈ N0 ist, und a0 , a1 , . . . , an ∈ C. Ist n ≥ 1, so wollen wir auch an 6= 0 annehmen. Dann wird durch f : C → C, z 7→ f (z) = an z n + an−1 z n−1 + . . . a1 z + a0 eine komplexe Funktion auf ganz C definiert. f heißt Polynom n-ten Grades und konstant, linear, quadratisch, kubisch, falls n = 0, falls n = 1, falls n = 2, falls n = 3. Für n ≥ 4 gibt es keine speziellen Namen für f . 2. Sind P, Q Polynome und D = {z ∈ C : Q(z) 6= 0}, so können wir auf D eine Funktion erklären durch P (z) . z 7→ f (z) = Q(z) f heißt rationale Funktion. 3. Die komplexe Konjugation f : C → C, z 7→ f (z) = z̄ ist eine auf ganz C erklärte komplexe Funktion. 4. Die Funktionen z 7→ Re(z) und z 7→ Im(z) sind reellwertige Funktionen, die auf ganz C erklärt sind. 5. Die Funktion C → R, z 7→ |z| hat als Bild [0, ∞). 6. Ist D = C \ {0} = {z ∈ C : z 6= 0}, so ist arg : D → R eine reellwertige Funktion mit Bild (−π, π]. 1.6 Komplexe Exponentialfunktion Außer den algebraischen Funktionen, die nur die Grundrechenarten endlich oft miteinander verknüpfen, kann man auch viele der wichtigen transzendenten Funktionen auf C definieren. Mit Abstand am wichtigsten ist die komplexe Exponentialfunktion, die wir hier behandeln wollen. Die reelle Exponentialfunktion war durch die Funktionalgleichung exp(x + y) = exp(x) · exp(y) (1.13) sowie den Wert exp(1) = e = 2.7182 . . . gekennzeichnet. (Genau genommen: zusätzlich durch die Stetigkeit.) Wenn wir nun eine Exponentialfunktion auf C erklären wollen, so soll diese auf ganz C die Gleichung (1.13) erfüllen. 1.6 21 Komplexe Exponentialfunktion Wir definieren für reelle Zahlen ϕ: exp(iϕ) = cos(ϕ) + i sin(ϕ). (1.14) Die Gleichung heißt auch die Euler’sche Formel. Das heißt, für z ∈ C mit |z| = 1 und ϕ = arg(z) ist exp(iϕ) = z. Speziell ist stets | exp(iϕ)| = 1. Wir müssen prüfen, ob mit dieser Festsetzung die Funktionalgleichung (1.13) erfüllt ist. Seien z1 = exp(iϕ1 ), und z2 = exp(iϕ2 ). Nach Satz 1.7 ist arg(z1 · z2 ) = ϕ1 + ϕ2 (mod 2π), also exp(i(ϕ1 + ϕ2 )) = z1 · z2 = exp(iϕ1 ) · exp(iϕ2 ). (1.15) Wir wollen jetzt die Exponentialfunktion für alle z ∈ C erklären. Definition 1.10 Die komplexe Exponentialfunktion exp : C → C wird für z ∈ C definiert durch exp(z) = eRe(z) cos(Im(z)) + i sin(Im(z)) . Wir schreiben meist auch nur ez für exp(z). Die Gültigkeit der Funktionalgleichung hatten wir separat schon für den Imaginärteil und den Realteil nachgewiesen. Es ergeben sich also unmittelbar die folgenden Eigenschaften. Lemma 1.11 π (i) exp(0) = 1, exp(1) = e, exp(i ) = i, Im(exp(iϕ)) ≥ 0 für ϕ ∈ [0, π]. 2 (ii) exp(z1 + z2 ) = exp(z1 ) · exp(z2 ) für alle z1 , z2 ∈ C. (iii) exp(πi) = −1, exp(2πi) = 1. (iv) exp(iϕ) = exp(−iϕ), ϕ ∈ R. (v) | exp(z)| = exp(Re(z)). (vi) arg(exp(z)) = Im(z)(mod 2π). (vii) cos(ϕ) = Beweis e−iϕ +e−iϕ 2 und sin(ϕ) = e−iϕ −e−iϕ . 2i π π (i) Nach Definition ist exp( π2 i) = cos( ) +i sin( ) = i. Weiter ist der Imaginärteil Im(exp(iϕ)) = 2 | {z } | {z2 } =0 =1 sin(ϕ) ≥ 0, falls ϕ ∈ [0, π]. (ii) Nach Definition ist exp(z1 + z2 ) = eRe(z1 +z2 ) exp(i Im(z1 + z2 )) = eRe(z1 ) eRe(z2 ) exp(i Im(z1 )) exp(i Im(z2 )) = exp(z1 ) exp(z2 ). π π (iii) Man rechnet eπi = e 2 i e 2 i = i2 = −1 und e2πi = eπi eπi = 1. (iv) Nach der Definition von exp sowie den elementaren Eigenschaften der Winkelfunktionen (1.8) ist exp(iϕ) = cos(ϕ) − i sin(ϕ) = cos(−ϕ) + i sin(−ϕ) = exp(−iϕ). 22 Zahlen (v) Per definitionem ist | exp(z)| = | exp(Re(z)) exp(i Im(z))| = exp(Re(z)) | exp(i Im(z))| . | {z } =1 (vi) Nach Satz 1.7 ist arg(exp(z)) = arg(exp(Re(z))) +arg(exp(Im(z))) = Im(z) | {z } (mod 2π). =0 (vii) Nach Lemma 1.5 (iii) ist eiϕ + e−iϕ (iv) eiϕ + eiϕ def. = = Re(eiϕ ) = cos(ϕ) 2 2 eiϕ − e−iϕ (iv) eiϕ − eiϕ def. = = Im(eiϕ ) = sin(ϕ) 2i 2i 2 Korollar 1.12 Jede komplexe Zahl z kann geschrieben werden als z = reiϕ , r ≥ 0, ϕ ∈ (−π, π]. Ist z 6= 0, so die Darstellung eindeutig. In diesem Fall heißt die Darstellung von z die Darstellung in (Standard-)Polarkoordinaten. 1.7 Wurzeln Mit Hilfe der komplexen Exponentialfunktion können wir leicht die n-ten Wurzeln komplexer Zahlen bestimmen. Satz 1.13 (Einheitswurzeln) Sei n ∈ N. Die Gleichung wn = 1 besitzt genau n verschiedene Lösungen w1 , . . . , wn ∈ C. Diese werden die n-ten Einheitswurzeln genannt und sind gegeben durch 2πk wk = exp i , k = 1, . . . , n. n Beweis Offenbar ist wkn = exp(2πk · i) = 1. Außerdem ist klar, dass alle wk unterschiedliche Zahlen sind, weil die Argumente alle unterschiedlich sind. Um auszuschließen, dass es weitere Zahlen w gibt, die wn = 1 lösen, nehmen wir an, dass w eine solche Zahl ist. Wegen 1 = |wn | = |w|n ist |w| = 1. Außerdem ist narg(w) = l · 2π für ein l ∈ Z, also 2 arg(w) = nl 2π für ein l ∈ Z. Damit ist w = exp 2πl n i also gleich einem der wk . Korollar 1.14 Für jede Zahl z ∈ C, z 6= 0 gibt es genau n unterschiedliche Zahlen s1 , . . . , sn ∈ C mit sn1 = . . . = snn = z. Diese Zahlen heißen die n-ten Wurzeln von z. Ist z = r exp(iϕ), so kann man setzen ϕ √ 2πk sk = n r exp i exp i . n n 1.8 23 Quadratische Gleichungen Die Situation, dass der Wert der Quadratwurzel nur bis auf Vorzeichen eindeutig ist, kennen wir schon von √ den reellen Zahlen. Dort hatte man sich geeinigt, dass für x ∈ [0, ∞) das Symbol x stets die positive Wurzel von x bezeichnet. Jetzt müssen wir eine der n Wurzeln einer komplexen Zahl z auszeichnen. Wir nehmen diejenige Zahl, deren Winkel gerade ein ntel des Winkels von z ist. Dies ist ein ganz willkürliche Festlegung, die aber für die reellen Zahlen mit der bekannten nten Wurzel übereinstimmt. Definition 1.15 Ist z ∈ C und n ∈ N, so heißt die Zahl √ n z := p n |z| exp arg(z) i n der Hauptwert der n-ten Wurzel von z. Ist n = 2, so schreiben wir auch √ z= √ 2 z. Beispiele: (i) Für z mit Im(z) = 0 und Re(z) ≥ 0 ist der Hauptwert der n-ten Wurzel genau die bekannte n-te Wurzel. √ √ √ (ii) Für z mit Im(z) = 0 und Re(z) ≤ 0 ist z = i −z. Beispielsweise ist −9 = 3i. √ √ (iii) i = exp( π4 i) = 12 2(1 + i). (Nachrechnen!) p √ √ 4 (iv) −8 − 8 3 i = 3 − i (Nachrechnen!) 1.8 Quadratische Gleichungen Wir betrachten die quadratische Funktion f : C → C f (x) = x2 + ax + b, wobei a, b ∈ C. Durch quadratische Ergänzung können wir für die Gleichung f (x) = 0 (1.16) die beiden Lösungen angeben a 1√ x1,2 = − ± ∆, (1.17) 2 2 wobei die Diskriminante ∆ ∈ C definiert ist durch ∆ = a2 − 4b. Die Zahlen x1 und x2 heißen die Nullstellen von f . Man rechnet direkt nach, dass dann f (x) = (x − x1 )(x − x2 ), x ∈ C. (1.18) Wir sagen, dass x − x1 und x − x2 die Linearfaktoren von f sind. Aus (1.18) ist außerdem unmittelbar klar, dass f (x) 6= 0, falls x 6= x1 und x 6= x2 , weil dann beide Linearfaktoren ungleich Null sind. Es gibt also keine weiteren Lösungen von (1.16). Sind die Koeffizienten a und b reell, so ist auch ∆ ∈ R und man kann drei Fälle unterscheiden. Satz 1.16 Sind a und b reell, so tritt genau einer der drei Fälle auf: (i) ∆ = 0: x1 und x2 sind reell und x1 = x2 . (ii) ∆ > 0: x1 und x2 sind reell und x1 6= x2 . (iii) ∆ < 0: x1 6= x2 und beide Nullstellen sind komplex konjugiert, d.h. x1 = x̄2 . Im ersten Fall heißt x1 eine doppelte Nullstelle. In den anderen Fällen heißen die Nullstellen einfach. 24 Zahlen Beweis (i) Ist ∆ = 0, so ist x1 = x2 = − a2 ∈ R. √ (ii) Ist ∆ > 0, so ist ∆ > 0 reell. √ √ (iii) Ist ∆ < 0, so ist x1 = − a2 + i 12 −∆, = − a2 − i 12 −∆ = x̄2 . 2 Beispiele: (i) f (x) = x2 − 2x + 1 = (x − 1)2 , ∆ = 0. (ii) f (x) = x2 − 3x + 2 = (x − 1)(x − 2), ∆ = 1. (iii) f (x) = x2 + 2x + 2 = (x − (−1 + i))(x − (−1 − i)), ∆ = −4. 1.9 Fundamentalsatz der Algebra An dieser Stelle mag es für die meisten praktischen Anwendungen genug sein mit den komplexen Zahlen. Jedoch bleibt vielleicht bei dem Leser eine gewisse Unsicherheit zurück: Wir hatten neue Zahlen (die reellen) einführen müssen, um gewisse algebraische Gleichungen lösen zu können, beispielsweise x2 − 2 = 0. Wir mussten dann noch die komplexen Zahlen einführen, um auch x2 +1 lösen zu können. Nun hat der letzte Abschnitt erschöpfende Auskunft gegeben darüber, dass man mit den komplexen Zahlen jede quadratische Gleichung lösen kann. Wie steht es nun aber mit kubischen Gleichungen, oder Gleichungen höherer Ordnung? Brauchen wir da wieder neue Zahlen? Die vielleicht verblüffende Antwort ist, dass dies nicht der Fall ist. Genau Auskunft gibt der folgende Satz, der in diesem Rahmen nicht bewiesen werden kann. Satz 1.17 (Fundamentalsatz der Algebra) (i) Sei n ∈ N und a0 , a1 , . . . , an ∈ C, an 6= 0, sowie f das Polynom f (x) = an xn + an−1 xn−1 + . . . + a1 x + a0 . Dann gibt es Zahlen k ∈ N und n1 , . . . , nk ∈ N mit n1 + n2 + . . . + nk = n, sowie unterschiedliche Zahlen x1 , . . . , xk ∈ C, sodass f (x) = an (x − x1 )n1 (x − x2 )n2 · · · (x − xk )nk , x ∈ C. Die Zahlen sind (bis auf Umordnung) eindeutig. Die Zahl nl heißt Vielfachheit der Nullstelle xl (l = 1, . . . , k). (ii) Sind alle Koeffizienten a0 , . . . , an reell, so kann man darüberhinaus die xl so umordnen, dass für ein m ∈ N0 gilt x1 = x̄2 , . . . , x2m−1 = x̄2m und n1 = n2 , . . . , n2m−1 = n2m , x2m+1 , x2m+2 , . . . , xk ∈ R. Anders gesagt: Im Falle reeller Koeffizienten ist jede Nullstelle entweder reell, oder konjugiert zu einer Nullstelle gleicher Vielfachheit. Man kann den vorangehenden Satz auch so formulieren: In den komplexen Zahlen zerfällt jedes Polynom in Linearfaktoren. Dies ist in den reellen Zahlen nicht der Fall. Man beachte aber, dass aus Teil (ii) insbesondere folgt, dass sich jedes reelle Polynom als ein Produkt von reellen Linearfaktoren und reellen quadratischen Faktoren schreiben lässt. 1.9 25 Fundamentalsatz der Algebra Beispiele 1.18 (i) x5 − 6x4 − 9x3 + 44x2 + 110x + 100 = x − (1 − i) x − (1 + i) (x − 5)2 (x + 2) = (x2 + 2x + 2)(x − 5)2 (x + 2). (ii) Sei f (x) =x10 − 31 x9 + 407 x8 − 2909 x7 + 11881 x6 − 24959 x5 + 7213 x4 + 92669 x3 − 224202 x2 + 223230 x − 83300. Dann ist f (x) = (x − (2 + i))2 (x − (2 − i))2 (x − (5 + 3i))(x − (5 − 3i))(x − 7)2 (x + 2)(x − 1) = (x2 − 4x + 5)2 (x2 − 10x + 34)(x − 7)2 (x + 2)(x − 1). Die jeweilige Lösung kann man sich nicht leicht verschaffen. Jedoch ist es relativ einfach, wenn auch zeitaufwändig, eine Lösung zu überprüfen. 1.19 Beispiel Gegeben sei das Polynom f (x) = x4 − 8x3 + 195 131 2 x − 67x + . 4 4 Aus glücklichen Umständen heraus sei bekannt, dass x1 = 2 + 3i eine Nullstelle ist. Wie lauten nun die anderen Nullstellen x2 , x3 , x4 ? 1. Schritt: Nach dem Fundamentalsatz ist auch x2 := 2 − 3i eine Nullstelle. Damit ist f (x) = x − (2 + 3i) x − (2 − 3i) (x − x3 )(x − x4 ) = (x2 − 4x + 13)(x − x3 )(x − x4 ). 2.Schritt: Durch Polynomdivision erhalten wir x4 −8x3 2 + 131 4 x −67x + 195 4 −x4 +4x3 −13x2 −4x3 2 + 79 4 x −67x + 195 4 +4x3 −16x2 +52x ÷ x2 − 4x + 13 = x2 − 4x + 15 4 = (x − x3 )(x − x4 ) (1.19) 15 2 4 x −15x + 195 4 2 − 15 4 x +15x − 195 4 0 Durch quadratische Ergänzung erhalten wir jetzt die reellen Lösungen x3 = 3 2 und x4 = 52 . 26 Zahlen Kapitel 2 Abbildungen Wir haben im letzten Abschnitt schon Funktionen kennen gelernt, deren Definitions- und Wertebereich die reellen oder komplexen Zahlen sind. Das Konzept der Abbildungen (oder Funktionen) ist jedoch auch in solchen Fällen nützlich, wo diese beiden Bereiche von allgemeinerer Natur ist. Die Sprache, die zur Beschreibung von Abbildungen benutzt wird, ist so mächtig, dass sie über reelle Funktionen in weiten Teilen mit dem Vokabular reden kann, das für einfache Tabellen verwendet wird. Wir stellen in diesem Abschnitt die elementarsten Begriffe zusammen und gehen dann im Detail auf reelle Funktionen einer Veränderlichen ein. 2.1 Allgemeines Seien M und N Mengen. Wir nehmen, um triviale Fälle auszuschließen an, dass weder M noch N leer ist. Definition 2.1 (Abbildungen) Eine Vorschrift f : M → N , x 7→ f (x), die jedem x ∈ M genau ein f (x) ∈ N zuordnet, heißt Abbildung von M nach N . M heißt Definitionsbereich, und N heißt Wertebereich von f , Die Menge der tatsächlich angenommenen Werte f (M ) := {f (x) : x ∈ M } ⊂ N heißt Bild von f . Die Angabe x 7→ f (x) heißt die Abbildungsvorschrift. Eine Abbildung ist also durch Angabe der drei Zutaten • Definitionsbereich • Wertebereich • Abbildungsvorschrift vollständig bestimmt. (i) M, N = R, x 7→ sin(x). √ (ii) M = [0, ∞), N = [0, ∞), x 7→ x. Beispiele 2.2 27 28 Abbildungen f M N Abbildung 2.1: Schematische Darstellung einer Abbildung f : M → N (iii) M = C, N = (−π, π], z 7→ arg(z). (iv) M = C, N = (−π, π] × [0, ∞) := {(ϕ, r) : ϕ ∈ (−π, π], r ∈ [0, ∞)}, z 7→ (arg(z), |z|). Das ist die Abbildung, die jedem z ∈ C seine Polarkoordinaten zuordnet. Die Schreibweise K × L, wo K und L Mengen sind, bedeutet stets, dass die Menge von Paaren (k, l) gemeint ist, wobei k ∈ K und l ∈ L. Im obigen Fall also Paaren von Winkeln ϕ und Längen r. (v) M = {H, He, Li, Be,. . .} = Menge der chemischen Elemente, N = N0 = {0, 1, 2, . . .}. g : M → N definieren wir durch x 7→ g(x) = Anzahl der Neutronen (des häufigsten Isotops) von x “. ” Die Abbildung g beschreibt uns also eine Tabelle, in der links die chemischen Elemente stehen, und in der wir rechts die Neutronenanzahl ablesen können. Nehmen wir mal an, dass wir noch eine weitere Tabelle haben, in der wir links die Ordnungszahl und rechts den Namen des jeweiligen Elementes finden. Diese Tabelle können wir als Abbildung beschreiben durch: f : L → M , wobei L = {1, 2, . . . , 108} (die Menge der Ordnungszahlen der Elemente) und f (x) = Name des Elementes mit x Protonen. Wie bekommen wir zu einer gegebenen Ordnungszahl x nun die Anzahl der Neutronen? Wir müssen erst in der Tabelle“ f den Namen f (x) des Elements nachschauen und dann in der Tabelle“ g die ” ” Neutronenzahl g(f (x)). Dieses Verfahren bezeichnet man als Verknüpfung von Abbildungen. Definition 2.3 Sind f : L → M und g : M → N Abbildungen, so heißt die Abbildung h : L →N x 7→h(x) = g(f (x)) die Verknüpfung von g mit f . Symbolisch schreiben wir g ◦ f = h. 2.4 Beispiel L = M = N , f (x) = x2 , g(y) = sin(y). Dann ist g ◦ f (x) = sin(x2 ). Warnung: Im allgemeinen ist f ◦ g 6= g ◦ f ! In diesem Fall wäre z.B. f ◦ g(x) = (sin(x))2 . 2.2 29 Umkehrabbildung f g L M N g f Abbildung 2.2: Verknüpfung der Abbildungen f : L → M und g : M → N zu f ◦ g : L → N 2.2 Umkehrabbildung Wenn man in der Tabelle mit den Elementen nach der Ordnungszahl eines Elementes sucht, muss man in der rechten Spalte der Tabelle das Element suchen und dann die links stehende Zahl ablesen. Natürlich ist diese Suche mühsam, weil die Tabelle (so nehmen wir mal an) nach der linken Spalte geordnet ist und nicht nach der rechten. Es wäre also praktisch, wenn wir eine weitere Tabelle besäßen, die uns diesen Vorgang erleichtert. In der Sprache der Abbildungen heißt das gewünschte Objekt (denn bisher haben wir es uns ja nur gewünscht und noch nicht hergestellt, oder überhaupt erstmal sichergestellt, dass eine solche Tabelle existiert) eine Umkehrabbildung. Definition 2.5 (Umkehrabbildung) Sind f : M → N und g : N → M Abbildungen mit der Eigenschaft, dass g(f (x)) = x für jedes x ∈ M, f (g(y)) = y für jedes y ∈ N, so heißen f und g Umkehrabbildungen zueinander. Symbolisch schreiben wir f = g −1 und g = f −1 . g=f −1 M f N Abbildung 2.3: Umkehrabbildung g : N → M der Abbildung f : M → N . 30 Abbildungen 2.6 Beispiel (i) M = [0, ∞), N = [1, ∞), f (x) = x2 + 1, g(y) = f (g(y)) = und g(f (x)) = √ y − 1 . Dann ist 2 p y−1 +1=y−1+1=y √ p (x2 + 1) − 1 = x2 = x, weil x ≥ 0. (ii) M = {1, . . . , 108}, N = {H, He, Li,. . .}, f (x) =Name von x, g(y) =Ordnungszahl von y. (iii) Ist M = {H, He, Li,. . .}, N = N0 und f (x) = Anzahl der Neutronen von x, so kann man zu f keine Umkehrabbildung finden, weil beispielsweise f (Al) = f (Si) = 14. Also kann man der Neutronenzahl 14 nicht eindeutig ein chemisches Element zuordnen. Das letzte Beispiel zeigt schon ganz klar, worauf es ankommt, wenn man nach Umkehrabbildungen sucht: verschiedene Argumente müssen unterschiedliche Funktionswerte liefern. Definition 2.7 (Ein-eindeutigkeit) Eine Abbildung f : M → N heißt ein-eindeutig (oder 1–1, oder injektiv), falls f (x) 6= f (y), wann immer x = 6 y. Die Ein-eindeutigkeit ist schon fast alles, was man braucht, damit es eine Umkehrabbildung gibt. Als zweites ist noch eine kleine technische Spitzfindigkeit zu beachten: Wenn f und g Umkehrfunktionen zueinander sind, so kehren sich die Rollen von Werte– und Definitionsbereich um. Damit das richtig klappt, muss f : M → N auch wirklich jeden Wert in N annehmen, oder in Formeln ausgedrückt: es muss f (M ) = N gelten. Praktisch ist das nie ein Problem. Man hat ja meist schon eine Vorstellung davon, welches Bild eine Funktion hat, die Sinusfunktion beispielsweise das Intervall [−1, 1], und wählt dann N so, dass es mit diesem Bereich übereinstimmt. Wir werden in den Beispielen sehen, wie das geht. Satz 2.8 Die Abbildung f : M → N besitzt eine Umkehrabbildung f −1 genau dann, wenn f ein-eindeutig ist und f (M ) = N gilt. 2.9 Beispiel M = [0, ∞), N = [1, ∞), f (x) = x2 + 1. Offenbar ist f ein-eindeutig. Außerdem wird jeder Wert in N tatsächlich angenommen. Wir können, weil das Problem so einfach ist, die Umkehrfunktion √ sogar explizit angeben: g : N → M , g(y) = y − 1 . Wenn wir, unvorsichtigerweise, N = R gewählt hätten, so hätten wir keine Umkehrabbildung angeben können. Das liegt daran, dass in diesem Fall die Gleichheit y = f (g(y)) für y < 1 nicht gelten kann, weil f den Wert y nicht annimmt. Ganz so spitzfindig war die Voraussetzung f (M ) = N also nicht, wie sich hier zeigt. Natürlich könnten wir uns auf den Standpunkt stellen, dass wir sowieso nur an der Gleichung f (g(x)) = x interessiert sind. In diesem Fall wäre die Bedingung an den Bildbereich hinfällig. 2.10 Beispiel Es sei ein Zusammenhang zwischen zwei reellen Größen x und y gegeben durch x2 + y 2 = 1. Unser Ziel ist es, y als Funktion von x zu schreiben. Schritt 1: Wir trennen die Variablen y 2 = 1 − x2 . √ Schritt 2: Die Umkehrfunktion von y 7→ y 2 ist y 7→ y, jedenfalls, wenn wir uns auf y ≥ 0 einschränken. Der Definitionsbereich der Umkehrabbildung ist [0, ∞), also müssen wir |x| ≤ 1 fordern. 2.3 31 Reelle Funktionen einer Veränderlichen Insgesamt folgt, dass wir y = f (x) schreiben können, wo f : [−1, 1] → [0, 1], p f (x) = 1 − x2 . Ist allgemeiner g(y) = h(x) als Zusammenhang gegeben, so können wir y = f (x) schreiben, wo f (x) = g −1 (h(x)) für einen Bereich I ⊂ R, sodass (wenn J = h(I) den Wertebereich von h bezeichnet) g : J → R ein-eindeutig ist. Wie gehen wir vor, wenn wir die Umkehrabbildung einer zusammengesetzten Abbildung bestimmen wollen? Dazu zunächst ein Beispiel. 2.11 Beispiel Sei L = M = N = R und f : L → M sowie g : M√→ N gegeben durch f (x) = x3 + 1 und g(y) = 5x. Die jeweiligen Umkehrabbildungen sind f −1 (x) = 3 x − 1 und g −1 (x) = x5 . Die verknüpfte Abbildung g ◦ f : R → R ist gegeben durch g ◦ f (x) = 5(x3 + 1). Die Umkehrabbildung ist (g ◦ f )−1 (y) = p 3 y 5 − 1 , denn ! r 3 r y y y 3 3 −1 =5 −1 +1 =5 −1+1 =y (g ◦ f ) 5 5 5 und r 3 √ g ◦ f (x) 3 5(x + 1) 3 −1 = − 1 = x3 = x. 5 5 Es gilt also (g ◦ f )−1 = f −1 ◦ g −1 . In Worten, man erhält die Umkehrabbildung einer verknüpften Abbildung, indem man die jeweiligen Umkehrabbildungen in umgekehrter Reihenfolge verknüpft. r 3 Dies gilt auch allgemeiner als nur für die oben betrachteten Abbildungen. Satz 2.12 Sind f : L → M und g : M → N umkehrbare Abbildungen mit Umkehrabbildungen f −1 und g −1 , so ist die zusammengesetzte Abbildung g ◦ f : L → N umkehrbar und hat die Umkehrabbildung (g ◦ f )−1 = f −1 ◦ g −1 . 2.3 Reelle Funktionen einer Veränderlichen Ist M ⊂ Rn = {(x1 , . . . , xn ) : x1 , . . . , xn ∈ R}, und N ⊂ R so heißt jede Abbildung f : M → N eine reelle Funktion von n (reellen) Veränderlichen. Wir wollen hier nur den Fall n = 1 betrachten, also reelle Funktionen einer Veränderlichen. Außerdem wollen wir annehmen, dass I := M ⊂ R ein Intervall ist. Dies kann offen oder abgeschlossen, beschränkt oder unbeschränkt sein. In welcher Weise kann man Abbildungsvorschriften von Abbildungen I → R angeben? (i) Elementar, durch algebraische Ausdrücke wie x 7→ x2 . (ii) Durch geometrische Konstruktion, z.B. x 7→ sin(x). (iii) Durch Definition von Hand“: Vorzeichenfunktion ” ( −1, sign : x 7→ +1, falls x < 0, falls x ≥ 0. (2.1) 32 Abbildungen (iv) Implizit, durch Angabe von Eigenschaften. Beispielsweise kann man eine Funktion f als Umkehrfunktion einer anderen Funktion g definieren, wenn man weiß, dass g umkehrbar ist. Praktisch liefert einem das natürlich keine Hilfe, wenn man ganz konkret Funktionswerte berechnen möchte. (v) Durch Annäherung der gewünschten Funktion mit elementaren Funktionen. Beispielsweise kann 1 3 1 1 x + 2·3·4 x4 + . . . + 2·3···n xn für große n immer näher an exp(x) man zeigen, dass 1 + x + 21 x2 + 2·3 gelangt. Dies wird uns in einem späteren Kapitel beschäftigen. Eine Funktion wird oft dadurch veranschaulicht, dass man ihren Graphen zeichnet. Formal handelt es sich dabei um die Menge von Punkten in der Ebene Graph(f ) = {(x, f (x)) : x ∈ I}. (2.2) Graph(f) f(x) 0110 (x,f(x)) x Durch die Angabe des Graphen (und genau genommen: des Wertebereichs) ist eine Funktion natürlich eindeutig bestimmt. Wenn man nur genau genug zeichnen könnte, wäre es also möglich, Funktionen alleine durch Zeichnung zu definieren. Im allgemeinen geht das nicht, aber der Graph ist dennoch hilfreich, wenn man wesentliche qualitative Aussagen verstehen oder mitteilen möchte. Wir kommen jetzt zu dem wichtigen Begriff der Monotonie. Definition 2.13 Die Funktion f heißt monoton wachsend, falls f (y) ≥ f (x) wann immer y > x, streng monoton wachsend, falls f (y) > f (x) wann immer y > x, monoton fallend, falls f (y) ≤ f (x) wann immer y > x, streng monoton fallend, falls f (y) < f (x) wann immer y > x. Satz 2.14 Ist f : I → N ⊂ R streng monoton wachsend (oder fallend), so ist f ein-eindeutig. Ist zusätzlich f (I) = N , so ist f umkehrbar. Die Umkehrabbildung ist dann ebenfalls streng monoton wachsend (beziehungsweise fallend). Der Graph der Umkehrfunktion ergibt sich durch Spiegelung des ursprünglichen Graphen an der Diagonalen {(x, x) : x ∈ R}. Beispiele 2.15 (i) Die Vorzeichenfunktion sign (siehe (2.1)) ist monoton wachsend, aber nicht streng monoton wachsend. Sie ist nicht umkehrbar. 2.3 33 Reelle Funktionen einer Veränderlichen (ii) Die Abbildung [0, 1] → [−1, 0], x 7→ −x2 ist streng monoton fallend. Die Abbildungsvorschrift der √ Umkehrfunktion lautet y 7→ −y . (iii) Ist r > 0, so ist die Abbildung [0, ∞) → [0, ∞), x 7→ xr streng monoton wachsend. Die Umkehrab1 bildung lautet [0, ∞) → [0, ∞), y 7→ y r . (iv) Die Abbildung [− π2 , π2 ] → [−1, 1], x 7→ sin(x) ist streng monoton wachsend. Die Umkehrabbildung, die wir nicht explizit kennen, aber die nach dem vorangehenden Satz existiert, heißt ArcusSinusfunktion. Symbolisch arcsin : [−1, 1] → [− π2 , π2 ]. (v) Die Abbildung [0, π] → [−1, 1], x 7→ cos(x) ist wieder streng monoton fallend. Die Umkehrfunktion arccos : [−1, 1] → [0, π] heißt Arcus-Kosinusfunktion. arccos(x) 4 3 x 5/2 arcsin(x) 2 3 1 y2 x 2/5 –1 –0.8 –0.6 –0.4 –0.2 0.2 0.6 0.4 0.8 1 x 1 –1 0 1 2 x 3 4 (vi) Die Abbildung (− π2 , π2 ) → R, x 7→ tan(x) ist streng monoton wachsend. Die Umkehrabbildung arctan : R → (− π2 , π2 ) heißt Arcus-Tangensfunktion. 34 Abbildungen 1.5 arctan(x) 1 0.5 –20 –10 0 10 x 20 –0.5 –1 –1.5 (vii) Die Abbildung exp : R → (0, ∞) ist streng monoton wachsend. Die Umkehrabbildung ist die (natürliche) Logarithmusfunktion log : (0, ∞) → R. Man beachte hier, dass es unterschiedliche Konventionen für Schreibweise des natürlichen Logarithmus gibt. Manche (oder besser: viele) Autoren, besonders aus den technischen Bereichen, schreiben ln für logarithmus naturalis und bezeichnen mit log den so genannten Logarithmus zur Basis 10. Wir folgen hier der in der Mathematik gebräuchlichen Notation. (viii) Die Abbildung f : [0, ∞) → (0, 1], x 7→ f (x) = exp(−x2 ) (siehe Zehnmarkschein) ist streng p monoton fallend. Die Umkehrfunktion lautet f −1 : (0, ∞) → [0, ∞), f −1 (y) = − log(y) . (ix) Die Abbildung R → R, x 7→ x2 ist weder monoton wachsend noch monoton fallend. Man kann keine Umkehrfunktion angeben. 2.16 Beispiel Wollen wir die Umkehrfunktion einer komplizierten, zusammengesetzten Funktion bestimmen, so wenden wir Satz 2.12 mehrfach an und suchen nach geeigneten Monotoniebereichen für die einzelnen Funktionen. Betrachten wir beispielsweise f gegeben durch r π f (x) = 3 1 − sin −x . 3 Dann können wir schreiben √ 3 f (x) = f1 (f2 (f3 (f4 (x)))), wobei f1 (x) = x, f2 (x) = 1 − x, f3 (x) = sin(x), f4 (x) = π3 − x. Damit wir die einzelnen Funktionen umkehren können, müssen wir ihre Definitionsbereiche so wählen, dass sie ein-eindeutig sind. Eine mögliche Wahl ist f1 : [0, ∞) → [0, ∞), f −1 (y) = y 3 , f2 : R → R, f2−1 (y) = 1 − y, π π f3−1 (y) = arcsin(y), f3 : [− 2 , 2 ] → [−1, 1], f4 : R → R, f4−1 (y) = π3 − y. Offenbar müssen wir für f4 zusätzlich annehmen, dass die Werte f4 (x) im Definitionsbereich von f3 liegen, also f4 (x) ∈ [− π2 , π2 ]. Damit wird der Definitionsbereich von f4 festgelegt als [− π6 , 5π 6 ]. Offenbar ist der √ 3 π 5π −1 Wertebereich f ([− 6 , 6 ]) = [0, 2]. Die Umkehrabbildung f ist jetzt durch umgedrehte Anwendung der einzelnen Umkehrabbildungen gegeben f −1 (y) = f4−1 (f3−1 (f2−1 (f1−1 (y)))). 2.4 35 Reelle Funktionen mehrerer Veränderlicher Insgesamt folgt: h π 5π i √ 3 → 0, 2 f: − , 6 6 ist umkehrbar, und die Umkehrabbildung ist gegeben durch f −1 (y) = 2.4 π − arcsin 1 − y 3 . 3 Reelle Funktionen mehrerer Veränderlicher Sei n = 2, 3, 4, . . . und M ⊂ Rn der Definitionsbereich der reellen Funktion f : M → R von n Veränderlichen. 2.17 Beispiel Das Gesetz des idealen Gases lautet pV = N kT, (2.3) wobei p der Druck, V das Volumen, N die Anzahl der Moleküle, T die absolute Temperatur und k die Boltzmann Konstante ist. Ist im Experiment das Volumen und die Temperatur einstellbar, sowie der Druck zu messen, so wollen wir p als Funktion von V und T schreiben: p = f (V, T ). Dabei ist M = (0, ∞) × (0, ∞) und f : M → (0, ∞), (V, T ) 7→ N k T . V Der Graph einer reellen Funktionen mehrerer Veränderlicher ist genauso wie oben definiert als Graph(f ) = {(x, f (x)) : x ∈ M }. Die Darstellung des Graphen ist allerdings schwieriger als bei Funktionen von nur einer Veränderlichen. Für Funktionen von zwei Veränderlichen bieten sich immerhin noch zwei Möglichkeiten an: 1. Perspektivische Darstellung In einer perspektivischen Darstellung wird der Parameterbereich (die Veränderlichen) als Fläche und der Funktionswert nach oben dargestellt. Oft wird der Graph mit einem Gitter belegt, damit die Werte optisch besser erkennbar sind. Das ist von Hand sehr aufwändig, allerdings mit Computern heutzutage kein Problem mehr. 36 Abbildungen f(x,y)=cos(x)y+sin(y) 4 2 0 f(x,y) –2 –4 –6 0 0 1 2 2 y 4 3 x 6 4 5 8 2. Niveaulinien Definition 2.18 Die Niveaulinie der Funktion f : M → R zur Höhe h ist die Menge Nf (h) = (x1 , x2 ) ∈ M : f (x1 , x2 ) = h . 2.19 Beispiel Betrachte die Funktion f : R2 → [0, ∞) (x1 , x2 ) 7→ |x1 |5/2 + 2|x2 |5/2 . Für h ≥ 0 ist n o Nf (h) = (x1 , x2 ) : |x1 |5/2 + 2 |x2 |5/2 = h . Bemerkung 2.20 Offenbar ist f nicht ein-eindeutig. Das ist die typische Situation für reelle Funktionen mehrerer Veränderlicher. Für die Naturwissenschaften relevante reelle Funktionen mehrerer Veränderlicher sind nie ein-eindeutig (und damit auch nie umkehrbar). 2.5 37 Vektorwertige Funktionen einer Veränderlichen 1 y 0.5 –1.5 –1 –0.5 0 0.5 x 1 1.5 –0.5 –1 F IGUR . Niveaulinien Nf (1), Nf (2), Nf (3), Nf (4) von f (x, y) = |x|5/2 + 2|y|5/2 f(x,y)=sin(x)*cos(y) 8 6 1 0.5 y4 0 f(x,y) –0.5 –1 0 2 0 2 2 y 0 2 4 x 6 4 4 6 8 x 6 8 8 F IGUR . Niveaulinien und perspektivische Darstellung von f (x, y) = sin(x) cos(y) 2.5 Vektorwertige Funktionen einer Veränderlichen Definition 2.21 Sei n = 2, 3, 4, . . . und M ⊂ R sowie N ⊂ Rn . Eine Abbildung f : M → N heißt vektorwertige Funktion von einer Veränderlichen. Wir schreiben auch f1 (x) f (x) = ... . fn (x) 38 Abbildungen Vektorwertige Funktionen benutzt man, um mehrere Messgrößen f1 , . . . , fn als Funktion, beispielsweise, der Zeit t, oder auch einer anderen, frei einstellbaren Größe, zu beschreiben. Darstellung: Für n = 2 kann man die Kurve {f (x) : x ∈ M } in der (y, z)–Ebene zeichnen und mit den x–Werten beschriften. Für n = 3 bietet sich eine perspektivische Darstellung mit Beschriftung an. z1 2.22 Beispiel Drehung mit konstanter Winkelgeschwindigkeit ω. Sei ω ∈ R, z = ∈ R2 und f : z2 [0, ∞) → R2 definiert durch z + cos(ωt) f (t) = 1 für t ≥ 0. (2.4) z2 + sin(ωt) Dann beschreibt f eine Drehung um die Achse z. f2 t=1 f(t) t=2 t=0 z t=3 f1 F IGUR . Darstellung von f aus (2.4) mit ω = π 2 2.23 Beispiel Zerfall von Stickstoffdioxid. 2N O2 −→ 2N O + O2 . f1 (t) = Konzentration c(N O2 ) zur Zeit t. f2 (t) = Konzentration c(N O) zur Zeit t. f3 (t) = Konzentration c(O2 ) zur Zeit t. Annahme f2 (0) = f3 (0) = 0 und f1 (0) = c0 > 0. Der Zerfall ist eine Reaktion zweiter Ordnung, das heißt, es sind zwei Reaktionspartner (die zwei N O2 Moleküle) an der Reaktion beteiligt. Die Menge des pro Zeiteinheit umgesetzten Stoffes ist nach dem Massenwirkungsgesetz proportional zum Quadrat der Konzentration an N O2 . Insgesamt ergibt sich folgende Gleichung, die hier nicht hergeleitet werden soll, c0 c0 kt + 1 c20 kt f (t) = c0 kt + 1 1 c2 kt 0 2 c0 kt + 1 . (2.5) 2.5 Vektorwertige Funktionen einer Veränderlichen Dabei ist k die Reaktionskonstante, z.B. k = 0.755 l/(mol s) bei einer Temperatur von 603K. 39 40 Abbildungen Kapitel 3 Stetige Funktionen und Grenzwerte Sei M, N ⊂ R. Eine Funktion f : M → N , x 7→ f (x), die keine Sprünge macht, wenn man am Wert x nur ein wenig wackelt, wollen wir stetig nennen. Wir müssen jetzt mathematisch präzise fassen, was wackeln“ ” und Sprünge“ heißen soll. ” 3.1 Definition und Beispiele Definition 3.1 Für x0 ∈ R und ε > 0 heißt Uε (x0 ) = x ∈ R : |x − x0 | < ε die ε-Umgebung von x0 . Unter Wackeln“ wollen wir jetzt verstehen, dass wir alle Werte x ∈ Uε (x0 )gleichzeitig betrachten. Keine ” ” Sprünge“ soll heißen, dass f (x) für diese x nur um weniges (ein vorher vorgegebenes δ > 0) von f (x0 ) abweicht. Definition 3.2 Eine Funktion f : M → N heißt stetig in x0 ∈ M , wenn für jedes δ > 0 ein ε = ε(δ) > 0 existiert mit der Eigenschaft: Für jedes x ∈ Uε (x0 ) ∩ M ist f (x) ∈ Uδ (f (x0 )). Ist f stetig in jedem Punkt x0 ∈ M , so heißt f stetig (in M ). Wenn man praktisch die Stetigkeit einer Funktion prüfen möchte, muss man so vorgehen: Bei festem x0 muss man zu jedem δ > 0 ein ε > 0 angeben. Dieses ε ist in der Regel aufwändig zu bestimmen. Als nächstes muss man nachweisen, dass für jedes x ∈ Uε (x0 ) gilt, dass |f (x) − f (x0 )| < δ. Es reicht nicht, dass dies nur für ein δ geht, es muss für jedes δ > 0 funktionieren. Es ist nicht verkehrt, sich an dieser Stelle den Sachverhalt als ein Spiel für zwei Spieler vorzustellen. Spieler 2 behauptet, dass f in x0 stetig ist. Spieler 1 schlägt einen Wert von δ vor und Spieler 2 muss mit der Angabe eines Wertes ε > 0 antworten. Außerdem muss Spieler 2 nachweisen, dass für jedes x ∈ Uε (x0 ) die Beziehung |f (x) − f (x0 )| < δ gilt. Kann Spieler 2 dies stets tun, so gewinnt er (oder sie) das Spiel und wir nennen die Funktion in x0 stetig. Findet Spieler 1 auch nur einen Wert δ > 0, für den Spieler 2 nicht angemessen antworten kann, so ist die Funktion unstetig in x0 . 41 42 Stetige Funktionen und Grenzwerte f(x0) +δ Uδ(f(x0 )) f(x0) f(x0) −δ Uε(x0 ) x0−ε x0 x 0+ε F IGUR . Stetiges f mit Uε (x0 ) und Uδ (f (x0 )) Beispiele 3.3 (i) f : R → R, x 7→ 3x ist stetig: Für x0 ∈ R und δ > 0 wählen wir ε = δ/3. Dann ist für x ∈ Uε (x0 ) |f (x) − f (x0 )| = |3x − 3x0 | = 3|x − x0 | < 3ε = δ, also f (x) ∈ Uδ (f (x0 )). (ii) f : R → R, x 7→ x2 ist überall stetig: Ist x0 ∈ R und δ > 0, so wählen wir ε = ε(δ) = δ √ . 4|x0 | + 2δ Für x ∈ Uε (x0 ) ist dann |f (x) − f (x0 )| = |x2 − x20 | = |x2 − 2xx0 + x20 + 2xx0 − 2x20 | ≤ (x − x0 )2 + 2|(x − x0 )x0 | < ε2 + 2ε|x0 | 2 δ 2|x0 |δ δ δ ≤ √ + ≤ + = δ. 4|x | 2 2 2δ 0 Insgesamt ist also f (x) ∈ Uδ (f (x0 )). (iii) Ähnlich wie in (ii) ist für jedes n ∈ N die Abbildung R → R, x 7→ xn stetig. (iv) Die Exponentialfunktion exp : R → (0, ∞) ist stetig: Ist x0 ∈ R und δ > 0, so wählen wir ε = log(1 + δe−x0 ). Dann ist |ex − ex0 | = |(ex−x0 − 1)|ex0 ≤ (e|x−x0 | − 1)ex0 < (eε − 1)ex0 = δ. Das heißt ex ∈ Uδ (x0 ), wie gewünscht. (v) Die Winkelfunktionen sin, cos : R → [−1, 1] sind überall stetig. (vi) Die Vorzeichenfunktion sign : R → {−1, 1} ist stetig in jedem x0 6= 0 und unstetig in x0 = 0. In der Tat: Für δ = 1 und jedes ε > 0 ist x = − 2ε ∈ Uε (0), aber |f (x) − f (0)| = | − 1 − 1| = 2 > 1. 3.2 43 Zusammensetzungen stetiger Funktionen (vii) Die Funktion f : R → [−1, 1], x 7→ 0, x ≤ 0, 1 sin , x x > 0, ist unstetig in x0 = 0 und stetig in allen x0 6= 0. Meist kann man durch Augenschein am Graphen der Funktion erkennen, ob die Funktion stetig oder Unstetig ist. Als Definition der Stetigkeit ist dieses Verfahren unbrauchbar, aber als Hilfsmittel zur Untersuchung einer Funktion sehr nützlich. Satz 3.4 Ist I ⊂ R ein Intervall, so ist jede Funktion f : I → R, deren Graphen man in einem Stück zeichnen kann, stetig. Besteht der Graph aus zwei, oder mehreren Stücken, die nicht miteinander verbunden sind, so ist f unstetig. Die Stellen, an denen der Graph getrennt ist, sind die Unstetigkeitsstellen. Achtung: Hier wurde vorausgesetzt, dass f auf einem Intervall definiert ist. Ist f auf mehreren Intervallen definiert, so muss der Graph nur in jedem einzelnen dieser Intervalle zusammenhängend sein. Beispiel: R \ {0} → R, x 7→ x−1 ist stetig, da man die Graphen für x < 0 und für x > 0 jeweils durchgehend zeichnen kann. In x = 0 ist die Funktion nicht definiert und kann daher in dieser Stelle auch nicht unstetig sein. 3.2 Zusammensetzungen stetiger Funktionen Funktionen kann man mit reellen Zahlen multiplizieren, indem man die Funktionswerte mit der jeweiligen reellen Zahl multipliziert. Man kann zwei Funktionen addieren, subtrahieren und multiplizieren, indem man das entsprechende mit den Funktionswerten tut. Man kann zwei Funktionen auch dividieren, jedenfalls dort, wo der Nenner nicht Null ist. Unter diesen Operationen bleibt die Stetigkeit als Eigenschaft erhalten. Diesen Sachverhalt wollen jetzt formal darstellen. Definition 3.5 Ist M eine Menge und f, g : M → R Abbildungen, sowie a ∈ R, so kann man Abbildungen af , f + g, f − g und f g : M → R definieren durch af : x 7→ af (x), f + g : x 7→ f (x) + g(x), f − g : x 7→ f (x) − g(x), f g : x 7→ f (x)g(x). Bezeichnet D = {x ∈ M : g(x) = 0} die Menge der Punkte, in denen g verschwindet, so definieren wir (x) die Abbildung fg : M \ D → R durch x 7→ fg(x) . Satz 3.6 Seien M ⊂ R, f, g : M → R Abbildungen und a ∈ R. Sind f und g in x0 ∈ M stetig, dann sind auch die Abbildungen af , f + g, f − g und f g in x0 stetig. Ist D wie oben und x0 ∈ M \ D, sowie f und g in x0 stetig, dann ist auch fg in x0 stetig. Sind die Abbildungen f und g stetig, dann sind auch die Abbildungen af , f + g, f − g, f g und Beispiele 3.7 f g stetig. (i) R → R, x 7→ 6 sin(x) ist stetig, weil sin stetig ist. (ii) R → R, x 7→ x4 + x5 ist stetig, weil x 7→ x4 und x 7→ x5 beide stetig sind. Etwas allgemeiner ist jedes Polynom auf R stetig. 44 Stetige Funktionen und Grenzwerte (iii) R → R, x 7→ x2 sin(x) ist stetig. (iv) R → R, x 7→ x3 +7 x2 +1 ist stetig, da x2 + 1 6= 0 für alle x ∈ R. x+1 (v) h : R \ {1} → R, x 7→ x−1 ist stetig. Man bemerke, dass die problematische Stelle bei x0 = 1 gar nicht im Definitionsbereich von h liegt. Allgemeiner ist jede rationale Funktion stetig (in ihrem Definitionsbereich). sin(x) ist stetig. (vi) tan : R \ k + 12 )π : k ∈ Z → R, x 7→ tan(x) = cos(x) Genauso wichtig wie die algebraischen Operationen auf den Funktionswerten, die wir gerade kennen gelernt haben, ist die Verknüpfung von Abbildungen durch Einsetzen ineinander (vergleiche Definition 2.3). Satz 3.8 Seien L, M, N ⊂ R und f : L → M und g : M → N Abbildungen. (i) Ist x0 ∈ L und f stetig in x0 sowie g stetig in y0 = f (x0 ), so ist g ◦ f stetig in x0 . (ii) Sind f und g stetig, so ist auch g ◦ f stetig. Beweis Sei x0 ∈ L und δ > 0 vorgegeben. Dann existiert nach Voraussetzung ein εg > 0, sodass für jedes y ∈ Uεg (y0 ) gilt g(y) ∈ Uδg (g(y0 )) = Uδg (g ◦ f (x0 )). (3.1) Sei δf = εg . Da f in x0 stetig ist, existiert ein εf > 0, sodass für jedes x ∈ Uεf (x0 ) gilt: f (x) ∈ Uδf (f (x0 )) = Uεg (y0 ). Wegen (3.1) ist also g ◦ f (x) ∈ Uδg (g ◦ f (x0 )) für jedes x ∈ Uεf (x0 ). Damit ist g ◦ f als stetig in x0 erkannt. 2 Beispiele 3.9 (i) R → R, x 7→ exp(−x2 ) ist stetig als Zusammensetzung g◦f der stetigen Abbildungen f : x 7→ −x2 und g : x 7→ exp(x). (ii) R → R, x 7→ sign(sin(x)) ist stetig in jedem Punkt x0 ∈ R \ {kπ : k ∈ Z}. Dabei ist die Ausnahmemenge natürlich gerade die Menge der Punkte, an denen die Sinusfunktion einen Nulldurchgang hat. 3.3 Zwischenwertsatz und Intervallschachtelung Ist f eine stetige reelle Funktion auf dem Intervall [a, b] (wobei a < b reelle Zahlen sind), so nimmt sie jeden Wert an, der zwischen f (a) und f (b) liegt. Ein Blick auf den Graphen bestätigt diese Tatsache sofort. Dennoch sollte man sich an dieser Stelle daran erinnern, dass wir die reellen Zahlen mühsam so hergestellt hatten, dass sie keine Lücken enthalten. Würden wir nämlich die gleiche Funktion nur auf den rationalen Zahlen auswerten, so wäre die Aussage falsch. (Beispiel: f (x) = x2 − 2, a = 0, b = 2. Es gibt keine rationale Nullstelle). Wir formulieren in diesem Abschnitt den Sachverhalt im so genannten Zwischenwertsatz. Obwohl die Aussage in diesem Rahmen keines Beweises bedarf, soll sie bewiesen werden, weil das Beweisprinzip, die so genannte Intervallschachtelung, ein konstruktives Verfahren liefert, sich die Stelle zu verschaffen, an der der gewünschte Wert angenommen wird. So kann man dann per Hand Umkehrfunktionen numerisch berechnen. 3.3 45 Zwischenwertsatz und Intervallschachtelung Satz 3.10 (Zwischenwertsatz) Seien a, b ∈ R , a < b, und f : [a, b] → R eine stetige Funktion. Ist f (a) ≤ f (b) (beziehungsweise f (a) ≥ f (b)), so existiert für jedes y ∈ [f (a), f (b)] (beziehungsweise y ∈ [f (b), f (a)]) ein x ∈ [a, b] mit f (x) = y. Beweis (Intervallschachtelung) Ohne Einschränkung der Allgemeinheit sei hier f (a) ≤ f (b) angenommen. Wir setzen a0 = a und b0 = b. Wir wählen den Punkt c0 genau in der Mitte des Intervalls [a0 , b0 ], 0 also c0 = a0 +b 2 . Fall 1 Ist jetzt f (c0 ) < y, dann erwarten wir, dass der gesuchte Punkt x in [c0 , b] liegt. Wir verkleinern das Intervall auf [a1 , b1 ], wobei a1 = c0 und b1 = b und suchen in diesem Intervall erneut nach x. Fall 2 Ist andererseits f (c0 ) ≥ y, dann erwarten wir x in [a0 , c0 ] und setzen daher a1 = a0 , b1 = c0 und suchen erneut in [a1 , b1 ] nach x. 1 halbiert und ein In beiden Fällen wird als nächster Schritt wieder das Intervall [a1 , b1 ] bei c1 = a1 +b 2 Teil verworfen. Der andere Teil wird [a2 , b2 ] genannt. Auf diese Weise erhalten wir sukzessive in einander enthaltene Intervalle [an , bn ] mit bn − an = (b − a)2−n und mit f (an ) ≤ y ≤ f (bn ). Die Regel ist dabei: n Setze cn = an +b und 2 Falls f (cn ) < y : setze an+1 = cn , bn+1 = bn . Falls f (cn ) ≥ y : setze an+1 = an , bn+1 = cn . Offenbar ist a0 ≤ a1 ≤ a2 ≤ . . . und b0 ≥ b1 ≥ b2 ≥ . . .. Es gibt also genau ein x mit an ≤ x ≤ bn für alle n. Da f stetig ist, muss f (x) = y sein. 2 Man bemerke, dass wir im n-ten Schritt den Wert x bereits bis auf einen Fehler von höchstens (b − a)2−n angenähert haben. 3.11 Beispiel Sei f : [0, 1] → R, x 7→ x + sin( π2 x). Dann ist f (0) = 0 und f (1) = 1 + sin( π2 ) = 2. Wir suchen jetzt nach einem Wert x ∈ [0, 1] mit f (x) = 1. Nach dem Zwischenwertsatz gibt es so ein x. Die Funktion f ist streng monoton wachsend, daher existiert auch die Umkehrabbildung f −1 : [0, 2] → [0, 1]. Daher ist x = f −1 (1) sogar eindeutig. Wir können unsere Aufgabe jetzt so auffassen, dass wir die Umkehrfunktion f −1 an der Stelle 1 explizit ausrechnen wollen. 1 Wir geben uns eine Fehlergrenze von beispielsweise 32 vor (hier könnte natürlich auch jede andere Zahl stehen) und wollen x bis auf diesen Fehler numerisch (also beispielsweise mit dem Taschenrechner) be1 = 2−5 müssen wir also a5 und b5 bestimmen. stimmen. Wegen 32 n an bn cn f (cn ) 0 0 1 1 2 1 2 + sin( π4 ) ≈ 1, 207 > 1 1 0 1 2 1 4 1 4 + sin( π8 ) ≈ 0, 633 < 1 2 1 4 2 4 3 8 3 8 + sin( 3π 16 ) ≈ 0, 931 < 1 3 3 8 4 8 7 16 7 16 + sin( 7π 32 ) ≈ 1, 072 > 1 4 6 16 7 16 13 32 5 3 8 13 32 13 32 + sin( 13π 64 ) ≈ 1, 002 > 1 13 Ergebnis x = f −1 (1) ∈ [ 12 32 , 32 ] = [0.375, 0.40625]. (Führt man das Verfahren noch um etliche Schritte weiter, so erhält man für x den Wert 0.4053883560. Der Wert von a5 weicht also von x tatsächlich um fast 1 32 ab.) 46 Stetige Funktionen und Grenzwerte 2 x+sin( π x/2) 1.5 1 0.5 0 –0.2 a0 a1 –0.5 0.2 0.4 0.6 x 0.8 1 b0 1.2 b1 b2 a2 b3 a3 F IGUR . Intervallschachtelung zur Bestimmung von x mit x + sin( πx 2 )=1 3.4 Grenzwerte von Zahlenfolgen Wir haben im letzten Abschnitt bei der Intervallschachtelung einen Wert x durch Zahlenfolgen (an )n∈N = (a1 , a2 , a3 , . . .) und (bn )n∈N angenähert. Wir wollen hier den Begriff der Annäherung präzisieren und die elementaren Rechenregeln für die so genannten Grenzwerte angeben. Definition 3.12 Eine Zahl a ∈ R heißt Grenzwert (oder Limes) der Zahlenfolge (an )n∈N , falls für jedes (noch so kleine) ε > 0 ein Index N = N (ε) ∈ N existiert mit der Eigenschaft an ∈ Uε (a) für alle n ≥ N. Existiert eine solche Zahl a, so sagen wir, dass die Folge (an )n∈N konvergent ist, und dass (an )n∈N gegen a strebt (oder konvergiert). Wir schreiben dann a = lim an , n→∞ n→∞ oder an −→ a. Lemma 3.13 Ist (an )n∈N konvergent, so ist der Grenzwert eindeutig bestimmt. 3.4 47 Grenzwerte von Zahlenfolgen (i) an = Beispiele 3.14 (ii) an = (−1)n n12 1 n konvergiert: lim an = 0. n→∞ konvergiert: lim an = 0. n→∞ (iii) an = n2 ist nicht konvergent. (iv) an = (−1)n ist nicht konvergent. Ein Grenzwert braucht im allgemeinen nicht zu existieren (Beispiele (iii) und (iv)). Wir führen für diese Situation die folgenden Begriffe ein: Definition 3.15 (i) Eine Zahlenfolge, die nicht konvergent ist, heißt divergent. (ii) Existiert für jedes (noch so große) M > 0 ein Index N = N (M ) ∈ N mit der Eigenschaft an > M für alle n > N, so sagen wir, dass (an )n∈N gegen ∞ strebt oder uneigentlich konvergiert. Wir schreiben dann lim an = ∞, n→∞ n→∞ n→∞ oder an −→ ∞. Analog definieren wir lim an = −∞ und an −→ −∞. n→∞ Die Folge in Beispiel (iii) strebt gegen ∞. Um ein einfaches Kriterium für die Konvergenz einer Folge zu erhalten, führen wir die folgenden Begriffe ein. Definition 3.16 Eine Folge (an )n∈N heißt • beschränkt, falls ein M > 0 existiert mit |an | ≤ M für alle n ∈ N. • monoton wachsend, falls a1 ≤ a2 ≤ a3 ≤ . . .. Analog: streng monoton wachsend und (streng) monoton fallend. Satz 3.17 Eine monoton wachsende (oder fallende) Zahlenfolge ist • konvergent, falls sie beschränkt ist, • uneigentlich konvergent, falls sie unbeschränkt ist. Beispiele 3.18 (i) Die Folgen (an )n∈N und (bn )n∈N aus der Intervallschachtelung sind monoton wachsend beziehungsweise fallend und beschränkt durch |a0 |+|b0 |. Daher existieren lim an und lim bn . n→∞ 2 n→∞ 2 (ii) Die Folge (an )n∈N mit an = n ist monoton wachsend aber unbeschränkt, es gilt lim n = ∞. n→∞ n (iii) Die Folge (an )n∈N mit an = (−1) ist beschränkt, aber nicht monoton. Sie ist divergent. (iv) Die Folge (an )n∈N mit an = 2n ist monoton wachsend und unbeschränkt. Sie konvergiert daher uneigentlich gegen ∞. (v) Als etwas kompliziertere Beispiele seien die Folgen (an )n∈N und (bn )n∈N mit an = (1 + n1 )n und bn = (1 + n1 )n+1 betrachtet. Beide Folgen sind beschränkt (zum Beispiel durch 4). (an )n∈N ist monoton wachsend und (bn )n∈N ist monoton fallend. Beide Folgen sind also konvergent, und man kann zeigen, dass beide gegen e konvergieren. 48 Stetige Funktionen und Grenzwerte Wir fassen die wichtigsten Rechenregeln für Grenzwerte von Zahlenfolgen zusammen. n→∞ n→∞ Satz 3.19 (i) Sind (an )n∈N und (bn )n∈N konvergente Zahlenfolgen mit an −→ a und bn −→ b, sowie λ ∈ R, so gilt lim (λ + an ) = λ + a, n→∞ lim (λ · an ) = λ · a, n→∞ lim (an + bn ) = a + b, (3.2) n→∞ lim (an − bn ) = a − b, n→∞ lim (an · bn ) = a · b. n→∞ (ii) Ist zudem b 6= 0, so gilt lim n→∞ an a = . bn b (3.3) (iii) Ist zusätzlich zu (i) (wobei wir jetzt auch a = ±∞ und b = ±∞ erlauben wollen) noch an ≤ bn für alle n ∈ N, so gilt a ≤ b. n→∞ 1 n→∞ an (iv) Gilt |an | −→ ∞, so gilt lim = 0. n→∞ 1 n→∞ an (v) Ist an > 0, n ∈ N, und an −→ 0, so gilt lim (i) lim (1 + n1 )(5 − n−2 ) = lim (1 + n1 ) · lim (5 − n−2 ) = 5. Beispiele 3.20 n n→∞ n+1 (ii) lim = ∞. n→∞ n→∞ 1 n→∞ 1+(1/n) = lim n→∞ = ( lim (1 + n1 ))−1 = 1. n→∞ (iii) Es ist lim 2−n = 0, weil lim 2n = ∞. n→∞ n→∞ (iv) (an )n∈N und (bn )n∈N aus der Intervallschachtelung. Wegen |bn − an | = 2−n (b0 − a0 ) ist lim (bn − n→∞ an ) = 0. Nach dem Satz ist daher lim an = lim bn − lim (bn − an ) = lim bn . n→∞ (v) Sei an = − n1 und bn = lim bn . 1 n n→∞ n→∞ n→∞ für jedes n ∈ N. Dann ist an < bn für jedes n, aber lim an = 0 = n→∞ n→∞ 3.5 Grenzwerte von Funktionen Sei stets M ⊂ R und f : M → R eine reelle Funktion. Ferner sei stets a ∈ R oder a = ±∞ so gewählt, dass es eine Zahlenfolge (an )n∈N gibt mit an ∈ M \ {a}, n ∈ N, und a = lim an . n→∞ (3.4) Wir nennen einen solchen Wert a einen Häufungspunkt der Menge M . Etwas weniger formal als oben können wir sagen, dass a ein Häufungspunkt von M ist wenn beliebig nah an a Punkte von M liegen. Dabei muss a selbst nicht in M liegen, sondern kann gewissermaßen am Rande von M sein. Diese Annahmen an a wirken vielleicht auf den ersten Blick etwas unübersichtlich, daher kommen hier ein paar Beispiele, an die sich der Leser halten kann. 3.5 49 Grenzwerte von Funktionen (i) M = (2, 7). Dann ist jeder Wert a ∈ [2, 7] ein Häufungspunkt von M . (ii) M = (−∞, 0). Dann sind a = −∞ und jeder Wert a ∈ (−∞, 0] Häufungspunkte von M . (iii) M = R \ {0}. Dann sind a = ±∞ und jeder Wert a ∈ R ein Häufungspunkte von M . Definition 3.21 Eine Zahl A ∈ R (oder A = ±∞) heißt (uneigentlicher) Grenzwert von f für x → a, falls für jede Folge (an )n∈N mit an ∈ M \ {a} (n ∈ N) und lim an = a gilt n→∞ A = lim f (an ). (3.5) n→∞ Wir schreiben dann lim f (x) = A. x→a Ist a ∈ R und werden in (3.4) und (3.5) nur Folgen (an )n∈N mit an > a (beziehungsweise an < a), n ∈ N, betrachtet, so heißt A rechtsseitiger (beziehungsweise linksseitiger) Grenzwert von f für x → a. Wir schreiben dann lim f (x) = A oder lim f (x) = A, x→a+ x↓a beziehungsweise lim f (x) = A oder lim f (x) = A. x→a− x↑a Beispiele 3.22 (ii) (i) lim exp(x) = ∞, lim exp(x) = 0 x→∞ x→−∞ lim sin(x) = 1. x→π/2 1 2 x→0 x (iii) lim 1 x→0 x (iv) lim = ∞. existiert nicht, aber lim x1 = ∞ und lim x1 = −∞ . x↓0 x↑0 (v) lim sign(x) existiert nicht, aber lim sign(x) = 1 und lim sign(x) = −1. x→0 x↓0 x↑0 Satz 3.23 Ist I ein Intervall, f : I → R und a ∈ I ein innerer Punkt, dann gilt: A := lim f (x) x→a existiert genau dann, wenn links- und rechtsseitiger Grenzwert existieren und übereinstimmen lim f (x) = A = lim f (x). x↓a x↑a Den Zusammenhang zwischen den Grenzwerten von Funktionen und der Stetigkeit von Funktionen stellt der folgenden fundamentale Satz her. Satz 3.24 Eine Funktion f : M → R ist stetig in x0 ∈ M genau dann, wenn f (x0 ) = lim f (x). x→x0 50 Stetige Funktionen und Grenzwerte Beispiel 3.25 Für 0 < x < π ist (siehe Skizze) sin(x) ≤ x ≤ tan(x). Benutzen wir jetzt tan(x) = sin(x) cos(x) und teilen wir durch sin(x), so erhalten wir 1 x ≤ . sin(x) cos(x) 1≤ Bilden wir Kehrwerte, so kehren sich auch die Ungleichungen um: sin(x) ≥ cos(x). x 1≥ (3.6) Wegen sin(−x) = − sin(x) und cos(−x) = cos(x) gilt (3.6) für alle x mit |x| < ist lim cos(x) = cos(0). Also ist x→0 1 ≥ lim x→0 Mithin ist lim x→0 sin(x) x sin(x) ≥ cos(0) = 1. x = 1. Als Folgerung sehen wir, dass die Funktion sin(x) , x x 7→ 1, R → R, x 6= 0, x = 0, stetig in 0 ist. x tan(x) sin(x) 1 F IGUR . Zur Veranschaulichung von sin(x) ≤ x ≤ tan(x), x > 0. Der eingezeichnete Kreisbogen hat die Länge x. π 2. Da cos stetig bei 0 ist, 3.5 51 Grenzwerte von Funktionen Satz 3.26 Sei M ⊂ R und a ein Häufungspunkt von M sowie λ ∈ R. Seien, f, g : M → R Abbildungen, die für x → a einen Limes in R besitzen. Dann existieren auch die folgenden Limiten, und es gilt: lim (f ± g)(x) = lim f (x) ± lim g(x), x→a x→a x→a lim (λ f )(x) = λ lim f (x), x→a x→a lim (f · g)(x) = lim f (x) · lim g(x). x→a x→a x→a (1) (2) (3) Ist außerdem lim g(x) 6= 0, so gilt auch x→a lim f (x) f (x) = x→a . x→a g(x) lim g(x) lim x→a Bemerkung 3.27 Sind f : L → M und g : M → N stetig, so gilt für x0 ∈ L lim g ◦ f (x) = g lim f (x) = g ◦ f (x0 ). x→x0 x→x0 Also ist g ◦ f stetig. Das liefert einen alternativen Beweis für Satz 3.8. (4) 52 Stetige Funktionen und Grenzwerte Kapitel 4 Differentialrechnung von Funktionen einer Variablen 4.1 Einführung f(x) f’(x 0 ) Sei im Folgenden stets I ⊂ R ein offenes Intervall, f : I → R eine Abbildung und x0 ∈ I. Wir wollen die Steigung der Funktion f an der Stelle x0 bestimmen. Dazu müssen wir diesen Begriff erst einmal genau fassen. Eine Möglichkeit ist, die Steigung der (eindeutig festgelegten) Tangente an den Graphen von f an der Stelle (x0 , f (x0 )) zu definieren. Dies stößt allerdings in der praktischen Berechnung dieser Größe auf Schwierigkeiten. Etwas einfacher zu handhaben ist die Idee, dass man die Sekante durch (x0 , f (x0 )) sowie einen weiteren Punkt (x, f (x)) betrachtet. Wenn man x gegen x0 schiebt (von rechts oder links), so sollte die Steigung der Sekante immer näher an die Steigung der obigen Tangente geraten. 1 f(x0 ) x x0 Tangente an f mit Steigung der Ableitung f’ F IGUR . f(x)-f(x 0) x-x 0 1 x0 Sekante an f mit Steigung des Differenzenquotienten F IGUR . 53 x 54 Differentialrechnung von Funktionen einer Variablen Definition 4.1 Die Funktion f heißt differenzierbar in x0 , falls der Grenzwert x → x0 der Differenf (x) − f (x0 ) zenquotienten existiert und endlich ist. Wir schreiben dann x − x0 f 0 (x0 ) := lim x→x0 f (x0 + h) − f (x0 ) f (x) − f (x0 ) = lim h→0 x − x0 h und nennen f 0 (x0 ) die Ableitung von f an der Stelle x0 . Ist f in jedem Punkt x0 ∈ I differenzierbar, so heißt f differenzierbar schlechthin. Weitere Schreibweisen für die Ableitung sind f 0 (x0 ) = Beispiele 4.2 df d (x0 ) = f (x) = f˙(x0 ) = Df (x0 ). x=x0 dx dx (4.1) (i) I = R, f (x) = 5 + 3x, x0 ∈ R beliebig. Dann ist f (x) − f (x0 ) 5 + 3x − (5 + 3x0 ) 3(x − x0 ) = = = 3, x − x0 x − x0 x − x0 also ist f 0 (x0 ) = 3. Das soll natürlich auch so sein, denn die lineare Funktion f mit Steigung 3 muss wohl die Ableitung 3 haben, wenn wir keinen ganz groben Fehler gemacht haben. (ii) I = R, f (x) = x2 , x2 + 2hx0 + h2 − x20 f (x0 + h) − f (x0 ) h→0 = 0 = 2x0 + h −→ 2x0 . h h Also ist f 0 (x0 ) = 2x0 . √ (iii) I = (0, ∞), f (x) = x, √ √ √ √ √ √ x0 + h − x0 x0 + h + x0 x0 + h − x0 f (x0 + h) − f (x0 ) √ = = √ h h h x0 + h + x0 = x + h − x0 1 h→0 √0 √ −→ √ . 2 x0 h x0 + h + x0 (iv) I = R, f (x) = |x|. Für x0 = 0 ist f (x0 ) = 0 sowie lim x↓0 f (x) f (x) = 1 und lim = −1. x↑0 x x Also existiert der Grenzwert der Differenzenquotienten nicht, und damit ist f in x0 = 0 nicht differenzierbar. p (v) I = R, f (x) = sign(x) 3 |x| (das ist die Umkehrfunktion von x 7→ x3 ), sowie x0 = 0. Dann ist √ 3 2 f (x) − f (0) x lim = lim = lim x− 3 = ∞, x↓0 x↓0 x x↓0 x √ 3 2 f (x) − f (0) −x lim = lim = lim x− 3 = ∞. x↑0 x↑0 −x x↓0 x Der Grenzwert der Differenzenquotienten existiert also nur uneigentlich (das heißt, ist ∞). Mithin ist f in x0 = 0 nicht differenzierbar. 4.1 55 Einführung Satz 4.3 Ist f in x0 differenzierbar, dann existiert eine Funktion x 7→ εx0 (x) mit f (x) = f (x0 ) + f 0 (x0 ) · (x − x0 ) + εx0 (x) · (x − x0 ) und lim εx0 (x) = 0. x→x0 Beweis Setze εx0 (x) = f (x) − f (x0 ) − f 0 (x0 ). x − x0 2 Per Definition der Ableitung ist lim εx0 (x) = 0. x→x0 Satz 4.4 Ist f in x0 differenzierbar, so ist f in x0 stetig. Beweis lim f (x) = lim f (x0 ) + f 0 (x0 )(x − x0 ) + εx0 (x)(x − x0 ) x→x0 = f (x0 ) + lim f 0 (x0 )(x − x0 ) + lim εx0 (x)(x − x0 ) x→x0 x→x0 | {z } | {z } x→x0 =0 =0 = f (x0 ). 2 56 4.2 Differentialrechnung von Funktionen einer Variablen Ableitungen einiger wichtiger Funktionen In diesem Abschnitt soll eine Tabelle einiger wichtiger Funktionen (mit Definitionsbereich I) und ihrer Ableitungen angegeben werden. Zusammen mit den Rechenregeln für das Ableiten zusammengesetzter Funktionen lassen sich damit die allermeisten Funktionen von Hand differenzieren. f (x) f 0 (x) I c (konstant) 0 R xn , n ∈ N nxn−1 R xk , k ∈ Z \ {0} kxk−1 R \ {0} xr , r ∈ R √ x rxr−1 1 √ 2 x (0, ∞) exp(x) R (0, ∞) sin(x) exp(x) 1 x cos(x) cos(x) − sin(x) R 1 1 + tan(x)2 = cos(x)2 1 √ 1 − x2 −1 √ 1 − x2 1 1 + x2 R \ {(2k + 1) π2 , k ∈ Z} log(x) tan(x) arcsin(x) arccos(x) arctan(x) (0, ∞) R (−1, 1) (−1, 1) R Bemerkung 4.5 Wo die Funktionen komplexe Argumente zulassen, kann man formal auch z ∈ C statt x ∈ R einsetzen. Daraus lässt sich, wie wir noch sehen werden, ein nützlicher Kalkül entwickeln. 4.3 4.3 57 Rechenregeln für Ableitungen Rechenregeln für Ableitungen Satz 4.6 (Summen-, Produkt,- und Quotientenregel) Sind f, g : I → R differenzierbar, so lassen sich auch die folgenden Ableitungen bilden und es gilt (f + g)0 = f 0 + g 0 (f − g)0 = f 0 − g 0 (f g)0 = f 0 g + f g 0 0 f f 0 g − f g0 (x), (x) = g g2 Beispiele 4.7 wo g(x) 6= 0. (i) f (x) = x7 + 3x4 + 1, f 0 (x) = 7x6 + 12x3 . (ii) f (x) = x9 sin(x), f 0 (x) = 9x8 sin(x) + x9 cos(x). (iii) f (x) = x3 (x2 + cos(x)), f 0 (x) = 3x2 (x2 + cos(x)) + x3 (2x − sin(x)). (iv) f (x) = x7 tan(x) log(x) 0 f 0 (x) = 7x6 tan(x) log(x) + x7 tan(x) log(x) 1 1 log(x) + x7 tan(x) 2 cos(x) x 7 x log(x) = x6 tan(x) (7 log(x) + 1) + cos(x)2 = 7x6 tan(x) log(x) + x7 (v) f (x) = tan(x) = cos(x)2 − sin(x)(− sin(x)) 1 sin(x) 0 , f (x) = = . 2 cos(x) cos(x) cos(x)2 Satz 4.8 (Kettenregel) (i) Sind I, J ⊂ R offene Intervalle und f : I → J und g : J → R differenzierbar, so ist auch h = g ◦ f in I differenzierbar mit Ableitung h0 (x) = (g ◦ f )0 (x) = f 0 (x) · g 0 (f (x)). Die Sprechweise für diese Regel lautet oft: Innere Ableitung mal äußere Ableitung“. ” Ist f nur in x0 und g nur in f (x0 ) differenzierbar, so ist h in x0 differenzierbar. (ii) Ist speziell h(x) = g(λx) für ein λ ∈ R, so ist h0 (x) = λg 0 (λx). Beispiele 4.9 (i) h(x) = sin(x2 ), f (x) = x2 , g(x) = sin(x). Dann ist h0 (x) = f 0 (x) · g 0 (f (x)) = 2x cos(x2 ). 58 Differentialrechnung von Funktionen einer Variablen (ii) h(x) = 2x = exp(x · log(2)). Dann ist h0 (x) = log(2) exp(x log(2)) = log(2) · 2x . (iii) h(x) = q tan e−x2 = f1 (f2 (f3 (f4 (x)))), wobei f1 (x) = √ x, f2 (x) = tan(x), f3 (x) = ex , f4 (x) = −x2 , 1 f10 (x) = √ 2 x f20 (x) = 1 + tan(x)2 f30 (x) = ex f40 (x) = −2x. Sukzessive Anwendung der Kettenregel liefert h0 (x) = f40 (x) · f30 (f4 (x)) · f20 (f3 (f4 (x))) · f10 (f2 (f3 (f4 (x)))) 2 2 2 1 = −2x · e−x · 1 + tan e−x . · p 2 tan(e−x2 ) Noch allgemeiner als im Beispiel (iii) kann man Verknüpfungen von n Funktionen ableiten. Die genaue Regel gibt das folgende Korollar (=Schlussfolgerung des letzten Satzes) der Kettenregel an. Korollar 4.10 Ist n ∈ N und h(x) = f1 (f2 (· · · fn (x)) · · · ), wobei f1 , . . . , fn differenzierbar sind, so ist h differenzierbar mit Ableitung 0 0 h0 (x) = fn0 (x) · fn−1 (fn (x)) · fn−2 (fn−1 (fn (x))) · · · f10 (f2 (f3 (· · · fn (x)) · · · ). Ein weiteres wichtiges Korollar zur Kettenregel gibt an, wie die Ableitungen von Umkehrfunktionen aussehen. Korollar 4.11 Ist f : I → J umkehrbar und differenzierbar, so ist g := f −1 ebenfalls differenzierbar in allen Punkten x ∈ J mit f 0 (f −1 (x)) 6= 0, und es ist dort (f −1 )0 (x) = g 0 (x) = 1 f 0 (f −1 (x)) . Beweis Wir zeigen hier nicht die Differenzierbarkeit von f −1 , sondern lediglich, wie man die Ableitung von f −1 ausrechnet. Sei h(x) = f (f −1 (x)). Dann ist nach der Kettenregel h0 (x) = (f −1 )0 (x)·f 0 (f −1 (x)). Andererseits ist h(x) = x, also h0 (x) = 1, also 1 = f −1 · f 0 (f −1 (x)). Teilt man jetzt durch f 0 (f −1 (x)), so folgt die Aussage des Korollars. 2 Beispiele 4.12 Also ist (i) Die Logarithmusfunktion log ist die Umkehrfunktion der Exponentialfunktion exp . log0 (x) = 1 exp0 (log(x)) = 1 1 = . exp(log(x)) x Das erklärt die Formel aus der Tabelle in Abschnitt 4.2. 4.4 59 Zwei Anwendungen (ii) Wir benutzen die Identität sin(x)2 + cos(x)2 = 1, um zu zeigen, dass 1 sin (arcsin(x)) 1 = cos(arcsin(x)) 1 1 . =p =√ 2 1 − x2 1 − sin(arcsin(x)) arcsin0 (x) = 4.4 0 Zwei Anwendungen Wir kommen jetzt zu zwei kleinen Anwendungen des bisher Gelernten. 4.13 Beispiel Wir wollen uns den Kalkül der Ableitungen mit komplexen Argumenten zu Nutze machen, um die Ableitungen von sin und cos zu bestimmen. Betrachte die Funktion f : C → C, z 7→ exp(iz). Nach den formalen Rechenregeln können wir f differenzieren f 0 (z) = i · exp(iz) = i · f (z). Setzen wir jetzt für z reelle Werte x ein, so ist f (x) = cos(x) + i sin(x) (4.2) f 0 (x) = i · f (x) = − sin(x) + i cos(x) (4.3) und Wenn wir andererseits in (4.2) direkt ableiten, so erhalten wir nach der Summenformel f 0 (x) = cos0 (x) + i sin0 (x). (4.4) Da Real- und Imaginärteil in (4.3) und (4.4) übereinstimmen müssen, ist cos0 (x) = − sin(x) und sin0 (x) = cos(x). Wir haben so mit Hilfe der komplexen Zahlen einen schnellen Weg gefunden, um die Winkelfunktionen zu differenzieren. In der Tabelle in Abschnitt 4.2 haben wir jetzt also alle Einträge aus den beiden Funktionen x 7→ xr und x 7→ exp(x) und den Rechenregeln herleiten können. 4.14 Beispiel Wir betrachten das Problem, dass wir die Stoffkonzentration f (t) des Ausgangsstoffes bei einer Zerfallsreaktion erster Ordnung aus elementaren Überlegungen heraus als Funktion der Zeit t angeben wollen. Der Stoffumsatz f (t)−f (t+h) soll für kleine Zeiten h in etwa proportional zur vorhandenen Konzentration f (t) sowie zur verstreichenden Zeit h sein. Also f (t) − f (t + h) ≈ k · hf (t) für kleine h > 0 und eine Konstante k > 0. Lösen wir dies nach f (t + h) auf, so erhalten wir f (t + h) ≈ (1 − kh)f (t). 60 Differentialrechnung von Funktionen einer Variablen Speziell ist also f (h) ≈ (1 − kh)f (0) und f (2h) ≈ (1 − kh)f (h) ≈ (1 − kh)2 f (0) sowie f (nh) ≈ (1 − kh)n f (0). Setzen wir t = nh, also n = ht , so erhalten wir f (t) ≈ (1 − kh)t/h . f (0) Dabei sollte hier Gleichheit herrschen, wenn wir h nach 0 gehen lassen, also f (t) = lim(1 − kh)t/h . h↓0 f (0) (4.5) Schreiben wir jetzt ax um als exp(x log(a)) und benutzen in der zweiten Gleichung die Stetigkeit der Exponentialfunktion, so erhalten wir t f (t) = lim exp log(1 − kh) h↓0 f (0) h t = exp lim log(1 − kh) h↓0 h =0 z }| { log(1 − kh) − log(1) = exp t lim h↓0 h = exp(tg 0 (0)), k , also wobei wir g(x) = log(1 − kx) gesetzt haben. Wir können die Ableitung ausrechnen g 0 (x) = − 1−kx 0 g (0) = −k, und erhalten so das klassische Gesetz für Reaktionen erster Ordnung f (t) = exp(−kt). f (0) 4.5 (4.6) Die de L’Hospital’sche Regel Als wir in Beispiel 3.25 auf Seite 50 den Grenzwert lim sin(x) bestimmt hatten, mussten wir uns erheblich x x→0 anstrengen und geometrische Hilfsmittel benutzen. Wir suchen nun nach einem systematischen Verfahren, um Grenzwerte vom Typ f (x) lim x→a g(x) zu bestimmen, wenn f (a) = g(a) = 0 ist. 4.6 61 Höhere Ableitungen Satz 4.15 (de l’Hospital’sche Regel) Sei I ⊂ R ein Intervall und f, g : I → R differenzierbar, sowie a ∈ I ein innerer Punkt mit f (a) = g(a) = 0. Dann ist f (x) f 0 (x) = lim 0 , x→a g(x) x→a g (x) lim (4.7) falls der Grenzwert existiert. Ist a ein Randpunkt von I (beziehungsweise a = −∞ oder a = ∞, falls I unbeschränkt ist), und ist • lim f (x) = lim g(x) = 0 x→a x→a • oder lim f (x) = ±∞ und lim g(x) = ±∞, x→a x→a so gilt ebenfalls (4.7). Dasselbe gilt analog für einseitige Grenzwerte (also x ↑ a und x ↓ a) Beispiele 4.16 (ii) lim x→0 cos(x) sin(x) = lim = 1. x→0 x 1 (i) sin0 (0) = lim x→0 1 − cos(x) sin(x) 1 = lim = . x→0 2x x2 2 1 log(x) = lim x = −1. x→1 1 − x x→1 −1 (iii) lim log(x) √ = lim x→∞ x→∞ x (iv) lim (v) lim x log(x) = lim x↓0 x↓0 1 x 1 √ 2 x log(x) 1 x 2 = lim √ = 0. x→∞ x 1 x x↓0 − 12 x = lim = lim(−x) = 0. x↓0 ex − x − 1 ex − 1 ex 1 (vi) lim = lim = lim = . Hier wurde die de l’Hospital’sche Regel zweimal 2 x→0 x→0 x→0 2 x 2x 2 hintereinander angewendet. 4.6 Höhere Ableitungen Sei I ⊂ R ein Intervall und f : I → R eine differenzierbare Funktion. Wir haben bisher die Ableitung f 0 von f kennen gelernt. Ist f 0 selber jedoch wieder differenzierbar, so kann uns nichts daran hindern, diese Funktion auch abzuleiten. Definition 4.17 (Höhere Ableitungen) Ist die Ableitung f 0 von f differenzierbar, so heißt die Ableitung f 00 von f 0 die zweite Ableitung von f oder die Ableitung zweiter Ordnung von f . Wir können dies Verfahren fortführen, solange die jeweilige Ableitung differenzierbar ist und nennen die Funktionen f 000 , f 0000 usw. die dritte, vierte usw. Ableitung von f , oder die Ableitung dritter, vierter usw. Ordnung. 62 Differentialrechnung von Funktionen einer Variablen Die Ableitung n-ter Ordnung wird auch bezeichnet mit f (n) (x) = dn f (x) = Dn f (x). dxn Die Funktion f heißt n-mal differenzierbar, wenn wir die n-te Ableitung bilden können. Ist f (n) stetig, so heißt f n-mal stetig differenzierbar. Beispiel 4.18 Bezeichnet f (t) die Position eines Fahrzeugs auf einer Straße zur Zeit t, so ist f 0 (t) die Geschwindigkeit des Fahrzeugs und f 00 (t) seine Beschleunigung. Kapitel 5 Kurvendiskussion von Funktionen einer Variablen Eine der wichtigsten Anwendungen der Differentialrechnung ist es zu bestimmen, wo eine Funktion minimal beziehungsweise maximal wird. Wir definieren im ersten Abschnitt die Begriffe, bringen sie im nächsten Abschnitt in Zusammenhang mit den Monotonieeigenschaften der Funktion und stellen in einem dritten und vierten Abschnitt zusammen, wo die Verbindung zu den Ableitungen der Funktion ist. Schließlich wird die Diskussion in einem fünften Abschnitt zusammengefasst und eine Art Checkliste angegeben für die Fragen, die durch die Kurvendiskussion beantwortet werden sollen. 5.1 Extremalstellen Definition 5.1 (Extremalstellen) Sei f : M → R eine Funktion. Eine Zahl m∗ ∈ R heißt Maximum von f , symbolisch m∗ = max(f ), falls f (x) ≤ m∗ für alle x ∈ M (5.1) für (wenigstens) ein x∗ ∈ M. (5.2) und f (x∗ ) = m∗ Die (im allgemeinen nicht eindeutige) Zahl x∗ heißt Maximalstelle von f , symbolisch x∗ = arg max(f ). Man sagt, dass f in x∗ das Maximum annimmt, oder dass f in x∗ das Maximum hat. Analog wird das Minimum m∗ = min(f ) von f definiert und die Minimalstelle x∗ = arg min(f ) (mit dem ≥“–Zeichen in (5.1)). ” Beide Punkte x∗ und x∗ werden Extremalstellen genannt. Beispiele 5.2 (i) M = [0, 2π], f (x) = sin(x). Dann ist m∗ = 1, x∗ = π 2 und m∗ = −1, x∗ = 3π . 2 Bei dem hier gewählten Intervall [0, 2π] sind die Punkte x∗ und x∗ eindeutig bestimmt. 63 64 Kurvendiskussion von Funktionen einer Variablen (ii) M = R, f (x) = cos(x). Dann ist m∗ = 1, x∗ ∈ {2k · π, k ∈ Z} = Menge der Maximalstellen und m∗ = −1, x∗ ∈ {(2k + 1) · π, k ∈ Z} = Menge der Minimalstellen. (iii) M = R, f (x) = x2 − 2x = (x − 1)2 − 1. Dann ist m∗ = −1 und x∗ = 1, jedoch gibt es keine Maximalstelle. (iv) M = − π2 , π2 , f (x) = tan(x). Es gibt keine Extremalstellen. (v) M = R, f (x) = exp(−x2 ). Dann ist m∗ = 1, x∗ = 0, jedoch gibt es keine Minimalstelle. In der Tat ist lim exp(−x2 ) = 0. Andererseits ist exp(−x2 ) > 0 für jedes x ∈ R. Somit käme für das x→∞ Minimum nur 0 als Wert in Frage, dieser Wert wird jedoch nicht angenommen. Es tritt öfter der Fall ein, dass eine Funktion lokal, also in einer kleinen Umgebung betrachtet, ein Maximum (oder Minimum) annimmt, das jedoch global betrachtet (also im gesamten Definitionsbereich gesehen) keines ist. f (x) = x4 − 2x2 + 1 2 1.5 1 0.5 –1.5 –1 –0.5 0 0.5 x 1 1.5 F IGUR . f nimmt in 0 ein lokales Maximum an, das jedoch global kein Maximum ist. Dies motiviert die folgende Definition. Definition 5.3 (lokale Extremalstellen) Ist M ⊂ R, so heißt x∗ ∈ M eine lokale Minimalstelle von f : M → R, falls es ein ε > 0 gibt mit f (x) ≥ f (x∗ ) für alle x ∈ Uε (x∗ ) ∩ M. (5.3) f (x∗ ) heißt dann lokales Minimum von f . Ein lokales Minimum heißt isoliert, falls in (5.3) die strikte Ungleichung gilt (für x 6= x∗ ). Analog definieren wir lokale Maximalstelle, lokales Maximum, isoliertes lokales Maximum, sowie lokale Extremalstelle usf. 5.2 65 Monotonie Manchmal spricht man zur Unterscheidung von lokalen Extrema zu Extrema in letzterem Fall auch von globalen Extrema. 5.4 Beispiel M = R, f (x) = x4 − 2x2 + 1. Die Funktion nimmt in 0 ein lokales Maximum an, denn f (x) < f (0) = 1 für jedes x ∈ R mit 0 < |x| < 1, also für jedes x ∈ Uε (x∗ ) \ {0}, wobei x∗ = 0 und ε = 1. Die lokale Maximalstelle x∗ = 0 ist also auch isoliert. Dieses lokale Maximum ist kein globales Maximum, weil beispielsweise f (2) = 9 > 1 = f (0). Zumindest auf abgeschlossenen Intervallen und bei stetigen Funktionen brauchen wir uns keine Sorgen um die Existenz von Extremalstellen zu machen. Auskunft gibt der folgende Satz, der hier nicht bewiesen werden kann. Satz 5.5 Ist f : [a, b] → R stetig, so nimmt f Minimum und Maximum an. Um Extremalstellen nachzuweisen, sind die ersten und zweiten Ableitungen einer Funktion (falls existent) hilfreich. Ein erster Schritt ist der folgende Satz. Satz 5.6 Sei I ⊂ R ein Intervall, c ∈ I ein innerer Punkt und f : I → R eine in c differenzierbare Funktion. Hat f in c eine lokale Extremalstelle, so ist f 0 (c) = 0. Beweis Ohne Einschränkung der Allgemeinheit sei hier nur der Fall betrachtet, wo c eine lokale Maximalstelle ist. Dann ist für x hinreichend nahe an c: f (x) − f (c) ≤ 0, also 0 ≤ lim x↑c f (x) − f (c) f (x) − f (c) = f 0 (c) = lim ≤ 0. x↓c x−c x−c Also ist f 0 (c) = 0. 2 Beispiele 5.7 (i) I = R, f (x) = x2 − 2x, x∗ = 1 Minimalstelle. Es ist f 0 (x) = 2x − 2, also f 0 (x∗ ) = 2x∗ − 2 = 0. (ii) I = R, f (x) = exp(−x2 ), x∗ = 0 Minimalstelle. Es ist f 0 (x) = −2x exp(−x2 ), also f 0 (x∗ ) = 0. 1 (iii) I = R, f (x) = arctan(x), f 0 (x) = 1+x 2 > 0. Da die erste Ableitung keine Nullstelle hat, hat f keine (lokalen oder globalen) Extremalstellen. (iv) Hat f in einem Randpunkt des Intervalls ein lokales Extremum, so muss dort die (einseitige) Ableitung nicht notwendigerweise verschwinden. Seien nämlich I = [0, 1] und f (x) = x. Dann hat f in x∗ = 1 eine Maximalstelle, aber f 0 (x) = 1 verschwindet nirgends. (v) Die Umkehrung des Satzes gilt nicht: Sei I = R und f (x) = x3 . Dann ist f 0 (x) = 3x2 und f 0 (x) = 0. Jedoch hat f in 0 kein lokales Extremum, weil f (x) < 0 für x < 0 und f (x) > 0 für x > 0. 5.2 Monotonie Wir wollen hier die Monotonieeigenschaften einer differenzierbaren Funktion näher betrachten. Zunächst brauchen wir ein paar vorbereitende Sätze. 66 Kurvendiskussion von Funktionen einer Variablen Satz 5.8 (Satz von Rolle) Sei f : [a, b] → R stetig und in (a, b) differenzierbar sowie f (a) = f (b). Dann gibt es ein c ∈ (a, b) mit f 0 (c) = 0. Beweis Da f stetig ist, nimmt f das Minimum m∗ sowie das Maximum m∗ in [a, b] an (Satz 5.5). Ist m∗ = m∗ , so ist wegen m∗ ≤ f (x) ≤ m∗ für jedes x ∈ [a, b] auch f (x) = f (a) = f (b) = m∗ = m∗ . Damit ist f konstant, also f 0 (x) = 0 für jedes x ∈ (a, b). Ist andererseits m∗ < m∗ , so ist entweder m∗ < f (a) oder m∗ > f (a), oder beides. Betrachten wir den Fall m∗ < f (a). Dann gibt es ein x∗ ∈ (a, b) mit f (x∗ ) = m∗ . Weil x∗ eine Minimalstelle von f und ein innerer Punkt von [a, b] ist, ist f 0 (x∗ ) = 0 nach Satz 5.6. Der Fall m∗ > f (a) funktioniert genauso. 2 5.9 Beispiel f : [−1, 1] → R, f (x) = x4 −2x2 . Dann ist f (−1) = f (1) = −1. Weiter ist f 0 (x) = 4x3 −4x und damit f 0 (0) = 0. Korollar 5.10 (Mittelwertsatz der Differentialrechung) Ist f : [a, b] → R stetig und in (a, b) differenzierbar, so existiert ein c ∈ (a, b) mit f (b) − f (a) . f 0 (c) = b−a Beweis Setze h(x) = f (x) − (x − a) Dann ist h(a) = f (a), h(b) = f (b) − (b − a) h0 (c) = 0. Es ist aber f (b) − f (a) . b−a f (b) − f (a) = f (a) = h(a). Also existiert ein c ∈ (a, b) mit b−a h0 (x) = f 0 (x) − also f 0 (c) = f (b) − f (a) , b−a f (b) − f (a) . b−a 2 Korollar 5.11 Ist f : [a, b] → R stetig und in (a, b) differenzierbar mit Ableitung f 0 (x) = 0 für alle x ∈ (a, b), so ist f konstant: f (x) = f (a) = f (b) für alle x ∈ [a, b]. Eine weitere wichtige Schlussfolgerung aus dem Mittelwertsatz gibt uns an, wie der Zusammenhang zwischen der Monotonie einer Abbildung und dem Vorzeichen ihrer Ableitung ist. Aufgrund der Wichtigkeit der Aussage formulieren wir sie hier als Satz. Satz 5.12 Sei I ⊂ R ein Intervall und f : I → R stetig und (im Inneren von I) differenzierbar. Dann gilt (i) f 0 (x) ≥ 0 für alle inneren Punkte x ∈ I ⇐⇒ f ist monoton wachsend f 0 (x) ≤ 0 für alle inneren Punkte x ∈ I ⇐⇒ f ist monoton fallend f 0 (x) > 0 für alle inneren Punkte x ∈ I =⇒ f ist streng monoton wachsend f 0 (x) < 0 für alle inneren Punkte x ∈ I =⇒ f ist streng monoton fallend (ii) 5.3 67 Bestimmung der Extremalstellen Beispiele 5.13 (i) I = R, f (x) = arctan(x). Dann ist f 0 (x) = streng monoton wachsend. 1 1+x2 > 0. Also ist die Funktion arctan (ii) I = R, f (x) = exp(x). Dann ist f 0 (x) = exp(x) > 0, also exp streng monoton wachsend. (iii) I = R, f (x) = x2 . Dann ist f 0 (x) = 2x. Die Ableitung ist strikt negativ für x < 0 und strikt positiv für x > 0. Wir wenden also den Satz für (−∞, 0] und [0, ∞) und erhalten, dass f streng monoton 1 fallend ist in (−∞, 0] und streng monoton wachsend in [0, ∞). 0.8 (iv) I = R, f (x) = (1 − sign(x))x2 . Dann ist 4x, falls x ≤ 0, 0 f (x) = 0, falls x > 0. 0.6 y 0.4 0.2 Also ist f 0 (x) ≤ 0 für alle x ∈ R und damit f monoton fallend. –1 Allerdings ist f nicht streng monoton fallend, da f (x) = 0 für alle x ≥ 0. –0.8 –0.6 –0.4 –0.2 0 0.2 0.4 0.6 F IGUR . f (x) = (1 − sign(x))x2 (v) I = R, f (x) = x3 . Dann ist f 0 (x) = 3x2 ≥ 0. Also ist f monoton wachsend. Man kann sogar zeigen, dass f streng monoton wachsend ist, aber dies liefert unser Satz nicht, denn f 0 (0) = 0, also haben wir nicht die strikte Ungleichung, die in Teil (ii) des Satzes benötigt wurde. 5.3 Bestimmung der Extremalstellen Wir haben in Abschnitt 5.1 gesehen, dass lokale Extremalstellen einer differenzierbaren Funktion nur dort vorliegen, wo die Ableitung verschwindet. Wie das Beispiel f (x) = x3 zeigt, wo f 0 (0) = 0 ist, jedoch kein lokales Extremum in 0 vorliegt, müssen wir zusätzliche Informationen über f haben, um eine Extremalstelle zu detektieren. Ist c eine Stelle, sodass f links von c monoton wachsend ist und rechts von c monoton fallend, so liegt in c offenbar ein lokales Maximum vor. Nach den Ergebnissen des letzten Abschnitts geht dies mit einem Vorzeichenwechsel von f 0 einher. Wir wollen zunächst den Begriff des Vorzeichenwechsels präzise fassen und dann das hier anschaulich gewonnene Ergebnis in einem Satz formulieren. Definition 5.14 Sei I ⊂ R ein Intervall und a ∈ I ein innerer Punkt. Wir sagen, dass das Vorzeichen einer Funktion g : I → R im Punkt a von − nach + wechselt, falls g(a) = 0 und lim sign(g(x)) = −1, x↑a 0.8 x –0.2 lim sign(g(x)) = +1, x↓a falls also: für alle x < a hinreichend nahe an a gilt g(x) < 0 und für alle x > a hinreichend nahe an a gilt g(x) > 0. Analog führen wir die Sprechweise ein, dass das Vorzeichen von + nach − wechselt. Lemma 5.15 Ist g differenzierbar und g(a) = 0, g 0 (a) > 0 (beziehungsweise g 0 (a) < 0), so wechselt das Vorzeichen von g in a von − nach + (beziehungsweise von + nach −). Beispiele 5.16 (i) I = R, g(x) = x2 − 1, a = −1. Dann ist g 0 (x) = 2x und g(−1) = 0, g 0 (−1) = −2 < 0. Das Vorzeichen wechselt also in −1 von + nach −. 1 68 Kurvendiskussion von Funktionen einer Variablen (ii) I = R, g(x) = x3 , a = 0. Das Vorzeichen wechselt in 0 von − nach +, jedoch ist g 0 (0) = 0. Das Kriterium in dem Lemma ist also nur hinreichend und nicht notwendig. Satz 5.17 Sei f : I → R differenzierbar und a ∈ I ein innerer Punkt mit f 0 (a) = 0. (i) Ist f sogar zweimal differenzierbar und f 00 (a) < 0 (beziehungsweise f 00 (a) > 0), so hat f in a ein isoliertes lokales Maximum (beziehungsweise Minimum). (ii) Wechselt das Vorzeichen von f 0 in a von + nach − (beziehungsweise von − nach +), so hat f in a ein isoliertes lokales Maximum (beziehungsweise Minimum). (iii) Hat die Funktion f 0 in a ein isoliertes lokales Extremum, so hat f in c kein lokales Extremum. Offenbar folgt aus (i) schon (ii) (Lemma 5.15). Fall (ii) tritt also häufiger auf. In der Praxis ist jedoch (i) oftmals einfacher zu prüfen. Man wird also so vorgehen (um bei hinreichend oft differenzierbaren Funktionen ein lokales Extremum im Inneren des Definitionsbereichs zu detektieren): 5.18 Rezept (zur lokalen Extremalstellenanalyse im Inneren des Definitionsbereichs) (1) Man prüft, ob f zweimal differenzierbar ist. Ist dies der Fall und die Ableitung ohne größere Umstände zu berechnen, so prüft man, ob f 00 (a) < 0 (beziehungsweise f 00 (a) > 0). Ist dies richtig, so hat f in a ein isoliertes lokales Maximum (beziehungsweise Minimum). (2) Führt (1) nicht zum Erfolg, so prüft man, ob f 0 in a das Vorzeichen wechselt. Ist dies der Fall, so hat f in a ein isoliertes lokales Extremum, und man ist fertig. (3) Führen weder (1) noch (2) zu einem Ergebnis, so hat f vermutlich (aber nicht sicher) in a kein isoliertes lokales Extremum. Um dies nachzuweisen, muss man testen, ob f 0 in a ein isoliertes lokales Extremum hat. Dazu geht man wie oben vor, nur eben für f 0 statt für f . Hat jetzt f 0 in a ein isoliertes lokales Extremum, so hat f in a kein ein isoliertes lokales Extremum, und man ist fertig. (4) Bringen weder (1), (2) noch (3) ein Ergebnis, dann wird die Sache wirklich schwierig. Hier gibt es dann keine Patentrezepte mehr und man muss sich neue Methoden überlegen. (5) Ein paar der üblichen verdächtigen“ Stellen, die man zudem prüfen sollte, sind ” (a) die Intervallenden, (b) die Nicht-Differenzierbarkeitsstellen, (c) die Nullstellen der Ableitungen an den Differenzierbarkeitsstellen. Diese Stellen muss man, bei (c) eventuell mit (1)–(4), individuell untersuchen. (6) Interessiert man sich nur für globale Extremalstellen einer stetigen Funktion auf einem abgeschlossenen Intervall und gibt es nur wenige Kandidaten der Typen (a), (b), (c) (es reicht auch, wenn einzelne Punkte nur im Verdacht stehen, zu einem der drei Typen zu gehören, solange man nur alle tatsächlich dazu gehörigen erfasst), dann braucht man nur die Funktionswerte dieser Kandidaten zu vergleichen und die mit dem Kleinsten bzw. dem Größten heraus zu picken. Ist das Definitionsintervall nicht abgeschlossen, so muss man zusätzlich noch das Grenzverhalten an den offenen Intervallenden untersuchen. 5.4 Krümmung 69 Beispiele 5.19 (i) I = R, f (x) = cos(x), a = 0. Die erste und zweite Ableitung sind f 0 (x) = − sin(x) 00 und f (x) = − cos(x). Also ist f 0 (0) = 0 und f 00 (0) = −1 < 0. Nach Punkt (1) unseres Rezeptes haben wir also ein isoliertes lokales Maximum von f bei a = 0 festgestellt. (ii) I = R, f (x) = x2 , a = 0. Die erste und zweite Ableitung sind f 0 (x) = 2x und f 00 (x) = 2. Also ist f 0 (0) = 0 und f 00 (0) = 2 > 0. Nach Punkt (1) unseres Rezeptes haben wir also ein isoliertes lokales Minimum von f bei a = 0 festgestellt. (iii) I = R, f (x) = x4 , a = 0. Dann ist f 0 (x) = 4x3 und f 00 (x) = 12x2 . Also ist f 0 (0) = 0 und f 00 (0) = 0. Punkt (1) unseres Rezeptes bringt kein Ergebnis, wir machen also bei Punkt (2) weiter. Für x < 0 ist f 0 (x) < 0 und für x > 0 ist f 0 (x) > 0. Also wechselt f 0 in 0 das Vorzeichen von − nach +. Ergebnis: f hat in 0 ein isoliertes lokales Minimum. (iv) I = (− π2 , π2 ), f (x) = tan(x)−x, a = 0. Die ersten beiden Ableitungen sind f 0 (x) = 1+(tan(x))2 − 1 = (tan(x))2 und (nach der Kettenregel) f 00 (x) = 2 tan(x)((tan(x))2 + 1). Wegen tan(0) = 0 ist f 0 (0) = tan(0)2 = 0 und f 00 (0) = 0. Also führt Punkt (1) zu keinem Ergebnis. Weiter geht es mit Punkt (2): Für x 6= 0 ist tan(x) 6= 0, also f 0 (x) > 0. Mithin wechselt f 0 in 0 nicht das Vorzeichen. Punkt (2) schlägt also auch fehl. Bei Punkt (3) stellen wir fest, dass f 0 (x) das globale Minimum 0 genau in dem einen Punkt x = 0 annimmt (klar, denn f 0 (x) > 0 für alle anderen x). Also hat f in 0 kein isoliertes lokales Extremum. p (v) Sei I = − 21 , 1 , f : I → R, x 7→ |x| + x. Für x ∈ I \ {0} hat man f 0 (x) = sign(x) · 2√1 x + 1, für x = 0 ist f nicht differenzierbar. Einzige Nullstelle von f 0 auf I \ {0} ist x = − 41 . Damit ergeben sich als Kandidaten für globale Extremalstellen: 0, − 14 sowie die Intervallenden − 12 , und q 1. Die zugehörigen Funktionswerte sind 0, 14 , 12 − 12 ≈ 0.2071 und 2. Damit ist 0 mit f (0) = 0 globale Minimalstelle und 1 mit f (1) = 2 globale Maximalstelle. Weitere Untersuchungen würden ergeben, dass − 21 lokale Minimalstelle und − 14 lokale Maximalstelle ist. Bemerkung 5.20 Kann man eine Extremalstelle nicht explizit ausrechnen, so muss man sich anders behelfen, beispielsweise mit einem Intervallschachtelungsverfahren. Hat man so, beispielsweise, die lokale Minimalstelle x∗ von f im Intervall [a, b] nachgewiesen (also mit einem Fehler von höchstens b − a), so ist (a) 1 0 | ≤ b−a |m∗ − f (b)+f 2 2 max{|f (x)| : x ∈ [a, b]}. Als Näherungswert bietet sich also 2 (f (a) − f (b)), b−a 0 mit Fehler ≤ 2 max{|f (x)| : x ∈ [a, b]} an. 5.4 Krümmung Ist der Graph einer Funktion f nach links gekrümmt, wie beispielsweise bei f (x) = x2 , so wollen wir f konvex nennen. Ist andererseits der Graph nach rechts gekrümmt, so wollen wir f konkav nennen. Diese Begriffe sind etwas willkürlich, und man muss sie an dieser Stelle schlicht auswendig lernen. Wir müssen jetzt mathematisch präziser fassen, was wir mit der Redeweise nach links gekrümmt“ bezie” hungsweise nach rechts gekrümmt“ meinen. ” 70 Kurvendiskussion von Funktionen einer Variablen f Verbindungsgerade G f(b) f(a) a Konvexe Funktion f x b Definition 5.21 Sei I ⊂ R ein Intervall und f : I → R eine Funktion. und a, b ∈ I, a < b. Wir nennen die Funktion f • konvex, falls für jedes Teilintervall [a, b] ⊂ I und jedes x ∈ [a, b] der Punkt (x, f (x)) unter der Verbindungsgeraden G von (a, f (a)) und (b, f (b)) liegt, falls also f (x) ≤ f (a) + x−a f (b) − f (a) b−a für alle x ∈ [a, b]. (5.4) • konkav, falls für jedes Teilintervall [a, b] ⊂ I und jedes x ∈ [a, b] der Punkt (x, f (x)) über der Verbindungsgeraden G von (a, f (a)) und (b, f (b)) liegt, falls also f (x) ≥ f (a) + x−a f (b) − f (a) b−a für alle x ∈ [a, b]. (5.5) Ist J ⊂ I ein Teilintervall und gelten die obigen Aussagen nur für Teilintervalle [a, b] ⊂ J, so heißt f konvex (beziehungsweise konkav) über J. Wir sprechen von strikter Konvexität (beziehungsweise Konkavität), falls in (5.4) (beziehungsweise (5.5)) die strikte Ungleichung gilt (für x ∈ (a, b)). Der Begriff der Striktheit der Konvexität beziehungsweise Konkavität steht für uns nicht im Mittelpunkt und wird gleichsam nur am Rande erwähnt. Obacht !! In einer in Bayern gebräuchlichen mathematischen Formelsammlung für das Gymnasium sind die Definitionen der Begriffe konvex“ und konkav“ genau umgekehrt. ” ” Den Zusammenhang zwischen den gerade eingeführten Begriffen und der zweiten Ableitung einer Funktion stellt der folgende Satz her. Satz 5.22 Ist f : I → R zweimal differenzierbar, so ist f • konvex genau dann, wenn f 00 (x) ≥ 0 für alle inneren Punkte x ∈ I. 5.4 71 Krümmung • konkav genau dann, wenn f 00 (x) ≤ 0 für alle inneren Punkte x ∈ I. Beispiele 5.23 konvex). (i) I = R, f (x) = x2 , f 00 (x) = 2 > 0. Also ist f konvex (tatsächlich sogar strikt (ii) I = R, f (x) = sin(x). f 00 (x) = − sin(x). In [0, π] ist − sin(x) ≤ 0, also sin konkav (tatsächlich sogar strikt konkav). In [π, 2π] ist − sin(x) ≥ 0, also sin konvex (tatsächlich sogar strikt konvex). (iii) I = (0, ∞), f (x) = log(x). Dann ist f 0 (x) = x1 , f 00 (x) = − x12 < 0. Also ist log strikt konkav. (iv) I = R. f (x) = |x| ist konvex, aber in 0 nicht differenzierbar. Außerdem ist f nicht strikt konvex. Definition 5.24 Ist c ∈ I ein innerer Punkt und f konvex (beziehungsweise konkav) auf einem Teilintervall [a, c] sowie konkav (beziehungsweise konvex) auf einem Teilintervall [c, b], so heißt c ein Wendepunkt von f. Satz 5.25 Ist f zweimal differenzierbar und wechselt f 00 in c das Vorzeichen, so ist c ein Wendepunkt von f. Beispiel 5.26 I = R, f (x) = x4 − 2x2 + 1 (siehe Figur auf Seite 64). Die erste und zweite Ableitung sind q f 0 (x) = 4x3 − 4x und f 00 (x) = 12x2 − 4 = 12 x2 − 13 . Also ist genau dann f 00 (x) < 0, wenn |x| < 13 q q q 1 und genau dann f 00 (x) > 0, wenn |x| > 13 . Es folgt, dass f über − ∞, − 13 und 3 , ∞ konvex q q q q ist, über − 13 , 13 aber konkav. Also besitzt f zwei Wendepunkte: bei − 13 mit f − 13 = 49 q q 1 und bei 13 mit f = 94 . 3 72 Kurvendiskussion von Funktionen einer Variablen 5.5 Programm: Kurvendiskussion Das Zusammentragen sämtlicher relevanter Daten einer Funktion f bezeichnet man als Kurvendiskussion. Was relevant ist (und was nicht), hängt natürlich vom Einzelfall sowie der Interessenlage des Betrachters, also von der jeweiligen Anwendung, die man im Blick hat, ab. Typischerweise umfasst die Kurvendiskussion wenigstens die Angabe der folgenden Informationen. (1) Falls nur die Vorschrift x 7→ f (x) vorgegeben ist, muss ein sinnvoller maximaler Definitionsbereich angegeben werden. 1 2 x→∞ x (2) Verhalten von f an den Rändern des Definitionsbereiches. Also beispielsweise lim 0 und lim 12 x→0 x 1 2 x→−∞ x = 0, lim = ∞. (3) Nullstellen. (4) Stetigkeit/Unstetigkeit von f . (5) Differenzierbarkeit, gegebenenfalls Ausnahmestellen. (6) Monotonieverhalten. (7) Lage und Art der Extremalstellen (mit Angabe der Funktionswerte). (8) Der Wertebereich von f . (9) Krümmungsverhalten von f (Konkavitäts- und Konvexitätsbereiche, Wendepunkte). (10) Skizze des Graphen an Hand dieser Informationen • Manchmal kommt die Angabe besonderer Eigenschaften hinzu, wie beispielsweise f ungerade“ ” (d.h. f (−x) = −f (x) wie bei f (x) = sin(x)), f gerade“ (d.h. f (−x) = f (x) wie bei f (x) = ” cos(x)), Periodizität oder Ähnliches. Wir führen das Programm der Kurvendiskussion im Folgenden an drei Beispielen durch. = 5.5 73 Krümmung Beispiel 5.27 Sei f (x) = x4 − 2x2 + 1. (1) f ist ein Polynom, also auf ganz R definiert. (2) lim f (x) = ∞, weil x4 schneller wächst als x2 . Ebenso lim f (x) = ∞. x→∞ x→−∞ (3) f (x) = (x2 − 1)2 . Also ist f (x) = 0 genau für x = −1 und x = 1. (4),(5) Polynome sind stetig und beliebig oft differenzierbar. (6) f 0 (x) = 4x3 − 4x = 4x(x2 − 1). Für x < −1 ist 4x < 0 und x2 − 1 > 0, also f 0 (x) < 0, x ∈ (−1, 0) ist 4x < 0 und x2 − 1 < 0, also f 0 (x) > 0, x ∈ (0, 1) ist 4x > 0 und x2 − 1 < 0, also f 0 (x) < 0, x>1 ist 4x > 0 und x2 − 1 > 0, also f 0 (x) > 0. Also ist f streng monoton wachsend in den Bereichen [−1, 0] und [1, ∞), sowie streng monoton fallend in Bereichen (−∞, −1] und [0, 1]. (7) Nach (6) ist klar, dass −1, 0, 1 die kritischen Stellen sind. Es ist f 00 (x) = 12x2 − 4, also f 00 (−1) = f 00 (1) = 8 und f 00 (0) = −4. f hat also isolierte lokale Minimalstellen in −1 und 1 mit f (−1) = f (1) = 0, sowie ein isoliertes lokales Maximum in 0 mit f (0) = 1. Zusammen mit (6) folgt, dass −1 und 1 sogar globale Minimalstellen sind, während nach (3) kein globales Maximum existiert. (8) Der Wertebereich (genauer: das Bild) von f ist [0, ∞). (9) Krümmung: Siehe Beispiel 5.26 auf Seite 71. (10) Skizze: Siehe Figur auf Seite 64. Beispiel 5.28 Sei f (x) = x + 2 sin(x). (1) Definitionsbereich ist ganz R. (2) Wegen | sin(x)| ≤ 1 für alle x, ist f (x) ≥ x − 2 und f (x) ≤ x + 2 für alle x ∈ R Also ist lim f (x) = ∞ und x→∞ lim f (x) = −∞. x→−∞ (4),(5) x 7→ x und x 7→ sin(x) sind stetig und beliebig oft differenzierbar und damit auch f . (6) f 0 (x) = 1 + 2 cos(x). Also ist 1 f 0 (x) > 0 ⇐⇒ cos(x) > − 2 2π 2π ⇐⇒ x ∈ 2kπ − , 2kπ + 3 3 für ein k ∈ Z, (5.6) 74 Kurvendiskussion von Funktionen einer Variablen und analog 2π 4π f 0 (x) < 0 ⇐⇒ x ∈ 2kπ + , 2kπ + 3 3 für ein k ∈ Z, sowie 2π für ein k ∈ Z. 3 Es folgt: f ist streng monoton wachsend in den Intervallen 2π 2π , k∈Z , 2kπ + 2kπ − 3 3 f 0 (x) = 0 ⇐⇒ x = 2kπ ± und streng monoton fallend in den Intervallen 2π 4π 2kπ + , , 2kπ + 3 3 k ∈ Z. (7) Aus (2) folgt, dass es keine globalen Extremalstellen gibt. Nach (6) ist klar, dass√f isolierte lokale 2π 2π Minimalstellen hat bei x = 2kπ − 2π 3, sowie isolierte 3 , k ∈ Z mit f (2kπ − 3 ) = 2kπ − √ 3 − 2π 2π 2π lokale Maximalstellen bei x = 2kπ + 3 mit f (2kπ + 3 ) = 2kπ + 3 + 3. 2π (3) Offenbar ist f (0) = 0. f wächst streng monoton zwischen − 2π 3 und 3 und nimmt dort die Werte √ 2π 2π 2π ±( 3 + 3) ≈ ±3.8 an. Also hat f in [− 3 , 3 ] ≈ [−2.1, 2.1] keine weiteren Nullstellen. Wegen (5.6) kann es aber auch keine Nullstellen für |x| > 2 geben. Insgesamt haben wir also: f hat genau eine Nullstelle bei x = 0. (8) Nach (2) und (4) ist der Wertebereich ganz R. (9) Die zweite Ableitung ist f 00 (x) = −2 sin(x). Mithin ist f 00 (x) < 0 für x ∈ (2kπ, (2k + 1)π), k ∈ Z, also f dort strikt konkav, und f 00 (x) > 0 für x ∈ ((2k − 1)π, 2kπ), k ∈ Z, also f dort strikt konvex. Die Wendepunkte sind die Punkte x = kπ, k ∈ Z. (10) Skizze: 10 f(x)=x+2sin(x) 5 wachsend fallend wachsend fallend –10 –8 –6 wachsend –2 –4 2 4 x 8 fallend konkav konkav konvex konvex –5 –10 konvex 6 Wendepunkte lok. Min.stellen lok. Max.stellen konkav 10 5.5 75 Krümmung Beispiel 5.29 (Lenard-Jones Potential) Ein Modell für das Potential von Teilchen im kernnahen Bereich ist das Lenard-Jones Potential. Eine extrem kurzreichweitige Abstoßung c1 x−12 (dabei ist x der Abstand des Teilchens von dem Kern und c1 > 0 eine Konstante) wird von einer langreichweitigen Anziehung −c2 x−6 überlagert (c2 > 0). Also ist f (x) = c1 x−12 − c2 x−6 . (1) Da x einen Abstand darstellt, ist nur x ≥ 0 sinnvoll. Da f (0) nicht definiert ist, setzen wir als Definitionsbereich I = (0, ∞) an. (2) lim f (x) = lim x−6 (c1 x−6 − c2 ) = ∞. x↓0 x↓0 lim f (x) = c1 lim x−12 − c2 lim x−6 = 0. x→∞ x→∞ (3) f (x) = 0 gilt genau dann, wenn x6 = q x = 6 cc12 . c1 c2 . x→∞ Da x > 0 sein muss, ist die einzige Nullstelle von f : (4) x 7→ x−6 und x 7→ x−12 sind in I stetig, also ist auch f stetig. (5) Ebenso ist f beliebig oft differenzierbar. (6) Die erste Ableitung ist f 0 (x) = −12c1 x−13 + 6c2 x−7 = 6c2 Also ist 0 f (x) < 0 ⇐⇒ c1 x <2 c2 6 x6 − 2 cc12 x13 . r ⇐⇒ x< 6 2 c1 c2 , r c1 c1 f (x) > 0 ⇐⇒ x >2 ⇐⇒ x> 6 2 . c2 c2 p Es folgt, dass f streng monoton fallend ist in (0, 6 2c1 /c2 ) und streng monoton wachsend in p ( 6 2c1 /c2 , ∞). p p (7) Aus (6) folgt sofort, dass f in 6 2c1 /c2 die eindeutige globale Minimalstelle hat mit f ( 6 2c1 /c2 ) = c2 − 2 , und dass es keine weiteren Extremalstellen gibt. 4c1 0 6 c2 (8) Aus (2) und (7) folgt, dass der Wertebereich [− 4c21 , ∞) ist. (9) Die zweite Ableitung ist f 00 (x) = 156c1 x−14 − 42c2 x−8 = 42c2 r 26c1 7c2 x10 x6 − . r 26 c1 26 c1 00 und f (x) < 0, falls x > 6 . Mithin Also ist f (x) > 0 genau dann, wenn x < 7 c2 r 7 c2 r 26 c 26 c 1 1 ist f strikt konvex in 0, 6 , strikt konkav in 6 , ∞ und hat einen Wendepunkt in 7 c 7 c 2 2 r r 26 c 133 c22 1 6 26 c1 mit f 6 =− . 7 c2 5 c2 676 c1 00 6 76 Kurvendiskussion von Funktionen einer Variablen (10) Skizze für c1 = 1 und c2 = 5. 10 f(x)=x−12 −5x−6 8 6 y 4 2 1/6 ( 26 35 ) 1 1.5 x 0.4 0 0.5 1/6 –2 –4 − 3325 676 Wendepunkt –6 Globales Minimum −6.25 –8 2 2.5 3 x Kapitel 6 Potenzreihen Die Funktion x 7→ sin(x) wurde geometrisch definiert als das Längenverhältnis zweier Seiten in einem Dreieck. Wie aber wird man praktisch vorgehen, wenn man für eine gegebene Zahl x den Wert von sin(x) ausrechnen möchte? Wir wollen zu diesem Zweck die Funktion sin durch elementare Funktionen annähern, die wir wirklich berechnen können. Hierzu bieten sich natürlich algebraische Funktionen an, die nur durch die Grundrechenarten definiert werden können. Speziell sind Polynome günstige Kandidaten. Wir führen in einem ersten Abschnitt den Begriff des Taylorpolynoms (nach Brook Taylor (1685–1731)) ein und geben eine einfache (grobe) Abschätzung für die Fehlergrenze an. In einem zweiten Abschnitt machen wir den Grenzübergang zu Polynomen mit unendlich vielen Summanden, den so genannten Potenzreihen. Wir berühren die technischen Probleme, die sich hier durch den Umgang mit unendlich vielen Summanden ergeben, nur am Rande und geben einen kleinen Einblick in den ganz praktischen (und sorglosen) Umgang mit diesen Objekten. 6.1 Taylorpolynome Im folgenden ist stets f eine reelle, auf dem Intervall I definierte Funktion, die wir als so oft differenzierbar annehmen, wie wir es gerade benötigen. Wir denken dabei zum Beispiel an f = sin, f = cos, f = exp und so weiter. Der Wert von f (x) für gegebenes x kann nicht durch elementare Rechenoperationen ausgerechnet werden. Wir hoffen aber, dass wir f durch Polynome pn (x) = cn xn +cn−1 xn−1 +. . .+c1 x+ c0 approximieren können, wenn wir n nur groß genug wählen und natürlich die Koeffizienten c0 , . . . , cn geeignet aussuchen. Um Schreibarbeit zu sparen, führen wir die folgende Bezeichnung ein. Definition 6.1 (Summenzeichen) Sind m, n ∈ Z, m ≤ n, und am , am+1 , . . . , an−1 , an Zahlen, so schreiben wir die Summe als n X ak := am + am+1 + . . . + an−1 + an . k=m Mit dieser Definition ist pn (x) = n X k=0 77 ck xk . 78 Potenzreihen Damit pn möglichst gut mit f übereinstimmt, müssen die Koeffizienten c0 , . . . , cn geschickt gewählt werden. Ein grundlegender Ansatz ist es, die Koeffizienten so zu wählen, dass die ersten n Ableitungen von f in x = 0 mit denen von pn übereinstimmen: f (k) (0) = p(k) n (0), k = 0, . . . , n. (6.1) Dabei ist f (k) die k-te Ableitung von f mit der Konvention f (0) = f . Wir gehen hier natürlich davon aus, dass wir die Ableitungen von f in 0 leichter berechnen können als die Funktionswerte von f an einer beliebigen Stelle x, sonst hätten wir ja nichts gewonnen. Beispiel 6.2 Sei f = sin. Dann ist sin(0) (0) = sin(0) = 0 sin(1) (0) = cos(0) = 1 sin(2) (0) = − sin(0) = 0 sin(3) (0) = − cos(0) = −1 sin(4) (0) = sin(0) = 0 .. .. . . (6.2) sin(4l) (0) = sin(0) = 0 sin(4l+1) (0) = cos(0) = 1 sin(4l+2) (0) = − sin(0) = 0 sin(4l+3) (0) = − cos(0) = −1 Also ist sin(2k) (0) = 0, sin(2k+1) (0) = (−1)k , k ∈ N0 . (6.3) Die Ableitungen von pn können wir durch schrittweises Ableiten immer leicht berechnen. p(1) n (x) = p(2) n (x) = n X k=1 n X ck kxk−1 ck k(k − 1)xk−2 (6.4) k=2 .. . p(l) n (x) = .. . n X ck k(k − 1) · · · (k − l + 1)xk−l k=l Um auch hier zu einer handlichen Schreibweise zu gelangen, führen wir die folgenden Konventionen ein. Definition 6.3 (i) Für n ∈ N definieren wir n! (lies: n Fakultät“) als das Produkt der ersten n natürlichen ” Zahlen n! = 1 · 2 · 3 · · · (n − 1) · n. Außerdem vereinbaren wir: 0! = 1. 6.1 79 Taylorpolynome (ii) Für x ∈ R und k ∈ N definieren wir den Binomialkoeffizienten als x x · (x − 1) · (x − 2) · · · (x − k + 1) = . k k! (Lies: x über k“.) Weiter setzen wir x0 = 1 und xk = 0 für k < 0. Speziell ist für k, n ∈ N0 mit k ≤ n: ” n n! = . k k!(n − k)! Für k, n ∈ N0 mit k > n oder für k < 0 ist nk = 0. Später benötigen wir den folgenden Hilfssatz. Lemma 6.4 Für jedes x ∈ R gilt xn = 0. n→∞ n! lim Beweis Für n ≥ |2x| ist 1 ≥ 2|x| n ≥ 2|x| n+k für k ∈ N, also |x|n |x|n+1 |x|n+2 ≥2 ≥4 ≥ ... n! (n + 1)! (n + 2)! Also schrumpft der Bruch in jedem Schritt auf weniger als die Hälfte zusammen. 2 Wir können die k-te Ableitung von pn schreiben als p(l) n (x) = n X ck k=l k! xk−l . (k − l)! (6.5) Für x = 0 verschwinden alle Summanden außer dem mit l = k, also ist p(k) n (0) = k!ck . (6.6) Wegen (6.1) ist also 1 (k) f (0). k! An dieser Stelle ist sehr erfreulich, dass die Koeffizienten gar nicht vom Grad n des Polynoms abhängen. Das so gewonnene Polynom n X f (k) (0) k pn (x) = x k! ck = k=0 heißt das n-te Taylorpolynom von f bei 0. Es ist dasjenige Polynom, das in den ersten n Ableitungen bei 0 mit denen von f übereinstimmt. Wir wollen nun als kleine Verallgemeinerung zulassen, dass die Ableitungen statt an 0 an einer beliebigen Stelle a ∈ R mit denen von f übereinstimmen. Definition 6.5 (Taylorpolynom) Das n-te Taylorpolynom von f bei a ist pn (x) = n X f (k) (a) k=0 k! (x − a)k . Es hat an der Stelle a dieselben Ableitungen bis zur Ordnung n wie f und ist das einzige Polynom vom Grade ≤ n mit dieser Eigenschaft. 80 Potenzreihen Beispiele 6.6 (i) Ist f = sin und n = 2N − 1, so ist (vergleiche (6.3)) pn (x) = N −1 X k=0 (−1)k 2k+1 x . (2k + 1)! Also p1 (x) = x, p3 (x) = x − 16 x3 , p5 (x) = x − 16 x3 + 1 5 120 x . (ii) Ist f = exp, so ist f = f 0 = f 00 = f 000 = . . .. Also ist das n-te Taylorpolynom von exp bei 0 pn (x) = n X 1 k x . k! k=0 Bisher haben wir uns die Polynome vor allem deshalb verschafft, weil wir hofften, dass sie unsere Funktion f annähern. Dass dies tatsächlich oft der Fall ist, zeigt der folgende Satz, der eine einfache (und leider noch etwas grobe) Abschätzung für die Güte der Approximation angibt. Satz 6.7 (Taylor Abschätzung) Sei pn das n-te Taylorpolynom von f bei a. Dann ist |f (x) − pn (x)| ≤ Beispiele 6.8 |x − a|n+1 max |f (n+1) (y)|, y zwischen a und x . (n + 1)! (i) Sei f = sin. Dann ist jede Ableitung durch 1 beschränkt. Also ist (mit n = 2N − 1) N −1 X (−1)k 2k+1 |x|2N x . (6.7) sin(x) − ≤ (2N )! (2k + 1)! k=0 Wollen wir sin(0.3) bis auf einen Fehler von 10−3 ausrechnen, so muss 0.32N /(2N )! ≤ 0.001 sein. 4 0.0081 Nun ist 0.32 /2! = 0.045 > 0.001 und 0.3 = 0.0003375 < 0.001. Also müssen wir N = 2 4! = 24 3 nehmen und damit n = 2N − 1 = 3. Also ist sin(0.3) ≈ p3 (0.3) = 0.3 − 0.3 6 = 0.2955 bis auf einen Fehler von maximal 0.001. Man prüfe mit dem Taschenrechner, dass das tatsächlich sehr gut stimmt! (ii) Wir wollen exp(1) bis auf einen Fehler von 0.001 berechnen. Aus der obigen Abschätzung erhalten wir n X e1 xk . ≤ exp(x) − k! (n + 1)! k=0 3 1 Nehmen wir als bekannt an, dass e < 3 ist, so müssen wir also (n+1)! ≤ 1000 , also (n + 1)! ≥ 3000 haben. Nun ist 6! = 720 und 7! = 5040. Also müssen wir n = 6 nehmen und bekommen exp(1) ≈ 1 + 1 + 1 1 1 1 1 + + + + = 2.7180555 . . . 2 6 24 120 720 mit einem Fehler von maximal 0.001. 1 = (1 − x)−1 , x 6= 1. Dann ist f 0 (x) = (1 − x)−2 , f 00 (x) = 2(1 − x)−3 und Beispiel 6.9 Sei f (x) = 1−x allgemeiner f (n) (x) = n!(1 − x)−(n+1) . Insbesondere ist f (n) (0) = n!, also ist das n-te Taylorpolynom von f bei 0 n X pn (x) = xk . k=0 6.2 81 Taylorreihen Wir rechnen (1 − x)pn (x) = (1 − x)(1 + x + x2 + . . . xn ) = (1 + x + x2 + . . . xn ) − (x + x2 + x3 + . . . xn+1 ) n+1 =1−x (6.8) . Also ist xn+1 1 − pn (x) = . 1−x 1−x (6.9) (Man beachte, dass dies den Fehler besser berechnet als die Abschätzung aus Satz 6.7. Die Schranke, die xn+1 n+1 dort gefunden wird, ist (1−x) für x ≤ 0.) Der Fehler wird mit wachsendem n n+2 für x > 0 und |x| nur dann kleiner, wenn |x| < 1 ist. Für |x| > 1 können wir nicht erwarten, eine gute Approximation zu bekommen (nicht mal für x < −1). Beispiel 6.10 Sei b ∈ R, N ∈ N und f (x) = (b + x)N . Dann ist f (1) (x) = N (b + x)N −1 f (2) (x) = N (N − 1)(b + x)N −2 f (3) (x) = N (N − 1)(N − 2)(b + x)N −3 .. .. . . N! (b + x)N −k f (k) (x) = (N − k)! .. .. . . f (N +1) (x) = 0 Also ist (ohne Fehlerterm!) f (x) = N X f (k) (0) k! k=0 xk = N X N k=0 k bN −k xk . Korollar 6.11 (Binomischer Lehrsatz) Für x, y ∈ R und N ∈ N ist N (x + y) = N X N k=0 6.2 k xk y N −k . Taylorreihen Wollen wir f immer besser annähern, so müssen wir n immer größer wählen. Im Idealfall konvergieren die Taylorpolynome f (x) = lim pn (x). (6.10) n→∞ 82 Potenzreihen Gilt (6.10), so schreiben wir auch f (x) = Definition 6.12 Der Ausdruck ∞ X f (n) (a) (x − a)n . n! n=0 ∞ X f (n) (a) (x − a)n n! n=0 heißt Taylorreihe von f um a. Die Taylorreihe tritt auf als ein Spezialfall des folgenden Objektes. Definition 6.13 Sind c0 , c1 , . . . Zahlen, so heißt der Ausdruck P (x) = ∞ X ck (x − a)k := lim n→∞ k=0 n X ck (x − a)k k=0 die Potenzreihe um a mit Koeffizienten (ck )k∈N0 . Wir sagen, dass die Potenzreihe für x ∈ R konvergiert, wenn der Grenzwert existiert und endlich ist. Satz 6.14 (i) Sei P eine Potenzreihe um a. Dann gibt es eine Zahl R ≥ 0, oder R = ∞, mit der Eigenschaft ( konvergent, falls |x − a| < R, P (x) ist divergent, falls |x − a| > R. (Für |x − a| = R kann man im Allgemeinen keine Aussage machen.) R heißt der Konvergenzradius von P . (ii) Sei R > 0. Dann ist die für |x − a| < R definierte Funktion x 7→ P (x) unendlich oft differenzierbar und hat die erste Ableitung (gliedweises Differenzieren!) P 0 (x) = ∞ X ck+1 (k + 1)(x − a)k . k=0 Auch die Reihe P 0 (und ebenso P 00 , P 000 usf.) hat denselben Konvergenzradius R. Ferner gilt (durch iteratives Ableiten) für jedes n ∈ N0 P (n) (a) = n! cn . (iii) Hat umgekehrt die durch formales gliedweises Differenzieren aus P entstehende Potenzreihe Q(x) = ∞ X ck+1 (k + 1)(x − a)k k=0 den Konvergenzradius R > 0, so auch P , und es gilt Q(x) = P 0 (x), sofern |x − a| < R. Beispiel 6.15 Wir wollen hier mit Hilfe der in Beispiel 6.6 ausgerechneten Taylorpolynome die Potenzreihen von Sinus-, Cosinus- und Exponentialfunktion ausrechnen. 6.2 83 Taylorreihen (i) Sei f = sin und pn wie in Beispiel 6.6(i). Dann ist nach (6.7) | sin(x) − pn (x)| ≤ (vergleiche Lemma 6.4). Also ist für alle x ∈ R sin(x) = ∞ X |x|n+1 n→∞ (n+1)! −→ 0 ck xk , k=0 wobei ck = 0, k gerade, (k−1)/2 (−1) , k! k ungerade. Lassen wir in der Reihe die Terme aus, die 0 sind, so erhalten wir sin(x) = ∞ X (−1)n 2n+1 x . (2n + 1)! n=0 (6.11) Da wir gesehen haben, dass diese Reihe für alle x ∈ R konvergiert, ist R = ∞. Nach dem obigen Satz können wir also gliedweise differenzieren und erhalten sin0 (x) = cos(x) = ∞ X (−1)n k=0 (2n)! x2n . (6.12) Auch für diese Reihe ist nach dem Satz der Konvergenzradius R = ∞. (ii) Sei f = exp und pn wie in Beispiel 6.6(ii). Dann ist nach Satz 6.7 für jedes x ∈ R n+1 n→∞ exp(x) − pn (x) ≤ |x| · exp(|x|) −→ 0. (n + 1)! Daher konvergiert die Taylorreihe der Exponentialfunktion überall gegen die Exponentialfunktion, es ist also R = ∞. Für jedes x ∈ R gilt also exp(x) = ∞ X xk k=0 Beispiel 6.16 Sei f (x) = 1 1−x und pn (x) = n P k=0 k! . (6.13) xk . Nach (6.9) ist für x ∈ (−1, 1) lim pn (x) = n→∞ 1 1−x . Jedoch ist für x = 1, lim pn (1) = lim (n + 1) = ∞. Also ist der Konvergenzradius R = 1 und wir n→∞ n→∞ haben ∞ X 1 = xn , x ∈ (−1, 1). (6.14) 1 − x n=0 Diese Reihe heißt auch die geometrische Reihe. √ Beispiel 6.17 Sei f (x) = x, x ≥ 0. Wir können kaum erwarten, dass f durch eine Potenzreihe um √0 angenähert wird. Erstens, weil f für negative x hier nicht definiert ist, und zweitens, weil f 0 (x) = 1/2 x für x → 0 gegen ∞ konvergiert. Probieren wir also eine Taylorreihenentwicklung um eine Zahl a > 0. Die 84 Potenzreihen Ableitungen von f sind schnell berechnet: 1 −1 x 2 2 1 1 −3 f 00 (x) = · − x 2 2 2 3 −5 1 1 − x 2 f (3) (x) = · − 2 2 2 .. .. . . 1 1 1 1 3 f (k) (x) = · − − ··· − k + 1 x 2 −k 2 2 2 2 1 1 = 2 k!x 2 −k k f 0 (x) = (6.15) Man kann zeigen, dass a der Konvergenzradius der resultierenden Taylorreihe ist, und dass f im Intervall (0, 2a) mit der Taylorreihe übereinstimmt. Also ist die Taylorreihe von f um a √ x= ∞ 1 X 2 n=0 n 1 a 2 −n (x − a)n = ∞ 1 n √ X x 2 a −1 , n a n=0 x ∈ (0, 2a). (6.16) Der folgende Satz besagt, dass zwei Potenzreihen die gleichen Koeffizienten haben, wenn sie konvergent sind und als Funktionen dieselben Werte annehmen. Satz 6.18 (Identitätssatz für Potenzreihen) Seien P (x) = ∞ X cn (x − a)n und Q(x) = ∞ X dn (x − a)n n=0 n=0 zwei Potenzreihen, um den selben Punkt a, mit Konvergenzradien RP , RQ > 0. Gibt es eine Folge (an )n∈N , n→∞ wobei an 6= a für alle n ∈ N, mit an −→ a und P (an ) = Q(an ), n ∈ N, so gilt ck = dk für alle k ∈ N0 . Speziell ist dies der Fall, wenn für ein r > 0 gilt P (x) = Q(x) für alle x ∈ R mit |x − a| < r. Beweis Wir können den Satz hier nicht komplett beweisen, wollen aber einen Hinweis geben, welche Idee dahinter steckt. Da P und Q stetig in a sind (Satz 6.14(ii)) folgt aus der Annahme, dass c0 = P (a) = lim P (an ) = lim Q(an ) = Q(a) = d0 . n→∞ n→∞ Als nächstes ist c1 = P 0 (a) = lim n→∞ Q(an ) − Q(a) P (an ) − P (a) = lim = Q0 (a) = d1 . n→∞ an − a an − a So kann man nacheinander sämtliche Ableitungen in a bestimmen und zeigen, dass sie alle gleich sind, dass also auch die Koeffizienten übereinstimmen müssen. 2 6.2 85 Taylorreihen ∞ P Beispiel 6.19 Sei f (x) = log(1 − x) und cn xn die Taylorreihe von f um 0. Wir wollen die Koeffizien- n=0 ten (ck )k∈N0 und den Konvergenzradius R dieser Reihe ausrechnen. Dazu leiten wir f ab, weil wir so eine Funktion bekommen, deren Potenzreihe wir schon kennen: f 0 (x) = −1/(1 − x). Nach Beispiel 6.16 hat die Potenzreihe von f 0 den Konvergenzradius R = 1, und es gilt f 0 (x) = − ∞ X 1 = −xn . 1 − x n=0 Nach Satz 6.14(ii) können wir die Potenzreihe von f 0 aber auch durch gliedweises Differenzieren der Reihe von f erhalten. Es gilt also ∞ X f 0 (x) = (n + 1)cn+1 xn . n=0 Nach Satz 6.14(i) haben beide Reihen denselben Konvergenzradius, nämlich R = 1. Es gilt c0 = f (0) = 0 und (nach dem Identitätssatz für Potenzreihen) cn = − n1 , n ∈ N. Also ist log(1 − x) = − ∞ X xn , n n=1 für |x| < 1. (6.17) Satz 6.20 (Rechenregeln) Seien P (x) = ∞ X n cn (x − a) und Q(x) = ∞ X dn (x − a)n n=0 n=0 zwei Potenzreihen, um den selben Punkt a, mit Konvergenzradien RP , RQ > 0. Ferner sei λ ∈ R (i) Dann gilt für x ∈ R mit |x − a| < RP : λP (x) = ∞ X (λcn )(x − a)n . (6.18) n=0 Für jedes x ∈ R mit |x − a| < min(RP , RQ ) gilt: P (x) + Q(x) = P (x) − Q(x) = P (x) · Q(x) = ∞ X n=0 ∞ X (cn + dn )(x − a)n (cn − dn )(x − a)n n=0 ∞ X n X n=0 k=0 (6.19) ! ck dn−k (x − a)n Jede dieser drei Potenzreihen hat mindestens den Konvergenzradius min(RP , RQ ). Die Formel für das Produkt der Potenzreihen heißt das Cauchy-Produkt. (ii) Ist λ 6= 0, so ist für x ∈ R mit |λx − a| < RP P (λx) = Diese Potenzreihe um a λ ∞ X a n (λn cn ) x − . λ n=0 hat den Konvergenzradius RP |λ| . (6.20) 86 Potenzreihen 1 1−x2 um 0 bestimmen. Dazu bemerken wir zunächst, dass 1 1 1 1 = + . 1 − x2 2 1−x 1+x Beispiel 6.21 Wir wollen die Potenzreihe von Wir wissen, dass ∞ X 1 = xn , 1 − x n=0 für |x| < 1. Also ist (mit λ = −1 in Teil (ii) des letzten Satzes) ∞ X 1 = (−1)n xn , 1 + x n=0 für |x| < 1. Nach dem Summensatz ist also ∞ ∞ X 1 + (−1)n n X 2n 1 = x = x . 1 − x2 2 n=0 n=0 (6.21) Beispiel 6.22 Seien M, N ∈ N und P (x) = (1 + x)M und Q(x) = (1 + x)N . Nach Beispiel 6.10 ist ∞ X M n P (x) = (1 + x)M = x , n n=0 N Q(x) = (1 + x) = ∞ X N n=0 (Erinnerung: für n > M ist M n n xn . = 0.) Das Cauchy-Produkt ist ! ∞ n X X M N P (x) · Q(x) = xn . k n − k n=0 k=0 Andererseits wissen wir, dass P (x)Q(x) = (1 + x)M +N = ∞ X M +N n x . n n=0 Nach dem Identitätssatz für Potenzreihen erhalten wir folgende wichtige Gleichung. Korollar 6.23 n X M N M +N = . k n−k n (6.22) k=0 6.3 Ausblick: komplexe Argumente Potenzreihen benutzen nur Multiplikation, Addition sowie den Begriff des Grenzwertes. Dies ist alles auch für komplexe Zahlen definiert. In der Tat haben wir für komplexe Zahlen den Abstand p |z1 − z2 | = (Re(z1 − z2 ))2 + (Im(z1 − z2 ))2 definiert. 6.3 87 Ausblick: komplexe Argumente Definition 6.24 (Grenzwerte komplexer Zahlenfolgen) Eine Folge (zn )n∈N komplexer Zahlen konvergiert gegen z ∈ C, falls lim |zn − z| = 0. n→∞ Gleichwertig damit ist, dass Real- und Imaginärteil konvergieren: Re(z) = lim Re(zn ), n→∞ und Im(z) = lim Im(zn ). n→∞ Wir schreiben dann z = lim zn . n→∞ Also können wir für c0 , c1 , . . . ∈ C die Potenzreihe P um a ∈ C definieren P (z) = ∞ X cn (z − a)n . n=0 Es gelten alle Sätze aus dem vorigen Abschnitt auch für komplexe Potenzreihen. Speziell existiert eine Zahl R ≥ 0, oder R = ∞, sodass P (z) konvergiert, falls |z − a| < R, und divergiert, falls |z − a| > R. Definition 6.25 Die Menge z ∈ C, |z − a| < R heißt Konvergenzkreis von P . Oft ist bei einer reellen Funktion nicht ohne weiteres ersichtlich, warum die Potenzreihe nicht überall konvergiert. Hier hilft die Betrachtung der komplexen Potenzreihe weiter. Beispiel 6.26 Sei 1 . 1 + x2 Die Funktion f ist auf ganz R definiert und beliebig oft differenzierbar. Es spricht also scheinbar nichts dagegen, dass f eine Taylorreihe um 0 haben sollte, die überall konvergiert. Es wird sich aber gleich zeigen, dass dies nicht richtig ist. f (x) = Die Bestimmung von f geht am einfachsten so: f (x) = ∞ ∞ X X 1 2 n = (−x ) = (−1)n x2n , 1 − (−x2 ) n=0 n=0 |x| < 1. Diese Potenzreihe hat also tatsächlich den Konvergenzradius R = 1. Betrachten wir jetzt f als Funktion auf C, so ist klar, dass f (z) definiert ist für alle z ∈ C, außer für z = ±i. Nun ist |i| = 1, also ist klar, dass der Konvergenzradius R gar nicht größer als 1 sein kann, wenn die Funktion im ganzen Konvergenzbereich der Potenzreihe mit dieser übereinstimmt. Die Diskussion fassen wir in der folgenden Faustregel zusammen: Faustregel 6.27 Sei P die Taylorreihe um a der in R definierten Funktion f , und sei f auch auf (einer Teilmenge von) C definierbar. Dann ist der Konvergenzradius R von P die größte Zahl R, so dass f in z ∈ C : |z − a| < R keine Ausnahmestelle hat. 88 Potenzreihen Wir kommen nun zu dem wichtigsten Beispiel einer komplexen Potenzreihe. Beispiel 6.28 Die Funktion f : C → C, z 7→ exp(iz) hat die Potenzreihe um 0 ∞ n X i n exp(iz) = z , n! n=0 z ∈ C. (6.23) Wir wissen, dass für reelle Zahlen x ∈ R die Euler’sche Formel gilt exp(ix) = cos(x) + i sin(x). Also ist nach Aufteilung in gerade und ungerade n in (6.23) cos(x) + i sin(x) = = ∞ ∞ X i2k 2k X i2k+1 x + x2k+1 , (2k)! (2k + 1)! k=0 ∞ X k=0 k k=0 ∞ X (−1) 2k x +i (2k)! k=0 (−1)k 2k+1 x . (2k + 1)! (6.24) Da in der zweiten Zeile beide Reihen reell sind, erhalten wir (diesmal ohne Mühe) die bekannten Formeln zurück. ∞ X (−1)k 2k cos(x) = x , (2k)! k=0 (6.25) ∞ X (−1)k 2k+1 sin(x) = x . (2k + 1)! k=0 Kapitel 7 Integration von Funktionen einer Variablen 7.1 Definition des Integrals Wir nehmen an, dass a < b reelle Zahlen sind und f : [a, b] → R eine Abbildung ist. Für den Moment wollen wir auch annehmen, dass f ≥ 0 ist. Das Ziel ist es, den Inhalt F der Fläche zu bestimmen, der von dem Graphen von f und der Koordinatenachse eingeschlossen wird. Graph(f) m4,3 a I 4,3 b F IGUR . Die Fläche F unter dem Graphen von f wird hier durch n = 4 Rechtecke angenähert. Zu diesem Zweck zerlegen wir das Intervall [a, b] in n (in der Abbildung: n = 4) gleichgroße Teilintervalle In,1 , In,2 , . . . , In,n der Länge b−a n . Also ist b−a b−a In,k = a + (k − 1) , a+k , k = 1, 2, . . . , n. n n In jedem Teilintervall wollen wir nun das größte Rechteck bestimmen, das noch unterhalb des Graphen 89 90 Integration von Funktionen einer Variablen von f liegt. Die Höhe dieses Rechtecks im k-ten Teilintervall ist (zumindest bei stetigem f ) der kleinste Funktionswert, der dort von f angenommen wird mn,k = min(f (x), x ∈ In,k ), k = 1, 2, . . . , n. Der Flächeninhalt des k-ten Rechtecks beträgt also (Breite × Höhe) mengenommen haben den Flächeninhalt Un (f ) := n X b−a n k=1 b−a n mn,k . mn,k . Alle n Rechtecke zusam- (7.1) Die Größe Un (f ) wird als die n-te Untersumme von f bezeichnet. Offenbar ist F ≥ Un (f ) für jedes n. Das gleiche können wir auch mit Rechtecken machen, die den Graphen von oben einschließen. Diese Rechtecke habe die Höhe Mn,k = max(f (x), x ∈ In,k ), k = 1, 2, . . . , n. Wir bezeichnen mit On (f ) := n X b−a n k=1 Mn,k (7.2) die nte Obersumme von f . Offenbar ist jetzt Un (f ) ≤ F ≤ On (f ). Die Idee ist nun, dass mit wachsendem n sich die Werte von Unter- und Obersumme immer mehr annähern sollten. Der gemeinsame Grenzwert muss dann die gesuchte Fläche F sein. Definition 7.1 Konvergieren die Folgen der Untersummen (Un (f ))n∈N und Obersummen (On (f ))n∈N gegen denselben Grenzwert, so bezeichnen wir den gemeinsamen Grenzwert als das Integral von f im Intervall [a, b] (oder von a bis b) und schreiben Z b f (x) dx = lim Un (f ) = lim On (f ). n→∞ a n→∞ Die Funktion f heißt dann integrierbar (in [a, b]). Zur Unterscheidung von anderen Integralbegriffen, die in der Mathematik gebräuchlich sind, wird dieses Integral auch Riemann–Integral1 genannt. Wir wollen später auch die folgende Notation benutzen: Z a Z f (x) dx := − b b f (x) dx. (7.3) a Die Bedingung an die Ober- und Untersummen ist natürlich in der Praxis nicht sehr handlich nachzuprüfen. Daher wollen wir hier ohne Beweis festhalten, dass wir uns beispielsweise bei stetigen oder bei monotonen (wachsend oder fallend) Funktionen keine Sorgen zu machen brauchen. Satz 7.2 Ist f : [a, b] → R stetig oder monoton, so ist f integrierbar. 1 nach Bernhard Riemann, Mathematiker in Göttingen (1826–1866) 7.2 7.2 91 Hauptsatz der Differential- und Integralrechnung Hauptsatz der Differential- und Integralrechnung Sei f : [a, b] → R stetig. Wir betrachten die Funktion Z t F (t) = f (x) dx für t ∈ [a, b]. a Das ist die Fläche, die zwischen den Punkten a und t unter der Kurve von f liegt. Graph(f) f(t) a t t+h F IGUR . Lässt man t auf t + h wachsen, so vergrößert sich die Fläche unter dem Graphen um etwa h · f (t). Um wie viel wächst F (t), wenn wir t um eine kleine Zahl h > 0 vergrößern? Es kommt bei der Fläche ein Stück dazu, das ungefähr gleich dem Rechteck mit Breite h und Höhe f (t) ist. Also ist F (t + h) ≈ F (t) + h · f (t). Das können wir umformen zu F (t + h) − F (t) ≈ f (t), h wobei Gleichheit gelten sollte, falls h gegen 0 strebt. Das heißt, wir erwarten: lim h↓0 F (t + h) − F (t) = f (t). h Damit haben wir den folgenden Satz hergeleitet (naja: plausibel gemacht). Satz 7.3 Sei f : [a, b] → R stetig und Z F (t) := t f (x) dx. a Dann ist F differenzierbar mit der Ableitung F 0 (t) = f (t). (7.4) (7.5) 92 Integration von Funktionen einer Variablen Definition 7.4 Eine Funktion F heißt Stammfunktion von f , falls F differenzierbar ist mit Ableitung F0 = f. Beispiele 7.5 (i) Ist f (x) = x2 , so ist F (x) = 13 x3 eine Stammfunktion von f . (ii) Ist f (x) = sin(x), so ist F (x) = − cos(x) eine Stammfunktion von f . Bemerkung 7.6 von f . (i) Ist F eine Stammfunktion von f und c ∈ R, so ist auch c + F eine Stammfunktion (ii) Sind F1 und F2 Stammfunktionen von f und G := F1 − F2 , so ist G0 (x) = F10 (x) − F20 (x) = f (x) − f (x) = 0 für alle x. Also ist G konstant. (iii) Zusammengefasst ist die Stammfunktion von f bis auf eine additive Konstante eindeutig. Wir können jetzt den zentralen Satz formulieren, der den Zusammenhang zwischen Integration und Differentiation angibt. Satz 7.7 (Hauptsatz der Differential- und Integralrechnung) Ist f : [a, b] → R stetig und F eine Stammfunktion von f , so ist Z b f (x) dx = F (b) − F (a). a Rt Beweis Nach Satz 7.3 ist auch die Funktion G : t 7→ a f (x) dx eine Stammfunktion von f . Nach BemerkungR 7.6 gibt es ein c ∈ R mit F − G = c. Auswertung an der Stelle a ergibt c = F (a) − G(a) = a F (a) − a f (x) dx = F (a). Auswertung an der Stelle b liefert damit F (a) = c = F (b) − G(b), also Z b f (x) dx = G(b) = F (b) − F (a). a 2 Manchmal wird für die auftretende Differenz von Werten der Stammfunktion die folgende Schreibweise verwendet. Definition 7.8 b F (x) := F (b) − F (a). a Mit dieser Schreibweise ist Z a Beispiele 7.9 (i) Wir wollen Z 0 π Rπ 0 b b f (x) dx = F (x) . a sin(x) dx bestimmen. Eine Stammfunktion von sin ist − cos, also ist π sin(x) dx = − cos(x) = − cos(π) − (− cos(0)) = 1 + 1 = 2. 0 7.3 93 Berechnung von Integralen (ii) Wir wollen R2 0 x2 dx bestimmen. Eine Stammfunktion von f (x) = x2 ist F (x) = 31 x3 . Also ist 2 Z 0 (iii) Wir wollen R2 1 1 x dx bestimmen. Eine Stammfunktion von f (x) = Z 1 7.3 2 1 3 1 1 8 x dx = x = · 8 − · 0 = . 3 0 3 3 3 2 2 1 x ist F (x) = log(x). Also ist 2 1 dx = log(x) = log(2) − log(1) = log(2) ≈ 0.693. x 1 Berechnung von Integralen Die Berechnung von Integralen läuft meist auf das Bestimmen von Stammfunktionen hinaus. Man sucht also eine Funktion F , die abgeleitet die gewünschte Funktion f liefert. Für das Ableiten hatten wir einen ganz komfortablen Kalkül zusammengestellt. Für ein paar Grundfunktionen konnte man die Ableitung aus einer Tabelle entnehmen. Alle daraus zusammengesetzten Funktionen konnte man mit Hilfe von einfachen Regeln systematisch ausrechnen. Für das Auffinden von Stammfunktionen funktioniert dies eben nicht. Während man schon eine Tabelle mit Grundfunktionen aufstellen kann und auch Addition und Multiplikation mit Zahlen keine Probleme bereiten, kann man für Produkte, Quotienten und Verknüpfungen von Funktionen keine allgemeingültigen nützlichen Regeln aufstellen. Hier ist man auf einen guten Instinkt und eventuell eine sehr große Formelsammlung angewiesen. In diesem Abschnitt stellen wir nun die Rechenregeln bereit, die es zum Glück doch noch gibt. Ist f (x) = n X ck xk k=0 ein Polynom, so ist F (x) = n X ck k+1 x k+1 k=0 eine Stammfunktion von f . Zum Nachweis muss man einfach nur F ableiten. Allgemeiner ist für eine konvergente Potenzreihe um den Punkt a ∈ R f (x) = ∞ X ck (x − a)k k=0 die Reihe F (x) = ∞ X ck (x − a)k+1 k+1 (7.6) k=0 mit selbem Konvergenzradius eine Stammfunktion und zwar mit F (a) = 0. Auch hier muss man zum Nachweis einfach F ableiten und die Regeln aus Kapitel 6 beachten. Für viele andere Funktionen kann man einfach die Tabelle der Ableitung aus Abschnitt 4.2 von rechts nach links lesen. Beispielsweise erhalten wir: Beispiele 7.10 (i) f (x) = exp(x), dann ist F (x) = exp(x) eine Stammfunktion. (ii) f (x) = x−2 , dann ist F (x) = −x−1 eine Stammfunktion. (iii) f (x) = 1 1+x2 , dann ist F (x) = arctan(x) eine Stammfunktion. 94 Integration von Funktionen einer Variablen (iv) f (x) = √ 1 , 1−x2 x ∈ (−1, 1), dann ist F (x) = arcsin(x) eine Stammfunktion. Für Funktionen, die sich als Summe oder Vielfache von Funktionen aus der Tabelle ergeben, kann man leicht Regeln angeben, die sich direkt aus den entsprechenden Regeln für die Differentiation ergeben. Satz 7.11 (Linearität des Integrals) Seien f, g : [a, b] → R integrierbar und λ ∈ R, sowie c ∈ (a, b). Dann ist Z b Z b (λf (x)) dx = λ f (x) dx (i) a b Z a b Z (f (x) + g(x)) dx = f (x) dx + a a b Z (f (x) − g(x)) dx = a b f (x) dx = (iii) f (x) dx. (iv) b Z f (x) dx + a g(x) dx a c Z (ii) b Z f (x) dx − a g(x) dx a b Z Z b Z a c Beweis (Nur für stetiges f und a ≤ c ≤ b.) Nur Punkt (iv) ist neu. Hierzu bemerken wir, dass nach dem Hauptsatz gilt (mit F eine Stammfunktion von f ) b Z f (x) dx = F (b) − F (a) a = (F (c) − F (a)) + (F (b) − F (c)) Z c Z b = f (x) dx + f (x) dx. a c 2 (i) Sei f (x) = 5 sin(x). Dann ist F (x) = −5 cos(x) eine Stammfunktion von f . Beispiele 7.12 (ii) Z 4 x+ 2 1 x Z 4 4 Z 1 dx x 2 2 4 4 1 2 = x + log(x) = 8 − 2 + log(4) − log(2) = 6 + log(2). 2 dx = x dx + 2 2 (iii) Wir wollen die Vorzeichenfunktion sign im Bereich −2 bis 5 integrieren. Das Problem dabei ist natürlich die Unstetigkeitsstelle in der Null. An der Stelle können wir uns aber mit Regel (iv) (aus Satz 7.11) behelfen: Z 5 Z 0 Z 5 sign(x) dx = sign(x) dx + sign(x) dx −2 −2 0 0 Z = Z (−1) dx + −2 5 (+1) dx 0 = −2 + 5 = 3. Allgemeiner kann man sogar zeigen, dass die Betragsfunktion x 7→ |x| eine Stammfunktion von sign ist. 7.3 95 Berechnung von Integralen Die Produktregel und die Kettenregel (siehe Abschnitt 4.3) übertragen sich leider nicht so einfach von der Differentiation auf die Integration. Man kann nur Folgendes angeben. Satz 7.13 (Substitutionsregel) Es seien a, b, c, d ∈ R mit a < b und c < d. Ist g : [a, b] → [c, d] stetig differenzierbar und f : [c, d] → R stetig, so gilt Z b g(b) Z 0 f (g(x))g (x) dx = f (y) dy. a g(a) Mit anderen Worten: Ist F eine Stammfunktion von f , so ist x 7→ F (g(x)) eine Stammfunktion von x 7→ f (g(x))g 0 (x). Beweis Zum Beweis sei F eine Stammfunktion von f . Wir setzen H(x) = F (g(x)). Dann ist nach der Kettenregel für Ableitungen H 0 (x) = g 0 (x)F 0 (g(x)) = g 0 (x) · f (g(x)). Dabei haben wir in der zweiten Gleichung ausgenutzt, dass F 0 = f ist. Also ist H eine Stammfunktion von x 7→ g 0 (x) · f (g(x)). Nach dem Hauptsatz der Differential- und Integralrechnung ist also b Z b Z g(b) f (g(x))g 0 (x) dx = H(x) = F (g(b)) − F (g(a)) = f (y) dy. a g(a) a 2 0 Bemerkung 7.14 Nimmt man die Schreibweise dg(x) dx = g (x) als Bruch ernst, so kann man ihn umformen 0 zu dg(x) = g (x) dx. Setzen wir jetzt noch y = g(x), so sagen wir, dass wir x durch die neue Integrationsvariable y substituiert haben mit dy = g 0 (x)dx. Beispiele 7.15 (i) Mit f (x) = sin(x) und y = g(x) = x2 ist Z π Z Z 2 1 π 1 π 2 2 x sin(x ) dx = 2x sin(x ) dx = sin(y) dy 2 0 2 0 0 π 2 1 1 = − cos(y) = (1 − cos(π 2 )). 2 2 0 (ii) Mit f (x) = x2 und y = g(x) = tan(x) (sowie: g 0 (x) = 1 + (tan(x))2 ) ist Z π/4 Z π/4 2 4 (tan(x)) + (tan(x)) dx = 1 + (tan(x))2 · (tan(x))2 dx 0 0 Z tan(π/4) y 2 dy = tan(0) tan(π/4) 1 1 3 1 = y = tan(π/4)3 = . 3 tan(0) 3 3 (iii) Sei c ∈ R. Mit g(x) = x + c ist Z b Z b+c f (x + c) dx = a f (y) dy. a+c 96 Integration von Funktionen einer Variablen (iv) Sei c 6= 0. Mit g(x) = cx ist Z b f (cx) dx = a 1 c Z bc f (y) dy. ac (v) Wir wollen eine Stammfunktion von tan bestimmen. Dazu setzen wir f (x) = − x1 und g(x) = cos(x). Dann ist g 0 (x) = − sin(x) und F (x) = − log(x) ist eine Stammfunktion von f . Nach der Substitutionsregel ist von sin(x) tan(x) = = g 0 (x)f (g(x)) cos(x) eine Stammfunktion x 7→ F (g(x)) = − log(cos(x)). (7.7) Mit der Substitutionsregel haben wir die Kettenregel rückwärts angewandt. Als nächstes wollen wir die Produktregel rückwärts anwenden. Die resultierende Integrationsregel nennt man dann partielle Integration. Satz 7.16 (Partielle Integration) Seien f und g stetige Abbildungen [a, b] → R mit stetigen Ableitungen f 0 und g 0 . Dann gilt b Z b Z b f 0 (x)g(x) dx. f (x)g 0 (x) dx = f (x)g(x) − a a Z Mit anderen Worten: x 7→ H(x) := f (x)g(x)− a x f 0 (t)g(t) dt ist eine Stammfunktion von x 7→ h(x) := a f (x)g 0 (x). Beweis Es reicht zu zeigen, dass H 0 (x) = h(x) ist. Nach der Produktregel für Ableitungen (Satz 4.6) ist aber d f (x)g(x) = f 0 (x)g(x) + f (x)g 0 (x). dx Nach dem Hauptsatz der Differential- und Integralrechnung ist andererseits Z x d f 0 (t)g(t) dt = f 0 (x)g(x). dx a Also ist (nach Satz 7.3) H 0 (x) = f 0 (x)g(x) + f (x)g 0 (x) − f 0 (x)g(x) = f (x)g 0 (x) = h(x). 2 Natürlich ist partielle Integration nur dann nützlich, wenn das Integral, das man auf der rechten Seite abziehen muss, leichter zu berechnen ist als das Integral, für das man sich ursprünglich interessiert hat. Das ist manchmal, aber durchaus nicht immer, der Fall. Wir wollen hier ein paar Beispiele angeben, bei denen es funktioniert. Z Beispiele 7.17 0 y x sin(x) dx bestimmen. Dazu setzen wir f (x) = x und g(x) = (i) Wir wollen 0 − cos(x). Also g (x) = sin(x), f 0 (x) = 1 und f 0 (x)g(x) = − cos(x). Mit Hilfe der partiellen 7.3 97 Berechnung von Integralen Integration bekommen wir y Z 0 y Z y (− cos(x)) dx x sin(x) dx = −x cos(x) − 0 0 y = −y cos(y) + sin(x) = sin(y) − y cos(y). 0 Z y log(x) dx berechnen. Dazu setzen wir f (x) = log(x) und g(x) = x. Dann ist (ii) Wir wollen f 0 (x) = 1 x 1 und g 0 (x) = 1. Also ist mit partieller Integration Z 1 y y Z log(x) dx = x log(x) − 1 1 y 1 · x dx = y log(y) − y + 1. x Also ist x 7→ x(log(x) − 1) eine Stammfunktion von log. Rπ (iii) Wir wollen 0 x2 cos(x) dx bestimmen. Dazu setzen wir f (x) = x2 und g(x) = sin(x). Damit ist f 0 (x) = 2x und g 0 (x) = cos(x), also Z 0 π π Z x2 cos(x) dx = x2 sin(x) − π Z 0 0 π 2x sin(x) dx = − 2x sin(x) dx, 0 weil sin(π) = sin(0) = 0. Um das verbleibende Integral auszurechnen, wenden wir Beispiel (i) an: Z π 2x sin(x) dx = 2(sin(π) − π cos(π)) = 2π. 0 Insgesamt haben wir also π Z x2 cos(x) dx = −2π. 0 (iv) (Fläche des Einheitskreises) Als letzte und schwierigste Anwendung wollen nun noch die Fläche eines Kreises mit Radius 1 ausrechnen. Hierzu reicht es sicher aus, die Fläche des halben Kreises auszurechnen, der oberhalb der x–Achse liegt und im Ursprung zentriert ist. Nach √ dem Satz von Pythagoras ist für jeden Punkt (x, y) auf dem Kreisrand x2 + y 2 = 1, also y = 1 − x2 . Wir müssen also das folgende Integral ausrechnen: Z 1 I := p 1 − y 2 dy. −1 Wir gehen dazu in zwei Schritten vor. Schritt 1. (Verwendung der Substitutionsregel) Man substituiere y = g(x) := sin(x) (also x = arcsin(y) = g −1 (y)). Dann muss man dy ersetzen durch g 0 (x) dx = cos(x) dx und die Intervallgrenzen −1, 1 durch g −1 (−1), g −1 (1). Damit erhält man Z π/2 p Z π/2 I= 1 − (sin(x))2 · cos(x) dx = (cos(x))2 dx. −π/2 −π/2 98 Integration von Funktionen einer Variablen Schritt 2. (partielle Integration) Wir wenden partielle Integration an mit f (x) = cos(x) und g 0 (x) = cos(x), also f 0 (x) = − sin(x) und g(x) = sin(x): Z π/2 cos(x) · cos(x) dx I= −π/2 π/2 Z + = cos(x) · sin(x) (sin(x))2 dx −π/2 −π/2 Z π/2 π/2 1 − (cos(x))2 dx = π − I. =0+ −π/2 Damit ist I = π/2. 7.4 Uneigentliche Integrale Wir betrachten die Funktion f : (0, 1] → R, x 7→ √1x . Wir würden gerne den Flächeninhalt unter dem R1 Graphen von f im Intervall (0, 1] als Integral 0 f (x) dx angeben. Im Rahmen dessen, wie das Integral in Abschnitt 7.1 eingeführt wurde, funktioniert dies aus zwei Gründen nicht: (1) Wir hatten bisher für die Integration vorausgesetzt, dass f im gesamten abgeschlossenen Intervall [0, 1] definiert ist. (2) Schlimmer noch: lim f (x) = ∞. Deshalb ist jede Obersumme On (f ) = ∞. x↓0 √ Da wir aber zu f die Stammfunktion F (x) = 2 x angeben können, lassen wir uns durch die obigen Bedenken nicht abschrecken, sondern suchen nach einem etwas allgemeineren Integralbegriff. In diesem Fall bietet sich Folgendes an: Für jedes h > 0 ist Z 1 f (x) dx = F (1) − F (h) = 2(1 − √ h). h Die rechte Seite ist für alle h ≥ 0 definiert und stetig in h. Also definieren wir Z 1 Z 1 f (x) dx = F (1) − F (0) = 2. f (x) dx = lim 0 h↓0 h R1 Wir nennen 0 f (x) dx ein uneigentliches Integral – eine der schönsten Wortschöpfungen in der Mathematik! Ähnlich wollen wir verfahren, um Integrationsgrenzen ins Unendliche auszudehnen. Definition 7.18 (Uneigentliches Integral) (i) Seien a ∈ R und b > a oder b = ∞ sowie f : [a, b) → R eine reelle Funktion. Für jedes R ∈ [a, b) sei f auf [a, R] integrierbar. Wir definieren das uneigentliche Integral Z b Z R f (x) dx = lim f (x) dx, a R↑b a falls der Limes existiert (wobei wir −∞ und +∞ als Grenzwerte zulassen wollen). In diesem Fall Rb heißt das Integral a f (x) dx auch konvergent (bzw. uneigentlich konvergent, falls der Grenzwert Rb nicht endlich ist). Andernfalls heißt a f (x) dx divergent. 7.4 99 Uneigentliche Integrale (ii) Analog gehen wir vor, falls b ∈ R und a < b oder a = −∞ sowie f : (a, b] → R ist. Hier ist Z b Z b f (x) dx = lim f (x) dx. R↓a a R (iii) Seien a < b, wobei wir a = −∞ und/oder b = ∞ zulassen, und f : (a, b) → R. Wir wählen ein c ∈ (a, b) und setzen (vergleiche Satz 7.11(iv)) Z b Z c Z b f (x) dx, f (x) dx + f (x) dx = c a a falls wenigstens einer der Summanden endlich ist, oder beide das gleiche Vorzeichen haben. Bemerkung 7.19 In (iii) hängt der Wert der Summe nicht von der Wahl von c ab. Im übrigen verwenden wir die Konvention x + ∞ = ∞, x − ∞ = −∞, falls x ∈ R und ∞ + ∞ = ∞, −∞ − ∞ = −∞. Der Ausdruck ∞ − ∞ kann nicht sinnvoll definiert werden. Beispiele 7.20 (i) a = 0, b = 1, f : (0, 1] → R, f (x) = log(x). Aus Beispiel 7.17(ii) wissen wir, dass F (x) = x(log(x) − 1) eine Stammfunktion von f ist. Die de l’Hospital’sche Regel liefert lim F (x) = 0 (siehe Beispiel 4.16(v)). Also konvergiert das uneigentliche Integral x↓0 Z 1 Z 1 log(x) dx = F (1) − lim F (R) = F (1) = −1. log(x) dx = lim 0 R↓0 R↓0 R (ii) a = 0, b = ∞, f : [0, ∞) → R, f (x) = exp(−x). Offenbar ist R Z R −x −x e dx = −e = 1 − e−R . 0 0 Also konvergiert das uneigentliche Integral Z ∞ e−x dx = lim 1 − e−R = 1. R→∞ 0 1 (iii) a = −∞, b = ∞, f : R → R, x 7→ K+x 2 , wobei K > 0 eine Konstante ist. Dann ist F (x) = x 1 √ arctan( √ ) eine Stammfunktion, denn K K 1 1 x 1 1 1 0 0 F (x) = √ · √ arctan √ = · = . 2 K 1 + x /K K + x2 K K K Wegen lim arctan(R) = − lim arctan(R) = R→∞ ∞ Z c R→−∞ 1 f (x) dx = lim √ arctan R→∞ K x √ K π 2 ist für c ∈ R R = √1 · π − √1 arctan √c . K 2 K K c und Z c 1 f (x) dx = lim √ arctan R→−∞ K −∞ Also existiert das uneigentliche Integral Z ∞ −∞ x √ K c 1 π = √1 arctan √c +√ · . K K K 2 R 1 π dx = √ . 2 K +x K 100 Integration von Funktionen einer Variablen (iv) a = 1, b = ∞, f : [1, ∞) → R, f (x) = x1 . Dann ist F (x) = log(x) eine Stammfunktion. Wegen lim F (x) = ∞ konvergiert das uneigentliche Integral nur uneigentlich x→∞ R 1 dx = lim log(x) = lim log(R) = ∞. R→∞ R→∞ x 1 ∞ Z 1 (v) a = 0, b = ∞, f : [0, ∞) → R, f (x) = sin(x). Dann ist F (x) = − cos(x) eine Stammfunktion. Jedoch existiert der Grenzwert von F (x) für x → ∞ nicht. Also existiert auch das uneigentliche R∞ Integral 0 sin(x) dx nicht. R∞ An diesem Beispiel sieht man auch, dass für die Existenz von −∞ f (x) dx nicht ausreichend ist, RR dass lim −R f (x) dx existiert. In dem hier betrachteten Fall ist nämlich R→∞ Z R −R R = − cos(R) + cos(−R) = 0. sin(x) dx = − cos(x) −R Also ist auch Z R lim R→∞ Aber R∞ −∞ sin(x) dx = 0. −R sin(x) dx existiert nicht, wie wir gesehen haben. Oft ist man in der Situation, dass man den Wert eines bestimmten (uneigentlichen) Integrals ausrechnen möchte, obwohl man eine Stammfunktion nicht, oder nur schwer, ausrechnen kann. Oft ist es so verzwickt, diese Integrale auszurechnen, dass man auf Tabellen angewiesen ist, in denen solche Integrale aufgelistet sind. ∞ Z xn e−x dx ausrechnen (für n ∈ N). Im Prinzip könnte man schon eine Beispiel 7.21 Wir wollen In := 0 Stammfunktion angeben, aber es geht hier einfacher. Mit partieller Integration (f (x) = xn , g(x) = −e−x ) erhalten wir R Z R Z R n −x n −x x e dx = −x e + nxn−1 e−x dx. 0 0 0 Wegen lim Rn e−R = 0 verschwindet der erste Summand, wenn R nach ∞ geht, also ist R→∞ Z ∞ xn e−x dx = 0 Z ∞ nxn−1 e−x dx. 0 Also ist In = nIn−1 . Wir haben aber I0 schon ausgerechnet: Z ∞ I0 = e−x dx = 1. 0 Also ist I1 = 1 · I0 = 1, I2 = 2 · I1 = 2 · 1 = 2, I3 = 3 · I2 = 3 · 2 · 1 = 3! = 6, . . . , In = n(n − 1)(n − 2) · · · 2 · 1 = n!. Insgesamt haben wir also Z 0 ∞ xn e−x dx = n! (7.8) 7.5 101 Komplexe Integranden 2 Beispiel 7.22 Für die Gauß’sche Fehlerfunktion f (x) = e−x kann man keine Stammfunktion explizit angeben. Aber man kann (wenn auch mit viel Mühe) ausrechnen, dass ∞ Z 2 e−x dx = √ π. (7.9) −∞ Beispiel 7.23 Man kann berechnen, dass ∞ Z 0 7.5 sin(x) π dx = . x 2 Komplexe Integranden Wenn wir eine komplexwertige Funktion f : [a, b] → R haben, bei der der Realteil Re(f ) und der Imaginärteil Im(f ) integrierbare Funktionen sind, so können wir das Integral von f definieren. Definition 7.24 Z b Z f (x) dx := a b Z Re(f (x)) dx + i a b Im(f (x)) dx. a Man bemerke, dass diese Definition verträglich ist mir den Rechenregeln aus Satz 7.11. Wegen Regel (ii) und f = Re(f ) + i Im(f ) müssen wir das Integral von f sogar so definieren. Das hier definierte Integral hat zwar keine so schöne anschauliche Interpretation wie das Integral mit reellwertigen Integranden, aber zum Rechnen ist es in manchen Situationen extrem praktisch. Bemerkung 7.25 Alle Regeln aus diesem Kapitel für die Bestimmung von Integralen gelten genauso für komplexwertige Integranden f . Beispiel 7.26 Das wichtigste Beispiel ist mal wieder die komplexe Exponentialfunktion f (x) = exp(iλx), wobei λ ∈ R, λ 6= 0. Wenden wir ganz formal die Rechenregeln an, so erhalten wir Z a b b exp(iλb) − exp(iλa) 1 exp(iλx) dx = exp(iλx) = . iλ iλ a Ist speziell n = λ ∈ Z \ {0}, sowie b = 2π und a = 0, so verschwindet der Zähler des Bruches, denn exp(2πn) = exp(0) = 1. Insgesamt erhalten wir die folgende wichtige Formel Z I(n) := 2π exp(inx) dx = 0 2π, 0, falls n = 0, falls n 6= 0. Mit Hilfe von (7.10) können wir nun gewisse Integrale von Winkelfunktionen sehr leicht berechnen. (7.10) 102 Integration von Funktionen einer Variablen Satz 7.27 Es seien m, n ∈ N0 . Dann ist ( 2π Z sin(mx) sin(nx) dx = 0 π, falls m = n 6= 0, 0, sonst. 2π, 2π π, cos(mx) cos(nx) dx = 0 0, (7.11) falls m = n = 0, Z falls m = n 6= 0, (7.12) sonst. 2π Z sin(mx) cos(nx) dx = 0. (7.13) 0 eix + e−ix eix − e−ix und cos(x) = Im(eix ) = . Beweis Nach Lemma 1.5 (iii) ist sin(x) = Re(eix ) = 2i 2 Daher ist eimx − e−imx einx − e−inx · sin(mx) sin(nx) = 2i 2i 1 i(m+n) =− e − ei(m−n) + e−i(m+n) − e−i(m−n) . 4 Also ist (mit der Notation aus (7.10)) Z 2π sin(mx) sin(nx) dx = − 0 1 1 I(m + n) − I(m − n) − I(−(m + n)) − I(−(m − n)) . 4 4 Ist n = 0, so verschwinden trivialerweise die jeweiligen Differenzen und der Gesamtausdruck ist gleich 0. Sei nun n 6= 0. Dann ist m + n 6= 0, also nach (7.10) I(m + n) = I(−(m + n)) = 0. Ist m 6= n, so ist m − n 6= 0, also auch I(m − n) = I(−(m − n)) = 0. Ist schließlich m = n, so ist m − n = 0, also auch I(m − n) = I(−(m − n)) = 2π. Insgesamt haben wir (7.11) nachgewiesen. 2 Der Nachweis von (7.12) und (7.13) verbleibt als Übung! 7.6 Partialbruchzerlegung 1 Wir wollen eine Stammfunktion F zu f (x) = 1−x 2 angeben. Wie geht man vor? Wir haben im Kapitel 6 gesehen, dass 1 1 1 1 = + . 1 − x2 2 1+x 1−x 1 1 Die Ausdrücke 1+x und 1−x heißen die Partialbrüche von f . Nun sind aber log(1 + x) und − log(1 − x) 1 1 . Also ist Stammfunktionen von 1+x und 1−x F (x) = 1 1 (log(1 + x) − log(1 − x)) = log 2 2 1+x 1−x eine Stammfunktion von f . Der folgende Satz zeigt, das wir hier keinen Glückstreffer gelandet haben, sondern, dass wir für jede rationale Funktion eine ähnliche Zerlegung finden können. 7.6 103 Partialbruchzerlegung Satz 7.28 (Partialbruchzerlegung) Man kann jede reelle rationale Funktion f als eine Summe schreiben von einem Polynom und von rationalen Funktionen die jeweils von einem der folgenden drei Typen sind: a (x + b)p a x 7→ 2 (x + bx + c)p ax x 7→ 2 . (x + bx + c)p x 7→ (1) (2) (2) Dabei können die Koeffizienten a, b, c ∈ R, sowie die Potenz p ∈ N bei jedem Summanden unterschiedlich sein. Eine solche Summe heißt Partialbruchzerlegung von f . Das Gute an einer Partialbruchzerlegung ist, dass man für die einzelnen Summanden Stammfunktionen angeben kann, die sind nämlich tabelliert. Wir wollen das Verfahren an einem Beispiel erläutern. R9 x4 −3x 4 x2 −4x+3 Beispiel 7.29 Wir wollen x4 −x4 −3x +4x3 −3x2 4x3 −3x2 −3x −4x3 +16x2 −12x 13x2 −15x −13x2 dx berechnen. Durch Polynomdivision erhalten wir ÷ x2 − 4x + 3 = x2 + 4x + 13 Rest 37x − 39 (7.14) +52x −39 37x −39 Also ist x4 − 3x 37x − 39 = x2 + 4x + 13 + 2 . 2 x − 4x + 3 x − 4x + 3 Der erste Teil macht keine Probleme. Für den Nenner bestimmen wir mit quadratischer Ergänzung die Linearfaktoren x2 − 4x + 3 = (x − 1)(x − 3). Also suchen wir nach Zahlen A1 und A2 mit A1 A2 37x − 39 + = , x−1 x−3 (x − 1)(x − 3) für x 6∈ {1, 3}. Dazu bringen wir die linke Seite auf einen Nenner A1 (x − 3) + A2 (x − 1) (A1 + A2 )x − 3A1 − A2 = . (x − 1)(x − 3) (x − 1)(x − 3) Also ist A1 + A2 = 37 und − 3A1 − A2 = −39. 104 Integration von Funktionen einer Variablen Die Lösung dieser linearen Gleichung ist A1 = 1, A2 = 36. Insgesamt haben wir 36 x4 − 3x 1 = x2 + 4x + 13 + + , − 4x + 3 x−1 x−3 für x 6∈ {1, 3}. x2 Hierzu können wir leicht die Stammfunktion F angeben F (x) = 1 3 x + 2x2 + 13x + log(|x − 1|) + 36 log(|x − 3|). 3 Also ist Z 4 9 1 x4 − 3x dx = 729 + 2 · 81 + 13 · 9 + log(8) +36 · | {z } − 4x + 3 3 log(6) | {z } x2 =3 log(2) − = log(2)+log(3) 1 64 + 2 · 16 + 13 · 4 + log(3) 3 1250 + 39 log(2) + 35 log(3) ≈ 482.151. 3 Analog können wir das Integral dieser Funktion in den Grenzen −1 bis 0 ausrechnen (als Illustration dafür, dass die Betragsstriche bei den Logarithmen tatsächlich eine Rolle spielen): Z 0 −1 x4 − 3x dx = F (0) − F (−1) x2 − 4x + 3 1 = 0 + 35 log(3) − − + 2 − 13 + log(2) + 36 log(4) 3 = 36 log(3) + 34 − 73 log(2) ≈ 0.28363. 3 In vorangehenden Beispiel hatten wir ausgenutzt, dass wir für das quadratische Polynom im Nenner reelle Nullstellen angeben konnten. Was machen wir aber, wenn das Polynom x2 + bx + c im Nenner keine reelle Nullstelle hat? Wir schauen in der Formelsammlung nach und finden: Lemma 7.30 Sei die Diskriminante ∆ = b2 −4c < 0 (d.h. x2 +bx+c hat keine reelle Nullstelle, vergleiche x 1 und g(x) = 2 . Stammfunktionen F und G von f und Satz 1.16) und seien f (x) = 2 x + bx + c x + bx + c g sind 2 2x + b arctan √ , F (x) = √ −∆ −∆ 1 b G(x) = log x2 + bx + c − √ arctan 2 −∆ Beweis Ableitungen bilden! 2x + b √ −∆ . 2 7.7 105 Wichtige Ungleichungen Beispiel 7.31 Wir wollen R1 x2 −x 0 x2 −2x+4 dx berechnen. Zunächst einmal schreiben wir den Bruch um: x2 − x x−4 =1+ 2 = 1 + f (x) + g(x), 2 x − 2x + 4 x − 2x + 4 wobei f (x) = −4 , x2 − 2x + 4 g(x) = x . x2 − 2x + 4 Ist b = −2 und c = 4, so ist ∆ = b2 − 4c = −12 < 0, also hat x2 − 2x + 4 keine reellen Nullstellen. Nach dem Lemma haben f und g die Stammfunktionen x−1 4 √ F (x) = − √ arctan 3 3 und 1 1 x−1 2 √ G(x) = log x − 2x + 4 + √ arctan . 2 3 3 √ √ Es ist F (1) = 0 und F (0) = − √43 arctan(−1/ 3) = 92 3 π sowie G(1) = √ 1 log(2) − 18 3 π. Also ist Z 0 7.7 1 1 2 log(3) und G(0) = x2 − x dx = 1 + F (1) − F (0) + G(1) − G(0) x2 − 2x + 4 1 1√ = 1 + log(3) − log(2) − 3 π ≈ −0.0507. 2 6 Wichtige Ungleichungen Wenn man Integrale nicht genau ausrechnen kann, kann man manchmal durch Vergleich mit bekannten Integralen Abschätzungen angeben. Hier stellen wir die wichtigsten Typen solcher Abschätzungen vor. Im folgenden ist stets a ∈ R oder a = −∞ und b ∈ R mit b > a oder b = ∞. Weiter sind f und g Funktionen, die auf (a, b) definiert sind. Satz 7.32 Sind f und g integrierbar und ist f (x) ≤ g(x) für alle x, so ist Z b Z f (x) dx ≤ a b g(x) dx. a Die Aussage sollte auch ohne gesonderten Beweis klar sein. Etwas komplizierter wird es im folgenden Satz. Z b Satz 7.33 Sei g(x) ≥ 0 für alle x ∈ R und sei g(x) dx < ∞. Ist |f (x)| ≤ g(x) für alle x und ist f a Z b (wenigstens stückweise) stetig, so existiert f (x) dx, und es gilt a Z Z b b f (x) dx ≤ g(x) dx. a a 106 Integration von Funktionen einer Variablen Speziell gilt für jede (uneigentlich) integrierbare Funktion f Z Z b b |f (x)| dx. f (x) dx ≤ a a Sind a, b ∈ R und M ≥ f (x) für alle x ∈ R, so ist Z b |f (x)| dx ≤ M · (b − a). a R∞ Beispiel 7.34 Wir wollen 0 exp(−x2 ) dx abschätzen. Wir wissen, dass x2 ≥ x − ist exp(−x2 ) ≤ exp( 14 ) exp(−x) für alle x. Es folgt Z ∞ Z ∞ 2 1/4 exp(−x ) dx ≤ e e−x dx = e1/4 ≈ 1.28. 0 1 4 ist für alle x. Also 0 Aus Beispiel 7.22 kennen wir allerdings auch schon den exakten Wert, nämlich √ Z ∞ Z π 1 ∞ 2 2 exp(−x ) dx = ≈ 0.886. exp(−x ) dx = 2 2 −∞ 0 Beispiel 7.35 Es ist Z ∞ 1 sin(x) 1 weil 2 ≤ 2 ist und x x Z 1 Beispiel 7.36 Wir wollen wissen, ob n − 1 ≤ x < n. Dann ist f (x) < 1 x2 ∞ sin(x) dx < ∞, x2 ∞ 1 −1 dx = −x = 1. 2 x 1 ∞ k X X 1 1 := lim endlich ist. Dazu setzen wir f (x) = 2 k→∞ n n2 n=1 n=1 1 n2 , falls =: g(x) und Z k Z k k X 1 = f (x) dx = 1 + f (x) dx. n2 0 1 n=1 Also ist Der wirkliche Wert Z ∞ ∞ X 1 1 ≤ 1 + dx = 2. 2 n x2 1 n=1 ∞ P n=1 1 n2 = π2 6 ≈ 1.645 ist kaum kleiner. Als letztes bringen wir noch die Cauchy-Schwarz’sche Ungleichung. Diese wird uns in ähnlicher Form noch gelegentlich begegnen. Der Beweis kann hier leider nicht erbracht werden. Satz 7.37 (Cauchy-Schwarz’sche Ungleichung) Ist Z b (f (x))2 dx < ∞ und a Z a b (g(x))2 dx < ∞, 7.7 so ist 107 Wichtige Ungleichungen v Z ! ! Z Z b u b b u t 2 2 f (x)g(x) dx ≤ (g(x)) dx . (f (x)) dx a a a R π/2 Beispiel 7.38 Wir wollen 0 x sin(x) dx nach oben abschätzen. Die Cauchy-Schwarz’sche Ungleichung liefert s s Z π/2 Z π/2 Z π/2 2 x sin(x) dx ≤ x dx (sin(x))2 dx 0 0 0 r v u Z π/2 1 π 3u u1 = (1 − cos(2x)) dx 3 2 u t2 |0 {z } =π/2 1 = √ π 2 ≈ 1.0073 . . . . 4 6 Der wirkliche Wert lässt sich durch partielle Integration berechnen und beträgt 1. Man liegt also mit der Abschätzung gar nicht so verkehrt. ∞ e−x dx bestimmen. Leider können wir das Integral nicht explizit ausrechx 1 nen. Wir können aber mit der Cauchy-Schwarz’schen Ungleichung eine obere Schranke für den Wert angeben: sZ sZ Z ∞ −x ∞ ∞ e 1 dx ≤ dx e−2x dx x x2 1 1 1 r r ∞ 1 −2x ∞ = − e −x−1 2 1 1 p = e−1 1/2 ≈ 0.2601 . . . . Z Beispiel 7.39 Wir wollen Der wirkliche Wert, den man sich nur durch andere numerische Methoden verschaffen kann, beträgt 0.2193 . . .. Auch hier liegt man mit der Abschätzung nicht so verkehrt. 108 Integration von Funktionen einer Variablen Kapitel 8 Gewöhnliche Differentialgleichungen Im ersten Abschnitt motivieren wir den Begriff der Differentialgleichung und führen ihn formal ein. In zwei weiteren Abschnitten behandeln wir konkrete Lösungsverfahren für Differentialgleichungen erster und zweiter Ordnung. 8.1 Allgemeines Wir betrachten eine Situation, bei der wir in einem wissenschaftlichen Experiment einen Parameter x frei einstellen können (bzw. wo x die Zeit ist) und y = y(x) ist eine Messgröße, die von x abhängt. Die Naturwissenschaft formuliert als Naturgesetz einen Zusammenhang zwischen x und y(x). Der Zusammenhang kann allerdings derart formuliert sein, dass nicht unmittelbar klar wird, wie man y(x) bei gegebenem x auch wirklich berechnet. Die Aufgabe der Mathematik ist es, Formeln für die Abbildungsvorschrift x 7→ y(x) zu finden. Beispiel 8.1 (Reaktion zweiter Ordnung) Wir betrachten die chemische Reaktion 2NO2 −→ 2NO + O2 . Wir interessieren uns hier für die Reaktionskinetik. Mit x bezeichnen wir die verstrichene Zeit, mit y(x) die Konzentration von Stickstoffdioxid zur Zeit x. Aus elementaren chemischen Überlegungen heraus wird ein Gesetz formuliert, dass der Stoffumsatz pro Zeiteinheit proportional zu y 2 (x) sein muss. Das entsprechende Naturgesetz lautet also d y 0 (x) = y(x) = −ky 2 (x). (8.1) dx Hierbei ist k ≥ die Reaktionskonstante. Wir nehmen an, dass die Messung zur Zeit x = 0 beginnt und die Anfangskonzentration y(0) = y0 ≥ 0 ist. Wir werden später sehen, wie man diese Gleichung systematisch so löst, dass man die Zuordnungsvorschrift x 7→ y(x) erhält. An dieser Stelle geben wir die Lösung nur an: y(x) = y0 1 . 1 + kxy0 (8.2) Hat man die Formel für y erst einmal an der Hand, so kann man leicht prüfen, dass y die Gleichung (8.2) löst. Probe: √ −ky0 y 0 (x) = y0 = −k y 2 (x) . (1 + kxy0 )2 109 110 Gewöhnliche Differentialgleichungen Der schwierige Teil besteht stets darin, eine Lösung zu raten oder sich systematisch zu verschaffen. Das Nachprüfen ist stets einfach. In diesem Sinne haben wir eine ähnliche Situation wie bei der Integration: Auch dort war es schwierig, eine Stammfunktion zu raten. Das Nachprüfen, ob eine Funktion tatsächlich eine Stammfunktion ist, ist stets einfach. Wir wollen in diesem Kapitel annehmen, dass das Naturgesetz in der Form F (x, y, y 0 , y 00 , . . . , y (n) ) = 0 (8.3) vorliegt für ein n ∈ N. (Im Beispiel war n = 1 und F (x, y, y 0 ) = ky 2 + y 0 .) Definition 8.2 (Differentialgleichung) Eine Gleichung der Form (8.3) heißt gewöhnliche Differentialgleichung (DGL) der Ordnung n. Kann man die Gleichung nach y (n) auflösen, gilt also y (n) = G(x, y, y 0 , . . . , y (n−1) ) (8.4) für eine Funktion G, so heißt (8.4) explizite Differentialgleichung Die Gleichung (8.1) ist also eine explizite (gewöhnliche) DGL erster Ordnung. Die Bezeichnung gewöhn” lich“ bedeutet lediglich, dass die Funktion y nur von einem freien Parameter abhängt. Gibt es mehrere freie Parameter, so spricht man von einer partiellen Differentialgleichung. Partielle Differentialgleichung treten auf bei der Untersuchung von Wärmeflussphänomenen oder von Wellen sowie in der Quantenmechanik. Hier behandeln wir nur gewöhnliche Differentialgleichungen. Im allgemeinen hat man bei der Lösung einer DGL der n-ter Ordnung noch n freie Konstanten zu wählen. Im Beispiel 8.1 war dies die Anfangskonzentration. Definition 8.3 (Anfangswertproblem) Die Angabe einer expliziten DGL und der Anfangswerte x0 , y(x0 ) = y0 , y 0 (x0 ) = y1 , . . . , y (n−1) (x0 ) = yn−1 (8.5) heißt Anfangswertproblem (AWP). Wir wollen nun festhalten, was wir unter einer Lösung einer Differentialgleichung verstehen. Definition 8.4 (Lösung einer DGL) Eine (wenigstens) n-mal differenzierbare Funktion y, die (8.3) erfüllt, heißt Lösung der DGL (8.3). Gilt zusätzlich noch (8.5), so heißt y eine Lösung des Anfangswertproblems [(8.3), (8.5)]. Beispiel 8.5 (Freier Fall) Wir lassen einen Stein aus einer Höhe y0 zur Zeit x = 0 fallen und wollen die Höhe y(x) als Funktion der Zeit x beschreiben. Physikalische Überlegungen ergeben, dass im freien Fall die Beschleunigung konstant ist y 00 (x) = −g, (8.6) wobei g = 9.81 sm2 die Erdbeschleunigung ist. Die Gleichung (8.6) ist eine explizite Differentialgleichung zweiter Ordnung. Für das Anfangswertproblem müssen wir also x0 , sowie y(x0 ) und y 0 (x0 ) vorgeben. In diesem Fall ist x0 = 0, y(0) = y0 und y 0 (0) = 0, weil der Stein anfangs noch in Ruhe befindlich ist. Dieses AWP lässt sich explizit lösen: Nach dem Hauptsatz der Differential- und Integralrechnung ist Z x y 0 (x) = y 0 (0) + y 00 (t) dt = −gx. 0 0 Genauso können wir y integrieren und erhalten Z y(x) = y0 + 0 x 1 y 0 (t) dt = y0 − gx2 . 2 Auch hier ergibt die Probe leicht, dass y wirklich eine Lösung des AWP ist. 8.2 111 Lösungsverfahren für DGL’en 1. Ordnung 8.2 Lösungsverfahren für DGL’en 1. Ordnung Wir betrachten im folgenden stets eine explizite Differentialgleichung erster Ordnung y 0 (x) = F (x, y(x)). Die Abbildungsvorschriften x 7→ y(x) sowie x 7→ y 0 (x) kennen wir nicht. Die Abbildung (x, y) 7→ F (x, y) ist vorgegeben. In diesem Abschnitt wollen wir zunächst eine geometrische Interpretation der DGL angeben. Danach behandeln wir die Frage, ob es stets eine Lösung der DGL gibt, und wenn ja, ob diese eindeutig ist, oder ob es eventuell mehrere Lösungen (mit selben Anfangswerten) geben kann. Danach wenden wir uns ganz konkreten Methoden zu, mit denen gewisse Typen expliziter Differentialgleichungen erster Ordnung gelöst werden können. 8.2.1 Geometrische Interpretation Zu jedem Wert der unabhängigen Variablen x und der abhängigen Variablen y können wir die Ableitung dy dx = F (x, y) einer Lösungskurve ausrechnen. Wir tragen in einem Diagramm Pfeile auf, die in (x, y) fußen und die Steigung F (x, y) haben. Die Lösungen der DGL sind dann die Integralkurven des Richtungsfeldes, d.h. sie haben in jedem Punkt (x, y) die vorgegebene Richtung als Tangente. 2 1.5 y(x) 1 0.5 0 1 2 3 4 5 6 x F IGUR . Richtungsfeld der DGL y 0 (x) = y − y 2 (x) + 13 cos(x) mit Lösungskurven zu den Anfangsbedingungen (x0 , y0 ) = (2, 1.5), (2, 1.08), (2, 1.05), (2, 1.01), (2, 0.8) 112 8.2.2 Gewöhnliche Differentialgleichungen Lösbarkeit und Eindeutigkeit Um die Lösbarkeit der DGL sowie die Eindeutigkeit der Lösung zu garantieren, braucht man gewisse Regularitätsannahmen an die Funktion F . Mit d F (x + h, y) − F (x, y) F (x, y) = lim h→0 dx h und d F (x, y + h) − F (x, y) F (x, y) = lim h→0 dy h bezeichnen wir die partiellen Ableitungen von F , falls die Grenzwerte existieren. Die partiellen Ableitungen werden genauso gebildet wie die Ableitungen, die wir schon kennen gelernt haben. Wir fassen im ersten Fall F als Funktion nur von x auf und leiten ab, im zweiten Fall fassen wir F als Funktion nur von y auf und leiten ab. Beispielsweise sind für F (x, y) = x cos(y 2 ) + sin(xy) die partiellen Ableitungen d d 2 2 dx F (x, y) = cos(y ) + y cos(xy) und dy F (x, y) = −2xy sin(y ) + x cos(xy). Bemerkung Oftmals findet man auch die Schreibweise ∂ ∂x und ∂ ∂y für d dx und d dy . Satz 8.6 (Existenz und Eindeutigkeit) Sei (x, y) 7→ F (x, y) stetig und differenzierbar in den Variablen x d d F (x, y) und dy F (x, y) stetig in x und y. und y und seien die partiellen Ableitungen dx Dann existiert zu zu (x0 , y0 ) genau eine Lösung des Anfangswertproblems y 0 = F (x, y), y(x0 ) = y0 . Der Satz kann in diesem Rahmen nicht bewiesen werden. d d Beispiel 8.7 Sei F (x, y) = −2xy. Dann ist dx F (x, y) = −2y und dy F (x, y) = −2x. Also sind die partiellen Ableitungen stetig und damit die Voraussetzungen des Satzes erfüllt. Wir haben damit zwar noch keine Lösung an der Hand, aber wir wissen, dass es eine gibt. Außerdem wissen wir, wenn wir eine Lösung geraten haben, dass es die einzige Lösung ist. In diesem Fall müssen wir also nicht weiter suchen. In diesem Beispiel kann man eine Lösung angeben (wir werden später noch sehen, wie man darauf kommt): 2 Für x0 = 0 und y(0) = 1 ist y(x) = e−x eine Lösung des AWP (Nachrechnen!). Der Satz sagt uns nun, dass dieses y die einzige Lösung ist. 8.2.3 Trennung der Variablen Wir nehmen jetzt an, dass F die besondere Gestalt hat: F (x, y) = − g(x) h(y) (8.7) für gewisse stetige Funktionen g und h. Wir sagen dann, dass die Variablen x und y getrennt sind, denn wir können, zumindest formal, schreiben h(y)dy = −g(x)dx. Die Strategie ist nun, beide Seiten zu integrieren und dann nach y aufzulösen. Wir setzen Z y Z x H(y) = h(t) dt, G(x) = g(t) dt. y0 x0 8.2 113 Lösungsverfahren für DGL’en 1. Ordnung Dann ist (nach der Kettenregel) d H(y(x)) = y 0 (x)H 0 (y(x)). dx Nach dem Hauptsatz der Differential- und Integralrechnung ist dies gleichbedeutend mit d H(y(x)) = y 0 (x)h(y(x)). dx Etwas einfacher erhält man d G(x) = g(x). dx Addieren wir die beiden Gleichungen, so bekommen wir d H(y(x)) + G(x) = y 0 (x)h(y(x)) + g(x) = 0, dx wobei wir in der zweiten Gleichung die DGL eingesetzt haben. Eine Funktion mit verschwindender Ableitung ist konstant, also gilt H(y(x)) + G(x) = H(y(x0 )) + G(x0 ) = 0. (8.8) Um das AWP zu lösen, müssen wir jetzt (8.8) nach y auflösen. Beispiel 8.8 Wir betrachten die DGL y 0 (x) = − x−a , y−b wobei a und b reelle Zahlen sind. Dann ist g(x) = x − a und h(y) = y − b. Wir erhalten Z y H(y) = (t − b) dt = 1 1 (y − b)2 − (y0 − b)2 , 2 2 (t − a) dt = 1 1 (x − a)2 − (x0 − a)2 . 2 2 y0 x Z G(x) = x0 Es folgt, dass (x − a)2 + (y(x) − b)2 = (x0 − a)2 + (y0 − b)2 =: R2 . Auflösen nach y ergibt y(x) = b ± p R2 − (x − a)2 , x ∈ (a − |R|, a + |R|), wobei das Vorzeichen, das Vorzeichen von y0 − b ist. Die Lösungskurve ist also ein Halbkreis um den Punkt (a, b) in der Ebene, der durch den Punkt (x0 , y0 ) geht. 114 Gewöhnliche Differentialgleichungen 1 y(x) –1 0.5 0 –0.5 0.5 1 x –0.5 –1 F IGUR . Richtungsfeld der DGL y 0 (x) = −x/y(x) mit Lösungskurve für x0 = 0, y0 = 1. Die Lösung ist nicht für alle x definiert und y0 = b ist offenbar als Startwert nicht zugelassen. Das liegt daran, dass die Funktion F (x, y) = − x−a y−b hier unstetig ist. (Im Diagramm wechseln die Pfeile in der x–Achse die Richtung schlagartig.) Beispiel 8.9 (Malthus’sches Wachstumsgesetz) Wir betrachten ein einfaches Wachstumsgesetz für Populationen, das auf Malthus zurück geht. Hier ist x die Zeit und y(x) die Größe der Population zur Zeit x. Wir nehmen an, dass die Vermehrung der Population proportional zur Anzahl der lebenden Individuen ist y 0 (x) = λy(x), dabei ist λ > 0 ein Parameter. Als Anfangswert nehmen wir x0 und y0 > 0 an. In der Notation von (8.7) ist also etwa (man hat natürlich immer Wahlmöglichkeiten indem man g und h mit der selben Funktion multipliziert) 1 g(x) = −λ, h(y) = . y Wir berechnen für y > 0 Z y H(y) = y0 1 dt = log(y) − log(y0 ) = log(y/y0 ), t G(x) = −λ(x − x0 ). Also ist log y(x) y0 = λ(x − x0 ). 8.2 115 Lösungsverfahren für DGL’en 1. Ordnung Auflösen nach y(x) ergibt y(x) = y0 exp(λ(x − x0 )). Bemerkung 8.10 In vielen Fällen muss man die Differentialgleichung erst durch eine geeignete Transformation in die Form (8.7) bringen, damit man die Methode der Trennung der Variablen anwenden kann. Wir wollen uns dies in einem einfachen Fall anschauen. Wir betrachten die DGL y 0 (x) = f (ax + by(x) + c), wobei f eine stetig differenzierbare Funktion ist und a, b, c ∈ R. Interessant ist hier nur der Fall b 6= 0. Wir ersetzen jetzt die abhängige Variable y durch z(x) = ax + by(x) + c. Dann ist z 0 (x) = a + by 0 (x) = a + bf (z(x)). Wie oben erhalten wir nun eine Lösung für z indem wir Z z(x) 1 dt x − x0 = a + bf (t) z0 nach z(x) auflösen. Daraus können wir sofort y(x) berechnen. Beispiel 8.11 y 0 (x) = (x + y)2 . Dann erfüllt z(x) = x + y(x) die DGL z 0 (x) = z 2 (x) + 1. Die explizite Lösung ist z(x) = tan(x + C), wobei die Zahl C noch von den Anfangswerten abhängt. Die allgemeine Lösung ist also y(x) = tan(x + C) − x. 8.2.4 Exakte Differentialgleichung Wir nehmen hier an, dass die DGL in der Form y 0 (x) = − g(x, y(x)) h(x, y(x)) (8.9) vorliegt mit stetigen Funktionen g und h. Gegenüber dem Fall mit den getrennten Variablen dürfen die Funktionen g und h jetzt von beiden Variablen x und y abhängen. Zudem wollen wir annehmen, dass es eine Funktion U (x, y) gibt mit der Eigenschaft, dass für die partiellen Ableitungen gilt d U (x, y) = g(x, y), dx d U (x, y) = h(x, y). dy (8.10) Definition 8.12 (Exakte DGL) Ist (8.10) erfüllt, so heißt die Differentialgleichung exakt. U heißt dann eine Stammfunktion. 116 Gewöhnliche Differentialgleichungen Warum ist es nützlich, eine exakte Differentialgleichung zu haben? Wenn man sich die Stammfunktion verschaffen kann, ist man mit dem Lösen der DGL schon fast fertig. Es gilt nämlich (hier benötigen wir genau genommen die mehrdimensionale Kettenregel, die wir später noch kennen lernen werden) d d d U (x, y(x)) = U (x, y) + y 0 (x) U (x, y) y=y(x) y=y(x) dx dx dy = g(x, y(x)) + y 0 (x)h(x, y(x)) = 0, wobei wir im letzten Schritt die DGL eingesetzt haben. Also ist x 7→ U (x, y(x)) konstant, mithin U (x, y(x)) = U (x0 , y0 ) für alle x. (8.11) Jetzt müssen wir diese Gleichung nur noch nach y(x) auflösen und haben das AWP gelöst. Wie können wir entscheiden, ob eine exakte Differentialgleichung vorliegt? Wie findet man eine Stammfunktion? Man kann zeigen, dass d d g(x, y) = h(x, y). dy dx (8.12) eine notwendige und hinreichende Bedingung dafür ist, dass die DGL exakt ist. (Den Beweis für die Notwendigkeit bleiben wir hier schuldig.) Ansatz für die Stammfunktion: Wir definieren Z x Z U (x, y) = g(s, y0 ) ds + x0 y h(x, t) dt. (8.13) y0 Dann gilt nach dem Hauptsatz der Differential- und Integralrechnung d U (x, y) = h(x, y). dy Weiter gilt (wobei wir in der Gleichung Integral und Ableitung vertauschen, was, genau genommen, einer Rechtfertigung bedarf) Z y d d U (x, y) = g(x, y0 ) + h(x, t) dt dx dx y0 Z y d = g(x, y0 ) + h(x, t) dt y0 dx Z y d = g(x, y0 ) + g(x, t) dt dt y0 = g(x, y0 ) + g(x, y) − g(x, y0 ) . Dabei haben wir im vorletzten Schritt die Bedingung (8.12) eingesetzt. Wir haben also gezeigt, dass U aus (8.13) in der Tat eine Stammfunktion ist, also die DGL exakt ist. Beispiel 8.13 y 0 (x) = − 3y + sin(x) . cos(y) + 3x 8.2 117 Lösungsverfahren für DGL’en 1. Ordnung Dann ist g(x, y) = 3y + sin(x) und h(x, y) = cos(y) + 3x. Es gilt d d g(x, y) = 3 = h(x, y). dy dx Also ist die DGL exakt. Die Stammfunktion bestimmen wir durch Z x Z y U (x, y) = (3y0 + sin(s)) ds + (cos(t) + 3x) dt x0 y0 = 3y0 (x − x0 ) + cos(x0 ) − cos(x) + 3x(y − y0 ) + sin(y) − sin(y0 ) = 3xy − cos(x) + sin(y) − [3x0 y0 − cos(x0 ) + sin(y0 )]. Da U (x, y(x)) konstant ist, gilt also für alle x 3xy(x) − cos(x) + sin(y(x)) = 3x0 y0 − cos(x0 ) + sin(y0 ). Wir können diese Gleichung nicht mehr weiter nach y(x) explizit auflösen, aber jetzt helfen uns numerische Verfahren, wie die Intervallschachtelung aus Kapitel 3.3 weiter, um konkrete Werte von y(x) auszurechnen. Beispiel 8.14 (Zur Übung!) Man zeige, dass die DGL y 0 (x) = y 2 exy + 3x2 y x3 + (1 + xy)exy exakt ist, und dass U (x, y) = y(exy + x3 ) eine Stammfunktion ist. 8.2.5 Integrierender Faktor Sei die DGL y0 = − g(x, y) h(x, y) gegeben. Ist die DGL nicht exakt, so kann man sie manchmal durch geschicktes Erweitern des Bruchs mit einer Funktion M (x, y) zu einer exakten DGL machen. Dazu schreiben wir y0 = − g(x, y)M (x, y) . h(x, y)M (x, y) Ist diese DGL exakt, so heißt M ein integrierender Faktor oder ein Euler’scher Multiplikator. Notwendig und hinreichend dafür ist d d (M (x, y)g(x, y)) = (M (x, y)h(x, y)). dy dx (8.14) Man kann zeigen, dass ein solcher integrierender Faktor stets existiert. Jedoch gelingt es nur in Einzelfällen, einen integrierenden Faktor explizit zu bestimmen. Dies gelingt vor allem dann, wenn M = M (x) nur von x d abhängt. In diesem Fall ist die linke Seite von (8.14) gleich M (x) dy g(x, y) und wir können (8.14) auflösen zu d d d M 0 (x) dy g(x, y) − dx (h(x, y) (log(M (x)) = = . (8.15) dx M (x) h(x, y) Es ist also klar, dass dieser Ansatz genau dann funktioniert, wenn die rechte Seite in (8.15) nur von x abhängt. 118 Gewöhnliche Differentialgleichungen Beispiel 8.15 Die DGL y0 = − (2x2 + 2xy 2 + 1)y g(x, y) =: − 3y 2 + x h(x, y) ist nicht exakt, denn d d g(x, y) − h(x, y) = 6xy 2 + 2x2 . dy dx Nun ist aber d dy g(x, y) − d dx h(x, y) h(x, y) = 6xy 2 + 2x2 = 2x 3y 2 + x 2 eine Funktion, die nur von x abhängt. Also ist M (x) = ex ein integrierender Faktor (merke: M 0 (x)/M (x) = 2x). Die Differentialgleichung ist damit in der Form 2 ex (2x2 + 2xy 2 + 1)y y (x) = − ex2 (3y 2 + x) 0 exakt. 8.2.6 Lineare Differentialgleichung 1. Ordnung Wir betrachten hier eine DGL von dem Typ y 0 (x) = g(x)y(x) + c(x). (8.16) Dabei sind g und c stetige Funktionen der freien Variablen x. Definition 8.16 Die DGL (8.16) heißt lineare Differentialgleichung erster Ordnung. Sie heißt homogen, falls c(x) ≡ 0, und inhomogen, falls c(x) 6≡ 0. Wir betrachten zunächst die homogene Gleichung y 0 (x) = g(x)y(x). Diese Gleichung ist vom Typ getrennte Variable“ (mit h(y) = −1/y), und wir können die Lösung des ” AWP mit y(x0 ) = y0 wie in Abschnitt 8.2.3 bestimmen: Z y(x) y0 1 dt = t Z x g(t) dt, x0 also Z x log(y(x)) = log(y0 ) + g(t) dt, x0 oder äquivalent y(x) = y0 eG(x) , wobei G die Stammfunktion von g ist Z (8.17) x G(x) = g(t) dt. x0 Die Lösung der inhomogenen Gleichung kann man ebenfalls explizit angeben. (8.18) 8.3 119 Lineare Differentialgleichung 2. Ordnung Satz 8.17 Das AWP [(8.16), y(x0 ) = y0 ] hat die eindeutige Lösung Z x G(x) −G(t) y(x) = e y0 + e c(t) dt . x0 Beweis Ableiten nach x ergibt y 0 (x) = G0 (x)y(x) + eG(x) e−G(x) h(x) = g(x)y(x) + h(x). 2 Beispiel 8.18 (Reaktion erster Ordnung) Bei einer Reaktion erster Ordnung ist der Stoffumsatz proportional zur vorhandenen Stoffmenge. Sei also x die Zeit und y(x) die Stoffmenge, die zur Zeit x noch vorhanden ist. Das Gesetz der Reaktionskinetik lässt sich als die homogene lineare Differentialgleichung fassen y 0 (x) = −ky(x). Dabei ist k > 0 die Reaktionskonstante. Sei y0 die zum Startzeitpunkt x0 = 0 vorhandene Stoffmenge. Dann ist y(x) = y0 e−kx . Beispiel 8.19 Sei der Vorgang wie oben, nur dass der betrachtete Stoff nicht von Anfang an vorhanden ist, sondern seinerseits erst durch eine Reaktion erster Ordnung entsteht. Das heißt, wir haben pro Zeiteinheit einen Stoffeintrag k1 e−k1 x von der vorgeschalteten Reaktion sowie einen Stoffumsatz −k2 y(x). Insgesamt lautet unser AWP y 0 (x) = −k2 y(x) + k1 e−k1 x , y(0) = 0. (8.19) Wir erhalten mit dem obigen Satz die Lösung y(x) = e−k2 x Z x ek2 t k1 e−k1 t dt 0 (k2 −k1 )x −k2 x e = k1 e 8.3 −1 k2 − k1 (8.20) . Lineare Differentialgleichung 2. Ordnung Eine Differentialgleichung von der Form y (n) (x) = f0 (x) + f1 (x)y 0 (x) + . . . + fn−1 (x)y (n−1) (x) (8.21) heißt lineare Differentialgleichung n-ter Ordnung. Sie heißt homogen, falls f0 (x) ≡ 0 identisch Null ist. Man kann zeigen, dass das Anfangswertproblem einer linearen Differentialgleichung stets eindeutig lösbar ist, falls die Funktionen f0 , f1 , . . . , fn−1 stetig sind. Ist die Gleichung homogen, so ist mit Y1 und Y2 auch λ1 Y1 +λ2 Y2 eine Lösung der DGL für alle λ1 , λ2 ∈ R. Die allgemeine Lösung der homogenen Gleichung hat also die Gestalt y(x) = C1 Y1 (x) + . . . + Cn Yn (x), (8.22) wobei Y1 , Y2 , . . . , Yn linear unabhängige Lösungen der DGL sind. Die Konstanten C1 , . . . , Cn müssen im konkreten Fall so gewählt werden, dass das AWP y(x0 ) = x0 , . . . , y (n−1) (x0 ) = yn−1 gelöst wird. Das geschieht durch Lösen des linearen Gleichungssystems. 120 Gewöhnliche Differentialgleichungen Wir betrachten hier zur Illustration den speziellen Fall einer homogenen linearen Differentialgleichung zweiter Ordnung mit konstanten Koeffizienten b, c ∈ R y 00 (x) + by 0 (x) + cy(x) = 0. (8.23) Wir haben gesehen, dass bei linearen Differentialgleichungen erster Ordnung Exponentialfunktionen als Lösung auftreten. Also machen wir auch hier den Ansatz y(x) = y(0)eλx , (8.24) wobei wir die Zahl λ noch bestimmen wollen. Setzen wir diese Funktion in die DGL (8.23) ein, so bekommen wir λ2 y(x) + bλy(x) + cy(x) = 0, also die quadratische Gleichung für λ λ2 + bλ + c = 0. (8.25) Die Lösung ist bekanntlich √ ∆ b , wobei ∆ = b2 − 4c. (8.26) λ1,2 = − ± 2 2 Wir unterscheiden die drei Fälle ∆ > 0, ∆ < 0 und ∆ = 0, da hier entweder zwei, keine, oder eine reelle Lösung vorliegt. Fall 1 (∆ > 0). Die allgemeine Lösung ergibt sich als Linearkombination √ y(x) = C1 eλ1 x + C2 eλ2 x = C1 ex(b− ∆)/2 √ + C2 ex(b+ ∆)/2 Dabei werden C1 , C2 ∈ R so gewählt, dass das AWP gelöst wird. 1 0.8 y(x)0.6 0.4 0.2 0 2 4 6 x 8 10 –0.2 –0.4 F IGUR . Lösungskurve für b = 3, c = 1, y(0) = 1 und y 0 (0) = 0 12 . (8.27) 8.3 121 Lineare Differentialgleichung 2. Ordnung Fall 2 (∆ < 0). Hier hat die Gleichung (8.25) keine reelle Lösung, aber zwei komplex konjugierte Lösungen √ b −∆ λ1,2 = − ± i . 2 2 Wir gehen ganz formal vor, wie in Fall 1, und schreiben y(x) = C1 eλ1 x + C2 eλ2 x i h √ √ = e−(b/2)x C1 e−i( −∆/2)x + C2 ei( −∆/2)x √−∆ √−∆ −(b/2)x =e (C1 + C2 ) cos x + i(C2 − C1 ) sin x . 2 2 (8.28) Wir haben jetzt eine Lösung der Differentialgleichung, die Werte in den komplexen Zahlen annimmt. Das ist noch nicht ganz das, was wir wollten. Da die DGL linear ist, ist aber sowohl der Realteil als auch der Imaginärteil in (8.28) eine Lösung. Wir erhalten so die allgemeine Lösung der DGL (mit neuen Konstanten C̃1 und C̃2 ) √−∆ √−∆ −(b/2)x x + C̃2 sin x . C̃1 cos (8.29) y(x) = e 2 2 Unter Benutzung des Additionstheorem für die Sinusfunktion kann man diesen Ausdruck stets umschreiben zu √−∆ −(b/2)x y(x) = A · e sin x+ϕ . 2 Dabei werden die Amplitude A und die Phasenverschiebung ϕ so gewählt, dass das Anfangswertproblem gelöst wird. Man sagt auch, dass hier der Fall einer gedämpften Schwingung vorliegt. 1 0.8 y(x)0.6 0.4 0.2 0 2 4 6 x 8 10 –0.2 –0.4 F IGUR . Lösungskurve für b = 3, c = 1, y(0) = 1 und y 0 (0) = 0 12 122 Gewöhnliche Differentialgleichungen Fall 3 (∆ = 0). In diesem Fall hat die quadratische Gleichung nur die eine Lösung λ = − 2b . Das heißt y(x) = y(0)e−(b/2)x ist eine Lösung der DGL. Wir wissen aber, dass es zwei linear unabhängige Lösungen geben muss. Wir machen den folgenden Ansatz: y(x) = k(x)e−(b/2)x . Dann ist y 0 (x) = b k 0 (x) − k(x) e−(b/2)x , 2 und 00 y (x) = b2 k (x) − bk (x) + k(x) e−(b/2)x . 4 00 0 Einsetzen in die DGL ergibt für k die Gleichung b2 b b2 k 00 (x) − 2k 0 (x) + k(x) + bk 0 (x) − k(x) + ck(x) = 0. 2 4 2 Dies kann man kürzen zu b2 k 00 (x) + k(x) c − = 0, | {z 4} =−∆/4=0 also k 00 (x) = 0. Damit ist k von der Form k(x) = C1 + C2 (x) für gewisse Zahlen C1 , C2 . Wir haben jetzt die allgemeine Lösung der Differentialgleichung y(x) = (C1 + C2 x) e−(b/2)x . (8.30) 8.3 123 Lineare Differentialgleichung 2. Ordnung 1 0.8 y(x)0.6 0.4 0.2 0 2 4 6 x 8 10 12 –0.2 –0.4 F IGUR . Lösungskurve für b = 2, c = 1, y(0) = 1 und y 0 (0) = 0 Beispiel 8.20 (Der harmonische Oszillator) Beim harmonischen Oszillator wirkt auf ein Teilchen, das um y aus der Ruhelage bewegt wurde, eine Rückstellkraft −cy, wobei c > 0 eine Konstante ist. Harmonische Oszillatoren treten in der Natur zuhauf auf: Gewicht an einer Feder, Pendel (mit kleinen Ausschlägen), Stromkreis mit Spule und Kondensator und so fort. Im Gegensatz zur chemischen Reaktion erster Ordnung, bei der Stoffumsatz pro Zeiteinheit, also die Geschwindigkeit des Vorgangs, proportional zu y ist, ist hier die zeitliche Änderung der Geschwindigkeit proportional zu y. Wir haben es also mit der folgenden homogenen linearen Differentialgleichung zweiter Ordnung zu tun y 00 (x) + cy(x) = 0. (8.31) Wir nehmen noch an, dass das Teilchen zur Zeit x0 = 0 die Position y(0) = y0 und die Geschwindigkeit y 0 (0) = y1 hat. Mit der Notation von oben haben wir also b = 0 und ∆ = −4c < 0. Es liegt also Fall 2 vor, und die allgemeine Lösung von (8.31) lautet √ √ y(x) = C1 cos c x + C2 sin c x . (8.32) Wir müssen noch C1 und C2 bestimmen y(0) = y0 = C1 √ y 0 (0) = y1 = C2 c Mithin ist y(x) = y0 cos √ y1 ⇐⇒ C2 = √ . c √ y1 c x + √ sin c x . c (8.33) 124 Gewöhnliche Differentialgleichungen Bemerkung 8.21 Man kann (8.33) stets auf die Form bringen √ y(x) = A sin c x + ϕ . (8.34) Hierzu muss man nur das Additionstheorem √ √ √ A sin c x + ϕ = A sin(ϕ) cos( c x) + A cos(ϕ) sin( c x) benutzen und dann nach A und ϕ auflösen. Beispielsweise ist, falls y0 6= 0, y1 y0 √ ϕ = arctan und A = . sin(ϕ) y0 c Beispiel 8.22 (Der gedämpfte harmonische Oszillator) Ergänzend zum vorherigen Beispiel wird nun noch der Effekt der Reibung berücksichtigt. Wir nehmen an, dass die Reibungskraft proportional zur Geschwindigkeit und ihr entgegengerichtet ist. Das heißt, wir haben die Differentialgleichung y 00 (x) + by 0 (x) + cy(x) = 0, (8.35) wobei b > 0 die Reibungskonstante ist. Wir wollen wieder das Anfangswertproblem y(0) = y0 und y 0 (0) = y1 lösen. √ Große Reibung Ist b > 2 c, so liegt Fall 1 vor, und die allgemeine Lösung ist y(x) = C1 eλ1 x + C2 eλ2 x , wobei λ1 = − b− √ b2 − 4c , 2 λ2 = − b+ √ b2 − 4c . 2 Man beachte, dass λ2 < − 2b < λ1 < 0. Um C1 und C2 zu bestimmen, setzen wir ein y(0) = C1 + C2 = y0 y 0 (0) = −λ1 C1 − λ2 C2 = y1 . Auflösen ergibt λ2 y0 + y1 , λ 2 − λ1 λ 1 y0 + y 0 C2 = . λ 2 − λ1 C1 = √ Kleine Reibung Ist b < 2 c, so liegt Fall 2 vor, und die allgemeine Lösung ist √4c − b2 −(b/2)x y(x) = Ae sin x+ϕ . 2 Einsetzen ergibt y0 = y(0) = A sin(ϕ) √ b 4c − b2 y1 = y 0 (x) = − A sin(ϕ) + A cos(ϕ). 2 2 Dieses lineare Gleichungssystem kann man nun nach A und ϕ auflösen. 8.3 125 Lineare Differentialgleichung 2. Ordnung √ Der Grenzfall Ist b = 2 c, so liegt Fall 3 vor. Die allgemeine Lösung ist y(x) = (C1 + C2 x)e−(b/2)x . Einsetzen ergibt y0 = y(0) = C1 b y1 = y 0 (0) = C2 − C2 . 2 Also b C2 = y1 + y0 . 2 Bemerkung 8.23 In jedem der drei Fälle gilt lim y(x) = 0. In der Praxis interessiert man sich oft dafür, x→∞ wie schnell diese Konvergenz abläuft. Beispielsweise hat man ein Messinstrument, das gedämpfte Schwingungen um den tatsächlichen Messwert herum ausführt, und bei dem man die Dämpfungskonstante b einstellen kann. Man ist jetzt an demjenigen Wert b interessiert, bei dem die Konvergenz möglichst schnell ist. √ λ2 < λ1 ) nach langer Zeit der Term e−λ1 x , d.h. y(x) ≈ Im ersten Fall (b > 2 c) dominiert (wegen √ √ b− b2 −4c −λ1 x C1 e für große x. Dabei war λ1 = − > − c. 2 √ Im zweiten Fall (b < 2 c) oszilliert die Lösung, die maximalen Ausschläge sind Ae−(b/2)x . √ Im dritten Fall (b = 2 c) ist der Abfall von der Ordnung e−(b/2)x . √ Insgesamt wird daher die schnellste Konvergenzgeschwindigkeit im Grenzfall b = 2 c erreicht. 126 Gewöhnliche Differentialgleichungen Kapitel 9 Vektorräume und Grundlagen der Analytischen Geometrie In diesem Kapitel entwickeln wir die Grundzüge der endlichdimensionalen Vektorräume und der analytischen Geometrie speziell der Ebene und des dreidimensionalen Raumes. 9.1 Vektorräume Geometrische Idee Wir veranschaulichen einen Punkt x in der Ebene durch einen Pfeil vom Ursprung nach x. Den Ursprung bezeichnen wir mit 0. Ist y ein weiterer Punkt, dann können wir den Pfeil, der y darstellt unter Beibehaltung der Richtung und der Länge so verschieben, dass er in x beginnt und auf einen dritten Punkt z zeigt. Diesen Punkt wollen wir mit x + y bezeichnen. Offenbar ist x + y = y + x. Speziell schreiben wir 2x für den Punkt x + x. Dieser hat einen Pfeil in gleicher Richtung wie x, jedoch mit doppelter Länge. Allgemeiner können wir für jedes λ ∈ [0, ∞) den Punkt λx definieren, dadurch, dass der entsprechende Pfeil die Richtung von x hat und das λ–fache seiner Länge. Nun wollen wir den Punkt −x definieren als denjenigen Punkt, für den −x + x = 0 ist. Das ist derjenige Punkt, dessen Pfeil die gleiche Länge wie die von x hat, jedoch die entgegengesetzte Richtung. Damit können wir λx auch für negative λ ∈ R definieren. Definition des Vektorraums Wie können wir mit diesen anschaulich beschriebenen Operationen rechnen? Dazu führen wir die Koordix1 natenachsen ein und beschreiben einen Punkt x als ein Zahlenpaar . Die Zahlen x1 , x2 ∈ R heißen x2 die Koordinaten von x (bezüglich der Standardbasis). Die Ebene ist die Menge aller Punkte x1 R2 = , x1 , x2 ∈ R . x2 127 128 Vektorräume und Grundlagen der Analytischen Geometrie x1 Analog können wir den dreidimensionalen Raum R3 als die Menge der Tripel x2 definieren und sogar, x3 ganz abstrakt, für jedes d ∈ N den d–dimensionalen Raum Rd als die Menge der d–Tupel x1 .. d R = x = . , x1 , . . . , xd ∈ R . xd Jeden Punkt x ∈ Rd nennen wir einen d–dimensionalen Vektor. Im Gegensatz dazu heißen Größen, die aus R sind, skalare Größen, oder Skalare. Die geometrischen Operationen, die wir oben beschrieben haben, bekommen nun den rechnerischen Gegenpart durch die Vektoraddition x1 y1 x1 + y1 x + y = ... + ... = ... (9.1) xd yd xd + yd und die Skalarmultiplikation x1 λx1 λx = λ ... = ... . xd (9.2) λxd Man beachte, dass wir für den Ursprung 0 .. 0 = . ∈ Rd 0 kein gesondertes Symbol verwenden. Bei manchen Autoren findet man hier Fettdruck oder einen Pfeil über der Null. Wir fassen die Rechenregeln für Vektoren zusammen. Lemma 9.1 (Rechenregeln für Vektoren) Sei V = Rd . Dann gilt für alle x, y, z ∈ V und µ, λ ∈ R Kommutativgesetz: x + y = y + x, Assoziativgesetz: (x + y) + z = x + (y + z), Null: 0 + x = x, Inverses: Es gibt ein −x ∈ V mit −x + x = 0, Skalarmultiplikation: 1 · x = x, (µ + λ)x = µx + λx, λ(x + y) = λx + λy. Definition 9.2 (Vektorraum) Jede Menge V , für die Rechenregeln aus dem Lemma gelten, heißt ein (reeller) Vektorraum. Wird auch λ, µ ∈ C zugelassen, so heißt V ein komplexer Vektorraum. 9.1 129 Vektorräume Beispiele 9.3 (i) V = Rd . (ii) V = {v ∈ Rd : v1 − v2 = 0}. Dann ist für u, v ∈ V auch w := u + v ∈ V , weil w1 − w2 = (u1 + v1 ) − (u2 + v2 ) = u1 − u2 + v1 − v2 = 0. Weiter ist für λ ∈ R stets λu1 − λu2 = 0, also ist λu ∈ V . Es ist klar 0 ∈ V . Es ist (−u1 ) − (−u2 ) = −(u1 − u2 ) = 0. Also ist −u ∈ V . (iii) Seien u, v ∈ R3 . Dann ist auch die Fläche V = {λu + µv : λ, µ ∈ R} ⊂ R3 ein Vektorraum. V heißt der von u und v aufgespannte Untervektorraum von R3 . (iv) Ist allgemeiner V ein Vektorraum und sind u1 , u2 , . . . , uk ∈ V , so heißt span(v 1 , . . . , v k ) := λ1 v 1 + . . . + λk v k : λ1 , . . . , λk ∈ R ⊂ V (9.3) der von (v 1 , . . . , v k ) aufgespannte (oder erzeugte) Untervektorraum von V . (v) Die Gerade G= x1 1 : x1 ∈ R ⊂ R2 2 ist kein Vektorraum (und kein Untervektorraum von R ).Essind gleich mehrere Regeln verletzt: Es 0 1 0 1 1 ist 0 6∈ G, es sind , ∈ G, aber + = 6∈ G. 1 1 1 1 2 (vi) Eine Gerade, Ebene und so weiter im Rd ist genau dann ein Vektorraum (also ein Untervektorraum von Rd , wenn sie den Ursprung enthält. Dann liegt nämlich der Fall von Beispiel (iii) beziehungsweise (iv) vor. (vii) Ein Beispiel, bei dem klar wird, dass der Begriff des Vektorraums sehr viel größere Objekte zulässt als den Rd ist das folgende. Sei V die Menge der stetigen Funktionen f : [0, 1] → R. Für f, g ∈ V und λ ∈ R definieren wir f +g und λf durch (f +g)(x) = f (x)+g(x) und (λf )(x) = λf (x) für alle x ∈ [0, 1]. Offenbar sind f + g und λf stetig, also in V . Weiter bezeichnen wir mit 0 die Funktion, die konstant Null ist. Offenbar ist auch 0 ∈ V . Man prüft leicht nach, dass die Rechenregeln aus Lemma 9.1 gelten (weil sie punktweise, also für jedes x ∈ [0, 1] gelten), also ist V ein Vektorraum. 9.1.1 Lineare Unabhängigkeit, Erzeugendensystem, Basis Wir betrachten einen Vektorraum V und Vektoren v 1 , . . . , v k ∈ V . Ein Vektor u ∈ V heißt Linearkombination der v 1 , . . . , v k , falls es Zahlen λ1 , . . . , λk ∈ R gibt, sodass u= k X λi v i . i=1 1 1 5 9.4 Beispiel Ist V = R3 und v 1 = 2, v 2 = 3. Dann ist u = 13 eine Linearkombination von v 1 0 1 3 und v 2 , denn 5 1 1 13 = 2 2 + 3 3 . 3 0 1 130 Vektorräume und Grundlagen der Analytischen Geometrie Definition 9.5 Ist ein Vektor v j eine Linearkombination der anderen, also j v = j−1 X λi v i + i=1 k X λi v i i=j+1 für gewisse Zahlen λi , dann heißen die Vektoren v 1 , . . . , v k linear abhängig. Andernfalls heißen die Vektoren linear unabhängig. 1 0 0 Beispiele 9.6 (i) Die Vektoren 0 , 1 , 0 ∈ R3 sind linear unabhängig. 0 0 1 5 1 1 (ii) Die Vektoren v 1 = 2, v 2 = 3 und v 3 = 13 sind linear abhängig, denn v 3 = 2v 1 + 3v 2 3 1 0 ist eine Linearkombination. Satz 9.7 Die Vektoren v 1 , . . . , v k ∈ V sind linear unabhängig, genau dann, wenn Folgendes gilt: Sind λ1 , . . . , λk ∈ R mit k X λi v i = 0, (9.4) i=1 1 k so ist zwingend λ = . . . = λ = 0. Beweis Ist beispielsweise v 1 eine Linearkombination der anderen Vektoren, also v 1 = µ2 v 2 + . . . + µk v k für gewisse Zahlen µ2 , . . . , µk , dann setzen wir λ1 = −1, , λi = µi , i = 2, . . . , k. Dann ist k X λi v i = 0, i=1 i 1 aber nicht alle λ sind 0, jedenfalls nicht λ . Gelte nun andererseits (9.4) und sei λi 6= 0 für ein i. Wir setzen µj := − λj . λi Dann ist µi = −1 und k X µj v j = 0, j=1 also vi = X µj v j . j6=i 2 9.1 131 Vektorräume Definition 9.8 (Dimension) Sind v 1 , . . . , v k ∈ V linear unabhängig und ist U = span(v 1 , . . . , v k ), so sagen wir, dass der Untervektorraum U die Dimension k hat: dim(U ) = k. Man kann zeigen, dass die Dimension eindeutig bestimmt ist. Den folgenden Satz wollen wir hier nicht beweisen. Satz 9.9 Seien v 1 , . . . , v k ∈ Rd linear unabhängig. (i) Es ist stets k ≤ d. (ii) Es ist k = d genau dann, wenn ist Rd = span(v 1 , . . . , v k ). Definition 9.10 (Basis) Sind b1 , . . . , bd ∈ Rd linear unabhängig, so heißt b1 , . . . , bd eine Basis von Rd . Es gilt in diesem Fall Rd = span(b1 , . . . , bd ). Beispiele 9.11 (i) Die Einheitsvektoren 1 0 0 0 1 .. . e1 = 0 , e2 = 0 , . . . ed = 0 .. .. . . 0 0 0 1 bilden die so genannte kanonische Basis oder Standardbasis des Rd . 2 1 (ii) Die Vektoren b1 = , b2 = bilden eine Basis des R2 . Ist nämlich λ1 b1 + λ2 b2 = 0, so ist 0 3 3λ2 = 0, also λ2 = 0 und 0 = 2λ1 + λ2 = 2λ2 . Also sind b1 und b2 linear unabhängig. 0 1 (iii) b1 = 0, b2 = 1 sind linear unabhängig, jedoch keine Basis von R3 , weil es nur zwei Vektoren 0 1 sind. 1 0 1 (iv) b1 = 0, b2 = 1, b3 = 2 ist ebenfalls keine Basis von R3 , weil b3 = b1 + 2b2 , also 0 1 2 b1 , b2 , b3 linear abhängig sind. Eine Basis kann als Koordinatensystem für den Rd dienen. Ist nämlich v ∈ Rd , so ist v eine Linearkombination der b1 , . . . , bd , also v = λ 1 b1 + . . . + λ d b d für gewisse Zahlen λ1 , . . . λd . Nehmen wir an, dass es eine weitere Darstellung von v als Linearkombination der bi gibt: v = µ1 b1 + . . . + µd bd . 132 Vektorräume und Grundlagen der Analytischen Geometrie Dann ist 0=v−v = d X (λi − µi )bi , i=1 i i 1 d also λ = µ für alle i = 1, . . . , d, da b , . . . , b linear unabhängig sind. Also sind die Zahlen λi eindeutig und können damit als Koordinaten dienen. v1 Beispiele 9.12 (i) Ist v = v2 ∈ R3 so ist v3 v = v1 e1 + v2 e2 + v3 e3 . Also sind die Zahlen v1 , v2 , v3 die Koordinaten von v bezüglich der Standardbasis. 2 1 −1 (ii) Die Vektoren b1 = , b2 = bilden eine Basis von R2 . Sei v = . Dann ist v = 0 3 9 −2b1 + 3b3 . Also sind −2, 3 die Koordinaten von v bezüglich b1 , b2 . Wir fassen die Überlegungen vor Beispiel 9.12 als Satz zusammen. Satz 9.13 (Koordinaten) Ist b1 , . . . , bd eine Basis von Rd , so lässt sich jeder Vektor v ∈ Rd in eindeutiger Weise als Linearkombination darstellen: v = v = λ 1 b1 + . . . + λ d bd . Die Zahlen λ1 , . . . , λd ∈ R heißen die Koordinaten von v bezüglich der Basis b1 , . . . , bd . 9.2 Skalarprodukt Wir wollen nun eine rechnerische Handhabe für die Längen von Vektoren haben. Dafür dient das Skalarprodukt. Gleichzeitig liefert es eine Möglichkeit zu verstehen, was es es heißt, dass zwei Vektoren senkrecht aufeinander stehen. 9.2.1 Grundlegendes zum Skalarprodukt u1 v1 .. .. Definition 9.14 (Skalarprodukt) Für zwei Vektoren u = . , v = . ∈ Rd definieren wir als ud vd das Skalarprodukt die Zahl d X hu, vi := ui vi . i=1 Manche Autoren verwenden Schreibweisen wie (u, v) oder u · v für das Skalarprodukt. Das Skalarprodukt heißt Skalarprodukt, weil das Ergebnis eine Zahl also ein Skalar ist. Manchmal findet man auch die Bezeichnung inneres Produkt . 9.2 133 Skalarprodukt *1 −2+ Beispiele 9.15 (i) 2 , 4 = −2 + 2 · 4 + 3 · 8 = 30. 3 8 1 1 (ii) , = 5. 2 2 (iii) Für die Einheitsvektoren e1 , . . . , ed des Rd gilt hei , ej i = 0, falls i 6= j und hei , ei i = 1. Lemma 9.16 (Eigenschaften des Skalarprodukts) Für u, v, w ∈ Rd und λ, µ ∈ R gilt Symmetrie: hu, vi = hv, ui Bilinearität: hλu + µv, wi = λhu, wi + µhv, wi hu, λv + µwi = λhu, vi + µhu, wi Positive Definitheit: hv, vi ≥ 0 und hv, vi = 0 ⇐⇒ v = 0. Nach dem Satz von Pythagoras ist die Länge des Vektors v = p v1 ∈ R2 genau |v| = v12 + v22 . Dies v2 legt die folgende Definition nahe. Definition 9.17 Für v ∈ Rd heißt die Zahl |v| := p hv, vi der Betrag von v oder die euklidische Norm von v. |v| ist damit der Abstand des Punktes v vom Ursprung 0 ∈ Rd . Manche Autoren verwenden an Stelle von |v| die Schreibweise kvk für die Norm von v. Lemma 9.18 (Eigenschaften der Norm) Für u, v ∈ Rd und λ ∈ R gilt Linearität |λv| = |λ| · |v| Dreiecksungleichung |u + v| ≤ |u| + |v| Positive Definitheit |v| ≥ 0 mit |v| = 0 ⇐⇒ v = 0. Beispiele 9.19 (ii) 3 . Dann ist 4 3 √ |λv| = −2 = 36 + 64 = 10 = | − 2| · 5 = |λ| · |v|. 4 (i) λ = −2, v = √ √ 3 3 12 12 15 √ 4 + 5 = 9 = 306 ≤ 18 = 25 + 169 = 4 + 5 . Bemerkung 9.20 Sind v, w ∈ Rd \ {0} und ist ϕ der von u und v gebildete Winkel, dann ist nach dem verallgemeinerten Satz von Pythagoras (dem so genannten Kosinussatz) |v − w|2 = |v|2 + |w|2 − 2|v| · |w| cos(ϕ). Andererseits ist |v − w|2 = hv − w, v − wi = hv, vi + hw, wi − 2hv, wi = |v|2 + |w|2 − 2hv, wi. (9.5) 134 Vektorräume und Grundlagen der Analytischen Geometrie Also ist cos(ϕ) = hv, wi . |v| · |w| (9.6) Speziell ist hv, wi = 0 genau dann, wenn ϕ = π2 , wenn also v und w senkrecht aufeinander stehen. Es gilt hv, wi = |v| · |w|, falls ϕ = 0, also wenn v und w parallel sind. Aus (9.6) folgt sofort die folgende wichtige Ungleichung. Satz 9.21 (Cauchy–Schwarz’sche Ungleichung) Für alle v, w ∈ Rd gilt |hv, wi| ≤ |v| · |w| mit Gleichheit genau dann, wenn v = λw für ein λ ∈ R. 9.2.2 Orthogonalität Mit Hilfe des Skalarprodukts definieren wir den Begriff der Orthogonalität und kommen so zum wichtigen Konzept der Orthonormalbasis. Definition 9.22 (i) Sind u, v ∈ Rd mit hu, vi = 0, so sagen wir, dass u und v orthogonal (oder senkrecht) zueinander sind. Wir schreiben auch u ⊥ v. (ii) Sind v 1 , . . . , v k ∈ Rd und gilt v i ⊥ v j , falls i 6= j, so heißt v 1 , . . . , v k orthogonal. (iii) Gilt zudem, dass die v i normiert sind, also |v i | = 1, i = 1, . . . , d, so heißt v 1 , . . . , v k orthonormal. 4 3 3 Beispiele 9.23 (i) d = 3, v 1 = 1 , v 2 = 0, v 3 = −25 sind orthogonal, denn 3 −4 −4 hv 1 , v 2 i = 3·4+1·0−4·3 = 0, hv 1 , v 3 i = 3·3−1·25+4·4 = 0, Allerdings ist v 1 , v 2 , v 3 nicht orthonormal, denn √ |v 1 | = 26 , |v 2 | = 5 , (ii) Sei ϕ ∈ R und v 1 = hv 2 , v 3 i = 4·3+0·25−3·4 = 0. √ |v 3 | = 5 26 . sin(ϕ) − cos(ϕ) , v2 = . Dann sind v 1 , v 2 orthonormal, denn cos(ϕ) sin(ϕ) hv 1 , v 2 i = − sin(ϕ) cos(ϕ) + cos(ϕ) sin(ϕ) = 0, und |v 1 |2 = sin(ϕ)2 + cos(ϕ)2 = 1, |v 2 |2 = cos(ϕ)2 + sin(ϕ)2 = 1. Satz 9.24 Ist v 1 , . . . , v k ∈ Rd \ {0} orthogonal, so ist v 1 , . . . , v k linear unabhängig. Beweis Seien λ1 , . . . , λk ∈ R und P i λi v i = 0. Dann ist für jedes j ∈ {1, . . . , k} 0 = hv j , λ1 v 1 + . . . + λk v k i = hv j , v 1 i + . . . + hv j , λk v k i = λ1 hv j , v 1 i + . . . + λk hv j , v k i = λj hv j , v j i, 9.2 135 Skalarprodukt weil hv i , v j i = 0 für i 6= j. Wegen v j 6= 0 ist hv j , v j i = |v j |2 6= 0, also λj = 0. Da j beliebig war, gilt λ1 = . . . = λk = 0. Also sind v 1 , . . . , v k linear unabhängig. 2 Definition 9.25 Sind b1 , . . . , bd ∈ Rd orthonormal, so heißt b1 , . . . , bd eine Orthonormalbasis (ONB) von Rd . (i) Die kanonische Basis e1 , . . . , ed des Rd ist eine Orthonormalbasis. Beispiele 9.26 (ii) Setze 1 1 b1 = √ 1 , 3 1 −2 1 b2 = √ 1 , 6 1 0 1 b3 = √ 1 . 2 −1 Dann ist b1 , b2 , b3 eine ONB von R3 , denn √ 2 hb , b i = (−2 + 1 + 1) = 0, 6 1 2 √ 6 hb , b i = (1 − 1) = 0, 6 1 3 √ 2 3 hb , b i = 3 (−2 · 0 + 1 − 1) = 0. 6 und hb1 , b1 i = 1 (1+1+1) = 1, 3 hb2 , b2 i = 1 ((−2)2 +1+1) = 1, 6 hb3 , b3 i = 1 (0+1+1) = 1. 2 Satz 9.27 Ist b1 , . . . , bd eine ONB von Rd , dann sind die Koordinaten von v ∈ Rd bezüglich b1 , . . . , bd gegeben durch hv, b1 i, . . . , hv, bd i. Also gilt v= d X hv, bi ibi . i=1 Beweis Sind λ1 , . . . , λd die Koordinaten von v bezüglich b1 , . . . , bd , so gilt für jedes i ∈ {1, . . . , d} i i i i i i i λ = hλ b , b i = hλ b , b i + X j6=i j j i hλ b , b i = | {z } =0 d X j=1 j j i hλ b , b i = * d X + j j λ b ,b i = hv, bi i. j=1 2 Beispiele 9.28 v1 .. (i) Die Koordinaten von v = . ∈ Rd bezüglich der kanonischen Basis e1 , . . . , ed vd sind hv, ei i = 0 · v1 + . . . + 0 · vi−1 + 1 · · · vi + 0 · vi+1 + . . . + 0 · vd = vi . 136 Vektorräume und Grundlagen der Analytischen Geometrie 6 (ii) Die Koordinaten von 7 ∈ R3 bezüglich der ONB Beispiel 9.26(ii) sind 8 + * 6 1 √ 1 1 hv, b1 i = 7 , √ 1 = √ (6 + 7 + 8) = 7 3, 3 1 3 8 + *6 −2 1 1√ 1 hv, b2 i = 7 , √ 1 = √ (−2 · 6 + 7 + 8) = 6, 2 6 6 8 1 + *6 0 1 1 1√ hv, b3 i = 7 , √ 1 = √ (0 · 6 + 7 − 8) = − 2. 2 2 −1 2 8 Also ist √ 1√ 2 1√ 3 6b − 2b . v = 7 3 b1 + 2 2 Probe: 1 −2 0 6 √ 1 1√ 2 1√ 3 1 1 7 3b + 6b − 6b 7 1 + 1 − 1 = 7 . 2 2 2 2 1 1 −1 8 9.2.3 Zerlegung in parallelen und orthogonalen Anteil Sind u, v ∈ Rd , v 6= 0, dann kann man u eindeutig zerlegen in einen Anteil up , der parallel (oder antiparallel) zu v ist und einen Anteil us , der senkrecht zu v ist: u = up + us . Dabei heißt parallel natürlich, dass es ein λ ∈ R mit up = λv und senkrecht heißt, dass hus , vi = 0. In der Tat sind up und us durch diese Eigenschaft eindeutig festgelegt, denn λ ist bestimmt durch hu, vi = hup , vi + hus , vi = hup , vi = λhv, vi. mit dem Wert λ = hu, vi hv, vi. Wir erhalten also up = hu, vi v, hv, vi us = u − u p . Es ist klar, dass up tatsächlich zu v parallel ist, aber es gilt auch us ⊥ v wegen hu, vi hu, vi s p p hu , vi = hu − u , vi = hu, vi − hu , vi = hu, vi − v, v = hu, vi − hv, vi = 0 . hv, vi hv, vi Beispiel 9.29 Sei 2 u = 3 , 4 4 v = 5 . 6 (9.7) 9.3 137 Drehung in der Ebene und Vektorprodukt Dann ist hv, vi = 16 + 25 + 36 = 77 und hu, vi = 8 + 15 + 24 = 47. Also ist 188 34 188 − 77 2 4 77 77 47 5 = 235 und us = 3 − 235 = − 4 . up = 77 77 77 77 282 282 26 4 6 77 77 77 Probe (dass us ⊥ v) hus , vi = − 9.3 34 4 26 1 ·4− ·5+ ·6= (−136 − 20 + 156) = 0. 77 77 77 77 Drehung in der Ebene und Vektorprodukt In diesem Abschnitt behandeln wir je eine Besonderheit der ebenen und der dreidimensionalen Geometrie, mit der wir zu gegebenen Vektoren senkrechte Vektoren herstellen. 9.3.1 Eine Spezialität der ebenen Geometrie Wir betrachten hier nur Vektoren in der Ebene, also Punkte x = Vektor ein x⊥ = x1 x2 ∈ R2 . Wir führen den folgenden −x2 . x1 (9.8) Der Vektor x⊥ entsteht durch Linksdrehung um einen Viertelkreis aus x. x⊥ steht senkrecht auf x, denn hx, x⊥ i = x1 · (−x2 ) + x2 · x1 = 0. Offenbar ist jeder Vektor, der senkrecht auf x steht, ein Vielfaches von x⊥ . Außerdem ist |x⊥ | = |x|. Die Vektoren x, x⊥ sind orthogonal, also linear unabhängig und damit eine Basis von R2 . Ist |x| = 1, so liegt eine ONB vor. Sei nun y ∈ R2 ein weiterer Vektor. x und y bestimmen ein Parallelogramm mit den Eckpunkten 0, x, y, und x+y. Mit F bezeichnen wir die Fläche dieses Parallelogramms. Wenn h die Höhe des Parallelogramms über der Seite 0, x ist, so ist F = h · |x|. Wir müssen also h bestimmen. h ist die Länge des Anteils y p von y, der senkrecht auf x steht, also parallel zu x⊥ ist: |hy, x⊥ i| hy, x⊥ i . h = |y p | = ⊥ ⊥ x⊥ = hx , x i |x| Also ist F = h · |x| = |hy, x⊥ i| = | det(x, y)|, wobei die Determinante definiert ist durch det(x, y) = hx⊥ , yi = x1 y2 − x2 y1 . (9.9) Die Determinante misst also die Fläche des Parallelogramms, wobei das Vorzeichen angibt, ob y durch Linksdrehung (+) oder Rechtsdrehung (-) aus x hervorgegangen ist. Da x und y offenbar genau dann linear unabhängig sind, wenn F 6= 0 ist, ergibt sich der folgende wichtige Satz. 138 Vektorräume und Grundlagen der Analytischen Geometrie Satz 9.30 Zwei Vektoren x, y ∈ R2 sind genau dann linear unabhängig, wenn det(x, y) 6= 0. 1 1 −1 und y = . Dann ist x⊥ = und det(x, y) = hx⊥ , yi = 1 3 1 −1 + 3 = 2. Also ist die Fläche des Parallelogramms F = 2 und x und y sind linear unabhängig. Man überzeuge sich durch eine Skizze, dass y durch Linksdrehung aus x hervorgegangen ist. (i) Sei x = Beispiele 9.31 −1 5 −2 ⊥ (ii) Sei x = und y = . Dann ist x = und det(x, y) = hx⊥ , yi = −10 − 1 = −11. 2 1 −1 Also ist die Fläche des Parallelogramms F = 11 und x und y sind linear unabhängig. Man überzeuge sich durch eine Skizze, dass y durch Rechtsdrehung aus x hervorgegangen ist. −2 6 −7 ⊥ (iii) Sei x = und y = . Dann ist x = und det(x, y) = hx⊥ , yi = −42 + 42 = 0. 7 −21 −2 Also ist die Fläche des Parallelogramms F = 0 und x und y sind linear abhängig. In der Tat ist y = −3x. 9.3.2 Eine Spezialität des dreidimensionalen Raums: Das Vektorprodukt Wir haben gerade gesehen, wie man in der Ebene zu einem Vektor einen dazu senkrecht stehenden produziert. Im dreidimensionalen Raum gibt es jedoch mehrere Möglichkeiten, einen Vektor zu produzieren, der senkrecht auf einem gegebenen steht. Die Richtung wird erst eindeutig, wenn wir zwei Vektoren vorgeben, zu denen ein dritter senkrecht stehen soll. Wenn wir jetzt noch Länge und Orientierung vorgeben, wird die Sache eindeutig. Dies motiviert die folgende Definition. x1 y1 Definition 9.32 (Vektorprodukt) Für x = x2 und y = y2 definieren wir das Vektorprodukt x3 y3 x × y ∈ R3 durch x2 y3 − x3 y2 x × y = x3 y1 − x1 y3 . x1 y2 − x2 y1 Manchmal wird dieser Vektor auch Kreuzprodukt oder äußeres Produkt genannt. Die Länge von x × y entspricht genau der Fläche des Parallelogramms, das von x und y erzeugt wird. Das 0 0 zeigen wir hier nur in dem Spezialfall, wo x3 = y3 = 0 ist. Dann ist nämlich x × y = x1 y2 − x2 y1 und |x × y| = |x1 y2 − x2 y1 |. Das ist aber genau die Fläche des Parallelogramms. Lemma 9.33 (Eigenschaften des Vektorprodukts) Für alle x, y, z ∈ R3 und µ, λ ∈ R gilt 9.3 Drehung in der Ebene und Vektorprodukt (i) Orthogonalität (x × y) ⊥ x und (x × y) ⊥ y. (ii) Antisymmetrie x × y = −y × x. (iii) Linearität x × (λy + µz) = λ(x × y) + µ(x × z) (λx + µy) × z = λ(x × z) + µ(y × z). (iv) x × y 6= 0 ⇐⇒ x, y sind linear unabhängig. (v) |x × y| = |x| · |y| ⇐⇒ x ⊥ y. |x × y| = |x| · |y| · sin ^(x, y) . Hierbei bezeichnet ^(x, y) den Winkel zwischen den Vektoren x und y. Weil wir dies nur am Rande bemerken, belassen wir es hier bei der intuitiven Beschreibung. (vi) 139 Beweis Zu (i): hx × y, xi = (x2 y3 − x3 y2 )x1 + (x3 y1 − x1 y3 )x2 + (x1 y2 − x2 y1 )x3 = 0. Zu (ii) und (iii): klar nach Definition des Vektorprodukts. Zu (iv): x, y sind linear unabhängig, wenn x und y ein nicht-entartetes Parallelogramm erzeugen. Aus dem Zusammenhang von der Fläche des Parallelogramms und |x × y| folgt die Aussage. (v) folgt aus (vi) oder aus dem nächsten Satz. (vi) folgt aus dem Zusammenhang von |x × y| mit der Fläche des Parallelogramms sowie der elementargeometrischen Formel für diese Fläche. 2 Für die Orientierung von x, y, x × y gilt die Rechte-Hand-Regel: Zeigt bei der rechten Hand der Daumen in Richtung x und der Zeigefinger in Richtung y, so zeigt der vorgespreizte Mittelfinger in Richtung von x×y. Jedes so angeordnete Tripel von Vektoren nennen wir ein Rechtssystem. Gilt das selbe mit der linken Hand, so sprechen wir von einem Linkssystem. Ohne Beweis (man kann z.B. (vi) aus dem vorangehenden Lemma verwenden) bringen wir die folgende Ergänzung zur Cauchy-Schwarz’schen Ungleichung und zur Eigenschaft (v) im vorangehenden Lemma. Satz 9.34 Für x, y ∈ R3 gilt 9.3.3 hx, yi2 + |x × y|2 = |x|2 |y|2 . Das Spatprodukt Wie zwei Vektoren in der Ebene ein Parallelogramm erzeugen, so erzeugen drei Vektoren im dreidimensional Raum einen Spat oder Parallelepiped. Bei einem Kristall sind diese drei Vektoren beispielsweise die drei benachbarten Atome (in den drei Hauptrichtungen) eines willkürlich gewählten Ursprungs. Das Spat ist dann die kleinste Zelle, oder Elementarzelle, des Kristalls. Mit Hilfe des Vektorprodukts können wir eine einfache Formel für das Volumen dieser Zelle angeben. Definition 9.35 (Spatprodukt) Seien x, y, z ∈ R3 . Als das Spatprodukt oder die Determinante bezeichnet man die Zahl det(x, y, z) = hx × y, zi. Explizit ist det(x, y, z) = x1 y2 z3 + y1 z2 x3 + z1 x2 y3 − z1 y2 x3 + x1 z2 y3 + y1 x2 z3 . 140 Vektorräume und Grundlagen der Analytischen Geometrie Lemma 9.36 (Gartenzaunregel) Zum Merken hilft das folgende Vorgehen: Man schreibe die Vektoren x, y, z, x, y in ein rechteckiges Schema: x1 y1 z1 x1 y1 x2 y2 z2 x2 y2 . x3 y3 z3 x3 y3 Nun summiert man die Produkte entlang der drei links geneigten Diagonalen x1 y2 z3 + y1 z2 x3 + z1 x2 y3 und zieht die Produkte entlang der drei rechts geneigten Diagonalen z1 y2 x3 + x1 z2 y3 + y1 x2 z3 davon ab. Das Volumen des Spats ist nun, wie beim Parallelogramm, V = | det(x, y, z)|. Wir sammeln die Rechenregeln für das Spatprodukt. Lemma 9.37 (Rechenregeln für das Spatprodukt) Für u, v, x, y, z ∈ R3 und µ ∈ R gilt (i) det(µx, y, z) = det(x, µy, z) = det(x, y, µz) = µ det(x, y, z), (ii) det(u + v, y, z) = det(u, y, z) + det(v, y, z) det(x, u + v, z) = det(x, u, z) + det(x, v, z) det(x, y, u + v) = det(x, y, u) + det(x, y, v) (iii) det(x, y, z) = det(y, z, x) = det(z, x, y) = − det(y, x, z) = − det(x, z, y) = − det(z, y, x) (iv) det(x, y, z) 6= 0 ⇐⇒ x, y, z sind linear unabhängig. (v) det(x, y, z) > 0 ⇐⇒ (x, y, z) bilden ein Rechtssystem det(x, y, z) < 0 ⇐⇒ (x, y, z) bilden ein Linkssystem 9.4 Geraden und Ebenen In diesem Abschnitt behandeln wir die verschiedenen Weisen, auf die man Geraden und Ebenen (allgemeiner: affine Räume) darstellen kann. Dies sind im allgemeinen Fall die parametrische und die baryzentrische Darstellung. Für so genannte Hyperebenen, also beispielsweise die Ebene im dreidimensionalen Raum oder die Gerade in der Ebene, gibt es die spezielle Darstellung in der Hesse’schen Form. 9.4.1 Parametrische und baryzentrische Darstellung Sind u, r ∈ Rd , r 6= 0, so gibt es genau eine Gerade G durch den Punkt u, die in Richtung von r verläuft G = u + λr, λ ∈ R . (9.10) Der Punkt u wird hier als Aufpunkt der Geraden verstanden, der Vektor r ist die Richtung der Geraden. Diese Darstellung einer Geraden wird als Parameterdarstellung bezeichnet. Die Variable λ ist der Parameter. Man beachte, dass man die selbe Gerade G erhält, wenn man r durch, beispielsweise, −r oder 2r ersetzt. Lediglich die Parameterdarstellung ändert sich im Detail. Anstatt eine Gerade durch die Angabe von einem Aufpunkt und einer Richtung zu beschreiben, können wir auch zwei Punkte u, v ∈ Rd , u 6= v angeben, durch die die Gerade gehen soll. Die Gerade ist eindeutig durch die Angabe solcher zwei Punkte festgelegt. Zunächst ist es das einfachste, eine Parameterdarstellung anzugeben. Wenn wir u als Aufpunkt betrachten, verläuft die Gerade in Richtung r := v − u, also ist wie in (9.10) G = u + λ(v − u), λ ∈ R . (9.11) 9.4 141 Geraden und Ebenen Eine etwas andere Darstellung erhalten wir, wenn wir einen zweiten Parameter µ einführen und µ = 1 − λ setzen. Dann ist nämlich (9.11) gleichwertig zu G = λv + µu, λ + µ = 1 . (9.12) (Man beachte, dass hier die Rollen von u und v gleichwertig sind, die Darstellung also symmetrisch in u und v ist.) Diese Darstellung heißt baryzentrische Darstellung der Geraden G. Für x ∈ G heißen die (eindeutig bestimmten) Zahlen µ und λ mit µ + λ = 1 und x = λv + µu die baryzentrischen Koordinaten von x bezüglich v und u. Die Vorstellung ist: x ist der Schwerpunkt, wenn wir Gewichte der Größe µ und λ in v und u anbringen. ( baryzentrisch“ leitet sich vom griechischen ” Wort für Schwerpunkt“ ab.) ” Im Gegensatz zu einer Geraden wird eine Ebene E durch die Angabe von einem Aufpunkt u und zwei Richtungen r1 und r2 bestimmt. Dabei müssen r1 und r2 natürlich linear unabhängig sein. (Sonst liegen r1 und r2 auf einer Geraden.) Wie für die Gerade erhalten wir die Parameterdarstellung: E = u + λ1 r 1 + λ 2 r 2 , λ 1 , λ 2 ∈ R . (9.13) Wenn wir eine Ebene nicht durch Richtungen beschreiben wollen, sondern durch Angabe von Punkten, durch die die Ebene geht, so müssen wir drei Punkte u0 , u1 , u2 ∈ Rd angeben. Wir können dann wieder eine Parameterdarstellung erzeugen, indem wir u0 als Aufpunkt verstehen und als Richtungen r1 = u1 −u0 und r2 = u2 −u0 setzen. Dabei müssen die Punkte u0 , u1 , u2 natürlich so gewählt sein, dass die Differenzen u1 − u0 und u2 − u0 linear unabhängig sind, also nicht auf einer Geraden liegen. Aus (9.13) erhalten wir sofort die Parameterdarstellung für die Ebene E = u0 + λ1 (u1 − u0 ) + λ2 (u2 − u0 ), λ1 , λ2 ∈ R . (9.14) Auch für die Ebene können wir wieder baryzentrische Koordinaten einführen: µ0 = 1 − λ1 − λ2 , µ1 = λ1 und µ2 = λ2 E = µ0 u0 + µ1 u1 + µ2 u2 , µ0 + µ1 + µ2 = 1 . (9.15) Die baryzentrische Darstellung der Ebene in (9.15) ist wieder völlig symmetrisch in den drei Punkten u0 , u1 , u2 . Sie legt nahe, dass man auch Ebenen von höherer Dimension“ betrachten kann, die durch mehr ” als drei Punkte angegeben werden. Unsere räumliche Vorstellungskraft versagt hier sicherlich, aber rein formal gibt es kein Problem, die Begriffe von Geraden und Ebenen zu verallgemeinern. Definition 9.38 (Affiner Raum) Es seien k ≤ d − 1 und u0 , u1 , . . . , uk ∈ Rd Punkte mit der Eigenschaft, dass u1 − u0 , . . . , uk − u0 linear unabhängig sind. Dann heißt die Menge ( k ) X i i 0 k A= µ u , µ + ... + µ = 1 i=0 der von u0 , . . . , uk aufgespannte k–dimensionale affine Unterraum von Rd . Für x ∈ A mit x = k P i=0 heißen die Zahlen µ0 , . . . , µk die baryzentrischen Koordinaten bezüglich der Punkte u0 , . . . , uk . µi ui 142 Vektorräume und Grundlagen der Analytischen Geometrie Ist k = d − 1, so heißt A eine Hyperebene im Rd . Spezialfälle sind k = 1: k = 2: k = d − 1: Gerade Ebene Hyperebene Nach der Definition wird also eine Gerade im R2 als Hyperebene bezeichnet, genauso wie eine Ebene im R3 als Hyperebene bezeichnet wird. Wir werden im nächsten Unterabschnitt sehen, dass diese Begriffsbildung sinnvoll ist. Man beachte, dass ein affiner Raum im allgemeinen kein Vektorraum ist. Sind nämlich u, v ∈ A, so ist im allgemeinen u + v 6∈ A. Allerdings ist stets λu + (1 − λ)v ∈ A. Man kann zeigen, dass ein affiner Raum A genau dann ein Vektorraum ist, wenn 0 ∈ A ist. Das wiederum ist gleichwertig dazu, dass die Punkte u0 , . . . , uk linear abhängig sind. 9.4.2 Hesse’sche Normalform Wir hatten gesehen, dass der Begriff der Hyperebenen H im Rd die Begriffe der Geraden in der Ebene und der Ebene im dreidimensionalen Raum verallgemeinert. Wir werden hier sehen, dass sich für Hyperebenen eine weitere, besonders praktische Beschreibung anbietet, bei der statt Punkten oder Richtungen innerhalb der Hyperebene diejenige Richtung angegeben wird, die senkrecht auf der Hyperebene steht. Dies ist, wie wir gleich sehen werden, zudem die Richtung, in der die Hyperebene den geringsten Abstand zum Ursprung hat. So kann eine Hyperebene durch Angabe der senkrechten Richtung sowie des Abstands zum Ursprung charakterisiert werden durch die so genannte Hesse’sche Normalform. Wir beginnen mit einem Lemma. Sei v ∈ H derjenige Vektor, für den |v| minimal ist, für den also gilt |w| ≥ |v| für alle w ∈ H. (9.16) Es ist nicht schwer zu zeigen, dass v eindeutig bestimmt ist. Wir wollen hier nur zeigen, dass v senkrecht auf H steht. Lemma 9.39 v steht senkrecht auf H. Mit anderen Worten hw − v, vi = 0 für alle w ∈ H. Beweis Für jedes λ ∈ R ist v + λ(w − v) ∈ H. Also ist die Funktion f : R → R f (λ) = |v + λ(w − v)|2 nach Voraussetzung minimal in λ = 0. Wir bezeichnen mit f 0 (λ) = Dann ist d dλ f (λ) die Ableitung von f . d hv − λ(w − v), v − λ(w − v)i dλ d 2 = λ hw − v, w − vi − 2λhv, w − vi dλ = 2λ|w − v|2 − 2hv, w − vi. f 0 (λ) = Da f in λ = 0 minimal ist, ist 1 hv, w − vi = − f 0 (0) = 0. 2 2 9.4 143 Geraden und Ebenen Definition 9.40 Wir nennen α = |v| den Abstand von H zum Ursprung und, falls v 6= 0 (also, falls 0 6∈ H), n := v |v| den Normalenvektor von H. n ist normiert (das heißt |n| = 1) und zeigt vom Ursprung senkrecht nach H. Wenn die Hyperebene H durch den Ursprung geht, müssen wir uns etwas mehr anstrengen, um einen normierten Vektor zu finden, der senkrecht auf H steht, da der Punkt minimalen Abstands ja der Ursprung ist. Man kann dazu so vorgehen: man betrachtet eine Hyperebene H 0 , die parallel zu H liegt und nicht durch den Ursprung geht. Für H 0 kann man einen Normalenvektor n angeben. Da n senkrecht auf H 0 steht, muss n auch senkrecht auf H stehen. Voilà. Hierzu ist allerdings zu bemerken, dass n nur bis auf das Vorzeichen eindeutig ist, weil ja mit n auch −n senkrecht auf H steht. Satz 9.41 (Hesse’sche Normalform) (a) Ist H ⊂ Rd eine Hyperebene (also eine Ebene, falls d = 3, oder eine Gerade, falls d = 2), so gibt es ein Paar (n, α) mit n ∈ Rd , |n| = 1 und α ≥ 0, sodass H = v ∈ Rd : hv, ni − α = 0 . (9.17) Dabei ist α stets eindeutig. Ist α > 0, so ist n eindeutig. Ist α = 0, so ist n nur bis auf das Vorzeichen eindeutig. (b) Ist umgekehrt ein Paar (n, α) wie oben gegeben, so wird durch (9.17) eine Hyperebene definiert. (c) Die Darstellung in (9.17) heißt Hesse’sche Normalform der Hyperebene H. Das Paar (n, α) nennt man die Koordinaten der Hesse’schen Normalform. Beispiele 9.42 (i) Sei d = 2 und H = G = u0 + λ(u1 − u0 ), λ ∈ R , wobei 0 2 und u1 = . 2 0 2 2 n steht senkrecht auf v := u1 − u0 = , also ist n ein Vielfaches von v ⊥ = (siehe (9.8)). −2 2 √ √ 1 1 . Mit n = + 22 ergibt sich Damit n normiert ist, ist n = ± 22 1 1 u0 = √ 0 α = hu , ni = √ 2 (0 · 1 + 2 · 1) = 2 > 0 . 2 Somit hatten wir das richtige Vorzeichen bei n gewählt. Also ist die Hesse’sche Normalform von G ( * √ + ) √ 2 1 2 G = v ∈ R : v, − 2 =0 . 2 1 (ii) Sei d = 3 und H = E = µ0 u0 + µ1 u1 + µ2 u2 , µ0 + µ1 + µ2 = 1 , 144 Vektorräume und Grundlagen der Analytischen Geometrie wo 2 u0 = 1 , 0 1 1 u1 = 1 , u2 = 3 . 1 0 −1 −1 n steht senkrecht auf v 1 := u1 − u0 = 0 und v 2 := u2 − u0 = 2 . Also ist n parallel zum 1 0 Vektorprodukt −2 w := v 1 × v 2 = −1 . −2 Nun ist hw, u0 i = −2 · 2 − 1 · 1 = −5. Das negative Vorzeichen zeigt an, dass w von E weg zeigt. Also müssen wir für n das andere Vorzeichen wählen 2 1 5 w 1 = und α = . n := − |w| 3 3 2 Probe: hn, u0 i − von E 5 3 = 0, hn, u1 i − 53 = 0 und hn, u2 i − 53 = 0. Also ist die Hesse’sche Normalform + * 2 5 1 E = v ∈ R3 : v, 1 − = 0 . 3 3 2 Bei der Probe in (ii) haben wir nur die Punkte getestet, die die Ebene definieren. Dass dies immer ausreichend ist, halten wir in dem folgenden Satz fest. Satz 9.43 Seien u0 , u1 , . . . , ud−1 ∈ Rd und {u1 − u0 , . . . , ud−1 − u0 } linear unabhängig sowie H die Hyperebene (d−1 ) X i i 0 d−1 H= µ u , µ + ... + µ =1 . i=0 d Ferner seien n ∈ R , |n| = 1 und α ≥ 0. n und α sind genau dann die Koordinaten der Hesse’schen Normalform von H, falls hui , ni − α = 0, für alle i = 0, . . . , d − 1. Beweis Es ist zu prüfen, dass hv, ni − α = 0 für alle v ∈ H. Sei dazu v= d−1 X µi ui mit i=0 d−1 X µi = 1 , i=0 d.h. in baryzentrischen Koordinaten gegeben. Dann ist *d−1 + d−1 d−1 X X X i i hv, ni = µ u ,n = µi hui , ni = µi α = α, i=0 weil d−1 X i=0 µi = 1. i=0 i=0 2 9.4 145 Geraden und Ebenen Abstand eines Punktes von einer Hyperebene Bei der Hesse’schen Normalform gibt |α| den Abstand der Hyperebene vom Ursprung an. Wie erhalten wir allgemein den Abstand dist(x, H) eines Punktes x im Vektorraum von einer Hyperebene H mit Koordinaten (n, α) der Hesse’schen Normalform? Zu x gehört ein Punkt xH ∈ H mit kleinstem Abstand zu x und es ist dist(x, H) = |x − xH |. Offenbar ist dann x − xH senkrecht zu H also parallel zu n und damit dist(x, H) = |x − xH | = |hx − xH , ni|. Wir berechnen hx − xH , ni = hx, ni + hαn − xH , ni −hαn, ni = hx, ni − α. | {z } =0, weil αn,xH ∈H Wir halten das Ergebnis in einem Satz fest. Satz 9.44 Der Abstand des Punktes x von der Hyperebene H mit Koordinaten (n, α) der Hesse’schen Normalform ist dist(x, H) = |hx, ni − α|. Beispiel 9.45 Sei G ⊂ R2 die Gerade durch die Punkte u0 = 2 −1 −2 und u1 = . Es sei x = . 0 1 −2 Dann ist der Normalenvektor n senkrecht auf u0 − u1 , also ⊥ 3 √ −1 10 1 (u0 − u1 )⊥ √ n=± 0 = ± = ± . |u − u1 | 10 −3 10 Wegen *√ 10 10 + √ 10 1 0 >0 ,u = −3 5 gilt das positive Vorzeichen und es ist √ 10 n= 10 Wir erhalten 1 , −3 √ α= 10 . 5 √ 2√ 1 √ 10 dist(x, G) = |hx, ni − α| = 10 − 10 = . 5 5 5 146 Vektorräume und Grundlagen der Analytischen Geometrie Kapitel 10 Matrizen und lineare Abbildungen v1 Um die Koordinaten x1 , . . . , xd des Vektors v = ... ∈ Rd bezüglich einer gegebenen Basis b1 , . . . , bd vd des Rd zu berechnen, müssen wir nach Satz 9.13 die Vektorgleichung x1 b1 +· · ·+xd bd = v nach x1 , . . . , xd auflösen. Äquivalent zu dieser Vektorgleichung ist das folgende lineare Gleichungssystem (LGS) b11 x1 .. . + · · · + bd1 xd .. . = b1d x1 + · · · + bdd xd = vd v1 .. . . (10.1) In diesem Kapitel wollen wir eine ökonomische Notation und Lösungsmethode für solche LGS mit Hilfe von Matrizen einführen. (Allgemeinere LGS werden im nachfolgenden Kapitel behandelt.) Weiter untersuchen wir Matrizen als Darstellung von linearen Abbildungen zwischen Vektorräumen. 10.1 Grundlegendes Definition 10.1 (Matrix) Seien m, n ∈ N. Ein rechteckiges Zahlenschema a11 a12 · · · a1n a21 a22 · · · a2n A= . .. .. = (aij ) i=1,...,m .. j=1,...,n .. . . . am1 am2 · · · amn heißt eine m × n–Matrix. Sind die Einträge aij reelle (komplexe) Zahlen, so heißt A reell (komplex). Die Menge aller reellen (komplexen) m × n–Matrizen wird mit M (m, n) = M (m, n; R) (bzw. M (m, n; C)) bezeichnet. a1j Die Spalten ... , j = 1, . . . , n heißen Spaltenvektoren, die Zeilen (ai1 , . . . , ain ), i = 1, . . . , m, heißen amj Zeilenvektoren von A. 147 148 Matrizen und lineare Abbildungen Die Zahlen aii heißen die Diagonalelemente von A. Ist m = n, so heißt A quadratisch. Beispiele 10.2 1 2 3 ∈ M (2, 3) 4 5 6 1 4 A = 2 0 ∈ M (3, 2) 3 0 i 1 A= ∈ M (2, 2; C) −1 1 A= v1 Wir interpretieren Zeilenvektoren (u1 , . . . , un ) als 1 × n–Matrizen, Spaltenvektoren ... als m × 1– vm Matrizen. Einige wichtige Matrizen: Definition 10.3 (i) Die Matrix 0 ··· 0 .. ∈ M (m, n) 0 := ... . 0 ··· 0 heißt die Nullmatrix. Sie wird unabhängig von m und n nur mit 0 bezeichnet. (ii) Die quadratische Matrix, bei der nur die Diagonalelemente ungleich Null sind d11 0 . . . . . . . . . . 0 0 d22 0 . . . . . . 0 . . 0 . 0 .. 0 0 D= . .. =: diag(d11 , . . . , dnn ) .. . . 0 . . . . . . . . 0 .. 0 0 . . . . . . . . . . . 0 dnn heißt Diagonalmatrix. (iii) Die Diagonalmatrix In := diag(1, . . . , 1) ∈ M (n, n) heißt Einheitsmatrix. Ist der Wert n aus dem Zusammenhang klar, so schreiben wir auch nur I = In . Matrizen vom selben Typ (m, n) kann man elementweise addieren und mit Skalaren multiplizieren. Definition 10.4 (Matrizenaddition) Seien A, B m × n–Matrizen und λ ∈ R. Dann definieren wir die m × n–Matrix C := A + B durch cij = aij + bij , i = 1, . . . , m, j = 1, . . . , n. 10.1 149 Grundlegendes Wir definieren die Matrix E = λA durch eij = λaij , i = 1, . . . , m, j = 1, . . . , n. Beispiel 10.5 A= Dann ist 1 4 A+B = 2 5 3 , 6 1+0 4+1 und B= 2+1 5+0 3A = 3 12 0 1 1 −3 . 0 1 3−3 1 = 6+1 5 6 15 3 5 0 7 9 . 18 Offenbar ist die Matrizenaddition nichts anderes als die Vektoraddition, nur dass bei Matrizen die m · n Einträge nicht untereinander sondern rechteckig notiert sind. Entsprechendes gilt für die Skalarmultiplikation. Es gelten also genau die Rechenregeln, die wir für Vektoren in Lemma 9.1 zusammengefasst haben. Es gilt also: Satz 10.6 Bezüglich der Addition und Skalarmultiplikation ist M (m, n) ein Vektorraum der Dimension m · n. Im Gegensatz zu Vektoren des Rd wollen wir Matrizen auch miteinander multiplizieren. Definition 10.7 (Matrizenmultiplikation) Sei A ∈ M (m, n), B ∈ M (n, p), so definieren wir das Produkt C := AB ∈ M (m, p) durch n X aik bkj . cij = k=1 Wichtig: Spaltenanzahl von A muss gleich der Zeilenanzahl von B sein! Beispiel 10.8 1 3 1 2 3 6 0 7 0 2 2 1 1 1 2 6 0 4 2+2+0+0 6 6 + 3 + 27 + 0 = 1 2+6+0+0 5 4 + 12 + 0 + 10 4 26 12 + 18 + 7 + 5 = 12, 5 42 . 8 70 4 + 36 + 0 + 30 ACHTUNG: Selbst wenn AB und BA definiert sind, ist im allgemeinen AB 6= BA Beispiel 10.9 0 1 A= , 1 0 0 3 AB = , 2 0 2 0 B= . 0 3 0 2 BA = . 3 0 150 Matrizen und lineare Abbildungen Achtung: Aus AB = 0 folgt nicht A = 0 oder B = 0. Beispiel 10.10 A= 0 , 0 1 0 B= AB = 0 = 0 . 1 0 0 0 . 0 0 0 Wir fassen die Rechenregeln für die Matrizenmultiplikation in einem Lemma zusammen. Lemma 10.11 (Rechenregeln für die Matrizenmultiplikation) A(BC) = (AB)C (A + B)C = AC + BC A(B + C) = AB + AC. Ist A ∈ M (m, n) und sind Im ∈ M (m, m), In ∈ M (n, n) die Einheitsmatrizen, so ist Im A = AIn = A. 10.2 Invertierbare Matrizen Definition 10.12 Eine Matrix A ∈ M (n, n) heißt invertierbar (oder regulär), falls es ein B ∈ M (n, n) gibt mit AB = In . Äquivalent dazu ist BA = In . Wir nennen A−1 := B das Inverse von A. Die Menge der invertierbaren n × n–Matrizen wird mit GL(n) bezeichnet. Matrizen, die nicht invertierbar sind, heißen singulär. Beispiele 10.13 (i) A= denn −1 AA und −1 (ii) Allgemeiner: A = = A A= a b c d 3 7 2 , 5 3·5−7·2 7·5−5·7 A−1 = 5 −2 , −7 3 3 · (−2) + 2 · 3 1 = (−2) · 7 + 5 · 3 0 5 · 3 + (−2) · 7 5 · 2 + (−2) · 5 (−7) · 3 + 3 · 7 (−7) · 2 + 3 · 5 = 1 0 0 1 0 . 1 ist invertierbar genau dann, wenn det(A) := |A| := ad − bc 6= 0. In diesem Fall ist A−1 = 1 det(A) d −b . −c a Diese Formel wird auch als Cramér’sche Regel bezeichnet. Satz 10.14 Sind A, B ∈ GL(n), so ist auch AB ∈ GL(n) mit Inversem (AB)−1 = B −1 A−1 . (10.2) 10.3 151 Gauß Verfahren Beweis (AB)(B −1 A−1 ) = A(BB −1 )A−1 = AIn A−1 = AA−1 = In . 2 Satz 10.15 Sei A ∈ M (n, n). Folgende Aussagen sind gleichwertig (i) A ∈ GL(n), a1j (ii) die Spaltenvektoren ... , j = 1, . . . , n, sind linear unabhängig. anj (iii) die Zeilenvektoren (ai1 , . . . , ain ), i = 1, . . . , n, sind linear unabhängig. Anwendung: Koordinaten berechnen a1j Seien die Spaltenvektoren aj = ... , j = 1, . . . , n eine Basis von Rn und v ∈ Rn . Die Koordinaten anj x1 x1 , . . . , xn von v bezüglich dieser Basis sollen bestimmt werden. Dazu schreiben wir x = ... als xn Spaltenvektor und a11 .. 1 n A = (a , . . . , a ) = . an1 ··· a1n .. . (10.3) · · · ann als Matrix. Wir müssen nun die Gleichung Ax = v (10.4) nach x auflösen. Nach Satz 10.15 ist A ∈ GL(n), also existiert A−1 . Wir multiplizieren die Gleichung (10.4) von links mit A−1 und erhalten so A−1 v = A−1 (Ax) = (A−1 A)x = In x = x. Wir können also die Koordinaten von jedem Vektor v leicht ausrechnen, wenn wir erst einmal A−1 gefunden haben. 10.3 Gauß Verfahren Wir geben hier ein universelles Verfahren an, um zu einer invertierbaren Matrix A ∈ GL(n) die Inverse A−1 auszurechnen. Schritt 1 Wir schreiben A und die Einheitsmatrix nebeneinander a11 · · · a1n 1 0 .. .. . . 0 1 .. .. . .. . . .. . 0 0 an1 · · · ann ··· 0 · · · 0 .. .. . . ··· 1 152 Matrizen und lineare Abbildungen Wir dürfen nun simultan die Zeilen beider Matrizen verändern durch eine der drei Manipulationen: (i) Zwei Zeilen vertauschen, (ii) (Vielfache) einer Zeile zu einer anderen addieren (oder davon abziehen), (iii) eine Zeile mit einer Zahl λ 6= 0 multiplizieren. Diese Manipulationen werden elementare Zeilenumformungen genannt. Wenn ursprünglich A · A−1 = I galt, gilt jetzt für die durch (auch mehrfache) Manipulation mit den 3 Methoden aus A und I erhaltenen Matrizen A0 bzw. I 0 ebenfalls A0 · A−1 = I 0 (nicht schwer zu zeigen). Man darf die elementaren Zeilenumformungen beliebig oft anwenden. Man tut es so lange, bis an Stelle von A die Einheitsmatrix steht, dann steht an Stelle von I die inverse Matrix A−1 . Schematisch geht man folgendermaßen vor: Schritt 2. Durch eventuelles Vertauschen von Zeilen wird a11 6= 0 erreicht. Durch Multiplikation der ersten Zeile mit a111 wird a11 = 1 erreicht. Schritt 3. Die erste Zeile wird nun a21 –fach von der zweiten Zeile abgezogen, dann a31 –fach von der 1 0 dritten und so weiter bis in der ersten Spalte der linken Matrix der Vektor e1 = . steht. .. 0 Schritt 4. Nacheinander werden die weiteren Spalten zu e2 , e3 und so weiter gemacht. Als Ergebnis steht links die Einheitsmatrix und rechts die Matrix A−1 . Das Verfahren geht genau dann auf, wenn A invertierbar ist. Ansonsten tritt im Verlauf auf der linken Seite eine Zeile oder Spalte mit nur Nullen auf. (Man muss also nicht im voraus prüfen, ob A invertierbar ist.) Wir führen das Verfahren hier an einem Beispiel durch. 0 9 6 Beispiel 10.16 Wir wollen die Matrix A = 1 1 −1 invertieren. 2 −7 2 0 9 6 1 0 0 1 1 −1 0 1 0 2 −7 2 0 0 1 Erste und zweite Zeile vertauschen, damit links oben keine Null steht. 1 1 −1 0 9 6 2 −7 2 Erste Zeile zweimal von der dritten abziehen. 1 1 −1 0 9 6 0 −9 4 0 1 0 1 0 0 0 1 1 0 0 −2 0 0 1 0 0 1 10.3 153 Gauß Verfahren Zweite Zeile mal 1 9 1 1 −1 2 0 1 3 0 −9 4 0 1 1 9 0 0 0 0 1 −2 Zweite Zeile von der ersten abziehen und 9-mal zur dritten addieren 1 0 − 35 2 0 1 3 0 0 10 Dritte Zeile mal 1 −9 1 9 1 −2 0 0 1 1 0 1 10 1 0 0 0 − 53 1 2 3 0 1 − 91 1 0 1 9 1 10 0 0 − 15 1 10 Dritte Zeile 53 –mal zur ersten addieren, und 23 –mal von der zweiten abziehen 1 0 0 0 1 0 0 0 1 1 18 2 45 1 10 2 3 2 15 − 15 1 6 1 − 15 1 10 Wir erhalten also die Inverse von A 1 18 2 45 1 10 A−1 = Probe: A · A−1 2 3 2 15 − 15 1 0 9 6 18 2 · 1 1 −1 = 45 1 2 −7 2 10 0 Beispiel 10.17 Wir wollen A = 3 1 1 6 1 − 15 . 1 10 2 3 2 15 − 15 2 4 3 −6 invertieren. 1 −2 0 2 4 1 3 3 −6 0 1 1 −2 0 1 6 1 − 15 1 10 0 1 0 0 0 1 1 0 0 0 0 1 Erste und zweite Zeile vertauschen 3 0 1 3 −6 2 4 1 −2 0 1 0 1 = 0 0 0 1 0 0 0 . 1 154 Matrizen und lineare Abbildungen Erste Zeile mal 1 3 1 0 1 Erste Zeile von der dritten abziehen 1 0 0 1 −2 2 4 1 −2 0 1 0 1 −2 2 4 0 0 1/3 0 0 0 1/3 1 0 0 −1/3 0 0 1 0 0 1 Die letzte Zeile hat links nur Nullen, also ist A nicht invertierbar. 10.4 Lineare Abbildungen Die wichtigsten Abbildungen in der Geometrie, Dehnungen, Scherungen, Spiegelungen, Drehungen usf., sind so genannte lineare Abbildungen. Wenn man weiß, wie sich die Einheitsvektoren transformieren, kann man das gedrehte, gespiegelte usf. Koordinatengitter zeichnen und dann für jeden Vektor ablesen, wohin er abgebildet wurde. In diesem Abschnitt formalisieren wir die dargestellte Idee und geben den Zusammenhang mit dem Matrizenkalkül an. Definition 10.18 Seien U und V Vektorräume. Eine Abbildung L : U → V heißt lineare Abbildung, wenn sie mit der Struktur von U und V verträglich ist, also die folgenden Regeln erfüllt: Für alle x, y ∈ U und λ ∈ R gilt L(x + y) = L(x) + L(y) L(λx) = λL(x). (i) Die identische Abbildung idU : U → U , x 7→ x, ist linear. x1 x1 (ii) Die Projektion L : R3 → R2 , x2 7→ ist linear, denn x2 x3 x1 + y1 x1 + y1 x1 y L(x + y) = L x2 + y2 = = + 1 = L(x) + L(y) x2 + y2 x2 y2 x3 + y3 Beispiele 10.19 und λx1 = λL(x). λx2 x1 x1 + x2 2 2 (iii) Die Scherung in der Ebene L : R → R , 7→ ist linear, denn x2 x2 x1 + y1 x1 + y1 + x2 + y2 x1 + x2 y 1 + y2 L(x + y) = L = = + = L(x) + L(y) x2 + y2 x2 + y2 x2 y2 L(λx) = und L(λx) = L λx1 λx2 = λ(x1 + x2 ) = λL(x). λx2 10.4 155 Lineare Abbildungen (iv) Ist u ∈ Rd fest gewählt, so ist L : Rd → R, x 7→ hu, xi eine lineare Abbildung. (v) Ist u ∈ Rd , u 6= 0, fest gewählt, so ist L : Rd → Rd , x 7→ x + u keine lineare Abbildung. Es ist nämlich (mit λ = 0) L(0 · x) = u 6= 0 = 0 · L(x). (vi) Die Abbildung L : Rd → R, x 7→ hx, xi ist nicht linear, denn L(λx) = hλx, λxi = λhx, λxi = λ2 hx, xi = λ2 L(x). (vii) Ein etwas weitreichenderes Beispiel ist die Integration stetiger Funktionen. Sei U = {f : [0, 1] → R stetig} und L : U → U gegeben durch L(f ) = F , wobei x Z F (x) = f (t) dt 0 die Stammfunktion von f mit F (0) = 0 ist. Dann ist L linear, denn für x ∈ [0, 1] gilt: Z x Z x (f + g)(t) dt = 0 Z x f (t) dt + 0 g(t) dt 0 und x Z Z x λf (t) dt = λ f (t) dt. 0 0 Ist nun U ein Vektorraum mit Basis u1 , . . . , un , so reicht es, die lineare Abbildung L : U → V an den Stellen u1 , . . . , un zu kennen. Es hat nämlich jeder Vektor x ∈ U eine eindeutige Darstellung x= n X λj u j , j=1 und es ist n n X X L(x) = L λj u j = λj L(uj ). j=1 j=1 Sei nun auch noch v 1 , . . . , v m eine Basis von V . Wir bezeichnen mit (aij )i=1,...,m die Koordinaten von L(uj ) bezüglich v 1 , . . . , v m , d.h. L(uj ) = m X v i aij . i=1 Insgesamt haben wir für x wie oben L(x) = m X n X i=1 j=1 v i aij λj . 156 Matrizen und lineare Abbildungen Satz 10.20 (Darstellungsmatrix) Seien U, V Vektorräume mit Basen u1 , . . . , un und v 1 , . . . , v m . Zu jeder linearen Abbildung L : U → V gehört genau eine Matrix A = (aij ) ∈ M (m, n), sodass für alle Pn x = j=1 uj gilt m X n X L(x) = v i aij λj . (10.5) i=1 j=1 A heißt die von L bezüglich der Basen u1 , . . . , un und v 1 , . . . , v m . Der j–te Spal Darstellungsmatrix a1,j tenvektor ... gibt die Koordinaten von L(uj ) bezüglich der Basis v 1 , . . . , v m wieder. Ist also Λ = an,j λ1 .. . der Koordinatenvektor von x bezüglich u1 , . . . , un , so ist das Matrixprodukt A · Λ der Koordina λn tenvektor von L(x) bezüglich v 1 . . . v m . Umgekehrt wird durch (10.5) zu jeder Matrix A eine lineare Abbildung L definiert. Achtung: Bei anderer Wahl der Basen erhält man eine andere Darstellungsmatrix! Beispiele 10.21 (i) Sei U = V = Rd und ui = v i = ei , i = 1, . . . , n die Standardbasis. Dann hat die identische Abbildung id : Rn → Rn die Einheitsmatrix In als Darstellungsmatrix. x1 x1 (ii) Sei S : R2 → R2 , 7→ die Spiegelung an der horizontalen Achse. Bezüglich der Basis x −x2 2 1 1 0 1 b1 = , b2 = hat S die Darstellungsmatrix , denn S(b1 ) = b2 und S(b2 ) = b1 . 1 −1 1 0 1 0 Bezüglich der Standardbasis hat S die Darstellungsmatrix . 0 −1 x1 x1 3 2 (iii) Die Projektion π : R → R , x2 7→ hat bezüglich der Standardbasen die Darstellungsmax2 x 3 1 0 0 trix . 0 1 0 (iv) Die Drehung Dϕ : R2 → R2 um den Winkel ϕ (gegen den Uhrzeigersinn) hat bezüglich der Standardbasen die Darstellungsmatrix cos(ϕ) − sin(ϕ) Dϕ = . sin(ϕ) cos(ϕ) r1 (v) (Vektorprodukt) Ist r = r2 ∈ R3 fest gewählt, so ist die Abbildung L : R3 → R3 , x 7→ r × x r3 linear. Die Darstellungsmatrix bezüglich der Standardbasis ist 0 −r3 r2 r3 0 −r1 . (10.6) −r2 r1 0 10.4 157 Lineare Abbildungen Wenn man eine Abbildung verstanden hat, ist es eine Zwangshandlung, Zusammensetzungen von Abbildungen zu untersuchen. Satz 10.22 Seien U, V, W Vektorräume mit Basen u1 , . . . , um , v 1 , . . . , v n und w1 , . . . , wp , sowie LA : U → V und LB : V → W lineare Abbildungen mit Darstellungsmatrizen A ∈ M (n, m) und B ∈ M (p, n). Dann ist die Verknüpfung LC := LB ◦ LA : U → W , x 7→ LB (LA (x)) eine lineare Abbildung mit Darstellungsmatrix C = BA ∈ M (p, m). Beweis n X LC (uk ) = LB (LA (uk )) = LB ajk v j j=1 = n X ajk LB (v j ) j=1 = n X ajk j=1 p X bij wi i=1 p n X X = wi bij ajk i=1 = p X j=1 wi cik . i=1 2 Matrizenmultiplikation entspricht also genau der Verknüpfung linearer Abbildungen. Wir erhalten sofort (z.B. mit Hilfe von Beispiel 10.21(i)) die einfache Schlussfolgerung. Korollar 10.23 Sei u1 , . . . , un eine Basis von U und LA : U → U linear mit Darstellungsmatrix A. Dann gilt LA ist umkehrbar ⇐⇒ A ∈ GL(n). Die Darstellungsmatrix der Umkehrabbildung (LA )−1 ist dann A−1 . x1 + λx2 Beispiele 10.24 (i) Die Scherung L : R → R , 7→ (wobei λ ∈ R fest ist) hat x2 1 λ bezüglich der Standardbasis die Darstellungsmatrix A = . Die Scherung ist umkehrbar mit 0 1 x1 x1 − λx2 Umkehrabbildung L−1 = . Dies ist auch eine Scherung mit Parameter −λ, also x2 x2 1 −λ mit Darstellungsmatrix . Nun ist 0 1 1 λ 1 −λ 1 0 · = , 0 1 0 1 0 1 1 −λ also ist = A−1 . 0 1 2 2 x1 x2 158 Matrizen und lineare Abbildungen (ii) Die Drehung Dϕ : R2 → R2 ist umkehrbar mit (Dϕ )−1 = D−ϕ (zurück drehen!). Es ist −1 cos(ϕ) − sin(ϕ) cos(−ϕ) − sin(−ϕ) cos(ϕ) = = sin(ϕ) cos(ϕ) sin(−ϕ) cos(−ϕ) − sin(ϕ) sin(ϕ) . cos(ϕ) Dies liefert übrigens auch die Cramér’sche Regel (10.2), weil det(Dϕ ) = 1. 10.5 Spezielle Matrizen Definition 10.25 Ist A = (aij ) ∈ M (m, n), so nennen wir die Matrix AT ∈ M (n, m) mit Einträgen a11 · · · am1 .. AT = ... . a1n · · · amn die transponierte Matrixvon A. Beispiele 10.26 (i) 1 4 2 5 T 1 3 = 2 6 3 4 5 . 6 (ii) x1 (x1 , . . . , xm )T = ... , xm (iii) Für x, y ∈ Rd ist T x1 .. . = (x1 , . . . , xm ). xm y1 d .. X T hx, yi = x y = (x1 , . . . , xd ) · . = xi yi . yd i=1 (iv) Ist A ∈ M (n, n) und x, y ∈ Rn , so ist hx, Ayi = hAT x, yi. (v) Es ist stets (AT )T = A. Lemma 10.27 Es ist (A + B)T = AT + B T (AB)T = B T AT (A−1 )T = (AT )−1 , falls A ∈ GL(n). Definition 10.28 Eine Matrix A ∈ M (n, n) heißt (i) symmetrisch, falls A = AT , (ii) orthogonal, falls A−1 = AT , 10.6 159 Basiswechsel (iii) obere (untere) Dreiecksmatrix, falls aij = 0 für i > j (bzw. i < j). Bemerkung 10.29 A ist genau dann symmetrisch, wenn hx, Ayi = hAx, yi für alle x, y ∈ Rn ist. Bemerkung 10.30 Eine Matrix A ist genau dann orthogonal, wenn die Zeilen (bzw. Spalten) eine Orthonormalbasis bilden. Dann ist nämlich * ai,1 aj,1 + n X 1, i = j (A · AT )ij = aik ajk = ... , ... = 0, i 6= j. k=1 aj,n ai,n Also ist A · AT = In und damit ist AT = A−1 . Bemerkung 10.31 Orthogonale Matrizen gehören zu linearen Abbildungen, die längen- und winkeltreu sind, also zu Spiegelungen und Drehungen, denn hAx, Ayi = hAT Ax, yi = hA−1 Ax, yi = hx, yi. 10.6 Basiswechsel 2 2 1 √1 5 2 auf die doppelte 1 Wir betrachten die lineare Abbildung L : R → R , die in Richtung von b = −1 1 2 √ aber auf die dreifache Länge. D.h. L hat bezüglich der Länge streckt, in Richtung von b = 5 2 1 2 Basis b , b die Darstellungsmatrix 2 0 A= = diag(2, 3). 0 3 Wie erhalten wir die Darstellungsmatrix bezüglich der Standardbasis e1 , e2 ? e = (eb1 , . . . , ebd ) zwei Basen von Wir formulieren das Problem allgemeiner. Seien B = (b1 , . . . , bd ) und B d d d e e Wie lässt sich A in R und L : R → R linear mit Darstellungsmatrix A bezüglich B und A bezüglich B. e A umrechnen? e1 λ1 λ e = .. e Sei x ∈ Rd mit Koordinaten Λ = ... bezüglich B und Λ . bezüglich B, also ed λd λ e Λ. e x = BΛ = B e −1 können wir die Koordinaten ineinander umrechnen. Durch Multiplikation mit B −1 beziehungsweise B e Die Matrix S hat in der k–ten Spalte die Koordinaten von ebk bezüglich Wir kürzen noch ab S := B −1 B. B. Wir bekommen so e e = S −1 Λ. Λ = S Λ, Λ Es ist dann eB e −1 BAB −1 B eΛ e = BS e −1 AS Λ. e L(x) = BAΛ = B Also haben wir insgesamt 160 Matrizen und lineare Abbildungen e Basen des Rn und Satz 10.32 (Basiswechsel) Sei L : Rn → Rn eine lineare Abbildung. Seien B und B e e e so gilt A und A die Darstellungsmatrizen von L bezüglich B beziehungsweise B. Setzen wir S := B −1 B, e = S −1 AS. A e Beispiel 10.33 Zurück zu unserem Beispiel. Da wir als neue Basis die Standardbasis betrachten, ist B = 1 0 e = B −1 , also . Daher ist S = B −1 B 0 1 S −1 √ 5 2 −1 =B= 5 1 2 und nach der Cramér’schen Regel S=B −1 √ 5 2 = 5 −1 1 . 2 Es ist dann die Darstellungsmatrix von L bezüglich der Standardbasis 1 2 −1 2 0 2 −1 e A = S AS = 1 2 0 3 −1 5 1 2 −1 4 2 = −3 6 5 1 2 1 11 −2 = . 5 −2 14 1 2 Probe 1 11 −2 2 2 4 2 e A = = =2 1 1 2 1 5 −2 14 1 11 −2 −1 −1 −3 −1 e A = = =3 . 2 2 6 2 5 −2 14 2 −1 Also wird wirklich in Richtung verdoppelt und in Richtung verdreifacht. 1 2 1 Beispiel 10.34 Sei L : R3 → R3 diejenige lineare Abbildung, die die Richtung b3 = 33 1 konstant 1 lässt, aber die dazu senkrechte Ebene um den Winkel ϕ dreht (in Richtung b3 schauend im (gegen den Uhrzeigersinn). Wir setzen also √ 1 2 −1 ⊥ b3 b2 = 2 0 √ und √ −1 6 −1 . b1 = b 2 × b 3 = 6 2 10.7 161 Lineare Gleichungssysteme L hat bezüglich der ONB − √16 1 √ B = (b1 , b2 , b3 ) = − 6 √2 6 √1 2 − √12 0 √1 3 √1 3 √1 3 wegen Beispiel 10.21(iv) die Darstellungsmatrix cos(ϕ) − sin(ϕ) 0 A = sin(ϕ) cos(ϕ) 0 0 0 1 (10.7) (10.8) e von L bezüglich der Standardbasis B e = I3 ausrechnen. Dabei Wir wollen wieder die Darstellungsmatrix A ist dann √ √ 1√ − 6 6 − 61 6 13 6 √ √ e = B −1 = 1 2 − 1 2 (10.9) S = B −1 B 0 2 2 √ √ √ 1 1 1 3 3 3 3 3 3 sowie S −1 = B. Ausrechnen ergibt e = S −1 AS A √ √ 1 + 2 cos(ϕ) 1 − cos(ϕ) − 3 sin(ϕ) 1 − cos(ϕ) + √3 sin(ϕ) √ 1 = 1 + 2 cos(ϕ) 1 − cos(ϕ) − 3 sin(ϕ) 1 − cos(ϕ) + √3 sin(ϕ) √ 3 1 − cos(ϕ) − 3 sin(ϕ) 1 − cos(ϕ) + 3 sin(ϕ) 1 + 2 cos(ϕ) π π 1 + 2 cos(ϕ) 1 − 2 cos(ϕ − 3 ) 1 − 2 cos(ϕ + 3 ) 1 1 + 2 cos(ϕ) 1 − 2 cos(ϕ − π3 ) = 1 − 2 cos(ϕ + π3 ) 3 π π 1 − 2 cos(ϕ − 3 ) 1 − 2 cos(ϕ + 3 ) 1 + 2 cos(ϕ) 10.7 (10.10) Lineare Gleichungssysteme Motivation: Beim Erhitzen auf über 400◦ C zersetzt sich Kaliumdichromat (K2 Cr2 O7 ) in Kaliumchromat (K2 CrO4 ), Chromoxid (Cr2 O3 ) und Sauerstoff (O2 ). Um die Anteile der beteiligten Stoffe mathematisch zu bestimmen, gelangt man zu einem linearen Gleichungssystem aus drei Gleichungen mit vier Unbekannten (siehe Beispiel 10.37). Wir betrachten allgemeiner lineare Gleichungssysteme (LGS) von der Form Ax = b, (10.11) wobei A ∈ M (m, n), x ∈ Rm und b ∈ Rm . Ein Vektor x heißt Lösung, falls (10.11) gilt. Das LGS heißt homogen, falls b = 0 und inhomogen sonst. Die Menge L = {x ∈ Rn : Ax = b} heißt Lösungsmenge des LGS und LH = {x ∈ Rn : Ax = 0} heißt Lösungsmenge des homogenen LGS. Es ist stets LH ⊂ Rn ein Untervektorraum. Es ist stets entweder L = ∅ oder L = xp + LH = {xp + x : x ∈ L}, (10.12) wobei xp ∈ L eine beliebige partikuläre Lösung des LGS ist. Also ist L ein affiner Raum. 162 Matrizen und lineare Abbildungen Bestimmung von L Falls m = n und A ∈ GL(n), so wissen wir, dass x = A−1 b die eindeutige Lösung ist. Speziell gilt LH = {0} ⇐⇒ A ∈ GL(n). (10.13) Allgemeiner gehen wir so vor: Ähnlich wie beim Gauß Verfahren schreiben wir A und b in eine Zeile. Wir machen dann elementare Zeilenumformungen, jeweils in A und b simultan, bis wir die Matrix A0 und b0 haben, wobei A0 die so genannte Zeilenstufenform hat. 1 0 0 A = ? · · ·? 0···0 ? 1 ? · · ·? ? 1 ? @. . . @ @. . . @ 1 @ 0 0 j1 j2 j3 ? · · ·? 0···0 b01 .. . .. . .. . .. . b0k 0 b = b0 k+1 . .. b0m jk Die Matrix A0 hat k Stufen. Jede Stufe hat an der Ecke eine 1. Unterhalb der Stufen sind nur Nullen, alle anderen Einträge sind nicht näher bestimmt und mit ? gekennzeichnet. Definition 10.35 Die Zahl k = Anzahl der Stufen von A0 =: Rang(A) nennen wir den Rang von A. Wichtig an der Zeilenstufenform ist, dass die Gleichung A0 x = b0 die gleiche Lösungsmenge L hat, wie die Gleichung Ax = b. Dabei können wir die Lösungen von A0 x = b0 leicht bestimmen. Als erstes ist klar: L 6= ∅ ⇐⇒ b0r = 0 für alle r > k. (10.14) In diesem Fall können wir die Werte x1 , . . . , xn bis auf die Werte xj1 , . . . , xjk frei wählen und dann die Werte xjk , xjk−1 , . . . , xj1 nacheinander ausrechnen. Die Dimension des Lösungsraums ist also so groß wie die Anzahl frei wählbarer Werte dim(L) = dim(LH ) = n − k. (10.15) Es gibt also genau n − k linear unabhängige Vektoren x1 , . . . , xn−k mit LH = span(x1 , . . . , xn−k ). 10.7 163 Lineare Gleichungssysteme Ist xp eine beliebige Lösung von A0 x = b0 , so hat L die Parameterdarstellung ( ) n−k X p i L= x + λi x , λ1 , . . . , λn−k ∈ R . i=1 Beispiel 10.36 0 1 A= 1 2 0 2 2 4 1 1 0 1 6 7 1 8 8 12 4 16 6 11 , 6 18 3 4 b= 2 . 7 Erste und zweite Zeile vertauschen 1 0 1 2 2 0 2 4 1 1 0 1 7 6 1 8 12 8 4 16 11 6 , 6 18 4 3 . 2 7 Erste Zeile einmal von der dritten und zweimal von der vierten abziehen 4 1 2 1 7 12 11 3 0 0 1 6 8 6 . −2 0 0 −1 −6 −8 −5 , −1 0 0 −1 −6 −8 −4 Zweite Zeile zur dritten und vierten hinzuzählen 1 2 1 7 12 0 0 1 6 8 0 0 0 0 0 0 0 0 0 0 11 6 , 1 2 4 3 . 1 2 Dritte Zeile zweimal von der vierten abziehen ergibt die Zeilenstufenform 4 1 2 1 7 12 11 3 0 0 1 6 8 6 0 0 , b = A = 1 . 0 0 0 0 0 1 0 0 0 0 0 0 0 Es ist also Rang (A) = k = 3. Wir berechnen eine Lösung xp indem wir setzen ? 0 ? p x = 0 , 0 ? und berechnen dann nacheinander xp6 = 1 (3. Gleichung), xp3 = −3 (2. Gleichung), und xp1 = −4 (1. Gleichung), also −4 0 −3 xp = 0 . 0 1 164 Matrizen und lineare Abbildungen Als nächstes brauchen wir n − k = 3 unabhängige Lösungen der homogenen Gleichung A0 x = 0. Wir können die Koordinaten x2 , x4 , x5 frei wählen und dann die anderen drei Koordinaten ausrechnen. Also setzen wir (als eine Möglichkeit) ? ? ? 1 0 0 ? 2 ? 3 ? ,x = ,x = . x1 = 0 1 0 0 0 1 ? ? ? Jetzt müssen wir die Lücken auffüllen. Damit x1 , x2 , x3 ∈ LH 0 ist, berechnen wir nacheinander 0 an 0 Stelle von b0 x16 = 0, x13 = −8, x11 = −4. x26 = 0, x23 = −6, x21 = −1. x36 = 0, x33 = 0, x31 = −2. Also −4 0 −8 1 x = 0 , 1 0 −1 0 −6 2 x = 1 . 0 0 −2 1 0 3 x = 0 , 0 0 Wir erhalten also die Menge der Lösungen von Ax = 0 −2 −1 −4 1 0 0 0 −6 −8 LH = λ1 + λ2 + λ3 , 0 1 0 0 0 1 0 0 0 λ1 , λ2 , λ3 ∈ R und die Menge der Lösungen von Ax = b −4 −4 −1 −2 0 0 1 0 −3 + λ1 −8 + λ2 −6 + λ3 0 , L = xp + LH = 0 0 0 1 0 0 1 0 1 0 0 0 λ1 , λ2 , λ3 ∈ R . Beispiel 10.37 Beim Erhitzen auf über 400◦ C zersetzt sich Kaliumdichromat (K2 Cr2 O7 ) in Kaliumchromat (K2 CrO4 ), Chromoxid (Cr2 O3 ) und Sauerstoff (O2 ). Die Reaktionsgleichung lautet x1 K2 Cr2 O7 → x2 K2 CrO4 + x3 Cr2 O3 + x4 O2 (10.16) 10.7 165 Lineare Gleichungssysteme mit zunächst unbekannten Werten für x1 , x2 , x3 , x4 . (Man erwartet natürlich ganzzahlige Werte ≥ 0.) Für die drei beteiligten Elemente gelangt man zu den Gleichungen K : 2x1 Cr : 2x1 O : 7x1 = 2x2 = x2 + 2x3 = 4x2 + 3x3 + 2x4 Dazu äquivalent ist das homogene LGS in Matrizenschreibweise 2 −2 0 0 0 2 −1 −2 0 . 0 7 −4 −3 −2 0 (10.17) Durch schrittweise elementare Umformungen nach dem bekannten Schema erhält man daraus nacheinander 1 −1 0 0 0 2 −1 −2 0 , 0 7 −4 −3 −2 0 1 −1 0 0 0 0 0 , 1 −2 0 0 3 −3 −2 0 1 −1 0 0 0 0 0 , 1 −2 0 0 0 3 −2 0 und schließlich die Zeilenstufenform 1 −1 0 0 0 0 . 0 1 −2 0 0 0 0 1 − 23 0 Wir sehen, dass wir den Ergebnisvektor 0 gar nicht hätten mitschleppen müssen, da er sich bei den 0 elementaren Umformungen nicht verändert. Wir können jetzt x4 6= 0 frei wählen. Mit x4 = 1 erhalten wir x3 = 32 , x2 = 43 , x1 = 34 . Das ist nicht ganz, was wir wollten. Schließlich geht es um ganze Moleküle, die ineinander umgewandelt 4 werden. Aber mit dem erhaltenen Lösungsvektor 3 4 3 2 3 ist auch jedes skalare Vielfache eine Lösung. 1 Die Theorie liefert, dass ein LGS mit ausschließlich rationalen Koeffizienten auch einen Lösungsvektor mit ausschließlich rationalen Koordinaten besitzt und ein solcher auch bei dem verwendeten modifizierten Gauß-Verfahren herauskommt. Multipliziert man mit dem Hauptnenner der auftretenden Brüche, so erhält man einen ganzzahligen Lösungsvektor. Gegebenenfalls muss man noch mit −1 multiplizieren und durch einen gemeinsamen Teiler der Koordinaten dividieren. Beim hier betrachteten Beispiel genügt es, den Lösungsvektor mit dem Hauptnenner 3 zu multiplizieren. Man erhält daraus als Reaktionsgleichung 4 K2 Cr2 O7 → 4 K2 CrO4 + 2 Cr2 O3 + 3 O2 . (10.18) 166 Matrizen und lineare Abbildungen Kapitel 11 Eigenwerte und Determinanten Ein Eigenvektor einer quadratischen Matrix A ist ein Vektor x, sodass Ax ein Vielfaches von x ist, also in die selbe Richtung zeigt, aber (möglicherweise) eine andere Länge hat. Der Faktor, um den Ax und x sich unterscheiden, heißt Eigenwert von A. Eigenwerte und Eigenvektoren sind extrem wichtige Begriffe der linearen Algebra. Wir wollen sie in Zusammenhang mit Determinanten bringen, das sind Volumenformen, die auch als Kriterium für die Invertierbarkeit einer Matrix dienen. Der Zusammenhang wird durch das so genannte charakteristische Polynom geliefert. Schließlich wollen wir als Hauptanwendung die Hauptachsentransformation durchführen. 11.1 Determinanten Eine n × n–Matrix A ist nach Satz 10.15 genau dann invertierbar, wenn die Spaltenvektoren linear unx1 y1 abhängig sind. Für 2 × 2–Matrizen A = ist dies der Fall, wenn x2 y2 x1 Bei 3 × 3–Matrizen A = x2 x3 det(A) := det(x, y) = hx⊥ , yi = 6 0. y 1 z1 y2 z2 ist dies genau dann der Fall, wenn y 3 z3 det(A) := det(x, y, z) = hx × y, zi = 6 0 ist. Wir wollen nun für größere n × n–Matrizen eine Determinante definieren, die uns den Test auf Invertierbarkeit erleichtert. Für A ∈ M (n, n) und k, l ∈ {1, . . . , n} definieren wir die Matrix Ak,l ∈ M (n − 1, n − 1), die durch Streichen der k–ten Zeile und l–ten Spalte aus A entsteht. a1,1 ··· a1,l−1 a1,l+1 ··· a1,n .. .. .. .. . . . . a · · · a a · · · a k−1,1 k−1,l−1 k−1,l+1 k−1,n k,l A = . a · · · a a · · · a k+1,1 k+1,l−1 k+1,l+1 k+1,n . .. .. .. .. . . . an,1 · · · an,l−1 an,l+1 · · · an,n 167 168 Eigenwerte und Determinanten Definition 11.1 (Determinante) Die Determinante einer n × n–Matrix A wird rekursiv definiert durch det(A) = a1,1 , n = 1, n X det(A) = (−1)k+l ak,l det(Ak,l ), für jedes k = 1, . . . , n, falls n > 1. (11.1) l=1 Der Wert hängt nicht von der Wahl von k ab. Gleichwertig ist det(A) = n X (−1)k+l ak,l det(Ak,l ), für jedes l = 1, . . . , n. (11.2) k=1 Der Wert hängt nicht von der Wahl von l ab. (11.1) und (11.2) heißen die Entwicklung von det(A) nach der k–ten Zeile beziehungsweise nach der l–ten Spalte. Praktisch wird man zur Berechnung einer Determinante so vorgehen, dass man sich eine Zeile oder Spalte sucht, in der möglichst viele Nullen stehen, damit die Arbeit gering wird. a11 a12 Beispiele 11.2 (i) det = a11 det(a22 ) − a12 det(a21 ) = a11 a22 − a21 a12 . Das ist die a21 a22 bekannte Determinante für 2 × 2–Matrizen. (ii) Um die Determinante einer 3 × 3–Matrix a11 A = a21 a31 zu berechnen gehen wir so vor: a22 a23 A1,1 = , a32 a33 A1,2 = a12 a22 a32 a13 a23 a33 a23 , a33 a21 a31 A1,3 = a21 a31 a22 . a32 Dann ist det(A) = a11 det(A1,1 ) − a12 det(A1,2 ) + a13 det(A1,3 ) = a11 [a22 a33 − a32 a23 ] − a12 [a21 a33 − a31 a23 ] + a13 [a21 a32 − a31 a22 ] = a11 a22 a33 + a12 a23 a31 + a13 a21 a32 − [a11 a23 a32 + a12 a21 a33 + a13 a22 a31 ]. Das ist die bekannte Gartenzaunregel für Determinanten von 3×3–Matrizen (vergleiche Lemma 9.36). (iii) 2 6 A= 2 3 0 2 0 0 7 0 1 5 6 3 . 8 9 11.2 169 Eigenwerte Entwicklung nach der zweiten Spalte: A2,2 2 = 2 3 7 1 5 6 8 9 und det(A2,2 ) = 18 + 168 + 60 − [80 + 126 + 18] = 22. Also ist det(A) = (−1)2+2 · 2 · 22 = 44. Satz 11.3 Seien A, B ∈ M (n, n). Dann ist det(AT ) = det(A) det(AB) = det(A) det(B) det(A) 6= 0 ⇐⇒ A ∈ GL(n) 1 , falls A ∈ GL(n). det(A−1 ) = det(A) Ist A orthogonal, so ist | det(A)| = 1. e bezüglich Korollar 11.4 Sei L : Rn → Rn linear mit Darstellungsmatrizen A bezüglich der Basis B und A e der Basis B. Dann gilt e = det(A). det(A) e so ist nach Satz 10.32 Beweis Setzen wir S := B −1 B, e = S −1 AS, A also (weil nach dem vorangehenden Satz det(S −1 ) = 1/ det(S)) e = det(S −1 ) det(A) det(S) = det(A). det(A) 2 Satz 11.5 Ist A eine obere (oder untere) Dreiecksmatrix (z.B. eine Diagonalmatrix), so ist det(A) = a11 a22 · · · ann . 11.2 Eigenwerte Beispiel 11.6 Hauptachsen der freien Rotation Ein Molekül bestehe aus n Atomen mit Massen m1 , . . . , mn an den Orten z 1 , . . . , z n ∈ R3 . Die Gesamtmasse sei mit M = m1 + . . . + mn bezeichnet. Um welche Achsen ist eine freie Rotation des Moleküls möglich? Eine Drehachse muss notwendig durch den Schwerpunkt S := n 1 X mi z i M l=1 170 Eigenwerte und Determinanten gehen. Wir setzen rl = z l − S für die Position relativ zum Schwerpunkt. Beschreibt nun die Richtung des Vektors w ∈ R3 die Drehachse (mit Rotation im Uhrzeigersinn) und die Länge |w| die Winkelgeschwindigkeit, so heißt die Größe n X L(w) := − ml rl × (rl × w) (11.3) l=1 der Drehimpuls der Rotation. Aus physikalischen Gründen, die hier nicht näher erläutert werden sollen, ist eine freie Rotation genau entlang derjenigen Achsen möglich, für die L(w) die selbe Richtung wie w hat, das heißt, wenn es ein λ ∈ R gibt mit L(w) = λw. Wie findet man diese Richtungen heraus? Das Kreuzprodukt mit r hat nach Beispiel 10.21(v) als lineare Abbildung bezüglich der Standardbasis die Darstellungsmatrix 0 −r3 r2 0 −r1 . Ar = r3 −r2 r1 0 Setzen wir r22 + r32 r r r B := −A · A = −r1 r2 −r1 r3 und J := n X −r1 r2 r12 + r32 −r2 r3 −r1 r3 −r2 r3 , r12 + r22 ml B rl , (11.4) l=1 so ist L(w) = Jw. Die symmetrische Matrix J heißt der Trägheitstensor des Moleküls. Wir müssen Lösungen w und λ finden von Jw = λw. Davon handelt dieser Abschnitt. Es wird sich zeigen, dass es im allgemeinen nur drei zueinander senkrechte Hauptrichtungen gibt, in denen eine freie Rotation möglich ist. Die Physik lehrt, dass nur in zwei dieser Richtungen die freie Rotation stabil ist, also tatsächlich beobachtbar ist. Im folgenden sei stets A ∈ M (n, n) eine quadratische Matrix. Definition 11.7 (Eigenwerte) Eine Zahl λ ∈ R heißt Eigenwert von A, falls es ein x ∈ Rn , x 6= 0, gibt mit Ax = λx. x heißt dann Eigenvektor von A zum Eigenwert λ. Die Menge Eλ = {x ∈ Rn : Ax = λx} der Eigenvektoren zum Eigenwert λ ist ein Untervektorraum von Rn und heißt Eigenraum zum Eigenwert λ. Speziell heißt E0 der Kern von A. Die Menge spec(A) = {λ ∈ R : λ ist Eigenwert von A} heißt das Spektrum von A. 11.2 171 Eigenwerte Beispiel 11.8 A = −1 5 . Dann ist 5 −1 1 4 1 A = =4 1 4 1 und −6 1 = −6 . 6 −1 1 1 1 Also ist Eigenvektor zum Eigenwert 4, E4 = α , α ∈ R und Eigenvektor zum Eigen1 1 −1 1 wert −6, E−6 = α , α ∈ R . Es ist spec(A) = {−6, 4}. −1 A 1 −1 = Dass A keine weiteren Eigenwerte besitzen kann, ist eine Konsequenz des folgenden Satzes. Satz 11.9 Sei A ∈ M (n, n) symmetrisch, sowie µ 6= λ Eigenwerte von A. Sind x ∈ Eµ und y ∈ Eλ , so ist x ⊥ y. Für nicht–symmetrische A ist dies im Allgemeinen falsch. Beweis Nach Bemerkung 10.26(iv) ist hx, Ayi = hAx, yi, also λhx, yi = hx, Ayi = hAx, yi = µhx, yi. 2 Wegen λ 6= µ ist hx, yi = 0. Wie bestimmt man nun die Eigenwerte praktisch? Definition 11.10 Das Polynom λ 7→ χA (λ) = det(A − λIn ) heißt das charakteristische Polynom von A. Es ist ein Polynom vom Grad n. Es ist Ax = λx genau dann, wenn (A − λIn )x = 0. Hierfür gibt es genau dann eine Lösung x 6= 0, wenn A − λIn nicht invertierbar ist (siehe Satz 11.3). Also haben wir den folgenden Satz. Satz 11.11 λ ist Eigenwert von A genau dann, wenn χA (λ) = 0. Um die Eigenwerte zu bestimmen, müssen wir also nur die Nullstellen des charakteristischen Polynoms ausrechnen. Um die Dimension der Eigenräume zu bestimmen, hilft der folgende Satz. Satz 11.12 Ist χA (λ) = (λ − λ1 )n1 · · · (λ − λk )nk die Zerlegung des charakteristischen Polynoms in Linearfaktoren (Fundamentalsatz der Algebra!), so ist für jedes i = 1, . . . , k λi ∈ R ⇐⇒ λi ∈ spec(A) und in diesem Fall gilt 1 ≤ dim(Eλi ) ≤ ni . 172 Eigenwerte und Determinanten Wir kommen jetzt zum Hauptsatz dieses Kapitels. Satz 11.13 (Hauptachsentransformation) Ist A ∈ M (n, n) symmetrisch, so gilt (i) Alle Eigenwerte λi sind reell. (ii) dim(Eλi ) = ni , i = 1, . . . , k. (iii) Es gibt eine Orthonormalbasis bλi ,j , i = 1, . . . , k, j = 1, . . . , ni aus Eigenvektoren zu den Eigenwerten λi . (iv) Ist B die Matrix mit Spaltenvektoren (bλi ,j , j = 1, . . . , ni ), i = 1, . . . , k, so ist B −1 AB = diag λ1 , . . . , λ1 , . . . , λk , . . . , λk . | {z } | {z } n1 -mal nk -mal Die Aussage des Satzes lässt sich kurz auch so ausdrücken: Ist A eine symmetrische Matrix und LA die lineare Abbildung LA : x 7→ Ax, so gibt es eine Orthonormalbasis B = (b1 , . . . , bn ), sodass die Darstellungsmatrix von LA bezüglich B eine Diagonalmatrix ist. 1 −1 Beispiel 11.14 A = . −1 1 1−λ −1 χA (λ) = det = (1 − λ)2 − (−1)2 = λ(λ − 2). −1 1−λ Also ist spec(A) = {0, 2}. λ1 = 0, n1 = 1. λ2 = 2, n2 = 1. Die Orthonormalbasis aus Eigenvektoren ist 1 1 1,1 b =√ , 2 1 Also 1 B=√ 2 Mit der Cramér’schen Regel bekommen wir b 2,1 1 =√ 2 1 . −1 1 1 . 1 −1 1 −1 −1 B −1 = √ . 1 2 −1 1 −1 −1 1 −1 1 1 B −1 AB = 1 −1 1 1 −1 2 −1 1 −1 −1 0 2 = 1 0 −2 2 −1 1 0 0 0 0 = = = diag(0, −2). 0 −2 2 0 −4 11.2 173 Eigenwerte Beispiel 11.15 − 21 − 52 5 A= − 2 − 12 −2 −2 −2 −2 . −1 Dann ist 1 −2 − λ 5 χA (λ) = det(A − λI3 ) = det −2 −2 = − − 52 − 21 − λ −2 −2 −2 −1 − λ 1 1 1 1 25 − λ − − λ (−1 − λ) − 10 − 10 − − − λ 4 + (−1 − λ) + 4 − − λ 2 2 2 4 2 = −λ3 − 2λ2 + 13λ − 10. Eine Nullstelle kann man raten: λ1 = 1 ist Nullstelle. Polynomdivision ergibt χA (λ) = −λ2 − 3λ + 10. λ−1 Quadratische Ergänzung liefert die Nullstellen λ2 = 2, λ3 = −5. Also ist spec(A) = {1, 2, −5}. Wir müssen noch die Eigenvektoren finden. Zunächst müssen wir für den Eigenwert λ1 = 1 eine Lösung von (A − I3 )x = 0 bestimmen. Es ist 3 − 2 − 52 −2 5 3 A − I3 = − 2 − 2 −2 . −2 −2 −2 Elementare Zeilenumformungen liefern die Zeilenstufenform 1 0 21 0 1 1 . 2 0 0 0 Also ist ein Eigenvektor zum Eigenwert λ1 = 1 gegeben durch −1 x1 = −1 . 2 Analog behandeln wir die beiden anderen Eigenwerte 5 −2 5 A − 2I3 = − 2 −2 − 52 − 52 −2 −2 −2 . −3 174 Eigenwerte und Determinanten Elementare Zeilenumformungen liefern 1 0 0 1 0 0 0 1 . 0 −1 Also ist x2 = 1 Eigenvektor zum Eigenwert λ2 = 2. 0 9 − 52 2 5 9 A + 5I3 = 2 − 2 −2 −2 −2 . −2 4 Elementare Zeilenumformungen liefern 1 0 0 0 −1 1 −1 . 0 0 1 Also ist x3 = 1 Eigenvektor zum Eigenwert λ3 = −5. Normieren liefert 1 √ √ 1√ − 6 6 − 12 2 13 3 1√ √ √ 1 1 B= 2 2 3 3 − 6 6 √ √ 1 0 13 3 3 6 ist eine Orthonormalbasis aus Eigenvektoren. B −1 √ 1√ − 6 6 − 61 6 1√ √ 1 = BT = 2 2 − 2 2 √ √ 1 1 3 3 3 3 √ 6 0 . √ 1 3 3 1 3 Also (nach Satz 11.13) 1 B −1 AB = . . . = 0 0 0 0 2 0 . 0 −5 Beispiel 11.16 Sei 8 2 2 − 9 9 9 5 4 2 A = − . 9 9 9 2 4 5 9 9 9 1 Dann ist A = I − nnT , wobei n = 31 2. Also ist A die Darstellungsmatrix der Projektion auf die −2 Hyperebene H = x ∈ R3 : hn, xi = 0 ⊂ R3 . 11.3 175 Der Quantenmechanische Harmonische Oszillator Damit ist An = 0 und Ax = 1 für alle x ∈ H. Also sind die Eigenräume E0 = Kern(A) = {µn, µ ∈ R} , E1 = H. 1 Wir können aus Eigenvektoren ergänzen durch Raten von b2 := nun b := n zu einer Orthonormalbasis 0 4 √ √ 1 1 und b3 := b1 × b2 = 1 2 −1. Wir erhalten also 2 2 6 1 1 √ 1 2 0 3 3 2 √ √ B = (b1 , b2 , b3 ) = 32 12 2 − 61 2 . √ √ 1 2 1 −3 2 2 6 2 und B −1 AB = diag(0, 1, 1). 11.3 Der Quantenmechanische Harmonische Oszillator Quantenmechanisch wird ein Teilchen (in einer Dimension) durch eine Funktion repräsentiert in dem Vektorraum der quadratintegrablen reellen Funktionen Z ∞ L2 (R) : ψ : ψ(x)2 dx < ∞ . (11.5) −∞ Dieser Raum erhält ein Skalarprodukt durch Z ∞ hφ, ψi := φ(x)ψ(x) dx (11.6) −∞ und entsprechend eine Norm (Länge von Vektoren) kψk := p hψ, ψi. Der Zustand eines Teilchens ist nun eine normierte Wellenfunktion ψ ∈ L2 (R) mit kψk = 1. Dabei wird ψ(x)2 interpretiert als die Wahrscheinlichkeit, das Teilchen im Ort x zu finden. Im Fall des harmonischen Oszillators wird jedem Zustand eine Energie E zugeordnet durch E = hψ, Hψi, wobei 1 d2 ψ(x) + x2 ψ(x). (11.7) 2 dx2 Die lineare Abbildung H : L2 (R) → L2 (R) heißt der Hamilton Operator des harmonischen Oszillators. H ist symmetrisch in dem Sinne, dass H(ψ) = − hφ, Hψi = hHφ, ψi, für alle φ, ψ. Die reinen Zustände des Teilchens sind nach der quantenmechanischen Theorie die Eigenvektoren von H. Der zugehörige Eigenwert ist dann gerade die Energie des Zustands. Wir suchen also nach Lösungen E und ψ der so genannten Schrödinger Gleichung Hψ = Eψ. (11.8) 176 Eigenwerte und Determinanten Ausformuliert heißt die zu lösende Gleichung also −ψ 00 (x) + (x2 − 2E)ψ(x) = 0. Wir machen den Ansatz 1 (11.9) 2 ψ(x) = P (x)e− 2 x , wobei P ein noch zu bestimmendes Polynom ist. Dann ist 1 2 ψ 00 (x) = [P 00 (x) − 2xP 0 (x) − P (x) + x2 P (x)]e− 2 x . Also folgt aus (11.9) P 00 (x) − 2xP 0 (x) + (2E − 1)P (x) = 0. (11.10) Die Lösungen dieser Differentialgleichung sind in der Theorie bekannt. Satz 11.17 Die Differentialgleichung h00n (x) − 2xh0n (x) + 2nhn (x) = 0 (11.11) ist nur für ganzzahlige n ∈ N0 lösbar. Die Lösungen sind die Hermite Polynome, die definiert sind durch h0 (x) = 1 h1 (x) = 2x h2 (x) = 8x2 − 2 h3 (x) = 8x3 − 12x .. . hn (x) = 2xhn−1 (x) − 2(n − 1)hn−2 (x). (11.12) Es kommen also nur die Energieniveaus En := n + 21 , n ∈ N0 in Frage. Die zugehörigen (auf 1 normierten) Zustände (Eigenvektoren) lauten demnach ψn (x) = p√ Es ist also spec(H) = 1 π 2n n! 1 2 hn (x)e− 2 x . (11.13) 1 n + , n = 0, 1, 2, . . . . 2 Tatsächlich sind nur Differenzen dieser Energieniveaus als Frequenzen des ausgesandten Lichts in einem Spektrometer beobachtbar. Daher erklärt sich die Bezeichnung Spektrum“ für die Eigenwerte von linearen ” Abbildungen. Kapitel 12 Lineare Differentialgleichungen mit konstanten Koeffizienten Wir untersuchen in diesem Kapitel, wie wir mit Hilfe des Matrizenkalküls lineare Systeme gekoppelter Differentialgleichungen erster Ordnung sowie lineare Differentialgleichungen höherer Ordnung systematisch lösen können. Dabei werden letztere auf den Fall der Systeme von Differentialgleichungen erster Ordnung zurückgeführt. 12.1 Systeme erster Ordnung Wir betrachten eine Folge von Reaktionen erster Ordnung A −→ B −→ C. Sei y1 (t) = y2 (t) = y3 (t) = Konzentration von Stoff A zur Zeit t, Konzentration von Stoff B zur Zeit t, Konzentration von Stoff C zur Zeit t. Die Reaktionskonstanten sind k1 > 0 und k2 > 0. Dann können wir die Differentialgleichungen aufstellen y10 (t) = y20 (t) = y30 (t) = Wir führen die kompakte Notation ein y1 (t) y(t) = y2 (t) , y3 (t) −k1 y1 (t) k1 y1 (t) − k2 y2 (t) k2 y2 (t) (12.1) −k1 0 0 A = k1 −k2 0 . 0 k2 0 Damit wird aus (12.1) y 0 = Ay. (12.2) Formal können wir die Lösung angeben: y(t) = etA y(0). Problem: Die Exponentialfunktion etA definieren. Wir gehen ganz formal vor und nehmen die Potenzreihe, die uns auch schon die reelle (und komplexe) Exponentialfunktion definiert hat zur Grundlage. 177 178 Lineare Differentialgleichungen mit konstanten Koeffizienten Definition 12.1 (Exponentialfunktion für Matrizen) Sei A ∈ M (n, n) und t ∈ R. Dann definieren wir als die Exponentialfunktion von tA die n × n–Matrix etA = exp(tA) = ∞ n n X t A . n! n=0 Dabei ist An = A · An−1 = A · · A} die n–te Matrixpotenz und A0 = In die Einheitsmatrix. | ·{z n–mal (i) e(t+s)A = etA esA Satz 12.2 (Eigenschaften der Exponentialfunktion) (ii) AetA = etA A. (iii) etA ∈ GL(n) und (etA )−1 = e−tA . (iv) Gilt AB = BA, so ist eA+B = eA eB , sowie AeB = eB A und BeA = eA B. (v) exp(S −1 AS) = S −1 exp(tA)S, falls S ∈ GL(n). (vi) Ableitung: d tA dt e = AetA (koordinatenweise). Z (vii) Ist A ∈ GL(n), so ist t erA dr = A−1 (etA − esA ) = (etA − esA )A−1 . s Beispiele 12.3 (i) A = 2 0 0 . Dann ist 3 0 A = 9 8 0 3 A = 0 27 .. . n 2 0 An = . 0 3n 2 4 0 Also ist tA e ∞ ∞ n n X X t A = = n! n=0 n=0 (2t)n n! 0 0 (3t)n n! ! = (ii) Allgemeiner als in (i) ist für A =diag(λ1 , . . . , λn ) etA = diag(etλ1 , . . . , etλn ). e2t 0 0 e3t ! . (12.3) 12.1 179 Systeme erster Ordnung (iii) Sei A = 0 −1 1 0 . Dann ist −1 0 A = 0 −1 0 1 3 A = −1 0 1 0 4 A = 0 1 2 A4n+k = Ak . Also ist die (1,1)– Koordinate von An n (−1)n/2 , 0, (A )1,1 = n gerade, n ungerade. Damit ist (etA )1,1 = ∞ X (−1)n n=0 t2n = cos(t). n! (12.4) Die anderen Einträge erhält man analog (Übung!) etA = cos(t) − sin(t) . sin(t) cos(t) Also ist etA die Drehmatrix in der Ebene. (iv) Seien µ, λ ∈ R und A = λ 0 µ . Dann ist λ 2 λ2 0 λ3 0 2λµ λ2 3λ2 µ λ3 λn 0 nλn−1 µ . λn A = 3 A = .. . An = Also ist tA e = eλt 0 µ t eλt . eλt (12.5) 180 Lineare Differentialgleichungen mit konstanten Koeffizienten λ (v) Sei λ ∈ R und A = 0 0 1 λ 0 0 1 . Dann ist λ 2 λ A2 = 0 0 3 λ A3 = 0 0 4 λ A4 = 0 0 .. . n λ An = 0 0 Also ist 0 2λ λ2 2λ λ2 0 3λ2 λ3 0 4λ3 λ4 0 3λ 3λ2 λ3 6λ2 4λ3 λ4 n 2 nλn−1 0 etA = 0 0 λn−2 nλn−1 . λn λn eλt 1 2 λt 2t e teλt teλt . eλt eλt (12.6) 0 e = 1 11 −2 . Statt hier die Potenzen von A e direkt auszurechnen, können wir uns zu (vi) Sei A 5 −2 14 e diagonalisieren (vergleiche BeiNutze machen, dass die Matrix symmetrisch ist. Wir können also A spiel 10.33): e = S −1 AS A wo die orthogonale Matrix S gegeben ist durch √ 5 2 1 S= und 5 −1 2 S −1 √ 5 2 −1 = 5 1 2 und die Diagonalmatrix A durch A= Also ist e tA e (vii) Seien A = λ 0 =S 1 e S= 5 −1 tA 2 0 0 . 3 2t 2 −1 e 1 2 0 0 e3t 2 −1 1 2 ! e2t + e3t −2e3t + 2e2t 1 = . 5 −2e3t + 2e2t e2t + 4e3t 0 0 0 und B = . Dann ist AB = 0 = BA. Also ist 0 0 µ λ λ 1 0 e 0 e 0 eA+B = = = eA · eB . 0 eµ 0 eµ 0 1 (12.7) 12.1 181 Systeme erster Ordnung Wir kommen nun wieder zu unseren Differentialgleichungen zurück. y1 (t) Definition 12.4 Sei A ∈ M (n, n) und b ∈ Rn sowie t 7→ y(t) = ... differenzierbar. Die Gleichung yn (t) y 0 (t) = Ay(t) + b (12.8) heißt System von n linearen Differentialgleichungen (DGL). Das System heißt homogen, falls b = 0. y heißt Lösung des Anfangswertproblems (AWP) (12.8), (12.9), falls (12.8) und y(t0 ) = y 0 (12.9) gilt. Satz 12.5 Das AWP (12.8), (12.9) besitzt die eindeutige Lösung Z t y(t) = e(t−t0 )A y 0 + e(t−s)A b ds. (12.10) t0 Ist speziell b = 0, so gilt y(t) = e(t−t0 )A y 0 . (12.11) Ist A invertierbar (und b 6= 0), so kann man das Integral ausrechnen und erhält y(t) = e(t−t0 )A y 0 + A−1 b − A−1 b. (12.12) 2 Beweis Ableiten nach t! Beispiel 12.6 Sei folgendes AWP gegeben y10 (t) = 2y1 (t) y20 (t) = +3y2 (t) + 1 2y2 (t) + 2 y1 (0) = −1 y2 (0) = 4. Das fassen wir zusammen als y 0 = Ay + b, wo 2 0 3 , 2 −1 1 2 − 34 0 1 2 A= b= y(0) = y 0 , 1 , 2 y0 = −1 . 4 Es ist dann (Cramér’sche Regel) A = ! −1 und A b= sowie (siehe (12.5)) exp(tA) = e2t 0 3te2t . e2t −1 1 182 Lineare Differentialgleichungen mit konstanten Koeffizienten Das setzen wir in (12.12) ein (mit t0 = 0) und erhalten tA y(t) = e −1 −1 −1 = + + 4 1 1 1 − 2e2t + 15te2t ! −1 + 5e2t . Beispiel 12.7 Wir lösen jetzt das Problem, das wir am Eingang zur diesem Abschnitt betrachtet hatten. Dabei ist b = 0 und −k1 0 0 A = k1 −k2 0 . 0 k2 0 Wir berechnen nacheinander die Matrixpotenzen und erhalten die allgemeine Formel k1n k1 ((−k )n − (−k )n ) An = k2 −k 1 2 1 k1 (−k2 )n −k2 (−k1 )n k2 −k1 0 0 k2n 0 . 1 −(−k2 )n Also ist etA = e−tk1 0 k1 e−tk1 −k2 e−tk2 k2 −k1 e−tk2 ke−tk2 −k2 e−tk1 k2 −k1 +1 1 − e−tk2 0 0 . 1 Wir erhalten also für die einzelnen Konzentrationen y1 (t) = e−(t−t0 ) y1 (t0 ) y2 (t) = k1 e−(t−t0 )k1 − k2 e−(t−t0 )k2 y1 (t0 ) + e−(t−t0 )k2 y2 (t0 ) k2 − k1 y3 (t) = 12.2 k1 e−(t−t0 )k2 − k2 e−(t−t0 )k1 + 1 y1 (t0 ) + 1 − e−(t−t0 )k2 y2 (t0 ) + y3 (t0 ). k2 − k1 Gleichungen höherer Ordnung Zur Erinnerung: Eine lineare DGL, die neben der ersten Ableitung y 0 von y auch noch höhere Ableitungen y 00 = y (2) , y 000 = y (3) , . . . , y (n) enthält y (n) = c0 + c1 y + c2 y (1) + . . . + cn y (n−1) , (12.13) wobei c0 , c1 , . . . , cn ∈ R fest sind, heißt lineare Differentialgleichung der Ordnung n mit konstanten Koeffizienten. Die DGL heißt homogen, falls c0 = 0. Die Lösung der DGL wird eindeutig durch die Angabe von y(t0 ) = y 1 , . . . , y (n−1) (t0 ) = y n . (12.14) 12.2 183 Gleichungen höherer Ordnung Zur Lösung des Anfangswertproblems (12.13), (12.14) schreiben wir (12.13) um. Wir definieren Y (t) ∈ Rn durch Y1 (t) := y(t) Y2 (t) := y 0 (t) .. . Yn (t) := y (n−1) (t). Dann (12.13) gleichwertig zu (1) y (t) Y2 (t) Y10 (t) .. .. .. . . . Y 0 (t) = . = = 0 Yn−1 Yn (t) (t) y (n−1) (t) c0 + c1 Y1 (t) + . . . + cn Yn (t) Yn0 (t) y (n) (t) (12.15) Also ist Y die Lösung einer linearen DGL erster Ordnung Y 0 (t) = AY (t) + b, wobei (alle freien Felder sind 0) 0 A= c1 1 0 c2 (12.16) 1 .. . 0 .. b = . . 0 c0 , 1 cn .. . 0 · · · cn−1 (12.17) Wir erhalten also die Lösung des AWP (12.13), (12.14) durch y(t) = Y1 (t), wo Y (t) = e(t−t0 )A Y (t0 ) + Z t e(t−s)A b ds. t0 Beispiel 12.8 Wir betrachten die DGL zweiter Ordnung y 00 (t) = 2 − y(t) mit Anfangswert y 0 (0) = 0, Es ist also c2 = 0, c1 = −1, c0 = 2 und damit 0 A= −1 y(0) = 1. 1 , 0 b= 0 . 2 Wir erhalten etA = cos(t) − sin(t) sin(t) cos(t) (12.18) 184 Lineare Differentialgleichungen mit konstanten Koeffizienten und Z t e(t−s)A b ds = 0 Z t esA b ds = Z t 0 0 Z t = 0 Damit ist cos(s) − sin(s) sin(s) 0 ds cos(s) 2 2 sin(s) 1 − cos(t) ds = 2 . 2 cos(s) sin(t) 1 − cos(t) 2 − cos(t) tA 1 Y (t) = e +2 = , 0 sin(t) sin(t) und y(t) = Y1 (t) = 2 − cos(t). Beispiel 12.9 Wir betrachten die Differentialgleichung dritter Ordnung y 000 = −1 + 3y + y 0 − 3y 00 (12.19) mit Anfangswert y(0) = 4, y 0 (0) = y 00 (0) = 0. (12.20) y Wir haben also Y = y 0 und y 00 Y 0 = AY + b, wobei 0 A = 0 3 1 0 0 1 , 1 −3 Y (0) = Y 0 , 0 b = 0 , −1 4 Y 0 = 0 . 0 (12.21) Das Charakteristische Polynom von A ist χA (λ) = det(A − λI) = −λ3 − 3 λ2 + λ + 3 Wir raten die Nullstelle λ1 = 1 und erhalten per Polynomdivision und quadratischer Ergänzung die anderen Nullstellen λ2 = −1 und λ3 = −3. Wir können jetzt nach Schema F vorgehen und zunächst die Matrix F = (f 1 , f 2 , f 3 ) der Eigenvektoren bestimmen: 3 − 21 − 41 4 1 1 1 1 1 F = 1 −1 −3 , F −1 = 38 2 8 . 1 1 9 1 − 81 0 8 Damit ist und 1 0 0 F −1 AF = D := 0 −1 0 0 0 −3 exp(tA) = F exp(tD)F −1 3 −t 1 −3t 3 t −8e +8e 4 e = 38 et + 38 e−3t − 34 e−t − 98 e−3t + 34 e−t + 38 et 1 2 et − 1 2 1 2 e−t + 1 2 et − 1 2 e−t 1 8 1 2 1 8 et e−t et + 1 8 e−3t − 1 4 e−t e−t 1 t 9 −3t 1 −t −4e 8 e + 8 e et − 3 8 e−3t + 1 4 12.2 185 Gleichungen höherer Ordnung Es ist A−1 und Also ist 1 −3 = 1 0 1 1 3 0 1 0 0 1 −3 −1 A b = 0 . 0 11 −t 11 −3t 11 t 1 + e + 4 e − 24 e 8 3 11 11 11 t −3t Y (t) = etA [Y 0 + A−1 b] − A−1 b = − e−t 8 e + 8 e 4 33 11 11 − e−3t + e−t + et 8 4 8 und damit y(t) = 1 11 t 11 −t 11 −3t + e + e − e 3 8 4 24 (12.22) Alternative Herleitung Der mühselige Teil an diesem Vorgehen war natürlich die Berechnung von etA . Wenn wir uns das sparen wollen, können wir folgende Überlegung anstellen: Da A die Eigenwerte 1, −1 und −3 hat, müssen die Einträge von etA Summen von Termen der Art et , e−t und e−3t sein. Dann muss aber auch y(t) die Form haben y(t) = a + b et + c e−t + d e−3t für gewisse Zahlen a, b, c, d ∈ R, die wir jetzt noch bestimmen müssen. Die Idee ist, dass in den Gleichungen alle konstanten Terme sowie alle Koeffizienten vor den Ausdrücke et , e−t und e−3t stets übereinstimmen müssen. Zunächst einmal taucht der konstante Term a in keiner der Ableitungen y 0 , y 00 und y 000 auf. Also liefert die DGL (12.19) 1 a= . 3 Jetzt berechnen wir noch die Ableitungen an der Stelle t = 0 b+c+d y(0) − a y 0 (0) = b − c − 3d . b + c + 9d y 00 (0) Der Anfangswert (12.20) liefert also die lineare Gleichung 1 11 1 1 1 b 4 3 3 1 −1 −3 c = 0 − 0 = 0 . 1 1 9 d 0 0 0 Die Lösung ist b= 11 , 8 c= 11 , 4 d=− 11 . 24 186 Lineare Differentialgleichungen mit konstanten Koeffizienten Also erhalten wir y(t) = 1 11 t 11 −t 11 −3t + e + e − e 3 8 4 24 (12.23) Aufgemerkt: Hat der Eigenwert λi die Vielfachheit ni > 1 (taucht er also als Linearfaktor (λ − λi )ni im charakteristischen Polynom auf), so kann exp(tA) neben eλi t auch noch Terme der Art teλi t , t2 eλi t , . . . , tni −1 eλi t haben, die beim Ansatz berücksichtigt werden müssen. Kapitel 13 Differentialrechnung von Funktionen mehrerer Veränderlicher Wir beginnen mit den grundlegenden Stetigkeits- und Differenzierbarkeitsbegriffen für Funktionen f (x1 , . . . , xn ), die von n Veränderlichen abhängen. Wir lernen den Satz über die Vertauschbarkeit der zweiten Ableitungen kennen (Satz von Schwarz). Danach führen wir die Taylorentwicklung bis zur zweiten Ordnung durch. Damit ist das Fundament für die Bestimmung von Extremalstellen gelegt. Als Anwendung bringen wir die Ausgleichsgerade der linearen Regression. 13.1 Partielle Ableitungen Wir beginnen mit dem Begriff des Grenzwertes von Folgen in Rn . Definition 13.1 Eine Folge von Vektoren (xN )N ∈N in Rn heißt konvergent gegen x ∈ Rn , falls (siehe Definition 9.17) lim |xN − x| = 0. Wir schreiben dann N →∞ x = lim xN . N →∞ Lemma 13.2 Es gilt x = lim xN N →∞ genau dann, wenn die einzelnen Koordinaten konvergieren: xi = lim xN i , i = 1, . . . , n. N →∞ Im gesamten restlichen Kapitel ist G ⊂ Rn ein Gebiet und f : G → R eine Abbildung mit n Veränderlichen. Definition 13.3 (Stetigkeit) f heißt stetig, im Punkt a ∈ G, falls f (a) = limN →∞ f (xN ) für jede Folge (xN ) in G mit a = lim xN . Wir schreiben dann auch N →∞ f (a) = lim f (x). x→a f heißt stetig, falls f in jedem Punkt a ∈ G stetig ist. 187 188 Differentialrechnung von Funktionen mehrerer Veränderlicher Beachte: Wegen Definition 3.21 und Satz 3.24 stimmt die hier gegebene Definition der Stetigkeit im Falle n = 1 mit der aus Definition 3.2 überein. Wir können die Funktion (x1 , . . . , xn ) 7→ f (x1 , . . . , xn ) als Funktion nur der i-ten Koordinate auffassen, wenn wir die anderen Koordinaten festhalten. Dann können wir für die freie Koordinate die Ableitung bestimmen. Definition 13.4 (Partielle Ableitung) Sei ei der i-te Einheitsvektor. Wir definieren f (x + hei ) − f (x) h→0 h f (x1 , . . . , xi−1 , xi + h, xi+1 , . . . , xn ) − f (x) = lim , h→0 h Di f (x) := lim falls der Grenzwert existiert. Di f heißt dann die i-te partielle Ableitung von f in x. Existieren alle partiellen Ableitungen, so heißt f partiell differenzierbar in x. Ist f in jedem x ∈ G partiell differenzierbar, so heißt f partiell differenzierbar. Ist die Abbildung x 7→ Di f (x) stetig für jedes i, so heißt f stetig partiell differenzierbar. Wir schreiben auch C 1 (G) für die Menge der stetig partiell differenzierbaren Funktionen. Andere gebräuchliche Schreibweisen sind Di f (x) = ∂f df (x) = (x) = fi (x). dxi ∂xi Beispiele 13.5 (i) G = R3 , f (x) = x1 x2 + 3x2 x23 . Dann ist D1 f (x) = x2 , D2 f (x) = x1 + 3x23 und D3 f (x) = 6x2 x3 . (ii) G = Rn , y ∈ Rn und f (x) := hy, xi. Dann ist Di f (x) = yi . (iii) G = Rn , und f (x) := hx, xi. Dann ist Di f (x) = 2xi . (iv) G = Rn \ {0}, und f (x) := |x| = p hx, xi. Dann ist (Kettenregel) 2xi xi Di f (x) = p = . |x 2 hx, xi i| (v) G = R2 \ {0} und f (x) = x2 |x|2 Dann ist x1 x2 2x1 x2 =− 2 2 2 (x1 + x2 ) |x|4 |x1 |2 − 2x22 x2 − x2 = 1 4 2 : 2 2 2 (x1 + x2 ) |x| D1 f (x) = − D1 f (x) = Oft ist es praktisch, die partiellen Ableitungen nicht nur einzeln zu betrachten, sondern in einem Vektor zusammenzufasssen. 13.1 189 Partielle Ableitungen Definition 13.6 (Gradient) Sei f ∈ C 1 (G). Wir definieren den Gradienten von f in x ∈ G als Vektor in Rn durch D1 f (x) .. grad(f )(x) := ∇f (x) := . . Dn f (x) (∇ spricht sich Nabla“.) ” Die geometrische Interpretation ist, dass ∇f in die Richtung des steilsten Anstiegs von f zeigt und die Länge |∇f | ebendiese steilste Steigung misst. Es gelten die folgenden Rechenregeln. Satz 13.7 Seien f, g : G → R und H : R → R stetig partiell differenzierbar. Dann gilt (i) Summenregel f + g ist stetig partiell differenzierbar mit Gradient ∇(f + g) = (∇f ) + (∇g). (13.1) (ii) Produktregel Das Produkt f g ist stetig partiell differenzierbar mit Gradient ∇(f g) = (∇f ) · g + f · ∇g. (13.2) (iii) Kettenregel H ◦ f ist stetig partiell differenzierbar mit Gradient ∇(H ◦ f )(x) = H 0 (f (x)) · ∇f (x). Beispiele 13.8 (13.3) (i) f (x) = hy, xi für ein festes y ∈ Rn . Dann ist ∇f (x) = y. (ii) f (x) = |x|2 , ∇f (x) = 2x. (iii) Ist A ∈ M (n, n) und f (x) = hx, Axi, so ist Di f (x) = n n k=1 `=1 X df (x) X = Ai,k xk + x` A`,i = ((A + AT )x)i , dxi also ∇hx, Axi = (A + AT )x. (13.4) (iv) Ist A ∈ M (n, n) und f (x) = |Ax|, so ist (nach (iii) mit AT A statt A) Di f (x) = Di = p hAx, Axi = Di hx, AT Axi 2|Ax| ((AT A + (AT A)T )x)i (AT Ax)i = , 2|Ax| |Ax| weil (AT A)T = AT (AT )T = AT A. Also ist ∇|Ax| = AT Ax . |Ax| (13.5) 190 Differentialrechnung von Funktionen mehrerer Veränderlicher 2 (v) f (x) = e−|x−a| für ein festes a ∈ Rn . Dann ist 2 ∇f (x) = −2(x − a)e−|x−a| . Definition 13.9 (Richtungsableitung) Sei f ∈ C 1 (G) und x ∈ G, sowie v ∈ Rd fest gewählt. Wir setzen g(t) = f (x + tv), t ∈ R. Dann heißt Dv f (x) := g 0 (0) = lim t→0 f (x + tv) − f (x) t die Richtungsableitung von f in Richtung v. Die Richtungsableitungen können wir ganz bequem mit Hilfe der partiellen Ableitungen ausrechnen. Lemma 13.10 Sei f ∈ C 1 (G). Dann ist Dv f (x) = h∇f (x), vi = n X Di f (x) · vi . i=1 Satz 13.11 (Linearisierung) Sei f ∈ C 1 (G). Dann gilt für alle x ∈ G und y ∈ Rn (mit y + x ∈ G) f (x + y) = f (x) + h(∇f )(x), yi + εx (y) · |y|, wobei der der Fehlerterm εx in 0 stetig ist lim εx (y) = 0. y→0 0.9 1 Beispiel 13.12 Sei n = 3 und f (x) = log(|x|). Wir wollen f 0.2 durch Linearisierung um x = 0 0.05 0 1 1 1 annähern, denn f 0 = 0 können wir leicht ausrechnen. Es ist ∇f (x) = |x|x 2 , also ∇f 0 = 0 0 0 0 und damit + * −0.1 0.9 1 1 f 0.2 ≈ f 0 + ∇f 0 , 0.2 = −0.1. 0.05 0 0 0.05 0.9 Der exakte Wert ist f 0.2 = log(0.92331) = −0.07979. Die Approximation war also nur mäßig gut. 0.05 13.2 Höhere partielle Ableitungen Die partiellen Ableitungen Di f sind selber wieder Funktionen G → R, und wir können versuchen, diese auch wieder abzuleiten. Definition 13.13 Die Ableitungen der partiellen Ableitungen Dji f (x) := Dj (Di f )(x) = Dj Di f (x), i, j = 1, . . . , n, 13.2 191 Höhere partielle Ableitungen heißen die zweiten partiellen Ableitungen von f . Sind diese stetige Funktionen G → R, so heißt f zweimal stetig partiell differenzierbar und wir schreiben f ∈ C 2 (G). Weitere Schreibweisen sind d2 f (x) ∂2 = f (x) = fji (x) = Dj (Di f )(x). dxj dxi ∂xj ∂xi Die n × n–Matrix (H f (x)ji )i,j=1,...,n = (Dji f (x))i,j=1,...,n heißt die Hesse–Matrix von f . Satz 13.14 (Schwarz) Ist f ∈ C 2 (G), so ist die Hesse–Matrix H f (x) symmetrisch: Dj Di f (x) = Di Dj f (x), Beispiele 13.15 für alle i, j = 1, . . . , n. (i) G = R2 , f (x) = x31 x2 + 3x2 ex1 . Dann ist D1 f (x) = 3x21 x2 + 3x2 ex1 , D21 f (x) = 3x21 + 3ex1 sowie D2 f (x) = x31 + 3ex1 , D12 f (x) = 3x21 + 3ex1 . 2 (ii) G = R3 und f (x) = sin(x1 ) cos(x2 ) + e−|x| . Dann ist −2x1 e−|x| 2 D2 f (x) = − sin(x1 ) sin(x2 ) −2x2 e−|x| 2 −2x3 e−|x| 2 D1 f (x) = cos(x1 ) cos(x2 ) D3 f (x) = 2 D11 f (x) = − sin(x1 ) cos(x2 ) + 2(2x21 − 1) e−|x| , 2 D21 f (x) = − cos(x1 ) sin(x2 ) + 4x1 x2 e−|x| , D31 f (x) = 4x1 x3 e−|x| , D12 f (x) = − cos(x1 ) sin(x2 ) + 4x1 x2 e−|x| , 2 2 2 D22 f (x) = − sin(x1 ) cos(x2 ) + 2(2x22 − 1) e−|x| , 2 D32 f (x) = 4x2 x3 e−|x| , D13 f (x) = 4x1 x3 e−|x| , D23 f (x) = 4x2 x3 e−|x| , D33 f (x) = 2(2x23 − 1) e−|x| . 2 2 2 Beispiel 13.16 Maxwell’sche Relationen der Thermostatik Wir betrachten die Energie E(S, V ) eines Gases als Funktion der Entropie S und des Volumens V . Wir definieren Temperatur T und Druck p durch ∂E(S, V ) ∂S ∂E(S, V ) p(S, V ) := −D2 E(S, V ) = − . ∂V T (S, V ) := D1 E(S, V ) = 192 Differentialrechnung von Funktionen mehrerer Veränderlicher Wollen wir nun wissen, wie sich die Temperatur bei kleinen Veränderungen des Volumens verhält, so berechnen wir mit dem Satz von Schwarz ∂T (S, V ) = D2 T (S, V ) = D2 D1 E(S, V ) ∂V = D1 D2 E(S, V ) = −D1 p(S, V ) =− (13.6) ∂p(S, V ) . ∂S (13.6) ist eine der vier Maxwell’schen Relationen der Thermostatik. Wir können für Funktionen mehrer Veränderlicher genauso eine Taylorentwicklung angeben, wie für Funktionen einer Veränderlicher. Allerdings werden die Ausdrücke sehr länglich. Deshalb beschränken wir uns hier auf die Taylorformel zweiter Ordnung. Damit kommt man in den allermeisten Anwendungen hin. Außerdem ist sie sehr nützlich, um die Extremalstellen der Funktion zu untersuchen. Satz 13.17 (Taylorformel 2. Ordnung) Sei f ∈ C 2 (G) und x ∈ G. Dann gilt für alle y ∈ Rn mit x+y ∈G 1 f (x + y) = f (x) + h∇f (x), yi + hy, H f (x) · yi + εx (y) · |y|2 2 (13.7) n 1 X 2 Di Dj f (x)yi yj + εx (y) · |y| , = f (x) + h∇f (x), yi + 2 i,j=1 wobei der Fehlerterm εx in 0 verschwindet lim εx (y) = 0. y→0 3 Beispiel 13.18 Wir wollen hier das Beispiel 13.12 fortsetzen, wo wirdieFunktion f : R → R, x 7→ 0.9 1 log(|x|) in z = 0.2 ausrechnen wollten, indem wir f um x = 0 linear entwickelt hatten. Der 0.05 0 Gradient von f war ∇f (x) = |x|x 2 . Die zweiten Ableitungen bekommen wir durch die Quotientenregel Di Dj f (x) = Di xj |x|2 1i=j − 2xi xj = . |x|2 |x|4 1 Für den hier betrachteten Punkt x = 0 ist also die Hesse-Matrix 0 1 −1 H f 0 = 0 0 0 0 1 0 0 0 . 1 13.3 193 Extremalstellen −0.1 Die Taylorformel zweiter Ordnung liefert nun (mit y = z − x = 0.2 ) 0.05 * *−0.1 −1 0.9 1 1 −0.1 + 1 0.2 , 0 f 0.2 ≈ f 0 + 0 , 0.2 + 2 0.05 0 0.05 0 0 0.05 = 0 − 0.1 + 0 1 0 0 −0.1 + 0 0.2 1 0.05 1 −(0.1)2 + (0.2)2 + (0.05)2 = −0.08375. 2 Den exakten Wert hatten wir oben schon ausgerechnet als −0.07979. Die Approximation zweiten Grades ist also deutlich besser als die lineare Approximation, die den Wert −0.1 ergeben hatte. 13.3 Extremalstellen Definition 13.19 (Extremalstellen) Ein Punkt x ∈ G heißt lokale Minimalstelle von f , wenn es ein ε > 0 gibt, sodass f (y) ≥ f (x) für alle y ∈ G mit |y − x| < ε. (13.8) Eine Minimalstelle heißt isoliert, wenn in (13.8) die strikte Ungleichung f (y) > f (x) für y 6= x gilt. Analog werden (isolierte) lokale Maximalstellen definiert und als Oberbegriff (isolierte) lokale Extremalstellen. Sei f ∈ C 1 (G) und x eine lokale Extremalstelle von f . Dann ist für jedes v ∈ Rn die Null eine lokale Extremalstelle von gv (t) := f (x + tv). Also ist 0 = gv0 (0) = Dv f (x) = h∇f (x), vi, v ∈ Rn . Mithin ist ∇f (x) = 0. Definition 13.20 Ist ∇f (x) = 0, so heißt x eine kritische Stelle von f . Sei f ∈ C 2 (G) und x eine kritische Stelle von f . Dann gilt nach der Taylorformel (Satz 13.17) gv00 (0) = n X Di Dj f (x)vi vj = hv, H f (x)vi. i,j=1 Daher gilt: Ist gv00 (0) > 0 für alle v 6= 0, so hat f in x ein isoliertes lokales Minimum. Ist gv00 (0) < 0 für alle v 6= 0, so hat f in x ein isoliertes lokales Maximum. 00 Gibt es v, w mit gv00 (0) > 0 und gw (0) < 0, so hat f in x einen Sattelpunkt. Welcher dieser drei Fälle eintritt, ist offenbar eine Eigenschaft der Hesse–Matrix H f (x). Wir treffen daher die folgende Definition. 194 Differentialrechnung von Funktionen mehrerer Veränderlicher Definition 13.21 (Definitheit von Matrizen) Eine symmetrische Matrix A ∈ M (n, n) heißt positiv definit, positiv semidefinit, falls hx, Axi > 0 für alle x ∈ Rn \ {0}, falls hx, Axi ≥ 0 für alle x ∈ Rn . A heißt negativ (semi–)definit, falls (−A) positiv (semi–)definit ist. Ansonsten heißt A indefinit. Wir fassen die obige Definition in dem Hauptsatz dieses Abschnitts zusammen. Satz 13.22 (Lokale Extremalstellen) Sei f ∈ C 2 (G) und ∇f (x) = 0. Ist die Hesse–Matrix H f (x) • positiv definit, so ist x eine isolierte lokale Minimalstelle. • negativ definit, so ist x eine isolierte lokale Maximalstelle. • indefinit, so ist x ein Sattelpunkt. Bemerkung 13.23 Ist H f (x) nur semidefinit (positiv oder negativ), so muss man auch noch höhere Ableitungen untersuchen, oder andere Methoden verwenden, um die Art der kritischen Stelle zu bestimmen. Bevor wir zu den Beispielen kommen, wollen wir uns noch damit beschäftigen, wie man praktisch die Definitheit einer Matrix bestimmt. Bemerkung 13.24 A ist positiv definit (bzw. semidefinit) genau dann, wenn spec(A) ⊂ (0, ∞) (bzw. spec(A) ⊂ [0, ∞)), falls also alle Eigenwerte strikt positiv (bzw. nicht-negativ) sind. (Man beachte: Symmetrische reelle Matrizen haben nach Satz 11.13 stets reelle Eigenwerte.) Beispiele 13.25 (i) A = 1 0 0 ist positiv definit. Eigenwerte 1 und 2. 2 0 ist positiv semidefinit. Eigenwerte 1 und 0. 0 −1 0 (iii) A = ist negativ definit. Eigenwerte −1 und −2. 0 −2 1 0 (iv) A = ist indefinit. Eigenwerte 1 und −2. 0 −2 (ii) A = 1 0 Wie sieht man es aber einer Nicht-Diagonalmatrix an, ob sie definit ist oder nicht. Darüber gibt der nächste Satz Auskunft: Lemma 13.26 (Hurwitz Kriterium) (a) Sei A = (ai,j ) ∈ M (n, n) symmetrisch und a11 · · · a1k .. , .. δk = det ... k = 1, . . . , n, . . ak1 · · · akk (13.9) 13.4 195 Anwendung: Lineare Regression die Determinante der Matrix, die aus A durch Streichen der letzten n − k Zeilen und Spalten hervorgeht. Dann gilt A ist positiv definit ⇐⇒ δk > 0 für alle k = 1, . . . , n. A ist negativ definit ⇐⇒ (−1)k δk > 0 für alle k = 1, . . . , n. (b) Speziell ist für (i) A = a b . b c A positiv definit A negativ definit A indefinit a b c (ii) A = b d e . c e f A positiv definit A negativ definit 13.4 ⇐⇒ a > 0 und ac − b2 > 0. ⇐⇒ a < 0 und ac − b2 > 0. ⇐⇒ a 6= 0 und ac − b2 < 0. ⇐⇒ a > 0, ad − b2 > 0 und det(A) > 0. ⇐⇒ a < 0 und ad − b2 > 0 und det(A) < 0. Anwendung: Lineare Regression Wir wollen hier als Anwendung der Bestimmung von Extremalstellen, die Regressionsgerade bestimmen, die als Ausgleichsgerade durch eine Reihe von fehlerbehafteten Messwerten geht. Wir nehmen an, dass wir n Messungen durchgeführt haben, wobei wir den Parameter x einstellen können (oder exakt messen) und die Messung der zweiten Größe y fehlerbehaftet ist. Also haben wir die Messwerte (x1 , y1 ), . . . , (xn , yn ). Wir vermuten einen (affin) linearen Zusammenhang zwischen den Messgrößen, das heißt sie sollten idealerweise auf einer Geraden y(x) = ax + b liegen. Das Ziel ist, die Werte a und b möglichst genau anzupassen. Als Maß für die Anpassung wählen wir die Summe der Fehlerquadrate n Q(a, b) := 1X (yi − (axi + b))2 . n i=1 (13.10) Wir versuchen also, ein Minimum von Q zu finden. Zunächst führen wir noch eine kompakte Notation ein: Wir schreiben für h = x, y, x2 , xy oder y 2 n hhi := 1X hi . n i=1 Man bemerke, dass hx2 i − hxi2 = h(x − hxi)2 i > 0 ist. Durch Ausmultiplizieren erhalten wir dann Q(a, b) = hy 2 i + a2 hx2 i + b2 − 2ahxyi − 2bhyi + 2abhxi. Ableiten ergibt D1 Q(a, b) = d Q(a, b) = 2ahx2 i − 2hxyi + 2bhxi da und D2 Q(a, b) = d Q(a, b) = 2b − 2hyi + 2ahxi. db 196 Differentialrechnung von Funktionen mehrerer Veränderlicher Damit Q minimal ist, muss D1 Q(a, b) = D2 Q(a, b) = 0 sein, also erhalten wir für a und b die linearen Gleichungen hx2 ia + hxib = hxyi hxia + b = hyi. Auflösen (z.B. mit der Cramér’schen Regel) ergibt a= hxyi − hxihyi , hx2 i − hxi2 b= hx2 ihyi − hxihxyi . hx2 i − hxi2 (13.11) Liegt hier wirklich ein Minimum vor? Wir berechnen die zweiten Ableitungen D11 Q(a, b) = 2hx2 i > 0. D21 Q(a, b) = 2hxi. D22 Q(a, b) = 2. Also ist det(H Q (a, b)) = D11 Q · D22 Q − (D12 Q)2 = 4hx2 i − 4hxi2 > 0. Nach dem Hurwitz-Kriterium ist also H Q (a, b) positiv definit, und damit liegt ein isoliertes lokales Minimum vor. 13.5 Vektorfelder In diesem Abschnitt wollen wir Funktionen f mit Werten in Rm betrachten, die ihrerseits wiederum von n Veränderlichen abhängen dürfen. Von besonderer Bedeutung ist der Fall m = n, in dem wir f ein Vektorfeld nennen, speziell in der Ebene n = m = 2 und im Raum m = n = 3. Wir definieren die Ableitung und geben als Rechenregel die Kettenregel an. Definition 13.27 Sei G ⊂ Rn ein Gebiet. Es seien die Funktionen fi : G → R, i = 1, . . . , m, stetig partiell differenzierbar und die Funktion f : Rn → Rm definiert durch f1 (x) f (x) = ... . fm (x) Dann heißt f stetig differenzierbar. Ist m = n, so heißt f ein n–dimensionales stetig differenzierbares Vektorfeld. Ist m = n = 3, so heißt f auch ein stetig differenzierbares Vektorfeld schlechthin. Die m × n–Matrix der partiellen Ableitungen heißt die Funktionalmatrix oder Jakobimatrix von f D1 f1 (x) · · · Dn f1 (x) .. .. T f 0 (x) = = (∇f1 (x), . . . , ∇fm (x)) . . . D1 fm (x) · · · Dn fm (x) Beispiele 13.28 (i) Sei G = Rn , A ∈ M (m, n) und y ∈ Rm fest. Dann ist f (x) = Ax + y stetig differenzierbar mit Ableitung f 0 (x) = A. Speziell ist für m = n und f (x) = x, f 0 (x) = In die Einheitsmatrix. 13.5 197 Vektorfelder (ii) Sei f : Rn → Rn , f (x) = x |x|2 . Di fi (x) = f ist ein stetig differenzierbares Vektorfeld. Es ist |x|2 − 2x2i 1 x2i = − 2 , |x|4 |x|2 |x|4 und Di fj (x) = −2 xi xj , |x|4 i = 1, . . . , n i 6= j. Also ist die Funktionalmatrix von f f 0 (x) = 1 1 In − 2 4 x · xT , |x|2 |x| wobei xT das Transponierte von x ist. Nach der Approximationsformel (Satz 13.11) gilt für kleine y ∈ Rn fi (x + y) ≈ fi (x) + h∇fi (x), yi. Also gilt für f die Approximationsformel (Taylorformel erster Ordnung) f (x + y) ≈ f (x) + f 0 (x)y. (13.12) Natürlich kann man auch Taylorformeln höherer Ordnung angeben, aber das wird leicht unübersichtlich, weshalb wir hier darüber hinweg gehen. x2 ex1 cos(2x1 ) . Dann ist die Ableitung 2(x2 )2 x x2 e 1 [cos(2x1 ) − 2 sin(2x1 )] ex1 cos(2x1 ) 0 f (x) = . 0 4x2 0 Wir entwickeln f um den Punkt x = 1 0 0 0 1 1 1 1 + y1 + y2 f +y ≈f + f0 ·y = + y= . 1 1 1 2 0 4 2 + 4y2 Beispiel 13.29 Sei f (x) = Satz 13.30 (Summe und Produkt) Seien G ⊂ Rn ein Gebiet, f, g : G → Rm sowie H : G → R stetig partiell differenzierbar. Dann gilt (i) Summenregel: (f + g)0 = f 0 + g 0 . (ii) Produktregel: (f · H)0 = f 0 H + f · (∇H)T . Beispiel 13.31 Sei A eine symmetrische n × n–Matrix und y ∈ Rn sowie g(x) = exp − hx, Axi + hx, yi . (13.13) Dann ist (siehe (13.4)) ∇hx, Axi = (AT + A)x = 2Ax, weil A symmetrisch ist. Also ist nach der Kettenregel (Satz 13.7(iii)) das Gradientenfeld von g f (x) := ∇g(x) = (−2Ax + y) exp − hx, Axi + hx, yi 198 Differentialrechnung von Funktionen mehrerer Veränderlicher stetig differenzierbar. Die Ableitung von f ist die Hesse Matrix von g H g (x) = f 0 (x) = −2A + (−2Ax + y) · (−2Ax + y)T exp − hx, Axi + hx, yi . Speziell ist an einer kritischen Stelle x0 ∈ Rm von g (also ∇g(x0 ) = 0 ⇐⇒ −2Ax + y = 0) H g (x0 ) = −2A exp − hx, Axi + hx, yi . H g (x0 ) ist also genau dann positiv definit (oder negativ oder indefinit), wenn −A dies ist. In diesem Fall hat g eine isolierte lokale Maximalstelle in 0 – wie erwartet. Wir betrachten auch den folgenden Spezialfall: g(x) = exp(−|Bx|2 ), wobei B eine beliebige m × n–Matrix ist. In der Tat ist dies ein Spezialfall von (13.13) mit y = 0 und A = B T B, denn hBx, Bxi = hx, B T Bxi. Man bemerke, dass B T B symmetrisch ist. Nun ist hBx, Bxi ≥ 0 für alle x, also ist B T B wenigstens positiv semidefinit. Es ist B T B positiv definit, wenn das lineare Gleichungssystem Bx = 0 nur die Lösung x = 0 hat, also wenn Rang(B) = n. Wir betrachten jetzt zwei stetig partiell differenzierbare Abbildungen f : F → Rm und g : G → Rk , wobei F ⊂ Rn , G ⊂ Rn sowie f (F ) ⊂ G. Satz 13.32 (Kettenregel) (i) Die Abbildung g ◦ f : F → Rk ist stetig partiell differenzierbar mit Funktionalmatrix (g ◦ f )0 (x) = g 0 (f (x)) · f 0 (x). (13.14) (ii) Falls n = k = 1 ist, so gilt speziell d g ◦ f (t) = h∇g(f (t)), f 0 (t)i. dt (13.15) Wenden wir in (ii) den Hauptsatz der Differential- und Integralrechnung auf die Funktion h(t) = g ◦ f (t) an, so erhalten wir folgende einfache Schlussfolgerung. Korollar 13.33 In der Situation von Satz 13.32(ii) gilt für a, b ∈ R und x = f (a), y = f (b) Z b g(y) − g(x) = h∇g(f (t)), f 0 (t)i dt. (13.16) a Sei f : G → Rn ein stetig partiell differenzierbares Vektorfeld. Es sei x0 ∈ Rn fest gewählt und y 0 = f (x0 ). Unter welchen Bedingungen können wir f wenigstens in einer Umgebung Uε (y 0 ) = {y ∈ Rn : |y − y 0 | < ε} umkehren? I = g 0 (y) = f 0 (f −1 (y)) · (f −1 )0 (y). Damit dies gut geht, muss f 0 (y 0 ) invertierbar sein. Der nächste Satz besagt, dass dies sogar ausreichend ist. Satz 13.34 Sei f : Rn → Rn ein stetig differenzierbares Vektorfeld und x0 ∈ Rn mit det(f 0 (x0 )) 6= 0. Wir setzen y 0 = f (x0 ). Dann existiert ein ε > 0 und eine inverse Abbildung f −1 : Uε (y 0 ) → Rn mit f (f −1 (y)) = y für alle y ∈ Uε (y 0 ). f −1 ist ein stetig differenzierbares Vektorfeld mit Ableitung (f −1 )0 (y) = (f 0 (f −1 (y)))−1 . 13.6 199 Rotation und Divergenz 13.6 Rotation und Divergenz Definition 13.35 Sei f : G → Rn ein stetig partiell differenzierbares Vektorfeld. Wir definieren die Divergenz von f als Summe der Diagonalelemente der Funktionalmatrix div f (x) := D1 f1 (x) + . . . + Dn fn (x). Im Fall n = 3 definieren wir die Rotation von f durch D2 f3 (x) − D3 f2 (x) rot f (x) = D3 f1 (x) − D1 f3 (x) . D1 f2 (x) − D2 f1 (x) Ist u : G → R zweimal stetig partiell differenzierbar, so definieren wir den Laplaceoperator ∆ als Summe der Diagonalelemente er Hesse–Matrix von u ∆u(x) = div grad u(x) = Manchmal schreibt man auch ∂ 2 u(x) ∂ 2 u(x) + . . . + . ∂x21 ∂x2n div f (x) = h∇, f i(x) rot f (x) = ∇ × f (x). (13.17) Dabei stellt man sich formal ∇ als Vektor vor ∂ ∂x1 ∂ ∇ = ∂x . 2 (13.18) ∂ ∂x3 Wir können die Divergenz als Quellstärke eines Feldes, die Rotation als Wirbelstärke interpretieren. Beispiele 13.36 Wir betrachten nur n = 3. (i) f (x) = x. Dann ist div f (x) = 3 und rot f (x) = 0. (ii) Sei r ∈ R3 fest und r2 x3 − r3 x2 f (x) = r × x = r3 x1 − r1 x3 . r1 x2 − r2 x1 Dann ist D1 f1 (x) = D2 f2 (x) = D3 f3 (x) = 0, also div f (x) = 0. Außerdem ist rot f (x) = 2r. Wir haben also ein reines Wirbelfeld vorliegen. (iii) Das elektrische Potential u genügt der Poisson Gleichung ∆u(x) = %(x). (13.19) 200 Differentialrechnung von Funktionen mehrerer Veränderlicher Dabei ist % die Ladungsverteilung. Zu u gehört ein (zeitlich konstantes) elektrisches Feld E durch E(x) = grad u(x). Es ist also % = div E (13.20) die Quellstärke des elektrischen Feldes. (13.20) wird auch als erste Maxwell’sche Gleichung der Elektrodynamik bezeichnet. (iv) Das (zeitlich konstante) magnetische Feld B ergibt aus der Stromstärke J : R3 → R3 durch (2. Maxwell’sche Gleichung) rot B(x) = J(x). (13.21) Satz 13.37 (i) Sei Sei G ⊂ R3 und u : G → R zweimal stetig partiell differenzierbar. Dann ist das Gradientenfeld rotationsfrei: rot grad u(x) = 0, x ∈ R3 . (13.22) (ii) Sei f : R3 → R3 zweimal stetig differenzierbar. Dann ist das Rotationsfeld quellenfrei: div rot f (x) = 0, Beispiele 13.38 x ∈ R3 . (13.23) (i) u(x) = |x|2 . Dann ist grad u(x) = 2x und rot grad u(x) = 0. (ii) r ∈ R3 fest und f (x) = r × x. Dann ist rot f (x) = 2r konstant also div rot f (x) = 0. (iii) Das elektrische Feld erfüllt die dritte Maxwell’sche Gleichung rot E(x) = rot grad u(x) = 0. (13.24) (iv) Das magnetische Feld B erhält man als Rotation eines so genannten Vektorpotentials A: B(x) = rot A(x). Also erfüllt B die vierte Maxwell’sche Gleichung div B(x) = div rot A(x) = 0. 13.7 (13.25) Implizite Funktionen In manchen Fällen ist die Abbildungsvorschrift x 7→ g(x) einer Funktion g nicht explizit bekannt, sondern man weiß nur, dass g eine Gleichung der Art H(x, g(x)) ≡ const. (13.26) löst, wobei H : G → R (mit gewissem G ⊂ R2 ) stetig partiell differenzierbar sein soll. Wir sagen dann, dass g durch (13.26) implizit gegeben ist. Im allgemeinen kann man nicht hoffen, aus (13.26) die Funktion g explizit ausrechnen zu können, aber wir können immerhin eine Bedingung angeben, wann ein solches g existiert, die Ableitung von g an einer Stelle ausrechnen und dadurch linear approximieren. Setzen wir F (x) = H(x, g(x)), so ist nach der Kettenregel 0 = F 0 (x) = D1 H(x, g(x)) + g 0 (x)D2 H(x, g(x)). 13.7 201 Implizite Funktionen Es muss also wenigstens D2 H(x0 , g(x0 )) 6= 0 sein, damit wir (13.26) in einer kleine Umgebung x ∈ (x0 − ε, x0 + ε) lösen können. Satz 13.39 (Implizite Funktionen) Sei G ⊂ R2 ein Gebiet und H : G → R stetig partiell differenzierbar sowie x0 , y0 ∈ R mit D2 H(x0 , y0 ) 6= 0. Dann gibt es ein ε > 0 und eine eindeutig festgelegte Funktion g : (x0 − ε, x0 + ε) → R mit g(x0 ) = y0 und für alle x ∈ (x0 − ε, x0 + ε). H(x, g(x)) = H(x0 , y0 ) g hat die Ableitung g 0 (x) = − D1 H(x, g(x)) D2 H(x, y) und kann für kleines |x − x0 | approximiert werden durch g(x) ≈ g(x0 ) − D1 H(x0 , y0 ) (x − x0 ). D2 (x0 , y0 ) (13.27) 2 2 Beispiele 13.40 (i) H(x, √ y) := x + y , x0 = 0, y0 = 1. Dann ist D2 H(x0 , y0 ) = 2y0 = 2 6= 0. Für ε = 1 und g(x) = 1 − x2 , x ∈ (−1, 1) ist H(x, g(x)) ≡ 1. Weiter ist g 0 (x) = − √ x D1 H(x, g(x)) x =− . =− 2 g(x) D2 H(x, g(x)) 1−x (ii) H wie oben, jedoch x0 = 1 und y0 = 0. Dann ist D2 H(x0 , y0 ) = 2y0 = 0 und wir können keine Funktion g finden, die in einer kleinen Umgebung (1 − ε, 1 + ε) die Gleichung H(x, g(x)) = 1 löst. (iii) H(x, y) = x2 y−sin(y), x0 = 1, y0 = π. Dann ist D1 H(x, y) = 2xy und D2 H(x, y) = x2 −cos(y). Also ist D2 H(x0 , y0 ) = 2. Damit existiert in einer Umgebung (1 − ε, 1 + ε) eine Funktion g mit H(x, g(x)) = H(x0 , y0 ) = π. Wir können für x nahe bei 1 approximieren g(x) ≈ y0 − D1 H(x0 , y0 ) 2π (x − x0 ) = π − (x − 1) = (2 − x)π. D2 H(x0 , y0 ) 2 Probe: für x = 0.95 ist die Approximation g(0.95) ≈ 3.2987. Der exakte Wert (den man z.B. per Intervallschachtelung erhält) ist g(0.95) = 3.302961754. Wir kommen nun noch zu einer Verallgemeinerung der vorhergehenden Situation. Sei G ⊂ Rn × Rm und H : G → Rm , (x, y) 7→ H(x, y) stetig partiell differenzierbar ist. Wir wollen wieder die Gleichung H(x, g(y)) = const. als implizite Definition der Funktion g : U → Rm (mit geeignetem Definitionsbereich U ⊂ Rn ) ansehen. Die ganze Sache funktioniert sehr ähnlich wie oben, wo m = n = 1 war. Statt der partiellen Ableitung kommen nun die Funktionalmatrizen Hx0 und Hy0 ins Spiel, die wir jetzt definieren. ∂H (x,y) ∂H1 (x,y) ∂H1 (x,y) 1 1 (x,y) · · · · · · ∂H∂x ∂y ∂y ∂x1 1 m n .. .. .. .. Hy0 (x, y) = Hx0 (x, y) = . . . . . ∂Hm (x,y) ∂Hm (x,y) ∂Hm (x,y) ∂Hm (x,y) · · · · · · ∂x1 ∂xn ∂y1 ∂ym 202 Differentialrechnung von Funktionen mehrerer Veränderlicher Satz 13.41 (Implizite Funktionen) Seien x0 ∈ Rn und y0 ∈ Rm so, dass (x0 , y0 ) ∈ G und det(Hy0 (x0 , y0 )) 6= 0 ist. Dann existiert ein ε > 0 und eine Umgebung U = Uε (x0 ) = {x ∈ Rn : |x − x0 | < ε} sowie eine eindeutig bestimmte stetig partiell differenzierbare Funktion g : U → Rm mit g(x0 ) = y0 und H(x, g(x)) = H(x0 , y0 ) für alle x ∈ U. g hat die Funktionalmatrix g 0 (x) = −(Hy0 (x, g(x)))−1 · Hx0 (x, g(x)). Kapitel 14 Mehrdimensionale Integration 14.1 Volumenintegrale in der Ebene a1 b Seien a = , b = 1 ∈ R2 mit a1 < b1 und a2 < b2 . Wir definieren den Quader Qba durch a2 b2 Q = Qba = {x ∈ R2 : ai ≤ xi ≤ bi , i = 1, 2} = [a1 , b1 ] × [a2 , b2 ]. (14.1) Für eine stetige Funktion f : Qba → R definieren das Integral von f in Q durch ! Z Z Z b1 f (x) dx = Q b2 dx1 dx2 f (x1 , x2 ) a1 Z a2 b2 Z dx2 = ! b1 (14.2) dx1 f (x1 , x2 ) . a2 a1 Wir lassen im folgenden meist die großen Klammern weg. Wenn wir nun auch noch uneigentliche Integrale zulassen wollen, weil entweder f nicht stetig ist, oder die Grenzen a1 , a2 , b1 oder b2 im Unendlichen liegen, so brauchen wir eine zusätzliche Bedingung, damit das Integral überhaupt existiert: Z b1 Z b2 dx1 dx2 |f (x1 , x2 )| < ∞. (14.3) a1 a2 Definition 14.1 Gilt (14.3) (mit eventuell unendlichen Integrationsgrenzen) so heißt f integrierbar in Q. Das Integral Z Z f (x) dx = f (x) dx1 dx2 Q Q wird durch (14.2) definiert, wobei die Integrationsreihenfolge egal ist. Bemerkung 14.2 (i) Die Tatsache, dass die Integrationsreihenfolge keine Rolle spielt, ist genau genommen ein Satz, nämlich der Satz von Fubini. R (ii) Ist f ≥ 0, so kann man das Integral Q f (x) dx als Volumen der Menge M := {(x1 , x2 , y) ∈ R3 : (x1 , x2 ) ∈ Q, 0 ≤ y ≤ f (x1 , x2 )} 203 204 Mehrdimensionale Integration interpretieren. In der ersten Zeile von (14.2) ist das innere Integral die zu x1 gehörige Fläche der Schnittmenge Mx1 := (x2 , y) ∈ R2 : (x1 , x2 , y) ∈ M Durch Integration dieser Flächen nach x1 erhält man daraus das Volumen von M . Vertauschen der Rollen von x1 und x2 ergibt dasselbe Volumen. Damit wird die Gleichheit der ersten mit der zweiten Zeile in (14.2) plausibel. Beispiele 14.3 (i) a1 = a2 = 0, b1 = 1, b2 = 2. f (x) = (x1 + x2 )2 + e−x1 . Dann ist Z 1 Z f (x) dx = Z 2 dx2 (x1 + x2 )2 e−x1 dx1 [0,1]×[0,2] 0 Z 0 1 1 = dx1 (x1 + 2)3 − x31 + 2e−x1 3 0 1 1 1 (x1 + 2)4 − x41 − 2e−x1 = 12 0 0 16 22 2 = + 2 − 2e−1 = − . 3 3 e (ii) a1 = 1, b2 = 2, a2 = π 2 , b2 = π. f (x) = x21 · cos(x2 ). Z 2 Z Z f (x) dx = [1,2]×[π/2,π] π dx2 x21 · cos(x2 ) dx1 1 π/2 2 Z π dx1 x21 − sin(x2 ) = π/2 1 Z =− 1 2 7 dx1 x21 = − . 3 (iii) Lässt sich f wie in (ii) als Produkt von zwei Funktionen schreiben f (x) = g(x1 ) · h(x2 ), dann ist ! ! Z Z Z b1 f (x) dx = Q b2 g(x1 ) dx1 · a1 h(x2 ) dx2 a2 (iv) a1 = 1, b1 = ∞, a2 = 0, b2 = ∞. f (x) = x2 e−x1 x2 . Dann ist Z Z ∞ Z x2 e−x1 x2 dx1 dx2 = dx1 [1,∞)×[0,∞) 1 ∞ dx2 x2 e−x1 x2 . 0 Das innere Integral bestimmen wir mit partieller Integration Z ∞ x2 =∞ Z ∞ 1 1 + e−x1 x2 dx2 . . dx2 x2 e−x1 x2 = − x2 e−x1 x2 x1 x1 x2 =0 0 0 | {z } | {z } =0 Also ist Z [1,∞)×[0,∞) x2 e−x1 x2 dx1 dx2 = =1/x21 Z 1 ∞ 1 1 ∞ dx = − = 1. 1 x21 x1 1 (14.4) 14.1 205 Volumenintegrale in der Ebene Das war recht kompliziert. Wir dürfen aber die Integrationsreihenfolge auch vertauschen und können so das selbe Integral viel einfacher berechnen: Z Z ∞ Z ∞ −x1 x2 x2 e dx1 dx2 = dx2 dx1 x2 e−x1 x2 [1,∞)×[0,∞) 0 Z = 1 ∞ dx2 e−x2 = 1. 0 2 (v) Sei Q = [0, ∞) × (−∞, ∞) und f (x) = (x1 − x2 )e−(x1 −x2 ) . Dann ist (mit der Substitution y = x1 − x2 ) Z ∞ Z ∞ Z ∞ Z ∞ 2 2 dx2 dx1 (x1 − x2 )e−(x1 −x2 ) = dx2 dy y e−y −∞ 0 −∞ −x 2 Z ∞ 2 1 y=∞ = dx2 − e−y 2 y=−x2 −∞ √ Z ∞ 2 π 1 . = dx2 e−x2 = 2 −∞ 2 Vertauschen wir die Integrationsreihenfolge, so erhalten wir (wieder mit Substitution) Z ∞ Z ∞ Z ∞ Z ∞ 2 −(x1 −x2 )2 dx1 dx2 (x1 − x2 )e = dx1 dy(−ye−y ) = 0. 0 −∞ 0 −∞ {z } | =0 Steht das im Widerspruch zu dem Satz? Nein, denn die Funktion f ist in Q gar nicht integrierbar, wie die folgende Rechnung zeigt Z ∞ Z ∞ Z ∞ Z ∞ 2 dx2 dx1 |f (x)| = dx2 dy y e−y −∞ 0 −∞ −x Z ∞ Z ∞2 2 ≥ dx2 dy y e−y = ∞ | {z } −∞ 0 = 12 Wollen wir nun über allgemeinere Gebiete G ⊂ R2 integrieren als nur über Quader, so können wir zunächst ganz formal vorgehen. Wir definieren die Indikatorfunktion der Menge G durch 1, x∈G 1G (x) = (14.5) 0, x 6∈ G. Definition 14.4 Seien G, H ⊂ R2 Gebiete mit G ⊂ H. Die Funktion f : H → R heißt in G integrierbar falls f · 1G in R2 integrierbar ist. Wir setzen dann Z Z f (x) dx = f (x)1G (x) dx. R2 G Zum praktischen Ausrechnen taugt diese Definition natürlich in den meisten Fällen nicht. Oft kann man sich aber zusätzliche Eigenschaften des Gebietes G zu Nutze machen. Ist beispielsweise G = G1 ∪ G2 , wo G1 und G2 disjunkte Gebiete sind (G1 ∩ G2 = ∅), so ist Z Z Z f (x) dx = f (x) dx + f (x) dx. (14.6) G G1 G2 206 Mehrdimensionale Integration Das ist besonders dann nützlich, wenn wir die einzelnen Integrale schon kennen. Ein anderer Fall ist der, wo G von zwei Funktionen s(x1 ) ≤ t(x1 ) nach unten und oben begrenzt wird: G = x ∈ R2 : x1 ∈ [a, b], x2 ∈ [s(x1 ), t(x1 )] . Satz 14.5 Z Z b f (x) dx = Z t(x1 ) dx1 G a dx2 f (x). s(x1 ) Beispiele 14.6 (i) Sei G = {x ∈ R2 : x1 ∈ [0, 1] x2 ∈ [0, x1 ]} und f (x) = x1 e−x2 . Dann ist s(x1 ) = 0 und t(x1 ) = x1 . Wir erhalten 1 Z Z dx2 x1 e−x2 = Z 1 dx1 x1 (1 − e−x1 ) 0 0 0 G x1 Z dx1 f (x) dx = Z 1 1 − ye−y dy 2 0 2 1 2 1 = − 1− = − . 2 e e 2 = 0 3 1 4 (ii) Sei G das Parallelogramm mit den Ecken , , und . Wir zerlegen G in die Dreiecke 0 0 2 2 G1 , G3 und das Rechteck G2 : G1 = {x ∈ R2 : x1 ∈ [0, 1], x2 ∈ [0, 2x1 ]} G2 = {x ∈ R2 : x1 ∈ [1, 3], x2 ∈ [0, 2]} G3 = {x ∈ R2 : x1 ∈ [3, 4], x2 ∈ [2(x1 − 3), 2]} Dann ist (die doppelt auftretenden gemeinsamen Ränder liefern keinen Beitrag zum Integral!) Z Z Z Z f (x) dx = f (x) dx + f (x) dx + f (x) dx G G1 1 G2 Z = Z dx1 0 G3 2x1 Z dx2 f (x) + 0 3 Z dx1 1 2 Z dx2 f (x) + 0 4 Z 2 dx1 3 dx2 f (x). 2(x1 −3) Manchmal kann man ein Gebiet G in natürlicher Weise parametrisieren. D.h. es gibt ein Rechteck Q und eine ein-eindeutige stetig differenzierbare Abbildung φ : Q → G. Wir können nun f : G → R integrieren, indem wir f (φ(x)) über Q integrieren. Dabei ist zu beachten, dass das Volumenelement dφ(x) = | det φ0 (x)|dx = D1 φ1 (x)D2 φ2 (x) − D1 φ2 (x)D2 φ1 (x)dx ist, wobei φ0 (x) die Funktionalmatrix von φ(x) ist. Anschaulich ist es so, dass das infinitesimal kleine recht dx1 0 0 eckige Volumenelement dx1 dx2 auf ein Volumenelement in Parallelogrammgestalt mit Seiten φ (x) 0 dx2 gebracht wird. Die Größe dieses Parallelogramms ist nun genau der Betrag der Determinante von φ0 (x) mal dx1 dx2 . 14.1 207 Volumenintegrale in der Ebene Wir erhalten so die für das praktische Ausrechnen von Integralen wichtige Transformationsformel, die die Substitutionsregel für mehrdimensionale Integrale ist. Satz 14.7 (Transformationsformel) Z Z f (x) dx = f (φ(x))| det φ0 (x)| dx. G (14.7) Q Beispiel 14.8 Sei G das Parallelogramm von Beispiel 14.6(ii). G ist das Bild des Quadrats Q = [0, 1] × 3 1 [0, 1] unter der linearen Abbildung φ(x) = Ax, wo A = . Es ist φ0 (x) = A und det φ0 (x) = 0 2 3 1 det = 6. Also ist 0 2 Z Z 1 Z 1 3x1 + x2 f (x) dx = 6 dx1 dx2 f . 2x2 G 0 0 Beispiel 14.9 Sei G = BR die Kreisscheibe mit Radius R G = BR = x ∈ R2 : |x| ≤ R . Wir wählen Q = [0, R] × [0, 2π) und r r cos ϕ = . ϕ r sin ϕ r cos ϕ Das heißt r und ϕ sind Abstand und Winkel des Punktes x = . Die Abbildung φ ist eineindeutig r sin ϕ bis auf den Punkt 0, der aber unerheblich ist, weil es nur ein Punkt ist und die Fläche 0 hat. Es ist r cos(ϕ) −r sin(ϕ) r φ0 = = r. und det φ0 ϕ sin(ϕ) r cos(ϕ) ϕ φ Wir erhalten so die wichtige Integralformel für Polarkoordinaten Z Z f (x) dx = BR R Z r dr 0 Lassen wir nun noch R → ∞ gehen, so erhalten wir Z Z ∞ Z f (x) dx = r dr 0 dϕ f 0 R2 2π 2π dϕ f 0 r cos(ϕ) . r sin(ϕ) r cos(ϕ) , r sin(ϕ) (14.8) (14.9) vorausgesetzt, dass f ist in R2 integrierbar ist. Diese Formeln sind natürlich besonders dann nützlich, wenn f (x) nur von |x| abhängt, also f (x) = g(|x|) für eine Funktion g, weil dann das innere Integral nur noch als Faktor 2π auftaucht: Z Z R f (x) dx = 2π BR g(r) r dr. 0 (14.10) 208 Mehrdimensionale Integration 1 |x| (i) Wir wollen für f (x) = Z BR das Integral 1 dx = |x| R f (x) dx berechnen. Wegen f BR R Z 0 (ii) Sein nun f (x) = exp(−|x| ). Dann ist f −|x|2 e Z dx = R2 ∞ 2π Z 1 = 2π r dϕ e ∞ Z = 2π ist dann R Z −r 2 re 0 0 2 1 r dr = 2πR. 0 2 r cos(ϕ) = e−r , also r sin(ϕ) −r 2 r dr 0 dϕ 0 2 Z 2π Z r dr r cos(ϕ) = r sin(ϕ) 2 1 dr = 2π − e−r 2 ∞ = π. 0 2 Man bemerke, dass f (x) = e−x1 · e−x2 ist. Nach (14.4) ist daher Z π= 2 e−|x| dx = ∞ Z R2 2 dx1 e−x1 Z −∞ ∞ 2 dx2 e−x2 Z −∞ Wir haben so die wichtige Formel gewonnen Z ∞ 2 dy e−y = √ ∞ dy e−y = 2 2 . −∞ π. (14.11) −∞ (iii) Sei 0 < R < S und G = x ∈ R2 : R < |x| < S, x2 ≥ 0 x2 ein halber Kreisring und f (x) = |x| 3 . Das Gebiet hat keinen besonders einfachen Rand, aber es lässt sich einfach parametrisieren durch die Polarkoordinaten Q = [R, S] × [0, π) und r r cos(ϕ) 7→ . ϕ r sin(ϕ) φ : Q → G, Es ist dann sin(ϕ) r sin(ϕ) r f φ = . = ϕ r3 r2 Also ist Z G x2 dx = |x|3 Z S R sin(ϕ) r2 dϕ 0 Z S = R 14.2 π Z r dr 1 dr r ! Z π sin(ϕ) dϕ = 2 log 0 S R . Volumenintegrale in höheren Dimensionen Genau wie in der Ebene können wir auch Integrale in höheren Dimensionen berechnen. Das Procedere ist genau das gleiche, und wir geben daher hier nur kurz die analogen formalen Definitionen und Sätze an. 14.2 209 Volumenintegrale in höheren Dimensionen a1 b1 .. .. n Sei G ⊂ R und f : G → R eine Funktion und a = . , b = . mit ai < bi für i = 1, . . . , n, an bn b wobei wir die Werte ±∞ zulassen wollen. Es sei Qa der Quader Qba = x ∈ Rn : ai ≤ xi ≤ bi , i = 1, . . . , n . (14.12) Definition 14.10 Die Funktion f heißt integrierbar in Qba , falls Z b1 Z b2 Z bn dx1 dx2 · · · dxn |f (x1 , . . . , xn )| < ∞. a1 a2 In diesem Fall definieren wir das Integral von f über Qba durch Z Z b1 Z b2 Z bn dx1 dx2 · · · dxn f (x1 , . . . , xn ). f (x) dx = Qba (14.13) an a1 a2 (14.14) an Satz 14.11 (Fubini) Ist f in Qba integrierbar, so spielt die Reihenfolge, in der die Integral in (14.14) ausgerechnet werden, keine Rolle. Mit anderen Worten: Für jede Vertauschungen der ersten n Zahlen {i1 , . . . , in } = {1, . . . , n} ist Z Z bi1 f (x) dx = bi2 Z dxi2 · · · dxi1 Qba bin Z ai1 ai2 dxin f (x1 , . . . , xn ). ain Beispiel 14.12 n = 3, Q = R × [0, 1] × [1, ∞), 2 f (x) = e−x3 x1 (x1 x22 )2 (1 − x2 )3 . Z Z ∞ f (x) dx = 1 Z dx1 −∞ ∞ Q 0 Z = dx1 −∞ ∞ dx3 1 2 dx2 e−x3 x1 (x1 x22 )2 (1 − x2 )3 0 Z dx1 −∞ Z 1 Z 2 dx3 e−x3 x1 (x1 x22 )2 (1 − x2 )3 1 ∞ Z = ∞ Z dx2 ∞ 2 dx3 x21 e−x3 x1 Z 1 1 x42 (1 − x2 )3 dx2 . 0 Man kann ohne größere Probleme zeigen, dass das Beta-Integral den folgenden Wert hat Z 1 m! n! . um (1 − u)n du = (m + n + 1)! 0 Also ist hier (mit m = 4 und n = 3) Z 0 Weiter ist Z 1 ∞ 1 x42 (1 − x2 )3 dx2 = 4! 3! 1 = . 8! 280 2 2 x3 =∞ 2 dx3 x21 e−x3 x1 = −e−x3 x1 = e−x1 . x3 =1 (14.15) 210 Mehrdimensionale Integration Also ist (nach (14.11)) Z f (x) dx = Q 1 280 Z √ ∞ 2 dx1 e−x1 = −∞ π . 280 Ist nun G ⊂ Rn wieder ein allgemeineres Gebiet (also nicht notwendigerweise ein Quader), so benutzen wir wieder die Indikatorfunktion 1, x∈G 1G (x) = (14.16) 0, x 6∈ G. Definition 14.13 Sei jetzt auch noch H ⊂ Rn mit G ⊂ H. Die Funktion f : H → R heißt in G integrierbar falls f · 1G in Rn integrierbar ist. Wir setzen dann Z Z f (x) dx = f (x)1G (x) dx. Rn G Zum praktischen Ausrechnen ist es auch hier wieder nützlich, wenn das Gebiet durch Funktionen berandet ist. Wir wollen hier nicht den allgemeinsten Fall behandeln, sondern nur einen einfachen. Wir nehmen an, dass G von der Gestalt ist G = x ∈ Rn : ai ≤ xi ≤ bi , i = 1, . . . , n − 1; s(x1 , . . . , xn−1 ) ≤ xn ≤ t(x1 , . . . , xn−1 ) , (14.17) wobei s, t : Rn−1 → R ∪ {±∞} sind, s ≤ t. Das heißt, dass das Gebiet in den ersten n − 1 Koordinaten ein Quader ist, während die n–te Koordinate variable Höhe hat. Wir erhalten dann Z Z b1 Z G bn−1 dx1 · · · f (x) dx = a1 Z t(x1 ,...,xn−1 ) dxn−1 an−1 dxn f (x1 , . . . , xn ). (14.18) s(x1 ,...,xn−1 ) Auch für Gebiete G ⊂ Rn kann man oft eine Parametrisierung angeben. Sei Qba der Quader aus (14.12). Wir nehmen an, dass es eine (bis auf einzelne Punkte) ein-eindeutige und stetig partiell differenzierbare Abbildung gibt φ : Qba → G. Es sei dann wieder φ0 (x) die Funktionalmatrix der ersten Ableitungen. Wir erhalten als Substitutionsregel die Transformationsformel. Satz 14.14 (Transformationsformel) Z Z f (x) dx = f (φ(x))| det φ0 (x)| dx. G (14.19) Q Aus der Transformationsformel erhalten wir eine einfache Schlussfolgerung. Korollar 14.15 Ist f : Rn → R in Rn integrierbar und A ∈ GL(n) eine invertierbare n × n–Matrix, so ist (mit φ(x) = Ax, Q = Rn und G = Rn ) Z f (Ax) dx = Rn 1 | det(A)| Z f (x) dx. Rn (14.20) 14.2 211 Volumenintegrale in höheren Dimensionen Das wichtigste Beispiel für die Transformationsformel sind wieder die Polarkoordinaten. Wir betrachten hier nur den Fall n = 3. Sei R > 0 und BR der Ball BR = x ∈ R3 : |x| ≤ R . Für R = ∞ ist B∞ = R3 . Ferner sei Q = [0, R] × [0, π] × [0, 2π] = (r, ϑ, ϕ) : r ∈ [0, R], ϑ ∈ [0, π], ϕ ∈ [0, 2π] . Wir setzen r sin(ϑ) cos(ϕ) φ(r, ϑ, ϕ) = r sin(ϑ) sin(ϕ) . r cos(ϑ) (14.21) Das heißt: r ist der Abstand vom Ursprung, ϑ ist der Breitengrad (von Norden her zählend) und ϕ ist der Längengrad. Die Funktionalmatrix ist sin(ϑ) cos(ϕ) r cos(ϑ) cos(ϕ) −r sin(ϑ) sin(ϕ) φ0 (r, ϑ, ϕ) = sin(ϑ) sin(ϕ) r cos(ϑ) sin(ϕ) r sin(ϑ) cos(ϕ) . cos(ϑ) −r sin(ϑ) 0 Daraus ergibt sich die Funktionaldeterminante det(φ0 (r, ϑ, ϕ)) = r2 sin(ϑ). Wegen ϑ ∈ [0, π] ist stets sin(ϑ) ≥ 0. Wir erhalten also den folgenden Satz. Satz 14.16 (Integration in Polarkoordinaten) Z Z R r2 dr f (x) dx = BR π Z 2π Z sin(ϑ) dϑ 0 0 0 r sin(ϑ) cos(ϕ) dϕ f r sin(ϑ) sin(ϕ) . r cos(ϑ) (14.22) Ist speziell f rotationssymmetrisch, also f (x) = g(|x|) für eine Funktion g : [0, ∞) → R, so ist Z Z R f (x) dx = 4π BR Beispiele 14.17 g(r) r2 dr. (14.23) 0 (i) f (x) = 1. Das Kugelvolumen ist also Z Z 1dx = 4π BR R r2 dr = 0 4π 3 R . 3 (ii) Sei f (x) = |x|−1 e−|x| . Dann ist Z Z f (x) dx = 4π R3 0 ∞ 1 r2 e−r dr = 4π r Z 0 ∞ r e−r dr = 4π. 212 Mehrdimensionale Integration (iii) f (x) = e−|x| 2 Z 2 e−|x| dx = 4π R3 Z ∞ 2 r2 e−r dr = π 3/2 . {z } |0 √ = π /4 Das war natürlich auch zu erwarten gewesen, weil (nach (14.11)) Z Z ∞ Z ∞ Z ∞ 2 2 2 2 e−|x| dx = dx1 dx2 dx3 e−(x1 +x2 +x3 ) R3 −∞ ∞ −∞ Z −∞ 2 e−y dy = 3 = π 3/2 . −∞ (iv) f (x) = x22 x23 . Z R Z r dr f (x) dx = 0 BR π Z 2 = R 6 0 ! Z π 3 r dr 0 14.3 2 Z sin(ϑ) cos(ϑ) dϑ {z }| 0 | = dϕ r2 (sin(ϑ) sin(ϕ))2 · r2 cos(ϑ)2 sin(ϑ)dϑ 0 Z 2π Z 0 =4/15 2π 2 sin(ϕ) dϕ {z } =π 4π 7 R . 105 Kurvenintegrale Definition 14.18 Eine stetig differenzierbare Funktion γ : [a, b] → Rn mit γ 0 (t) 6= 0, t ∈ (a, b) heißt glatte Kurve. Die Kurve γ heißt stückweise glatt, falls sie aus endlich vielen glatten Stücken [a, a1 ], [a1 , a2 ], . . . , [am−1 , am ], [am , b] besteht. Eine Kurve γ heißt geschlossen, falls Anfangspunkt γ(a) und Endpunkt γ(b) übereinstimmen. Die Ableitung γ 0 (t) heißt der Geschwindigkeitsvektor der Kurve. Die Länge der Kurve γ ist das Integral Z b `(γ) = |γ 0 (t)| dt. (14.24) a Definition 14.19 Sind γ 1 : [a, b] → Rn und γ 2 : [b, c] → Rn Kurven mit γ 1 (b) = γ 2 (b), so definieren wir die zusammengesetzte Kurve γ := γ 1 + γ 2 : [a, c] → Rn γ(t) = γ 1 (t), γ 2 (t), t ∈ [a, b] t ∈ (b, c] (14.25) Es gilt `(γ) = `(γ 1 ) + `(γ 2 ). cos(t) Beispiele 14.20 (i) n = 2, a = 0, b = 2π, γ(t) = ist eine geschlossene glatte Kurve mit Gesin(t) R 2π R 2π − sin(t) schwindigkeitsvektor γ 0 (t) = = γ(t)⊥ und Länge `(γ) = 0 |γ 0 (t)| dt = 0 1 dt = cos(t) 2π. 14.3 213 Kurvenintegrale (ii) Seien x, y, z ∈ Rn und γ 1 (t) : [0, 1] → Rn , t 7→ x + t(y − x), 2 n t 7→ y + (t − 1)(z − y), 3 n t 7→ z + (t − 2)(x − z). γ (t) : [1, 2] → R , γ (t) : [2, 3] → R , Dann ist γ 1 die direkte Verbindung von x nach y, γ 2 die von y nach z und γ 3 die von z nach x. γ 1 , γ 2 , γ 3 sind glatt mit Geschwindigkeitsvektoren (γ 1 )0 (t) = y − x, (γ 2 )0 (t) = z − y, (γ 3 )0 (t) = x − z. Es ist `(γ 1 ) = |y − x|, `(γ 2 ) = |z − y| und `(γ 3 ) = |x − z|. Die zusammengesetzte Kurve γ 1 + γ 2 ist nur stückweise glatt. Die zusammengesetzte Kurve γ = γ 1 + γ 2 + γ 3 ist stückweise glatt und geschlossen. γ umläuft das Dreieck mit den Eckpunkten x, y, z. Die Länge von γ ist der Umfang des Dreiecks `(γ) = |y − x| + |z − y| + |x − z|. (iii) n = 3, R > 0. γ : [0, 2π] → R3 sei die Spiralkurve R cos(t) γ(t) = R sin(t) . t γ ist glatt mit Geschwindigkeitsvektor −R sin(t) γ 0 (t) = R cos(t) , 1 |γ 0 (t)| = p 1 + R2 und Länge `(γ) = 2π p 1 + R2 . (iv) Sei f : [a, b] → R eine stetig differenzierbare Funktion. Dann ist die Kurve t 2 γ : [a, b] → R , t 7→ , f (t) die den Graph von f abläuft, glatt. Es ist γ 0 (t) = Z `(γ) = 1 und γ hat die Länge f 0 (t) b p 1 + (f 0 (t))2 dt. (14.26) a Definition 14.21 Sei γ : [a, b] → Rn eine (stückweise) glatte Kurve und φ : [c, d] → [a, b] stetig differenzierbar mit φ0 (t) > 0 für alle t ∈ (c, d) sowie φ(c) = a und φ(d) = b. Dann ist γ̄ := γ ◦ φ : [c, d] → Rn , γ̄(t) = γ(φ(t)) ebenfalls eine (stückweise) glatte Kurve. Wir sagen, dass sich γ und γ̄ nur bis auf die Parametrisierung φ unterscheiden. Lemma 14.22 Sind γ und γ̄ gleich bis auf Parametrisierung, so haben sie die selbe Länge `(γ) = `(γ̄). 214 Mehrdimensionale Integration Beweis Sei γ̄ = γ ◦φ. Dann ist nach der Kettenregel γ̄ 0 (t) = φ0 (t)·γ 0 (φ(t)) und mit der Substitutionsregel Z d d Z 0 0 a c c b |γ(t)| dt = `(γ). φ (t) · |γ (φ(t))| dt = |γ̄ (t)| dt = `(γ̄) = Z 0 2 R cos(t) Beispiel 14.23 Sei γ : [0, 2π] → R3 , γ(t) = R sin(t) die Spiralkurve und γ̄ : [0, 1] → R3 , γ̄(t) = t 2 R cos(2πt ) R sin(2πt2 ) . Dann ist γ̄ = γ ◦ φ, wobei φ : [0, 1] → [0, 2π], φ(t) = 2πt2 . Es ist also γ̄ 0 (t) = 2πt2 −4πRt sin(2πt2 ) √ 4πRt cos(2πt2 ) und |γ̄ 0 (t)| = 4πt 1 + R2 . Also ist 4πt Z `(γ̄) = 1 Z p 2 |γ̄ (t)| dt = 4π 1 + R 1 0 t dt = 2π p 1 + R2 . 0 0 Das ist genau der Wert von `(γ), den wir in Beispiel 14.20(iii) ausgerechnet hatten. Definition 14.24 Sei G ⊂ Rn ein Gebiet und f : G → Rn ein stetiges Vektorfeld. Weiter sei γ : [a, b] → G eine stückweise glatte Kurve. Wir definieren das Kurvenintegral Z Z b Z f (x) dx := f dγ := γ f (γ(t)), γ 0 (t) dt. (14.27) a Satz 14.25 Sind γ und γ̄ gleich bis auf Parametrisierung, so ist Z Z f dγ = f dγ̄. ⊥ 2 Beispiele 14.26 (i) G = R und f (x) = x R cos(t) . Dann ist R sin(t) Z Z = −x2 . R > 0 und γ : [0, 2π] → R2 , γ(t) = x1 2π f dγ = γ(t)⊥ , γ 0 (t) dt 0 Z 2π = 0 = R2 Z 0 −R sin(t) −R sin(t) , dt R cos(t) R cos(t) 2π 1 dt = 2πR2 . 14.3 215 Kurvenintegrale (ii) Sei u : R3 → R stetig differenzierbar und E = grad u. Seien x, y ∈ R3 und γ : [0, 1] → R3 die direkte Verbindung von x nach y, also γ(t) = x + t(y − x). Dann ist nach der Substitutionsregel Z Z 1 E dγ = hE(γ(t)), γ 0 (t)i dt 0 1 Z hgrad u(γ(t)), γ 0 (t)i dt = 0 = u(y) − u(x). (iii) Sei u : R3 → R stetig differenzierbar und E = grad u. Seien x, y ∈ R3 und γ : [a, b] → R3 eine glatte Kurve mit Anfangspunkt x = γ(a) und Endpunkt y = γ(b). Dann ist nach der mehrdimensionalen Kettenregel (Satz 13.32(ii)) und dem Hauptsatz der Differential- und Integralrechnung (Satz 7.7) Z Z b Z b E dγ = hE(γ(t)), γ 0 (t)i dt = hgrad u(γ(t)), γ 0 (t)i dt a Z a b = 3 X Di u γ(t) γi0 (t) dt = Z a i=1 b u γ(t) dt a = u γ(b) − u γ(a) = u(y) − u(x). Der Sachverhalt von Beispiel (ii) gilt allgemeiner auch für krummlinige Kurven. Um das hin zu schreiben, führen wir ein paar Begriffe ein. Definition 14.27 Sei G ⊂ Rn ein Gebiet sowie f : G → Rn ein stetiges Vektorfeld. Eine stetig differenzierbare Funktion F : G → R heißt Stammfunktion oder Potential von f , falls f = grad F. Existiert eine solche Stammfunktion, so heißt das Vektorfeld f integrierbar. f heißt das Gradientenfeld von F. Satz 14.28 Sei f : G → Rn ein integrierbares Vektorfeld mit Stammfunktion F . Seien x, y ∈ G und γ eine stückweise glatte Kurve in G mit Anfangspunkt x und Endpunkt y. Dann gilt Z F (y) − F (x) = f dγ. (14.28) Speziell ist für jede geschlossene Kurve Z f dγ = 0 (14.29) Eine Umkehrung des Satzes gilt in zusammenhängenden Gebieten. Definition 14.29 Sei G ⊂ Rn ein Gebiet. (i) G heißt zusammenhängend, falls je zwei Punkte x, y durch eine Kurve miteinander verbunden werden können. 216 Mehrdimensionale Integration (ii) G heißt sternförmig, falls es einen Punkt x0 ∈ G gibt, sodass für jeden Punkt y ∈ G die Verbindungsgerade von x0 nach y ganz in G liegt. Ein sternförmiges Gebiet ist natürlich immer zusammenhängend. (i) Zusammenhängend und sternförmig sind: Kreis, Quader, Zylinder und G = Rn . (ii) Das Gebiet G = (0, 1) × (0, 1) ∪ (3, 4) × (0, 1) ist nicht zusammenhängend. Beispiele 14.30 (iii) Das Gebiet G = R2 \ {0} ist zusammenhängend, aber nicht sternförmig: Für kein x0 ∈ G liegt die Verbindungsgerade zu y = −x0 nicht ganz in G, weil sie durch 0 geht. (iv) Der Halbkreisring mit Radien 0 < L < R G = x ∈ R2 : L ≤ |x| ≤ R, x2 ≥ 0 ist zusammenhängend, aber nicht sternförmig. f1 Satz 14.31 Sei G ⊂ Rn ein zusammenhängendes Gebiet und f = ... : G → Rn ein stetiges Vektorfn feld. Die folgenden drei Aussagen sind gleichwertig. (i) f ist integrierbar. (ii) Für je zwei stückweise glatte Kurven γ und γ̄ in G mit den selben Anfangs- und Endpunkten ist Z Z f dγ = f dγ̄. (iii) Für jede stückweise glatte geschlossene Kurve γ in G ist Z f dγ = 0. Wir können dann eine Stammfunktion F angeben, indem wir einen beliebigen Punkt x0 ∈ G fest wählen, für den wir F (x0 ) = 0 setzen. Für y ∈ G und eine beliebige Kurve stückweise glatte Kurve in G von x0 nach y setzen wir Z F (y) := f dγ. (14.30) Ist speziell G = Rn , so können wir x0 = 0 wählen. Es ist dann (mit γ als achsenparallelem Streckenzug) Z x1 Z x2 Z xn F (x) = f1 (t, 0 . . . , 0) dt + f2 (x1 , t, 0, . . . , 0) dt + . . . + fn (x1 , . . . , xn−1 , t) dt. (14.31) 0 0 0 Wichtig ist an dieser Stelle festzuhalten, dass der Wert des Integrals in (14.30) nicht von der Wahl von γ abhängt. Das ist genau die Aussage (ii). R Beweis Gilt (i) und ist γ eine Kurve von x nach y, so istR f dγ = F (y) − F (x) unabhängig von der speziellen Wahl von γ. Ist γ geschlossen, so ist x = y, also f dγ = F (y) − F (y) = 0 14.3 217 Kurvenintegrale Gilt (ii), so wird durch (14.30) eine Stammfunktion definiert, also ist f integrierbar. Sind γ und γ̄ zwei Kurven von x nach y, so nennen wir γ̄ − die Kurve, die den Weg von γ̄ in umgekehrter Richtung durchläuft. Es ist dann γ + γ̄ − geschlossen (mit Anfangs- und Endpunkt x) und es gilt Z Z Z Z Z f d(γ + γ̄ − ) = f dγ + f dγ̄ − = f dγ − f dγ̄. Nach Voraussetzung ist der Ausdruck dann 0. Gelte nun (iii). Sind γ und γ̄ zwei Kurven von R x nach y, so bilden wirR wie obenR die geschlossene Kurve γ + γ̄ − und schließen aus der Voraussetzung f d(γ + γ̄ − ) = 0, dass f dγ = f dγ̄. 2 Beispiele 14.32 (i) Sei f (x) = x. Sei γ : [0, 1] → Rn eine beliebige stückweise glatte geschlossene Kurve in Rn . Dann ist Z Z 1 f dγ = hf (γ(t)), γ 0 (t)i dt 0 1 Z hγ(t), γ 0 (t)i dt Z 1 1 d 2 |γ(t)| dt = dt 0 2 1 1 = |γ(t)|2 = 0, 2 0 = 0 weil γ geschlossen ist. Ist nun γ : [0, 1] → Rn eine beliebige stückweise glatte Kurve von γ(0) = x nach γ(1) = y, so ist wie oben Z 1 1 1 |γ(1)|2 − |γ(0)|2 = |y|2 − |x|2 . f dγ = 2 2 2 Also ist (mit x0 = 0) 1 F (y) = |y|2 2 eine Stammfunktion von f . In der Tat ist grad F (x) = x = f (x). −x2 ⊥ (ii) n = 2 und f (x) = x = . Entlang der geschlossenen Kurve x1 cos(t) γ : [0, 2π] → R2 , t 7→ sin(t) ist nach Beispiel 14.26(i) Z f dγ = 2π. Also ist f nicht integrierbar. Die Bedingungen des Satzes sind in vielen Fällen schwierig nachzuprüfen, weil man alle geschlossenen Kurven überprüfen muss. Einfacher wäre es, wenn man die Integrierbarkeit aus lokalen Eigenschaften des Vektorfeldes ableiten könnte. f1 .. Sei im folgenden f = . ein stetig differenzierbares Vektorfeld im Gebiet G ⊂ Rn . Ist f integrierbar fn f = grad F , dann gilt nach dem Satz von Schwarz (Satz 13.14), dass die zweiten partiellen Ableitungen 218 Mehrdimensionale Integration von F vertauschbar sind Di Dj F = Dj Di F, i, j = 1, . . . , n. Also gilt dfj (x) dfi (x) = , dxj dxi i, j = 1, . . . , n. (14.32) Für n = 3 ist dies gleichwertig mit rot f = 0. Ein integrierbares Vektorfeld in R3 ist also stets wirbelfrei. Die Umkehrung gilt nur unter zusätzlichen Annahmen an die Geometrie von G. Satz 14.33 Sei G ⊂ Rn sternförmig und f : G → Rn ein stetig differenzierbares Vektorfeld. Dann ist f genau dann integrierbar, wenn (14.32) gilt. Im Fall n = 3 ist das gleichwertig zu rot f = 0. Beispiele 14.34 (i) Sei G = Rn und f (x) = x. Dann ist dfi (x) 1, = 0, dxj i=j i 6= j. Also gilt (14.32) und f ist integrierbar. 0 −x2 (ii) n = 3, r := 0 und f (x) = r × x = x1 . Dann ist rot f = 2r (siehe Beispiel 13.36(ii)), also 1 0 R f nicht integrierbar. In der Tat können wir eine geschlossene Kurve γ angeben, sodass f dγ 6= 0. Sei cos(t) γ : [0, 2π] → R3 , t 7→ sin(t) . 0 Dann ist Z Z + * − sin(t) − sin(t) cos(t) , cos(t) dt = 2π. 0 0 2π f dγ = 0 2 (iii) n = 2, G = R , f (x) = sin(x2 )ex1 . Es ist cos(x2 )ex1 D2 f1 (x) = cos(x2 )ex1 = D1 f2 (x). Also ist f integrierbar. Wir setzen Z x2 t x1 dt + f2 dt 0 t 0 0 Z x1 Z x2 = sin(0)et dt + cos(t)ex1 dt Z F (x) = x1 f1 0 = sin(x2 )ex1 . 0 14.4 219 Oberflächenintegrale (iv) n = 2, G = R2 \ {0}, f (x) = x⊥ = |x|2 −x2 x1 . |x|2 f ist beispielsweise das Magnetfeld eines linienförmigen Leiters in x3 –Richtung (Gesetz von Biot– Savart). Dann ist x22 − x21 −|x|2 + 2x22 = D1 f2 = |x|4 |x|4 D2 f1 = |x|2 − 2x21 x22 − x21 = . |x|4 |x|4 Jedoch gilt beispielsweise für die geschlossene Kurve γ : [0, 2π] → R2 , t 7→ Z Z 2π f dγ = 0 cos(t) , dass sin(t) − sin(t) − sin(t) , dt = 2π. cos(t) cos(t) Mithin ist f nicht integrierbar. Ist das ein Widerspruch zu Satz 14.33? Nein, denn das Gebiet G ist nicht sternförmig. 14.4 Oberflächenintegrale Wir wollen hier den Fluss von Vektorfeldern durch Oberflächen von einfachen Körpern K ⊂ R3 berechnen. Grob gesprochen handelt es sich dabei um die Anzahl“ der Kraftlinien, die aus K austreten. ” Im folgenden sei K ⊂ R3 stets ein endlich großer, geometrisch einfacher Körper, zum Beispiel ein Quader Qba := [a1 , b1 ] × [a2 , b2 ] × [a3 , b3 ], (14.33) eine Kugel um x0 ∈ R3 mit Radius R > 0 BR,x0 = x ∈ R3 : |x − x0 | ≤ R , oder ein Zylinder mit Höhe H und Radius R ZH,R = x ∈ R3 : x21 + x22 ≤ R2 , x3 ∈ [0, H] . (14.34) (14.35) Wir wollen hier nicht die größtmögliche Allgemeinheit anstreben, sondern die ohnehin schwierigen Ideen in einfachen Situationen kennen lernen. Mit ∂K bezeichnen wir den Rand von K, also die Oberfläche, die K von R3 \ K trennt. Außer an den Kanten gehört zu jedem Punkt x ∈ ∂K ein Vektor n(x) ∈ R3 , |n(x)| = 1, der senkrecht auf ∂K steht und nach außen zeigt. Wir nennen n(x) den Normalenvektor von K in x. Wir betrachten im folgenden stets ein stetiges Vektorfeld f : G → R3 , wobei K ⊂ G ⊂ R3 . 14.4.1 Der Quader Wir betrachten zunächst einen Quader K = Qba := [a1 , b1 ] × [a2 , b2 ] × [a3 , b3 ]. 220 Mehrdimensionale Integration Dann besteht ∂K aus sechs Flächenstücken F1 , . . . , F6 −1 n(x) = 0 0 1 n(x) = 0 0 0 n(x) = −1 0 0 n(x) = 1 0 0 n(x) = 0 −1 0 n(x) = 0 . 1 F1 := {a1 } × [a2 , b2 ] × [a3 , b3 ], F2 := {b1 } × [a2 , b2 ] × [a3 , b3 ], F3 := [a1 , b1 ] × {a2 } × [a3 , b3 ], F4 := [a1 , b1 ] × {b2 } × [a3 , b3 ], F5 := [a1 , b1 ] × [a2 , b2 ] × {a3 }, F6 := [a1 , b1 ] × [a2 , b2 ] × {b3 }, Wir setzen (wobei wir f (x1 , x2 , x3 ) = f (x) schreiben) Z b2 Z hf (x), n(x)i dx = F1 b3 Z dx3 hf (a1 , x2 , x3 ), n(a1 , x2 , x3 )i . dx2 a2 (14.36) a3 −1 Wegen n(a1 , x2 , x3 ) = 0 ergibt sich 0 Z b2 Z hf (x), n(x)i dx = − F1 Z a2 Analog definieren wir die anderen Integrale Z Z R Fi F4 Z b3 dx3 hf (x1 , b2 , x3 ), n(x1 , b2 , x3 )i dx1 a1 Z b1 = a3 Z b3 dx1 a1 dx3 f1 (a1 , x2 , x3 ). a3 hf (x), n(x)i dx, beispielsweise b1 hf (x), n(x)i dx = b3 dx2 (14.37) dx3 f2 (x1 , b2 , x3 ). a3 Als Oberflächenintegral über die ganze Quaderoberfläche wollen wir die Summe der sechs einzelnen Integrale verstehen. 14.4 221 Oberflächenintegrale Definition 14.35 Für einen Quader K = Qba definieren wir das Oberflächenintegral Z hf (x), n(x)i dx = ∂Qba 6 Z X hf (x), n(x)i dx i=1 Fi Z b2 b3 Z dx3 [f1 (b1 , x2 , x3 ) − f1 (a1 , x2 , x3 )] dx2 = a2 Z b1 a3 Z b3 dx3 [f2 (x1 , b2 , x3 ) − f2 (x1 , a2 , x3 )] dx1 + a1 Z b1 + (14.38) a3 Z b2 dx2 [f3 (x1 , x2 , b3 ) − f3 (x1 , x2 , a3 )]. dx1 a1 a2 Beispiel 14.36 f (x) = x. Dann ist Z Z hf (x), n(x)i dx + hf (x), n(x)i dx F1 F2 b2 Z = b3 Z dx3 (b1 − a1 ) dx2 a2 a3 = (b1 − a1 )(b2 − a2 )(b3 − a3 ). Analog erhält man Z Z hf (x), n(x)i dx + F3 hf (x), n(x)i dx F4 Z Z hf (x), n(x)i dx hf (x), n(x)i dx = F5 F6 = (b1 − a1 )(b2 − a2 )(b3 − a3 ). Insgesamt also Z ∂Qba hx, n(x)i dx = 3 · vol(Qba ), (14.39) wobei vol(Qba ) = (b1 − a1 )(b2 − a2 )(b3 − a3 ) das Volumen von Qba ist. Um nun auch für andere Körper, beispielsweise Kugeln, ein Oberflächenintegral zu definieren, nähern wir ∂K durch N ebene Flächenstücke F1N , F2N , . . . , FNN an ∂K ≈ F1N ∪ . . . ∪ FNN . Wir nehmen an, dass die Flächeninhalte |FiN |, i = 1, . . . , N der Flächenstücke immer kleiner werden und definieren dann: Definition 14.37 (Oberflächenintegral) Z hf (x), n(x)i dx := lim ∂K N →∞ N Z X i=1 FiN hf (x), n(x)i dx. 222 Mehrdimensionale Integration Praktisch berechnen kann man solche Integrale in Fällen, wo man ∂K in einfache Teilstücke zerlegen kann, die man parametrisieren kann. Das haben wir beim Quader schon gemacht. 14.4.2 Der Zylinder Wir betrachten nun den Zylinder K = ZH,R = x ∈ R3 : x21 + x22 ≤ R2 , x3 ∈ [0, H] . Der Rand ∂ZH,R besteht aus dem Boden B, dem Deckel D und dem Mantel M B = x ∈ R3 : x21 + x22 ≤ R2 , x3 = 0 D = x ∈ R3 : x21 + x22 ≤ R2 , x3 = H M = x ∈ R3 : x21 + x22 = R2 , x3 ∈ [0, H] . (14.40) Es ist 0 n(x) = 0 für x ∈ B, −1 0 n(x) = 0 für x ∈ D, 1 x1 /R n(x) = x2 /R für x ∈ M. 0 Boden und Deckel parametrisieren wir durch die ebenen Polarkoordinaten φB : [0, R] × [0, 2π) → R3 , φD : [0, R] × [0, 2π) → R3 , r cos(ϕ) (r, ϕ) 7→ r sin(ϕ) 0 r cos(ϕ) (r, ϕ) 7→ r sin(ϕ) . H (14.41) R cos(ϕ) (h, ϕ) 7→ R sin(ϕ) . h (14.42) Den Mantel parametrisieren wir durch φM : [0, H] × [0, 2π) → R3 , 14.4 223 Oberflächenintegrale Es ist dann Z Z hf (x), n(x)i dx = R dϕ hf (φB (r, ϕ)), n(φB (r, ϕ))i r dr 0 0 B R Z =− Z 2π Z dϕf3 (r cos(ϕ), r sin(ϕ), 0) r dr 0 R Z hf (x), n(x)i dx = D 2π Z Z 0 2π dϕ hf (φD (r, ϕ)), n(φD (r, ϕ))i r dr 0 0 R Z = Z 2π r dr dϕ f3 (r cos(ϕ), r sin(ϕ), H) 0 Z 0 H Z hf (x), n(x)i dx = R M 2π Z dh dϕhf (φM (h, ϕ)), n(φM (h, ϕ))i 0 0 H Z =R dh 0 H Z cos(ϕ) + f R cos(ϕ), R sin(ϕ), h , sin(ϕ) 0 dϕ 0 =R 2π Z dϕ f1 R cos(ϕ), R sin(ϕ), h cos(ϕ) + f2 R cos(ϕ), R sin(ϕ), h sin(ϕ). dh 0 * 2π Z 0 (14.43) Wir fassen das Ergebnis in einem Satz zusammen. Satz 14.38 Das Oberflächenintegral über den Zylinder ist Z Z Z Z hf (x), n(x)i dx = hf (x), n(x)i dx + hf (x), n(x)i dx + hf (x), n(x)i dx ∂ZH,R D Z B R = Z dϕ f3 (r cos(ϕ), r sin(ϕ), H) − f3 (r cos(ϕ), r sin(ϕ), 0) r dr 0 M 2π 0 Z +R H Z dh 0 2π h dϕ f1 R cos(ϕ), R sin(ϕ), h cos(ϕ) 0 i + f2 R cos(ϕ), R sin(ϕ), h sin(ϕ) . (14.44) Beispiele 14.39 Also ist −x2 0 (i) r = 0 und f (x) = r × x = x1 . Dann ist 1 0 *−x 0+ 2 für x ∈ D hf (x), n(x)i = x1 , 0 = 0, 0 1 *−x 0 + 2 für x ∈ B hf (x), n(x)i = x1 , 0 = 0, 0 −1 *−x x /R+ 2 1 für x ∈ M hf (x), n(x)i = x1 , x2 /R = 0. 0 0 Z hr × x, n(x)i dx = 0. ∂ZH,R (14.45) 224 Mehrdimensionale Integration (ii) f (x) = x. Dann ist für x ∈ D für x ∈ B hf (x), n(x)i = x3 = H hf (x), n(x)i = −x3 = 0 1 hf (x), n(x)i = (x21 + x22 ) = R. R für x ∈ M Also ist Z hf (x), n(x)i dx = 0 B Z R Z hf (x), n(x)i dx = Z Z Z hf (x), n(x)i dx = R H Z 2π dh dϕ R = 2πR2 H. 0 0 M dϕ H = πR2 H, 0 0 D 2π r dr Insgesamt ist also Z hx, n(x)i dx = 3 · vol(ZH,R ), (14.46) ∂ZH,R wobei vol(ZH,R ) = πR2 H das Volumen des Zylinders ist. 14.4.3 Die Kugel Ein wichtiger Körper ist die Kugel um x0 mit Radius R K = BR,x0 = x ∈ R3 : |x − x0 | ≤ R . Wir parametrisieren ∂BR,x0 = x ∈ R3 : |x − x0 | = R mit den Kugelkoordinaten R sin(ϑ) cos(ϕ) (ϑ, ϕ) 7→ x + R sin(ϑ) sin(ϕ) . R cos(ϑ) 3 0 φ : [0, π] × [0, 2π) → R , (14.47) Das infinitesimale Volumenelement (Oberflächenelement) dφ(ϑ, ϕ) hat die Größe dφ(ϑ, ϕ) = R sin(ϑ) dϑdϕ. Der Normalenvektor ist n(x) = x − x0 . R Wir erhalten Satz 14.40 Das Oberflächenintegral über die Kugel ist Z Z π Z 2π hf (x), n(x)i dx = sin(ϑ) dϑ dϕhf (φ(ϑ, ϕ)), (φ(ϑ, ϕ) − x0 )i ∂BR,x0 0 = R2 0 * R sin(ϑ) cos(ϕ) sin(ϑ) cos(ϕ) + (14.48) π 2π sin(ϑ) dϑ dϕ f x0 + R sin(ϑ) sin(ϕ) , sin(ϑ) sin(ϕ) . 0 0 R cos(ϑ) cos(ϑ) Z Z 14.4 225 Oberflächenintegrale Beispiele 14.41 2 (i) f (x) = x, x0 = 0. Dann ist hx, n(x)i = RR = R, also Z 2π Z Z π dϕ R sin(ϑ) dϑ hx, n(x)i dx = R2 0 0 ∂BR,x0 = 2πR 3 Z π (14.49) 3 sin(ϑ) dϑ = 4πR = 3 · vol(BR,0 ), 0 wobei vol(BR,0 ) = 4 3 πR 3 das Kugelvolumen ist. (ii) Sei x0 = 0 und f (x) die elektrische Feldstärke einer Punktladung Q in 0. Dann ist |f (x)| = und f (x) hat die Richtung von x, also f (x) = konstante. Dann ist für x ∈ ∂BR,0 Q 4πε0 |x|3 x. Q 4πε0 |x|2 Dabei bezeichnet ε0 die elektrische Feld- Q . 4πε0 R2 Damit ist für jedes R > 0 der elektrische Fluss durch die Kugeloberfläche mit Radius R Z Z π Z 2π Q = Q. ε0 hf (x), n(x)i dx = ε0 R2 sin(ϑ) dϑ dϕ 2 4πε 0R ∂BR,x0 0 0 hf (x), n(x)i = 14.4.4 (14.50) Der Gauß’sche Integralsatz R Wir haben im letzten Beispiel gesehen, dass der elektrische Fluss ∂BR,x hf (x), n(x)i dx, der von einer 0 Punktladung im Ursprung ausgeht und durch die Kugeloberfläche tritt, nicht vom Radius der Kugel abhängt. Tatsächlich hängt er nicht einmal von der Gestalt des Körpers (also hier der Kugel) ab, wenn nur 0 im Inneren K \ ∂K liegt. Im folgenden Satz verzichten wir der Einfachheit halber auf die physikalischen Konstanten. Satz 14.42 (i) Für jeden (hinreichend glatt berandeten) Körper K ⊂ R3 mit 0 ∈ K \ ∂K gilt Z x , n(x) dx = 4π. |x|2 ∂K (ii) Für jeden Körper K mit 0 6∈ K ∪ ∂K gilt Z ∂K x , n(x) dx = 0. |x|2 Als Verallgemeinerung des vorangehenden Satzes kommen wir jetzt zum Hauptsatz über Oberflächenintegrale, dem Gauß’schen Integralsatz. Dieser stellt die Verallgemeinerung des Hauptsatzes der Differentialund Integralrechnung dar und setzt das Oberflächenintegral eines stetig differenzierbaren Vektorfeldes f mit dem Volumenintegral der Divergenz div f in Beziehung (siehe Definition 13.35). Satz 14.43 (Gauß’scher Integralsatz) Sei f : R3 → R3 ein stetig differenzierbares Vektorfeld und K ⊂ R3 ein hinreichend glatt berandeter Körper. Dann gilt Z Z hf (x), n(x)i dx = div f (x) dx. (14.51) ∂K K 226 Mehrdimensionale Integration Beispiele 14.44 (i) Für f (x) = x ist div f = 3. Also ist Z Z hx, n(x)i dx = 3 · vol(K) := 3 1 dx. ∂K K Dieses Ergebnis hatten wir in (14.39), (14.46) und (14.49) schon für die Spezialfälle Quader, Zylinder und Kugel von Hand nachgerechnet. (ii) Sei r ∈ R3 und f (x) = r × x. Dann ist (nach Beispiel 13.36(ii)) div f = 0 und Z hr × x, n(x)i dx = 0. ∂K Aus diese Formel hatten wir für den Zylinder schon in (14.45) ausgerechnet. (iii) Sei g : R → R stetig differenzierbar mit Ableitung g 0 und g(x1 ) f (x) = 0 0 sowie K = Qba = [a1 , b1 ] × [0, 1] × [0, 1]. Dann ist div f (x) = g 0 (x1 ) und Z Z 1 hf (x), n(x)i dx = ∂K 1 Z dx3 (f1 (b, x2 , x3 ) − f1 (a, x2 , x3 )) dx2 0 Z 0 1 = 1 Z dx3 (g(b) − g(a)) dx2 0 0 = g(b) − g(a) Z b = g 0 (x1 ) dx1 a Z = b Z dx1 a 1 Z dx2 0 1 0 Z dx3 g (x1 ) = 0 div f (x) dx. K Also ist der Gauß’sche Integralsatz tatsächlich eine Verallgemeinerung des Hauptsatzes der Differentialund Integralrechnung. Kapitel 15 Appendix: Alternativer Zugang zu Linearen Differentialgleichungen Wir untersuchen in diesem Kapitel, wie wir mit Hilfe des Matrizenkalküls lineare Systeme gekoppelter Differenzialgleichungen erster Ordnung sowie lineare Differenzialgleichungen höherer Ordnung systematisch lösen können. Dabei werden letztere auf den Fall der Systeme von Differenzialgleichungen erster Ordnung zurückgeführt. 15.1 Systeme erster Ordnung Wir betrachten eine Folge von Reaktionen erster Ordnung A −→ B −→ C. Sei y1 (t) = y2 (t) = y3 (t) = Konzentration von Stoff A zur Zeit t, Konzentration von Stoff B zur Zeit t, Konzentration von Stoff C zur Zeit t. Die Reaktionskonstanten seien k1 , k2 > 0. Dann können wir die Differenzialgleichungen aufstellen y10 (t) = y20 (t) = y30 (t) = Wir führen die kompakte Notation ein y1 (t) y(t) = y2 (t) , y3 (t) −k1 y1 (t) k1 y1 (t) − k2 y2 (t) k2 y2 (t) (15.1) −k1 0 0 A = k1 −k2 0 . 0 k2 0 Damit wird aus (15.1) y 0 = Ay. (15.2) Formal könnten wir die Lösung in direkter Verallgemeinerung der eindimensionalen Situation aus Abschnitt 8.2.6 sofort angeben: y(t) = etA y(0). Problem dabei: Die Exponentialfunktion etA wäre zu definieren. Das ist möglich, aber etwas aufwendig. Daher gehen wir etwas anders vor und verwenden einen geschickten Ansatz, der sich ebenfalls am eindimensionalen Fall orientiert. Zunächst beschreiben wir die allgemeine 227 228 Appendix: Alternativer Zugang zu Linearen Differentialgleichungen Situation, dabei ist es sinnvoll, etwas allgemeiner vorzugehen und auch komplexe Differenzialgleichungen zu betrachten. Mit K bezeichnen wir die Menge R bzw. C der reellen bzw. komplexen Zahlen und mit M (m, n; K) die Menge der m × n-Matrizen über K. b1 .. Definition 15.1 (1) Sei I ⊂ R ein Intervall, d ∈ N, A ∈ M (d, d; K), und sei b = . : I → Kd eine bd vektorwertige Funktion aus stetigen Abbildungen b1 , . . . , bd : I → K. Dann heißt das Gleichungssystem y10 (t) .. . = yd0 (t) = ad1 y1 (t) a11 y1 (t) .. . + · · · + a1d yd (t) .. .. . . + · · · + add yd (t) + b1 (t) .. . (15.3) + bd (t) oder in Kurzfassung als Matrixgleichung y 0 (t) = A · y(t) + b(t) (15.3*) (System) lineare(r) Differenzialgleichung(en) 1. Ordnung mit konstanten Koeffizienten. Die Ableitung in der Matrizenschreibweise ist also koordinatenweise zu interpretieren, darüberhinaus bei K = C jeweils für die Real- und die Imaginärteile getrennt. (2) Die DGL (15.3) heißt homogen, falls b ≡ 0 ist (d.h. b(t) = 0 für alle t ∈ I), andernfalls heißt sie inhomogen. (3) Die DGL (15.3*) zusammen mit der Anfangsbedingung y(t0 ) = y 0 (15.4) heißt Anfangswertproblem (AWP). (4) Sei C1 (I, Kd ) der K-Vektorraum der (koordinatenweise) stetig differenzierbaren Abbildungen von I in Kd . Unter einer Lösung der DGL bzw. des AWP versteht man jede differenzierbare Funktion ϕ ∈ C1 (I, Kd ) , die (15.3*) bzw. (15.3*) und (15.4) an Stelle von y erfüllt. Damit gilt: Satz 15.2 Die lineare DGL 1. Ordnung 15.3(∗) besitzt zu jeder Anfangsbedingung (t0 , y 0 ) ∈ I × Kd genau eine Lösung x ∈ C1 (I, Kd ) mit x(t0 ) = y 0 . Satz 15.3 Sei I ⊂ R ein Intervall und A ∈ M (d, d; K). Dann bildet die Menge L0 aller Lösungen y ∈ C1 (I, Kd ) der homogenen linearen DGL zur DGL (15.3), also von y0 = A · y , einen d-dimensionalen K-Vektorraum (bzgl. der koordinatenweisen Operationen). Für ϕ1 , . . . , ϕk ∈ L0 sind äquivalent: (15.5) 15.1 229 Systeme erster Ordnung 1. ϕ1 , . . . , ϕk sind über K linear unabhängig. 2. Es gibt ein t0 ∈ I , sodass gilt: ϕ1 (t0 ), . . . , ϕk (t0 ) ∈ Kd sind linear unabhängig. 3. Für alle t ∈ I gilt: ϕ1 (t), . . . , ϕk (t) ∈ Kd sind linear unabhängig. Beweis (a) Offenbar ist L0 ein K-Vektorraum, insbesondere 0 ∈ L0 . (3) ⇒ (2) ⇒ (1) : trivial. (1) ⇒ (3) : Seien t ∈ I , λ1 , . . . , λk ∈ K mit λ1 ϕ1 (t) + · · · + λk ϕk (t) = 0 . =⇒ ϕ := λ1 ϕ1 + · · · + λk ϕk ∈ L0 , ϕ(t) = 0 für dieses t . Nach 15.2 gibt es genau ein ϕ0 ∈ L0 mit ϕ0 (t) = 0 . Da die konstante Funktion 0 diese Eigenschaften hat, muss ϕ0 ≡ 0 sein. (1) =⇒ ϕ ≡ 0 =⇒ λ1 = · · · = λk = 0 . (b) Noch zu zeigen ist dim L0 = d : Seien e1 , . . . , ed die Einheitsvektoren des Kd sowie t0 ∈ I . ϕj (t0 ) = ej (j = 1, . . . , d) . (2)⇒(1) =⇒ 15.2 =⇒ Es gibt ein ϕj ∈ L0 mit ϕ1 , . . . , ϕd linear unabhängig =⇒ dim L0 ≥ d . Umgekehrt sind für ϕ ∈ L0 die Vektoren ϕ(t0 ), e1 = ϕ1 (t0 ), . . . , ed = ϕd (t0 ) ∈ Kd linear abhängig. (1)⇒(3) =⇒ ϕ, ϕ1 , . . . , ϕd sind linear abhängig. =⇒ 2 dim L0 = d . Definition 15.4 Jede Basis von L0 heißt ein Lösungsfundamentalsystem der homogenen linearen DGL in Satz 15.3. Wegen 15.3 ist damit nach 10.15 und 11.3 klar: Korollar 15.5 Genau dann bilden ϕ1 , . . . , ϕd ∈ L0 ein Lösungsfundamentalsystem, wenn für ein (oder für alle) t ∈ I die zugehörige Wronski-Determinante det ϕ1 (t), . . . , ϕd (t) 6= 0 ist. Beispiel 15.6 Betrachte für ω ∈ R \ {0} die homogene lineare Differentialgleichung x01 = −ωx2 0 −ω 0 ⇐⇒ x = x. x02 = ωx1 ω 0 Offenbar sind ϕ1 : t 7→ cos ωt sin ωt , ϕ2 : t 7→ − sin ωt cos ωt Lösungen auf R . Sie bilden ein Lösungsfundamentalsystem wegen dim L0 = 2 und, weil für die zugehörige Wronski-Determinante gilt: cos ωt − sin ωt det = cos2 ωt + sin2 ωt = 1 . sin ωt cos ωt 230 Appendix: Alternativer Zugang zu Linearen Differentialgleichungen Wie man aus einer Lösung der inhomogenen linearen Differentialgleichung (15.3) und einem Lösungsfundamentalsystem der zugehörigen homogenen linearen DGL (15.5) alle Lösungen von (15.3) erhält, erklärt der folgende Satz. Satz 15.7 Ist ψ0 eine Lösung der inhomogenen linearen Differentialgleichung 15.1(∗) bzw. 15.1(∗∗) und L0 der Lösungsvektorraum der zugehörigen homogenen linearen Differentialgleichung, so ist die Menge aller Lösungen der inhomogenen linearen Differentialgleichung gegeben durch L = {ψ0 + ϕ : ϕ ∈ L0 } . 2 Beweis: klar. Jetzt bleiben noch zwei Probleme zu klären: 1. Wie kann man ein Lösungsfundamentalsystem der homogenen linearen DGL erhalten? 2. Wie gelangt man überhaupt zu einer Lösung der inhomogenen linearen Differentialgleichung? 15.1.1 Lösung der homogenen linearen Differentialgleichung y0 = A · y Vorüberlegungen. Gegeben sei ein reelles Intervall I und die für A ∈ M (d, d; K) definierte homogene lineare Differentialgleichung mit konstanten Koeffizienten (s. (15.5)) y0 = A · y . (15.6) Im Falle d = 1 und K = R hat man den Spezialfall y0 = a · y (15.7) mit a ∈ R . Diese DGL hat nach Abschnitt 8.2.6 die Lösungsmenge L0 = {ϕc : I → R , t 7→ c · eat : c ∈ R} . In Anlehnung an dieses Ergebnis versuchen wir für (15.6) bei allgemeinem d für K = C den Lösungsansatz y : t 7→ eλt · c = eµt (cos νt + i sin νt) · c mit λ = µ + iν ∈ C , c ∈ Cd . (15.8) Frage: Wie müssen λ, c, A zusammenhängen, falls der Ansatz überhaupt etwas bringen sollte? Differenzieren von (15.8) liefert wie im Reellen y 0 (t) = µ eµt (cos νt + i sin νt) · c + eµt (−ν sin νt + iν cos νt) · c = (µ + iν)eµt (cos νt + i sin νt) · c = λ eλt · c . Einsetzen in (15.6) ergibt λ c eλt = A · c eλt . ⇐⇒ Damit erhält man sofort den ersten Teil des folgenden Satzes: λc = A · c . 15.1 231 Systeme erster Ordnung Satz 15.8 (1) Die Funktion t 7→ c · eλt ist genau dann nicht-triviale Lösung (d.h. 6= 0) von (15.6), wenn λ Eigenwert von A und wenn c ein zugehöriger Eigenvektor ist. (2) Sind c1 , . . . , cd ∈ Cd d linear unabhängige Eigenvektoren von A mit zugehörigen Eigenwerten λ1 , . . . , λd (z.B., wenn alle λj verschieden sind), so bilden die Funktionen t 7→ cj eλj t (j = 1, . . . , d) ein Lösungsfundamentalsystem von (15.6). Beweis (2) Auswertung der Funktionen bei t = 0 ergibt die nach Voraussetzung linear unabhängigen Vektoren c1 , . . . , cd . Nach Satz 15.3 sind dann die betrachteten Lösungsfunktionen linear unabhängig und bilden daher ein Lösungsfundamentalsystem. 2 Bemerkung 15.9 (Lösungsfundamentalsystem bei mehrfachen Eigenwerten) Sei λ ein Eigenwert von A der Ordnung k > 0 . Bei k > 1 kann man nicht ohne Zusatzvoraussetzungen an A erwarten, daß es auch k linear unabhängige Eigenvektoren zu λ gibt. Man kann aber zeigen: (1) Zum Eigenwert λ von A der Ordnung k > 0 gibt es komplexwertige Polynomfunktionen (komponentenweise betrachtet) Ph : R → Cd (h = 1, . . . , k) vom Grade ≤ k − 1 , so daß die Funktionen t 7→ Ph (t) · eλt (h = 1, . . . , k) linear unabhängige Lösungen von (15.6) sind. Sind alle Koeffizienten von A sowie λ reell, so kann man auch die Polynome Ph mit reellen Koeffizienten wählen. (2) Wählt man für jeden Eigenwert λ von A eine seiner Ordnung entsprechende Anzahl linear unabhängiger Lösungen gemäß (1) (bei k = 1 ist das gerade eine), so erhält man insgesamt ein Lösungsfundamentalsystem von (15.6). Bemerkung 15.10 (reelles Lösungsfundamentalsystem). Jede reelle homogene lineare Differentialgleichung mit konstanten Koeffizienten y0 = A · y mit A ∈ M (d, d; R) (15.9) läßt sich auch als komplexe Differentialgleichung auffassen. Gesucht: reelles Lösungsfundamentalsystem. Man kann zeigen, dass man auf folgende Weise zu einem reellen Lösungsfundamentalsystem von (15.9) gelangt: (1) Ist λ reeller Eigenwert von A , so wähle man zu λ gemäß 15.9(1) reellwertige (über C und damit auch über R) linear unabhängige Lösungen entsprechend der Vielfachheit von λ . (2) Sind λ und λ̄ konjugiert komplexe Eigenwerte, so wähle man zu einem dieser beiden Eigenwerte, etwa λ = µ + iν , gemäß 15.8 bzw. 15.9(1) linear unabhängige komplexwertige Lösungen entsprechend der Vielfachheit k von λ . Die insgesamt 2k Real- und Imaginärteile dieser komplexen Lösungen sind linear unabhängige reelle Lösungen von (15.9). (3) Zusammengenommen ergeben die durch (1) und (2) erhaltenen Lösungen ein reelles Lösungsfundamentalsystem. 232 Appendix: Alternativer Zugang zu Linearen Differentialgleichungen Beispiel 15.11 Wir betrachten wieder für ω ∈ R \ {0} die homogene lineare Differentialgleichung aus Beispiel 15.6 x01 = −ωx2 0 −ω 0 ⇐⇒ x = Ax mit A = . x02 = ωx1 ω 0 Die Eigenwertgleichung lautet dann λ2 + ω 2 = 0 mit den zueinander konjugiert komplexen Lösungen λ = ±iω . Für den zu λ = iω gehörigen Eigenvektor muss man das lineare Gleichungssystem −iω −ω (A − iω I2 ) c = c=0 ω −iω nicht-trivial lösen. Elementare Umformungen von A − iω I2 ergeben nacheinander 1 −i 1 −i , . ω −iω 0 0 i Damit ist c = ein zugehöriger Eigenvektor und 1 iωt ie − sin(ωt) + i cos(ωt) ϕ : t 7→ eiωt c = = eiωt cos(ωt) + i sin(ωt) die zu λ = iω komplexwertige Lösung der Differentialgleichung. Nach 15.10 erhält man daraus die beiden reellwertigen linear unabhängigen Lösungen − sin(ωt) cos(ωt) ϕ1 : t 7→ , ϕ2 : t 7→ . cos(ωt) sin(ωt) Aus Dimensionsgründen bilden ϕ1 , ϕ2 bereits ein reelles Lösungsfundamentalsystem. Bis auf die Reihenfolge der Vektoren stimmt dieses mit dem in Beispiel 15.6 angegebenen überein. Beispiel 15.12 Wir lösen jetzt das Problem, das wir am Eingang zur diesem Abschnitt betrachtet hatten. Dabei ist b = 0 und −k1 0 0 A = k1 −k2 0 . 0 k2 0 Daher ist A − λI3 für λ ∈ R eine untere Dreiecksmatrix und das charakteristische Polynom von A lautet nach 11.5 χA : λ 7→ (−k1 − λ)(−k2 − λ)(−λ). Die Eigenwerte von A sind die Nullstellen von χA , also λ1 = −k1 , λ2 = −k2 , λ3 = 0. Daraus bestimmen wir als zugehörige Eigenvektoren k2 − k1 0 0 c1 = k1 , c2 = 1 , c3 = 0 . −k2 −1 1 Damit bilden die Funktionen ϕ1 , ϕ2 , ϕ3 : R → R3 mit ϕi = eλi t ci (i = 1, 2, 3) bei k1 6= k2 ein LFS. Die allgemeine Lösung hat also die Gestalt k2 − k1 0 0 mit α1 , α2 , α3 ∈ R . y : t 7→ α1 e−k1 t k1 + α2 e−k2 t 1 + α3 0 −k2 −1 1 15.1 233 Systeme erster Ordnung Hat man zur Zeit t = 0 die Anfangskonzentrationen η1 , η2 , η3 , so erhält man für die Koeffizienten α1 , α2 , α3 der Lösung des zugehorigen AWP das LGS k2 − k1 0 0 α1 η1 k1 1 0 · α2 = η2 , −k2 1 1 α3 η3 das sich ohne Probleme lösen lässt. 15.1.2 Die inhomogene lineare Differentialgleichung y0 = A · y + b Wir wenden uns jetzt den Lösungen der inhomogenen linearen Differentialgleichung (15.3) bzw. (15.3*) zu. Bemerkung 15.13 Gegeben sei die inhomogene lineare DGL mit konstanten Koeffizienten y10 (t) .. . = yd0 (t) = ad1 y1 (t) a11 y1 (t) .. . + · · · + a1d yd (t) .. .. . . + · · · + add yd (t) + b1 (t) .. . (15.3) + bd (t) mit stetigen Funktionen b1 , . . . , bd : I → K , I ein mehrpunktiges reelles Intervall. Um alle Lösungen dieser DGL zu kennen, genügt es nach 15.7, irgendeine partikuläre“ Lösung dieser ” DGL sowie ein Lösungsfundamentalsystem der zugehörigen homogenen linearen DGL (15.6) zu kennen. Damit bleibt noch zu klären, wie man überhaupt zu einer Lösung der inhomogenen linearen Differentialgleichung kommt. Satz 15.14 (Variation der Konstanten). In der Situation von Definition 15.1(1) sei Φ = (ϕ1 , . . . , ϕd ) ein Lösungsfundamentalsystem der homogenen linearen Differentialgleichung y0 = A · y , (15.6) zusammengefasst zu einer d × d-Matrix. Dann erhält man eine partikuläre Lösung ψ der inhomogenen linearen Differentialgleichung y 0 = A · y + b(t) (15.3*) durch den Ansatz ψ(t) = Φ(t) C(t) , (15.10) wobei C : I → Kd aus der Differentialgleichung Φ(t) C 0 (t) = b(t) 15.5 ⇐⇒ C 0 (t) = Φ(t)−1 b(t) als C : t 7→ Z t Φ(τ )−1 b(τ ) dτ + c (15.11) t0 mit t0 ∈ I und beliebigem c ∈ Kd zu bestimmen ist. Die Integration erfolgt dabei koordinatenweise und gegebenenfalls für Real- und Imaginärteil getrennt. Beweis Aus dem Ansatz ψ = Φ · C folgt mit der Produktregel (gilt auch bei Matrizenmultiplikation, wie man sich leicht überzeugt) ψ0 außerdem ist = Φ0 · C + Φ · C 0 ; 234 Appendix: Alternativer Zugang zu Linearen Differentialgleichungen A·ψ+b = A · Φ · C + b = Φ0 · C + b wegen Φ0 = A · Φ (da Φ Lösungsfundamentalsystem der homogenen Gleichung ist). Daraus erhält man (Gleichheit der linken Seiten ⇐⇒ Gleichheit der rechten Seiten): ψ0 = A · ψ + b Φ · C0 = b . ⇐⇒ Beispiel 15.15 Die Differentialgleichung y 0 = y + et (t, y ∈ R2 ) hat ϕ : t 7→ et als Lösungsfundamentalsystem der zugehörigen homogenen linearen Differentialgleichung. Mit Z Z t t e−τ eτ dτ = C: t→ 1 dτ = t 0 0 ψ : R → R, t 7→ t et . liefert 15.14 die Funktion als eine partikuläre Lösung der inhomogenen Gleichung. Beliebige Lösungen der inhomogenen Gleichung haben daher nach 15.7 die Gestalt y : t 7→ t et + c et (c ∈ R) . Bemerkung 15.16 Bei konstantem inhomogenen Anteil b gibt es ein einfacheres Verfahren, zu einer partikulären Lösung von (15.3) zu gelangen: 1. Falls det(A) 6= 0 ist, mache man den Ansatz y ≡ c ∈ Kd ist konstant. =⇒ 0=A·c+b. (15.12) Auflösen nach c ergibt c = −A−1 b . Man prüft sofort nach, daß dies tatsächlich eine Lösung der DGL liefert. Wenn immer (15.12) nach c auflösbar ist (nicht notwendig eindeutig), findet man auf die gleiche Weise ebenfalls eine partikuläre Lösung von (15.3) 2. Hat A die 0 als Eigenwert der Ordnung k ≥ 1 , so führt der Ansatz y : t 7→ p(t) mit einem Spaltenvektor p aus Polynomfunktionen mit Ordnungen ≤ k zu einer partikulären Lösung von (15.3). Falls K = R ist, erhält man auch eine reelle partikuläre Lösung. Beispiel 15.17 Sei folgendes AWP gegeben y10 (t) = 2y1 (t) y20 (t) = +3y2 (t) + 1 2y2 (t) + 2 y1 (0) = −1 y2 (0) = 4. Das fassen wir zusammen als y 0 = Ay + b, wo A= 2 0 3 , 2 b= y(0) = y 0 , 1 , 2 y0 = −1 . 4 15.2 Lineare Differentialgleichung en höherer Ordnung mit konstanten Koeffizienten 235 Das zugehörige charakteristische Polynom ist dann (2 − λ)2 mit der doppelten Nullstelle λ = 2. Um die Eigenvektoren zu diesem Eigenwert zu bestimmen, müssen wir die Gleichung 0 3 v1 0 (A − 2I2 )v = = 0 0 v2 0 1 nicht-trivial nach v auflösen. Daraus folgt v = oder ein skalares Vielfaches davon. Nach Satz 15.8(1) 0 ist dann die auf R definierte Funktion 2t 1 e ϕ1 : t 7→ e2t = 0 0 eine nicht-triviale Lösung der zugehörigen homogenen Differentialgleichung. Eine davon linear unabhängige Lösung ermittelt man mit dem Ansatz aus Bemerkung 15.9 unter Zuhilfenahme von Bemerkung 15.10 als 3t · e2t 2 ϕ : t 7→ . e2t ϕ1 , ϕ2 bilden dann ein reelles LFS der homogenen DGL y 0 = Ay . Ferner ist (Cramer’sche Regel) −1 A = 1 2 − 34 0 1 2 ! , also −1 c := −A b= 1 . −1 Nach Bemerkung 15.16 ist c eine partikuläre Lösung der inhomogenen DGL. Die allgemeine Lösung hat dann die Form 1 + λ1 e2t + 3λ2 t · e2t 1 2 ψ : t 7→ c + λ1 ϕ + λ2 ϕ = mit λ1 , λ2 ∈ R . −1 + λ2 e2t Einsetzen der Anfangsbedingungen liefert λ1 = −2, λ2 = 5 , also als Lösung des AWP die auf R definierte Funktion ! 1 − 2e2t + 15te2t y : t 7→ . −1 + 5e2t 15.2 Lineare Differentialgleichung en höherer Ordnung mit konstanten Koeffizienten Sei I ⊂ R ein nicht-triviales Intervall und b : I → K stetig. Eine DGL, die neben der ersten Ableitung y 0 von y auch noch höhere Ableitungen y 00 = y (2) , y 000 = y (3) , . . . , y (d) , d ≥ 2 enthält, der Gestalt y (d) (t) + ad−1 y (d−1) (t) + · · · + a1 y 0 (t) + a0 y(t) = b(t), (15.13) wobei a0 , a1 , . . . , ad−1 ∈ K fest sind, heißt lineare Differenzialgleichung der Ordnung d mit konstanten Koeffizienten. Die DGL heißt homogen, falls b ≡ 0 ist, andernfalls heißt sie inhomogen. Die DGL wird zum AWP und ihre Lösung damit eindeutig durch die zusätzliche Vorgabe von Anfangswerten . Das sind hier die Funktionswerte der Lösungsfunktion sowie ihrer ersten d − 1 Ableitungen zu einem Anfangs zeitpunkt“ t0 ∈ I , also ” y(t0 ) = y 0 , . . . , y (d−1) (t0 ) = y d−1 . (15.14) 236 15.2.1 Appendix: Alternativer Zugang zu Linearen Differentialgleichungen Die homogene Differentialgleichung Zur Lösung der zu (15.13) gehörigen homogenen Differentialgleichung y (d) (t) + ad−1 y (d−1) (t) + · · · + a1 y 0 (t) + a0 y(t) = 0, (15.15) formen wir diese in ein System erster Ordnung um, indem wir y(t) Y0 (t) y 0 (t) Y1 (t) Y (t) = . := .. .. . (d−1) Yd−1 (t) y (t) definieren. Dann ist (15.15) gleichwertig zu (1) 0 y (t) Y0 (t) Y1 (t) Y10 (t) y (2) (t) Y2 (t) .. . . 0 .. .. Y (t) = . = = Y 0 (t) y (d−1) (t) Yd−1 (t) d−2 0 (d) Yd−1 (t) −a0 Y0 (t) − a1 Y1 (t) − · · · − ad−1 Yd−1 (t) y (t) (15.16) bzw. in Matrizenscheibweise Y 0 (t) = A · Y (t) mit 0 0 .. . A= 0 −a0 1 0 .. . 0 1 .. . ... ... .. . 0 0 .. −a1 −a2 . ... 0 0 .. . 1 (15.160 ) ∈ M (d, d; K) . (15.17) −ad−1 A hat das charakteristische Polynom −λ 0 .. . det(A − λId ) = det 0 −a0 1 −λ .. . 0 1 .. . ... ... .. . 0 0 .. −a1 −a2 . ... 0 0 .. . 1 , (15.18) −λ−ad−1 wenn Id die d × d-Einheitsmatrix bezeichnet. Entwickeln nach der letzten Zeile ergibt mit Gleichung (11.1), Satz 11.5 sowie einigen zusätzlichen Kenntnissen über Determinanten det(A − λId ) = (−1)d (λd + ad−1 λd−1 + · · · + a1 λ + a0 ) . λ ∈ C ist also genau dann Eigenwert von A , wenn λ Nullstelle des zur DGL (15.15) gehörigen charakteristischen Polynoms λd + ad−1 λd−1 + · · · + a1 λ + a0 (15.19) (das ist, abgesehen vom Vorzeichen, das bei der Nullstellenbestimmung keine Rolle spielt, das charakteristische Polynom der Matrix A) ist. Dieses hat jeweils für die j-te Potenz von λ denselben Koeffizienten 15.2 Lineare Differentialgleichung en höherer Ordnung mit konstanten Koeffizienten 237 wie die j-te Ableitung in der Differentialgleichung (15.15). c0 Sei c = ... Eigenvektor von A zum Eigenwert λ . Dann folgt indirekt aus (A − λId )c = 0 , daß cd−1 c0 6= 0 ist (sonst wäre c = 0). Durch Übergang zum 1/c0 -fachen folgt mit Satz 15.8(1): y : t 7→ eλt ist eine nicht-triviale Lösung von (15.15). Man braucht also den Eigenvektor c nicht für die Lösung von (15.15). Außerdem wird aus der Herleitung mit den Hilfsfunktionen Y1 , . . . , Yd−1 klar, warum bei den Anfangsbedingungen des Anfangswertproblems (15.13), (15.14) Bedingungen für Ableitungen auftauchen. Allgemeiner kann man aus den vorangehenden Bemerkungen folgern oder auch direkt beweisen: Satz 15.18 1. Ist λ eine Nullstelle des charakterististischen Polynoms von (15.15) der Ordnung k , so sind die Funktionen t 7→ th · eλt h = 0, . . . , k − 1 über C linear unabhängige komplexwertige Lösungen von (15.15). 2. Sind die Koeffizienten a0 , . . . , ad−1 der Differentialgleichung (15.15) alle reell, so sind für jede reelle Nullstelle λ des charakteristischen Polynoms die in (1) beschriebenen k linear unabhängigen Lösungsfunktionen wieder reellwertig. Ist λ, λ̄ mit λ = µ + iν ein Paar konjugiert komplexer Eigenwerte, so sind die 2k Funktionen t 7→ th eµt · cos νt , t 7→ th eµt · sin νt (h = 0, . . . , k − 1) linear unabhängige reellwertige Lösungen von (15.15). 3. Man erhält ein Lösungsfundamentalsystem der Differentialgleichung (15.15), wenn man für jede Nullstelle λ ihres charakteristischen Polynoms die ihrer Vielfachheit entsprechende Anzahl von Funktionen gemäß (1) auswählt. Bei Differentialgleichung en mit reellen Koeffizienten verwendet man entsprechend (2) , wobei bei konjugiert komplexen Nullstellenpaaren der Ordnung k , ausgehend von einer dieser Nullstellen, 2k Funktionen des Lösungsfundamentalsystem s bestimmt werden können. 15.2.2 Die homogene lineare Differenzialgleichung 2. Ordnung Wir betrachten hier zur Illustration den besonders wichtigen Spezialfall der homogenen linearen Differenzialgleichung zweiter Ordnung mit konstanten Koeffizienten b, c ∈ R y 00 (t) + by 0 (t) + cy(t) = 0. (15.20) Nach Abschnitt 15.2.1 müssen wir die Nullstellen des zugehörigen charakteristischen Polynoms bestimmen, also die quadratische Gleichung für λ λ2 + bλ + c = 0 (15.21) lösen. Die Lösung ist bekanntlich λ1,2 √ b ∆ =− ± , 2 2 wobei ∆ = b2 − 4c. (15.22) 238 Appendix: Alternativer Zugang zu Linearen Differentialgleichungen Wir unterscheiden die drei Fälle ∆ > 0, ∆ < 0 und ∆ = 0, da hier entweder zwei, keine, oder eine reelle Lösung vorliegt. Fall 1 (∆ > 0). Die allgemeine Lösung ergibt sich nach Satz 15.18 als Linearkombination √ y(t) = C1 eλ1 t + C2 eλ2 t = C1 et(b− ∆)/2 √ + C2 et(b+ ∆)/2 (15.23) mit C1 , C2 ∈ R. 1 0.8 y(x)0.6 0.4 0.2 0 2 4 6 x 8 10 12 –0.2 –0.4 Figur. Lösungskurve für y 00 (t) + 3y 0 (t) + y(t) = 0 und die Anfangswerte y(0) = 1 und y 0 (0) = 0 Fall 2 (∆ < 0). Hier hat die Gleichung (15.21) keine reelle Lösung, aber zwei konjugiert komplexe Lösungen √ b −∆ λ1,2 = − ± i . 2 2 Nach Satz 15.18 hat die Differentialgleichung die allgemeine reelle Lösung √−∆ √−∆ y(t) = e−(b/2)t C1 cos t + C2 sin t . 2 2 (15.24) mit C1 , C2 ∈ R . Unter Benutzung des Additionstheorem für die Sinusfunktion kann man diesen Ausdruck stets umschreiben zu √−∆ −(b/2)t y(t) = A · e sin t+ϕ . 2 Dabei werden die Amplitude A und die Phasenverschiebung ϕ so gewählt, dass das Anfangswertproblem gelöst wird. Man sagt bei b > 0 auch, dass hier der Fall einer gedämpften Schwingung vorliegt. 15.2 239 Lineare Differentialgleichung en höherer Ordnung mit konstanten Koeffizienten 1.0 √ e−0.1t · sin( 3.99, t) 0.5 0.0 −0.5 −1.0 0 5 10 15 20 25 30 35 Figur. Eine Lösungskurve der Differentialgleichung y + 0.2y + 4y = 0 1 0.8 y(x)0.6 0.4 0.2 0 2 4 6 x 8 10 12 –0.2 –0.4 Figur. Lösungskurve bei gedämpfter Schwingung für die AW y(0) = 1 und y 0 (0) = 0 Fall 3 (∆ = 0). In diesem Fall hat die quadratische Gleichung nur die eine Lösung λ = − 2b . Das heißt nach Satz 15.18: y1 : t 7→ e−(b/2)t , y2 : t 7→ t · e−(b/2)t bilden ein reelles Lösungsfundamentalsystem. 4.0 3.5 3.0 2.5 2.0 1.5 1.0 0.5 0.0 4 · e−0.1t t · e−0.1t 0 5 10 15 20 25 Figur. Lösungskurven der Differentialgleichung y + 0.2y + 0.01y = 0 30 35 240 Appendix: Alternativer Zugang zu Linearen Differentialgleichungen Wir haben damit die allgemeine Lösung der Differenzialgleichung y(t) = (C1 + C2 t) e−(b/2)t (15.25) mit C1 , C2 ∈ R . 1 0.8 y(x)0.6 0.4 0.2 0 2 4 6 x 8 10 12 –0.2 –0.4 Figur. Lösungskurve für y 00 (t) + 2y 0 (t) + y(t) = 0 und die AW y(0) = 1 und y 0 (0) = 0 Beispiel 15.19 (Der harmonische Oszillator) Beim harmonischen Oszillator wirkt auf ein Teilchen, das um y aus der Ruhelage bewegt wurde, eine Rückstellkraft −cy, wobei c > 0 eine Konstante ist. Harmonische Oszillatoren treten in der Natur zuhauf auf: Gewicht an einer Feder, Pendel (mit kleinen Ausschlägen), Stromkreis mit Spule und Kondensator und so fort. Aus praktischen Gründen schreiben wir c = ω 2 mit ω > 0. Im Gegensatz zur chemischen Reaktion erster Ordnung, bei der Stoffumsatz pro Zeiteinheit, also die Geschwindigkeit des Vorgangs, proportional zu y ist, ist hier die Beschleunigung, also die zeitliche Änderung der Geschwindigkeit, proportional zu y. Wir haben es also mit der folgenden homogenen linearen Differenzialgleichung zweiter Ordnung zu tun y 00 (t) + ω 2 y(t) = 0. (15.26) Wir nehmen noch an, dass das Teilchen zur Zeit t0 = 0 die Position y(0) = y0 und die Geschwindigkeit y 0 (0) = y1 hat. Mit der Notation von oben haben wir also b = 0 und ∆ = −4ω 2 < 0. Es liegt also Fall 2 vor, und die allgemeine Lösung von (15.26) lautet y(t) = C1 cos (ω t) + C2 sin (ω t) . (15.27) 15.2 Lineare Differentialgleichung en höherer Ordnung mit konstanten Koeffizienten 241 Wir müssen noch C1 und C2 bestimmen y(0) = y0 = C1 y 0 (0) = y1 = C2 ω ⇐⇒ Mithin ist y(t) = y0 cos (ω t) + C2 = y1 . ω y1 sin (ω t) . ω (15.28) Bemerkung 15.20 Man kann (15.28) stets auf die Form bringen y(t) = A sin (ω t + ϕ) . (15.29) Hierzu muss man nur das Additionstheorem A sin (ω t + ϕ) = A sin(ϕ) cos(ω t) + A cos(ϕ) sin(ω t) benutzen und dann nach A und ϕ auflösen. Beipielsweise ist, falls y0 , y1 6= 0, y0 ω y0 . ϕ = arctan und A = y1 sin(ϕ) Beispiel 15.21 (Der gedämpfte harmonische Oszillator) Ergänzend zum vorherigen Beispiel wird nun noch der Effekt der Reibung berücksichtigt. Wir nehmen an, dass die Reibungskraft proportional zur Ge√ schwindigkeit und ihr entgegengerichtet ist. Wenn wir jetzt noch aus praktischen Gründen wieder ω := c sowie zusätzlich µ := 2b definieren, wobei b > 0 die Reibungskonstante bezeichnet, so erhalten wir die Differenzialgleichung y 00 (t) + 2µy 0 (t) + ω 2 y(t) = 0, (15.30) wobei µ, ω > 0 sind. Wir wollen wieder das Anfangswertproblem y(0) = y0 und y 0 (0) = y1 lösen. Große Reibung Ist µ > ω, so liegt Fall 1 vor, und die allgemeine Lösung ist y(t) = C1 eλ1 t + C2 eλ2 t , wobei λ1 = −µ + p µ2 − ω 2 , λ2 = −µ − p µ2 − ω 2 . Man beachte, dass λ2 < −µ < λ1 < 0. Um C1 und C2 zu bestimmen, setzen wir ein y(0) = C1 + C2 = y0 y 0 (0) = λ1 C1 + λ2 C2 = y1 . Auflösen ergibt −y1 + λ2 y0 , λ 2 − λ1 y1 − λ 1 y0 C2 = . λ2 − λ1 C1 = Kleine Reibung Ist µ < ω, so liegt Fall 2 vor, und die allgemeine Lösung ist p y(t) = Ae−µt sin ω 2 − µ2 t + ϕ . 242 Appendix: Alternativer Zugang zu Linearen Differentialgleichungen Einsetzen ergibt y0 = y(0) = A sin(ϕ) p y1 = y 0 (0) = −µA sin(ϕ) + A ω 2 − µ2 cos(ϕ). Dieses nicht-lineare Gleichungssystem müsste man nun nach A und ϕ auflösen. Der Grenzfall Ist µ = ω, so liegt Fall 3 vor. Die allgemeine Lösung ist y(t) = (C1 + C2 t)e−µt . Einsetzen ergibt y0 = y(0) = C1 y1 = y 0 (0) = C2 − µC1 . Also C2 = y1 + µy0 . Bemerkung 15.22 In jedem der drei Fälle gilt lim y(t) = 0. In der Praxis interessiert man sich oft dafür, t→∞ wie schnell diese Konvergenz abläuft. Beispielweise hat man ein Messinstrument, das gedämpfte Schwingungen um den tatsächlichen Messwert herum ausführt, und bei dem man die Dämpfungskonstante b = 2µ einstellen kann. Man ist jetzt an demjenigen Wert b interessiert, bei dem die Konvergenz möglichst schnell ist. Im ersten Fall (µ > ω) domininert (wegen λ2 p < λ1 ) nach langer Zeit der Term eλ1 t , d.h. y(t) ≈ C1 eλ1 t für große t. Dabei kann man zeigen: λ1 = −µ + µ2 − ω 2 > −ω. Im zweiten Fall (µ < ω) oszilliert die Lösung, die maximalen Ausschläge sind |A|e−µt mit −µ > −ω. Im dritten Fall (µ = ω) ist der Abfall von der Größenordnung e−µt = e−ω t . Insgesamt wird daher die schnellste Konvergenzgeschwindigkeit im Grenzfall µ = ω erreicht. 15.2.3 Die inhomogene Differentialgleichung höherer Ordnung Bemerkung 15.23 Zur Lösung der inhomogenen linearen Differentialgleichung höherer Ordnung y (d) (t) + ad−1 y (d−1) (t) + · · · + a1 y 0 (t) + a0 y(t) = b(t), (15.13) mit festen a0 , a1 , . . . , ad−1 ∈ K und b : I → K muss man wie bei den Systemen 1. Ordnung die homogene DGL lösen und eine partikuläre Lösung der inhomogenen DGL bestimmen. Dafür kann man grundsätzlich das in Abschnitt 15.1.1 beschriebene Verfahren der Variation der Konstanten verwenden. Man muss dabei das gewonnene LFS durch Hinzunahme der Ableitungsfunktionen bis zur Ordnung d − 1 zu einer d × d-Matrix ergänzen. Am Schluss benötigt man vom Ergebnisvektor nur die erste Koordinate. Wenn die Funktion b selbst auch konstant ist, hilft gemäß Bemerkung 15.16 ein einfacher Ansatz, um zu einer partikulären Lösung der inhomogenen DGL zu gelangen: 1. Falls 0 keine Nullstelle des charakteristischen Polynoms ist, muss die DGL eine konstante Lösungsfunktion besitzen. 15.2 243 Lineare Differentialgleichung en höherer Ordnung mit konstanten Koeffizienten 2. Falls 0 eine Nullstelle der Ordnung k ≥ 1 des charakteristischen Polynoms ist, gibt es ein Polynom p der Ordnung ≤ k, das die DGL löst. Beispiel 15.24 Wir betrachten das AWP y 00 (t) + y(t) = 2, y 0 (0) = 0. y(0) = 1, Das zugehörige charakteristische Polynom lautet dann λ 7→ λ2 + 1 = (λ + i)(λ − i) und hat die zu einander konjugiert komplexen Nullstellen ±i. Damit bilden die Funktionen cos und sin ein reelles Lösungsfundamentalsystem (s. Satz 15.18). Der Ansatz für eine konstante partikuläre Lösung der inhomogenen DGL gemäß 15.23 liefert die partikuläre Lösung y0 : t 7→ 2 . Damit lautet die allgemeine Lösung y : t 7→ 2 + α cos(t) + β sin(t) α, β ∈ R . Einsetzen der Anfangswerte ergibt für α, β die Gleichungen 2 + α = 1, β = 0. Damit hat das AWP die Lösung y : t 7→ 2 − cos(t) . Beispiel 15.25 Wir betrachten die Differenzialgleichung dritter Ordnung y 000 + 3y 00 − y 0 − 3y = −1 (15.31) mit Anfangswert y(0) = 4, y 0 (0) = y 00 (0) = 0. (15.32) Das zugehörige charakteristische Polynom lautet χ : λ 7→ λ3 + 3λ2 − λ − 3 = (λ + 3)(λ2 − 1) = (λ + 3)(λ + 1)(λ − 1) und hat daher die Nullstellen λ1,2 = ±1, λ3 = −3. Eine konstante partikuläre Lösung der inhomogenen DGL gemäß 15.23 ist offenbar die Funktion y0 : t 7→ 31 . Damit lautet die allgemeine Lösung der inhomogenen DGL 1 y : t 7→ + αet + βe−t + γe−3t α, β, γ ∈ R . 3 Die beiden ersten Ableitungen dieser Lösung sind y 0 : t 7→ αet − βe−t − 3γe−3t , y 00 : t 7→ αet + βe−t + 9γe−3t . Einsetzen der Anfangsbedingungen ergibt die drei linearen Gleichungen 1 + α + β + γ = 4, 3 Als Lösung erhält man α = 11 8 , β= 11 4 , y : t 7→ α − β − 3γ = 0 , α + β + 9γ = 0 . γ = − 11 24 . Damit hat man als Lösung des AWP die Funktion 1 11 t 11 −t 11 −3t + e + e − e . 3 8 4 24 244 Index Abbildung, 27 1–1, 30 ein-eindeutig, 30 injektiv, 30 Verknüpfung von, 29 Abbildungsvorschrift, 27 Ableitung, 54, 188 höhere, 61 Kettenregel, 57 Produktregel, 57 Quotientenregel, 57 Summenregel, 57 Tabelle, 56 Umkehrfunktion, 58 Additionstheoreme für Winkelfunktionen, 14 affiner Unterraum, 141 algebraische Funktion, 12 Anfangswertproblem, 110 Arcus Funktionen, 33 Aufpunkt, 140 äußeres Produkt, 138 AWP, siehe Anfangswertproblem Cramér’sche Regel, 150 de l’Hospital’sche Regel, 61 Definitionsbereich, 27 Definitionsbereich einer Funktion, 12, 20 Determinante, 137, 139, 168 DGL, siehe Differentialgleichung Differentialgleichung, 109 erster Ordnung, 181 exakte, 115 explizite, 110 höherer Ordnung, 182 lineare, 119 lineare 1. Ordnung, 118 lineare 2. Ordnung, 119 Lösung, 110 partielle, 110 Trennung der Variablen, 112 Differentialrechnung, 53 Differenzenquotient, 54 Differenzialgleichung höherer Ordnung, 235 lineare 2. Ordnung, 237 differenzierbar, 54 Dimension, 131, 162 Diskriminante, 23 divergent, 47 Divergenz, 199 Drehimpuls, 170 baryzentrische Darstellung, 141 baryzentrischen Koordinaten, 141 Basis, 131 Basiswechsel, 159 beschränkte Folge, 47 Beta-Integral, 209 Betrag eines Vektors, 133 Bild, siehe Funktion Bild einer Abbildung, 27 Binomialkoeffizient, 79 Binomischer Lehrsatz, 81 Biot–Savart, 219 Eigenraum, 170 Eigenvektor, 170 Eigenwert, 170 Einheitswurzel, 22 Einheitswurzeln, 22 euklidische Norm, 133 Euler’sche Formel, 21, 88 Euler’sche Zahl, 10 Euler’scher Multiplikator, 117 Exponentialfunktion, 177 komplexe, 20, 59 Cauchy–Schwarz’sche Ungleichung, 134, 139 Cauchy-Produkt, 85 Cauchy-Schwarz Ungleichung, 106 charakteristische Polynom, 171 Cosinus, 13 244 Index reelle, 13, 34 Extremalstelle, 63, 63, 193 globale, 64 lokale, 64 Fakultät, 78 Folge beschränkte, 47 divergente, 47 konvergente, 46 monotone, 47 uneigentlich konvergente, 47 Fubini, 209 Fundamentalsatz der Algebra, 24 Funktion Ableitung einer, 54 algebraische, 12 Bild, 12, 20 Definitionbereich, 12 Definitionsbereich, 12 differenzierbare, 54 Extremalstelle, 63 gerade, 72 Graph, 32 implizit gegebene, 200 komplexe, 20 konkave, 69 konvexe, 69 Maximum, 63 mehrerer Veränderlicher, 35 Minimum, 63 monotone, 33 rationale, 12, 12, 20, 103 reelle, 12 stetige, 41 transzendente, 13 ungerade, 72 vektorwertige, 38 Wendepunkt, 71 Funktionaldeterminante, 211 Funktionalmatrix, 196 ganze Zahl, 9 Gauß’scher Integralsatz, 225 Gauß Verfahren, 151 geometrische Reihe, 83 GL, 150 globale Extremalstelle, 64 Gradient, 189 Gradientenfeld, 215 245 Graph einer Funktion, 32 Grenzwert komplexer Zahlen, 87 von Folgen, 46 von Funktionen, 49 Hamilton Operator, 175 harmonischen Oszillators, 175 harmonischer Oszillator, 123, 240 Hauptachse, 169 Hauptachsentransformation, 172 Hauptsatz der Differential- und Integralrechnung, 92 Hauptwert der Wurzelfunktion, 23 Hermite Polynome, 176 Hesse’sche Normalform, 142, 143 Hesse–Matrix, 191 homogenes LGS, 161 Hurwitz Kriterium, 194 Hyperebene, 142 Häufungspunkt, 48 ideales Gas, 35 implizit gegebene Funktion, 200 indefinit, 194 Indikatorfunktion, 205 inneres Produkt, 132 Integral, 90 komplexer Integrand, 101 uneigentliches, 98 integrierbar, 203, 209, 215 Integrierender Faktor, 117 Intervall, 11 Intervallschachtelung, 44 irrationale Zahl, 11 Jakobimatrix, 196 kanonische Basis, 131 Kern, 170 Kettenregel, 57, 95, 189, 198 komplexe Zahl, 9, 15 konjugierte Zahl, 16 konkav, 69 konvergent, 46, 187 Konvergenzkreis, 87 Konvergenzradius, 82 konvex, 69 Koordinaten, 132 Kreuzprodukt, 138 246 kritische Stelle, 193 Krümmung, 69 Kugel, 219, 224 Kugelkoordinaten, 211 Kugelvolumen, 225 Kurve geschlossene, 212 Geschwindigkeitsvektor, 212 glatte, 212 Länge, 212 stückweise glatte, 212 Kurvendiskussion, 63, 72 Kurvenintegral, 214 Laplaceoperator, 199 Lenard-Jones Potential, 75 LGS, 147 Limes von Folgen, 46 von Funktionen, 49 linear abhängig, 130 linear unabhängig, 130 lineare Abbildung, 147, 154 lineares Gleichungssystem, 147 Linearfaktor, 23 Linearkombination, 129 Linkssystem, 139 Logarithmus, 13, 34 lokale Extremalstelle, 64 Malthus’sches Wachstumsgesetz, 114 Matrix, 147 Darstellungs–, 156 Definitheit, 194 Diagonal–, 148 Diagonalelement, 148 Einheits–, 148 Exponentialfunktion, 177 invertierbare, 150 Kern, 170 Null-, 148 obere Dreiecks–, 159 orthogonale, 159 quadratische, 148 reguläre, 150 singuläre, 150 symmetrische, 159 transponierte, 158 untere Dreiecks–, 159 Maximum, 63, 193 Index Maximumstelle lokale, 64 Maxwell’sche Gleichung, 200 Maxwell’sche Relationen, 191 Minimalstelle lokale, 64 Minimum, 63, 193 Mittelwertsatz, 66 monotone Folge, 47 monotone Funktion, 33 negativ definit, 194 Niveaulinien, 36 Norm, 133 Normalenvektor, 143, 219 Nullstelle eines Polynoms, 23 Oberflächenintegral, 219 Obersumme einer Funktion, 90 ONB, 135 Orientierung, 139 orthogonal, 134 orthonormal, 134 Orthonormalbasis, 135 Oszillator harmonischer, 123, 240 Parallelepiped, 139 Parameterdarstellung, 140 Parametrisierung, 213 Partialbruchzerlegung, 102, 103 partielle Ableitung, 188 partielle Integration, 96 Poisson Gleichung, 199 Polarkoordinaten, 22, 207, 211 Polynom, 12 Polynomdivision, 25, 103 positiv definit, 194 Potential, 215 Potenzreihe, 77 Ableitung, 82 Cauchy-Produkt, 85 Definition, 82 Identitätssatz, 84 komplexe, 86 Konvergenzkreis, 87 Konvergenzradius, 82 Produktregel, 57, 95, 189, 197 Quader, 219, 219 Index quadratische Ergänzung, 23 Quellstärke, 199 Rand, 219 Rang, 162 Rationale Funktion, 12 Integration, 103 Partialbruchzerlegung, 103 rationale Funktion, 12 rationale Zahl, 10 Rechte-Hand-Regel, 139 Rechtssystem, 139 reelle Zahl, 10 Richtung, 140 Richtungsableitung, 190 Riemann–Integral, 90 Rotation, 169, 199 Satz Rolle, 66 Satz von Fubini, 209 Schrödinger Gleichung, 175 Sekante, 53 senkrecht, 134 sign, 32 Sinus, 13 Skalare, 128 Skalarprodukt, 132 Spaltenvektor, 147 Spat, 139 Spatprodukt, 139 Spektrum, 170 Spiralkurve, 213 Stammfunktion, 92, 115, 215 Standardbasis, 131 sternförmig, 216 stetig, 41, 187 Substitutionsregel, 95, 207 Summenregel, 189, 197 Tangens, 13 Tangente, 53 Taylorformel, 192 Taylorpolynom, 77 Taylorreihe, 82 Transformationsformel, 207, 210 Trennung der Variablen, 112 Trägheitstensor, 170 Umgebung, 41 247 Umkehrabbildung, 29 uneigentlich konvergent, 47 uneigentliches Integral, 98 Untersumme einer Funktion, 90 Untervektorraum, 129 Ursprung, 128 Vektor, 128 Vektorfeld, 196 Vektorpotential, 200 Vektorprodukt, 138 Vektorraum, 128 Verknüpfung von Abbildungen, 29 Vorzeichenfunktion, 32 Wendepunkt, 71 Wertebereich, 27 Winkelfunktionen, 13 Additionstheoreme, 14 Wirbelstärke, 199 Wurzelfunktion, Hauptwert, 23 Zahl Euler’sche, 10 ganze, 9 irrationale, 11 komplexe, 9, 15 Grenzwert, 87 konjugierte , 16 rationale, 10 reelle, 10 Zahlengerade, 10 Zeilenstufenform, 162 Zeilenvektor, 147 zusammenhängend, 215 Zwischenwertsatz, 44 Zylinder, 219, 222