Mathematik f¨ur Chemiker Vorlesungsskript - staff.uni

Werbung
Mathematik für Chemiker
Vorlesungsskript
Winter 2000/2001 und Sommer 2001
Achim Klenke
Mathematisches Institut
Johannes-Gutenberg Universität Mainz
Staudingerweg 9
55099 Mainz
Germany
2
Inhaltsverzeichnis
Inhaltsverzeichnis
Vorwort
7
1
Zahlen
9
1.1
Reelle Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9
1.2
Reelle Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12
1.3
Komplexe Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
15
1.4
Gauß’sche Zahlenebene . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
16
1.5
Funktionen auf C . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
19
1.6
Komplexe Exponentialfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
20
1.7
Wurzeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
22
1.8
Quadratische Gleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
23
1.9
Fundamentalsatz der Algebra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
24
2
3
4
Abbildungen
27
2.1
Allgemeines . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
27
2.2
Umkehrabbildung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
29
2.3
Reelle Funktionen einer Veränderlichen . . . . . . . . . . . . . . . . . . . . . . . . . . .
31
2.4
Reelle Funktionen mehrerer Veränderlicher . . . . . . . . . . . . . . . . . . . . . . . . .
35
2.5
Vektorwertige Funktionen einer Veränderlichen . . . . . . . . . . . . . . . . . . . . . . .
37
Stetige Funktionen und Grenzwerte
41
3.1
Definition und Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
41
3.2
Zusammensetzungen stetiger Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . .
43
3.3
Zwischenwertsatz und Intervallschachtelung . . . . . . . . . . . . . . . . . . . . . . . . .
44
3.4
Grenzwerte von Zahlenfolgen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
46
3.5
Grenzwerte von Funktionen
48
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Differentialrechnung von Funktionen einer Variablen
3
53
4
5
6
7
8
Inhaltsverzeichnis
4.1
Einführung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
53
4.2
Ableitungen einiger wichtiger Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . .
56
4.3
Rechenregeln für Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
57
4.4
Zwei Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
59
4.5
Die de L’Hospital’sche Regel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
60
4.6
Höhere Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
61
Kurvendiskussion von Funktionen einer Variablen
63
5.1
Extremalstellen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
63
5.2
Monotonie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
65
5.3
Bestimmung der Extremalstellen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
67
5.4
Krümmung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
69
5.5
Programm: Kurvendiskussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
72
Potenzreihen
77
6.1
Taylorpolynome . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
77
6.2
Taylorreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
81
6.3
Ausblick: komplexe Argumente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
86
Integration von Funktionen einer Variablen
89
7.1
Definition des Integrals . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
89
7.2
Hauptsatz der Differential- und Integralrechnung . . . . . . . . . . . . . . . . . . . . . .
91
7.3
Berechnung von Integralen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
93
7.4
Uneigentliche Integrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
98
7.5
Komplexe Integranden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
7.6
Partialbruchzerlegung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
7.7
Wichtige Ungleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
Gewöhnliche Differentialgleichungen
109
8.1
Allgemeines . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
8.2
Lösungsverfahren für DGL’en 1. Ordnung . . . . . . . . . . . . . . . . . . . . . . . . . . 111
8.2.1
Geometrische Interpretation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
8.2.2
Lösbarkeit und Eindeutigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
8.2.3
Trennung der Variablen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
8.2.4
Exakte Differentialgleichung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
8.2.5
Integrierender Faktor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
8.2.6
Lineare Differentialgleichung 1. Ordnung . . . . . . . . . . . . . . . . . . . . . . 118
Inhaltsverzeichnis
8.3
9
Lineare Differentialgleichung 2. Ordnung . . . . . . . . . . . . . . . . . . . . . . . . . . 119
Vektorräume und Grundlagen der Analytischen Geometrie
9.1
9.3
9.4
127
Vektorräume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
9.1.1
9.2
5
Lineare Unabhängigkeit, Erzeugendensystem, Basis . . . . . . . . . . . . . . . . 129
Skalarprodukt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
9.2.1
Grundlegendes zum Skalarprodukt . . . . . . . . . . . . . . . . . . . . . . . . . . 132
9.2.2
Orthogonalität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
9.2.3
Zerlegung in parallelen und orthogonalen Anteil . . . . . . . . . . . . . . . . . . 136
Drehung in der Ebene und Vektorprodukt . . . . . . . . . . . . . . . . . . . . . . . . . . 137
9.3.1
Eine Spezialität der ebenen Geometrie . . . . . . . . . . . . . . . . . . . . . . . . 137
9.3.2
Eine Spezialität des dreidimensionalen Raums: Das Vektorprodukt . . . . . . . . . 138
9.3.3
Das Spatprodukt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
Geraden und Ebenen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140
9.4.1
Parametrische und baryzentrische Darstellung . . . . . . . . . . . . . . . . . . . . 140
9.4.2
Hesse’sche Normalform . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142
10 Matrizen und lineare Abbildungen
147
10.1 Grundlegendes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147
10.2 Invertierbare Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150
10.3 Gauß Verfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
10.4 Lineare Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154
10.5 Spezielle Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158
10.6 Basiswechsel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159
10.7 Lineare Gleichungssysteme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161
11 Eigenwerte und Determinanten
167
11.1 Determinanten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
11.2 Eigenwerte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169
11.3 Der Quantenmechanische Harmonische Oszillator . . . . . . . . . . . . . . . . . . . . . . 175
12 Lineare Differentialgleichungen mit konstanten Koeffizienten
177
12.1 Systeme erster Ordnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177
12.2 Gleichungen höherer Ordnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182
13 Differentialrechnung von Funktionen mehrerer Veränderlicher
187
13.1 Partielle Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187
6
Inhaltsverzeichnis
13.2 Höhere partielle Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190
13.3 Extremalstellen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193
13.4 Anwendung: Lineare Regression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195
13.5 Vektorfelder . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 196
13.6 Rotation und Divergenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199
13.7 Implizite Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 200
14 Mehrdimensionale Integration
203
14.1 Volumenintegrale in der Ebene . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203
14.2 Volumenintegrale in höheren Dimensionen . . . . . . . . . . . . . . . . . . . . . . . . . . 208
14.3 Kurvenintegrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212
14.4 Oberflächenintegrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219
14.4.1 Der Quader . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219
14.4.2 Der Zylinder . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 222
14.4.3 Die Kugel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 224
14.4.4 Der Gauß’sche Integralsatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 225
15 Appendix: Alternativer Zugang zu Linearen Differentialgleichungen
227
15.1 Systeme erster Ordnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227
15.1.1 Lösung der homogenen linearen Differentialgleichung y’=A y . . . . . . . . . . . 230
15.1.2 Die inhomogene lineare Differentialgleichung y’=A y+b . . . . . . . . . . . . . . 233
15.2 Lineare Differentialgleichung en höherer Ordnung mit konstanten Koeffizienten . . . . . . 235
15.2.1 Die homogene Differentialgleichung . . . . . . . . . . . . . . . . . . . . . . . . . 236
15.2.2 Die homogene lineare Differenzialgleichung 2. Ordnung . . . . . . . . . . . . . . 237
15.2.3 Die inhomogene Differentialgleichung höherer Ordnung . . . . . . . . . . . . . . 242
Schlagwortverzeichnis
244
Vorwort
Dieses Skript ist entstanden als Vorlesungsskript zu der dreistündigen zweisemestrigen Vorlesung Mathematik für Chemiker, die ich im Wintersemester 2000/2001 und im Sommersemester 2001 an der Friedrich
Alexander Universität Erlangen-Nürnberg gehalten habe.
Herr Kollege Jörn Lembcke aus Erlangen hat etliche Fehler dieses Skriptes ausmerzen geholfen. Außerdem
hat er einen alternativen Zugang zu dem Matrizenkalkül, mit dem ich die linearen Differentialgleichungen
behandelt habe, geliefert. Dieser Zugang ist als Anhang diesem Skript angefügt. Vielen Dank an Herrn
Lembcke für die gründliche Durchsicht und die Verbeserungsvorschläge für dieses Skript!
Mainz, 27.August 2004.
Achim Klenke.
7
8
INHALTSVERZEICHNIS
Kapitel 1
Zahlen
Die Relevanz der Zahlen in den Naturwissenschaften muss an dieser Stelle nicht erläutert werden. Dieses
Kapitel stellt die grundlegenden Zahlbegriffe der natürlichen, ganzen, rationalen und reellen Zahlen gestrafft dar und führt dann die komplexen Zahlen ein. Zu diesem Zweck wird zunächst noch eine Übersicht
über die Exponentialfunktion sowie die Winkelfunktionen gegeben.
1.1
Reelle Zahlen
Natürliche Zahlen
Die Menge der natürlichen Zahlen wird mit
N = {1, 2, 3, . . .}
(1.1)
bezeichnet. Die heute übliche positionelle Dezimalschreibweise“ entstand zwischen 300 v.Chr. und 600
”
n.Chr. in Indien. Die arabischen Rechentechniken gelangten im späten Mittelalter zum Beispiel über die
Rechenbücher Adam Rieses nach Europa.
Die Null wird als eigenständige, nützliche Größe erstmals 600 n.Chr. in Indien beschrieben. Die Menge der
natürlichen Zahlen mit Null wird mit
N0 = {0, 1, 2, 3, . . .}
(1.2)
bezeichnet.
Operationen: Addition (+) und Multiplikation (·).
Ganze Zahlen
Mit
Z = {0, −1, 1, −2, 2, . . .}
(1.3)
wird die Menge der ganzen Zahlen bezeichnet.
Operationen: +, −, ·.
Die ganzen Zahlen wurden seit dem späten Mittelalter in Europa als nützliche Größen anerkannt. Obwohl
9
10
Zahlen
negative Zahlen keinen direkten Bezug zum Zählen realer Objekte haben, sind sie aus konzeptionellen
Gründen hilfreich. So möchte man beispielsweise in dem Ausdruck
(3 + 5) − 7 = 3 + (5 − 7) = 1
auch den Ausdruck (5 − 7) sinnvoll erklären und benötigt – zumindest als Zwischenergebnis der Rechnung
– den Begriff 5 − 7 = −2.
Die Mathematik stellt nicht die Frage danach, ob es die negativen Zahlen wirklich gibt“, sondern nur,
”
(1) ob man einen konsistenten Kalkül aufbauen kann,
(2) ob dieser Kalkül nützlich ist.
Auf die Nützlichkeit muss der Leser zunächst vertrauen. Die Konsistenz wird in den Sätzen gezeigt und in
den Übungen der praktische Umgang mit dem Kalkül gelernt.
Rationale Zahlen (Brüche)
Die Menge der rationalen Zahlen wird mit
Q=
p
, p ∈ Z, q ∈ N . . .
q
(1.4)
bezeichnet.
Operationen: +, −, ·, ÷.
Die (positiven) rationalen Zahlen sind schon im klassischen Griechenland geläufig – vor allem als Verhältnisgrößen in der Geometrie. Sie drücken Verhältnisse ganzer Zahlen aus, wie sie zum Beispiel auch in der
Stöchiometrie auftreten.
Reelle Zahlen
Die Menge der reellen Zahlen ist die Menge der Zahlen mit unendlicher Dezimalentwicklung
o
n
a2
a1
+
. . . , mit a1 , a2 , . . . ∈ {0, 1, . . . , 9}
R = k + r : k ∈ Z, r = 0, a1 a2 a3 . . . =
10 100
(1.5)
Anschaulich ist R die Menge der Punkte auf der Zahlengeraden
R0
Beispiele: 0,3,− 32 ,
√
2, π, e.
Dabei bezeichnet π = 3.1415 . . . die Kreiszahl und e = 2.7182 . . . die Euler’sche Zahl (nach Leonhard
Euler (1707–1783)). Reelle Zahlen drücken kontinuierliche Größen aus. Das Konzept soll hier nicht mathematisch fundiert werden. Stattdessen wird an die Anschauung und an das Schulwissen appelliert.
Satz 1.1 Brüche sind genau diejenigen reellen Zahlen, deren Dezimalentwicklung schließlich periodisch
wird.
1.1
11
Reelle Zahlen
Beispiel: 5.37614 614 614 . . . =
537
614
537 077
+
=
.
100 99 900
99 900
Die Zahlen, die reell sind, aber nicht rational, heißen irrational
√
Beispiele: 2, π, 0.10 110 1110 11110 . . . sind irrational.
√
Für e und π ist das etwas schwieriger nachzuweisen. Für 2 ist der Beweis nicht
√ so schwer: Wir nehmen
das Gegenteil an und führen dies zum Widerspruch. Wir nehmen also an, dass 2 = pq ist für teilerfremde
p, q ∈ N. Die Teilerfremdheit heißt gerade, dass der Bruch gekürzt ist. Dann sind aber auch p2 und q 2
2
teilerfremd, also ist 2 = pq2 ein gekürzter Bruch und damit q = 1 und p2 = 2. Nun ist aber 12 = 1 und
n2 ≥ 4 für alle n = 2, 3, 4, . . .. Damit ist die Annahme ad absurdum geführt und die Aussage bewiesen.
Für die bisher eingeführten Zahlen gilt die Inklusionskette
N ⊂ N0 ⊂ Z ⊂ Q ⊂ R.
(1.6)
Außerdem gelten die folgenden
Rechenregeln:
(1) Assoziativgesetz
a + (b + c) = (a + b) + c
und
a · (b · c) = (a · b) · c.
(2) Distributivgesetz
a · (b + c) = (a · b) + a · c.
(3) Kommutativgesetz
a·b=b·a
(4) Vollständigkeit a − b ist stets lösbar, und
a
b
a + b = b + a.
und
ist lösbar, falls b 6= 0.
Auf den reellen Zahlen ist eine Ordnung erklärt: x < y heißt, dass x kleiner als y ist, also weiter links auf
dem Zahlenstrahl liegt. Wir schreiben x ≤ y, falls x < y oder x = y.
Der Absolutbetrag einer reellen Zahl x ist definiert durch
(
x, falls x ≥ 0,
|x| =
−x, falls x < 0.
(1.7)
Zusammenhängende Teilmengen der reellen Zahlen heißen Intervalle. Für Intervalle sind die folgenden
Schreibweisen gebräuchlich:
[a, b] = {x ∈ R :
[a, b) = {x ∈ R :
(a, b] = {x ∈ R :
(a, b) = {x ∈ R :
a ≤ x ≤ b}
a ≤ x < b}
a < x ≤ b}
a < x < b}
abgeschlossenes Intervall,
rechtsoffenes Intervall,
linksoffenes Intervall,
offenes Intervall
Ebenfalls gebräuchlich ist die Schreibweise
[a, ∞) = {x ∈ R : a ≤ x},
(−∞, b] = {x ∈ R : x ≤ b},
R+ = [0, ∞),
12
Zahlen
und analog (a, ∞) und (−∞, b). Manche Autoren, insbesondere in der deutschsprachigen Literatur, benutzen die Schreibweise mit umgedrehten eckigen Klammern, statt der runden, für offene Intervalle: [a, b[=
[a, b) u.s.w.
1.2
Reelle Funktionen
Definition 1.2 Ist D ⊂ R, so heißt eine Vorschrift f : D → R, x 7→ f (x), die jedem x ∈ D genau
ein f (x) ∈ R zuordnet eine reelle oder reellwertige Funktion auf D. Wenn keine Unklarheiten entstehen
können, sagt man auch nur kurz, dass f eine Funktion auf D ist. Die Menge D heißt der Definitionsbereich
von f und die Menge der Werte, die tatsächlich von f angenommen werden, heißt der Wertebereich oder
das Bild von f .
Hier ein paar wichtige Beispiele.
Algebraische Funktionen auf R
Polynome
x 7→ f (x) = a1 x + a0 ,
linear,
2
x 7→ f (x) = a2 x + a1 x + a0 ,
quadratisch,
n
x 7→ f (x) = an x + . . . + a1 x + a0 ,
Polynom vom Grad n, falls an 6= 0.
Rationale Funktionen
Sind P, Q Polynome und D = {x ∈ R : Q(x) 6= 0}, so können wir auf D eine Funktion erklären durch
x 7→ f (x) =
P (x)
.
Q(x)
f heißt rationale Funktion.
Wurzeln
Schließlich zählen noch die (nichtnegativen)
Wurzelfunktionen zu den algebraischen Funktionen, also die
√
x
und
für natürliche Zahlen n ∈ N die n-te Wurzel [0, ∞) → R,
Quadratwurzel
[0,
∞)
→
R,
x
→
7
√
x 7→ n x.
Jede endliche Kombination von Addition, Subtraktion, Multiplikation, Division oder Hintereinanderausführung
von algebraischen Funktionen nennen wir auch wieder eine algebraische Funktion, also zum Beispiel
√
3
x4 + 1
p
[0, ∞) → R, x 7→
−
.
√
x + 1 1 + 6 x2 + x5 + x3
Transzendente Funktionen auf R
Transzendente Funktionen sind solche Funktionen, die nicht durch endliches Hintereinanderschalten von
Addition, Multiplikation und Division, sowie von Wurzelfunktionen entstehen. Wichtige Beispiele, die
1.2
13
Reelle Funktionen
1
sin(x)
tan(x)
x
cos(x)
1
schon aus der Schule bekannt sind, sind Exponential- und Logarithmusfunktion, sowie die Winkelfunktionen, ferner deren Umkehrfunktionen.
Exponentialfunktion. exp(x) = ex , wobei e = 2.7182 . . . die Euler’sche Zahl ist. Der Wertebereich ist
(0, ∞). Es gelten die wichtigen Rechenregeln: exp(0) = 1, exp(1) = e, exp(x + y) = exp(x) · exp(y).
Diese Eigenschaften (und, genau genommen, die Stetigkeit, die wir später noch kennen lernen werden)
bestimmen die Exponentialfunktion schon eindeutig.
Logarithmusfunktion. Der Logarithmus ist die Umkehrfunktion der Exponentialfunktion. Das heißt,
sein Definitionsbereich ist (0, ∞) und es gilt für jedes x ∈ (0, ∞): exp(log(x)) = x. Dadurch ist der
Logarithmus implizit definiert. Es gelten die einfachen Regeln: log(1) = 0, log(e) = 1, log(x · y) =
log(x) + log(y).
Achtung: Der hier betrachtete Logarithmus ist immer der natürliche Logarithmus, den manche Autoren
mit ln bezeichnen.
Winkelfunktionen. Die Winkelfunktionen Sinus, Cosinus und Tangens können als (eventuell negativ
gemessene) Längen in einem Dreieck im Einheitskreis mit gegebenem Winkel definiert werden. Dabei
messen wir stets den Winkel im Bogenmaß, der Bereich der Winkel erstreckt sich also über [0, 2π) und
nicht über [0◦ , 360◦ ). Eigenschaften Für jedes x ∈ R ist
14
Zahlen
für jedes k ∈ Z,
für jedes k ∈ Z,
sin(x) = sin(x + 2πk)
cos(x) = cos(x + 2πk)
sin(x) = − sin(−x),
cos(x) = cos(−x),
π
cos(x) = sin x +
2
o
n
sin(x)
1
tan(x) =
π: k∈Z
für jedes x 6∈
k+
cos(x)
2
(1.8)
sin(x)2 + cos(x)2 = 1 (Pythagoras).
Additionstheoreme.
Für beliebige x, y ∈ R ist
sin(x + y) = sin(x) cos(y) + sin(y) cos(x),
cos(x + y) = cos(x) cos(y) − sin(x) sin(y).
(1.9)
2
1
–8
–6
–4
–2
0
2
–1
–2
sin(x)
cos(x)
tan(x)
4
x
6
8
1.3
15
Komplexe Zahlen
Man erhält durch einfache geometrische Überlegungen die folgende Tabelle mit einigen Werten der Sinusund Kosinusfunktion.
x
0
π
6
π
4
π
3
π
2
2π
3
3π
4
5π
6
π
360◦
2π
0◦
30◦
45◦
60◦
90◦
120◦
135◦
150◦
180◦
sin(x)
0
cos(x)
1
1
2
√
1
3
2
1√
2
2
1√
2
2
1√
3
2
1
2
1√
3
2
1
−
2
1√
2
2
1√
−
2
2
1
2
1√
−
3
2
x·
1.3
1
0
0
−1
Komplexe Zahlen
Wenn wir einen Blick auf den Graphen der Funktion f (x) = x2 − 2 werfen, sehen wir, dass f (1) = −1 ist
und f (2) = 2 sowie, dass es dazwischen einen Punkt x geben muss, für den f (x) = 0 ist. Was hier sofort
einsichtig ist, hat die Einführung der reellen Zahlen erzwungen, weil wir wissen, dass ein solches x keine
rationale Zahl sein kann. Wir mussten die rationalen Zahlen vervollständigen.
Werfen wir einen Blick auf den Graphen der Funktion f (x) = x2 + 1, so vermissen wir sicherlich für das
Erste keine Zahl mit der Eigenschaft f (x) = 0. Es ist jedoch für den Kalkül extrem nützlich, eine solche
Zahl zu haben. Der geneigte Leser wird dies im Laufe seines Studiums noch einsehen. Im folgenden führen
wir die neue Klasse der komplexen Zahlen ein, innerhalb der jede quadratische Gleichung auflösbar ist.
Definition 1.3 Wir führen eine neue Zahl i ein, mit der Rechenregel i2 = −1. Wir nennen i die imaginäre
Einheit
Die Menge der komplexen Zahlen ist
C = {z = u + v · i : u, v ∈ R}.
Für z = u + v · i nennen wir
Re(z) = u
den Realteil und
Im(z) = v
den Imaginärteil von z.
Auf C gelten die Rechenregeln
(a + b · i) + (u + v · i) = (a + u) + (b + v) · i
(a + b · i) · (u + v · i) = av + bu · i + av · i + bv · |{z}
i2
(1.10)
=−1
= (au − bv) + (bu + av) · i.
Grob gesagt gelten für die Zahlen in C die üblichen Rechenregeln (Assoziativ-,Distributiv- und Kommu-
16
Zahlen
tativgesetz) sowie die Extraregel, dass an jeder Stelle i2 durch −1 ersetzt werden kann und −1 durch i2 .
2
Beispielsweise ist 1i = − ii = −i und allgemeiner
1
u−v·i
u−v·i
,
=
= 2
u+v·i
(u + v · i)(u − v · i)
u + v2
falls u2 + v 2 > 0.
Definition 1.4 Ist z = u + v · i ∈ C, so heißt
z̄ = u − v · i
die (komplex) konjugierte Zahl von z. Die Zahl
p
√
|z| = u2 + v 2 = z z̄ ≥ 0
heißt Betrag von z.
Man bemerke, dass also, falls z2 6= 0
z1
z1 z̄2
.
=
z2
|z2 |2
(1.11)
Insbesondere kann man in C also dividieren.
Lemma 1.5 Die komplexe Konjugation hat folgende einfache Regeln.
(i) z̄¯ = z
(ii) z = z̄ genau dann, wenn z reell ist, also Im(z) = 0.
(iii) Re(z) =
z − z̄
z + z̄
und Im(z) =
.
2
2i
(iv) z1 + z2 = z̄1 + z̄2 und z1 · z2 = z̄1 · z̄2 .
Beweis (i) und (ii) sind klar.
z + z̄
Re(z) + i Im(z) + Re(z) − i Im(z)
(iii)
=
= Re(z).
2
2
Re(z) + i Im(z) − Re(z) + i Im(z)
z − z̄
=
= Im(z).
(iv)
2i
2i
2
Offenbar ist jede komplexe Zahl z mit Im(z) = 0 eine reelle Zahl und die Rechenregeln sind konsistent mit
denen auf R. Die komplexen Zahlen sind also eine Verallgemeinerung der reellen Zahlen.
1.4
Gauß’sche Zahlenebene
Die größte Schwierigkeit, die wir haben, wenn wir uns die komplexen Zahlen vorstellen wollen, rührt
daher, dass wir sie nicht in der Zahlengeraden eintragen können. Diese ist ja schon mit den reellen Zahlen
ausgeschöpft. Abhilfe schafft hier die Gauß’sche Zahlenebene: Wir tragen die komplexe Zahl z = u + v · i
in ein ebenes Diagramm ein; den Realteil u nach rechts und den Imaginärteil v nach oben.
1.4
17
Gauß’sche Zahlenebene
vi
z=u+vi
i
−1
u
1
−i
Aus dieser Darstellung wird sofort klar, dass der Betrag einer komplexen Zahl nichts anderes ist, als der
Abstand vom Ursprung (Satz von Pythagoras).
Die Addition von komplexen Zahlen wird zur Vektoraddition:
z1+z 2
z1
i
z2
−1
1
−i
Aus dem Diagramm ist sofort ersichtlich, dass für den Betrag komplexer Zahlen die Dreiecksungleichung
gilt.
Satz 1.6 (Dreiecksungleichung) Sind z1 , z2 ∈ C, so gilt
|z1 + z2 | ≤ |z1 | + |z2 |.
Beweis Der etwas längliche Beweis wird hier ausgelassen. Stattdessen wird auf das Diagramm verwiesen.
2
18
Zahlen
Statt eine Zahl z durch Real- und Imaginärteil anzugeben, kann man sie auch durch den Abstand |z| vom
Ursprung und den Winkel arg(z) gegenüber der Abszisse (vulgo: x–Achse) bestimmen. Da der Winkel
zunächst nur bis auf ganzzahlige Vielfache von 2π bestimmt ist, wollen wir festlegen, dass stets arg(z) ∈
(−π, π]. Wir haben also für Zahlen mit positivem Imaginärteil positive Winkel und für Zahlen mit negativem Imaginärteil negative Winkel. Ist z = 0, so kann man natürlich keinen Winkel angeben. Wir wollen
dann der Einfachheit halber arg(0) = 0 setzen.
z
i
|z|
arg(z)
−1
1
−i
Klar ist, dass wir arg(z) als diejenige Zahl in (−π, π] definiert haben mit der Eigenschaft
Re(z) = |z| cos(arg(z))
Im(z) = |z| sin(arg(z)).
(1.12)
An dieser Stelle kann man bemerken, dass die komplexe Konjugation das Vorzeichen der Argumentes
ändert. Komplexe Konjugation entspricht also in der Zahlenebene der Spiegelung an der waagerechten
Achse. Für alle z ∈ C, die nicht auf der negativen reellen Achse liegen (warum nur solche?), gilt daher:
arg(z̄) = −arg(z).
Satz 1.7 Sind z1 , z2 6= 0, so ist
|z1 · z2 | = |z1 | · |z2 |
arg(z1 · z2 ) = arg(z1 ) + arg(z2 )
(mod 2π).
Wir benutzen die Schreibweise (mod 2π)“ um anzudeuten, dass die rechte Seite von der linken um ganz”
zahlige Vielfache von 2π abweichen kann. Zum Beispiel ist (−i) · (−i) = −1 und arg(−1) = π sowie
arg(−i) = −π/2. Also ist arg(−1) = 2arg(−i) + 2π.
1.5
19
Funktionen auf C
vi
z=u+vi
i
u
−1
1
−i
−vi
z=u−vi
Komplexe Konjugation durch Spiegelung an der reellen Achse
Beweis (i)
q
(z1 z2 ) · (z1 z2 )
p
= (z1 z̄1 ) · (z2 z̄2 )
p
= |z1 |2 · |z2 |2 = |z1 | · |z2 |.
|z1 · z2 | =
(ii) Sei ϕ1 = arg(z1 ) und ϕ2 = arg(z2 ). Sei ferner z3 = u + v · i definiert durch
u = |z1 | · |z2 | · cos(ϕ1 + ϕ2 )
v = |z1 | · |z2 | · sin(ϕ1 + ϕ2 ).
Offenbar ist |z3 | = |z1 | · |z2 | und arg(z3 ) = arg(z1 ) + arg(z2 )(mod 2π). Wir müssen zeigen, dass z3 =
z1 · z2 gilt. In der Tat gilt nach den Additionstheoremen für die Winkelfunktionen
u = |z1 | · |z2 | · [cos(ϕ1 ) cos(ϕ2 ) − sin(ϕ1 ) sin(ϕ2 )]
= Re(z1 )Re(z2 ) − Im(z1 )Im(z2 ) = Re(z1 · z2 ),
v = |z1 | · |z2 | · [sin(ϕ1 ) cos(ϕ2 ) + cos(ϕ1 ) sin(ϕ2 )]
= Re(z1 )Im(z2 ) + Im(z1 )Re(z2 ) = Im(z1 · z2 ).
Damit ist der Beweis erbracht.
1.5
2
Funktionen auf C
Bisher haben wir die Grundrechenarten als Operationen auf C kennen gelernt. Jetzt wollen wir, ähnlich dem
Vorgehen für die reellen Zahlen, auch Abbildungen aus den komplexen Zahlen heraus, bzw. mit Werten in
den komplexen Zahlen betrachten.
20
Zahlen
Definition 1.8 (Komplexe Funktion) Ist D ⊂ C, so heißt eine Vorschrift f : D → C, (beziehungsweise
D → R) z 7→ f (z), die jedem x ∈ D genau ein f (z) ∈ C (beziehungsweise in R) zuordnet eine komplexwertige, oder komplexe, Funktion auf D (beziehungsweise reelle oder reellwertige Funktion auf D). Die
Menge D heißt der Definitionsbereich von f und die Menge der Werte, die von f tatsächlich angenommen
werden, heißt Bild von f .
Beispiele 1.9
1. Wie für die reellen Zahlen lassen sich auch für die komplexen Zahlen durch die Grundrechenarten die so genannten rationalen Funktionen definieren. Wir nehmen an, dass n ∈ N0
ist, und a0 , a1 , . . . , an ∈ C. Ist n ≥ 1, so wollen wir auch an 6= 0 annehmen. Dann wird durch
f : C → C,
z 7→ f (z) = an z n + an−1 z n−1 + . . . a1 z + a0
eine komplexe Funktion auf ganz C definiert. f heißt Polynom n-ten Grades und
konstant,
linear,
quadratisch,
kubisch,
falls n = 0,
falls n = 1,
falls n = 2,
falls n = 3.
Für n ≥ 4 gibt es keine speziellen Namen für f .
2. Sind P, Q Polynome und D = {z ∈ C : Q(z) 6= 0}, so können wir auf D eine Funktion erklären
durch
P (z)
.
z 7→ f (z) =
Q(z)
f heißt rationale Funktion.
3. Die komplexe Konjugation f : C → C, z 7→ f (z) = z̄ ist eine auf ganz C erklärte komplexe
Funktion.
4. Die Funktionen z 7→ Re(z) und z 7→ Im(z) sind reellwertige Funktionen, die auf ganz C erklärt
sind.
5. Die Funktion C → R, z 7→ |z| hat als Bild [0, ∞).
6. Ist D = C \ {0} = {z ∈ C : z 6= 0}, so ist arg : D → R eine reellwertige Funktion mit Bild
(−π, π].
1.6
Komplexe Exponentialfunktion
Außer den algebraischen Funktionen, die nur die Grundrechenarten endlich oft miteinander verknüpfen,
kann man auch viele der wichtigen transzendenten Funktionen auf C definieren. Mit Abstand am wichtigsten ist die komplexe Exponentialfunktion, die wir hier behandeln wollen.
Die reelle Exponentialfunktion war durch die Funktionalgleichung
exp(x + y) = exp(x) · exp(y)
(1.13)
sowie den Wert exp(1) = e = 2.7182 . . . gekennzeichnet. (Genau genommen: zusätzlich durch die Stetigkeit.) Wenn wir nun eine Exponentialfunktion auf C erklären wollen, so soll diese auf ganz C die Gleichung
(1.13) erfüllen.
1.6
21
Komplexe Exponentialfunktion
Wir definieren für reelle Zahlen ϕ:
exp(iϕ) = cos(ϕ) + i sin(ϕ).
(1.14)
Die Gleichung heißt auch die Euler’sche Formel. Das heißt, für z ∈ C mit |z| = 1 und ϕ = arg(z) ist
exp(iϕ) = z. Speziell ist stets | exp(iϕ)| = 1.
Wir müssen prüfen, ob mit dieser Festsetzung die Funktionalgleichung (1.13) erfüllt ist. Seien z1 = exp(iϕ1 ),
und z2 = exp(iϕ2 ). Nach Satz 1.7 ist arg(z1 · z2 ) = ϕ1 + ϕ2 (mod 2π), also
exp(i(ϕ1 + ϕ2 )) = z1 · z2 = exp(iϕ1 ) · exp(iϕ2 ).
(1.15)
Wir wollen jetzt die Exponentialfunktion für alle z ∈ C erklären.
Definition 1.10 Die komplexe Exponentialfunktion exp : C → C wird für z ∈ C definiert durch
exp(z) = eRe(z) cos(Im(z)) + i sin(Im(z)) .
Wir schreiben meist auch nur ez für exp(z). Die Gültigkeit der Funktionalgleichung hatten wir separat
schon für den Imaginärteil und den Realteil nachgewiesen. Es ergeben sich also unmittelbar die folgenden
Eigenschaften.
Lemma 1.11
π
(i) exp(0) = 1, exp(1) = e, exp(i ) = i, Im(exp(iϕ)) ≥ 0 für ϕ ∈ [0, π].
2
(ii) exp(z1 + z2 ) = exp(z1 ) · exp(z2 ) für alle z1 , z2 ∈ C.
(iii) exp(πi) = −1, exp(2πi) = 1.
(iv) exp(iϕ) = exp(−iϕ), ϕ ∈ R.
(v) | exp(z)| = exp(Re(z)).
(vi) arg(exp(z)) = Im(z)(mod 2π).
(vii) cos(ϕ) =
Beweis
e−iϕ +e−iϕ
2
und sin(ϕ) =
e−iϕ −e−iϕ
.
2i
π
π
(i) Nach Definition ist exp( π2 i) = cos( ) +i sin( ) = i. Weiter ist der Imaginärteil Im(exp(iϕ)) =
2
| {z } | {z2 }
=0
=1
sin(ϕ) ≥ 0, falls ϕ ∈ [0, π].
(ii) Nach Definition ist
exp(z1 + z2 ) = eRe(z1 +z2 ) exp(i Im(z1 + z2 ))
= eRe(z1 ) eRe(z2 ) exp(i Im(z1 )) exp(i Im(z2 ))
= exp(z1 ) exp(z2 ).
π
π
(iii) Man rechnet eπi = e 2 i e 2 i = i2 = −1 und e2πi = eπi eπi = 1.
(iv) Nach der Definition von exp sowie den elementaren Eigenschaften der Winkelfunktionen (1.8) ist
exp(iϕ) = cos(ϕ) − i sin(ϕ) = cos(−ϕ) + i sin(−ϕ) = exp(−iϕ).
22
Zahlen
(v) Per definitionem ist
| exp(z)| = | exp(Re(z)) exp(i Im(z))| = exp(Re(z)) | exp(i Im(z))| .
|
{z
}
=1
(vi) Nach Satz 1.7 ist
arg(exp(z)) = arg(exp(Re(z))) +arg(exp(Im(z))) = Im(z)
|
{z
}
(mod 2π).
=0
(vii) Nach Lemma 1.5 (iii) ist
eiϕ + e−iϕ (iv) eiϕ + eiϕ
def.
=
= Re(eiϕ ) = cos(ϕ)
2
2
eiϕ − e−iϕ (iv) eiϕ − eiϕ
def.
=
= Im(eiϕ ) = sin(ϕ)
2i
2i
2
Korollar 1.12 Jede komplexe Zahl z kann geschrieben werden als
z = reiϕ ,
r ≥ 0, ϕ ∈ (−π, π].
Ist z 6= 0, so die Darstellung eindeutig. In diesem Fall heißt die Darstellung von z die Darstellung in
(Standard-)Polarkoordinaten.
1.7
Wurzeln
Mit Hilfe der komplexen Exponentialfunktion können wir leicht die n-ten Wurzeln komplexer Zahlen bestimmen.
Satz 1.13 (Einheitswurzeln) Sei n ∈ N. Die Gleichung wn = 1 besitzt genau n verschiedene Lösungen
w1 , . . . , wn ∈ C. Diese werden die n-ten Einheitswurzeln genannt und sind gegeben durch
2πk
wk = exp
i ,
k = 1, . . . , n.
n
Beweis Offenbar ist wkn = exp(2πk · i) = 1. Außerdem ist klar, dass alle wk unterschiedliche Zahlen sind,
weil die Argumente alle unterschiedlich sind.
Um auszuschließen, dass es weitere Zahlen w gibt, die wn = 1 lösen, nehmen wir an, dass w eine solche
Zahl ist. Wegen 1 = |wn | = |w|n ist |w| = 1. Außerdem
ist narg(w) = l · 2π für ein l ∈ Z, also
2
arg(w) = nl 2π für ein l ∈ Z. Damit ist w = exp 2πl
n i also gleich einem der wk .
Korollar 1.14 Für jede Zahl z ∈ C, z 6= 0 gibt es genau n unterschiedliche Zahlen s1 , . . . , sn ∈ C mit
sn1 = . . . = snn = z. Diese Zahlen heißen die n-ten Wurzeln von z. Ist z = r exp(iϕ), so kann man setzen
ϕ √
2πk
sk = n r exp
i exp
i .
n
n
1.8
23
Quadratische Gleichungen
Die Situation, dass der Wert der Quadratwurzel nur bis auf Vorzeichen eindeutig ist, kennen
wir schon von
√
den reellen Zahlen. Dort hatte man sich geeinigt, dass für x ∈ [0, ∞) das Symbol x stets die positive
Wurzel von x bezeichnet. Jetzt müssen wir eine der n Wurzeln einer komplexen Zahl z auszeichnen. Wir
nehmen diejenige Zahl, deren Winkel gerade ein ntel des Winkels von z ist. Dies ist ein ganz willkürliche
Festlegung, die aber für die reellen Zahlen mit der bekannten nten Wurzel übereinstimmt.
Definition 1.15 Ist z ∈ C und n ∈ N, so heißt die Zahl
√
n
z :=
p
n
|z| exp
arg(z)
i
n
der Hauptwert der n-ten Wurzel von z. Ist n = 2, so schreiben wir auch
√
z=
√
2
z.
Beispiele:
(i) Für z mit Im(z) = 0 und Re(z) ≥ 0 ist der Hauptwert der n-ten Wurzel genau die bekannte n-te Wurzel.
√
√
√
(ii) Für z mit Im(z) = 0 und Re(z) ≤ 0 ist z = i −z. Beispielsweise ist −9 = 3i.
√
√
(iii) i = exp( π4 i) = 12 2(1 + i). (Nachrechnen!)
p
√
√
4
(iv) −8 − 8 3 i = 3 − i (Nachrechnen!)
1.8
Quadratische Gleichungen
Wir betrachten die quadratische Funktion f : C → C
f (x) = x2 + ax + b,
wobei a, b ∈ C. Durch quadratische Ergänzung können wir für die Gleichung
f (x) = 0
(1.16)
die beiden Lösungen angeben
a 1√
x1,2 = − ±
∆,
(1.17)
2 2
wobei die Diskriminante ∆ ∈ C definiert ist durch ∆ = a2 − 4b. Die Zahlen x1 und x2 heißen die
Nullstellen von f . Man rechnet direkt nach, dass dann
f (x) = (x − x1 )(x − x2 ),
x ∈ C.
(1.18)
Wir sagen, dass x − x1 und x − x2 die Linearfaktoren von f sind. Aus (1.18) ist außerdem unmittelbar
klar, dass f (x) 6= 0, falls x 6= x1 und x 6= x2 , weil dann beide Linearfaktoren ungleich Null sind. Es gibt
also keine weiteren Lösungen von (1.16).
Sind die Koeffizienten a und b reell, so ist auch ∆ ∈ R und man kann drei Fälle unterscheiden.
Satz 1.16 Sind a und b reell, so tritt genau einer der drei Fälle auf:
(i)
∆ = 0:
x1 und x2 sind reell und x1 = x2 .
(ii)
∆ > 0:
x1 und x2 sind reell und x1 6= x2 .
(iii)
∆ < 0:
x1 6= x2 und beide Nullstellen sind komplex konjugiert, d.h. x1 = x̄2 .
Im ersten Fall heißt x1 eine doppelte Nullstelle. In den anderen Fällen heißen die Nullstellen einfach.
24
Zahlen
Beweis (i) Ist ∆ = 0, so ist x1 = x2 = − a2 ∈ R.
√
(ii) Ist ∆ > 0, so ist ∆ > 0 reell.
√
√
(iii) Ist ∆ < 0, so ist x1 = − a2 + i 12 −∆, = − a2 − i 12 −∆ = x̄2 .
2
Beispiele:
(i) f (x) = x2 − 2x + 1 = (x − 1)2 , ∆ = 0.
(ii) f (x) = x2 − 3x + 2 = (x − 1)(x − 2), ∆ = 1.
(iii) f (x) = x2 + 2x + 2 = (x − (−1 + i))(x − (−1 − i)), ∆ = −4.
1.9
Fundamentalsatz der Algebra
An dieser Stelle mag es für die meisten praktischen Anwendungen genug sein mit den komplexen Zahlen.
Jedoch bleibt vielleicht bei dem Leser eine gewisse Unsicherheit zurück: Wir hatten neue Zahlen (die reellen) einführen müssen, um gewisse algebraische Gleichungen lösen zu können, beispielsweise x2 − 2 = 0.
Wir mussten dann noch die komplexen Zahlen einführen, um auch x2 +1 lösen zu können. Nun hat der letzte
Abschnitt erschöpfende Auskunft gegeben darüber, dass man mit den komplexen Zahlen jede quadratische
Gleichung lösen kann.
Wie steht es nun aber mit kubischen Gleichungen, oder Gleichungen höherer Ordnung? Brauchen wir da
wieder neue Zahlen? Die vielleicht verblüffende Antwort ist, dass dies nicht der Fall ist. Genau Auskunft
gibt der folgende Satz, der in diesem Rahmen nicht bewiesen werden kann.
Satz 1.17 (Fundamentalsatz der Algebra)
(i) Sei n ∈ N und a0 , a1 , . . . , an ∈ C, an 6= 0, sowie f das Polynom f (x) = an xn + an−1 xn−1 +
. . . + a1 x + a0 . Dann gibt es Zahlen k ∈ N und n1 , . . . , nk ∈ N mit n1 + n2 + . . . + nk = n, sowie
unterschiedliche Zahlen x1 , . . . , xk ∈ C, sodass
f (x) = an (x − x1 )n1 (x − x2 )n2 · · · (x − xk )nk ,
x ∈ C.
Die Zahlen sind (bis auf Umordnung) eindeutig. Die Zahl nl heißt Vielfachheit der Nullstelle xl
(l = 1, . . . , k).
(ii) Sind alle Koeffizienten a0 , . . . , an reell, so kann man darüberhinaus die xl so umordnen, dass für ein
m ∈ N0 gilt
x1 = x̄2 , . . . , x2m−1 = x̄2m und n1 = n2 , . . . , n2m−1 = n2m ,
x2m+1 , x2m+2 , . . . , xk ∈ R.
Anders gesagt: Im Falle reeller Koeffizienten ist jede Nullstelle entweder reell, oder konjugiert zu
einer Nullstelle gleicher Vielfachheit.
Man kann den vorangehenden Satz auch so formulieren: In den komplexen Zahlen zerfällt jedes Polynom in
Linearfaktoren. Dies ist in den reellen Zahlen nicht der Fall. Man beachte aber, dass aus Teil (ii) insbesondere folgt, dass sich jedes reelle Polynom als ein Produkt von reellen Linearfaktoren und reellen quadratischen
Faktoren schreiben lässt.
1.9
25
Fundamentalsatz der Algebra
Beispiele 1.18
(i)
x5 − 6x4 − 9x3 + 44x2 + 110x + 100 = x − (1 − i) x − (1 + i) (x − 5)2 (x + 2)
= (x2 + 2x + 2)(x − 5)2 (x + 2).
(ii) Sei
f (x) =x10 − 31 x9 + 407 x8 − 2909 x7 + 11881 x6
− 24959 x5 + 7213 x4 + 92669 x3 − 224202 x2 + 223230 x − 83300.
Dann ist
f (x) = (x − (2 + i))2 (x − (2 − i))2 (x − (5 + 3i))(x − (5 − 3i))(x − 7)2 (x + 2)(x − 1)
= (x2 − 4x + 5)2 (x2 − 10x + 34)(x − 7)2 (x + 2)(x − 1).
Die jeweilige Lösung kann man sich nicht leicht verschaffen. Jedoch ist es relativ einfach, wenn auch
zeitaufwändig, eine Lösung zu überprüfen.
1.19 Beispiel Gegeben sei das Polynom
f (x) = x4 − 8x3 +
195
131 2
x − 67x +
.
4
4
Aus glücklichen Umständen heraus sei bekannt, dass x1 = 2 + 3i eine Nullstelle ist. Wie lauten nun die
anderen Nullstellen x2 , x3 , x4 ?
1. Schritt: Nach dem Fundamentalsatz ist auch x2 := 2 − 3i eine Nullstelle. Damit ist
f (x) = x − (2 + 3i) x − (2 − 3i) (x − x3 )(x − x4 )
= (x2 − 4x + 13)(x − x3 )(x − x4 ).
2.Schritt: Durch Polynomdivision erhalten wir
x4
−8x3
2
+ 131
4 x
−67x + 195
4
−x4
+4x3
−13x2
−4x3
2
+ 79
4 x
−67x + 195
4
+4x3
−16x2
+52x
÷
x2 − 4x + 13
= x2 − 4x +
15
4
= (x − x3 )(x − x4 )
(1.19)
15 2
4 x
−15x + 195
4
2
− 15
4 x
+15x − 195
4
0
Durch quadratische Ergänzung erhalten wir jetzt die reellen Lösungen x3 =
3
2
und x4 = 52 .
26
Zahlen
Kapitel 2
Abbildungen
Wir haben im letzten Abschnitt schon Funktionen kennen gelernt, deren Definitions- und Wertebereich
die reellen oder komplexen Zahlen sind. Das Konzept der Abbildungen (oder Funktionen) ist jedoch auch
in solchen Fällen nützlich, wo diese beiden Bereiche von allgemeinerer Natur ist. Die Sprache, die zur
Beschreibung von Abbildungen benutzt wird, ist so mächtig, dass sie über reelle Funktionen in weiten
Teilen mit dem Vokabular reden kann, das für einfache Tabellen verwendet wird. Wir stellen in diesem
Abschnitt die elementarsten Begriffe zusammen und gehen dann im Detail auf reelle Funktionen einer
Veränderlichen ein.
2.1
Allgemeines
Seien M und N Mengen. Wir nehmen, um triviale Fälle auszuschließen an, dass weder M noch N leer ist.
Definition 2.1 (Abbildungen) Eine Vorschrift f : M → N , x 7→ f (x), die jedem x ∈ M genau ein
f (x) ∈ N zuordnet, heißt Abbildung von M nach N .
M heißt Definitionsbereich, und N heißt Wertebereich von f ,
Die Menge der tatsächlich angenommenen Werte f (M ) := {f (x) : x ∈ M } ⊂ N heißt Bild von f .
Die Angabe x 7→ f (x) heißt die Abbildungsvorschrift.
Eine Abbildung ist also durch Angabe der drei Zutaten
• Definitionsbereich
• Wertebereich
• Abbildungsvorschrift
vollständig bestimmt.
(i) M, N = R, x 7→ sin(x).
√
(ii) M = [0, ∞), N = [0, ∞), x 7→ x.
Beispiele 2.2
27
28
Abbildungen
f
M
N
Abbildung 2.1: Schematische Darstellung einer Abbildung f : M → N
(iii) M = C, N = (−π, π], z 7→ arg(z).
(iv) M = C, N = (−π, π] × [0, ∞) := {(ϕ, r) : ϕ ∈ (−π, π], r ∈ [0, ∞)}, z 7→ (arg(z), |z|). Das ist
die Abbildung, die jedem z ∈ C seine Polarkoordinaten zuordnet. Die Schreibweise K × L, wo K
und L Mengen sind, bedeutet stets, dass die Menge von Paaren (k, l) gemeint ist, wobei k ∈ K und
l ∈ L. Im obigen Fall also Paaren von Winkeln ϕ und Längen r.
(v) M = {H, He, Li, Be,. . .} = Menge der chemischen Elemente, N = N0 = {0, 1, 2, . . .}. g : M → N
definieren wir durch
x 7→ g(x) = Anzahl der Neutronen (des häufigsten Isotops) von x “.
”
Die Abbildung g beschreibt uns also eine Tabelle, in der links die chemischen Elemente stehen, und
in der wir rechts die Neutronenanzahl ablesen können.
Nehmen wir mal an, dass wir noch eine weitere Tabelle haben, in der wir links die Ordnungszahl
und rechts den Namen des jeweiligen Elementes finden. Diese Tabelle können wir als Abbildung
beschreiben durch: f : L → M , wobei L = {1, 2, . . . , 108} (die Menge der Ordnungszahlen der
Elemente) und
f (x) = Name des Elementes mit x Protonen.
Wie bekommen wir zu einer gegebenen Ordnungszahl x nun die Anzahl der Neutronen? Wir müssen
erst in der Tabelle“ f den Namen f (x) des Elements nachschauen und dann in der Tabelle“ g die
”
”
Neutronenzahl g(f (x)). Dieses Verfahren bezeichnet man als Verknüpfung von Abbildungen.
Definition 2.3 Sind f : L → M und g : M → N Abbildungen, so heißt die Abbildung
h : L →N
x 7→h(x) = g(f (x))
die Verknüpfung von g mit f . Symbolisch schreiben wir g ◦ f = h.
2.4 Beispiel L = M = N , f (x) = x2 , g(y) = sin(y). Dann ist g ◦ f (x) = sin(x2 ).
Warnung: Im allgemeinen ist f ◦ g 6= g ◦ f ! In diesem Fall wäre z.B. f ◦ g(x) = (sin(x))2 .
2.2
29
Umkehrabbildung
f
g
L
M
N
g f
Abbildung 2.2: Verknüpfung der Abbildungen f : L → M und g : M → N zu f ◦ g : L → N
2.2
Umkehrabbildung
Wenn man in der Tabelle mit den Elementen nach der Ordnungszahl eines Elementes sucht, muss man in
der rechten Spalte der Tabelle das Element suchen und dann die links stehende Zahl ablesen. Natürlich ist
diese Suche mühsam, weil die Tabelle (so nehmen wir mal an) nach der linken Spalte geordnet ist und nicht
nach der rechten. Es wäre also praktisch, wenn wir eine weitere Tabelle besäßen, die uns diesen Vorgang
erleichtert. In der Sprache der Abbildungen heißt das gewünschte Objekt (denn bisher haben wir es uns ja
nur gewünscht und noch nicht hergestellt, oder überhaupt erstmal sichergestellt, dass eine solche Tabelle
existiert) eine Umkehrabbildung.
Definition 2.5 (Umkehrabbildung) Sind f : M → N und g : N → M Abbildungen mit der Eigenschaft,
dass
g(f (x)) = x für jedes x ∈ M,
f (g(y)) = y für jedes y ∈ N,
so heißen f und g Umkehrabbildungen zueinander. Symbolisch schreiben wir f = g −1 und g = f −1 .
g=f −1
M
f
N
Abbildung 2.3: Umkehrabbildung g : N → M der Abbildung f : M → N .
30
Abbildungen
2.6 Beispiel
(i) M = [0, ∞), N = [1, ∞), f (x) = x2 + 1, g(y) =
f (g(y)) =
und
g(f (x)) =
√
y − 1 . Dann ist
2
p
y−1 +1=y−1+1=y
√
p
(x2 + 1) − 1 = x2 = x,
weil x ≥ 0.
(ii) M = {1, . . . , 108}, N = {H, He, Li,. . .}, f (x) =Name von x, g(y) =Ordnungszahl von y.
(iii) Ist M = {H, He, Li,. . .}, N = N0 und f (x) = Anzahl der Neutronen von x, so kann man zu
f keine Umkehrabbildung finden, weil beispielsweise f (Al) = f (Si) = 14. Also kann man der
Neutronenzahl 14 nicht eindeutig ein chemisches Element zuordnen.
Das letzte Beispiel zeigt schon ganz klar, worauf es ankommt, wenn man nach Umkehrabbildungen sucht:
verschiedene Argumente müssen unterschiedliche Funktionswerte liefern.
Definition 2.7 (Ein-eindeutigkeit) Eine Abbildung f : M → N heißt ein-eindeutig (oder 1–1, oder injektiv), falls
f (x) 6= f (y), wann immer x =
6 y.
Die Ein-eindeutigkeit ist schon fast alles, was man braucht, damit es eine Umkehrabbildung gibt. Als zweites ist noch eine kleine technische Spitzfindigkeit zu beachten: Wenn f und g Umkehrfunktionen zueinander sind, so kehren sich die Rollen von Werte– und Definitionsbereich um. Damit das richtig klappt, muss
f : M → N auch wirklich jeden Wert in N annehmen, oder in Formeln ausgedrückt: es muss f (M ) = N
gelten. Praktisch ist das nie ein Problem. Man hat ja meist schon eine Vorstellung davon, welches Bild
eine Funktion hat, die Sinusfunktion beispielsweise das Intervall [−1, 1], und wählt dann N so, dass es mit
diesem Bereich übereinstimmt. Wir werden in den Beispielen sehen, wie das geht.
Satz 2.8 Die Abbildung f : M → N besitzt eine Umkehrabbildung f −1 genau dann, wenn f ein-eindeutig
ist und f (M ) = N gilt.
2.9 Beispiel M = [0, ∞), N = [1, ∞), f (x) = x2 + 1. Offenbar ist f ein-eindeutig. Außerdem wird jeder
Wert in N tatsächlich angenommen. Wir können,
weil das Problem so einfach ist, die Umkehrfunktion
√
sogar explizit angeben: g : N → M , g(y) = y − 1 .
Wenn wir, unvorsichtigerweise, N = R gewählt hätten, so hätten wir keine Umkehrabbildung angeben
können. Das liegt daran, dass in diesem Fall die Gleichheit y = f (g(y)) für y < 1 nicht gelten kann, weil
f den Wert y nicht annimmt. Ganz so spitzfindig war die Voraussetzung f (M ) = N also nicht, wie sich
hier zeigt. Natürlich könnten wir uns auf den Standpunkt stellen, dass wir sowieso nur an der Gleichung
f (g(x)) = x interessiert sind. In diesem Fall wäre die Bedingung an den Bildbereich hinfällig.
2.10 Beispiel Es sei ein Zusammenhang zwischen zwei reellen Größen x und y gegeben durch x2 + y 2 = 1.
Unser Ziel ist es, y als Funktion von x zu schreiben.
Schritt 1: Wir trennen die Variablen
y 2 = 1 − x2 .
√
Schritt 2: Die Umkehrfunktion von y 7→ y 2 ist y 7→ y, jedenfalls, wenn wir uns auf y ≥ 0 einschränken.
Der Definitionsbereich der Umkehrabbildung ist [0, ∞), also müssen wir |x| ≤ 1 fordern.
2.3
31
Reelle Funktionen einer Veränderlichen
Insgesamt folgt, dass wir y = f (x) schreiben können, wo f : [−1, 1] → [0, 1],
p
f (x) = 1 − x2 .
Ist allgemeiner g(y) = h(x) als Zusammenhang gegeben, so können wir y = f (x) schreiben, wo f (x) =
g −1 (h(x)) für einen Bereich I ⊂ R, sodass (wenn J = h(I) den Wertebereich von h bezeichnet) g : J →
R ein-eindeutig ist.
Wie gehen wir vor, wenn wir die Umkehrabbildung einer zusammengesetzten Abbildung bestimmen wollen? Dazu zunächst ein Beispiel.
2.11 Beispiel Sei L = M = N = R und f : L → M sowie g : M√→ N gegeben durch f (x) = x3 + 1 und
g(y) = 5x. Die jeweiligen Umkehrabbildungen sind f −1 (x) = 3 x − 1 und g −1 (x) = x5 . Die verknüpfte
Abbildung
g ◦ f : R → R ist gegeben durch g ◦ f (x) = 5(x3 + 1). Die Umkehrabbildung ist (g ◦ f )−1 (y) =
p
3 y
5 − 1 , denn
!
r
3
r
y
y
y
3
3
−1 =5
−1
+1 =5
−1+1 =y
(g ◦ f )
5
5
5
und
r
3
√
g ◦ f (x)
3 5(x + 1)
3
−1 =
− 1 = x3 = x.
5
5
Es gilt also (g ◦ f )−1 = f −1 ◦ g −1 . In Worten, man erhält die Umkehrabbildung einer verknüpften Abbildung, indem man die jeweiligen Umkehrabbildungen in umgekehrter Reihenfolge verknüpft.
r
3
Dies gilt auch allgemeiner als nur für die oben betrachteten Abbildungen.
Satz 2.12 Sind f : L → M und g : M → N umkehrbare Abbildungen mit Umkehrabbildungen f −1 und
g −1 , so ist die zusammengesetzte Abbildung g ◦ f : L → N umkehrbar und hat die Umkehrabbildung
(g ◦ f )−1 = f −1 ◦ g −1 .
2.3
Reelle Funktionen einer Veränderlichen
Ist M ⊂ Rn = {(x1 , . . . , xn ) : x1 , . . . , xn ∈ R}, und N ⊂ R so heißt jede Abbildung f : M → N eine
reelle Funktion von n (reellen) Veränderlichen.
Wir wollen hier nur den Fall n = 1 betrachten, also reelle Funktionen einer Veränderlichen. Außerdem
wollen wir annehmen, dass I := M ⊂ R ein Intervall ist. Dies kann offen oder abgeschlossen, beschränkt
oder unbeschränkt sein.
In welcher Weise kann man Abbildungsvorschriften von Abbildungen I → R angeben?
(i) Elementar, durch algebraische Ausdrücke wie x 7→ x2 .
(ii) Durch geometrische Konstruktion, z.B. x 7→ sin(x).
(iii) Durch Definition von Hand“: Vorzeichenfunktion
”
(
−1,
sign : x 7→
+1,
falls x < 0,
falls x ≥ 0.
(2.1)
32
Abbildungen
(iv) Implizit, durch Angabe von Eigenschaften. Beispielsweise kann man eine Funktion f als Umkehrfunktion einer anderen Funktion g definieren, wenn man weiß, dass g umkehrbar ist. Praktisch liefert
einem das natürlich keine Hilfe, wenn man ganz konkret Funktionswerte berechnen möchte.
(v) Durch Annäherung der gewünschten Funktion mit elementaren Funktionen. Beispielsweise kann
1 3
1
1
x + 2·3·4
x4 + . . . + 2·3···n
xn für große n immer näher an exp(x)
man zeigen, dass 1 + x + 21 x2 + 2·3
gelangt. Dies wird uns in einem späteren Kapitel beschäftigen.
Eine Funktion wird oft dadurch veranschaulicht, dass man ihren Graphen zeichnet. Formal handelt es sich
dabei um die Menge von Punkten in der Ebene
Graph(f ) = {(x, f (x)) : x ∈ I}.
(2.2)
Graph(f)
f(x)
0110
(x,f(x))
x
Durch die Angabe des Graphen (und genau genommen: des Wertebereichs) ist eine Funktion natürlich
eindeutig bestimmt. Wenn man nur genau genug zeichnen könnte, wäre es also möglich, Funktionen alleine
durch Zeichnung zu definieren. Im allgemeinen geht das nicht, aber der Graph ist dennoch hilfreich, wenn
man wesentliche qualitative Aussagen verstehen oder mitteilen möchte.
Wir kommen jetzt zu dem wichtigen Begriff der Monotonie.
Definition 2.13 Die Funktion f heißt
monoton wachsend,
falls f (y) ≥ f (x)
wann immer y > x,
streng monoton wachsend,
falls f (y) > f (x)
wann immer y > x,
monoton fallend,
falls f (y) ≤ f (x)
wann immer y > x,
streng monoton fallend,
falls f (y) < f (x)
wann immer y > x.
Satz 2.14 Ist f : I → N ⊂ R streng monoton wachsend (oder fallend), so ist f ein-eindeutig.
Ist zusätzlich f (I) = N , so ist f umkehrbar. Die Umkehrabbildung ist dann ebenfalls streng monoton
wachsend (beziehungsweise fallend). Der Graph der Umkehrfunktion ergibt sich durch Spiegelung des ursprünglichen Graphen an der Diagonalen {(x, x) : x ∈ R}.
Beispiele 2.15
(i) Die Vorzeichenfunktion sign (siehe (2.1)) ist monoton wachsend, aber nicht streng
monoton wachsend. Sie ist nicht umkehrbar.
2.3
33
Reelle Funktionen einer Veränderlichen
(ii) Die Abbildung [0, 1] → [−1, 0], x 7→ −x2 ist streng monoton fallend. Die Abbildungsvorschrift der
√
Umkehrfunktion lautet y 7→ −y .
(iii) Ist r > 0, so ist die Abbildung [0, ∞) → [0, ∞), x 7→ xr streng monoton wachsend. Die Umkehrab1
bildung lautet [0, ∞) → [0, ∞), y 7→ y r .
(iv) Die Abbildung [− π2 , π2 ] → [−1, 1], x 7→ sin(x) ist streng monoton wachsend. Die Umkehrabbildung, die wir nicht explizit kennen, aber die nach dem vorangehenden Satz existiert, heißt ArcusSinusfunktion. Symbolisch arcsin : [−1, 1] → [− π2 , π2 ].
(v) Die Abbildung [0, π] → [−1, 1], x 7→ cos(x) ist wieder streng monoton fallend. Die Umkehrfunktion
arccos : [−1, 1] → [0, π] heißt Arcus-Kosinusfunktion.
arccos(x)
4
3
x 5/2
arcsin(x)
2
3
1
y2
x
2/5
–1
–0.8
–0.6
–0.4
–0.2
0.2
0.6
0.4
0.8
1
x
1
–1
0
1
2
x
3
4
(vi) Die Abbildung (− π2 , π2 ) → R, x 7→ tan(x) ist streng monoton wachsend. Die Umkehrabbildung
arctan : R → (− π2 , π2 ) heißt Arcus-Tangensfunktion.
34
Abbildungen
1.5
arctan(x)
1
0.5
–20
–10
0
10
x
20
–0.5
–1
–1.5
(vii) Die Abbildung exp : R → (0, ∞) ist streng monoton wachsend. Die Umkehrabbildung ist die
(natürliche) Logarithmusfunktion log : (0, ∞) → R. Man beachte hier, dass es unterschiedliche
Konventionen für Schreibweise des natürlichen Logarithmus gibt. Manche (oder besser: viele) Autoren, besonders aus den technischen Bereichen, schreiben ln für logarithmus naturalis und bezeichnen
mit log den so genannten Logarithmus zur Basis 10. Wir folgen hier der in der Mathematik gebräuchlichen Notation.
(viii) Die Abbildung f : [0, ∞) → (0, 1], x 7→ f (x) = exp(−x2 ) (siehe Zehnmarkschein)
ist streng
p
monoton fallend. Die Umkehrfunktion lautet f −1 : (0, ∞) → [0, ∞), f −1 (y) = − log(y) .
(ix) Die Abbildung R → R, x 7→ x2 ist weder monoton wachsend noch monoton fallend. Man kann
keine Umkehrfunktion angeben.
2.16 Beispiel Wollen wir die Umkehrfunktion einer komplizierten, zusammengesetzten Funktion bestimmen, so wenden wir Satz 2.12 mehrfach an und suchen nach geeigneten Monotoniebereichen für die einzelnen Funktionen. Betrachten wir beispielsweise f gegeben durch
r
π
f (x) = 3 1 − sin
−x .
3
Dann können wir schreiben
√
3
f (x) = f1 (f2 (f3 (f4 (x)))),
wobei f1 (x) = x, f2 (x) = 1 − x, f3 (x) = sin(x), f4 (x) = π3 − x. Damit wir die einzelnen Funktionen umkehren können, müssen wir ihre Definitionsbereiche so wählen, dass sie ein-eindeutig sind. Eine
mögliche Wahl ist
f1 : [0, ∞) → [0, ∞),
f −1 (y) = y 3 ,
f2 : R → R,
f2−1 (y) = 1 − y,
π π
f3−1 (y) = arcsin(y),
f3 : [− 2 , 2 ] → [−1, 1],
f4 : R → R,
f4−1 (y) = π3 − y.
Offenbar müssen wir für f4 zusätzlich annehmen, dass die Werte f4 (x) im Definitionsbereich von f3 liegen,
also f4 (x) ∈ [− π2 , π2 ]. Damit wird der Definitionsbereich von f4 festgelegt als [− π6 , 5π
6 ]. Offenbar ist der
√
3
π 5π
−1
Wertebereich f ([− 6 , 6 ]) = [0, 2]. Die Umkehrabbildung f ist jetzt durch umgedrehte Anwendung
der einzelnen Umkehrabbildungen gegeben
f −1 (y) = f4−1 (f3−1 (f2−1 (f1−1 (y)))).
2.4
35
Reelle Funktionen mehrerer Veränderlicher
Insgesamt folgt:
h π 5π i
√
3
→ 0, 2
f: − ,
6 6
ist umkehrbar, und die Umkehrabbildung ist gegeben durch
f −1 (y) =
2.4
π
− arcsin 1 − y 3 .
3
Reelle Funktionen mehrerer Veränderlicher
Sei n = 2, 3, 4, . . . und M ⊂ Rn der Definitionsbereich der reellen Funktion f : M → R von n Veränderlichen.
2.17 Beispiel Das Gesetz des idealen Gases lautet
pV = N kT,
(2.3)
wobei p der Druck, V das Volumen, N die Anzahl der Moleküle, T die absolute Temperatur und k die
Boltzmann Konstante ist. Ist im Experiment das Volumen und die Temperatur einstellbar, sowie der Druck
zu messen, so wollen wir p als Funktion von V und T schreiben:
p = f (V, T ).
Dabei ist M = (0, ∞) × (0, ∞) und
f : M → (0, ∞),
(V, T ) 7→ N k
T
.
V
Der Graph einer reellen Funktionen mehrerer Veränderlicher ist genauso wie oben definiert als
Graph(f ) = {(x, f (x)) : x ∈ M }.
Die Darstellung des Graphen ist allerdings schwieriger als bei Funktionen von nur einer Veränderlichen.
Für Funktionen von zwei Veränderlichen bieten sich immerhin noch zwei Möglichkeiten an:
1. Perspektivische Darstellung
In einer perspektivischen Darstellung wird der Parameterbereich (die Veränderlichen) als Fläche und der
Funktionswert nach oben dargestellt. Oft wird der Graph mit einem Gitter belegt, damit die Werte optisch
besser erkennbar sind. Das ist von Hand sehr aufwändig, allerdings mit Computern heutzutage kein Problem
mehr.
36
Abbildungen
f(x,y)=cos(x)y+sin(y)
4
2
0
f(x,y)
–2
–4
–6
0
0
1
2
2
y
4
3
x
6
4
5
8
2. Niveaulinien
Definition 2.18 Die Niveaulinie der Funktion f : M → R zur Höhe h ist die Menge
Nf (h) = (x1 , x2 ) ∈ M : f (x1 , x2 ) = h .
2.19 Beispiel Betrachte die Funktion
f : R2 → [0, ∞)
(x1 , x2 ) 7→ |x1 |5/2 + 2|x2 |5/2 .
Für h ≥ 0 ist
n
o
Nf (h) = (x1 , x2 ) : |x1 |5/2 + 2 |x2 |5/2 = h .
Bemerkung 2.20 Offenbar ist f nicht ein-eindeutig. Das ist die typische Situation für reelle Funktionen
mehrerer Veränderlicher. Für die Naturwissenschaften relevante reelle Funktionen mehrerer Veränderlicher
sind nie ein-eindeutig (und damit auch nie umkehrbar).
2.5
37
Vektorwertige Funktionen einer Veränderlichen
1
y
0.5
–1.5
–1
–0.5
0
0.5
x
1
1.5
–0.5
–1
F IGUR . Niveaulinien Nf (1), Nf (2), Nf (3), Nf (4) von f (x, y) = |x|5/2 + 2|y|5/2
f(x,y)=sin(x)*cos(y)
8
6
1
0.5
y4
0
f(x,y)
–0.5
–1
0
2
0
2
2
y
0
2
4
x
6
4
4
6
8
x
6
8
8
F IGUR . Niveaulinien und perspektivische Darstellung von f (x, y) = sin(x) cos(y)
2.5
Vektorwertige Funktionen einer Veränderlichen
Definition 2.21 Sei n = 2, 3, 4, . . . und M ⊂ R sowie N ⊂ Rn . Eine Abbildung f : M → N heißt
vektorwertige Funktion von einer Veränderlichen. Wir schreiben auch


f1 (x)


f (x) =  ...  .
fn (x)
38
Abbildungen
Vektorwertige Funktionen benutzt man, um mehrere Messgrößen f1 , . . . , fn als Funktion, beispielsweise,
der Zeit t, oder auch einer anderen, frei einstellbaren Größe, zu beschreiben.
Darstellung: Für n = 2 kann man die Kurve {f (x) : x ∈ M } in der (y, z)–Ebene zeichnen und mit den
x–Werten beschriften. Für n = 3 bietet sich eine perspektivische Darstellung mit Beschriftung an.
z1
2.22 Beispiel Drehung mit konstanter Winkelgeschwindigkeit ω. Sei ω ∈ R, z =
∈ R2 und f :
z2
[0, ∞) → R2 definiert durch
z + cos(ωt)
f (t) = 1
für t ≥ 0.
(2.4)
z2 + sin(ωt)
Dann beschreibt f eine Drehung um die Achse z.
f2
t=1
f(t)
t=2
t=0
z
t=3
f1
F IGUR . Darstellung von f aus (2.4) mit ω =
π
2
2.23 Beispiel Zerfall von Stickstoffdioxid. 2N O2 −→ 2N O + O2 .
f1 (t) = Konzentration c(N O2 ) zur Zeit t.
f2 (t) = Konzentration c(N O) zur Zeit t.
f3 (t) = Konzentration c(O2 ) zur Zeit t.
Annahme f2 (0) = f3 (0) = 0 und f1 (0) = c0 > 0. Der Zerfall ist eine Reaktion zweiter Ordnung, das
heißt, es sind zwei Reaktionspartner (die zwei N O2 Moleküle) an der Reaktion beteiligt. Die Menge des
pro Zeiteinheit umgesetzten Stoffes ist nach dem Massenwirkungsgesetz proportional zum Quadrat der
Konzentration an N O2 . Insgesamt ergibt sich folgende Gleichung, die hier nicht hergeleitet werden soll,


c0
 c0 kt + 1

 c20 kt
f (t) = 
 c0 kt + 1

 1 c2 kt
0
2 c0 kt + 1



.



(2.5)
2.5
Vektorwertige Funktionen einer Veränderlichen
Dabei ist k die Reaktionskonstante, z.B. k = 0.755 l/(mol s) bei einer Temperatur von 603K.
39
40
Abbildungen
Kapitel 3
Stetige Funktionen und Grenzwerte
Sei M, N ⊂ R. Eine Funktion f : M → N , x 7→ f (x), die keine Sprünge macht, wenn man am Wert x nur
ein wenig wackelt, wollen wir stetig nennen. Wir müssen jetzt mathematisch präzise fassen, was wackeln“
”
und Sprünge“ heißen soll.
”
3.1
Definition und Beispiele
Definition 3.1 Für x0 ∈ R und ε > 0 heißt
Uε (x0 ) = x ∈ R : |x − x0 | < ε
die ε-Umgebung von x0 .
Unter Wackeln“ wollen wir jetzt verstehen, dass wir alle Werte x ∈ Uε (x0 )gleichzeitig betrachten. Keine
”
”
Sprünge“ soll heißen, dass f (x) für diese x nur um weniges (ein vorher vorgegebenes δ > 0) von f (x0 )
abweicht.
Definition 3.2 Eine Funktion f : M → N heißt stetig in x0 ∈ M , wenn für jedes δ > 0 ein ε = ε(δ) > 0
existiert mit der Eigenschaft: Für jedes x ∈ Uε (x0 ) ∩ M ist f (x) ∈ Uδ (f (x0 )).
Ist f stetig in jedem Punkt x0 ∈ M , so heißt f stetig (in M ).
Wenn man praktisch die Stetigkeit einer Funktion prüfen möchte, muss man so vorgehen: Bei festem x0
muss man zu jedem δ > 0 ein ε > 0 angeben. Dieses ε ist in der Regel aufwändig zu bestimmen. Als
nächstes muss man nachweisen, dass für jedes x ∈ Uε (x0 ) gilt, dass |f (x) − f (x0 )| < δ. Es reicht nicht,
dass dies nur für ein δ geht, es muss für jedes δ > 0 funktionieren. Es ist nicht verkehrt, sich an dieser
Stelle den Sachverhalt als ein Spiel für zwei Spieler vorzustellen. Spieler 2 behauptet, dass f in x0 stetig
ist. Spieler 1 schlägt einen Wert von δ vor und Spieler 2 muss mit der Angabe eines Wertes ε > 0 antworten.
Außerdem muss Spieler 2 nachweisen, dass für jedes x ∈ Uε (x0 ) die Beziehung |f (x) − f (x0 )| < δ gilt.
Kann Spieler 2 dies stets tun, so gewinnt er (oder sie) das Spiel und wir nennen die Funktion in x0 stetig.
Findet Spieler 1 auch nur einen Wert δ > 0, für den Spieler 2 nicht angemessen antworten kann, so ist die
Funktion unstetig in x0 .
41
42
Stetige Funktionen und Grenzwerte
f(x0) +δ
Uδ(f(x0 ))
f(x0)
f(x0) −δ
Uε(x0 )
x0−ε x0 x 0+ε
F IGUR . Stetiges f mit Uε (x0 ) und Uδ (f (x0 ))
Beispiele 3.3
(i) f : R → R, x 7→ 3x ist stetig: Für x0 ∈ R und δ > 0 wählen wir ε = δ/3. Dann ist
für x ∈ Uε (x0 )
|f (x) − f (x0 )| = |3x − 3x0 | = 3|x − x0 | < 3ε = δ,
also f (x) ∈ Uδ (f (x0 )).
(ii) f : R → R, x 7→ x2 ist überall stetig: Ist x0 ∈ R und δ > 0, so wählen wir ε = ε(δ) =
δ
√ .
4|x0 | + 2δ
Für x ∈ Uε (x0 ) ist dann
|f (x) − f (x0 )| = |x2 − x20 | = |x2 − 2xx0 + x20 + 2xx0 − 2x20 |
≤ (x − x0 )2 + 2|(x − x0 )x0 |
< ε2 + 2ε|x0 |
2
δ
2|x0 |δ
δ
δ
≤ √
+
≤ + = δ.
4|x
|
2
2
2δ
0
Insgesamt ist also f (x) ∈ Uδ (f (x0 )).
(iii) Ähnlich wie in (ii) ist für jedes n ∈ N die Abbildung R → R, x 7→ xn stetig.
(iv) Die Exponentialfunktion exp : R → (0, ∞) ist stetig: Ist x0 ∈ R und δ > 0, so wählen wir
ε = log(1 + δe−x0 ). Dann ist
|ex − ex0 | = |(ex−x0 − 1)|ex0 ≤ (e|x−x0 | − 1)ex0 < (eε − 1)ex0 = δ.
Das heißt ex ∈ Uδ (x0 ), wie gewünscht.
(v) Die Winkelfunktionen sin, cos : R → [−1, 1] sind überall stetig.
(vi) Die Vorzeichenfunktion sign : R → {−1, 1} ist stetig in jedem x0 6= 0 und unstetig in x0 = 0. In
der Tat: Für δ = 1 und jedes ε > 0 ist x = − 2ε ∈ Uε (0), aber |f (x) − f (0)| = | − 1 − 1| = 2 > 1.
3.2
43
Zusammensetzungen stetiger Funktionen
(vii) Die Funktion f : R → [−1, 1],
x 7→


 0,
x ≤ 0,
1

 sin
,
x
x > 0,
ist unstetig in x0 = 0 und stetig in allen x0 6= 0.
Meist kann man durch Augenschein am Graphen der Funktion erkennen, ob die Funktion stetig oder Unstetig ist. Als Definition der Stetigkeit ist dieses Verfahren unbrauchbar, aber als Hilfsmittel zur Untersuchung
einer Funktion sehr nützlich.
Satz 3.4 Ist I ⊂ R ein Intervall, so ist jede Funktion f : I → R, deren Graphen man in einem Stück
zeichnen kann, stetig. Besteht der Graph aus zwei, oder mehreren Stücken, die nicht miteinander verbunden sind, so ist f unstetig. Die Stellen, an denen der Graph getrennt ist, sind die Unstetigkeitsstellen.
Achtung: Hier wurde vorausgesetzt, dass f auf einem Intervall definiert ist. Ist f auf mehreren Intervallen
definiert, so muss der Graph nur in jedem einzelnen dieser Intervalle zusammenhängend sein. Beispiel:
R \ {0} → R, x 7→ x−1 ist stetig, da man die Graphen für x < 0 und für x > 0 jeweils durchgehend
zeichnen kann. In x = 0 ist die Funktion nicht definiert und kann daher in dieser Stelle auch nicht unstetig
sein.
3.2
Zusammensetzungen stetiger Funktionen
Funktionen kann man mit reellen Zahlen multiplizieren, indem man die Funktionswerte mit der jeweiligen
reellen Zahl multipliziert. Man kann zwei Funktionen addieren, subtrahieren und multiplizieren, indem man
das entsprechende mit den Funktionswerten tut. Man kann zwei Funktionen auch dividieren, jedenfalls dort,
wo der Nenner nicht Null ist. Unter diesen Operationen bleibt die Stetigkeit als Eigenschaft erhalten. Diesen
Sachverhalt wollen jetzt formal darstellen.
Definition 3.5 Ist M eine Menge und f, g : M → R Abbildungen, sowie a ∈ R, so kann man Abbildungen
af , f + g, f − g und f g : M → R definieren durch
af : x 7→ af (x),
f + g : x 7→ f (x) + g(x),
f − g : x 7→ f (x) − g(x),
f g : x 7→ f (x)g(x).
Bezeichnet D = {x ∈ M : g(x) = 0} die Menge der Punkte, in denen g verschwindet, so definieren wir
(x)
die Abbildung fg : M \ D → R durch x 7→ fg(x)
.
Satz 3.6 Seien M ⊂ R, f, g : M → R Abbildungen und a ∈ R. Sind f und g in x0 ∈ M stetig, dann sind
auch die Abbildungen af , f + g, f − g und f g in x0 stetig. Ist D wie oben und x0 ∈ M \ D, sowie f und
g in x0 stetig, dann ist auch fg in x0 stetig.
Sind die Abbildungen f und g stetig, dann sind auch die Abbildungen af , f + g, f − g, f g und
Beispiele 3.7
f
g
stetig.
(i) R → R, x 7→ 6 sin(x) ist stetig, weil sin stetig ist.
(ii) R → R, x 7→ x4 + x5 ist stetig, weil x 7→ x4 und x 7→ x5 beide stetig sind. Etwas allgemeiner ist
jedes Polynom auf R stetig.
44
Stetige Funktionen und Grenzwerte
(iii) R → R, x 7→ x2 sin(x) ist stetig.
(iv) R → R, x 7→
x3 +7
x2 +1
ist stetig, da x2 + 1 6= 0 für alle x ∈ R.
x+1
(v) h : R \ {1} → R, x 7→ x−1
ist stetig. Man bemerke, dass die problematische Stelle bei x0 = 1
gar nicht im Definitionsbereich von h liegt. Allgemeiner ist jede rationale Funktion stetig (in ihrem
Definitionsbereich).
sin(x)
ist stetig.
(vi) tan : R \ k + 12 )π : k ∈ Z → R, x 7→ tan(x) = cos(x)
Genauso wichtig wie die algebraischen Operationen auf den Funktionswerten, die wir gerade kennen gelernt
haben, ist die Verknüpfung von Abbildungen durch Einsetzen ineinander (vergleiche Definition 2.3).
Satz 3.8 Seien L, M, N ⊂ R und f : L → M und g : M → N Abbildungen.
(i) Ist x0 ∈ L und f stetig in x0 sowie g stetig in y0 = f (x0 ), so ist g ◦ f stetig in x0 .
(ii) Sind f und g stetig, so ist auch g ◦ f stetig.
Beweis Sei x0 ∈ L und δ > 0 vorgegeben. Dann existiert nach Voraussetzung ein εg > 0, sodass für jedes
y ∈ Uεg (y0 ) gilt
g(y) ∈ Uδg (g(y0 )) = Uδg (g ◦ f (x0 )).
(3.1)
Sei δf = εg . Da f in x0 stetig ist, existiert ein εf > 0, sodass für jedes x ∈ Uεf (x0 ) gilt: f (x) ∈
Uδf (f (x0 )) = Uεg (y0 ). Wegen (3.1) ist also g ◦ f (x) ∈ Uδg (g ◦ f (x0 )) für jedes x ∈ Uεf (x0 ). Damit ist
g ◦ f als stetig in x0 erkannt.
2
Beispiele 3.9
(i) R → R, x 7→ exp(−x2 ) ist stetig als Zusammensetzung g◦f der stetigen Abbildungen
f : x 7→ −x2 und g : x 7→ exp(x).
(ii) R → R, x 7→ sign(sin(x)) ist stetig in jedem Punkt x0 ∈ R \ {kπ : k ∈ Z}. Dabei ist die Ausnahmemenge natürlich gerade die Menge der Punkte, an denen die Sinusfunktion einen Nulldurchgang
hat.
3.3
Zwischenwertsatz und Intervallschachtelung
Ist f eine stetige reelle Funktion auf dem Intervall [a, b] (wobei a < b reelle Zahlen sind), so nimmt sie
jeden Wert an, der zwischen f (a) und f (b) liegt. Ein Blick auf den Graphen bestätigt diese Tatsache sofort.
Dennoch sollte man sich an dieser Stelle daran erinnern, dass wir die reellen Zahlen mühsam so hergestellt
hatten, dass sie keine Lücken enthalten. Würden wir nämlich die gleiche Funktion nur auf den rationalen
Zahlen auswerten, so wäre die Aussage falsch. (Beispiel: f (x) = x2 − 2, a = 0, b = 2. Es gibt keine
rationale Nullstelle).
Wir formulieren in diesem Abschnitt den Sachverhalt im so genannten Zwischenwertsatz. Obwohl die Aussage in diesem Rahmen keines Beweises bedarf, soll sie bewiesen werden, weil das Beweisprinzip, die
so genannte Intervallschachtelung, ein konstruktives Verfahren liefert, sich die Stelle zu verschaffen, an
der der gewünschte Wert angenommen wird. So kann man dann per Hand Umkehrfunktionen numerisch
berechnen.
3.3
45
Zwischenwertsatz und Intervallschachtelung
Satz 3.10 (Zwischenwertsatz) Seien a, b ∈ R , a < b, und f : [a, b] → R eine stetige Funktion. Ist
f (a) ≤ f (b) (beziehungsweise f (a) ≥ f (b)), so existiert für jedes y ∈ [f (a), f (b)] (beziehungsweise
y ∈ [f (b), f (a)]) ein x ∈ [a, b] mit f (x) = y.
Beweis (Intervallschachtelung) Ohne Einschränkung der Allgemeinheit sei hier f (a) ≤ f (b) angenommen. Wir setzen a0 = a und b0 = b. Wir wählen den Punkt c0 genau in der Mitte des Intervalls [a0 , b0 ],
0
also c0 = a0 +b
2 .
Fall 1 Ist jetzt f (c0 ) < y, dann erwarten wir, dass der gesuchte Punkt x in [c0 , b] liegt. Wir verkleinern das
Intervall auf [a1 , b1 ], wobei a1 = c0 und b1 = b und suchen in diesem Intervall erneut nach x.
Fall 2 Ist andererseits f (c0 ) ≥ y, dann erwarten wir x in [a0 , c0 ] und setzen daher a1 = a0 , b1 = c0 und
suchen erneut in [a1 , b1 ] nach x.
1
halbiert und ein
In beiden Fällen wird als nächster Schritt wieder das Intervall [a1 , b1 ] bei c1 = a1 +b
2
Teil verworfen. Der andere Teil wird [a2 , b2 ] genannt. Auf diese Weise erhalten wir sukzessive in einander
enthaltene Intervalle [an , bn ] mit bn − an = (b − a)2−n und mit f (an ) ≤ y ≤ f (bn ). Die Regel ist dabei:
n
Setze cn = an +b
und
2
Falls f (cn ) < y : setze an+1 = cn , bn+1 = bn .
Falls f (cn ) ≥ y : setze an+1 = an , bn+1 = cn .
Offenbar ist a0 ≤ a1 ≤ a2 ≤ . . . und b0 ≥ b1 ≥ b2 ≥ . . .. Es gibt also genau ein x mit an ≤ x ≤ bn für
alle n. Da f stetig ist, muss f (x) = y sein.
2
Man bemerke, dass wir im n-ten Schritt den Wert x bereits bis auf einen Fehler von höchstens (b − a)2−n
angenähert haben.
3.11 Beispiel Sei f : [0, 1] → R, x 7→ x + sin( π2 x). Dann ist f (0) = 0 und f (1) = 1 + sin( π2 ) = 2.
Wir suchen jetzt nach einem Wert x ∈ [0, 1] mit f (x) = 1. Nach dem Zwischenwertsatz gibt es so ein x.
Die Funktion f ist streng monoton wachsend, daher existiert auch die Umkehrabbildung f −1 : [0, 2] →
[0, 1]. Daher ist x = f −1 (1) sogar eindeutig. Wir können unsere Aufgabe jetzt so auffassen, dass wir die
Umkehrfunktion f −1 an der Stelle 1 explizit ausrechnen wollen.
1
Wir geben uns eine Fehlergrenze von beispielsweise 32
vor (hier könnte natürlich auch jede andere Zahl
stehen) und wollen x bis auf diesen Fehler numerisch (also beispielsweise mit dem Taschenrechner) be1
= 2−5 müssen wir also a5 und b5 bestimmen.
stimmen. Wegen 32
n
an
bn
cn
f (cn )
0
0
1
1
2
1
2
+ sin( π4 ) ≈ 1, 207 > 1
1
0
1
2
1
4
1
4
+ sin( π8 ) ≈ 0, 633 < 1
2
1
4
2
4
3
8
3
8
+ sin( 3π
16 ) ≈ 0, 931 < 1
3
3
8
4
8
7
16
7
16
+ sin( 7π
32 ) ≈ 1, 072 > 1
4
6
16
7
16
13
32
5
3
8
13
32
13
32
+ sin( 13π
64 ) ≈ 1, 002 > 1
13
Ergebnis x = f −1 (1) ∈ [ 12
32 , 32 ] = [0.375, 0.40625]. (Führt man das Verfahren noch um etliche Schritte
weiter, so erhält man für x den Wert 0.4053883560. Der Wert von a5 weicht also von x tatsächlich um fast
1
32 ab.)
46
Stetige Funktionen und Grenzwerte
2
x+sin( π x/2)
1.5
1
0.5
0
–0.2
a0
a1
–0.5
0.2
0.4
0.6
x
0.8
1
b0
1.2
b1
b2
a2
b3
a3
F IGUR . Intervallschachtelung zur Bestimmung von x mit x + sin( πx
2 )=1
3.4
Grenzwerte von Zahlenfolgen
Wir haben im letzten Abschnitt bei der Intervallschachtelung einen Wert x durch Zahlenfolgen (an )n∈N =
(a1 , a2 , a3 , . . .) und (bn )n∈N angenähert. Wir wollen hier den Begriff der Annäherung präzisieren und die
elementaren Rechenregeln für die so genannten Grenzwerte angeben.
Definition 3.12 Eine Zahl a ∈ R heißt Grenzwert (oder Limes) der Zahlenfolge (an )n∈N , falls für jedes
(noch so kleine) ε > 0 ein Index N = N (ε) ∈ N existiert mit der Eigenschaft
an ∈ Uε (a) für alle n ≥ N.
Existiert eine solche Zahl a, so sagen wir, dass die Folge (an )n∈N konvergent ist, und dass (an )n∈N gegen
a strebt (oder konvergiert). Wir schreiben dann
a = lim an ,
n→∞
n→∞
oder an −→ a.
Lemma 3.13 Ist (an )n∈N konvergent, so ist der Grenzwert eindeutig bestimmt.
3.4
47
Grenzwerte von Zahlenfolgen
(i) an =
Beispiele 3.14
(ii) an =
(−1)n n12
1
n
konvergiert: lim an = 0.
n→∞
konvergiert: lim an = 0.
n→∞
(iii) an = n2 ist nicht konvergent.
(iv) an = (−1)n ist nicht konvergent.
Ein Grenzwert braucht im allgemeinen nicht zu existieren (Beispiele (iii) und (iv)). Wir führen für diese
Situation die folgenden Begriffe ein:
Definition 3.15
(i) Eine Zahlenfolge, die nicht konvergent ist, heißt divergent.
(ii) Existiert für jedes (noch so große) M > 0 ein Index N = N (M ) ∈ N mit der Eigenschaft
an > M
für alle n > N,
so sagen wir, dass (an )n∈N gegen ∞ strebt oder uneigentlich konvergiert. Wir schreiben dann
lim an = ∞,
n→∞
n→∞
n→∞
oder an −→ ∞. Analog definieren wir lim an = −∞ und an −→ −∞.
n→∞
Die Folge in Beispiel (iii) strebt gegen ∞. Um ein einfaches Kriterium für die Konvergenz einer Folge zu
erhalten, führen wir die folgenden Begriffe ein.
Definition 3.16 Eine Folge (an )n∈N heißt
• beschränkt, falls ein M > 0 existiert mit |an | ≤ M für alle n ∈ N.
• monoton wachsend, falls a1 ≤ a2 ≤ a3 ≤ . . .. Analog: streng monoton wachsend und (streng)
monoton fallend.
Satz 3.17 Eine monoton wachsende (oder fallende) Zahlenfolge ist
• konvergent, falls sie beschränkt ist,
• uneigentlich konvergent, falls sie unbeschränkt ist.
Beispiele 3.18
(i) Die Folgen (an )n∈N und (bn )n∈N aus der Intervallschachtelung sind monoton wachsend beziehungsweise fallend und beschränkt durch |a0 |+|b0 |. Daher existieren lim an und lim bn .
n→∞
2
n→∞
2
(ii) Die Folge (an )n∈N mit an = n ist monoton wachsend aber unbeschränkt, es gilt lim n = ∞.
n→∞
n
(iii) Die Folge (an )n∈N mit an = (−1) ist beschränkt, aber nicht monoton. Sie ist divergent.
(iv) Die Folge (an )n∈N mit an = 2n ist monoton wachsend und unbeschränkt. Sie konvergiert daher
uneigentlich gegen ∞.
(v) Als etwas kompliziertere Beispiele seien die Folgen (an )n∈N und (bn )n∈N mit an = (1 + n1 )n und
bn = (1 + n1 )n+1 betrachtet. Beide Folgen sind beschränkt (zum Beispiel durch 4). (an )n∈N ist
monoton wachsend und (bn )n∈N ist monoton fallend. Beide Folgen sind also konvergent, und man
kann zeigen, dass beide gegen e konvergieren.
48
Stetige Funktionen und Grenzwerte
Wir fassen die wichtigsten Rechenregeln für Grenzwerte von Zahlenfolgen zusammen.
n→∞
n→∞
Satz 3.19
(i) Sind (an )n∈N und (bn )n∈N konvergente Zahlenfolgen mit an −→ a und bn −→ b, sowie
λ ∈ R, so gilt
lim (λ + an ) = λ + a,
n→∞
lim (λ · an ) = λ · a,
n→∞
lim (an + bn ) = a + b,
(3.2)
n→∞
lim (an − bn ) = a − b,
n→∞
lim (an · bn ) = a · b.
n→∞
(ii) Ist zudem b 6= 0, so gilt
lim
n→∞
an
a
= .
bn
b
(3.3)
(iii) Ist zusätzlich zu (i) (wobei wir jetzt auch a = ±∞ und b = ±∞ erlauben wollen) noch an ≤ bn für
alle n ∈ N, so gilt a ≤ b.
n→∞
1
n→∞ an
(iv) Gilt |an | −→ ∞, so gilt lim
= 0.
n→∞
1
n→∞ an
(v) Ist an > 0, n ∈ N, und an −→ 0, so gilt lim
(i) lim (1 + n1 )(5 − n−2 ) = lim (1 + n1 ) · lim (5 − n−2 ) = 5.
Beispiele 3.20
n
n→∞ n+1
(ii) lim
= ∞.
n→∞
n→∞
1
n→∞ 1+(1/n)
= lim
n→∞
= ( lim (1 + n1 ))−1 = 1.
n→∞
(iii) Es ist lim 2−n = 0, weil lim 2n = ∞.
n→∞
n→∞
(iv) (an )n∈N und (bn )n∈N aus der Intervallschachtelung. Wegen |bn − an | = 2−n (b0 − a0 ) ist lim (bn −
n→∞
an ) = 0. Nach dem Satz ist daher lim an = lim bn − lim (bn − an ) = lim bn .
n→∞
(v) Sei an = − n1 und bn =
lim bn .
1
n
n→∞
n→∞
n→∞
für jedes n ∈ N. Dann ist an < bn für jedes n, aber lim an = 0 =
n→∞
n→∞
3.5
Grenzwerte von Funktionen
Sei stets M ⊂ R und f : M → R eine reelle Funktion. Ferner sei stets a ∈ R oder a = ±∞ so gewählt,
dass es eine Zahlenfolge (an )n∈N gibt mit an ∈ M \ {a}, n ∈ N, und
a = lim an .
n→∞
(3.4)
Wir nennen einen solchen Wert a einen Häufungspunkt der Menge M . Etwas weniger formal als oben
können wir sagen, dass a ein Häufungspunkt von M ist wenn beliebig nah an a Punkte von M liegen.
Dabei muss a selbst nicht in M liegen, sondern kann gewissermaßen am Rande von M sein.
Diese Annahmen an a wirken vielleicht auf den ersten Blick etwas unübersichtlich, daher kommen hier ein
paar Beispiele, an die sich der Leser halten kann.
3.5
49
Grenzwerte von Funktionen
(i) M = (2, 7). Dann ist jeder Wert a ∈ [2, 7] ein Häufungspunkt von M .
(ii) M = (−∞, 0). Dann sind a = −∞ und jeder Wert a ∈ (−∞, 0] Häufungspunkte von M .
(iii) M = R \ {0}. Dann sind a = ±∞ und jeder Wert a ∈ R ein Häufungspunkte von M .
Definition 3.21 Eine Zahl A ∈ R (oder A = ±∞) heißt (uneigentlicher) Grenzwert von f für x → a, falls
für jede Folge (an )n∈N mit an ∈ M \ {a} (n ∈ N) und lim an = a gilt
n→∞
A = lim f (an ).
(3.5)
n→∞
Wir schreiben dann
lim f (x) = A.
x→a
Ist a ∈ R und werden in (3.4) und (3.5) nur Folgen (an )n∈N mit an > a (beziehungsweise an < a), n ∈ N,
betrachtet, so heißt A rechtsseitiger (beziehungsweise linksseitiger) Grenzwert von f für x → a. Wir
schreiben dann
lim f (x) = A oder lim f (x) = A,
x→a+
x↓a
beziehungsweise
lim f (x) = A oder lim f (x) = A.
x→a−
x↑a
Beispiele 3.22
(ii)
(i) lim exp(x) = ∞, lim exp(x) = 0
x→∞
x→−∞
lim sin(x) = 1.
x→π/2
1
2
x→0 x
(iii) lim
1
x→0 x
(iv) lim
= ∞.
existiert nicht, aber lim x1 = ∞ und lim x1 = −∞ .
x↓0
x↑0
(v) lim sign(x) existiert nicht, aber lim sign(x) = 1 und lim sign(x) = −1.
x→0
x↓0
x↑0
Satz 3.23 Ist I ein Intervall, f : I → R und a ∈ I ein innerer Punkt, dann gilt:
A := lim f (x)
x→a
existiert genau dann, wenn links- und rechtsseitiger Grenzwert existieren und übereinstimmen
lim f (x) = A = lim f (x).
x↓a
x↑a
Den Zusammenhang zwischen den Grenzwerten von Funktionen und der Stetigkeit von Funktionen stellt
der folgenden fundamentale Satz her.
Satz 3.24 Eine Funktion f : M → R ist stetig in x0 ∈ M genau dann, wenn f (x0 ) = lim f (x).
x→x0
50
Stetige Funktionen und Grenzwerte
Beispiel 3.25 Für 0 < x < π ist (siehe Skizze)
sin(x) ≤ x ≤ tan(x).
Benutzen wir jetzt tan(x) =
sin(x)
cos(x)
und teilen wir durch sin(x), so erhalten wir
1
x
≤
.
sin(x)
cos(x)
1≤
Bilden wir Kehrwerte, so kehren sich auch die Ungleichungen um:
sin(x)
≥ cos(x).
x
1≥
(3.6)
Wegen sin(−x) = − sin(x) und cos(−x) = cos(x) gilt (3.6) für alle x mit |x| <
ist lim cos(x) = cos(0). Also ist
x→0
1 ≥ lim
x→0
Mithin ist lim
x→0
sin(x)
x
sin(x)
≥ cos(0) = 1.
x
= 1. Als Folgerung sehen wir, dass die Funktion

 sin(x) ,
x
x 7→

1,
R → R,
x 6= 0,
x = 0,
stetig in 0 ist.
x
tan(x)
sin(x)
1
F IGUR . Zur Veranschaulichung von sin(x) ≤ x ≤ tan(x), x > 0.
Der eingezeichnete Kreisbogen hat die Länge x.
π
2.
Da cos stetig bei 0 ist,
3.5
51
Grenzwerte von Funktionen
Satz 3.26 Sei M ⊂ R und a ein Häufungspunkt von M sowie λ ∈ R. Seien, f, g : M → R Abbildungen,
die für x → a einen Limes in R besitzen. Dann existieren auch die folgenden Limiten, und es gilt:
lim (f ± g)(x) = lim f (x) ± lim g(x),
x→a
x→a
x→a
lim (λ f )(x) = λ lim f (x),
x→a
x→a
lim (f · g)(x) = lim f (x) · lim g(x).
x→a
x→a
x→a
(1)
(2)
(3)
Ist außerdem lim g(x) 6= 0, so gilt auch
x→a
lim f (x)
f (x)
= x→a
.
x→a g(x)
lim g(x)
lim
x→a
Bemerkung 3.27 Sind f : L → M und g : M → N stetig, so gilt für x0 ∈ L
lim g ◦ f (x) = g lim f (x) = g ◦ f (x0 ).
x→x0
x→x0
Also ist g ◦ f stetig. Das liefert einen alternativen Beweis für Satz 3.8.
(4)
52
Stetige Funktionen und Grenzwerte
Kapitel 4
Differentialrechnung von Funktionen
einer Variablen
4.1
Einführung
f(x)
f’(x 0 )
Sei im Folgenden stets I ⊂ R ein offenes Intervall, f : I → R eine Abbildung
und x0 ∈ I. Wir wollen die Steigung der
Funktion f an der Stelle x0 bestimmen.
Dazu müssen wir diesen Begriff erst einmal genau fassen. Eine Möglichkeit ist, die
Steigung der (eindeutig festgelegten) Tangente an den Graphen von f an der Stelle
(x0 , f (x0 )) zu definieren. Dies stößt allerdings in der praktischen Berechnung dieser Größe auf Schwierigkeiten. Etwas einfacher zu handhaben ist die Idee, dass man
die Sekante durch (x0 , f (x0 )) sowie einen
weiteren Punkt (x, f (x)) betrachtet. Wenn
man x gegen x0 schiebt (von rechts oder
links), so sollte die Steigung der Sekante
immer näher an die Steigung der obigen
Tangente geraten.
1
f(x0 )
x
x0
Tangente an f mit Steigung der Ableitung f’
F IGUR .
f(x)-f(x 0)
x-x 0
1
x0
Sekante an f mit Steigung des Differenzenquotienten
F IGUR .
53
x
54
Differentialrechnung von Funktionen einer Variablen
Definition 4.1 Die Funktion f heißt differenzierbar in x0 , falls der Grenzwert x → x0 der Differenf (x) − f (x0 )
zenquotienten
existiert und endlich ist. Wir schreiben dann
x − x0
f 0 (x0 ) := lim
x→x0
f (x0 + h) − f (x0 )
f (x) − f (x0 )
= lim
h→0
x − x0
h
und nennen f 0 (x0 ) die Ableitung von f an der Stelle x0 .
Ist f in jedem Punkt x0 ∈ I differenzierbar, so heißt f differenzierbar schlechthin.
Weitere Schreibweisen für die Ableitung sind
f 0 (x0 ) =
Beispiele 4.2
df
d
(x0 ) =
f (x)
= f˙(x0 ) = Df (x0 ).
x=x0
dx
dx
(4.1)
(i) I = R, f (x) = 5 + 3x, x0 ∈ R beliebig. Dann ist
f (x) − f (x0 )
5 + 3x − (5 + 3x0 )
3(x − x0 )
=
=
= 3,
x − x0
x − x0
x − x0
also ist f 0 (x0 ) = 3. Das soll natürlich auch so sein, denn die lineare Funktion f mit Steigung 3 muss
wohl die Ableitung 3 haben, wenn wir keinen ganz groben Fehler gemacht haben.
(ii) I = R, f (x) = x2 ,
x2 + 2hx0 + h2 − x20
f (x0 + h) − f (x0 )
h→0
= 0
= 2x0 + h −→ 2x0 .
h
h
Also ist f 0 (x0 ) = 2x0 .
√
(iii) I = (0, ∞), f (x) = x,
√
√
√ √
√ √
x0 + h − x0
x0 + h + x0
x0 + h − x0
f (x0 + h) − f (x0 )
√
=
=
√ h
h
h x0 + h + x0
=
x + h − x0
1
h→0
√0
√ −→ √ .
2 x0
h x0 + h + x0
(iv) I = R, f (x) = |x|. Für x0 = 0 ist f (x0 ) = 0 sowie
lim
x↓0
f (x)
f (x)
= 1 und lim
= −1.
x↑0 x
x
Also existiert der Grenzwert der Differenzenquotienten nicht, und damit ist f in x0 = 0 nicht differenzierbar.
p
(v) I = R, f (x) = sign(x) 3 |x| (das ist die Umkehrfunktion von x 7→ x3 ), sowie x0 = 0. Dann ist
√
3
2
f (x) − f (0)
x
lim
= lim
= lim x− 3 = ∞,
x↓0
x↓0 x
x↓0
x
√
3
2
f (x) − f (0)
−x
lim
= lim
= lim x− 3 = ∞.
x↑0
x↑0 −x
x↓0
x
Der Grenzwert der Differenzenquotienten existiert also nur uneigentlich (das heißt, ist ∞). Mithin ist
f in x0 = 0 nicht differenzierbar.
4.1
55
Einführung
Satz 4.3 Ist f in x0 differenzierbar, dann existiert eine Funktion x 7→ εx0 (x) mit
f (x) = f (x0 ) + f 0 (x0 ) · (x − x0 ) + εx0 (x) · (x − x0 )
und lim εx0 (x) = 0.
x→x0
Beweis Setze
εx0 (x) =
f (x) − f (x0 )
− f 0 (x0 ).
x − x0
2
Per Definition der Ableitung ist lim εx0 (x) = 0.
x→x0
Satz 4.4 Ist f in x0 differenzierbar, so ist f in x0 stetig.
Beweis
lim f (x) = lim f (x0 ) + f 0 (x0 )(x − x0 ) + εx0 (x)(x − x0 )
x→x0
= f (x0 ) + lim f 0 (x0 )(x − x0 ) + lim εx0 (x)(x − x0 )
x→x0
x→x0
|
{z
} |
{z
}
x→x0
=0
=0
= f (x0 ).
2
56
4.2
Differentialrechnung von Funktionen einer Variablen
Ableitungen einiger wichtiger Funktionen
In diesem Abschnitt soll eine Tabelle einiger wichtiger Funktionen (mit Definitionsbereich I) und ihrer
Ableitungen angegeben werden. Zusammen mit den Rechenregeln für das Ableiten zusammengesetzter
Funktionen lassen sich damit die allermeisten Funktionen von Hand differenzieren.
f (x)
f 0 (x)
I
c (konstant)
0
R
xn , n ∈ N
nxn−1
R
xk , k ∈ Z \ {0}
kxk−1
R \ {0}
xr , r ∈ R
√
x
rxr−1
1
√
2 x
(0, ∞)
exp(x)
R
(0, ∞)
sin(x)
exp(x)
1
x
cos(x)
cos(x)
− sin(x)
R
1
1 + tan(x)2 =
cos(x)2
1
√
1 − x2
−1
√
1 − x2
1
1 + x2
R \ {(2k + 1) π2 , k ∈ Z}
log(x)
tan(x)
arcsin(x)
arccos(x)
arctan(x)
(0, ∞)
R
(−1, 1)
(−1, 1)
R
Bemerkung 4.5 Wo die Funktionen komplexe Argumente zulassen, kann man formal auch z ∈ C statt
x ∈ R einsetzen. Daraus lässt sich, wie wir noch sehen werden, ein nützlicher Kalkül entwickeln.
4.3
4.3
57
Rechenregeln für Ableitungen
Rechenregeln für Ableitungen
Satz 4.6 (Summen-, Produkt,- und Quotientenregel) Sind f, g : I → R differenzierbar, so lassen sich
auch die folgenden Ableitungen bilden und es gilt
(f + g)0 = f 0 + g 0
(f − g)0 = f 0 − g 0
(f g)0 = f 0 g + f g 0
0
f
f 0 g − f g0
(x),
(x) =
g
g2
Beispiele 4.7
wo g(x) 6= 0.
(i) f (x) = x7 + 3x4 + 1, f 0 (x) = 7x6 + 12x3 .
(ii) f (x) = x9 sin(x), f 0 (x) = 9x8 sin(x) + x9 cos(x).
(iii) f (x) = x3 (x2 + cos(x)), f 0 (x) = 3x2 (x2 + cos(x)) + x3 (2x − sin(x)).
(iv) f (x) = x7 tan(x) log(x)
0
f 0 (x) = 7x6 tan(x) log(x) + x7 tan(x) log(x)
1
1
log(x) + x7 tan(x)
2
cos(x)
x
7
x
log(x)
= x6 tan(x) (7 log(x) + 1) +
cos(x)2
= 7x6 tan(x) log(x) + x7
(v) f (x) = tan(x) =
cos(x)2 − sin(x)(− sin(x))
1
sin(x) 0
, f (x) =
=
.
2
cos(x)
cos(x)
cos(x)2
Satz 4.8 (Kettenregel) (i) Sind I, J ⊂ R offene Intervalle und f : I → J und g : J → R differenzierbar,
so ist auch h = g ◦ f in I differenzierbar mit Ableitung
h0 (x) = (g ◦ f )0 (x) = f 0 (x) · g 0 (f (x)).
Die Sprechweise für diese Regel lautet oft: Innere Ableitung mal äußere Ableitung“.
”
Ist f nur in x0 und g nur in f (x0 ) differenzierbar, so ist h in x0 differenzierbar.
(ii) Ist speziell h(x) = g(λx) für ein λ ∈ R, so ist h0 (x) = λg 0 (λx).
Beispiele 4.9
(i) h(x) = sin(x2 ), f (x) = x2 , g(x) = sin(x). Dann ist
h0 (x) = f 0 (x) · g 0 (f (x)) = 2x cos(x2 ).
58
Differentialrechnung von Funktionen einer Variablen
(ii) h(x) = 2x = exp(x · log(2)). Dann ist
h0 (x) = log(2) exp(x log(2)) = log(2) · 2x .
(iii) h(x) =
q
tan e−x2 = f1 (f2 (f3 (f4 (x)))), wobei
f1 (x) =
√
x,
f2 (x) = tan(x),
f3 (x) = ex ,
f4 (x) = −x2 ,
1
f10 (x) = √
2 x
f20 (x) = 1 + tan(x)2
f30 (x) = ex
f40 (x) = −2x.
Sukzessive Anwendung der Kettenregel liefert
h0 (x) = f40 (x) · f30 (f4 (x)) · f20 (f3 (f4 (x))) · f10 (f2 (f3 (f4 (x))))
2
2 2
1
= −2x · e−x · 1 + tan e−x
.
· p
2 tan(e−x2 )
Noch allgemeiner als im Beispiel (iii) kann man Verknüpfungen von n Funktionen ableiten. Die genaue
Regel gibt das folgende Korollar (=Schlussfolgerung des letzten Satzes) der Kettenregel an.
Korollar 4.10 Ist n ∈ N und h(x) = f1 (f2 (· · · fn (x)) · · · ), wobei f1 , . . . , fn differenzierbar sind, so ist h
differenzierbar mit Ableitung
0
0
h0 (x) = fn0 (x) · fn−1
(fn (x)) · fn−2
(fn−1 (fn (x))) · · · f10 (f2 (f3 (· · · fn (x)) · · · ).
Ein weiteres wichtiges Korollar zur Kettenregel gibt an, wie die Ableitungen von Umkehrfunktionen aussehen.
Korollar 4.11 Ist f : I → J umkehrbar und differenzierbar, so ist g := f −1 ebenfalls differenzierbar in
allen Punkten x ∈ J mit f 0 (f −1 (x)) 6= 0, und es ist dort
(f −1 )0 (x) = g 0 (x) =
1
f 0 (f −1 (x))
.
Beweis Wir zeigen hier nicht die Differenzierbarkeit von f −1 , sondern lediglich, wie man die Ableitung
von f −1 ausrechnet. Sei h(x) = f (f −1 (x)). Dann ist nach der Kettenregel h0 (x) = (f −1 )0 (x)·f 0 (f −1 (x)).
Andererseits ist h(x) = x, also h0 (x) = 1, also 1 = f −1 · f 0 (f −1 (x)). Teilt man jetzt durch f 0 (f −1 (x)),
so folgt die Aussage des Korollars.
2
Beispiele 4.12
Also ist
(i) Die Logarithmusfunktion log ist die Umkehrfunktion der Exponentialfunktion exp .
log0 (x) =
1
exp0 (log(x))
=
1
1
= .
exp(log(x))
x
Das erklärt die Formel aus der Tabelle in Abschnitt 4.2.
4.4
59
Zwei Anwendungen
(ii) Wir benutzen die Identität sin(x)2 + cos(x)2 = 1, um zu zeigen, dass
1
sin (arcsin(x))
1
=
cos(arcsin(x))
1
1
.
=p
=√
2
1 − x2
1 − sin(arcsin(x))
arcsin0 (x) =
4.4
0
Zwei Anwendungen
Wir kommen jetzt zu zwei kleinen Anwendungen des bisher Gelernten.
4.13 Beispiel Wir wollen uns den Kalkül der Ableitungen mit komplexen Argumenten zu Nutze machen,
um die Ableitungen von sin und cos zu bestimmen.
Betrachte die Funktion f : C → C, z 7→ exp(iz). Nach den formalen Rechenregeln können wir f differenzieren
f 0 (z) = i · exp(iz) = i · f (z).
Setzen wir jetzt für z reelle Werte x ein, so ist
f (x) = cos(x) + i sin(x)
(4.2)
f 0 (x) = i · f (x) = − sin(x) + i cos(x)
(4.3)
und
Wenn wir andererseits in (4.2) direkt ableiten, so erhalten wir nach der Summenformel
f 0 (x) = cos0 (x) + i sin0 (x).
(4.4)
Da Real- und Imaginärteil in (4.3) und (4.4) übereinstimmen müssen, ist cos0 (x) = − sin(x) und sin0 (x) =
cos(x).
Wir haben so mit Hilfe der komplexen Zahlen einen schnellen Weg gefunden, um die Winkelfunktionen zu
differenzieren.
In der Tabelle in Abschnitt 4.2 haben wir jetzt also alle Einträge aus den beiden Funktionen x 7→ xr und
x 7→ exp(x) und den Rechenregeln herleiten können.
4.14 Beispiel Wir betrachten das Problem, dass wir die Stoffkonzentration f (t) des Ausgangsstoffes bei
einer Zerfallsreaktion erster Ordnung aus elementaren Überlegungen heraus als Funktion der Zeit t angeben
wollen.
Der Stoffumsatz f (t)−f (t+h) soll für kleine Zeiten h in etwa proportional zur vorhandenen Konzentration
f (t) sowie zur verstreichenden Zeit h sein. Also f (t) − f (t + h) ≈ k · hf (t) für kleine h > 0 und eine
Konstante k > 0. Lösen wir dies nach f (t + h) auf, so erhalten wir
f (t + h) ≈ (1 − kh)f (t).
60
Differentialrechnung von Funktionen einer Variablen
Speziell ist also
f (h) ≈ (1 − kh)f (0)
und
f (2h) ≈ (1 − kh)f (h) ≈ (1 − kh)2 f (0)
sowie
f (nh) ≈ (1 − kh)n f (0).
Setzen wir t = nh, also n = ht , so erhalten wir
f (t)
≈ (1 − kh)t/h .
f (0)
Dabei sollte hier Gleichheit herrschen, wenn wir h nach 0 gehen lassen, also
f (t)
= lim(1 − kh)t/h .
h↓0
f (0)
(4.5)
Schreiben wir jetzt ax um als exp(x log(a)) und benutzen in der zweiten Gleichung die Stetigkeit der
Exponentialfunktion, so erhalten wir
t
f (t)
= lim exp
log(1 − kh)
h↓0
f (0)
h
t
= exp lim log(1 − kh)
h↓0 h
=0
z }| {
log(1 − kh) − log(1) = exp t lim
h↓0
h
= exp(tg 0 (0)),
k
, also
wobei wir g(x) = log(1 − kx) gesetzt haben. Wir können die Ableitung ausrechnen g 0 (x) = − 1−kx
0
g (0) = −k, und erhalten so das klassische Gesetz für Reaktionen erster Ordnung
f (t)
= exp(−kt).
f (0)
4.5
(4.6)
Die de L’Hospital’sche Regel
Als wir in Beispiel 3.25 auf Seite 50 den Grenzwert lim sin(x)
bestimmt hatten, mussten wir uns erheblich
x
x→0
anstrengen und geometrische Hilfsmittel benutzen. Wir suchen nun nach einem systematischen Verfahren,
um Grenzwerte vom Typ
f (x)
lim
x→a g(x)
zu bestimmen, wenn f (a) = g(a) = 0 ist.
4.6
61
Höhere Ableitungen
Satz 4.15 (de l’Hospital’sche Regel) Sei I ⊂ R ein Intervall und f, g : I → R differenzierbar, sowie
a ∈ I ein innerer Punkt mit f (a) = g(a) = 0. Dann ist
f (x)
f 0 (x)
= lim 0
,
x→a g(x)
x→a g (x)
lim
(4.7)
falls der Grenzwert existiert. Ist a ein Randpunkt von I (beziehungsweise a = −∞ oder a = ∞, falls I
unbeschränkt ist), und ist
• lim f (x) = lim g(x) = 0
x→a
x→a
• oder lim f (x) = ±∞ und lim g(x) = ±∞,
x→a
x→a
so gilt ebenfalls (4.7).
Dasselbe gilt analog für einseitige Grenzwerte (also x ↑ a und x ↓ a)
Beispiele 4.16
(ii) lim
x→0
cos(x)
sin(x)
= lim
= 1.
x→0
x
1
(i) sin0 (0) = lim
x→0
1 − cos(x)
sin(x)
1
= lim
= .
x→0 2x
x2
2
1
log(x)
= lim x = −1.
x→1 1 − x
x→1 −1
(iii) lim
log(x)
√
= lim
x→∞
x→∞
x
(iv) lim
(v) lim x log(x) = lim
x↓0
x↓0
1
x
1
√
2 x
log(x)
1
x
2
= lim √ = 0.
x→∞
x
1
x
x↓0 − 12
x
= lim
= lim(−x) = 0.
x↓0
ex − x − 1
ex − 1
ex
1
(vi) lim
=
lim
=
lim
= . Hier wurde die de l’Hospital’sche Regel zweimal
2
x→0
x→0
x→0 2
x
2x
2
hintereinander angewendet.
4.6
Höhere Ableitungen
Sei I ⊂ R ein Intervall und f : I → R eine differenzierbare Funktion. Wir haben bisher die Ableitung f 0
von f kennen gelernt. Ist f 0 selber jedoch wieder differenzierbar, so kann uns nichts daran hindern, diese
Funktion auch abzuleiten.
Definition 4.17 (Höhere Ableitungen) Ist die Ableitung f 0 von f differenzierbar, so heißt die Ableitung
f 00 von f 0 die zweite Ableitung von f oder die Ableitung zweiter Ordnung von f .
Wir können dies Verfahren fortführen, solange die jeweilige Ableitung differenzierbar ist und nennen die
Funktionen f 000 , f 0000 usw. die dritte, vierte usw. Ableitung von f , oder die Ableitung dritter, vierter usw.
Ordnung.
62
Differentialrechnung von Funktionen einer Variablen
Die Ableitung n-ter Ordnung wird auch bezeichnet mit
f (n) (x) =
dn
f (x) = Dn f (x).
dxn
Die Funktion f heißt n-mal differenzierbar, wenn wir die n-te Ableitung bilden können. Ist f (n) stetig, so
heißt f n-mal stetig differenzierbar.
Beispiel 4.18 Bezeichnet f (t) die Position eines Fahrzeugs auf einer Straße zur Zeit t, so ist f 0 (t) die
Geschwindigkeit des Fahrzeugs und f 00 (t) seine Beschleunigung.
Kapitel 5
Kurvendiskussion von Funktionen einer
Variablen
Eine der wichtigsten Anwendungen der Differentialrechnung ist es zu bestimmen, wo eine Funktion minimal beziehungsweise maximal wird. Wir definieren im ersten Abschnitt die Begriffe, bringen sie im
nächsten Abschnitt in Zusammenhang mit den Monotonieeigenschaften der Funktion und stellen in einem
dritten und vierten Abschnitt zusammen, wo die Verbindung zu den Ableitungen der Funktion ist. Schließlich wird die Diskussion in einem fünften Abschnitt zusammengefasst und eine Art Checkliste angegeben
für die Fragen, die durch die Kurvendiskussion beantwortet werden sollen.
5.1
Extremalstellen
Definition 5.1 (Extremalstellen) Sei f : M → R eine Funktion. Eine Zahl m∗ ∈ R heißt Maximum von
f , symbolisch m∗ = max(f ), falls
f (x) ≤ m∗
für alle x ∈ M
(5.1)
für (wenigstens) ein x∗ ∈ M.
(5.2)
und
f (x∗ ) = m∗
Die (im allgemeinen nicht eindeutige) Zahl x∗ heißt Maximalstelle von f , symbolisch x∗ = arg max(f ).
Man sagt, dass f in x∗ das Maximum annimmt, oder dass f in x∗ das Maximum hat.
Analog wird das Minimum m∗ = min(f ) von f definiert und die Minimalstelle x∗ = arg min(f ) (mit dem
≥“–Zeichen in (5.1)).
”
Beide Punkte x∗ und x∗ werden Extremalstellen genannt.
Beispiele 5.2
(i) M = [0, 2π], f (x) = sin(x). Dann ist
m∗ = 1,
x∗ =
π
2
und
m∗ = −1,
x∗ =
3π
.
2
Bei dem hier gewählten Intervall [0, 2π] sind die Punkte x∗ und x∗ eindeutig bestimmt.
63
64
Kurvendiskussion von Funktionen einer Variablen
(ii) M = R, f (x) = cos(x). Dann ist
m∗ = 1,
x∗ ∈ {2k · π, k ∈ Z} = Menge der Maximalstellen
und
m∗ = −1,
x∗ ∈ {(2k + 1) · π, k ∈ Z} = Menge der Minimalstellen.
(iii) M = R, f (x) = x2 − 2x = (x − 1)2 − 1. Dann ist m∗ = −1 und x∗ = 1, jedoch gibt es keine
Maximalstelle.
(iv) M = − π2 , π2 , f (x) = tan(x). Es gibt keine Extremalstellen.
(v) M = R, f (x) = exp(−x2 ). Dann ist m∗ = 1, x∗ = 0, jedoch gibt es keine Minimalstelle. In der
Tat ist lim exp(−x2 ) = 0. Andererseits ist exp(−x2 ) > 0 für jedes x ∈ R. Somit käme für das
x→∞
Minimum nur 0 als Wert in Frage, dieser Wert wird jedoch nicht angenommen.
Es tritt öfter der Fall ein, dass eine Funktion lokal, also in einer kleinen Umgebung betrachtet, ein Maximum
(oder Minimum) annimmt, das jedoch global betrachtet (also im gesamten Definitionsbereich gesehen)
keines ist.
f (x) = x4 − 2x2 + 1
2
1.5
1
0.5
–1.5
–1
–0.5
0
0.5
x
1
1.5
F IGUR . f nimmt in 0 ein lokales Maximum an, das jedoch global kein Maximum ist.
Dies motiviert die folgende Definition.
Definition 5.3 (lokale Extremalstellen) Ist M ⊂ R, so heißt x∗ ∈ M eine lokale Minimalstelle von
f : M → R, falls es ein ε > 0 gibt mit
f (x) ≥ f (x∗ ) für alle x ∈ Uε (x∗ ) ∩ M.
(5.3)
f (x∗ ) heißt dann lokales Minimum von f . Ein lokales Minimum heißt isoliert, falls in (5.3) die strikte
Ungleichung gilt (für x 6= x∗ ).
Analog definieren wir lokale Maximalstelle, lokales Maximum, isoliertes lokales Maximum, sowie lokale
Extremalstelle usf.
5.2
65
Monotonie
Manchmal spricht man zur Unterscheidung von lokalen Extrema zu Extrema in letzterem Fall auch von
globalen Extrema.
5.4 Beispiel M = R, f (x) = x4 − 2x2 + 1. Die Funktion nimmt in 0 ein lokales Maximum an, denn
f (x) < f (0) = 1 für jedes x ∈ R mit 0 < |x| < 1, also für jedes x ∈ Uε (x∗ ) \ {0}, wobei x∗ = 0 und
ε = 1. Die lokale Maximalstelle x∗ = 0 ist also auch isoliert.
Dieses lokale Maximum ist kein globales Maximum, weil beispielsweise f (2) = 9 > 1 = f (0).
Zumindest auf abgeschlossenen Intervallen und bei stetigen Funktionen brauchen wir uns keine Sorgen
um die Existenz von Extremalstellen zu machen. Auskunft gibt der folgende Satz, der hier nicht bewiesen
werden kann.
Satz 5.5 Ist f : [a, b] → R stetig, so nimmt f Minimum und Maximum an.
Um Extremalstellen nachzuweisen, sind die ersten und zweiten Ableitungen einer Funktion (falls existent)
hilfreich. Ein erster Schritt ist der folgende Satz.
Satz 5.6 Sei I ⊂ R ein Intervall, c ∈ I ein innerer Punkt und f : I → R eine in c differenzierbare
Funktion. Hat f in c eine lokale Extremalstelle, so ist f 0 (c) = 0.
Beweis Ohne Einschränkung der Allgemeinheit sei hier nur der Fall betrachtet, wo c eine lokale Maximalstelle ist. Dann ist für x hinreichend nahe an c: f (x) − f (c) ≤ 0, also
0 ≤ lim
x↑c
f (x) − f (c)
f (x) − f (c)
= f 0 (c) = lim
≤ 0.
x↓c
x−c
x−c
Also ist f 0 (c) = 0.
2
Beispiele 5.7
(i) I = R, f (x) = x2 − 2x, x∗ = 1 Minimalstelle. Es ist f 0 (x) = 2x − 2, also f 0 (x∗ ) =
2x∗ − 2 = 0.
(ii) I = R, f (x) = exp(−x2 ), x∗ = 0 Minimalstelle. Es ist f 0 (x) = −2x exp(−x2 ), also f 0 (x∗ ) = 0.
1
(iii) I = R, f (x) = arctan(x), f 0 (x) = 1+x
2 > 0. Da die erste Ableitung keine Nullstelle hat, hat f
keine (lokalen oder globalen) Extremalstellen.
(iv) Hat f in einem Randpunkt des Intervalls ein lokales Extremum, so muss dort die (einseitige) Ableitung nicht notwendigerweise verschwinden. Seien nämlich I = [0, 1] und f (x) = x. Dann hat f in
x∗ = 1 eine Maximalstelle, aber f 0 (x) = 1 verschwindet nirgends.
(v) Die Umkehrung des Satzes gilt nicht: Sei I = R und f (x) = x3 . Dann ist f 0 (x) = 3x2 und
f 0 (x) = 0. Jedoch hat f in 0 kein lokales Extremum, weil f (x) < 0 für x < 0 und f (x) > 0
für x > 0.
5.2
Monotonie
Wir wollen hier die Monotonieeigenschaften einer differenzierbaren Funktion näher betrachten. Zunächst
brauchen wir ein paar vorbereitende Sätze.
66
Kurvendiskussion von Funktionen einer Variablen
Satz 5.8 (Satz von Rolle) Sei f : [a, b] → R stetig und in (a, b) differenzierbar sowie f (a) = f (b). Dann
gibt es ein c ∈ (a, b) mit f 0 (c) = 0.
Beweis Da f stetig ist, nimmt f das Minimum m∗ sowie das Maximum m∗ in [a, b] an (Satz 5.5). Ist
m∗ = m∗ , so ist wegen m∗ ≤ f (x) ≤ m∗ für jedes x ∈ [a, b] auch f (x) = f (a) = f (b) = m∗ = m∗ .
Damit ist f konstant, also f 0 (x) = 0 für jedes x ∈ (a, b).
Ist andererseits m∗ < m∗ , so ist entweder m∗ < f (a) oder m∗ > f (a), oder beides. Betrachten wir den
Fall m∗ < f (a). Dann gibt es ein x∗ ∈ (a, b) mit f (x∗ ) = m∗ . Weil x∗ eine Minimalstelle von f und ein
innerer Punkt von [a, b] ist, ist f 0 (x∗ ) = 0 nach Satz 5.6. Der Fall m∗ > f (a) funktioniert genauso.
2
5.9 Beispiel f : [−1, 1] → R, f (x) = x4 −2x2 . Dann ist f (−1) = f (1) = −1. Weiter ist f 0 (x) = 4x3 −4x
und damit f 0 (0) = 0.
Korollar 5.10 (Mittelwertsatz der Differentialrechung) Ist f : [a, b] → R stetig und in (a, b) differenzierbar, so existiert ein c ∈ (a, b) mit
f (b) − f (a)
.
f 0 (c) =
b−a
Beweis Setze
h(x) = f (x) − (x − a)
Dann ist h(a) = f (a), h(b) = f (b) − (b − a)
h0 (c) = 0. Es ist aber
f (b) − f (a)
.
b−a
f (b) − f (a)
= f (a) = h(a). Also existiert ein c ∈ (a, b) mit
b−a
h0 (x) = f 0 (x) −
also
f 0 (c) =
f (b) − f (a)
,
b−a
f (b) − f (a)
.
b−a
2
Korollar 5.11 Ist f : [a, b] → R stetig und in (a, b) differenzierbar mit Ableitung f 0 (x) = 0 für alle
x ∈ (a, b), so ist f konstant: f (x) = f (a) = f (b) für alle x ∈ [a, b].
Eine weitere wichtige Schlussfolgerung aus dem Mittelwertsatz gibt uns an, wie der Zusammenhang zwischen der Monotonie einer Abbildung und dem Vorzeichen ihrer Ableitung ist. Aufgrund der Wichtigkeit
der Aussage formulieren wir sie hier als Satz.
Satz 5.12 Sei I ⊂ R ein Intervall und f : I → R stetig und (im Inneren von I) differenzierbar. Dann gilt
(i)
f 0 (x) ≥ 0 für alle inneren Punkte x ∈ I
⇐⇒
f
ist monoton wachsend
f 0 (x) ≤ 0 für alle inneren Punkte x ∈ I
⇐⇒
f
ist monoton fallend
f 0 (x) > 0 für alle inneren Punkte x ∈ I
=⇒ f
ist streng monoton wachsend
f 0 (x) < 0 für alle inneren Punkte x ∈ I
=⇒ f
ist streng monoton fallend
(ii)
5.3
67
Bestimmung der Extremalstellen
Beispiele 5.13
(i) I = R, f (x) = arctan(x). Dann ist f 0 (x) =
streng monoton wachsend.
1
1+x2
> 0. Also ist die Funktion arctan
(ii) I = R, f (x) = exp(x). Dann ist f 0 (x) = exp(x) > 0, also exp streng monoton wachsend.
(iii) I = R, f (x) = x2 . Dann ist f 0 (x) = 2x. Die Ableitung ist strikt negativ für x < 0 und strikt positiv
für x > 0. Wir wenden also den Satz für (−∞, 0] und [0, ∞) und erhalten, dass f streng monoton
1
fallend ist in (−∞, 0] und streng monoton wachsend in [0, ∞).
0.8
(iv) I = R, f (x) = (1 − sign(x))x2 . Dann ist
4x, falls x ≤ 0,
0
f (x) =
0,
falls x > 0.
0.6
y
0.4
0.2
Also ist f 0 (x) ≤ 0 für alle x ∈ R und damit f monoton fallend. –1
Allerdings ist f nicht streng monoton fallend, da f (x) = 0 für
alle x ≥ 0.
–0.8
–0.6
–0.4
–0.2
0
0.2
0.4
0.6
F IGUR . f (x) = (1 − sign(x))x2
(v) I = R, f (x) = x3 . Dann ist f 0 (x) = 3x2 ≥ 0. Also ist f monoton wachsend. Man kann sogar
zeigen, dass f streng monoton wachsend ist, aber dies liefert unser Satz nicht, denn f 0 (0) = 0, also
haben wir nicht die strikte Ungleichung, die in Teil (ii) des Satzes benötigt wurde.
5.3
Bestimmung der Extremalstellen
Wir haben in Abschnitt 5.1 gesehen, dass lokale Extremalstellen einer differenzierbaren Funktion nur dort
vorliegen, wo die Ableitung verschwindet. Wie das Beispiel f (x) = x3 zeigt, wo f 0 (0) = 0 ist, jedoch kein
lokales Extremum in 0 vorliegt, müssen wir zusätzliche Informationen über f haben, um eine Extremalstelle
zu detektieren. Ist c eine Stelle, sodass f links von c monoton wachsend ist und rechts von c monoton
fallend, so liegt in c offenbar ein lokales Maximum vor. Nach den Ergebnissen des letzten Abschnitts geht
dies mit einem Vorzeichenwechsel von f 0 einher. Wir wollen zunächst den Begriff des Vorzeichenwechsels
präzise fassen und dann das hier anschaulich gewonnene Ergebnis in einem Satz formulieren.
Definition 5.14 Sei I ⊂ R ein Intervall und a ∈ I ein innerer Punkt. Wir sagen, dass das Vorzeichen einer
Funktion g : I → R im Punkt a von − nach + wechselt, falls g(a) = 0 und
lim sign(g(x)) = −1,
x↑a
0.8
x
–0.2
lim sign(g(x)) = +1,
x↓a
falls also:
für alle x < a hinreichend nahe an a gilt g(x) < 0
und
für alle x > a hinreichend nahe an a gilt g(x) > 0.
Analog führen wir die Sprechweise ein, dass das Vorzeichen von + nach − wechselt.
Lemma 5.15 Ist g differenzierbar und g(a) = 0, g 0 (a) > 0 (beziehungsweise g 0 (a) < 0), so wechselt das
Vorzeichen von g in a von − nach + (beziehungsweise von + nach −).
Beispiele 5.16
(i) I = R, g(x) = x2 − 1, a = −1. Dann ist g 0 (x) = 2x und g(−1) = 0, g 0 (−1) =
−2 < 0. Das Vorzeichen wechselt also in −1 von + nach −.
1
68
Kurvendiskussion von Funktionen einer Variablen
(ii) I = R, g(x) = x3 , a = 0. Das Vorzeichen wechselt in 0 von − nach +, jedoch ist g 0 (0) = 0. Das
Kriterium in dem Lemma ist also nur hinreichend und nicht notwendig.
Satz 5.17 Sei f : I → R differenzierbar und a ∈ I ein innerer Punkt mit f 0 (a) = 0.
(i) Ist f sogar zweimal differenzierbar und f 00 (a) < 0 (beziehungsweise f 00 (a) > 0), so hat f in a ein
isoliertes lokales Maximum (beziehungsweise Minimum).
(ii) Wechselt das Vorzeichen von f 0 in a von + nach − (beziehungsweise von − nach +), so hat f in a
ein isoliertes lokales Maximum (beziehungsweise Minimum).
(iii) Hat die Funktion f 0 in a ein isoliertes lokales Extremum, so hat f in c kein lokales Extremum.
Offenbar folgt aus (i) schon (ii) (Lemma 5.15). Fall (ii) tritt also häufiger auf. In der Praxis ist jedoch (i) oftmals einfacher zu prüfen. Man wird also so vorgehen (um bei hinreichend oft differenzierbaren Funktionen
ein lokales Extremum im Inneren des Definitionsbereichs zu detektieren):
5.18 Rezept (zur lokalen Extremalstellenanalyse im Inneren des Definitionsbereichs)
(1) Man prüft, ob f zweimal differenzierbar ist. Ist dies der Fall und die Ableitung ohne größere Umstände
zu berechnen, so prüft man, ob f 00 (a) < 0 (beziehungsweise f 00 (a) > 0). Ist dies richtig, so hat f in
a ein isoliertes lokales Maximum (beziehungsweise Minimum).
(2) Führt (1) nicht zum Erfolg, so prüft man, ob f 0 in a das Vorzeichen wechselt. Ist dies der Fall, so hat
f in a ein isoliertes lokales Extremum, und man ist fertig.
(3) Führen weder (1) noch (2) zu einem Ergebnis, so hat f vermutlich (aber nicht sicher) in a kein
isoliertes lokales Extremum. Um dies nachzuweisen, muss man testen, ob f 0 in a ein isoliertes lokales
Extremum hat. Dazu geht man wie oben vor, nur eben für f 0 statt für f . Hat jetzt f 0 in a ein isoliertes
lokales Extremum, so hat f in a kein ein isoliertes lokales Extremum, und man ist fertig.
(4) Bringen weder (1), (2) noch (3) ein Ergebnis, dann wird die Sache wirklich schwierig. Hier gibt es
dann keine Patentrezepte mehr und man muss sich neue Methoden überlegen.
(5) Ein paar der üblichen verdächtigen“ Stellen, die man zudem prüfen sollte, sind
”
(a) die Intervallenden,
(b) die Nicht-Differenzierbarkeitsstellen,
(c) die Nullstellen der Ableitungen an den Differenzierbarkeitsstellen.
Diese Stellen muss man, bei (c) eventuell mit (1)–(4), individuell untersuchen.
(6) Interessiert man sich nur für globale Extremalstellen einer stetigen Funktion auf einem abgeschlossenen Intervall und gibt es nur wenige Kandidaten der Typen (a), (b), (c) (es reicht auch, wenn einzelne
Punkte nur im Verdacht stehen, zu einem der drei Typen zu gehören, solange man nur alle tatsächlich
dazu gehörigen erfasst), dann braucht man nur die Funktionswerte dieser Kandidaten zu vergleichen
und die mit dem Kleinsten bzw. dem Größten heraus zu picken. Ist das Definitionsintervall nicht
abgeschlossen, so muss man zusätzlich noch das Grenzverhalten an den offenen Intervallenden untersuchen.
5.4
Krümmung
69
Beispiele 5.19
(i) I = R, f (x) = cos(x), a = 0. Die erste und zweite Ableitung sind f 0 (x) = − sin(x)
00
und f (x) = − cos(x). Also ist f 0 (0) = 0 und f 00 (0) = −1 < 0. Nach Punkt (1) unseres Rezeptes
haben wir also ein isoliertes lokales Maximum von f bei a = 0 festgestellt.
(ii) I = R, f (x) = x2 , a = 0. Die erste und zweite Ableitung sind f 0 (x) = 2x und f 00 (x) = 2. Also ist
f 0 (0) = 0 und f 00 (0) = 2 > 0. Nach Punkt (1) unseres Rezeptes haben wir also ein isoliertes lokales
Minimum von f bei a = 0 festgestellt.
(iii) I = R, f (x) = x4 , a = 0. Dann ist f 0 (x) = 4x3 und f 00 (x) = 12x2 . Also ist f 0 (0) = 0 und
f 00 (0) = 0. Punkt (1) unseres Rezeptes bringt kein Ergebnis, wir machen also bei Punkt (2) weiter.
Für x < 0 ist f 0 (x) < 0 und für x > 0 ist f 0 (x) > 0. Also wechselt f 0 in 0 das Vorzeichen von −
nach +. Ergebnis: f hat in 0 ein isoliertes lokales Minimum.
(iv) I = (− π2 , π2 ), f (x) = tan(x)−x, a = 0. Die ersten beiden Ableitungen sind f 0 (x) = 1+(tan(x))2 −
1 = (tan(x))2 und (nach der Kettenregel) f 00 (x) = 2 tan(x)((tan(x))2 + 1). Wegen tan(0) = 0 ist
f 0 (0) = tan(0)2 = 0 und f 00 (0) = 0. Also führt Punkt (1) zu keinem Ergebnis. Weiter geht es mit
Punkt (2): Für x 6= 0 ist tan(x) 6= 0, also f 0 (x) > 0. Mithin wechselt f 0 in 0 nicht das Vorzeichen.
Punkt (2) schlägt also auch fehl. Bei Punkt (3) stellen wir fest, dass f 0 (x) das globale Minimum 0
genau in dem einen Punkt x = 0 annimmt (klar, denn f 0 (x) > 0 für alle anderen x). Also hat f in 0
kein isoliertes lokales Extremum.
p
(v) Sei I = − 21 , 1 , f : I → R, x 7→ |x| + x. Für x ∈ I \ {0} hat man f 0 (x) = sign(x) · 2√1 x + 1,
für x = 0 ist f nicht differenzierbar. Einzige Nullstelle von f 0 auf I \ {0} ist x = − 41 . Damit
ergeben sich als Kandidaten für globale Extremalstellen: 0, − 14 sowie die Intervallenden − 12 , und
q
1. Die zugehörigen Funktionswerte sind 0, 14 , 12 − 12 ≈ 0.2071 und 2. Damit ist 0 mit f (0) = 0
globale Minimalstelle und 1 mit f (1) = 2 globale Maximalstelle.
Weitere Untersuchungen würden ergeben, dass − 21 lokale Minimalstelle und − 14 lokale Maximalstelle ist.
Bemerkung 5.20 Kann man eine Extremalstelle nicht explizit ausrechnen, so muss man sich anders behelfen, beispielsweise mit einem Intervallschachtelungsverfahren. Hat man so, beispielsweise, die lokale
Minimalstelle x∗ von f im Intervall [a, b] nachgewiesen (also mit einem Fehler von höchstens b − a), so ist
(a)
1
0
| ≤ b−a
|m∗ − f (b)+f
2
2 max{|f (x)| : x ∈ [a, b]}. Als Näherungswert bietet sich also 2 (f (a) − f (b)),
b−a
0
mit Fehler ≤ 2 max{|f (x)| : x ∈ [a, b]} an.
5.4
Krümmung
Ist der Graph einer Funktion f nach links gekrümmt, wie beispielsweise bei f (x) = x2 , so wollen wir f
konvex nennen. Ist andererseits der Graph nach rechts gekrümmt, so wollen wir f konkav nennen. Diese
Begriffe sind etwas willkürlich, und man muss sie an dieser Stelle schlicht auswendig lernen.
Wir müssen jetzt mathematisch präziser fassen, was wir mit der Redeweise nach links gekrümmt“ bezie”
hungsweise nach rechts gekrümmt“ meinen.
”
70
Kurvendiskussion von Funktionen einer Variablen
f
Verbindungsgerade G
f(b)
f(a)
a
Konvexe Funktion f
x
b
Definition 5.21 Sei I ⊂ R ein Intervall und f : I → R eine Funktion. und a, b ∈ I, a < b. Wir nennen die
Funktion f
• konvex, falls für jedes Teilintervall [a, b] ⊂ I und jedes x ∈ [a, b] der Punkt (x, f (x)) unter der
Verbindungsgeraden G von (a, f (a)) und (b, f (b)) liegt, falls also
f (x) ≤ f (a) +
x−a
f (b) − f (a)
b−a
für alle x ∈ [a, b].
(5.4)
• konkav, falls für jedes Teilintervall [a, b] ⊂ I und jedes x ∈ [a, b] der Punkt (x, f (x)) über der
Verbindungsgeraden G von (a, f (a)) und (b, f (b)) liegt, falls also
f (x) ≥ f (a) +
x−a
f (b) − f (a)
b−a
für alle x ∈ [a, b].
(5.5)
Ist J ⊂ I ein Teilintervall und gelten die obigen Aussagen nur für Teilintervalle [a, b] ⊂ J, so heißt f
konvex (beziehungsweise konkav) über J.
Wir sprechen von strikter Konvexität (beziehungsweise Konkavität), falls in (5.4) (beziehungsweise (5.5))
die strikte Ungleichung gilt (für x ∈ (a, b)).
Der Begriff der Striktheit der Konvexität beziehungsweise Konkavität steht für uns nicht im Mittelpunkt
und wird gleichsam nur am Rande erwähnt.
Obacht !! In einer in Bayern gebräuchlichen mathematischen Formelsammlung für das Gymnasium sind
die Definitionen der Begriffe konvex“ und konkav“ genau umgekehrt.
”
”
Den Zusammenhang zwischen den gerade eingeführten Begriffen und der zweiten Ableitung einer Funktion
stellt der folgende Satz her.
Satz 5.22 Ist f : I → R zweimal differenzierbar, so ist f
• konvex genau dann, wenn f 00 (x) ≥ 0 für alle inneren Punkte x ∈ I.
5.4
71
Krümmung
• konkav genau dann, wenn f 00 (x) ≤ 0 für alle inneren Punkte x ∈ I.
Beispiele 5.23
konvex).
(i) I = R, f (x) = x2 , f 00 (x) = 2 > 0. Also ist f konvex (tatsächlich sogar strikt
(ii) I = R, f (x) = sin(x). f 00 (x) = − sin(x). In [0, π] ist − sin(x) ≤ 0, also sin konkav (tatsächlich
sogar strikt konkav). In [π, 2π] ist − sin(x) ≥ 0, also sin konvex (tatsächlich sogar strikt konvex).
(iii) I = (0, ∞), f (x) = log(x). Dann ist f 0 (x) = x1 , f 00 (x) = − x12 < 0. Also ist log strikt konkav.
(iv) I = R. f (x) = |x| ist konvex, aber in 0 nicht differenzierbar. Außerdem ist f nicht strikt konvex.
Definition 5.24 Ist c ∈ I ein innerer Punkt und f konvex (beziehungsweise konkav) auf einem Teilintervall
[a, c] sowie konkav (beziehungsweise konvex) auf einem Teilintervall [c, b], so heißt c ein Wendepunkt von
f.
Satz 5.25 Ist f zweimal differenzierbar und wechselt f 00 in c das Vorzeichen, so ist c ein Wendepunkt von
f.
Beispiel 5.26 I = R, f (x) = x4 − 2x2 + 1 (siehe Figur auf Seite 64). Die erste und zweite Ableitung sind
q
f 0 (x) = 4x3 − 4x und f 00 (x) = 12x2 − 4 = 12 x2 − 13 . Also ist genau dann f 00 (x) < 0, wenn |x| < 13
q
q q
1
und genau dann f 00 (x) > 0, wenn |x| > 13 . Es folgt, dass f über − ∞, − 13 und
3 , ∞ konvex
q
q q q ist, über − 13 , 13 aber konkav. Also besitzt f zwei Wendepunkte: bei − 13 mit f − 13 = 49
q
q 1
und bei 13 mit f
= 94 .
3
72
Kurvendiskussion von Funktionen einer Variablen
5.5
Programm: Kurvendiskussion
Das Zusammentragen sämtlicher relevanter Daten einer Funktion f bezeichnet man als Kurvendiskussion.
Was relevant ist (und was nicht), hängt natürlich vom Einzelfall sowie der Interessenlage des Betrachters, also von der jeweiligen Anwendung, die man im Blick hat, ab. Typischerweise umfasst die Kurvendiskussion
wenigstens die Angabe der folgenden Informationen.
(1) Falls nur die Vorschrift x 7→ f (x) vorgegeben ist, muss ein sinnvoller maximaler Definitionsbereich
angegeben werden.
1
2
x→∞ x
(2) Verhalten von f an den Rändern des Definitionsbereiches. Also beispielsweise lim
0 und
lim 12
x→0 x
1
2
x→−∞ x
= 0, lim
= ∞.
(3) Nullstellen.
(4) Stetigkeit/Unstetigkeit von f .
(5) Differenzierbarkeit, gegebenenfalls Ausnahmestellen.
(6) Monotonieverhalten.
(7) Lage und Art der Extremalstellen (mit Angabe der Funktionswerte).
(8) Der Wertebereich von f .
(9) Krümmungsverhalten von f (Konkavitäts- und Konvexitätsbereiche, Wendepunkte).
(10) Skizze des Graphen an Hand dieser Informationen
• Manchmal kommt die Angabe besonderer Eigenschaften hinzu, wie beispielsweise f ungerade“
”
(d.h. f (−x) = −f (x) wie bei f (x) = sin(x)), f gerade“ (d.h. f (−x) = f (x) wie bei f (x) =
”
cos(x)), Periodizität oder Ähnliches.
Wir führen das Programm der Kurvendiskussion im Folgenden an drei Beispielen durch.
=
5.5
73
Krümmung
Beispiel 5.27 Sei f (x) = x4 − 2x2 + 1.
(1) f ist ein Polynom, also auf ganz R definiert.
(2) lim f (x) = ∞, weil x4 schneller wächst als x2 . Ebenso lim f (x) = ∞.
x→∞
x→−∞
(3) f (x) = (x2 − 1)2 . Also ist f (x) = 0 genau für x = −1 und x = 1.
(4),(5) Polynome sind stetig und beliebig oft differenzierbar.
(6) f 0 (x) = 4x3 − 4x = 4x(x2 − 1). Für
x < −1
ist 4x < 0 und x2 − 1 > 0, also f 0 (x) < 0,
x ∈ (−1, 0)
ist 4x < 0 und x2 − 1 < 0, also f 0 (x) > 0,
x ∈ (0, 1)
ist 4x > 0 und x2 − 1 < 0, also f 0 (x) < 0,
x>1
ist 4x > 0 und x2 − 1 > 0, also f 0 (x) > 0.
Also ist f streng monoton wachsend in den Bereichen [−1, 0] und [1, ∞), sowie streng monoton
fallend in Bereichen (−∞, −1] und [0, 1].
(7) Nach (6) ist klar, dass −1, 0, 1 die kritischen Stellen sind. Es ist f 00 (x) = 12x2 − 4, also f 00 (−1) =
f 00 (1) = 8 und f 00 (0) = −4. f hat also isolierte lokale Minimalstellen in −1 und 1 mit f (−1) =
f (1) = 0, sowie ein isoliertes lokales Maximum in 0 mit f (0) = 1.
Zusammen mit (6) folgt, dass −1 und 1 sogar globale Minimalstellen sind, während nach (3) kein
globales Maximum existiert.
(8) Der Wertebereich (genauer: das Bild) von f ist [0, ∞).
(9) Krümmung: Siehe Beispiel 5.26 auf Seite 71.
(10) Skizze: Siehe Figur auf Seite 64.
Beispiel 5.28 Sei f (x) = x + 2 sin(x).
(1) Definitionsbereich ist ganz R.
(2) Wegen | sin(x)| ≤ 1 für alle x, ist
f (x) ≥ x − 2
und
f (x) ≤ x + 2
für alle x ∈ R
Also ist lim f (x) = ∞ und
x→∞
lim f (x) = −∞.
x→−∞
(4),(5) x 7→ x und x 7→ sin(x) sind stetig und beliebig oft differenzierbar und damit auch f .
(6) f 0 (x) = 1 + 2 cos(x). Also ist
1
f 0 (x) > 0 ⇐⇒ cos(x) > −
2
2π
2π ⇐⇒ x ∈ 2kπ −
, 2kπ +
3
3
für ein k ∈ Z,
(5.6)
74
Kurvendiskussion von Funktionen einer Variablen
und analog
2π
4π f 0 (x) < 0 ⇐⇒ x ∈ 2kπ +
, 2kπ +
3
3
für ein k ∈ Z,
sowie
2π
für ein k ∈ Z.
3
Es folgt: f ist streng monoton wachsend in den Intervallen
2π 2π
,
k∈Z
, 2kπ +
2kπ −
3
3
f 0 (x) = 0 ⇐⇒ x = 2kπ ±
und streng monoton fallend in den Intervallen
2π
4π 2kπ +
,
, 2kπ +
3
3
k ∈ Z.
(7) Aus (2) folgt, dass es keine globalen Extremalstellen gibt. Nach (6) ist klar, dass√f isolierte lokale
2π
2π
Minimalstellen hat bei x = 2kπ − 2π
3, sowie isolierte
3 , k ∈ Z mit f (2kπ − 3 ) = 2kπ − √
3 −
2π
2π
2π
lokale Maximalstellen bei x = 2kπ + 3 mit f (2kπ + 3 ) = 2kπ + 3 + 3.
2π
(3) Offenbar ist f (0) = 0. f wächst streng monoton zwischen − 2π
3 und 3 und nimmt dort die Werte
√
2π
2π 2π
±( 3 + 3) ≈ ±3.8 an. Also hat f in [− 3 , 3 ] ≈ [−2.1, 2.1] keine weiteren Nullstellen. Wegen
(5.6) kann es aber auch keine Nullstellen für |x| > 2 geben. Insgesamt haben wir also: f hat genau
eine Nullstelle bei x = 0.
(8) Nach (2) und (4) ist der Wertebereich ganz R.
(9) Die zweite Ableitung ist f 00 (x) = −2 sin(x). Mithin ist f 00 (x) < 0 für x ∈ (2kπ, (2k + 1)π), k ∈ Z,
also f dort strikt konkav, und f 00 (x) > 0 für x ∈ ((2k − 1)π, 2kπ), k ∈ Z, also f dort strikt konvex.
Die Wendepunkte sind die Punkte x = kπ, k ∈ Z.
(10) Skizze:
10
f(x)=x+2sin(x)
5
wachsend
fallend
wachsend
fallend
–10
–8
–6
wachsend
–2
–4
2
4
x
8
fallend
konkav
konkav
konvex
konvex
–5
–10
konvex
6
Wendepunkte
lok. Min.stellen
lok. Max.stellen
konkav
10
5.5
75
Krümmung
Beispiel 5.29 (Lenard-Jones Potential) Ein Modell für das Potential von Teilchen im kernnahen Bereich
ist das Lenard-Jones Potential. Eine extrem kurzreichweitige Abstoßung c1 x−12 (dabei ist x der Abstand
des Teilchens von dem Kern und c1 > 0 eine Konstante) wird von einer langreichweitigen Anziehung
−c2 x−6 überlagert (c2 > 0). Also ist
f (x) = c1 x−12 − c2 x−6 .
(1) Da x einen Abstand darstellt, ist nur x ≥ 0 sinnvoll. Da f (0) nicht definiert ist, setzen wir als
Definitionsbereich I = (0, ∞) an.
(2)
lim f (x) = lim x−6 (c1 x−6 − c2 ) = ∞.
x↓0
x↓0
lim f (x) = c1 lim x−12 − c2 lim x−6 = 0.
x→∞
x→∞
(3) f (x) = 0 gilt genau dann, wenn x6 =
q
x = 6 cc12 .
c1
c2 .
x→∞
Da x > 0 sein muss, ist die einzige Nullstelle von f :
(4) x 7→ x−6 und x 7→ x−12 sind in I stetig, also ist auch f stetig.
(5) Ebenso ist f beliebig oft differenzierbar.
(6) Die erste Ableitung ist
f 0 (x) = −12c1 x−13 + 6c2 x−7 = 6c2
Also ist
0
f (x) < 0
⇐⇒
c1
x <2
c2
6
x6 − 2 cc12
x13
.
r
⇐⇒
x<
6
2
c1
c2
,
r
c1
c1
f (x) > 0
⇐⇒
x >2
⇐⇒
x> 6 2 .
c2
c2
p
Es
folgt, dass f streng monoton fallend ist in (0, 6 2c1 /c2 ) und streng monoton wachsend in
p
( 6 2c1 /c2 , ∞).
p
p
(7) Aus (6) folgt sofort, dass f in 6 2c1 /c2 die eindeutige globale Minimalstelle hat mit f ( 6 2c1 /c2 ) =
c2
− 2 , und dass es keine weiteren Extremalstellen gibt.
4c1
0
6
c2
(8) Aus (2) und (7) folgt, dass der Wertebereich [− 4c21 , ∞) ist.
(9) Die zweite Ableitung ist
f 00 (x) = 156c1 x−14 − 42c2 x−8 = 42c2
r
26c1
7c2
x10
x6 −
.
r
26 c1
26 c1
00
und f (x) < 0, falls x > 6
. Mithin
Also ist f (x) > 0 genau dann, wenn x <
7 c2 r
7 c2
r 26 c 26 c
1
1
ist f strikt konvex in 0, 6
, strikt konkav in 6
, ∞ und hat einen Wendepunkt in
7
c
7
c
2
2
r
r
26 c 133 c22
1
6 26 c1
mit f 6
=−
.
7 c2
5 c2
676 c1
00
6
76
Kurvendiskussion von Funktionen einer Variablen
(10) Skizze für c1 = 1 und c2 = 5.
10
f(x)=x−12 −5x−6
8
6
y
4
2
1/6
( 26
35 )
1
1.5
x
0.4
0
0.5
1/6
–2
–4
−
3325
676
Wendepunkt
–6
Globales Minimum
−6.25
–8
2
2.5
3
x
Kapitel 6
Potenzreihen
Die Funktion x 7→ sin(x) wurde geometrisch definiert als das Längenverhältnis zweier Seiten in einem
Dreieck. Wie aber wird man praktisch vorgehen, wenn man für eine gegebene Zahl x den Wert von sin(x)
ausrechnen möchte?
Wir wollen zu diesem Zweck die Funktion sin durch elementare Funktionen annähern, die wir wirklich
berechnen können. Hierzu bieten sich natürlich algebraische Funktionen an, die nur durch die Grundrechenarten definiert werden können. Speziell sind Polynome günstige Kandidaten.
Wir führen in einem ersten Abschnitt den Begriff des Taylorpolynoms (nach Brook Taylor (1685–1731))
ein und geben eine einfache (grobe) Abschätzung für die Fehlergrenze an.
In einem zweiten Abschnitt machen wir den Grenzübergang zu Polynomen mit unendlich vielen Summanden, den so genannten Potenzreihen. Wir berühren die technischen Probleme, die sich hier durch den
Umgang mit unendlich vielen Summanden ergeben, nur am Rande und geben einen kleinen Einblick in den
ganz praktischen (und sorglosen) Umgang mit diesen Objekten.
6.1
Taylorpolynome
Im folgenden ist stets f eine reelle, auf dem Intervall I definierte Funktion, die wir als so oft differenzierbar
annehmen, wie wir es gerade benötigen. Wir denken dabei zum Beispiel an f = sin, f = cos, f =
exp und so weiter. Der Wert von f (x) für gegebenes x kann nicht durch elementare Rechenoperationen
ausgerechnet werden. Wir hoffen aber, dass wir f durch Polynome pn (x) = cn xn +cn−1 xn−1 +. . .+c1 x+
c0 approximieren können, wenn wir n nur groß genug wählen und natürlich die Koeffizienten c0 , . . . , cn
geeignet aussuchen. Um Schreibarbeit zu sparen, führen wir die folgende Bezeichnung ein.
Definition 6.1 (Summenzeichen) Sind m, n ∈ Z, m ≤ n, und am , am+1 , . . . , an−1 , an Zahlen, so schreiben wir die Summe als
n
X
ak := am + am+1 + . . . + an−1 + an .
k=m
Mit dieser Definition ist
pn (x) =
n
X
k=0
77
ck xk .
78
Potenzreihen
Damit pn möglichst gut mit f übereinstimmt, müssen die Koeffizienten c0 , . . . , cn geschickt gewählt werden. Ein grundlegender Ansatz ist es, die Koeffizienten so zu wählen, dass die ersten n Ableitungen von f
in x = 0 mit denen von pn übereinstimmen:
f (k) (0) = p(k)
n (0),
k = 0, . . . , n.
(6.1)
Dabei ist f (k) die k-te Ableitung von f mit der Konvention f (0) = f . Wir gehen hier natürlich davon
aus, dass wir die Ableitungen von f in 0 leichter berechnen können als die Funktionswerte von f an einer
beliebigen Stelle x, sonst hätten wir ja nichts gewonnen.
Beispiel 6.2 Sei f = sin. Dann ist
sin(0) (0) = sin(0) = 0
sin(1) (0) = cos(0) = 1
sin(2) (0) = − sin(0) = 0
sin(3) (0) = − cos(0) = −1
sin(4) (0) = sin(0) = 0
..
..
.
.
(6.2)
sin(4l) (0) = sin(0) = 0
sin(4l+1) (0) = cos(0) = 1
sin(4l+2) (0) = − sin(0) = 0
sin(4l+3) (0) = − cos(0) = −1
Also ist
sin(2k) (0) = 0,
sin(2k+1) (0) = (−1)k ,
k ∈ N0 .
(6.3)
Die Ableitungen von pn können wir durch schrittweises Ableiten immer leicht berechnen.
p(1)
n (x) =
p(2)
n (x) =
n
X
k=1
n
X
ck kxk−1
ck k(k − 1)xk−2
(6.4)
k=2
..
.
p(l)
n (x) =
..
.
n
X
ck k(k − 1) · · · (k − l + 1)xk−l
k=l
Um auch hier zu einer handlichen Schreibweise zu gelangen, führen wir die folgenden Konventionen ein.
Definition 6.3 (i) Für n ∈ N definieren wir n! (lies: n Fakultät“) als das Produkt der ersten n natürlichen
”
Zahlen
n! = 1 · 2 · 3 · · · (n − 1) · n.
Außerdem vereinbaren wir: 0! = 1.
6.1
79
Taylorpolynome
(ii) Für x ∈ R und k ∈ N definieren wir den Binomialkoeffizienten als
x
x · (x − 1) · (x − 2) · · · (x − k + 1)
=
.
k
k!
(Lies: x über k“.) Weiter setzen wir x0 = 1 und xk = 0 für k < 0. Speziell ist für k, n ∈ N0 mit k ≤ n:
”
n
n!
=
.
k
k!(n − k)!
Für k, n ∈ N0 mit k > n oder für k < 0 ist nk = 0.
Später benötigen wir den folgenden Hilfssatz.
Lemma 6.4 Für jedes x ∈ R gilt
xn
= 0.
n→∞ n!
lim
Beweis Für n ≥ |2x| ist 1 ≥
2|x|
n
≥
2|x|
n+k
für k ∈ N, also
|x|n
|x|n+1
|x|n+2
≥2
≥4
≥ ...
n!
(n + 1)!
(n + 2)!
Also schrumpft der Bruch in jedem Schritt auf weniger als die Hälfte zusammen.
2
Wir können die k-te Ableitung von pn schreiben als
p(l)
n (x) =
n
X
ck
k=l
k!
xk−l .
(k − l)!
(6.5)
Für x = 0 verschwinden alle Summanden außer dem mit l = k, also ist
p(k)
n (0) = k!ck .
(6.6)
Wegen (6.1) ist also
1 (k)
f (0).
k!
An dieser Stelle ist sehr erfreulich, dass die Koeffizienten gar nicht vom Grad n des Polynoms abhängen.
Das so gewonnene Polynom
n
X
f (k) (0) k
pn (x) =
x
k!
ck =
k=0
heißt das n-te Taylorpolynom von f bei 0. Es ist dasjenige Polynom, das in den ersten n Ableitungen
bei 0 mit denen von f übereinstimmt. Wir wollen nun als kleine Verallgemeinerung zulassen, dass die
Ableitungen statt an 0 an einer beliebigen Stelle a ∈ R mit denen von f übereinstimmen.
Definition 6.5 (Taylorpolynom) Das n-te Taylorpolynom von f bei a ist
pn (x) =
n
X
f (k) (a)
k=0
k!
(x − a)k .
Es hat an der Stelle a dieselben Ableitungen bis zur Ordnung n wie f und ist das einzige Polynom vom
Grade ≤ n mit dieser Eigenschaft.
80
Potenzreihen
Beispiele 6.6
(i) Ist f = sin und n = 2N − 1, so ist (vergleiche (6.3))
pn (x) =
N
−1
X
k=0
(−1)k 2k+1
x
.
(2k + 1)!
Also p1 (x) = x, p3 (x) = x − 16 x3 , p5 (x) = x − 16 x3 +
1
5
120 x .
(ii) Ist f = exp, so ist f = f 0 = f 00 = f 000 = . . .. Also ist das n-te Taylorpolynom von exp bei 0
pn (x) =
n
X
1 k
x .
k!
k=0
Bisher haben wir uns die Polynome vor allem deshalb verschafft, weil wir hofften, dass sie unsere Funktion
f annähern. Dass dies tatsächlich oft der Fall ist, zeigt der folgende Satz, der eine einfache (und leider noch
etwas grobe) Abschätzung für die Güte der Approximation angibt.
Satz 6.7 (Taylor Abschätzung) Sei pn das n-te Taylorpolynom von f bei a. Dann ist
|f (x) − pn (x)| ≤
Beispiele 6.8
|x − a|n+1
max |f (n+1) (y)|, y zwischen a und x .
(n + 1)!
(i) Sei f = sin. Dann ist jede Ableitung durch 1 beschränkt. Also ist (mit n = 2N − 1)
N
−1
X
(−1)k 2k+1 |x|2N
x
.
(6.7)
sin(x) −
≤
(2N )!
(2k + 1)!
k=0
Wollen wir sin(0.3) bis auf einen Fehler von 10−3 ausrechnen, so muss 0.32N /(2N )! ≤ 0.001 sein.
4
0.0081
Nun ist 0.32 /2! = 0.045 > 0.001 und 0.3
= 0.0003375 < 0.001. Also müssen wir N = 2
4! =
24
3
nehmen und damit n = 2N − 1 = 3. Also ist sin(0.3) ≈ p3 (0.3) = 0.3 − 0.3
6 = 0.2955 bis auf
einen Fehler von maximal 0.001. Man prüfe mit dem Taschenrechner, dass das tatsächlich sehr gut
stimmt!
(ii) Wir wollen exp(1) bis auf einen Fehler von 0.001 berechnen. Aus der obigen Abschätzung erhalten
wir
n
X
e1
xk .
≤
exp(x) −
k! (n + 1)!
k=0
3
1
Nehmen wir als bekannt an, dass e < 3 ist, so müssen wir also (n+1)!
≤ 1000
, also (n + 1)! ≥ 3000
haben. Nun ist 6! = 720 und 7! = 5040. Also müssen wir n = 6 nehmen und bekommen
exp(1) ≈ 1 + 1 +
1 1
1
1
1
+ +
+
+
= 2.7180555 . . .
2 6 24 120 720
mit einem Fehler von maximal 0.001.
1
= (1 − x)−1 , x 6= 1. Dann ist f 0 (x) = (1 − x)−2 , f 00 (x) = 2(1 − x)−3 und
Beispiel 6.9 Sei f (x) = 1−x
allgemeiner f (n) (x) = n!(1 − x)−(n+1) . Insbesondere ist f (n) (0) = n!, also ist das n-te Taylorpolynom
von f bei 0
n
X
pn (x) =
xk .
k=0
6.2
81
Taylorreihen
Wir rechnen
(1 − x)pn (x) = (1 − x)(1 + x + x2 + . . . xn )
= (1 + x + x2 + . . . xn ) − (x + x2 + x3 + . . . xn+1 )
n+1
=1−x
(6.8)
.
Also ist
xn+1
1
− pn (x) =
.
1−x
1−x
(6.9)
(Man beachte, dass dies den Fehler besser berechnet als die Abschätzung aus Satz 6.7. Die Schranke, die
xn+1
n+1
dort gefunden wird, ist (1−x)
für x ≤ 0.) Der Fehler wird mit wachsendem n
n+2 für x > 0 und |x|
nur dann kleiner, wenn |x| < 1 ist. Für |x| > 1 können wir nicht erwarten, eine gute Approximation zu
bekommen (nicht mal für x < −1).
Beispiel 6.10 Sei b ∈ R, N ∈ N und f (x) = (b + x)N . Dann ist
f (1) (x) = N (b + x)N −1
f (2) (x) = N (N − 1)(b + x)N −2
f (3) (x) = N (N − 1)(N − 2)(b + x)N −3
..
..
.
.
N!
(b + x)N −k
f (k) (x) =
(N − k)!
..
..
.
.
f (N +1) (x) = 0
Also ist (ohne Fehlerterm!)
f (x) =
N
X
f (k) (0)
k!
k=0
xk =
N X
N
k=0
k
bN −k xk .
Korollar 6.11 (Binomischer Lehrsatz) Für x, y ∈ R und N ∈ N ist
N
(x + y)
=
N X
N
k=0
6.2
k
xk y N −k .
Taylorreihen
Wollen wir f immer besser annähern, so müssen wir n immer größer wählen. Im Idealfall konvergieren die
Taylorpolynome
f (x) = lim pn (x).
(6.10)
n→∞
82
Potenzreihen
Gilt (6.10), so schreiben wir auch
f (x) =
Definition 6.12 Der Ausdruck
∞
X
f (n) (a)
(x − a)n .
n!
n=0
∞
X
f (n) (a)
(x − a)n
n!
n=0
heißt Taylorreihe von f um a.
Die Taylorreihe tritt auf als ein Spezialfall des folgenden Objektes.
Definition 6.13 Sind c0 , c1 , . . . Zahlen, so heißt der Ausdruck
P (x) =
∞
X
ck (x − a)k := lim
n→∞
k=0
n
X
ck (x − a)k
k=0
die Potenzreihe um a mit Koeffizienten (ck )k∈N0 . Wir sagen, dass die Potenzreihe für x ∈ R konvergiert,
wenn der Grenzwert existiert und endlich ist.
Satz 6.14 (i) Sei P eine Potenzreihe um a. Dann gibt es eine Zahl R ≥ 0, oder R = ∞, mit der Eigenschaft
(
konvergent, falls |x − a| < R,
P (x) ist
divergent,
falls |x − a| > R.
(Für |x − a| = R kann man im Allgemeinen keine Aussage machen.) R heißt der Konvergenzradius von P .
(ii) Sei R > 0. Dann ist die für |x − a| < R definierte Funktion x 7→ P (x) unendlich oft differenzierbar
und hat die erste Ableitung (gliedweises Differenzieren!)
P 0 (x) =
∞
X
ck+1 (k + 1)(x − a)k .
k=0
Auch die Reihe P 0 (und ebenso P 00 , P 000 usf.) hat denselben Konvergenzradius R.
Ferner gilt (durch iteratives Ableiten) für jedes n ∈ N0
P (n) (a) = n! cn .
(iii) Hat umgekehrt die durch formales gliedweises Differenzieren aus P entstehende Potenzreihe
Q(x) =
∞
X
ck+1 (k + 1)(x − a)k
k=0
den Konvergenzradius R > 0, so auch P , und es gilt Q(x) = P 0 (x), sofern |x − a| < R.
Beispiel 6.15 Wir wollen hier mit Hilfe der in Beispiel 6.6 ausgerechneten Taylorpolynome die Potenzreihen von Sinus-, Cosinus- und Exponentialfunktion ausrechnen.
6.2
83
Taylorreihen
(i) Sei f = sin und pn wie in Beispiel 6.6(i). Dann ist nach (6.7) | sin(x) − pn (x)| ≤
(vergleiche Lemma 6.4). Also ist für alle x ∈ R
sin(x) =
∞
X
|x|n+1 n→∞
(n+1)! −→
0
ck xk ,
k=0
wobei
ck =

0,


k gerade,
(k−1)/2

 (−1)
,
k!
k ungerade.
Lassen wir in der Reihe die Terme aus, die 0 sind, so erhalten wir
sin(x) =
∞
X
(−1)n 2n+1
x
.
(2n + 1)!
n=0
(6.11)
Da wir gesehen haben, dass diese Reihe für alle x ∈ R konvergiert, ist R = ∞. Nach dem obigen
Satz können wir also gliedweise differenzieren und erhalten
sin0 (x) = cos(x) =
∞
X
(−1)n
k=0
(2n)!
x2n .
(6.12)
Auch für diese Reihe ist nach dem Satz der Konvergenzradius R = ∞.
(ii) Sei f = exp und pn wie in Beispiel 6.6(ii). Dann ist nach Satz 6.7 für jedes x ∈ R
n+1
n→∞
exp(x) − pn (x) ≤ |x|
· exp(|x|) −→ 0.
(n + 1)!
Daher konvergiert die Taylorreihe der Exponentialfunktion überall gegen die Exponentialfunktion, es
ist also R = ∞. Für jedes x ∈ R gilt also
exp(x) =
∞
X
xk
k=0
Beispiel 6.16 Sei f (x) =
1
1−x
und pn (x) =
n
P
k=0
k!
.
(6.13)
xk . Nach (6.9) ist für x ∈ (−1, 1) lim pn (x) =
n→∞
1
1−x .
Jedoch ist für x = 1, lim pn (1) = lim (n + 1) = ∞. Also ist der Konvergenzradius R = 1 und wir
n→∞
n→∞
haben
∞
X
1
=
xn ,
x ∈ (−1, 1).
(6.14)
1 − x n=0
Diese Reihe heißt auch die geometrische Reihe.
√
Beispiel 6.17 Sei f (x) = x, x ≥ 0. Wir können kaum erwarten, dass f durch eine Potenzreihe um
√0
angenähert wird. Erstens, weil f für negative x hier nicht definiert ist, und zweitens, weil f 0 (x) = 1/2 x
für x → 0 gegen ∞ konvergiert. Probieren wir also eine Taylorreihenentwicklung um eine Zahl a > 0. Die
84
Potenzreihen
Ableitungen von f sind schnell berechnet:
1 −1
x 2
2
1 1 −3
f 00 (x) = · −
x 2
2
2
3 −5
1
1
−
x 2
f (3) (x) = · −
2
2
2
..
..
.
.
1
1
1 1 3 f (k) (x) = · −
−
···
− k + 1 x 2 −k
2
2
2
2
1
1
= 2 k!x 2 −k
k
f 0 (x) =
(6.15)
Man kann zeigen, dass a der Konvergenzradius der resultierenden Taylorreihe ist, und dass f im Intervall
(0, 2a) mit der Taylorreihe übereinstimmt. Also ist die Taylorreihe von f um a
√
x=
∞ 1
X
2
n=0
n
1
a 2 −n (x − a)n =
∞ 1 n
√ X
x
2
a
−1 ,
n
a
n=0
x ∈ (0, 2a).
(6.16)
Der folgende Satz besagt, dass zwei Potenzreihen die gleichen Koeffizienten haben, wenn sie konvergent
sind und als Funktionen dieselben Werte annehmen.
Satz 6.18 (Identitätssatz für Potenzreihen) Seien
P (x) =
∞
X
cn (x − a)n
und
Q(x) =
∞
X
dn (x − a)n
n=0
n=0
zwei Potenzreihen, um den selben Punkt a, mit Konvergenzradien RP , RQ > 0. Gibt es eine Folge (an )n∈N ,
n→∞
wobei an 6= a für alle n ∈ N, mit an −→ a und P (an ) = Q(an ), n ∈ N, so gilt ck = dk für alle k ∈ N0 .
Speziell ist dies der Fall, wenn für ein r > 0 gilt
P (x) = Q(x)
für alle x ∈ R mit |x − a| < r.
Beweis Wir können den Satz hier nicht komplett beweisen, wollen aber einen Hinweis geben, welche Idee
dahinter steckt.
Da P und Q stetig in a sind (Satz 6.14(ii)) folgt aus der Annahme, dass
c0 = P (a) = lim P (an ) = lim Q(an ) = Q(a) = d0 .
n→∞
n→∞
Als nächstes ist
c1 = P 0 (a) = lim
n→∞
Q(an ) − Q(a)
P (an ) − P (a)
= lim
= Q0 (a) = d1 .
n→∞
an − a
an − a
So kann man nacheinander sämtliche Ableitungen in a bestimmen und zeigen, dass sie alle gleich sind, dass
also auch die Koeffizienten übereinstimmen müssen.
2
6.2
85
Taylorreihen
∞
P
Beispiel 6.19 Sei f (x) = log(1 − x) und
cn xn die Taylorreihe von f um 0. Wir wollen die Koeffizien-
n=0
ten (ck )k∈N0 und den Konvergenzradius R dieser Reihe ausrechnen. Dazu leiten wir f ab, weil wir so eine
Funktion bekommen, deren Potenzreihe wir schon kennen: f 0 (x) = −1/(1 − x). Nach Beispiel 6.16 hat
die Potenzreihe von f 0 den Konvergenzradius R = 1, und es gilt
f 0 (x) = −
∞
X
1
=
−xn .
1 − x n=0
Nach Satz 6.14(ii) können wir die Potenzreihe von f 0 aber auch durch gliedweises Differenzieren der Reihe
von f erhalten. Es gilt also
∞
X
f 0 (x) =
(n + 1)cn+1 xn .
n=0
Nach Satz 6.14(i) haben beide Reihen denselben Konvergenzradius, nämlich R = 1. Es gilt c0 = f (0) = 0
und (nach dem Identitätssatz für Potenzreihen) cn = − n1 , n ∈ N. Also ist
log(1 − x) = −
∞
X
xn
,
n
n=1
für |x| < 1.
(6.17)
Satz 6.20 (Rechenregeln) Seien
P (x) =
∞
X
n
cn (x − a)
und
Q(x) =
∞
X
dn (x − a)n
n=0
n=0
zwei Potenzreihen, um den selben Punkt a, mit Konvergenzradien RP , RQ > 0. Ferner sei λ ∈ R
(i) Dann gilt für x ∈ R mit |x − a| < RP :
λP (x) =
∞
X
(λcn )(x − a)n .
(6.18)
n=0
Für jedes x ∈ R mit |x − a| < min(RP , RQ ) gilt:
P (x) + Q(x) =
P (x) − Q(x) =
P (x) · Q(x) =
∞
X
n=0
∞
X
(cn + dn )(x − a)n
(cn − dn )(x − a)n
n=0
∞
X
n
X
n=0
k=0
(6.19)
!
ck dn−k
(x − a)n
Jede dieser drei Potenzreihen hat mindestens den Konvergenzradius min(RP , RQ ).
Die Formel für das Produkt der Potenzreihen heißt das Cauchy-Produkt.
(ii) Ist λ 6= 0, so ist für x ∈ R mit |λx − a| < RP
P (λx) =
Diese Potenzreihe um
a
λ
∞
X
a n
(λn cn ) x −
.
λ
n=0
hat den Konvergenzradius
RP
|λ|
.
(6.20)
86
Potenzreihen
1
1−x2
um 0 bestimmen. Dazu bemerken wir zunächst, dass
1
1
1
1
=
+
.
1 − x2
2 1−x 1+x
Beispiel 6.21 Wir wollen die Potenzreihe von
Wir wissen, dass
∞
X
1
=
xn ,
1 − x n=0
für |x| < 1.
Also ist (mit λ = −1 in Teil (ii) des letzten Satzes)
∞
X
1
=
(−1)n xn ,
1 + x n=0
für |x| < 1.
Nach dem Summensatz ist also
∞
∞
X
1 + (−1)n n X 2n
1
=
x
=
x .
1 − x2
2
n=0
n=0
(6.21)
Beispiel 6.22 Seien M, N ∈ N und P (x) = (1 + x)M und Q(x) = (1 + x)N . Nach Beispiel 6.10 ist
∞ X
M n
P (x) = (1 + x)M =
x ,
n
n=0
N
Q(x) = (1 + x)
=
∞ X
N
n=0
(Erinnerung: für n > M ist
M
n
n
xn .
= 0.) Das Cauchy-Produkt ist
!
∞
n X
X
M
N
P (x) · Q(x) =
xn .
k
n
−
k
n=0
k=0
Andererseits wissen wir, dass
P (x)Q(x) = (1 + x)M +N =
∞ X
M +N n
x .
n
n=0
Nach dem Identitätssatz für Potenzreihen erhalten wir folgende wichtige Gleichung.
Korollar 6.23
n X
M
N
M +N
=
.
k
n−k
n
(6.22)
k=0
6.3
Ausblick: komplexe Argumente
Potenzreihen benutzen nur Multiplikation, Addition sowie den Begriff des Grenzwertes. Dies ist alles auch
für komplexe Zahlen definiert. In der Tat haben wir für komplexe Zahlen den Abstand
p
|z1 − z2 | = (Re(z1 − z2 ))2 + (Im(z1 − z2 ))2
definiert.
6.3
87
Ausblick: komplexe Argumente
Definition 6.24 (Grenzwerte komplexer Zahlenfolgen) Eine Folge (zn )n∈N komplexer Zahlen konvergiert gegen z ∈ C, falls
lim |zn − z| = 0.
n→∞
Gleichwertig damit ist, dass Real- und Imaginärteil konvergieren:
Re(z) = lim Re(zn ),
n→∞
und Im(z) = lim Im(zn ).
n→∞
Wir schreiben dann
z = lim zn .
n→∞
Also können wir für c0 , c1 , . . . ∈ C die Potenzreihe P um a ∈ C definieren
P (z) =
∞
X
cn (z − a)n .
n=0
Es gelten alle Sätze aus dem vorigen Abschnitt auch für komplexe Potenzreihen. Speziell existiert eine Zahl
R ≥ 0, oder R = ∞, sodass P (z) konvergiert, falls |z − a| < R, und divergiert, falls |z − a| > R.
Definition 6.25 Die Menge
z ∈ C, |z − a| < R
heißt Konvergenzkreis von P .
Oft ist bei einer reellen Funktion nicht ohne weiteres ersichtlich, warum die Potenzreihe nicht überall konvergiert. Hier hilft die Betrachtung der komplexen Potenzreihe weiter.
Beispiel 6.26 Sei
1
.
1 + x2
Die Funktion f ist auf ganz R definiert und beliebig oft differenzierbar. Es spricht also scheinbar nichts
dagegen, dass f eine Taylorreihe um 0 haben sollte, die überall konvergiert. Es wird sich aber gleich zeigen,
dass dies nicht richtig ist.
f (x) =
Die Bestimmung von f geht am einfachsten so:
f (x) =
∞
∞
X
X
1
2 n
=
(−x
)
=
(−1)n x2n ,
1 − (−x2 ) n=0
n=0
|x| < 1.
Diese Potenzreihe hat also tatsächlich den Konvergenzradius R = 1. Betrachten wir jetzt f als Funktion
auf C, so ist klar, dass f (z) definiert ist für alle z ∈ C, außer für z = ±i. Nun ist |i| = 1, also ist klar, dass
der Konvergenzradius R gar nicht größer als 1 sein kann, wenn die Funktion im ganzen Konvergenzbereich
der Potenzreihe mit dieser übereinstimmt.
Die Diskussion fassen wir in der folgenden Faustregel zusammen:
Faustregel 6.27 Sei P die Taylorreihe um a der in R definierten Funktion f , und sei f auch auf (einer
Teilmenge von) C definierbar. Dann ist der Konvergenzradius R von P die größte Zahl R, so dass f in
z ∈ C : |z − a| < R
keine Ausnahmestelle hat.
88
Potenzreihen
Wir kommen nun zu dem wichtigsten Beispiel einer komplexen Potenzreihe.
Beispiel 6.28 Die Funktion f : C → C, z 7→ exp(iz) hat die Potenzreihe um 0
∞ n
X
i n
exp(iz) =
z ,
n!
n=0
z ∈ C.
(6.23)
Wir wissen, dass für reelle Zahlen x ∈ R die Euler’sche Formel gilt
exp(ix) = cos(x) + i sin(x).
Also ist nach Aufteilung in gerade und ungerade n in (6.23)
cos(x) + i sin(x) =
=
∞
∞
X
i2k 2k X i2k+1
x +
x2k+1 ,
(2k)!
(2k + 1)!
k=0
∞
X
k=0
k
k=0
∞
X
(−1) 2k
x +i
(2k)!
k=0
(−1)k 2k+1
x
.
(2k + 1)!
(6.24)
Da in der zweiten Zeile beide Reihen reell sind, erhalten wir (diesmal ohne Mühe) die bekannten Formeln
zurück.
∞
X
(−1)k 2k
cos(x) =
x ,
(2k)!
k=0
(6.25)
∞
X
(−1)k 2k+1
sin(x) =
x
.
(2k + 1)!
k=0
Kapitel 7
Integration von Funktionen einer
Variablen
7.1
Definition des Integrals
Wir nehmen an, dass a < b reelle Zahlen sind und f : [a, b] → R eine Abbildung ist. Für den Moment
wollen wir auch annehmen, dass f ≥ 0 ist. Das Ziel ist es, den Inhalt F der Fläche zu bestimmen, der von
dem Graphen von f und der Koordinatenachse eingeschlossen wird.
Graph(f)
m4,3
a
I 4,3
b
F IGUR . Die Fläche F unter dem Graphen von f wird hier durch n = 4 Rechtecke angenähert.
Zu diesem Zweck zerlegen wir das Intervall [a, b] in n (in der Abbildung: n = 4) gleichgroße Teilintervalle
In,1 , In,2 , . . . , In,n der Länge b−a
n . Also ist
b−a
b−a
In,k = a + (k − 1)
, a+k
,
k = 1, 2, . . . , n.
n
n
In jedem Teilintervall wollen wir nun das größte Rechteck bestimmen, das noch unterhalb des Graphen
89
90
Integration von Funktionen einer Variablen
von f liegt. Die Höhe dieses Rechtecks im k-ten Teilintervall ist (zumindest bei stetigem f ) der kleinste
Funktionswert, der dort von f angenommen wird
mn,k = min(f (x), x ∈ In,k ),
k = 1, 2, . . . , n.
Der Flächeninhalt des k-ten Rechtecks beträgt also (Breite × Höhe)
mengenommen haben den Flächeninhalt
Un (f ) :=
n
X
b−a
n
k=1
b−a
n mn,k .
mn,k .
Alle n Rechtecke zusam-
(7.1)
Die Größe Un (f ) wird als die n-te Untersumme von f bezeichnet. Offenbar ist F ≥ Un (f ) für jedes n.
Das gleiche können wir auch mit Rechtecken machen, die den Graphen von oben einschließen. Diese Rechtecke habe die Höhe
Mn,k = max(f (x), x ∈ In,k ),
k = 1, 2, . . . , n.
Wir bezeichnen mit
On (f ) :=
n
X
b−a
n
k=1
Mn,k
(7.2)
die nte Obersumme von f . Offenbar ist jetzt
Un (f ) ≤ F ≤ On (f ).
Die Idee ist nun, dass mit wachsendem n sich die Werte von Unter- und Obersumme immer mehr annähern
sollten. Der gemeinsame Grenzwert muss dann die gesuchte Fläche F sein.
Definition 7.1 Konvergieren die Folgen der Untersummen (Un (f ))n∈N und Obersummen (On (f ))n∈N
gegen denselben Grenzwert, so bezeichnen wir den gemeinsamen Grenzwert als das Integral von f im
Intervall [a, b] (oder von a bis b) und schreiben
Z
b
f (x) dx = lim Un (f ) = lim On (f ).
n→∞
a
n→∞
Die Funktion f heißt dann integrierbar (in [a, b]).
Zur Unterscheidung von anderen Integralbegriffen, die in der Mathematik gebräuchlich sind, wird dieses
Integral auch Riemann–Integral1 genannt.
Wir wollen später auch die folgende Notation benutzen:
Z
a
Z
f (x) dx := −
b
b
f (x) dx.
(7.3)
a
Die Bedingung an die Ober- und Untersummen ist natürlich in der Praxis nicht sehr handlich nachzuprüfen.
Daher wollen wir hier ohne Beweis festhalten, dass wir uns beispielsweise bei stetigen oder bei monotonen
(wachsend oder fallend) Funktionen keine Sorgen zu machen brauchen.
Satz 7.2 Ist f : [a, b] → R stetig oder monoton, so ist f integrierbar.
1 nach
Bernhard Riemann, Mathematiker in Göttingen (1826–1866)
7.2
7.2
91
Hauptsatz der Differential- und Integralrechnung
Hauptsatz der Differential- und Integralrechnung
Sei f : [a, b] → R stetig. Wir betrachten die Funktion
Z t
F (t) =
f (x) dx
für t ∈ [a, b].
a
Das ist die Fläche, die zwischen den Punkten a und t unter der Kurve von f liegt.
Graph(f)
f(t)
a
t
t+h
F IGUR . Lässt man t auf t + h wachsen, so vergrößert sich die Fläche unter dem Graphen um
etwa h · f (t).
Um wie viel wächst F (t), wenn wir t um eine kleine Zahl h > 0 vergrößern?
Es kommt bei der Fläche ein Stück dazu, das ungefähr gleich dem Rechteck mit Breite h und Höhe f (t) ist.
Also ist
F (t + h) ≈ F (t) + h · f (t).
Das können wir umformen zu
F (t + h) − F (t)
≈ f (t),
h
wobei Gleichheit gelten sollte, falls h gegen 0 strebt. Das heißt, wir erwarten:
lim
h↓0
F (t + h) − F (t)
= f (t).
h
Damit haben wir den folgenden Satz hergeleitet (naja: plausibel gemacht).
Satz 7.3 Sei f : [a, b] → R stetig und
Z
F (t) :=
t
f (x) dx.
a
Dann ist F differenzierbar mit der Ableitung
F 0 (t) = f (t).
(7.4)
(7.5)
92
Integration von Funktionen einer Variablen
Definition 7.4 Eine Funktion F heißt Stammfunktion von f , falls F differenzierbar ist mit Ableitung
F0 = f.
Beispiele 7.5
(i) Ist f (x) = x2 , so ist F (x) = 13 x3 eine Stammfunktion von f .
(ii) Ist f (x) = sin(x), so ist F (x) = − cos(x) eine Stammfunktion von f .
Bemerkung 7.6
von f .
(i) Ist F eine Stammfunktion von f und c ∈ R, so ist auch c + F eine Stammfunktion
(ii) Sind F1 und F2 Stammfunktionen von f und G := F1 − F2 , so ist G0 (x) = F10 (x) − F20 (x) =
f (x) − f (x) = 0 für alle x. Also ist G konstant.
(iii) Zusammengefasst ist die Stammfunktion von f bis auf eine additive Konstante eindeutig.
Wir können jetzt den zentralen Satz formulieren, der den Zusammenhang zwischen Integration und Differentiation angibt.
Satz 7.7 (Hauptsatz der Differential- und Integralrechnung) Ist f : [a, b] → R stetig und F eine
Stammfunktion von f , so ist
Z b
f (x) dx = F (b) − F (a).
a
Rt
Beweis Nach Satz 7.3 ist auch die Funktion G : t 7→ a f (x) dx eine Stammfunktion von f . Nach BemerkungR 7.6 gibt es ein c ∈ R mit F − G = c. Auswertung an der Stelle a ergibt c = F (a) − G(a) =
a
F (a) − a f (x) dx = F (a). Auswertung an der Stelle b liefert damit F (a) = c = F (b) − G(b), also
Z
b
f (x) dx = G(b) = F (b) − F (a).
a
2
Manchmal wird für die auftretende Differenz von Werten der Stammfunktion die folgende Schreibweise
verwendet.
Definition 7.8
b
F (x) := F (b) − F (a).
a
Mit dieser Schreibweise ist
Z
a
Beispiele 7.9
(i) Wir wollen
Z
0
π
Rπ
0
b
b
f (x) dx = F (x) .
a
sin(x) dx bestimmen. Eine Stammfunktion von sin ist − cos, also ist
π
sin(x) dx = − cos(x) = − cos(π) − (− cos(0)) = 1 + 1 = 2.
0
7.3
93
Berechnung von Integralen
(ii) Wir wollen
R2
0
x2 dx bestimmen. Eine Stammfunktion von f (x) = x2 ist F (x) = 31 x3 . Also ist
2
Z
0
(iii) Wir wollen
R2
1
1 x
dx bestimmen. Eine Stammfunktion von f (x) =
Z
1
7.3
2
1 3 1
1
8
x dx = x = · 8 − · 0 = .
3 0
3
3
3
2
2
1
x
ist F (x) = log(x). Also ist
2
1
dx = log(x) = log(2) − log(1) = log(2) ≈ 0.693.
x
1
Berechnung von Integralen
Die Berechnung von Integralen läuft meist auf das Bestimmen von Stammfunktionen hinaus. Man sucht
also eine Funktion F , die abgeleitet die gewünschte Funktion f liefert. Für das Ableiten hatten wir einen
ganz komfortablen Kalkül zusammengestellt. Für ein paar Grundfunktionen konnte man die Ableitung aus
einer Tabelle entnehmen. Alle daraus zusammengesetzten Funktionen konnte man mit Hilfe von einfachen
Regeln systematisch ausrechnen. Für das Auffinden von Stammfunktionen funktioniert dies eben nicht.
Während man schon eine Tabelle mit Grundfunktionen aufstellen kann und auch Addition und Multiplikation mit Zahlen keine Probleme bereiten, kann man für Produkte, Quotienten und Verknüpfungen von
Funktionen keine allgemeingültigen nützlichen Regeln aufstellen. Hier ist man auf einen guten Instinkt und
eventuell eine sehr große Formelsammlung angewiesen.
In diesem Abschnitt stellen wir nun die Rechenregeln bereit, die es zum Glück doch noch gibt.
Ist
f (x) =
n
X
ck xk
k=0
ein Polynom, so ist
F (x) =
n
X
ck k+1
x
k+1
k=0
eine Stammfunktion von f . Zum Nachweis muss man einfach nur F ableiten. Allgemeiner ist für eine
konvergente Potenzreihe um den Punkt a ∈ R
f (x) =
∞
X
ck (x − a)k
k=0
die Reihe
F (x) =
∞
X
ck
(x − a)k+1
k+1
(7.6)
k=0
mit selbem Konvergenzradius eine Stammfunktion und zwar mit F (a) = 0. Auch hier muss man zum
Nachweis einfach F ableiten und die Regeln aus Kapitel 6 beachten. Für viele andere Funktionen kann man
einfach die Tabelle der Ableitung aus Abschnitt 4.2 von rechts nach links lesen. Beispielsweise erhalten wir:
Beispiele 7.10
(i) f (x) = exp(x), dann ist F (x) = exp(x) eine Stammfunktion.
(ii) f (x) = x−2 , dann ist F (x) = −x−1 eine Stammfunktion.
(iii) f (x) =
1
1+x2 ,
dann ist F (x) = arctan(x) eine Stammfunktion.
94
Integration von Funktionen einer Variablen
(iv) f (x) =
√ 1
,
1−x2
x ∈ (−1, 1), dann ist F (x) = arcsin(x) eine Stammfunktion.
Für Funktionen, die sich als Summe oder Vielfache von Funktionen aus der Tabelle ergeben, kann man
leicht Regeln angeben, die sich direkt aus den entsprechenden Regeln für die Differentiation ergeben.
Satz 7.11 (Linearität des Integrals) Seien f, g : [a, b] → R integrierbar und λ ∈ R, sowie c ∈ (a, b).
Dann ist
Z b
Z b
(λf (x)) dx = λ
f (x) dx
(i)
a
b
Z
a
b
Z
(f (x) + g(x)) dx =
f (x) dx +
a
a
b
Z
(f (x) − g(x)) dx =
a
b
f (x) dx =
(iii)
f (x) dx.
(iv)
b
Z
f (x) dx +
a
g(x) dx
a
c
Z
(ii)
b
Z
f (x) dx −
a
g(x) dx
a
b
Z
Z
b
Z
a
c
Beweis (Nur für stetiges f und a ≤ c ≤ b.) Nur Punkt (iv) ist neu. Hierzu bemerken wir, dass nach dem
Hauptsatz gilt (mit F eine Stammfunktion von f )
b
Z
f (x) dx = F (b) − F (a)
a
= (F (c) − F (a)) + (F (b) − F (c))
Z c
Z b
=
f (x) dx +
f (x) dx.
a
c
2
(i) Sei f (x) = 5 sin(x). Dann ist F (x) = −5 cos(x) eine Stammfunktion von f .
Beispiele 7.12
(ii)
Z
4
x+
2
1
x
Z
4
4
Z
1
dx
x
2
2
4
4
1 2 = x + log(x) = 8 − 2 + log(4) − log(2) = 6 + log(2).
2
dx =
x dx +
2
2
(iii) Wir wollen die Vorzeichenfunktion sign im Bereich −2 bis 5 integrieren. Das Problem dabei ist
natürlich die Unstetigkeitsstelle in der Null. An der Stelle können wir uns aber mit Regel (iv) (aus
Satz 7.11) behelfen:
Z 5
Z 0
Z 5
sign(x) dx =
sign(x) dx +
sign(x) dx
−2
−2
0
0
Z
=
Z
(−1) dx +
−2
5
(+1) dx
0
= −2 + 5 = 3.
Allgemeiner kann man sogar zeigen, dass die Betragsfunktion x 7→ |x| eine Stammfunktion von sign
ist.
7.3
95
Berechnung von Integralen
Die Produktregel und die Kettenregel (siehe Abschnitt 4.3) übertragen sich leider nicht so einfach von der
Differentiation auf die Integration. Man kann nur Folgendes angeben.
Satz 7.13 (Substitutionsregel) Es seien a, b, c, d ∈ R mit a < b und c < d. Ist g : [a, b] → [c, d] stetig
differenzierbar und f : [c, d] → R stetig, so gilt
Z
b
g(b)
Z
0
f (g(x))g (x) dx =
f (y) dy.
a
g(a)
Mit anderen Worten: Ist F eine Stammfunktion von f , so ist x 7→ F (g(x)) eine Stammfunktion von
x 7→ f (g(x))g 0 (x).
Beweis Zum Beweis sei F eine Stammfunktion von f . Wir setzen H(x) = F (g(x)). Dann ist nach der
Kettenregel für Ableitungen
H 0 (x) = g 0 (x)F 0 (g(x)) = g 0 (x) · f (g(x)).
Dabei haben wir in der zweiten Gleichung ausgenutzt, dass F 0 = f ist. Also ist H eine Stammfunktion von
x 7→ g 0 (x) · f (g(x)). Nach dem Hauptsatz der Differential- und Integralrechnung ist also
b
Z b
Z g(b)
f (g(x))g 0 (x) dx = H(x) = F (g(b)) − F (g(a)) =
f (y) dy.
a
g(a)
a
2
0
Bemerkung 7.14 Nimmt man die Schreibweise dg(x)
dx = g (x) als Bruch ernst, so kann man ihn umformen
0
zu dg(x) = g (x) dx. Setzen wir jetzt noch y = g(x), so sagen wir, dass wir x durch die neue Integrationsvariable y substituiert haben mit dy = g 0 (x)dx.
Beispiele 7.15
(i) Mit f (x) = sin(x) und y = g(x) = x2 ist
Z π
Z
Z 2
1 π
1 π
2
2
x sin(x ) dx =
2x sin(x ) dx =
sin(y) dy
2 0
2 0
0
π 2
1
1
= − cos(y) = (1 − cos(π 2 )).
2
2
0
(ii) Mit f (x) = x2 und y = g(x) = tan(x) (sowie: g 0 (x) = 1 + (tan(x))2 ) ist
Z π/4
Z π/4
2
4
(tan(x)) + (tan(x)) dx =
1 + (tan(x))2 · (tan(x))2 dx
0
0
Z
tan(π/4)
y 2 dy
=
tan(0)
tan(π/4)
1
1 3 1
= y = tan(π/4)3 = .
3 tan(0)
3
3
(iii) Sei c ∈ R. Mit g(x) = x + c ist
Z
b
Z
b+c
f (x + c) dx =
a
f (y) dy.
a+c
96
Integration von Funktionen einer Variablen
(iv) Sei c 6= 0. Mit g(x) = cx ist
Z
b
f (cx) dx =
a
1
c
Z
bc
f (y) dy.
ac
(v) Wir wollen eine Stammfunktion von tan bestimmen. Dazu setzen wir f (x) = − x1 und g(x) =
cos(x). Dann ist g 0 (x) = − sin(x) und F (x) = − log(x) ist eine Stammfunktion von f . Nach der
Substitutionsregel ist von
sin(x)
tan(x) =
= g 0 (x)f (g(x))
cos(x)
eine Stammfunktion
x 7→ F (g(x)) = − log(cos(x)).
(7.7)
Mit der Substitutionsregel haben wir die Kettenregel rückwärts angewandt. Als nächstes wollen wir die Produktregel rückwärts anwenden. Die resultierende Integrationsregel nennt man dann partielle Integration.
Satz 7.16 (Partielle Integration) Seien f und g stetige Abbildungen [a, b] → R mit stetigen Ableitungen
f 0 und g 0 . Dann gilt
b Z b
Z b
f 0 (x)g(x) dx.
f (x)g 0 (x) dx = f (x)g(x) −
a
a
Z
Mit anderen Worten: x 7→ H(x) := f (x)g(x)−
a
x
f 0 (t)g(t) dt ist eine Stammfunktion von x 7→ h(x) :=
a
f (x)g 0 (x).
Beweis Es reicht zu zeigen, dass H 0 (x) = h(x) ist. Nach der Produktregel für Ableitungen (Satz 4.6) ist
aber
d
f (x)g(x) = f 0 (x)g(x) + f (x)g 0 (x).
dx
Nach dem Hauptsatz der Differential- und Integralrechnung ist andererseits
Z x
d
f 0 (t)g(t) dt = f 0 (x)g(x).
dx a
Also ist (nach Satz 7.3)
H 0 (x) = f 0 (x)g(x) + f (x)g 0 (x) − f 0 (x)g(x) = f (x)g 0 (x) = h(x).
2
Natürlich ist partielle Integration nur dann nützlich, wenn das Integral, das man auf der rechten Seite abziehen muss, leichter zu berechnen ist als das Integral, für das man sich ursprünglich interessiert hat. Das ist
manchmal, aber durchaus nicht immer, der Fall. Wir wollen hier ein paar Beispiele angeben, bei denen es
funktioniert.
Z
Beispiele 7.17
0
y
x sin(x) dx bestimmen. Dazu setzen wir f (x) = x und g(x) =
(i) Wir wollen
0
− cos(x). Also g (x) = sin(x), f 0 (x) = 1 und f 0 (x)g(x) = − cos(x). Mit Hilfe der partiellen
7.3
97
Berechnung von Integralen
Integration bekommen wir
y
Z
0
y Z y
(− cos(x)) dx
x sin(x) dx = −x cos(x) −
0
0
y
= −y cos(y) + sin(x) = sin(y) − y cos(y).
0
Z
y
log(x) dx berechnen. Dazu setzen wir f (x) = log(x) und g(x) = x. Dann ist
(ii) Wir wollen
f 0 (x) =
1
x
1
und g 0 (x) = 1. Also ist mit partieller Integration
Z
1
y
y Z
log(x) dx = x log(x) −
1
1
y
1
· x dx = y log(y) − y + 1.
x
Also ist x 7→ x(log(x) − 1) eine Stammfunktion von log.
Rπ
(iii) Wir wollen 0 x2 cos(x) dx bestimmen. Dazu setzen wir f (x) = x2 und g(x) = sin(x). Damit ist
f 0 (x) = 2x und g 0 (x) = cos(x), also
Z
0
π
π Z
x2 cos(x) dx = x2 sin(x) −
π
Z
0
0
π
2x sin(x) dx = −
2x sin(x) dx,
0
weil sin(π) = sin(0) = 0.
Um das verbleibende Integral auszurechnen, wenden wir Beispiel (i) an:
Z
π
2x sin(x) dx = 2(sin(π) − π cos(π)) = 2π.
0
Insgesamt haben wir also
π
Z
x2 cos(x) dx = −2π.
0
(iv) (Fläche des Einheitskreises) Als letzte und schwierigste Anwendung wollen nun noch die Fläche
eines Kreises mit Radius 1 ausrechnen. Hierzu reicht es sicher aus, die Fläche des halben Kreises
auszurechnen, der oberhalb der x–Achse liegt und im Ursprung zentriert ist. Nach √
dem Satz von
Pythagoras ist für jeden Punkt (x, y) auf dem Kreisrand x2 + y 2 = 1, also y = 1 − x2 . Wir
müssen also das folgende Integral ausrechnen:
Z
1
I :=
p
1 − y 2 dy.
−1
Wir gehen dazu in zwei Schritten vor.
Schritt 1. (Verwendung der Substitutionsregel)
Man substituiere y = g(x) := sin(x) (also x = arcsin(y) = g −1 (y)). Dann muss man dy ersetzen
durch g 0 (x) dx = cos(x) dx und die Intervallgrenzen −1, 1 durch g −1 (−1), g −1 (1). Damit erhält
man
Z π/2 p
Z π/2
I=
1 − (sin(x))2 · cos(x) dx =
(cos(x))2 dx.
−π/2
−π/2
98
Integration von Funktionen einer Variablen
Schritt 2. (partielle Integration)
Wir wenden partielle Integration an mit f (x) = cos(x) und g 0 (x) = cos(x), also f 0 (x) = − sin(x)
und g(x) = sin(x):
Z π/2
cos(x) · cos(x) dx
I=
−π/2
π/2
Z
+
= cos(x) · sin(x)
(sin(x))2 dx
−π/2
−π/2
Z
π/2
π/2
1 − (cos(x))2 dx = π − I.
=0+
−π/2
Damit ist I = π/2.
7.4
Uneigentliche Integrale
Wir betrachten die Funktion f : (0, 1] → R, x 7→ √1x . Wir würden gerne den Flächeninhalt unter dem
R1
Graphen von f im Intervall (0, 1] als Integral 0 f (x) dx angeben. Im Rahmen dessen, wie das Integral in
Abschnitt 7.1 eingeführt wurde, funktioniert dies aus zwei Gründen nicht:
(1) Wir hatten bisher für die Integration vorausgesetzt, dass f im gesamten abgeschlossenen Intervall
[0, 1] definiert ist.
(2) Schlimmer noch: lim f (x) = ∞. Deshalb ist jede Obersumme On (f ) = ∞.
x↓0
√
Da wir aber zu f die Stammfunktion F (x) = 2 x angeben können, lassen wir uns durch die obigen
Bedenken nicht abschrecken, sondern suchen nach einem etwas allgemeineren Integralbegriff. In diesem
Fall bietet sich Folgendes an: Für jedes h > 0 ist
Z
1
f (x) dx = F (1) − F (h) = 2(1 −
√
h).
h
Die rechte Seite ist für alle h ≥ 0 definiert und stetig in h. Also definieren wir
Z
1
Z
1
f (x) dx = F (1) − F (0) = 2.
f (x) dx = lim
0
h↓0
h
R1
Wir nennen 0 f (x) dx ein uneigentliches Integral – eine der schönsten Wortschöpfungen in der Mathematik! Ähnlich wollen wir verfahren, um Integrationsgrenzen ins Unendliche auszudehnen.
Definition 7.18 (Uneigentliches Integral)
(i) Seien a ∈ R und b > a oder b = ∞ sowie f : [a, b) → R
eine reelle Funktion. Für jedes R ∈ [a, b) sei f auf [a, R] integrierbar. Wir definieren das uneigentliche Integral
Z b
Z R
f (x) dx = lim
f (x) dx,
a
R↑b
a
falls der Limes existiert (wobei wir −∞ und +∞ als Grenzwerte zulassen wollen). In diesem Fall
Rb
heißt das Integral a f (x) dx auch konvergent (bzw. uneigentlich konvergent, falls der Grenzwert
Rb
nicht endlich ist). Andernfalls heißt a f (x) dx divergent.
7.4
99
Uneigentliche Integrale
(ii) Analog gehen wir vor, falls b ∈ R und a < b oder a = −∞ sowie f : (a, b] → R ist. Hier ist
Z b
Z b
f (x) dx = lim
f (x) dx.
R↓a
a
R
(iii) Seien a < b, wobei wir a = −∞ und/oder b = ∞ zulassen, und f : (a, b) → R. Wir wählen ein
c ∈ (a, b) und setzen (vergleiche Satz 7.11(iv))
Z b
Z c
Z b
f (x) dx,
f (x) dx +
f (x) dx =
c
a
a
falls wenigstens einer der Summanden endlich ist, oder beide das gleiche Vorzeichen haben.
Bemerkung 7.19 In (iii) hängt der Wert der Summe nicht von der Wahl von c ab. Im übrigen verwenden
wir die Konvention x + ∞ = ∞, x − ∞ = −∞, falls x ∈ R und ∞ + ∞ = ∞, −∞ − ∞ = −∞. Der
Ausdruck ∞ − ∞ kann nicht sinnvoll definiert werden.
Beispiele 7.20
(i) a = 0, b = 1, f : (0, 1] → R, f (x) = log(x). Aus Beispiel 7.17(ii) wissen wir,
dass F (x) = x(log(x) − 1) eine Stammfunktion von f ist. Die de l’Hospital’sche Regel liefert
lim F (x) = 0 (siehe Beispiel 4.16(v)). Also konvergiert das uneigentliche Integral
x↓0
Z
1
Z
1
log(x) dx = F (1) − lim F (R) = F (1) = −1.
log(x) dx = lim
0
R↓0
R↓0
R
(ii) a = 0, b = ∞, f : [0, ∞) → R, f (x) = exp(−x). Offenbar ist
R
Z R
−x
−x e dx = −e = 1 − e−R .
0
0
Also konvergiert das uneigentliche Integral
Z ∞
e−x dx = lim 1 − e−R = 1.
R→∞
0
1
(iii) a = −∞, b = ∞, f : R → R, x 7→ K+x
2 , wobei K > 0 eine Konstante ist. Dann ist F (x) =
x
1
√ arctan( √ ) eine Stammfunktion, denn
K
K
1
1
x
1
1
1
0
0
F (x) = √ · √ arctan √
=
·
=
.
2
K 1 + x /K
K + x2
K
K
K
Wegen lim arctan(R) = − lim arctan(R) =
R→∞
∞
Z
c
R→−∞
1
f (x) dx = lim √ arctan
R→∞
K
x
√
K
π
2
ist für c ∈ R
R
= √1 · π − √1 arctan √c
.
K 2
K
K
c
und
Z
c
1
f (x) dx = lim √ arctan
R→−∞
K
−∞
Also existiert das uneigentliche Integral
Z ∞
−∞
x
√
K
c
1
π
= √1 arctan √c
+√ · .
K
K
K 2
R
1
π
dx = √ .
2
K +x
K
100
Integration von Funktionen einer Variablen
(iv) a = 1, b = ∞, f : [1, ∞) → R, f (x) = x1 . Dann ist F (x) = log(x) eine Stammfunktion. Wegen
lim F (x) = ∞ konvergiert das uneigentliche Integral nur uneigentlich
x→∞
R
1
dx = lim log(x) = lim log(R) = ∞.
R→∞
R→∞
x
1
∞
Z
1
(v) a = 0, b = ∞, f : [0, ∞) → R, f (x) = sin(x). Dann ist F (x) = − cos(x) eine Stammfunktion.
Jedoch existiert
der Grenzwert von F (x) für x → ∞ nicht. Also existiert auch das uneigentliche
R∞
Integral 0 sin(x) dx nicht.
R∞
An diesem Beispiel sieht man auch, dass für die Existenz von −∞ f (x) dx nicht ausreichend ist,
RR
dass lim −R f (x) dx existiert. In dem hier betrachteten Fall ist nämlich
R→∞
Z
R
−R
R
= − cos(R) + cos(−R) = 0.
sin(x) dx = − cos(x)
−R
Also ist auch
Z
R
lim
R→∞
Aber
R∞
−∞
sin(x) dx = 0.
−R
sin(x) dx existiert nicht, wie wir gesehen haben.
Oft ist man in der Situation, dass man den Wert eines bestimmten (uneigentlichen) Integrals ausrechnen
möchte, obwohl man eine Stammfunktion nicht, oder nur schwer, ausrechnen kann. Oft ist es so verzwickt,
diese Integrale auszurechnen, dass man auf Tabellen angewiesen ist, in denen solche Integrale aufgelistet
sind.
∞
Z
xn e−x dx ausrechnen (für n ∈ N). Im Prinzip könnte man schon eine
Beispiel 7.21 Wir wollen In :=
0
Stammfunktion angeben, aber es geht hier einfacher. Mit partieller Integration (f (x) = xn , g(x) = −e−x )
erhalten wir
R Z R
Z R
n −x
n −x x e dx = −x e +
nxn−1 e−x dx.
0
0
0
Wegen lim Rn e−R = 0 verschwindet der erste Summand, wenn R nach ∞ geht, also ist
R→∞
Z
∞
xn e−x dx =
0
Z
∞
nxn−1 e−x dx.
0
Also ist In = nIn−1 . Wir haben aber I0 schon ausgerechnet:
Z ∞
I0 =
e−x dx = 1.
0
Also ist I1 = 1 · I0 = 1, I2 = 2 · I1 = 2 · 1 = 2, I3 = 3 · I2 = 3 · 2 · 1 = 3! = 6, . . . , In =
n(n − 1)(n − 2) · · · 2 · 1 = n!. Insgesamt haben wir also
Z
0
∞
xn e−x dx = n!
(7.8)
7.5
101
Komplexe Integranden
2
Beispiel 7.22 Für die Gauß’sche Fehlerfunktion f (x) = e−x kann man keine Stammfunktion explizit
angeben. Aber man kann (wenn auch mit viel Mühe) ausrechnen, dass
∞
Z
2
e−x dx =
√
π.
(7.9)
−∞
Beispiel 7.23 Man kann berechnen, dass
∞
Z
0
7.5
sin(x)
π
dx = .
x
2
Komplexe Integranden
Wenn wir eine komplexwertige Funktion f : [a, b] → R haben, bei der der Realteil Re(f ) und der Imaginärteil Im(f ) integrierbare Funktionen sind, so können wir das Integral von f definieren.
Definition 7.24
Z
b
Z
f (x) dx :=
a
b
Z
Re(f (x)) dx + i
a
b
Im(f (x)) dx.
a
Man bemerke, dass diese Definition verträglich ist mir den Rechenregeln aus Satz 7.11. Wegen Regel (ii)
und f = Re(f ) + i Im(f ) müssen wir das Integral von f sogar so definieren.
Das hier definierte Integral hat zwar keine so schöne anschauliche Interpretation wie das Integral mit reellwertigen Integranden, aber zum Rechnen ist es in manchen Situationen extrem praktisch.
Bemerkung 7.25 Alle Regeln aus diesem Kapitel für die Bestimmung von Integralen gelten genauso für
komplexwertige Integranden f .
Beispiel 7.26 Das wichtigste Beispiel ist mal wieder die komplexe Exponentialfunktion f (x) = exp(iλx),
wobei λ ∈ R, λ 6= 0. Wenden wir ganz formal die Rechenregeln an, so erhalten wir
Z
a
b
b
exp(iλb) − exp(iλa)
1
exp(iλx) dx =
exp(iλx) =
.
iλ
iλ
a
Ist speziell n = λ ∈ Z \ {0}, sowie b = 2π und a = 0, so verschwindet der Zähler des Bruches, denn
exp(2πn) = exp(0) = 1. Insgesamt erhalten wir die folgende wichtige Formel
Z
I(n) :=
2π
exp(inx) dx =
0
2π,
0,
falls n = 0,
falls n 6= 0.
Mit Hilfe von (7.10) können wir nun gewisse Integrale von Winkelfunktionen sehr leicht berechnen.
(7.10)
102
Integration von Funktionen einer Variablen
Satz 7.27 Es seien m, n ∈ N0 . Dann ist
(
2π
Z
sin(mx) sin(nx) dx =
0
π,
falls m = n 6= 0,
0,
sonst.

2π,



2π
π,
cos(mx) cos(nx) dx =

0


0,
(7.11)
falls m = n = 0,
Z
falls m = n 6= 0,
(7.12)
sonst.
2π
Z
sin(mx) cos(nx) dx = 0.
(7.13)
0
eix + e−ix
eix − e−ix
und cos(x) = Im(eix ) =
.
Beweis Nach Lemma 1.5 (iii) ist sin(x) = Re(eix ) =
2i
2
Daher ist
eimx − e−imx einx − e−inx
·
sin(mx) sin(nx) =
2i
2i
1 i(m+n)
=−
e
− ei(m−n) + e−i(m+n) − e−i(m−n) .
4
Also ist (mit der Notation aus (7.10))
Z
2π
sin(mx) sin(nx) dx = −
0
1
1
I(m + n) − I(m − n) − I(−(m + n)) − I(−(m − n)) .
4
4
Ist n = 0, so verschwinden trivialerweise die jeweiligen Differenzen und der Gesamtausdruck ist gleich 0.
Sei nun n 6= 0. Dann ist m + n 6= 0, also nach (7.10) I(m + n) = I(−(m + n)) = 0. Ist m 6= n, so ist
m − n 6= 0, also auch I(m − n) = I(−(m − n)) = 0. Ist schließlich m = n, so ist m − n = 0, also auch
I(m − n) = I(−(m − n)) = 2π. Insgesamt haben wir (7.11) nachgewiesen.
2
Der Nachweis von (7.12) und (7.13) verbleibt als Übung!
7.6
Partialbruchzerlegung
1
Wir wollen eine Stammfunktion F zu f (x) = 1−x
2 angeben. Wie geht man vor? Wir haben im Kapitel 6
gesehen, dass
1
1
1
1
=
+
.
1 − x2
2 1+x 1−x
1
1
Die Ausdrücke 1+x
und 1−x
heißen die Partialbrüche von f . Nun sind aber log(1 + x) und − log(1 − x)
1
1
. Also ist
Stammfunktionen von 1+x und 1−x
F (x) =
1
1
(log(1 + x) − log(1 − x)) = log
2
2
1+x
1−x
eine Stammfunktion von f .
Der folgende Satz zeigt, das wir hier keinen Glückstreffer gelandet haben, sondern, dass wir für jede rationale Funktion eine ähnliche Zerlegung finden können.
7.6
103
Partialbruchzerlegung
Satz 7.28 (Partialbruchzerlegung) Man kann jede reelle rationale Funktion f als eine Summe schreiben
von einem Polynom und von rationalen Funktionen die jeweils von einem der folgenden drei Typen sind:
a
(x + b)p
a
x 7→ 2
(x + bx + c)p
ax
x 7→ 2
.
(x + bx + c)p
x 7→
(1)
(2)
(2)
Dabei können die Koeffizienten a, b, c ∈ R, sowie die Potenz p ∈ N bei jedem Summanden unterschiedlich
sein. Eine solche Summe heißt Partialbruchzerlegung von f .
Das Gute an einer Partialbruchzerlegung ist, dass man für die einzelnen Summanden Stammfunktionen
angeben kann, die sind nämlich tabelliert. Wir wollen das Verfahren an einem Beispiel erläutern.
R9
x4 −3x
4 x2 −4x+3
Beispiel 7.29 Wir wollen
x4
−x4
−3x
+4x3
−3x2
4x3
−3x2
−3x
−4x3
+16x2
−12x
13x2
−15x
−13x2
dx berechnen. Durch Polynomdivision erhalten wir
÷
x2 − 4x + 3
= x2 + 4x + 13 Rest 37x − 39
(7.14)
+52x −39
37x −39
Also ist
x4 − 3x
37x − 39
= x2 + 4x + 13 + 2
.
2
x − 4x + 3
x − 4x + 3
Der erste Teil macht keine Probleme. Für den Nenner bestimmen wir mit quadratischer Ergänzung die
Linearfaktoren
x2 − 4x + 3 = (x − 1)(x − 3).
Also suchen wir nach Zahlen A1 und A2 mit
A1
A2
37x − 39
+
=
,
x−1 x−3
(x − 1)(x − 3)
für x 6∈ {1, 3}.
Dazu bringen wir die linke Seite auf einen Nenner
A1 (x − 3) + A2 (x − 1)
(A1 + A2 )x − 3A1 − A2
=
.
(x − 1)(x − 3)
(x − 1)(x − 3)
Also ist
A1 + A2 = 37
und
− 3A1 − A2 = −39.
104
Integration von Funktionen einer Variablen
Die Lösung dieser linearen Gleichung ist
A1 = 1,
A2 = 36.
Insgesamt haben wir
36
x4 − 3x
1
= x2 + 4x + 13 +
+
,
− 4x + 3
x−1 x−3
für x 6∈ {1, 3}.
x2
Hierzu können wir leicht die Stammfunktion F angeben
F (x) =
1 3
x + 2x2 + 13x + log(|x − 1|) + 36 log(|x − 3|).
3
Also ist
Z
4
9
1
x4 − 3x
dx = 729 + 2 · 81 + 13 · 9 + log(8) +36 ·
| {z }
− 4x + 3
3
log(6)
| {z }
x2
=3 log(2)
−
=
log(2)+log(3)
1
64 + 2 · 16 + 13 · 4 + log(3)
3
1250
+ 39 log(2) + 35 log(3) ≈ 482.151.
3
Analog können wir das Integral dieser Funktion in den Grenzen −1 bis 0 ausrechnen (als Illustration dafür,
dass die Betragsstriche bei den Logarithmen tatsächlich eine Rolle spielen):
Z
0
−1
x4 − 3x
dx = F (0) − F (−1)
x2 − 4x + 3
1
= 0 + 35 log(3) − − + 2 − 13 + log(2) + 36 log(4)
3
= 36 log(3) +
34
− 73 log(2) ≈ 0.28363.
3
In vorangehenden Beispiel hatten wir ausgenutzt, dass wir für das quadratische Polynom im Nenner reelle
Nullstellen angeben konnten. Was machen wir aber, wenn das Polynom x2 + bx + c im Nenner keine reelle
Nullstelle hat? Wir schauen in der Formelsammlung nach und finden:
Lemma 7.30 Sei die Diskriminante ∆ = b2 −4c < 0 (d.h. x2 +bx+c hat keine reelle Nullstelle, vergleiche
x
1
und g(x) = 2
. Stammfunktionen F und G von f und
Satz 1.16) und seien f (x) = 2
x + bx + c
x + bx + c
g sind
2
2x + b
arctan √
,
F (x) = √
−∆
−∆
1
b
G(x) = log x2 + bx + c − √
arctan
2
−∆
Beweis Ableitungen bilden!
2x + b
√
−∆
.
2
7.7
105
Wichtige Ungleichungen
Beispiel 7.31 Wir wollen
R1
x2 −x
0 x2 −2x+4
dx berechnen. Zunächst einmal schreiben wir den Bruch um:
x2 − x
x−4
=1+ 2
= 1 + f (x) + g(x),
2
x − 2x + 4
x − 2x + 4
wobei
f (x) =
−4
,
x2 − 2x + 4
g(x) =
x
.
x2 − 2x + 4
Ist b = −2 und c = 4, so ist ∆ = b2 − 4c = −12 < 0, also hat x2 − 2x + 4 keine reellen Nullstellen. Nach
dem Lemma haben f und g die Stammfunktionen
x−1
4
√
F (x) = − √ arctan
3
3
und
1
1
x−1
2
√
G(x) = log x − 2x + 4 + √ arctan
.
2
3
3
√
√
Es ist F (1) = 0 und F (0) = − √43 arctan(−1/ 3) = 92 3 π sowie G(1) =
√
1
log(2) − 18
3 π. Also ist
Z
0
7.7
1
1
2
log(3) und G(0) =
x2 − x
dx = 1 + F (1) − F (0) + G(1) − G(0)
x2 − 2x + 4
1
1√
= 1 + log(3) − log(2) −
3 π ≈ −0.0507.
2
6
Wichtige Ungleichungen
Wenn man Integrale nicht genau ausrechnen kann, kann man manchmal durch Vergleich mit bekannten
Integralen Abschätzungen angeben. Hier stellen wir die wichtigsten Typen solcher Abschätzungen vor.
Im folgenden ist stets a ∈ R oder a = −∞ und b ∈ R mit b > a oder b = ∞. Weiter sind f und g
Funktionen, die auf (a, b) definiert sind.
Satz 7.32 Sind f und g integrierbar und ist f (x) ≤ g(x) für alle x, so ist
Z
b
Z
f (x) dx ≤
a
b
g(x) dx.
a
Die Aussage sollte auch ohne gesonderten Beweis klar sein. Etwas komplizierter wird es im folgenden Satz.
Z b
Satz 7.33 Sei g(x) ≥ 0 für alle x ∈ R und sei
g(x) dx < ∞. Ist |f (x)| ≤ g(x) für alle x und ist f
a
Z b
(wenigstens stückweise) stetig, so existiert
f (x) dx, und es gilt
a
Z
Z
b
b
f (x) dx ≤
g(x) dx.
a
a
106
Integration von Funktionen einer Variablen
Speziell gilt für jede (uneigentlich) integrierbare Funktion f
Z
Z
b
b
|f (x)| dx.
f (x) dx ≤
a
a
Sind a, b ∈ R und M ≥ f (x) für alle x ∈ R, so ist
Z b
|f (x)| dx ≤ M · (b − a).
a
R∞
Beispiel 7.34 Wir wollen 0 exp(−x2 ) dx abschätzen. Wir wissen, dass x2 ≥ x −
ist exp(−x2 ) ≤ exp( 14 ) exp(−x) für alle x. Es folgt
Z ∞
Z ∞
2
1/4
exp(−x ) dx ≤ e
e−x dx = e1/4 ≈ 1.28.
0
1
4
ist für alle x. Also
0
Aus Beispiel 7.22 kennen wir allerdings auch schon den exakten Wert, nämlich
√
Z ∞
Z
π
1 ∞
2
2
exp(−x ) dx =
≈ 0.886.
exp(−x ) dx =
2
2
−∞
0
Beispiel 7.35 Es ist
Z
∞
1
sin(x) 1
weil 2 ≤ 2 ist und
x
x
Z
1
Beispiel 7.36 Wir wollen wissen, ob
n − 1 ≤ x < n. Dann ist f (x) <
1
x2
∞
sin(x) dx
< ∞,
x2
∞
1
−1 dx = −x = 1.
2
x
1
∞
k
X
X
1
1
:=
lim
endlich ist. Dazu setzen wir f (x) =
2
k→∞
n
n2
n=1
n=1
1
n2 ,
falls
=: g(x) und
Z k
Z k
k
X
1
=
f
(x)
dx
=
1
+
f (x) dx.
n2
0
1
n=1
Also ist
Der wirkliche Wert
Z ∞
∞
X
1
1
≤
1
+
dx = 2.
2
n
x2
1
n=1
∞
P
n=1
1
n2
=
π2
6
≈ 1.645 ist kaum kleiner.
Als letztes bringen wir noch die Cauchy-Schwarz’sche Ungleichung. Diese wird uns in ähnlicher Form
noch gelegentlich begegnen. Der Beweis kann hier leider nicht erbracht werden.
Satz 7.37 (Cauchy-Schwarz’sche Ungleichung) Ist
Z b
(f (x))2 dx < ∞
und
a
Z
a
b
(g(x))2 dx < ∞,
7.7
so ist
107
Wichtige Ungleichungen
v
Z
!
! Z
Z b
u
b
b
u
t
2
2
f (x)g(x) dx ≤
(g(x)) dx .
(f (x)) dx
a
a
a
R π/2
Beispiel 7.38 Wir wollen 0 x sin(x) dx nach oben abschätzen. Die Cauchy-Schwarz’sche Ungleichung
liefert
s
s
Z π/2
Z π/2
Z π/2
2
x sin(x) dx ≤
x dx
(sin(x))2 dx
0
0
0
r v
u Z π/2
1 π 3u
u1
=
(1 − cos(2x)) dx
3 2 u
t2 |0
{z
}
=π/2
1
= √ π 2 ≈ 1.0073 . . . .
4 6
Der wirkliche Wert lässt sich durch partielle Integration berechnen und beträgt 1. Man liegt also mit der
Abschätzung gar nicht so verkehrt.
∞
e−x
dx bestimmen. Leider können wir das Integral nicht explizit ausrechx
1
nen. Wir können aber mit der Cauchy-Schwarz’schen Ungleichung eine obere Schranke für den Wert angeben:
sZ
sZ
Z ∞ −x
∞
∞
e
1
dx ≤
dx
e−2x dx
x
x2
1
1
1
r
r
∞
1 −2x ∞
= − e
−x−1 2
1
1
p
= e−1 1/2 ≈ 0.2601 . . . .
Z
Beispiel 7.39 Wir wollen
Der wirkliche Wert, den man sich nur durch andere numerische Methoden verschaffen kann, beträgt 0.2193 . . ..
Auch hier liegt man mit der Abschätzung nicht so verkehrt.
108
Integration von Funktionen einer Variablen
Kapitel 8
Gewöhnliche Differentialgleichungen
Im ersten Abschnitt motivieren wir den Begriff der Differentialgleichung und führen ihn formal ein. In
zwei weiteren Abschnitten behandeln wir konkrete Lösungsverfahren für Differentialgleichungen erster
und zweiter Ordnung.
8.1
Allgemeines
Wir betrachten eine Situation, bei der wir in einem wissenschaftlichen Experiment einen Parameter x frei
einstellen können (bzw. wo x die Zeit ist) und y = y(x) ist eine Messgröße, die von x abhängt. Die Naturwissenschaft formuliert als Naturgesetz einen Zusammenhang zwischen x und y(x). Der Zusammenhang
kann allerdings derart formuliert sein, dass nicht unmittelbar klar wird, wie man y(x) bei gegebenem x auch
wirklich berechnet. Die Aufgabe der Mathematik ist es, Formeln für die Abbildungsvorschrift x 7→ y(x)
zu finden.
Beispiel 8.1 (Reaktion zweiter Ordnung) Wir betrachten die chemische Reaktion
2NO2 −→ 2NO + O2 .
Wir interessieren uns hier für die Reaktionskinetik. Mit x bezeichnen wir die verstrichene Zeit, mit y(x) die
Konzentration von Stickstoffdioxid zur Zeit x. Aus elementaren chemischen Überlegungen heraus wird ein
Gesetz formuliert, dass der Stoffumsatz pro Zeiteinheit proportional zu y 2 (x) sein muss. Das entsprechende
Naturgesetz lautet also
d
y 0 (x) =
y(x) = −ky 2 (x).
(8.1)
dx
Hierbei ist k ≥ die Reaktionskonstante. Wir nehmen an, dass die Messung zur Zeit x = 0 beginnt und die
Anfangskonzentration y(0) = y0 ≥ 0 ist.
Wir werden später sehen, wie man diese Gleichung systematisch so löst, dass man die Zuordnungsvorschrift
x 7→ y(x) erhält. An dieser Stelle geben wir die Lösung nur an:
y(x) = y0
1
.
1 + kxy0
(8.2)
Hat man die Formel für y erst einmal an der Hand, so kann man leicht prüfen, dass y die Gleichung (8.2)
löst. Probe:
√
−ky0
y 0 (x) = y0
= −k y 2 (x)
.
(1 + kxy0 )2
109
110
Gewöhnliche Differentialgleichungen
Der schwierige Teil besteht stets darin, eine Lösung zu raten oder sich systematisch zu verschaffen. Das
Nachprüfen ist stets einfach. In diesem Sinne haben wir eine ähnliche Situation wie bei der Integration:
Auch dort war es schwierig, eine Stammfunktion zu raten. Das Nachprüfen, ob eine Funktion tatsächlich
eine Stammfunktion ist, ist stets einfach.
Wir wollen in diesem Kapitel annehmen, dass das Naturgesetz in der Form
F (x, y, y 0 , y 00 , . . . , y (n) ) = 0
(8.3)
vorliegt für ein n ∈ N. (Im Beispiel war n = 1 und F (x, y, y 0 ) = ky 2 + y 0 .)
Definition 8.2 (Differentialgleichung) Eine Gleichung der Form (8.3) heißt gewöhnliche Differentialgleichung (DGL) der Ordnung n. Kann man die Gleichung nach y (n) auflösen, gilt also
y (n) = G(x, y, y 0 , . . . , y (n−1) )
(8.4)
für eine Funktion G, so heißt (8.4) explizite Differentialgleichung
Die Gleichung (8.1) ist also eine explizite (gewöhnliche) DGL erster Ordnung. Die Bezeichnung gewöhn”
lich“ bedeutet lediglich, dass die Funktion y nur von einem freien Parameter abhängt. Gibt es mehrere freie
Parameter, so spricht man von einer partiellen Differentialgleichung. Partielle Differentialgleichung treten auf bei der Untersuchung von Wärmeflussphänomenen oder von Wellen sowie in der Quantenmechanik.
Hier behandeln wir nur gewöhnliche Differentialgleichungen.
Im allgemeinen hat man bei der Lösung einer DGL der n-ter Ordnung noch n freie Konstanten zu wählen.
Im Beispiel 8.1 war dies die Anfangskonzentration.
Definition 8.3 (Anfangswertproblem) Die Angabe einer expliziten DGL und der Anfangswerte
x0 ,
y(x0 ) = y0 , y 0 (x0 ) = y1 , . . . , y (n−1) (x0 ) = yn−1
(8.5)
heißt Anfangswertproblem (AWP).
Wir wollen nun festhalten, was wir unter einer Lösung einer Differentialgleichung verstehen.
Definition 8.4 (Lösung einer DGL) Eine (wenigstens) n-mal differenzierbare Funktion y, die (8.3) erfüllt,
heißt Lösung der DGL (8.3). Gilt zusätzlich noch (8.5), so heißt y eine Lösung des Anfangswertproblems
[(8.3), (8.5)].
Beispiel 8.5 (Freier Fall) Wir lassen einen Stein aus einer Höhe y0 zur Zeit x = 0 fallen und wollen die
Höhe y(x) als Funktion der Zeit x beschreiben. Physikalische Überlegungen ergeben, dass im freien Fall
die Beschleunigung konstant ist
y 00 (x) = −g,
(8.6)
wobei g = 9.81 sm2 die Erdbeschleunigung ist. Die Gleichung (8.6) ist eine explizite Differentialgleichung
zweiter Ordnung. Für das Anfangswertproblem müssen wir also x0 , sowie y(x0 ) und y 0 (x0 ) vorgeben. In
diesem Fall ist x0 = 0, y(0) = y0 und y 0 (0) = 0, weil der Stein anfangs noch in Ruhe befindlich ist. Dieses
AWP lässt sich explizit lösen: Nach dem Hauptsatz der Differential- und Integralrechnung ist
Z x
y 0 (x) = y 0 (0) +
y 00 (t) dt = −gx.
0
0
Genauso können wir y integrieren und erhalten
Z
y(x) = y0 +
0
x
1
y 0 (t) dt = y0 − gx2 .
2
Auch hier ergibt die Probe leicht, dass y wirklich eine Lösung des AWP ist.
8.2
111
Lösungsverfahren für DGL’en 1. Ordnung
8.2
Lösungsverfahren für DGL’en 1. Ordnung
Wir betrachten im folgenden stets eine explizite Differentialgleichung erster Ordnung
y 0 (x) = F (x, y(x)).
Die Abbildungsvorschriften x 7→ y(x) sowie x 7→ y 0 (x) kennen wir nicht. Die Abbildung (x, y) 7→ F (x, y)
ist vorgegeben.
In diesem Abschnitt wollen wir zunächst eine geometrische Interpretation der DGL angeben. Danach behandeln wir die Frage, ob es stets eine Lösung der DGL gibt, und wenn ja, ob diese eindeutig ist, oder
ob es eventuell mehrere Lösungen (mit selben Anfangswerten) geben kann. Danach wenden wir uns ganz
konkreten Methoden zu, mit denen gewisse Typen expliziter Differentialgleichungen erster Ordnung gelöst
werden können.
8.2.1
Geometrische Interpretation
Zu jedem Wert der unabhängigen Variablen x und der abhängigen Variablen y können wir die Ableitung
dy
dx = F (x, y) einer Lösungskurve ausrechnen. Wir tragen in einem Diagramm Pfeile auf, die in (x, y) fußen
und die Steigung F (x, y) haben. Die Lösungen der DGL sind dann die Integralkurven des Richtungsfeldes,
d.h. sie haben in jedem Punkt (x, y) die vorgegebene Richtung als Tangente.
2
1.5
y(x)
1
0.5
0
1
2
3
4
5
6
x
F IGUR . Richtungsfeld der DGL y 0 (x) = y − y 2 (x) + 13 cos(x) mit Lösungskurven zu den
Anfangsbedingungen (x0 , y0 ) = (2, 1.5), (2, 1.08), (2, 1.05), (2, 1.01), (2, 0.8)
112
8.2.2
Gewöhnliche Differentialgleichungen
Lösbarkeit und Eindeutigkeit
Um die Lösbarkeit der DGL sowie die Eindeutigkeit der Lösung zu garantieren, braucht man gewisse Regularitätsannahmen an die Funktion F .
Mit
d
F (x + h, y) − F (x, y)
F (x, y) = lim
h→0
dx
h
und
d
F (x, y + h) − F (x, y)
F (x, y) = lim
h→0
dy
h
bezeichnen wir die partiellen Ableitungen von F , falls die Grenzwerte existieren. Die partiellen Ableitungen werden genauso gebildet wie die Ableitungen, die wir schon kennen gelernt haben. Wir fassen im
ersten Fall F als Funktion nur von x auf und leiten ab, im zweiten Fall fassen wir F als Funktion nur
von y auf und leiten ab. Beispielsweise sind für F (x, y) = x cos(y 2 ) + sin(xy) die partiellen Ableitungen
d
d
2
2
dx F (x, y) = cos(y ) + y cos(xy) und dy F (x, y) = −2xy sin(y ) + x cos(xy).
Bemerkung Oftmals findet man auch die Schreibweise
∂
∂x
und
∂
∂y
für
d
dx
und
d
dy .
Satz 8.6 (Existenz und Eindeutigkeit) Sei (x, y) 7→ F (x, y) stetig und differenzierbar in den Variablen x
d
d
F (x, y) und dy
F (x, y) stetig in x und y.
und y und seien die partiellen Ableitungen dx
Dann existiert zu zu (x0 , y0 ) genau eine Lösung des Anfangswertproblems
y 0 = F (x, y),
y(x0 ) = y0 .
Der Satz kann in diesem Rahmen nicht bewiesen werden.
d
d
Beispiel 8.7 Sei F (x, y) = −2xy. Dann ist dx
F (x, y) = −2y und dy
F (x, y) = −2x. Also sind die
partiellen Ableitungen stetig und damit die Voraussetzungen des Satzes erfüllt. Wir haben damit zwar noch
keine Lösung an der Hand, aber wir wissen, dass es eine gibt. Außerdem wissen wir, wenn wir eine Lösung
geraten haben, dass es die einzige Lösung ist. In diesem Fall müssen wir also nicht weiter suchen.
In diesem Beispiel kann man eine Lösung angeben (wir werden später noch sehen, wie man darauf kommt):
2
Für x0 = 0 und y(0) = 1 ist y(x) = e−x eine Lösung des AWP (Nachrechnen!). Der Satz sagt uns nun,
dass dieses y die einzige Lösung ist.
8.2.3
Trennung der Variablen
Wir nehmen jetzt an, dass F die besondere Gestalt hat:
F (x, y) = −
g(x)
h(y)
(8.7)
für gewisse stetige Funktionen g und h. Wir sagen dann, dass die Variablen x und y getrennt sind, denn wir
können, zumindest formal, schreiben
h(y)dy = −g(x)dx.
Die Strategie ist nun, beide Seiten zu integrieren und dann nach y aufzulösen. Wir setzen
Z y
Z x
H(y) =
h(t) dt,
G(x) =
g(t) dt.
y0
x0
8.2
113
Lösungsverfahren für DGL’en 1. Ordnung
Dann ist (nach der Kettenregel)
d
H(y(x)) = y 0 (x)H 0 (y(x)).
dx
Nach dem Hauptsatz der Differential- und Integralrechnung ist dies gleichbedeutend mit
d
H(y(x)) = y 0 (x)h(y(x)).
dx
Etwas einfacher erhält man
d
G(x) = g(x).
dx
Addieren wir die beiden Gleichungen, so bekommen wir
d H(y(x)) + G(x) = y 0 (x)h(y(x)) + g(x) = 0,
dx
wobei wir in der zweiten Gleichung die DGL eingesetzt haben. Eine Funktion mit verschwindender Ableitung ist konstant, also gilt
H(y(x)) + G(x) = H(y(x0 )) + G(x0 ) = 0.
(8.8)
Um das AWP zu lösen, müssen wir jetzt (8.8) nach y auflösen.
Beispiel 8.8 Wir betrachten die DGL
y 0 (x) = −
x−a
,
y−b
wobei a und b reelle Zahlen sind. Dann ist g(x) = x − a und h(y) = y − b. Wir erhalten
Z
y
H(y) =
(t − b) dt =
1
1
(y − b)2 − (y0 − b)2 ,
2
2
(t − a) dt =
1
1
(x − a)2 − (x0 − a)2 .
2
2
y0
x
Z
G(x) =
x0
Es folgt, dass
(x − a)2 + (y(x) − b)2 = (x0 − a)2 + (y0 − b)2 =: R2 .
Auflösen nach y ergibt
y(x) = b ±
p
R2 − (x − a)2 ,
x ∈ (a − |R|, a + |R|),
wobei das Vorzeichen, das Vorzeichen von y0 − b ist. Die Lösungskurve ist also ein Halbkreis um den Punkt
(a, b) in der Ebene, der durch den Punkt (x0 , y0 ) geht.
114
Gewöhnliche Differentialgleichungen
1
y(x)
–1
0.5
0
–0.5
0.5
1
x
–0.5
–1
F IGUR . Richtungsfeld der DGL y 0 (x) = −x/y(x) mit Lösungskurve für x0 = 0, y0 = 1.
Die Lösung ist nicht für alle x definiert und y0 = b ist offenbar als Startwert nicht zugelassen. Das liegt
daran, dass die Funktion F (x, y) = − x−a
y−b hier unstetig ist. (Im Diagramm wechseln die Pfeile in der
x–Achse die Richtung schlagartig.)
Beispiel 8.9 (Malthus’sches Wachstumsgesetz) Wir betrachten ein einfaches Wachstumsgesetz für Populationen, das auf Malthus zurück geht. Hier ist x die Zeit und y(x) die Größe der Population zur Zeit x. Wir
nehmen an, dass die Vermehrung der Population proportional zur Anzahl der lebenden Individuen ist
y 0 (x) = λy(x),
dabei ist λ > 0 ein Parameter. Als Anfangswert nehmen wir x0 und y0 > 0 an. In der Notation von (8.7)
ist also etwa (man hat natürlich immer Wahlmöglichkeiten indem man g und h mit der selben Funktion
multipliziert)
1
g(x) = −λ,
h(y) = .
y
Wir berechnen für y > 0
Z
y
H(y) =
y0
1
dt = log(y) − log(y0 ) = log(y/y0 ),
t
G(x) = −λ(x − x0 ).
Also ist
log
y(x)
y0
= λ(x − x0 ).
8.2
115
Lösungsverfahren für DGL’en 1. Ordnung
Auflösen nach y(x) ergibt
y(x) = y0 exp(λ(x − x0 )).
Bemerkung 8.10 In vielen Fällen muss man die Differentialgleichung erst durch eine geeignete Transformation in die Form (8.7) bringen, damit man die Methode der Trennung der Variablen anwenden kann.
Wir wollen uns dies in einem einfachen Fall anschauen. Wir betrachten die DGL
y 0 (x) = f (ax + by(x) + c),
wobei f eine stetig differenzierbare Funktion ist und a, b, c ∈ R. Interessant ist hier nur der Fall b 6= 0. Wir
ersetzen jetzt die abhängige Variable y durch
z(x) = ax + by(x) + c.
Dann ist
z 0 (x) = a + by 0 (x) = a + bf (z(x)).
Wie oben erhalten wir nun eine Lösung für z indem wir
Z z(x)
1
dt
x − x0 =
a + bf (t)
z0
nach z(x) auflösen. Daraus können wir sofort y(x) berechnen.
Beispiel 8.11
y 0 (x) = (x + y)2 .
Dann erfüllt z(x) = x + y(x) die DGL
z 0 (x) = z 2 (x) + 1.
Die explizite Lösung ist
z(x) = tan(x + C),
wobei die Zahl C noch von den Anfangswerten abhängt. Die allgemeine Lösung ist also
y(x) = tan(x + C) − x.
8.2.4
Exakte Differentialgleichung
Wir nehmen hier an, dass die DGL in der Form
y 0 (x) = −
g(x, y(x))
h(x, y(x))
(8.9)
vorliegt mit stetigen Funktionen g und h. Gegenüber dem Fall mit den getrennten Variablen dürfen die
Funktionen g und h jetzt von beiden Variablen x und y abhängen. Zudem wollen wir annehmen, dass es
eine Funktion U (x, y) gibt mit der Eigenschaft, dass für die partiellen Ableitungen gilt
d
U (x, y) = g(x, y),
dx
d
U (x, y) = h(x, y).
dy
(8.10)
Definition 8.12 (Exakte DGL) Ist (8.10) erfüllt, so heißt die Differentialgleichung exakt. U heißt dann
eine Stammfunktion.
116
Gewöhnliche Differentialgleichungen
Warum ist es nützlich, eine exakte Differentialgleichung zu haben? Wenn man sich die Stammfunktion
verschaffen kann, ist man mit dem Lösen der DGL schon fast fertig. Es gilt nämlich (hier benötigen wir
genau genommen die mehrdimensionale Kettenregel, die wir später noch kennen lernen werden)
d
d
d
U (x, y(x)) =
U (x, y)
+ y 0 (x) U (x, y)
y=y(x)
y=y(x)
dx
dx
dy
= g(x, y(x)) + y 0 (x)h(x, y(x))
= 0,
wobei wir im letzten Schritt die DGL eingesetzt haben. Also ist x 7→ U (x, y(x)) konstant, mithin
U (x, y(x)) = U (x0 , y0 )
für alle x.
(8.11)
Jetzt müssen wir diese Gleichung nur noch nach y(x) auflösen und haben das AWP gelöst.
Wie können wir entscheiden, ob eine exakte Differentialgleichung vorliegt? Wie findet man eine Stammfunktion?
Man kann zeigen, dass
d
d
g(x, y) =
h(x, y).
dy
dx
(8.12)
eine notwendige und hinreichende Bedingung dafür ist, dass die DGL exakt ist. (Den Beweis für die Notwendigkeit bleiben wir hier schuldig.)
Ansatz für die Stammfunktion: Wir definieren
Z x
Z
U (x, y) =
g(s, y0 ) ds +
x0
y
h(x, t) dt.
(8.13)
y0
Dann gilt nach dem Hauptsatz der Differential- und Integralrechnung
d
U (x, y) = h(x, y).
dy
Weiter gilt (wobei wir in der Gleichung Integral und Ableitung vertauschen, was, genau genommen, einer
Rechtfertigung bedarf)
Z y
d
d
U (x, y) = g(x, y0 ) +
h(x, t) dt
dx
dx y0
Z y
d
= g(x, y0 ) +
h(x, t) dt
y0 dx
Z y
d
= g(x, y0 ) +
g(x, t) dt
dt
y0
= g(x, y0 ) + g(x, y) − g(x, y0 ) .
Dabei haben wir im vorletzten Schritt die Bedingung (8.12) eingesetzt. Wir haben also gezeigt, dass U aus
(8.13) in der Tat eine Stammfunktion ist, also die DGL exakt ist.
Beispiel 8.13
y 0 (x) = −
3y + sin(x)
.
cos(y) + 3x
8.2
117
Lösungsverfahren für DGL’en 1. Ordnung
Dann ist g(x, y) = 3y + sin(x) und h(x, y) = cos(y) + 3x. Es gilt
d
d
g(x, y) = 3 =
h(x, y).
dy
dx
Also ist die DGL exakt. Die Stammfunktion bestimmen wir durch
Z x
Z y
U (x, y) =
(3y0 + sin(s)) ds +
(cos(t) + 3x) dt
x0
y0
= 3y0 (x − x0 ) + cos(x0 ) − cos(x) + 3x(y − y0 ) + sin(y) − sin(y0 )
= 3xy − cos(x) + sin(y) − [3x0 y0 − cos(x0 ) + sin(y0 )].
Da U (x, y(x)) konstant ist, gilt also für alle x
3xy(x) − cos(x) + sin(y(x)) = 3x0 y0 − cos(x0 ) + sin(y0 ).
Wir können diese Gleichung nicht mehr weiter nach y(x) explizit auflösen, aber jetzt helfen uns numerische
Verfahren, wie die Intervallschachtelung aus Kapitel 3.3 weiter, um konkrete Werte von y(x) auszurechnen.
Beispiel 8.14 (Zur Übung!) Man zeige, dass die DGL
y 0 (x) =
y 2 exy + 3x2 y
x3 + (1 + xy)exy
exakt ist, und dass U (x, y) = y(exy + x3 ) eine Stammfunktion ist.
8.2.5
Integrierender Faktor
Sei die DGL
y0 = −
g(x, y)
h(x, y)
gegeben. Ist die DGL nicht exakt, so kann man sie manchmal durch geschicktes Erweitern des Bruchs mit
einer Funktion M (x, y) zu einer exakten DGL machen. Dazu schreiben wir
y0 = −
g(x, y)M (x, y)
.
h(x, y)M (x, y)
Ist diese DGL exakt, so heißt M ein integrierender Faktor oder ein Euler’scher Multiplikator. Notwendig und hinreichend dafür ist
d
d
(M (x, y)g(x, y)) =
(M (x, y)h(x, y)).
dy
dx
(8.14)
Man kann zeigen, dass ein solcher integrierender Faktor stets existiert. Jedoch gelingt es nur in Einzelfällen,
einen integrierenden Faktor explizit zu bestimmen. Dies gelingt vor allem dann, wenn M = M (x) nur von x
d
abhängt. In diesem Fall ist die linke Seite von (8.14) gleich M (x) dy
g(x, y) und wir können (8.14) auflösen
zu
d
d
d
M 0 (x)
dy g(x, y) − dx (h(x, y)
(log(M (x)) =
=
.
(8.15)
dx
M (x)
h(x, y)
Es ist also klar, dass dieser Ansatz genau dann funktioniert, wenn die rechte Seite in (8.15) nur von x
abhängt.
118
Gewöhnliche Differentialgleichungen
Beispiel 8.15 Die DGL
y0 = −
(2x2 + 2xy 2 + 1)y
g(x, y)
=: −
3y 2 + x
h(x, y)
ist nicht exakt, denn
d
d
g(x, y) −
h(x, y) = 6xy 2 + 2x2 .
dy
dx
Nun ist aber
d
dy g(x, y)
−
d
dx h(x, y)
h(x, y)
=
6xy 2 + 2x2
= 2x
3y 2 + x
2
eine Funktion, die nur von x abhängt. Also ist M (x) = ex ein integrierender Faktor (merke: M 0 (x)/M (x) =
2x). Die Differentialgleichung ist damit in der Form
2
ex (2x2 + 2xy 2 + 1)y
y (x) = −
ex2 (3y 2 + x)
0
exakt.
8.2.6
Lineare Differentialgleichung 1. Ordnung
Wir betrachten hier eine DGL von dem Typ
y 0 (x) = g(x)y(x) + c(x).
(8.16)
Dabei sind g und c stetige Funktionen der freien Variablen x.
Definition 8.16 Die DGL (8.16) heißt lineare Differentialgleichung erster Ordnung. Sie heißt homogen,
falls c(x) ≡ 0, und inhomogen, falls c(x) 6≡ 0.
Wir betrachten zunächst die homogene Gleichung
y 0 (x) = g(x)y(x).
Diese Gleichung ist vom Typ getrennte Variable“ (mit h(y) = −1/y), und wir können die Lösung des
”
AWP mit y(x0 ) = y0 wie in Abschnitt 8.2.3 bestimmen:
Z
y(x)
y0
1
dt =
t
Z
x
g(t) dt,
x0
also
Z
x
log(y(x)) = log(y0 ) +
g(t) dt,
x0
oder äquivalent
y(x) = y0 eG(x) ,
wobei G die Stammfunktion von g ist
Z
(8.17)
x
G(x) =
g(t) dt.
x0
Die Lösung der inhomogenen Gleichung kann man ebenfalls explizit angeben.
(8.18)
8.3
119
Lineare Differentialgleichung 2. Ordnung
Satz 8.17 Das AWP [(8.16), y(x0 ) = y0 ] hat die eindeutige Lösung
Z x
G(x)
−G(t)
y(x) = e
y0 +
e
c(t) dt .
x0
Beweis Ableiten nach x ergibt
y 0 (x) = G0 (x)y(x) + eG(x) e−G(x) h(x) = g(x)y(x) + h(x).
2
Beispiel 8.18 (Reaktion erster Ordnung) Bei einer Reaktion erster Ordnung ist der Stoffumsatz proportional zur vorhandenen Stoffmenge. Sei also x die Zeit und y(x) die Stoffmenge, die zur Zeit x noch
vorhanden ist. Das Gesetz der Reaktionskinetik lässt sich als die homogene lineare Differentialgleichung
fassen
y 0 (x) = −ky(x).
Dabei ist k > 0 die Reaktionskonstante. Sei y0 die zum Startzeitpunkt x0 = 0 vorhandene Stoffmenge.
Dann ist
y(x) = y0 e−kx .
Beispiel 8.19 Sei der Vorgang wie oben, nur dass der betrachtete Stoff nicht von Anfang an vorhanden ist,
sondern seinerseits erst durch eine Reaktion erster Ordnung entsteht. Das heißt, wir haben pro Zeiteinheit
einen Stoffeintrag k1 e−k1 x von der vorgeschalteten Reaktion sowie einen Stoffumsatz −k2 y(x). Insgesamt
lautet unser AWP
y 0 (x) = −k2 y(x) + k1 e−k1 x ,
y(0) = 0.
(8.19)
Wir erhalten mit dem obigen Satz die Lösung
y(x) = e−k2 x
Z
x
ek2 t k1 e−k1 t dt
0
(k2 −k1 )x
−k2 x e
= k1 e
8.3
−1
k2 − k1
(8.20)
.
Lineare Differentialgleichung 2. Ordnung
Eine Differentialgleichung von der Form
y (n) (x) = f0 (x) + f1 (x)y 0 (x) + . . . + fn−1 (x)y (n−1) (x)
(8.21)
heißt lineare Differentialgleichung n-ter Ordnung. Sie heißt homogen, falls f0 (x) ≡ 0 identisch Null ist.
Man kann zeigen, dass das Anfangswertproblem einer linearen Differentialgleichung stets eindeutig lösbar
ist, falls die Funktionen f0 , f1 , . . . , fn−1 stetig sind.
Ist die Gleichung homogen, so ist mit Y1 und Y2 auch λ1 Y1 +λ2 Y2 eine Lösung der DGL für alle λ1 , λ2 ∈ R.
Die allgemeine Lösung der homogenen Gleichung hat also die Gestalt
y(x) = C1 Y1 (x) + . . . + Cn Yn (x),
(8.22)
wobei Y1 , Y2 , . . . , Yn linear unabhängige Lösungen der DGL sind. Die Konstanten C1 , . . . , Cn müssen im
konkreten Fall so gewählt werden, dass das AWP y(x0 ) = x0 , . . . , y (n−1) (x0 ) = yn−1 gelöst wird. Das
geschieht durch Lösen des linearen Gleichungssystems.
120
Gewöhnliche Differentialgleichungen
Wir betrachten hier zur Illustration den speziellen Fall einer homogenen linearen Differentialgleichung
zweiter Ordnung mit konstanten Koeffizienten b, c ∈ R
y 00 (x) + by 0 (x) + cy(x) = 0.
(8.23)
Wir haben gesehen, dass bei linearen Differentialgleichungen erster Ordnung Exponentialfunktionen als
Lösung auftreten. Also machen wir auch hier den Ansatz
y(x) = y(0)eλx ,
(8.24)
wobei wir die Zahl λ noch bestimmen wollen. Setzen wir diese Funktion in die DGL (8.23) ein, so bekommen wir
λ2 y(x) + bλy(x) + cy(x) = 0,
also die quadratische Gleichung für λ
λ2 + bλ + c = 0.
(8.25)
Die Lösung ist bekanntlich
√
∆
b
,
wobei ∆ = b2 − 4c.
(8.26)
λ1,2 = − ±
2
2
Wir unterscheiden die drei Fälle ∆ > 0, ∆ < 0 und ∆ = 0, da hier entweder zwei, keine, oder eine reelle
Lösung vorliegt.
Fall 1 (∆ > 0). Die allgemeine Lösung ergibt sich als Linearkombination
√
y(x) = C1 eλ1 x + C2 eλ2 x = C1 ex(b−
∆)/2
√
+ C2 ex(b+
∆)/2
Dabei werden C1 , C2 ∈ R so gewählt, dass das AWP gelöst wird.
1
0.8
y(x)0.6
0.4
0.2
0
2
4
6
x
8
10
–0.2
–0.4
F IGUR . Lösungskurve für b = 3, c = 1, y(0) = 1 und y 0 (0) = 0
12
.
(8.27)
8.3
121
Lineare Differentialgleichung 2. Ordnung
Fall 2 (∆ < 0). Hier hat die Gleichung (8.25) keine reelle Lösung, aber zwei komplex konjugierte Lösungen
√
b
−∆
λ1,2 = − ± i
.
2
2
Wir gehen ganz formal vor, wie in Fall 1, und schreiben
y(x) = C1 eλ1 x + C2 eλ2 x
i
h
√
√
= e−(b/2)x C1 e−i( −∆/2)x + C2 ei( −∆/2)x
√−∆ √−∆ −(b/2)x
=e
(C1 + C2 ) cos
x + i(C2 − C1 ) sin
x .
2
2
(8.28)
Wir haben jetzt eine Lösung der Differentialgleichung, die Werte in den komplexen Zahlen annimmt. Das
ist noch nicht ganz das, was wir wollten. Da die DGL linear ist, ist aber sowohl der Realteil als auch der
Imaginärteil in (8.28) eine Lösung. Wir erhalten so die allgemeine Lösung der DGL (mit neuen Konstanten
C̃1 und C̃2 )
√−∆ √−∆ −(b/2)x
x + C̃2 sin
x .
C̃1 cos
(8.29)
y(x) = e
2
2
Unter Benutzung des Additionstheorem für die Sinusfunktion kann man diesen Ausdruck stets umschreiben
zu
√−∆
−(b/2)x
y(x) = A · e
sin
x+ϕ .
2
Dabei werden die Amplitude A und die Phasenverschiebung ϕ so gewählt, dass das Anfangswertproblem
gelöst wird. Man sagt auch, dass hier der Fall einer gedämpften Schwingung vorliegt.
1
0.8
y(x)0.6
0.4
0.2
0
2
4
6
x
8
10
–0.2
–0.4
F IGUR . Lösungskurve für b = 3, c = 1, y(0) = 1 und y 0 (0) = 0
12
122
Gewöhnliche Differentialgleichungen
Fall 3 (∆ = 0). In diesem Fall hat die quadratische Gleichung nur die eine Lösung λ = − 2b . Das heißt
y(x) = y(0)e−(b/2)x ist eine Lösung der DGL. Wir wissen aber, dass es zwei linear unabhängige Lösungen
geben muss.
Wir machen den folgenden Ansatz: y(x) = k(x)e−(b/2)x . Dann ist
y 0 (x) =
b
k 0 (x) − k(x) e−(b/2)x ,
2
und
00
y (x) =
b2
k (x) − bk (x) + k(x) e−(b/2)x .
4
00
0
Einsetzen in die DGL ergibt für k die Gleichung
b2
b b2
k 00 (x) − 2k 0 (x) + k(x) + bk 0 (x) − k(x) + ck(x) = 0.
2
4
2
Dies kann man kürzen zu
b2 k 00 (x) + k(x) c −
= 0,
| {z 4}
=−∆/4=0
also
k 00 (x) = 0.
Damit ist k von der Form
k(x) = C1 + C2 (x)
für gewisse Zahlen C1 , C2 . Wir haben jetzt die allgemeine Lösung der Differentialgleichung
y(x) = (C1 + C2 x) e−(b/2)x .
(8.30)
8.3
123
Lineare Differentialgleichung 2. Ordnung
1
0.8
y(x)0.6
0.4
0.2
0
2
4
6
x
8
10
12
–0.2
–0.4
F IGUR . Lösungskurve für b = 2, c = 1, y(0) = 1 und y 0 (0) = 0
Beispiel 8.20 (Der harmonische Oszillator) Beim harmonischen Oszillator wirkt auf ein Teilchen, das
um y aus der Ruhelage bewegt wurde, eine Rückstellkraft −cy, wobei c > 0 eine Konstante ist. Harmonische Oszillatoren treten in der Natur zuhauf auf: Gewicht an einer Feder, Pendel (mit kleinen Ausschlägen),
Stromkreis mit Spule und Kondensator und so fort.
Im Gegensatz zur chemischen Reaktion erster Ordnung, bei der Stoffumsatz pro Zeiteinheit, also die Geschwindigkeit des Vorgangs, proportional zu y ist, ist hier die zeitliche Änderung der Geschwindigkeit
proportional zu y. Wir haben es also mit der folgenden homogenen linearen Differentialgleichung zweiter
Ordnung zu tun
y 00 (x) + cy(x) = 0.
(8.31)
Wir nehmen noch an, dass das Teilchen zur Zeit x0 = 0 die Position y(0) = y0 und die Geschwindigkeit
y 0 (0) = y1 hat.
Mit der Notation von oben haben wir also b = 0 und ∆ = −4c < 0. Es liegt also Fall 2 vor, und die
allgemeine Lösung von (8.31) lautet
√ √ y(x) = C1 cos c x + C2 sin c x .
(8.32)
Wir müssen noch C1 und C2 bestimmen
y(0) = y0 = C1
√
y 0 (0) = y1 = C2 c
Mithin ist
y(x) = y0 cos
√
y1
⇐⇒ C2 = √ .
c
√ y1
c x + √ sin c x .
c
(8.33)
124
Gewöhnliche Differentialgleichungen
Bemerkung 8.21 Man kann (8.33) stets auf die Form bringen
√
y(x) = A sin c x + ϕ .
(8.34)
Hierzu muss man nur das Additionstheorem
√
√
√
A sin c x + ϕ = A sin(ϕ) cos( c x) + A cos(ϕ) sin( c x)
benutzen und dann nach A und ϕ auflösen. Beispielsweise ist, falls y0 6= 0,
y1
y0
√
ϕ = arctan
und A =
.
sin(ϕ)
y0 c
Beispiel 8.22 (Der gedämpfte harmonische Oszillator) Ergänzend zum vorherigen Beispiel wird nun noch
der Effekt der Reibung berücksichtigt. Wir nehmen an, dass die Reibungskraft proportional zur Geschwindigkeit und ihr entgegengerichtet ist. Das heißt, wir haben die Differentialgleichung
y 00 (x) + by 0 (x) + cy(x) = 0,
(8.35)
wobei b > 0 die Reibungskonstante ist. Wir wollen wieder das Anfangswertproblem y(0) = y0 und y 0 (0) =
y1 lösen.
√
Große Reibung Ist b > 2 c, so liegt Fall 1 vor, und die allgemeine Lösung ist
y(x) = C1 eλ1 x + C2 eλ2 x ,
wobei
λ1 = −
b−
√
b2 − 4c
,
2
λ2 = −
b+
√
b2 − 4c
.
2
Man beachte, dass λ2 < − 2b < λ1 < 0.
Um C1 und C2 zu bestimmen, setzen wir ein
y(0) = C1 + C2 = y0
y 0 (0) = −λ1 C1 − λ2 C2 = y1 .
Auflösen ergibt
λ2 y0 + y1
,
λ 2 − λ1
λ 1 y0 + y 0
C2 =
.
λ 2 − λ1
C1 =
√
Kleine Reibung Ist b < 2 c, so liegt Fall 2 vor, und die allgemeine Lösung ist
√4c − b2
−(b/2)x
y(x) = Ae
sin
x+ϕ .
2
Einsetzen ergibt
y0 = y(0) = A sin(ϕ)
√
b
4c − b2
y1 = y 0 (x) = − A sin(ϕ) + A
cos(ϕ).
2
2
Dieses lineare Gleichungssystem kann man nun nach A und ϕ auflösen.
8.3
125
Lineare Differentialgleichung 2. Ordnung
√
Der Grenzfall Ist b = 2 c, so liegt Fall 3 vor. Die allgemeine Lösung ist
y(x) = (C1 + C2 x)e−(b/2)x .
Einsetzen ergibt
y0 = y(0) = C1
b
y1 = y 0 (0) = C2 − C2 .
2
Also
b
C2 = y1 + y0 .
2
Bemerkung 8.23 In jedem der drei Fälle gilt lim y(x) = 0. In der Praxis interessiert man sich oft dafür,
x→∞
wie schnell diese Konvergenz abläuft. Beispielsweise hat man ein Messinstrument, das gedämpfte Schwingungen um den tatsächlichen Messwert herum ausführt, und bei dem man die Dämpfungskonstante b einstellen kann. Man ist jetzt an demjenigen Wert b interessiert, bei dem die Konvergenz möglichst schnell
ist.
√
λ2 < λ1 ) nach langer Zeit der Term e−λ1 x , d.h. y(x) ≈
Im ersten Fall (b > 2 c) dominiert (wegen
√
√
b− b2 −4c
−λ1 x
C1 e
für große x. Dabei war λ1 = −
> − c.
2
√
Im zweiten Fall (b < 2 c) oszilliert die Lösung, die maximalen Ausschläge sind Ae−(b/2)x .
√
Im dritten Fall (b = 2 c) ist der Abfall von der Ordnung
e−(b/2)x .
√
Insgesamt wird daher die schnellste Konvergenzgeschwindigkeit im Grenzfall b = 2 c erreicht.
126
Gewöhnliche Differentialgleichungen
Kapitel 9
Vektorräume und Grundlagen der
Analytischen Geometrie
In diesem Kapitel entwickeln wir die Grundzüge der endlichdimensionalen Vektorräume und der analytischen Geometrie speziell der Ebene und des dreidimensionalen Raumes.
9.1
Vektorräume
Geometrische Idee
Wir veranschaulichen einen Punkt x in der Ebene durch einen Pfeil vom Ursprung nach x. Den Ursprung
bezeichnen wir mit 0.
Ist y ein weiterer Punkt, dann können wir den Pfeil, der y darstellt unter Beibehaltung der Richtung und der
Länge so verschieben, dass er in x beginnt und auf einen dritten Punkt z zeigt. Diesen Punkt wollen wir mit
x + y bezeichnen. Offenbar ist x + y = y + x.
Speziell schreiben wir 2x für den Punkt x + x. Dieser hat einen Pfeil in gleicher Richtung wie x, jedoch
mit doppelter Länge. Allgemeiner können wir für jedes λ ∈ [0, ∞) den Punkt λx definieren, dadurch, dass
der entsprechende Pfeil die Richtung von x hat und das λ–fache seiner Länge.
Nun wollen wir den Punkt −x definieren als denjenigen Punkt, für den −x + x = 0 ist. Das ist derjenige
Punkt, dessen Pfeil die gleiche Länge wie die von x hat, jedoch die entgegengesetzte Richtung. Damit
können wir λx auch für negative λ ∈ R definieren.
Definition des Vektorraums
Wie können wir mit diesen anschaulich beschriebenen Operationen rechnen?
Dazu führen wir die Koordix1
natenachsen ein und beschreiben einen Punkt x als ein Zahlenpaar
. Die Zahlen x1 , x2 ∈ R heißen
x2
die Koordinaten von x (bezüglich der Standardbasis). Die Ebene ist die Menge aller Punkte
x1
R2 =
, x1 , x2 ∈ R .
x2
127
128
Vektorräume und Grundlagen der Analytischen Geometrie
 
x1
Analog können wir den dreidimensionalen Raum R3 als die Menge der Tripel x2  definieren und sogar,
x3
ganz abstrakt, für jedes d ∈ N den d–dimensionalen Raum Rd als die Menge der d–Tupel


 
x1




 .. 
d
R = x =  .  , x1 , . . . , xd ∈ R .




xd
Jeden Punkt x ∈ Rd nennen wir einen d–dimensionalen Vektor. Im Gegensatz dazu heißen Größen, die
aus R sind, skalare Größen, oder Skalare.
Die geometrischen Operationen, die wir oben beschrieben haben, bekommen nun den rechnerischen Gegenpart durch die Vektoraddition
    

x1
y1
x1 + y1
    

x + y =  ...  +  ...  =  ... 
(9.1)
xd
yd
xd + yd
und die Skalarmultiplikation

 

x1
λx1
  

λx = λ  ...  =  ...  .
xd
(9.2)
λxd
Man beachte, dass wir für den Ursprung
 
0
 .. 
0 =  .  ∈ Rd
0
kein gesondertes Symbol verwenden. Bei manchen Autoren findet man hier Fettdruck oder einen Pfeil über
der Null.
Wir fassen die Rechenregeln für Vektoren zusammen.
Lemma 9.1 (Rechenregeln für Vektoren) Sei V = Rd . Dann gilt für alle x, y, z ∈ V und µ, λ ∈ R
Kommutativgesetz:
x + y = y + x,
Assoziativgesetz:
(x + y) + z = x + (y + z),
Null:
0 + x = x,
Inverses: Es gibt ein −x ∈ V mit
−x + x = 0,
Skalarmultiplikation:
1 · x = x,
(µ + λ)x = µx + λx,
λ(x + y) = λx + λy.
Definition 9.2 (Vektorraum) Jede Menge V , für die Rechenregeln aus dem Lemma gelten, heißt ein (reeller) Vektorraum. Wird auch λ, µ ∈ C zugelassen, so heißt V ein komplexer Vektorraum.
9.1
129
Vektorräume
Beispiele 9.3
(i) V = Rd .
(ii) V = {v ∈ Rd : v1 − v2 = 0}. Dann ist für u, v ∈ V auch w := u + v ∈ V , weil w1 − w2 =
(u1 + v1 ) − (u2 + v2 ) = u1 − u2 + v1 − v2 = 0. Weiter ist für λ ∈ R stets λu1 − λu2 = 0, also ist
λu ∈ V . Es ist klar 0 ∈ V . Es ist (−u1 ) − (−u2 ) = −(u1 − u2 ) = 0. Also ist −u ∈ V .
(iii) Seien u, v ∈ R3 . Dann ist auch die Fläche V = {λu + µv : λ, µ ∈ R} ⊂ R3 ein Vektorraum. V
heißt der von u und v aufgespannte Untervektorraum von R3 .
(iv) Ist allgemeiner V ein Vektorraum und sind u1 , u2 , . . . , uk ∈ V , so heißt
span(v 1 , . . . , v k ) := λ1 v 1 + . . . + λk v k : λ1 , . . . , λk ∈ R ⊂ V
(9.3)
der von (v 1 , . . . , v k ) aufgespannte (oder erzeugte) Untervektorraum von V .
(v) Die Gerade
G=
x1
1
: x1 ∈ R
⊂ R2
2
ist kein Vektorraum
(und
kein
Untervektorraum
von
R ).Essind gleich mehrere Regeln verletzt: Es
0
1
0
1
1
ist 0 6∈ G, es sind
,
∈ G, aber
+
=
6∈ G.
1
1
1
1
2
(vi) Eine Gerade, Ebene und so weiter im Rd ist genau dann ein Vektorraum (also ein Untervektorraum
von Rd , wenn sie den Ursprung enthält. Dann liegt nämlich der Fall von Beispiel (iii) beziehungsweise (iv) vor.
(vii) Ein Beispiel, bei dem klar wird, dass der Begriff des Vektorraums sehr viel größere Objekte zulässt
als den Rd ist das folgende. Sei V die Menge der stetigen Funktionen f : [0, 1] → R. Für f, g ∈ V
und λ ∈ R definieren wir f +g und λf durch (f +g)(x) = f (x)+g(x) und (λf )(x) = λf (x) für alle
x ∈ [0, 1]. Offenbar sind f + g und λf stetig, also in V . Weiter bezeichnen wir mit 0 die Funktion,
die konstant Null ist. Offenbar ist auch 0 ∈ V . Man prüft leicht nach, dass die Rechenregeln aus
Lemma 9.1 gelten (weil sie punktweise, also für jedes x ∈ [0, 1] gelten), also ist V ein Vektorraum.
9.1.1
Lineare Unabhängigkeit, Erzeugendensystem, Basis
Wir betrachten einen Vektorraum V und Vektoren v 1 , . . . , v k ∈ V . Ein Vektor u ∈ V heißt Linearkombination der v 1 , . . . , v k , falls es Zahlen λ1 , . . . , λk ∈ R gibt, sodass
u=
k
X
λi v i .
i=1
 
 
 
1
1
5
9.4 Beispiel Ist V = R3 und v 1 = 2, v 2 = 3. Dann ist u = 13 eine Linearkombination von v 1
0
1
3
und v 2 , denn
 
 
 
5
1
1
13 = 2 2 + 3 3 .
3
0
1
130
Vektorräume und Grundlagen der Analytischen Geometrie
Definition 9.5 Ist ein Vektor v j eine Linearkombination der anderen, also
j
v =
j−1
X
λi v i +
i=1
k
X
λi v i
i=j+1
für gewisse Zahlen λi , dann heißen die Vektoren v 1 , . . . , v k linear abhängig. Andernfalls heißen die
Vektoren linear unabhängig.
     
1
0
0
Beispiele 9.6
(i) Die Vektoren 0 , 1 , 0 ∈ R3 sind linear unabhängig.
0
0
1
 
 
 
5
1
1
(ii) Die Vektoren v 1 = 2, v 2 = 3 und v 3 = 13 sind linear abhängig, denn v 3 = 2v 1 + 3v 2
3
1
0
ist eine Linearkombination.
Satz 9.7 Die Vektoren v 1 , . . . , v k ∈ V sind linear unabhängig, genau dann, wenn Folgendes gilt: Sind
λ1 , . . . , λk ∈ R mit
k
X
λi v i = 0,
(9.4)
i=1
1
k
so ist zwingend λ = . . . = λ = 0.
Beweis Ist beispielsweise v 1 eine Linearkombination der anderen Vektoren, also v 1 = µ2 v 2 + . . . + µk v k
für gewisse Zahlen µ2 , . . . , µk , dann setzen wir
λ1 = −1,
, λi = µi , i = 2, . . . , k.
Dann ist
k
X
λi v i = 0,
i=1
i
1
aber nicht alle λ sind 0, jedenfalls nicht λ .
Gelte nun andererseits (9.4) und sei λi 6= 0 für ein i. Wir setzen
µj := −
λj
.
λi
Dann ist µi = −1 und
k
X
µj v j = 0,
j=1
also
vi =
X
µj v j .
j6=i
2
9.1
131
Vektorräume
Definition 9.8 (Dimension) Sind v 1 , . . . , v k ∈ V linear unabhängig und ist U = span(v 1 , . . . , v k ), so
sagen wir, dass der Untervektorraum U die Dimension k hat:
dim(U ) = k.
Man kann zeigen, dass die Dimension eindeutig bestimmt ist.
Den folgenden Satz wollen wir hier nicht beweisen.
Satz 9.9 Seien v 1 , . . . , v k ∈ Rd linear unabhängig.
(i) Es ist stets k ≤ d.
(ii) Es ist k = d genau dann, wenn ist Rd = span(v 1 , . . . , v k ).
Definition 9.10 (Basis) Sind b1 , . . . , bd ∈ Rd linear unabhängig, so heißt b1 , . . . , bd eine Basis von Rd .
Es gilt in diesem Fall Rd = span(b1 , . . . , bd ).
Beispiele 9.11
(i) Die Einheitsvektoren
 
 
 
1
0
0
0
1
 .. 
 
 
.
 
 
 
e1 = 0 , e2 = 0 , . . . ed = 0
 .. 
 .. 
 
.
.
0
0
0
1
bilden die so genannte kanonische Basis oder Standardbasis des Rd .
2
1
(ii) Die Vektoren b1 =
, b2 =
bilden eine Basis des R2 . Ist nämlich λ1 b1 + λ2 b2 = 0, so ist
0
3
3λ2 = 0, also λ2 = 0 und 0 = 2λ1 + λ2 = 2λ2 . Also sind b1 und b2 linear unabhängig.
 
 
0
1
(iii) b1 = 0, b2 = 1 sind linear unabhängig, jedoch keine Basis von R3 , weil es nur zwei Vektoren
0
1
sind.
 
 
 
1
0
1
(iv) b1 = 0, b2 = 1, b3 = 2 ist ebenfalls keine Basis von R3 , weil b3 = b1 + 2b2 , also
0
1
2
b1 , b2 , b3 linear abhängig sind.
Eine Basis kann als Koordinatensystem für den Rd dienen. Ist nämlich v ∈ Rd , so ist v eine Linearkombination der b1 , . . . , bd , also
v = λ 1 b1 + . . . + λ d b d
für gewisse Zahlen λ1 , . . . λd . Nehmen wir an, dass es eine weitere Darstellung von v als Linearkombination
der bi gibt:
v = µ1 b1 + . . . + µd bd .
132
Vektorräume und Grundlagen der Analytischen Geometrie
Dann ist
0=v−v =
d
X
(λi − µi )bi ,
i=1
i
i
1
d
also λ = µ für alle i = 1, . . . , d, da b , . . . , b linear unabhängig sind. Also sind die Zahlen λi eindeutig
und können damit als Koordinaten dienen.
 
v1
Beispiele 9.12
(i) Ist v = v2  ∈ R3 so ist
v3
v = v1 e1 + v2 e2 + v3 e3 .
Also sind die Zahlen v1 , v2 , v3 die Koordinaten von v bezüglich der Standardbasis.
2
1
−1
(ii) Die Vektoren b1 =
, b2 =
bilden eine Basis von R2 . Sei v =
. Dann ist v =
0
3
9
−2b1 + 3b3 . Also sind −2, 3 die Koordinaten von v bezüglich b1 , b2 .
Wir fassen die Überlegungen vor Beispiel 9.12 als Satz zusammen.
Satz 9.13 (Koordinaten) Ist b1 , . . . , bd eine Basis von Rd , so lässt sich jeder Vektor v ∈ Rd in eindeutiger
Weise als Linearkombination darstellen:
v = v = λ 1 b1 + . . . + λ d bd .
Die Zahlen λ1 , . . . , λd ∈ R heißen die Koordinaten von v bezüglich der Basis b1 , . . . , bd .
9.2
Skalarprodukt
Wir wollen nun eine rechnerische Handhabe für die Längen von Vektoren haben. Dafür dient das Skalarprodukt. Gleichzeitig liefert es eine Möglichkeit zu verstehen, was es es heißt, dass zwei Vektoren senkrecht
aufeinander stehen.
9.2.1
Grundlegendes zum Skalarprodukt


 
u1
v1
 .. 
 .. 
Definition 9.14 (Skalarprodukt) Für zwei Vektoren u =  .  , v =  .  ∈ Rd definieren wir als
ud
vd
das Skalarprodukt die Zahl
d
X
hu, vi :=
ui vi .
i=1
Manche Autoren verwenden Schreibweisen wie (u, v) oder u · v für das Skalarprodukt. Das Skalarprodukt heißt Skalarprodukt, weil das Ergebnis eine Zahl also ein Skalar ist. Manchmal findet man auch die
Bezeichnung inneres Produkt .
9.2
133
Skalarprodukt
*1 −2+
Beispiele 9.15
(i) 2 ,  4  = −2 + 2 · 4 + 3 · 8 = 30.
3
8
1
1
(ii)
,
= 5.
2
2
(iii) Für die Einheitsvektoren e1 , . . . , ed des Rd gilt hei , ej i = 0, falls i 6= j und hei , ei i = 1.
Lemma 9.16 (Eigenschaften des Skalarprodukts) Für u, v, w ∈ Rd und λ, µ ∈ R gilt
Symmetrie:
hu, vi = hv, ui
Bilinearität:
hλu + µv, wi = λhu, wi + µhv, wi
hu, λv + µwi = λhu, vi + µhu, wi
Positive Definitheit:
hv, vi ≥ 0 und hv, vi = 0 ⇐⇒ v = 0.
Nach dem Satz von Pythagoras ist die Länge des Vektors v =
p
v1
∈ R2 genau |v| = v12 + v22 . Dies
v2
legt die folgende Definition nahe.
Definition 9.17 Für v ∈ Rd heißt die Zahl
|v| :=
p
hv, vi
der Betrag von v oder die euklidische Norm von v. |v| ist damit der Abstand des Punktes v vom Ursprung
0 ∈ Rd .
Manche Autoren verwenden an Stelle von |v| die Schreibweise kvk für die Norm von v.
Lemma 9.18 (Eigenschaften der Norm) Für u, v ∈ Rd und λ ∈ R gilt
Linearität
|λv| = |λ| · |v|
Dreiecksungleichung
|u + v| ≤ |u| + |v|
Positive Definitheit
|v| ≥ 0 mit |v| = 0 ⇐⇒ v = 0.
Beispiele 9.19
(ii)
3
. Dann ist
4
3 √
|λv| = −2
= 36 + 64 = 10 = | − 2| · 5 = |λ| · |v|.
4 (i) λ = −2, v =
√
√
3
3 12 12 15 √
4 + 5 = 9 = 306 ≤ 18 = 25 + 169 = 4 + 5 .
Bemerkung 9.20 Sind v, w ∈ Rd \ {0} und ist ϕ der von u und v gebildete Winkel, dann ist nach dem
verallgemeinerten Satz von Pythagoras (dem so genannten Kosinussatz)
|v − w|2 = |v|2 + |w|2 − 2|v| · |w| cos(ϕ).
Andererseits ist
|v − w|2 = hv − w, v − wi = hv, vi + hw, wi − 2hv, wi = |v|2 + |w|2 − 2hv, wi.
(9.5)
134
Vektorräume und Grundlagen der Analytischen Geometrie
Also ist
cos(ϕ) =
hv, wi
.
|v| · |w|
(9.6)
Speziell ist hv, wi = 0 genau dann, wenn ϕ = π2 , wenn also v und w senkrecht aufeinander stehen. Es gilt
hv, wi = |v| · |w|, falls ϕ = 0, also wenn v und w parallel sind.
Aus (9.6) folgt sofort die folgende wichtige Ungleichung.
Satz 9.21 (Cauchy–Schwarz’sche Ungleichung) Für alle v, w ∈ Rd gilt
|hv, wi| ≤ |v| · |w|
mit Gleichheit genau dann, wenn v = λw für ein λ ∈ R.
9.2.2
Orthogonalität
Mit Hilfe des Skalarprodukts definieren wir den Begriff der Orthogonalität und kommen so zum wichtigen
Konzept der Orthonormalbasis.
Definition 9.22 (i) Sind u, v ∈ Rd mit hu, vi = 0, so sagen wir, dass u und v orthogonal (oder senkrecht)
zueinander sind. Wir schreiben auch u ⊥ v.
(ii) Sind v 1 , . . . , v k ∈ Rd und gilt v i ⊥ v j , falls i 6= j, so heißt v 1 , . . . , v k orthogonal.
(iii) Gilt zudem, dass die v i normiert sind, also |v i | = 1, i = 1, . . . , d, so heißt v 1 , . . . , v k orthonormal.
 


 
4
3
3
Beispiele 9.23
(i) d = 3, v 1 =  1 , v 2 = 0, v 3 = −25 sind orthogonal, denn
3
−4
−4
hv 1 , v 2 i = 3·4+1·0−4·3 = 0,
hv 1 , v 3 i = 3·3−1·25+4·4 = 0,
Allerdings ist v 1 , v 2 , v 3 nicht orthonormal, denn
√
|v 1 | = 26 , |v 2 | = 5 ,
(ii) Sei ϕ ∈ R und v 1 =
hv 2 , v 3 i = 4·3+0·25−3·4 = 0.
√
|v 3 | = 5 26 .
sin(ϕ)
− cos(ϕ)
, v2 =
. Dann sind v 1 , v 2 orthonormal, denn
cos(ϕ)
sin(ϕ)
hv 1 , v 2 i = − sin(ϕ) cos(ϕ) + cos(ϕ) sin(ϕ) = 0,
und
|v 1 |2 = sin(ϕ)2 + cos(ϕ)2 = 1,
|v 2 |2 = cos(ϕ)2 + sin(ϕ)2 = 1.
Satz 9.24 Ist v 1 , . . . , v k ∈ Rd \ {0} orthogonal, so ist v 1 , . . . , v k linear unabhängig.
Beweis Seien λ1 , . . . , λk ∈ R und
P
i
λi v i = 0. Dann ist für jedes j ∈ {1, . . . , k}
0 = hv j , λ1 v 1 + . . . + λk v k i
= hv j , v 1 i + . . . + hv j , λk v k i
= λ1 hv j , v 1 i + . . . + λk hv j , v k i
= λj hv j , v j i,
9.2
135
Skalarprodukt
weil hv i , v j i = 0 für i 6= j. Wegen v j 6= 0 ist hv j , v j i = |v j |2 6= 0, also λj = 0. Da j beliebig war, gilt
λ1 = . . . = λk = 0. Also sind v 1 , . . . , v k linear unabhängig.
2
Definition 9.25 Sind b1 , . . . , bd ∈ Rd orthonormal, so heißt b1 , . . . , bd eine Orthonormalbasis (ONB) von
Rd .
(i) Die kanonische Basis e1 , . . . , ed des Rd ist eine Orthonormalbasis.
Beispiele 9.26
(ii) Setze
 
1
1
b1 = √ 1 ,
3 1
 
−2
1
b2 = √  1  ,
6
1


0
1
b3 = √  1  .
2 −1
Dann ist b1 , b2 , b3 eine ONB von R3 , denn
√
2
hb , b i =
(−2 + 1 + 1) = 0,
6
1
2
√
6
hb , b i =
(1 − 1) = 0,
6
1
3
√
2
3
hb , b i =
3
(−2 · 0 + 1 − 1) = 0.
6
und
hb1 , b1 i =
1
(1+1+1) = 1,
3
hb2 , b2 i =
1
((−2)2 +1+1) = 1,
6
hb3 , b3 i =
1
(0+1+1) = 1.
2
Satz 9.27 Ist b1 , . . . , bd eine ONB von Rd , dann sind die Koordinaten von v ∈ Rd bezüglich b1 , . . . , bd
gegeben durch hv, b1 i, . . . , hv, bd i. Also gilt
v=
d
X
hv, bi ibi .
i=1
Beweis Sind λ1 , . . . , λd die Koordinaten von v bezüglich b1 , . . . , bd , so gilt für jedes i ∈ {1, . . . , d}
i
i i
i
i i
i
λ = hλ b , b i = hλ b , b i +
X
j6=i
j j
i
hλ b , b i =
| {z }
=0
d
X
j=1
j j
i
hλ b , b i =
* d
X
+
j j
λ b ,b
i
= hv, bi i.
j=1
2
Beispiele 9.28
 
v1
 .. 
(i) Die Koordinaten von v =  .  ∈ Rd bezüglich der kanonischen Basis e1 , . . . , ed
vd
sind
hv, ei i = 0 · v1 + . . . + 0 · vi−1 + 1 · · · vi + 0 · vi+1 + . . . + 0 · vd
= vi .
136
Vektorräume und Grundlagen der Analytischen Geometrie
 
6
(ii) Die Koordinaten von 7 ∈ R3 bezüglich der ONB Beispiel 9.26(ii) sind
8
 +
* 
6
1
√
1
1
hv, b1 i = 7 , √ 1 = √ (6 + 7 + 8) = 7 3,
3 1
3
8
 +
*6
−2
1
1√
1
hv, b2 i = 7 , √  1  = √ (−2 · 6 + 7 + 8) =
6,
2
6
6
8
1
 +
*6
0
1
1
1√
hv, b3 i = 7 , √  1  = √ (0 · 6 + 7 − 8) = −
2.
2
2 −1
2
8
Also ist
√
1√ 2 1√ 3
6b −
2b .
v = 7 3 b1 +
2
2
Probe:
 
 
   
1
−2
0
6
√ 1 1√ 2 1√ 3
1
1
7 3b +
6b −
6b 7 1 +  1  −  1  = 7 .
2
2
2
2
1
1
−1
8
9.2.3
Zerlegung in parallelen und orthogonalen Anteil
Sind u, v ∈ Rd , v 6= 0, dann kann man u eindeutig zerlegen in einen Anteil up , der parallel (oder antiparallel) zu v ist und einen Anteil us , der senkrecht zu v ist:
u = up + us .
Dabei heißt parallel natürlich, dass es ein λ ∈ R mit up = λv und senkrecht heißt, dass hus , vi = 0. In der
Tat sind up und us durch diese Eigenschaft eindeutig festgelegt, denn λ ist bestimmt durch
hu, vi = hup , vi + hus , vi = hup , vi = λhv, vi.
mit dem Wert λ = hu, vi hv, vi. Wir erhalten also
up =
hu, vi
v,
hv, vi
us = u − u p .
Es ist klar, dass up tatsächlich zu v parallel ist, aber es gilt auch us ⊥ v wegen
hu, vi
hu, vi
s
p
p
hu , vi = hu − u , vi = hu, vi − hu , vi = hu, vi −
v, v = hu, vi −
hv, vi = 0 .
hv, vi
hv, vi
Beispiel 9.29 Sei
 
2
u = 3 ,
4
 
4
v = 5 .
6
(9.7)
9.3
137
Drehung in der Ebene und Vektorprodukt
Dann ist hv, vi = 16 + 25 + 36 = 77 und hu, vi = 8 + 15 + 24 = 47. Also ist
   188   34 
   188 
− 77
2
4
77
77










47
5 =  235  und us = 3 −  235  = − 4  .
up =
77
77
77
    

77    
282
282
26
4
6
77
77
77
Probe (dass us ⊥ v)
hus , vi = −
9.3
34
4
26
1
·4−
·5+
·6=
(−136 − 20 + 156) = 0.
77
77
77
77
Drehung in der Ebene und Vektorprodukt
In diesem Abschnitt behandeln wir je eine Besonderheit der ebenen und der dreidimensionalen Geometrie,
mit der wir zu gegebenen Vektoren senkrechte Vektoren herstellen.
9.3.1
Eine Spezialität der ebenen Geometrie
Wir betrachten hier nur Vektoren in der Ebene, also Punkte x =
Vektor ein
x⊥ =
x1
x2
∈ R2 . Wir führen den folgenden
−x2
.
x1
(9.8)
Der Vektor x⊥ entsteht durch Linksdrehung um einen Viertelkreis aus x. x⊥ steht senkrecht auf x, denn
hx, x⊥ i = x1 · (−x2 ) + x2 · x1 = 0.
Offenbar ist jeder Vektor, der senkrecht auf x steht, ein Vielfaches von x⊥ . Außerdem ist |x⊥ | = |x|.
Die Vektoren x, x⊥ sind orthogonal, also linear unabhängig und damit eine Basis von R2 . Ist |x| = 1, so
liegt eine ONB vor.
Sei nun y ∈ R2 ein weiterer Vektor. x und y bestimmen ein Parallelogramm mit den Eckpunkten 0, x, y,
und x+y. Mit F bezeichnen wir die Fläche dieses Parallelogramms. Wenn h die Höhe des Parallelogramms
über der Seite 0, x ist, so ist F = h · |x|. Wir müssen also h bestimmen. h ist die Länge des Anteils y p von
y, der senkrecht auf x steht, also parallel zu x⊥ ist:
|hy, x⊥ i|
hy, x⊥ i
.
h = |y p | = ⊥ ⊥ x⊥ =
hx , x i
|x|
Also ist
F = h · |x| = |hy, x⊥ i| = | det(x, y)|,
wobei die Determinante definiert ist durch
det(x, y) = hx⊥ , yi = x1 y2 − x2 y1 .
(9.9)
Die Determinante misst also die Fläche des Parallelogramms, wobei das Vorzeichen angibt, ob y durch
Linksdrehung (+) oder Rechtsdrehung (-) aus x hervorgegangen ist.
Da x und y offenbar genau dann linear unabhängig sind, wenn F 6= 0 ist, ergibt sich der folgende wichtige
Satz.
138
Vektorräume und Grundlagen der Analytischen Geometrie
Satz 9.30 Zwei Vektoren x, y ∈ R2 sind genau dann linear unabhängig, wenn det(x, y) 6= 0.
1
1
−1
und y =
. Dann ist x⊥ =
und det(x, y) = hx⊥ , yi =
1
3
1
−1 + 3 = 2. Also ist die Fläche des Parallelogramms F = 2 und x und y sind linear unabhängig.
Man überzeuge sich durch eine Skizze, dass y durch Linksdrehung aus x hervorgegangen ist.
(i) Sei x =
Beispiele 9.31
−1
5
−2
⊥
(ii) Sei x =
und y =
. Dann ist x =
und det(x, y) = hx⊥ , yi = −10 − 1 = −11.
2
1
−1
Also ist die Fläche des Parallelogramms F = 11 und x und y sind linear unabhängig. Man überzeuge
sich durch eine Skizze, dass y durch Rechtsdrehung aus x hervorgegangen ist.
−2
6
−7
⊥
(iii) Sei x =
und y =
. Dann ist x =
und det(x, y) = hx⊥ , yi = −42 + 42 = 0.
7
−21
−2
Also ist die Fläche des Parallelogramms F = 0 und x und y sind linear abhängig. In der Tat ist
y = −3x.
9.3.2
Eine Spezialität des dreidimensionalen Raums: Das Vektorprodukt
Wir haben gerade gesehen, wie man in der Ebene zu einem Vektor einen dazu senkrecht stehenden produziert. Im dreidimensionalen Raum gibt es jedoch mehrere Möglichkeiten, einen Vektor zu produzieren, der
senkrecht auf einem gegebenen steht. Die Richtung wird erst eindeutig, wenn wir zwei Vektoren vorgeben,
zu denen ein dritter senkrecht stehen soll. Wenn wir jetzt noch Länge und Orientierung vorgeben, wird die
Sache eindeutig. Dies motiviert die folgende Definition.
 
 
x1
y1
Definition 9.32 (Vektorprodukt) Für x = x2  und y = y2  definieren wir das Vektorprodukt
x3
y3
x × y ∈ R3 durch


x2 y3 − x3 y2
x × y = x3 y1 − x1 y3  .
x1 y2 − x2 y1
Manchmal wird dieser Vektor auch Kreuzprodukt oder äußeres Produkt genannt.
Die Länge von x × y entspricht genau der Fläche des Parallelogramms, das von x und y erzeugt
wird. Das


0

0
zeigen wir hier nur in dem Spezialfall, wo x3 = y3 = 0 ist. Dann ist nämlich x × y = 
x1 y2 − x2 y1
und |x × y| = |x1 y2 − x2 y1 |. Das ist aber genau die Fläche des Parallelogramms.
Lemma 9.33 (Eigenschaften des Vektorprodukts) Für alle x, y, z ∈ R3 und µ, λ ∈ R gilt
9.3
Drehung in der Ebene und Vektorprodukt
(i) Orthogonalität
(x × y) ⊥ x und (x × y) ⊥ y.
(ii) Antisymmetrie
x × y = −y × x.
(iii) Linearität
x × (λy + µz) = λ(x × y) + µ(x × z)
(λx + µy) × z = λ(x × z) + µ(y × z).
(iv)
x × y 6= 0 ⇐⇒ x, y sind linear unabhängig.
(v)
|x × y| = |x| · |y| ⇐⇒ x ⊥ y.
|x × y| = |x| · |y| · sin ^(x, y) .
Hierbei bezeichnet ^(x, y) den Winkel zwischen den Vektoren x und
y. Weil wir dies nur am Rande bemerken, belassen wir es hier bei der
intuitiven Beschreibung.
(vi)
139
Beweis Zu (i):
hx × y, xi = (x2 y3 − x3 y2 )x1 + (x3 y1 − x1 y3 )x2 + (x1 y2 − x2 y1 )x3 = 0.
Zu (ii) und (iii): klar nach Definition des Vektorprodukts.
Zu (iv): x, y sind linear unabhängig, wenn x und y ein nicht-entartetes Parallelogramm erzeugen. Aus dem
Zusammenhang von der Fläche des Parallelogramms und |x × y| folgt die Aussage.
(v) folgt aus (vi) oder aus dem nächsten Satz.
(vi) folgt aus dem Zusammenhang von |x × y| mit der Fläche des Parallelogramms sowie der elementargeometrischen Formel für diese Fläche.
2
Für die Orientierung von x, y, x × y gilt die Rechte-Hand-Regel: Zeigt bei der rechten Hand der Daumen
in Richtung x und der Zeigefinger in Richtung y, so zeigt der vorgespreizte Mittelfinger in Richtung von
x×y. Jedes so angeordnete Tripel von Vektoren nennen wir ein Rechtssystem. Gilt das selbe mit der linken
Hand, so sprechen wir von einem Linkssystem.
Ohne Beweis (man kann z.B. (vi) aus dem vorangehenden Lemma verwenden) bringen wir die folgende
Ergänzung zur Cauchy-Schwarz’schen Ungleichung und zur Eigenschaft (v) im vorangehenden Lemma.
Satz 9.34 Für x, y ∈ R3 gilt
9.3.3
hx, yi2 + |x × y|2 = |x|2 |y|2 .
Das Spatprodukt
Wie zwei Vektoren in der Ebene ein Parallelogramm erzeugen, so erzeugen drei Vektoren im dreidimensional Raum einen Spat oder Parallelepiped. Bei einem Kristall sind diese drei Vektoren beispielsweise die
drei benachbarten Atome (in den drei Hauptrichtungen) eines willkürlich gewählten Ursprungs. Das Spat
ist dann die kleinste Zelle, oder Elementarzelle, des Kristalls. Mit Hilfe des Vektorprodukts können wir eine
einfache Formel für das Volumen dieser Zelle angeben.
Definition 9.35 (Spatprodukt) Seien x, y, z ∈ R3 . Als das Spatprodukt oder die Determinante bezeichnet
man die Zahl
det(x, y, z) = hx × y, zi.
Explizit ist
det(x, y, z) = x1 y2 z3 + y1 z2 x3 + z1 x2 y3 − z1 y2 x3 + x1 z2 y3 + y1 x2 z3 .
140
Vektorräume und Grundlagen der Analytischen Geometrie
Lemma 9.36 (Gartenzaunregel) Zum Merken hilft das folgende Vorgehen: Man schreibe die Vektoren
x, y, z, x, y in ein rechteckiges Schema:


x1 y1 z1 x1 y1


x2 y2 z2 x2 y2  .


x3 y3 z3 x3 y3
Nun summiert man die Produkte entlang der drei links geneigten Diagonalen x1 y2 z3 + y1 z2 x3 + z1 x2 y3
und zieht die Produkte entlang der drei rechts geneigten Diagonalen z1 y2 x3 + x1 z2 y3 + y1 x2 z3 davon ab.
Das Volumen des Spats ist nun, wie beim Parallelogramm, V = | det(x, y, z)|. Wir sammeln die Rechenregeln für das Spatprodukt.
Lemma 9.37 (Rechenregeln für das Spatprodukt) Für u, v, x, y, z ∈ R3 und µ ∈ R gilt
(i)
det(µx, y, z) = det(x, µy, z) = det(x, y, µz) = µ det(x, y, z),
(ii)
det(u + v, y, z) = det(u, y, z) + det(v, y, z)
det(x, u + v, z) = det(x, u, z) + det(x, v, z)
det(x, y, u + v) = det(x, y, u) + det(x, y, v)
(iii)
det(x, y, z) = det(y, z, x) = det(z, x, y) = − det(y, x, z) = − det(x, z, y) = − det(z, y, x)
(iv)
det(x, y, z) 6= 0 ⇐⇒ x, y, z sind linear unabhängig.
(v)
det(x, y, z) > 0 ⇐⇒ (x, y, z) bilden ein Rechtssystem
det(x, y, z) < 0 ⇐⇒ (x, y, z) bilden ein Linkssystem
9.4
Geraden und Ebenen
In diesem Abschnitt behandeln wir die verschiedenen Weisen, auf die man Geraden und Ebenen (allgemeiner: affine Räume) darstellen kann. Dies sind im allgemeinen Fall die parametrische und die baryzentrische
Darstellung. Für so genannte Hyperebenen, also beispielsweise die Ebene im dreidimensionalen Raum oder
die Gerade in der Ebene, gibt es die spezielle Darstellung in der Hesse’schen Form.
9.4.1
Parametrische und baryzentrische Darstellung
Sind u, r ∈ Rd , r 6= 0, so gibt es genau eine Gerade G durch den Punkt u, die in Richtung von r verläuft
G = u + λr, λ ∈ R .
(9.10)
Der Punkt u wird hier als Aufpunkt der Geraden verstanden, der Vektor r ist die Richtung der Geraden.
Diese Darstellung einer Geraden wird als Parameterdarstellung bezeichnet. Die Variable λ ist der Parameter. Man beachte, dass man die selbe Gerade G erhält, wenn man r durch, beispielsweise, −r oder 2r
ersetzt. Lediglich die Parameterdarstellung ändert sich im Detail.
Anstatt eine Gerade durch die Angabe von einem Aufpunkt und einer Richtung zu beschreiben, können wir
auch zwei Punkte u, v ∈ Rd , u 6= v angeben, durch die die Gerade gehen soll. Die Gerade ist eindeutig
durch die Angabe solcher zwei Punkte festgelegt. Zunächst ist es das einfachste, eine Parameterdarstellung
anzugeben. Wenn wir u als Aufpunkt betrachten, verläuft die Gerade in Richtung r := v − u, also ist wie
in (9.10)
G = u + λ(v − u), λ ∈ R .
(9.11)
9.4
141
Geraden und Ebenen
Eine etwas andere Darstellung erhalten wir, wenn wir einen zweiten Parameter µ einführen und µ = 1 − λ
setzen. Dann ist nämlich (9.11) gleichwertig zu
G = λv + µu, λ + µ = 1 .
(9.12)
(Man beachte, dass hier die Rollen von u und v gleichwertig sind, die Darstellung also symmetrisch in u
und v ist.) Diese Darstellung heißt baryzentrische Darstellung der Geraden G. Für x ∈ G heißen die
(eindeutig bestimmten) Zahlen µ und λ mit µ + λ = 1 und
x = λv + µu
die baryzentrischen Koordinaten von x bezüglich v und u. Die Vorstellung ist: x ist der Schwerpunkt,
wenn wir Gewichte der Größe µ und λ in v und u anbringen. ( baryzentrisch“ leitet sich vom griechischen
”
Wort für Schwerpunkt“ ab.)
”
Im Gegensatz zu einer Geraden wird eine Ebene E durch die Angabe von einem Aufpunkt u und zwei
Richtungen r1 und r2 bestimmt. Dabei müssen r1 und r2 natürlich linear unabhängig sein. (Sonst liegen r1
und r2 auf einer Geraden.) Wie für die Gerade erhalten wir die Parameterdarstellung:
E = u + λ1 r 1 + λ 2 r 2 , λ 1 , λ 2 ∈ R .
(9.13)
Wenn wir eine Ebene nicht durch Richtungen beschreiben wollen, sondern durch Angabe von Punkten,
durch die die Ebene geht, so müssen wir drei Punkte u0 , u1 , u2 ∈ Rd angeben. Wir können dann wieder
eine Parameterdarstellung erzeugen, indem wir u0 als Aufpunkt verstehen und als Richtungen r1 = u1 −u0
und r2 = u2 −u0 setzen. Dabei müssen die Punkte u0 , u1 , u2 natürlich so gewählt sein, dass die Differenzen
u1 − u0 und u2 − u0 linear unabhängig sind, also nicht auf einer Geraden liegen. Aus (9.13) erhalten wir
sofort die Parameterdarstellung für die Ebene
E = u0 + λ1 (u1 − u0 ) + λ2 (u2 − u0 ), λ1 , λ2 ∈ R .
(9.14)
Auch für die Ebene können wir wieder baryzentrische Koordinaten einführen: µ0 = 1 − λ1 − λ2 , µ1 = λ1
und µ2 = λ2
E = µ0 u0 + µ1 u1 + µ2 u2 , µ0 + µ1 + µ2 = 1 .
(9.15)
Die baryzentrische Darstellung der Ebene in (9.15) ist wieder völlig symmetrisch in den drei Punkten
u0 , u1 , u2 . Sie legt nahe, dass man auch Ebenen von höherer Dimension“ betrachten kann, die durch mehr
”
als drei Punkte angegeben werden. Unsere räumliche Vorstellungskraft versagt hier sicherlich, aber rein
formal gibt es kein Problem, die Begriffe von Geraden und Ebenen zu verallgemeinern.
Definition 9.38 (Affiner Raum) Es seien k ≤ d − 1 und u0 , u1 , . . . , uk ∈ Rd Punkte mit der Eigenschaft,
dass u1 − u0 , . . . , uk − u0 linear unabhängig sind. Dann heißt die Menge
( k
)
X
i i
0
k
A=
µ u , µ + ... + µ = 1
i=0
der von u0 , . . . , uk aufgespannte k–dimensionale affine Unterraum von Rd . Für x ∈ A mit x =
k
P
i=0
heißen die Zahlen µ0 , . . . , µk die baryzentrischen Koordinaten bezüglich der Punkte u0 , . . . , uk .
µi ui
142
Vektorräume und Grundlagen der Analytischen Geometrie
Ist k = d − 1, so heißt A eine Hyperebene im Rd .
Spezialfälle sind
k = 1:
k = 2:
k = d − 1:
Gerade
Ebene
Hyperebene
Nach der Definition wird also eine Gerade im R2 als Hyperebene bezeichnet, genauso wie eine Ebene im R3
als Hyperebene bezeichnet wird. Wir werden im nächsten Unterabschnitt sehen, dass diese Begriffsbildung
sinnvoll ist.
Man beachte, dass ein affiner Raum im allgemeinen kein Vektorraum ist. Sind nämlich u, v ∈ A, so ist im
allgemeinen u + v 6∈ A. Allerdings ist stets λu + (1 − λ)v ∈ A.
Man kann zeigen, dass ein affiner Raum A genau dann ein Vektorraum ist, wenn 0 ∈ A ist. Das wiederum
ist gleichwertig dazu, dass die Punkte u0 , . . . , uk linear abhängig sind.
9.4.2
Hesse’sche Normalform
Wir hatten gesehen, dass der Begriff der Hyperebenen H im Rd die Begriffe der Geraden in der Ebene und
der Ebene im dreidimensionalen Raum verallgemeinert. Wir werden hier sehen, dass sich für Hyperebenen
eine weitere, besonders praktische Beschreibung anbietet, bei der statt Punkten oder Richtungen innerhalb
der Hyperebene diejenige Richtung angegeben wird, die senkrecht auf der Hyperebene steht. Dies ist, wie
wir gleich sehen werden, zudem die Richtung, in der die Hyperebene den geringsten Abstand zum Ursprung
hat. So kann eine Hyperebene durch Angabe der senkrechten Richtung sowie des Abstands zum Ursprung
charakterisiert werden durch die so genannte Hesse’sche Normalform.
Wir beginnen mit einem Lemma. Sei v ∈ H derjenige Vektor, für den |v| minimal ist, für den also gilt
|w| ≥ |v| für alle w ∈ H.
(9.16)
Es ist nicht schwer zu zeigen, dass v eindeutig bestimmt ist. Wir wollen hier nur zeigen, dass v senkrecht
auf H steht.
Lemma 9.39 v steht senkrecht auf H. Mit anderen Worten
hw − v, vi = 0 für alle w ∈ H.
Beweis Für jedes λ ∈ R ist v + λ(w − v) ∈ H. Also ist die Funktion f : R → R
f (λ) = |v + λ(w − v)|2
nach Voraussetzung minimal in λ = 0. Wir bezeichnen mit f 0 (λ) =
Dann ist
d
dλ f (λ)
die Ableitung von f .
d
hv − λ(w − v), v − λ(w − v)i
dλ
d 2
=
λ hw − v, w − vi − 2λhv, w − vi
dλ
= 2λ|w − v|2 − 2hv, w − vi.
f 0 (λ) =
Da f in λ = 0 minimal ist, ist
1
hv, w − vi = − f 0 (0) = 0.
2
2
9.4
143
Geraden und Ebenen
Definition 9.40 Wir nennen α = |v| den Abstand von H zum Ursprung und, falls v 6= 0 (also, falls 0 6∈ H),
n :=
v
|v|
den Normalenvektor von H. n ist normiert (das heißt |n| = 1) und zeigt vom Ursprung senkrecht nach H.
Wenn die Hyperebene H durch den Ursprung geht, müssen wir uns etwas mehr anstrengen, um einen
normierten Vektor zu finden, der senkrecht auf H steht, da der Punkt minimalen Abstands ja der Ursprung
ist. Man kann dazu so vorgehen: man betrachtet eine Hyperebene H 0 , die parallel zu H liegt und nicht durch
den Ursprung geht. Für H 0 kann man einen Normalenvektor n angeben. Da n senkrecht auf H 0 steht, muss
n auch senkrecht auf H stehen. Voilà. Hierzu ist allerdings zu bemerken, dass n nur bis auf das Vorzeichen
eindeutig ist, weil ja mit n auch −n senkrecht auf H steht.
Satz 9.41 (Hesse’sche Normalform) (a) Ist H ⊂ Rd eine Hyperebene (also eine Ebene, falls d = 3,
oder eine Gerade, falls d = 2), so gibt es ein Paar (n, α) mit n ∈ Rd , |n| = 1 und α ≥ 0, sodass
H = v ∈ Rd : hv, ni − α = 0 .
(9.17)
Dabei ist α stets eindeutig. Ist α > 0, so ist n eindeutig. Ist α = 0, so ist n nur bis auf das Vorzeichen
eindeutig.
(b) Ist umgekehrt ein Paar (n, α) wie oben gegeben, so wird durch (9.17) eine Hyperebene definiert.
(c) Die Darstellung in (9.17) heißt Hesse’sche Normalform der Hyperebene H. Das Paar (n, α) nennt
man die Koordinaten der Hesse’schen Normalform.
Beispiele 9.42
(i) Sei d = 2 und
H = G = u0 + λ(u1 − u0 ), λ ∈ R ,
wobei
0
2
und
u1 =
.
2
0
2
2
n steht senkrecht auf v := u1 − u0 =
, also ist n ein Vielfaches von v ⊥ =
(siehe (9.8)).
−2
2
√
√
1
1
. Mit n = + 22
ergibt sich
Damit n normiert ist, ist n = ± 22
1
1
u0 =
√
0
α = hu , ni =
√
2
(0 · 1 + 2 · 1) = 2 > 0 .
2
Somit hatten wir das richtige Vorzeichen bei n gewählt. Also ist die Hesse’sche Normalform von G
(
* √ +
)
√
2 1
2
G = v ∈ R : v,
− 2 =0 .
2 1
(ii) Sei d = 3 und
H = E = µ0 u0 + µ1 u1 + µ2 u2 , µ0 + µ1 + µ2 = 1 ,
144
Vektorräume und Grundlagen der Analytischen Geometrie
wo
 
2
u0 = 1 ,
0
 
 
1
1
u1 = 1 ,
u2 = 3 .
1
0
 
 
−1
−1
n steht senkrecht auf v 1 := u1 − u0 =  0  und v 2 := u2 − u0 =  2 . Also ist n parallel zum
1
0
Vektorprodukt
 
−2
w := v 1 × v 2 = −1 .
−2
Nun ist hw, u0 i = −2 · 2 − 1 · 1 = −5. Das negative Vorzeichen zeigt an, dass w von E weg zeigt.
Also müssen wir für n das andere Vorzeichen wählen
 
2
1 
5
w
1
=
und α = .
n := −
|w|
3
3
2
Probe: hn, u0 i −
von E
5
3
= 0, hn, u1 i − 53 = 0 und hn, u2 i − 53 = 0. Also ist die Hesse’sche Normalform


 +
*
2


5
1
E = v ∈ R3 : v, 1 − = 0 .


3
3
2
Bei der Probe in (ii) haben wir nur die Punkte getestet, die die Ebene definieren. Dass dies immer ausreichend ist, halten wir in dem folgenden Satz fest.
Satz 9.43 Seien u0 , u1 , . . . , ud−1 ∈ Rd und {u1 − u0 , . . . , ud−1 − u0 } linear unabhängig sowie H die
Hyperebene
(d−1
)
X
i i
0
d−1
H=
µ u , µ + ... + µ
=1 .
i=0
d
Ferner seien n ∈ R , |n| = 1 und α ≥ 0.
n und α sind genau dann die Koordinaten der Hesse’schen Normalform von H, falls
hui , ni − α = 0,
für alle i = 0, . . . , d − 1.
Beweis Es ist zu prüfen, dass hv, ni − α = 0 für alle v ∈ H. Sei dazu
v=
d−1
X
µi ui
mit
i=0
d−1
X
µi = 1 ,
i=0
d.h. in baryzentrischen Koordinaten gegeben. Dann ist
*d−1
+ d−1
d−1
X
X
X
i i
hv, ni =
µ u ,n =
µi hui , ni =
µi α = α,
i=0
weil
d−1
X
i=0
µi = 1.
i=0
i=0
2
9.4
145
Geraden und Ebenen
Abstand eines Punktes von einer Hyperebene
Bei der Hesse’schen Normalform gibt |α| den Abstand der Hyperebene vom Ursprung an. Wie erhalten wir
allgemein den Abstand dist(x, H) eines Punktes x im Vektorraum von einer Hyperebene H mit Koordinaten (n, α) der Hesse’schen Normalform?
Zu x gehört ein Punkt xH ∈ H mit kleinstem Abstand zu x und es ist dist(x, H) = |x − xH |. Offenbar ist
dann x − xH senkrecht zu H also parallel zu n und damit
dist(x, H) = |x − xH | = |hx − xH , ni|.
Wir berechnen
hx − xH , ni = hx, ni + hαn − xH , ni −hαn, ni = hx, ni − α.
|
{z
}
=0, weil αn,xH ∈H
Wir halten das Ergebnis in einem Satz fest.
Satz 9.44 Der Abstand des Punktes x von der Hyperebene H mit Koordinaten (n, α) der Hesse’schen
Normalform ist
dist(x, H) = |hx, ni − α|.
Beispiel 9.45 Sei G ⊂ R2 die Gerade durch die Punkte u0 =
2
−1
−2
und u1 =
. Es sei x =
.
0
1
−2
Dann ist der Normalenvektor n senkrecht auf u0 − u1 , also
⊥
3
√ −1
10 1
(u0 − u1 )⊥
√
n=± 0
=
±
=
±
.
|u − u1 |
10 −3
10
Wegen
*√
10
10
+ √
10
1
0
>0
,u
=
−3
5
gilt das positive Vorzeichen und es ist
√
10
n=
10
Wir erhalten
1
,
−3
√
α=
10
.
5
√
2√
1 √ 10
dist(x, G) = |hx, ni − α| = 10 −
10 =
.
5
5
5
146
Vektorräume und Grundlagen der Analytischen Geometrie
Kapitel 10
Matrizen und lineare Abbildungen
 
v1
 
Um die Koordinaten x1 , . . . , xd des Vektors v =  ...  ∈ Rd bezüglich einer gegebenen Basis b1 , . . . , bd
vd
des Rd zu berechnen, müssen wir nach Satz 9.13 die Vektorgleichung x1 b1 +· · ·+xd bd = v nach x1 , . . . , xd
auflösen. Äquivalent zu dieser Vektorgleichung ist das folgende lineare Gleichungssystem (LGS)
b11 x1
..
.
+ · · · + bd1 xd
..
.
=
b1d x1
+ · · · + bdd xd
= vd
v1
.. .
.
(10.1)
In diesem Kapitel wollen wir eine ökonomische Notation und Lösungsmethode für solche LGS mit Hilfe
von Matrizen einführen. (Allgemeinere LGS werden im nachfolgenden Kapitel behandelt.)
Weiter untersuchen wir Matrizen als Darstellung von linearen Abbildungen zwischen Vektorräumen.
10.1
Grundlegendes
Definition 10.1 (Matrix) Seien m, n ∈ N. Ein rechteckiges Zahlenschema


a11 a12 · · · a1n
 a21 a22 · · · a2n 


A= .
..
..  = (aij ) i=1,...,m
..
j=1,...,n
 ..
.
.
. 
am1 am2 · · · amn
heißt eine m × n–Matrix. Sind die Einträge aij reelle (komplexe) Zahlen, so heißt A reell (komplex). Die
Menge aller reellen (komplexen) m × n–Matrizen wird mit M (m, n) = M (m, n; R) (bzw. M (m, n; C))
bezeichnet.


a1j


Die Spalten  ... , j = 1, . . . , n heißen Spaltenvektoren, die Zeilen (ai1 , . . . , ain ), i = 1, . . . , m, heißen
amj
Zeilenvektoren von A.
147
148
Matrizen und lineare Abbildungen
Die Zahlen aii heißen die Diagonalelemente von A.
Ist m = n, so heißt A quadratisch.
Beispiele 10.2
1 2 3
∈ M (2, 3)
4 5 6


1 4
A = 2 0 ∈ M (3, 2)
3 0
i 1
A=
∈ M (2, 2; C)
−1 1
A=


v1
 
Wir interpretieren Zeilenvektoren (u1 , . . . , un ) als 1 × n–Matrizen, Spaltenvektoren  ...  als m × 1–
vm
Matrizen.
Einige wichtige Matrizen:
Definition 10.3
(i) Die Matrix


0 ··· 0

..  ∈ M (m, n)
0 :=  ...
.
0 ··· 0
heißt die Nullmatrix. Sie wird unabhängig von m und n nur mit 0 bezeichnet.
(ii) Die quadratische Matrix, bei der nur die Diagonalelemente ungleich Null sind


d11 0 . . . . . . . . . .
0
 0 d22 0 . . . . . .
0 




.
.
 0
. 0 ..
0
0 


D= .
..  =: diag(d11 , . . . , dnn )
 ..

.




.
 0 . . . . . . . . 0 ..
0 
0 . . . . . . . . . . . 0 dnn
heißt Diagonalmatrix.
(iii) Die Diagonalmatrix
In := diag(1, . . . , 1) ∈ M (n, n)
heißt Einheitsmatrix. Ist der Wert n aus dem Zusammenhang klar, so schreiben wir auch nur I = In .
Matrizen vom selben Typ (m, n) kann man elementweise addieren und mit Skalaren multiplizieren.
Definition 10.4 (Matrizenaddition) Seien A, B m × n–Matrizen und λ ∈ R. Dann definieren wir die
m × n–Matrix C := A + B durch
cij = aij + bij ,
i = 1, . . . , m, j = 1, . . . , n.
10.1
149
Grundlegendes
Wir definieren die Matrix E = λA durch
eij = λaij ,
i = 1, . . . , m, j = 1, . . . , n.
Beispiel 10.5
A=
Dann ist
1
4
A+B =
2
5
3
,
6
1+0
4+1
und
B=
2+1
5+0
3A =
3
12
0
1
1 −3
.
0 1
3−3
1
=
6+1
5
6
15
3
5
0
7
9
.
18
Offenbar ist die Matrizenaddition nichts anderes als die Vektoraddition, nur dass bei Matrizen die m · n Einträge nicht untereinander sondern rechteckig notiert sind. Entsprechendes gilt für die Skalarmultiplikation.
Es gelten also genau die Rechenregeln, die wir für Vektoren in Lemma 9.1 zusammengefasst haben. Es gilt
also:
Satz 10.6 Bezüglich der Addition und Skalarmultiplikation ist M (m, n) ein Vektorraum der Dimension
m · n.
Im Gegensatz zu Vektoren des Rd wollen wir Matrizen auch miteinander multiplizieren.
Definition 10.7 (Matrizenmultiplikation) Sei A ∈ M (m, n), B ∈ M (n, p), so definieren wir das Produkt C := AB ∈ M (m, p) durch
n
X
aik bkj .
cij =
k=1
Wichtig: Spaltenanzahl von A muss gleich der Zeilenanzahl von B sein!
Beispiel 10.8

1
3
1
2
3
6
0
7
0

 2
2 
1
1 
1
2
6
0


4
2+2+0+0

6 
6
+ 3 + 27 + 0
=
1
2+6+0+0
5
 

4 + 12 + 0 + 10
4
26
12 + 18 + 7 + 5 = 12, 5 42 .
8
70
4 + 36 + 0 + 30
ACHTUNG: Selbst wenn AB und BA definiert sind, ist im allgemeinen
AB 6= BA
Beispiel 10.9
0 1
A=
,
1 0
0 3
AB =
,
2 0
2 0
B=
.
0 3
0 2
BA =
.
3 0
150
Matrizen und lineare Abbildungen
Achtung: Aus AB = 0 folgt nicht A = 0 oder B = 0.
Beispiel 10.10
A=
0
,
0
1
0
B=
AB = 0 =
0
.
1
0
0
0
.
0
0
0
Wir fassen die Rechenregeln für die Matrizenmultiplikation in einem Lemma zusammen.
Lemma 10.11 (Rechenregeln für die Matrizenmultiplikation)
A(BC) = (AB)C
(A + B)C = AC + BC
A(B + C) = AB + AC.
Ist A ∈ M (m, n) und sind Im ∈ M (m, m), In ∈ M (n, n) die Einheitsmatrizen, so ist
Im A = AIn = A.
10.2
Invertierbare Matrizen
Definition 10.12 Eine Matrix A ∈ M (n, n) heißt invertierbar (oder regulär), falls es ein B ∈ M (n, n)
gibt mit AB = In . Äquivalent dazu ist BA = In . Wir nennen A−1 := B das Inverse von A. Die Menge
der invertierbaren n × n–Matrizen wird mit GL(n) bezeichnet.
Matrizen, die nicht invertierbar sind, heißen singulär.
Beispiele 10.13
(i)
A=
denn
−1
AA
und
−1
(ii) Allgemeiner: A =
=
A
A=
a b
c d
3
7
2
,
5
3·5−7·2
7·5−5·7
A−1 =
5 −2
,
−7 3
3 · (−2) + 2 · 3
1
=
(−2) · 7 + 5 · 3
0
5 · 3 + (−2) · 7 5 · 2 + (−2) · 5
(−7) · 3 + 3 · 7 (−7) · 2 + 3 · 5
=
1
0
0
1
0
.
1
ist invertierbar genau dann, wenn det(A) := |A| := ad − bc 6= 0. In
diesem Fall ist
A−1 =
1
det(A)
d −b
.
−c a
Diese Formel wird auch als Cramér’sche Regel bezeichnet.
Satz 10.14 Sind A, B ∈ GL(n), so ist auch AB ∈ GL(n) mit Inversem
(AB)−1 = B −1 A−1 .
(10.2)
10.3
151
Gauß Verfahren
Beweis
(AB)(B −1 A−1 ) = A(BB −1 )A−1 = AIn A−1 = AA−1 = In .
2
Satz 10.15 Sei A ∈ M (n, n). Folgende Aussagen sind gleichwertig
(i) A ∈ GL(n),


a1j
 
(ii) die Spaltenvektoren  ... , j = 1, . . . , n, sind linear unabhängig.
anj
(iii) die Zeilenvektoren (ai1 , . . . , ain ), i = 1, . . . , n, sind linear unabhängig.
Anwendung: Koordinaten berechnen


a1j
 
Seien die Spaltenvektoren aj =  ... , j = 1, . . . , n eine Basis von Rn und v ∈ Rn . Die Koordinaten
anj


x1
 
x1 , . . . , xn von v bezüglich dieser Basis sollen bestimmt werden. Dazu schreiben wir x =  ...  als
xn
Spaltenvektor und

a11
 ..
1
n
A = (a , . . . , a ) =  .
an1
···

a1n
.. 
. 
(10.3)
· · · ann
als Matrix. Wir müssen nun die Gleichung
Ax = v
(10.4)
nach x auflösen. Nach Satz 10.15 ist A ∈ GL(n), also existiert A−1 . Wir multiplizieren die Gleichung
(10.4) von links mit A−1 und erhalten so
A−1 v = A−1 (Ax) = (A−1 A)x = In x = x.
Wir können also die Koordinaten von jedem Vektor v leicht ausrechnen, wenn wir erst einmal A−1 gefunden haben.
10.3
Gauß Verfahren
Wir geben hier ein universelles Verfahren an, um zu einer invertierbaren Matrix A ∈ GL(n) die Inverse
A−1 auszurechnen.
Schritt 1 Wir schreiben A und die Einheitsmatrix nebeneinander



a11 · · · a1n
1 0
 ..
.. 

 .
. 
0 1


 .. ..
 .
.. 
. .
 ..
. 
0 0
an1 · · · ann

··· 0
· · · 0

.. 
..
. .
··· 1
152
Matrizen und lineare Abbildungen
Wir dürfen nun simultan die Zeilen beider Matrizen verändern durch eine der drei Manipulationen:
(i) Zwei Zeilen vertauschen,
(ii) (Vielfache) einer Zeile zu einer anderen addieren (oder davon abziehen),
(iii) eine Zeile mit einer Zahl λ 6= 0 multiplizieren.
Diese Manipulationen werden elementare Zeilenumformungen genannt.
Wenn ursprünglich A · A−1 = I galt, gilt jetzt für die durch (auch mehrfache) Manipulation mit den 3
Methoden aus A und I erhaltenen Matrizen A0 bzw. I 0 ebenfalls A0 · A−1 = I 0 (nicht schwer zu zeigen).
Man darf die elementaren Zeilenumformungen beliebig oft anwenden. Man tut es so lange, bis an Stelle
von A die Einheitsmatrix steht, dann steht an Stelle von I die inverse Matrix A−1 . Schematisch geht man
folgendermaßen vor:
Schritt 2. Durch eventuelles Vertauschen von Zeilen wird a11 6= 0 erreicht. Durch Multiplikation der ersten
Zeile mit a111 wird a11 = 1 erreicht.
Schritt 3. Die erste Zeile wird nun a21 –fach von der zweiten Zeile abgezogen,
dann a31 –fach von der
 
1
0
 
dritten und so weiter bis in der ersten Spalte der linken Matrix der Vektor e1 =  .  steht.
 .. 
0
Schritt 4. Nacheinander werden die weiteren Spalten zu e2 , e3 und so weiter gemacht.
Als Ergebnis steht links die Einheitsmatrix und rechts die Matrix A−1 . Das Verfahren geht genau dann auf,
wenn A invertierbar ist. Ansonsten tritt im Verlauf auf der linken Seite eine Zeile oder Spalte mit nur Nullen
auf. (Man muss also nicht im voraus prüfen, ob A invertierbar ist.)
Wir führen das Verfahren hier an einem Beispiel durch.


0 9
6


Beispiel 10.16 Wir wollen die Matrix A = 1 1 −1 invertieren.
2 −7 2




0 9
6
1 0 0




1 1 −1
0 1 0




2 −7 2
0 0 1
Erste und zweite Zeile vertauschen, damit links oben keine Null steht.


1 1 −1


0 9
6


2 −7 2
Erste Zeile zweimal von der dritten abziehen.


1 1 −1


0 9
6


0 −9 4

0

1

0
1
0
0

0 1

1 0

0 −2

0

0

1

0

0

1
10.3
153
Gauß Verfahren
Zweite Zeile mal
1
9



1 1 −1


2 
0 1
3 

0 −9 4
0
1
1

9
0
0

0

0

1
−2
Zweite Zeile von der ersten abziehen und 9-mal zur dritten addieren


1 0 − 35


2 
0 1
3 

0 0 10
Dritte Zeile mal
 1
−9
 1

 9
1
−2

0

0

1
1
0
1
10

1

0

0
0 − 53
1
2
3
0
1


− 91
1
0






1
9
1
10
0

0

− 15

1
10
Dritte Zeile 53 –mal zur ersten addieren, und 23 –mal von der zweiten abziehen

1
0

0

0
1
0

0

0

1
1
18
2

 45
1
10

2
3
2
15
− 15
1
6

1 
− 15

1
10

Wir erhalten also die Inverse von A
1
18
2

 45
1
10

A−1 =
Probe:
A · A−1
2
3
2
15
− 15

 1
0 9
6
18

 2
·
1
1
−1
=

  45
1
2 −7 2
10

0
Beispiel 10.17 Wir wollen A = 3
1
1
6

1 
− 15
.
1
10
2
3
2
15
− 15

2 4
3 −6 invertieren.
1 −2



0 2 4
1
3 3 −6
0
1 1 −2
0

1
6

1 
− 15

1
10

0
1
0

0
0
1
1
0
0

0
0
1
Erste und zweite Zeile vertauschen

3
0
1

3 −6
2 4
1 −2

0
1
0

1

=
0
0
0
1
0

0

0
.
1
154
Matrizen und lineare Abbildungen
Erste Zeile mal
1
3

1
0
1
Erste Zeile von der dritten abziehen

1
0
0

1 −2
2 4
1 −2

0
1
0

1 −2
2 4
0 0
1/3
0
0

0 1/3
1
0
0 −1/3

0
0
1

0
0
1
Die letzte Zeile hat links nur Nullen, also ist A nicht invertierbar.
10.4
Lineare Abbildungen
Die wichtigsten Abbildungen in der Geometrie, Dehnungen, Scherungen, Spiegelungen, Drehungen usf.,
sind so genannte lineare Abbildungen. Wenn man weiß, wie sich die Einheitsvektoren transformieren,
kann man das gedrehte, gespiegelte usf. Koordinatengitter zeichnen und dann für jeden Vektor ablesen,
wohin er abgebildet wurde. In diesem Abschnitt formalisieren wir die dargestellte Idee und geben den
Zusammenhang mit dem Matrizenkalkül an.
Definition 10.18 Seien U und V Vektorräume. Eine Abbildung L : U → V heißt lineare Abbildung,
wenn sie mit der Struktur von U und V verträglich ist, also die folgenden Regeln erfüllt: Für alle x, y ∈ U
und λ ∈ R gilt
L(x + y) = L(x) + L(y)
L(λx) = λL(x).
(i) Die identische Abbildung idU : U → U , x 7→ x, ist linear.
 
x1
x1
(ii) Die Projektion L : R3 → R2 , x2  7→
ist linear, denn
x2
x3


x1 + y1
x1 + y1
x1
y
L(x + y) = L x2 + y2  =
=
+ 1 = L(x) + L(y)
x2 + y2
x2
y2
x3 + y3
Beispiele 10.19
und
λx1
= λL(x).
λx2
x1
x1 + x2
2
2
(iii) Die Scherung in der Ebene L : R → R ,
7→
ist linear, denn
x2
x2
x1 + y1
x1 + y1 + x2 + y2
x1 + x2
y 1 + y2
L(x + y) = L
=
=
+
= L(x) + L(y)
x2 + y2
x2 + y2
x2
y2
L(λx) =
und
L(λx) = L
λx1
λx2
=
λ(x1 + x2 )
= λL(x).
λx2
10.4
155
Lineare Abbildungen
(iv) Ist u ∈ Rd fest gewählt, so ist L : Rd → R, x 7→ hu, xi eine lineare Abbildung.
(v) Ist u ∈ Rd , u 6= 0, fest gewählt, so ist L : Rd → Rd , x 7→ x + u keine lineare Abbildung. Es ist
nämlich (mit λ = 0)
L(0 · x) = u 6= 0 = 0 · L(x).
(vi) Die Abbildung L : Rd → R, x 7→ hx, xi ist nicht linear, denn
L(λx) = hλx, λxi = λhx, λxi = λ2 hx, xi = λ2 L(x).
(vii) Ein etwas weitreichenderes Beispiel ist die Integration stetiger Funktionen. Sei U = {f : [0, 1] →
R stetig} und L : U → U gegeben durch L(f ) = F , wobei
x
Z
F (x) =
f (t) dt
0
die Stammfunktion von f mit F (0) = 0 ist. Dann ist L linear, denn für x ∈ [0, 1] gilt:
Z
x
Z
x
(f + g)(t) dt =
0
Z
x
f (t) dt +
0
g(t) dt
0
und
x
Z
Z
x
λf (t) dt = λ
f (t) dt.
0
0
Ist nun U ein Vektorraum mit Basis u1 , . . . , un , so reicht es, die lineare Abbildung L : U → V an den
Stellen u1 , . . . , un zu kennen. Es hat nämlich jeder Vektor x ∈ U eine eindeutige Darstellung
x=
n
X
λj u j ,
j=1
und es ist


n
n
X
X
L(x) = L 
λj u j  =
λj L(uj ).
j=1
j=1
Sei nun auch noch v 1 , . . . , v m eine Basis von V . Wir bezeichnen mit (aij )i=1,...,m die Koordinaten von
L(uj ) bezüglich v 1 , . . . , v m , d.h.
L(uj ) =
m
X
v i aij .
i=1
Insgesamt haben wir für x wie oben
L(x) =
m X
n
X
i=1 j=1
v i aij λj .
156
Matrizen und lineare Abbildungen
Satz 10.20 (Darstellungsmatrix) Seien U, V Vektorräume mit Basen u1 , . . . , un und v 1 , . . . , v m . Zu jeder linearen
Abbildung L : U → V gehört genau eine Matrix A = (aij ) ∈ M (m, n), sodass für alle
Pn
x = j=1 uj gilt
m X
n
X
L(x) =
v i aij λj .
(10.5)
i=1 j=1
A heißt die
von L bezüglich der Basen u1 , . . . , un und v 1 , . . . , v m . Der j–te Spal Darstellungsmatrix

a1,j


tenvektor  ...  gibt die Koordinaten von L(uj ) bezüglich der Basis v 1 , . . . , v m wieder. Ist also Λ =
an,j

λ1
 .. 
 .  der Koordinatenvektor von x bezüglich u1 , . . . , un , so ist das Matrixprodukt A · Λ der Koordina
λn
tenvektor von L(x) bezüglich v 1 . . . v m .
Umgekehrt wird durch (10.5) zu jeder Matrix A eine lineare Abbildung L definiert.
Achtung: Bei anderer Wahl der Basen erhält man eine andere Darstellungsmatrix!
Beispiele 10.21
(i) Sei U = V = Rd und ui = v i = ei , i = 1, . . . , n die Standardbasis. Dann hat die
identische Abbildung id : Rn → Rn die Einheitsmatrix In als Darstellungsmatrix.
x1
x1
(ii) Sei S : R2 → R2 ,
7→
die Spiegelung an der horizontalen Achse. Bezüglich der Basis
x
−x2
2
1
1
0 1
b1 =
, b2 =
hat S die Darstellungsmatrix
, denn S(b1 ) = b2 und S(b2 ) = b1 .
1
−1
1 0
1 0
Bezüglich der Standardbasis hat S die Darstellungsmatrix
.
0 −1
 
x1
x1
3
2  
(iii) Die Projektion π : R → R , x2 7→
hat bezüglich der Standardbasen die Darstellungsmax2
x
3
1 0 0
trix
.
0 1 0
(iv) Die Drehung Dϕ : R2 → R2 um den Winkel ϕ (gegen den Uhrzeigersinn) hat bezüglich der Standardbasen die Darstellungsmatrix
cos(ϕ) − sin(ϕ)
Dϕ =
.
sin(ϕ) cos(ϕ)
 
r1
(v) (Vektorprodukt) Ist r = r2  ∈ R3 fest gewählt, so ist die Abbildung L : R3 → R3 , x 7→ r × x
r3
linear. Die Darstellungsmatrix bezüglich der Standardbasis ist


0
−r3 r2
 r3
0
−r1  .
(10.6)
−r2 r1
0
10.4
157
Lineare Abbildungen
Wenn man eine Abbildung verstanden hat, ist es eine Zwangshandlung, Zusammensetzungen von Abbildungen zu untersuchen.
Satz 10.22 Seien U, V, W Vektorräume mit Basen u1 , . . . , um , v 1 , . . . , v n und w1 , . . . , wp , sowie LA :
U → V und LB : V → W lineare Abbildungen mit Darstellungsmatrizen A ∈ M (n, m) und B ∈
M (p, n). Dann ist die Verknüpfung LC := LB ◦ LA : U → W , x 7→ LB (LA (x)) eine lineare Abbildung
mit Darstellungsmatrix C = BA ∈ M (p, m).
Beweis


n
X
LC (uk ) = LB (LA (uk )) = LB 
ajk v j 
j=1
=
n
X
ajk LB (v j )
j=1
=
n
X
ajk
j=1
p
X
bij wi
i=1


p
n
X
X
=
wi 
bij ajk 
i=1
=
p
X
j=1
wi cik .
i=1
2
Matrizenmultiplikation entspricht also genau der Verknüpfung linearer Abbildungen. Wir erhalten sofort
(z.B. mit Hilfe von Beispiel 10.21(i)) die einfache Schlussfolgerung.
Korollar 10.23 Sei u1 , . . . , un eine Basis von U und LA : U → U linear mit Darstellungsmatrix A. Dann
gilt
LA ist umkehrbar ⇐⇒ A ∈ GL(n).
Die Darstellungsmatrix der Umkehrabbildung (LA )−1 ist dann A−1 .
x1 + λx2
Beispiele 10.24
(i) Die Scherung L : R → R ,
7→
(wobei λ ∈ R fest ist) hat
x2
1 λ
bezüglich der Standardbasis die Darstellungsmatrix A =
. Die Scherung ist umkehrbar mit
0 1
x1
x1 − λx2
Umkehrabbildung L−1
=
. Dies ist auch eine Scherung mit Parameter −λ, also
x2
x2
1 −λ
mit Darstellungsmatrix
. Nun ist
0 1
1 λ
1 −λ
1 0
·
=
,
0 1
0 1
0 1
1 −λ
also ist
= A−1 .
0 1
2
2
x1
x2
158
Matrizen und lineare Abbildungen
(ii) Die Drehung Dϕ : R2 → R2 ist umkehrbar mit (Dϕ )−1 = D−ϕ (zurück drehen!). Es ist
−1 cos(ϕ) − sin(ϕ)
cos(−ϕ) − sin(−ϕ)
cos(ϕ)
=
=
sin(ϕ) cos(ϕ)
sin(−ϕ) cos(−ϕ)
− sin(ϕ)
sin(ϕ)
.
cos(ϕ)
Dies liefert übrigens auch die Cramér’sche Regel (10.2), weil det(Dϕ ) = 1.
10.5
Spezielle Matrizen
Definition 10.25 Ist A = (aij ) ∈ M (m, n), so nennen wir die Matrix AT ∈ M (n, m) mit Einträgen


a11 · · · am1

.. 
AT =  ...
. 
a1n
· · · amn
die transponierte Matrixvon A.
Beispiele 10.26
(i)
1
4
2
5

T
1
3
= 2
6
3

4
5 .
6
(ii)


x1
 
(x1 , . . . , xm )T =  ...  ,
xm
(iii) Für x, y ∈ Rd ist
T
x1
 .. 
 .  = (x1 , . . . , xm ).

xm
 
y1
d
 ..  X
T
hx, yi = x y = (x1 , . . . , xd ) ·  .  =
xi yi .
yd
i=1
(iv) Ist A ∈ M (n, n) und x, y ∈ Rn , so ist
hx, Ayi = hAT x, yi.
(v) Es ist stets (AT )T = A.
Lemma 10.27 Es ist
(A + B)T = AT + B T
(AB)T = B T AT
(A−1 )T = (AT )−1 , falls A ∈ GL(n).
Definition 10.28 Eine Matrix A ∈ M (n, n) heißt
(i) symmetrisch, falls A = AT ,
(ii) orthogonal, falls A−1 = AT ,
10.6
159
Basiswechsel
(iii) obere (untere) Dreiecksmatrix, falls aij = 0 für i > j (bzw. i < j).
Bemerkung 10.29 A ist genau dann symmetrisch, wenn hx, Ayi = hAx, yi für alle x, y ∈ Rn ist.
Bemerkung 10.30 Eine Matrix A ist genau dann orthogonal, wenn die Zeilen (bzw. Spalten) eine Orthonormalbasis bilden. Dann ist nämlich


 
* ai,1
aj,1 + n
X
1, i = j


 
(A · AT )ij =
aik ajk =  ...  ,  ...  =
0, i 6= j.
k=1
aj,n
ai,n
Also ist A · AT = In und damit ist AT = A−1 .
Bemerkung 10.31 Orthogonale Matrizen gehören zu linearen Abbildungen, die längen- und winkeltreu
sind, also zu Spiegelungen und Drehungen, denn
hAx, Ayi = hAT Ax, yi = hA−1 Ax, yi = hx, yi.
10.6
Basiswechsel
2
2
1
√1
5
2
auf die doppelte
1
Wir betrachten die lineare Abbildung L : R → R , die in Richtung von b =
−1
1
2
√
aber auf die dreifache Länge. D.h. L hat bezüglich der
Länge streckt, in Richtung von b = 5
2
1 2
Basis b , b die Darstellungsmatrix
2 0
A=
= diag(2, 3).
0 3
Wie erhalten wir die Darstellungsmatrix bezüglich der Standardbasis e1 , e2 ?
e = (eb1 , . . . , ebd ) zwei Basen von
Wir formulieren das Problem allgemeiner. Seien B = (b1 , . . . , bd ) und B
d
d
d
e
e Wie lässt sich A in
R und L : R → R linear mit Darstellungsmatrix A bezüglich B und A bezüglich B.
e
A umrechnen?
 
 
e1
λ1
λ



e =  .. 
e
Sei x ∈ Rd mit Koordinaten Λ =  ...  bezüglich B und Λ
.  bezüglich B, also
ed
λd
λ
e Λ.
e
x = BΛ = B
e −1 können wir die Koordinaten ineinander umrechnen.
Durch Multiplikation mit B −1 beziehungsweise B
e Die Matrix S hat in der k–ten Spalte die Koordinaten von ebk bezüglich
Wir kürzen noch ab S := B −1 B.
B. Wir bekommen so
e
e = S −1 Λ.
Λ = S Λ,
Λ
Es ist dann
eB
e −1 BAB −1 B
eΛ
e = BS
e −1 AS Λ.
e
L(x) = BAΛ = B
Also haben wir insgesamt
160
Matrizen und lineare Abbildungen
e Basen des Rn und
Satz 10.32 (Basiswechsel) Sei L : Rn → Rn eine lineare Abbildung. Seien B und B
e
e
e so gilt
A und A die Darstellungsmatrizen von L bezüglich B beziehungsweise B. Setzen wir S := B −1 B,
e = S −1 AS.
A
e
Beispiel
10.33 Zurück zu unserem Beispiel. Da wir als neue Basis die Standardbasis betrachten, ist B =
1 0
e = B −1 , also
. Daher ist S = B −1 B
0 1
S
−1
√ 5 2 −1
=B=
5 1 2
und nach der Cramér’schen Regel
S=B
−1
√ 5 2
=
5 −1
1
.
2
Es ist dann die Darstellungsmatrix von L bezüglich der Standardbasis
1 2 −1
2 0
2
−1
e
A = S AS =
1
2
0
3
−1
5
1 2 −1
4 2
=
−3 6
5 1 2
1 11 −2
=
.
5 −2 14
1
2
Probe
1 11 −2
2
2
4
2
e
A
=
=
=2
1
1
2
1
5 −2 14
1 11 −2
−1
−1
−3
−1
e
A
=
=
=3
.
2
2
6
2
5 −2 14
2
−1
Also wird wirklich in Richtung
verdoppelt und in Richtung
verdreifacht.
1
2
 
1
Beispiel 10.34 Sei L : R3 → R3 diejenige lineare Abbildung, die die Richtung b3 = 33 1 konstant
1
lässt, aber die dazu senkrechte Ebene um den Winkel ϕ dreht (in Richtung b3 schauend im (gegen den
Uhrzeigersinn). Wir setzen also
 
√
1
2
−1 ⊥ b3
b2 =
2
0
√
und
√
 
−1
6
−1 .
b1 = b 2 × b 3 =
6
2
10.7
161
Lineare Gleichungssysteme
L hat bezüglich der ONB

− √16
 1
√
B = (b1 , b2 , b3 ) = 
− 6
√2
6
√1
2
− √12
0

√1
3

√1 
3
√1
3
wegen Beispiel 10.21(iv) die Darstellungsmatrix


cos(ϕ) − sin(ϕ) 0
A =  sin(ϕ) cos(ϕ) 0
0
0
1
(10.7)
(10.8)
e von L bezüglich der Standardbasis B
e = I3 ausrechnen. Dabei
Wir wollen wieder die Darstellungsmatrix A
ist dann
√
√ 
 1√
− 6 6 − 61 6 13 6
 √

√
e = B −1 =  1 2 − 1 2
(10.9)
S = B −1 B
0 
2
 2

√
√
√
1
1
1
3 3
3 3
3 3
sowie S −1 = B. Ausrechnen ergibt
e = S −1 AS
A
√
√


1 + 2 cos(ϕ)
1 − cos(ϕ) − 3 sin(ϕ) 1 − cos(ϕ) + √3 sin(ϕ)
√
1
=
1 + 2 cos(ϕ)
1 − cos(ϕ) − 3 sin(ϕ)
1 − cos(ϕ) + √3 sin(ϕ)
√
3
1 − cos(ϕ) − 3 sin(ϕ) 1 − cos(ϕ) + 3 sin(ϕ)
1 + 2 cos(ϕ)


π
π
1 + 2 cos(ϕ)
1 − 2 cos(ϕ − 3 ) 1 − 2 cos(ϕ + 3 )
1
1 + 2 cos(ϕ)
1 − 2 cos(ϕ − π3 )
= 1 − 2 cos(ϕ + π3 )
3
π
π
1 − 2 cos(ϕ − 3 ) 1 − 2 cos(ϕ + 3 )
1 + 2 cos(ϕ)
10.7
(10.10)
Lineare Gleichungssysteme
Motivation: Beim Erhitzen auf über 400◦ C zersetzt sich Kaliumdichromat (K2 Cr2 O7 ) in Kaliumchromat
(K2 CrO4 ), Chromoxid (Cr2 O3 ) und Sauerstoff (O2 ). Um die Anteile der beteiligten Stoffe mathematisch
zu bestimmen, gelangt man zu einem linearen Gleichungssystem aus drei Gleichungen mit vier Unbekannten (siehe Beispiel 10.37).
Wir betrachten allgemeiner lineare Gleichungssysteme (LGS) von der Form
Ax = b,
(10.11)
wobei A ∈ M (m, n), x ∈ Rm und b ∈ Rm . Ein Vektor x heißt Lösung, falls (10.11) gilt. Das LGS heißt
homogen, falls b = 0 und inhomogen sonst. Die Menge
L = {x ∈ Rn : Ax = b}
heißt Lösungsmenge des LGS und
LH = {x ∈ Rn : Ax = 0}
heißt Lösungsmenge des homogenen LGS. Es ist stets LH ⊂ Rn ein Untervektorraum. Es ist stets entweder
L = ∅ oder
L = xp + LH = {xp + x : x ∈ L},
(10.12)
wobei xp ∈ L eine beliebige partikuläre Lösung des LGS ist. Also ist L ein affiner Raum.
162
Matrizen und lineare Abbildungen
Bestimmung von L
Falls m = n und A ∈ GL(n), so wissen wir, dass
x = A−1 b
die eindeutige Lösung ist. Speziell gilt
LH = {0}
⇐⇒
A ∈ GL(n).
(10.13)
Allgemeiner gehen wir so vor: Ähnlich wie beim Gauß Verfahren schreiben wir A und b in eine Zeile. Wir
machen dann elementare Zeilenumformungen, jeweils in A und b simultan, bis wir die Matrix A0 und b0
haben, wobei A0 die so genannte Zeilenstufenform hat.

1
 0







0
A =








? · · ·?
0···0
?
1

? · · ·?
?
1
?
@. . .
@
@. . .
@ 1
@
0
0
j1
j2
j3










? · · ·? 

0···0 





b01
..
.
..
.
..
.
..
.
b0k



















0
b =









b0 
 k+1 
 . 
 .. 
b0m
jk
Die Matrix A0 hat k Stufen. Jede Stufe hat an der Ecke eine 1. Unterhalb der Stufen sind nur Nullen, alle
anderen Einträge sind nicht näher bestimmt und mit ? gekennzeichnet.
Definition 10.35 Die Zahl
k = Anzahl der Stufen von A0 =: Rang(A)
nennen wir den Rang von A.
Wichtig an der Zeilenstufenform ist, dass die Gleichung A0 x = b0 die gleiche Lösungsmenge L hat, wie die
Gleichung Ax = b. Dabei können wir die Lösungen von A0 x = b0 leicht bestimmen. Als erstes ist klar:
L 6= ∅
⇐⇒
b0r = 0 für alle r > k.
(10.14)
In diesem Fall können wir die Werte x1 , . . . , xn bis auf die Werte xj1 , . . . , xjk frei wählen und dann die
Werte xjk , xjk−1 , . . . , xj1 nacheinander ausrechnen. Die Dimension des Lösungsraums ist also so groß wie
die Anzahl frei wählbarer Werte
dim(L) = dim(LH ) = n − k.
(10.15)
Es gibt also genau n − k linear unabhängige Vektoren x1 , . . . , xn−k mit
LH = span(x1 , . . . , xn−k ).
10.7
163
Lineare Gleichungssysteme
Ist xp eine beliebige Lösung von A0 x = b0 , so hat L die Parameterdarstellung
(
)
n−k
X
p
i
L= x +
λi x , λ1 , . . . , λn−k ∈ R .
i=1
Beispiel 10.36

0
1
A=
1
2
0
2
2
4
1
1
0
1
6
7
1
8
8
12
4
16

6
11
,
6
18
 
3
4

b=
2 .
7
Erste und zweite Zeile vertauschen

1
0

1
2
2
0
2
4
1
1
0
1
7
6
1
8
12
8
4
16

11
6
,
6
18
 
4
3
 .
2
7
Erste Zeile einmal von der dritten und zweimal von der vierten abziehen

 

4
1 2 1
7
12 11

3
0 0 1
6
8
6

 .

−2
0 0 −1 −6 −8 −5 ,
−1
0 0 −1 −6 −8 −4
Zweite Zeile zur dritten und vierten hinzuzählen

1 2 1 7 12
0 0 1 6 8

0 0 0 0 0
0 0 0 0 0

11
6
,
1
2
 
4
3
 .
1
2
Dritte Zeile zweimal von der vierten abziehen ergibt die Zeilenstufenform
 


4
1 2 1 7 12 11
3

0 0 1 6 8
6
0
0

,
b =
A =
1 .
0 0 0 0 0
1
0
0 0 0 0 0
0
Es ist also Rang (A) = k = 3. Wir berechnen eine Lösung xp indem wir setzen
 
?
0
 
?
p

x =
0 ,
 
0
?
und berechnen dann nacheinander xp6 = 1 (3. Gleichung), xp3 = −3 (2. Gleichung), und xp1 = −4 (1.
Gleichung), also
 
−4
0
 
−3

xp = 
 0 .
 
0
1
164
Matrizen und lineare Abbildungen
Als nächstes brauchen wir n − k = 3 unabhängige Lösungen der homogenen Gleichung A0 x = 0. Wir
können die Koordinaten x2 , x4 , x5 frei wählen und dann die anderen drei Koordinaten ausrechnen. Also
setzen wir (als eine Möglichkeit)
 
 
 
?
?
?
1
0
0
 
 
 
? 2 ? 3 ?
,x =  ,x =  .
x1 = 
0
1
0
 
 
 
0
0
1
?
?
?
Jetzt müssen wir die Lücken auffüllen. Damit x1 , x2 , x3 ∈ LH
 
0
ist, berechnen wir nacheinander 0 an
0
Stelle von b0
x16 = 0,
x13 = −8,
x11 = −4.
x26 = 0,
x23 = −6,
x21 = −1.
x36 = 0,
x33 = 0,
x31 = −2.
Also
 
−4
0
 
−8
1

x =
 0 ,
 
1
0
 
−1
0
 
−6
2

x =
 1 .
 
0
0

−2
1
 
0
3

x =
 0 ,
 
0
0
Wir erhalten also die Menge der Lösungen von Ax = 0
  
 
 
−2
−1
−4



1
0
0









  
0
−6
−8




LH = λ1   + λ2   + λ3  
,
 0
1
0



0
0
 1


0
0
0

λ1 , λ2 , λ3 ∈ R
und die Menge der Lösungen von Ax = b
 
 
 
 
−4
−4
−1
−2


 

0
0
1
0



 
 
 

−3
 
 
 
 + λ1 −8 + λ2 −6 + λ3  0  ,
L = xp + LH = 






0


0
0
1
 








0
0
1
0



1
0
0
0















λ1 , λ2 , λ3 ∈ R








.







Beispiel 10.37 Beim Erhitzen auf über 400◦ C zersetzt sich Kaliumdichromat (K2 Cr2 O7 ) in Kaliumchromat (K2 CrO4 ), Chromoxid (Cr2 O3 ) und Sauerstoff (O2 ). Die Reaktionsgleichung lautet
x1 K2 Cr2 O7 → x2 K2 CrO4 + x3 Cr2 O3 + x4 O2
(10.16)
10.7
165
Lineare Gleichungssysteme
mit zunächst unbekannten Werten für x1 , x2 , x3 , x4 . (Man erwartet natürlich ganzzahlige Werte ≥ 0.) Für
die drei beteiligten Elemente gelangt man zu den Gleichungen
K : 2x1
Cr : 2x1
O : 7x1
= 2x2
= x2 + 2x3
= 4x2 + 3x3 + 2x4
Dazu äquivalent ist das homogene LGS in Matrizenschreibweise


 
2 −2
0
0
0
 2 −1 −2
 0  .
0 
7 −4 −3 −2
0
(10.17)
Durch schrittweise elementare Umformungen nach dem bekannten Schema erhält man daraus nacheinander


 
1 −1
0
0
0
 2 −1 −2
 0  ,
0 
7 −4 −3 −2
0


 
1 −1
0
0
0
 0
 0  ,
1 −2
0 
0
3 −3 −2
0


 
1 −1
0
0
0
 0
 0  ,
1 −2
0 
0
0
3 −2
0
und schließlich die Zeilenstufenform

 

1 −1
0
0
0
 0  .
 0
1 −2
0 
0
0
0
1 − 23
 
0
Wir sehen, dass wir den Ergebnisvektor  0  gar nicht hätten mitschleppen müssen, da er sich bei den
0
elementaren Umformungen nicht verändert.
Wir können jetzt x4 6= 0 frei wählen. Mit x4 = 1 erhalten wir x3 = 32 , x2 = 43 , x1 = 34 .
Das ist nicht ganz, was wir wollten. Schließlich geht es um ganze Moleküle, die ineinander umgewandelt
 4 

werden. Aber mit dem erhaltenen Lösungsvektor 

3
4
3
2
3

 ist auch jedes skalare Vielfache eine Lösung.

1
Die Theorie liefert, dass ein LGS mit ausschließlich rationalen Koeffizienten auch einen Lösungsvektor
mit ausschließlich rationalen Koordinaten besitzt und ein solcher auch bei dem verwendeten modifizierten
Gauß-Verfahren herauskommt. Multipliziert man mit dem Hauptnenner der auftretenden Brüche, so erhält
man einen ganzzahligen Lösungsvektor. Gegebenenfalls muss man noch mit −1 multiplizieren und durch
einen gemeinsamen Teiler der Koordinaten dividieren.
Beim hier betrachteten Beispiel genügt es, den Lösungsvektor mit dem Hauptnenner 3 zu multiplizieren.
Man erhält daraus als Reaktionsgleichung
4 K2 Cr2 O7 → 4 K2 CrO4 + 2 Cr2 O3 + 3 O2 .
(10.18)
166
Matrizen und lineare Abbildungen
Kapitel 11
Eigenwerte und Determinanten
Ein Eigenvektor einer quadratischen Matrix A ist ein Vektor x, sodass Ax ein Vielfaches von x ist, also in
die selbe Richtung zeigt, aber (möglicherweise) eine andere Länge hat. Der Faktor, um den Ax und x sich
unterscheiden, heißt Eigenwert von A. Eigenwerte und Eigenvektoren sind extrem wichtige Begriffe der
linearen Algebra. Wir wollen sie in Zusammenhang mit Determinanten bringen, das sind Volumenformen,
die auch als Kriterium für die Invertierbarkeit einer Matrix dienen. Der Zusammenhang wird durch das so
genannte charakteristische Polynom geliefert. Schließlich wollen wir als Hauptanwendung die Hauptachsentransformation durchführen.
11.1
Determinanten
Eine n × n–Matrix A ist nach Satz 10.15
genau dann invertierbar, wenn die Spaltenvektoren linear unx1 y1
abhängig sind. Für 2 × 2–Matrizen A =
ist dies der Fall, wenn
x2 y2

x1
Bei 3 × 3–Matrizen A = x2
x3
det(A) := det(x, y) = hx⊥ , yi =
6 0.

y 1 z1
y2 z2  ist dies genau dann der Fall, wenn
y 3 z3
det(A) := det(x, y, z) = hx × y, zi =
6 0
ist.
Wir wollen nun für größere n × n–Matrizen eine Determinante definieren, die uns den Test auf Invertierbarkeit erleichtert. Für A ∈ M (n, n) und k, l ∈ {1, . . . , n} definieren wir die Matrix Ak,l ∈ M (n − 1, n − 1),
die durch Streichen der k–ten Zeile und l–ten Spalte aus A entsteht.


a1,1
···
a1,l−1
a1,l+1
···
a1,n
 ..
..
..
.. 
 .
.
.
. 




a
·
·
·
a
a
·
·
·
a
k−1,1
k−1,l−1
k−1,l+1
k−1,n 
k,l

A =
.
a
·
·
·
a
a
·
·
·
a
k+1,1
k+1,l−1
k+1,l+1
k+1,n


 .
..
..
.. 
 ..
.
.
. 
an,1
· · · an,l−1
an,l+1
· · · an,n
167
168
Eigenwerte und Determinanten
Definition 11.1 (Determinante) Die Determinante einer n × n–Matrix A wird rekursiv definiert durch
det(A) = a1,1 ,
n = 1,
n
X
det(A) =
(−1)k+l ak,l det(Ak,l ),
für jedes k = 1, . . . , n,
falls n > 1.
(11.1)
l=1
Der Wert hängt nicht von der Wahl von k ab.
Gleichwertig ist
det(A) =
n
X
(−1)k+l ak,l det(Ak,l ),
für jedes l = 1, . . . , n.
(11.2)
k=1
Der Wert hängt nicht von der Wahl von l ab. (11.1) und (11.2) heißen die Entwicklung von det(A) nach
der k–ten Zeile beziehungsweise nach der l–ten Spalte.
Praktisch wird man zur Berechnung einer Determinante so vorgehen, dass man sich eine Zeile oder Spalte
sucht, in der möglichst viele Nullen stehen, damit die Arbeit gering wird.
a11 a12
Beispiele 11.2
(i) det
= a11 det(a22 ) − a12 det(a21 ) = a11 a22 − a21 a12 . Das ist die
a21 a22
bekannte Determinante für 2 × 2–Matrizen.
(ii) Um die Determinante einer 3 × 3–Matrix

a11
A = a21
a31
zu berechnen gehen wir so vor:
a22 a23
A1,1 =
,
a32 a33
A1,2 =
a12
a22
a32

a13
a23 
a33
a23
,
a33
a21
a31
A1,3 =
a21
a31
a22
.
a32
Dann ist
det(A) = a11 det(A1,1 ) − a12 det(A1,2 ) + a13 det(A1,3 )
= a11 [a22 a33 − a32 a23 ] − a12 [a21 a33 − a31 a23 ] + a13 [a21 a32 − a31 a22 ]
= a11 a22 a33 + a12 a23 a31 + a13 a21 a32 − [a11 a23 a32 + a12 a21 a33 + a13 a22 a31 ].
Das ist die bekannte Gartenzaunregel für Determinanten von 3×3–Matrizen (vergleiche Lemma 9.36).
(iii)

2
6
A=
2
3
0
2
0
0
7
0
1
5

6
3
.
8
9
11.2
169
Eigenwerte
Entwicklung nach der zweiten Spalte:
A2,2

2
= 2
3
7
1
5

6
8
9
und
det(A2,2 ) = 18 + 168 + 60 − [80 + 126 + 18] = 22.
Also ist
det(A) = (−1)2+2 · 2 · 22 = 44.
Satz 11.3 Seien A, B ∈ M (n, n). Dann ist
det(AT ) = det(A)
det(AB) = det(A) det(B)
det(A) 6= 0
⇐⇒
A ∈ GL(n)
1
, falls A ∈ GL(n).
det(A−1 ) =
det(A)
Ist A orthogonal, so ist | det(A)| = 1.
e bezüglich
Korollar 11.4 Sei L : Rn → Rn linear mit Darstellungsmatrizen A bezüglich der Basis B und A
e
der Basis B. Dann gilt
e = det(A).
det(A)
e so ist nach Satz 10.32
Beweis Setzen wir S := B −1 B,
e = S −1 AS,
A
also (weil nach dem vorangehenden Satz det(S −1 ) = 1/ det(S))
e = det(S −1 ) det(A) det(S) = det(A).
det(A)
2
Satz 11.5 Ist A eine obere (oder untere) Dreiecksmatrix (z.B. eine Diagonalmatrix), so ist
det(A) = a11 a22 · · · ann .
11.2
Eigenwerte
Beispiel 11.6 Hauptachsen der freien Rotation Ein Molekül bestehe aus n Atomen mit Massen m1 , . . . , mn
an den Orten z 1 , . . . , z n ∈ R3 . Die Gesamtmasse sei mit M = m1 + . . . + mn bezeichnet. Um welche
Achsen ist eine freie Rotation des Moleküls möglich?
Eine Drehachse muss notwendig durch den Schwerpunkt
S :=
n
1 X
mi z i
M
l=1
170
Eigenwerte und Determinanten
gehen. Wir setzen rl = z l − S für die Position relativ zum Schwerpunkt. Beschreibt nun die Richtung des
Vektors w ∈ R3 die Drehachse (mit Rotation im Uhrzeigersinn) und die Länge |w| die Winkelgeschwindigkeit, so heißt die Größe
n
X
L(w) := −
ml rl × (rl × w)
(11.3)
l=1
der Drehimpuls der Rotation. Aus physikalischen Gründen, die hier nicht näher erläutert werden sollen, ist
eine freie Rotation genau entlang derjenigen Achsen möglich, für die L(w) die selbe Richtung wie w hat,
das heißt, wenn es ein λ ∈ R gibt mit
L(w) = λw.
Wie findet man diese Richtungen heraus? Das Kreuzprodukt mit r hat nach Beispiel 10.21(v) als lineare
Abbildung bezüglich der Standardbasis die Darstellungsmatrix


0
−r3 r2
0
−r1  .
Ar =  r3
−r2 r1
0
Setzen wir
r22 + r32
r
r
r
B := −A · A =  −r1 r2
−r1 r3

und
J :=
n
X
−r1 r2
r12 + r32
−r2 r3

−r1 r3
−r2 r3  ,
r12 + r22
ml B rl ,
(11.4)
l=1
so ist
L(w) = Jw.
Die symmetrische Matrix J heißt der Trägheitstensor des Moleküls.
Wir müssen Lösungen w und λ finden von
Jw = λw.
Davon handelt dieser Abschnitt. Es wird sich zeigen, dass es im allgemeinen nur drei zueinander senkrechte
Hauptrichtungen gibt, in denen eine freie Rotation möglich ist. Die Physik lehrt, dass nur in zwei dieser
Richtungen die freie Rotation stabil ist, also tatsächlich beobachtbar ist.
Im folgenden sei stets A ∈ M (n, n) eine quadratische Matrix.
Definition 11.7 (Eigenwerte) Eine Zahl λ ∈ R heißt Eigenwert von A, falls es ein x ∈ Rn , x 6= 0, gibt
mit
Ax = λx.
x heißt dann Eigenvektor von A zum Eigenwert λ. Die Menge
Eλ = {x ∈ Rn : Ax = λx}
der Eigenvektoren zum Eigenwert λ ist ein Untervektorraum von Rn und heißt Eigenraum zum Eigenwert
λ. Speziell heißt E0 der Kern von A. Die Menge
spec(A) = {λ ∈ R : λ ist Eigenwert von A}
heißt das Spektrum von A.
11.2
171
Eigenwerte
Beispiel 11.8 A =
−1 5
. Dann ist
5 −1
1
4
1
A
=
=4
1
4
1
und
−6
1
= −6
.
6
−1
1
1
1
Also ist
Eigenvektor zum Eigenwert 4, E4 = α
, α ∈ R und
Eigenvektor zum Eigen1
1
−1
1
wert −6, E−6 = α
, α ∈ R . Es ist spec(A) = {−6, 4}.
−1
A
1
−1
=
Dass A keine weiteren Eigenwerte besitzen kann, ist eine Konsequenz des folgenden Satzes.
Satz 11.9 Sei A ∈ M (n, n) symmetrisch, sowie µ 6= λ Eigenwerte von A. Sind x ∈ Eµ und y ∈ Eλ , so
ist x ⊥ y.
Für nicht–symmetrische A ist dies im Allgemeinen falsch.
Beweis Nach Bemerkung 10.26(iv) ist hx, Ayi = hAx, yi, also
λhx, yi = hx, Ayi = hAx, yi = µhx, yi.
2
Wegen λ 6= µ ist hx, yi = 0.
Wie bestimmt man nun die Eigenwerte praktisch?
Definition 11.10 Das Polynom
λ 7→ χA (λ) = det(A − λIn )
heißt das charakteristische Polynom von A. Es ist ein Polynom vom Grad n.
Es ist Ax = λx genau dann, wenn (A − λIn )x = 0. Hierfür gibt es genau dann eine Lösung x 6= 0, wenn
A − λIn nicht invertierbar ist (siehe Satz 11.3). Also haben wir den folgenden Satz.
Satz 11.11 λ ist Eigenwert von A genau dann, wenn χA (λ) = 0.
Um die Eigenwerte zu bestimmen, müssen wir also nur die Nullstellen des charakteristischen Polynoms
ausrechnen. Um die Dimension der Eigenräume zu bestimmen, hilft der folgende Satz.
Satz 11.12 Ist
χA (λ) = (λ − λ1 )n1 · · · (λ − λk )nk
die Zerlegung des charakteristischen Polynoms in Linearfaktoren (Fundamentalsatz der Algebra!), so ist
für jedes i = 1, . . . , k
λi ∈ R
⇐⇒
λi ∈ spec(A)
und in diesem Fall gilt
1 ≤ dim(Eλi ) ≤ ni .
172
Eigenwerte und Determinanten
Wir kommen jetzt zum Hauptsatz dieses Kapitels.
Satz 11.13 (Hauptachsentransformation) Ist A ∈ M (n, n) symmetrisch, so gilt
(i) Alle Eigenwerte λi sind reell.
(ii) dim(Eλi ) = ni , i = 1, . . . , k.
(iii) Es gibt eine Orthonormalbasis bλi ,j , i = 1, . . . , k, j = 1, . . . , ni aus Eigenvektoren zu den Eigenwerten λi .
(iv) Ist B die Matrix mit Spaltenvektoren (bλi ,j , j = 1, . . . , ni ), i = 1, . . . , k, so ist
B −1 AB = diag λ1 , . . . , λ1 , . . . , λk , . . . , λk .
| {z }
| {z }
n1 -mal
nk -mal
Die Aussage des Satzes lässt sich kurz auch so ausdrücken: Ist A eine symmetrische Matrix und LA die
lineare Abbildung LA : x 7→ Ax, so gibt es eine Orthonormalbasis B = (b1 , . . . , bn ), sodass die Darstellungsmatrix von LA bezüglich B eine Diagonalmatrix ist.
1 −1
Beispiel 11.14 A =
.
−1
1
1−λ
−1
χA (λ) = det
= (1 − λ)2 − (−1)2 = λ(λ − 2).
−1
1−λ
Also ist
spec(A) = {0, 2}.
λ1 = 0,
n1 = 1.
λ2 = 2,
n2 = 1.
Die Orthonormalbasis aus Eigenvektoren ist
1 1
1,1
b =√
,
2 1
Also
1
B=√
2
Mit der Cramér’schen Regel bekommen wir
b
2,1
1
=√
2
1
.
−1
1
1
.
1 −1
1 −1 −1
B −1 = √
.
1
2 −1
1 −1 −1
1 −1
1
1
B −1 AB =
1
−1
1
1 −1
2 −1
1 −1 −1
0
2
=
1
0 −2
2 −1
1 0
0
0
0
=
=
= diag(0, −2).
0 −2
2 0 −4
11.2
173
Eigenwerte
Beispiel 11.15
− 21
− 52
 5
A=
− 2
− 12
−2
−2


−2

−2
.
−1
Dann ist
 1
−2 − λ

5
χA (λ) = det(A − λI3 ) = det 
 −2
−2
=
−
− 52
− 21 − λ
−2
−2


−2 

−1 − λ
1
1
1
1
25
− λ − − λ (−1 − λ) − 10 − 10 −
− − λ 4 + (−1 − λ) + 4 − − λ
2
2
2
4
2
= −λ3 − 2λ2 + 13λ − 10.
Eine Nullstelle kann man raten: λ1 = 1 ist Nullstelle. Polynomdivision ergibt
χA (λ)
= −λ2 − 3λ + 10.
λ−1
Quadratische Ergänzung liefert die Nullstellen
λ2 = 2,
λ3 = −5.
Also ist
spec(A) = {1, 2, −5}.
Wir müssen noch die Eigenvektoren finden. Zunächst müssen wir für den Eigenwert λ1 = 1 eine Lösung
von (A − I3 )x = 0 bestimmen. Es ist
 3

− 2 − 52 −2

 5
3

A − I3 = 
− 2 − 2 −2 .
−2 −2 −2
Elementare Zeilenumformungen liefern die Zeilenstufenform


1 0 21
0 1 1  .
2
0 0 0
Also ist ein Eigenvektor zum Eigenwert λ1 = 1 gegeben durch
 
−1
x1 = −1 .
2
Analog behandeln wir die beiden anderen Eigenwerte
 5
−2
 5
A − 2I3 = 
− 2
−2
− 52
− 52
−2

−2

−2
.
−3
174
Eigenwerte und Determinanten
Elementare Zeilenumformungen liefern

1
0
0
1
0
0

0
1 .
0
 
−1
Also ist x2 =  1 Eigenvektor zum Eigenwert λ2 = 2.
0
 9
− 52
2
 5
9
A + 5I3 = 
2
− 2
−2

−2

−2
.
−2
4
Elementare Zeilenumformungen liefern

1
0
0

0 −1
1 −1 .
0
0
 
1
Also ist x3 = 1 Eigenvektor zum Eigenwert λ3 = −5. Normieren liefert
1
√
√ 
 1√
− 6 6 − 12 2 13 3
 1√
√
√ 
1
1

B=
2 2
3 3 
− 6 6
√
√
1
0 13 3
3 6
ist eine Orthonormalbasis aus Eigenvektoren.
B −1
√
 1√
− 6 6 − 61 6
 1√
√
1
= BT = 
2 2
− 2 2
√
√
1
1
3 3
3 3
√ 
6

0 
.
√
1
3 3
1
3
Also (nach Satz 11.13)

1
B −1 AB = . . . = 0
0

0 0
2 0 .
0 −5
Beispiel 11.16 Sei
 8
2 2 
−
9 9 
 9


5 4 
 2
A = −
.
 9
9 9 


2
4 5
9
9 9
 
1
Dann ist A = I − nnT , wobei n = 31  2. Also ist A die Darstellungsmatrix der Projektion auf die
−2
Hyperebene
H = x ∈ R3 : hn, xi = 0 ⊂ R3 .
11.3
175
Der Quantenmechanische Harmonische Oszillator
Damit ist An = 0 und Ax = 1 für alle x ∈ H. Also sind die Eigenräume
E0 = Kern(A) = {µn, µ ∈ R} ,
E1 = H.
1
Wir können
aus Eigenvektoren ergänzen durch Raten von b2 :=
  nun b := n zu einer Orthonormalbasis
 
0
4
√
√
1
1 und b3 := b1 × b2 = 1 2 −1. Wir erhalten also
2
2
6
1
1
√ 
 1
2
0
3
3 2

√
√ 


B = (b1 , b2 , b3 ) =  32 12 2 − 61 2  .


√
√
1
2
1
−3 2 2
6 2
und
B −1 AB = diag(0, 1, 1).
11.3
Der Quantenmechanische Harmonische Oszillator
Quantenmechanisch wird ein Teilchen (in einer Dimension) durch eine Funktion repräsentiert in dem Vektorraum der quadratintegrablen reellen Funktionen
Z ∞
L2 (R) : ψ :
ψ(x)2 dx < ∞ .
(11.5)
−∞
Dieser Raum erhält ein Skalarprodukt durch
Z
∞
hφ, ψi :=
φ(x)ψ(x) dx
(11.6)
−∞
und entsprechend eine Norm (Länge von Vektoren)
kψk :=
p
hψ, ψi.
Der Zustand eines Teilchens ist nun eine normierte Wellenfunktion ψ ∈ L2 (R) mit kψk = 1. Dabei wird
ψ(x)2 interpretiert als die Wahrscheinlichkeit, das Teilchen im Ort x zu finden.
Im Fall des harmonischen Oszillators wird jedem Zustand eine Energie E zugeordnet durch
E = hψ, Hψi,
wobei
1 d2 ψ(x)
+ x2 ψ(x).
(11.7)
2 dx2
Die lineare Abbildung H : L2 (R) → L2 (R) heißt der Hamilton Operator des harmonischen Oszillators.
H ist symmetrisch in dem Sinne, dass
H(ψ) = −
hφ, Hψi = hHφ, ψi,
für alle φ, ψ.
Die reinen Zustände des Teilchens sind nach der quantenmechanischen Theorie die Eigenvektoren von H.
Der zugehörige Eigenwert ist dann gerade die Energie des Zustands. Wir suchen also nach Lösungen E und
ψ der so genannten Schrödinger Gleichung
Hψ = Eψ.
(11.8)
176
Eigenwerte und Determinanten
Ausformuliert heißt die zu lösende Gleichung also
−ψ 00 (x) + (x2 − 2E)ψ(x) = 0.
Wir machen den Ansatz
1
(11.9)
2
ψ(x) = P (x)e− 2 x ,
wobei P ein noch zu bestimmendes Polynom ist. Dann ist
1
2
ψ 00 (x) = [P 00 (x) − 2xP 0 (x) − P (x) + x2 P (x)]e− 2 x .
Also folgt aus (11.9)
P 00 (x) − 2xP 0 (x) + (2E − 1)P (x) = 0.
(11.10)
Die Lösungen dieser Differentialgleichung sind in der Theorie bekannt.
Satz 11.17 Die Differentialgleichung
h00n (x) − 2xh0n (x) + 2nhn (x) = 0
(11.11)
ist nur für ganzzahlige n ∈ N0 lösbar. Die Lösungen sind die Hermite Polynome, die definiert sind durch
h0 (x) = 1
h1 (x) = 2x
h2 (x) = 8x2 − 2
h3 (x) = 8x3 − 12x
..
.
hn (x) = 2xhn−1 (x) − 2(n − 1)hn−2 (x).
(11.12)
Es kommen also nur die Energieniveaus En := n + 21 , n ∈ N0 in Frage. Die zugehörigen (auf 1 normierten)
Zustände (Eigenvektoren) lauten demnach
ψn (x) = p√
Es ist also
spec(H) =
1
π 2n n!
1
2
hn (x)e− 2 x .
(11.13)
1
n + , n = 0, 1, 2, . . . .
2
Tatsächlich sind nur Differenzen dieser Energieniveaus als Frequenzen des ausgesandten Lichts in einem
Spektrometer beobachtbar. Daher erklärt sich die Bezeichnung Spektrum“ für die Eigenwerte von linearen
”
Abbildungen.
Kapitel 12
Lineare Differentialgleichungen mit
konstanten Koeffizienten
Wir untersuchen in diesem Kapitel, wie wir mit Hilfe des Matrizenkalküls lineare Systeme gekoppelter Differentialgleichungen erster Ordnung sowie lineare Differentialgleichungen höherer Ordnung systematisch
lösen können. Dabei werden letztere auf den Fall der Systeme von Differentialgleichungen erster Ordnung
zurückgeführt.
12.1
Systeme erster Ordnung
Wir betrachten eine Folge von Reaktionen erster Ordnung A −→ B −→ C. Sei
y1 (t) =
y2 (t) =
y3 (t) =
Konzentration von Stoff A zur Zeit t,
Konzentration von Stoff B zur Zeit t,
Konzentration von Stoff C zur Zeit t.
Die Reaktionskonstanten sind k1 > 0 und k2 > 0. Dann können wir die Differentialgleichungen aufstellen
y10 (t) =
y20 (t) =
y30 (t) =
Wir führen die kompakte Notation ein


y1 (t)
y(t) = y2 (t) ,
y3 (t)
−k1 y1 (t)
k1 y1 (t) − k2 y2 (t)
k2 y2 (t)
(12.1)


−k1
0 0
A =  k1 −k2 0  .
0
k2 0
Damit wird aus (12.1)
y 0 = Ay.
(12.2)
Formal können wir die Lösung angeben: y(t) = etA y(0). Problem: Die Exponentialfunktion etA definieren.
Wir gehen ganz formal vor und nehmen die Potenzreihe, die uns auch schon die reelle (und komplexe)
Exponentialfunktion definiert hat zur Grundlage.
177
178
Lineare Differentialgleichungen mit konstanten Koeffizienten
Definition 12.1 (Exponentialfunktion für Matrizen) Sei A ∈ M (n, n) und t ∈ R. Dann definieren wir
als die Exponentialfunktion von tA die n × n–Matrix
etA = exp(tA) =
∞ n n
X
t A
.
n!
n=0
Dabei ist An = A · An−1 = A
· · A} die n–te Matrixpotenz und A0 = In die Einheitsmatrix.
| ·{z
n–mal
(i) e(t+s)A = etA esA
Satz 12.2 (Eigenschaften der Exponentialfunktion)
(ii) AetA = etA A.
(iii) etA ∈ GL(n) und (etA )−1 = e−tA .
(iv) Gilt AB = BA, so ist eA+B = eA eB , sowie AeB = eB A und BeA = eA B.
(v) exp(S −1 AS) = S −1 exp(tA)S, falls S ∈ GL(n).
(vi) Ableitung:
d tA
dt e
= AetA (koordinatenweise).
Z
(vii) Ist A ∈ GL(n), so ist
t
erA dr = A−1 (etA − esA ) = (etA − esA )A−1 .
s
Beispiele 12.3
(i) A =
2
0
0
. Dann ist
3
0
A =
9
8 0
3
A =
0 27
..
.
n
2
0
An =
.
0 3n
2
4
0
Also ist
tA
e
∞
∞ n n
X
X
t A
=
=
n!
n=0
n=0
(2t)n
n!
0
0
(3t)n
n!
!
=
(ii) Allgemeiner als in (i) ist für A =diag(λ1 , . . . , λn )
etA = diag(etλ1 , . . . , etλn ).
e2t
0
0
e3t
!
.
(12.3)
12.1
179
Systeme erster Ordnung
(iii) Sei A =
0 −1
1
0
. Dann ist
−1
0
A =
0 −1
0 1
3
A =
−1 0
1 0
4
A =
0 1
2
A4n+k = Ak .
Also ist die (1,1)– Koordinate von An
n
(−1)n/2 ,
0,
(A )1,1 =
n gerade,
n ungerade.
Damit ist
(etA )1,1 =
∞
X
(−1)n
n=0
t2n
= cos(t).
n!
(12.4)
Die anderen Einträge erhält man analog (Übung!)
etA =
cos(t) − sin(t)
.
sin(t)
cos(t)
Also ist etA die Drehmatrix in der Ebene.
(iv) Seien µ, λ ∈ R und A =
λ
0
µ
. Dann ist
λ
2
λ2
0
λ3
0
2λµ
λ2
3λ2 µ
λ3
λn
0
nλn−1 µ
.
λn
A =
3
A =
..
.
An =
Also ist
tA
e
=
eλt
0
µ t eλt
.
eλt
(12.5)
180
Lineare Differentialgleichungen mit konstanten Koeffizienten

λ
(v) Sei λ ∈ R und A =  0
0
1
λ
0

0
1 . Dann ist
λ
 2
λ
A2 =  0
0
 3
λ
A3 =  0
0
 4
λ
A4 =  0
0
..
.
 n
λ


An =  0

0
Also ist


0
2λ
λ2
2λ
λ2
0
3λ2
λ3
0
4λ3
λ4
0

3λ
3λ2 
λ3

6λ2
4λ3 
λ4
n
2
nλn−1
0

etA = 
0
0
λn−2



nλn−1  .

λn
λn
eλt
1 2 λt
2t e
teλt


teλt 
.
eλt
eλt
(12.6)
0
e = 1 11 −2 . Statt hier die Potenzen von A
e direkt auszurechnen, können wir uns zu
(vi) Sei A
5 −2
14
e diagonalisieren (vergleiche BeiNutze machen, dass die Matrix symmetrisch ist. Wir können also A
spiel 10.33):
e = S −1 AS
A
wo die orthogonale Matrix S gegeben ist durch
√ 5 2 1
S=
und
5 −1 2
S
−1
√ 5 2 −1
=
5 1 2
und die Diagonalmatrix A durch
A=
Also ist
e
tA
e
(vii) Seien A =
λ
0
=S
1
e S=
5
−1 tA
2
0
0
.
3
2t
2 −1
e
1 2
0
0
e3t
2
−1
1
2
!
e2t + e3t
−2e3t + 2e2t
1
=
.
5 −2e3t + 2e2t
e2t + 4e3t
0
0 0
und B =
. Dann ist AB = 0 = BA. Also ist
0
0 µ
λ
λ
1 0
e
0
e
0
eA+B =
=
= eA · eB .
0 eµ
0 eµ
0 1
(12.7)
12.1
181
Systeme erster Ordnung
Wir kommen nun wieder zu unseren Differentialgleichungen zurück.


y1 (t)


Definition 12.4 Sei A ∈ M (n, n) und b ∈ Rn sowie t 7→ y(t) =  ...  differenzierbar. Die Gleichung
yn (t)
y 0 (t) = Ay(t) + b
(12.8)
heißt System von n linearen Differentialgleichungen (DGL). Das System heißt homogen, falls b = 0. y
heißt Lösung des Anfangswertproblems (AWP) (12.8), (12.9), falls (12.8) und
y(t0 ) = y 0
(12.9)
gilt.
Satz 12.5 Das AWP (12.8), (12.9) besitzt die eindeutige Lösung
Z t
y(t) = e(t−t0 )A y 0 +
e(t−s)A b ds.
(12.10)
t0
Ist speziell b = 0, so gilt
y(t) = e(t−t0 )A y 0 .
(12.11)
Ist A invertierbar (und b 6= 0), so kann man das Integral ausrechnen und erhält
y(t) = e(t−t0 )A y 0 + A−1 b − A−1 b.
(12.12)
2
Beweis Ableiten nach t!
Beispiel 12.6 Sei folgendes AWP gegeben
y10 (t) = 2y1 (t)
y20 (t) =
+3y2 (t) + 1
2y2 (t) + 2
y1 (0) = −1
y2 (0) = 4.
Das fassen wir zusammen als
y 0 = Ay + b,
wo
2
0
3
,
2
−1
1
2
− 34
0
1
2
A=
b=
y(0) = y 0 ,
1
,
2
y0 =
−1
.
4
Es ist dann (Cramér’sche Regel)
A
=
!
−1
und A
b=
sowie (siehe (12.5))
exp(tA) =
e2t
0
3te2t
.
e2t
−1
1
182
Lineare Differentialgleichungen mit konstanten Koeffizienten
Das setzen wir in (12.12) ein (mit t0 = 0) und erhalten
tA
y(t) = e
−1
−1
−1
=
+
+
4
1
1
1 − 2e2t + 15te2t
!
−1 + 5e2t
.
Beispiel 12.7 Wir lösen jetzt das Problem, das wir am Eingang zur diesem Abschnitt betrachtet hatten.
Dabei ist b = 0 und


−k1
0
0
A =  k1 −k2 0 .
0
k2 0
Wir berechnen nacheinander die Matrixpotenzen und erhalten die allgemeine Formel
k1n


 k1 ((−k )n − (−k )n )
An =  k2 −k
1
2
1

k1 (−k2 )n −k2 (−k1 )n
k2 −k1

0
0
k2n

0
.

1
−(−k2 )n
Also ist



etA = 

e−tk1
0
k1 e−tk1 −k2 e−tk2
k2 −k1
e−tk2
ke−tk2 −k2 e−tk1
k2 −k1
+1
1 − e−tk2
0



0 .

1
Wir erhalten also für die einzelnen Konzentrationen
y1 (t) = e−(t−t0 ) y1 (t0 )
y2 (t) =
k1 e−(t−t0 )k1 − k2 e−(t−t0 )k2
y1 (t0 ) + e−(t−t0 )k2 y2 (t0 )
k2 − k1
y3 (t) =
12.2
k1 e−(t−t0 )k2 − k2 e−(t−t0 )k1
+ 1 y1 (t0 ) + 1 − e−(t−t0 )k2 y2 (t0 ) + y3 (t0 ).
k2 − k1
Gleichungen höherer Ordnung
Zur Erinnerung: Eine lineare DGL, die neben der ersten Ableitung y 0 von y auch noch höhere Ableitungen
y 00 = y (2) , y 000 = y (3) , . . . , y (n) enthält
y (n) = c0 + c1 y + c2 y (1) + . . . + cn y (n−1) ,
(12.13)
wobei c0 , c1 , . . . , cn ∈ R fest sind, heißt lineare Differentialgleichung der Ordnung n mit konstanten
Koeffizienten. Die DGL heißt homogen, falls c0 = 0. Die Lösung der DGL wird eindeutig durch die
Angabe von
y(t0 ) = y 1 , . . . , y (n−1) (t0 ) = y n .
(12.14)
12.2
183
Gleichungen höherer Ordnung
Zur Lösung des Anfangswertproblems (12.13), (12.14) schreiben wir (12.13) um. Wir definieren Y (t) ∈ Rn
durch
Y1 (t) := y(t)
Y2 (t) := y 0 (t)
..
.
Yn (t) := y (n−1) (t).
Dann (12.13) gleichwertig zu

 
  (1)
y (t)
Y2 (t)
Y10 (t)

 

 
..
..
..

 

 
.
.
.
Y 0 (t) = 
.
=
=
0

Yn−1
Yn (t)
(t) y (n−1) (t) 
c0 + c1 Y1 (t) + . . . + cn Yn (t)
Yn0 (t)
y (n) (t)

(12.15)
Also ist Y die Lösung einer linearen DGL erster Ordnung
Y 0 (t) = AY (t) + b,
wobei (alle freien Felder sind 0)

0



A=


c1
1
0
c2
(12.16)

1
..
.
 
0
 .. 
 
b =  . .
0
c0



,

1
cn
..
.
0
· · · cn−1
(12.17)
Wir erhalten also die Lösung des AWP (12.13), (12.14) durch
y(t) = Y1 (t),
wo
Y (t) = e(t−t0 )A Y (t0 ) +
Z
t
e(t−s)A b ds.
t0
Beispiel 12.8 Wir betrachten die DGL zweiter Ordnung
y 00 (t) = 2 − y(t)
mit Anfangswert
y 0 (0) = 0,
Es ist also c2 = 0, c1 = −1, c0 = 2 und damit
0
A=
−1
y(0) = 1.
1
,
0
b=
0
.
2
Wir erhalten
etA =
cos(t)
− sin(t)
sin(t)
cos(t)
(12.18)
184
Lineare Differentialgleichungen mit konstanten Koeffizienten
und
Z
t
e(t−s)A b ds =
0
Z
t
esA b ds =
Z t
0
0
Z t
=
0
Damit ist
cos(s)
− sin(s)
sin(s)
0
ds
cos(s)
2
2 sin(s)
1 − cos(t)
ds = 2
.
2 cos(s)
sin(t)
1 − cos(t)
2 − cos(t)
tA 1
Y (t) = e
+2
=
,
0
sin(t)
sin(t)
und
y(t) = Y1 (t) = 2 − cos(t).
Beispiel 12.9 Wir betrachten die Differentialgleichung dritter Ordnung
y 000 = −1 + 3y + y 0 − 3y 00
(12.19)
mit Anfangswert
y(0) = 4,

y 0 (0) = y 00 (0) = 0.
(12.20)

y
Wir haben also Y =  y 0  und
y 00
Y 0 = AY + b,
wobei

0
A = 0
3

1
0
0
1 ,
1 −3
Y (0) = Y 0 ,

0
b =  0 ,
−1
 
4
Y 0 = 0 .
0

(12.21)
Das Charakteristische Polynom von A ist
χA (λ) = det(A − λI) = −λ3 − 3 λ2 + λ + 3
Wir raten die Nullstelle λ1 = 1 und erhalten per Polynomdivision und quadratischer Ergänzung die anderen
Nullstellen λ2 = −1 und λ3 = −3. Wir können jetzt nach Schema F vorgehen und zunächst die Matrix
F = (f 1 , f 2 , f 3 ) der Eigenvektoren bestimmen:
 3

− 21 − 41


4
1
1
1



1
1 
F = 1 −1 −3 ,
F −1 =  38
2
8 .


1
1
9
1
− 81
0
8
Damit ist
und


1 0
0
F −1 AF = D := 0 −1 0 
0 0 −3
exp(tA) = F exp(tD)F −1
 3 −t 1 −3t 3 t
−8e
+8e
4 e


=  38 et + 38 e−3t − 34 e−t

− 98 e−3t + 34 e−t + 38 et
1
2
et −
1
2
1
2
e−t +
1
2
et −
1
2
e−t
1
8
1
2
1
8
et
e−t
et +
1
8
e−3t −
1
4
e−t



e−t 

1 t
9 −3t
1 −t
−4e
8 e + 8 e
et −
3
8
e−3t +
1
4
12.2
185
Gleichungen höherer Ordnung
Es ist
A−1
und
Also ist
 1
−3

= 1
0
1
1
3
0
1

0
0
 1
−3
 
−1
A b =  0 .
0

11 −t 11 −3t 11 t 1
+
e + 
 4 e − 24 e
8
3



11
11
11
t
−3t
Y (t) = etA [Y 0 + A−1 b] − A−1 b = 
−
e−t 
 8 e + 8 e

4


 33

11
11
− e−3t +
e−t +
et
8
4
8

und damit
y(t) =
1 11 t 11 −t 11 −3t
+
e +
e −
e
3
8
4
24
(12.22)
Alternative Herleitung
Der mühselige Teil an diesem Vorgehen war natürlich die Berechnung von etA . Wenn wir uns das sparen
wollen, können wir folgende Überlegung anstellen: Da A die Eigenwerte 1, −1 und −3 hat, müssen die
Einträge von etA Summen von Termen der Art et , e−t und e−3t sein. Dann muss aber auch y(t) die Form
haben
y(t) = a + b et + c e−t + d e−3t
für gewisse Zahlen a, b, c, d ∈ R, die wir jetzt noch bestimmen müssen. Die Idee ist, dass in den Gleichungen alle konstanten Terme sowie alle Koeffizienten vor den Ausdrücke et , e−t und e−3t stets übereinstimmen müssen.
Zunächst einmal taucht der konstante Term a in keiner der Ableitungen y 0 , y 00 und y 000 auf. Also liefert die
DGL (12.19)
1
a= .
3
Jetzt berechnen wir noch die Ableitungen an der Stelle t = 0
 


b+c+d
y(0) − a
 y 0 (0)  = b − c − 3d .
b + c + 9d
y 00 (0)
Der Anfangswert (12.20) liefert also die lineare Gleichung

      1   11 
1 1
1
b
4
3
3
1 −1 −3  c  = 0 −  0  =  0  .
1 1
9
d
0
0
0
Die Lösung ist
b=
11
,
8
c=
11
,
4
d=−
11
.
24
186
Lineare Differentialgleichungen mit konstanten Koeffizienten
Also erhalten wir
y(t) =
1 11 t 11 −t 11 −3t
+
e +
e −
e
3
8
4
24
(12.23)
Aufgemerkt:
Hat der Eigenwert λi die Vielfachheit ni > 1 (taucht er also als Linearfaktor (λ − λi )ni im charakteristischen Polynom auf), so kann exp(tA) neben eλi t auch noch Terme der Art
teλi t , t2 eλi t , . . . , tni −1 eλi t
haben, die beim Ansatz berücksichtigt werden müssen.
Kapitel 13
Differentialrechnung von Funktionen
mehrerer Veränderlicher
Wir beginnen mit den grundlegenden Stetigkeits- und Differenzierbarkeitsbegriffen für Funktionen
f (x1 , . . . , xn ), die von n Veränderlichen abhängen. Wir lernen den Satz über die Vertauschbarkeit der
zweiten Ableitungen kennen (Satz von Schwarz). Danach führen wir die Taylorentwicklung bis zur zweiten
Ordnung durch. Damit ist das Fundament für die Bestimmung von Extremalstellen gelegt. Als Anwendung
bringen wir die Ausgleichsgerade der linearen Regression.
13.1
Partielle Ableitungen
Wir beginnen mit dem Begriff des Grenzwertes von Folgen in Rn .
Definition 13.1 Eine Folge von Vektoren (xN )N ∈N in Rn heißt konvergent gegen x ∈ Rn , falls (siehe
Definition 9.17) lim |xN − x| = 0. Wir schreiben dann
N →∞
x = lim xN .
N →∞
Lemma 13.2 Es gilt
x = lim xN
N →∞
genau dann, wenn die einzelnen Koordinaten konvergieren:
xi = lim xN
i ,
i = 1, . . . , n.
N →∞
Im gesamten restlichen Kapitel ist G ⊂ Rn ein Gebiet und f : G → R eine Abbildung mit n Veränderlichen.
Definition 13.3 (Stetigkeit) f heißt stetig, im Punkt a ∈ G, falls f (a) = limN →∞ f (xN ) für jede Folge
(xN ) in G mit a = lim xN . Wir schreiben dann auch
N →∞
f (a) = lim f (x).
x→a
f heißt stetig, falls f in jedem Punkt a ∈ G stetig ist.
187
188
Differentialrechnung von Funktionen mehrerer Veränderlicher
Beachte: Wegen Definition 3.21 und Satz 3.24 stimmt die hier gegebene Definition der Stetigkeit im Falle
n = 1 mit der aus Definition 3.2 überein.
Wir können die Funktion (x1 , . . . , xn ) 7→ f (x1 , . . . , xn ) als Funktion nur der i-ten Koordinate auffassen,
wenn wir die anderen Koordinaten festhalten. Dann können wir für die freie Koordinate die Ableitung
bestimmen.
Definition 13.4 (Partielle Ableitung) Sei ei der i-te Einheitsvektor. Wir definieren
f (x + hei ) − f (x)
h→0
h
f (x1 , . . . , xi−1 , xi + h, xi+1 , . . . , xn ) − f (x)
= lim
,
h→0
h
Di f (x) := lim
falls der Grenzwert existiert. Di f heißt dann die i-te partielle Ableitung von f in x. Existieren alle partiellen Ableitungen, so heißt f partiell differenzierbar in x. Ist f in jedem x ∈ G partiell differenzierbar, so
heißt f partiell differenzierbar. Ist die Abbildung x 7→ Di f (x) stetig für jedes i, so heißt f stetig partiell
differenzierbar. Wir schreiben auch C 1 (G) für die Menge der stetig partiell differenzierbaren Funktionen.
Andere gebräuchliche Schreibweisen sind
Di f (x) =
∂f
df (x)
=
(x) = fi (x).
dxi
∂xi
Beispiele 13.5
(i) G = R3 , f (x) = x1 x2 + 3x2 x23 . Dann ist D1 f (x) = x2 , D2 f (x) = x1 + 3x23 und
D3 f (x) = 6x2 x3 .
(ii) G = Rn , y ∈ Rn und f (x) := hy, xi. Dann ist Di f (x) = yi .
(iii) G = Rn , und f (x) := hx, xi. Dann ist Di f (x) = 2xi .
(iv) G = Rn \ {0}, und f (x) := |x| =
p
hx, xi. Dann ist (Kettenregel)
2xi
xi
Di f (x) = p
=
.
|x
2 hx, xi
i|
(v) G = R2 \ {0} und f (x) =
x2
|x|2
Dann ist
x1 x2
2x1 x2
=−
2
2
2
(x1 + x2 )
|x|4
|x1 |2 − 2x22
x2 − x2
= 1 4 2 :
2
2
2
(x1 + x2 )
|x|
D1 f (x) = −
D1 f (x) =
Oft ist es praktisch, die partiellen Ableitungen nicht nur einzeln zu betrachten, sondern in einem Vektor
zusammenzufasssen.
13.1
189
Partielle Ableitungen
Definition 13.6 (Gradient) Sei f ∈ C 1 (G). Wir definieren den Gradienten von f in x ∈ G als Vektor in
Rn durch


D1 f (x)


..
grad(f )(x) := ∇f (x) := 
.
.
Dn f (x)
(∇ spricht sich Nabla“.)
”
Die geometrische Interpretation ist, dass ∇f in die Richtung des steilsten Anstiegs von f zeigt und die
Länge |∇f | ebendiese steilste Steigung misst. Es gelten die folgenden Rechenregeln.
Satz 13.7 Seien f, g : G → R und H : R → R stetig partiell differenzierbar. Dann gilt
(i) Summenregel f + g ist stetig partiell differenzierbar mit Gradient
∇(f + g) = (∇f ) + (∇g).
(13.1)
(ii) Produktregel Das Produkt f g ist stetig partiell differenzierbar mit Gradient
∇(f g) = (∇f ) · g + f · ∇g.
(13.2)
(iii) Kettenregel H ◦ f ist stetig partiell differenzierbar mit Gradient
∇(H ◦ f )(x) = H 0 (f (x)) · ∇f (x).
Beispiele 13.8
(13.3)
(i) f (x) = hy, xi für ein festes y ∈ Rn . Dann ist ∇f (x) = y.
(ii) f (x) = |x|2 , ∇f (x) = 2x.
(iii) Ist A ∈ M (n, n) und f (x) = hx, Axi, so ist
Di f (x) =
n
n
k=1
`=1
X
df (x) X
=
Ai,k xk +
x` A`,i = ((A + AT )x)i ,
dxi
also
∇hx, Axi = (A + AT )x.
(13.4)
(iv) Ist A ∈ M (n, n) und f (x) = |Ax|, so ist (nach (iii) mit AT A statt A)
Di f (x) = Di
=
p
hAx, Axi =
Di hx, AT Axi
2|Ax|
((AT A + (AT A)T )x)i
(AT Ax)i
=
,
2|Ax|
|Ax|
weil (AT A)T = AT (AT )T = AT A. Also ist
∇|Ax| =
AT Ax
.
|Ax|
(13.5)
190
Differentialrechnung von Funktionen mehrerer Veränderlicher
2
(v) f (x) = e−|x−a| für ein festes a ∈ Rn . Dann ist
2
∇f (x) = −2(x − a)e−|x−a| .
Definition 13.9 (Richtungsableitung) Sei f ∈ C 1 (G) und x ∈ G, sowie v ∈ Rd fest gewählt. Wir setzen
g(t) = f (x + tv), t ∈ R. Dann heißt
Dv f (x) := g 0 (0) = lim
t→0
f (x + tv) − f (x)
t
die Richtungsableitung von f in Richtung v.
Die Richtungsableitungen können wir ganz bequem mit Hilfe der partiellen Ableitungen ausrechnen.
Lemma 13.10 Sei f ∈ C 1 (G). Dann ist
Dv f (x) = h∇f (x), vi =
n
X
Di f (x) · vi .
i=1
Satz 13.11 (Linearisierung) Sei f ∈ C 1 (G). Dann gilt für alle x ∈ G und y ∈ Rn (mit y + x ∈ G)
f (x + y) = f (x) + h(∇f )(x), yi + εx (y) · |y|,
wobei der der Fehlerterm εx in 0 stetig ist
lim εx (y) = 0.
y→0


 
0.9
1
Beispiel 13.12 Sei n = 3 und f (x) = log(|x|). Wir wollen f  0.2  durch Linearisierung um x = 0
0.05
 
0
 
1
1
1
annähern, denn f 0 = 0 können wir leicht ausrechnen. Es ist ∇f (x) = |x|x 2 , also ∇f 0 = 0
0
0
0
und damit
+

  *
  

−0.1
0.9
1
1
f  0.2  ≈ f 0 + ∇f 0 ,  0.2  = −0.1.
0.05
0
0
0.05


0.9
Der exakte Wert ist f  0.2  = log(0.92331) = −0.07979. Die Approximation war also nur mäßig gut.
0.05
13.2
Höhere partielle Ableitungen
Die partiellen Ableitungen Di f sind selber wieder Funktionen G → R, und wir können versuchen, diese
auch wieder abzuleiten.
Definition 13.13 Die Ableitungen der partiellen Ableitungen
Dji f (x) := Dj (Di f )(x) = Dj Di f (x),
i, j = 1, . . . , n,
13.2
191
Höhere partielle Ableitungen
heißen die zweiten partiellen Ableitungen von f . Sind diese stetige Funktionen G → R, so heißt f zweimal
stetig partiell differenzierbar und wir schreiben f ∈ C 2 (G).
Weitere Schreibweisen sind
d2 f (x)
∂2
=
f (x) = fji (x) = Dj (Di f )(x).
dxj dxi
∂xj ∂xi
Die n × n–Matrix (H f (x)ji )i,j=1,...,n = (Dji f (x))i,j=1,...,n heißt die Hesse–Matrix von f .
Satz 13.14 (Schwarz) Ist f ∈ C 2 (G), so ist die Hesse–Matrix H f (x) symmetrisch:
Dj Di f (x) = Di Dj f (x),
Beispiele 13.15
für alle i, j = 1, . . . , n.
(i) G = R2 , f (x) = x31 x2 + 3x2 ex1 . Dann ist
D1 f (x) = 3x21 x2 + 3x2 ex1 ,
D21 f (x) = 3x21 + 3ex1
sowie
D2 f (x) = x31 + 3ex1 ,
D12 f (x) = 3x21 + 3ex1 .
2
(ii) G = R3 und f (x) = sin(x1 ) cos(x2 ) + e−|x| . Dann ist
−2x1 e−|x|
2
D2 f (x) = − sin(x1 ) sin(x2 ) −2x2 e−|x|
2
−2x3 e−|x|
2
D1 f (x) = cos(x1 ) cos(x2 )
D3 f (x) =
2
D11 f (x) = − sin(x1 ) cos(x2 ) + 2(2x21 − 1) e−|x| ,
2
D21 f (x) = − cos(x1 ) sin(x2 ) +
4x1 x2 e−|x| ,
D31 f (x) =
4x1 x3 e−|x| ,
D12 f (x) = − cos(x1 ) sin(x2 ) +
4x1 x2 e−|x| ,
2
2
2
D22 f (x) = − sin(x1 ) cos(x2 ) + 2(2x22 − 1) e−|x| ,
2
D32 f (x) =
4x2 x3 e−|x| ,
D13 f (x) =
4x1 x3 e−|x| ,
D23 f (x) =
4x2 x3 e−|x| ,
D33 f (x) =
2(2x23 − 1) e−|x| .
2
2
2
Beispiel 13.16 Maxwell’sche Relationen der Thermostatik Wir betrachten die Energie E(S, V ) eines
Gases als Funktion der Entropie S und des Volumens V . Wir definieren Temperatur T und Druck p durch
∂E(S, V )
∂S
∂E(S, V )
p(S, V ) := −D2 E(S, V ) = −
.
∂V
T (S, V ) := D1 E(S, V ) =
192
Differentialrechnung von Funktionen mehrerer Veränderlicher
Wollen wir nun wissen, wie sich die Temperatur bei kleinen Veränderungen des Volumens verhält, so berechnen wir mit dem Satz von Schwarz
∂T (S, V )
= D2 T (S, V ) = D2 D1 E(S, V )
∂V
= D1 D2 E(S, V )
= −D1 p(S, V )
=−
(13.6)
∂p(S, V )
.
∂S
(13.6) ist eine der vier Maxwell’schen Relationen der Thermostatik.
Wir können für Funktionen mehrer Veränderlicher genauso eine Taylorentwicklung angeben, wie für Funktionen einer Veränderlicher. Allerdings werden die Ausdrücke sehr länglich. Deshalb beschränken wir uns
hier auf die Taylorformel zweiter Ordnung. Damit kommt man in den allermeisten Anwendungen hin. Außerdem ist sie sehr nützlich, um die Extremalstellen der Funktion zu untersuchen.
Satz 13.17 (Taylorformel 2. Ordnung) Sei f ∈ C 2 (G) und x ∈ G. Dann gilt für alle y ∈ Rn mit
x+y ∈G
1
f (x + y) = f (x) + h∇f (x), yi + hy, H f (x) · yi + εx (y) · |y|2
2
(13.7)
n
1 X
2
Di Dj f (x)yi yj + εx (y) · |y| ,
= f (x) + h∇f (x), yi +
2 i,j=1
wobei der Fehlerterm εx in 0 verschwindet
lim εx (y) = 0.
y→0
3
Beispiel 13.18 Wir
 wollen
 hier das Beispiel 13.12 fortsetzen, wo wirdieFunktion f : R → R, x 7→
0.9
1
log(|x|) in z =  0.2  ausrechnen wollten, indem wir f um x = 0 linear entwickelt hatten. Der
0.05
0
Gradient von f war ∇f (x) = |x|x 2 . Die zweiten Ableitungen bekommen wir durch die Quotientenregel
Di Dj f (x) = Di
xj
|x|2 1i=j − 2xi xj
=
.
|x|2
|x|4
 
1
Für den hier betrachteten Punkt x = 0 ist also die Hesse-Matrix
0
  
1
−1
H f 0 =  0
0
0
0
1
0

0
0 .
1
13.3
193
Extremalstellen


−0.1
Die Taylorformel zweiter Ordnung liefert nun (mit y = z − x =  0.2 )
0.05


  *  

*−0.1 −1
0.9
1
1
−0.1 +
1
 0.2  ,  0
f  0.2  ≈ f 0 + 0 ,  0.2  +
2
0.05
0
0.05
0
0
0.05
= 0 − 0.1 +
0
1
0


0
−0.1 +
0  0.2 
1
0.05
1
−(0.1)2 + (0.2)2 + (0.05)2 = −0.08375.
2
Den exakten Wert hatten wir oben schon ausgerechnet als −0.07979. Die Approximation zweiten Grades
ist also deutlich besser als die lineare Approximation, die den Wert −0.1 ergeben hatte.
13.3
Extremalstellen
Definition 13.19 (Extremalstellen) Ein Punkt x ∈ G heißt lokale Minimalstelle von f , wenn es ein ε > 0
gibt, sodass
f (y) ≥ f (x) für alle y ∈ G mit |y − x| < ε.
(13.8)
Eine Minimalstelle heißt isoliert, wenn in (13.8) die strikte Ungleichung f (y) > f (x) für y 6= x gilt.
Analog werden (isolierte) lokale Maximalstellen definiert und als Oberbegriff (isolierte) lokale Extremalstellen.
Sei f ∈ C 1 (G) und x eine lokale Extremalstelle von f . Dann ist für jedes v ∈ Rn die Null eine lokale
Extremalstelle von
gv (t) := f (x + tv).
Also ist
0 = gv0 (0) = Dv f (x) = h∇f (x), vi,
v ∈ Rn .
Mithin ist
∇f (x) = 0.
Definition 13.20 Ist ∇f (x) = 0, so heißt x eine kritische Stelle von f .
Sei f ∈ C 2 (G) und x eine kritische Stelle von f . Dann gilt nach der Taylorformel (Satz 13.17)
gv00 (0) =
n
X
Di Dj f (x)vi vj = hv, H f (x)vi.
i,j=1
Daher gilt:
Ist gv00 (0) > 0 für alle v 6= 0, so hat f in x ein isoliertes lokales Minimum.
Ist gv00 (0) < 0 für alle v 6= 0, so hat f in x ein isoliertes lokales Maximum.
00
Gibt es v, w mit gv00 (0) > 0 und gw
(0) < 0, so hat f in x einen Sattelpunkt.
Welcher dieser drei Fälle eintritt, ist offenbar eine Eigenschaft der Hesse–Matrix H f (x). Wir treffen daher
die folgende Definition.
194
Differentialrechnung von Funktionen mehrerer Veränderlicher
Definition 13.21 (Definitheit von Matrizen) Eine symmetrische Matrix A ∈ M (n, n) heißt
positiv definit,
positiv semidefinit,
falls hx, Axi > 0 für alle x ∈ Rn \ {0},
falls hx, Axi ≥ 0 für alle x ∈ Rn .
A heißt negativ (semi–)definit, falls (−A) positiv (semi–)definit ist. Ansonsten heißt A indefinit.
Wir fassen die obige Definition in dem Hauptsatz dieses Abschnitts zusammen.
Satz 13.22 (Lokale Extremalstellen) Sei f ∈ C 2 (G) und ∇f (x) = 0. Ist die Hesse–Matrix H f (x)
• positiv definit, so ist x eine isolierte lokale Minimalstelle.
• negativ definit, so ist x eine isolierte lokale Maximalstelle.
• indefinit, so ist x ein Sattelpunkt.
Bemerkung 13.23 Ist H f (x) nur semidefinit (positiv oder negativ), so muss man auch noch höhere Ableitungen untersuchen, oder andere Methoden verwenden, um die Art der kritischen Stelle zu bestimmen.
Bevor wir zu den Beispielen kommen, wollen wir uns noch damit beschäftigen, wie man praktisch die
Definitheit einer Matrix bestimmt.
Bemerkung 13.24 A ist positiv definit (bzw. semidefinit) genau dann, wenn
spec(A) ⊂ (0, ∞)
(bzw. spec(A) ⊂ [0, ∞)),
falls also alle Eigenwerte strikt positiv (bzw. nicht-negativ) sind. (Man beachte: Symmetrische reelle Matrizen haben nach Satz 11.13 stets reelle Eigenwerte.)
Beispiele 13.25
(i) A =
1
0
0
ist positiv definit. Eigenwerte 1 und 2.
2
0
ist positiv semidefinit. Eigenwerte 1 und 0.
0
−1 0
(iii) A =
ist negativ definit. Eigenwerte −1 und −2.
0 −2
1 0
(iv) A =
ist indefinit. Eigenwerte 1 und −2.
0 −2
(ii) A =
1
0
Wie sieht man es aber einer Nicht-Diagonalmatrix an, ob sie definit ist oder nicht. Darüber gibt der nächste
Satz Auskunft:
Lemma 13.26 (Hurwitz Kriterium) (a) Sei A = (ai,j ) ∈ M (n, n) symmetrisch und


a11 · · · a1k

..  ,
..
δk = det  ...
k = 1, . . . , n,
.
. 
ak1
· · · akk
(13.9)
13.4
195
Anwendung: Lineare Regression
die Determinante der Matrix, die aus A durch Streichen der letzten n − k Zeilen und Spalten hervorgeht.
Dann gilt
A ist positiv definit
⇐⇒ δk > 0 für alle k = 1, . . . , n.
A ist negativ definit ⇐⇒ (−1)k δk > 0 für alle k = 1, . . . , n.
(b) Speziell ist für
(i) A =
a b
.
b c
A positiv definit
A negativ definit
A indefinit


a b c
(ii) A =  b d e .
c e f
A positiv definit
A negativ definit
13.4
⇐⇒ a > 0 und ac − b2 > 0.
⇐⇒ a < 0 und ac − b2 > 0.
⇐⇒ a 6= 0 und ac − b2 < 0.
⇐⇒ a > 0, ad − b2 > 0 und det(A) > 0.
⇐⇒ a < 0 und ad − b2 > 0 und det(A) < 0.
Anwendung: Lineare Regression
Wir wollen hier als Anwendung der Bestimmung von Extremalstellen, die Regressionsgerade bestimmen,
die als Ausgleichsgerade durch eine Reihe von fehlerbehafteten Messwerten geht.
Wir nehmen an, dass wir n Messungen durchgeführt haben, wobei wir den Parameter x einstellen können
(oder exakt messen) und die Messung der zweiten Größe y fehlerbehaftet ist. Also haben wir die Messwerte
(x1 , y1 ), . . . , (xn , yn ). Wir vermuten einen (affin) linearen Zusammenhang zwischen den Messgrößen, das
heißt sie sollten idealerweise auf einer Geraden y(x) = ax + b liegen. Das Ziel ist, die Werte a und b
möglichst genau anzupassen. Als Maß für die Anpassung wählen wir die Summe der Fehlerquadrate
n
Q(a, b) :=
1X
(yi − (axi + b))2 .
n i=1
(13.10)
Wir versuchen also, ein Minimum von Q zu finden.
Zunächst führen wir noch eine kompakte Notation ein: Wir schreiben für h = x, y, x2 , xy oder y 2
n
hhi :=
1X
hi .
n i=1
Man bemerke, dass hx2 i − hxi2 = h(x − hxi)2 i > 0 ist. Durch Ausmultiplizieren erhalten wir dann
Q(a, b) = hy 2 i + a2 hx2 i + b2 − 2ahxyi − 2bhyi + 2abhxi.
Ableiten ergibt
D1 Q(a, b) =
d
Q(a, b) = 2ahx2 i − 2hxyi + 2bhxi
da
und
D2 Q(a, b) =
d
Q(a, b) = 2b − 2hyi + 2ahxi.
db
196
Differentialrechnung von Funktionen mehrerer Veränderlicher
Damit Q minimal ist, muss D1 Q(a, b) = D2 Q(a, b) = 0 sein, also erhalten wir für a und b die linearen
Gleichungen
hx2 ia + hxib = hxyi
hxia + b = hyi.
Auflösen (z.B. mit der Cramér’schen Regel) ergibt
a=
hxyi − hxihyi
,
hx2 i − hxi2
b=
hx2 ihyi − hxihxyi
.
hx2 i − hxi2
(13.11)
Liegt hier wirklich ein Minimum vor? Wir berechnen die zweiten Ableitungen
D11 Q(a, b) = 2hx2 i > 0.
D21 Q(a, b) = 2hxi.
D22 Q(a, b) = 2.
Also ist
det(H Q (a, b)) = D11 Q · D22 Q − (D12 Q)2 = 4hx2 i − 4hxi2 > 0.
Nach dem Hurwitz-Kriterium ist also H Q (a, b) positiv definit, und damit liegt ein isoliertes lokales Minimum vor.
13.5
Vektorfelder
In diesem Abschnitt wollen wir Funktionen f mit Werten in Rm betrachten, die ihrerseits wiederum von n
Veränderlichen abhängen dürfen. Von besonderer Bedeutung ist der Fall m = n, in dem wir f ein Vektorfeld
nennen, speziell in der Ebene n = m = 2 und im Raum m = n = 3. Wir definieren die Ableitung und
geben als Rechenregel die Kettenregel an.
Definition 13.27 Sei G ⊂ Rn ein Gebiet. Es seien die Funktionen fi : G → R, i = 1, . . . , m, stetig partiell
differenzierbar und die Funktion f : Rn → Rm definiert durch


f1 (x)


f (x) =  ...  .
fm (x)
Dann heißt f stetig differenzierbar. Ist m = n, so heißt f ein n–dimensionales stetig differenzierbares
Vektorfeld. Ist m = n = 3, so heißt f auch ein stetig differenzierbares Vektorfeld schlechthin.
Die m × n–Matrix der partiellen Ableitungen heißt die Funktionalmatrix oder Jakobimatrix von f


D1 f1 (x) · · · Dn f1 (x)


..
..
T
f 0 (x) = 
 = (∇f1 (x), . . . , ∇fm (x)) .
.
.
D1 fm (x) · · · Dn fm (x)
Beispiele 13.28
(i) Sei G = Rn , A ∈ M (m, n) und y ∈ Rm fest. Dann ist f (x) = Ax + y stetig
differenzierbar mit Ableitung
f 0 (x) = A.
Speziell ist für m = n und f (x) = x, f 0 (x) = In die Einheitsmatrix.
13.5
197
Vektorfelder
(ii) Sei f : Rn → Rn , f (x) =
x
|x|2 .
Di fi (x) =
f ist ein stetig differenzierbares Vektorfeld. Es ist
|x|2 − 2x2i
1
x2i
=
−
2
,
|x|4
|x|2
|x|4
und
Di fj (x) = −2
xi xj
,
|x|4
i = 1, . . . , n
i 6= j.
Also ist die Funktionalmatrix von f
f 0 (x) =
1
1
In − 2 4 x · xT ,
|x|2
|x|
wobei xT das Transponierte von x ist.
Nach der Approximationsformel (Satz 13.11) gilt für kleine y ∈ Rn
fi (x + y) ≈ fi (x) + h∇fi (x), yi.
Also gilt für f die Approximationsformel (Taylorformel erster Ordnung)
f (x + y) ≈ f (x) + f 0 (x)y.
(13.12)
Natürlich kann man auch Taylorformeln höherer Ordnung angeben, aber das wird leicht unübersichtlich,
weshalb wir hier darüber hinweg gehen.
x2 ex1 cos(2x1 )
. Dann ist die Ableitung
2(x2 )2
x
x2 e 1 [cos(2x1 ) − 2 sin(2x1 )] ex1 cos(2x1 )
0
f (x) =
.
0
4x2
0
Wir entwickeln f um den Punkt x =
1
0
0
0
1
1 1
1 + y1 + y2
f
+y ≈f
+ f0
·y =
+
y=
.
1
1
1
2
0 4
2 + 4y2
Beispiel 13.29 Sei f (x) =
Satz 13.30 (Summe und Produkt) Seien G ⊂ Rn ein Gebiet, f, g : G → Rm sowie H : G → R stetig
partiell differenzierbar. Dann gilt
(i) Summenregel: (f + g)0 = f 0 + g 0 .
(ii) Produktregel: (f · H)0 = f 0 H + f · (∇H)T .
Beispiel 13.31 Sei A eine symmetrische n × n–Matrix und y ∈ Rn sowie
g(x) = exp − hx, Axi + hx, yi .
(13.13)
Dann ist (siehe (13.4)) ∇hx, Axi = (AT + A)x = 2Ax, weil A symmetrisch ist. Also ist nach der Kettenregel (Satz 13.7(iii)) das Gradientenfeld von g
f (x) := ∇g(x) = (−2Ax + y) exp − hx, Axi + hx, yi
198
Differentialrechnung von Funktionen mehrerer Veränderlicher
stetig differenzierbar. Die Ableitung von f ist die Hesse Matrix von g
H g (x) = f 0 (x) = −2A + (−2Ax + y) · (−2Ax + y)T exp − hx, Axi + hx, yi .
Speziell ist an einer kritischen Stelle x0 ∈ Rm von g (also ∇g(x0 ) = 0 ⇐⇒ −2Ax + y = 0)
H g (x0 ) = −2A exp − hx, Axi + hx, yi .
H g (x0 ) ist also genau dann positiv definit (oder negativ oder indefinit), wenn −A dies ist. In diesem Fall
hat g eine isolierte lokale Maximalstelle in 0 – wie erwartet.
Wir betrachten auch den folgenden Spezialfall:
g(x) = exp(−|Bx|2 ),
wobei B eine beliebige m × n–Matrix ist. In der Tat ist dies ein Spezialfall von (13.13) mit y = 0 und
A = B T B, denn hBx, Bxi = hx, B T Bxi. Man bemerke, dass B T B symmetrisch ist. Nun ist hBx, Bxi ≥
0 für alle x, also ist B T B wenigstens positiv semidefinit. Es ist B T B positiv definit, wenn das lineare
Gleichungssystem Bx = 0 nur die Lösung x = 0 hat, also wenn Rang(B) = n.
Wir betrachten jetzt zwei stetig partiell differenzierbare Abbildungen f : F → Rm und g : G → Rk , wobei
F ⊂ Rn , G ⊂ Rn sowie f (F ) ⊂ G.
Satz 13.32 (Kettenregel) (i) Die Abbildung g ◦ f : F → Rk ist stetig partiell differenzierbar mit Funktionalmatrix
(g ◦ f )0 (x) = g 0 (f (x)) · f 0 (x).
(13.14)
(ii) Falls n = k = 1 ist, so gilt speziell
d
g ◦ f (t) = h∇g(f (t)), f 0 (t)i.
dt
(13.15)
Wenden wir in (ii) den Hauptsatz der Differential- und Integralrechnung auf die Funktion h(t) = g ◦ f (t)
an, so erhalten wir folgende einfache Schlussfolgerung.
Korollar 13.33 In der Situation von Satz 13.32(ii) gilt für a, b ∈ R und x = f (a), y = f (b)
Z b
g(y) − g(x) =
h∇g(f (t)), f 0 (t)i dt.
(13.16)
a
Sei f : G → Rn ein stetig partiell differenzierbares Vektorfeld. Es sei x0 ∈ Rn fest gewählt und y 0 =
f (x0 ). Unter welchen Bedingungen können wir f wenigstens in einer Umgebung
Uε (y 0 ) = {y ∈ Rn : |y − y 0 | < ε}
umkehren?
I = g 0 (y) = f 0 (f −1 (y)) · (f −1 )0 (y).
Damit dies gut geht, muss f 0 (y 0 ) invertierbar sein. Der nächste Satz besagt, dass dies sogar ausreichend ist.
Satz 13.34 Sei f : Rn → Rn ein stetig differenzierbares Vektorfeld und x0 ∈ Rn mit det(f 0 (x0 )) 6= 0. Wir
setzen y 0 = f (x0 ). Dann existiert ein ε > 0 und eine inverse Abbildung
f −1 : Uε (y 0 ) → Rn
mit f (f −1 (y)) = y für alle y ∈ Uε (y 0 ). f −1 ist ein stetig differenzierbares Vektorfeld mit Ableitung
(f −1 )0 (y) = (f 0 (f −1 (y)))−1 .
13.6
199
Rotation und Divergenz
13.6
Rotation und Divergenz
Definition 13.35 Sei f : G → Rn ein stetig partiell differenzierbares Vektorfeld. Wir definieren die
Divergenz von f als Summe der Diagonalelemente der Funktionalmatrix
div f (x) := D1 f1 (x) + . . . + Dn fn (x).
Im Fall n = 3 definieren wir die Rotation von f durch


D2 f3 (x) − D3 f2 (x)
rot f (x) = D3 f1 (x) − D1 f3 (x) .
D1 f2 (x) − D2 f1 (x)
Ist u : G → R zweimal stetig partiell differenzierbar, so definieren wir den Laplaceoperator ∆ als Summe
der Diagonalelemente er Hesse–Matrix von u
∆u(x) = div grad u(x) =
Manchmal schreibt man auch
∂ 2 u(x)
∂ 2 u(x)
+
.
.
.
+
.
∂x21
∂x2n
div f (x) = h∇, f i(x)
rot f (x) = ∇ × f (x).
(13.17)
Dabei stellt man sich formal ∇ als Vektor vor

∂
∂x1



 ∂ 
∇ =  ∂x
.
 2
(13.18)
∂
∂x3
Wir können die Divergenz als Quellstärke eines Feldes, die Rotation als Wirbelstärke interpretieren.
Beispiele 13.36 Wir betrachten nur n = 3.
(i) f (x) = x. Dann ist div f (x) = 3 und rot f (x) = 0.
(ii) Sei r ∈ R3 fest und


r2 x3 − r3 x2
f (x) = r × x = r3 x1 − r1 x3  .
r1 x2 − r2 x1
Dann ist D1 f1 (x) = D2 f2 (x) = D3 f3 (x) = 0, also div f (x) = 0. Außerdem ist
rot f (x) = 2r.
Wir haben also ein reines Wirbelfeld vorliegen.
(iii) Das elektrische Potential u genügt der Poisson Gleichung
∆u(x) = %(x).
(13.19)
200
Differentialrechnung von Funktionen mehrerer Veränderlicher
Dabei ist % die Ladungsverteilung. Zu u gehört ein (zeitlich konstantes) elektrisches Feld E durch
E(x) = grad u(x).
Es ist also
% = div E
(13.20)
die Quellstärke des elektrischen Feldes. (13.20) wird auch als erste Maxwell’sche Gleichung der
Elektrodynamik bezeichnet.
(iv) Das (zeitlich konstante) magnetische Feld B ergibt aus der Stromstärke J : R3 → R3 durch (2.
Maxwell’sche Gleichung)
rot B(x) = J(x).
(13.21)
Satz 13.37 (i) Sei Sei G ⊂ R3 und u : G → R zweimal stetig partiell differenzierbar. Dann ist das
Gradientenfeld rotationsfrei:
rot grad u(x) = 0,
x ∈ R3 .
(13.22)
(ii) Sei f : R3 → R3 zweimal stetig differenzierbar. Dann ist das Rotationsfeld quellenfrei:
div rot f (x) = 0,
Beispiele 13.38
x ∈ R3 .
(13.23)
(i) u(x) = |x|2 . Dann ist grad u(x) = 2x und rot grad u(x) = 0.
(ii) r ∈ R3 fest und f (x) = r × x. Dann ist rot f (x) = 2r konstant also div rot f (x) = 0.
(iii) Das elektrische Feld erfüllt die dritte Maxwell’sche Gleichung
rot E(x) = rot grad u(x) = 0.
(13.24)
(iv) Das magnetische Feld B erhält man als Rotation eines so genannten Vektorpotentials A:
B(x) = rot A(x).
Also erfüllt B die vierte Maxwell’sche Gleichung
div B(x) = div rot A(x) = 0.
13.7
(13.25)
Implizite Funktionen
In manchen Fällen ist die Abbildungsvorschrift x 7→ g(x) einer Funktion g nicht explizit bekannt, sondern
man weiß nur, dass g eine Gleichung der Art
H(x, g(x)) ≡ const.
(13.26)
löst, wobei H : G → R (mit gewissem G ⊂ R2 ) stetig partiell differenzierbar sein soll. Wir sagen dann,
dass g durch (13.26) implizit gegeben ist. Im allgemeinen kann man nicht hoffen, aus (13.26) die Funktion
g explizit ausrechnen zu können, aber wir können immerhin eine Bedingung angeben, wann ein solches g
existiert, die Ableitung von g an einer Stelle ausrechnen und dadurch linear approximieren.
Setzen wir F (x) = H(x, g(x)), so ist nach der Kettenregel
0 = F 0 (x) = D1 H(x, g(x)) + g 0 (x)D2 H(x, g(x)).
13.7
201
Implizite Funktionen
Es muss also wenigstens D2 H(x0 , g(x0 )) 6= 0 sein, damit wir (13.26) in einer kleine Umgebung x ∈
(x0 − ε, x0 + ε) lösen können.
Satz 13.39 (Implizite Funktionen) Sei G ⊂ R2 ein Gebiet und H : G → R stetig partiell differenzierbar
sowie x0 , y0 ∈ R mit D2 H(x0 , y0 ) 6= 0. Dann gibt es ein ε > 0 und eine eindeutig festgelegte Funktion
g : (x0 − ε, x0 + ε) → R mit g(x0 ) = y0 und
für alle x ∈ (x0 − ε, x0 + ε).
H(x, g(x)) = H(x0 , y0 )
g hat die Ableitung
g 0 (x) = −
D1 H(x, g(x))
D2 H(x, y)
und kann für kleines |x − x0 | approximiert werden durch
g(x) ≈ g(x0 ) −
D1 H(x0 , y0 )
(x − x0 ).
D2 (x0 , y0 )
(13.27)
2
2
Beispiele 13.40
(i) H(x,
√ y) := x + y , x0 = 0, y0 = 1. Dann ist D2 H(x0 , y0 ) = 2y0 = 2 6= 0. Für
ε = 1 und g(x) = 1 − x2 , x ∈ (−1, 1) ist H(x, g(x)) ≡ 1. Weiter ist
g 0 (x) = − √
x
D1 H(x, g(x))
x
=−
.
=−
2
g(x)
D2 H(x, g(x))
1−x
(ii) H wie oben, jedoch x0 = 1 und y0 = 0. Dann ist D2 H(x0 , y0 ) = 2y0 = 0 und wir können keine
Funktion g finden, die in einer kleinen Umgebung (1 − ε, 1 + ε) die Gleichung H(x, g(x)) = 1 löst.
(iii) H(x, y) = x2 y−sin(y), x0 = 1, y0 = π. Dann ist D1 H(x, y) = 2xy und D2 H(x, y) = x2 −cos(y).
Also ist D2 H(x0 , y0 ) = 2. Damit existiert in einer Umgebung (1 − ε, 1 + ε) eine Funktion g mit
H(x, g(x)) = H(x0 , y0 ) = π. Wir können für x nahe bei 1 approximieren
g(x) ≈ y0 −
D1 H(x0 , y0 )
2π
(x − x0 ) = π −
(x − 1) = (2 − x)π.
D2 H(x0 , y0 )
2
Probe: für x = 0.95 ist die Approximation g(0.95) ≈ 3.2987. Der exakte Wert (den man z.B. per
Intervallschachtelung erhält) ist g(0.95) = 3.302961754.
Wir kommen nun noch zu einer Verallgemeinerung der vorhergehenden Situation. Sei G ⊂ Rn × Rm und
H : G → Rm ,
(x, y) 7→ H(x, y)
stetig partiell differenzierbar ist. Wir wollen wieder die Gleichung
H(x, g(y)) = const.
als implizite Definition der Funktion g : U → Rm (mit geeignetem Definitionsbereich U ⊂ Rn ) ansehen.
Die ganze Sache funktioniert sehr ähnlich wie oben, wo m = n = 1 war. Statt der partiellen Ableitung
kommen nun die Funktionalmatrizen Hx0 und Hy0 ins Spiel, die wir jetzt definieren.

 ∂H (x,y)


∂H1 (x,y)
∂H1 (x,y)
1
1 (x,y)
·
·
·
· · · ∂H∂x
∂y
∂y
∂x1
1
m
n




..
..
..
..




Hy0 (x, y) = 
Hx0 (x, y) = 
.
.
.
.

.




∂Hm (x,y)
∂Hm (x,y)
∂Hm (x,y)
∂Hm (x,y)
·
·
·
·
·
·
∂x1
∂xn
∂y1
∂ym
202
Differentialrechnung von Funktionen mehrerer Veränderlicher
Satz 13.41 (Implizite Funktionen) Seien x0 ∈ Rn und y0 ∈ Rm so, dass (x0 , y0 ) ∈ G und det(Hy0 (x0 , y0 )) 6=
0 ist. Dann existiert ein ε > 0 und eine Umgebung
U = Uε (x0 ) = {x ∈ Rn : |x − x0 | < ε}
sowie eine eindeutig bestimmte stetig partiell differenzierbare Funktion g : U → Rm mit g(x0 ) = y0 und
H(x, g(x)) = H(x0 , y0 )
für alle x ∈ U.
g hat die Funktionalmatrix
g 0 (x) = −(Hy0 (x, g(x)))−1 · Hx0 (x, g(x)).
Kapitel 14
Mehrdimensionale Integration
14.1
Volumenintegrale in der Ebene
a1
b
Seien a =
, b = 1 ∈ R2 mit a1 < b1 und a2 < b2 . Wir definieren den Quader Qba durch
a2
b2
Q = Qba = {x ∈ R2 : ai ≤ xi ≤ bi , i = 1, 2} = [a1 , b1 ] × [a2 , b2 ].
(14.1)
Für eine stetige Funktion f : Qba → R definieren das Integral von f in Q durch
!
Z
Z
Z
b1
f (x) dx =
Q
b2
dx1
dx2 f (x1 , x2 )
a1
Z
a2
b2
Z
dx2
=
!
b1
(14.2)
dx1 f (x1 , x2 ) .
a2
a1
Wir lassen im folgenden meist die großen Klammern weg.
Wenn wir nun auch noch uneigentliche Integrale zulassen wollen, weil entweder f nicht stetig ist, oder die
Grenzen a1 , a2 , b1 oder b2 im Unendlichen liegen, so brauchen wir eine zusätzliche Bedingung, damit das
Integral überhaupt existiert:
Z b1
Z b2
dx1
dx2 |f (x1 , x2 )| < ∞.
(14.3)
a1
a2
Definition 14.1 Gilt (14.3) (mit eventuell unendlichen Integrationsgrenzen) so heißt f integrierbar in Q.
Das Integral
Z
Z
f (x) dx =
f (x) dx1 dx2
Q
Q
wird durch (14.2) definiert, wobei die Integrationsreihenfolge egal ist.
Bemerkung 14.2
(i) Die Tatsache, dass die Integrationsreihenfolge keine Rolle spielt, ist genau genommen ein Satz, nämlich der Satz von Fubini.
R
(ii) Ist f ≥ 0, so kann man das Integral Q f (x) dx als Volumen der Menge
M := {(x1 , x2 , y) ∈ R3 : (x1 , x2 ) ∈ Q, 0 ≤ y ≤ f (x1 , x2 )}
203
204
Mehrdimensionale Integration
interpretieren.
In der ersten Zeile von (14.2) ist das innere Integral die zu x1 gehörige Fläche der Schnittmenge
Mx1 := (x2 , y) ∈ R2 : (x1 , x2 , y) ∈ M
Durch Integration dieser Flächen nach x1 erhält man daraus das Volumen von M . Vertauschen der
Rollen von x1 und x2 ergibt dasselbe Volumen. Damit wird die Gleichheit der ersten mit der zweiten
Zeile in (14.2) plausibel.
Beispiele 14.3
(i) a1 = a2 = 0, b1 = 1, b2 = 2. f (x) = (x1 + x2 )2 + e−x1 . Dann ist
Z
1
Z
f (x) dx =
Z
2
dx2 (x1 + x2 )2 e−x1
dx1
[0,1]×[0,2]
0
Z
0
1
1
=
dx1 (x1 + 2)3 − x31 + 2e−x1
3
0
1
1
1
(x1 + 2)4 − x41 − 2e−x1 =
12
0
0
16
22
2
=
+ 2 − 2e−1 =
− .
3
3
e
(ii) a1 = 1, b2 = 2, a2 =
π
2 , b2
= π. f (x) = x21 · cos(x2 ).
Z
2
Z
Z
f (x) dx =
[1,2]×[π/2,π]
π
dx2 x21 · cos(x2 )
dx1
1
π/2
2
Z
π
dx1 x21 − sin(x2 ) =
π/2
1
Z
=−
1
2
7
dx1 x21 = − .
3
(iii) Lässt sich f wie in (ii) als Produkt von zwei Funktionen schreiben f (x) = g(x1 ) · h(x2 ), dann ist
!
!
Z
Z
Z
b1
f (x) dx =
Q
b2
g(x1 ) dx1
·
a1
h(x2 ) dx2
a2
(iv) a1 = 1, b1 = ∞, a2 = 0, b2 = ∞. f (x) = x2 e−x1 x2 . Dann ist
Z
Z ∞
Z
x2 e−x1 x2 dx1 dx2 =
dx1
[1,∞)×[0,∞)
1
∞
dx2 x2 e−x1 x2 .
0
Das innere Integral bestimmen wir mit partieller Integration
Z ∞
x2 =∞ Z ∞ 1
1
+
e−x1 x2 dx2 . .
dx2 x2 e−x1 x2 = − x2 e−x1 x2 x1
x1
x2 =0
0
0
|
{z
} |
{z
}
=0
Also ist
Z
[1,∞)×[0,∞)
x2 e−x1 x2 dx1 dx2 =
=1/x21
Z
1
∞
1
1 ∞
dx
=
−
= 1.
1
x21
x1 1
(14.4)
14.1
205
Volumenintegrale in der Ebene
Das war recht kompliziert. Wir dürfen aber die Integrationsreihenfolge auch vertauschen und können
so das selbe Integral viel einfacher berechnen:
Z
Z ∞
Z ∞
−x1 x2
x2 e
dx1 dx2 =
dx2
dx1 x2 e−x1 x2
[1,∞)×[0,∞)
0
Z
=
1
∞
dx2 e−x2 = 1.
0
2
(v) Sei Q = [0, ∞) × (−∞, ∞) und f (x) = (x1 − x2 )e−(x1 −x2 ) . Dann ist (mit der Substitution
y = x1 − x2 )
Z ∞
Z ∞
Z ∞
Z ∞
2
2
dx2
dx1 (x1 − x2 )e−(x1 −x2 ) =
dx2
dy y e−y
−∞
0
−∞
−x
2
Z ∞
2
1
y=∞
=
dx2 − e−y 2
y=−x2
−∞
√
Z ∞
2
π
1
.
=
dx2 e−x2 =
2 −∞
2
Vertauschen wir die Integrationsreihenfolge, so erhalten wir (wieder mit Substitution)
Z ∞
Z ∞
Z ∞
Z ∞
2
−(x1 −x2 )2
dx1
dx2 (x1 − x2 )e
=
dx1
dy(−ye−y ) = 0.
0
−∞
0
−∞
{z
}
|
=0
Steht das im Widerspruch zu dem Satz? Nein, denn die Funktion f ist in Q gar nicht integrierbar, wie
die folgende Rechnung zeigt
Z ∞
Z ∞
Z ∞
Z ∞
2
dx2
dx1 |f (x)| =
dx2
dy y e−y −∞
0
−∞
−x
Z ∞
Z ∞2
2
≥
dx2
dy y e−y = ∞
| {z }
−∞
0
= 12
Wollen wir nun über allgemeinere Gebiete G ⊂ R2 integrieren als nur über Quader, so können wir zunächst
ganz formal vorgehen. Wir definieren die Indikatorfunktion der Menge G durch
1,
x∈G
1G (x) =
(14.5)
0,
x 6∈ G.
Definition 14.4 Seien G, H ⊂ R2 Gebiete mit G ⊂ H. Die Funktion f : H → R heißt in G integrierbar
falls f · 1G in R2 integrierbar ist. Wir setzen dann
Z
Z
f (x) dx =
f (x)1G (x) dx.
R2
G
Zum praktischen Ausrechnen taugt diese Definition natürlich in den meisten Fällen nicht. Oft kann man
sich aber zusätzliche Eigenschaften des Gebietes G zu Nutze machen. Ist beispielsweise G = G1 ∪ G2 , wo
G1 und G2 disjunkte Gebiete sind (G1 ∩ G2 = ∅), so ist
Z
Z
Z
f (x) dx =
f (x) dx +
f (x) dx.
(14.6)
G
G1
G2
206
Mehrdimensionale Integration
Das ist besonders dann nützlich, wenn wir die einzelnen Integrale schon kennen.
Ein anderer Fall ist der, wo G von zwei Funktionen s(x1 ) ≤ t(x1 ) nach unten und oben begrenzt wird:
G = x ∈ R2 : x1 ∈ [a, b], x2 ∈ [s(x1 ), t(x1 )] .
Satz 14.5
Z
Z
b
f (x) dx =
Z
t(x1 )
dx1
G
a
dx2 f (x).
s(x1 )
Beispiele 14.6
(i) Sei G = {x ∈ R2 : x1 ∈ [0, 1] x2 ∈ [0, x1 ]} und f (x) = x1 e−x2 . Dann ist
s(x1 ) = 0 und t(x1 ) = x1 . Wir erhalten
1
Z
Z
dx2 x1 e−x2 =
Z
1
dx1 x1 (1 − e−x1 )
0
0
0
G
x1
Z
dx1
f (x) dx =
Z 1
1
−
ye−y dy
2
0
2
1
2 1
= − 1−
= − .
2
e
e 2
=
0
3
1
4
(ii) Sei G das Parallelogramm mit den Ecken
,
,
und
. Wir zerlegen G in die Dreiecke
0
0
2
2
G1 , G3 und das Rechteck G2 :
G1 = {x ∈ R2 : x1 ∈ [0, 1], x2 ∈ [0, 2x1 ]}
G2 = {x ∈ R2 : x1 ∈ [1, 3], x2 ∈ [0, 2]}
G3 = {x ∈ R2 : x1 ∈ [3, 4], x2 ∈ [2(x1 − 3), 2]}
Dann ist (die doppelt auftretenden gemeinsamen Ränder liefern keinen Beitrag zum Integral!)
Z
Z
Z
Z
f (x) dx =
f (x) dx +
f (x) dx +
f (x) dx
G
G1
1
G2
Z
=
Z
dx1
0
G3
2x1
Z
dx2 f (x) +
0
3
Z
dx1
1
2
Z
dx2 f (x) +
0
4
Z
2
dx1
3
dx2 f (x).
2(x1 −3)
Manchmal kann man ein Gebiet G in natürlicher Weise parametrisieren. D.h. es gibt ein Rechteck Q und
eine ein-eindeutige stetig differenzierbare Abbildung
φ : Q → G.
Wir können nun f : G → R integrieren, indem wir f (φ(x)) über Q integrieren. Dabei ist zu beachten, dass
das Volumenelement
dφ(x) = | det φ0 (x)|dx = D1 φ1 (x)D2 φ2 (x) − D1 φ2 (x)D2 φ1 (x)dx
ist, wobei φ0 (x) die Funktionalmatrix von φ(x) ist. Anschaulich ist es so, dass das infinitesimal kleine
recht
dx1
0
0
eckige Volumenelement dx1 dx2 auf ein Volumenelement in Parallelogrammgestalt mit Seiten φ (x)
0
dx2
gebracht wird. Die Größe dieses Parallelogramms ist nun genau der Betrag der Determinante von φ0 (x) mal
dx1 dx2 .
14.1
207
Volumenintegrale in der Ebene
Wir erhalten so die für das praktische Ausrechnen von Integralen wichtige Transformationsformel, die die
Substitutionsregel für mehrdimensionale Integrale ist.
Satz 14.7 (Transformationsformel)
Z
Z
f (x) dx =
f (φ(x))| det φ0 (x)| dx.
G
(14.7)
Q
Beispiel 14.8 Sei G das Parallelogramm von Beispiel 14.6(ii).
G ist
das Bild des Quadrats Q = [0, 1] ×
3 1
[0, 1] unter der linearen Abbildung φ(x) = Ax, wo A =
. Es ist φ0 (x) = A und det φ0 (x) =
0 2
3 1
det
= 6. Also ist
0 2
Z
Z 1
Z 1
3x1 + x2
f (x) dx = 6
dx1
dx2 f
.
2x2
G
0
0
Beispiel 14.9 Sei G = BR die Kreisscheibe mit Radius R
G = BR = x ∈ R2 : |x| ≤ R .
Wir wählen
Q = [0, R] × [0, 2π)
und
r
r cos ϕ
=
.
ϕ
r sin ϕ
r cos ϕ
Das heißt r und ϕ sind Abstand und Winkel des Punktes x =
. Die Abbildung φ ist eineindeutig
r sin ϕ
bis auf den Punkt 0, der aber unerheblich ist, weil es nur ein Punkt ist und die Fläche 0 hat. Es ist
r
cos(ϕ) −r sin(ϕ)
r φ0
=
= r.
und det φ0
ϕ
sin(ϕ) r cos(ϕ)
ϕ φ
Wir erhalten so die wichtige Integralformel für Polarkoordinaten
Z
Z
f (x) dx =
BR
R
Z
r dr
0
Lassen wir nun noch R → ∞ gehen, so erhalten wir
Z
Z ∞
Z
f (x) dx =
r dr
0
dϕ f
0
R2
2π
2π
dϕ f
0
r cos(ϕ)
.
r sin(ϕ)
r cos(ϕ)
,
r sin(ϕ)
(14.8)
(14.9)
vorausgesetzt, dass f ist in R2 integrierbar ist. Diese Formeln sind natürlich besonders dann nützlich, wenn
f (x) nur von |x| abhängt, also f (x) = g(|x|) für eine Funktion g, weil dann das innere Integral nur noch
als Faktor 2π auftaucht:
Z
Z
R
f (x) dx = 2π
BR
g(r) r dr.
0
(14.10)
208
Mehrdimensionale Integration
1
|x|
(i) Wir wollen für f (x) =
Z
BR
das Integral
1
dx =
|x|
R
f (x) dx berechnen. Wegen f
BR
R
Z
0
(ii) Sein nun f (x) = exp(−|x| ). Dann ist f
−|x|2
e
Z
dx =
R2
∞
2π
Z
1
= 2π
r
dϕ e
∞
Z
= 2π
ist dann
R
Z
−r 2
re
0
0
2
1
r
dr = 2πR.
0
2
r cos(ϕ)
= e−r , also
r sin(ϕ)
−r 2
r dr
0
dϕ
0
2
Z
2π
Z
r dr
r cos(ϕ)
=
r sin(ϕ)
2
1
dr = 2π − e−r
2
∞
= π.
0
2
Man bemerke, dass f (x) = e−x1 · e−x2 ist. Nach (14.4) ist daher
Z
π=
2
e−|x| dx =
∞
Z
R2
2
dx1 e−x1
Z
−∞
∞
2
dx2 e−x2
Z
−∞
Wir haben so die wichtige Formel gewonnen
Z ∞
2
dy e−y =
√
∞
dy e−y
=
2
2
.
−∞
π.
(14.11)
−∞
(iii) Sei 0 < R < S und
G = x ∈ R2 : R < |x| < S, x2 ≥ 0
x2
ein halber Kreisring und f (x) = |x|
3 . Das Gebiet hat keinen besonders einfachen Rand, aber es lässt
sich einfach parametrisieren durch die Polarkoordinaten
Q = [R, S] × [0, π)
und
r
r cos(ϕ)
7→
.
ϕ
r sin(ϕ)
φ : Q → G,
Es ist dann
sin(ϕ)
r sin(ϕ)
r
f φ
=
.
=
ϕ
r3
r2
Also ist
Z
G
x2
dx =
|x|3
Z
S
R
sin(ϕ)
r2
dϕ
0
Z
S
=
R
14.2
π
Z
r dr
1
dr
r
! Z
π
sin(ϕ) dϕ
= 2 log
0
S
R
.
Volumenintegrale in höheren Dimensionen
Genau wie in der Ebene können wir auch Integrale in höheren Dimensionen berechnen. Das Procedere ist
genau das gleiche, und wir geben daher hier nur kurz die analogen formalen Definitionen und Sätze an.
14.2
209
Volumenintegrale in höheren Dimensionen


 
a1
b1
 .. 
 .. 
n
Sei G ⊂ R und f : G → R eine Funktion und a =  . , b =  .  mit ai < bi für i = 1, . . . , n,
an
bn
b
wobei wir die Werte ±∞ zulassen wollen. Es sei Qa der Quader
Qba = x ∈ Rn : ai ≤ xi ≤ bi , i = 1, . . . , n .
(14.12)
Definition 14.10 Die Funktion f heißt integrierbar in Qba , falls
Z b1
Z b2
Z bn
dx1
dx2 · · ·
dxn |f (x1 , . . . , xn )| < ∞.
a1
a2
In diesem Fall definieren wir das Integral von f über Qba durch
Z
Z b1
Z b2
Z bn
dx1
dx2 · · ·
dxn f (x1 , . . . , xn ).
f (x) dx =
Qba
(14.13)
an
a1
a2
(14.14)
an
Satz 14.11 (Fubini) Ist f in Qba integrierbar, so spielt die Reihenfolge, in der die Integral in (14.14)
ausgerechnet werden, keine Rolle. Mit anderen Worten: Für jede Vertauschungen der ersten n Zahlen
{i1 , . . . , in } = {1, . . . , n} ist
Z
Z
bi1
f (x) dx =
bi2
Z
dxi2 · · ·
dxi1
Qba
bin
Z
ai1
ai2
dxin f (x1 , . . . , xn ).
ain
Beispiel 14.12 n = 3, Q = R × [0, 1] × [1, ∞),
2
f (x) = e−x3 x1 (x1 x22 )2 (1 − x2 )3 .
Z
Z
∞
f (x) dx =
1
Z
dx1
−∞
∞
Q
0
Z
=
dx1
−∞
∞
dx3
1
2
dx2 e−x3 x1 (x1 x22 )2 (1 − x2 )3
0
Z
dx1
−∞
Z
1
Z
2
dx3 e−x3 x1 (x1 x22 )2 (1 − x2 )3
1
∞
Z
=
∞
Z
dx2
∞
2
dx3 x21 e−x3 x1
Z
1
1
x42 (1 − x2 )3 dx2 .
0
Man kann ohne größere Probleme zeigen, dass das Beta-Integral den folgenden Wert hat
Z 1
m! n!
.
um (1 − u)n du =
(m
+
n + 1)!
0
Also ist hier (mit m = 4 und n = 3)
Z
0
Weiter ist
Z
1
∞
1
x42 (1 − x2 )3 dx2 =
4! 3!
1
=
.
8!
280
2
2 x3 =∞
2
dx3 x21 e−x3 x1 = −e−x3 x1 = e−x1 .
x3 =1
(14.15)
210
Mehrdimensionale Integration
Also ist (nach (14.11))
Z
f (x) dx =
Q
1
280
Z
√
∞
2
dx1 e−x1 =
−∞
π
.
280
Ist nun G ⊂ Rn wieder ein allgemeineres Gebiet (also nicht notwendigerweise ein Quader), so benutzen
wir wieder die Indikatorfunktion
1,
x∈G
1G (x) =
(14.16)
0,
x 6∈ G.
Definition 14.13 Sei jetzt auch noch H ⊂ Rn mit G ⊂ H. Die Funktion f : H → R heißt in G integrierbar
falls f · 1G in Rn integrierbar ist. Wir setzen dann
Z
Z
f (x) dx =
f (x)1G (x) dx.
Rn
G
Zum praktischen Ausrechnen ist es auch hier wieder nützlich, wenn das Gebiet durch Funktionen berandet
ist. Wir wollen hier nicht den allgemeinsten Fall behandeln, sondern nur einen einfachen. Wir nehmen an,
dass G von der Gestalt ist
G = x ∈ Rn : ai ≤ xi ≤ bi , i = 1, . . . , n − 1; s(x1 , . . . , xn−1 ) ≤ xn ≤ t(x1 , . . . , xn−1 ) ,
(14.17)
wobei s, t : Rn−1 → R ∪ {±∞} sind, s ≤ t. Das heißt, dass das Gebiet in den ersten n − 1 Koordinaten
ein Quader ist, während die n–te Koordinate variable Höhe hat. Wir erhalten dann
Z
Z
b1
Z
G
bn−1
dx1 · · ·
f (x) dx =
a1
Z
t(x1 ,...,xn−1 )
dxn−1
an−1
dxn f (x1 , . . . , xn ).
(14.18)
s(x1 ,...,xn−1 )
Auch für Gebiete G ⊂ Rn kann man oft eine Parametrisierung angeben. Sei Qba der Quader aus (14.12).
Wir nehmen an, dass es eine (bis auf einzelne Punkte) ein-eindeutige und stetig partiell differenzierbare
Abbildung gibt
φ : Qba → G.
Es sei dann wieder φ0 (x) die Funktionalmatrix der ersten Ableitungen. Wir erhalten als Substitutionsregel
die Transformationsformel.
Satz 14.14 (Transformationsformel)
Z
Z
f (x) dx =
f (φ(x))| det φ0 (x)| dx.
G
(14.19)
Q
Aus der Transformationsformel erhalten wir eine einfache Schlussfolgerung.
Korollar 14.15 Ist f : Rn → R in Rn integrierbar und A ∈ GL(n) eine invertierbare n × n–Matrix, so
ist (mit φ(x) = Ax, Q = Rn und G = Rn )
Z
f (Ax) dx =
Rn
1
| det(A)|
Z
f (x) dx.
Rn
(14.20)
14.2
211
Volumenintegrale in höheren Dimensionen
Das wichtigste Beispiel für die Transformationsformel sind wieder die Polarkoordinaten. Wir betrachten
hier nur den Fall n = 3. Sei R > 0 und BR der Ball
BR = x ∈ R3 : |x| ≤ R .
Für R = ∞ ist B∞ = R3 . Ferner sei
Q = [0, R] × [0, π] × [0, 2π]
= (r, ϑ, ϕ) : r ∈ [0, R], ϑ ∈ [0, π], ϕ ∈ [0, 2π] .
Wir setzen


r sin(ϑ) cos(ϕ)
φ(r, ϑ, ϕ) =  r sin(ϑ) sin(ϕ)  .
r cos(ϑ)
(14.21)
Das heißt: r ist der Abstand vom Ursprung, ϑ ist der Breitengrad (von Norden her zählend) und ϕ ist der
Längengrad. Die Funktionalmatrix ist


sin(ϑ) cos(ϕ) r cos(ϑ) cos(ϕ) −r sin(ϑ) sin(ϕ)
φ0 (r, ϑ, ϕ) =  sin(ϑ) sin(ϕ) r cos(ϑ) sin(ϕ) r sin(ϑ) cos(ϕ)  .
cos(ϑ)
−r sin(ϑ)
0
Daraus ergibt sich die Funktionaldeterminante
det(φ0 (r, ϑ, ϕ)) = r2 sin(ϑ).
Wegen ϑ ∈ [0, π] ist stets sin(ϑ) ≥ 0. Wir erhalten also den folgenden Satz.
Satz 14.16 (Integration in Polarkoordinaten)
Z
Z
R
r2 dr
f (x) dx =
BR
π
Z
2π
Z
sin(ϑ) dϑ
0
0
0

r sin(ϑ) cos(ϕ)
dϕ f  r sin(ϑ) sin(ϕ)  .
r cos(ϑ)

(14.22)
Ist speziell f rotationssymmetrisch, also f (x) = g(|x|) für eine Funktion g : [0, ∞) → R, so ist
Z
Z
R
f (x) dx = 4π
BR
Beispiele 14.17
g(r) r2 dr.
(14.23)
0
(i) f (x) = 1. Das Kugelvolumen ist also
Z
Z
1dx = 4π
BR
R
r2 dr =
0
4π 3
R .
3
(ii) Sei f (x) = |x|−1 e−|x| . Dann ist
Z
Z
f (x) dx = 4π
R3
0
∞
1
r2 e−r dr = 4π
r
Z
0
∞
r e−r dr = 4π.
212
Mehrdimensionale Integration
(iii) f (x) = e−|x|
2
Z
2
e−|x| dx = 4π
R3
Z
∞
2
r2 e−r dr = π 3/2 .
{z
}
|0
√
= π /4
Das war natürlich auch zu erwarten gewesen, weil (nach (14.11))
Z
Z ∞
Z ∞
Z ∞
2
2
2
2
e−|x| dx =
dx1
dx2
dx3 e−(x1 +x2 +x3 )
R3
−∞
∞
−∞
Z
−∞
2
e−y dy
=
3
= π 3/2 .
−∞
(iv) f (x) = x22 x23 .
Z
R
Z
r dr
f (x) dx =
0
BR
π
Z
2
=
R
6
0
! Z
π
3
r dr
0
14.3
2
Z
sin(ϑ) cos(ϑ) dϑ
{z
}|
0
|
=
dϕ r2 (sin(ϑ) sin(ϕ))2 · r2 cos(ϑ)2
sin(ϑ)dϑ
0
Z
2π
Z
0
=4/15
2π
2
sin(ϕ) dϕ
{z
}
=π
4π 7
R .
105
Kurvenintegrale
Definition 14.18 Eine stetig differenzierbare Funktion γ : [a, b] → Rn mit γ 0 (t) 6= 0, t ∈ (a, b) heißt glatte
Kurve.
Die Kurve γ heißt stückweise glatt, falls sie aus endlich vielen glatten Stücken [a, a1 ], [a1 , a2 ], . . . , [am−1 , am ],
[am , b] besteht.
Eine Kurve γ heißt geschlossen, falls Anfangspunkt γ(a) und Endpunkt γ(b) übereinstimmen.
Die Ableitung γ 0 (t) heißt der Geschwindigkeitsvektor der Kurve. Die Länge der Kurve γ ist das Integral
Z b
`(γ) =
|γ 0 (t)| dt.
(14.24)
a
Definition 14.19 Sind γ 1 : [a, b] → Rn und γ 2 : [b, c] → Rn Kurven mit γ 1 (b) = γ 2 (b), so definieren wir
die zusammengesetzte Kurve
γ := γ 1 + γ 2 : [a, c] → Rn
γ(t) =
γ 1 (t),
γ 2 (t),
t ∈ [a, b]
t ∈ (b, c]
(14.25)
Es gilt `(γ) = `(γ 1 ) + `(γ 2 ).
cos(t)
Beispiele 14.20
(i) n = 2, a = 0, b = 2π, γ(t) =
ist eine geschlossene glatte Kurve mit Gesin(t)
R 2π
R 2π
− sin(t)
schwindigkeitsvektor γ 0 (t) =
= γ(t)⊥ und Länge `(γ) = 0 |γ 0 (t)| dt = 0 1 dt =
cos(t)
2π.
14.3
213
Kurvenintegrale
(ii) Seien x, y, z ∈ Rn und
γ 1 (t) : [0, 1] → Rn ,
t 7→ x + t(y − x),
2
n
t 7→ y + (t − 1)(z − y),
3
n
t 7→ z + (t − 2)(x − z).
γ (t) : [1, 2] → R ,
γ (t) : [2, 3] → R ,
Dann ist γ 1 die direkte Verbindung von x nach y, γ 2 die von y nach z und γ 3 die von z nach x.
γ 1 , γ 2 , γ 3 sind glatt mit Geschwindigkeitsvektoren (γ 1 )0 (t) = y − x, (γ 2 )0 (t) = z − y, (γ 3 )0 (t) =
x − z. Es ist `(γ 1 ) = |y − x|, `(γ 2 ) = |z − y| und `(γ 3 ) = |x − z|. Die zusammengesetzte Kurve
γ 1 + γ 2 ist nur stückweise glatt. Die zusammengesetzte Kurve γ = γ 1 + γ 2 + γ 3 ist stückweise glatt
und geschlossen. γ umläuft das Dreieck mit den Eckpunkten x, y, z. Die Länge von γ ist der Umfang
des Dreiecks
`(γ) = |y − x| + |z − y| + |x − z|.
(iii) n = 3, R > 0. γ : [0, 2π] → R3 sei die Spiralkurve


R cos(t)
γ(t) =  R sin(t)  .
t
γ ist glatt mit Geschwindigkeitsvektor


−R sin(t)
γ 0 (t) =  R cos(t)  ,
1
|γ 0 (t)| =
p
1 + R2
und Länge
`(γ) = 2π
p
1 + R2 .
(iv) Sei f : [a, b] → R eine stetig differenzierbare Funktion. Dann ist die Kurve
t
2
γ : [a, b] → R ,
t 7→
,
f (t)
die den Graph von f abläuft, glatt. Es ist γ 0 (t) =
Z
`(γ) =
1
und γ hat die Länge
f 0 (t)
b
p
1 + (f 0 (t))2 dt.
(14.26)
a
Definition 14.21 Sei γ : [a, b] → Rn eine (stückweise) glatte Kurve und φ : [c, d] → [a, b] stetig differenzierbar mit φ0 (t) > 0 für alle t ∈ (c, d) sowie φ(c) = a und φ(d) = b. Dann ist
γ̄ := γ ◦ φ : [c, d] → Rn , γ̄(t) = γ(φ(t))
ebenfalls eine (stückweise) glatte Kurve. Wir sagen, dass sich γ und γ̄ nur bis auf die Parametrisierung φ
unterscheiden.
Lemma 14.22 Sind γ und γ̄ gleich bis auf Parametrisierung, so haben sie die selbe Länge `(γ) = `(γ̄).
214
Mehrdimensionale Integration
Beweis Sei γ̄ = γ ◦φ. Dann ist nach der Kettenregel γ̄ 0 (t) = φ0 (t)·γ 0 (φ(t)) und mit der Substitutionsregel
Z
d
d
Z
0
0
a
c
c
b
|γ(t)| dt = `(γ).
φ (t) · |γ (φ(t))| dt =
|γ̄ (t)| dt =
`(γ̄) =
Z
0
2


R cos(t)
Beispiel 14.23 Sei γ : [0, 2π] → R3 , γ(t) =  R sin(t)  die Spiralkurve und γ̄ : [0, 1] → R3 , γ̄(t) =
t


2
R cos(2πt )
 R sin(2πt2 ) . Dann ist γ̄ = γ ◦ φ, wobei φ : [0, 1] → [0, 2π], φ(t) = 2πt2 . Es ist also γ̄ 0 (t) =
2πt2


−4πRt sin(2πt2 )
√
 4πRt cos(2πt2 )  und |γ̄ 0 (t)| = 4πt 1 + R2 . Also ist
4πt
Z
`(γ̄) =
1
Z
p
2
|γ̄ (t)| dt = 4π 1 + R
1
0
t dt = 2π
p
1 + R2 .
0
0
Das ist genau der Wert von `(γ), den wir in Beispiel 14.20(iii) ausgerechnet hatten.
Definition 14.24 Sei G ⊂ Rn ein Gebiet und f : G → Rn ein stetiges Vektorfeld. Weiter sei γ : [a, b] →
G eine stückweise glatte Kurve. Wir definieren das Kurvenintegral
Z
Z
b
Z
f (x) dx :=
f dγ :=
γ
f (γ(t)), γ 0 (t) dt.
(14.27)
a
Satz 14.25 Sind γ und γ̄ gleich bis auf Parametrisierung, so ist
Z
Z
f dγ = f dγ̄.
⊥
2
Beispiele 14.26
(i) G = R und f (x) = x
R cos(t)
. Dann ist
R sin(t)
Z
Z
=
−x2
. R > 0 und γ : [0, 2π] → R2 , γ(t) =
x1
2π
f dγ =
γ(t)⊥ , γ 0 (t) dt
0
Z
2π
=
0
= R2
Z
0
−R sin(t)
−R sin(t)
,
dt
R cos(t)
R cos(t)
2π
1 dt = 2πR2 .
14.3
215
Kurvenintegrale
(ii) Sei u : R3 → R stetig differenzierbar und E = grad u. Seien x, y ∈ R3 und γ : [0, 1] → R3 die
direkte Verbindung von x nach y, also γ(t) = x + t(y − x). Dann ist nach der Substitutionsregel
Z
Z 1
E dγ =
hE(γ(t)), γ 0 (t)i dt
0
1
Z
hgrad u(γ(t)), γ 0 (t)i dt
=
0
= u(y) − u(x).
(iii) Sei u : R3 → R stetig differenzierbar und E = grad u. Seien x, y ∈ R3 und γ : [a, b] → R3
eine glatte Kurve mit Anfangspunkt x = γ(a) und Endpunkt y = γ(b). Dann ist nach der mehrdimensionalen Kettenregel (Satz 13.32(ii)) und dem Hauptsatz der Differential- und Integralrechnung
(Satz 7.7)
Z
Z b
Z b
E dγ =
hE(γ(t)), γ 0 (t)i dt =
hgrad u(γ(t)), γ 0 (t)i dt
a
Z
a
b
=
3
X
Di u γ(t) γi0 (t) dt =
Z
a i=1
b
u γ(t) dt
a
= u γ(b) − u γ(a) = u(y) − u(x).
Der Sachverhalt von Beispiel (ii) gilt allgemeiner auch für krummlinige Kurven. Um das hin zu schreiben,
führen wir ein paar Begriffe ein.
Definition 14.27 Sei G ⊂ Rn ein Gebiet sowie f : G → Rn ein stetiges Vektorfeld. Eine stetig differenzierbare Funktion F : G → R heißt Stammfunktion oder Potential von f , falls
f = grad F.
Existiert eine solche Stammfunktion, so heißt das Vektorfeld f integrierbar. f heißt das Gradientenfeld von
F.
Satz 14.28 Sei f : G → Rn ein integrierbares Vektorfeld mit Stammfunktion F . Seien x, y ∈ G und γ eine
stückweise glatte Kurve in G mit Anfangspunkt x und Endpunkt y. Dann gilt
Z
F (y) − F (x) = f dγ.
(14.28)
Speziell ist für jede geschlossene Kurve
Z
f dγ = 0
(14.29)
Eine Umkehrung des Satzes gilt in zusammenhängenden Gebieten.
Definition 14.29 Sei G ⊂ Rn ein Gebiet.
(i) G heißt zusammenhängend, falls je zwei Punkte x, y durch eine Kurve miteinander verbunden werden können.
216
Mehrdimensionale Integration
(ii) G heißt sternförmig, falls es einen Punkt x0 ∈ G gibt, sodass für jeden Punkt y ∈ G die Verbindungsgerade von x0 nach y ganz in G liegt. Ein sternförmiges Gebiet ist natürlich immer zusammenhängend.
(i) Zusammenhängend und sternförmig sind: Kreis, Quader, Zylinder und G = Rn .
(ii) Das Gebiet G = (0, 1) × (0, 1) ∪ (3, 4) × (0, 1) ist nicht zusammenhängend.
Beispiele 14.30
(iii) Das Gebiet G = R2 \ {0} ist zusammenhängend, aber nicht sternförmig: Für kein x0 ∈ G liegt die
Verbindungsgerade zu y = −x0 nicht ganz in G, weil sie durch 0 geht.
(iv) Der Halbkreisring mit Radien 0 < L < R
G = x ∈ R2 : L ≤ |x| ≤ R, x2 ≥ 0
ist zusammenhängend, aber nicht sternförmig.


f1
 
Satz 14.31 Sei G ⊂ Rn ein zusammenhängendes Gebiet und f =  ...  : G → Rn ein stetiges Vektorfn
feld. Die folgenden drei Aussagen sind gleichwertig.
(i) f ist integrierbar.
(ii) Für je zwei stückweise glatte Kurven γ und γ̄ in G mit den selben Anfangs- und Endpunkten ist
Z
Z
f dγ = f dγ̄.
(iii) Für jede stückweise glatte geschlossene Kurve γ in G ist
Z
f dγ = 0.
Wir können dann eine Stammfunktion F angeben, indem wir einen beliebigen Punkt x0 ∈ G fest wählen,
für den wir F (x0 ) = 0 setzen. Für y ∈ G und eine beliebige Kurve stückweise glatte Kurve in G von x0
nach y setzen wir
Z
F (y) := f dγ.
(14.30)
Ist speziell G = Rn , so können wir x0 = 0 wählen. Es ist dann (mit γ als achsenparallelem Streckenzug)
Z x1
Z x2
Z xn
F (x) =
f1 (t, 0 . . . , 0) dt +
f2 (x1 , t, 0, . . . , 0) dt + . . . +
fn (x1 , . . . , xn−1 , t) dt. (14.31)
0
0
0
Wichtig ist an dieser Stelle festzuhalten, dass der Wert des Integrals in (14.30) nicht von der Wahl von γ
abhängt. Das ist genau die Aussage (ii).
R
Beweis Gilt (i) und ist γ eine Kurve von x nach y, so istR f dγ = F (y) − F (x) unabhängig von der
speziellen Wahl von γ. Ist γ geschlossen, so ist x = y, also f dγ = F (y) − F (y) = 0
14.3
217
Kurvenintegrale
Gilt (ii), so wird durch (14.30) eine Stammfunktion definiert, also ist f integrierbar. Sind γ und γ̄ zwei
Kurven von x nach y, so nennen wir γ̄ − die Kurve, die den Weg von γ̄ in umgekehrter Richtung durchläuft.
Es ist dann γ + γ̄ − geschlossen (mit Anfangs- und Endpunkt x) und es gilt
Z
Z
Z
Z
Z
f d(γ + γ̄ − ) = f dγ + f dγ̄ − = f dγ − f dγ̄.
Nach Voraussetzung ist der Ausdruck dann 0.
Gelte nun (iii). Sind γ und γ̄ zwei Kurven von
R x nach y, so bilden wirR wie obenR die geschlossene Kurve
γ + γ̄ − und schließen aus der Voraussetzung f d(γ + γ̄ − ) = 0, dass f dγ = f dγ̄.
2
Beispiele 14.32
(i) Sei f (x) = x. Sei γ : [0, 1] → Rn eine beliebige stückweise glatte geschlossene
Kurve in Rn . Dann ist
Z
Z 1
f dγ =
hf (γ(t)), γ 0 (t)i dt
0
1
Z
hγ(t), γ 0 (t)i dt
Z 1 1 d
2
|γ(t)|
dt
=
dt
0 2
1
1
= |γ(t)|2 = 0,
2
0
=
0
weil γ geschlossen ist.
Ist nun γ : [0, 1] → Rn eine beliebige stückweise glatte Kurve von γ(0) = x nach γ(1) = y, so ist
wie oben
Z
1
1
1
|γ(1)|2 − |γ(0)|2 = |y|2 − |x|2 .
f dγ =
2
2
2
Also ist (mit x0 = 0)
1
F (y) = |y|2
2
eine Stammfunktion von f . In der Tat ist grad F (x) = x = f (x).
−x2
⊥
(ii) n = 2 und f (x) = x =
. Entlang der geschlossenen Kurve
x1
cos(t)
γ : [0, 2π] → R2 ,
t 7→
sin(t)
ist nach Beispiel 14.26(i)
Z
f dγ = 2π.
Also ist f nicht integrierbar.
Die Bedingungen des Satzes sind in vielen Fällen schwierig nachzuprüfen, weil man alle geschlossenen
Kurven überprüfen muss. Einfacher wäre es, wenn man die Integrierbarkeit aus lokalen Eigenschaften des
Vektorfeldes ableiten könnte.
 
f1
 .. 
Sei im folgenden f =  .  ein stetig differenzierbares Vektorfeld im Gebiet G ⊂ Rn . Ist f integrierbar
fn
f = grad F , dann gilt nach dem Satz von Schwarz (Satz 13.14), dass die zweiten partiellen Ableitungen
218
Mehrdimensionale Integration
von F vertauschbar sind
Di Dj F = Dj Di F,
i, j = 1, . . . , n.
Also gilt
dfj (x)
dfi (x)
=
,
dxj
dxi
i, j = 1, . . . , n.
(14.32)
Für n = 3 ist dies gleichwertig mit
rot f = 0.
Ein integrierbares Vektorfeld in R3 ist also stets wirbelfrei.
Die Umkehrung gilt nur unter zusätzlichen Annahmen an die Geometrie von G.
Satz 14.33 Sei G ⊂ Rn sternförmig und f : G → Rn ein stetig differenzierbares Vektorfeld. Dann ist f
genau dann integrierbar, wenn (14.32) gilt. Im Fall n = 3 ist das gleichwertig zu rot f = 0.
Beispiele 14.34
(i) Sei G = Rn und f (x) = x. Dann ist
dfi (x)
1,
=
0,
dxj
i=j
i 6= j.
Also gilt (14.32) und f ist integrierbar.
 


0
−x2
(ii) n = 3, r := 0 und f (x) = r × x =  x1  . Dann ist rot f = 2r (siehe Beispiel 13.36(ii)), also
1
0
R
f nicht integrierbar. In der Tat können wir eine geschlossene Kurve γ angeben, sodass f dγ 6= 0.
Sei


cos(t)
γ : [0, 2π] → R3 ,
t 7→  sin(t)  .
0
Dann ist
Z
Z
 
+
*
− sin(t)
− sin(t)
 cos(t)  ,  cos(t)  dt = 2π.
0
0
2π
f dγ =
0
2
(iii) n = 2, G = R , f (x) =
sin(x2 )ex1
. Es ist
cos(x2 )ex1
D2 f1 (x) = cos(x2 )ex1 = D1 f2 (x).
Also ist f integrierbar. Wir setzen
Z x2 t
x1
dt +
f2
dt
0
t
0
0
Z x1
Z x2
=
sin(0)et dt +
cos(t)ex1 dt
Z
F (x) =
x1
f1
0
= sin(x2 )ex1 .
0
14.4
219
Oberflächenintegrale
(iv) n = 2, G = R2 \ {0},
f (x) =
x⊥
=
|x|2
−x2
x1
.
|x|2
f ist beispielsweise das Magnetfeld eines linienförmigen Leiters in x3 –Richtung (Gesetz von Biot–
Savart). Dann ist
x22 − x21
−|x|2 + 2x22
=
D1 f2 =
|x|4
|x|4
D2 f1 =
|x|2 − 2x21
x22 − x21
=
.
|x|4
|x|4
Jedoch gilt beispielsweise für die geschlossene Kurve γ : [0, 2π] → R2 , t 7→
Z
Z
2π
f dγ =
0
cos(t)
, dass
sin(t)
− sin(t)
− sin(t)
,
dt = 2π.
cos(t)
cos(t)
Mithin ist f nicht integrierbar. Ist das ein Widerspruch zu Satz 14.33? Nein, denn das Gebiet G ist
nicht sternförmig.
14.4
Oberflächenintegrale
Wir wollen hier den Fluss von Vektorfeldern durch Oberflächen von einfachen Körpern K ⊂ R3 berechnen.
Grob gesprochen handelt es sich dabei um die Anzahl“ der Kraftlinien, die aus K austreten.
”
Im folgenden sei K ⊂ R3 stets ein endlich großer, geometrisch einfacher Körper, zum Beispiel ein Quader
Qba := [a1 , b1 ] × [a2 , b2 ] × [a3 , b3 ],
(14.33)
eine Kugel um x0 ∈ R3 mit Radius R > 0
BR,x0 = x ∈ R3 : |x − x0 | ≤ R ,
oder ein Zylinder mit Höhe H und Radius R
ZH,R = x ∈ R3 : x21 + x22 ≤ R2 , x3 ∈ [0, H] .
(14.34)
(14.35)
Wir wollen hier nicht die größtmögliche Allgemeinheit anstreben, sondern die ohnehin schwierigen Ideen
in einfachen Situationen kennen lernen.
Mit ∂K bezeichnen wir den Rand von K, also die Oberfläche, die K von R3 \ K trennt. Außer an den
Kanten gehört zu jedem Punkt x ∈ ∂K ein Vektor n(x) ∈ R3 , |n(x)| = 1, der senkrecht auf ∂K steht und
nach außen zeigt. Wir nennen n(x) den Normalenvektor von K in x.
Wir betrachten im folgenden stets ein stetiges Vektorfeld f : G → R3 , wobei K ⊂ G ⊂ R3 .
14.4.1
Der Quader
Wir betrachten zunächst einen Quader
K = Qba := [a1 , b1 ] × [a2 , b2 ] × [a3 , b3 ].
220
Mehrdimensionale Integration
Dann besteht ∂K aus sechs Flächenstücken F1 , . . . , F6
 
−1
n(x) =  0
0
 
1
n(x)
= 0
0
 
0
n(x) = −1
0
 
0
n(x)
= 1
0
 
0
n(x) =  0
−1
 
0
n(x) = 0 .
1
F1 := {a1 } × [a2 , b2 ] × [a3 , b3 ],
F2 := {b1 } × [a2 , b2 ] × [a3 , b3 ],
F3 := [a1 , b1 ] × {a2 } × [a3 , b3 ],
F4 := [a1 , b1 ] × {b2 } × [a3 , b3 ],
F5 := [a1 , b1 ] × [a2 , b2 ] × {a3 },
F6 := [a1 , b1 ] × [a2 , b2 ] × {b3 },
Wir setzen (wobei wir f (x1 , x2 , x3 ) = f (x) schreiben)
Z
b2
Z
hf (x), n(x)i dx =
F1
b3
Z
dx3 hf (a1 , x2 , x3 ), n(a1 , x2 , x3 )i .
dx2
a2
(14.36)
a3


−1
Wegen n(a1 , x2 , x3 ) =  0 ergibt sich
0
Z
b2
Z
hf (x), n(x)i dx = −
F1
Z
a2
Analog definieren wir die anderen Integrale
Z
Z
R
Fi
F4
Z
b3
dx3 hf (x1 , b2 , x3 ), n(x1 , b2 , x3 )i
dx1
a1
Z b1
=
a3
Z b3
dx1
a1
dx3 f1 (a1 , x2 , x3 ).
a3
hf (x), n(x)i dx, beispielsweise
b1
hf (x), n(x)i dx =
b3
dx2
(14.37)
dx3 f2 (x1 , b2 , x3 ).
a3
Als Oberflächenintegral über die ganze Quaderoberfläche wollen wir die Summe der sechs einzelnen Integrale verstehen.
14.4
221
Oberflächenintegrale
Definition 14.35 Für einen Quader K = Qba definieren wir das Oberflächenintegral
Z
hf (x), n(x)i dx =
∂Qba
6 Z
X
hf (x), n(x)i dx
i=1 Fi
Z b2
b3
Z
dx3 [f1 (b1 , x2 , x3 ) − f1 (a1 , x2 , x3 )]
dx2
=
a2
Z b1
a3
Z b3
dx3 [f2 (x1 , b2 , x3 ) − f2 (x1 , a2 , x3 )]
dx1
+
a1
Z b1
+
(14.38)
a3
Z b2
dx2 [f3 (x1 , x2 , b3 ) − f3 (x1 , x2 , a3 )].
dx1
a1
a2
Beispiel 14.36 f (x) = x. Dann ist
Z
Z
hf (x), n(x)i dx +
hf (x), n(x)i dx
F1
F2
b2
Z
=
b3
Z
dx3 (b1 − a1 )
dx2
a2
a3
= (b1 − a1 )(b2 − a2 )(b3 − a3 ).
Analog erhält man
Z
Z
hf (x), n(x)i dx +
F3
hf (x), n(x)i dx
F4
Z
Z
hf (x), n(x)i dx
hf (x), n(x)i dx
=
F5
F6
= (b1 − a1 )(b2 − a2 )(b3 − a3 ).
Insgesamt also
Z
∂Qba
hx, n(x)i dx = 3 · vol(Qba ),
(14.39)
wobei
vol(Qba ) = (b1 − a1 )(b2 − a2 )(b3 − a3 )
das Volumen von Qba ist.
Um nun auch für andere Körper, beispielsweise Kugeln, ein Oberflächenintegral zu definieren, nähern wir
∂K durch N ebene Flächenstücke F1N , F2N , . . . , FNN an
∂K ≈ F1N ∪ . . . ∪ FNN .
Wir nehmen an, dass die Flächeninhalte |FiN |, i = 1, . . . , N der Flächenstücke immer kleiner werden und
definieren dann:
Definition 14.37 (Oberflächenintegral)
Z
hf (x), n(x)i dx := lim
∂K
N →∞
N Z
X
i=1
FiN
hf (x), n(x)i dx.
222
Mehrdimensionale Integration
Praktisch berechnen kann man solche Integrale in Fällen, wo man ∂K in einfache Teilstücke zerlegen kann,
die man parametrisieren kann. Das haben wir beim Quader schon gemacht.
14.4.2
Der Zylinder
Wir betrachten nun den Zylinder
K = ZH,R = x ∈ R3 : x21 + x22 ≤ R2 , x3 ∈ [0, H] .
Der Rand ∂ZH,R besteht aus dem Boden B, dem Deckel D und dem Mantel M
B = x ∈ R3 : x21 + x22 ≤ R2 , x3 = 0
D = x ∈ R3 : x21 + x22 ≤ R2 , x3 = H
M = x ∈ R3 : x21 + x22 = R2 , x3 ∈ [0, H] .
(14.40)
Es ist

0
n(x) =  0  für x ∈ B,
−1
 
0
n(x) = 0 für x ∈ D,
1


x1 /R
n(x) = x2 /R für x ∈ M.
0

Boden und Deckel parametrisieren wir durch die ebenen Polarkoordinaten
φB : [0, R] × [0, 2π) → R3 ,
φD : [0, R] × [0, 2π) → R3 ,


r cos(ϕ)
(r, ϕ) 7→  r sin(ϕ) 
0


r cos(ϕ)
(r, ϕ) 7→  r sin(ϕ)  .
H
(14.41)


R cos(ϕ)
(h, ϕ) 7→  R sin(ϕ)  .
h
(14.42)
Den Mantel parametrisieren wir durch
φM : [0, H] × [0, 2π) → R3 ,
14.4
223
Oberflächenintegrale
Es ist dann
Z
Z
hf (x), n(x)i dx =
R
dϕ hf (φB (r, ϕ)), n(φB (r, ϕ))i
r dr
0
0
B
R
Z
=−
Z
2π
Z
dϕf3 (r cos(ϕ), r sin(ϕ), 0)
r dr
0
R
Z
hf (x), n(x)i dx =
D
2π
Z
Z
0
2π
dϕ hf (φD (r, ϕ)), n(φD (r, ϕ))i
r dr
0
0
R
Z
=
Z
2π
r dr
dϕ f3 (r cos(ϕ), r sin(ϕ), H)
0
Z
0
H
Z
hf (x), n(x)i dx = R
M
2π
Z
dh
dϕhf (φM (h, ϕ)), n(φM (h, ϕ))i
0
0
H
Z
=R
dh
0
H
Z

cos(ϕ) +
f R cos(ϕ), R sin(ϕ), h ,  sin(ϕ) 
0
dϕ
0
=R
2π
Z
dϕ f1 R cos(ϕ), R sin(ϕ), h cos(ϕ) + f2 R cos(ϕ), R sin(ϕ), h sin(ϕ).
dh
0

*
2π
Z
0
(14.43)
Wir fassen das Ergebnis in einem Satz zusammen.
Satz 14.38 Das Oberflächenintegral über den Zylinder ist
Z
Z
Z
Z
hf (x), n(x)i dx = hf (x), n(x)i dx + hf (x), n(x)i dx +
hf (x), n(x)i dx
∂ZH,R
D
Z
B
R
=
Z
dϕ f3 (r cos(ϕ), r sin(ϕ), H) − f3 (r cos(ϕ), r sin(ϕ), 0)
r dr
0
M
2π
0
Z
+R
H
Z
dh
0
2π
h
dϕ f1 R cos(ϕ), R sin(ϕ), h cos(ϕ)
0
i
+ f2 R cos(ϕ), R sin(ϕ), h sin(ϕ) .
(14.44)
Beispiele 14.39
Also ist


 
−x2
0
(i) r = 0 und f (x) = r × x =  x1 . Dann ist
1
0
*−x  0+
2
für x ∈ D
hf (x), n(x)i =  x1  , 0 = 0,
0
1
*−x   0 +
2
für x ∈ B
hf (x), n(x)i =  x1  ,  0  = 0,
0
−1
*−x  x /R+
2
1
für x ∈ M
hf (x), n(x)i =  x1  , x2 /R = 0.
0
0
Z
hr × x, n(x)i dx = 0.
∂ZH,R
(14.45)
224
Mehrdimensionale Integration
(ii) f (x) = x. Dann ist
für x ∈ D
für x ∈ B
hf (x), n(x)i = x3 = H
hf (x), n(x)i = −x3 = 0
1
hf (x), n(x)i = (x21 + x22 ) = R.
R
für x ∈ M
Also ist
Z
hf (x), n(x)i dx = 0
B
Z
R
Z
hf (x), n(x)i dx =
Z
Z
Z
hf (x), n(x)i dx = R
H
Z
2π
dh
dϕ R = 2πR2 H.
0
0
M
dϕ H = πR2 H,
0
0
D
2π
r dr
Insgesamt ist also
Z
hx, n(x)i dx = 3 · vol(ZH,R ),
(14.46)
∂ZH,R
wobei
vol(ZH,R ) = πR2 H
das Volumen des Zylinders ist.
14.4.3
Die Kugel
Ein wichtiger Körper ist die Kugel um x0 mit Radius R
K = BR,x0 = x ∈ R3 : |x − x0 | ≤ R .
Wir parametrisieren
∂BR,x0 = x ∈ R3 : |x − x0 | = R
mit den Kugelkoordinaten


R sin(ϑ) cos(ϕ)
(ϑ, ϕ) 7→ x +  R sin(ϑ) sin(ϕ)  .
R cos(ϑ)
3
0
φ : [0, π] × [0, 2π) → R ,
(14.47)
Das infinitesimale Volumenelement (Oberflächenelement) dφ(ϑ, ϕ) hat die Größe
dφ(ϑ, ϕ) = R sin(ϑ) dϑdϕ.
Der Normalenvektor ist
n(x) =
x − x0
.
R
Wir erhalten
Satz 14.40 Das Oberflächenintegral über die Kugel ist
Z
Z π
Z 2π
hf (x), n(x)i dx =
sin(ϑ) dϑ
dϕhf (φ(ϑ, ϕ)), (φ(ϑ, ϕ) − x0 )i
∂BR,x0
0
= R2
0

 

* 
R sin(ϑ) cos(ϕ)
sin(ϑ) cos(ϕ) + (14.48)
π
2π
sin(ϑ) dϑ
dϕ f x0 +  R sin(ϑ) sin(ϕ)  ,  sin(ϑ) sin(ϕ)  .
0
0
R cos(ϑ)
cos(ϑ)
Z
Z
14.4
225
Oberflächenintegrale
Beispiele 14.41
2
(i) f (x) = x, x0 = 0. Dann ist hx, n(x)i = RR = R, also
Z 2π
Z
Z π
dϕ R
sin(ϑ) dϑ
hx, n(x)i dx = R2
0
0
∂BR,x0
= 2πR
3
Z
π
(14.49)
3
sin(ϑ) dϑ = 4πR = 3 · vol(BR,0 ),
0
wobei
vol(BR,0 ) =
4 3
πR
3
das Kugelvolumen ist.
(ii) Sei x0 = 0 und f (x) die elektrische Feldstärke einer Punktladung Q in 0. Dann ist |f (x)| =
und f (x) hat die Richtung von x, also f (x) =
konstante. Dann ist für x ∈ ∂BR,0
Q
4πε0 |x|3 x.
Q
4πε0 |x|2
Dabei bezeichnet ε0 die elektrische Feld-
Q
.
4πε0 R2
Damit ist für jedes R > 0 der elektrische Fluss durch die Kugeloberfläche mit Radius R
Z
Z π
Z 2π
Q
= Q.
ε0 hf (x), n(x)i dx = ε0 R2
sin(ϑ) dϑ
dϕ
2
4πε
0R
∂BR,x0
0
0
hf (x), n(x)i =
14.4.4
(14.50)
Der Gauß’sche Integralsatz
R
Wir haben im letzten Beispiel gesehen, dass der elektrische Fluss ∂BR,x hf (x), n(x)i dx, der von einer
0
Punktladung im Ursprung ausgeht und durch die Kugeloberfläche tritt, nicht vom Radius der Kugel abhängt.
Tatsächlich hängt er nicht einmal von der Gestalt des Körpers (also hier der Kugel) ab, wenn nur 0 im
Inneren K \ ∂K liegt. Im folgenden Satz verzichten wir der Einfachheit halber auf die physikalischen
Konstanten.
Satz 14.42
(i) Für jeden (hinreichend glatt berandeten) Körper K ⊂ R3 mit 0 ∈ K \ ∂K gilt
Z x
, n(x) dx = 4π.
|x|2
∂K
(ii) Für jeden Körper K mit 0 6∈ K ∪ ∂K gilt
Z ∂K
x
, n(x) dx = 0.
|x|2
Als Verallgemeinerung des vorangehenden Satzes kommen wir jetzt zum Hauptsatz über Oberflächenintegrale, dem Gauß’schen Integralsatz. Dieser stellt die Verallgemeinerung des Hauptsatzes der Differentialund Integralrechnung dar und setzt das Oberflächenintegral eines stetig differenzierbaren Vektorfeldes f
mit dem Volumenintegral der Divergenz div f in Beziehung (siehe Definition 13.35).
Satz 14.43 (Gauß’scher Integralsatz) Sei f : R3 → R3 ein stetig differenzierbares Vektorfeld und K ⊂
R3 ein hinreichend glatt berandeter Körper. Dann gilt
Z
Z
hf (x), n(x)i dx =
div f (x) dx.
(14.51)
∂K
K
226
Mehrdimensionale Integration
Beispiele 14.44
(i) Für f (x) = x ist div f = 3. Also ist
Z
Z
hx, n(x)i dx = 3 · vol(K) := 3
1 dx.
∂K
K
Dieses Ergebnis hatten wir in (14.39), (14.46) und (14.49) schon für die Spezialfälle Quader, Zylinder
und Kugel von Hand nachgerechnet.
(ii) Sei r ∈ R3 und f (x) = r × x. Dann ist (nach Beispiel 13.36(ii)) div f = 0 und
Z
hr × x, n(x)i dx = 0.
∂K
Aus diese Formel hatten wir für den Zylinder schon in (14.45) ausgerechnet.
(iii) Sei g : R → R stetig differenzierbar mit Ableitung g 0 und


g(x1 )
f (x) =  0 
0
sowie K = Qba = [a1 , b1 ] × [0, 1] × [0, 1]. Dann ist
div f (x) = g 0 (x1 )
und
Z
Z
1
hf (x), n(x)i dx =
∂K
1
Z
dx3 (f1 (b, x2 , x3 ) − f1 (a, x2 , x3 ))
dx2
0
Z
0
1
=
1
Z
dx3 (g(b) − g(a))
dx2
0
0
= g(b) − g(a)
Z b
=
g 0 (x1 ) dx1
a
Z
=
b
Z
dx1
a
1
Z
dx2
0
1
0
Z
dx3 g (x1 ) =
0
div f (x) dx.
K
Also ist der Gauß’sche Integralsatz tatsächlich eine Verallgemeinerung des Hauptsatzes der Differentialund Integralrechnung.
Kapitel 15
Appendix: Alternativer Zugang zu
Linearen Differentialgleichungen
Wir untersuchen in diesem Kapitel, wie wir mit Hilfe des Matrizenkalküls lineare Systeme gekoppelter Differenzialgleichungen erster Ordnung sowie lineare Differenzialgleichungen höherer Ordnung systematisch
lösen können. Dabei werden letztere auf den Fall der Systeme von Differenzialgleichungen erster Ordnung
zurückgeführt.
15.1
Systeme erster Ordnung
Wir betrachten eine Folge von Reaktionen erster Ordnung A −→ B −→ C. Sei
y1 (t) =
y2 (t) =
y3 (t) =
Konzentration von Stoff A zur Zeit t,
Konzentration von Stoff B zur Zeit t,
Konzentration von Stoff C zur Zeit t.
Die Reaktionskonstanten seien k1 , k2 > 0. Dann können wir die Differenzialgleichungen aufstellen
y10 (t) =
y20 (t) =
y30 (t) =
Wir führen die kompakte Notation ein


y1 (t)
y(t) = y2 (t) ,
y3 (t)
−k1 y1 (t)
k1 y1 (t) − k2 y2 (t)
k2 y2 (t)
(15.1)


−k1
0 0
A =  k1 −k2 0  .
0
k2 0
Damit wird aus (15.1)
y 0 = Ay.
(15.2)
Formal könnten wir die Lösung in direkter Verallgemeinerung der eindimensionalen Situation aus Abschnitt
8.2.6 sofort angeben: y(t) = etA y(0). Problem dabei: Die Exponentialfunktion etA wäre zu definieren. Das
ist möglich, aber etwas aufwendig. Daher gehen wir etwas anders vor und verwenden einen geschickten
Ansatz, der sich ebenfalls am eindimensionalen Fall orientiert. Zunächst beschreiben wir die allgemeine
227
228
Appendix: Alternativer Zugang zu Linearen Differentialgleichungen
Situation, dabei ist es sinnvoll, etwas allgemeiner vorzugehen und auch komplexe Differenzialgleichungen
zu betrachten.
Mit K bezeichnen wir die Menge R bzw. C der reellen bzw. komplexen Zahlen und mit M (m, n; K) die
Menge der m × n-Matrizen über K.
 
b1
 .. 
Definition 15.1 (1) Sei I ⊂ R ein Intervall, d ∈ N, A ∈ M (d, d; K), und sei b =  .  : I → Kd eine
bd
vektorwertige Funktion aus stetigen Abbildungen b1 , . . . , bd : I → K. Dann heißt das Gleichungssystem
y10 (t)
..
.
=
yd0 (t)
= ad1 y1 (t)
a11 y1 (t)
..
.
+ · · · + a1d yd (t)
..
..
.
.
+ · · · + add yd (t)
+
b1 (t)
..
.
(15.3)
+ bd (t)
oder in Kurzfassung als Matrixgleichung
y 0 (t) = A · y(t) + b(t)
(15.3*)
(System) lineare(r) Differenzialgleichung(en) 1. Ordnung mit konstanten Koeffizienten.
Die Ableitung in der Matrizenschreibweise ist also koordinatenweise zu interpretieren, darüberhinaus bei
K = C jeweils für die Real- und die Imaginärteile getrennt.
(2) Die DGL (15.3) heißt homogen, falls b ≡ 0 ist (d.h. b(t) = 0 für alle t ∈ I), andernfalls heißt sie
inhomogen.
(3) Die DGL (15.3*) zusammen mit der Anfangsbedingung
y(t0 ) = y 0
(15.4)
heißt Anfangswertproblem (AWP).
(4) Sei C1 (I, Kd ) der K-Vektorraum der (koordinatenweise) stetig differenzierbaren Abbildungen von I
in Kd . Unter einer Lösung der DGL bzw. des AWP versteht man jede differenzierbare Funktion ϕ ∈
C1 (I, Kd ) , die (15.3*) bzw. (15.3*) und (15.4) an Stelle von y erfüllt.
Damit gilt:
Satz 15.2 Die lineare DGL 1. Ordnung 15.3(∗) besitzt zu jeder Anfangsbedingung (t0 , y 0 ) ∈ I × Kd
genau eine Lösung x ∈ C1 (I, Kd ) mit x(t0 ) = y 0 .
Satz 15.3 Sei I ⊂ R ein Intervall und A ∈ M (d, d; K). Dann bildet die Menge L0 aller Lösungen
y ∈ C1 (I, Kd ) der homogenen linearen DGL zur DGL (15.3), also von
y0 = A · y ,
einen d-dimensionalen K-Vektorraum (bzgl. der koordinatenweisen Operationen).
Für ϕ1 , . . . , ϕk ∈ L0 sind äquivalent:
(15.5)
15.1
229
Systeme erster Ordnung
1. ϕ1 , . . . , ϕk sind über K linear unabhängig.
2. Es gibt ein t0 ∈ I , sodass gilt:
ϕ1 (t0 ), . . . , ϕk (t0 ) ∈ Kd sind linear unabhängig.
3. Für alle t ∈ I gilt: ϕ1 (t), . . . , ϕk (t) ∈ Kd sind linear unabhängig.
Beweis (a) Offenbar ist L0 ein K-Vektorraum, insbesondere 0 ∈ L0 .
(3) ⇒ (2) ⇒ (1) : trivial.
(1) ⇒ (3) : Seien t ∈ I , λ1 , . . . , λk ∈ K mit λ1 ϕ1 (t) + · · · + λk ϕk (t) = 0 .
=⇒
ϕ := λ1 ϕ1 + · · · + λk ϕk ∈ L0 ,
ϕ(t) = 0
für dieses t .
Nach 15.2 gibt es genau ein ϕ0 ∈ L0 mit ϕ0 (t) = 0 . Da die konstante Funktion 0 diese Eigenschaften
hat, muss ϕ0 ≡ 0 sein.
(1)
=⇒
ϕ ≡ 0 =⇒ λ1 = · · · = λk = 0 .
(b) Noch zu zeigen ist dim L0 = d :
Seien e1 , . . . , ed die Einheitsvektoren des Kd sowie t0 ∈ I .
ϕj (t0 ) = ej (j = 1, . . . , d) .
(2)⇒(1)
=⇒
15.2
=⇒ Es gibt ein ϕj ∈ L0 mit
ϕ1 , . . . , ϕd linear unabhängig =⇒ dim L0 ≥ d .
Umgekehrt sind für ϕ ∈ L0 die Vektoren ϕ(t0 ), e1 = ϕ1 (t0 ), . . . , ed = ϕd (t0 ) ∈ Kd linear abhängig.
(1)⇒(3)
=⇒
ϕ, ϕ1 , . . . , ϕd sind linear abhängig. =⇒
2
dim L0 = d .
Definition 15.4 Jede Basis von L0 heißt ein Lösungsfundamentalsystem der homogenen linearen DGL
in Satz 15.3.
Wegen 15.3 ist damit nach 10.15 und 11.3 klar:
Korollar 15.5 Genau dann bilden ϕ1 , . . . , ϕd ∈ L0 ein Lösungsfundamentalsystem, wenn für ein (oder
für alle) t ∈ I die zugehörige Wronski-Determinante
det ϕ1 (t), . . . , ϕd (t) 6= 0
ist.
Beispiel 15.6 Betrachte für ω ∈ R \ {0} die homogene lineare Differentialgleichung
x01 = −ωx2
0 −ω
0
⇐⇒
x =
x.
x02 =
ωx1
ω
0
Offenbar sind
ϕ1 : t 7→
cos ωt
sin ωt
,
ϕ2 : t 7→
− sin ωt
cos ωt
Lösungen auf R . Sie bilden ein Lösungsfundamentalsystem wegen dim L0 = 2 und, weil für die zugehörige Wronski-Determinante gilt:
cos ωt − sin ωt
det
= cos2 ωt + sin2 ωt = 1 .
sin ωt
cos ωt
230
Appendix: Alternativer Zugang zu Linearen Differentialgleichungen
Wie man aus einer Lösung der inhomogenen linearen Differentialgleichung (15.3) und einem Lösungsfundamentalsystem der zugehörigen homogenen linearen DGL (15.5) alle Lösungen von (15.3) erhält, erklärt
der folgende Satz.
Satz 15.7 Ist ψ0 eine Lösung der inhomogenen linearen Differentialgleichung 15.1(∗) bzw. 15.1(∗∗) und
L0 der Lösungsvektorraum der zugehörigen homogenen linearen Differentialgleichung, so ist die Menge
aller Lösungen der inhomogenen linearen Differentialgleichung gegeben durch
L = {ψ0 + ϕ : ϕ ∈ L0 } .
2
Beweis: klar.
Jetzt bleiben noch zwei Probleme zu klären:
1. Wie kann man ein Lösungsfundamentalsystem der homogenen linearen DGL erhalten?
2. Wie gelangt man überhaupt zu einer Lösung der inhomogenen linearen Differentialgleichung?
15.1.1
Lösung der homogenen linearen Differentialgleichung y0 = A · y
Vorüberlegungen. Gegeben sei ein reelles Intervall I und die für A ∈ M (d, d; K) definierte homogene
lineare Differentialgleichung mit konstanten Koeffizienten (s. (15.5))
y0 = A · y .
(15.6)
Im Falle d = 1 und K = R hat man den Spezialfall
y0 = a · y
(15.7)
mit a ∈ R . Diese DGL hat nach Abschnitt 8.2.6 die Lösungsmenge
L0 = {ϕc : I → R , t 7→ c · eat : c ∈ R} .
In Anlehnung an dieses Ergebnis versuchen wir für (15.6) bei allgemeinem d für K = C den Lösungsansatz
y : t 7→ eλt · c = eµt (cos νt + i sin νt) · c mit λ = µ + iν ∈ C , c ∈ Cd .
(15.8)
Frage: Wie müssen λ, c, A zusammenhängen, falls der Ansatz überhaupt etwas bringen sollte?
Differenzieren von (15.8) liefert wie im Reellen
y 0 (t)
= µ eµt (cos νt + i sin νt) · c + eµt (−ν sin νt + iν cos νt) · c
= (µ + iν)eµt (cos νt + i sin νt) · c = λ eλt · c .
Einsetzen in (15.6) ergibt
λ c eλt = A · c eλt .
⇐⇒
Damit erhält man sofort den ersten Teil des folgenden Satzes:
λc = A · c .
15.1
231
Systeme erster Ordnung
Satz 15.8 (1) Die Funktion t 7→ c · eλt ist genau dann nicht-triviale Lösung (d.h. 6= 0) von (15.6), wenn
λ Eigenwert von A und wenn c ein zugehöriger Eigenvektor ist.
(2) Sind c1 , . . . , cd ∈ Cd d linear unabhängige Eigenvektoren von A mit zugehörigen Eigenwerten
λ1 , . . . , λd (z.B., wenn alle λj verschieden sind), so bilden die Funktionen
t 7→ cj eλj t
(j = 1, . . . , d)
ein Lösungsfundamentalsystem von (15.6).
Beweis (2) Auswertung der Funktionen bei t = 0 ergibt die nach Voraussetzung linear unabhängigen
Vektoren
c1 , . . . , cd .
Nach Satz 15.3 sind dann die betrachteten Lösungsfunktionen linear unabhängig und bilden daher ein
Lösungsfundamentalsystem.
2
Bemerkung 15.9 (Lösungsfundamentalsystem bei mehrfachen Eigenwerten)
Sei λ ein Eigenwert von A der Ordnung k > 0 . Bei k > 1 kann man nicht ohne Zusatzvoraussetzungen
an A erwarten, daß es auch k linear unabhängige Eigenvektoren zu λ gibt. Man kann aber zeigen:
(1) Zum Eigenwert λ von A der Ordnung k > 0 gibt es komplexwertige Polynomfunktionen (komponentenweise betrachtet) Ph : R → Cd (h = 1, . . . , k) vom Grade ≤ k − 1 , so daß die Funktionen
t 7→ Ph (t) · eλt
(h = 1, . . . , k)
linear unabhängige Lösungen von (15.6) sind. Sind alle Koeffizienten von A sowie λ reell, so kann man
auch die Polynome Ph mit reellen Koeffizienten wählen.
(2) Wählt man für jeden Eigenwert λ von A eine seiner Ordnung entsprechende Anzahl linear unabhängiger Lösungen gemäß (1) (bei k = 1 ist das gerade eine), so erhält man insgesamt ein Lösungsfundamentalsystem von (15.6).
Bemerkung 15.10 (reelles Lösungsfundamentalsystem).
Jede reelle homogene lineare Differentialgleichung mit konstanten Koeffizienten
y0 = A · y
mit A ∈ M (d, d; R)
(15.9)
läßt sich auch als komplexe Differentialgleichung auffassen.
Gesucht: reelles Lösungsfundamentalsystem. Man kann zeigen, dass man auf folgende Weise zu einem
reellen Lösungsfundamentalsystem von (15.9) gelangt:
(1) Ist λ reeller Eigenwert von A , so wähle man zu λ gemäß 15.9(1) reellwertige (über C und damit
auch über R) linear unabhängige Lösungen entsprechend der Vielfachheit von λ .
(2) Sind λ und λ̄ konjugiert komplexe Eigenwerte, so wähle man zu einem dieser beiden Eigenwerte,
etwa λ = µ + iν , gemäß 15.8 bzw. 15.9(1) linear unabhängige komplexwertige Lösungen entsprechend
der Vielfachheit k von λ . Die insgesamt 2k Real- und Imaginärteile dieser komplexen Lösungen sind
linear unabhängige reelle Lösungen von (15.9).
(3) Zusammengenommen ergeben die durch (1) und (2) erhaltenen Lösungen ein reelles Lösungsfundamentalsystem.
232
Appendix: Alternativer Zugang zu Linearen Differentialgleichungen
Beispiel 15.11 Wir betrachten wieder für ω ∈ R \ {0} die homogene lineare Differentialgleichung aus
Beispiel 15.6
x01 = −ωx2
0 −ω
0
⇐⇒
x
=
Ax
mit
A
=
.
x02 =
ωx1
ω
0
Die Eigenwertgleichung lautet dann λ2 + ω 2 = 0 mit den zueinander konjugiert komplexen Lösungen
λ = ±iω .
Für den zu λ = iω gehörigen Eigenvektor muss man das lineare Gleichungssystem
−iω −ω
(A − iω I2 ) c =
c=0
ω −iω
nicht-trivial lösen. Elementare Umformungen von A − iω I2 ergeben nacheinander
1
−i
1 −i
,
.
ω −iω
0
0
i
Damit ist c =
ein zugehöriger Eigenvektor und
1
iωt ie
− sin(ωt) + i cos(ωt)
ϕ : t 7→ eiωt c =
=
eiωt
cos(ωt) + i sin(ωt)
die zu λ = iω komplexwertige Lösung der Differentialgleichung. Nach 15.10 erhält man daraus die beiden
reellwertigen linear unabhängigen Lösungen
− sin(ωt)
cos(ωt)
ϕ1 : t 7→
,
ϕ2 : t 7→
.
cos(ωt)
sin(ωt)
Aus Dimensionsgründen bilden ϕ1 , ϕ2 bereits ein reelles Lösungsfundamentalsystem. Bis auf die Reihenfolge der Vektoren stimmt dieses mit dem in Beispiel 15.6 angegebenen überein.
Beispiel 15.12 Wir lösen jetzt das Problem, das wir am Eingang zur diesem Abschnitt betrachtet hatten.
Dabei ist b = 0 und


−k1
0
0
A =  k1 −k2 0 .
0
k2 0
Daher ist A − λI3 für λ ∈ R eine untere Dreiecksmatrix und das charakteristische Polynom von A lautet
nach 11.5
χA : λ 7→ (−k1 − λ)(−k2 − λ)(−λ).
Die Eigenwerte von A sind die Nullstellen von χA , also λ1 = −k1 , λ2 = −k2 , λ3 = 0. Daraus bestimmen
wir als zugehörige Eigenvektoren


 
 
k2 − k1
0
0
c1 =  k1  , c2 =  1  , c3 = 0 .
−k2
−1
1
Damit bilden die Funktionen ϕ1 , ϕ2 , ϕ3 : R → R3 mit ϕi = eλi t ci (i = 1, 2, 3) bei k1 6= k2 ein LFS. Die
allgemeine Lösung hat also die Gestalt


 
 
k2 − k1
0
0
mit
α1 , α2 , α3 ∈ R .
y : t 7→ α1 e−k1 t  k1  + α2 e−k2 t  1  + α3 0
−k2
−1
1
15.1
233
Systeme erster Ordnung
Hat man zur Zeit t = 0 die Anfangskonzentrationen η1 , η2 , η3 , so erhält man für die Koeffizienten α1 , α2 , α3
der Lösung des zugehorigen AWP das LGS

    
k2 − k1 0 0
α1
η1
 k1
1 0 · α2  = η2  ,
−k2
1 1
α3
η3
das sich ohne Probleme lösen lässt.
15.1.2
Die inhomogene lineare Differentialgleichung y0 = A · y + b
Wir wenden uns jetzt den Lösungen der inhomogenen linearen Differentialgleichung (15.3) bzw. (15.3*)
zu.
Bemerkung 15.13 Gegeben sei die inhomogene lineare DGL mit konstanten Koeffizienten
y10 (t)
..
.
=
yd0 (t)
= ad1 y1 (t)
a11 y1 (t)
..
.
+ · · · + a1d yd (t)
..
..
.
.
+ · · · + add yd (t)
+
b1 (t)
..
.
(15.3)
+ bd (t)
mit stetigen Funktionen b1 , . . . , bd : I → K , I ein mehrpunktiges reelles Intervall.
Um alle Lösungen dieser DGL zu kennen, genügt es nach 15.7, irgendeine partikuläre“ Lösung dieser
”
DGL sowie ein Lösungsfundamentalsystem der zugehörigen homogenen linearen DGL (15.6) zu kennen.
Damit bleibt noch zu klären, wie man überhaupt zu einer Lösung der inhomogenen linearen Differentialgleichung kommt.
Satz 15.14 (Variation der Konstanten). In der Situation von Definition 15.1(1) sei Φ = (ϕ1 , . . . , ϕd ) ein
Lösungsfundamentalsystem der homogenen linearen Differentialgleichung
y0 = A · y ,
(15.6)
zusammengefasst zu einer d × d-Matrix. Dann erhält man eine partikuläre Lösung ψ der inhomogenen
linearen Differentialgleichung
y 0 = A · y + b(t)
(15.3*)
durch den Ansatz
ψ(t) = Φ(t) C(t) ,
(15.10)
wobei C : I → Kd aus der Differentialgleichung
Φ(t) C 0 (t) = b(t)
15.5
⇐⇒
C 0 (t) = Φ(t)−1 b(t) als C : t 7→
Z
t
Φ(τ )−1 b(τ ) dτ + c
(15.11)
t0
mit t0 ∈ I und beliebigem c ∈ Kd zu bestimmen ist.
Die Integration erfolgt dabei koordinatenweise und gegebenenfalls für Real- und Imaginärteil getrennt.
Beweis Aus dem Ansatz ψ = Φ · C folgt mit der Produktregel (gilt auch bei Matrizenmultiplikation, wie
man sich leicht überzeugt)
ψ0
außerdem ist
=
Φ0 · C + Φ · C 0 ;
234
Appendix: Alternativer Zugang zu Linearen Differentialgleichungen
A·ψ+b
= A · Φ · C + b = Φ0 · C + b
wegen Φ0 = A · Φ (da Φ Lösungsfundamentalsystem der homogenen Gleichung ist). Daraus erhält man
(Gleichheit der linken Seiten ⇐⇒ Gleichheit der rechten Seiten):
ψ0 = A · ψ + b
Φ · C0 = b .
⇐⇒
Beispiel 15.15 Die Differentialgleichung
y 0 = y + et
(t, y ∈ R2 )
hat ϕ : t 7→ et als Lösungsfundamentalsystem der zugehörigen homogenen linearen Differentialgleichung.
Mit
Z
Z
t
t
e−τ eτ dτ =
C: t→
1 dτ = t
0
0
ψ : R → R,
t 7→ t et .
liefert 15.14 die Funktion
als eine partikuläre Lösung der inhomogenen Gleichung. Beliebige Lösungen der inhomogenen Gleichung
haben daher nach 15.7 die Gestalt
y : t 7→ t et + c et
(c ∈ R) .
Bemerkung 15.16 Bei konstantem inhomogenen Anteil b gibt es ein einfacheres Verfahren, zu einer
partikulären Lösung von (15.3) zu gelangen:
1. Falls det(A) 6= 0 ist, mache man den Ansatz y ≡ c ∈ Kd ist konstant. =⇒
0=A·c+b.
(15.12)
Auflösen nach c ergibt c = −A−1 b . Man prüft sofort nach, daß dies tatsächlich eine Lösung der
DGL liefert.
Wenn immer (15.12) nach c auflösbar ist (nicht notwendig eindeutig), findet man auf die gleiche
Weise ebenfalls eine partikuläre Lösung von (15.3)
2. Hat A die 0 als Eigenwert der Ordnung k ≥ 1 , so führt der Ansatz
y : t 7→ p(t)
mit einem Spaltenvektor p aus Polynomfunktionen mit Ordnungen ≤ k zu einer partikulären
Lösung von (15.3). Falls K = R ist, erhält man auch eine reelle partikuläre Lösung.
Beispiel 15.17 Sei folgendes AWP gegeben
y10 (t) = 2y1 (t)
y20 (t) =
+3y2 (t) + 1
2y2 (t) + 2
y1 (0) = −1
y2 (0) = 4.
Das fassen wir zusammen als
y 0 = Ay + b,
wo
A=
2
0
3
,
2
b=
y(0) = y 0 ,
1
,
2
y0 =
−1
.
4
15.2
Lineare Differentialgleichung en höherer Ordnung mit konstanten Koeffizienten
235
Das zugehörige charakteristische Polynom ist dann (2 − λ)2 mit der doppelten Nullstelle λ = 2. Um die
Eigenvektoren zu diesem Eigenwert zu bestimmen, müssen wir die Gleichung
0 3
v1
0
(A − 2I2 )v =
=
0 0
v2
0
1
nicht-trivial nach v auflösen. Daraus folgt v =
oder ein skalares Vielfaches davon. Nach Satz 15.8(1)
0
ist dann die auf R definierte Funktion
2t 1
e
ϕ1 : t 7→ e2t
=
0
0
eine nicht-triviale Lösung der zugehörigen homogenen Differentialgleichung. Eine davon linear unabhängige Lösung ermittelt man mit dem Ansatz aus Bemerkung 15.9 unter Zuhilfenahme von Bemerkung 15.10
als
3t · e2t
2
ϕ : t 7→
.
e2t
ϕ1 , ϕ2 bilden dann ein reelles LFS der homogenen DGL y 0 = Ay .
Ferner ist (Cramer’sche Regel)
−1
A
=
1
2
− 34
0
1
2
!
,
also
−1
c := −A
b=
1
.
−1
Nach Bemerkung 15.16 ist c eine partikuläre Lösung der inhomogenen DGL. Die allgemeine Lösung hat
dann die Form
1 + λ1 e2t + 3λ2 t · e2t
1
2
ψ : t 7→ c + λ1 ϕ + λ2 ϕ =
mit λ1 , λ2 ∈ R .
−1 + λ2 e2t
Einsetzen der Anfangsbedingungen liefert λ1 = −2, λ2 = 5 , also als Lösung des AWP die auf R
definierte Funktion
!
1 − 2e2t + 15te2t
y : t 7→
.
−1 + 5e2t
15.2
Lineare Differentialgleichung en höherer Ordnung mit konstanten Koeffizienten
Sei I ⊂ R ein nicht-triviales Intervall und b : I → K stetig. Eine DGL, die neben der ersten Ableitung
y 0 von y auch noch höhere Ableitungen y 00 = y (2) , y 000 = y (3) , . . . , y (d) , d ≥ 2 enthält, der Gestalt
y (d) (t) + ad−1 y (d−1) (t) + · · · + a1 y 0 (t) + a0 y(t) = b(t),
(15.13)
wobei a0 , a1 , . . . , ad−1 ∈ K fest sind, heißt lineare Differenzialgleichung der Ordnung d mit konstanten
Koeffizienten. Die DGL heißt homogen, falls b ≡ 0 ist, andernfalls heißt sie inhomogen.
Die DGL wird zum AWP und ihre Lösung damit eindeutig durch die zusätzliche Vorgabe von Anfangswerten . Das sind hier die Funktionswerte der Lösungsfunktion sowie ihrer ersten d − 1 Ableitungen zu einem
Anfangs zeitpunkt“ t0 ∈ I , also
”
y(t0 ) = y 0 , . . . , y (d−1) (t0 ) = y d−1 .
(15.14)
236
15.2.1
Appendix: Alternativer Zugang zu Linearen Differentialgleichungen
Die homogene Differentialgleichung
Zur Lösung der zu (15.13) gehörigen homogenen Differentialgleichung
y (d) (t) + ad−1 y (d−1) (t) + · · · + a1 y 0 (t) + a0 y(t) = 0,
(15.15)
formen wir diese in ein System erster Ordnung um, indem wir




y(t)
Y0 (t)
 y 0 (t) 
 Y1 (t) 




Y (t) =  .  := 

..


 .. 
.
(d−1)
Yd−1 (t)
y
(t)
definieren. Dann ist (15.15) gleichwertig zu
  (1)
 0
 

y (t)
Y0 (t)
Y1 (t)
 Y10 (t)   y (2) (t)  

Y2 (t)

 
 

 ..  



.
.
0
..
..
Y (t) =  .  = 
=

 

 

Y 0 (t) y (d−1) (t) 

Yd−1 (t)
d−2
0
(d)
Yd−1 (t)
−a0 Y0 (t) − a1 Y1 (t) − · · · − ad−1 Yd−1 (t)
y (t)
(15.16)
bzw. in Matrizenscheibweise
Y 0 (t) = A · Y (t)
mit

0
0
..
.



A=


 0
−a0
1
0
..
.
0
1
..
.
...
...
..
.
0
0
..
−a1
−a2
.
...
0
0
..
.
1
(15.160 )




 ∈ M (d, d; K) .



(15.17)
−ad−1
A hat das charakteristische Polynom

−λ
0
..
.



det(A − λId ) = det 


 0
−a0
1
−λ
..
.
0
1
..
.
...
...
..
.
0
0
..
−a1
−a2
.
...
0
0
..
.
1




 ,



(15.18)
−λ−ad−1
wenn Id die d × d-Einheitsmatrix bezeichnet. Entwickeln nach der letzten Zeile ergibt mit Gleichung
(11.1), Satz 11.5 sowie einigen zusätzlichen Kenntnissen über Determinanten
det(A − λId ) = (−1)d (λd + ad−1 λd−1 + · · · + a1 λ + a0 ) .
λ ∈ C ist also genau dann Eigenwert von A , wenn λ Nullstelle des zur DGL (15.15) gehörigen
charakteristischen Polynoms
λd + ad−1 λd−1 + · · · + a1 λ + a0
(15.19)
(das ist, abgesehen vom Vorzeichen, das bei der Nullstellenbestimmung keine Rolle spielt, das charakteristische Polynom der Matrix A) ist. Dieses hat jeweils für die j-te Potenz von λ denselben Koeffizienten
15.2
Lineare Differentialgleichung en höherer Ordnung mit konstanten Koeffizienten
237
wie die j-te Ableitung in der Differentialgleichung (15.15).


c0
Sei c =  ...  Eigenvektor von A zum Eigenwert λ . Dann folgt indirekt aus (A − λId )c = 0 , daß
cd−1
c0 6= 0 ist (sonst wäre c = 0). Durch Übergang zum 1/c0 -fachen folgt mit Satz 15.8(1):
y : t 7→ eλt
ist eine nicht-triviale Lösung von (15.15).
Man braucht also den Eigenvektor c nicht für die Lösung von (15.15). Außerdem wird aus der Herleitung
mit den Hilfsfunktionen Y1 , . . . , Yd−1 klar, warum bei den Anfangsbedingungen des Anfangswertproblems
(15.13), (15.14) Bedingungen für Ableitungen auftauchen.
Allgemeiner kann man aus den vorangehenden Bemerkungen folgern oder auch direkt beweisen:
Satz 15.18
1. Ist λ eine Nullstelle des charakterististischen Polynoms von (15.15) der Ordnung k , so
sind die Funktionen
t 7→ th · eλt
h = 0, . . . , k − 1
über C linear unabhängige komplexwertige Lösungen von (15.15).
2. Sind die Koeffizienten a0 , . . . , ad−1 der Differentialgleichung (15.15) alle reell, so sind für jede
reelle Nullstelle λ des charakteristischen Polynoms die in (1) beschriebenen k linear unabhängigen
Lösungsfunktionen wieder reellwertig. Ist λ, λ̄ mit λ = µ + iν ein Paar konjugiert komplexer
Eigenwerte, so sind die 2k Funktionen
t 7→ th eµt · cos νt ,
t 7→ th eµt · sin νt
(h = 0, . . . , k − 1)
linear unabhängige reellwertige Lösungen von (15.15).
3. Man erhält ein Lösungsfundamentalsystem der Differentialgleichung (15.15), wenn man für jede
Nullstelle λ ihres charakteristischen Polynoms die ihrer Vielfachheit entsprechende Anzahl von
Funktionen gemäß (1) auswählt.
Bei Differentialgleichung en mit reellen Koeffizienten verwendet man entsprechend (2) , wobei bei
konjugiert komplexen Nullstellenpaaren der Ordnung k , ausgehend von einer dieser Nullstellen,
2k Funktionen des Lösungsfundamentalsystem s bestimmt werden können.
15.2.2
Die homogene lineare Differenzialgleichung 2. Ordnung
Wir betrachten hier zur Illustration den besonders wichtigen Spezialfall der homogenen linearen Differenzialgleichung zweiter Ordnung mit konstanten Koeffizienten b, c ∈ R
y 00 (t) + by 0 (t) + cy(t) = 0.
(15.20)
Nach Abschnitt 15.2.1 müssen wir die Nullstellen des zugehörigen charakteristischen Polynoms bestimmen,
also die quadratische Gleichung für λ
λ2 + bλ + c = 0
(15.21)
lösen. Die Lösung ist bekanntlich
λ1,2
√
b
∆
=− ±
,
2
2
wobei ∆ = b2 − 4c.
(15.22)
238
Appendix: Alternativer Zugang zu Linearen Differentialgleichungen
Wir unterscheiden die drei Fälle ∆ > 0, ∆ < 0 und ∆ = 0, da hier entweder zwei, keine, oder eine reelle
Lösung vorliegt.
Fall 1 (∆ > 0). Die allgemeine Lösung ergibt sich nach Satz 15.18 als Linearkombination
√
y(t) = C1 eλ1 t + C2 eλ2 t = C1 et(b−
∆)/2
√
+ C2 et(b+
∆)/2
(15.23)
mit C1 , C2 ∈ R.
1
0.8
y(x)0.6
0.4
0.2
0
2
4
6
x
8
10
12
–0.2
–0.4
Figur. Lösungskurve für y 00 (t) + 3y 0 (t) + y(t) = 0 und die Anfangswerte y(0) = 1 und y 0 (0) = 0
Fall 2 (∆ < 0). Hier hat die Gleichung (15.21) keine reelle Lösung, aber zwei konjugiert komplexe
Lösungen
√
b
−∆
λ1,2 = − ± i
.
2
2
Nach Satz 15.18 hat die Differentialgleichung die allgemeine reelle Lösung
√−∆ √−∆ y(t) = e−(b/2)t C1 cos
t + C2 sin
t .
2
2
(15.24)
mit C1 , C2 ∈ R . Unter Benutzung des Additionstheorem für die Sinusfunktion kann man diesen Ausdruck
stets umschreiben zu
√−∆
−(b/2)t
y(t) = A · e
sin
t+ϕ .
2
Dabei werden die Amplitude A und die Phasenverschiebung ϕ so gewählt, dass das Anfangswertproblem gelöst wird. Man sagt bei b > 0 auch, dass hier der Fall einer gedämpften Schwingung vorliegt.
15.2
239
Lineare Differentialgleichung en höherer Ordnung mit konstanten Koeffizienten
1.0
√
e−0.1t · sin( 3.99, t)
0.5
0.0
−0.5
−1.0
0
5
10
15
20
25
30
35
Figur. Eine Lösungskurve der Differentialgleichung y + 0.2y + 4y = 0
1
0.8
y(x)0.6
0.4
0.2
0
2
4
6
x
8
10
12
–0.2
–0.4
Figur. Lösungskurve bei gedämpfter Schwingung für die AW y(0) = 1 und y 0 (0) = 0
Fall 3 (∆ = 0). In diesem Fall hat die quadratische Gleichung nur die eine Lösung λ = − 2b . Das heißt
nach Satz 15.18: y1 : t 7→ e−(b/2)t , y2 : t 7→ t · e−(b/2)t bilden ein reelles Lösungsfundamentalsystem.
4.0
3.5
3.0
2.5
2.0
1.5
1.0
0.5
0.0
4 · e−0.1t
t · e−0.1t
0
5
10
15
20
25
Figur. Lösungskurven der Differentialgleichung y + 0.2y + 0.01y = 0
30
35
240
Appendix: Alternativer Zugang zu Linearen Differentialgleichungen
Wir haben damit die allgemeine Lösung der Differenzialgleichung
y(t) = (C1 + C2 t) e−(b/2)t
(15.25)
mit C1 , C2 ∈ R .
1
0.8
y(x)0.6
0.4
0.2
0
2
4
6
x
8
10
12
–0.2
–0.4
Figur. Lösungskurve für y 00 (t) + 2y 0 (t) + y(t) = 0 und die AW y(0) = 1 und y 0 (0) = 0
Beispiel 15.19 (Der harmonische Oszillator) Beim harmonischen Oszillator wirkt auf ein Teilchen, das
um y aus der Ruhelage bewegt wurde, eine Rückstellkraft −cy, wobei c > 0 eine Konstante ist. Harmonische Oszillatoren treten in der Natur zuhauf auf: Gewicht an einer Feder, Pendel (mit kleinen Ausschlägen),
Stromkreis mit Spule und Kondensator und so fort. Aus praktischen Gründen schreiben wir c = ω 2 mit
ω > 0.
Im Gegensatz zur chemischen Reaktion erster Ordnung, bei der Stoffumsatz pro Zeiteinheit, also die Geschwindigkeit des Vorgangs, proportional zu y ist, ist hier die Beschleunigung, also die zeitliche Änderung
der Geschwindigkeit, proportional zu y. Wir haben es also mit der folgenden homogenen linearen Differenzialgleichung zweiter Ordnung zu tun
y 00 (t) + ω 2 y(t) = 0.
(15.26)
Wir nehmen noch an, dass das Teilchen zur Zeit t0 = 0 die Position y(0) = y0 und die Geschwindigkeit
y 0 (0) = y1 hat.
Mit der Notation von oben haben wir also b = 0 und ∆ = −4ω 2 < 0. Es liegt also Fall 2 vor, und die
allgemeine Lösung von (15.26) lautet
y(t) = C1 cos (ω t) + C2 sin (ω t) .
(15.27)
15.2
Lineare Differentialgleichung en höherer Ordnung mit konstanten Koeffizienten
241
Wir müssen noch C1 und C2 bestimmen
y(0) = y0 = C1
y 0 (0) = y1 = C2 ω
⇐⇒
Mithin ist
y(t) = y0 cos (ω t) +
C2 =
y1
.
ω
y1
sin (ω t) .
ω
(15.28)
Bemerkung 15.20 Man kann (15.28) stets auf die Form bringen
y(t) = A sin (ω t + ϕ) .
(15.29)
Hierzu muss man nur das Additionstheorem
A sin (ω t + ϕ) = A sin(ϕ) cos(ω t) + A cos(ϕ) sin(ω t)
benutzen und dann nach A und ϕ auflösen. Beipielsweise ist, falls y0 , y1 6= 0,
y0 ω
y0
.
ϕ = arctan
und A =
y1
sin(ϕ)
Beispiel 15.21 (Der gedämpfte harmonische Oszillator) Ergänzend zum vorherigen Beispiel wird nun
noch der Effekt der Reibung berücksichtigt. Wir nehmen an, dass die Reibungskraft proportional zur Ge√
schwindigkeit und ihr entgegengerichtet ist. Wenn wir jetzt noch aus praktischen Gründen wieder ω := c
sowie zusätzlich µ := 2b definieren, wobei b > 0 die Reibungskonstante bezeichnet, so erhalten wir die
Differenzialgleichung
y 00 (t) + 2µy 0 (t) + ω 2 y(t) = 0,
(15.30)
wobei µ, ω > 0 sind. Wir wollen wieder das Anfangswertproblem y(0) = y0 und y 0 (0) = y1 lösen.
Große Reibung Ist µ > ω, so liegt Fall 1 vor, und die allgemeine Lösung ist
y(t) = C1 eλ1 t + C2 eλ2 t ,
wobei
λ1 = −µ +
p
µ2 − ω 2 ,
λ2 = −µ −
p
µ2 − ω 2 .
Man beachte, dass λ2 < −µ < λ1 < 0.
Um C1 und C2 zu bestimmen, setzen wir ein
y(0) = C1 + C2 = y0
y 0 (0) = λ1 C1 + λ2 C2 = y1 .
Auflösen ergibt
−y1 + λ2 y0
,
λ 2 − λ1
y1 − λ 1 y0
C2 =
.
λ2 − λ1
C1 =
Kleine Reibung Ist µ < ω, so liegt Fall 2 vor, und die allgemeine Lösung ist
p
y(t) = Ae−µt sin
ω 2 − µ2 t + ϕ .
242
Appendix: Alternativer Zugang zu Linearen Differentialgleichungen
Einsetzen ergibt
y0 = y(0) = A sin(ϕ)
p
y1 = y 0 (0) = −µA sin(ϕ) + A ω 2 − µ2 cos(ϕ).
Dieses nicht-lineare Gleichungssystem müsste man nun nach A und ϕ auflösen.
Der Grenzfall Ist µ = ω, so liegt Fall 3 vor. Die allgemeine Lösung ist
y(t) = (C1 + C2 t)e−µt .
Einsetzen ergibt
y0 = y(0) = C1
y1 = y 0 (0) = C2 − µC1 .
Also
C2 = y1 + µy0 .
Bemerkung 15.22 In jedem der drei Fälle gilt lim y(t) = 0. In der Praxis interessiert man sich oft dafür,
t→∞
wie schnell diese Konvergenz abläuft. Beispielweise hat man ein Messinstrument, das gedämpfte Schwingungen um den tatsächlichen Messwert herum ausführt, und bei dem man die Dämpfungskonstante b = 2µ
einstellen kann. Man ist jetzt an demjenigen Wert b interessiert, bei dem die Konvergenz möglichst schnell
ist.
Im ersten Fall (µ > ω) domininert (wegen λ2 p
< λ1 ) nach langer Zeit der Term eλ1 t , d.h. y(t) ≈ C1 eλ1 t für
große t. Dabei kann man zeigen: λ1 = −µ + µ2 − ω 2 > −ω.
Im zweiten Fall (µ < ω) oszilliert die Lösung, die maximalen Ausschläge sind |A|e−µt mit −µ > −ω.
Im dritten Fall (µ = ω) ist der Abfall von der Größenordnung
e−µt = e−ω t .
Insgesamt wird daher die schnellste Konvergenzgeschwindigkeit im Grenzfall µ = ω erreicht.
15.2.3
Die inhomogene Differentialgleichung höherer Ordnung
Bemerkung 15.23 Zur Lösung der inhomogenen linearen Differentialgleichung höherer Ordnung
y (d) (t) + ad−1 y (d−1) (t) + · · · + a1 y 0 (t) + a0 y(t) = b(t),
(15.13)
mit festen a0 , a1 , . . . , ad−1 ∈ K und b : I → K muss man wie bei den Systemen 1. Ordnung die homogene
DGL lösen und eine partikuläre Lösung der inhomogenen DGL bestimmen.
Dafür kann man grundsätzlich das in Abschnitt 15.1.1 beschriebene Verfahren der Variation der Konstanten
verwenden. Man muss dabei das gewonnene LFS durch Hinzunahme der Ableitungsfunktionen bis zur
Ordnung d − 1 zu einer d × d-Matrix ergänzen. Am Schluss benötigt man vom Ergebnisvektor nur die erste
Koordinate.
Wenn die Funktion b selbst auch konstant ist, hilft gemäß Bemerkung 15.16 ein einfacher Ansatz, um zu
einer partikulären Lösung der inhomogenen DGL zu gelangen:
1. Falls 0 keine Nullstelle des charakteristischen Polynoms ist, muss die DGL eine konstante Lösungsfunktion besitzen.
15.2
243
Lineare Differentialgleichung en höherer Ordnung mit konstanten Koeffizienten
2. Falls 0 eine Nullstelle der Ordnung k ≥ 1 des charakteristischen Polynoms ist, gibt es ein Polynom
p der Ordnung ≤ k, das die DGL löst.
Beispiel 15.24 Wir betrachten das AWP
y 00 (t) + y(t) = 2,
y 0 (0) = 0.
y(0) = 1,
Das zugehörige charakteristische Polynom lautet dann
λ 7→ λ2 + 1 = (λ + i)(λ − i)
und hat die zu einander konjugiert komplexen Nullstellen ±i. Damit bilden die Funktionen cos und sin ein
reelles Lösungsfundamentalsystem (s. Satz 15.18). Der Ansatz für eine konstante partikuläre Lösung der
inhomogenen DGL gemäß 15.23 liefert die partikuläre Lösung y0 : t 7→ 2 . Damit lautet die allgemeine
Lösung
y : t 7→ 2 + α cos(t) + β sin(t)
α, β ∈ R .
Einsetzen der Anfangswerte ergibt für α, β die Gleichungen
2 + α = 1,
β = 0.
Damit hat das AWP die Lösung
y : t 7→ 2 − cos(t) .
Beispiel 15.25 Wir betrachten die Differenzialgleichung dritter Ordnung
y 000 + 3y 00 − y 0 − 3y = −1
(15.31)
mit Anfangswert
y(0) = 4,
y 0 (0) = y 00 (0) = 0.
(15.32)
Das zugehörige charakteristische Polynom lautet
χ : λ 7→ λ3 + 3λ2 − λ − 3 = (λ + 3)(λ2 − 1) = (λ + 3)(λ + 1)(λ − 1)
und hat daher die Nullstellen λ1,2 = ±1, λ3 = −3. Eine konstante partikuläre Lösung der inhomogenen DGL gemäß 15.23 ist offenbar die Funktion y0 : t 7→ 31 . Damit lautet die allgemeine Lösung der
inhomogenen DGL
1
y : t 7→ + αet + βe−t + γe−3t
α, β, γ ∈ R .
3
Die beiden ersten Ableitungen dieser Lösung sind
y 0 : t 7→ αet − βe−t − 3γe−3t ,
y 00 : t 7→ αet + βe−t + 9γe−3t .
Einsetzen der Anfangsbedingungen ergibt die drei linearen Gleichungen
1
+ α + β + γ = 4,
3
Als Lösung erhält man α =
11
8 ,
β=
11
4 ,
y : t 7→
α − β − 3γ = 0 ,
α + β + 9γ = 0 .
γ = − 11
24 . Damit hat man als Lösung des AWP die Funktion
1 11 t 11 −t 11 −3t
+ e + e − e
.
3
8
4
24
244
Index
Abbildung, 27
1–1, 30
ein-eindeutig, 30
injektiv, 30
Verknüpfung von, 29
Abbildungsvorschrift, 27
Ableitung, 54, 188
höhere, 61
Kettenregel, 57
Produktregel, 57
Quotientenregel, 57
Summenregel, 57
Tabelle, 56
Umkehrfunktion, 58
Additionstheoreme für Winkelfunktionen, 14
affiner Unterraum, 141
algebraische Funktion, 12
Anfangswertproblem, 110
Arcus Funktionen, 33
Aufpunkt, 140
äußeres Produkt, 138
AWP, siehe Anfangswertproblem
Cramér’sche Regel, 150
de l’Hospital’sche Regel, 61
Definitionsbereich, 27
Definitionsbereich einer Funktion, 12, 20
Determinante, 137, 139, 168
DGL, siehe Differentialgleichung
Differentialgleichung, 109
erster Ordnung, 181
exakte, 115
explizite, 110
höherer Ordnung, 182
lineare, 119
lineare 1. Ordnung, 118
lineare 2. Ordnung, 119
Lösung, 110
partielle, 110
Trennung der Variablen, 112
Differentialrechnung, 53
Differenzenquotient, 54
Differenzialgleichung
höherer Ordnung, 235
lineare 2. Ordnung, 237
differenzierbar, 54
Dimension, 131, 162
Diskriminante, 23
divergent, 47
Divergenz, 199
Drehimpuls, 170
baryzentrische Darstellung, 141
baryzentrischen Koordinaten, 141
Basis, 131
Basiswechsel, 159
beschränkte Folge, 47
Beta-Integral, 209
Betrag eines Vektors, 133
Bild, siehe Funktion
Bild einer Abbildung, 27
Binomialkoeffizient, 79
Binomischer Lehrsatz, 81
Biot–Savart, 219
Eigenraum, 170
Eigenvektor, 170
Eigenwert, 170
Einheitswurzel, 22
Einheitswurzeln, 22
euklidische Norm, 133
Euler’sche Formel, 21, 88
Euler’sche Zahl, 10
Euler’scher Multiplikator, 117
Exponentialfunktion, 177
komplexe, 20, 59
Cauchy–Schwarz’sche Ungleichung, 134, 139
Cauchy-Produkt, 85
Cauchy-Schwarz Ungleichung, 106
charakteristische Polynom, 171
Cosinus, 13
244
Index
reelle, 13, 34
Extremalstelle, 63, 63, 193
globale, 64
lokale, 64
Fakultät, 78
Folge
beschränkte, 47
divergente, 47
konvergente, 46
monotone, 47
uneigentlich konvergente, 47
Fubini, 209
Fundamentalsatz der Algebra, 24
Funktion
Ableitung einer, 54
algebraische, 12
Bild, 12, 20
Definitionbereich, 12
Definitionsbereich, 12
differenzierbare, 54
Extremalstelle, 63
gerade, 72
Graph, 32
implizit gegebene, 200
komplexe, 20
konkave, 69
konvexe, 69
Maximum, 63
mehrerer Veränderlicher, 35
Minimum, 63
monotone, 33
rationale, 12, 12, 20, 103
reelle, 12
stetige, 41
transzendente, 13
ungerade, 72
vektorwertige, 38
Wendepunkt, 71
Funktionaldeterminante, 211
Funktionalmatrix, 196
ganze Zahl, 9
Gauß’scher Integralsatz, 225
Gauß Verfahren, 151
geometrische Reihe, 83
GL, 150
globale Extremalstelle, 64
Gradient, 189
Gradientenfeld, 215
245
Graph einer Funktion, 32
Grenzwert
komplexer Zahlen, 87
von Folgen, 46
von Funktionen, 49
Hamilton Operator, 175
harmonischen Oszillators, 175
harmonischer Oszillator, 123, 240
Hauptachse, 169
Hauptachsentransformation, 172
Hauptsatz der Differential- und Integralrechnung,
92
Hauptwert der Wurzelfunktion, 23
Hermite Polynome, 176
Hesse’sche Normalform, 142, 143
Hesse–Matrix, 191
homogenes LGS, 161
Hurwitz Kriterium, 194
Hyperebene, 142
Häufungspunkt, 48
ideales Gas, 35
implizit gegebene Funktion, 200
indefinit, 194
Indikatorfunktion, 205
inneres Produkt, 132
Integral, 90
komplexer Integrand, 101
uneigentliches, 98
integrierbar, 203, 209, 215
Integrierender Faktor, 117
Intervall, 11
Intervallschachtelung, 44
irrationale Zahl, 11
Jakobimatrix, 196
kanonische Basis, 131
Kern, 170
Kettenregel, 57, 95, 189, 198
komplexe Zahl, 9, 15
konjugierte Zahl, 16
konkav, 69
konvergent, 46, 187
Konvergenzkreis, 87
Konvergenzradius, 82
konvex, 69
Koordinaten, 132
Kreuzprodukt, 138
246
kritische Stelle, 193
Krümmung, 69
Kugel, 219, 224
Kugelkoordinaten, 211
Kugelvolumen, 225
Kurve
geschlossene, 212
Geschwindigkeitsvektor, 212
glatte, 212
Länge, 212
stückweise glatte, 212
Kurvendiskussion, 63, 72
Kurvenintegral, 214
Laplaceoperator, 199
Lenard-Jones Potential, 75
LGS, 147
Limes
von Folgen, 46
von Funktionen, 49
linear abhängig, 130
linear unabhängig, 130
lineare Abbildung, 147, 154
lineares Gleichungssystem, 147
Linearfaktor, 23
Linearkombination, 129
Linkssystem, 139
Logarithmus, 13, 34
lokale Extremalstelle, 64
Malthus’sches Wachstumsgesetz, 114
Matrix, 147
Darstellungs–, 156
Definitheit, 194
Diagonal–, 148
Diagonalelement, 148
Einheits–, 148
Exponentialfunktion, 177
invertierbare, 150
Kern, 170
Null-, 148
obere Dreiecks–, 159
orthogonale, 159
quadratische, 148
reguläre, 150
singuläre, 150
symmetrische, 159
transponierte, 158
untere Dreiecks–, 159
Maximum, 63, 193
Index
Maximumstelle
lokale, 64
Maxwell’sche Gleichung, 200
Maxwell’sche Relationen, 191
Minimalstelle
lokale, 64
Minimum, 63, 193
Mittelwertsatz, 66
monotone Folge, 47
monotone Funktion, 33
negativ definit, 194
Niveaulinien, 36
Norm, 133
Normalenvektor, 143, 219
Nullstelle eines Polynoms, 23
Oberflächenintegral, 219
Obersumme einer Funktion, 90
ONB, 135
Orientierung, 139
orthogonal, 134
orthonormal, 134
Orthonormalbasis, 135
Oszillator
harmonischer, 123, 240
Parallelepiped, 139
Parameterdarstellung, 140
Parametrisierung, 213
Partialbruchzerlegung, 102, 103
partielle Ableitung, 188
partielle Integration, 96
Poisson Gleichung, 199
Polarkoordinaten, 22, 207, 211
Polynom, 12
Polynomdivision, 25, 103
positiv definit, 194
Potential, 215
Potenzreihe, 77
Ableitung, 82
Cauchy-Produkt, 85
Definition, 82
Identitätssatz, 84
komplexe, 86
Konvergenzkreis, 87
Konvergenzradius, 82
Produktregel, 57, 95, 189, 197
Quader, 219, 219
Index
quadratische Ergänzung, 23
Quellstärke, 199
Rand, 219
Rang, 162
Rationale Funktion, 12
Integration, 103
Partialbruchzerlegung, 103
rationale Funktion, 12
rationale Zahl, 10
Rechte-Hand-Regel, 139
Rechtssystem, 139
reelle Zahl, 10
Richtung, 140
Richtungsableitung, 190
Riemann–Integral, 90
Rotation, 169, 199
Satz
Rolle, 66
Satz von Fubini, 209
Schrödinger Gleichung, 175
Sekante, 53
senkrecht, 134
sign, 32
Sinus, 13
Skalare, 128
Skalarprodukt, 132
Spaltenvektor, 147
Spat, 139
Spatprodukt, 139
Spektrum, 170
Spiralkurve, 213
Stammfunktion, 92, 115, 215
Standardbasis, 131
sternförmig, 216
stetig, 41, 187
Substitutionsregel, 95, 207
Summenregel, 189, 197
Tangens, 13
Tangente, 53
Taylorformel, 192
Taylorpolynom, 77
Taylorreihe, 82
Transformationsformel, 207, 210
Trennung der Variablen, 112
Trägheitstensor, 170
Umgebung, 41
247
Umkehrabbildung, 29
uneigentlich konvergent, 47
uneigentliches Integral, 98
Untersumme einer Funktion, 90
Untervektorraum, 129
Ursprung, 128
Vektor, 128
Vektorfeld, 196
Vektorpotential, 200
Vektorprodukt, 138
Vektorraum, 128
Verknüpfung von Abbildungen, 29
Vorzeichenfunktion, 32
Wendepunkt, 71
Wertebereich, 27
Winkelfunktionen, 13
Additionstheoreme, 14
Wirbelstärke, 199
Wurzelfunktion, Hauptwert, 23
Zahl
Euler’sche, 10
ganze, 9
irrationale, 11
komplexe, 9, 15
Grenzwert, 87
konjugierte , 16
rationale, 10
reelle, 10
Zahlengerade, 10
Zeilenstufenform, 162
Zeilenvektor, 147
zusammenhängend, 215
Zwischenwertsatz, 44
Zylinder, 219, 222
Herunterladen