Einführung in die Mathematik 1 (21.9.2017)

Oliver Deiser
Einführung in die Mathematik 1
Inhalt
1. Abschnitt Elementare Funktionen . . . . . . . . . . . . . . . . . .
9
1. Geraden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11
Geraden und ihre Parameter . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Die Gerade durch zwei gegebene Punkte . . . . . . . . . . . . . . . . . . .
Die Steigungsform . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Die Tangente einer differenzierbaren Funktion . . . . . . . . . . . . . .
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12
14
15
17
18
2. Parabeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Parabeln und ihre Parameter . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Die Einheitsparabel und die Wurzelfunktion . . . . . . . . . . . . . . . .
Parabeln mit Parameter b = 0 . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Überführung in Scheitelform . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Bestimmung der Nullstellen . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Parabeln mit vorgegebenen Nullstellen . . . . . . . . . . . . . . . . . . . .
Die Parabel durch drei gegebene Punkte . . . . . . . . . . . . . . . . . . .
Brennpunkt und Leitlinie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Das Problem der Winkeldrittelung . . . . . . . . . . . . . . . . . . . . . . . .
Kreise, Ellipsen und Hyperbeln . . . . . . . . . . . . . . . . . . . . . . . . . . .
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3. Polynome . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Polynome und ihr Grad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Koeffizientenvergleich für Polynome . . . . . . . . . . . . . . . . . . . . . .
Die Polynomdivision . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Abspalten von Linearfaktoren . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Die geometrische Summe und die geometrische Reihe . . . . . . . .
Entwicklung eines Polynoms in einem Punkt . . . . . . . . . . . . . . . .
Polynome durch gegebene Punkte . . . . . . . . . . . . . . . . . . . . . . . .
Grenzwertverhalten von Polynomen . . . . . . . . . . . . . . . . . . . . . . .
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
© Oliver Deiser
67
68
69
72
76
5. Die Exponentialfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Charakterisierung der Exponentialfunktion . . . . . . . . . . . . . . . . .
Das Additionstheorem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
47
48
50
51
53
55
58
60
63
66
4. Rationale Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Rationale Funktionen und ihre Definitionsbereiche . . . . . . . . . . .
Polstellen und stetig hebbare Definitionslücken . . . . . . . . . . . . . .
Die Partialbruchzerlegung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21
22
22
25
26
30
31
33
34
36
39
45
77
78
79
Einführung in die Mathematik 1
2
Inhalt
Reihendarstellung der Exponentialfunktion . . . . . . . . . . . . . . . . .
Die Limesdarstellung der Exponentialfunktion . . . . . . . . . . . . . .
Der natürliche Logarithmus . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Die allgemeine Exponentialfunktion . . . . . . . . . . . . . . . . . . . . . . .
Die Potenzfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Die allgemeinen Logarithmen . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
81
84
85
86
89
90
93
6. Die trigonometrischen Funktionen . . . . . . . . . . . . . . . . . . . . . . .
Kosinus und Sinus am Einheitskreis . . . . . . . . . . . . . . . . . . . . . . .
Eigenschaften von Kosinus und Sinus . . . . . . . . . . . . . . . . . . . . . .
Drehungen und Additionstheoreme . . . . . . . . . . . . . . . . . . . . . . .
Weitere trigonometrische Funktionen . . . . . . . . . . . . . . . . . . . . .
Trigonometrische Größen in rechtwinkligen Dreiecken . . . . . . .
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
95
96
99
101
106
108
112
7. Arkusfunktionen und Polarkoordinaten . . . . . . . . . . . . . . . . . . . 115
Die Arkusfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Winkelberechnungen bei Geraden . . . . . . . . . . . . . . . . . . . . . . . .
Polarkoordinaten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Die Koordinatenabbildungen . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
116
122
123
126
128
8. Die hyperbolischen Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . 131
Paritäts-Zerlegung einer Funktion . . . . . . . . . . . . . . . . . . . . . . . .
Kosinus und Sinus Hyperbolicus . . . . . . . . . . . . . . . . . . . . . . . . . .
Weitere hyperbolische Funktionen . . . . . . . . . . . . . . . . . . . . . . . .
Die Areafunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
132
133
135
136
139
2 . A b s c h n i t t D e r a n a l y t i s c h e K a l k ü l . . . . . . . . . . . . . . . . . . . 141
1. Differentialquotienten und lineare Approximation . . . . . . . . . 143
Differenzierbarkeit an einer Stelle . . . . . . . . . . . . . . . . . . . . . . . . .
Der Approximationssatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Die Landau-Notation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Differenzierbarkeit an allen Stellen . . . . . . . . . . . . . . . . . . . . . . . .
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
144
146
149
151
153
2. Ableitungsregeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
Die Regeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Einfache Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Ableitung von Kosinus und Sinus . . . . . . . . . . . . . . . . . . . . . . . . .
Ableitung der trigonometrischen Funktionen . . . . . . . . . . . . . . . .
Ableitung der hyperbolischen Funktionen . . . . . . . . . . . . . . . . . .
Einfache Differentialgleichungen . . . . . . . . . . . . . . . . . . . . . . . . .
Potenzreihendarstellungen für den Kosinus und Sinus . . . . . . . .
Die Ableitungen des Arkustangens . . . . . . . . . . . . . . . . . . . . . . . .
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Einführung in die Mathematik 1
156
157
158
161
162
163
166
169
172
© Oliver Deiser
Inhalt
3
3. Die Taylor-Entwicklung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175
Schmiegeparabeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Taylor-Polynome . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Taylor-Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
176
180
182
191
4. Monotonie und Krümmung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193
Kritische Punkte und lokale Extrema . . . . . . . . . . . . . . . . . . . . . .
Das Krümmungsverhalten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Krümmungskreise . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Die dritte Ableitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Nullstellensuche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
194
200
202
206
207
212
5. Integration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215
Stammfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Das Riemann-Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Eigenschaften des Integrals . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Der Hauptsatz der Differential- und Integralrechnung . . . . . . . .
Zum Beweis des Hauptsatzes . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Uneigentliche Integrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
216
217
221
222
224
225
226
6. Integrationsregeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227
Unbestimmte Integrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Linearität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Partielle Integration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Die Substitutionsregel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Elimination trigonometrischer Funktionen . . . . . . . . . . . . . . . . .
Weitere Integrationsregeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Nichtelementare Integrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
228
229
230
233
239
242
243
245
3 . A b s c h n i t t R e e l l e u n d k o m p l e x e Z a h l e n . . . . . . . . . . . . . 249
1. Die Vollständigkeit der reellen Zahlen . . . . . . . . . . . . . . . . . . . . 251
Modellierung eines Linearkontinuums . . . . . . . . . . . . . . . . . . . . .
Obere und untere Schranken . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Das Vollständigkeitsaxiom . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Das Archimedische Axiom . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Dichte Mengen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
252
253
256
258
259
260
268
2. Grenzwerte für Folgen und Reihen . . . . . . . . . . . . . . . . . . . . . . 271
Folgen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Die Epsilon-Definition des Grenzwerts einer Folge . . . . . . . . . .
Die Limesregeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Eine Charakterisierung der konvergenten Folgen . . . . . . . . . . . .
© Oliver Deiser
272
274
276
277
Einführung in die Mathematik 1
4
Inhalt
Unendliche Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Die geometrische Reihe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Die harmonische Reihe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Konvergenzkriterien für unendliche Reihen . . . . . . . . . . . . . . . . .
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
278
280
282
284
287
3. Grenzwerte und Stetigkeit von Funktionen . . . . . . . . . . . . . . . . 289
Grenzwerte bei Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Stetigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Links- und rechtsseitige Grenzwerte . . . . . . . . . . . . . . . . . . . . . . .
Uneigentliche Grenzwerte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Die Folgenstetigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Stetigkeits- und Unstetigkeitsbeweise . . . . . . . . . . . . . . . . . . . . . .
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
290
292
297
298
299
301
302
4. Komplexe Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 305
Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Die Gaußsche Zahlenebene . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Die geometrische Deutung der komplexen Multiplikation . . . . .
Die imaginäre Einheit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Realteil, Imaginärteil, Betrag und Konjugation . . . . . . . . . . . . . .
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
306
309
310
312
313
315
5. Der Fundamentalsatz der Algebra . . . . . . . . . . . . . . . . . . . . . . . . 317
Komplexe Polynome . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Formulierungen des Fundamentalsatzes . . . . . . . . . . . . . . . . . . . .
Komplexe Quadratwurzeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Die komplexen Einheitswurzeln . . . . . . . . . . . . . . . . . . . . . . . . . .
Das regelmäßige Fünfeck . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Ein anschaulicher Beweis des Fundamentalsatzes . . . . . . . . . . . . .
Komplexe Wurzelfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
318
322
323
326
328
330
333
335
6. Die komplexe Exponentialfunktion . . . . . . . . . . . . . . . . . . . . . . . 337
Übertragung analytischer Begriffe ins Komplexe . . . . . . . . . . . . .
Die Exponentialfunktion im Komplexen . . . . . . . . . . . . . . . . . . . .
Kreisaufwicklung und Eulersche Formel . . . . . . . . . . . . . . . . . . .
Anwendungen der Eulerschen Formel . . . . . . . . . . . . . . . . . . . . .
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
338
340
342
350
352
4 . A b s c h n i t t E b e n e u n d R a u m . . . . . . . . . . . . . . . . . . . . . . . . . . 353
1. Reelle Vektoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 355
Reelle Vektoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Die Vektoraddition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Die Skalarmultiplikation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Der Satz des Pythagoras und die Euklidische Norm . . . . . . . . . .
Das Euklidische Skalarprodukt . . . . . . . . . . . . . . . . . . . . . . . . . . .
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Einführung in die Mathematik 1
356
357
358
359
363
366
© Oliver Deiser
Inhalt
5
2. Die Euklidische Ebene . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 369
Die Winkelformel für das Euklidische Skalarprodukt . . . . . . . . .
Determinanten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Linearkombinationen und Koordinatenvektoren . . . . . . . . . . . . .
Lineare Gleichungssysteme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Algebraische Kurven ersten und zweiten Grades . . . . . . . . . . . . .
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
370
375
378
380
384
387
3. (2 × 2)-Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 391
Matrizen und ihre Einträge . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Addition und Skalierung von Matrizen . . . . . . . . . . . . . . . . . . . . .
Das Matrix-Vektor-Produkt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Die Matrizenmultiplikation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Matrizen als lineare Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . .
Allgemeine Abbildungseigenschaften von Matrizen . . . . . . . . . . .
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
392
395
396
399
402
408
410
4. Invertierung und Orthogonalität . . . . . . . . . . . . . . . . . . . . . . . . . 413
Das Inverse einer Matrix . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Orthogonale Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Matrizen und Ellipsen, I . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
414
419
422
426
5. Eigenwerte und Spektralsatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . 429
Eigenwerte und Eigenvektoren . . . . . . . . . . . . . . . . . . . . . . . . . . .
Der Spektralsatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Diagonalisierung symmetrischer Matrizen . . . . . . . . . . . . . . . . . .
Matrizen und Ellipsen, II . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Die Singulärwertzerlegung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
430
433
434
437
440
443
6. Der Euklidische Raum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 447
Grundlegendes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Geraden und Ebenen im dreidimensionalen Raum . . . . . . . . . . .
Lineare Unabhängigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Die Orthogonaldarstellung einer Ebene . . . . . . . . . . . . . . . . . . . .
Eigenschaften des Kreuzprodukts . . . . . . . . . . . . . . . . . . . . . . . . .
Determinanten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Linearkombinationen und Koordinatenvektoren . . . . . . . . . . . . .
Lineare Gleichungssysteme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
448
449
450
452
455
459
462
463
465
7. (3 × 3)-Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 467
Grundlegendes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Matrizen als lineare Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . .
Invertierbarkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Der Invertierungsalgorithmus . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Die Elementarmatrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Eigenwerte und Eigenvektoren . . . . . . . . . . . . . . . . . . . . . . . . . . .
© Oliver Deiser
468
470
474
475
477
479
Einführung in die Mathematik 1
6
Inhalt
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 481
5 . A b s c h n i t t M e h r d i m e n s i o n a l e A n a l y s i s . . . . . . . . . . . . . . 483
1. Kurven . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 485
Vektoren als Funktionswerte . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Parametrisierte Kurven . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Tangentialvektoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Die Länge einer Kurve . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
486
488
489
493
497
2. Partielle Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 499
Mehrdimensionale Definitionsbereiche . . . . . . . . . . . . . . . . . . . .
Richtungsableitung und partielle Differenzierbarkeit . . . . . . . . .
Gradienten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Anwendungen des Gradienten . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Allgemeine mehrdimensionale Funktionen . . . . . . . . . . . . . . . . . .
Vektorfelder und Differentialoperatoren . . . . . . . . . . . . . . . . . . .
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
500
504
506
509
511
513
516
3. Mehrdimensionale Integration . . . . . . . . . . . . . . . . . . . . . . . . . . 519
Mehrdimensionale Integrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Das Cavalierische Prinzip . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Integration in Polarkoordinaten . . . . . . . . . . . . . . . . . . . . . . . . . .
Inhalte von Rotationsflächen . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
520
524
527
531
536
6 . A b s c h n i t t A n h ä n g e . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 537
1. Grundlagen über reelle Funktionen . . . . . . . . . . . . . . . . . . . . . . 539
Der Funktionsbegriff . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Reelle Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Zur Definition von Funktionen durch Terme . . . . . . . . . . . . . . . .
Punktweise Operationen mit reellen Funktionen . . . . . . . . . . . . .
539
541
544
545
2. Axiome für die reellen Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . 547
Axiome für die Addition und Multiplikation . . . . . . . . . . . . . . . . . 547
Ordnungaxiome . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 548
Das Vollständigkeitsaxiom . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 548
3. Vollständige Induktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 549
4. Notationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 551
5. Index . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 555
Einführung in die Mathematik 1
© Oliver Deiser
Vorwort
Das vorliegende zweiteilige Werk möchte eine Einführung in die Mathematik an
der Schnittstelle zwischen Schule und Hochschule geben, sowohl für das Fachstudium als auch das Studium des gymnasialen Lehramts. Die traditionelle Zweiteilung in Lineare Algebra und Analysis wird ersetzt durch einen breiten Zugang
zur Mathematik, der die unantastbaren Merkmale dieser Wissenschaft − exaktes
fachsprachliches Definieren und Formulieren von Ergebnissen und Fragen, anschauliches und formales Argumentieren − wahrt, aber zugleich grundlegende
Erkenntnisse der Lehr- und Lernforschung berücksichtigt: Wissensanbindung,
Transformationsprozesse und Perspektivenwechsel, Wiederholung, schrittweiser Erwerb einer Sprache.
Im ersten Band werden elementare reelle Funktionen, der analytische Kalkül,
reelle und komplexe Zahlen und die auf die Euklidische Ebene und den dreidimensionalen Euklidischen Raum fokussierte Lineare Algebra und analytische
Geometrie behandelt. Die Themen des zweiten Bandes umfassen elementare
Zahlen- und Graphentheorie, mathematische Strukturen, endliche Kombinatorik und Elemente der unendlichen Mengenlehre. In Anhängen werden Grundlagen im Umfeld von Junktoren, Quantoren, Mengen, Relationen, Funktionen
und vollständiger Induktion im Überblick vorgestellt sowie Materialien zum
Nachschlagen versammelt.
Die genannten Themen können in geeigneter Auswahl im Rahmen von zwei
umfangreichen Modulen behandelt werden, die durch Zusatzangebote (Ergänzungsübungen, Diskussionstutorien, Brückenkurse) oder ein Grundlagenmodul
vervollständigt werden. Diese Vervollständigung erscheint dem Autor sehr
wichtig, um die Sprache der Mathematik sicher zu erlernen.
© Oliver Deiser
Einführung in die Mathematik 1
8
Vorwort
Für das Fachstudium kann eine „Einführung in die Mathematik 1/2“ parallel
gelesen werden, für das Studium des Lehramts bietet sich mit Blick auf das zweite
Fach und die Erziehungswissenschaften eine auf zwei Semester verteilte Durchführung an. Sich anschließende systematische Module zur Analysis und Linearen
Algebra können eine solide Grundlage sowie eine Bekanntschaft mit Leitmotiven der Disziplin voraussetzen und sich so stärker auf ihre eigentlichen Themen
konzentrieren.
Mein Dank gilt allen Leserinnen und Lesern, die durch ihre genaue Lektüre
und ihre Rückmeldungen mitgeholfen haben, die Darstellung zu verbessern.
München, im September 2017
Oliver Deiser
Einführung in die Mathematik 1
© Oliver Deiser
1. Abschnitt
Elementare Funktionen
© Oliver Deiser
Einführung in die Mathematik 1
1. Geraden
Die elementaren Funktionen sind die Grundfunktionen der Analysis. Zu ihnen
gehören Geraden, Parabeln, allgemeine Polynome beliebigen Grades, rationale Funktionen, Exponentialfunktionen und Logarithmen zu beliebigen Basen, trigonometrische Funktionen und weiter alle Funktionen, die aus diesen
Funktionen durch Addition, Multiplikation, Bildung der Umkehrfunktion und
Verknüpfung hervorgehen.
Wir beginnen unsere Untersuchung der elementaren Funktionen mit den Geraden. Sie spielen in der Analysis eine Schlüsselrolle bei der lokalen Approximation von Funktionen.
© Oliver Deiser
Einführung in die Mathematik 1
12
1. Abschnitt
Elementare Funktionen
Geraden und ihre Parameter
Definition (Gerade)
Seien a, b P R. Dann heißt die Funktion g : R → R mit
g(x) = ax + b für alle x P R
die (funktionale) Gerade mit der Steigung a und der y-Verschiebung oder dem
Nullwert b.
10
5
4x
-3 x + 4
8
-2
-1
1
2
3
-5
Drei Geraden
Der Graph einer funktionalen Geraden ist eine Gerade im Sinne der Geometrie.
Bemerkung
(1) Die geometrischen Geraden der Ebene, die parallel zur y-Achse
verlaufen, lassen sich nicht durch eine Funktion darstellen. Der Zusatz
„funktional“ kann aber weggelassen werden, wenn man sich bewusst
ist, dass unsere Geraden nicht alle Geraden der Ebene im geometrischen Sinne darstellen.
(2) Eine Gerade g : R → R wird auch oft als lineare Funktion bezeichnet.
Da die Begriffe Funktion und Abbildung in der Mathematik prinzipiell
gleichwertig sind, ist etwas Vorsicht geboten, da unsere Geraden im
Allgemeinen keine linearen Abbildungen im Sinne der Linearen
Algebra sind (dies ist nur dann der Fall, wenn b = g(0) = 0). Im Umfeld
der elementaren Funktionen ist die Sprechweise aber weit verbreitet
und ungefährlich.
Eine einfache, aber wichtige Gerade ist:
Einführung in die Mathematik 1
© Oliver Deiser
1.
Geraden
13
Definition (Identität)
Die Gerade id : R → R mit id(x) = x für alle x P R heißt die Identität oder
(erste) Winkelhalbierende auf R.
Allgemeiner sind Geraden g der Form g(x) = ax mit beliebigem a P R. Sie verlaufen wie die Identität durch den Nullpunkt, unterscheiden sich aber von der
Identität durch ihre Steigung. Ist a > 0, so ist die Gerade streng monoton steigend, ist a < 0, so ist sie streng monoton fallend. Je größer der Betrag von a ist, desto steiler verläuft der Graph von g. Im Fall a = 0 ist die Gerade die Nullfunktion.
Eine Gerade der allgemeinen Form g : R → R mit g(x) = ax + b für alle x P R
geht aus der Geraden h mit h(x) = ax durch die Verschiebung von h um b entlang
der y-Achse hervor. Es gilt g(0) = b, was die Benennung von b als Nullwert motiviert. Ist a = 0, so ist g konstant gleich b. Im Fall einer von Null verschiedenen
Steigung a hat g die eindeutige Nullstelle
x1 = −
b
.
a
Mit Hilfe der Steigung a können wir die Änderung einer Geraden zwischen
zwei Punkten bestimmen. Ist g die Gerade ax + b und sind x1 , x2 P R so gilt
g(x1 ) − g(x2 ) = ax1 + b − ax2 − b = a(x1 − x2 ).
Speziell ändern sich die Funktionswerte von g um a, wenn wir von einer Stelle x1
zur Stelle x2 = x1 + 1 gehen. Graphisch lässt sich dies durch ein Steigungsdreieck
mit den Punkten (x1 , g(x1 )), (x2 , g(x1 )), (x2 , g(x2 )) darstellen. Für alle x1 ≠ x2 gilt
a =
g(x1 ) − g(x2 )
x1 − x2
=
g(x2 ) − g(x1 )
,
x2 − x1
sodass sich die Steigung der Geraden leicht bestimmen lässt, wenn die Funktionswerte an zwei verschiedenen Stellen bekannt sind.
g(x2 )
g(x1 ) - g(x2 )
g(x1 )
x1 - x2
g(x)
x1
© Oliver Deiser
x2
Einführung in die Mathematik 1
14
1. Abschnitt
Elementare Funktionen
Die Gerade durch zwei gegebene Punkte
Sind zwei Punkte (x1 , y1 ) und (x2 , y2 ) der Ebene mit x1 ≠ x2 gegeben, so gibt
es genau eine Gerade g durch diese Punkte, d. h. eine Gerade g mit g(x1 ) = y1
und g(x2 ) = y2 . Die Steigung dieser Geraden berechnet sich nach obigen Überlegungen zu
a =
y1 − y2
x1 − x2
y2 − y1
.
x2 − x1
=
Die y-Verschiebung b erhalten wir aus y1 = g(x1 ) = ax1 + b, sodass
b = y1 − ax1 =
x1 y1 − x2 y1 − x1 y1 + x1 y2
x1 − x2
=
x1 y2 − x2 y1
.
x1 − x2
Insgesamt gilt also
g(x) = ax + b =
y1 − y2
x +
x1 − x2
x1 y2 − x2 y1
x1 − x2
für alle x P R.
Die Größe x1 y2 − x2 y1 im Zähler von b wird uns später bei den Determinanten
wieder begegnen.
Beispiel
Für die Gerade g : R → R durch die Punkte (2, 4) und (5, 1) gilt
4−1
x +
2−5
g(x) =
2⋅1 − 5⋅4
2−5
= − x + 6 für alle x P R.
6
5
4
g(x)
3
4
1
2
1
1
2
3
4
5
6
Die Gerade durch die Punkte (2, 4) und (5, 1)
Einen alternativen Ansatz der Konstruktion einer Geraden durch zwei gegebene Punkte diskutieren wir in den Übungen und allgemeiner im folgenden
Kapitel.
Einführung in die Mathematik 1
© Oliver Deiser
1.
Geraden
15
Die Steigungsform
Sei g die Gerade ax + b. Ist nun p P R ein Punkt von Interesse, so ist oft eine
Darstellung von g von Vorteil, die den Punkt p als „neuen Ursprung“ oder
„Entwicklungspunkt“ ansieht. Hierzu fassen wir die Gerade g als die um p entlang der x1 -Achse und g(p) = ap + b entlang der y-Achse verschobene Gerade
ax auf. Damit gilt
g(x) = a(x − p) + g(p) für alle x P R.
(Steigungsform im Punkt p)
Anstelle von „Steigungsform“ spricht man gleichwertig auch von einer PunktRichtungsdarstellung. Die Gerade g verläuft durch den Punkt (p, g(p)) in der Richtung des Vektors (1, a).
g(p+1)
a
g(p)
g(x)
1
p+1
p
Zur Steigungsform einer Geraden (I)
Die Steigungsform lässt sich auch rechnerisch erhalten, da
g(x) = ax + b
= ax + b + g(p) − g(p)
= ax + b + g(p) − ap − b
= a(x − p) + g(p) für alle x P R.
Mit Hilfe des anschaulichen Verschiebungsarguments lässt sich diese wichtige
Form aber vielleicht leichter merken:
Steigung mal x verschoben um p plus Funktionswert
© Oliver Deiser
Einführung in die Mathematik 1
16
1. Abschnitt
Elementare Funktionen
Beispiel
Wir betrachten die Steigungsform nochmal anhand der konkreten Geraden
g : R → R mit
g(x) = 3(x − 1) + 8 für alle x P R.
Die Gerade g hat die Steigung 3, x-Verschiebung 1 und relative y-Verschiebung 8 (relativ zur x-Verschiebung 1). Die y-Verschiebung relativ zur Stelle 0
ist 5, sodass g(x) = 3x + 5 für alle x P R.
10
3 (x - 1) + 8
8
11
5
g(x) = 3 (x - 1) + 8
-2
-1
1
2
3
15
10
5
3 (x - 1) + 8
g(x) = 3 (x - 1) + 8
3 (x - 1)
3x
-2
-1
1
2
3
-5
-10
Zur Steigungsform einer Geraden (II). Das zweite Diagramm zeigt, wie g durch
eine zweifache Achsenverschiebung einer Geraden erhalten werden kann, die durch
den Ursprung verläuft und die Steigung von g besitzt.
Einführung in die Mathematik 1
© Oliver Deiser
1.
Geraden
17
Die Tangente einer differenzierbaren Funktion
Die Steigungsform wird in der Differentialrechnung zur lokalen Approximation von Funktionen eingesetzt: Hat eine Funktion f : R → R an einer Stelle
p P R die Ableitung f ′(p) = a, so heißt die Gerade g : R → R mit
g(x) = f ′(p) (x − p) + f(p) für alle x P R
die Tangente von f durch den Punkt (p, f(p)). An der Stelle p ist die Tangente die
aus linearer Sicht bestmögliche Approximation an die Funktion f: Sie stimmt mit
der Funktion f in Funktionswert und Steigung an der Stelle p überein. Wir betrachten Tangenten und ihre Approximationseigenschaften im zweiten Abschnitt genauer.
g(x)
f(x)
f(p)
p
Die Tangente einer differenzierbaren Funktion f an einer Stelle p
h(x) = f(x) - g(x)
f(p)
p
Die Differenz h zwischen f und der Tangente g an der Stelle p
© Oliver Deiser
Einführung in die Mathematik 1
18
1. Abschnitt
Elementare Funktionen
Übungen
Übung 1
(a) Bestimmen Sie die Steigungsform einer Geraden g : R → R durch
zwei Punkte (x1 , y1 ) und (x2 , y2 ), x1 ≠ x2 in den Entwicklungspunkten
x1 und x2 .
(b) Nehmen Sie nun an, dass y1 und y2 die Werte einer Funktion
f : R → R an den Stellen x1 und x2 sind. Schreiben Sie die Steigungsformen für diese Situation auf und erstellen ein zugehöriges
Diagramm.
Übung 2
Sei f : R → R eine Funktion. Es gebe eine Konstante c P R mit der
Eigenschaft:
(+) Für alle x, y P R mit x ≠ y ist
f(x) − f(y)
= c.
x−y
Zeigen Sie, dass f eine Gerade ist. Betrachten Sie nun die schwächere
Eigenschaft
(++) Für alle x P R ist f(x + 1) − f(x) =
f(x + 1) − f(x)
= c.
1
Folgt hieraus ebenfalls, dass f eine Gerade ist?
Übung 3
Seien g, h : R → R Geraden. Weiter sei f = h + g, d. h. es gilt
f(x) = h(g(x)) für alle x P R.
Zeigen Sie, dass f eine Gerade ist. Finden Sie eine Bedingung für f(0) = 0.
Übung 4
Für welche Geraden g : R → R gilt g(x + y) = g(x) + g(y) für alle x, y P R?
Übung 5
Sei g : R → R eine Gerade. Bestimmen Sie:
(a) die Gerade g1 : R → R, deren Graph der an der x-Achse gespiegelte
Graph von g ist,
(b) die Gerade g2 : R → R, deren Graph der an der y-Achse gespiegelte
Graph von g ist,
(c) die Gerade g3 : R → R, deren Graph der am Nullpunkt gespiegelte
Graph von g ist.
Einführung in die Mathematik 1
© Oliver Deiser
1.
Geraden
19
Übung 6
Wann besitzen zwei Geraden g, h : R → R genau einen Schnittpunkt?
Finden Sie ein Kriterium für die vier Parameter der Geraden und beweisen
Sie es. Leiten Sie zudem im Fall der eindeutigen Existenz eine Formel für
den Schnittpunkt her.
Übung 7
Wie kann man feststellen, ob drei Punkte (x1 , y1 ), (x2 , y2 ), (x3 , y3 ) der Ebene
mit paarweise verschiedenen x1 , x2 , x3 auf einer Geraden g : R → R liegen?
Diskutieren Sie verschiedene Möglichkeiten.
Übung 8
Sei g : R → R eine Gerade, und seien x1 , x2 P R mit x1 ≠ x2 . Zeigen Sie,
dass sich g eindeutig als Summe zweier Geraden g1 , g2 : R → R mit
g(x1 ) = 0 und g(x2 ) = 0 darstellen lässt. Bestimmen Sie zudem die Koeffizienten der Darstellung
g(x) = c1 (x − x1 ) + c2 (x − x2 ) für alle x P R.
Gewinnen Sie hieraus eine neue Konstruktionsmöglichkeit der eindeutigen
Geraden durch zwei gegebene Punkte (x1 , y1 ) und (x2 , y2 ) mit x1 ≠ x2 .
Zeichnen Sie ein Diagramm zur Illustration.
© Oliver Deiser
Einführung in die Mathematik 1
2. Parabeln
Wir betrachten nun Parabeln, die bereits deutlich schwieriger zu beherrschen
sind als Geraden. Wesentliches Hilfsmittel ist die Überführung in Scheitelform.
Sie erlaubt uns, die geometrische Lage einer Parabel zu erkennen. Mit ihrer
Hilfe gewinnen wir die Mitternachtsformel für die Nullstellen.
© Oliver Deiser
Einführung in die Mathematik 1
22
1. Abschnitt
Elementare Funktionen
Parabeln und ihre Parameter
Definition (Parabel)
Seien a, b, c P R mit a ≠ 0. Dann heißt die Funktion f : R → R mit
f(x) = ax2 + bx + c für alle x P R
die (funktionale) Parabel mit der Öffnung a, Nullpunktsteigung b und dem
Nullwert c.
Wie bei den Geraden fängt der Begriff nicht alle geometrischen Parabeln ein.
Diesmal sind sogar nur sehr spezielle geometrische Parabeln funktional darstellbar, nämlich genau diejenigen, deren Mittelachse parallel zur y-Achse verläuft.
Wir lassen dennoch den Zusatz „funktional“ wieder weg. Anstelle von einer „Parabel“ spricht man gleichwertig auch von einer quadratischen Funktion.
12
10
8
x2 - x + 1
6
x2 - 2 x + 1
x2 - 3 x + 1
4
2
-2
-1
1
2
3
4
-2
Die Einheitsparabel und die Wurzelfunktion
Die einfachste Parabel ist:
Definition (Einheitsparabel)
Die Parabel sq : R → R mit sq(x) = x2 für alle x P R heißt die Einheitsparabel
oder Normalparabel (mit sq für engl. square).
Die Einheitsparabel ist eine gerade Funktion und verläuft durch die Punkte
(0, 0), (1/2, 1/4), (1, 1), (2, 4).
Einführung in die Mathematik 1
© Oliver Deiser
2. Parabeln
23
4
x2
3
2
1
-2
-1
1
2
Die Einheitsparabel
Auf dem Intervall [0, ∞[ ist die Funktion streng monoton wachsend, sodass wir
sie dort umkehren können:
Definition (Quadratwurzel)
Die Umkehrfunktion der auf das Intervall [ 0, ∞ [ eingeschränkten
Einheitsparabel heißt die Quadratwurzelfunktion. Wir bezeichnen sie mit
sqrt : [ 0, ∞ [ → [ 0, ∞ [ (für engl. square root).
Weiter schreiben wir auch £x anstelle von sqrt(x). Für alle x ≥ 0 heißt
sqrt(x) die Quadratwurzel oder kurz Wurzel von x.
Die Wurzelfunktion ist nur für nichtnegative reelle Zahlen definiert und sie
besitzt nur nichtnegative Werte. Nach Definition als Umkehrfunktion der auf
[ 0, ∞ [ eingeschränkten Quadratfunktion gilt
sqrt(sq(x)) = x = sq(sqrt(x)) für alle x P [ 0, ∞ [
oder gleichwertig
£x2 = x = ( £x ) 2 für alle x P [ 0, ∞ [.
Weiter ist die Wurzel aus x2 wegen x2 ≥ 0 zwar für alle reellen Zahlen x definiert,
sie ergibt aber im Allgemeinen nicht x, sondern den Betrag von x:
£x2 = |x| für alle x P R.
(Formel vom nicht vergessenen Betrag)
Es ist eine zeitlose Fehlerquelle, den Betrag zu vergessen. Der Leser möge sich
die Beziehung anhand von Beispielen vor Augen führen: Für x = −2 gilt x2 = 4 und
die Wurzel aus 4 ist 2 und nicht −2.
© Oliver Deiser
Einführung in die Mathematik 1
24
1. Abschnitt
Elementare Funktionen
2.0
x
1.5
1.0
0.5
1
2
3
4
3.0
2.5
2.0
x
1.5
x2
x
1.0
0.5
0.0
0.5
1.0
1.5
2.0
2.5
3.0
Die Wurzelfunktion als Umkehrfunktion des rechten Astes der Einheitsparabel
Beim Rechnen mit Wurzeln ist die Vorzeichenfunktion sgn : R → { −1, 0, 1 }
hilfreich, die durch
sgn(x) = 1 für x > 0, sgn(x) = −1 für x < 0, sgn(0) = 0
definiert ist (mit sgn für lateinisch signum oder engl. sign). Es gilt
x = sgn(x) |x| und |x| = x sgn(x) für alle x P R.
Für alle x P R und y ≥ 0 gilt damit
£x2 y = £x2 £y = |x| £y = sgn(x) x £y.
Einführung in die Mathematik 1
© Oliver Deiser
2. Parabeln
25
1.0
sgn(x)
0.5
-2
-1
1
2
-0.5
-1.0
Parabeln mit Parameter b = 0
Wir betrachten eine Parabel der Form ax2 mit einer von 0 verschiedenen reellen Zahl a. Eine derartige Parabel ist durch ihre Öffnung a charakterisiert:
(1) Ist a positiv (negativ), so ist die Parabel nach oben (unten) geöffnet.
(2) Die Parabel ax2 verläuft durch den Punkt (1, a). Je größer der Betrag von a
ist, desto enger ist der Graph der Parabel.
(3) Die Parabel ax2 ist eine gerade Funktion, da a(−x)2 = ax2 für alle x P R. Sie
verläuft durch den Nullpunkt sowie durch (1/2, a/4), (1, a), (2, 4a).
Unproblematisch ist der Parameter c: Eine Parabel der Form ax2 + c entsteht
aus der Parabel ax2 durch Verschiebung um den Wert c entlang der y-Achse.
Auch diese Funktionen sind gerade.
15
10
x2
+1
2
5
-x2 + 2
2 x2 - 2
-3
-2
-1
1
2
3
-5
© Oliver Deiser
Einführung in die Mathematik 1
26
1. Abschnitt
Elementare Funktionen
Überführung in Scheitelform
Wir betrachten nun eine allgemeine Parabel f : R → R der Form
f(x) = ax2 + bx + c für alle x P R.
Wie sieht der Graph von f aus? Besitzt der Graph überhaupt immer die geometrische Form einer Parabel? Dies ist zunächst keineswegs klar! Man würde f
nicht eine Parabel nennen, wenn es anders wäre. Aber die Frage nach dem
Warum bleibt. Die geometrische Wirkung einer Veränderung des Parameters b
ist nicht so einfach zu erklären wie eine Veränderung von a oder c.
Ansatz I: Geometrische Verschiebung
Um zu zeigen, dass f die Form einer Parabel hat, können wir so vorgehen:
Wir zeigen, dass f die Verschiebung der Parabel ax2 um eine gewisse Konstante
x0 entlang der x-Achse und eine gewisse Konstante y0 entlang der y-Achse ist.
Analytisch entspricht eine derartige Verschiebung dem Übergang von x zu
x − x0 und der Addition von y0 . Es genügt also, den folgenden Satz zu beweisen:
Satz (Verschiebungssatz für Parabeln)
Eine Parabel ax2 + bx + c ist eine Verschiebung der Parabel ax entlang der
Achsen: Es gibt x0 , y0 P R mit
(+) ax2 + bx + c = a(x − x0 )2 + y0 für alle x P R.
Beweis
Die Aussage (+) ist äquivalent zu
ax2 + bx + c = ax2 − 2ax0 x + ax0 2 + y0 für alle x P R.
Durch Koeffizientenvergleich können wir x0 und y0 bestimmen: Aus
b = −2ax0 , c = ax0 2 + y0
erhalten wir
x0 = −
b
,
2a
y0 = c − ax0 2 = c − a
b2
4 a2
= c −
b2
.
4a
Einsetzen zeigt, dass x0 und y0 wie gewünscht sind.
Wir können die x0 -y0 -Verschiebung in einer beliebigen Reihenfolge durchführen, also zuerst entlang der x-Achse und dann entlang der y-Achse verschieben oder umgekehrt. Die Öffnung a der Parabel bleibt dabei gleich.
Die im Beweis gefundenen Werte für x0 und y0 halten wir in einer Definition
fest:
Einführung in die Mathematik 1
© Oliver Deiser
2. Parabeln
27
Definition (Scheitelpunkt, Scheitelform)
Sei f : R → R, f(x) = ax2 + bx + c eine Parabel. Dann heißt der Punkt
(x0 , y0 ) =
(−
b
, c −
2a
b2
4a
)
der Ebene der Scheitelpunkt und die Darstellung
f(x) = a(x − x0 )2 + y0
die Scheitelform der Parabel.
35
30
25
(x - 2)2 + 10
20
(x - 2)2
x2
15
10
5
-2
2
4
6
Achsenverschiebung von x2 um 2 nach rechts und 10 nach oben
5
-1
1
2
3
4
5
-2 (x - 2)2 + 5
5
-5
-10
Eine Parabel in Scheitelform. Der Scheitelpunkt ist (2, 5)
© Oliver Deiser
Einführung in die Mathematik 1
28
1. Abschnitt
Elementare Funktionen
Ansatz II: Quadratische Ergänzung
Wir haben die Formel für den Scheitelpunkt durch einen geometrisch motivierten Ansatz gewonnen. Bei einer etwas anderen Herleitung, bekannt als quadratische Ergänzung, steht die algebraische Umformung mit Hilfe der binomischen Formel im Vordergrund. Ausgangspunkt ist ax2 + bx + c. Ausklammern
von a liefert die Form
(
a x2 +
b
x
a
)+c
bzw. a(x2 − 2qx) + c, wobei q = −
b
.
2a
Durch Einfügen von 0 = q2 − q2 können wir die binomische Formel anwenden:
a(x2 − 2qx) + c = a(x2 − 2qx + q 2 − q 2 ) + c
= a((x − q)2 − q 2 ) + c = a(x − q)2 + c − aq2 .
Damit haben wir die Scheitelform wiedergefunden (mit x0 = q).
Die quadratische Ergänzung hat den Vorteil, dass wir eine Parabel schnell in
Scheitelform überführen können. Wir müssen nur den algebraischen Trick des
Einschiebens der Null anwenden, der die binomische Formel ins Spiel bringt.
Obige Definition von q ist motiviert durch den Wunsch nach einem Faktor 2 im
mittleren Term (ob wir ein negatives oder positives Vorzeichen für diesen anstreben, ist Geschmackssache; der Buchstabe „q“ steht für „quadratisch“, man kann
natürlich auch gleich mit x0 arbeiten). Wer eine direkte Rechnung bevorzugt,
kann die quadratische Ergänzung so durchführen:
(
ax2 + bx + c = a x2 +
(
= a x+
b
x
a
b
2a
)2
)+c
+ c −
(
= a x2 +
b
x +
a
b2
b2
−
4a2
4a2
)+c
b2
.
4a
Ansatz III: Verwendung der Ableitung
Mit Methoden der Differentialrechnung lässt sich der Scheitelpunkt besonders elegant finden. Es gilt
d
ax2 + bx + c = 2ax + b.
dx
Die Ableitung wechselt an der Stelle x0 = −b/(2a) ihr Vorzeichen, sodass dort ein
lokales Extremum vorliegt. Den Wert y0 erhalten wir durch
y0 = ax0 2 + bx0 + c.
Die Ableitung zeigt auch, warum wir den zweiten Koeffizienten b als Nullpunktsteigung bezeichnet haben: Es gilt f ′(0) = b. Wegen f(0) = c verläuft die Parabel
also durch den Punkt (0, c) mit der Steigung b. Diese Information ist beim Zeichnen per Hand oft hilfreich.
Einführung in die Mathematik 1
© Oliver Deiser
2. Parabeln
29
Ein Vergleich
Die folgende Tabelle zeigt die polynomielle Darstellung ax2 + bx + c und die
Scheitelform a(x − x0 ) + y0 einer Parabel im Vergleich. Beide Darstellungen haben drei Parameter und die Tabellen geben an, ob sich Öffnung und Verschiebung der Parabel bei einer Änderung der Parameter ändert oder nicht.
Parameter
Öffnung
x-Verschiebung
y-Verschiebung
a
ja
ja
ja
b
nein
ja
ja
c
nein
nein
ja
2
Wirkung einer Parameteränderung für die Form ax + bx + c
Parameter
Öffnung
x-Verschiebung
y-Verschiebung
a
ja
nein
nein
x0
nein
ja
nein
y0
nein
nein
ja
Wirkung einer Parameteränderung für die Scheitelform a(x − x0 )2 + y0
15
10
5
-6
-4
-2
2
4
6
-5
-10
Die Parabeln x2 + bx für die dreizehn Parameter b = −6, −5,−4, …, 4, 5, 6.
Die Scheitelpunkte der Parabeln befinden sich auf der Parabel −x2 .
© Oliver Deiser
Einführung in die Mathematik 1
30
1. Abschnitt
Elementare Funktionen
Bestimmung der Nullstellen
Wir betrachten nun die Nullstellen einer Parabel. Auch hier ist die Scheitelform nützlich: Eine Parabel a(x − x0 )2 + y0 in Scheitelform hat die Nullstellen
x1,2 = x0 ± £− y0 /a,
y0
≥ 0,
a
falls −
wobei x1 dem positiven Vorzeichen und x2 dem negativen Vorzeichen entspricht,
sodass x1 ≥ x2 . Mit Hilfe unserer Formel für den Scheitelpunkt
(x0 , y0 ) =
(−
b
, c −
2a
b2
4a
)
einer beliebigen Parabel ax2 + bx + c gewinnen wir eine allgemeine Formel für
die Nullstellen. Sie berechnen sich zu
s
b2 − 4ac
−b
±
x1,2 = x0 ± £− y0 /a =
4a2
2a
−b
2a
±
£b2 − 4ac
2|a|
=
−b ± sgn(a) £b2 − 4ac
,
2a
falls b − 4ac ≥ 0. Der Wert b2 − 4ac heißt die Diskriminante der Parabel. Ihr
Vorzeichen entscheidet über die Existenz von Nullstellen.
Bei unserer Berechnung haben wir das Vorzeichen sgn(a) verwendet, um einen
gemeinsamen Nenner zu erreichen. Für negative a wird ± zu . Damit ist immer
x1 ≥ x2 , wie bei den Nullstellen einer Parabel in Scheitelform. Um die Formel zu
vereinfachen, können wir aufgrund des Auftretens von ± das Signum auch unterdrücken. Dann gilt allerdings x1 ≤ x2 für a < 0.
2
±
y0
y0
a
x0
y0
a
Der Abstand der Nullstellen von der x-Koordinate des Scheitelpunktes
Einführung in die Mathematik 1
© Oliver Deiser
2. Parabeln
31
Wir fassen unsere Ergebnisse in einem Satz zusammen.
Satz (Nullstellen von Parabeln)
Eine Parabel ax2 + bx + c hat im Fall einer nichtnegativen Diskriminante
d = b2 − 4ac ≥ 0 genau die Nullstellen
x1,2 =
−b ± £b2 − 4ac
.
2a
(Lösungsformel, Mitternachtsformel)
Ist d = 0, so gilt x1 = x2 . Andernfalls gilt x1 ≠ x2 . Im Fall d < 0 hat die Parabel
keine Nullstellen.
Ist x1 = x2 (d. h. y0 = 0), so sagen wir, dass die Parabel eine doppelte Nullstelle
besitzt. Der Scheitelpunkt (x0 , y0 ) = (x0 , 0) berührt dann die x-Achse.
Parabeln mit vorgegebenen Nullstellen
Die Mitternachtsformel erlaubt die Berechnung der Nullstellen x1 , x2 mit
Hilfe der Parameter a, b, c einer Parabel. Es stellt sich umgekehrt die Frage, ob
und wie die Parameter mit Hilfe vorgegebener Nullstellen berechnet werden
können. Da die Multiplikation einer Parabel mit einer Konstanten die Nullstellen unverändert lässt, sind die Parameter a, b, c durch die Nullstellen x1 , x2 nicht
eindeutig bestimmt. Eindeutig erreichen wir, wenn wir normierte Parabeln (mit
der Öffnung a = 1) betrachten:
Satz (Vietascher Wurzelsatz)
Seien b, c P R, und seien x1 , x2 die (nicht notwendig verschiedenen)
Nullstellen von x2 + bx + c. Dann gilt:
b = −(x1 + x2 ), c = x1 x2 .
(Formeln von Vieta)
Wir geben zwei Beweise des Satzes.
Beweis mit Hilfe der Mitternachtsformel
Nach der Mitternachtsformel gilt wegen a = 1:
2x1,2 = −b ± £b2 − 4c
Wir setzen w = £b2 − 4c. Dann gilt
−(x1 + x2 ) =
x1 x2 =
b−w+b+w
2
b2 − w2
4
© Oliver Deiser
= b,
= c.
Einführung in die Mathematik 1
32
1. Abschnitt
Elementare Funktionen
Beweis durch Koeffizientenvergleich
Da sich Nullstellen abspalten lassen, gilt:
x2 + bx + c = (x − x1 )(x − x2 ) für alle x P R.
Ausmultiplizieren der rechten Seite liefert
x2 + bx + c = x2 − (x1 + x2 )x + x1 x2 für alle x P R.
Die Formeln von Vieta ergeben sich nun durch Koeffizientenvergleich.
Korollar (Parabeln mit vorgegebenen Nullstellen)
Seien x1 , x2 P R und sei g = x2 − (x1 + x2 ) + x1 x2 . Dann sind die Parabeln, die
x1 und x2 als Nullstellen besitzen, genau die Funktionen der Form
a g = a (x − x1 ) (x − x2 ) mit a P R*.
Eine Parabel der Öffnung 1, die zwei Nullstellen besitzt, lässt sich also eindeutig als Produkt zweier Geraden der Steigung schreiben.
10
f(x)
5
x2 - 6 x + 5
2
4
6
x-1
x-5
-5
-10
10
f(x)
5
2 x2 - 12 x + 10
2
4
6
x-1
2 (x - 5)
-5
-10
Zwei Parabeln mit den Nullstellen 1 und 5, dargestellt als Produkt zweier Geraden
Einführung in die Mathematik 1
© Oliver Deiser
2. Parabeln
33
Die Parabel durch drei gegebene Punkte
Seien (x1 , y1 ), (x2 , y2 ), (x3 , y3 ) Punkte der Ebene mit paarweise verschiedenen
x-Koordinaten x1 , x2 , x3 , die nicht auf einer Geraden liegen. Wir zeigen, dass es
genau eine Parabel ax2 + bx + c gibt, die durch diese Punkte verläuft. Eine Möglichkeit ist, das Gleichungssystem
a x1 2 + b x1 + c = y1
a x2 2 + b x2 + c = y2
a x3 2 + b x3 + c = y3
in den Unbekannten a,b,c zu lösen. Eleganter ist ein auf Lagrange zurückgehenden Ansatz, der auf der Beobachtung beruht, dass die Parabel
(x − x2 )(x − x3 )
(x1 − x2 )(x1 − x3 )
Nullstellen bei x2 und x3 besitzt und an der Stelle x1 den Wert 1 annimmt. Durch
Skalierung und symmetrische Summation erhalten wir die Funktion
y1
(x − x2 )(x − x3 )
(x1 − x2 )(x1 − x3 )
+ y2
(x − x1 )(x − x3 )
(x2 − x1 )(x2 − x3 )
+ y3
(x − x1 )(x − x2 )
,
(x3 − x1 )(x3 − x2 )
die per Konstruktion durch die drei Punkte verläuft. Ausmultiplizieren zeigt,
dass diese Funktion eine Parabel oder eine Gerade ist. Da die drei Punkte nicht
auf einer Geraden liegen, ist der zweite Fall unmöglich.
Dies zeigt die Existenz. Die Eindeutigkeit können wir so einsehen: Verlaufen
zwei Parabeln f und g durch die drei gegebenen Punkte, so ist f − g eine Funktion
der Form ax2 + bx + c mit den drei verschiedenen Nullstellen x1 , x2 und x3 . Dann
ist aber f − g die Nullfunktion, da alle anderen Funktionen der Form ax2 + bx + c
höchstens zwei Nullstellen besitzen. Damit ist f = g.
Beispiel
Die eindeutige Parabel durch die Punkte
(x1 , y1 ) = (0, 2), (x2 , y2 ) = (1, 1), (x3 , y3 ) = (3, 3)
berechnet sich zu
2
(x − 1)(x − 3)
(0 − 1)(0 − 3)
+ 1
=
2
(x − 1)(x − 3) −
3
=
1
2x2 − 5x + 6 .
3
(
© Oliver Deiser
(x − 0)(x − 3)
(1 − 0)(1 − 3)
1
x(x − 3) +
2
+ 3
(x − 0)(x − 1)
(3 − 0)(3 − 1)
1
x(x − 1)
2
)
Einführung in die Mathematik 1
34
1. Abschnitt
Elementare Funktionen
5
4
3
1
2 x2 - 5 x + 6
3
2
(x - 3) (x - 1)
3
1
- (x - 3) x
2
1
(x - 1) x
2
2
1
-1
1
2
3
4
-1
Die eindeutige Parabel durch die drei Punkte (0, 2), (1, 1), (3, 3), dargestellt als
Summe dreier Parabeln.
Brennpunkt und Leitlinie
Wir besprechen noch einige geometrische Eigenschaften von Parabeln. Dabei
konzentrieren wir uns auf Parabeln der Form ax2 .
Definition (Brennpunkt und Leitlinie)
Der Brennpunkt einer Parabel ax2 ist der Punkt F = (0, a/4). Die Leitlinie L
von ax2 ist die zur x-Achse parallele Gerade durch den Punkt −F.
Statt Brennpunkt ist auch Fokuspunkt oder kurz Fokus üblich. Die Leitlinie ist
auch als Direktrix bekannt. Die beiden Objekte sind durch die folgenden Eigenschaften ausgezeichnet:
(1) Im Brennpunkt einer Parabel ax2 laufen alle zur y-Achse parallelen
Strahlen zusammen, die an der Tangente der Parabel reflektiert werden.
(2) Die Parabel ax2 ist die Menge aller Punkte P der Ebene, deren Abstand zu
F gleich ihrem Abstand zu L ist. (Dabei ist der Abstand von P und L
definiert als die Länge des Lotes von P auf L.)
Einführung in die Mathematik 1
© Oliver Deiser
2. Parabeln
35
Die folgenden Diagramme illustrieren diese Eigenschaften. Ihr Beweis sei
dem Leser zur Übung überlassen.
2
1
F
-2
-1
1
2
Der Brennpunkt F = (0, 1/4) der Einheitsparabel
2
1
d
d
F
-2
-1
1
2
L
Die Leitlinie L der Einheitsparabel
© Oliver Deiser
Einführung in die Mathematik 1
36
1. Abschnitt
Elementare Funktionen
Das Problem der Winkeldrittelung
In der Geschichte der Mathematik spielen die drei klassischen Probleme der antiken Geometrie eine wichtige Rolle:
(A) Quadratur des Kreises
(B) Winkeltrisektion
(C) Würfelverdoppelung (Delisches Problem)
Alle Probleme stellen die Frage, ob es möglich ist, eine bestimmte geometrische Größe mit Hilfe von Zirkel und Lineal zu konstruieren. Die Quadratur
des Kreises ist die Aufgabe, einen Kreis mit Hilfe von Zirkel und Lineal in ein
flächengleiches Quadrat zu verwandeln. Die Winkeltrisektion verlangt für einen beliebig vorgegebenen Winkel α die Konstruktion von α/3. Und bei der
Würfelverdoppelung ist zu einem Würfel der Kantenlänge a ein zweiter Würfel mit dem doppelten Volumen (also der Kantenlänge 3 £2a) zu erzeugen. Erst
im 19. Jahrhundert konnte gezeigt werden, dass die drei Konstruktionsaufgaben
mit Zirkel und Lineal nicht lösbar sind. Beteiligt an den Unmöglichkeitsnachweisen waren insbesondere Carl Friedrich Gauß, Niels Henrik Abel, Évariste
Galois, Pierre-Laurant Wantzel und Ferdinand von Lindemann. Die entwickelten algebraischen Methoden erlauben eine Detailanalyse der Problematik. So
ergibt sich zum Beispiel, dass die Drittelung des in jedem gleichseitigen Dreieck
auftauchenden Winkels π/3 nicht möglich ist. Bereits Descartes konnte jedoch
zeigen, dass die Winkeltrisektion gelingt, wenn zusätzlich zu Zirkel und Lineal
Parabeln verwendet werden dürfen (genauer genügt die Einheitsparabel). Die
folgende Konstruktion verwendet die Parabel 2x2 :
Wir starten mit einem Punkt
P = (x, y) = (cos α, sin α)
auf dem Einheitskreis mit x,y > 0. Ziel ist, den Winkel α zu dritteln.
(1) Wir konstruieren den Punkt Q = (x/2, 1).
(2) Nun bilden wir den Kreis mit dem Mittelpunkt Q durch den Nullpunkt.
Der Schnitt dieses Kreises mit dem rechten Ast der Parabel 2x2 liefert den
Punkt R.
(3) Die Senkrechte durch R trifft den Einheitskreis im Punkt S.
Man kann zeigen, dass der Punkt S den Winkel α/3 mit der positiven x-Achse
einschließt.
Das folgende Diagramm visualisiert die Konstruktion. Dabei ist α = π/3, sodass sich ein 20 Grad Winkel ergibt.
Einführung in die Mathematik 1
© Oliver Deiser
2. Parabeln
37
2.0
2x2
R
1.5
Q
1.0
P
0.5
S
-1.0
-0.5
0.5
1.0
Winkeldrittelung mit Hilfe der Parabel 2x2
Auch das Problem der Würfelverdoppelung lässt sich mit erweiterten Hilfsmitteln lösen. Gegeben a > 0 kann eine Strecke der Länge 3 £a mit Hilfe einer
Parabel und einer Hyperbel konstruiert werden; eine derartige Konstruktion
wird bereits dem antiken Mathematiker Menaichmos zugeschrieben. Wesentlich schwieriger ist dagegen das Problem der Quadratur des Kreises. Parabeln,
Hyperbeln, Ellipsen und noch weitaus allgemeinere algebraische Kurven reichen nicht aus, eine Strecke der Länge π zu konstruieren.
Näherungskonstruktionen
Aus der Winkeldrittelung mit Hilfe einer Parabel lassen sich beliebig genaue
Näherungslösungen gewinnen, die nur Zirkel und Lineal verwenden. Hierzu
wird der rechte Ast der Parabel 2x2 für ein beliebiges n ≥ 1 durch den Streckenzug
ersetzt, der durch die n + 1 Punkte
(tk , 2tk 2 ) mit t0 = 0, t1 = 1/n, t2 = 2/n, …, tn = 1.
definiert wird. Dieser Streckenzug ist mit Zirkel und Lineal konstruierbar. Eine
Konstruktion, die für eine Parabel a x2 mit einer beliebigen Öffnung a geeignet
ist, ist die folgende:
(1) Gegeben sei ein Punkt P = (p, q) mit p > 0 und ein n ≥ 1. Wir konstruieren
n + 1 Punkte auf der Parabel ax2 mit der Öffnung a = q/p2 . Zwei der
Punkte sind der Nullpunkt O und der Punkt P.
© Oliver Deiser
Einführung in die Mathematik 1
38
1. Abschnitt
Elementare Funktionen
(2) Wir setzen P0 = (p, 0) und unterteilen die Strecken OP0 und P0 P in je n
gleichlange Teile.
(3) Wir zeichnen zur y-Achse parallele Geraden durch die Teilpunkte von
OP0 . Weiter verbinden wir den Nullpunkt O mit den Teilpunkten von
P0 P durch Geradenstücke.
(4) Die Schnittpunkte der einander entsprechenden Geraden aus (3) und (4)
liegen auf der Parabel a x2 (Beweis als Übung).
q = ap2
P
p
Konstruktion von Punkten auf einer Parabel der Öffnung a bei gegebenem Punkt P.
Auf der linken Seite ist gespiegelt der approximierende Steckenzug gezeigt.
Führen wir die Winkeldrittelung für α = π/3 mit einer approximierten Parabel
2x2 durch, so erhalten wir in Grad angegeben die Winkel
20,854763…
für n = 4
20,279338…
für n = 8
20,009275…
für n = 16
20,004528…
für n = 32
20,002107…
für n = 64
20,000884…
für n = 128.
Einführung in die Mathematik 1
© Oliver Deiser
2. Parabeln
39
Kreise, Ellipsen und Hyperbeln
Mit Hilfe der Einheitsparabel und der Wurzelfunktion können wir Kreisbögen erzeugen. Für alle r > 0 stellen die beiden Funktionen fr , gr : [−r, r ] → R mit
fr (x) = £r2 − x2 , gr (x) = − £r2 − x2 für alle x P [ −r, r ]
die obere bzw. untere Hälfte des Kreises Kr = { (x, y) P R2 | x2 + y2 = r2 } mit Radius
r und Mittelpunkt 0 dar. Zum Beweis lösen wir definierende Gleichung x2 + y2 = r2
des Kreises nach y auf. Wir erhalten:
y = ±£r2 − x2 .
Der Radikand ist genau dann größergleich 0, wenn x2 ≤ r2 , d. h. wenn |x| ≤ r.
Dies liefert die Definition von fr und gr .
3
2
1 - x2
2 - x2
3 - x2
1
- 1 - x2
- 2 - x2
- 3 - x2
-2
-1
1
2
1 - x2
2 - x2
3 - x2
-1
-2
Verformung von Parabelbögen zu Kreisbögen durch Anwendung der Wurzelfunktion
© Oliver Deiser
Einführung in die Mathematik 1
40
1. Abschnitt
Elementare Funktionen
Ellipsen
Durch Skalierung der Funktionswerte erhalten wir in y-Richtung gestauchte
oder gestreckte Kreise und damit achsenparallele Ellipsen. Denn eine achsenparallele Ellipse mit den Halbachsen a, b > 0 ist definiert durch
Ea, b = { (x, y) P R2 | (x/a)2 + (y/b)2 = 1 }.
Auflösen der definierenden Gleichung nach y liefert
y = ±
b
£a2 − x2 .
a
Damit stellen die Funktionen c fa und c ga mit c = b/a die obere bzw. untere
Hälfte der Ellipse Ea, b dar.
2
1
-2
-1
1
-1
1
2
1 - x2
5
4
2 - x2
2
3
3 - x2
2
-
1
2
1 - x2
-
5
4
2 - x2
-
2
3
3 - x2
-2
Funktional dargestellte Ellipsen
Um die geometrischen Eigenschaften einer Ellipse Ea, b mit den Halbachsen
a ≥ b > 0 zu beschreiben, definieren wir:
e = £a2 − b2
(lineare Exzentrizität)
ε = e/a = £1 − (b/a)
2
(numerische Exzentrizität)
F1, 2 = ± (e, 0)
(Brennpunkte)
Einführung in die Mathematik 1
© Oliver Deiser
2. Parabeln
41
Die beiden Exzentrizitäten messen die Abweichung der Ellipse von einem
Kreis. Ist a = b und damit Ea, b der Kreis Ka , so gilt e = ε = 0. Die numerische Exzentrizität hängt nur vom Verhältnis der Halbachsen ab. Es gilt stets ε P [ 0, 1 [.
Die Brennpunkte einer Ellipse verallgemeinern den Kreismittelpunkt: Eine
Ellipse Ea, b ist die Menge aller Punkte der Ebene, deren Abstandssumme zu den
beiden Brennpunkten gleich 2a ist, d. h.
(+) Ea, b = { P P R2 | F1 P + F2 P = 2a }.
Dabei bezeichnet PQ den Abstand zweier Punkte P und Q der Ebene. In einem
Brennpunkt laufen alle vom anderen Brennpunkt ausgehenden Strahlen zusammen, die an der Ellipse tangential reflektiert werden.
Ea, b
a
b
a
F2
F1
Ea, b
a
F2
b
a
F1
Brennpunkte und Abstandseigenschaft von Ellipsen Ea, b
© Oliver Deiser
Einführung in die Mathematik 1
42
1. Abschnitt
Elementare Funktionen
Hyperbeln
Die Verformung einer Parabel zu einem Kreis erfolgte durch Anwendung der
Wurzelfunktion auf eine nach unten geöffnete und nach oben verschobene Parabel. Wenden wir die Wurzelfunktion auf eine nach oben geöffnete und nach unten verschobene Parabel an, so erhalten wir Hyperbeln: Für alle r > 0 stellen die
Funktionen fr , gr : R − ] −r, r [ → R mit
fr (x) = £x2 − r2 , gr (x) = − £x2 − r2 für alle x mit |x| ≥ r
die obere bzw. untere Hälfte der Hyperbel
Hr = { (x, y) P R2 | x2 − y2 = r2 }
dar.
4
x2 - 1
2
x2 - 2
x2 - 3
- x2 - 1
-4
-2
2
4
- x2 - 2
- x2 - 3
x2 - 1
-2
x2 - 2
x2 - 3
-4
Verformung von Parabelbögen zu Hyperbelbögen durch Anwendung der Wurzelfunktion
Die Äste der Hyperbeln Hr besitzen die Winkelhalbierenden als Asymptoten.
Dies lässt sich durch Auswerten der Funktionen fr und gr an im Betrag großen
Stellen x einsehen.
Durch eine Skalierung wie bei den Kreisen werden die Hyperbeln Hr gestaucht oder gestreckt und damit zu den allgemeineren Hyperbeln
Einführung in die Mathematik 1
© Oliver Deiser
2. Parabeln
43
Ha, b = { (x, y) P R2 | (x/a)2 − (y/b)2 = 1 }.
Auflösen nach y liefert
y = ±
b
£x2 − a2 .
a
Die Funktionen c fa und c ga mit c = b/a stellen die obere bzw. untere Hälfte der
Hyperbeln Ha, b dar. Der Parameter a ist der Abstand der Scheitelpunkte vom
Ursprung, c = b/a der Betrag der Steigung der Asymptoten, b der Betrag der
Asymptoten an den Stellen ± a. Wir setzen
e = £a2 + b2
(lineare Exzentrizität)
ε = e/a = £1 + (b/a)
2
(numerische Exzentrizität)
F1, 2 = ± (e, 0)
(Brennpunkte)
Die Abstandseigenschaft lautet nun
(++) Ha, b = { P P R2 | F1 P − F2 P = ± 2a }.
Anstelle der Summen der Abstände zu den Brennpunkten haben nun also die
Differenzen einen in ihrem Betrag konstanten Wert.
Ha, b
b
a
F2
F1
Brennpunkte und Abstandseigenschaft einer Hyperbel Ha, b
© Oliver Deiser
Einführung in die Mathematik 1
44
1. Abschnitt
Elementare Funktionen
Das folgende Diagramm fasst unsere Überlegungen noch einmal zusammen.
Ein bemerkenswertes Zusammenspiel zwischen einer Funktion und ihrer Umkehrfunktion.
4
2
-4
-2
2
4
-2
-4
Die Ellipsen E1, b und Hyperbeln H1, b für b = 1/2, 1, 2 und ihre „Quadratparabeln“
Einführung in die Mathematik 1
© Oliver Deiser
2. Parabeln
45
Übungen
Übung 1
Seien x, y ≥ 0. Zeigen Sie, dass sqrt(x y) = sqrt(x) sqrt(y).
Übung 2
Seien ax2 + bx + c und a′x2 + b′x + c′ Parabeln mit
ax2 + bx + c = a′x2 + b′x + c′ für alle x P R.
Zeigen Sie, dass a = a′, b = b′ und c = c′.
Übung 3
Seien f, g : R → R Parabeln, die dieselben Nullstellen x1 , x2 mit x1 ≠ x2 und
zudem denselben Scheitelpunkt besitzen. Zeigen Sie, dass f = g.
Übung 4
Seien g, h : R → R zwei Geraden mit von Null verschiedenen Steigungen.
Zeigen Sie, dass das Produkt f : R → R, f(x) = g(x) h(x) für alle x P R eine
Parabel ist. Welche Nullstellen und welchen Scheitelpunkt besitzt die
Parabel f ? Illustrieren Sie die Situation durch ein Diagramm.
Übung 5
Seien a, x1 , x2 P R mit a ≠ 0, und sei f = a (x − x1 ) (x − x2 ). Berechnen Sie den
Scheitelpunkt von f sowie die Schnittpunkte von f mit den Geraden (x − x1 )
und (x − x2 ) in Abhängigkeit von der Öffnung a und den Nullstellen x1 und
x2 .
Übung 6
Seien s, t P R. Bestimmen Sie die Lösungen des Gleichungssystems
x + y = s, x y = t
in den reellen Unbekannten x, y.
Übung 7
Bestimmen Sie die eindeutige Parabel durch die Punkte (0, 2), (1, 1) und
(3, 9), die wir durch die Methode von Lagrange gefunden haben, durch
Lösen eines Gleichungssystems in den Unbekannten a, b, c.
Übung 8
Bestimmen Sie mit Hilfe Ihres Grundwissens über Differenzieren den
qualitativen Verlauf eines Polynoms dritten Grades, also einer Funktion
f : R → R der Form
f(x) = ax3 + bx2 + cx + d für alle x P R
© Oliver Deiser
Einführung in die Mathematik 1
46
1. Abschnitt
Elementare Funktionen
mit Koeffizienten a, b, c, d P R, a ≠ 0. Unterscheiden Sie insbesondere, ob
die Ableitung keine, eine doppelte oder zwei verschiedene Nullstellen
besitzt. Fertigen Sie Diagramme zur Illustration Ihrer Analyse an.
Übung 9
Betrachten Sie die Aussagen
„Parabeln mit gleichen Nullstellen und gleicher Öffnung sind gleich“,
„Parabeln mit gleichem Scheitelpunkt und gleicher Öffnung sind gleich“.
„Parabeln mit einer gemeinsamen Nullstelle und dort übereinstimmender
Steigung sind gleich“.
„Parabeln mit gleichem Scheitelpunkt und einer gemeinsamen Nullstelle
sind gleich“.
Welche Aussagen sind zutreffend und welche nicht? Geben Sie sowohl
anschauliche als auch formale Argumente.
Übung 10
Beweisen Sie die angegebenen Eigenschaften des Brennpunkts und der
Leitlinie einer Parabel ax2 . Welche weiteren geometrischen Eigenschaften
können Sie feststellen?
Übung 11
Zeigen Sie, dass die in der Näherungskonstruktion der Parabel a x2
konstruierten Schnittpunkte tatsächlich auf der Parabel a x2 liegen.
Einführung in die Mathematik 1
© Oliver Deiser
3. Polynome
Nach den Geraden und Parabeln betrachten wir nun allgemeine Polynome beliebigen Grades. Eine universelle Formel für die Nullstellen eines Polynoms
steht nicht mehr zur Verfügung, aber dennoch können wir einige allgemeine
Aussagen beweisen. Ein wichtiges Ergebnis, das wir mit Hilfe von Polynomdivision gewinnen, ist die Abspaltung eines Linearfaktors.
© Oliver Deiser
Einführung in die Mathematik 1
48
1. Abschnitt
Elementare Funktionen
Polynome und ihr Grad
Definition (Polynom)
Seien a0 , …, an P R. Dann heißt die Funktion f : R → R mit
f(x) = an xn + an − 1 xn − 1 + … + a0 für alle x P R
das (reelle) Polynom oder die (reelle) Polynomfunktion mit den Koeffizienten
a0 , …, an .
(a) Ist an ≠ 0, so heißt n der Grad und an der Leitkoeffizient des Polynoms. Gilt an = 1, so heißt das Polynom normiert.
(b) Sind alle Koeffizienten gleich 0, so heißt f das Nullpolynom. Dem
Nullpolynom ordnen wir den symbolischen Grad −∞ zu.
(c) Ein Polynom vom Grad 0 oder −∞ heißt ein konstantes Polynom.
8
6
f(x) =
4
1 2
x -3 x3 + 14 x2 - 17 x + 6
10
2
-2
-1
1
2
3
4
-2
-4
0.06
0.05
f(x) =
0.04
1 2
x -3 x3 + 14 x2 - 17 x + 6
10
0.03
0.02
0.01
-0.2
0.2
0.4
0.6
0.8
1.0
1.2
-0.01
Zwei verschiedene Ausschnitte desselben Polynoms vom Grad 5
Einführung in die Mathematik 1
© Oliver Deiser
3. Polynome
49
Den Grad eines Polynoms f : R → R bezeichnen wir auch mit
deg(f ) P N ∪ { −∞ } (für engl. degree).
Der Grad ist ein Maß für die Komplexität des Polynoms. Das Nullpolynom hat
den Grad −∞, konstante Funktionen ungleich der Nullfunktion haben den Grad 0.
Geraden und Parabeln sind spezielle Polynome. Ein Polynom ist genau eine
Gerade, wenn sein Grad kleiner oder gleich 1 ist, und genau dann eine Parabel,
wenn sein Grad gleich 2 ist.
Mit den üblichen Rechenregeln für den symbolischen Wert −∞ gelten für alle
Polynome f und g die Gradformeln
deg(f + g) ≤ max(deg(f ), deg(g)),
deg(f ⋅ g) = deg(f ) + deg(g).
Polynome eignen sich zur Approximation von Funktionen. Wir werden derartige Taylor-Polynome in Abschnitt 2 betrachten. Vorab ein visueller Eindruck:
1.0
f(x)
0.5
-10
-5
5
10
-0.5
-1.0
Die Funktion sieht aus wie die Sinusfunktion …
4
2
f(x)
-15
-10
-5
5
10
15
-2
-4
… ist aber ein Polynom (vom Grad 29).
© Oliver Deiser
Einführung in die Mathematik 1
50
1. Abschnitt
Elementare Funktionen
Koeffizientenvergleich für Polynome
Anschaulich klar oder zumindest nicht überraschend ist:
Satz (Eindeutigkeit der Nullfunktion)
Seien a0 , …, an P R. Es gelte
an xn + … + a1 x + a0 = 0 für alle x P R.
Dann ist ai = 0 für alle i ≤ n.
Es gibt viele Beweise für diesen Satz, aber er ist dennoch nicht vollkommen
elementar. In der Algebra werden Polynome nicht nur aus reellen Zahlen gebildet und es zeigt sich, dass der Satz nicht mehr in allen Fällen gültig ist. Man muss
dann zwischen Polynomen (in der Algebra definiert als Folgen von Koeffizienten) und den durch sie definierten Auswertungsfunktionen unterscheiden. Wir
betrachten einige Argumente für R:
Beweis durch wiederholtes Ableiten
Einsetzen von 0 zeigt a0 = 0. Bildung der ersten Ableitung und Einsetzen von
0 liefert a1 = 0. Durch Bildung der zweiten Ableitung und Einsetzen von 0
erhalten wir a2 = 0. So fortfahrend ergibt sich ai = 0 für alle i.
Beweis durch Ausklammern und ein Stetigkeitsargument
Einsetzen von 0 zeigt, dass a0 = 0. Ausklammern von x liefert, dass
x (an xn − 1 + … + a1 ) = 0 für alle x P R, sodass
an xn − 1 + … + a1 = 0 für alle x ≠ 0.
Ein Polynom, das an allen von Null verschiedenen Stellen gleich 0 ist, muss
aus Stetigkeitsgründen das Nullpolynom sein. Damit ist a1 = 0 (wieder
durch Einsetzen von 0). So fortfahrend erhalten wir ai = 0 für alle i.
Beweis durch Limesbildung
Ein nichtkonstantes Polynom strebt gegen ∞ oder −∞, wenn x gegen ∞
strebt. Damit ist n ≤ 0. Aus a0 = 0 (Einsetzen der 0) folgt die Behauptung.
Einen weiteren Beweis werden wir später kennenlernen. Eine wichtige Folgerung, die wir in einfachen Spezialfällen bereits verwendet haben, ist:
Korollar (Koeffizientenvergleich)
Seien a0 , …, an , b0 , …, bn P R. Es gelte
an xn + … + a1 x + a0 = bn xn + … + b1 x + b0
für alle x P R.
Dann ai = bi für alle i ≤ n.
Einführung in die Mathematik 1
© Oliver Deiser
3. Polynome
51
Die Polynomdivision
Sind f, g Polynome und ist c P R, so sind auch cf, f + g, f − g und f ⋅ g Polynome. Im Allgemeinen können wir zwei Polynome aber nicht dividieren, ohne
die Menge der Polynome zu verlassen. Gibt es ein Polynom h mit f = h ⋅ g, so
heißt g ein Teilerpolynom oder Teiler von f. Allgemein lässt sich eine Division mit
Rest wie bei den ganzen Zahlen durchführen:
Satz (Polynomdivision mit Rest)
Seien f, g : R → R nichtkonstante Polynome. Dann gibt es eindeutig
bestimmte Polynome h und r mit
f = h g + r und deg(r) < deg(g).
Der Grad von h ist die Differenz der Grade von f und g, da
deg(f ) = deg(h g + r) = deg(h g) = deg(h) + deg(g)
Beweis
zur Existenz:
Sei f = f0 . Wir werden Polynome hi und fi definieren mit
f0
= h1 g + f 1 ,
deg(f1 ) < deg(f0 ),
f1
= h2 g + f 2 ,
deg(f2 ) < deg(f1 ),
…
fm − 1 = hm g + fm ,
deg(fm ) < deg(g) ≤ deg(fm − 1 ).
Dann gilt
f0 = h1 g + f1 = (h1 + h2 ) g + f2 = … = (h1 + … + hm ) g + fm ,
sodass die Summe der hi ein Polynom h und r = fm wie gewünscht sind.
Polynome hi und fi mit diesen Eigenschaften definieren wir rekursiv
durch
(+) hi = ci x k i ,
fi = fi − 1 − hi g,
wobei ci der Quotient der Leitkoeffizienten und ki die Differenz der
Grade von fi − 1 und g ist.
zur Eindeutigkeit:
Ist f = q g + s mit deg(s) < deg(g), so gilt (h − q) g = s − r und damit
grad(h − q) + grad(g) = grad(s − r) < grad(g).
Also ist h − q das Nullpolynom, sodass h = q und folglich r = s.
© Oliver Deiser
Einführung in die Mathematik 1
52
1. Abschnitt
Elementare Funktionen
Wir nennen das Polynom h den Quotienten und das Polynom r den Rest der
Division von f durch g.
Aus der Rekursion
(+) hi = ci x k i ,
fi = fi − 1 − hi g,
gewinnen wir einen Algorithmus zur Durchführung der Polynomdivision. Das
folgende Beispiel zeigt eine von vielen denkbaren Möglichkeiten, wie die Durchführung notiert werden kann.
Beispiel
f = x 4 + 2x 3 − 2x + 1,
g = x 2 + 1.
x4
x3
x2
x1
1
1
2
0
−2
1
f0
2
1
0
1
0
0
x g
2
−1
−2
1
f1
2
0
2
0
2x g
−1
−4
1
f2
−1
0
−1
−1 g
−4
2
f3
Ergebnis der Polynomdivision mit Rest von f durch g:
f = h g + r = (x2 + 2x − 1) g + (−4x + 2)
Zum Aufbau der Tabelle: Wir tragen in jeder Zeile die Koeffizienten des
betrachteten Polynoms fi bzw. hi g ein. Dabei ist hi definiert durch ci x k i wie
in (+) und fi + 1 = fi − hi g die Differenz der beiden Vorgängerzeilen. Das
Verfahren endet, sobald der Grad von fi kleiner als der Grad von g
geworden ist. Der Quotient h ist die Summe der hi und der Rest r das letzte
Differenzpolynom fm .
Der Nenner der Koeffizienten ci in hi = ci x k i ist immer der Leitkoeffizient des
Divisors g. Damit erhalten wir:
Satz (Erhalt ganzzahliger Koeffizienten)
Ist das Polynom g normiert und sind alle Koeffizienten des Polynoms f
ganze Zahlen, so sind auch alle Koeffizienten des Quotienten und des
Restes der Polynomdivision von f durch g ganze Zahlen.
Einführung in die Mathematik 1
© Oliver Deiser
3. Polynome
53
Abspalten von Linearfaktoren
Eine wichtige Anwendung der Polynomdivision ist:
Satz (Abspaltung eines Linearfaktors)
Sei f : R → R ein nichtkonstantes Polynom, und sei x0 eine Nullstelle von f.
Dann gibt es ein Polynom h : R → R mit deg(h) = deg(f ) − 1 und
f(x) = (x − x0 ) h(x) für alle x P R.
Beweis
Wir dividieren f durch das Polynom x − x0 . Nach dem Satz über die
Polynomdivision gibt es Polynome von h und r mit
(1) f = h (x − x0 ) + r,
(2) deg(r) < deg(x − x0 ) = 1.
(3) deg(h) = deg(f ) − 1.
Nach (2) ist r ein konstantes Polynom. Nach (1) gilt
0 = f(x0 ) = h(x0 ) (x0 − x0 ) + r(x0 ) = r(x0 ).
Da r konstant ist und in x0 eine Nullstelle besitzt, ist r das Nullpolynom.
Nach (1) ist damit f = (x − x0 ) h.
Etwas ungenauer spricht man auch vom „Abspalten einer Nullstelle“, obwohl
ja nicht x0 , sondern eine Gerade x − x0 abgespalten wird.
Folgerungen
Da das Abspalten eines Linearfaktors den Grad um 1 reduziert, erhalten wir:
Korollar (Anzahl der Nullstellen eines Polynoms)
Ein Polynom f : R → R vom Grad n ≥ 0 hat höchstens n Nullstellen.
Genauer gilt: Es gibt ein 0 ≤ k < n, reelle Zahlen x1 , …, xk und ein
nullstellenfreies Polynom g mit
(+) f = (x − x1 ) … (x − xk ) g.
Ein besonders erfreulicher Fall tritt ein, wenn die Funktion g konstant ist:
Definition (Zerfällung in Linearfaktoren)
Ist das Polynom g in (+) konstant, so sagen wir, dass f in Linearfaktoren zerfällt.
Die Nullstellen x1 , …, xk müssen nicht notwendig paarweise verschieden sein.
Wir definieren hierzu:
© Oliver Deiser
Einführung in die Mathematik 1
54
1. Abschnitt
Elementare Funktionen
Definition (algebraische Vielfachheit einer Nullstelle)
Sei f ein nichtkonstantes Polynom, und sei x0 eine Nullstelle von f. Weiter
sei m ≥ 1 derart, dass ein Polynom g existiert mit
f = (x − x0 )m g, g(x0 ) ≠ 0.
Dann heißt m die algebraische Vielfachheit der Nullstelle x0 von f. Wir sagen
auch, dass f bei x0 eine m-fache Nullstelle besitzt.
Salopp formuliert: Wir zählen, wie oft wir x − x0 abspalten können.
Beispiele
(1) Ist f = (x − x1 )n , so ist die algebraische Vielfache von x1 gleich n. Die
Funktion besitzt eine n-fache Nullstelle bei x1 .
(2) Ist x1 ≠ x2 und f = (x − x1 )m (x − x2 )r , so besitzt die Funktion f eine
m-fache Nullstelle bei x1 und eine r-fache Nullstelle bei x2 .
10
8
f(x)
6
f(x)
4
x-1
x-2
2
x-4
2
4
6
-2
-4
Die Funktion f(x) = (x − 1)2 (x − 2) (x − 4) zerfällt in Linearfaktoren und
lässt sich damit als Produkt von Geraden auffassen.
Aus dem Korollar über die Anzahl der Nullstellen eines Polynoms vom Grad
n erhalten wir einen weiteren:
Beweis des Satzes über die Eindeutigkeit der Nullfunktion
Ist an xn + … + a1 x + a0 = 0 für alle x P R, so hat das Polynom n + 1
Nullstellen (etwa 0, …, n). Nach dem Korollar ist es also das Nullpolynom.
Wie oben ergibt sich hieraus der Koeffizientenvergleich für Polynome: Sind
zwei Polynome als Funktionen identisch, so stimmen auch die sie definierenden
Koeffizienten überein.
Explizit halten wir fest:
Einführung in die Mathematik 1
© Oliver Deiser
3. Polynome
55
Korollar (Identitätssatz für Polynome)
Sind f, g Polynome vom Grad kleinergleich n, die an n + 1 Stellen übereinstimmen, so ist f = g.
Beweis
Das Polynom h = f − g hat einen Grad kleinergleich n und zudem n + 1
Nullstellen. Damit ist h = 0 und folglich f = g.
Ohne die Gradforderung ist das Ergebnis nicht richtig. Durch zwei Punkte
der Ebene mit verschiedenen x-Koordinaten kann man sowohl eine Gerade als
auch eine Parabel legen. Es gibt aber nur eine Gerade durch die beiden Punkte.
Ein spezielles Beispiel für die Abspaltung einer Nullstelle verdient einen eigenen Abschnitt:
Die geometrische Summe und die geometrische Reihe
Sei q P R. Dann haben die Polynome
x − q, x2 − q2 , x3 − q3 , …, xn − qn , …
die Nullstelle q, sodass wir stets den Linearfaktor x − q abspalten können:
x−q
= (x − q) 1
2
2
= (x − q) (x + q)
3
3
x −q
= (x − q) (x2 + x q + q2 )
x4 − q4
= (x − q) (x3 + x2 q + x q2 + q3 )
x −q
…
xn + 1 − qn + 1 = (x − q) (xn + xn − 1 q1 + … + x1 qn − 1 + qn )
…
Der Leser multipliziere die rechten Seiten aus, um sich vor Augen zu führen,
wie sich alle bis auf zwei Summanden gegenseitig aufheben. Es liegt eine sog.
Teleskop-Summe vor.
Setzen wir speziell x = 1, so erhalten wir
1 − qn + 1 = (1 − q) (1 + q1 + … + qn − 1 + qn ) für alle n P N.
Dies zeigt:
Satz (geometrische Summe)
Für alle n P N und q P R mit q ≠ 1 gilt:
1 + q + q2 + … + qn =
© Oliver Deiser
1 − qn + 1
.
1−q
Einführung in die Mathematik 1
56
1. Abschnitt
Elementare Funktionen
Die Formel des Satzes können wir auch in Summennotation schreiben:
∑ k ≤ n qk =
1 − qn + 1
.
1−q
Sei nun q P R mit |q| < 1. Dann gilt
(+) limn
→∞
qn + 1 = limn
→∞
qn = 0.
Damit erhalten wir:
1 + q + q2 + … + qn + …
= limn
= limn
→∞
→∞
(1 + q + … + qn )
1 − qn + 1
1−q
=
1
.
1−q
Das erste Gleichheitszeichen ist als Definition der unendlichen Summe auf der
linken Seite zu lesen. Beim zweiten Gleichheitszeichen verwenden wir die Formel für die geometrische Summe und beim dritten den Grenzwert (+). Wir besprechen unendliche Summen später genauer, für jetzt genügt erneut ein intuitiver Grenzwertbegriff.
Wir halten das Ergebnis als Satz fest:
Satz (geometrische Reihe)
Für alle q P R mit |q| < 1 gilt
1
.
1−q
1 + q + q2 + … + qn + … =
6
1
1-q
4
1-q3
1-q
1-q5
1-q
1-q8
1-q
2
-3
-2
1 + q + … + qn =
Einführung in die Mathematik 1
-1
1
2
1
1 − qn + 1
approximiert
für q P ] −1, 1 [
1−q
1−q
© Oliver Deiser
3. Polynome
57
In der unendlichen Summennotation können wir den Satz in der Form
1
1−q
∑ n P N qn =
für alle q P ] −1, 1 [
notieren. Statt ∑ n P N schreiben wir auch ∑ n ≥ 0 , ∑ n oder ∑ ∞n = 0 . Ob man die Notation 1 + q + q2 + … + qn + … oder ∑ n qn bevorzugt, ist wie bei den endlichen
Summen letztendlich Geschmackssache. Nützlich ist auch die Variante
1
−1 =
1−q
∑ n ≥ 1 qn =
q
1−q
für alle q P ] −1, 1 [
der Summation ab n = 1.
Beispiele
1
∑n n
2
= 1+
1
1
+
+… =
2
4
= 1+
1
1
+
+… =
4
16
∑n
1
4n
∑n
(−1)n
3n
= 1−
1
1 − 1/2
= 2, ∑ n ≥ 1
1
1 − 1/4
1
1
1
+
−
+… =
3
9
27
=
1
2n
= 1.
4
1
, ∑ n≥1 n
3
4
1
1 − (−1/3)
=
=
1
.
3
3
.
4
Zwei Visualisierungen der geometrischen Reihe (ab n = 1):
1
1
1
+
+
+ … = 1 für q = 1/2,
2
4
8
1
1
1
+
+
+… =
4
16
64
© Oliver Deiser
1
3
für q = 1/4
Einführung in die Mathematik 1
58
1. Abschnitt
Elementare Funktionen
Entwicklung eines Polynoms in einem Punkt
Für eine beliebige reelle Zahl p können wir ein Koordinatensystem mit
Nullpunkt p betrachten. Der Wechsel in dieses Koordinatensystem wird durch
den Übergang von x zu x′ = x − p beschrieben (die Null wird zu −p und p wird
zu 0). Anschaulich ist klar, dass ein Polynom n-ten Grades auch in den neuen
Koordinaten ein Polynom n-ten Grades ist. Der Beweis des folgenden Satzes
zeigt, wie sich die Koeffizienten umrechnen lassen.
Satz
Sei an xn + … + a0 ein Polynom n-ten Grades und sei p P R. Dann gibt es
eindeutig bestimmte b0 , …, bn P R mit
(+) an xn + … + a0 = bn (x − p)n + … + b1 (x − p) + b0
für alle x P R.
n
Weiter gilt bn = an und b0 = an p + … + a1 p + a0 .
Beweis
Wir setzen x′ = x − p. Dann gilt
an xn + … + a1 x + a0 = an (x′ + p)n + … + a1 (x′ + p) + a0
= bn x′ n + … + b1 x′ + b0
für gewisse reelle Koeffizienten bi , die wir durch Ausmultiplizieren der
Terme (x′ + p)k erhalten. Speziell ergibt das Ausmultiplizieren bn = an und
b0 = an pn + … + a1 p + a0 . Die Eindeutigkeit ergibt sich mit einem der
Argumente des Falls p = 0.
Die Formel für b0 erhalten wir alternativ auch durch Einsetzen von p in (+).
Definition (Entwicklung an einer Stelle)
In der Situation des Satzes heißt das Polynom
bn (x − p)n + … + b1 (x − p) + b0
die Entwicklung des Polynoms an xn + … + a0 an der Stelle p.
Beispiel
Wir entwickeln das Polynom x3 + 2x2 − x + 1 an der Stelle 1. Mit x′ = x − 1
gilt:
x3 + 2x2 − x + 1 = (x′ + 1)3 + 2(x′ + 1)2 − (x′ + 1) + 1
= x′ 3 + 3x′ 2 + 3x′ + 1 + 2x′ 2 + 4x′ + 2 − x′
= x′ 3 + 5x′ 2 + 6x′ + 3
= (x − 1) 3 + 5(x − 1) 2 + 6(x − 1) + 3
Einführung in die Mathematik 1
© Oliver Deiser
3. Polynome
59
Die Koeffizienten bi lassen sich auch elegant mit Hilfe von Differentialrechnung berechnen. Ist f : R → R mit
f(x) = an xn + … + a0 = bn (x − p)n + … + b1 (x − p) + b0
für alle x P R,
und x′ = x − p, so erhalten wir durch wiederholtes Ableiten
f (x)
= bn x′ n + …
+ b3 x′ 3
+ b2 x′ 2
+ b1 x′ + b0 ,
f ′(x)
= n bn x′ n − 1 + …
+ 3 b3 x′ 2
+ 2 b2 x′
+ 1 b1
+ 3 ⋅ 2 b3 x′
+ 2 ⋅ 1 b2
f ″(x) = n (n − 1) bn x′ n − 2 + …
f ′′′(x) = n (n − 1) (n − 2) bn x′ n − 3 + … + 3 ⋅ 2 ⋅ 1 b3
usw.
Einsetzen von x = p liefert wegen x′ = x − p die zauberhafte Formel
(#) bk =
f (k) (p)
k!
für alle k ≤ n,
wobei f (k) die k-te Ableitung von f bezeichnet (mit f (0) = f ).
Beispiel
Wir berechnen die Entwicklung das Polynoms f(x) = x3 + 2x2 − x + 1 an der
Stelle 1 mit der Ableitungsmethode. Es gilt
f ′(x)
= 3x2 + 4x − 1,
f ″(x) = 6x + 4,
f ′′′(x) = 6.
Damit ist f(1) = 3, f ′(1) = 6, f ″(p) = 10, f ′′′(p) = 6, sodass
b0 = 3, b1 = 6, b2 =
10
2!
= 5, b3 =
6
3!
= 1.
Wir erhalten also erneut das Polynom
(x − 1) 3 + 5(x − 1) 2 + 6(x − 1) + 3.
Darstellungen dieser Form spielen in der Analysis bei der lokalen Approximation von Funktionen eine Schlüsselrolle: Ziel ist, eine differenzierbare
Funktion f an einem gegebenen Entwicklungspunkt p durch ein Polynom zu
approximieren (je höher der Grad des Polynoms, desto besser ist in der Regel
die Approximation). Dabei entstehen Polynome der Form
bn (x − p)n + … + b1 (x − p) + b0 ,
wobei die Koeffizienten bk erneut durch (#) gegeben sind. Wir besprechen diese
sogenannte Taylor-Entwicklung später genauer. Als Anwendung der Methode geben wir hier noch einen weiteren Beweis der Abspaltung von Linearfaktoren, der
die Polynomdivision nicht heranzieht:
© Oliver Deiser
Einführung in die Mathematik 1
60
1. Abschnitt
Elementare Funktionen
Zweiter Beweis der Abspaltung eines Linearfaktors
Sei x0 eine Nullstelle von an xn + … + a0 , n ≥ 1. Weiter sei
an xn + … a1 x + a0 = bn (x − x0 )n + … + b1 (x − x0 ) + b0 .
die Darstellung des Polynoms im Entwicklungspunkt x0 . Dann ist b0 = 0
und folglich
an xn + … + a1 x + a0 = (x − x0 ) (bn (x − x0 )n − 1 + … + b1 ).
Die Idee dieses Beweises lässt sich auch so formulieren: Das Abspalten ist im
Fall x0 = 0 offensichtlich, da dann a0 = 0 gelten muss wir x = x − x0 einfach aus
an xn + … + a1 x ausklammern können. Da alle Nullstellen gleichberechtigt sind,
können wir eine beliebige Nullstelle x0 zum neuen Nullpunkt erklären und
dann ausklammern.
Der Beweis benötigt nur die Existenz, nicht die Eindeutigkeit der b-Koeffizienten (b0 = 0 ergibt sich durch Einsetzen von x0 ). Damit erhalten wir wie oben
alle Folgerungen aus dem Abspalten eines Linearfaktors, einschließlich der Eindeutigkeit der Nullfunktion und des Koeffizientenvergleichs.
Polynome durch gegebene Punkte
Wir hatten in den vorangehenden Kapiteln gesehen, dass wir durch zwei
Punkte genau ein Polynom vom Grad kleinergleich 1 und drei Punkte genau ein
Polynom vom Grad kleinergleich 2 legen können. Allgemein gilt nun:
Satz (Polynominterpolation)
Sei n P N, und seien (x0 , y0 ), …, (xn , yn ) Punkte der Ebene mit paarweise
verschiedenen x-Koordinaten. Dann gibt es genau ein Polynom f : R → R
mit den Eigenschaften:
(a) deg(f ) ≤ n,
(b) f(xi ) = yi für alle i ≤ n.
Gegeben sind n + 1 Punkte. Wir starten im Index mit 0, da „i ≤ n“ einfacher ist
als „1 ≤ i ≤ n + 1“.
Der Beweis des Satzes ist eine Verallgemeinerung unserer Argumentation bei
den Parabeln.
Beweis
Die Eindeutigkeit folgt aus dem Identitätssatz für Polynome. Für die
Existenz definieren für alle i ≤ n ein Polynom gi : R → R durch:
gi (x) = ∏ j ≤ n, j ≠ i (x − xj ) = (x − x0 ) … (x − xi − 1 ) (x − xi + 1 ) … (x − xn ).
Jedes gi ist das Produkt von n Geraden der Steigung 1, sodass deg(gi ) = n.
Einführung in die Mathematik 1
© Oliver Deiser
3. Polynome
61
Für alle i gilt gi (xi ) ≠ 0. Weiter ist gi (xj ) = für alle i ≠ j. Wir setzen nun
f = ∑i ≤ n
yi
gi (xi )
gi .
Als Summe von Polynomen vom Grad n ist f ein Polynom vom Grad
kleinergleich n. Einsetzen zeigt, dass f(xi ) = yi für alle i ≤ n.
Die Bezeichnung als „Interpolation“ ist in der Numerik üblich: Gegeben sind
die Daten (x0 , y0 ), …, (xn , yn ). Die Frage ist, zu welcher Funktion diese Daten am
besten passen. Weiß oder wünscht man, dass die Funktion ein Polynom ist, so ist
das konstruierte Polynom f das gemessen an seinem Grad einfachste Polynom,
das die Daten interpoliert.
Bemerkung
Der Satz besagt nicht, dass es durch gegebene Punkte (x0 , y0 ), …, (xn , yn )
nur ein Polynom gibt. Für die Eindeutigkeit ist die Gradbedingung (a)
wesentlich: Unter allen Polynomen vom Grad −∞, 0, 1, …, n gibt es genau
ein Polynom f, das durch die n + 1 Punkte verläuft. Dagegen gibt es bereits
unendlich viele Polynome des Grades n + 1 durch die gegebenen Punkte.
Dies können wir beispielsweise durch Hinzufügen von eines Punktes der
Form (x*, f(x*) + k), k = 1, 2, 3, … zur Punktliste einsehen.
Beispiel: Mehrere Polynome dritten Grades durch drei Punkte
Das Nullpolynom verläuft durch die Punkte (−1, 0), (0, 0), (1, 0) und ist das
einzige Polynom vom Grad kleinergleich 2 mit dieser Eigenschaft. Es gibt
keine andere Gerade und keine Parabel durch diese Punkte. Dagegen
verlaufen alle Polynome dritten Grades der Form
gc (x) = c x (x2 − 1) = c x3 − cx
mit c P R* beliebig durch die Punkte (−1, 0), (0, 0) und (1, 0).
3
2
1
-1.5
-1.0
-0.5
x x2 - 1
0.5
-1
1.0
1.5
2 x x2 - 1
3 x x2 - 1
-2
-3
© Oliver Deiser
Einführung in die Mathematik 1
62
1. Abschnitt
Elementare Funktionen
Beispiel
Wir betrachten die sieben Punkte
(−3, 1), (−2, 2), (−1, −2), (0, 0), (1, 2), (2, 1), (3, 4).
Das eindeutige Polynom f : R → R von Grad kleinergleich 6 durch diese
Punkte berechnet sich zu
f(x) = −
1
720
( 13 x6 − 81 x5 − 155 x4 + 945 x3 + 142 x2 − 2304 x ).
f(x)
10
5
-4
-2
2
4
-5
-10
Ändern wir den ersten Punkt zu (−3, 3) ab, so erhalten wir das recht
ähnliche Interpolationspolynom g : R → R mit
gx) = −
1
720
( 11 x6 − 75 x5 − 145 x4 + 915 x3 + 134 x2 − 2280 x ).
15
10
5
g(x)
f(x)
-4
-2
2
4
-5
-10
Einführung in die Mathematik 1
© Oliver Deiser
3. Polynome
63
Ersetzen wir dagegen den vierten Punkt durch (0, 1), so erhalten wir das
sehr verschiedene Interpolationspolynom h : R → R mit
h(x) = −
1
240
( 11 x6 − 27 x5 − 145 x4 + 315 x3 + 374 x2 − 768 x − 240 ).
20
10
h(x)
-4
-2
2
4
f(x)
-10
-20
Grenzwertverhalten von Polynomen
Polynome streben gegen ± ∞, wenn x gegen ± ∞ strebt. Genauer gilt:
Satz (Grenzwertverhalten von Polynomen)
Sei f : R → R ein Polynom vom Grad n ≥ 1. Dann gilt
limx
→∞
f(x) P { ∞, −∞ }, limx
→ −∞
f(x) P { ∞, −∞ }.
Ist n gerade (ungerade), so haben die uneigentlichen Grenzwerte dasselbe
(unterschiedliche) Vorzeichen.
Dies ergibt sich aus
(
limx → ∞ (an xn + … + a0 ) = an limx
→∞
xn 1 +
= an limx
→∞
xn ,
a0
an − 1
+…+
an x
an xn
)
und analog für x → −∞.
Nimmt ein Polynom an einer Stelle einen negativen und an einer anderen
Stelle einen positiven Wert an, so existiert zwischen diesen beiden Stellen aus
Stetigkeitsgründen eine Nullstelle (Zwischenwertsatz). Damit erhalten wir:
© Oliver Deiser
Einführung in die Mathematik 1
64
1. Abschnitt
Elementare Funktionen
Korollar (Existenz von Nullstellen bei ungeradem Grad))
Jedes Polynom f : R → R ungeraden Grades besitzt mindestens eine
Nullstelle.
Dass die Aussage bei geradem Grad nicht gilt, zeigt zum Beispiel die um 1 entlang der y-Achse verschobene Einheitsparabel, also das Polynom x2 + 1.
15
10
5
x3 + x + 1
x2 + 1
x4 + x 3 + x 2 + 2 x + 4
-2
-1
1
2
-5
-10
Zur gradabhängigen Existenz von Nullstellen
Interessante Grenzwertphänomene lassen sich auch beobachten, wenn wir
den Grad n als variabel betrachten. Ein instruktives Beispiel liefern die Funktionen fn : [ 0, 1 ] → [ 0, 1 ], die für alle n ≥ 1 definiert sind durch
fn (x) = xn für alle x P [ 0, 1 ].
1.0
0.8
x
x2
0.6
x4
x8
0.4
x16
x64
0.2
0.2
0.4
0.6
0.8
1.0
Monome xn auf dem EInheitsintervall [ 0, 1 ]
Einführung in die Mathematik 1
© Oliver Deiser
3. Polynome
65
Alle Funktionen fn verlaufen durch den Punkt (1, 1). Für alle x P [ 0, 1 [ gilt dagegen limn → ∞ fn (x) = 0. Die Grenzfunktion g : [ 0, 1 ] → [ 0, 1 ] mit g(1) = 1 und
g(x) = 0 für x < 1 ist unstetig.
Das Verhalten der Monome xn spiegelt sich im Verhalten ihrer Umkehrfunktionen, den n-ten Wurzeln n £x, wider. Diese Funktionen sind für gerade n auf
[ 0, ∞ [ und für ungerade n auf ganz R definiert. Für ungerade n konvergieren die
n-ten Wurzeln punktweise gegen die Vorzeichenfunktion sgn auf R. d. h.
limn
→ ∞, n ungerade
n
£x = sgn(x) für alle x P R.
2
1
3
5
9
-10
-5
5
10
x
x
x
17
33
x
x
-1
-2
n-te Wurzeln auf R für ungerade n
Die Idee lässt sich vielfach variieren. Das folgende Diagramm zeigt eine weitere
Konstruktion.
1.0
0.8
1 - x2
0.6
0.4
4
1 - x2
8
1 - x2
16
1 - x2
32
1 - x2
0.2
-1.0
© Oliver Deiser
-0.5
0.5
1.0
Einführung in die Mathematik 1
66
1. Abschnitt
Elementare Funktionen
Übungen
Übung 1
Seien b, c, d P R und seien x1 , x2 , x3 die Nullstellen von x3 + bx2 + cx + d.
Zeigen Sie:
x1 + x2 + x3 = −b, x1 x2 + x1 x3 + x1 x3 = c, x1 x2 x3 = −d.
Übung 2
Formulieren Sie die Beweise des Satzes über die Eindeutigkeit der
Nullfunktion mit Hilfe von Ableiten bzw. Ausklammern induktiv.
Übung 3
Zeigen Sie, dass ein Polynom f : R → R genau dann in Linearfaktoren
zerfällt, wenn f ein Produkt von Geraden ist, d. h. wenn es Geraden
g1 , … gn gibt mit f = g1 … gn .
Übung 4
Sei f ein Polynom vom Grad 3 und es gelte f(x) = 1/x für x = 1, …, 4.
Bestimmen Sie f(5).
[ Hinweis: Wer keine Polynominterpolation berechnen möchte, kann das
Polynom g = x f − 1 betrachten. ]
Übung 5
Seien c P R und n P N ungerade. Ermitteln Sie einen Linearfaktor des
Polynoms xn + cn und spalten Sie ihn ab.
Übung 6
Sei f ein Polynom mit ganzzahligen Koeffizienten. Weiter seien a, b ganze
Zahlen. Zeigen Sie, dass a − b ein Teiler von f(a) − f(b) ist, d. h.:
Es gibt eine ganze Zahl d mit d(a − b) = f(a) − f(b).
[ Hinweis: Spalten Sie eine Nullstelle eines geeignet definierten Polynoms
ab.]
Übung 7
Zeigen Sie, dass es kein Polynom f mit ganzzahligen Koeffizienten gibt mit
f(1) = 2, f(2) = 3, f(3) = 1.
Übung 8
Entwickeln Sie das Polynom x4 + 2x3 − x2 + 2x − 2 an den Stellen 1 und −1.
Einführung in die Mathematik 1
© Oliver Deiser
4. Rationale Funktionen
Wir betrachten nun rationale Funktionen, die durch Division zweier Polynome
entstehen. Dabei kommt den Nullstellen des Zähler- und Nennerpolynoms eine
besondere Bedeutung zu.
Das Nullpolynom bezeichnen wir im Folgenden kurz mit 0, sodass g ≠ 0 für ein
Polynom g bedeutet, dass g nicht das Nullpolynom ist.
© Oliver Deiser
Einführung in die Mathematik 1
68
1. Abschnitt
Elementare Funktionen
Rationale Funktionen und ihre Definitionsbereiche
Definition (rationale Funktion, Definitionslücke)
Seien f, g : R → R reelle Polynome, g ≠ 0, und sei P = { x P R | g(x) ≠ 0 }.
Dann heißt die Funktion h : P → R mit
h(x) =
f(x)
g(x)
für alle x P P
die durch f und g definierte (reelle) rationale Funktion. Wir bezeichnen sie
mit f/g. Die Nullstellen von g heißen die Definitionslücken von f/g.
Eine rationale Funktion f/g ist also genau an den Nullstellen des Nennerpolynoms g nicht definiert. Der Definitionsbereich P von f/g ist eine Vereinigung
von offenen Intervallen.
40
30
h(x) =
x x2 -2 x-3
20
(x-4) (x-2)
10
-5
5
10
-10
-20
-30
50
h(x) =
x x2 -2 x-3
(x-4) (x-2)
-40
-20
20
40
-50
Zwei verschiedene Ausschnitte derselben rationalen Funktion
Einführung in die Mathematik 1
© Oliver Deiser
4.
Rationale Funktionen
69
Beispiele
(1) Jedes Polynom f ist eine rationale Funktion, da f = f /1.
(2) 1/x ist eine rationale Funktion auf R − { 0 }.
(3) 1/(x2 + 1) ist (oder genauer: definiert) eine rationale Funktion auf R.
(4) (x2 − 1)/(x − 1) ist eine rationale Funktion auf R − { 1 }.
(5) x + 1 ist eine rationale Funktion auf R. Für alle x ≠ 1 stimmt diese
Funktion mit der Funktion aus dem letzten Beispiel überein, da
x2 − 1
(x + 1) (x − 1)
=
x−1
x−1
= x + 1 für alle x ≠ 1.
Polstellen und stetig hebbare Definitionslücken
Das Verhalten einer rationalen Funktion f/g bei Annäherung an eine Definitionslücke x0 hängt vom Nullstellenverhalten des Zählers und Nenners bei x0 ab:
(1) Ist x0 keine Nullstelle von f oder die algebraische Vielfachheit k von x0
bezüglich f kleiner als die algebraische Vielfachheit m von x0 bezüglich g,
so gilt
limx
→ x0
f(x)/g(x) P { ∞, −∞ }.
(2) Ist die algebraische Vielfachheit von x0 bzgl. f größergleich derjenigen von
x0 bzgl. g, so gilt
limx
→ x0
f(x)/g(x) P R.
Definition (Vielfachheit einer Polstelle, stetig hebbare Definitionslücke)
Im Fall (1) heißt x0 eine (m − k)-fache Polstelle von f/g, wobei wir k = 0
setzen, falls x0 keine Nullstelle von f ist. Im Fall (2) heißt x0 eine stetig
hebbare Definitionslücke von f/g.
Die Vielfachheit einer Polstelle x0 ist ein Maß dafür, wie schnell eine rationale
Funktion gegen ± ∞ strebt, wenn x gegen x0 strebt.
Beispiele
(1) Die rationale Funktion h : R − { 1, 2 } → R mit
h(x) =
x
(x − 1)(x − 2)2
für alle x P R − { 1, 2 }
besitzt eine einfache Polstelle bei 1 und eine 2-fache (doppelte)
Polstelle bei 2.
© Oliver Deiser
Einführung in die Mathematik 1
70
1. Abschnitt
Elementare Funktionen
50
h(x) =
40
x
(x-1) (x-2)2
30
20
10
-1
1
2
3
4
5
-10
-20
Eine einfache und eine doppelte Polstelle
(2) Die rationale Funktion f : R − { 1, 2 } → R mit
f(x) =
x2 − 1
(x − 1)(x − 2)
=
(x − 1) (x + 1)
(x − 1)(x − 2)
für alle x P R − { 1, 2 }
besitzt eine stetig hebbare Definitionslücke bei 1 und eine einfache
Polstelle bei 2. Durch Kürzen von (x − 1) ergibt sich die einfachere
Darstellung (x + 1)/(x − 2) der Funktion f, die aber zunächst nur auf der
Menge R − { 1, 2 } definiert ist. Wir können und werden sie durch die
Setzung „f(1) = (1 + 1)/(1 − 2) = −2“ zu einer auf R − { 2 } definierten
Funktion (die wir wieder f nennen) stetig fortsetzen, was die Bezeichnung „stetig hebbar“ motiviert.
30
h(x) =
x2 -1
(x-1) (x-2)
20
10
-1
1
2
3
4
5
-10
Eine stetig hebbare Definitionslücke
Einführung in die Mathematik 1
© Oliver Deiser
4.
Rationale Funktionen
71
Haben zwei Polynome f und g keine gemeinsamen Nullstellen, so sagen wir,
dass die rationale Funktion f/g einen vollständigen Definitionsbereich besitzt. Diese
Eigenschaft können wir durch Kürzen von gemeinsamen Linearfaktoren immer
erreichen. Alle stetig hebbaren Definitionslücken sind dann geschlossen, sodass
jede verbleibende Definitionslücke eine Polstelle ist.
Allgemeiner können wir in f/g nicht nur gemeinsame Linearfaktoren, sondern
gemeinsame Teilerpolynome kürzen. Hat f/g bereits einen vollständigen Definitionsbereich P, so wird durch weiteres Kürzen nur noch eine Termdarstellung,
aber nicht mehr die Funktion f/g : P → R verändert, da Definitionsbereich und
Werte gleich bleiben. Haben f und g keine gemeinsamen Teilerpolynome, so
nennen wir die rationale Funktion f/g vollständig gekürzt.
Wir vereinbaren:
Konvention
Wir identifizieren im Folgenden rationale Funktionen f1 /g1 und f2 /g2 , die
durch Kürzen ineinander übergehen.
Beispiel
Mit dieser Vereinbarung können wir schreiben
x(x + 1)
x
=
x+1
1
= x+1 =
(x − 1) (x + 1)2
(x − 1) (x + 1)
=
(x − 1) (x + 1)2
.
x2 − 1
Mit rationalen Funktionen können wir so rechnen wie mit rationalen Zahlen.
Insbesondere stehen die vier Grundrechenarten zur Verfügung, wobei die Division zweier rationaler Funktionen genau dann erklärt ist, wenn der Divisor nicht
das Nullpolynom ist. Es gilt
f1
g1
f2
g2
±
f1 /g1
f2 /g2
=
=
f1 g2 ± f2 g1
,
g1 g2
f1
g1
f2
g2
=
f1 f2
,
g1 g2
x+1−2
(x − 1)(x + 1)
=
x−1
(x − 1)(x + 1)
⋅
f1 g2
, falls f2 ≠ 0.
f2 g1
Beispiel
Es gilt
1
x−1
+
−2
(x − 1)(x + 1)
=
=
1
.
x+1
Das Beispiel zeigt, dass die nach der Summenformel berechnete Summe
zweier gekürzter rationaler Funktionen nicht gekürzt sein muss.
© Oliver Deiser
Einführung in die Mathematik 1
72
1. Abschnitt
Elementare Funktionen
Die Partialbruchzerlegung
Sind f und g Polynome mit g ≠ 0, so zeigt die Polynomdivision f = h g + r von f
durch g, dass wir die rationale Funktion f/g schreiben können in der Form
f/g = h + r/g, mit deg(r) < deg(g).
Die rationale Funktion r/g lässt sich nun noch durch das additive Abspalten von
Polstellen, bekannt als Partialbruchzerlegung, vereinfachen. Wir illustrieren das
Verfahren durch einige instruktive Beispiele.
Beispiele
(1) Wir suchen für die rationale Funktion 1/(x(x + 1)) eine Darstellung
1
x (x + 1)
=
a
x
+
b
.
x+1
Um a und b zu bestimmen, schreiben wir
a
x
+
b
x+1
a(x + 1) + bx
x(x + 1)
=
=
(a + b)x + a
.
x(x + 1)
Wir suchen also a, b mit (a + b)x + a = 1 = 0 x + 1. Durch Koeffizientenvergleich erhalten wir das Gleichungssystem a + b = 0, a = 1, das durch
a = 1, b = −1
eindeutig gelöst wird. Wir erhalten also die Partialbruchzerlegung
1
x (x + 1)
=
1
x
+
−1
.
x+1
10
5
1
x (x+1)
-2.0
-1.5
-1.0
-0.5
0.5
1
x
1.0
-
1
x+1
-5
-10
Die Partialbruchzerlegung einer rationalen Funktion (I)
Einführung in die Mathematik 1
© Oliver Deiser
4.
Rationale Funktionen
73
(2) Wir suchen a, b mit
2x + 1
(x − 1)(x − 2)
a
x−1
=
+
b
.
x−2
Erweitern liefert wie im ersten Beispiel
a(x − 2) + b(x − 1) = (a + b)x − 2a − b = 2x + 1.
Das Gleichungssystem a + b = 2, −2a − b = 1 wird durch
a = −3, b = 5
eindeutig gelöst, sodass
2x + 1
(x − 1)(x − 2)
−3
x−1
=
+
5
.
x−2
(3) Wir suchen a, b, c mit
−x + 2
x (x + 1) (x + 2)
=
a
x
+
b
x+1
c
.
x+2
+
Erweitern liefert
a(x + 1)(x + 2) + b x (x + 2) + c x (x + 1) =
a(x2 + 3x + 2) + b(x2 + 2x) + c(x2 + x) =
(a + b + c)x2 + (3a + 2b + c)x + 2a = 0x2 − x + 2.
Das Gleichungssystem
a + b + c = 0, 3a + 2b + c = − 1, 2a = 2
wird durch a = 1, b = −3, c = 2 eindeutig gelöst, sodass
−x + 2
x (x + 1) (x + 2)
=
1
x
−
3
x+1
+
2
.
x+2
(4) Wir suchen a, b, c mit
2x2 + 1
(x − 1)3
=
a
(x − 1)3
+
b
(x − 1)2
+
c
x−1
Erweitern liefert
a + b(x − 1) + c(x − 1)2 = cx2 + (b − 2c)x + a − b + c = 2x2 + 0x + 1.
Die eindeutige Lösung ist a = 3, b = 4, c = 2, sodass
2x2 + 1
(x − 1)3
© Oliver Deiser
=
3
(x − 1)3
+
4
(x − 1)2
+
2
.
x−1
Einführung in die Mathematik 1
74
1. Abschnitt
Elementare Funktionen
(5) Wir suchen a, b, c mit
2x2
(x + 1)(x2 + 1)
=
a
x+1
+
bx + c
.
x2 + 1
Erweitern liefert
a(x2 + 1) + (bx + c)(x + 1) = (a + b)x2 + (b + c)x + a + c = 2x2 + 0x + 0.
Wir finden die Lösung
a = 1, b = 1, c = −1,
sodass
2x2
(x + 1)(x2 + 1)
=
1
x+1
+
x−1
.
x2 + 1
10
5
-2.0
-1.5
-1.0
-0.5
0.5
-5
1.0
2 x2
(x+1) x2 +1
1
x+1
x-1
x2 +1
-10
-15
Die Partialbruchzerlegung einer rationalen Funktion (II)
Allgemein gilt folgender Satz, den wir hier ohne Beweis angeben, der aber mit
Blick auf die Beispiele plausibel ist:
Einführung in die Mathematik 1
© Oliver Deiser
4.
Rationale Funktionen
75
Satz (Partialbruchzerlegung, additive Abspaltung von Polstellen)
Sei f/g eine rationale Funktion mit vollständigem Definitionsbereich und
deg(f ) < deg(g). Weiter sei x0 eine k-fache Nullstelle von g, und es sei
g = (x − x0 )k g*, g*(x0 ) ≠ 0.
Dann gibt es eindeutig bestimmte a1 , …, ak P R und ein Polynom f * mit
deg(f *) < deg(g*), sodass
f
g
=
f
(x − x0 )k g*
ak
(x − x0 )k
=
+ … +
a1
x − x0
+
f*
.
g*
Das Verfahren lässt sich mit f */g* wiederholen, bis alle reellen Nullstellen des
Nenners additiv abgespalten sind. Weiter lassen sich in ähnlicher Art und Weise
auch nullstellenfreie Polynome zweiten Grades mit beliebigen Potenzen k aus
dem Nenner abspalten, wobei nun lineare Funktionen anstelle von Konstanten
in den Zählern auftauchen. Ein (mit Hilfe eines Computers berechnetes) Beispiel mit k = 4 ist
81
(x2 + x + 1)4 (x3 + x + 1)
=
−27 (x − 1)
(x2 + x + 1)4
−
88x + 29
x2 + x + 1
9 (7x + 2)
(x2 + x + 1)3
−
+
−
3 (25x + 11)
(x2 + x + 1)2
88x2 − 59x + 134
.
x3 + x + 1
Am klarsten wird die Partialbruchzerlegung bei Verwendung komplexer Zahlen, da jedes komplexe Polynom nach dem Fundamentalsatz der Algebra in Linearfaktoren zerfällt. Wir kommen später darauf zurück.
Die Partialbruchzerlegung ist bei der Integration rationaler Funktionen unverzichtbar, da die Partialbrüche meistens leichter zu integrieren sind als eine in
der Form f/g mit Polynomen f und g gegebene rationale Funktion. Durch das
Auftreten linearer oder quadratischer Funktionen im Nenner der Partialbruchzerlegung kommt darüber hinaus der Logarithmusfunktion (mit Ableitung 1/x)
und der Arkustangensfunktion (mit Ableitung 1/(x2 + 1)) bei der Integration rationaler Funktionen eine wichtige Rolle zu.
© Oliver Deiser
Einführung in die Mathematik 1
76
1. Abschnitt
Elementare Funktionen
Übungen
Übung 1
Geben Sie eine rationale Funktion an, die in den Punkten 1, 2, 3 einfache
Nullstellen, in 0 und 4 doppelte Polstellen und in 5 eine stetig hebbare
Definitionslücke besitzt. Ist eine rationale Funktion durch diese Eigenschaften eindeutig bestimmt?
Übung 2
Präzisieren Sie folgende Aussage:
„Eine rationale Funktion verhält sich wie ein Polynom, wenn x
gegen ∞ oder −∞ strebt.“
Übung 3
Skizzieren Sie den qualitativen Verlauf der rationalen Funktionen
(a)
(1 + x2 ) (x − 3)
,
(1 − x)2
(b)
1 + x2
.
(1 − x) (x − 3)
Übung 4
Zeigen oder widerlegen Sie, dass es eine rationale Funktion f gibt mit
limx
→∞
f(x) = 0, limx
→ −∞
f(x) = 1.
Übung 5
Diskutieren sie die qualitativen Zusammenhänge zwischen einer rationalen
Funktion h = f/g und der rationalen Funktion 1/h.
Übung 6
Bestimmen Sie die Partialbruchzerlegung für
(a)
1
,
(x − 1) x (x + 1)
(b)
1
,
(x + 1) (2x3 + 1)
(c)
6
,
x (x + 1) (x + 2) (x + 3)
(d)
1
(x2 + x + 1) (2x2 + x + 1)
Einführung in die Mathematik 1
(=
ax + b
x2 + x + 1
+
cx + d
2x2 + x + 1
).
© Oliver Deiser
5. Die Exponentialfunktion
In diesem Kapitel betrachten wir die reelle Exponentialfunktion zur Basis der
Eulerschen Zahl e. Mit Hilfe dieser fundamentalen Funktion − der vielleicht
wichtigsten der Analysis − können wir viele weitere Funktionen einführen: Die
Logarithmusfunktion zur Basis e, die allgemeinen Exponentialfunktionen zu einer positiven Basis, die allgemeinen Logarithmusfunktionen zu einer positiven
von 1 verschiedenen Basis sowie die Potenzfunktionen für beliebige reelle Exponenten.
© Oliver Deiser
Einführung in die Mathematik 1
78
1. Abschnitt
Elementare Funktionen
Charakterisierung der Exponentialfunktion
Wir gewinnen die Exponentialfunktion aus folgendem Satz:
Satz (Existenz- und Eindeutigkeitssatz, Charakterisierungssatz)
Es gibt genau eine Funktion f : R → R mit:
(1) f ′ = f,
(2) f(0) = 1.
Wir verwenden diesen Satz in dieser Einführung ohne Beweis. Plausibel wird
er durch die Betrachtung des Richtungsfeldes der Differentialgleichung f ′ = f, die
auch oft in der Form y′ = y notiert wird. Eine Funktion f mit f ′ = f hat an einer
Stelle x die Steigung y = f(x). Heften wir also an jeden Punkt (x, y) der Ebene den
auf die Länge 1 skalierten Vektor (1, y) an, so läuft f derart durch dieses Vektorfeld, dass unsere Vektoren an jedem Punkt (x, f(x)) des Graphen von f in Richtung
der Tangente von f zeigen. Umgekehrt können wir eine Funktion durch den
Punkt (0, 1) in unser Richtungsfeld einzeichnen und so die Existenz und Eindeutigkeit einer Funktion f mit den Eigenschaften (1) und (2) glaubhaft machen. Das
ist natürlich kein strenger Beweis, mindestens aber eine fruchtbare Anschauung.
6
4
2
0
-2
-4
-2
0
2
4
Das Richtungsfeld der Differentialgleichung y′ = y
Einführung in die Mathematik 1
© Oliver Deiser
5. Die Exponentialfunktion
79
Definition (Exponentialfunktion)
Die eindeutige Funktion des Satzes heißt die (reelle) Exponentialfunktion.
Wir bezeichnen sie mit exp : R → R. Weiter setzen wir
e = exp(1).
Die reelle Zahl e heißt die Eulersche Zahl oder Eulersche Konstante.
60
50
40
30
exp(x)
20
10
-4
-2
2
4
Das Additionstheorem
Als erstes zeigen wir, dass die Exponentialfunktion keine Nullstellen besitzt:
Satz (Nullstellenfreiheit der Exponentialfunktion)
Für alle x P R gilt exp(x) exp(−x) = 1, sodass exp(x) = 1/exp(−x). Insbesondere hat die Exponentialfunktion keine Nullstellen.
Beweis
Wir definieren g : R → R durch g(x) = exp(x) exp(−x). Dann gilt
g′(x) = exp(x) exp(−x) − exp(x) exp(−x) = 0 für alle x.
Damit ist g konstant gleich g(0) = exp(0) exp(−0) = 1 ⋅ 1 = 1.
Damit können wir nun eineweitere sehr wichtige Eigenschaft zeigen, die wir
durchgehend verwenden werden:
Satz (Additionstheorem, Funktionalgleichung)
Für alle x, y P R gilt
exp(x + y) = exp(x) exp(y).
© Oliver Deiser
Einführung in die Mathematik 1
80
1. Abschnitt
Elementare Funktionen
Beweis
Sei y P R. Wegen exp(y) ≠ 0 können wir f : R → R definieren durch
f(x) =
exp(x + y)
exp(y)
für alle x P R.
Für die Funktion f gilt f(0) = 1 und f ′(x) = f(x) für alle x P R. Nach dem
Existenz- und Eindeutigkeitsatz ist also f = exp. Durch Multiplikation mit
der Konstanten reellen Zahl exp(y) erhalten wir
exp(x) exp(y) = f(x) exp(y) = exp(x + y) für alle x P R.
Es ist bemerkenswert, dass sich diese Eigenschaft aus dem Charakterisierungssatz gewinnen lässt.
Beispiele
Sei x P R. Wegen
1 = exp(0) = exp(x − x) = exp(x) exp(−x)
ergibt sich noch einmal der Satz über die Nullstellenfreiheit. Weiter gilt:
exp(2x) = exp(x + x) = exp(x) exp(x) = exp(x)2 ,
exp(x) = exp(x/2 + x/2) = exp(x/2) exp(x/2) = exp(x/2)2 .
Damit ist exp(x) das Quadrat einer reellen Zahl. Wegen exp(x) ≠ 0 ist also
exp(x) > 0. Damit haben wir gezeigt, dass die Exponentialfunktion nur
positive Werte annimmt.
Das Additionstheorem motiviert:
Notation: Exponentialschreibweise
Wir schreiben auch ex anstelle von exp(x).
Das Additionstheorem lautet in der neuen Schreibweise:
ex + y = ex ⋅ ey
für alle x, y P R.
Weiter ist e1 = exp(1) = e.
Beispiele
Sei x P R. Obige Beispiele lesen sich nun in der Form
1 = ex − x = ex e−x , sodass e−x = (ex )− 1 ,
e−1 = (e1 )−1 = 1/e,
e2x = ex + x = ex ex = (ex )2 ,
ex = ex/2 + x/2 = ex/2 ex/2 = (ex/2 )2 , sodass ex/2 = £ex .
Einführung in die Mathematik 1
© Oliver Deiser
5. Die Exponentialfunktion
81
Reihendarstellung der Exponentialfunktion
Die Exponentialfunktion erlaubt eine Berechnung durch eine Potenzreihe.
Eine Potenzreihe hat die Form
(+) ∑ n an xn = a0 + a1 x + a2 x2 + … + an xn + …
mit Koeffizienten an P R. Man kann sich eine solche Reihe als „unendliches Polynom“ vorstellen. Im Gegensatz zu Polynomen treten nun aber Konvergenzfragen auf, da eine unendliche Summe gebildet wird. Soll die Summe für alle reelle
Zahlen x endlich sein, so müssen die Koeffizienten an in ihrem Betrag schnell gegen Null konvergieren, um die Potenzen xn , die für |x| > 1 in ihrem Betrag
schnell wachsen, zu kompensieren. Ist die Konvergenz für alle reellen Zahlen gegeben, so kann man Potenzreihen in vielerlei Hinsicht so behandeln, als wären
sie Polynome. Insbesondere darf man sie gliedweise differenzieren: Ist f : R → R
definiert durch (+), so gilt
(++) f ′(x) = ∑ n ≥ 1 n an xn − 1 = ∑ n (n + 1) an + 1 xn für alle x P R.
Dies alles zu präzisieren und mit vollständigen Beweisen systematisch zu entwickeln erfordert viel Arbeit. Im Rahmen dieser Einführung werden wir Potenzreihen weitgehend naiv und spielerisch behandeln. Natürlich verwenden
wir dabei nur Sätze, die sich in einem strengen Aufbau der Analysis auch beweisen lassen.
Wir beginnen unsere spielerische Untersuchung mit der Frage, wie wir die
Koeffizienten an einstellen müssen, damit durch f(x) = ∑ n an xn eine Funktion
f : R → R definiert wird mit
(1) f ′ = f,
(2) f(0) = 1
Zunächst gilt f(0) = a0 . Wir setzen also a0 = 1. Aus dem Wunsch f ′ = f und gliedweisem Differenzieren (++) ergibt sich durch Koeffizientenvergleich
an = (n + 1) an + 1 für alle n ≥ 0.
Damit erhalten wir die Rekursionsgleichung
a0 = 1, an + 1 = an
1
n+1
für alle n ≥ 0.
Diese wird gelöst durch
an =
1
n!
=
1
1⋅2⋅…⋅n
für alle n ≥ 0,
wobei wir 0! = 1 verwenden. Diese Koeffizienten konvergieren extrem schnell
gegen 0 und setzen sich gegen xn für eine im Betrag beliebig große feste reelle
Zahl x durch. Insgesamt gilt:
© Oliver Deiser
Einführung in die Mathematik 1
82
1. Abschnitt
Elementare Funktionen
Satz (Reihendarstellung der Exponentialfunktion)
Für alle x P R gilt
exp(x) = 1 + x +
x2
2!
+
x3
3!
+ … = ∑n
xn
.
n!
(Exponentialreihe)
Die Exponentialreihe können wir zur effektiven Berechnung der Exponentialfunktion verwenden. Für alle n P N stellt die sogenannte n-te Partialsumme
fn (x) = 1 + x +
x2
2!
+ … +
xn
n!
= ∑ k≤n
xk
k!
der Exponentialreihe eine Approximation an die Exponentialfunktion dar. Je
größer der Betrag von x ist, desto größer müssen wir n wählen, um eine gute
Approximation zu erhalten. Die folgenden Diagramme geben einen Eindruck
der Güte der Approximation.
2.5
2.0
1.5
exp(x)
1+x
1.0
0.5
-1.0
-0.5
0.5
1.0
15
10
exp(x)
1+x
1+x+
5
1+x+
x2
2
x2
2
-4
-2
2
+
x3
6
4
-5
Approximationen an die Exponentialfunktion im Nullpunkt
Einführung in die Mathematik 1
© Oliver Deiser
5. Die Exponentialfunktion
83
2000
1500
exp(x)
1000
f(x)
500
-10
-5
5
10
Die Approximation f(x) = 1 + x + x2 /2 + … + x10 /10!
Die Reihendarstellung der Exponentialfunktion erlaubt insbesondere auch
eine schnelle numerische Berechnung von exp(x). Für die Eulersche Zahl e gilt
e = exp(1) =
1
0!
+
= 1 + 1 +
1
1!
1
2!
+
1
2
+
1
6
+
+
1
3!
1
24
+
1
4!
+ …
+ …
= 2,71828182845904523536028747135266249775…
Berechnung der Koeffizienten durch mehrfaches Ableiten
Die Koeffizienten der Exponentialreihe lassen sich auch durch Auswerten der
mehrfach gebildeten Ableitung an der Stelle 0 gewinnen. Der Leser vergleiche
dies mit der Diskussion der Entwicklung von Polynomen an einer Stelle. Für alle
k P N gilt
f (k) (x) = k! ak + (k + 1) … 2 ak + 1 x + (k + 2) … 3 ak + 2 x2 + …,
sodass f (k) (0) = k! ak oder
(#) ak =
f (k) (0)
.
k!
Diese Koeffizientenformel gilt allgemein für Potenzreihen. In unserem Fall
gilt f (k) = f und f(0) = 1, sodass
ak =
1
.
k!
© Oliver Deiser
Einführung in die Mathematik 1
84
1. Abschnitt
Elementare Funktionen
Die Limesdarstellung der Exponentialfunktion
Eine alternative Darstellung der Exponentialfunktion verwendet eine Grenzwertbildung, die sich durch das Problem einer stetigen Verzinsung motivieren
lässt (wir diskutieren diese Motivation in den Übungen). Betrachten wir eine natürliche Zahl n ≥ 1, so gilt
d
dx
(+)
(1 +
x
n
)n
(
= n 1+
x
n
)n − 1
1
n
(
= 1+
x
n
) n − 1.
Wenn n gegen unendlich strebt, wird der Unterschied zwischen n und n − 1 im
Exponenten auf der rechten Seite bei beliebigem x unerheblich, da
(1 +
x
n
x
n
) n − 1 = (1 +
)n
n
.
n+x
Damit lässt sich vermuten, dass durch die Grenzwertbildung
(
f(x) = lim n ≥ 1 1 +
x
n
)n
eine Funktion f : R → R definiert wird mit f ′ = f. Dies ist, wie man zeigen kann,
tatsächlich der Fall. (Dass die Grenzfunktion überall definiert und zudem differenzierbar ist und ihre Ableitung der Grenzwert der Ableitungen in (+) ist, ist
keineswegs selbstverständlich.) Damit haben wir erneut eine Funktion gefunden,
die sich bei der Ableitung selbst reproduziert und zudem an der Stelle x = 0 den
Wert 1 besitzt. Nach dem Eindeutigkeitssatz gilt:
Satz (Limesdarstellung der Exponentialfunktion)
Für alle x P R gilt
(
exp(x) = lim n ≥ 1 1 +
x
n
) n.
Speziell ist
(
e = lim n ≥ 1 1 +
1
n
) n.
Die Limesdarstellung ist theoretisch von Bedeutung, aus numerischer Sicht
aber der Reihendarstellung unterlegen. Ist x P R und n P N, so sind
sn (x) = ∑ k ≤ n
xk
,
k!
tn (x) =
(1 +
x
n
)n
Approximationen an exp(x). Die Approximation sn ist im Allgemeinen deutlich
besser als tn .
Einführung in die Mathematik 1
© Oliver Deiser
5. Die Exponentialfunktion
85
Der natürliche Logarithmus
Für alle x P R gilt exp′(x) = exp(x) > 0, sodass die Exponentialfunktion streng
monoton steigend ist. Dies lässt sich anschaulich auch am Richtungsfeld der Differentialgleichung f ′ = f erkennen. Wie jede streng monotone Funktion besitzt
die Exponentialfunktion eine Umkehrfunktion:
Definition (natürlicher Logarithmus)
Die Umkehrfunktion der Exponentialfunktion exp : R → R heißt der
natürliche Logarithmus oder der Logarithmus zur Basis e. In Zeichen
schreiben wir
log : ] 0, ∞ [ → R oder ln : ] 0, ∞ [ → R.
Wir bevorzugen im Folgenden die Bezeichnung „log“ statt „ln“. Letzteres
steht für „logarithmus naturalis“. Nach Definition gilt:
(1) log(exp(x)) = x für alle x P R,
(2) exp(log(x)) = x für alle x > 0.
2
log(x)
1
1
2
3
4
5
6
-1
-2
Speziell gilt
log(1) = 0, log(e) = 1, log(1/e) = −1,
da exp(0) = 1 und exp(1) = e. Als Umkehrfunktion einer streng monoton steigenden Funktion ist der Logarithmus ebenfalls streng monoton steigend (und nicht
etwa fallend!).
Aus dem Additionstheorem der Exponentialfunktion wird ein Multiplikationstheorem:
© Oliver Deiser
Einführung in die Mathematik 1
86
1. Abschnitt
Elementare Funktionen
Satz (Multiplikationstheorem)
Für alle x, y > 0 gilt log(x y) = log(x) + log(y).
Beweis
Seien x, y > 0, und seien a, b P R mit exp(a) = x, exp(b) = y. Dann gilt
log(x ⋅ y) = log(exp(a) exp(b)) = log(exp(a + b)) = a + b = log(x) + log(y).
Beispiele
Für alle x > 0 gilt:
(a) log(x2 ) = log(xx) = log(x) + log(x) = 2 log(x).
(b) log(x) = log(£x £x) = 2 log(£x), sodass
log(x1/2 ) = log(£x) = 1/2 log(x).
Die allgemeine Exponentialfunktion
Wir haben exp(x) aufgrund der sich aus dem Additionstheorem ergebenden
Rechengesetze auch in der Exponentialschreibweise ex notiert. Eine natürliche
Frage ist, ob und wie wir eine Exponentiation (Potenzbildung) zu einer anderen
Basis gewinnen können. Für eine solche Exponentiation soll gelten
(ey )x = ex y für alle x, y P R.
Setzen wir a = ey , so gilt y = log(a) und wir erhalten
ax = ex y = ex log(a) für alle x P R.
Dies können wir zur Definition verwenden:
Definition (Exponentialfunktion zu einer positiven Basis)
Sei a > 0. Dann definieren wir expa : R → R durch
expa (x) = exp(x log(a)) für alle x P R.
Die Funktion expa heißt die Exponentialfunktion zur Basis a.
Das Additionstheorem gilt auch für die allgemeinen Exponentialfunktionen,
denn für alle x, y P R gilt:
expa (x + y) = exp((x + y) log(a)) = exp(x log(a) + y log(a))
= exp(x log(a)) exp(y log(a)) = expa (x) expa (y).
Wie für die Exponentialfunktion zur Basis e motiviert dies:
Notation: allgemeine Exponentialschreibweise
Wir schreiben auch ax anstelle von expa (x). Dabei ist a > 0 und x P R.
Einführung in die Mathematik 1
© Oliver Deiser
5. Die Exponentialfunktion
87
Die Eigenschaften und den qualitativen Verlauf von expa kann man sich mit
folgender Merkregel klarmachen:
ax verhält sich wie ex , wobei x um den konstanten Faktor log(a) skaliert wird.
Für die Skalierung sind vor allem die Intervalle ] 0, 1 [, { 1 }, ] 1, ∞ [ von Bedeutung, in denen der Logarithmus negativ, gleich null bzw. positiv ist.
Die reelle Zahl ax ist für a > 0 und x P R durch die Exponentialfunktion definiert, in Fortsetzung bereits definierter Potenzen wie a2 oder a1/2 = £a. Weiter ist
ax auch für gewisse a ≤ 0 und x erklärt, etwa
(−8)1/3 = 3 £−8 = −2, 00 = 1, (−1)2 = 1.
Es gibt aber keine allgemeine Exponentialfunktion expa : R → R zu einer negativen Basis. Denn für a < 0 würde nach dem Additionstheorem expa (1/2) im Quadrat gleich a ergeben, was wegen a < 0 nicht sein kann.
5
4
3
x
2x
10x
2
1
-1.0
-0.5
0.5
1.0
Exponentialfunktionen zu Basen größer als 1
5
4
1 x
3
1 x
2
2
1 x
10
1
-1.0
-0.5
0.5
1.0
Exponentialfunktionen zu Basen kleiner als 1
© Oliver Deiser
Einführung in die Mathematik 1
88
1. Abschnitt
Elementare Funktionen
Fast schon „nach Konstruktion“ gelten:
Satz (Rechenregeln für die allgemeine Exponentialfunktion)
Seien a, b > 0. Dann gilt alle x, y P R:
(a) ax ⋅ ay = ax + y ,
(b) (ay )x = ax y ,
(c) ax bx = (a b)x .
Beweis
zu (a): ax ⋅ ay = ex log(a) ⋅ ey log(a) = e(x + y) log(a) = ax + y .
zu (b): (ax ) y = (ex log(a) ) y = ey log(exp(x log(a))) = ey x log(a) = ax y .
zu (c): ax bx = ex log(a) ⋅ ex log(b) = ex (log(a) + log(b)) = ex log(a b) = (a b)x .
Die Aussage (a) ist nichts anderes als das Additionstheorem für expa in der alternativen Notationen, aber es schadet nicht, das kurze Argument nochmal zu
wiederholen. Teil (b) ist die Verallgemeinerung unseres Ansatzes (ey )x = ex y , der
die Definition von ax motivierte.
Weiter halten wir folgende allgemeine Logarithmusregel fest:
Satz
Für alle a > 0 und x P R gilt log(ax ) = x log(a).
Beweis
Es gilt log(ax ) = log(exp(x log(a))) = x log(a).
Berechnung von Grenzwerten
Mit Hilfe der allgemeinen Exponentialfunktion lassen sich viele Grenzwerte
einfach berechnen. Einige Beispiele sind:
Beispiele
(a) Sei 0 < a < 1. Dann gilt log(a) < 0, sodass
limn
→∞
(b) limn
→∞
an = limn
n
→∞
£n = limn
en log(a) = 0.
→∞
n1/n = limn
→∞
elog(n)/n = e0 = 1.
(c) Sei n > 0. Dann gilt:
limx
→∞
ex
xn
= limn
→∞
ex
e
n log(x)
= limx
→∞
ex − n log(x) = ∞.
Weitere Beispiele betrachten wir in den Übungen.
Einführung in die Mathematik 1
© Oliver Deiser
5. Die Exponentialfunktion
89
Die Potenzfunktionen
In der allgemeinen Exponentialfunktion ist die Basis fest und der Exponent variabel. Vertauschen wir die Rollen, erhalten wir.
Definition (allgemeine Potenzfunktionen)
Sei b P R. Dann definieren wir pot b : ] 0, ∞ [ → R durch
pot b (x) = xb = expx (b) = eb log(x) für alle x > 0.
Die Funktion potb heißt die Potenzfunktion zum Exponenten b.
Beispiele für Potenzfunktionen sind die auf R+ erklärten Funktionen
1, x, x2 , x3 , …
x− 1 = 1/x, x− 2 = 1/x2 , x− 3 = 1/x3 , …
x1/2 = £x, x1/3 = 3 £x, x1/4 = 4 £x, …
xn/m =
m
£xn für n P Z und m P N*.
Für einen positiven Exponenten b können wir die Potenzfunktionen stetig
durch potb (0) = 0 fortsetzen, und für manche Exponenten b kann die Potenzfunktion potb sogar auf ganz R erklärt werden, z. B. für b P N oder b = 1/3,
nicht aber für b = −1 oder b = 1/2. Im Allgemeinen sind die Potenzfunktionen
nur für positive reelle Zahlen definiert, da zu ihrer Definition die Logarithmusfunktion herangezogen wird.
2.5
2.0
x1
1.5
x
3
1.0
x
x2
0.5
0.0
0.5
1.0
1.5
2.0
Potenzfunktionen zu positiven Exponenten
© Oliver Deiser
Einführung in die Mathematik 1
90
1. Abschnitt
Elementare Funktionen
7
6
5
1
x
1
x
4
1
x2
1
x3
3
2
1
0.0
0.5
1.0
1.5
2.0
2.5
3.0
Potenzfunktionen zu negativen Exponenten
Die beiden Welten der Potenzfunktionen für positive bzw. negative Exponenten werden durch die konstante Potenzfunktion pot0 mit
pot0 (x) = x0 = 1 für alle x > 0
getrennt. Die Wurzelfunktionen pot1/n nähern sich punktweise von unten an
pot0 an, wenn n gegen unendlich strebt. Ebenso nähern sich die Potenzfunktionen pot−1/n punktweise von oben an pot0 an. Beide Typen haben Besonderheiten
an ihrer linken Definitionsgrenze 0: Die Wurzelfunktionen können stetig im
Nullpunkt fortgesetzt werden, sind dort aber nicht differenzierbar. Und die
Funktionen pot−1/n (x) streben gegen unendlich, wenn x gegen 0 strebt.
Die allgemeinen Logarithmen
Eine Exponentialfunktion expa ist im Fall a > 1 streng monoton steigend und
im Fall 0 < a < 1 streng monoton fallend, sodass wir ihre Umkehrfunktion können
(die wie immer das Monotonieverhalten erbt):
Definition (Logarithmus zu einer positiven Basis a ≠ 1)
Sei a > 0, a ≠ 1. Dann heißt die Umkehrfunktion der Exponentialfunktion
zur Basis a der Logarithmus zur Basis a. In Zeichen schreiben wir
loga : ] 0, +∞ [ → R.
Ausgenommen in der Definition ist der Fall a = 1. Die Exponentialfunktion
exp1 ist konstant gleich 1 und besitzt daher keine Umkehrfunktion:
Ein Logarithmus zur Basis 1 ist nicht definiert.
Einführung in die Mathematik 1
© Oliver Deiser
5. Die Exponentialfunktion
91
Nach Definition gilt für alle a > 0, a ≠ 1, x P R und y > 0:
(+) y = a x = expa (x) genau dann, wenn loga (y) = x.
Etwas salopp kann man dies so formulieren:
Die Funktion log a holt den Exponenten aus a x .
1
0.5
1.0
1.5
2.0
2.5
3.0
log(x)
log2 (x)
log10 (x)
-1
-2
Logarithmen zu Basen größer als 1
2
log 1 (x)
e
1
log 1 (x)
2
0.5
1.0
1.5
2.0
2.5
3.0
log 1 (x)
10
-1
Logarithmen zu Basen kleiner als 1
Wie für den Logarithmus zur Basis e zeigt man:
Satz (Multiplikationstheorem)
Sei a > 0, a ≠ 1. Dann gilt für alle x, y > 0:
loga (x y) = loga (x) + loga (y) für alle x, y > 0.
Weitere Eigenschaften versammelt der folgende Satz:
© Oliver Deiser
Einführung in die Mathematik 1
92
1. Abschnitt
Elementare Funktionen
Satz (Rechenregeln für Logarithmen, Basisumrechnung)
Seien a, b > 0 mit a, b ≠ 1. Weiter sei x > 0. Dann gilt:
(1) loga (x) =
log(x)
,
log(a)
(2) loga (x) =
logb (x)
,
logb (a)
(3) loga (x) = − log1/a (x),
(4) loga (b) =
1
.
logb (a)
Beweis
zu (1): Es gilt
x = elog(x) = e log(x)/log(a) ⋅ log(a) = alog(x)/log(a) .
Anwendung von loga auf beiden Seiten liefert die Behauptung.
zu (2): Nach (1) ist log(y) = logb (y) log(b) für alle y > 0, sodass
loga (x) =
log(x)
log(a)
logb (x) log(b)
logb (a) log(b)
=
=
logb (x)
.
logb (a)
zu (3):
loga (x) =
log1/a (x)
log1/a (a)
=
log1/a (x)
−1
= − log1/a (x).
zu (4):
loga (b) =
logb (b)
logb (a)
=
1
.
logb (a)
Beispiel
Wir betrachten den Unterschied zwischen den Logarithmen zu den Basen
2 und 8. Wegen 8 = 23 gilt für alle x > 0:
log8 (x) =
log2 (x)
log2 (8)
=
log2 (x)
log2 (23 )
=
log2 (x)
3 log2 (2)
=
1
log2 (x).
3
Der Logarithmus zur Basis 8 entsteht also aus dem Logarithmus zur Basis 2
durch Skalierung um den Faktor 3.
Einführung in die Mathematik 1
© Oliver Deiser
5. Die Exponentialfunktion
93
Übungen
Übung 1
Seien a, c P R beliebig. Zeigen Sie, dass es genau eine Funktion f : R → R
gibt mit f ′(x) = af(x) für alle x P R und f(0) = c.
[ Verwenden Sie zum Beweis der Eindeutigkeit, dass Funktionen, deren
Ableitung die Nullfunktion ist, konstant sind. ]
Übung 2
Wir betrachten die Differentialgleichung f ′(x) = 1/f(x).
(a) Zeichnen Sie das Richtungsfeld der Differentialgleichung.
(b) Für welche x0 , y0 P R gibt es eine Lösung f : P → R mit f(x0 ) = y0 ?
(Der Definitionsbereich P wird maximal gewählt, sodass die
Funktion f auf ganz P differenzierbar ist.)
(c) Geben Sie eine Lösung f : P → R mit f(x0 ) = y0 im Fall der Existenz
in Abhängigkeit von x0 , y0 P R konkret an.
Übung 3
Sei c P R. Zeigen Sie, dass es genau eine Funktion f : ] 0, ∞ [ → R gibt mit
f ′(x) = − f(x)/x für alle x > 0 und f(1) = a.
Übung 4
Zeigen Sie mit Hilfe des Additionstheorems:
(1) exp(nx) = exp(x)n für alle n P N,
(2) exp(−nx) = exp(x)−n für alle n P N,
(3) exp(n/m x) =
m
£exp(x)n für alle n P Z, m ≥ 1.
Übung 5
Werden k Euro zu einem jährlichen positiven Zinssatz von p Prozent
angelegt, so erhält man mit a = p/100 nach einem Jahr k(1 + a) Euro, also
zum Beispiel 106 Euro bei k = 100, 6% Zinsen und a = 0,06. Erfolgt bereits
nach einem halben Jahr eine anteilige Verzinsung, so erhält man nach
einem halben Jahr k(1 + a/2) Euro. Legt man dieses Kapitel ein weiteres
halbes Jahr an, so erhält man k(1 + a/2)2 > k(1 + a). Modellieren Sie auf der
Grundlage dieser Überlegungen eine stetige Verzinsung, bei der das
angelegte Kapital kontinuierlich verzinst und die Zinsen kontinuierlich
wieder angelegt werden. Welche Rolle spielt e in diesem Modell?
© Oliver Deiser
Einführung in die Mathematik 1
94
1. Abschnitt
Elementare Funktionen
Übung 6
Beweisen Sie das Additionstheorem für die Exponentialfunktion mit Hilfe
der Limesdarstellung
(
exp(x) = lim n ≥ 1 1 +
x
n
)n
für alle x P R.
Übung 7
Für welche Paare (a, x) reeller Zahlen kann ax definiert werden? Geben Sie
die Definitionen genau an. Vergleichen Sie verschiedene Definitionen und
zeigen Sie, dass sie konsistent sind, zum Beispiel
x2 = x x versus x2 = exp(2log(x)) für alle x > 0.
Übung 8
Warum ist die Basis e gegenüber anderen Basen a > 0 ausgezeichnet?
Übung 9
Skizzieren Sie die Funktionen expa : R → R und loga : ] 0, ∞ [ → R für
einige Basen a, sodass der von der Basis abhängige qualitative Verlauf
deutlich wird.
Übung 10
Sei a > 0 mit a ≠ 1. Zeigen Sie:
loga (x y ) = y loga (x) für alle x > 0 und y P R.
Übung 11
Sei a > 0 mit a ≠ 1. Weiter sei c ≠ 0. Zeigen Sie:
logac (x) = loga (x)/c für alle x > 0.
Übung 12
Betrachten Sie die Aussage
„Die Exponentialfunktion wächst schneller als jede Potenz xn .“
(a) Präzisieren Sie die Aussage.
(b) Welche Wachstumsaussage ergibt sich für den Logarithmus?
(c) Strebt log(x) besonders schnell oder besonders langsam gegen ∞,
wenn x von rechts gegen 0 strebt? Begründen Sie Ihre Antwort.
Übung 13
Bestimmen Sie für x > 0:.
(a) lim x
→0
x (log x)n mit n ≥ 1 beliebig.
(b) lim x
→0
xx .
Einführung in die Mathematik 1
© Oliver Deiser
6. Die trigonometrischen Funktionen
Wir führen den Kosinus und Sinus als Koordinatenfunktionen für Punkte des
Einheitskreis ein. Als erste wichtige Anwendung beschreiben wir Drehungen in
der Ebene. Danach diskutieren wir die klassische Bedeutung der trigonometrischen Funktionen an Dreiecken. Mit Hilfe der Umkehrfunktionen bestimmen
wir schließlich Winkel und Polarkoordinaten.
© Oliver Deiser
Einführung in die Mathematik 1
96
1. Abschnitt
Elementare Funktionen
Kosinus und Sinus am Einheitskreis
Wir definieren:
Definition (Kreis)
Sei r P R+0 . Dann heißt
Kr = { (x, y) P R2 | x2 + y2 = r2 }
der Kreis oder genauer die Kreislinie mit Radius r und Mittelpunkt 0 = (0, 0)
der Ebene R2 . Der Kreis K = K1 heißt der Einheitskreis in R2 .
Definition (Winkel im Bogenmaß)
Ist P ein Punkt auf dem Einheitskreis K, so heißt die Länge α P [ 0, 2π [
des Kreisbogens von K, der gegen den Uhrzeigersinn von (1, 0) zu P
führt, der von P und der x-Achse eingeschlossene Winkel (im Bogenmaß) im
Intervall [ 0, 2π[.
1.0
K
P
0.5
-1.0
-0.5
0.5
1.0
-0.5
-1.0
Ein Punkt auf dem Einheitskreis und Winkel im Bogenmaß
Wir vereinbaren:
Konvention
Indem wir reelle Zahlen, die sich nur um ein ganzzahliges Vielfaches von
2π unterscheiden, miteinander identifizieren, können wir jede reelle Zahl
als Winkel auffassen. Für alle α P R gibt es dann einen Punkt P auf dem
Einheitskreis mit dem Winkel α. Zwei Winkel, die demselben Punkt P
entsprechen, unterscheiden sich um ein ganzzahliges Vielfaches von 2π.
Einführung in die Mathematik 1
© Oliver Deiser
6. Die trigonometrischen Funktionen
97
Anschaulich entspricht diese Identifizierung dem mehrfachen Durchlaufen
des Einheitskreises für α ≥ 2π bzw. einem Durchlaufen des Einheitskreises im
Uhrzeigersinn für α < 0. Oft ist es auch nützlich, Winkel standardmäßig im Intervall ] −π, π ] anstelle von [ 0, 2π [ zu wählen. Prinzipiell ist jedes halboffene Intervall der Länge 2π geeignet.
Nach diesen Vorbereitungen können wir nun die Kosinus- und Sinusfunktion
einführen:
Definition (Sinus und Kosinus als Koordinatenfunktionen)
Sei α P R, und sei P der Punkt des Einheitskreis K mit Winkel α. Dann
setzen wir
cos(α) = „die x-Koordinate von P“,
sin(α) = „die y-Koordinate von P“.
Die so definierten Funktionen cos : R → R und sin : R → R heißen die
Kosinus-Funktion bzw. Sinus-Funktion auf R.
Liegt also P auf K mit Winkel α, so gilt nach Definition
P = (cos(α), sin(α)).
K
sin( )
P
cos( )
Kosinus und Sinus als Koordinatenfunktionen für Punkte des Einheitskreises
Aufgrund unserer Identifizierung von Winkeln sind die Kosinus- und Sinusfunktion 2π-periodisch, d. h. es gilt
cos(α + k2π) = cos(α),
sin(α + k2π) = sin(α) für alle α P R und k P Z.
© Oliver Deiser
Einführung in die Mathematik 1
98
1. Abschnitt
Elementare Funktionen
1.0
cos(x)
0.5
-3
-2
-
2
3
2
3
-0.5
-1.0
1.0
sin(x)
0.5
-3
-2
-
-0.5
-1.0
Wir können die Definition aus unterschiedlichen Gesichtspunkten betrachten. Zwei wichtige Interpretationen sind:
Dynamische Interpretation: Gleichmäßige Kreisbewegung
Bewegt sich ein Punkt P in der Zeit t auf dem Einheitskreis gleichmäßig
gegen den Uhrzeigersinn mit der Winkelgeschwindigkeit 1 und gilt
P(0) = (1, 0), so gilt
P(t) = (cos(t), sin(t)) für alle t P R.
Geometrische Interpretation: Längentreue Kreisaufwicklung
Sei x P R. Wickeln wir eine Strecke von 0 bis x längentreu auf den
Einheitskreis auf (gegen den Uhrzeigersinn für x ≥ 0, im Uhrzeigersinn für
x < 0), so endet diese Kreisaufwicklung im Punkt
P(x) = (cos(x), sin(x)) P K.
Einführung in die Mathematik 1
© Oliver Deiser
6. Die trigonometrischen Funktionen
99
Im Umgang mit trigonometrischen Funktionen verwenden wir je nach Kontext und prinzipiell völlig frei die Variablen x,y,α,β, …,ϕ,ψ, … Um Klammern zu
sparen, vereinbaren wir:
Notation
Wir lassen Funktionsklammern oft weg und schreiben sin x, cos x statt
sin(x), cos(x). Weiter schreiben wir sin2 x, cos2 x statt (sin x)2 , (cos x)2 .
Allgemein verwenden wir für jede Funktion f zusätzlich zu f(x) auch die alternative Notation fx , wo immer es der Übersichtlichkeit dient.
Eigenschaften von Kosinus und Sinus
Aus der Definition am Einheitskreis gewinnen wir:
Satz (elementare Werte von cos und sin)
Für alle k P Z gilt:
(a) cos(π/2 + kπ) = 0, sin(kπ) = 0,
k
(Nullstellen)
k
(b) cos(kπ) = (−1) , sin(π/2 + kπ) = (−1) ,
(±1-Werte)
(c) cos(π/4 + kπ) = sin(π/4 + kπ) = (−1)k £2/2.
(gleiche Werte)
Zudem gibt es keine weiteren Nullstellen, Stellen mit Wert ±1 und Stellen
mit gleichem Wert.
1.0
0.5
cos(x)
-3
-2
-
2
3
sin(x)
-0.5
-1.0
Einige häufig verwendete Formeln versammelt der folgende Satz.
© Oliver Deiser
Einführung in die Mathematik 1
100
1. Abschnitt
Elementare Funktionen
Satz (elementare Eigenschaften von cos und sin)
Für alle α P R gilt:
(a) cos2 α + sin2 α = 1,
(Satz des Pythagoras für Kosinus und Sinus)
(b) cos α = cos (−α), sin α = − sin(−α),
(Parität)
(c) cos(π/2 − α) = sin α, sin(π/2 − α) = cos α,
(Spiegelung)
(d) cos(α + π/2) = − sin α, sin(α + π/2) = cos α,
cos(α + π) = − cos α, sin(α + π) = − sin α,
cos(α + 3π/2) = sin α, sin(α + 3π/2) = − cos α,
cos(α + 2π) = cos α, sin(α + 2π) = sin α.
(Verschiebungsformeln)
Die erste Eigenschaft folgt aus dem Satz des Pythagoras, den wir an dieser
Stelle voraussetzen. Die anderen Eigenschaften ergeben sich aus elementaren
geometrischen Transformationen, die wir aufgrund ihrer Bedeutung allgemein
formulieren:
Spiegelung im Nullpunkt
Bei der Spiegelung am Nullpunkt geht ein Punkt (x, y) über in den Punkt
−(x, y) = (−x, −y).
Spiegelung an den Achsen
Bei der Spiegelung an der x-Achse geht ein Punkt (x, y) über in (x, −y). Bei
der Spiegelung an der y-Achse geht (x, y) über in (−x, y).
Spiegelungen an der ersten und zweiten Winkelhalbierenden
Bei der Spiegelung an der Winkelhalbierenden (des ersten und dritten
Quadranten) geht ein Punkt (x, y) über in (y, x). Bei der Spiegelung an der
Winkelhalbierenden des zweiten und vierten Quadranten geht (x, y) über in
(−y, −x).
Drehungen um π/2
Bei der Drehung um π/2 (gegen den Uhrzeigersinn) geht ein Punkt (x, y)
über in (−y, x). Bei der Drehung um π/2 im Uhrzeigersinn geht (x, y) über
in (y, −x).
Damit lässt sich eine Drehung um π/2 beispielsweise auch auffassen als eine
Spiegelung an der x-Achse gefolgt von einer Spiegelung an der Winkelhalbierenden: (x, y) wird erst zu (x, −y) und dann zu (−y, x).
Der Leser möge die Eigenschaften des Satzes mit Hilfe von Diagrammen visualisieren und sie mit Hilfe der Transformationsregeln für Spiegelungen und Drehungen um π/2 begründen.
Einführung in die Mathematik 1
© Oliver Deiser
6. Die trigonometrischen Funktionen
101
(-y, x)
x
(x, y)
y
-x
-y
y
x
-y
(-x, -y)
-x
(y, -x)
Die beiden Drehungen um π/2 und die Spiegelung am Nullpunkt
Drehungen und Additionstheoreme
Seien P = (cos α, sin α) ein Punkt auf dem Einheitskreis und β P R. Drehen wir
P um den Winkel β, so erhalten wir den Punkt
Q = (cos(α + β), sin(α + β))
des Einheitskreises.
Q
K
sin( )
P
cos( )
Die Drehung eines Punktes P zum Punkt Q auf K (I)
© Oliver Deiser
Einführung in die Mathematik 1
102
1. Abschnitt
Elementare Funktionen
Den Punkt Q können wir aber auch so beschreiben: P ist die Summe der
Vektoren v = (cos α, 0) und w = (0, sin α). Weiter ist Q die Summe der um β gedrehten Vektoren v und w, die wir v* und w* nennen wollen. Der Vektor v* ist
ist der um cos α skalierte um β gedrehte Einheitsvektor e1 = (1, 0), sodass
v* = cos(α) (cos β, sin β).
Ebenso ist der Vektor w* der um sinα skalierte und um β gedrehte Einheitsvektor
e2 = (0, 1), sodass
w* = sin(α) (− sin β, cos β).
Damit gilt:
Q = cos α (cos β, sin β) + sin α (− sin β, cos β)
= (cos α cos β − sin α sin β, cos α sin β + sin α cos β).
K
Q
P
w*
w
v*
v
Die Drehung eines Punktes P zum Punkt Q auf K (II)
Durch Koordinatenvergleich erhalten wir:
Satz (Additionstheoreme für Kosinus und Sinus)
Für alle α, β P R gilt:
(a) cos(α + β) = cos α cos β − sin α sin β,
(b) sin(α + β) = cos α sin β + sin α cos β.
Unsere Argumentation entspricht der Definition von Kosinus und Sinus als
Koordinatenfunktionen für Punkte des Einheitskreises. Einen weiteren Beweis
dieser fundamentalen Eigenschaften mit Hilfe von rechtwinkligen Dreiecken
werden wir unten kennenlernen.
Einführung in die Mathematik 1
© Oliver Deiser
6. Die trigonometrischen Funktionen
103
Für den Spezialfall α = β erhalten wir:
Korollar (Verdopplungsformeln)
Für alle α P R gilt:
(a) sin(2α) = sin α cos α + cos α sin α = 2 sin α cos α,
(b) cos(2α) = cos α cos α − sin α sin α = cos2 α − sin2 α.
Im Fall β = π/4 erhalten mit Hilfe der Werte sin(π/4) = cos(π/4) = £2/2:
Korollar (π/4-Formeln)
Für alle α P R gilt:
(a) cos α + sin α = £2 cos(α − π/4) = £2 sin(α + π/4),
(b) cos α − sin α = £2 cos(α + π/4) = − £2 sin(α − π/4).
1.0
0.5
cos(2 x)
cos2 (x)
-
sin2 (x)
-0.5
-1.0
Zur Verdopplungsformel des Kosinus
1.5
1.0
0.5
cos(x) + sin(x)
-2
-
2
cos(x) - sin(x)
2
-0.5
-1.0
-1.5
Summe und Differenz von Kosinus und Sinus
© Oliver Deiser
Einführung in die Mathematik 1
104
1. Abschnitt
Elementare Funktionen
Wir wollen die Additionstheoreme noch einmal in einem anderen Licht betrachten.
Drehungen am Kreis in kartesischen Koordinaten
Seien P1 = (x1 , y1 ) = (cos α, sin α) und P2 = (x2 , y2 ) = (cos β, sin β) Punkte auf
dem Einheitskreis mit den Winkeln α bzw. β. Drehen wir P1 um den
Winkel β oder gleichwertig P2 um den Winkel α, so erhalten wir nach den
Additionstheoremen den Punkt
Q = (cos α cos β − sin α sin β, cos α sin β + sin α cos β)
= (x1 x2 − y1 y2 , x1 y2 + y1 x2 ).
(Drehformel)
Es ist bemerkenswert, dass sich die Koordinaten von Q in dieser relativ
einfachen Form aus den Koordinaten von P1 und P2 berechnen lassen.
Q
P2
y2
P1
y1
K
x2
x1
Q ergibt sich aus den Koordinaten von P1 und P2 : Q = (x1 x2 − y1 y2 , x1 y2 + y1 x2 )
Beispiel
Sei λ = 1/£2, und sei P1 = λ (1, 1) der Punkt auf dem Einheitskreis mit dem
Winkel π/4. Drehen wir P1 um den Winkel π/4, so erhalten wir den
Einheitsvektor Q = e2 = (0, 1). Dieses anschaulich klare Ergebnis liefert
auch die Drehformel mit P2 = P1 , da
Q = (x1 x2 − y1 y2 , x1 y2 + y1 x2 ) = (λ2 − λ2 , λ2 + λ2 ) = (0, 1).
Ist allgemein P2 = (x, y) ein Punkt auf K, so ist
Q = (λx − λ y, λy + λx) = λ (x − y, x + y)
der um π/4 gedrehte Punkt auf K. Dieses Ergebnis erhalten wir auch aus
der folgenden allgemeinen Überlegung:
Einführung in die Mathematik 1
© Oliver Deiser
6. Die trigonometrischen Funktionen
105
Drehungen als Transformationen der Ebene
Sei α P R. Wir betrachten die Funktion rotα : R2 → R2 , die einen Vektor
v = (x, y) der Ebene um den Winkel α dreht. Ist v = (x, y) P R2 und
λ = £x2 + y2
die Länge von v, so gibt es ein β mit v = λ (cos β, sin β). Aus
rotα (x, y) = λ rotα (cos β, sin β)
und x = λ cos β, y = λ sin β erhalten wir
rotα (x, y) = λ (cos(α + β), sin(α + β))
= λ (cos α cos β − sin α sin β, cos α sin β + sin α cos β)
= (x cos α − y sin α, x sin α + y cos α).
Der Leser setze (x1 , y1 ) = (cos α, sin α) und vergleiche das Ergebnis mit
obiger Drehformel. Übersichtlicher wird die Formel für rotα (x, y), wenn
wir Vektoren der Ebene als Spalten notieren (die Koordinaten untereinander schreiben) und die Abbildung rotα durch eine (2 × 2)-Matrix darstellen:
rotα (x, y) =
cos α
− sin α
x
sin α
cos α
y
=
x cos α − y sin α
x sin α + y cos α
.
Einsetzen von e1 = (1, 0) und e2 = (0, 1) zeigt, dass die beiden Spaltenvektoren der Matrix die Bilder der Einheitsvektoren e1 und e2 unter der Drehung
um α sind. Die allgemeine Wirkung der Matrix auf einen Vektor (x, y) ist
durch „Zeile mal Spalte“ (im Sinne einer Linearkombination) definiert. Mit
diesen Regeln lässt sich die Darstellung leicht merken. An dieser Stelle ist
alles nur ein Spiel mit Notationen. Wir werden Matrizen später genauer
besprechen und auf Drehungen zurückkommen.
rot (v)
= 2 /7
v
= 9 /7
v
rot (v)
Zwei Rotationen eines Vektors
© Oliver Deiser
Einführung in die Mathematik 1
106
1. Abschnitt
Elementare Funktionen
Weitere trigonometrische Funktionen
Mit Hilfe der Kosinus- und Sinusfunktion lassen sich zahlreiche weitere Funktionen definieren. Vier davon sind:
Definition (Tangens, Kotangens, Sekans, Kosekans)
Wir definieren
tan =
cos
, sec =
sin
sin
, cot =
cos
1
, csc =
cos
1
.
sin
Die Funktionen heißen der Tangens, Kotangens, Sekans bzw. Kosekans.
Wie bei den rationalen Funktion sind die Funktionen genau an den Nullstellen der Nenner nicht definiert. Damit gilt
tan, sec : R − A → R mit A = { π/2 + k π | k P Z },
cot, csc : R − B → R mit B = { k π | k P Z }.
Aus den elementaren Formeln für den Kosinus und Sinus ergeben sich viele
Formeln für die anderen trigonometrischen Funktionen. Exemplarisch halten
wir fest:
tan(± π/4) = cot(± π/4) = ± 1,
tan(π/2 − α) = cot α, cot(π/2 − α) = tan α,
tan(α ± π) = tan α, cot(α ± π) = cot α.
Diese Formeln gelten unter der Voraussetzung der Definiertheit, d. h. für alle
Stellen α, an denen alle beteiligten Funktionen definiert sind.
Die Additionstheoreme für den Kosinus und Sinus liefern:
Satz (Additionstheoreme für Tangens, Kotangens)
Für alle α, β P R gilt unter der Voraussetzung der Definiertheit:
(a) tan(α + β) =
tan α + tan β
,
1 − tan α tan β
(b) cot(α + β) =
cot α cot β − 1
.
cot α + cot β
Die Beweise dieser Additionstheoreme seien dem Leser zur Übung überlassen.
Einführung in die Mathematik 1
© Oliver Deiser
6. Die trigonometrischen Funktionen
107
6
tan(x)
4
2
-2
-
2
-2
-4
-6
cot(x)
5
-2
-
2
-5
sec(x)
5
-3
-2
-
2
3
2
3
-5
csc(x)
5
-3
-2
-
-5
© Oliver Deiser
Einführung in die Mathematik 1
108
1. Abschnitt
Elementare Funktionen
Trigonometrische Größen in rechtwinkligen Dreiecken
Kosinus und Sinus spielen bei der Untersuchung rechtwinkliger Dreiecke eine
Schlüsselrolle. Ist ein rechtwinkliges Dreieck ABC mit Seitenlängen a, b, c und
Winkeln α, β, γ mit γ = π/2 gegeben, so können wir durch Verschieben, Drehen
und Spiegeln annehmen, dass A der Nullpunkt ist, C auf der positiven x-Achse
und B im ersten Quadranten liegt. Dann ist B = (b, a) ein Punkt auf dem Kreis Kc ,
dessen Radius der Hypotenuse c des Dreiecks ABC entspricht. Folglich ist
(b, a) = B = c (cos α, sin α), b = c cos α, a = c sin α.
Die anderen trigonometrischen Funktionen lassen sich ebenfalls mit Hilfe
rechtwinkliger Dreiecke veranschaulichen.
Auch die Additionstheoreme
cos(α + β) = cos α cos β − sin α sin β,
sin(α + β) = cos α sin β + sin α cos β
für alle α, β P R
können wir mit Hilfe rechtwinkliger Dreiecke beweisen:
Zweiter Beweis der Additionstheoreme
Seien α, β P R. Wir nehmen zunächst an, dass α, β > 0 und α + β < π/2.
Alles weitere wird sich hieraus ergeben. Unter diesen Voraussetzungen ist
α + β der Winkel eines rechtwinkligen Dreiecks. Ein solches Dreieck
konstruieren wir wie folgt, wobei wir mit / ABC den zur Ecke B gehörigen
Winkel eines Dreiecks mit den Ecken A, B, C bezeichnen:
Sei P = (cos α, sin α). Weiter sei Q = (x0 , 0) der Punkt auf der x-Achse mit
/0QP = β. Dann gilt /Q0P = α. Schließlich sei A der Punkt auf der
Geraden QP mit /0AP = π/2. Dann ist /0PA = α + β. Das Dreieck 0PA ist
also wie gewünscht.
K
A
P
+
Q
Zum trigonometrischen Beweis des Additionstheorems des Sinus
Einführung in die Mathematik 1
© Oliver Deiser
6. Die trigonometrischen Funktionen
109
Damit können wir nun rechnen:
sin(α + β) = 0A = x0 sin β
= (cos α + cot β sin β) sin β
= sin α cos β + cos α sin β.
Das Kosinus-Theorem wird analog bewiesen (oder mit Hilfe des Satzes von
Pythagoras aus dem Sinus-Theorem gefolgert).
Wir betrachten nun allgemeinere Winkel. Die Additionstheoreme sind
wegen sin 0 = cos(π/2) = 0 und sin (π/2) = cos 0 = 1 klar, wenn einer der
beiden Winkel 0 oder π/2 ist. Sind α, β P [ 0, π/2 ] mit α + β ≥ π/2, so seien
α* = π/2 − α, β* = π/2 − β. Dann gilt nach dem bereits Bewiesenen, dass
sin(α + β) = sin(π − (α + β))
= sin(α* + β*)
= sin α* cos β* + cos α* sin β*
= cos α sin β + sin α cos β
= sin α cos β + cos α sin β.
Analog argumentiert man für den Kosinus. Damit haben wir die Additionstheoreme für alle α, β P [ 0, π/2 ] gezeigt (dies entspricht Punkten P und Q
auf dem Einheitskreis im ersten Quadranten). Hieraus können wir die
Theoreme für beliebige Winkel α, β P R folgern, indem wir
α = α1 + k1 π/2, β = β1 + k2 π/2 mit k1 , k2 P Z und α1 , β1 P [ 0, π/2 ]
schreiben und die Verschiebungsformeln anwenden.
Identifikation der trigonometrischen Größen
Die sechs trigonometrischen Größen
cos α, sin α, tan α, cot α, sec α, csc α
tauchen in zahlreichen geometrischen Figuren auf. Wir betrachten zwei typische
Beispiele. Die Identifikation der Größen ergibt sich aus ihrer Definition durch
Anwendung des Strahlensatzes.
Im Folgenden bezeichnen wir die Länge der Strecke zwischen zwei Punkten A
und B der Ebene mit AB. Ist A = (x1 , y1 ) und B = (x2 , y2 ), so gilt also
AB = £(x1 − x2 )2 + (y1 − y2 )2 .
In unserer ersten Figur betrachten wir einen Punkt P auf dem Einheitskreis
mit Winkel α P ]0, π/2[ und den durch den Nullpunkt 0 und P definierten Halbstrahl der Ebene. Dieser Halbstrahl schneidet das kartesische Koordinatengitter
in zwei Punkten R und S. In der entstehenden Figur sind alle sechs Größen enthalten.
© Oliver Deiser
Einführung in die Mathematik 1
110
1. Abschnitt
Elementare Funktionen
U = (0, 1)
S
R
P
O
T = (1, 0)
Q
cos α = OQ, sin α = QP, tan α = TR, cot α = US, sec α = OR, csc α = OS
Mit Hilfe der Figur können wir viele Eigenschaften der Funktionen veranschaulichen. So strebt zum Beispiel tan α = TR gegen unendlich, wenn der
Winkel α gegen π/2 strebt. Weiter gilt R = S = (1, 1) und damit tan α = cot α,
falls α = π/4.
In der zweiten Figur betrachten wir die Tangente des Einheitskreises K bei P.
Sie definiert zwei Punkte auf den Achsen:
S
U
P
R
O
Q
T
cos α = OQ, sin α = QP, tan α = PR, cot α = PS, sec α = OR, csc α = OS
Einführung in die Mathematik 1
© Oliver Deiser
6. Die trigonometrischen Funktionen
111
Kombiniert erhalten wir folgende Figur, die die vier vielleicht weniger offensichtlichen Größen tan α, cot α, sec α und csc α in den Mittelpunkt rückt:
cot
K
csc
tan
sec
Die Figur lässt sich noch weiter analysieren. Der Schnittpunkt W der beiden
Tangensstrecken definiert beispielsweise die Winkelhalbierende von α.
© Oliver Deiser
Einführung in die Mathematik 1
112
1. Abschnitt
Elementare Funktionen
Übungen
Übung 1
Illustrieren und begründen Sie die elementaren Eigenschaften von Kosinus
und Sinus mit Hilfe von Diagrammen.
Übung 2
Erläutern und präzisieren Sie die folgende Aussage mit Hilfe der Definition
von Kosinus und Sinus am Einheitskreis:
„Kennt man den Kosinus oder den Sinus auf [ 0, π/4 ], so kennt man beide
Funktionen auf ganz R.“
Übung 3
Finden Sie Formeln für sin(3x) und cos(3x).
Übung 4
Zeigen Sie, dass für alle x, y P R unter der Voraussetzung der Definiertheit
gilt:
(a) tan(x + y) =
tan x + tan y
,
1 − tan x tan y
(b) cot(x + y) =
cot x cot y − 1
.
cot x + cot y
Übung 5
Zeigen Sie, dass für alle x P R unter der Voraussetzung der Definiertheit
die folgenden Halbierungsformeln gelten:
(a) cos2 (x/2) =
1 + cos x
,
2
(b) sin2 (x/2) =
1 − cos x
,
2
(c) tan(x/2) =
1 − cos x
sin x
=
sin x
.
1 + cos x
Welche Vorzeichen sind beim Wurzelziehen in (a) und (b) abhängig von x
zu wählen?
Einführung in die Mathematik 1
© Oliver Deiser
6. Die trigonometrischen Funktionen
113
Übung 6
Seien x, y P R. Wir setzen s = (x − y)/2 und t = (x + y)/2. Zeigen Sie:
(a) sin x + sin y = 2 sin t cos s,
(b) cos x + cos y = 2 cos s cos t,
(c) sin x − sin y = 2 sin s cos t,
(d) cos x − cos y = −2 sin s sin t.
Übung 7
Zeigen Sie:
(a) sin
(
π
4
) = cos(
π
4
)=
(b) sin
(
π
8
) = cos(
3π
8
)
(
π
8
) = sin(
3π
8
)=
(
π
8
) = cot(
3π
8
) = £2 − 1,
(
3π
8
π
8
) = £2 + 1,
cos
(c) tan
tan
) = cot(
1
, tan
(
π
4
£2
1
=
£2 − £2 ,
2
) = cot(
π
4
) = 1,
1
£2 + £2 ,
2
Übung 8
(a) Geben Sie Formeln für Drehungen um die Winkel π/4 und π/8 im
und gegen den Uhrzeigersinn an, die nur die Grundrechenarten und
die Wurzelfunktion verwenden.
(b) Geben Sie ausgehend von der Drehformel rotπ/2 (x, y) = (−y, x)
rekursiv Formeln für Drehungen um π/2n für alle n ≥ 1 an, die nur
die Grundrechenarten und die Wurzelfunktion verwenden.
Begründen Sie den Rekursionsschritt geometrisch und zeichnen Sie
ein Diagramm zur Illustration.
Übung 9
Erklären Sie geometrisch, warum der Betrag von cos α + sin α maximal den
Wert £2 ergibt.
Übung 10
Sei f : R → R. Zeigen Sie, dass die folgenden Aussagen äquivalent sind:
(a) Es gibt c, t0 P R mit f(t) = c cos(t + t0 ) für alle t P R.
(b) Es gibt a, b P R mit f(t) = a cos t + b sin t für alle t P R.
© Oliver Deiser
Einführung in die Mathematik 1
114
1. Abschnitt
Elementare Funktionen
Übung 11
Beweisen Sie das Additionstheorem für den Kosinus für α, β P ] 0, π/2 [ mit
α + β < π/2
(a) mit Hilfe des im zweiten Beweis der Additionstheoreme konstruierten Dreiecks,
(b) mit Hilfe des Additionstheorems für den Sinus und dem Satz des
Pythagoras.
Einführung in die Mathematik 1
© Oliver Deiser
7. Arkusfunktionen und Polarkoordinaten
Wir betrachten nun die Umkehrfunktionen der auf geeignete Intervalle eingeschränkten trigonometrischen Funktionen. Die so erhaltenen Arkusfunktionen
eignen sich zur Messung von Bogenlängen und damit von Winkeln im Bogenmaß. Eine wichtige Rolle kommt dabei dem Arkustangens zu. Mit seiner Hilfe
führen wir Polarkoordinaten ein, bei denen die Ebene nicht durch ein achsenparalleles Gitter überzogen wird, sondern durch von Nullpunkt ausgehende Halbstrahlen und zentrische Kreise.
© Oliver Deiser
Einführung in die Mathematik 1
116
1. Abschnitt
Elementare Funktionen
Die Arkusfunktionen
Um die trigonometrischen Funktionen umkehren zu können, schränken wir
sie auf möglichst große Intervalle ein, auf denen die Funktionen keine Werte
mehrfach annehmen (der Leser vergleiche die Definition der Quadratwurzelfunktion). Bei der Einschränkung bevorzugen wir Intervalle, die die Null als
Mitte oder linke Grenze besitzen.
Definition (Einschränkungen der trigonometrischen Funktionen)
Wir definieren
sin0 = sin | [− π/2, π/2] ,
cos0 = cos | [ 0, π ],
tan0 = tan | ]− π/2, π/2 [,
cot0 = cot | ] 0, π [,
sec0 = sec|([0, π] − { π/2 }), csc0 = csc|([ − π/2, π/2 ] − { 0 }).
Graphisch entsteht sin0 aus sin, indem wir den Sinus außerhalb des Intervalls
[ −π/2, π/2 ] abdecken oder wegradieren. Analoges gilt für die anderen Funktionen.
Damit können wir definieren:
Definition (Arkusfunktionen)
Die Arkusfunktionen
arccos, arcsin, arctan, arccot, arcsec, arccsc
sind definiert als die Umkehrfunktionen von
cos0 , sin0 , tan0 , cot0 , sec0 , csc0 .
Einen Überblick über Definitions- und Wertebereich der Arkusfunktion gibt
die folgende Tabelle:
Funktion
Definitionsbereich
Wertebereich
arcsin
[ −1, 1 ]
[ − π/2, π/2 ]
arccos
[ −1, 1 ]
[ 0, π ]
arctan
R
] − π/2, π/2 [
arccot
R
] 0, π [
arcsec
R − ] −1, 1 [
[ 0, π ] − { π/2 }
arccsc
R − ] −1, 1 [
[ − π/2, π/2 ] − { 0 }
Einführung in die Mathematik 1
© Oliver Deiser
7. Arkusfunktionen und Polarkoordinaten
117
2
arcsin(x)
4
-1.0
-0.5
0.5
1.0
4
2
3
4
2
arccos(x)
4
-1.0
-0.5
0.5
1.0
2
4
-6
-4
-2
2
4
6
4
arctan(x)
2
© Oliver Deiser
Einführung in die Mathematik 1
118
1. Abschnitt
Elementare Funktionen
arccot(x)
3
4
2
4
-6
-4
-2
2
4
6
3
4
arcsec(x)
2
4
-10
-5
5
10
5
10
2
4
-10
-5
arccsc(x)
4
2
Einführung in die Mathematik 1
© Oliver Deiser
7. Arkusfunktionen und Polarkoordinaten
119
Die Namensgebung geht auf „arcus“ = „Bogen“ und die mathematische Lesart
als „Kreisbogen“ zurück. So wie Kosinus und Sinus eine Bogenlänge ϕ in Koordinaten umrechnen, so rechnet der Arkuskosinus eine x-Koordinate und der Arkussinus eine y-Koordinate in eine Bogenlänge um. Dabei wird die Bogenlänge
immer in einem bestimmten Winkelintervall angegeben und im Allgemeinen
folgt aus x = cos ϕ nicht, dass arccos x = ϕ. Richtig ist dies, wenn ϕ P [ 0, π ]. Analog zur Formel £x2 = |x| vom nichtvergessenen Betrag gibt es Formeln vom
„nichtvergessenen Winkelintervall“. Nach Definition gilt zum Beispiel für den
Arkussinus
sin arcsin x = x
für alle x P [ −1, 1 ],
arcsin sin α = α
für alle α P [ −π/2, π/2 ],
arcsin sin α = π − α
für alle α P [ π/2, 3π/2 ],
arcsin sin α = α − 2π
für alle α P [ 3π/2, 5π/2 ],
arcsin sin(α + 2π) = arcsin sin α
für alle α P R.
Graphisch dargestellt ergeben sich periodische Sägezahnfunktionen:
arcsin(sin x)
arccos(cos x)
-3
-2
-
2
3
2
4
arctan(tan x)
-2
-
2
4
2
© Oliver Deiser
Einführung in die Mathematik 1
120
1. Abschnitt
Elementare Funktionen
3
4
arccot(cot x)
2
4
-2
-
2
In vielen Anwendungen − zum Beispiel in der Integrationstheorie − sind Verknüpfungen des Typs „trigo auf arkus“ bedeutsam. Einige Formeln sind:
Satz (Kombinationsformeln)
Für alle x P R gilt unter der Voraussetzung der Definiertheit:
(a) sin arccos x = cos arcsin x = £1 − x2 ,
(b) tan arccot x = cot arctan x =
1
.
x
Beweis
zu (a): Für alle y P [ 0, π ] ist sin y ≥ 0 und
sin y = £1 − cos2 y .
Ist nun x P [ −1, 1 ] beliebig und y = arccos x, so ist y P [ 0, π ], sodass sich
wegen
cos y = cos arccos x = x
die Sinus-Formel ergibt. Die Kosinus-Formel wird analog bewiesen.
zu (b): Für alle y P R gilt unter der Voraussetzung der Definiertheit
tan y =
1
.
cot y
Für y = arccot x ergibt sich wegen cot arccot x = x die Tangens-Formel.
Die Formel für den Kotangens wird analog bewiesen.
Zur Visualisierung der Kombinationsformeln betrachten wir für ein gegebenes x > 0 rechtwinklige Dreiecke mit den Seitenlängen 1 und x. Davon gibt es
sechs Typen, deren dritte Seite w gleich £1 − x2 , £1 + x2 oder £x2 − 1 ist:
Einführung in die Mathematik 1
© Oliver Deiser
7. Arkusfunktionen und Polarkoordinaten
Arccos
121
Arcsin
1
1
w
x
x
w
Arctan
Arccot
w
w
x
1
1
x
Arcsec
Arccsc
x
x
w
1
1
w
Aus den Figuren lassen sich die Kombinationsformeln der folgenden Tabelle ablesen:
Bild
α
cos α
sin α
1
arccos x
x
w = £1 - x2
2
arcsin x
w = £ 1 − x2
x
3
arctan x
1/w = 1/ £1 + x2
x/w = x/ £1 + x2
4
arccot x
x/w = x/ £1 + x2
1/w = 1/ £1 + x2
5
arcsec x
1/x
w/x = £x2 − 1 /x
6
arccsc x
w/x = £x2 − 1 /x
1/x
© Oliver Deiser
Einführung in die Mathematik 1
122
1. Abschnitt
Elementare Funktionen
Für die umgekehrte Kombinationen „arkus auf trigo“ gibt es keine einfachen
Formeln. Neben Sägezahntypen wie oben entstehen Funktionen mit einem wellenartigen Verlauf:
4
arctan(cos x)
-2
-
2
/4 cos x
4
Winkelberechnungen bei Geraden
Der Arkustangens spielt eine prominente Rolle bei der Berechnung von Winkeln. Ist g = ax + b eine Gerade mit der Steigung a ≠ 0, so ist arctan(a) der im Intervall ] −π/2, π/2 [ gemessene Winkel, den die Gerade mit der x-Achse oder allgemeiner jeder konstanten Funktion einschließt. (Im Fall a = 0 gilt arctan(a) = 0, in
Übereinstimmung mit der Parallelität der Geraden zur x-Achse.)
Sind zwei Geraden g = ax + b und h = c x + d mit Steigungen a ≠ c gegeben, so
berechnet sich der Winkel α im Intervall [ 0, π/2 ], in dem sich die Geraden
schneiden, durch
α =
{
|arctan a − arctan c|
π − |arctan a − arctan c|
dieser Wert in [ 0, π/2 ] liegt,
falls
sonst.
Gilt ac = −1, so stehen die Vektoren (1, a) und (1, c) senkrecht aufeinander, sodass
α = π/2. Sei also a c ≠ −1. Dann erhalten wir in beiden Fällen der Fallunterscheidung für α, dass
tan α = |tan(arctan a + arctan(−c))| =
a−c
| 1 + ac |.
Dabei haben wir das Additionstheorem des Tangens verwendet sowie die Formeln
tan|β| = |tan β| für alle β P ]−π/2, π/2 [,
tan(π − β) = |tan β| für alle β P ] π/2, π [,
− arctan x = arctan(−x) für alle x P R.
Einführung in die Mathematik 1
© Oliver Deiser
7. Arkusfunktionen und Polarkoordinaten
a
1
123
Der Schnittwinkel
zweier Geraden
(einer von mehreren
Fällen)
c
Polarkoordinaten
Jeder vom Ursprung verschiedene Punkt der Ebene schließt einen eindeutigen gegen den Uhrzeigersinn gemessenen Winkel im Intervall [ 0, 2π [ mit der
x-Achse ein:
Definition (Argument)
Wir definieren arg : R2 − { 0 } → [ 0, 2π [ durch:
arg(x, y) = „das eindeutige α P [ 0, 2 π [ mit (x, y) = £x2 + y2 (cos α, sin α)“.
Für alle (x, y) P R2 − { 0 } heißt arg(x, y) das Argument von (x, y) (bzgl. des
Winkelintervalls [ 0, 2π [).
Wir können die Argumentbildung so beschreiben: Wir projizieren den Punkt
P = (x, y) auf den Einheitskreis K, d.h., wir suchen den eindeutigen Schnittpunkt
P* der Halbgeraden von O durch P mit K (hier verwenden wir P ≠ O). Ist
r = £x2 + y2 > 0
der Abstand OP von P zum Ursprung, so ist P* = 1/r (x, y). Das Argument von P
ist die gegen den Uhrzeigersinn gemessene Bogenlänge des Kreisbogens von K,
der von (1, 0) zu P* führt. Alle Punkte, die auf der Halbgeraden von O durch P
liegen, haben das gleiche Argument.
Andere Winkelintervalle
Die Definition des Arguments hängt vom gewählten Winkelintervall ab.
Genauer schreiben wir arg[ 0, 2π [ . Oft ist es nützlich, statt [ 0, 2π [ das
Intervall ] −π, π ] zu betrachten, sodass das Argument stets diesem Intervall
angehört. Prinzipiell ist jedes halboffene Intervall der Länge 2π geeignet.
Mit Hilfe des Arguments können wir ein Koordinatensystem einführen, das
Punkte durch ihren Abstand vom Ursprung und ihr Argument beschreibt:
© Oliver Deiser
Einführung in die Mathematik 1
124
1. Abschnitt
Elementare Funktionen
Definition (Polarkoordinaten)
Für alle (x, y) P R2 − { 0 } heißt (r, α) P R2 mit
r = £x2 + y2 , α = arg(x, y)
der Polarkoordinatenvektor von (x, y) (bzgl. des Winkelintervalls [ 0, 2π [ ).
Die Koordinate r heißt der Radius und die Koordinate α der Polarwinkel
von (x, y). Wir sagen auch, dass r, α Polarkoordinaten von (x, y) sind.
Q = (-6, 5)
5
Kartesisches
Koordinatengitter
P = (4, 3)
-5
5
-5
7
12
2
5
2
12
3
3
3
4
4
5
Polares
Koordinatengitter
6
6
11
P = (4, /6)
12
12
0
1
2
3
4
5
6
7
8
13
23
12
12
Q = (5, 5 /6)
7
11
6
6
5
7
4
4
4
3
5
17
12
Einführung in die Mathematik 1
3
2
19
3
12
© Oliver Deiser
7. Arkusfunktionen und Polarkoordinaten
125
Um die Sprechweise zu erleichtern, nennen wir auch (r, α) Polarkoordinaten
von (x, y), obwohl das geordnete Paar (r, α) eigentlich keinen Plural rechtfertigt.
Unter unserer Winkel-Identifizierung ist der Winkelanteil von Polarkoordinaten nur bis auf ganzzahlige Vielfache von 2π bestimmt, d. h. sind (r, α) Polarkoordinaten von (x, y), so auch (r, α + k2π) für alle k P Z. Wer den Nullpunkt
zulassen möchte, kann arg(0, 0) = 0 definieren. Dann sind (0, α) für alle α P R
Polarkoordinaten des Nullpunkts.
Das Argument eines Punktes lässt sich mit Hilfe des Arkustangens berechnen.
Dabei müssen wir außerhalb des ersten Quadranten geeignete Vielfache von π/2
addieren. Denn die Werte des Arkustangens liegen stets in ] −π/2, π/2 [, während
das Argument in [ 0, 2π [ liegt. Es ergibt sich folgende Fallunterscheidung:
arg(x, y) =
{
arctan(y/x),
falls
x > 0 und y ≥ 0
arctan(y/x) + 2π,
arctan(y/x) + π,
π/2,
falls
falls
falls
x > 0 und y < 0
x<0
x = 0 und y > 0
3 π/2,
falls
x = 0 und y < 0
Eine Möglichkeit, die Korrekturwinkel zu ermitteln, verwendet Drehungen
und Spiegelungen:
P2
x
P1
y
P3
P4
α = arctan(y/x), β = arctan(x/y) = π/2 − α
arg(P1 ) = α mit P1 = (x, y)
arg(P2 ) = π − β = π − arctan(x/y) = π + arctan(x/(−y)) mit P2 = (−y, x)
Der Leser ist aufgefordert, sich die Korrekturwinkel auf seine Weise mit Hilfe
eines Diagramms klar zu machen.
© Oliver Deiser
Einführung in die Mathematik 1
126
1. Abschnitt
Elementare Funktionen
Bemerkung
(1) Wird für das Argument statt [ 0, 2π [ das Winkelintervall ] −π, π ] oder
ein anderes Intervall gewählt, ist die Fallunterscheidung entsprechend
anzupassen. Für ] −π, π ] ergibt sich
arg(x, y) =
{
arctan(y/x),
arctan(y/x) + sgn(y) π,
arctan(y/x) + sgn(y) π,
falls
falls
falls
x>0
x < 0, y ≠ 0
x < 0, y = 0
sgn(y) π/2,
falls
x=0
Im ersten und vierten Quadranten (ohne der y-Achse) ist hier also kein
Korrekturwinkel nötig. Der zweite und dritte Fall lässt sich zusammenfassen, wenn statt der Vorzeichenfunktion sgn die Variante sgn2
mit sgn2 (0) = 1 verwendet wird.
(2) In vielen Programmiersprachen wird die Argument-Funktion auch mit
arctan2 bezeichnet und als eine zweistellige Version des Arkustangens
aufgefasst. Es gilt dann je nach Definition arg(x, y) = arctan2 (x, y) oder
arg(x, y) = arctan2 (y, x).
Die Rückrechnung von Polarkoordinaten (r, α) in kartesische Koordinaten ist
gegeben durch
x = r cos α,
y = r sin α.
Dabei spielt es aufgrund der Periodizität des Kosinus und Sinus keine Rolle, in
welchem Winkelintervall das Argument α gewählt wurde.
Die Koordinatenabbildungen
Der Wechsel zwischen kartesischen und polaren Koordinaten lässt sich mit
Hilfe von Abbildungen der Ebene präzisieren. Wir wählen wieder [ 0, 2π [ als
Winkelintervall und setzen
P = ] 0, ∞ [ × [ 0, 2π [ , R = R2 − { 0 }.
Die Menge P ist ein waagrechter Halbstreifen der Ebene, die Menge R die gesamte Ebene ohne den Nullpunkt. Im Streifen P leben Polarkoordinatenvektoren mit Winkeln in [ 0, 2π [, wenn wir diese Vektoren wie üblich kartesisch als
Punkte der Ebene lesen. Wir können einen Punkt (r, α) von P als Kode des Punktes (x, y) von R auffassen, der die Polarkoordinaten (r, α) besitzt. Die Kodierung
und Dekodierung wird durch die Abbildungen Ψ : R → P und Φ : P → R mit
(
Ψ(x, y) = £x2 + y2 , arg(x, y)
Φ(r, α) = r (cos α, sin α)
Einführung in die Mathematik 1
)
für alle (x, y) P R
für alle (r, α) P P
© Oliver Deiser
7. Arkusfunktionen und Polarkoordinaten
127
beschrieben. Die Abbildungen Φ und Ψ sind bijektiv und invers zueinander, d.h.
Φ + Ψ ist die Identität auf P und Ψ + Φ die Identität auf R:
Φ(Ψ(x, y)) = (x, y) für alle (x, y) P R,
Ψ(Φ(r, α)) = (r, α) für alle (r, α) P P.
Bemerkung
Dem Nullpunkt werden bei dieser Konstruktion keine Polarkoordinaten
zugeordnet. Will man ihn zulassen, so kann man P und R um den Nullpunkt erweitern und Ψ(0, 0) = Φ(0, 0) = (0, 0) definieren.
Beim Rechnen mit Polarkoordinaten treten die Abbildungen Φ und Ψ oft in
den Hintergrund. Ein Paar (r, α) wird als Punkt der Ebene empfunden und nicht
als Element des Streifens P. Einander zugeordnete Paare (r, α) und (x, y) gelten
als verschiedene Namen desselben Punktes. Mathematisch ist dieser Punkt identisch mit (x, y), d. h. der kartesische Name ist das Objekt. Das kartesische System
ist durch die Definition R2 = R × R der Ebene ausgezeichnet.
© Oliver Deiser
Einführung in die Mathematik 1
128
1. Abschnitt
Elementare Funktionen
Übungen
Übung 1
Zeigen Sie, dass für alle x im Definitionsbereich der Funktionen gilt:
(a) arcsin(−x) = −arcsin(x),
(b) arccos(−x) = π − arccos(x),
(c) arccos(x) + arcsin(x) = π/2.
Illustrieren Sie die Formeln durch Diagramme am Einheitskreis.
Übung 2
Zeigen Sie, dass für alle x P R* gilt:
arctan(x) = sgn(x) π/2 − arctan(1/x).
Illustrieren Sie die Formel
(a) am Einheitskreis,
(b) mit Hilfe von Geraden einer von Null verschiedenen Steigung und
ihrer Umkehrfunktion.
Übung 3
Zeigen Sie, dass für alle x P R gilt:
(a) arctan(x) + arccot(x) = π/2,
(b)
arccot x =
{
arctan(1/x)
arctan(1/x) + π
falls
falls
x>0
x < 0,
arctan x =
{
arccot(1/x)
arccot(1/x) − π
falls
falls
x>0
x < 0.
(c)
Übung 4
Illustrieren Sie die Formeln
(a) sin arccos x = cos arcsin x = £1 − x2 ,
(b) tan arccot x = cot arctan x =
1
x
geometrisch mit Hilfe des Einheitskreises.
Einführung in die Mathematik 1
© Oliver Deiser
7. Arkusfunktionen und Polarkoordinaten
129
Übung 5
Zeigen Sie algebraisch, dass für alle x P R unter der Voraussetzung der
Definiertheit gilt:
(a) sin arccot x = cos arctan x =
(b) sin arctan x = cos arccot x =
(c) tan arcsin x = cot arccos x =
(d) tan arccos x = cot arcsin x =
1
£1 + x2
x
£1 + x2
x
£1 − x2
£1 − x2
x
.
.
.
.
Übung 6
Berechnen Sie Polarkoordinaten der acht Punkte (a, b) mit a, b P { −1, 0, 1
}, (a, b) ≠ (0, 0).
Übung 7
Zeichnen Sie ein Diagramm, das die quadrantenabhängige Berechnung des
Arguments arg(x, y) eines Punktes (x, y) mit Hilfe des Arkustangens
illustriert. Legen Sie dabei sowohl das Winkelintervall [ 0, 2π [ als auch das
Winkelintervall ] −π, π ] zugrunde.
Übung 8
In einem Buch finden Sie folgenden Graphen des Arkuskotangens:
2
4
-10
-5
5
10
4
2
Wie erklären Sie diesen Graphen?
© Oliver Deiser
Einführung in die Mathematik 1
8. Die hyperbolischen Funktionen
Mit Hilfe der Exponentialfunktion führen wir die sogenannten hyperbolischen
Funktionen ein, die viele Analogien zu den trigonometrischen Funktionen aufweisen. Diese Funktion sind für sich von Interesse und werden sich später in der
Integrationstheorie als nützlich erweisen.
© Oliver Deiser
Einführung in die Mathematik 1
132
1. Abschnitt
Elementare Funktionen
Paritäts-Zerlegung einer Funktion
Wir beginnen mit einer allgemeinen Konstruktion. Zur Erinnerung:
Definition (gerade und ungerade Funktion)
Sei P ⊆ R derart, dass für alle Elemente x von P auch −x ein Element von P
ist. Weiter sei f : P → R. Dann heißt f gerade, falls f(−x) = f(x) für alle x P P.
Analog heißt f ungerade, falls f(−x) = −f(x) für alle x P P.
Diese Eigenschaften werden oft auch als Parität einer Funktion bezeichnet, in
Analogie zur Parität gerade/ungerade bei den ganzen Zahlen. Beispielsweise ist
der Kosinus gerade und der Sinus ungerade.
Ist f : P → R eine beliebige Funktion mit einem zum Nullpunkt symmetrischen Definitionsbereich P, so können wir f+ , f− : P → R definieren durch
f+ (x) =
f(x) + f(−x)
, f− (x) =
2
f(x) − f(−x)
2
für alle x P P.
Dann ist f+ gerade und f− ungerade. Aufgrund des Faktors 1/2 gilt zudem
f(x) = f+ (x) + f− (x) für alle x P P.
Durch diese Konstruktion können wir jede Funktion als Summe einer geraden
und ungeraden Funktion darstellen. Im Englischen spricht man von einer even
and odd decomposition, in Deutschen von einer Paritäts-Zerlegung:
Definition (Paritäts-Zerlegung)
Die Darstellung f = f+ + f− heißt die Paritäts-Zerlegung von f. Weiter heißt
die Funktion f+ der gerade und die Funktion f− der ungerade Anteil von f.
f(x)
f+ (x)
f- (x)
Die Paritätszerlegung einer Funktion
Einführung in die Mathematik 1
© Oliver Deiser
8. Die hyperbolischen Funktionen
133
Kosinus und Sinus Hyperbolicus
Ein natürlicher Kandidat für eine Paritäts-Zerlegung ist die Exponentialfunktion, die ja weder gerade noch ungerade ist. Sie besitzt in der Tat eine bemerkenswerte Zerlegung, deren Teile einen eigenen Namen verdienen:
Definition (Kosinus und Sinus Hyperbolicus)
Wir definieren den Kosinus Hyperbolicus cosh : R → R und den Sinus
Hyperbolicus sinh : R → R durch
ex + e−x
, sinh x =
2
cosh x =
ex − e−x
2
für alle x P R.
Nach Konstruktion sind der Kosinus Hyperbolicus gerade und der Sinus
Hyperbolicus ungerade. Weiter bilden die beiden Funktionen die Paritäts-Zerlegung der Exponentialfunktion:
exp = cosh + sinh.
5
exp(x)
-3
-2
-1
1
2
3
cosh(x)
sinh(x)
-5
Die Paritätszerlegung der Exponentialfunktion
Die Namensgebung „hyperbolisch“ ist motiviert durch folgende Überlegung.
Wir betrachten die Einheitshyperbel
H1 = { (x, y) P R2 | x2 − y2 = 1 }.
Der rechte Ast von H1 verläuft durch den Punkt (1, 0), liegt symmetrisch zur
x-Achse und schmiegt sich asymptotisch an die Winkelhalbierenden des ersten
und vierten Quadranten an.
Setzen wir nun P(t) = (cosh t, sinh t) für alle t P R, so beschreibt P eine Bewegung auf einer dem rechten Ast von H1 , da cosh(t) > 0 für alle t und
(+) cosh2 x − sinh2 x = 1 für alle x P R.
© Oliver Deiser
Einführung in die Mathematik 1
134
1. Abschnitt
Elementare Funktionen
Der Punkt P liegt für t < 0 im vierten Quadranten, erreicht zur Zeit t = 0 den
Punkt (1, 0) und liegt für t > 0 im ersten Quadranten. Für alle t ist P(t) der an der
x-Achse gespiegelte Punkt P(−t).
Der Leser vergleiche dies mit der Kreisbewegung (cos t, sin t) auf dem Einheitskreis K1 = { (x, y) P R2 | x2 + y2 = 1 }. Dem Satz des Pythagoras
cos2 x + sin2 x = 1 für alle x P R
entspricht für die hyperbolischen Funktionen die Formel (+).
4
H1
2
Die Einheitshyperbel H1
-4
-2
2
4
-2
-4
Der Kosinus Hyperbolicus ist überraschenderweise auch im Alltag häufig zu
finden: Eine zwischen zwei Punkten aufgehängte Kette wird durch diese Funktion beschrieben (und nicht etwa wie eine Wurfbahn durch eine Parabel). Man
nennt die Form deswegen auch eine Kettenlinie.
Aus der Potenzreihendarstellung exp x = ∑ n xn /n! erhalten wir
(∑ n
xn
n!
+ ∑n
= ∑ n gerade
x2
n!
= ∑n
cosh x =
1
2
(−x)n
n!
)
x2n
(2n)!
=
1
xn + (−x)n
∑n
2
n!
für alle x P R.
Analog ist
sinh x = ∑ n
x2n + 1
(2n + 1)!
für alle x P R.
Aus exp′ = exp und den Definitionen von cosh und sinh ergibt sich
cosh′ = sinh, sinh′ = cosh, cosh″ = cosh, sinh″ = sinh.
Der Leser überzeuge sich davon, dass diese Ableitungen durch gliedweises Differenzieren der Potenzreihendarstellung von cosh und sinh reproduziert werden.
Einführung in die Mathematik 1
© Oliver Deiser
8. Die hyperbolischen Funktionen
135
Weitere hyperbolische Funktionen
Aus den hyperbolischen Grundfunktionen cosh und sinh lassen sich wie bei
den trigonometrischen Funktion definieren:
Definition (weitere hyperbolische Funktionen)
Wir definieren den Tangens Hyperbolicus, Kotangens Hyperbolicus, Sekans
Hyperbolicus und Kosekans Hyperbolicus durch
sinh
, coth =
cosh
tanh =
cosh
, sech =
sinh
1
, csch =
cosh
1
.
sinh
Da der Nullpunkt die einzige Nullstelle des Sinus Hyperbolicus ist und der
Kosinus Hyperbolicus nur positive Werte annimmt, gilt
tanh : R → R, coth : R* → R, sech : R → R, csch : R* → R.
4
2
tanh(x)
-3
-2
-1
1
2
3
coth(x)
-2
-4
3
2
1
sech(x)
-4
-2
2
4
csch(x)
-1
-2
-3
© Oliver Deiser
Einführung in die Mathematik 1
136
1. Abschnitt
Elementare Funktionen
Die Areafunktionen
In weiterer Analogie zu den trigonometrischen Funktionen können wir die
Umkehrfunktion der hyperbolischen Funktionen erklären:
Definition (Areafunktionen)
Die Area-Funktionen arcosh, arsinh, artanh, arcoth, arsech, arcsch sind
definiert als die Umkehrfunktionen von cosh0 , sinh, tanh, coth, sech0 , csch,
wobei cosh0 und sech0 die Einschränkung von cosh und sech auf [ 0, ∞ [ ist.
Es gilt
arcosh : [1, ∞[ → R,
arsinh : R → R,
artanh : ]−1, 1[ → R,
arcoth : ] −∞, 1 [ ∪ ] 1, ∞ [ → R,
arsech : ]0, 1] → R,
arcsch : R* → R.
3
2
1
arcosh(x)
-5
5
arsinh(x)
-1
-2
-3
2
1
artanh(x)
-4
-2
2
4
arcoth(x)
-1
-2
Einführung in die Mathematik 1
© Oliver Deiser
8. Die hyperbolischen Funktionen
137
4
2
arsech(x)
-3
-2
-1
1
2
3
arcsch(x)
-2
-4
Da die Hyperbelfunktionen über die Exponentialfunktion definiert sind, ist
ein Zusammenhang der Areafunktionen mit der Logarithmusfunktion zu vermuten. Die genauen Beziehungen sind:
Satz (Logarithmus-Darstellung der Areafunktionen)
Es gilt:
arcosh x = log ( x + £x2 − 1 )
für alle x ≥ 1,
arsinh x = log ( x + £x2 + 1 )
für alle x P R,
artanh x =
1
log
2
(
1 + x
1 − x
)
für alle x mit |x| < 1,
arcoth x =
1
log
2
(
x + 1
x − 1
)
für alle x mit |x| > 1,
arsech x = log (
1 + £1 − x2
x
)
für alle 0 < x ≤ 1,
arcsch x = log (
1 + £1 + x2
x
)
für alle x ≠ 0.
Beweis
Wir zeigen die Darstellung des Area Kosinus Hyperbolicus. Die anderen
Formeln werden ähnlich beweisen.
Sei x ≥ 1, und sei y ≥ 0 derart, dass x = cosh y. Mit z = ey gilt
2x = 2 cosh y = ey + e−y = ey +
© Oliver Deiser
1
ey
= z +
1
.
z
Einführung in die Mathematik 1
138
1. Abschnitt
Elementare Funktionen
Multiplikation mit z liefert die quadratische Gleichung z2 − 2xz + 1 = 0 in
z mit den Lösungen
z1,2 = x ± £x2 − 1.
Wegen z = ey ≥ 1 scheidet das negative Vorzeichen aus, sodass
ey = z = x + £x2 − 1.
Damit ist arcosh x = arcosh(cosh y) = log( x + £x2 − 1 ).
Die Namensgebung „area“ für „Fläche“ ist wie folgt motiviert: Ist a P [ 0, 1 [
und sind P = (xa , ya ) und Q = (xa , − ya ) die Schnittpunkte des rechten Astes der
Einheitshyperbel mit den Geraden durch den Nullpunkt der Steigung a bzw. -a,
so wird durch die Punkte O, P, Q eine Fläche mit dem Inhalt A definiert. Man
kann zeigen, dass xa = cosh A, ya = sinh A, sodass
A = arcosh xa = arsinh ya .
In diesem Sinne messen die Areafunktionen Flächen an der Einheitshyperbel so,
wie die Arkusfunktionen Bogenlängen am Einheitskreis messen. Da eine Bogenlänge gleich der doppelten Fläche des zugehörigen Kreissektors ist, lassen sich
auch die Arkusfunktionen als Flächeninhalte interpretieren.
2
P = (cosh A, sinh A)
1.0
P = (cos , sin )
= (cos A, sin A)
1
0.5
A
A
0.5
1.0
1.5
2.0
2.5
-0.5
0.5
1.0
1.5
-0.5
-1
Q = (cos A, -sin A)
-1.0
Q = (cosh A, sinh A)
-2
Die Flächenmessung der Areafunktionen im Vergleich mit den Arkusfunktionen
Einführung in die Mathematik 1
© Oliver Deiser
8. Die hyperbolischen Funktionen
139
Übungen
Übung 1
Bestimmen und skizzieren Sie die Paritäts-Zerlegung für die Funktion
f : R → R mit f(x) = (x − 1)2 + 1 für alle x P R.
Übung 2
Formulieren und beweisen Sie einen allgemeinen Satz über die Paritätszerlegung eines Polynoms f : R → R.
Übung 3
Zeigen Sie, dass für alle x, y P R gilt:
(a) cosh(x + y) = cosh x cosh y + sinh x sinh y,
(b) sinh(x + y) = cosh x sinh y + sinh x cosh y.
Übung 4
Sei H = { (x, y) P R2 | x2 − y2 = 1, x ≥ 1 } der rechte Ast der Einheitshyperbel.
Zeigen Sie:
Für alle P = (x, y) P H gibt es genau ein t P R mit P = (cosh t, sinh t).
Wie lässt sich eine Bewegung auf dem linken Ast definieren?
Übung 5
Zeigen Sie, dass
H = { (x, y) P R2 | x2 − y2 = 1, x ≥ 1 } (rechter Ast der Einheitshyperbel)
und der Graph der Funktion f : R+ → R mit
f(x) = 1/(2x) für alle x > 0
durch eine Drehung um π/4 gegen bzw. im Uhrzeigersinn auseinander
hervorgehen. Erstellen Sie zudem ein Diagramm zur Illustration.
Übung 6
Sei a > 0. Untersuchen Sie eine zu Einführung der hyperbolischen
Funktionen analoge Definition von Funktionen, die auf der allgemeinen
Exponentialfunktion expa zur Basis a anstelle von exp = expe beruht. Welche
Unterschiede und Zusammenhänge können Sie feststellen?
Übung 7
Wie lässt sich die Bewegung P(t) = (cosh t, sinh t) , t P R, auf dem rechten
Ast von H1 mit Hilfe der Flächenmessung der Areafunktionen genauer
beschreiben?
© Oliver Deiser
Einführung in die Mathematik 1
140
1. Abschnitt
Elementare Funktionen
Übung 8
Zeigen Sie:
arsinh x = log ( x + £x2 + 1 )
für alle x P R,
artanh x =
1
log
2
(
1 + x
1 − x
)
für alle x mit |x| < 1,
arcoth x =
1
log
2
(
x + 1
x − 1
)
für alle x mit |x| > 1,
arsech x = log (
1 + £1 − x2
x
)
für alle 0 < x ≤ 1,
arcsch x = log (
1 + £1 + x2
x
)
für alle x ≠ 0.
Einführung in die Mathematik 1
© Oliver Deiser
2. Abschnitt
Der analytische Kalkül
© Oliver Deiser
Einführung in die Mathematik 1
1. Differentialquotienten und
lineare Approximation
Wir diskutieren die grundlegenden Begriffe im Umfeld der Ableitung einer reellen Funktion. Besonderes Gewicht liegt dabei auf der Idee der lokalen linearen
Approximation einer Funktion durch eine Gerade.
© Oliver Deiser
Einführung in die Mathematik 1
144
2. Abschnitt
Der analytische Kalkül
Differenzierbarkeit an einer Stelle
Geraden eignen sich zur lokalen Approximation von „guten“ Funktionen: Ist
f : R → R eine Funktion und p P R ein Punkt von Interesse, so können wir versuchen, eine Gerade durch (p, f(p)) P R2 zu legen, die sich lokal, d. h. in der Nähe
des betrachteten Punktes, möglichst gut an den Graphen von f anschmiegt. Das
ist nicht immer möglich, man denke an Sprünge oder Knicke.
Im Folgenden betrachten wir Funktionen der Form f : P → R, deren Definitionsbereich P entweder R, ein Intervall mit Grenzen a < b oder allgemeiner eine
Vereinigung von Intervallen ist, die mehr als einen Punkten enthalten.
Definition (Differenzenquotient, Sekante)
Sei f : P → R, und sei p P P. Für alle x P P mit x ≠ p heißt die reelle Zahl
a(p, x) =
f(x) − f(p)
x−p
der Differenzenquotient von f für p und x. Die eindeutige Gerade g : R → R
durch (p, f(p)) und (x, f(x)) heißt die durch die Stellen p und x definierte
Sekante von f.
Definition (Differentialquotient, Ableitung)
Sei f : P → R, und sei p P P. Im Fall der Existenz von
a = limx
→p
a(x, p) = limx
→p
f(x) − f(p)
x−p
heißt die Funktion f an der Stelle p differenzierbar und a die Ableitung oder
der Differentialquotient von f an der Stelle p.
Für die Ableitung sind verschiedene Schreibweisen in Gebrauch:
Notation
Ist a die Ableitung von f an der Stelle p, so schreiben wir
a = f ′(p) = Df(p) =
d
f(x)
dx
x=p
=
df(x)
dx
x=p
=
df(x)
(p).
dx
Definition (Tangente)
Sei f : P → R differenzierbar an der Stelle p P P. Dann heißt die Gerade
g: R → R mit
g(x) = f(p) + f ′(p) (x − p) für alle x P R
die durch die Stelle p definierte Tangente von f oder die Tangente von f durch
den Punkt (p, f(p)).
Einführung in die Mathematik 1
© Oliver Deiser
1.
Differentialquotienten und lineare Approximation
145
f(x2 )
f(x1 )
f(x)
f(p)
g1 (x)
g2 (x)
g(x)
p
x2
x1
Zwei Sekanten g1 und g2 und die Tangente g von f an der Stelle p
f'(p)
f(x)
a(p, x)
f(p)
p
Der Differenzenquotient a(x, p) an der Stelle p als Funktion in x
Beispiele
(1) Ist f : R → R mit f(x) = c für alle x, so gilt für alle p P R:
f ′(p) = limx
→p
f(x) − f(p)
x−p
= limx
→p
c−c
x−p
= 0.
(2) Sei n ≥ 1 und f : R → R mit f(x) = xn für alle x. Weiter sei p P R. Dann
gilt für alle x P R:
xn − pn = (x − p)(xn − 1 p0 + … + x0 pn − 1 ).
(vgl. unsere Ergebnisse zur geometrischen Summe). Damit ergibt sich
f ′(p) = limx
© Oliver Deiser
→p
xn − pn
x−p
= limx
→p
(xn − 1 p0 + … + x0 pn − 1 ) = n pn − 1 .
Einführung in die Mathematik 1
146
2. Abschnitt
Der analytische Kalkül
(3) Ist f : R → R mit f(x) = |x| für alle x, so ist x an der Stelle p = 0 nicht
differenzierbar, da
|x| − 0
x−p
= 1 für x > 0,
|x| − 0
x−p
= −1 für x < 0.
Sehr nützlich ist die folgende Umformulierung des Differentialquotienten,
die sich durch die Setzung h = x − p ergibt:
h-Formulierung des Differentialquotienten
limx
f(x) − f(p)
x−p
→p
= limh
→0
f(p + h) − f(p)
h
Implizit ist im h-Limes immer h ≠ 0 und p + h P P enthalten.
Der Approximationssatz
Eine sehr wichtige Sicht auf die Ableitung wird ausgedrückt in:
Satz (linearer Approximationssatz)
Sei f : P → R, und sei p P P. Dann sind äquivalent:
(1) f ist differenzierbar in p.
(2) Es gibt ein a P R und eine Funktion r : P → R mit den Eigenschaften:
(i) f(x) = f(p) + a (x − p) + r(x) für alle x P P,
(ii) limx
→p
r(x)
x−p
= 0.
Gilt (2), so ist a = f ′(p).
Die Idee ist:
In der Nähe von p ist die Funktion f ihre Tangente plus ein kleiner Rest.
Was „kleiner Rest“ bedeuten soll, wird durch die Grenzwertbedingung (ii) präzisiert. Der Leser beachte, dass die Eigenschaft (i) für ein beliebiges a P R immer
erreicht werden kann: Wir setzen einfach
ra (x) = f(x) − f(p) − a (x − p) für alle x P P.
Dann gilt
f(x) = f(p) + a (x − p) + ra (x) für alle x P P
nach Konstruktion. Die Bedingung (ii) ist aber in der Regel verletzt:
Einführung in die Mathematik 1
© Oliver Deiser
1.
Differentialquotienten und lineare Approximation
147
Beispiel
Sei f die Betragsfunktion, d. h. f(x) = |x| für alle x. Weiter sei p = 0 und
a P R beliebig. Dann gilt für alle xP P:
ra (x) = f(x) − f(0) − a (x − 0) = |x| − ax = x(sgn(x) − a),
sodass
ra (x)
x−p
=
x(sgn(x) − a)
x
= sgn(x) − a.
Der Quotient konvergiert nicht gegen 0, wenn x gegen 0 strebt. Der
rechtsseitige Grenzwert ist 1 − a, der linksseitige 1 + a. (Dies entspricht den
einseitigen Ableitungen: Für a = 1 erhalten wir 0 wenn x von rechts gegen 0
konvergiert und für a = −1 erhalten wir 0, wenn x von links gegen 0
konvergiert.)
Das Beispiel illustriert die Bedeutung der Bedingung (ii):
Die Restfunktion r strebt nicht nur gegen Null, wenn x gegen p strebt. Sie strebt stärker
immer noch gegen 0, wenn sie durch x − p geteilt wird.
Anders formuliert: Die Restfunktion r konvergiert an der Stelle p schneller als
eine lineare Funktion gegen 0. Der Leser denke zum Beispiel an die Einheitsparabel x2 und die Stelle 0. Die Konvergenz muss aber nicht unbedingt quadratisch sein. Auch die Funktion x3/2 konvergiert an der Stelle 0 auch nach einer
Division durch x immer noch gegen gegen 0. Allgemeiner gilt dies für x1 + ε für
ein beliebig kleines ε > 0.
f(p)
f(x)
r(x)
g(x)
p
Die Restfunktion r(x) = f(x) − g(x) an der Stelle p
Nach diesen Vorbereitungen wollen wir nun den Approximationssatz beweisen.
© Oliver Deiser
Einführung in die Mathematik 1
148
2. Abschnitt
Der analytische Kalkül
Beweis
(1) impliziert (2):
Sei also f differenzierbar an der Stelle p. Wir setzen a = f ′(p) und
definieren r : P → R durch
r(x) = f(x) − f(p) − a (x − p) für alle x P P
Dann gilt (i) nach Definition. Weiter gilt auch (ii), da
limx → p
r(x)
x−p
= limx
→p
= limx
→p
f(x) − f(p)
x−p
(
f(x) − f(p)
x−p
− a
x−p
x−p
− a limx
→p
)
x−p
x−p
= a − a = 0.
(2) impliziert (1) (und Zusatz):
Sind a P R und r : P → R wie in (2), so gilt
limx
→p
f(x) − f(p)
x−p
= limx
→p
(a +
r(x)
x−p
)
= a + 0 = a.
Dies zeigt, dass f an der Stelle p differenzierbar ist mit f ′(p) = a.
Wir betrachten den Approximationssatzes noch einmal an einem konkreten
Beispiel. Als Funktion wählen wir die Logarithmusfunktion.
1.0
0.5
log(x)
r(x)
0.5
1.0
1.5
2.0
r(x)
x-p
g(x)
-0.5
-1.0
Die Restfunktion r(x) = log(x) − g(x) und der Quotient r(x)/(x − p) an der Stelle 1
Einführung in die Mathematik 1
© Oliver Deiser
1.
Differentialquotienten und lineare Approximation
149
Die Landau-Notation
Die Bedingungen (i) und (ii) des Approximationssatzes sind etwas sperrig in
der Formulierung und es ist wünschenswert, eine einfache und suggestive Notation zur Verfügung zu haben. Bewährt hat sich hier eine symbolische Notation,
die auf den Zahlentheoretiker Edmund Landau zurückgeht. Sie wird heute in der
Mathematik, Physik und Informatik (in zahlreichen Varianten) an vielen Stellen
verwendet, um das asymptotische Verhalten von Funktionen zu beschreiben.
Landau-Notation oder klein-o-Notation
Ein Ausdruck
o(x − p) für x → p
steht für eine Funktion r : P → R (mit einem kontextabhängigen Definitionsbereich P) mit der Eigenschaft
limx
→p
r(x)
x−p
= 0.
Ist allgemeiner g : P → R eine Funktion mit g(x) ≠ 0 für alle x ≠ p, so steht
o(g(x)) für x → p
für eine Funktion r : P → R mit
limx
→p
r(x)
g(x)
= 0.
Damit können wir den Approximationssatz nun so formulieren:
Satz (linearer Approximationssatz in Landau-Notation)
Sei f : P → R, und sei p P P. Dann sind äquivalent:
(1) f ist differenzierbar in p.
(2) Es gibt ein a P R mit
f(x) = f(p) + a (x − p) + o(x − p) für x → p.
Gilt (2), so ist a = f ′(p).
Dadurch wird die Idee „Tangente plus kleiner Rest“ besonders schön zum
Ausdruck gebracht.
© Oliver Deiser
Einführung in die Mathematik 1
150
2. Abschnitt
Der analytische Kalkül
Kalkül der Landau-Notation
Ein Ausdruck o(g(x)) verweist auf eine nicht weiter spezifizierte „namenlose“
Funktion r. Besonders gut zu handhaben wird die Landau-Notation nun durch
die − für mathematische Verhältnisse ungewöhnlichen − Vereinbarung, dass
zwei oder mehr identisch notierte Ausdrücke o(g(x)) auf verschiedene Funktionen r1 , r2 , … verweisen können. Dadurch entsteht ein Kalkül der o-Notation.
So bedeutet zum Beispiel
o(x − p) + o(x − x) = o(x − p) für x → p,
dass die Summe zweier Funktionen r1 , r2 des Typs o(x − p) wieder eine Funktion
r = r1 + r2 des Typs o(x − p) ergibt (für die betrachtete Konvergenz x → p). Analog
bedeutet
o(x − p) ⋅ o(x − p) = o((x − p)2 ) für x → p,
dass das Produkt zweier Funktionen des Typs o(x − p) eine Funktion r = r1 ⋅ r2 des
Typs o((x − p)2 ) darstellt, d. h. dass gilt
limx
→p
r1 (x) r2 (x)
(x − p)2
= 0.
Weiter bedeutet
o((x − p)2 ) impliziert o(x − p) für x → p,
dass jede Funktion r des Typs o((x − p)2 ) auch eine Funktion des Typs o(x − p) ist.
Damit ist zum Beispiel
f(x) = f(p) + a (x − p) + o((x − p)2 ) für x → p
eine Verstärkung der Differenzierbarkeit von f an der Stelle p: Die Restfunktion konvergiert hier schneller als für die Differenzierbarkeit gefordert gegen
0, nämlich „besser als quadratisch“ anstelle von „besser als linear“. Anschaulich
bedeutet dies, dass sich die Tangente von f an der Stelle p besonders eng an die
Funktion f anschmiegt.
Beispiel
Sei f : R → R mit f(x) = x3 für alle x P R. Weiter sei p = 1. Dann gilt f ′(p) = 3,
sodass die Tangente g von f an der Stelle p gegeben ist durch
g(x) = f(p) + f ′(p)(x − p) = 1 + 3(x − 1) = 3x − 2 für alle x P R.
Damit ist
f(x) = g(x) + o(x − 1) für x → 1.
In Termnotation können wir schreiben:
x3 = 3x − 2 + o(x − 1) für x → 1.
Einführung in die Mathematik 1
© Oliver Deiser
1.
Differentialquotienten und lineare Approximation
151
Differenzierbarkeit an allen Stellen
Bisher haben wir die Differenzierbarkeit an einer festen Stelle p untersucht.
Nun variieren wir die Stelle und fassen im Fall der Existenz alle Ableitungen zu
einer Funktion zusammen:
Definition (Differenzierbarkeit)
Eine Funktion f : P → R heißt differenzierbar, falls f ′(x) für alle x P P
existiert. Wir nennen die Funktion f ′ : P → R die erste Ableitung von f.
Existiert die erste Ableitung, so stellt sich die Frage, ob f ′ : P → R wieder differenzierbar ist. Das folgende Beispiel zeigt, dass dies nicht immer der Fall ist:
Beispiel
Sei f : R → R definiert durch f(x) = x3 für x ≥ 0 und f(x) = x2 für x < 0. Dann
ist f differenzierbar mit f ′(x) = 3x2 für x ≥ 0 und f(x) = 2x für x < 0. Aber die
Funktion f ′ : R → R ist nicht differenzierbar an der Stelle 0.
15
10
f(x)
5
f (x)
-2
-1
1
2
-5
Ein Knick in der Ableitung
In vielen Fällen ist aber ein wiederholtes Ableiten möglich. Wir definieren
hierzu allgemein:
Definition (mehrfache Differenzierbarkeit)
Sei f : P → R. Wir setzen f (0) = f und definieren rekursiv solange möglich
f (n + 1) = f (n) ′ für alle n P N.
Ist n P N und existiert f (n) , so heißt f n-mal differenzierbar und f (n) die n-te
Ableitung von f.
© Oliver Deiser
Einführung in die Mathematik 1
152
2. Abschnitt
Der analytische Kalkül
Der Exponent wird in Klammern gesetzt, um die Notation von der Potenzierung zu unterscheiden. Im Fall der Existenz gilt
f ′ = f (1) , f ″ = (f ′)′ = f (2) , f ″′ = (f ″)′ = f (3) .
Die zweite Ableitung beschreibt die Änderung des Steigungsverhaltens von f,
die sich anschaulich auf die Krümmung des Graphen von f auswirkt. Dabei ist
aber f ″(p) kein direktes Maß für die Krümmung von f an der Stelle p: Die Parabel
x2 hat eine konstante zweite Ableitung, aber anschaulich keine konstante Krümmung. Wir werden später eine Formel für den lokalen Krümmungsradius einer
Funktion diskutieren, in der wie erwartet die zweite Ableitung eine wichtige
Rolle spielt.
6
4
2
f(x)
f (x)
-3
-2
-1
1
2
3
f (x)
f (3) (x)
-2
-4
-6
Die ersten drei Ableitungen der Funktion f(x) = x2 /2 + cos(x) + arctan(x2 )
Einführung in die Mathematik 1
© Oliver Deiser
1.
Differentialquotienten und lineare Approximation
153
Übungen
Übung 1
Sei f : R* → R mit f(x) = 1/x. Weiter sei p P R*. Bestimmen Sie die
Ableitung von f an der Stelle p durch Berechnung des Differentialquotienten.
Übung 2
Sei f : R → R mit f(x) = x2 . Weiter sei p P R.
(a) Bestimmen Sie die Tangente von f an der Stelle p.
(b) Bestimmen Sie die Restfunktion r : R → R und weisen Sie die
Limesbedingung des Approximationssatzes nach.
(c) Zeichnen Sie f sowie die Tangenten und Restfunktionen für die
Stellen p = 1 und p = 2.
Übung 3
Seien f, g : P → R differenzierbar an der Stelle p P P. Weiter seien a, b P R
und h = af + bg. Zeigen Sie
(a) durch Berechnung des Differentialquotienten,
(b) mit Hilfe des linearen Approximationssatzes und der LandauNotation,
dass h an der Stelle p differenzierbar mit
h′(p) = a f ′(p) + b g′(p).
Übung 4
Geben Sie instruktive Beispiele verschiedener Art für Funktionen an, die an
einer Stelle ihres Definitionsbereichs nicht differenzierbar sind.
Übung 5
Sei f : R → R mit f(0) = 0. Welche geometrische Bedeutung hat das
Verhältnis f(x)/x von Funktionswert und Stelle?
Übung 6
Sei f : R → R mit f(p) = 0 differenzierbar an der Stelle p mit a = f ′(p).
Welche qualitativen Aussagen über das lokale Verhalten von f an der Stelle
p können Sie in Abhängigkeit von a treffen? Wie können Sie diese
Aussagen begründen?
© Oliver Deiser
Einführung in die Mathematik 1
154
2. Abschnitt
Der analytische Kalkül
Übung 7
Seien a, b, c P R, und sei f : R → R mit f(x) = a x2 + b x + c für alle x P R.
Welche anschauliche Bedeutung hat der Parameter b?
Übung 8
Beschreiben Sie, wie Sie die Ableitung sin′(x) = cos(x) verwenden können,
wenn Sie den Verlauf des Sinus per Hand skizzieren. Fertigen Sie eine
entsprechende Skizze an.
Übung 9
Begründen Sie, wie und warum sich die Ableitung physikalisch als
Geschwindigkeit deuten lässt.
Übung 10
Sei f : R → R, und sei p P R derart, dass
y− = limx
+
y = limx
→ p, x < p
f(x),
(linksseitiger Grenzwert)
→ p, x > p
f(x)
(rechtsseitiger Grenzwert)
existieren, aber y− ≠ y+ . Zeigen Sie, dass f an der Stelle p nicht differenzierbar ist.
Übung 11
Seien a0 , …, an P R und sei f : R → R das Polynom mit den Koeffizienten
a0 , …, an , d. h.
f(x) = an xn + … + a1 x + a0 für alle x P R.
Geben Sie eine Formel für die k-te Ableitung, k ≥ 0, von f an. (Die
Ableitungsregel für Polynome dürfen Sie als bekannt voraussetzen.)
Übung 12
Sei n ≥ 1. Geben Sie eine Funktion f : R → R an, die an der Stelle 0 n-mal,
aber nicht (n + 1)-mal differenzierbar ist.
Einführung in die Mathematik 1
© Oliver Deiser
2. Ableitungsregeln
In diesem Kapitel stellen den den Kalkül des Differenzierens vor, mit dem wir die
Ableitung jeder elementaren Funktion bestimmen können. Weiter betrachten
wir einfache Differentialgleichungen und die sich aus ihnen ergebenden Potenzreihendarstellungen.
© Oliver Deiser
Einführung in die Mathematik 1
156
2. Abschnitt
Der analytische Kalkül
Die Regeln
Satz (Ableitungsregeln)
Unter der Voraussetzung der Existenz der beteiligten Ableitungen von f
und g gilt:
(a) (a f + b g)′(p) = a f ′(p) + b g′(p),
(Linearität der Ableitung)
(b) (f g)′(p) = f ′(p) g(p) + f(p) g′(p),
(Produktregel)
(c) (f/g)′(p) =
f ′(p) g(p) − g′(p) f(p)
,
g2 (p)
(Quotientenregel)
(d) (g + f )′(p) = g′(f(p)) ⋅ f ′(p),
(e) (f − 1 )′ (f(p)) =
1
, falls f ′(p) ≠ 0.
f ′(p)
(Kettenregel)
(Ableitung der Umkehrfunktion)
Es gibt zwei Möglichkeiten, die Ableitungsregeln zu beweisen:
Möglichkeit 1: Wir berechnen die Differentialquotienten.
Möglichkeit 2: Wir verwenden den linearen Approximationssatz.
Die zweite Möglichkeit spiegelt die Grundidee der lokalen Ersetzung einer
Funktion durch ihre Tangente besonders schön wider. Exemplarisch zeigen wir:
Beweis der Produktregel mit Hilfe des Approximationssatzes
Seien f und g differenzierbar an der Stelle p, sodass
f(x) = f(p) + f ′(p) (x − p) + o(x − p),
g(x) = g(p) + g′(p) (x − p) + o(x − p) für x → p.
Dann gilt
(f ⋅ g)(x) = f(x) ⋅ g(x)
= f(p) g(p) + f(p) g′(p) (x − p) + f ′(p) g(p) (x − p) + o(x − p)
= f(p) g(p) + (f(p)g′(p) + f ′(p) g(p))(x − p) + o(x − p) für x → p.
Dabei enthält das „o“ in der zweiten Zeile die Summe
( f(p) + g(p) + f ′(p) (x − p) + g′(p) (x − p) ) o(x − p)
+ o((x − p)2 ).
Nach dem Approximationssatz ist also die Produktfunktion fg differenzierbar an der Stelle p und es gilt
(f g)′(p) = f ′(p) g(p) + f(p) g′(p).
Einführung in die Mathematik 1
© Oliver Deiser
2. Ableitungsregeln
157
Einfache Ableitungen
Im Folgenden bestimmen wir die Ableitungen aller im ersten Abschnitt betrachteten Funktionen. Wegen dxn /dx = n xn−1 können wir aufgrund der Linearität der Ableitung beliebige Polynome differenzieren:
d
an xn + … + a2 x2 + a1 x + a0
dx
(
)
= n an xn − 1 + … + 2 a2 x + a1 .
Die Ableitung einer rationalen Funktion f/g ergibt sich aus der Ableitungsregel
für Polynome und der Quotientenregel:
(f/g)′ =
f ′ g − g′ f
.
g2
Für die Exponentialfunktion gilt nach unserer Charakterisierung
exp′ = exp.
Die Ableitung der Logarithmus erhalten wir mit Hilfe der Regel für die Ableitung der Umkehrfunktion:
1
exp′(log x)
d
log x =
dx
1
exp(log x)
=
=
1
.
x
Die Ableitung der allgemeinen Exponentialfunktionen können wir mit der Kettenregel bestimmen. Für alle a > 0 gilt:
d x
a =
dx
d x log a
d
e
= ex log a
(x log a) = ax log a.
dx
dx
Damit gilt expa ′ = log(a) expa . Für die Umkehrfunktionen erhalten wir
d
loga x =
dx
1
expa ′(loga x)
=
1
log(a) expa (loga x)
=
1
.
log(a) x
Für die Potenzfunktionen gilt schließlich
d
xa =
dx
d a log x
d
a
e
= ea log x
(a log x) = x a
dx
dx
x
= a xa − 1 ,
in Übereinstimmung und Verallgemeinerung der Ableitungsregel für die Monome xn .
© Oliver Deiser
Einführung in die Mathematik 1
158
2. Abschnitt
Der analytische Kalkül
Ableitung von Kosinus und Sinus
Wir haben den Kosinus und Sinus als Koordinatenfunktionen für durch das
Bogenmaß definierte Punkte des Einheitskreises eingeführt. Die Ableitungen
der beiden Funktionen können wir raten, indem wir die elementaren Werte der
beiden Funktionen betrachten: Die lokalen Extrema des Kosinus (die ±1-Werte)
sind genau die Nullstellen des Sinus, und ebenso sind die lokalen Extrema des
Sinus (die ±-Werte) genau die Nullstellen des Kosinus. Betrachtung der Vorzeichen führt zur Hypothese
cos′ = − sin, sin′ = cos.
Um diese Hypothese zu beweisen, zeigen wir zunächst einen Hilfssatz:
Satz (Ableitungen vom Kosinus und Sinus im Nullpunkt)
limx
→0
sin x
x
= 1, limx
→0
cos x − 1
x
= 0.
Damit ist sin′(0) = 1 und cos′(0) = 0.
Beweis
Wir zeigen die Aussage für den Sinus. Die Aussage für den Kosinus kann
ähnlich bewiesen werden. Wegen sin(−x) = −sin x können wir uns auf
positive x beschränken. Wir betrachten die Punkte
A = (1, 0), P = (cos x, sin x) P K1 , Q = (1, tan x),
sodass Q auf der Geraden OP liegt und OAQ ein rechtwinkliges Dreieck
bildet. Es gilt
(+)
sin x
x
≤
x
2
≤
tan x
,
2
denn die drei Größen sind der Reihe nach die Flächen
des Dreiecks OAP, des Kreissegments OAP, des Dreiecks OAQ.
Umformen liefert
(++) cos x ≤
sin x
x
≤ 1.
Da cos x gegen 1 strebt, wenn x gegen 0 strebt, folgt die Behauptung.
Wegen
sin
x
=
sinx − sin0
x −0
ist also sin′(0) = 1.
Einführung in die Mathematik 1
© Oliver Deiser
2. Ableitungsregeln
159
K
1
Q
tan(x)
P
sin(x)
Sektorfläche: x/2
x
cos(x)
A
Zur Ableitung des Sinus an der Stelle 0
Der Sinus-Grenzwert lässt sich auch durch folgende Argumentation veranschaulichen: Für kleine x ist die Bogenlänge x ungefähr gleich sin x, sodass das
Verhältnis der beiden Größen ungefähr gleich 1 ist.
Mit Hilfe der Additionstheoreme ergibt sich nun:
Satz (Ableitungen des Kosinus und Sinus)
Es gilt cos′ = − sin und sin′ = cos.
Beweis
Sei x P R beliebig. Dann gilt
d
sin x = limh
dx
→0
sin(x + h) − sin x
h
= limh
→0
sin x cos h + cos x sinh − sin x
h
= limh
→0
( sin x
cos h − 1
h
+ cos x
sin h
h
)
= sin x ⋅ 0 + cos x ⋅ 1 = cos x.
Die Kosinus-Ableitung wird analog bewiesen oder mit Hilfe der Formel
cos x = sin(π/2 − x) und der Kettenregel aus der Sinus-Ableitung gewonnen.
Nicht vorenthalten möchten wir dem Leser:
© Oliver Deiser
Einführung in die Mathematik 1
160
2. Abschnitt
Der analytische Kalkül
Dynamische Argumentation
Bewegt sich ein Punkt P mit P(0) = (1, 0) in der Zeit t auf dem Einheitskreis
K1 mit der Winkelgeschwindigkeit 1 gegen den Uhrzeigersinn, so gilt:
P(t) = (cos t, sin t) für alle t P R.
1
Q(t)
P(t)
sin(t)
K
cos(t)
Sei t P R beliebig. Dann ist Q(t) = (cos′ t, sin′ t) ist der Geschwindigkeitsvektor des Punktes zur Zeit t. Dieser Vektor steht senkrecht auf P(t) und hat die
Länge 1. Genauer ist Q(t) um π/2 (gegen den Uhrzeigersinn) gedrehte
Vektor P(t). Da (x, y) bei der Drehung um π/2 in (−y, x) übergeht, gilt
(cos′ t, sin′ t) = Q(t) = (−sin t, cos t).
Folglich ist cos′ t = −sin t und sin′ t = cos t.
Insgesamt erhalten wir die periodische Ableitungsfolge
cos, sin, −cos, −sin, cos, sin, −cos, −sin, …
1.0
0.5
cos(x)
sin(x)
-
-cos(x)
-sin(x)
-0.5
-1.0
Einführung in die Mathematik 1
© Oliver Deiser
2. Ableitungsregeln
161
Ableitung der trigonometrischen Funktionen
Die Ableitungen der anderen trigonometrischen Funktionen ergeben sich aus
den Ableitungen von Kosinus und Sinus durch Anwendung der Ableitungsregeln. Wir stellen die Formeln tabellarisch zusammen. Die Beweise seien zur
Übung überlassen.
Funktion
Ableitung
Funktion
Ableitung
sin x
cos x
cos x
−sin x
tan x
sec2 x
cot x
−csc2 x
sec x
sec x tan x
csc x
−csc x cot x
arcsin x
arctan x
arcsec x
© Oliver Deiser
1
£1 − x
2
1
1 + x2
1
x2 £1 − 1/x2
arccos x
−
arccot x
arccsc x
−
−
1
£1 − x2
1
1 + x2
1
x2 £1 − 1/x2
Einführung in die Mathematik 1
162
2. Abschnitt
Der analytische Kalkül
Für den Tangens und Kotangens sind oft auch die folgenden äquivalenten Formen nützlich:
d
tan x = 1 + tan2 x,
dx
d
cot x = − (1 + cot2 x)
dx
Bemerkung
Als Merkregel kann man verwenden, dass genau die trigonometrischen
Funktionen, die mit „c“ beginnen, ein negatives Vorzeichen in der
Ableitung aufweisen.
Ableitung der hyperbolischen Funktionen
Für die hyperbolischen Funktionen ergeben sich die folgenden Ableitungen:
Funktion
Ableitung
Funktion
Ableitung
sinh x
cosh x
cosh x
sinh x
tanh x
sech2
coth x
− csch2 x
sech x
− sech x tanh x
csch x
− csch x coth x
1
arsinh x
£x + 1
1
1 − x2
artanh x
arsech x
−
£x − 1
2
1
1 − x2
arcoth x
1
x £1 − x
1
arcosh x
2
2
arcsch x
−
1
|x| £1 + x2
Der Leser lasse sich durch die identischen Terme der Ableitungen von artanh
und arcoth nicht irritieren. Wie immer sind die Formeln nur unter der Voraussetzung der Definiertheit gültig, also für |x| < 1 für den artanh bzw. für |x| > 1
für den arcoth.
Die Ableitungen des Tangens und Kotangens Hyperbolicus lassen sich auch
wieder alternativ schreiben als
d
tanh x = 1 − tanh2 x,
dx
Einführung in die Mathematik 1
d
coth x = 1 − coth2 x
dx
© Oliver Deiser
2. Ableitungsregeln
163
Einfache Differentialgleichungen
Wir betrachten die ermittelten Ableitungen nun noch im Licht von Differentialgleichungen, also Gleichungen mit Funktionen und ihren Ableitungen als
Unbekannten. Die Funktionen werden dabei wie üblich mit f,g,h, … bezeichnet,
oft aber auch mit y.
Die Differentialgleichung f ′ = f
Die Exponentialfunktion erfüllt
f ′ = f.
Aber auch die Funktionen 2exp und allgemeiner c exp für eine beliebige reelle
Zahl c sind Lösungen dieser Differentialgleichung. Eindeutig wird die Lösung
erst durch Vorgabe eines Wertes an einer Stelle. Das sogenannte Anfangswertproblem (kurz AWP)
(+) f ′ = f, f(0) = c bzw. y′ = y, y(0) = c
hat für ein gegebenes c P R die Lösung f = c exp.
6
4
2 exp(x)
-
2
exp(x)
2
0
-2
-4
-2
0
2
4
Zwei Anfangswertprobleme zu y′ = y und ihre Lösung: y0 = 2 bzw. y0 = −1/2
© Oliver Deiser
Einführung in die Mathematik 1
164
2. Abschnitt
Der analytische Kalkül
Um zu zeigen, dass das AWP (+) für ein gegebenes c keine weiteren Lösungen
besitzt, verwenden wir ohne Beweis den folgenden anschaulich klaren (aber keineswegs trivial zu beweisenden) Satz:
Satz (Funktionen mit Ableitung 0)
Sei I ein Intervall und f : I → R mit f ′ = 0. Dann ist f konstant, d. h. es gibt
ein c P R mit f(x) = c für alle x P I.
Der Leser beachte, dass die Voraussetzung, dass der Definitionsbereich von f
ein Intervall ist, wesentlich ist:
Beispiel
Die Funktion f : [0, 1 ] ∪ [2, 3 ] → R mit f(x) = 0 für alle x P [0, 1 ] und f(x) = 2
für alle x P [ 2, 3 ] hat als Ableitung die Nullfunktion auf [ 0, 1 ] ∪ [ 2, 3 ]. Die
Funktion f ist aber nicht konstant.
Mit Hilfe des Satzes können wir die Eindeutigkeit der Lösung relativ einfach
zeigen. Sei also f eine Lösung von (+). Wir definieren g : R → R durch
g =
f
.
exp
Dann gilt
g′ =
f ′ exp − f exp′
exp2
=
f ′ exp − f exp
exp2
= 0,
sodass g konstant gleich einer reellen Zahl c′ ist. Wegen c′ = g(0) = f(0) = c ist aber
c′ = c und damit f = g exp = c exp. Das Argument zeigt insbesondere die Eindeutigkeit einer Funktion f mit f ′ = f und f(0) = 1, wobei die Existenz einer solchen
Funktion vorausgesetzt wird.
Die Differentialgleichung f ″ = f
Differentialgleichungen können auch mehrfache Ableitungen involvieren,
man spricht dann von Gleichungen höherer Ordnung. So erfüllen zum Beispiel
sowohl der Kosinus Hyperbolicus als auch der Sinus Hyperbolicus die Differentialgleichung f ″ = f zweiter Ordnung. Allgemeiner gilt dies für die Funktionen
a cosh x + b sinh x
mit beliebigen Skalaren a,b P R, d.h. für Linearkombinationen des Kosinus und
Sinus Hyperbolicus. Man kann zeigen, dass jede Lösung in dieser Form dargestellt werden kann. Alternativ können die Lösungen auch in der Form
a ex + b e−x .
angegeben werden.
Einführung in die Mathematik 1
© Oliver Deiser
2. Ableitungsregeln
165
Die allgemeine Lösung einer Differentialgleichung zweiter Ordnung involviert zwei freie Parameter. Um Eindeutigkeit zu erreichen, wird ein Anfangswert
für f und ein Anfangswert für f ′ vorgegeben (physikalisch: ein Startpunkt und
eine Startgeschwindigkeit).
Beispiel
Das AWP
f ″ = f, f(0) = 1, f ′(0) = 0
hat den Kosinus Hyperbolicus als eindeutige Lösung, das AWP
f ″ = f, f(0) = 0, f ′(1) = 1
dagegen den Sinus Hyperbolicus.
Die Differentialgleichung f ″ = −f
Die Differentialgleichung f ″ = − f zweiter Ordnung hat die allgemeine Lösung
a cos x + b sin x, mit a, b P R beliebig.
Alternativ können die Lösungen auch durch Funktionen der Form
c cos(x − x0 )
mit c ≥ 0 und x0 P R beschrieben werden. Im physikalischen Kontext ist c eine
Amplitude und x0 eine Phasenverschiebung.
Beispiel
Das AWP
f ″ = −f, f(0) = 1, f ′(0) = 1
hat die eindeutige Lösung cos x + sin x. Diese Lösung lässt sich auch in der
Form £2 cos(x − π/4) schreiben.
1.5
1.0
0.5
cos(x) + sin(x)
-3
-2
-
2
3
2 cos(x)
-0.5
-1.0
-1.5
© Oliver Deiser
Einführung in die Mathematik 1
166
2. Abschnitt
Der analytische Kalkül
Potenzreihendarstellungen für den Kosinus und Sinus
Bisher haben wir, auf spielerischer Basis, die Potenzreihendarstellungen
exp x = ∑ n P N
xn
n!
= 1 + x +
cosh x = ∑ n P N
x(2n)
(2n)!
sinh x = ∑ n P N
x(2n + 1)
(2n + 1)!
= 1 +
x2
2
+
x3
6
x2
2
+
x4
24
= x +
x3
6
+
+ …,
+ …,
x5
120
+ …,
gefunden. Mit Hilfe der zweiten Ableitungen cos″ = −cos und sin″ = −sin können
wir Potenzreihen für den Kosinus und Sinus ermitteln. Leiten wir eine Potenzreihe
f(x) = a0 + a1 x + a2 x2 + … + an xn + …
gliedweise zweimal ab, so ergibt sich
f ′(x) = 1 ⋅ a1 + 2 a2 x + … + n an xn − 1 + …,
f ″(x) = 2 ⋅ 1 ⋅ a2 + 3 ⋅ 2 a3 x + … + n (n − 1) an xn − 2 + …
Soll die zweite Ableitung die Ausgangsreihe mit einem negativen Vorzeichen reproduzieren, so liefert ein Koeffizientenvergleich
a0 = − 2 ⋅ 1 a2 , a1 = − 3 ⋅ 2 a3 , a2 = − 4 ⋅ 3 a4
und allgemein
(+) an = − (n + 2) (n + 1) an + 2
für alle n P N.
Wir betrachten nun den Kosinus, sodass
f(x) = cos x, f ′(x) = − sin x, f ″(x) = − cos x.
Wegen cos 0 = f(0) = 1 ist a0 = 1. Aus (+) ergibt sich
a2 = −
1
, a4 =
2!
1
1
, a6 = −
, a8 =
4!
6!
1
8!
und allgemein
a2n = (−1)n
1
(2n)!
für alle n P N.
Einführung in die Mathematik 1
© Oliver Deiser
2. Ableitungsregeln
167
Wegen cos′(0) = f ′(0) = 1 erhalten wir a1 = 0 und damit an = 0 für alle ungeraden
Indizes n. Insgesamt ergibt sich
cos x = 1 −
x2
2!
+
x4
4!
−
x6
6!
+ … = ∑ n (−1)n
x2n
.
(2n)!
Damit unterscheidet sich die Potenzreihe des Kosinus von der des Kosinus Hyperbolicus nur durch abwechselnde Vorzeichen.
Analoge Überlegungen (oder gliedweises Differenzieren der Kosinus-Reihe
und Verwendung von cos′ = − sin x) liefern
sin x = x −
x3
3!
+
x5
5!
−
x7
7!
+ … = ∑ n (−1)n
x2n + 1
.
(2n + 1)!
Man kann zeigen, dass diese Darstellungen in der Tat für alle reellen Zahlen
gültig sind:
Satz (Kosinus-Reihe und Sinus-Reihe)
Für alle x P R gilt:
cos x = 1 −
x2
2!
+
x4
4!
−
x6
6!
+ … = ∑ n (−1)n
x2n
,
(2n)!
sin x = x −
x3
3!
+
x5
5!
−
x7
7!
+ … = ∑ n (−1)n
x2n + 1
.
(2n + 1)!
Speziell für im Betrag kleine Stellen x ergibt sich so eine Möglichkeit der effektiven Berechnung des Kosinus und des Sinus. Mit Hilfe der Landau-Notation
können wir schreiben
cos x = 1 + o(x),
cos x = 1 − x2 /2 + o(x3 ),
sin x = x + o(x2 ),
sin x = x − x3 /6 + o(x4 ) für x → 0.
Unsere Überlegungen zeigen, dass der Kosinus und der Sinus wie ihre hyperbolischen Verwandten eine der Exponentialfunktion formal ähnliche Darstellung als Potenzreihe besitzen. Während die hyperbolischen Funktionen
mit Hilfe der Exponentialfunktion exp : R → R definiert werden können, ist
ein Zusammenhang zwischen der Exponentialfunktion und den trigonometrischen Funktionen im Reellen aufgrund des Vorzeichenverhaltens der Koeffizienten nicht ersichtlich. Dieser Zusammenhang wird sich erst im Komplexen
ergeben.
© Oliver Deiser
Einführung in die Mathematik 1
168
2. Abschnitt
Der analytische Kalkül
4
2
sin(x)
f3 (x)
-
f5 (x)
-2
-4
4
2
sin(x)
-2
f9 (x)
-
2
f11 (x)
-2
-4
4
2
sin(x)
-4
f31 (x)
-2
2
4
f33 (x)
-2
-4
Die Sinusfunktion und einige Approximationen f2n + 1 mit
f2n + 1 (x) = x −
Einführung in die Mathematik 1
x3
3!
+
x5
5!
−
x7
7!
+ … + (−1)n
x2n + 1
(2n + 1)!
© Oliver Deiser
2. Ableitungsregeln
169
Die Ableitungen des Arkustangens
Für viele elementare Funktionen lassen die höheren Ableitungen explizit
leicht angeben. Die Exponentialfunktion reproduziert sich selbst:
exp, exp, exp, …
Der Sinus hat die periodische Ableitungsfolge
sin, cos, − sin, − cos, sin, cos, − sin, − cos, …
Für den Logarithmus ergibt sich
log,
1
1
1
1
1
, − 2 , 2 3 , − 3! 4 , …, (−1)n − 1 (n − 1)! n , …,
x
x
x
x
x
was durch Induktion nach n leicht nachgewiesen werden kann. Deutlich schwieriger sind die höheren Ableitungen
arctan, arctan′, …, arctan(n) , …
des Arkustangens zu berechnen. Wir geben eine elementare Analyse dieser in der
Literatur überraschenderweise kaum beachteten Problemstellung. Die ersten
Ableitungen lauten:
arctan′(x)
=
1
1 + x2
=: g(x)
arctan″(x)
=
−2x
(1 + x2 )2
= −2x g(x)2
arctan(3) (x) =
2(3x2 − 1)
(1 + x2 )3
= 2 (3x2 − 1) g(x)3
arctan(4) (x) =
6(−4x3 + 4x)
(1 + x2 )4
= 3! (−4x3 + 4x) g(x)4
arctan(5) (x) =
24(5x4 − 10x2 + 1)
(1 + x2 )5
= 4! (5x4 − 10x2 + 1) g(x)5
arctan(6) (x) =
120(−6x5 + 20x3 − 6x)
(1 + x2 )6
= 5! (−6x5 + 20x3 − 6x) g(x)6
Die auf der rechten Seite der Tabelle isolierten Polynome haben alternierende
Vorzeichen. Ihre Koeffizienten tauchen als Diagonalen im Pascalschen Dreieck
auf:
© Oliver Deiser
Einführung in die Mathematik 1
170
2. Abschnitt
Der analytische Kalkül
1
1
1
2
1
3
1
4
1
5
1
1
6
1
4
6
10
10
15
1
3
20
1
1
5
15
6
1
Diese Beobachtungen motivieren:
Definition (Arkustangens-Polynome)
Für alle n ≥ 0 ist das n-te Arkustangens-Polynom qn : R → R definiert durch
{

n+1
qn (x) = (−1)n ∑ 0 ≤ k ≤ n, k gerade k + 1 (−1)k/2 xn − k für alle x P R.
Für alle x P R gilt
q0 (x) = 1, q1 (x) = −2x, q2 (x) = 3x2 − 1, q3 (x) = −4x3 + 4x, …
Mit Blick auf die oben berechneten Ableitungen ist folgendes Ergebnis nicht
mehr überraschend:
Satz (Ableitungen des Arkustangens)
Für alle n ≥ 1 gilt
arctan(n) (x) = (n − 1)!
qn − 1 (x)
(1 + x2 )n
für alle x P R.
Beim Versuch, den Satz durch Induktion nach n ohne weitere Vorbereitungen
zu beweisen, verwickeln wir uns leicht in unüberschaubare Terme. Es ist daher
nützlich, vorab einige Eigenschaften der Polynome zu isolieren:
Satz (Eigenschaften der Arkustangens-Polynome)
Sei n ≥ 0. Dann gilt:
(a) qn ist ein Polynom vom Grad n.
(b) qn (−x) = (−1)n qn (x) für alle x P R.
(c) qn (0) = 0 für n ungerade, qn (0) = (−1)n/2 für n gerade.
(d) qn ′ = − (n + 1) qn − 1 für n ≥ 1.
(e) qn (x) + 2x qn − 1 (x) + (1 + x2 ) qn − 2 (x) = 0 für n ≥ 2.
Einführung in die Mathematik 1
© Oliver Deiser
2. Ableitungsregeln
171
Beweis
Die ersten vier Eigenschaften sind leicht einzusehen. Die fünfte Eigenschaft zeigen wir durch Induktion nach n ≥ 2. Der Induktionsanfang n = 2
ist klar. Im Induktionsschritt von n − 1 nach n berechnen wir
d
qn (x) + 2x qn − 1 (x) + (1 + x2 ) qn − 2 (x)
dx
(
)
= qn ′(x) + 2qn − 1 (x) + 2xqn − 1 ′(x) + 2x qn − 2 (x) + (1 + x2 ) qn − 2 ′(x)
=
( 1 − n ) ( qn − 1(x) + 2x qn − 2(x) + (1 + x2) qn − 3(x) )
= I. V. 0.
Damit ist das abgeleitete Polynom konstant. Nach (b) hat es an der Stelle 0
den Wert 0, sodass das Polynom das Nullpolynom ist.
Problemlos ist nun:
Beweis des Satzes über die Ableitungen des Arkustangens
Wir zeigen die Behauptung durch Induktion nach n ≥ 1. Der Induktionsanfang n = 1 ist klar wegen q0 = 1 und arctan′(x) = 1/(1 + x2 ). Im Induktionsschritt von n nach n + 1 berechnen wir mit Hilfe von (d) und (e):
arctan(n+1) = (n − 1)!
= (n − 1)!
= n!
qn − 1 ′(x)(1 + x2 )n − 2 n x qn − 1 (x)(1 + x2 )n − 1
(1 + x2 )2n
− n qn − 2 (x) (1 + x2 ) − 2 n x qn − 1 (x)
(1 + x2 )n + 1
qn (x)
(1 + x2 )n .
Die Frage betrifft letztendlich die höheren Ableitungen der rationalen Funktion 1/(1 + x2 ). Der Arkustangens kommt „nur“ durch arctan′(x) = 1/(1 + x2 ) ins
Spiel. Unabhängig davon haben die qn -Polynome interessante Eigenschaften.
Normieren wir (Leitkoeffizient wird 1) die qn -Polynome durch
pn (x) =
(−1)n
qn (x) für alle n ≥ 0 und x P R,
n+1
so gilt
(+) pn ′ = (−1)n − 1 qn − 1 = n pn − 1 für alle n ≥ 1.
Der Leser vergleiche dies mit der Ableitung d/dx xn = n xn − 1 für die Monome.
Eine Folge (rn )n ≥ 0 von Polynomen mit rn ′ = n rn−1 für alle n ≥ 1 ist in der Literatur
als Appell-Folge bekannt. Nach (+) bilden die pn -Polynome wie die Monome xn
eine Appell-Folge.
© Oliver Deiser
Einführung in die Mathematik 1
172
2. Abschnitt
Der analytische Kalkül
Übungen
Übung 1
(a) Zeigen Sie
d n
x = n xn − 1 für alle n ≥ 1
dx
induktiv mit Hilfe der Produktregel.
(b) Leiten Sie die Quotientenregel aus der Produkt- und Kettenregel ab,
unter Verwendung von
d
dx
1
x
= −
1
.
x2
Übung 2
Zeigen Sie die Kettenregel unter Verwendung der Ableitungsregel für
Polynome für den Fall, dass eine der beiden beteiligten Funktionen eine
Gerade und die andere eine Parabel ist.
Übung 3
(a) Nehmen Sie an, dass die Umkehrfunktion einer differenzierbaren
Funktion differenzierbar ist und gewinnen Sie die Ableitungsregel
für die Umkehrfunktion aus der Kettenregel.
(b) Visualisieren Sie die Ableitungsregel für die Umkehrfunktion durch
ein Diagramm.
Übung 4
Beweisen Sie, soweit noch nicht erfolgt, die tabellarisch angegebenen
Formeln für die Ableitungen der trigonometrischen Funktionen (einschl.
ihrer Umkehrfunktionen).
Übung 5
Beweisen Sie, soweit noch nicht erfolgt, die tabellarisch angegebenen
Formeln für die Ableitungen der hyperbolischen Funktionen (einschl. ihrer
Umkehrfunktionen).
Übung 6
In den Übungen zu den trigonometrischen Funktionen hatten wir gesehen,
dass sich Funktionen der Formen
(1) a cos x + b sin x mit a, b P R
(2) c cos(x − x0 ) mit c, x0 P R
Einführung in die Mathematik 1
© Oliver Deiser
2. Ableitungsregeln
173
ineinander umrechnen lassen. Gewinnen Sie dieses Resultat neu unter
Verwendung der eindeutigen Lösbarkeit der Anfangswertprobleme
f ″ = − f, f(0) = a, f ′(0) = b bzw. f ″ = − f, f(x0 ) = c, f ′(x0 ) = −c.
Welche Umrechnungsformeln zwischen a, b und c, x0 ergeben sich?
Übung 7
Bestimmen Sie in Analogie zur Ermittlung der Potenzreihendarstellung für
den Kosinus die Potenzreihendarstellung einer Funktion f : R → R mit den
Eigenschaften:
f (3) = −f, f(0) = 1, f ′(0) = 0, f ″(0) = 0.
Übung 8
Plotten Sie (mit Hilfe eines Computers) die Kosinus-Funktion und die fünf
Polynome
pn (x) = ∑ 0 ≤ k ≤ n (−1)k
x2k
(2k)!
für n = 1, …, 5.
Erstellen Sie zudem eine Tabelle, die den numerischen Unterschied
zwischen cos(x) und pn (x) für n = 1, …, 5 und x = 1/10, 1, π/2 und 10π
illustriert.
Übung 9
Eine alternative Darstellung der Ableitungen des Arkustangens: Wir
definieren h : R → R durch
h(x) =
1
£1 + x2
= £arctan′(x) für alle x P R.
Weiter sei gn : R → R für alle n ≥ 1 definiert durch
gn (x) = (−1)n − 1 (n − 1)! h(x)n sin( n arccot x ) für alle x P R.
Zeigen Sie:
(1) gn (x) = (−sgn(x))n − 1 h(x)n sin( n arcsin h(x) ) für alle n ≥ 1, x P R.
(2) g1 = h(x)2 = arctan′(x), gn ′ = gn + 1 für alle n ≥ 1.
Nach (2) gilt arctan(n) = gn für alle n ≥ 1.
© Oliver Deiser
Einführung in die Mathematik 1
3. Die Taylor-Entwicklung
Mit Hilfe der ersten Ableitung konnten wir eine differenzierbare Funktion lokal
durch ihre Tangente approximieren. Wir betrachten nun Approximationen höherer Ordnung, bei denen wir eine hinreichend oft differenzierbare Funktion an
einer gegebenen Stelle (einem Entwicklungspunkt) durch Parabeln und allgemeiner Polynome n-ten Grades annähern. Dabei stellt sich auch die Frage nach
der Möglichkeit der Potenzreihenentwicklung einer Funktion.
© Oliver Deiser
Einführung in die Mathematik 1
176
2. Abschnitt
Der analytische Kalkül
Schmiegeparabeln
Sei f : P → R eine an einer Stelle p P P differenzierbare Funktion. Nach dem
linearen Approximationssatz gilt
f(x) = f(p) + f ′(p) (x − p) + o(x − p) für x → p,
wobei „o(x − p) für x → p“ für eine Funktion r : P → R steht mit
limx
→p
r(x)
x−p
= 0.
Eine natürliche Idee ist es nun, die Tangente
g(x) = f(p) + f ′(p) (x − p) für alle x P R,
durch eine Parabel zu ersetzen, um eine noch bessere lokale Approximation an f
zu erhalten. Um die Form einer solchen Parabel zu finden, beobachten wir, dass
die Tangente g durch folgende Eigenschaften charakterisiert ist:
(a) Übereinstimmung an der Stelle p: f(p) = g(p).
(b) Übereinstimmung der ersten Ableitung an der Stelle p: f ′(p) = g′(p).
Dies legt es nahe, für die gesuchte Parabel h : R → R zusätzlich eine Übereinstimmung der zweiten Ableitung an der Stelle p zu fordern. Setzen wir
h(x) = f(p) + f ′(p) (x − p) + c (x − p)2 ,
mit einer unbekannten Konstanten c, so gilt
h″(p) = 2c.
Soll h″(p) = f ″(p) gelten, muss also c = f ″(p)/2 sein. Diese Überlegung motiviert:
Definition (Schmiegeparabel)
Sei f : P → R zweimal differenzierbar an einer Stelle p P P. Dann heißt die
Funktion h : R → R mit
h(x) = f(p) + f ′(p) (x − p) +
f ″(p)
(x − p)2 für alle x P R
2
die Schmiegeparabel von f an der Stelle p.
Eine Schmiegeparabel h stimmt nach Konstruktion an der Stelle p in der nullten, ersten und zweiten Ableitung mit der Funktion f, an die sie sich anschmiegt,
überein (wobei die nullte Ableitung einer Funktion als die Funktion selbst definiert ist). Sie ist nur dann eine echte Parabel, wenn f ″(p) ≠ 0. In Fall f ″(p) = 0 fällt
h mit der Tangente von f an der Stelle p zusammen. Um die Sprechweise zu vereinfachen, lassen wir diesen Fall zu.
In Analogie zum linearen Approximationssatz gilt:
Einführung in die Mathematik 1
© Oliver Deiser
3. Die Taylor-Entwicklung
177
2
1
-1
1
2
3
4
5
log(x)
-1
h(x)
-2
-3
-4
Die Schmiegeparabel des Logarithmus an der Stelle 1
Satz (quadratischer Approximationssatz)
Sei f : P → R zweimal differenzierbar an der Stelle p P P. Weiter sei h die
Schmiegeparabel von f an der Stelle p und r : P → R mit r(x) = f(x) − h(x)
für alle x P P. Dann gilt
limx
→p
r(x)
(x − p)2
= 0.
Der Beweis des Satzes ist nicht mehr so einfach wie im linearen Fall. Relativ problemlos
lässt er sich mit den Regeln von l’Hospital führen, siehe etwa [Deiser, Analysis 1] für einen
Beweis.
Unter den Voraussetzungen des Satzes können wir also schreiben
Satz (quadratischer Approximationssatz in Landau-Notation)
Sei f : P → R zweimal differenzierbar an der Stelle p P P, und sei h die
Schmiegeparabel von f an der Stelle p. Dann gilt
f(x) = h(x) + o((x − p)2 )
= f(p) + f ′(p) (x − p) +
f ″(p)
(x − p)2 + o((x − p)2 ) für x → p.
2
Ein typisches Beispiel für eine Restfunktion des Typs o((x − p)2 ) ist das Polynom (x − p)3 dritten Grades. Aber auch (x − p)5/2 erfüllt die Bedingung. Die Konvergenz gegen 0 muss schneller sein als eine quadratische Konvergenz.
Wir können die Ergebnisse etwas salopp so zusammenfassen: Eine Funktion
ist lokal ihre Tangente plus ein kleiner Rest und weiter ihre Schmiegeparabel
plus ein noch kleinerer Rest. Was „kleiner Rest“ bedeuten soll, wird durch die
klein-o-Notation in kompakter Form zum Ausdruck gebracht. Anstelle dieser
Notationen können wir immer auch konkrete Restfunktionen verwenden, die
eine bestimmte Limesbedingung erfüllen.
© Oliver Deiser
Einführung in die Mathematik 1
178
2. Abschnitt
Der analytische Kalkül
1.5
1.0
log(x)
0.5
h(x)
r(x)
r(x)
(x-1)2
0.5
1.0
1.5
2.0
2.5
3.0
3.5
-0.5
-1.0
Zum quadratischen Approximationssatz:
Schmiegeparabel und Restfunktion des Logarithmus an der Stelle 1
Im Gegensatz zu einer Tangente ist eine Schmiegeparabel h einer Funktion f
an einer Stelle p nicht mehr so leicht in einen Graphen einer Funktion einzuzeichnen. Um die Lage von h zu bestimmen, nehmen wir f ″(p) ≠ 0 an. Dann ist
a = f ″(p)/2 die Öffnung von h. Je größer also der Betrag der zweiten Ableitung
von f an der Stelle p ist, desto steiler ist die Parabel. Ist |f ″(p)| klein, so ist die Parabel sehr flach. Mit unserer Formel
(−
b
, c −
2a
b2
4a
)
für den Scheitelpunkt einer Parabel mit den Parametern a,b,c berechnet sich der
Scheitelpunkt der Schmiegeparabel h zu
(+) s(p) = ( p, f(p) ) −
f ′(p)
f ′(p)
( 1,
f ″(p)
2
)
(Scheitelpunkt der Schmiegeparabel)
(Dieses Ergebnis können wir auch leicht durch Ableiten von h erhalten, denn
p − f ′(p)/f ″(p) ist die eindeutige Nullstelle von h′.)
Genau im Fall f ′(p) = 0 fällt der Scheitelpunkt s(p) mit dem Punkt (p, f(p)) zusammen. Der Abstand der x-Koordinate des Scheitelpunkts von der Stelle p ist durch
das Verhältnis der beiden ersten Ableitungen von f an der Stelle p bestimmt.
Fassen wir nun p als Variable auf, so erhalten wir eine Kurve s : P → R2 , die jeder Stelle p des Definitionsbereichs von f einen Punkt der Ebene gemäß (+) zuweist. Diese Scheitelpunktskurve können wir am Allgemeinen nicht mehr als reellwertige Funktion auffassen. Die folgenden Diagramme zeigen einige Beispiele.
Einführung in die Mathematik 1
© Oliver Deiser
3. Die Taylor-Entwicklung
179
1.0
0.5
-2
-1
1
2
-0.5
-1.0
Scheitelpunkte der Schmiegeparabeln von f(x) = x (x − 1) (x + 1)
2
1
2
4
6
8
10
-1
-2
Scheitelpunkte der Schmiegeparabeln des Logarithmus log
© Oliver Deiser
Einführung in die Mathematik 1
180
2. Abschnitt
Der analytische Kalkül
6
4
2
-5
5
-2
-4
Scheitelpunkte der Schmiegeparabeln von cos auf [ −π, π ]
Taylor-Polynome
Noch allgemeiner können wir fragen, wie Polynome höheren Grades definiert werden können, die an einer bestimmten Stelle in mehr als zwei Ableitungen mit einer Funktion übereinstimmen. Ist eine an einer Stelle p ihres
Definitionsbereichs n-mal differenzierbare Funktion f gegeben, so suchen wir
also ein Polynom g : R → R höchstens n-ten Grades der Form
g(x) = a0 + a1 (x − p) + a2 (x − p)2 + … + an (x − p)n für alle x P R
mit der Eigenschaft
f(p) = g(p), f ′(p) = g′(p), f ″(p) = g″(p), …, f (n) (p) = g(n) (p).
Sei k ≤ n. Dann gilt für alle x P R
g(k) (x) = k! ak +
k!
ak + 1 (x − p) + … +
1!
k!
an (x − p)n − k ,
(n − k)!
sodass g(k) (p) = k! ak . Wenn g(k) (p) = f (k) (p) gelten soll, muss also
ak =
f (k) (p)
k!
sein. Die Fakultät im Nenner gleicht die Faktoren aus, die beim k-fachen Ableiten von (x − p)k entstehen. Wir definieren:
Einführung in die Mathematik 1
© Oliver Deiser
3. Die Taylor-Entwicklung
181
Definition (Taylor-Polynome)
Sei f : P → R n-mal differenzierbar an der Stelle p P P. Dann ist das n-te
Taylor-Polynom T np f : R → R von f im Entwicklungspunkt p definiert durch
T np f(x) = f(p) + f ′(p) (x − p) +
= ∑k ≤ n
f ″(p)
(x − p)2 + … +
2!
f (k) (p)
(x − p)k
k!
f (n) (p)
(x − p)n
n!
für alle x P R.
Wir nennen das Polynom T np f auch die Taylor-Entwicklung der Ordnung n
der Funktion f an der Stelle p.
Das Taylor-Polynom der Ordnung 0 ist konstant gleich f(p). Die Taylor-Polynome der Ordnungen 1 und 2 sind die Tangente und die Schmiegeparabel von f
an der Stelle p. Die Taylor-Entwicklung dritter Ordnung lautet
T 3p (x) = f(p) + f ′(p) (x − p) +
f ″(p)
(x − p)2 +
2
f (3)
(x − p)3 .
6
4
2
log(x)
-1
1
2
3
4
h(x)
r(x)
-2
-4
Das Taylor-Polynom h(x) dritter Ordnung des Logarithmus an der Stelle 1 und die
Restfunktion r(x) = log(x) − h(x)
Wie erwartet kann man eine zu den bisherigen Ergebnissen analoge
Approximationsgüte nachweisen:
Satz (Satz von Peano)
Sei f : P → R n-mal differenzierbar an der Stelle p P P. Weiter sei
r : P → R die Funktion mit r(x) = f(x) − T np f (x) für alle x P P. Dann gilt
limx
→p
r(x)
(x − p)n
© Oliver Deiser
= 0.
Einführung in die Mathematik 1
182
2. Abschnitt
Der analytische Kalkül
Gleichwertig in der Landau-Notation formuliert lautet der Satz:
Satz (Satz von Peano in Landau-Notation)
Sei f : P → R n-mal differenzierbar an der Stelle p P P. Dann gilt:
f(x) = T np f (x) + o((x − p)n )
= f(p) + f ′(p)(x − p) + … +
f (n) (p)
(x − p)n + o((x − p)n ) für x → p.
n!
Taylor-Reihen
Es ist verführerisch, die Taylor-Entwicklung nicht bei einer bestimmten Ordnung abzubrechen, sondern unendlich fortzusetzen:
Definition (Taylor-Reihe)
Sei f : P → R beliebig oft differenzierbar an der Stelle p P P. Dann ist die
Taylor-Reihe T p f von f im Entwicklungspunkt p definiert durch
T p f (x) = ∑ n
f (n) (p)
(x − p)n für alle x P R.
n!
Im Gegensatz zu den Taylor-Polynomen ist keineswegs garantiert, dass durch
eine unendliche Taylor-Reihe eine auf ganz R oder auch nur auf P definierte
Funktion erklärt ist (Konvergenzproblem). Weiter stellt sich die Frage, ob die erhoffte „perfekte Approximation“, bei der die Restfunktion Null geworden ist,
tatsächlich erreicht wird: Stimmt die Taylor-Reihe auf P oder wenigstens auf gewissen Teilintervallen von P mit f überein? (Darstellungsproblem). Offensichtlich
ist nur die Übereinstimmung im Entwicklungspunkt. Ob die Funktion f auch in
anderen Punkten durch ihre Taylor-Reihe dargestellt wird, und welche Punkte
dies genau sind, ist nicht klar.
Die Untersuchung dieser Fragen ist eine nichttriviale Aufgabe der Analysis.
Unseren spielerisch-experimentellen Ansatz fortsetzend behandeln wir diesen
Problemkreis exemplarisch. Begegnet sind uns bisher die für alle x P R gültigen
Potenzreihendarstellungen
exp x = ∑ n
cosh x = ∑ n
xn
,
n!
x(2n)
,
(2n)!
cos x = ∑ n (−1)n
x(2n)
,
(2n)!
Einführung in die Mathematik 1
sinh x = ∑ n
x(2n + 1)
,
(2n + 1)!
sin x = ∑ n (−1)n
x(2n + 1)
.
(2n + 1)!
© Oliver Deiser
3. Die Taylor-Entwicklung
183
Die Reihen auf der rechten Seite sind die Taylor-Entwicklungen der Funktionen
im Entwicklungspunkt 0. Dies lässt sich explizit durch Berechnung der TaylorReihen nachweisen oder allgemein aus der Eindeutigkeit einer Potenzreihendarstellung folgern:
Satz (Eindeutigkeit einer Potenzreihendarstellung)
Sei p P R, ε > 0 und f : ] p − ε, p + ε [ → R dargestellt durch zwei Potenzreihen, sodass
f(x) = ∑ n an (x − p)n = ∑ n bn (x − p)n für alle x P ] p − ε, p + ε [.
Dann gilt
an =
f (n) (p)
n!
= bn für alle n P N.
Beweis
Gliedweises Differenzieren der Potenzreihe ∑ n an (x − p)n zeigt, dass
an =
f (n) (p)
n!
für alle n P N.
Ebenso gilt bn = f (n) (p)/n! für alle n P N.
Ist eine Funktion f : P → R durch als Taylor-Reihe darstellbar, d. h. gilt
f(x) = T p f(x) = ∑ n
f (n) (p)
(x − p)n für alle x P P,
n!
so bedeutet dies, dass die gesamte Funktion durch die Folge
f (p), f ′(p), f ″(p), …, f (n) (p), …
ihrer Ableitungen an der Stelle p festgelegt ist. Kennen wir nämlich diese Ableitungen, so kennen wir die Taylor-Reihe T p f und damit die Funktion f. Der
Leser beachte, dass sich alle Ableitungen berechnen lassen, wenn die Funktion
f auf einem winzigen Ausschnitt um den Entwicklungspunkt herum vorliegt:
Aus f |] p − ε, p + ε [ lässt sich, für ein beliebig kleines ε > 0, die gesamte Funktion f : P → R rekonstruieren − immer vorausgesetzt, f ist durch T p f darstellbar. Der Verlauf von f ist in diesem Sinne durch den Verlauf von f im Intervall
] p − ε, p + ε [ determiniert. Die Folge der Ableitungen von f an der Stelle p trägt
die gesamte Vergangenheit und Zukunft von f in sich.
Die perfekte Darstellbarkeit wie bei den Funktionen exp, cosh, sinh, sin, cos
ist aber nicht in allen Fällen zu erreichen. Wir betrachten hierzu vier Beispiele,
die die auftretenden Phänomene illustrieren.
© Oliver Deiser
Einführung in die Mathematik 1
184
2. Abschnitt
Der analytische Kalkül
Beispiel 1: Die geometrische Reihe als Taylor-Reihe
Sei f : R − { 1 } → R definiert durch
f(x) =
1
1−x
für alle x ≠ 1.
Aufgrund unserer Überlegungen zur geometrischen Reihe wissen wir, dass
f(x) =
1
1−x
= ∑ n xn für alle x P ] −1, 1 [.
Aufgrund des Eindeutigkeitssatzes ist die geometrische Reihe ∑ n xn die
Taylor-Reihe von f im Entwicklungspunkt 0. Zur Illustration berechnen
wir die Taylor-Reihe durch Bestimmung der Ableitungen. Für alle x ≠ 1 gilt
f ′(x) =
1
, f ″(x) =
(1 − x)2
2!
, …, f (n) (x) =
(1 − x)3
n!
, …
(1 − x)n
Damit ist f (n) (0) = n! für alle n P N.
10
5
1
1-x
f2 (x)
-2
-1
1
2
f3 (x)
-5
-10
40
20
1
1-x
-2
-1
1
2
f6 (x)
f7 (x)
-20
-40
Die Funktion 1/(1 - x) und einige Taylor-Polynome fn der Ordnung n im
Entwicklungspunkt p = 0
Einführung in die Mathematik 1
© Oliver Deiser
3. Die Taylor-Entwicklung
185
Für den Entwicklungspunkt p = 0 erhalten wir also
n!
(x − 0)n = ∑ n xn für alle x P R.
n!
T1 f(x) = ∑ n
Damit haben wir die geometrische Reihe wiedergefunden. Es gilt
f(x) =
1
1−x
= ∑ n xn = T1 f(x)
genau dann, wenn |x| < 1. Die Taylor-Entwicklung von f im Entwicklungspunkt p = 0 stimmt mit f nur in einem endlichen Intervall überein. Genauer
ist dieses Intervall symmetrisch um den Entwicklungspunkt, und es reicht
bis zur Polstelle von f. Der Definitionsbereich R − { 1 } von f ist wesentlich
größer als der Konvergenzbereich der Taylor-Reihe. So gilt zum Beispiel
f(−1) = 1/2, während
∑ n (−1)n = 1 − 1 + 1 − 1 + …
nicht konvergiert, da die Summen 1, 1 − 1, 1 − 1 + 1, 1 − 1 + 1 − 1, …
zwischen 1 und 0 hin und her pendeln.
Besipiel 2: Die Taylor-Reihe des Logarithmus
Es gilt
log′(x) =
1
1
, log″(x) = − 2 ,
x
x
log(3) (x) = 2
1
1
, log(4) (x) = − 3! 4 ,
3
x
x
und allgemein
log(n) (x) = (−1)n − 1 (n − 1)!
1
xn
für alle n ≥ 1, x > 0.
Wir betrachten den Entwicklungspunkt p = 1, für den die Ableitungen
besonders einfache Werte ergeben. Wegen log(1) = 0 erhalten wir:
T1 log (x) = ∑ n ≥ 1
(−1)n − 1
(x − 1)n für alle x P R.
n
Die Taylor-Reihe divergiert zum Beispiel für x = 0, wie es im Hinblick auf
den Logarithmus ja auch sein soll, aber auch für x = 3, wo der Logarithmus
definiert ist. Man kann zeigen, dass die Taylor-Reihe genau für x P ] 0, 2 ]
mit dem Logarithmus übereinstimmt. Speziell ergibt sich für x = 2 die
bemerkenswerte Darstellung
log 2 = 1 −
© Oliver Deiser
1
2
+
1
3
−
1
4
+ …
(log(2)-Reihe)
Einführung in die Mathematik 1
186
2. Abschnitt
Der analytische Kalkül
3
2
1
log(x)
f3 (x)
-0.5
0.5
1
1.5
2
f4 (x)
2.5
f5 (x)
-1
-2
-3
3
2
1
log(x)
f20 (x)
-0.5
0.5
1
1.5
2
f25 (x)
2.5
f30 (x)
-1
-2
-3
Einige Taylor-Polynome fn = T n1 log
1
sn
log(2)
0.5
0.25
5
Zur log(2)-Reihe: sn = 1 −
Einführung in die Mathematik 1
10
1
2
+
1
3
15
−
1
4
+ … + (−1)n + 1
1
n
© Oliver Deiser
3. Die Taylor-Entwicklung
187
Wählen wir den Entwicklungspunkt p = 2, so erhalten wir eine Taylor-Reihe,
die im Intervall ]0, 4] konvergiert und dort den Logarithmus darstellt. Allgemeiner erhalten wir für einen Entwicklungspunkt p > 0 eine Konvergenz und Übereinstimmung im Intervall ]0, 2p]. Dieses Verhalten ergibt sich auch bei der Quadratwurzelfunktion, die ja im Nullpunkt nicht differenzierbar ist. Im Gegensatz
zur Taylor-Entwicklung der Funktion 1/(1 − x) aus dem ersten Beispiel ist nun der
Konvergenzbereich ein halboffenes Intervall. Allgemein zeigt sich:
Der Konvergenzbereich einer Taylor-Reihe ist immer symmetrisch um
den Entwicklungspunkt p. Genauer ist er von der Form
[ p − r, p + r ], ] p − r, p + r] , [ p − r, p + r [ oder ] p − r, p + r [
mit einem gewissen Konvergenzradius r ≤ ∞.
Damit kann eine Taylor-Reihe global keine Funktion wie 1/x, sqrt x, log x oder
tan x darstellen, deren Definitionsbereich nicht symmetrisch zum Entwicklungspunkt p ist. Salopp formuliert:
Die Taylor-Entwicklung bleibt an kritischen Stellen hängen.
Umgekehrt stellt sich die Frage, ob ein symmetrischer Definitionsbereich die
Darstellbarkeit durch eine Taylor-Reihe garantiert. Wir betrachten hierzu:
Beispiel 3: Taylor-Reihe des Arkustangens
Der Arkustangens arctan : R → R hat für alle n ≥ 1 die Ableitungen
qn − 1 (x)
, wobei
(1 + x2 )n
{

n+1
qn (x) = (−1)n ∑ 0 ≤ k ≤ n, k gerade k + 1 (−1)k/2 xn − k für alle x P R.
arctan(n) (x) = (n − 1)!
Damit ist arctan(2n) (0) = 0 und arctan(2n + 1) (0) = (−1)n /(2n + 1) für alle n,
sodass
x3
3
(+) T0 arctan (x) = x −
+
x5
5
− … = ∑ n (−1)n
x2n + 1
.
2n + 1
Alternativ können wir die geometrische Reihe einsetzen. Es gilt
arctan′(x) =
1
1 − (−x2 )
= ∑ n (−x2 )n = 1 − x2 + x4 − x6 + … für |x| < 1.
Wegen arctan(0) = 0 ergibt sich (+), denn gliedweises Differenzieren der
Reihe (+) liefert die geometrische Reihe für arctan′.
Man kann zeigen, dass T0 arctan(x) = arctan(x) genau dann gilt, wenn |x| ≤ 1.
Für x = 1 erhalten wir wegen arctan(1) = π/4:
π
4
= 1 −
© Oliver Deiser
1
3
+
1
5
−
1
7
+ …
(Leibniz-Reihe)
Einführung in die Mathematik 1
188
2. Abschnitt
Der analytische Kalkül
3
2
1
arctan(x)
f3 (x)
-2
-1
1
f5 (x)
2
f7 (x)
-1
-2
-3
3
2
1
arctan(x)
f20 (x)
-1
-0.5
0.5
1
1.5
f30 (x)
2
f40 (x)
-1
-2
-3
Einige Taylor-Polynome fn = T n1 arctan
1
sn
/4
0.5
0.25
5
Zur Leibniz-Reihe: sn = 1 −
Einführung in die Mathematik 1
10
1
3
+
1
5
15
−
1
7
+ … + (−1)n − 1
1
2n − 1
© Oliver Deiser
3. Die Taylor-Entwicklung
189
Zu dieser überraschenden Darstellung von π/4 gesellt sich die ebenso überraschende Divergenz der Reihe für x mit |x| > 1. Wenn sich Kosinus und Sinus als
Reihe auf ganz R darstellen lassen, warum nicht auch der Arkustangens? Das
Phänomen klärt sich erst, wenn wir die reellen Zahlen zu den komplexen Zahlen
erweitern: Die komplexwertige Arkustangens-Funktion besitzt eine Polstelle bei
der imaginären Einheit i, die den Abstand 1 vom Entwicklungspunkt 0 besitzt.
(Dies kann man durch Betrachtung der Ableitung 1/(1 + x2 ) erkennen, die eine
Polstelle bei x aufweist, falls x2 = −1 gilt.) Erst durch eine Erweiterung des Zahlbereichs wird also der im Reellen überraschend kleine Konvergenzradius r = 1
befriedigend erklärt: Die Taylor-Entwicklung bleibt bei i hängen, wobei dieses
Hindernis im Reellen nicht zu sehen ist.
Bislang haben stets eine Übereinstimmung der Taylor-Reihe mit der Ausgangsfunktion auf einem echten Intervall, dessen Mittelpunkt der Entwicklungspunkt ist, gefunden und damit zumindest lokal eine „perfekte Approximation“
(mit Rest 0) gefunden. Das folgende Beispiel zeigt, dass dies nicht immer so ist:
Beispiel 4: Das Gegenbeispiel von Cauchy
Wir definieren f : R → R durch
f(x) =
2
e−1/x
0
{
falls x ≠ 0,
falls x = 0.
Man kann zeigen, das f (n) (0) = 0 für alle n. Damit ist die Taylor-Reihe von f
im Entwicklungspunkt 0 die Nullfunktion. Sie stellt eine auf ganz R
definierte Funktion dar, stimmt aber nur im Nullpunkt mit f überein.
3
2
f(x)
1
f (x)
f (x)
-3
-2
-1
1
2
3
-1
Die Funktion f von Cauchy und ihre erste und zweite Ableitung
Wir müssen also wohl oder übel konstatieren:
Es ist möglich, dass eine Taylor-Reihe überall konvergiert, aber nur im Entwicklungspunkt mit der Ausgangsfunktion übereinstimmt.
© Oliver Deiser
Einführung in die Mathematik 1
190
2. Abschnitt
Der analytische Kalkül
Eine Variante erhalten wir, indem wir f auf der negativen x-Achse gleich Null
setzen. Die Taylor-Reihe dieser Funktion (erneut die auf ganz R definierte Nullfunktion) stimmt genau auf dem Intervall ] −∞, 0 ] mit der Funktion überein.
Derartige Funktionen dürfen aber als Sonderfälle gelten. Auch hier bringt
erst die komplexe Analysis Licht ins Dunkel, denn im Komplexen gilt: Eine
komplex-differenzierbare Funktion lässt sich lokal (und etwas salopp formuliert: so weit als möglich) immer in eine Taylor-Reihe entwickeln. Hat also eine
reelle Funktion eine differenzierbare komplexe Version, so kann eine Diskrepanz wie im Beispiel von Cauchy nicht auftreten. Die komplexe Variante der
Funktion von Cauchy ist im Nullpunkt nicht mehr differenzierbar. Wie beim
Arkustangens ist diese Eigenschaft der Funktion im Reellen nicht zu sehen.
Positiv formuliert können wir feststellen, dass wir im Reellen Freiheiten haben,
den Verlauf einer beliebig oft differenzierbaren Funktion zu gestalten, die in
der determinierten Welt des Komplexen nicht vorhanden sind.
Einführung in die Mathematik 1
© Oliver Deiser
3. Die Taylor-Entwicklung
191
Übungen
Übung 1
Bestimmen Sie die Schmiegeparabel h : R → R im Punkt 1 für die
Funktion f : R → R mit f(x) = x3 − 2x + x + 1 für alle x P R. Überzeugen Sie
sich explizit von der Darstellung
f(x) = h(x) + o((x − 1)2 ) für x → 1.
Übung 2
Bestimmen Sie die Schmiegeparabel des Sinus in den Punkten 0, π/4 und
π/2. Fertigen Sie zugehörige Skizzen an.
Übung 3
Sei f : R → R ein Polynom n-ten Grades, und sei p P R beliebig. Zeigen
Sie, dass T np f = f. (Hinweis: Zeigen Sie, dass zwei Polynome n-ten Grades,
die an einer Stelle in allen Ableitungen übereinstimmen, gleich sind.)
Übung 4
Sei f : R → R das Polynom dritten Grades mit
f(x) = (x − 1)3 + 2(x − 1)2 − 3(x − 1) + 1 für alle x P R.
Bestimmen sie die Taylor-Polynome dritten Grades von f in den Entwicklungspunkten p = 0 und p = 2. Wie können diese Darstellungen von f auch
ohne Taylor-Entwicklung erhalten werden? Welche Vor- und Nachteile
haben die verschiedenen Methoden?
Übung 5
Bestimmen Sie das Taylor-Polynom dritten Grades für die Wurzelfunktion
sqrt(x) in den Entwicklungspunkten p = 1 und p = 2.
Übung 6
Bestimmen Sie das Taylor-Polynom fünften Grades des Tangens im
Entwicklungspunkt 0.
Übung 7
Zeigen Sie durch Berechnung der Ableitungen, dass die Taylor-Reihen von
exp, cosh, sinh, cos und sin im Nullpunkt mit den Hilfe von Differentialgleichungen gewonnenen Potenzreihendarstellungen dieser Funktionen
übereinstimmen.
© Oliver Deiser
Einführung in die Mathematik 1
192
2. Abschnitt
Der analytische Kalkül
Übung 8
Die Taylor-Reihe des Arkustangens konvergiert nur für x P [ −1, 1 ]. Zeigen
Sie, dass
arctan(x −1 ) = sgn(x) π/2 − arctan(x)
für alle x ≠ 0,
und beschreiben Sie, wie sich mit Hilfe dieses Ergebnisses der Wert
arctan(x) für ein beliebiges x P R approximativ berechnen lässt.
Einführung in die Mathematik 1
© Oliver Deiser
4. Monotonie und Krümmung
Das übergeordnete Thema dieses Kapitels ist die Kurvendiskussion, die zu den
prominentestes Anwendungen der Differentialrechnung gehört. Wir untersuchen
(a) Monotonieverhalten
(b) lokale Extremwerte (Hoch- und Tiefpunkte)
(c) Krümmungseigenschaften (Links- und Rechtskrümmung, Krümmungskreise)
(d) Nullstellen
einer auf einem Intervall definierten hinreichend oft differenzierbaren reellen
Funktion. Viele Ergebnisse haben Eingang in die Mathematik des Gymnasiums
gefunden, sodass wir auf Schulwissen aufbauen können.
© Oliver Deiser
Einführung in die Mathematik 1
194
2. Abschnitt
Der analytische Kalkül
Kritische Punkte und lokale Extrema
Neben der Ermittlung der Nullstellen einer reellen Funktion f : P → R ist die
Ermittlung von lokalen Maxima und Minima von großer Bedeutung. Weiß man,
dass eine Funktion den Wert c annimmt und dass alle Funktionswerte kleineroder größergleich c sind, so ist die Suche nach einer Stelle x, an der f den Extremwert c annimmt, gleichbedeutend mit dem Finden einer Nullstelle der Funktion
f − c. In der Regel ist aber ein derartiger Extremwert nicht bekannt, sodass das
Auffinden einer Extremalstelle x zunächst keine Nullstellensuche auf den Plan
ruft. Dies ändert sich, wenn wir f als differenzierbar voraussetzen: An einer Extremalstelle x hat f eine waagrechte Tangente, sodass x eine Nullstelle der Ableitung von f ist. Wir suchen also ein x mit f ′(x) = 0. Ist f ein Polynom, so ist diese
Aufgabe sogar einfacher als die Suche einer Nullstelle von f, da sich der Grad von
f beim Differenzieren verringert. Leider sind Nullstellen der Ableitung nicht in
allen Fällen Extremalstellen: Die streng monoton steigende Funktion x3 besitzt
zum Beispiel im Nullpunkt die Ableitung 0, hat dort aber kein Extremum. Wir
müssen also unter allen Nullstellen von f ′ die − im Hinblick auf das Problem −
guten von den schlechten aussortieren. Dies geschieht durch eine Untersuchung
des Monotonieverhaltens von f in der Umgebung von x, das sich aus dem Vorzeichenverhalten von f ′ ergibt; alternativ können wir die zweite Ableitung heranziehen. Insgesamt können wir mit den Methoden der Differentialrechnung alle
lokalen Maxima und Minima von f ermitteln und unter diesen dann im Fall der
Existenz den größen und kleinsten angenommenen Wert suchen (das globale
Maximum bzw. Minimum von f ).
Wir diskutieren diese Zusammenhänge im Folgenden in kompakter Form.
Die Beweise der anschaulichen Sätze werden in der Analysis geführt.
4
f
2
-3
-2
-1
1
2
3
-2
Wir suchen die lokalen Maxima und Minima von f im Intervall [ −3, 3 ].
Hier und in den folgenden Diagrammen ist f das Polynom x5 /6 − x3 + x + 2.
Einführung in die Mathematik 1
© Oliver Deiser
4. Monotonie und Krümmung
195
Zunächst präzisieren wir einige Begriffe.
Definition (kritischer Punkt)
Sei f : P → R differenzierbar, und sei p P P mit f ′(p) = 0. Dann heißt p ein
kritischer Punkt von f.
Die genauen Definitionen im Umfeld von Extremwerten sind oft recht
schwerfällig. Um die Sprechweise zu erleichtern, definieren wir:
Definition (links und rechts von einer Stelle)
Sei f : P → R, und sei p P P. Wir sagen, dass f eine Eigenschaft %(x) links
der Stelle p erfüllt, falls gilt:
∃ε > 0 ∀x P ] p − ε [ ∩ P %(x).
Analog erfüllt f die Eigenschaft %(x) rechts der Stelle p, falls gilt:
∃ε > 0 ∀x P ] p + ε [ ∩ P %(x).
„Links von p“ “ heißt also anschaulich genauer „in einem kleinen Bereich links
von p“. Ist p der linke Randpunkt des Definitionsbereichs von f, so ist der Begriff
nicht von Interesse; rein logisch ist %(x) dann für alle Eigenschaften richtig. Analoges gilt für „rechts von p“.
Beispiel
Die Sinusfunktion ist negativ links der Null und positiv rechts der Null.
Zudem ist sie links und rechts der Null streng monoton steigend.
Damit können wir nun definieren:
Definition (lokales Extremum, Hochpunkt, Tiefpunkt)
Sei f : P → R, und sei p P P. Dann besitzt f an der Stelle p ein
(a) lokales Maximum, falls f ≤ f(p) links und rechts von p,
(b) lokales Minimum, falls f ≥ f(p) links und rechts von p,
(c) lokales Extremum, falls f in p ein lokales Maximum oder Maximum
besitzt.
Ist p eine lokale Maximalstelle (Minimalstelle) von f, so heißt der Punkt
(p, f(p)) ein lokales Maximum (Minimum) oder ein Hochpunkt (Tiefpunkt) von
f. Gilt < bzw. > statt ≤ bzw. < in (a) oder (b), so heißen die Extrema strikt.
Wir beschränken uns ab jetzt auf Intervalle als Definitionsbereiche. Funktionen wie 1/x können in auf Intervallen definierte Funktionen zerlegt werden.
Konvention
Im Folgenden sei I stets ein reelles Intervall (beliebiger Art).
© Oliver Deiser
Einführung in die Mathematik 1
196
2. Abschnitt
Der analytische Kalkül
Lokale Extrema sind oft − aber nicht immer − mit einem Wechsel des Monotonieverhaltens verbunden. Ein derartiger Wechsel kann mit Hilfe des Vorzeichens der ersten Ableitung ermittelt werden:
Satz (Monotoniesatz)
Sei f : I → R differenzierbar. Dann gilt:
(a) f ′ ≥ 0 genau dann, wenn f ist monoton steigend.
(b) f ′ ≤ 0 genau dann, wenn f ist monoton fallend.
(c) f ′ > 0 impliziert f ist streng monoton steigend.
(d) f ′ < 0 impliziert f ist streng monoton fallend.
4
2
f(x)
f (x)
-3
-2
-1
1
2
3
-2
4
2
f(x)
f (x)
-3
-2
-1
1
2
3
-2
Das Vorzeichen von f ′ spiegelt das Monotonieverhalten von f
Einführung in die Mathematik 1
© Oliver Deiser
4. Monotonie und Krümmung
197
Die streng monotonen Funktionen x3 und −x3 zeigen, dass die Umkehrungen
in (c) und (d) nicht gelten. Sie gelten aber „fast“ in dem Sinne, dass die Ableitung
einer streng monotonen Funktion nur an einzelnen Punkten gleich 0 sein kann.
Aus der Definition der Ableitung und dem Monotoniesatz gewinnen wir:
Satz (Extremwertbestimmung)
Sei f : I → R und p P I. Dann gilt unter entsprechenden Differenzierbarkeitsvoraussetzungen:
(a) Ist p kein Randpunkt von I und besitzt f in p ein lokales Extremum,
so ist p ein kritischer Punkt von f.
(b) Ist f ′ > 0 links von p und f ′ < 0 rechts von p, so besitzt f in p ein
striktes lokales Maximum.
(c) Ist f ′ < 0 links von p und f ′ > 0 rechts von p, so besitzt f in p ein
striktes lokales Minimum.
(d) Ist f ′(p) = 0 und f ″(p) < 0, so besitzt f in p ein striktes lokales
Maximum.
(e) Ist f ′(p) = 0 und f ″(p) > 0, so besitzt f in p ein striktes lokales
Minimum.
Beweis
Wir zeigen (a). Es gelte f ′(p) = limx → p (f(x) − f(p))/(x − p) > 0. Da p nicht
das Maximum von I ist, gibt es ein x > p in I, für das der Zähler des
Differenzenquotienten positiv ist. Also ist p kein lokales Maximum von f.
Ebenso gibt es ein x < p in I, für das der Zähler negativ ist, sodass p kein
lokales Minimum von f ist. Analog argumentieren wir im Fall f ′(p) < 0.
Die Beweise der anderen Aussagen mit Hilfe des Monotoniesatzes seien
dem Leser zur Übung überlassen.
4
2
f(x)
f (x)
-3
-2
-1
1
2
3
f (x)
-2
© Oliver Deiser
Einführung in die Mathematik 1
198
2. Abschnitt
Der analytische Kalkül
Wir betrachten noch einige stark oszillierende Funktionen, die zeigen, dass lokale Extrema komplizierter sein können als man denken könnte:
(a) Ein lokales Extremum ist nicht notwendig mit einem Wechsel des
Monotonieverhaltens verbunden.
(b) Es kann unendlich viele Extrema in einem beschränkten Intervall geben.
(c) Ein nicht striktes lokale Extremum bedeutet nicht immer, dass die
Funktion links und rechts der Stelle konstant ist.
0.025
f
0.020
0.015
0.010
0.005
-0.10
-0.05
0.00
0.05
0.10
f : R → R mit f(x) = x2 (2 + sin(1/x)) für x ≠ 0 und f(0) = 0.
Die Funktion f ist differenzierbar mit f ′(0) = 0, besitzt bei 0 ein striktes
(globales) Minimum, ist aber links und rechts der 0 nicht monoton.
Das Minimum kann mit Teil (b) des Satzes nicht identifiziert werden.
2
1
-0.4
-0.2
0.2
0.4
f'
-1
-2
Die erste Ableitung von f ist unstetig im Nullpunkt. Die zweite Ableitung
f ″(0) existiert nicht, sodass Teil (d) des Satzes nicht anwendbar ist.
Einführung in die Mathematik 1
© Oliver Deiser
4. Monotonie und Krümmung
199
0.020
g
0.015
0.010
0.005
-0.10
-0.05
0.00
0.05
0.10
g : R → R mit f(x) = x2 (1 + sin(1/x)) für x ≠ 0 und g(0) = 0.
Die Funktion besitzt an der Stelle 0 ein nicht striktes lokales Minimum,
ist aber links und rechts der 0 nicht konstant.
0.10
0.05
-0.10
-0.05
0.05
0.10
-0.05
h
-0.10
h : R → R mit h(x) = x (1 + 10 x sin(1/x)) für x ≠ 0 und h(0) = 0.
Die Funktion h ist differenzierbar mit h′(0) > 0, aber h ist links und rechts der Null
nicht monoton steigend. Dies zeigt, dass ein einziger Punkt mit einer positiven
Ableitung in Teil (c) des Monotoniesatzes nicht genügt.
© Oliver Deiser
Einführung in die Mathematik 1
200
2. Abschnitt
Der analytische Kalkül
Das Krümmungsverhalten
Neben Monotonie und Extrema ist vor allem die Krümmung einer Funktion
von Interesse. Sie wird durch die Lage der Funktion bzgl. ihrer Sekanten beschrieben:
Definition (konvex, konkav)
Sei f : I → R. Dann heißt f konvex (konkav), falls für alle a < b in I gilt:
f ist auf ] a, b [ kleinergleich (größergleich) der Geraden durch (a, f(a)) und
(b, f(b)).
Gilt < (>) statt ≤ (≥) so heißt f streng konvex (streng konkav).
Neben den international üblichen Begriffen konvex und konkav spricht man
im Deutschen anschaulich auch von linksgekrümmten bzw. rechtsgekrümmten
Funktionen. Die Richtung entspricht dem Abfahren des Graphen von f von −∞
nach ∞.
8
6
4
2
-3
-2
-1
1
2
3
Die Einheitsparabel x2 ist streng konvex. Sie liegt unterhalb jeder Strecke,
die zwei ihrer Punkte miteinander verbinden.
Beispiele
Die Exponentialfunktion exp ist streng konvex. Die Quadratwurzelfunktion
ist streng konkav. Die Identität x ist konvex und konkav. Die Funktion x3 ist
weder konvex noch konkav.
Ist die Funktion f konvex, so ist −f konkav und umgekehrt. Bei der Untersuchung der Krümmung können wir uns also auf einen Typ konzentrieren.
Einführung in die Mathematik 1
© Oliver Deiser
4. Monotonie und Krümmung
201
Das Krümmungsverhalten einer Funktion verhält sich zur zweiten Ableitung
so wie das Monotonieverhalten zur ersten Ableitung:
Satz (zweite Ableitung und Krümmung)
Sei f : I → R zweimal differenzierbar. Dann gilt:
(a) f ″ ≥ 0 genau dann, wenn f ist konvex.
(b) f ″ > 0 impliziert f ist streng konvex.
(c) f ″ ≤ 0 genau dann, wenn f ist konkav.
(d) f ″ < 0 impliziert f ist streng konkav.
Ein Wechsel im Monotonieverhalten markiert ein lokales Extremum. Analog
markiert ein Wechsel im Krümmungsverhalten einen Wendepunkt:
Definition (Wendepunkt)
Sei f : I → R stetig und p P I. Dann besitzt f an der Stelle p einen
Wendepunkt, falls f links und rechts von p ein unterschiedliches Krümmungsverhalten aufweist, d. h. dort konkav bzw. konvex ist oder umgekehrt.
Gilt zudem f ′(p) = 0, so besitzt f an der Stelle p einen Terassenpunkt.
Der Arkustangens hat zum Beispiel bei 0 eine Wendestelle. Die Funktion x3
weist dort einen Terassenpunkt auf. Besitzt eine zweimal differenzierbare Funktion f in p einen Wendepunkt, so gilt notwendig f ″(p) = 0. Die Wendepunkte sind
also unter den Nullstellen der zweiten Ableitung von f zu suchen.
4
2
f(x)
f (x)
-3
-2
-1
1
2
3
f (x)
-2
Wendepunkte und zugehörige Tangenten unseres Polynoms f.
In den vier durch die Wendestellen definierten Intervallen ist f
rechts-, links, rechts bzw. links gekrümmt.
© Oliver Deiser
Einführung in die Mathematik 1
202
2. Abschnitt
Der analytische Kalkül
Krümmungskreise
Die zweite Ableitung einer Funktion f spiegelt die Änderung des Steigungsverhaltens von f wider. Eine Änderung des Steigungsverhaltens bewirkt anschaulich eine Änderung der Krümmung des Graphen von f. Dass f ″(p) kein direktes Maß für die Krümmung von f an der Stelle p ist, zeigen zum Beispiel die
Einheitsparabel oder der Kreisbogen £1 − x2 auf ] −1, 1 [: Die Parabel ist anschaulich nicht konstant gekrümmt, hat aber eine konstante zweite Ableitung.
Und für den Kreisbogen ist es genau umgekehrt.
Ein Maß für die Krümmung von f an der Stelle p erhalten wir, indem wir an
den Graphen von f einen Kreis anlegen, der durch den Punkt (p, f(p)) verläuft
und dort die Funktion f möglichst gut approximiert (der Leser vgl. Tangenten
und Schmiegeparabeln). Einem Kreis mit Radius r ordnen wir die Krümmung 1/
r zu, da die Krümmung mit größeren Radien abnehmen soll. Hat also der approximierende Kreis den Radius r, so soll f an der Stelle p die Krümmung ±1/r zugeordnet werden, je nachdem, ob f links- oder rechtsgekrümmt ist. Der Kreismittelpunkt liegt entsprechend auf der linken bzw. rechten Seite von f.
f
M(r)
r
f(p)
p
Wir konstruieren den Punkt M(r) auf der Senkrechten der Tangente durch (p, f(p)) so,
dass sich der Kreis mit Mittelpunkt M(r) und Radius r bestmöglich an f anschmiegt.
Zur Berechnung des besten Radius nehmen wir f als konvex an und setzen
v = (1, f ′(p)), c = £1 + f ′(p)2 , w = 1/c rotπ/2 (v) = 1/c (−f ′(p), 1).
Der Vektor w hat die Länge 1 und er steht senkrecht auf dem Richtungsvektor v
der Tangente von f an der Stelle p. Wir setzen nun
Einführung in die Mathematik 1
© Oliver Deiser
4. Monotonie und Krümmung
203
M(r) = (xr , yr ) = (p, f(p)) + r w für alle r > 0.
Die Aufgabe ist, r so einzustellen, dass sich der Kreis K(r) mit Mittelpunkt M(r)
und Radius r bestmöglich an f im Punkt (p, f(p)) anschmiegt. Wir stellen hierzu
die untere Hälfte von Kr die Funktion gr : I(r) → R dar mit
gr (x) = yr − £r 2 − (x − xr )2
für alle x P I(r) = ] xr − r, xr + r [.
Die Funktion gr stimmt für alle r > 0 an der Stelle mit f(p) überein. Weiter gilt
gr ′(x) = −
x − xr
für alle x P I(r).
£r − (x − xr )2
2
Wegen
p − xr = r/c f ′(p) und c2 − f ′(p)2 = 1
gilt also gr (p)′ = f ′(p) für alle r > 0. Bis jetzt sind also alle Radien gleich gut. Den
gesuchten optimalen Radius erhalten wir, indem wir gr ″(p) = f ″(p) fordern. Die
Funktion hat dann an der Stelle p die Krümmung 1/r des Halbkreises gr .
Ausrechnen liefert den erfreulich überschaubaren Wert
f ″(p) = gr ″(p) =
r2
( r2
− (p − xr )2 )3/2
=
c3
.
r
Im Fall f ″(p) ≠ 0 erhalten wir also r = c3 /f ″(p) und
r
( −f ′(p), 1 ) = ( p, f(p) ) +
c
M(r) = ( p, f(p) ) +
c2
( −f ′(p), 1 ).
f ″(p)
Im Fall f ″(p) = 0 erhalten wir keinen Krümmungsradius, die Funktion ist in diesem Fall an der Stelle p nicht gekrümmt.
Im Fall einer konkaven (rechtsgekrümmten) Funktion verfahren wir analog,
wobei wir nun v im Uhrzeigersinn drehen, da der gesuchte Kreismittelpunkt
rechts von f liegt. Wir erhalten f ″(p) = −c3 /r. Die rechte Seite der Formel für den
Mittelpunkt M(r) bleibt gleich, da f ″(p) im Nenner negativ ist.
Diese Überlegungen motivieren:
Definition (Krümmung, Krümmungsradius, Krümmungskreis)
Sei f : P → R zweimal differenzierbar, und sei p P P. Weiter sei
c = £1 + f ′(p)2 .
Dann ist die Krümmung κ und im Fall f ″(p) ≠ 0 der Krümmungsradius r und
der Krümmungskreismittelpunkt M von f an der Stelle p definiert durch
κ =
f ″(p)
,
c3
r =
1
κ
=
c3
, M = ( p, f(p) ) +
|f ″(p)|
c2
( −f ′(p), 1 ).
f ″(p)
In den Krümmungsradius geht neben der zweiten Ableitung f ″(p) also auch
die erste Ableitung f ′(p) ein.
© Oliver Deiser
Einführung in die Mathematik 1
204
2. Abschnitt
Der analytische Kalkül
2.
1.5
1.
x2
g(x)
0.5
-1.0
-0.5
0.5
1.0
Krümmungskreise der Einheitsparabel an den Stellen p = 0, 1/4, 1/2.
Die Krümmungskreismittelpunkte (Evolute) durchlaufen die Funktion g mit
g(x) = 1/2 + 3/4 3 £4x2 .
5
4
3
2
1
-2
-
2
-1
-2
-3
-4
Krümmungskreise des Kosinus an den Stellen p = −π, −π/8, 3/4π
Die Evolute lässt sich nicht mehr als Funktion darstellen.
Einführung in die Mathematik 1
© Oliver Deiser
4. Monotonie und Krümmung
205
Zur Illustration der Formeln zeichnen wir noch die Krümmung κ = κf als
Funktion für einige f, d. h. es gilt κ(x) = f ″(x)/(1 + f ′(x)2 )3/2 .
6
5
4
x2
3
(x) =
2
4 x2 +1 3/2
2
1
-3
-2
-1
0
1
2
3
1.0
0.5
cos(x)
-2
-
2
(x) = -
cos(x)
sin2 (x)+1 3/2
-0.5
-1.0
1.4
1.2
1.0
x
0.8
(x) =
0.6
x
1+ 2 x 3/2
0.4
0.2
-3
-2
-1
0
1
2
3
Die κ-Funktion der Exponentialfunktion nimmt ihr Maximum
an der Stelle p = − log(2)/2 an. Es gilt κ(p) = 2/(3£3).
© Oliver Deiser
Einführung in die Mathematik 1
206
2. Abschnitt
Der analytische Kalkül
Die dritte Ableitung
Den Nullstellen der ersten und zweiten Ableitung einer Funktion f konnten
wir eine geometrisch anschauliche Bedeutung zuweisen:
(a) Lokale Extremalstellen von f sind Nullstellen von f ′.
(b) Wendepunkte von f sind Nullstellen von f ″.
Es stellt sich die Frage, ob eine ähnliche Interpretation auch für die dritte Ableitung möglich ist. Krümmungskreise sind hierzu weniger geeignet, da in den Krümmungsradius die erste Ableitung eingeht. Für die Schmiegeparabel g : R → R von
f an der Stelle p gilt
g(x) = f(x) + f ′(p) (x − p) + f ″(p)/2 (x − p)2 für alle x P R.
Die erste Ableitung geht ein, aber nicht in die Öffnung der Parabel, die gleich der
Hälfte der zweiten Ableitung von f ist. An Extremalstellen von f ″ haben die
Schmiegeparabeln von f also eine maximale oder minimale Öffnung, sodass sie
dort besonders eng oder weit verlaufen. Diese Extremalstellen sind Nullstellen
der dritten Ableitung von f. Damit haben wir:
(c) Stellen mit extremalen Schmiegeparabelöffnungen sind Nullstellen von f (3) .
Analoge Überlegungen gelten für die Taylor-Polynome höherer Ordnung.
Auch eine dynamische Interpretation ist möglich. Aus zeitlicher Sicht geben
f ′(t) und f ″(t) die Geschwindigkeit und die Beschleunigung eines sich eindimensional in der Zeit t bewegenden Punktes wieder. Die dritte Ableitung f (3) (t) kann
als Ruck (engl. jerk oder surge) aufgefasst werden.
8
6
4
f(x)
2
f (x)
f (x)
-3
-2
-1
1
2
3
f (3) (x)
-2
-4
-6
Schmiegeparabeln unseres Polynoms f an den Nullstellen der dritten Ableitung
Einführung in die Mathematik 1
© Oliver Deiser
4. Monotonie und Krümmung
207
Nullstellensuche
Wir haben gesehen, dass viele Anwendungen der Differentialrechnung die
Bestimmung von Nullstellen erfordern. In expliziter Form ist dies nur für sehr
einfache Funktionen möglich. Bereits für Polynome fünften Grades existiert
keine allgemeine Lösungsformel. Wir müssen uns also in vielen Fällen mit Näherungsverfahren begnügen. Ist f : P → R eine Funktion mit mindestens einer
Nullstelle, so produziert ein derartiges Verfahren ausgehend von einem Startwert x0 P P eine Folge x0 , x1 , x2 , …, xn , … von Elementen von P, die gegen eine
Nullstelle der Funktion konvergiert, d. h. es gilt f(x*) = 0 für x* = limn xn . Gute
Verfahren konvergieren zudem schnell, d.h. die Abstände |x* − xn | zwischen der
Nullstelle und den Approximationen xn konvergieren schnell gegen 0.
Ein Verfahren, das ganz ohne Methoden der Differentialrechnung auskommt,
beruht auf dem Zwischenwertsatz:
Satz (Zwischenwertsatz)
Sei f : [ a, b ] → R eine stetige Funktion. Dann nimmt f jeden Wert zwischen
f(a) und f(b) an. Insbesondere besitzt f eine Nullstelle, wenn f(a) und f(b)
verschiedene Vorzeichen haben.
Ist f : [a, b] → R mit sgn(f(a)) ≠ sgn(f(b)), so liefert das folgende Verfahren eine
Nullstelle von f. Zudem lässt es sich als konstruktiver Beweis des Zwischenwertsatzes lesen.
Bisektionsverfahren
Sei f : [ a, b ] → R stetig mit sgn(f(a)) ≠ sgn(f(b)) und f(a), f(b) ≠ 0. Wir
setzen (x0 , y0 ) = (a, b). Nun definieren wir rekursiv xn , yn , cn wie folgt:
Ist (xn , yn ) konstruiert, so setzen wir cn = (xn + yn )/2. Ist f(cn ) = 0, so stoppen
wir mit Ausgabe von cn . Andernfalls setzen wir
(xn + 1 , yn + 1 ) =
{
(xn , cn )
(cn , yn )
falls
falls
sgn(f(xn )) ≠ sgn(f(cn ))
sgn(f(cn )) ≠ sgn(f(yn )).
In jedem Schritt halbieren wir also das betrachtete Intervall unter Wahrung der
„guten Voraussetzung“ der unterschiedlichen Vorzeichen. Das Verfahren stoppt
mit einer Nullstelle cn = (xn + yn )/2 von f oder es produziert eine Folge (xn , yn ) mit
limn xn = limn yn = limn cn = x* und f(x*) = 0.
Der Beweis von f(x*) = 0 benutzt die Stetigkeit von f: Die Funktionswerte f(xn )
haben alle das gleiche Vorzeichen s1 , die Funktionswerte f(yn ) alle das gleiche
Vorzeichen s2 . Nach Konstruktion gilt s1 ≠ s2 . Sei s1 = −1 und s2 = 1. Aus Stetigkeitsgründen gilt f(x*) = limn f(xn ) ≤ 0 und f(x*) = limn f(yn ) ≥ 0, sodass f(x*) = 0.
Analoges gilt, wenn s1 = 1 und s2 = −1.
© Oliver Deiser
Einführung in die Mathematik 1
208
2. Abschnitt
Der analytische Kalkül
f
a
c0
c1
c2 c4
c3
b
Die ersten Stellen c0 , c1 , c2 , … eines Bisektionsverfahrens
Ein berühmtes Verfahren der Nullstellensuche beruht auf dem folgenden anschaulichen Satz:
Satz (Nullstellensatz für konvexe Funktionen)
Sei f : [ a, b ] → R differenzierbar und streng konvex mit f(a) < 0 < f(b).
Dann gilt:
(a) f besitzt eine eindeutige Nullstelle x*.
(b) f < 0 auf [ a, x* [ , f > 0 auf ] x*, b ], f ′ > 0 auf [ x*, b ].
Eine analoge Aussage gilt für den Fall f(a) > 0 > f(b).
Das Newton-Verfahren findet die Nullstelle x* durch wiederholtes Anlegen
von Tangenten. Ist x0 > x*, so liegt die Tangente
g(x) = f(x0 ) + f ′(x0 ) (x − x0 )
von f an der Stelle x0 aufgrund der Konvexität von f unterhalb von f. Sie schneidet die x-Achse an der Stelle
x1 = x0 −
f(x0 )
.
f ′(x1 )
Es gilt x* < x1 < x0 , sodass x1 näher an x* liegt als x0 . Diese Beobachtung motiviert:
Einführung in die Mathematik 1
© Oliver Deiser
4. Monotonie und Krümmung
209
Newton-Verfahren
Sei f : [ a, b] → R differenzierbar und streng konvex mit sgn(f(a)) ≠ sgn(f(b)).
Wir setzen
x0 =
{
b
a
f(a) < 0 < f(b)
f(b) < 0 < f(a).
falls
falls
Nun definieren wir xn rekursiv durch
xn + 1 = xn −
f(xn )
f ′(xn )
für alle n ≥ 0.
f
x3
x2
x1
x0
Die ersten Stellen einer Newton-Iteration x0 , x1 , x2 , …
Die Folge x0 , x1 , x2 , … wird auch als Newton-Iteration von f (zum Startwert x0 )
bezeichnet. Man kann wie erwartet zeigen, dass sie im Fall x0 = b streng monoton
fallend und im Fall x0 = a streng monoton steigend gegen die eindeutige Nullstelle x* von f konvergiert.
Analoge Ergebnisse gelten für streng konkave Funktionen. Durch Übergang
von f zu −f können wir aber immer Konvexität erreichen, ohne die Nullstelle zu
verändern.
Das Newton-Verfahren eignet sich insbesondere zur Berechnung von Wurzeln. Seien also k ≥ 1 und c > 0. Wir berechnen x* = k £c. Hierzu wählen wir ein
beliebiges b mit b > x*, etwa b = max(2, c). Dann ist x* die eindeutige Nullstelle
der streng konvexen Funktion f : [ 0, b ] → R mit
f(x) = xk − c
© Oliver Deiser
für alle x P [ 0, b ].
Einführung in die Mathematik 1
210
2. Abschnitt
Der analytische Kalkül
Die Newton-Iteration von f zum Startwert x0 = b ist gegeben durch
xn + 1 = xn −
xnk − c
k xnk − 1
für alle n ≥ 0.
Es gilt x* = limn xn . Speziell können wir eine Quadratwurzel x* = £c mit einem
beliebigen Startwert x0 > x* approximativ durch
xn + 1 = xn −
x2n − c
2 xn
xn + c/xn
2
=
für alle n ≥ 0
berechnen. Diese lange vor Newton bekannte Rekursion ist auch als Heron-Verfahren bekannt.
Ein Vergleich der beiden Verfahren
Wir berechnen
£2 = 1, 41421 35623 73095 04880 16887 24209 …
mit Hilfe des Bisektions- und des Newton-Verfahrens. Wir verwenden wieder
die Funktion f : [ 0, 2 ] → R mit
f(x) = x2 − 2.
Die beiden folgenden Tabellen zeigen die ersten Approximationen. Auf einen
Kommentar dürfen wir verzichten…
Newton/Heron-Verfahren zur Berechnung von £2
n
xn als Bruch
xn numerisch
0
2
2
1
3
2
1,5
2
17
12
1, 41666 …
3
577
408
1, 41421 56862 …
4
665857
470832
1, 41421 35623 74689 …
5
886731088897
627013566048
Einführung in die Mathematik 1
1, 41421 35623 73095 04880 16896 …
© Oliver Deiser
4. Monotonie und Krümmung
211
Bisektionsverfahren zur Berechnung von £2
n
cn als Bruch
cn numerisch
0
1
1
1
3
2
1,5
2
5
4
1,25
3
11
8
1,375
4
23
16
1,4375
5
45
32
1,40625
© Oliver Deiser
Einführung in die Mathematik 1
212
2. Abschnitt
Der analytische Kalkül
Übungen
Übung 1
Zeigen Sie, dass die Funktion f : ] 0, ∞ [ → R mit f(x) = (1 + 1/x)x für alle
x > 0 streng monoton steigend ist.
Übung 2
Sei I ein reelles Intervall, und sei f : I → R differenzierbar. Wir nennen f
quasipositiv, falls gilt
(a) f(x) ≥ 0 für alle x P I.
(b) es gibt kein Teilintervall [ a, b ] von I mit f(x) = 0 für alle x P [ a, b ].
Geben Sie Beispiele und Gegenbeispiele für diese Eigenschaft an. Begründen Sie zudem folgende Äquivalenz anschaulich oder beweisen Sie sie:
f ist quasipositiv genau dann, wenn f ist streng monoton steigend.
Formulieren Sie eine analoge Äquivalenz für streng monoton fallende
Funktionen.
Übung 3
Beweisen Sie die Aussagen (b) − (d) des Satzes über Extremwertbestimmung.
Übung 4
In der Aussage (a) des Satzes über Extremwertbestimmung ist die Voraussetzung, dass p kein Randpunkt von I ist, wesentlich. Illustrieren Sie dies
durch Beispiele. Wo geht diese Voraussetzung in den Beweis ein?
Übung 5
Geben Sie ein Beispiel für eine beliebig oft differenzierbare Funktion f und
eine lokale Maximalstelle p von f, für die (b) des Satzes über Extremwertbestimmung anwendbar ist, (d) jedoch nicht.
Übung 6
Sei I ein offenes Intervall und f : P → I beliebig oft differenzierbar. Weiter
seien p P I und n ≥ 1 derart, dass f (k) (p) = 0 für 1 ≤ k < n aber f (n) (p) ≠ 0 gilt.
Wann besitzt f an der Stelle p ein lokales Maximum, wann ein lokales
Minimum, wann kein lokales Extremum?
Übung 7
Sei I ein Intervall und f : I → R stetig und streng monoton steigend oder
streng monoton fallend. Welche Implikationen bestehen zwischen der
Konvexität/Konkavität von f und f − 1 ? Formulieren Sie allgemeine
Aussagen und geben Sie instruktive Beispiele an.
Einführung in die Mathematik 1
© Oliver Deiser
4. Monotonie und Krümmung
213
Übung 8
Mit den Funktionen und Bezeichnungen wie bei der Herleitungen des
Krümmungsradius: Verifizieren Sie, dass
gr ″(p) =
c3
.
r
Übung 9
Zeigen Sie, dass die Krümmungskreismittelpunkte der Einheitsparabel der
Graph der Funktion g: R → R sind mit
g(x) = 1/2 + 3/4 3 £4x2 für alle x P R.
Übung 10
Bestimmen Sie die Menge der Krümmungskreismittelpunkte der Kosinusfunktion.
© Oliver Deiser
Einführung in die Mathematik 1
5. Integration
Mit den Ableitungsregeln steht uns ein systematischer Kalkül zur Verfügung, mit
dessen Hilfe wir die Ableitung einer gegebenen elementaren Funktion effektiv
bestimmen können. Nun betrachten wir das umgekehrte Problem:
Wie findet man, gegeben eine Funktion f, eine Funktion F mit F′ = f ?
Dieses Problem des Auffindens einer Stammfunktion oder eines unbestimmten Integrals erweist sich als überraschend komplex. Weiter ist es eng mit dem geometrischen Problem der Berechnung von durch Funktionsgraphen definierten
Flächen verbunden (Berechnung von bestimmten Integralen). In diesem Kapitel
definieren wir die grundlegenden Konzepte, die mit diesen Fragen verbunden
sind, einschl. des Hauptsatzes der Differential- und Integralrechnung. Der
Frage der effektiven Berechnung von Integralen wenden wir uns im nächsten
Kapitel zu.
© Oliver Deiser
Einführung in die Mathematik 1
216
2. Abschnitt
Der analytische Kalkül
Stammfunktionen
Definition (Stammfunktion)
Sei f : P → R. Dann heißt eine Funktion F : P → R eine Stammfunktion von f,
falls F′ = f.
Wir möchten zu einer gegebenen Funktion eine Stammfunktion finden. Für
einfache Funktionen wie Polynome ist dies noch leicht möglich, aber im Allgemeinen ist diese Aufgabe weitaus schwieriger als das Problem der Bestimmung
der Ableitung. Der Leser denke etwa an Funktionen wie f = log oder f = log + log,
für die eine Stammfunktion nicht unmittelbar ersichtlich ist. Weiter zeigen
Funktionen wie 1/x und 1/(1 + x2 ), dass relativ einfache Funktionen komplizierte
Stammfunktionen besitzen können (in diesem Fall die Funktionen log und arctan). Während die Ableitung einer rationalen Funktion stets wieder eine rationale Funktion darstellt, ist eine Stammfunktion einer rationalen Funktion im Allgemeinen keine rationale Funktion mehr. Anders formuliert: Stammfunktionen
rationaler Funktionen müssen auch außerhalb der rationalen Funktionen gesucht werden. Analog wird sich zeigen, dass nicht jede elementare Funktion eine
elementare Stammfunktion besitzt. Damit müssen Stammfunktionen elementarer Funktionen auch außerhalb der elementaren Funktion gesucht werden.
Zwei wichtige Beobachtungen sind:
(1) Ist F eine Stammfunktion von f und c P R, so ist auch F + c eine Stammfunktion von f.
(2) Sind F und G Stammfunktionen von f, so gilt (F − G)′ = f − f = 0, sodass
ein c P R existiert mit F − G = c.
Kurz:
Eine Stammfunktion ist nur bis auf eine Konstante eindeutig bestimmt.
2
1
f(x)
F1 (x)
F2 (x)
-2
-1
1
2
F3 (x)
-1
Drei Stammfunktionen einer Funktion f
Einführung in die Mathematik 1
© Oliver Deiser
5.
Integration
217
Das Riemann-Integral
Das Problem des Auffindens einer Stammfunktion ist eng verknüpft mit einer
auf den ersten Blick ganz anderen Fragestellung:
Wie bestimmt man den signierten Inhalt der Fläche, die eine auf einem Intervall
[ a, b ] definierte reellwertige Funktion f mit der x-Achse einschließt?
Signiert (vorzeichenbehaftet) bedeutet dabei, dass Flächenanteile unterhalb
der x-Achse negativ zählen. Dies ermöglicht die folgende Sicht:
Signierte Flächen als Mittelwerte
Ist f : [ a, b ] → R auf einem Intervall der Länge 1 definiert, so ist der
signierte Flächeninhalt c anschaulich der Mittelwert der Funktion f, denn
die Funktion g : [ a, b ] → R mit konstantem Wert c definiert den gleichen
signierten Flächeninhalt wie die Funktion f, nämlich 1 ⋅ c. Ist allgemeiner
[ a, b ] ein Intervall der Länge m > 0, so ist der signierte Flächeninhalt c das
m-fache des Mittelwerts von f. Damit lässt sich die geometrische Fragestellung der Flächenbestimmung in die Fragestellung der Mittelwertbildung
übersetzen und umgekehrt:
Signierte Fläche = Mittelwert mal Intervall-Länge.
1.0
0.5
f(x)
c
0.2
0.4
0.6
0.8
1.0
-0.5
-1.0
Die signierte Fläche als Mittelwert c einer Funktion f : [ 0, 1 ] → R
Der Zusammenhang zwischen dem Problem der Flächenbestimmung und
dem Problem des Auffindens einer Stammfunktion ist schwieriger zu begründen. Wir werden diesen Zusammenhang im Hauptsatz der Differential- und
Integralrechnung genau angeben und verschiedene Argumente diskutieren.
Vorerst stellen wir aber die Stammfunktionen zurück und das Problem der signierten Flächenbestimmung (gleichwertig: Mittelwertbildung) an die Spitze.
© Oliver Deiser
Einführung in die Mathematik 1
218
2. Abschnitt
Der analytische Kalkül
Für eine Funktion f : [ a, b ] → R definieren wir
I ba f =
*
a
b
f =
*
b
f(x) dx = „signierter Flächeninhalt von f “.
a
Die so definierte reelle Zahl I ba nennen wir auch das (bestimmte) Integral über f
(von a bis b).
Approximation durch Riemann-Summen
Wenn wir den Inhalt einer Fläche der Ebene nicht als gegebenen Begriff voraussetzen wollen, können wir das Integral durch eine Approximation über
Rechtecksflächen (deren Flächeninhalt elementar bekannt ist) und eine Grenzwertbildung erklären. Hierzu definieren wir:
Definition (Partition, Zerlegungspunkt, Stützstellen, Feinheit, äquidistant)
Sei [ a, b ] ein reelles Intervall. Eine Folge p = (tk , xk )k ≤ n heißt eine Partition
von [ a, b ] der Länge n + 1, falls gilt
a = t0 ≤ x0 ≤ t1 ≤ x1 ≤ … ≤ tn ≤ xn ≤ b.
Wir nennen die Zahlen tk auch die Zerlegungspunkte und die Zahlen xk die
Stützstellen der Partition. Weiter setzen wir tn + 1 = b und nennen
δ(p) = maxk ≤ n (tk + 1 − tk )
die Feinheit der Partition. Die Partition heißt äquidistant, falls tk + 1 − tk für
alle k ≤ n gleich ist.
Beispiel
Wir betrachten das Intervall [ a, b ] = [ 0, 1 ] und setzen
tk = xk = k/10 für alle 0 ≤ k ≤ 9.
Dann ist p = (tk , xk )k ≤ n eine Partition von [ 0, 1 ] der Länge 10. Nach
unserer Konvention ist t10 = b = 1, sodass die Zerlegungspunkte
0 = t0 , t1 , …, t9 , t10 = 1
das Intervall [ 0, 1 ] in 10 Teilintervalle zerlegen. Die Länge einer Partition
ist damit gleich der Anzahl der erzeugten Teilintervalle.
Die Partition p ist äquidistant und besitzt die Feinheit δ = 1/10. Da die
Stützstellen xk mit den linken Intervallgrenzen der Teilintervalle [ tk , tk +1 ]
zusammenfallen, sagen wir auch, dass die Partition linksseitige Stützstellen
besitzt. Setzen wir dagegen xk = tk + 1 für alle k, so sprechen wir von rechtsseitigen Stützstellen. Schließlich sind mittige Stützstellen durch xk = (tk + 1 − tk )/2
definiert. Prinzipiell können die Stützstellen beliebig in den zugehörigen
Teilintervallen gewählt werden. Links/rechts/mittig sind lediglich drei
wichtige Typen.
Einführung in die Mathematik 1
© Oliver Deiser
5.
Integration
219
Mit Hilfe von Partitionen können wir nun Approximationen an den gesuchten
Flächeninhalt einer gegebenen Funktion definieren:
Definition (Riemann-Summe)
Sei f : [ a, b ] → R und p = (tk , xk )k ≤ n eine Partition von [ a, b ]. Dann heißt
∑ p f = ∑ k ≤ n f(xk ) (tk + 1 − tk )
die Riemann-Summe von f bzgl. p.
t0
t0 = x 0
x0
t1 = x 1
t1
t2 = x 2
x1
t3 = x 3
t4 = x 4
t2
t5 = x 5
x2
t6 = x 6
t3
x3
t4
x4
t5
t7 = x 7
t8 = x 8
t9 = x 9
x10
Dargestellt sind zwei Riemann-Summen einer Funktion der Länge 5 bzw. 10.
Die zweite Partition ist äquidistant und besitzt linksseitige Stützstellen.
© Oliver Deiser
Einführung in die Mathematik 1
220
2. Abschnitt
Der analytische Kalkül
Je feiner eine Partition ist, desto besser approximiert eine Riemann-Summe
den signierten Flächeninhalt. Dies motiviert:
Definition (Riemann-Integral)
Eine Funktion f : [ a, b ] → R heißt Riemann-integrierbar mit RiemannIntegral c P R, falls für jede Folge (pn )n P N von Partitionen von [ a, b ] mit
limn → ∞ δ(pn ) = 0 gilt, dass limn → ∞ ∑ p f = c. Wir schreiben dann
*
Iba f =
b
*
f =
a
b
f(x) dx = c.
a
Die Limesbedingung der Definition notieren wir auch suggestiv in der Form
lim δ(p)
→0
∑ p f = c.
Bemerkung
Ist f : [ a, b ] → R integrierbar und (pn )n P N eine Folge von Partitionen,
deren Feinheiten gegen 0 konvergieren, so gilt nach Definition des
Integrals, dass
limn
→∞
∑ pn f =
*
b
f.
a
Damit kann jede derartige Folge zur Berechnung des Integrals verwendet
werden, insbesondere eine Folge äquidistanter Partitionen (mit linksseitigen, mittigen oder rechtsseitigen Stützstellen).
Man kann zeigen:
Satz (Integrierbarkeit der elementaren Funktionen)
Jede elementare Funktion f : [ a, b ] → R ist Riemann-integrierbar.
Ein ebenso berühmtes wie instruktives Beispiel für eine nicht Riemann-integrierbare Funktion ist:
Definition (Dirichlet-Sprungfunktion)
Die Dirichlet-Sprungfunktion f : [ 0, 1 ] → R ist definiert durch
f(x) =
{
1
falls x rational,
0
falls x irrational.
Die Dirichletsche Sprungfunktion nimmt in jedem noch so kleinen Teilintervall [ a, b ] von [ 0, 1 ] mit a < b sowohl den Wert 1 als auch den Wert 0 an. Damit
ist nicht klar, ob dieser Funktion überhaupt ein sinnvoller Flächeninhalt zugeordnet werden kann. In Sinne des Riemann-Integrals ist dies nicht möglich. Der
explizite Nachweis, dass die Dirichletsche Sprungfunktion nicht Riemann-integrierbar ist, sei dem Leser zur Übung empfohlen.
Einführung in die Mathematik 1
© Oliver Deiser
5.
Integration
221
Intervallgrenzen und Rückwärtsintegrale
Wir führen noch einige Notationen ein, die den Umgang mit Integralen erleichtern. Für ein Teilintervall [ c, d ] von [ a, b ] setzen wir
*
d
f =
*
d
g,
c
c
wobei g : [c, d] → R die auf [c, d] eingeschränkte Funktion f ist, d.h. g = f |[c, d].
Weiter definieren wir
*
a
*
f = −
b
b
für b < a
f
a
(Rückwärtsintegral)
Eigenschaften des Integrals
Durchgehend gebraucht werden:
Satz (elementare Eigenschaften des Integrals)
Sei [ a, b ] ein reelles Intervall. Dann gilt für alle integrierbaren Funktionen
f, g : [ a, b ] → R, alle c P R und alle s P [ a, b ]:
(1)
*
b
1 = b − a,
(Normierung)
a
(2)
*
c f = c * f,
*
b
(f + g) = c
*
a
(5)
*
*
b
f + d
b
f ≤
b
f =
a
*
*
b
g,
(Additivität)
a
a
a
(4)
(Skalierung)
a
a
(3)
b
b
b
g, falls f(x) ≤ g(x) für alle x P [ a, b ],
a
s
*f
+
*
b
f
(Monotonie)
(Aufspaltung)
s
a
Zum Beweis zeigt man, dass die Eigenschaften für Riemann-Summen gelten
und beim Grenzübergang zum Integral erhalten bleiben. Die zweite und dritte
Eigenschaft können wir zusammenfassen zu
*
b
(c f + d g) = c
a
© Oliver Deiser
*
a
b
f + d
*
b
g.
(Linearität)
a
Einführung in die Mathematik 1
222
2. Abschnitt
Der analytische Kalkül
Der Hauptsatz der Differential- und Integralrechnung
Wir haben das Integral mit Hilfe von Flächeninhalten bzw. Mittelwerten eingeführt. Den Zusammenhang zum ursprünglichen Problem des Auffindens von
Stammfunktion beschreibt:
Satz (Hauptsatz der Differential- und Integralrechnung, HDI)
Sei f : [ a, b ] → R integrierbar.
Teil 1: Berechnung von Integralen
Ist F eine Stammfunktion von f, so gilt
*
b
f = F(b) − F(a).
a
Teil 2: Existenz von Stammfunktionen
Sei s P [ a, b ] und F : [ a, b ] → R definiert durch
F(x) =
*
x
f
für alle x P [ a, b ].
s
Dann gilt: Ist f stetig, so ist F eine Stammfunktion von f.
Kurz:
(1) Mit Stammfunktionen können wir Integrale berechnen.
(2) Mit Integralen können wir Stammfunktionen definieren.
In diesem Sinne sind Integrieren und Differenzieren invers zueinander.
Der erste Teil des Hauptsatzes erlaubt die Berechnung eines Integrals durch
die Bestimmung (bei der auch das Raten erlaubt ist) einer Stammfunktion des Integranden. Hierbei ist folgende Notation nützlich:
Definition (Auswertungsnotation)
Wir setzen
F
b
a
F
=
b
a
= F(b) − F(a).
Damit gilt also unter den Voraussetzungen des ersten Teils des Satzes
*
a
b
f = F
b
a
.
Der zweite Teil des Satzes garantiert die Existenz von Stammfunktionen für
eine wichtige Klasse von Funktionen. Liegt keine Stammfunktion einer stetigen
Funktion f vor, so erlaubt der Satz die approximative Berechnung einer solchen
Einführung in die Mathematik 1
© Oliver Deiser
5.
Integration
223
durch die approximative Berechnung von Integralen (z.B. durch Riemann-Summen). Der erste Teil des Satzes ergibt sich aus dem zweiten, wenn man sich auf
stetige Funktionen f : [ a, b ] → R beschränkt. Wir diskutieren dies in den Übungen.
Der erste Teil des Hauptsatzes erlaubt in vielen Fällen die mühelose Berechnung von Integralen. Die komplizierte Flächenberechnung durch einen Grenzübergang mit Riemann-Summen entfällt. Dennoch bleiben die Riemann-Summen wertvoll: Ist keine Stammfunktion von f bekannt, so kann mit ihrer Hilfe
ein approximativer Wert sehr effektiv berechnet werden. Dies zeichnet die Riemann-Summen vor den aus der Schule vielleicht bekannten Ober- und Untersummen aus, die theoretisch wichtig und elegant sind, sich aber bei weitem nicht
so einfach berechnen lassen wie die Riemann-Summen mit ihren konkreten
Stützstellen.
Beispiele
(1) Für alle a, b P R gilt
*
b
x2 dx =
a
x3
3
x=b
x=a
=
b 3 − a3
.
3
Der Leser versuche, das Integral für den Spezialfall a = 0 und b = 1 mit
Hilfe von Riemann-Summen zu berechnen!
(2)
*
2
1
(3)
*
1
0
1
dx = log(x)
x
2
1
= log 2 − log 1 = log 2.
1
dx = arctan(x)
1 + x2
1
0
= arctan 1 − arctan 0 =
π
.
4
(4) Das Integral
*
2
log(arctan(x2 )) dx
1
lässt sich mit Hilfe von Riemann-Summen approximativ berechnen. Wir
wählen äquidistante Partitionen der Länge n mit linksseitigen Stützstellen und erhalten gerundet auf fünf Nachkommastellen die Werte
0,07633 für n = 10,
0,10080 für n = 100,
0,10316 für n = 1000.
0,10340 für n = 10000.
Eine genauere numerische Approximation liefert
0,1034225943675219…
mit exakten Nachkommastellen.
© Oliver Deiser
Einführung in die Mathematik 1
224
2. Abschnitt
Der analytische Kalkül
Zum Beweis des Hauptsatzes
Ein strenger Beweis des Hauptsatzes wird innerhalb einer systematischen
Darstellung der Analysis geführt. Wir begnügen uns hier mit einer Argumentation, die den „magischen Zusammenhang“ zwischen Differentiation und Integration ans Licht bringt, und die sich zudem als Grundlage für einen vollständigen Beweis eignet.
Argumentation mit Riemann-Summen
Sei p = (tk , xk )k ≤ n eine sehr feine Partition von [ a, b ], d. h. δ(p) ist sehr klein.
Dann gilt (mit , = „wird approximiert durch, ist ungefähr gleich“):
*
b
a
f , ∑ p f = ∑ k ≤ n f(xk ) (tk + 1 − tk )
= ∑ k ≤ n F′(xk ) (tk + 1 − tk )
F(tk + 1 ) − F(tk )
(tk + 1 − tk )
tk + 1 − tk
, ∑k ≤ n
= ∑ k ≤ n (F(tk + 1 ) − F(tk ))
= F(tn + 1 ) − F(t0 )
= F(b) − F(a).
Die Summe der drittletzten Zeile ist eine sog. Teleskop-Summe: Es bleiben nur
die äußersten Summanden übrig, da sich alle anderen paarweise aufheben.
Noch bestechender wird das Argument, wenn wir die Leibniz-Notation ernst
nehmen und infinitesimal rechnen:
Argumentation mit infinitesimalen Größen
Wir fassen das Integral über f von a nach b als Summe von infinitesimalen
Rechtecksflächen f(x) ⋅ dx auf und die Ableitung als Quotienten dF(x)/dx
infinitesimaler Größen. Dann können wir schreiben
*
b
f(x) dx =
*
b
F′(x) dx =
a
a
a
=
*
*
b
b
dF(x)
dx
dx
dF(x) = F(b) − F(a).
a
Im letzten Schritt haben wir eine „infinitesimale Teleskop-Summe“ aufgelöst,
die sich erneut auf die beiden äußersten Summanden reduziert.
Einführung in die Mathematik 1
© Oliver Deiser
5.
Integration
225
Das erste Argument lässt sich vergleichsweise leicht mit Hilfe eines
Grenzübergangs zu einem vollständigen Beweis ausbauen. Ein Integral ist ja
als Grenzwert von Riemann-Summen und eine Ableitung als Grenzwert von
Differenzenquotienten definiert. Das zweite Argument benötigt die exakte
Einführung infinitesimaler Größen, was zwar aufwendig, innerhalb der im
20. Jahrhundert entwickelten Nonstandard-Analysis aber möglich ist.
Uneigentliche Integrale
Wir haben bislang nur Funktionen betrachtet, die auf endlichen Intervallen
definiert sind. Um auch andere Funktionen behandeln zu können, führt man zusätzliche Grenzübergänge ein. Im Fall der Existenz setzen wir
*
a
∞
f = limb
→∞
*
b
*
f,
a
b
−∞
f = lima
→ −∞
*
b
f,
a
*
∞
f =
−∞
*
∞
f +
0
*
0
f.
−∞
Analog werden Polstellen behandelt. Dabei ist es allgemein üblich, ein uneigentliches Integral über f von a bis b nur dann zu erklären, wenn f auf jedem
Teilintervall [ c, d ] mit a < c < d < b integrierbar im ursprünglichen Sinn ist. Damit kann man zum Beispiel nicht über Polstellen im Inneren der Integrationsgrenzen hinweg integrieren. Natürlich lässt sich das Integral für solche Fälle
verallgemeinern, solange sich ein wohldefinierter Grenzwert ergibt.
Beispiel
*
1
0
1
log x dx = lima → 0 * log x dx = lima → 0 x(log(x) − 1)
a
= −1 − lima
→0
x=1
x=a
a(log(a) − 1) = −1 − 0 = −1.
log(x)
0.2
0.4
0.6
0.8
1.0
1.2
1.4
-1
-2
-3
-4
© Oliver Deiser
Ein uneigentliches Integral für den Logarithmus
Einführung in die Mathematik 1
226
2. Abschnitt
Der analytische Kalkül
Übungen
Übung 1
Sei f : [ 0, 1 ] → R mit f(x) = x für alle x. Für alle n sei pn eine äquidistante
Partition von [ 0, 1 ] der Länge n (und beliebigen Stützstellen). Zeigen Sie
limn
→∞
∑ pn f =
1
.
2
Übung 2
Zeigen Sie mit Hilfe der Definition des Riemann-Integrals, dass die
Dirichletsche Sprungfunktion f : [ 0, 1 ] → R nicht Riemann-integrierbar
ist.
Übung 3
Geben Sie mit Hilfe von Skizzen anschauliche Argumente für die elementaren Eigenschaften des Integrals. Legen Sie dabei besonderes Augenmerk
auf die Additivität.
Übung 4
Zeigen Sie Teil 1 des Hauptsatzes mit Hilfe von Teil 2, unter der Voraussetzung der Stetigkeit von f.
Übung 5
Berechnen Sie die Fläche des Einheitskreises mit Hilfe von Integration und
der Funktion F : [ −1, 1 ] → R mit
F(x) = x £1 − x2 + arcsin x für alle x P [ −1, 1 ].
Einführung in die Mathematik 1
© Oliver Deiser
6. Integrationsregeln
Wir entwickeln nun einen Kalkül zur Bestimmung von Integralen. Dieser Kalkül
besteht aus Integrationsregeln, die wir durch Umkehrung der Ableitungsregeln
gewinnen. Der Kalkül erweist sich als sehr leistungsfähig, aber auch als deutlich
komplizierter und subtiler als der Kalkül des Differenzierens. Seine theoretischen Grenzen findet er in der Tatsache, dass nicht jede elementare Funktion
eine elementare Stammfunktion besitzt.
© Oliver Deiser
Einführung in die Mathematik 1
228
2. Abschnitt
Der analytische Kalkül
Unbestimmte Integrale
Bevor wir die Integrationsregeln besprechen, führen wir noch eine nützliche
Notation ein.
Notation
Sei I ⊆ R ein (beschränktes oder unbeschränktes) Intervall und sei f : I → R
derart, dass f auf jedem beschränkten Intervall [ a, b ] ⊆ I integrierbar ist.
Weiter besitze f eine Stammfunktion. Dann bezeichnen wir mit
I(f ) =
*f
(unbestimmtes Integral)
irgendeine Stammfunktion von f.
Da eine Stammfunktion nur bis auf eine Konstante bestimmt ist, müsste man genauer das unbestimmte Integral als Menge aller Stammfunktionen definieren.
Unsere Notation ist aber einfacher und in der Regel ungefährlich. Alternativ ist
auch die „+ c“-Schreibweise möglich.
Nach dem Hauptsatz gilt für alle a, b im Definitionsbereich von f:
*
b
f =
a
( *f )
b
a
= F(b) − F(a)
für jede auf [ a, b ] definierte Stammfunktion F von f.
Nach Definition gilt
( * f ) ′ = f.
Ist f stetig differenzierbar (sodass f ′ stetig ist und damit eine Stammfunktion von
f existiert), so gilt
* f′
= f.
In der alternativen Notation lesen sich die Zusammenhänge als
I(f)′ = f und I(f ′) = f
bzw. D(I(f)) = f und I(D(f)) = f.
Beispiele
(1)
*0
(2)
* 1 dx
= x,
(3)
* sin x
dx = − cos x.
= 1,
*0
= c für alle c P R.
*x
= x2 /2,
Einführung in die Mathematik 1
© Oliver Deiser
6.
Integrationsregeln
229
(4) Bei der Integration von Funktionen, die durch Terme definiert sind, ist
die fehlende Angabe des Definitionsbereichs zuweilen gefährlich. So
gilt zum Beispiel
*
{
1
dx =
x
falls x > 0,
falls x < 0.
log(x)
log(−x)
Man kann dies durch
*
1
dx = log | x |
x
zusammenfassen.
4
2
-2
1
x
-1
1
2
log( x )
-2
-4
Prinzipiell muss aber immer ein Intervall, auf dem die zu integrierende
Funktion definiert ist, gegeben sein. Das unbestimmte Integral ist nur
für Funktionen erklärt, die auf einem Intervall definiert sind. Ist kein
Intervall explizit angegeben, so geht es aus dem Kontext hervor oder
die Überlegungen gelten für jedes Intervall, auf dem der Integrationsterm eine Funktion definiert.
Linearität
Die einfachste Integrationsregel ist die Linearität: Existieren die unbestimmten Integrale für f, g : I → R und sind c, d P R, so gilt
* c f(x) + d g(x) dx
= c * f(x) dx + d * g(x) dx.
Die Regel ergibt sich aus der Linearität der Ableitung: Sind F und G Stammfunktionen von f bzw. g, so gilt
(c F + d G)′ = c F′ + d G′ = c f + d g.
© Oliver Deiser
Einführung in die Mathematik 1
230
2. Abschnitt
Der analytische Kalkül
Die Linearität ist bei der Berechnung von Integralen ständig im Einsatz. Besonders nützlich ist sie bei der Integration rationaler Funktionen im Zusammenspiel mit der Partialbruchzerlegung:
Beispiel
Mit Hilfe von Partialbruchzerlegung berechnen wir für x > 1:
2x2 + 1
dx
(x − 1)3
*
=
*
3
(x − 1)3
4
(x − 1)2
=
*
3
dx +
(x − 1)3
+
*
−4
x−1
+
2
dx
x−1
4
dx +
(x − 1)2
=
−3
2 (x − 1)2
+
=
−8x + 5
2 (x − 1)2
+ 2 log(x − 1).
*
2
dx
x−1
+ 2 log(x − 1)
Partielle Integration
Satz (partielle Integration)
Seien f, g : I → R stetig differenzierbar. Dann gilt:
*f′ g
*
a
= fg −
b
f′g = fg
b
a
* f g′,
−
*
b
f g′ für alle a, b P I.
a
Der Beweis ergibt sich aus der Ableitungsregel (fg)′ = f ′ g + g′f, denn
fg =
* (f g)′
=
* (f ′ g
+ f g′) =
* f ′ g + * f g′.
Die Version für bestimmte Integrale ergibt sich durch Auswertung, denn für alle
a, b P I gilt:
*
a
b
f′g =
fg −
* f g′
b
a
=
fg
b
a
−
* f g′
b
a
= fg
b
a
−
*
b
f g′.
a
In Anwendungen verwendet man die partielle Integration, um die Ableitung
eines Faktors eines Produkts auf den anderen Faktor zu übertragen − auf Kosten
eines Produkts fg. Sehr sorgfältig muss man auf die Vorzeichen achten, die eine
Fehlerquelle bei der partiellen Integration darstellen.
Einführung in die Mathematik 1
© Oliver Deiser
6.
Integrationsregeln
231
Beispiel: Einfügen der Eins-Funktion
Auch wenn kein Produkt zu integrieren ist, lässt sich die partielle Integration manchmal gewinnbringend anwenden. Denn statt f können wir immer
1 ⋅ f schreiben. Damit lässt sich zum Beispiel eine Stammfunktion des
Logarithmus finden:
* log(x) dx
=
* 1 log(x) dx
= x log(x) −
*x ⋅
1
dx
x
= x log(x) − x = x (log(x) − 1).
1.0
0.5
1
2
3
4
log(x)
x (log(x) - 1)
-0.5
-1.0
-1.5
Analog gilt für den Arkustangens
* arctan(x) dx
=
* 1 arctan(x) dx
= x arctan(x) −
*
x
dx
1 + x2
1
log(1 + x2 ),
2
= x arctan(x) −
wobei wir das Logarithmus-Integral an dieser Stelle raten.
2
arctan(x)
x arctan(x) -
1
log 1 + x2
2
x
-1
2
-6
-4
-2
2
4
6
-
© Oliver Deiser
Einführung in die Mathematik 1
232
2. Abschnitt
Der analytische Kalkül
Beispiel: Integration von cos2
In diesem Beispiel verwenden wir die partielle Integration zusammen mit
einer trigonometrischen Identität. Es gilt
* cos2(x) dx
=
* cos(x) cos(x) dx
=
* cos(x) sin′(x) dx
= cos(x) sin(x) −
* cos′(x) sin(x) dx
= cos(x) sin(x) +
* sin2(x) dx.
Addition von * cos2 (x) auf beiden Seiten ergibt
2
* cos2(x) dx
= cos(x) sin(x) +
* (sin2(x) + cos2(x)) dx
= cos(x) sin(x) +
* 1 dx
= cos(x) sin(x) + x.
Division durch 2 liefert eine Stammfunktion von cos2 x. Eine solche lässt
sich auch ohne partielle Integration finden, wenn man die Formel
2 cos2 (x) = cos(2x) + 1
verwendet, die sich aus
cos(2x) = cos2 x − sin2 x = cos2 x − (1 − cos2 x)
ergibt. Die Berechnung lautet dann:
2
* cos2(x) dx
=
* cos(2x) + 1 dx
= sin(2x)/2 + x = cos(x) sin(x) + x.
Gerade für die Integration gilt: Es gibt oft mehrere Wege, die ans Ziel
führen. Neben den Integrationsregeln sind geeignete Termumformungen
ein entscheidendes Hilfsmittel.
3
2
1
cos2 (x)
-2
-
2
1
(cos(x) sin(x) + x)
2
-1
-2
-3
Einführung in die Mathematik 1
© Oliver Deiser
6.
Integrationsregeln
233
Die Substitutionsregel
Satz (Substitutionsregel)
Seien f : J → R stetig und s : I → J stetig differenzierbar. Dann gilt
* (f + s) s′
*
( *f)
=
b
(f + s) s′ =
*
s(b)
+ s,
f
für alle a, b P I.
s(a)
a
Nach den Voraussetzungen sind
f : J → R und (f + s) ⋅ s′ : I → R
stetig, sodass diese Funktionen Stammfunktionen besitzen. Sei F eine Stammfunktion von f, d. h.
* f.
F =
Nach der Kettenregel ist
(F + s)′ = (f + s) ⋅ s′,
sodass
(*f )
+ s = F + s
eine Stammfunktion von (f + s) ⋅ s′ ist. Dies zeigt die Version für unbestimmte Integrale. Auswertung liefert
*
b
(f + s) s′ =
F + s
a
b
a
= F
s(b)
s(a)
=
*
s(b)
f
für alle a, b P I.
s(a)
In Anwendungen wird die Regel oft von rechts nach links (Einführen einer
Substitution) statt von links nach rechts (Elimination einer Substitution) verwendet: Gesucht ist eine Stammfunktion von f. Um eine solche zu finden, führt
man eine injektive Substitutionsfunktion s ein, sodass
*f
=
( * (f + s) s′ )
+ s− 1 .
Bei einer geschickt gewählten Funktion s kann der Integrand auf der rechten
Seite deutlich einfacher sein als der Integrand f auf der linken Seite.
Bei der Durchführung des Substitutions-Verfahrens bewährt sich die LeibnizNotation:
© Oliver Deiser
Einführung in die Mathematik 1
234
2. Abschnitt
Der analytische Kalkül
Anwendung der Substitutionsregel in der Leibniz-Notation
(1) Zu bestimmen ist das Integral einer in der Variablen x gegebenen
Funktion f.
(2) Man setzt x = s(t) für eine frei gewählte stetig differenzierbare
Substitutionsfunktion s, deren Werte im Definitionsbereich des
Integranden liegen.
(3) Aus
dx
dt
=
ds(t)
dt
= s′(t)
gewinnen wir
(+) dx = ds(t) = s′(t) dt.
Folglich ist
* f(x) dx
=
* f(s(t)) ds(t)
=
* f(s(t)) s′(t) dt.
(4) Die Bestimmung des Integrals auf der rechten Seite in (3) (evtl. mit
Hilfe weiterer Substitutionen) liefert eine Funktion F(t) in der
Variablen t, die man zur Berechnung bestimmter Integrale über f
verwenden kann:
*
x=b
x=a
−1
f(x) dx =
*
t = s (b)
−1
t = s (a)
t = s−1 (b)
f(s(t)) s′(t) dt = F(t)
t = s−1 (a)
.
Die Substitutionsfunktion s muss dabei nicht injektiv sein, in den
Intervallgrenzen kann man beliebige Urbilder von a und b einsetzen.
Ist s injektiv, so liefert das Einsetzen von t = s− 1 (x) (Rücksubstitution)
in F(t) eine Funktion F(s− 1 (x)) in x. Diese Funktion ist eine Stammfunktion von f.
Zuweilen wird im Schritt (2) auch ein funktionaler Zusammenhang der Form
t = h(x), dt = dh(x) = h′(x) dx
hergestellt, der der unmittelbaren Vereinfachung des Integranden dient: Terme
der Form h(x) im Integranden werden zu t, h′(x)dx wird zu dt und die Integrationsgrenzen a und b werden zu h(a) und h(b) (dies entspricht der Anwendung der
Regel von links nach rechts: Entfernen einer Substitution). Weiter verzichtet
man oft darauf, den Substitutionsfunktionen Namen zu geben und rechnet statt
dessen mit Variablen, die über bestimmte Terme miteinander zusammenhängen.
Anders formuliert: Die Variablen t und x werden als Funktionen t(x) und x(t) aufgefasst.
Die folgenden Beispiele erläutern das Verfahren.
Einführung in die Mathematik 1
© Oliver Deiser
6.
Integrationsregeln
235
Beispiel: Geraden als Substitution
Seien c, d P R mit c ≠ 0. Wir betrachten das Integral
*
b
f(c x + d) dx
a
für eine beliebige Funktion f, für die das Integral in den Grenzen von a bis
b definiert ist. Mit
t = c x + d, dt = c dx
gilt
*
b
f(cx + d) dx =
a
=
1
c
*
1
c
*
x=b
f(c x + d) c dx =
x=a
t = cb + d
f(t) dt =
t = ca + d
1
c
*
cb + d
f(t) dt.
ca + d
In der unbestimmten Form können wir schreiben:
* f(c x + d) dx
1
c
=
* f(t) dt
=
1
F(t) =
c
1
F(cx + d),
c
wobei F(t) eine in t = t(x) notierte Stammfunktion von f ist.
Beispiel: Integral einer logarithmischen Ableitung
Sei g : [ a, b ] → ] 0, ∞ [ stetig differenzierbar. Wir betrachten das Integral
*
b
g′(x)
g(x)
a
dx.
Mit
t = g(x), dt = g′(x) dx
erhalten wir
*
x=b
x=a
g′(x)
dx =
g(x)
*
t = g(b)
t = g(a)
1
dt = log(t)
t
t = g(b)
t = g(a)
x=a
= log(g(x))
x=b
.
In unbestimmter Form gilt
*
g′(x)
g(x)
dx =
*
1
dt = log(t) = log(g(x)) .
t
Die Stammfunktion log(g(x)) lässt sich in diesem einfachen Fall natürlich
auch raten, vgl. obiges Beispiel zur Berechnung der Integrals des Arkustangens. Der Quotient L(g) = g′/g ist als logarithmische Ableitung der
Funktion g bekannt. Er erfüllt die Ableitungsregel L(gh) = L(g) + L(h).
© Oliver Deiser
Einführung in die Mathematik 1
236
2. Abschnitt
Der analytische Kalkül
Beispiel: Berechnung von Kreisflächen, I
Sei r > 0 und Kr = { (x, y) P R2 | x2 + y2 = r2 } der Kreis mit Mittelpunkt 0
und Radius r. Wir berechnen die Fläche dieses Kreises mit Hilfe von
Integration. Hierzu betrachten wir die Funktion f : [ −r, r ] → R mit
f(x) = £r2 − x2 für alle x P [ −r, r ],
deren Graph die obere Hälfte des Kreises ist.
r
f(x)
r
1 - x2
-r
x
r
Das Integral über f von −r bis r ist die Hälfte der gesuchten Kreisfläche.
Zur Berechnung dieses Integrals setzen wir
x = r sin(t), dx = r cos(t) dt.
Dann gilt
*
r
−r
f(x) dx =
*
x=r
£r2 − x2 dx =
*
t = π/2
t = π/2
£r2 − r2 sin2 (t) r cos(t) dt
t = −π/2
x = −r
= r2
*
£1 − sin2 (t) cos(t) dt
t = −π/2
= r2
*
t = π/2
£cos2 (t) cos(t) dt
t = −π/2
= r2
*
t = π/2
|cos(t)| cos(t) dt = r2
cos(t) sin(t) + t
2
t = π/2
cos2 (t) dt
t = −π/2
t = −π/2
= r2
*
t = π/2
t = −π/2
= r2
(
π
π
+
4
4
)
= r2
π
,
2
wobei wir cos(t) ≥ 0 für t P [ −π/2, p/2 ] und das oben mit Hilfe partieller
Integration berechnete Integral über cos2 verwendet haben. Damit
berechnet sich die Kreisfläche zu r2 π.
Einführung in die Mathematik 1
© Oliver Deiser
6.
Integrationsregeln
237
Beispiel: Berechnung von Kreisflächen, II
Sei r > 0. Wir bestimmen in Erweiterung des vorangehenden Beispiels eine
Stammfunktion von f : [ −r, r ] → R mit
f(x) = £r2 − x2 für alle x P [ −r, r ].
Sei wieder
x = r sin(t), dx = r cos(t) dt, t = arcsin
( xr ).
Dann gilt (wie in obiger Rechnung)
* f(x) dx
= r2
* cos2(t) dt
= r2
cos(t) sin(t) + t
2
(Rücksubstitution)
=
r2
2
(cos(arcsin( xr ))
=
r2
2
( £1 − x /r
=
1
2
( x £r − x
2
2
2
2
x
x
+ arcsin
r
r
( ))
x
x
+ arcsin
r
r
( ))
+ r2 arcsin
( xr ) ) .
Auswerten der Stammfunktion in den Grenzen von x = −r bis x = r liefert
wegen arcsin(±1) = ± π/2 erneut den Wert r2 π/2 und damit die Hälfte der
Fläche eines Kreises mit Radius r. Mit der Stammfunktion lassen sich aber
allgemeiner aber auch Teilflächen eines Kreises und insbesondere Kreissegmente berechnen. Für r = 1 ergibt sich folgendes Bild:
4
1 - x2
-1.0
-0.5
0.5
1.0
1
x
2
1 - x2 + arcsin(x)
4
© Oliver Deiser
Einführung in die Mathematik 1
238
2. Abschnitt
Der analytische Kalkül
Die Substitutionsregel kann bei der Berechnung eines Integrals mehrfach
hintereinander angewendet werden. Nach einer Substitution t = s1 (x) können
wir zum Beispiel u = s2 (t) setzen. Sind s1 und s2 injektiv, so lautet die Rücksubstitution
x = s1 −1 (t) = s1 −1 (s2 −1 (u)).
Erneut können wir die Notation zu t = t(x) und u = u(t) vereinfachen, sodass die
Substitutionsfunktionen mit den Variablennamen verschmelzen.
Beispiel: Mehrfache Substitution
Mit den Substitutionen
t = sin(x), dt = cos(x) dx,
u = 2t, du = 2 dt
gilt
*
cos x
dx =
1 + 4 sin2 x
*
1
dt
1 + 4t2
=
*
1
1 + u2
1
du
2
1
arctan(2t)
2
=
1
arctan(u) =
2
=
1
arctan(2sin(x)).
2
Zur Illustration der Regel betrachten wir noch:
Beispiel: Nichtinjektive Substitutionen
Mit der Substitution
x = sin(t), dx = cos(t) dt
gilt
* 2x dx
=
* 2 sin(t) cos(t) dt
= sin2 (t).
Wegen x2 = sin2 (t) erhalten wir die Stammfunktion x2 , formal aber nur auf
dem Intervall [ −π/2, π/2 ], auf dem die Substitution injektiv ist: Auf diesem
Intervall ist t = arcsin(x) und sin2 (t) = sin2 (arcsin(x)) = x2 . Zur Berechnung
von bestimmten Integralen mit Intervallgrenzen im Wertebereich [ −1, 1 ]
der Substitutionsfunktion können wir aber die Funktion sin2 (t) mit
beliebigen Urbildern der Intervallgrenzen verwenden. Wegen sin(−2π) = 0
und sin(9π/2) = sin(π/2 + 4π) = 1 ist zum Beispiel
*
0
1
2x dx = sin2 (t)
t = 9π/2
t = −2π
Einführung in die Mathematik 1
.
© Oliver Deiser
6.
Integrationsregeln
239
Die Frage nach der Injektivität der Substitutionsfunktion stellt sich in der
Praxis eher selten, da eine nichtinjektive Substitution das Integrationsintervall
unnötig mehrfach durchläuft. Benötigt wird die Injektivität zudem nur bei der
Rücksubstitution, in bestimmten Integralen genügt es, beliebige Urbilder zu
finden.
Elimination trigonometrischer Funktionen
Wir betrachten Substitutionen, die trigonometrische Funktionen aus Integranden entfernen. Grundlage hierzu ist eine Arkustangens-Substitution:
(Sub1)
x = arctan t, dx =
1
dt, t = tan x.
1 + t2
Für alle x P ] − π/2, π/2 [ gilt
cos x =
1
£1 + tan2 x
, sin x = tan x cos x.
Wegen x = arctan t P ] −π/2, π/2 [ für alle x P R erhalten wir
cos(arctan t) =
1
£1 + t
2
,
sin(arctan t) =
t
£1 + t2
für alle t P R.
Damit lassen sich alle Kosinus- und Sinusfunktionen eines Integranden mit Hilfe
der Arkustangens-Substitution eliminieren. Durch eine auf den ersten Blick unscheinbare Variante können wir zudem auch noch die Wurzeln vermeiden:
(Sub2)
x = 2 arctan t, dx =
2
x
dt, t = tan(
).
2
1+t
2
Bei dieser Substitution erhalten wir aufgrund der Verdopplungsformeln
cos(2t) = cos2 t − sin2 t, sin(2t) = 2 cos t sin t,
die rein rationalen Formeln
cos ( 2 arctan t ) =
1 − t2
,
1 + t2
sin ( 2 arctan t ) =
2t
1 + t2
für alle t P R.
Damit können wir trigonometrische Integranden in rationale Integranden verwandeln. Wir diskutieren hierzu einige Beispiele.
© Oliver Deiser
Einführung in die Mathematik 1
240
2. Abschnitt
Der analytische Kalkül
Beispiel
Wir betrachten die Funktion f : ] −π, π [ → R mit
f(x) =
1
1 + cos x
für alle x P ] −π, π [.
Mit der Substitution x = 2 arctan t gilt nach obigen Formeln
* f(x) dx
=
*
1
1 + cos(x)
=
*
1
1 + cos(2 arctan t))
=
*
=
* 1 dt
= tan
dx
2
1 + t2
2
2
(1 + (1 − t ) / (1 + t2 )) (1 + t2 )
(
x
2
= t
dt
dt
(Rücksubstitution)
).
5
1
1+cos(x)
tan
x
2
-
-5
Beispiel
Sei f : ] −π/4, 3π/4 [ → R definiert durch
f(x) =
1
sin(x) + cos(x)
für alle x P ] −π/4, 3π/4 [.
Wir setzen wieder x = 2 arctan(t). Dann gilt
Einführung in die Mathematik 1
© Oliver Deiser
6.
* f(x) dx
=
*
1
sin(x) + cos(x)
=
*
1
sin(2 arctan t) + cos(2 arctan t))
=
*
=
*
=
*
=
*
241
dx
2
dt
1 + t2
1
2
2
2
2
1 + t2
2t / (1 + t ) + (1 − t ) / (1 + t )
2
Integrationsregeln
dt
dt
2 − (t − 1)2
1
1 − (t − 1)2 /2
dt
mit u = (t − 1)/£2
1
£2 du = £2 artanh(u)
1 − u2
= £2 artanh
t−1
(
£2
)
(
= £2 artanh
tan(x/2) − 1
£2
).
6
4
2
1
sin(x)+cos(x)
-
2
4
4
2
3
4
tan
2 arctanh
x
-1
2
2
-2
-4
-6
Zur Überprüfung der Definitionsbereiche verwenden wir die Werte
sin
(
π
8
) = cos(
3π
8
)=
1
£2 − £2 ,
2
(
π
8
) = sin(
3π
8
)=
1
£2 + £2 ,
2
(
π
8
) = £2 − 1,
cos
tan
(
tan
3π
8
) = £2 + 1,
die sich aus sin(π/4) = cos(π/4) = 1/£2 und den Halbierungsformeln ergeben.
Damit ist |t − 1| ≤ £2 und |u| < 1, was wir für den artanh brauchen.
© Oliver Deiser
Einführung in die Mathematik 1
242
2. Abschnitt
Der analytische Kalkül
Weitere Integrationsregeln
Jede Ableitungsregel führt zu einer Integrationsregel, durch die sich unser Integrationskalkül weiter anreichern lässt. So gilt nach der Quotientenregel
(+)
*
f ′ g − g′ f
g2
f
.
g
=
Beispiel
Mit Hilfe der Regel (+) kann man sofort sehen, dass
(x2 + 1) cos x − 2 x sin x
dx =
(x2 + 1)2
*
sin x
.
x2 + 1
Der Integrand selbst ist keineswegs harmlos: Spalten des Bruchs in zwei Teile
erzeugt Integranden, die keine elementaren Stammfunktionen besitzen.
Aus (+) erhalten wir auch die Regel
*
f′
g
=
f
g
*
+
g′ f
,
g2
eine „partielle Integration für Quotienten“. Wegen
f′
g
= f′ ⋅
1
g
und
(
1
g′
′ = − 2
f
g
)
liefert diese Regel im Vergleich zur partiellen Integration für Produkte aber
nichts wesentlich Neues.
Die geometrische Interpretation des Integrals ist für die Integration von Umkehrfunktionen nützlich. Exemplarisch betrachten wir:
Beispiel
Für alle x > 1 gilt
log(x) x =
*
log x
et dt +
0
*
x
log t dt,
1
da das Rechteck [ 0, log x ] × [ 0, x ] ⊆ R2 durch den Graphen der Exponentialfunktion in zwei Flächen aufgeteilt wird, deren Inhalt durch die beiden
Integrale berechnet wird. Damit ist
*
x
log t dt = log(x) x − et
1
log(x)
0
= log(x) x − x + 1.
Damit haben wir die oben durch partielle Integration gewonnene Stammfunktion log(x) x − x des Logarithmus wiedergefunden.
Einführung in die Mathematik 1
© Oliver Deiser
6.
Integrationsregeln
243
Nichtelementare Integrale
Während die Ableitung einer elementaren Funktion stets eine elementare
Funktion ist, ist das Integral einer elementaren Funktion im Allgemeinen nicht
mehr elementar. Die Situation ist vergleichbar mit den rationalen Funktionen:
Die Ableitung einer rationalen Funktion ist stets eine rationale Funktion, bei Integration rationaler Funktionen tauchen aber nichtrationale Funktionen auf, allen voran der Logarithmus und Arkustangens. Analog reichen die elementaren
Funktion nicht aus, um alle elementaren Funktionen integrieren zu können. Es
müssen neue Funktionen eingeführt werden, so wie der Logarithmus und der
Arkustangens neu für die Welt der rationalen Funktion sind. Man kann zeigen,
dass die folgenden elementaren Funktionen keine elementaren Stammfunktionen besitzen:
sin x
,
x
sin x
, sin(x2 ),
x2
1
,
log x
exp(− x2 /2),
(Gaußsche Glockenkurve)
£1 − k2 sin2 x für k P ] 0, 1 [.
Die Integration dieser und vieler weiterer Funktionen führt zur Einführung spezieller Funktionen (und zugehöriger numerischer Berechnungsverfahren), die
die Klasse der elementaren Funktionen erweitern.
Die folgenden Diagramme zeigen einige der genannten Funktionen samt
nichtelementaren Stammfunktionen.
2
1
sin(x)
x
-4
-2
2
4
F(x)
2
-1
-2
Der Integral-Sinus F
© Oliver Deiser
Einführung in die Mathematik 1
244
2. Abschnitt
Der analytische Kalkül
1.0
0.5
sin x2
F(x)
-6
-4
-2
2
4
6
2
2
-0.5
-1.0
Das Fresnel-Integral F
1.0
0.5
exp -
-4
x2
2
F(x)
-2
2
4
2
-0.5
-1.0
Das (nicht normierte) Gaußsche Fehlerintegral F
Die Gaußsche Glockenkurve und das zugehörige Fehlerintegral spielen in der
Wahrscheinlichkeitstheorie eine sehr wichtige Rolle. Wir werden in Abschnitt 5
die Fläche unter der Glockenkurve als £2π berechnen.
Bedeutsam in der Theorie der nichtelementaren Funktionen sind weiter Integranden der Form
£1 − k2 sin2 x für k P ] 0, 1 [.
Sie tauchen insbesondere bei der Berechnung des Umfangs von Ellipsen auf.
Auch hierauf werden wir im fünften Abschnitt zurückkommen.
Einführung in die Mathematik 1
© Oliver Deiser
6.
Integrationsregeln
245
Übungen
Übung 1
Zeichnen Sie Diagramme zur Erläuterung der Formeln
(a)
*
b
f(cx) dx =
a
(b)
*
b
1
c
f(x + d) dx =
*
cb
f(t) dt
für c ≠ 0,
f(t) dt
für d P R.
ca
*
b+d
a+d
a
Übung 2
Sei E die achsenparallele Ellipse mit den Halbachsen a, b > 0, d. h.
E = { (x, y) P R2 | (x/a)2 + (y/b)2 = 1 }.
Skizzieren Sie E und bestimmen Sie die Fläche von E in Abhängigkeit von
den Parametern a und b mit Hilfe von Integration.
Übung 3
Bestimmen Sie durch Anwendung der Integrationsregeln:
(a)
*
1
dx für x > 0,
x + x2
(b)
*
sin x cos x
dx.
1 + 4sin2 x
Übung 4
Bestimmen Sie durch Anwendung der Integrationsregeln:
log(x)
dx,
x
(a)
*
(b)
* x log(x) dx,
(c)
* log2(x) dx,
(d)
* log3(x) dx,
(e)
* £x log(x) dx,
(f )
* log(£x) dx.
© Oliver Deiser
Einführung in die Mathematik 1
246
2. Abschnitt
Der analytische Kalkül
Übung 5
Bestimmen Sie durch Anwendung der Integrationsregeln:
(a)
* x £1 − x2 dx,
(b)
*
(c)
*
1
£1 − x2
x
£1 − x4
dx,
dx.
Übung 6
Seien a, b P R mit b > 0. Bestimmen Sie durch Anwendung der
Integrationsregeln:
*
1 − a ex
dx.
1 + b ex
Übung 7
Bestimmen Sie durch Anwendung der Integrationsregeln:
(a)
* arcsin x dx, * arccos x dx,
(b)
* arctan x dx, * arccot x dx,
(c)
* arsinh x dx, * arcosh x dx,
(d)
* artanh x dx, * arcoth x dx.
Übung 8
Bestimmen Sie durch Anwendung der Integrationsregeln:
(a)
* tan x dx, * cot x dx,
(b)
* tanh x dx, * coth x dx.
Einführung in die Mathematik 1
© Oliver Deiser
6.
Integrationsregeln
247
Übung 9
Zeigen Sie mit Hilfe einer Arkustangens-Substitution und trigonometrischer Identitäten, dass
* sec x dx
*
=
1
1 + tan(x/2)
dx = log(
cos x
1 − tan(x/2)
)
= log(tan(x/2 + π/4))
= log(cos(x/2) + sin(x/2)) − log(cos(x/2) − sin(x/2))
= log(tan x + sec x).
Übung 10
Bestimmen Sie durch Anwendung der Integrationsregeln (mit Hilfe der
Stammfunktion des Sekans) aus vorangehenden Übung:
* sec3 x dx
=
*
1
dx.
cos3 x
Übung 11
Sei f : [ a, b ] → [ 0, ∞ [ streng monoton wachsend und stetig differenzierbar.
Weiter seien c = f(a) und d = f(b).
(a) Finden Sie mit Hilfe eines Diagramms und der geometrischen
Interpretation des Integrals als Flächeninhalt eine Formel für
*
d
f − 1 (x) dx
c
b
in Abhängigkeit von * f(x) dx.
a
(b) Beweisen Sie Ihre Formel mit Hilfe der Integrationsregeln.
© Oliver Deiser
Einführung in die Mathematik 1
3. Abschnitt
Reelle und komplexe Zahlen
© Oliver Deiser
Einführung in die Mathematik 1
1. Die Vollständigkeit der reellen Zahlen
Bisher haben wir die reellen Zahlen als gegeben betrachtet und Begriffe wie
„Grenzwert“ und „Stetigkeit“ anschaulich verwendet. In diesem Abschnitt betrachten wir die reellen Zahlen und die Grundlagen der Analysis genauer. Dabei
streben wir erneut keine vollständige Behandlung dieses Themas an, sondern
eine Art „Wissensvertiefung erster Stufe“. Wir beginnen mit der Isolierung einer
Eigenschaft, die die reellen Zahlen von den rationalen Zahlen unterscheidet.
© Oliver Deiser
Einführung in die Mathematik 1
252
3. Abschnitt
Reelle und komplexe Zahlen
Modellierung eines Linearkontinuums
Neben einem Modell des Zählens ist ein Modell eines Linearkontinuums von
grundlegender Bedeutung für die Mathematik. Ein solches Modell wird aus
Punkten gebildet. Je zwei verschiedene Punkte sind durch ein „kleiner“ bzw.
„größer“ miteinander vergleichbar (Linearität) und zwischen zwei Punkten liegt
immer ein weiterer Punkt (Dichtheit). Weiter kann mit den Punkten gerechnet
werden (arithmetisches Kontinuum). Alle diese Eigenschaften werden durch die
rationalen Zahlen
Q = { ± n/m | n P N, m ≥ 1 }
erfüllt. Dennoch sind die rationalen Zahlen kein geeignetes Modell für ein
Linearkontinuum. Warum nicht, zeigt der folgende Satz, der zum Grundbestand
des mathematischen Wissens gehört.
Satz (Irrationalität der Quadratwurzel aus 2)
£2 ist irrational, d. h. es gibt keine natürlichen Zahlen n, m mit (n/m)2 = 2.
Beweis
Seien n, m P N. Wir betrachten die Primfaktorzerlegungen von n und m
und schreiben
n = 2a1 ⋅ 3a2 ⋅ 5a3 ⋅ …
m = 2b1 ⋅ 3b2 ⋅ 5b3 ⋅ …
mit Exponenten ak , bk ≥ 0. Nach den Potenzregeln gilt
n2
= 22 a1 ⋅ 32 a2 ⋅ 52 a3 ⋅ …
m2
= 22 b1 ⋅ 32 b2 ⋅ 52 b3 ⋅ …
2m2 = 22 b1 + 1 ⋅ 32 b2 ⋅ 52 b3 ⋅ …
Dann sind die 2-Exponenten von n2 und 2m2 verschieden, da der erste der
beiden Exponenten gerade, der zweite aber ungerade ist. Aufgrund der
Eindeutigkeit der Primfaktorzerlegung ist also n2 ≠ 2m2 und damit (n/m)2 ≠ 2.
Da (n/m)2 = 2 äquivalent zu 2n2 = m2 ist, lässt sich das Ergebnis auch so formulieren:
Satz (Irrationalität der Quadratwurzel aus 2, zahlentheoretische Version)
Das Doppelte einer Quadratzahl ist keine Quadratzahl.
In dieser Version ist nur noch von natürlichen Zahlen und der Multiplikation
die Rede. Es tauchen keine Wurzeln und Verhältnisse mehr auf.
Eine wichtige Folgerung für die Analysis ist:
Einführung in die Mathematik 1
© Oliver Deiser
1.
Die Vollständigkeit der reellen Zahlen
253
Korollar
Die Funktion f : Q → Q mit f(q) = q2 − 2 für alle q P Q hat keine Nullstelle.
2
f(x)
1
2
-2
-1
1
2
-1
-2
Die Funktion f : Q → Q besitzt keine Nullstellen
Diese und verwandte Überlegungen zeigen, dass Q für die Analysis ungeeignet ist: Die rationalen Zahlen haben Lücken. Wie kann man den Unterschied
von Q und R genau fassen? Eine Möglichkeit, die die Ordnungsstruktur der reellen Zahlen an die Spitze stellt, werden wir nun kennenlernen. Anschaulich besagt
sie, dass jede in den rationalen Zahlen auftretende Lücke durch eine (irrationale)
reelle Zahl geschlossen wird.
Obere und untere Schranken
Zur Formulierung der „Lückenlosigkeit“ von R brauchen wir eine Reihe von
Ordnungsbegriffen. Die meisten von ihnen sind anschaulich und suggestiv in ihrer Namensgebung.
Definition (obere und unter Schranke)
Seien X ⊆ R und s P R. Dann heißt s eine obere Schranke von X, in Zeichen
X ≤ s, falls für alle x P X gilt, dass x ≤ s. Analog heißt s eine untere Schranke
von X, in Zeichen s ≤ X, falls für alle x P X gilt, dass s ≤ x. Die Menge X
heißt nach oben (unten) beschränkt, falls eine obere (untere Schranke) von X
existiert. Schließlich heißt X beschränkt, falls X nach oben und unten
beschränkt ist.
© Oliver Deiser
Einführung in die Mathematik 1
254
3. Abschnitt
Reelle und komplexe Zahlen
Definition (Minimum und Maximum)
Seien X ⊆ R und s P R. Dann heißt s das Maximum oder von X, in Zeichen
s = max(X), falls s P X und X ≤ s. Analog heißt s das Minimum von X, in
Zeichen s = min(X), falls s P X und s ≤ X.
Für a1 , …, an P R setzen wir zur Vereinfachung der Notation
max(a1 , …, an ) = max({ a1 , …, an }),
min(a1 , …, an ) = min({ a1 , …, an }).
Wir betrachten nun besonders ausgezeichnete obere und untere Schranken einer Menge:
Definition (Supremum und Infimum)
Seien X ⊆ R und s P R. Dann heißt s das Supremum oder die kleinste obere
Schranke von X, in Zeichen s = sup(X), falls
s = min { t | X ≤ t }.
Analog heißt s das Infimum oder die größte untere Schranke von X, falls
s = max { t | t ≤ X }.
t
inf(X)
X
sup(X)
s
Eine Menge X reeller Zahlen mit unterer Schranke t und oberer Schranke s
Anschaulich erhalten wir das Infimum einer nach unten beschränkten nichtleeren Menge X reeller Zahlen, indem wir eine untere Schranke t von X betrachten und diese Schranke soweit nach rechts verschieben, bis sie die Menge X in
folgendem Sinne berührt: Jede weitere Vergrößerung würde dazu führen, dass
keine untere Schranke mehr vorliegt. Analoges gilt für das Supremum.
Wir fassen die Definitionen in einer Tabelle zusammen.
Begriff
Ausdruck
Definition
s ist eine obere Schranke von X
X≤s
∀x P X x ≤ s
s ist eine untere Schranke von X
s≤X
∀x P X s ≤ x
s ist das Maximum von X
s = max(X)
sPX ∧ X ≤ s
s ist das Minimum von X
s = min(X)
sPX ∧ s ≤ X
s ist das Supremum von X
s = sup(X)
X ≤ s ∧ ∀t (X ≤ t → s ≤ t)
s ist das Infimum von X
s = inf(X)
s ≤ X ∧ ∀t (t ≤ X → t ≤ s)
Einführung in die Mathematik 1
© Oliver Deiser
1.
Die Vollständigkeit der reellen Zahlen
255
Beispiele
(1) [ 0, 1 ] ≤ 1, [ 0, 1 ] ≤ 2, [ 0, 1 [ ≤ 1, [ 0, 1 [ ≤ 2.
(2) max([ 0, 1 ]) = 1, max([ 0, 1 [) existiert nicht.
(3) sup([ 0, 1 ]) = 1, sup([ 0, 1 [) = 1.
(4) N ⊆ R ist nach unten, aber nicht nach oben beschränkt.
(5) max(N) und sup(N) existieren nicht, min(N) = inf(N) = 0.
(6) Sei X = { 1 − 1/n | n P N* } ⊆ Q. Dann gilt
max(X) existiert nicht, sup(X) = 1 P Q.
Die Menge X ⊆ Q hat also ein Supremum in Q.
(7) Sei X = { q P Q | q > 0 ∧ q2 ≤ 2 }. Dann ist X nach oben beschränkt
(zum Beispiel durch 2). Es gilt
max(X) existiert nicht, sup(X) = £2 ¸ Q.
Die Teilmenge X der rationalen Zahlen hat also kein Supremum in Q.
Anschaulich können wir dies so beschreiben: Ist s P Q eine obere
Schranke von X, so können wir s durch Verkleinerung von rechts an X
heranführen, wobei wir jederzeit in der Menge der rationalen Zahlen
verbleiben müssen. Durch diese Einschränkung erreichen wir
aufgrund der Irrationalität von £2 nie das Supremum von X. Wir
steuern auf einen Punkt zu, den es in Q nicht gibt. Jede rationale obere
Schranke von X lässt sich immer noch zu einer rationalen oberen
Schranke von X verkleinern.
Das Maximum und Minimum einer Menge ist immer ein Element der Menge.
Das Supremum einer Menge kann der Menge angehören oder auch nicht, und
das Gleiche gilt für das Infimum. Es gelten die folgenden Implikationen:
(i) Existiert max(X), so ist sup(X) = max(X).
(ii) Existiert min(X), so ist inf(X) = min(X).
(iii) Ist s = sup(X), so ist s = max(X ∪ { s }).
(iv) Ist s = inf(X), so ist s = min(X ∪ { s }).
Nach diesen Vorbereitungen können wir nun die fundamentale Eigenschaft
der reellen Zahlen, die sie von Q und anderen Zahlbereichen unterscheidet,
axiomatisch fassen.
© Oliver Deiser
Einführung in die Mathematik 1
256
3. Abschnitt
Reelle und komplexe Zahlen
Das Vollständigkeitsaxiom
Axiom (Vollständigkeitsaxiom für die reellen Zahlen)
Jede nichtleere und nach oben beschränkte Menge reeller Zahlen besitzt
ein Supremum in den reellen Zahlen.
Wir bezeichnen die Aussage als Axiom, da wir die reellen Zahlen weiterhin als
gegeben voraussetzen. Konstruiert man die Menge der reellen Zahlen (mit Hilfe
der Axiome der Mengenlehre), so wird die Aussage zu einem beweisbaren Satz.
Die in den obigen Beispielen betrachtete Menge
X = { q P Q | q > 0 ∧ q2 ≤ 2 } ⊆ Q
zeigt, dass die rationalen Zahlen ein analog formuliertes Vollständigkeitsaxiom
verletzen: Die Menge X ist eine nichtleere und nach oben beschränkte Teilmenge von Q, die innerhalb der rationalen Zahlen kein Supremum besitzt. Sie
markiert eine Lücke von Q, die in R durch £2 geschlossen wird.
Um Rechenregeln für Suprema und Infima möglichst allgemein und unkompliziert formulieren zu können, ist es nützlich, auch leere und unbeschränkte
Mengen zuzulassen. Hierzu vereinbaren wir:
Konvention
sup(∅) = −∞
inf(∅) = ∞
sup(X) = ∞, falls X ⊆ R nach oben unbeschränkt ist
inf(X) = −∞, falls X ⊆ R nach unten unbeschränkt ist
Für die symbolischen Werte ∞ und −∞ vereinbaren wir:
−∞ < ∞
−∞ < x, x < ∞
für alle x P R
∞ + ∞ = ∞, −∞ − −∞ = −∞
x + ∞ = ∞, x − ∞ = −∞, x / ∞ = x / −∞ = 0
für alle x P R
x ⋅ ∞ = ∞, x ⋅ −∞ = −∞
für alle x P ] 0, ∞ ]
x ⋅ ∞ = −∞, x ⋅ −∞ = ∞
für alle x P [ − ∞, 0 [
Warnung
Nicht erklärt sind ∞ − ∞, −∞ + ∞, 0 ⋅ ∞, 0 ⋅ −∞, ±∞/∞, ∞/±∞.
Als nächstes führen wir arithmetische Operationen für Mengen reeller Zahlen
ein:
Einführung in die Mathematik 1
© Oliver Deiser
1.
Die Vollständigkeit der reellen Zahlen
257
Definition (Addition und Skalierung von Teilmengen von R)
Für alle X, Y ⊆ R und alle c P R setzen wir
X + Y = { x + y | x P X und y P Y },
X ⋅ Y = X Y = { x y | x P X und y P Y },
cX = { c x | x P X },
−X = (−1) X = { −x | x P X }.
Damit können wir nun Rechenregeln zusammenstellen:
Satz (Rechenregeln für Suprema und Infima)
Für alle nichtleeren X, Y ⊆ R gilt:
(1) sup(X + Y) = sup(X) + sup(Y),
(2) sup(c X) = c sup(X) für alle c > 0,
(3) sup(X ⋅ Y) = sup(X) sup(Y), falls 0 ≤ X, Y,
(4) X ⊆ Y impliziert sup(X) ≤ sup(Y),
(5) inf(X) = −sup(−X), sup(X) = −inf(−X).
Analoge Regeln gelten für Infima.
Beweisskizze
Wir zeigen exemplarisch die erste Eigenschaft für nach oben beschränkte
und nichtleere Teilmengen X, Y von R. Seien also s = sup(X) und t = sup(Y).
Für alle x P X und y P Y gilt x ≤ s und y ≤ t, sodass x + y ≤ s + t. Damit ist
s + t eine obere Schranke von X + Y. Ist nun u P R beliebig mit u < s + t, so sei
ε = s + t − u.
Dann gilt ε > 0. Wegen s = sup(X) und t = sup(Y) gibt es x P X und y P Y
mit x > s − ε/2 und y > t − ε/2 (sonst wären s − ε/2 bzw. t − ε/2 obere
Schranken von X bzw. Y). Dann gilt
x + y > s − ε/2 + t − ε/2 = s + t − ε = u,
sodass u keine obere Schranke von X + Y ist. Dies zeigt, dass s + t die
kleinste obere Schranke von X + Y ist.
Aus der Eigenschaft (5) des Satzes folgt insbesondere:
Korollar (Existenz von Infima)
Sei X ⊆ R nichtleer und nach unten beschränkt. Dann existiert inf(X).
Dass wir im Vollständigkeitsaxiom Suprema gegenüber Infima bevorzugt haben, hat keinen speziellen Grund. Fordert man die Existenz von Infima, so lässt
sich die Existenz von Suprema folgern.
© Oliver Deiser
Einführung in die Mathematik 1
258
3. Abschnitt
Reelle und komplexe Zahlen
Das Archimedische Axiom
Eine weitere wichtige Eigenschaft der reellen Zahlen lautet:
Axiom (Archimedisches Axiom)
Für alle reellen Zahlen x > 0 gibt es eine natürliche Zahl n ≥ 1 mit 1/n < x.
...
0.0
0.2
0.4
0.6
0.8
1.0
Das Infimum aller Zahlen 1/n, n ≥ 1, ist 0
Das Archimedische Axiom ist äquivalent zu
inf({ 1/n | n ≥ 1 }) = 0.
Damit sind infinitesimale Größen ausgeschlossen: Es gibt keine positive reelle
Zahl, die kleiner ist als alle Zahlen 1/n mit n ≥ 1.
Bemerkung
Das Archimedische Axiom lässt sich aus dem Vollständigkeitsaxiom
ableiten, sodass es in einer axiomatischen Charakterisierung der reellen
Zahlen nicht explizit gefordert muss.
Als exemplarische Anwendung des Axioms zeigen wir den folgenden nützlichen Satz:
Satz (Identifikation von Suprema mit Hilfe des archimedischen Axioms)
Sei X ⊆ R nichtleer und nach oben beschränkt. Weiter sei s P R. Dann sind
äquivalent:
(1) s = sup(X).
(2) X ≤ s und für alle n P N* gibt es ein x P X mit x + 1/n > s.
Die zweite Aussage können wir auch so formulieren:
(2)′ X ≤ s und für alle n P N* gilt [ s − 1/n, x ] ∩ X ≠ ∅.
Ein analoger Satz gilt natürlich auch für Infima.
Beweis
(1) impliziert (2) :
Sei s = sup(X). Dann gilt X ≤ s. Sei also n ≥ 1 beliebig. Da s die kleinste
obere Schranke von X ist, ist s − 1/n keine obere Schranke von X. Also
gibt es ein x P X mit x > s − 1/n. Folglich ist x + 1/n > s.
Einführung in die Mathematik 1
© Oliver Deiser
1.
Die Vollständigkeit der reellen Zahlen
259
(2) impliziert (1) :
Es gelte (2). Dann ist s eine obere Schranke von X. Sei nun t < s
beliebig. Nach dem Archimedischen Axiom gibt es ein n ≥ 1 derart,
dass 1/n ≤ s − t. Sei nun x P X mit x + 1/n > s (ein solches x existiert
nach Voraussetzung). Dann ist aber
x > s − 1/n ≥ t,
sodass t keine obere Schranke von X ist. Dies zeigt, dass s die kleinste
obere Schranke von X ist.
Dichte Mengen
Reelle Zahlen lassen sich durch rationale Zahlen beliebig genau approximieren. Es gilt:
Satz (Dichtheit der rationalen Zahlen)
Seien x, y P R mit x < y. Dann gibt es ein q P Q mit x < q < y.
Beweis
Wir setzen ε = y − x. Dann ist ε > 0. Folglich existiert ein n ≥ 1 mit 1/n < ε.
Die Vielfachen m ⋅ 1/n P Q, m P N, von 1/n sind unbeschränkt in R und
folgen aufeinander im Abstand 1/n, da
(m + 1) 1/n − m 1/n = (m + 1 − m) 1/n = 1/n für alle m P N.
Wegen 1/n < x − y muss also eines dieser Vielfachen zwischen x und y
liegen.
Allgemein definieren wir:
Definition (dicht)
Eine Menge D reeller Zahlen heißt dicht in R, falls für alle x < y in R ein
z P D existiert mit x < z < y.
Die rationalen Zahlen sind das Paradebeispiel für eine in R dichte Menge.
Aber auch
D = { ± n/2m | n, m P N }
ist dicht in R. Und natürlich ist R selbst dicht in R.
-1.0
-0.5
0.0
0.5
1.0
Visualisierung der dichten Menge D
© Oliver Deiser
Einführung in die Mathematik 1
260
3. Abschnitt
Reelle und komplexe Zahlen
Anwendungen
Wir diskutieren nun einige Anwendungen der Vollständigkeit der reellen
Zahlen. Sie zeigen die vielfältigen Einsatzmöglichkeiten von oberen und unteren
Schranken.
1. Grenzwerte monotoner Folgen
Als erstes betrachten wir den Zusammenhang zwischen Grenzwert und Supremum/Infimum für einfache Folgen
x0 , x1 , x2 , …, xn , …
reeller Zahlen. Dabei verwenden wir den Grenzwertbegriff (und den Begriff einer Folge selbst) nach wie vor anschaulich. Eine genaue Definition geben wir im
nächsten Kapitel.
Um die Notation zu vereinfachen, schreiben wir
supn xn statt sup({ xn | n P N }), infn xn statt inf({ xn | n P N }).
Der vielleicht einfachste Zusammenhang zwischen dem Grenzwert einer
Folge und dem Supremum bzw. Infimum einer Menge ist:
Satz (Grenzwerte monotoner Folgen)
Sei x0 , x1 , …, xn , … eine Folge in R. Dann gilt
(1) Ist die Folge monoton wachsend, d. h. xn ≤ xn + 1 für alle n, so gilt
limn xn = supn xn P R ∪ { ∞ }.
(2) Ist die Folge monoton fallend, d. h. xn > xn + 1 für alle n, so gilt
limn xn = infn xn = R ∪ { −∞ }.
Die Grenzwerte sind dabei genau dann Elemente von R, wenn die Folge
beschränkt ist.
Der Leser erstelle Diagramme zur Visualisierung dieser Zusammenhänge.
Beispiele
(1) Die Folge x0 , x1 , x2 , … mit xn = n für alle n ist monoton steigend. Es
gilt limn xn = supn xn = ∞.
(2) Die Folge x0 , x1 , x2 , … mit xn = 1/2n für alle n ist monoton fallend. Es
gilt limn xn = infn xn = 0.
(3) Die Folge x0 , x1 , x2 , … mit xn = (−1)n für alle n ist nicht monoton. Es
gilt infn xn = −1 und supn xn = 1. Dagegen existiert limn xn nicht.
Einführung in die Mathematik 1
© Oliver Deiser
1.
Die Vollständigkeit der reellen Zahlen
261
2. Grenzwerte von Pendelfolgen
Definition (Pendelfolge)
Eine Folge x0 , x1 , …, xn , … reeller Zahlen heißt eine linksstartende
Pendelfolge, falls gilt:
x0 ≤ x2 ≤ … ≤ x2n ≤ … ≤ x2n + 1 ≤ … ≤ x3 ≤ x1 .
Analog sind rechtsstartende Pendelfolgen definiert durch die Eigenschaft
x1 ≤ x3 ≤ … ≤ x2n + 1 ≤ … ≤ x2n ≤ … ≤ x2 ≤ x0 .
Wir beschränken uns im Folgenden auf linksstartende Pendelfolgen. Analoge
Ergebnisse gelten für den zweiten Typ. Allgemein genügt es, sich auf einen Typ
zu konzentrieren, denn die beiden Typen gehen durch das Streichen des ersten
Folgengliedes ineinander über.
Auch für Pendelfolgen können wir einen Zusammenhang zwischen Grenzwert und Supremum/Infimum herstellen:
Satz (Grenzwerte von Pendelfolgen)
Sei x0 , x1 , …, xn , …, eine linksstartende Pendelfolge in R. Dann existiert der
Grenzwert der Folge genau dann, wenn gilt:
infn (x2n + 1 − x2n ) = 0.
(Konvergenzbedingung für Pendelfolgen)
In diesem Fall ist
limn xn = supn x2n = infn x2n + 1 .
Ist nämlich s = supn x2n und t = infn x2n + 1 , so gilt s ≤ t. Die Konvergenzbedingung besagt, dass sich die geraden und ungeraden Glieder beliebig nahe kommen, sodass s = t. Genau dann ist s = t der Grenzwert der Folge. Die Folge
x1 − x0 , x3 − x2 , …, x2n + 1 − x2n , …
der Abstände der Paare einer linksstartenden Pendelfolge ist monoton fallend
und nach unten beschränkt durch 0. Sie konvergiert also immer gegen ihr Infimum. Die Folge konvergiert genau dann, wenn dieses Infimum Null ist.
Viele der Folgen, die uns in der Analysis begegnen, sind entweder monoton
oder pendelnd (zumindest ab einer bestimmten Stelle n0 ). Damit decken die beiden Folgentypen bereits zahlreiche Fälle ab. Noch allgemeinere Folgen, die um
ihren Grenzwert beliebig hin und her springen können, betrachten wir nächsten
Kapitel.
Beispiele
(1) Die Folge x0 , x1 , x2 , … mit xn = (−1)n /2n für alle n ist eine rechtsstartende Pendelfolge mit 0 = limn xn = supn x2n + 1 = infn x2n .
(2) Die Folge x0 , x1 , x2 , … mit xn = (−1)n + 1 für alle n ist eine linksstartende
Pendelfolge, die die Konvergenzbedingung nicht erfüllt.
© Oliver Deiser
Einführung in die Mathematik 1
262
3. Abschnitt
Reelle und komplexe Zahlen
3. Intervallschachtelungen
Definition (Intervallschachtelung)
Eine Folge I0 , I1 , …, In , … von reellen Intervallen In heißt eine Intervallschachtelung, falls gilt
I0 ⊇ I1 ⊇ … ⊇ In ⊇ ….
Für jede Intervallschachtelung können wir die Menge
I =
>n In
= { x P R | x P In für alle n P N }
aller Punkte betrachten, die in jedem der Intervalle als Element enthalten sind.
Das wichtigste Ergebnis über diese Schnittmenge ist:
Satz (Satz über Intervallschachtelungen)
Sei I0 , I1 , …, In , … eine Intervallschachtelung bestehend aus abgeschlossenen und beschränkten Intervallen In = [ an , bn ]. Weiter sei I = >n In .
Dann gilt
I = [ supn an , infn bn ] ≠ ∅.
Weiter gilt I = { supn an } = { infn bn } genau dann, wenn limn (bn − an ) = 0.
Beweis
Die monotonen Folgen
a0 , a1 , … an , … und b0 , b1 , …, bn , …
der linken und rechten Intervallgrenzen sind aufgrund der Schachtelung
der Intervalle monoton steigend bzw. fallend und zudem beschränkt,
sodass sie gegen ihr Supremum a bzw. Infimum b konvergieren. Das
Intervall [ a, b ] ist ein Teilintervall jedes Intervalls In und somit im Durchschnitt I der Intervalle enthalten. Andererseits können wegen a = supn an
und b = infn bn keine weiteren Punkte in I enthalten sein, sodass I = [ a, b ].
Aus der Äquivalenz von limn (an − bn ) = 0 und a = b ergibt sich der Zusatz.
Der Durchschnitt einer Intervallschachtelung wie im Satz besteht genau dann
aus genau einem Punkt, wenn die Folge der Intervall-Längen gegen Null konvergiert. Wir beobachten hierzu, dass die aus den Intervallgrenzen gebildete
Folge
a0 , b0 , a1 , b1 , …, an , bn , …
eine linksstartende Pendelfolge ist. Gilt
limn an = a = b = limn bn ,
so ist der Durchschnitt der Intervalle die einpunktige Menge { a } = { b }. Anschaulich ziehen sich die Intervalle auf den Punkt a = b zusammen.
Einführung in die Mathematik 1
© Oliver Deiser
1.
Die Vollständigkeit der reellen Zahlen
263
4. Die Dezimaldarstellung
Wir betrachten endliche und unendliche Dezimalbrüche. Dabei beschränken wir uns auf nichtnegative reelle Zahlen. Für m P N und Nachkommaziffern d1 , …, dn P { 0, …, 9 } setzen wir
m, d1 … dn = m +
d1
10
+
d2
100
+ … +
dn
.
10n
(endlicher Dezimalbruch)
Lesen wir die Ziffernfolge d1 … dn als Dezimalzahl, so gilt
m, d1 … dn = m +
d1 …dn
.
10n
Wir erinnern an:
Charakterisierung der endlichen Dezimalbrüche
Genau die rationalen Zahlen q ≥ 0 der Form q = a/10n lassen sich als
endlicher Dezimalbruch schreiben. In gekürzter Form sind dies genau die
Brüche, deren Nenner nur die Primfaktoren 2 und 5 enthält.
Beispielsweise lassen sich also 1/5 und 3/20, nicht aber 1/7 oder 2/15 als endlicher Dezimalbruch schreiben.
Mit Hilfe des Supremumsbegriffs können wir unendliche Dezimalbrüche definieren:
Definition (unendlicher Dezimalbruch)
Für m P N und eine Folge (dn )n P N in { 0, …, 9 } setzen wir
m,d1 d2 … = supn m,d1 …dn .
(unendlicher Dezimalbruch)
Statt „sup“ können wir auch „lim“ schreiben, da die Folge der endlichen Dezimalbrüche monoton steigend und nach oben beschränkt durch m + 1 ist.
Jeder unendliche Dezimalbruch definiert eine eindeutige reelle Zahl x ≥ 0. Die
Umkehrung ist im Allgemeinen nicht gültig. Dieses bedeutsame Phänomen lässt
sich mit Hilfe der Definition als Supremum sehr einfach erklären:
Beispiel: Neuner-Periode
Es gilt 1 = 1,000… = 0,999… Denn nach Definition ist
0,999… = supn 0,9…9 (mit n Stellen)
= supn (1 − 1/10n ) = 1 − infn 1/10n = 1 − 0 = 1.
Der Einwand, dass zu 1 in 0,999… immer noch „etwas fehlen“ würde, ist
damit entkräftet: 0,999… ist definiert als Supremum einer Menge (oder
gleichwertig als Grenzwert einer Folge), und ein Supremum muss einer
Menge nicht angehören (ein Grenzwert nicht von den Folgengliedern
angenommen werden).
© Oliver Deiser
Einführung in die Mathematik 1
264
3. Abschnitt
Reelle und komplexe Zahlen
Allgemein gilt:
Charakterisierung der Nichteindeutigkeit
Jede reelle Zahl x ≥ 0 hat genau eine oder genau zwei unendliche Dezimaldarstellungen. Genauer gilt:
(1) 0 hat die eindeutige unendliche Dezimaldarstellung 0 = 0,000…
(2) Eine reelle Zahl x > 0 hat genau dann zwei unendliche Darstellungen,
wenn x von der Form m, d1 … dn ist mit dn ≠ 0. In diesem Fall gilt
x = m, d1 …dn 000…
(Nullfortsetzung)
x = m, d1 … (dn − 1)999…
(Neuner-Periode)
Aus der Charakterisierung folgt, dass die Darstellung einer irrationalen Zahl
stets eindeutig ist. Aber auch rationale Zahlen wie 1/3 oder 1/7 haben eine eindeutige unendliche Dezimaldarstellung. Welche Zahlen dies sind ergibt sich aus
der obigen Charakterisierung der endlichen Dezimalbrüche.
Wir betrachten zwei Möglichkeiten der Veranschaulichung oder, wenn man
so will, Interpretation von Dezimalbrüchen:
Visualisierung 1: Abmessen am Zahlstrahl
Die Dezimaldarstellung einer reellen Zahl x > 0 lässt sich anschaulich durch
„Abmessen am Zahlenstrahl“ mit immer kleineren Maßstäben
1, 1/10, 1/100, …
beschreiben. Mit den so produzierten endlichen Dezimalbrüchen entstehen
rationale Approximationen an x, die monoton steigend gegen x konvergieren. Erlauben wir, dass eine Approximation exakt gleich x ist, so ist eine in 0
auslaufende Folge von Approximationen möglich. Fordern wir dagegen,
dass jede Approximation echt kleiner als x sein muss, so erhalten wir immer
eine streng monoton steigende Folge von endlichen Dezimalbrüchen, die
in manchen Fällen in der Ziffer 9 terminiert.
Visualisierung 2: Verwendung von Bäumen
Ist x ein Element von [ 0, 1 [, so können wir [ 0, 1 ] in 10 Teilintervalle
[ 0, 1/10 [, [ 1/10, 2/10[ , …, [ 9/10, 1 [
zerlegen und fragen, in welchem der Teile sich x befindet. So finden wir
eine erste Dezimalstelle d1 . Nun wiederholen wir das Verfahren mit dem
Intervall [ d1 /10, (d1 + 1)/10 [ und erhalten so d2 . So fortfahrend ergibt sich
die Darstellung x = 0, d1 d2 …, wobei wir im zweideutigen Fall (x ist eine der
auftretenden Intervallgrenzen) die in 0 terminierende Darstellung
erzeugen, da wir nach rechts offene Intervalle verwenden. Die Darstellung
lässt sich als unendlicher Pfad in einem Baum auffassen, dessen Knoten mit
Intervallen beschriftet sind und der sich an jedem Knoten zehnfach
verzweigt.
Einführung in die Mathematik 1
© Oliver Deiser
1.
Die Vollständigkeit der reellen Zahlen
265
5. b-adische Darstellungen
Eine natürliche Verallgemeinerung der Dezimaldarstellung ist die b-adische
Darstellung für eine beliebige natürliche Basis b ≥ 1. Obige Definitionen werden
übernommen, wobei nun anstelle der Menge { 0, …, 9 } von Nachkommastellen
die Menge { 0, …, b − 1 } tritt und die Nenner 10n durch bn ersetzt werden. Die
Dezimaldarstellung entspricht dem Fall b = 10. In der Mathematik, Informatik
und Kulturgeschichte sind neben b = 10 vor allem bedeutsam:
b=2
Dualdarstellung
b=3
Ternärdarstellung
b = 16
Hexadezimaldarstellung
b = 60
Hexagesimaldarstellung
Für die Hexadezimaldarstellung verwendet man statt 0, …, 15 die Nachkommaziffern 0, …, 9, A, …, F, um keine Trennstellen in der Darstellung angeben zu
müssen. Analoges gilt allgemein für b-adische Darstellungen mit b > 10.
Beispiele
(1) In Dualdarstellung gilt
1 = 1,000… = 0,111… = supn (1/2 + 1/4 + 1/8 + … + 1/2n ).
(2) In 7-adischer Darstellung gilt
1 = 1,000… = 0,666… = supn (6/7 + 6/72 + 6/73 + … + 6/7n ).
Die beiden oben geschilderten Möglichkeiten der Visualisierung lassen sich
leicht an den Fall einer allgemeinen b-adischen Darstellung anpassen. An die
Stelle der Maßstäbe 1/10k treten die Maßstäbe 1/bk . Und die Bäume aus Intervallen sind nun b-fach statt 10-fach verzweigt.
[0,
1
[
8
1 1
[ , [
8 4
1 3
[ , [
4 8
[0,
1
4
[
3 1
[ , [
8 2
1 5
[ , [
2 8
5 3
[ , [
8 4
1 1
[ , [
4 2
1 3
[ , [
2 4
3
[ , 1[
4
[0,
1
3 7
[ , [
4 8
7
[ , 1[
8
1
[ , 1[
2
[
2
[0, 1[
Baumdiagramm zur Dualdarstellung
© Oliver Deiser
Einführung in die Mathematik 1
266
3. Abschnitt
Reelle und komplexe Zahlen
6. Ober- und Unterintegral
Das Integral einer Funktion f : [ a, b ] → R kann anstelle von Riemann-Summen mit Hilfe von Ober- und Unterintegralen definiert werden. Hierzu wird in
jedem Intervall einer stützstellenfreien Partition p = (tk )k ≤ n von [ a, b ] das Supremum bzw. Infimum aller Funktionswerte des Intervalls gebildet. Dadurch entstehen Approximationen von oben und von unten:
S p f = ∑ k ≤ n (t k + 1 − t k ) sup x P [ t k , t k + 1 ] f(x),
(obere Darboux-Summe)
s p f = ∑ k ≤ n (t k + 1 − t k ) inf x P [ t k , t k + 1 ] f(x).
(untere Darboux-Summe)
t0
t1
t2
t3
t4
t5
t0
t1
t2
t3
t4
t5
Die obere und untere Darboux-Summe einer Funktion für eine stützstellenfreie Partition
Einführung in die Mathematik 1
© Oliver Deiser
1.
Die Vollständigkeit der reellen Zahlen
267
Die Funktion f wird bei der Bildung einer Darboux-Summe als beschränkt
vorausgesetzt, damit die Suprema und Infima definiert sind. Stützstellen und zugehörige Funktionswerte spielen keine Rolle. Wir setzen nun
S f = infp Sp f,
(Oberintegral)
s f = supp sp f.
(Unterintegral)
Das Infimum bzw. Supremum wird über alle Partitionen p gebildet (wobei man
sich auf äquidistante Partitionen beschränken kann). Es gilt stets s f ≤ S f. Man
kann nun zeigen, dass f genau dann Riemann-integrierbar ist, wenn s f = S f gilt,
d. h. wenn Ober- und Unterintegral übereinstimmen. Dieser Zugang zur Integration, oft auch Darboux-Integral genannt, ist also äquivalent zum Zugang über
Riemann-Summen. Er ist theoretisch aufgrund des eleganten Kalküls mit Suprema und Infima ansprechend, aus numerischer Sicht aber weniger geeignet, da
die Darboux-Summen im Vergleich zu den Riemann-Summen viel schwieriger
zu berechnen sind. Wie so oft sind beide Wege wertvoll.
© Oliver Deiser
Einführung in die Mathematik 1
268
3. Abschnitt
Reelle und komplexe Zahlen
Übungen
Übung 1
Zeigen Sie in Analogie zum Beweis der Irrationalität von £2, dass £3
irrational ist. Warum scheitert der Beweis bei £4? Auf welche Zahlen lässt
sich das Argument allgemein anwenden?
Übung 2
Recherchieren Sie den Beweis der Irrationalität von £2, der sich in den
„Elementen“ des Euklid findet. Vergleichen Sie diesen Beweis mit unserem
Argument.
Übung 3
Bestimmen Sie die Infima und Suprema der folgenden Mengen:
(a) [ 0, 1 ] ∪ { 2 },
(b) ] 0, 1 [ ∪ ] 2, 3 [,
(c) { sin(x) | 0 ≤ x ≤ π/2 },
(d) { (−1)n /n | n ≥ 1 },
(e) { 3/10, 33/100, 333/1000, … },
(f ) { 1/2 + 1/4 + … + 1/2n | n ≥ 1 },
(g) sup({ 1 + 1/k | k ≥ n }) | n ≥ 1 }).
Übung 4
Zeigen Sie, dass die Eigenschaft
sup(X + Y) = sup(X) + sup(Y)
unter den eingeführten Konventionen für alle nichtleeren (nicht notwendig
beschränkten) X, Y ⊆ R gültig ist. Kann man auch leere Teilmengen
zulassen?
Übung 5
Sei X ⊆ R. Zeigen Sie:
inf(X) = − sup(− X), sup(X) = − inf(− X).
Übung 6
Zeigen Sie, dass das Archimedische Axiom äquivalent ist zur Aussage
(+) N ist unbeschränkt in R.
Einführung in die Mathematik 1
© Oliver Deiser
1.
Die Vollständigkeit der reellen Zahlen
269
Übung 7
Nehmen Sie an, dass Q dicht in R ist und zeigen Sie mit Hilfe dieser
Voraussetzung das Archimedische Axiom.
Übung 8
Begründen Sie die Dichtheit der rationalen Zahlen in R mit Hilfe der
Dezimalbruchentwicklung.
Übung 9
Sei D = { ± n/2m | n, m P N } ⊆ Q. Geben Sie eine möglichst einfache
beschränkte nichtleere Teilmenge von D an, deren Supremum in Q − D
liegt. Stellen Sie eine Analogie zu £2 her.
Übung 10
Definieren Sie die Menge D der vorangehenden Übung mit Hilfe von
Dualdarstellung.
Übung 11
Sei b eine natürliche Zahl mit b ≥ 2.
(a) Geben Sie (ohne Begründung) alle möglichen b-adischen Darstellung der folgenden reellen Zahlen an:
1,
1
,
b
a
für 1 ≤ a < b,
b−1
1
.
2
(b) Charakterisieren Sie (mit kurzer Begründung) alle reellen Zahlen
x > 0, die genau zwei b-adische Darstellungen besitzen. Geben Sie
einige Beispiele an.
Übung 12
Erstellen Sie Diagramme zu den im Text beschriebenen Visualisierungen
der Dezimaldarstellung für eine reelle Zahl x P [ 0, 1 ]:
(1) Approximation am Zahlenstrahl von links
(2) wiederholte Intervallteilung (Baumstruktur)
Erläutern Sie das Phänomen der Zweideutigkeit für beide Visualisierungen.
Verallgemeinern Sie zudem die Visualisierungen auf b-adische Darstellungen und betrachten Sie speziell den Fall b = 2 für die Visualisierung (2).
© Oliver Deiser
Einführung in die Mathematik 1
2. Grenzwerte für Folgen und Reihen
Wir definieren nun Grenzwerte von Folgen
(xn )n P N = (x0 , x1 , x2 , …, xn , …)
und unendlichen Reihen
∑ n xn = x0 + x1 + x2 + … + xn + …
in R formal mit Hilfe der Epsilontik. Diese Definitionsform wird heute in der
Analysis zur Präzisierung aller Arten von Grenzwertbegriffen verwendet.
© Oliver Deiser
Einführung in die Mathematik 1
272
3. Abschnitt
Reelle und komplexe Zahlen
Folgen
Wir präzisieren zunächst den Begriff einer Folge. Allgemein definieren wir:
Definition (Folge in einer Menge)
Sei M eine Menge. Eine Folge in M (mit Definitionsbereich N) ist eine
Funktion der Form f : N → M.
Notation (Folgennotation)
Wir notieren eine Folge f : N → M in einer Menge M oft als
f = (xn )n P N , mit xn = f(n) für alle n P N.
Einen Wert xn = f(n) nennen wir auch ein Glied der Folge und die Stelle n
einen Index. Anstelle von (xn )n P N schreiben wir auch
(x0 , x1 , x2 , …, xn , …) oder x0 , x1 , x2 , …, xn , …
Eine Folge wird üblicherweise nicht mit einem Funktionsnamen wie f,g,h versehen (man kann dies natürlich tun, wenn man möchte), sondern einfach in der
Form (xn )n P N angegeben. Besonders nützlich ist die Folgennotation, wenn die
Funktionswerte durch Terme definiert sind. So ist zum Beispiel (n2 )n P N die
Funktion f auf N mit f(n) = n2 für alle n P N.
Folgen tauchen in vielen Varianten auf. Oft beginnt man mit dem Index 1 statt
0 und notiert eine solche Folge in der Form (xn )n ≥ 1 oder x1 , x2 , …, xn , … (n ≥ 1).
Da eine Folge eine Funktion (einer bestimmten Form) ist, stehen ohne weitere
Definitionen alle funktionalen Begriffe zur Verfügung:
Beispiele
(1) Die Folge (1)n P N ist die Folge (xn )n P N mit xn = 1 für alle n. In der
alternativen Notation lautet sie 1, 1, 1, …
(2) Die Folge (1/n)n ≥ 1 ist die Folge (xn )n ≥ 1 mit xn = 1/n für alle n ≥ 1. Wir
können sie auch notieren als 1, 1/2, 1/3, …, 1/n, …
(3) Eine Folge (xn )n P N ist injektiv, wenn alle Folgenglieder paarweise
verschieden sind, d. h. wenn xn ≠ xm für alle n ≠ m.
(4) Eine Folge (xn )n P N in R ist monoton wachsend, wenn xn ≤ xn + 1 für alle
n gilt. Gilt stärker xn < xn + 1 für alle n, so ist sie streng monoton
wachsend.
(5) Ist (xn )n P N eine Folge in R und (nk )k P N eine Folge in N, so ist
(xn )n P N + (nk )k P N = (xnk )k P N .
Der besseren Lesbarkeit halber kann man den Index nk auch in der
Form n(k) schreiben und die Komposition als (xn(k) )k P N angeben.
Einführung in die Mathematik 1
© Oliver Deiser
2. Grenzwerte für Folgen und Reihen
273
Zur Visualisierung einer reellen Folge stehen verschiedene Möglichkeiten zur
Verfügung. Zwei davon betrachten wir genauer.
Visualisierung einer reellen Folge, Typ I
Die Folge (xn )n P N wird als Punktfolge auf der x-Achse gezeichnet. Man
trägt die Folgenglieder xn als Punkte auf der x-Achse ein und benennt die
Punkte derart, dass die Indizes eindeutig aus dem Diagramm hervorgehen.
Visualisierung einer reellen Folge, Typ II
Die Folge (xn )n P N wird als Funktionsgraph (bestehend aus Punkten der
Ebene) gezeichnet: Der Graph besteht aus den Punkten (n, xn ) P R2 , n P N.
x2 n + 1
-2
x2 n
-1
0
1
2
Typ I: Visualisierung der Folge 1, −1, 1, −1, 1, −1, …
1.0
0.5
1
2
3
4
5
6
7
8
9
10
-0.5
-1.0
Typ II: Visualisierung der Folge 1, −1, 1, −1, 1, −1, …
1.0
0.5
1
2
3
4
5
6
7
8
9
10
-0.5
Typ II: Visualisierung der Folge (xn )n ≥ 1 mit xn = (−1)n + 1 /n für alle n ≥ 1
© Oliver Deiser
Einführung in die Mathematik 1
274
3. Abschnitt
Reelle und komplexe Zahlen
Die Epsilon-Definition des Grenzwerts einer Folge
Anschaulich bedeutet x = limn P N xn , dass die Folgenglieder gegen x streben,
wenn n gegen unendlich strebt. Wie lässt sich dies präzisieren? Der erste Ansatz
ist vielleicht:
„Die Folgenglieder xn kommen dem Wert x beliebig nahe.“
Dies ist notwendig für die Konvergenz gegen x, aber nicht ausreichend. Die
Folge
1/2, 1, 1/4, 1, 1/8, 1, …
kommt zum Beispiel der Null beliebig nahe, hat aber die Null nicht als Grenzwert. Wir müssen also die Bedingung verstärken:
„Die Folgenglieder xn sind ab einer bestimmten Stelle beliebig nahe bei x.“
Mit dieser Formulierung sind wir schon fast am Ziel. Wir müssen nur noch die
Abhängigkeitsverhältnisse zwischen „ab einer bestimmten Stelle“ und „beliebig
nahe“ klären, um eine exakte Definition zu erhalten, mit der wir arbeiten können. Allen Ansprüchen an Genauigkeit gerecht wird:
Definition (Grenzwert, Limes, Konvergenzbedingung)
Sei (xn )n P N eine Folge in R, und sei x P R. Dann heißt x Grenzwert oder
Limes der Folge (xn )n P N , falls gilt
∀ε > 0 ∃n0 ∀n ≥ n0 |x − xn | < ε.
(Konvergenzbedingung)
x+
x
x-
0
1
2
3
4
5
6
7
8
9 10 11 12 13 14 15 16 17 18 19 20
Visualisierung der Konvergenz-Bedingung für eine Folge (xn )n P N
Einführung in die Mathematik 1
© Oliver Deiser
2. Grenzwerte für Folgen und Reihen
275
Die Konvergenzbedingung besagt, dass für jedes (noch so kleine) ε > 0 ein
Index n0 existiert, sodass alle xn ab der Stelle n0 (d. h. für n ≥ n0 ) im Intervall
I(x, ε) = ] x − ε, x + ε [
liegen. Mit der Konvention
„fast alle“ = „alle bis auf höchstens endlich viele Ausnahmen“
können wir die Konvergenzbedingung so formulieren:
Umformulierung der Konvergenzbedingung
Für alle ε > 0 gilt:
Fast alle Folgenglieder sind Elemente von I(x, ε) = ] x − ε, x + ε [.
Diese Umformulierung lässt sich anschaulich so ausdrücken:
„Jedes (noch so kleine) Intervall ] x − ε, x + ε [ fängt die Folge schließlich ein.“
Im Fall der Existenz ist ein Grenzwert eindeutig bestimmt (Beweis als Übung).
Damit können wir einführen:
Limesnotation
Ist x P R der Grenzwert der Folge (xn )n P N , so schreiben wir
x = limn
→∞
xn oder kurz x = limn xn .
Schließlich definieren wir:
Definition (konvergent, divergent)
Sei (xn )n P N eine Folge in R. Besitzt (xn )n P N einen Grenzwert x P R, so
heißt die Folge konvergent. Andernfalls heißt sie divergent.
Definition (Nullfolge)
Gilt limn xn = 0, so nennen wir (xn )n P N auch eine Nullfolge.
Uneigentliche Grenzwerte
Wie für die Bildung von Supremum und Infimum ist es oft nützlich, auch die
symbolischen Werte ∞ und −∞ als Grenzwerte zuzulassen.
Definition (uneigentliche Konvergenz)
Für eine Folge (xn )n P N in R definieren wir
limn xn = ∞
falls
limn xn = −∞ falls
∀k > 0 ∃n0 ∀n ≥ n0 xn ≥ k,
∀k > 0 ∃n0 ∀n ≥ n0 xn ≤ −k.
Gilt limn xn = ± ∞, so nennen wir die Folge (xn )n P N uneigentlich konvergent.
Die Bedingungen besagen anschaulich, dass fast alle Glieder der Folge größer-
© Oliver Deiser
Einführung in die Mathematik 1
276
3. Abschnitt
Reelle und komplexe Zahlen
gleich (bzw. kleinergleich) einer beliebigen vorgegebenen Schranke sind. Eine
uneigentlich konvergente Folge ist nach wie vor divergent im Sinne der (eigentlichen) Konvergenz einer Folge in R.
Beispiele
(1) Es gilt limn ≥ 1 1/n = 0. Die Folge (1/n)n ≥ 1 ist eine Nullfolge.
(2) Es gilt limn n = ∞. Die Folge (n)n P N ist uneigentlich konvergent.
(3) limn (−1)n existiert nicht. Die Folge ((−1)n )n P N ist beschränkt und
divergent. limn (−1)n n existiert nicht. Die Folge ((−1)n n)n P N
konvergiert weder eigentlich noch uneigentlich.
(4) Es gilt limn xn = ∞ genau dann, wenn limn −xn = −∞.
Die Limesregeln
Für die Berechnung von Grenzwerten sind die folgenden Regeln unentbehrlich, die wir hier ohne Beweis angeben:
Satz (Limesregeln)
Seien (xn )n P N und (yn )n P N (x n )n P N konvergente Folgen in R. Dann gilt:
(a) lim n (x n + yn ) = lim n x n + lim n yn ,
(b) lim n (c x n ) = c lim n x n für alle c P R,
(c) lim n (x n − yn ) = lim n x n − lim n yn ,
(d) lim n (x n yn ) = lim n x n lim n yn .
(e)
lim n
(
xn
yn
)
=
lim n xn
, falls yn ≠ 0 für alle n und limn yn ≠ 0.
lim n yn
Beispiele
(1) Es gelte lim n x n = x. Dann gilt
lim n (xn2 ) = lim n (x n x n ) = (lim n x n ) ⋅ (lim n x n ) = x x = x2 .
Analoges gilt für höhere Exponenten.
(2) Es gilt
lim n ≥ 1
(
2 + n3
n3
2 lim n ≥ 1
1
n
)3
Einführung in die Mathematik 1
= lim n ≥ 1
(
2
n3
+
n3
n3
)
=
+ lim n ≥ 1 1 = 2 ⋅ 0 3 + 1 = 1.
© Oliver Deiser
2. Grenzwerte für Folgen und Reihen
277
Eine Charakterisierung der konvergenten Folgen
Welche Folgen konvergieren und welche nicht? Für monotone Folgen und
Pendelfolgen können wir einfache Kriterien angeben:
Konvergenzkriterium für monotone Folgen
Eine monotone Folge (xn )n P N konvergiert genau dann, wenn sie beschränkt
ist. In diesem Fall gilt je nach Monotonietyp
limn xn = supn xn bzw.
(bei monotoner Zunahme)
limn xn = infn xn .
(bei monotoner Abnahme)
Konvergenzkriterium für Pendelfolgen
Eine Pendelfolge (xn )n P N konvergiert genau dann, wenn die Folge der
Abstände gerader und ungerader Folgenglieder gegen Null konvergiert,
d. h. wenn limn |x2n + 1 − x2n | = 0. In diesem Fall gilt je nach Typ
limn xn = supn x2n = infn x2n + 1 bzw.
(bei Linksstart)
limn xn = supn x2n + 1 = infn x2n .
(bei Rechtsstart)
Was kann man über die Konvergenz allgemeiner Folgen sagen, die nicht notwendig diesen beiden Grundtypen angehören? Erstaunlicherweise gibt es eine
Bedingung, die für alle Folgen geeignet ist. Sie besagt anschaulich, dass sich die
Folgenglieder beliebig verdichten:
Definition (Cauchy-Folge, Cauchy-Bedingung)
Eine Folge (xn )n P N in R heißt Cauchy-Folge, falls gilt
∀ε > 0 ∃n0 ∀n, m ≥ n0 |xn − xm | < ε.
(Cauchy-Bedingung)
Diese Bedingung fängt genau die konvergenten Folgen ein:
Satz (Charakterisierung der konvergenten Folgen)
Sei (xn )n P N eine Folge in R. Dann konvergiert die Folge genau dann, wenn
sie eine Cauchy-Folge ist. In diesem Fall ist
limn xn = infn supk ≥ n xk = supn infk ≥ n xk .
Der Beweis dieses Satzes wird in der Analysis geführt. Die Formeln für den
Grenzwert zeigen, dass der Grenzwert auch im allgemeinen Fall mit Hilfe einer
Supremums- und Infimums-Bildung identifiziert werden kann. Die Formeln
sind deutlich komplizierter als die Formeln für monotone Folgen und Pendelfolgen, dafür aber für alle Folgen anwendbar.
© Oliver Deiser
Einführung in die Mathematik 1
278
3. Abschnitt
Reelle und komplexe Zahlen
Konvergenz von Cauchy-Folgen als Axiom
Die Aussage „Jede Cauchy-Folge in R konvergiert.“ wird auch oft als
Axiom für die reellen Zahlen verwendet und als (metrisches) Vollständigkeitsaxiom bezeichnet. Zusammen mit dem Archimedischen Axiom ist das
metrische Vollständigkeitsaxiom äquivalent zu unserem linearen Vollständigkeitsaxiom, das die Existenz eines Supremums für nichtleere und
beschränkte Teilmengen von R fordert. Welchen Zugang man für die
reellen Zahlen bevorzugt, ist letztendlich Geschmackssache. Die Existenz
eines Supremums einer nichtleeren beschränkten Teilmenge von R ist
vielleicht etwas anschaulicher als die Existenz des Grenzwerts einer
Cauchy-Folge. Ganz unabhängig davon ist der Begriff der Cauchy-Folge
unverzichtbar zur Beschreibung der Vollständigkeit von Räumen, die eine
Abstandsmessung zulassen, aber keine lineare Struktur mehr aufweisen.
Unendliche Reihen
Wir haben schon mehrfach unendliche Summen der Form
(+) x0 + x1 + … + xn + …
betrachtet, sog. unendliche Reihen. Mit Hilfe des Grenzwerts für Folgen können
wir die Konvergenz unendlicher Reihen präzisieren ohne weitere Grenzwertdefinitionen einzuführen. Dies erfolgt durch Betrachtung der Partialsummen
s0 = x0 , s1 = x0 + x1 , s2 = x0 + x1 + x2 , …, sn = x0 + … + xn , …,
die auftreten, wenn wir die Summe (+) schrittweise berechnen.
Definition (Partialsumme, unendliche Reihe, Summe, Wert)
Sei (x n )n P N eine Folge in R. Für alle n P N sei
sn = x0 + … + xn = ∑ k ≤ n x k
die n-te Partialsumme der Folge. Wir setzen
∑ n P N x n = (sn )n P N
und nennen ∑ n P N xn die unendliche Reihe mit den Summanden xn . Im Fall
der Konvergenz der Folge der Partialsummen setzen wir zudem
∑ n P N x n = limn sn .
Diesen Grenzwert nennen wir die Summe von (xn )n P N oder den Wert der
unendlichen Reihe.
Notation
Neben ∑ n P N x n verwenden wir gleichwertig auch die Notationen
∞
∑ n = 0 x n , ∑ n ≥ 0 x n , ∑ n x n , x0 + x1 + x2 + … + xn + …
Einführung in die Mathematik 1
© Oliver Deiser
2. Grenzwerte für Folgen und Reihen
279
Das Summenzeichen hat eine Doppelbedeutung: Für jede Folge (xn )n P N ist
die unendliche Reihe ∑ n xn definiert als die Folge (sn )n P N der Partialsummen der
Folge. Konvergiert die Folge der Partialsummen, so bezeichnet ∑ n xn nun auch
den Grenzwert der Folge der Partialsummen. Die Bedeutung geht in der Regel
aus dem Kontext hervor:
Beispiel
1. Bedeutung: „Die Reihe ∑ n 1/2n konvergiert.“
2. Bedeutung: „Es gilt ∑ n 1/2n = 1 + 1/2 + 1/4 + … + 1/2n + … = 2.“
1. Bedeutung: „Die Reihe ∑ n (−1)n divergiert.“
2.0
1.5
1.0
0.5
0
1
2
3
4
5
6
7
8
9
10
Die Partialsummen sn der unendlichen Reihe ∑ n 1/2n .
Es gilt limn sn = 2 und damit ∑ n 1/2n = 2.
1
0.5
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Die Partialsummen sn der unendlichen Reihe ∑ n (−1)n .
Die Reihe ∑ n (−1)n divergiert, da die Folge der Partialsummen divergiert.
© Oliver Deiser
Einführung in die Mathematik 1
280
3. Abschnitt
Reelle und komplexe Zahlen
Die geometrische Reihe
Sei q P R. Bei der Diskussion der Polynomdivision hatten wir bereits die geometrische Summe
q0 + … + qn =
1 − qn + 1
,
1−q
falls q ≠ 1
betrachtet, die sich aus der (auch für q = 1 gültigen) Teleskop-Summe
(q0 + … + qn ) (1 − q) = q0 − q1 + q2 − q2 + … − qn + 1 = 1 − qn + 1
ergibt. Die zugehörige unendliche Reihe ist
∑ n qn = q0 + … + qn + …
(geometrische Reihe)
Ihr Konvergenzverhalten wird zusammengefasst in:
Satz (Konvergenz der geometrischen Reihe)
Sei q P R. Ist |q| < 1, so ist ∑ n qn konvergent und es gilt
∑ n qn =
1
.
1−q
Ist |q| ≥ 1, so divergiert ∑ n qn .
Wir erinnern an den Beweis. Ist |q| < 1, so gilt
∑ n qn = limn sn = limn
1 − qn + 1
1−q
=
1
,
1−q
wobei wir verwenden, dass
limn qn + 1 = limn qn = 0 (da |q| < 1).
Ist dagegen |q| > 1, so gilt |sn + 1 − sn | ≥ 1 für alle n, sodass die Folge (sn )n P N der
Partialsummen divergent ist.
Nützlich ist:
Geometrische Reihe ab dem Index 1
∑ n ≥ 1 qn =
q
1−q
für alle |q| < 1.
Diese Formel ergibt sich aus
1
1−q
− q0 =
1
1−q
Einführung in die Mathematik 1
− 1 =
q
.
1−q
© Oliver Deiser
2. Grenzwerte für Folgen und Reihen
281
1.0
0.8
0.6
0.4
0.2
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Die Folge Partialsummen sn der geometrischen Reihe ∑ n qn mit q = −2/3.
Die Reihe konvergiert gegen 1/(1 − q) = 3/5.
1.0
0.8
0.6
0.4
0.2
0
5
10
15
20
25
30
35
40
45
50
Die Partialsummen sn der geometrischen Reihe ∑ n qn mit q = −9/10.
Die Reihe konvergiert (deutlich langsamer als oben) gegen 1/(1 − q) = 10/19.
Für positive q sind die Partialsummen der geometrischen Reihe ∑ n qn streng
monoton wachsend. Für q P [ 0, 1 ] konvergiert die Reihe. Strebt q im Intervall
[ 0, 1 ] gegen 1, wird der Wert der Reihe beliebig groß, da dann 1/(1 − q) gegen
unendlich konvergiert. Ab einschließlich q = 1 ist die geometrische Reihe
uneigentlich konvergent gegen ∞.
Für negative q bilden die Partialsummen von ∑ n qn eine rechtsstartende
Pendelfolge. Für q P ] −1, 0 [ konvergiert die Reihe mit Werten im Intervall ] 1/
2, 1 [. Für q ≤ −1 ist die Reihe divergent und auch nicht uneigentlich
konvergent. Für q = −1 ergibt sich 1, 0, 1, 0, … als Folge der Partialsummen.
Die Formel 1/(1 − q) liefert für q = −1 den Wert 1/2, aber die Folge der
Partialsummen divergiert.
© Oliver Deiser
Einführung in die Mathematik 1
282
3. Abschnitt
Reelle und komplexe Zahlen
Die harmonische Reihe
Die harmonische Reihe ist die Reihe
1
n
∑n ≥ 1
1
2
= 1 +
+
1
3
+
1
4
+ …
Die Partialsummen sn dieser Reihe sind aufgrund der positiven Summanden
streng monoton steigend. Das Wachstum ist jedoch sehr langsam. Durch folgende geistreiche Zusammenfassung von Summanden können wir sehen, dass
die harmonische Reihe divergiert:
1 +
1
2
= 1 +
≥
1
2
+
1
3
1
+
2
1
2
+
1
4
+
(
+ …
1
1
+
3
4
+
1
2
)+(
1
1
+…+
5
8
)+(
1
1
+…+
9
16
)+…
+ … = ∞.
Die harmonische Reihe zeigt:
Eine Nullfolge aus positiven Summanden führt nicht immer eine endliche Summe.
Man kann zeigen, dass die Folge der Partialsummen sn = 1 + … + 1/n der
harmonischen Reihe bis auf eine Konstante so wächst wie der natürliche Logarithmus. Es gilt
limn ( sn − log(n) ) = γ = 0,57721…
(Euler-Mascheroni-Konstante)
5
4
3
log(x)
2
log(x) +
1
5
10
15
20
25
-1
Die Partialsummen der harmonischen Reihe im Vergleich mit dem Logarithmus
Einführung in die Mathematik 1
© Oliver Deiser
2. Grenzwerte für Folgen und Reihen
283
In den Übungen werden wir sehen, dass
∑n ≥ 1
1
n2
= 1 +
1
4
1
9
+
+
1
16
+ …
konvergiert. Euler zeigte, dass π2 /6 der Wert dieser Reihe ist.
s
1.5
1
0.5
0
5
10
15
20
25
Die Partialsummen der Reihe ∑ n 1/n2 und ihr Wert s = π2 /6 = 1,6449…
Allgemeiner konvergiert die Reihe
∑n ≥ 1
1
nk
= 1 +
1
2k
1
3k
+
+ …
für jedes k ≥ 2. Die Werte dieser Reihen konnten für gerade Exponenten k berechnet werden. So gilt zum Beispiel
∑n ≥ 1
1
n4
=
π4
,
90
∑n ≥ 1
1
n6
=
π6
.
945
Für ungerade Exponenten k ist dagegen nur wenig bekannt. Ein einfacher Zusammenhang zwischen ∑ n ≥ 1 1/n3 und π3 scheint nicht zu bestehen.
Eine unendliche Reihe, die noch langsamer divergiert als die harmonische
Reihe, ist
∑ p prim
1
p
=
1
2
+
1
3
+
1
5
+
1
7
+
1
11
+ … = ∞.
Die Divergenz dieser Reihe kann mit Methoden der analytischen Zahlentheorie
gezeigt werden. Das Wachstum entspricht dem von log(log(x)) und wieder
taucht die Euler-Mascheroni-Konstante γ auf. Ein bemerkenswertes Ergebnis
einer wunderbaren Theorie.
© Oliver Deiser
Einführung in die Mathematik 1
284
3. Abschnitt
Reelle und komplexe Zahlen
2.0
1.5
1.0
log(log(x))
0.5
log(log(x)) +
5
10
15
20
25
30
35
40
-0.5
-1.0
Die Partialsummen der Reihe ∑ p prim 1/p im Vergleich mit log(log(x))
Konvergenzkriterien für unendliche Reihen
Wir betrachten drei klassische Kriterien, mit denen sich in vielen Fällen die
Konvergenz einer Reihe feststellen lässt.
Satz (Leibniz-Kriterium für alternierende Reihen)
Sei (xn )n P N eine monoton fallende Nullfolge. Dann konvergiert
∑ n (−1)n xn = x0 − x1 + x2 − x3 + …
Der einfache Beweis besteht in der Beobachtung dass die Partialsummen
sn = ∑ k ≤ n (−1)k xk
eine konvergente (in x0 rechtsstartende) Pendelfolge bilden.
Beispiele
Die unendlichen Reihen
∑n≥1
(−1)n − 1
n
= 1 −
1
1
1
+
−
+ …
2
3
4
(alternierende harm. Reihe)
∑n≥1
(−1)n − 1
2n − 1
= 1 −
1
1
1
+
−
+ …
3
5
7
(Leibniz-Reihe)
konvergieren nach dem Leibniz-Kriterium. Weitaus schwieriger als die
Feststellung der Konvergenz ist die Berechnung der Grenzwerte. Man
kann zeigen, dass die alternierende harmonische Reihe gegen log(2) und die
Leibniz-Reihe π/4 konvergiert; der Leser vergleiche hierzu die TaylorEntwicklungen des Logarithmus und Arkustangens in Abschnitt 2.
Einführung in die Mathematik 1
© Oliver Deiser
2. Grenzwerte für Folgen und Reihen
285
Unser zweites Kriterium ist:
Satz (Majoranten-Kriterium)
Sei ∑ n yn eine konvergente Reihe positiver reeller Zahlen. Weiter sei
(xn )n P N eine Folge in R mit |xn | ≤ yn . Dann konvergiert ∑ n xn .
Zum Beweis zeigt man, dass die Partialsummen der Folge (xn )n P N eine
Cauchy-Folge bilden. Gelten die Voraussetzungen des Satzes, so sagen wir auch,
dass die Reihe ∑ n xn durch die konvergente Reihe ∑ n yn majorisiert wird.
1.0
q
q2
q3
0.5
1
2
3
4
5
6
7
8
9
10
11
12
-0.5
-1.0
Majorisierung durch eine geometrische Reihe ∑ n qn mit q = 9/10:
Eine Reihe ∑ n xn konvergiert, falls jedes xn im n-ten grauen Intervall [ − qn , qn ] liegt.
Das Kriterium führt im Zusammenspiel mit der geometrischen Reihe zu:
Satz (Quotienten-Kriterium)
Sei ∑ n xn eine unendliche Reihe mit xn ≠ 0 für alle n P N. Es gebe ein
q P ] 0, 1 [ mit der Eigenschaft
|
xn + 1
xn
|≤q
für alle n P N.
Dann konvergiert ∑ n xn .
Beweis
Sei q wie im Satz. Dann gilt
|x1 | ≤ q |x0 |, |x2 | ≤ q |x1 | ≤ q2 |x0 |, …
Induktiv ergibt sich
|xn | ≤ |x0 | qn für alle n P N.
Damit wird die Reihe ∑ n xn durch die (wegen q < 1 konvergente) skalierte
geometrische Reihe | x0 | ∑ n qn majorisiert.
© Oliver Deiser
Einführung in die Mathematik 1
286
3. Abschnitt
Reelle und komplexe Zahlen
Warnung
Im Quotientenkriterium ist es wichtig, dass q < 1. Es genügt nicht, dass alle
Quotienten im Betrag kleiner als 1 sind. Die divergente Majorante ∑ n 1n
beweist weder die Konvergenz noch die Divergenz von ∑ n xn . Entsprechende Beispiele diskutieren wir in den Übungen.
Für Anwendungen ist nützlich:
Gültigkeit ab einer Stelle im Quotienten-Kriterium
Da die Konvergenz einer unendlichen Reihe nicht von endlich vielen
Summanden abhängt, genügt es im Majoranten- und Quotientenkriterium,
wenn die Bedingungen ab einer Stelle n0 gelten, also zum Beispiel
|
xn + 1
xn
|
≤
9
10
für alle n ≥ 5
erfüllt ist.
Ein Beispiel für eine derartige Abschätzung der Quotienten ab einer Stelle liefert die folgende vielleicht wichtigste Anwendung des Quotientenkriteriums,
mit der wir eine Hypothek einlösen können:
Konvergenz der Exponentialreihe
Sei x P R beliebig. Wir betrachten die Exponentialreihe
∑n
xn
n!
= 1 + x +
x2
2
+
x3
3!
+ …
Sei nun n0 eine natürliche Zahl mit n0 ≥ 2|x|. Dann gilt
|
xn + 1 /(n + 1)!
xn /n!
|=
|x|
n+1
<
1
2
für alle n ≥ n0 .
Damit konvergiert die Exponentialreihe für alle x P R. Der Konvergenzbeweis verwendet letztendlich eine Majorisierung durch eine geometrische Reihe.
Einführung in die Mathematik 1
© Oliver Deiser
2. Grenzwerte für Folgen und Reihen
287
Übungen
Übung 1
Zeichnen Sie Diagramme des Typs I und II zu einigen Folgen Ihrer Wahl.
Diskutieren Sie die Unterschiede der beiden Typen und die Frage, ob sich
sich für gewisse Folgen ein Typ besser eignet als der andere.
Übung 2
Erläutern Sie die Konvergenz und Divergenz von Folgen mit Hilfe der
Folgendiagramme von Typ I und II. Betrachten Sie dabei zunächst einen
anschaulichen Grenzwertbegriff und in einer zweiten Stufe die ε-Definition.
Übung 3
Zeigen Sie mit Hilfe der ε-Definition, dass ein Grenzwert einer konvergenten Folge (xn )n P N eindeutig bestimmt ist. Zeichnen Sie ein Diagramm, das
die Beweisidee erläutert.
Übung 4
Seien (xn )n P N und (yn )n P N gegen x bzw. y konvergente Folgen in R. Zeigen
Sie, dass limn (xn + yn ) = x + y. Erstellen Sie wieder ein Diagramm zur
Illustration.
Übung 5
Erstellen Sie ein Diagramm vom Typ II für die Partialsummen der
alternierenden harmonischen Reihe.
Übung 6
(a) Bestimmen Sie die Partialsummen sn und den Wert der Reihe
∑n ≥ 1
1
n(n + 1)
=
1
1⋅2
+
1
2⋅3
+
1
3⋅4
+ …
(b) Zeigen Sie mit Hilfe von (a), dass die Reihe ∑ n ≥ 1 1/n2 konvergiert.
(c) Lässt sich das Quotientenkriterium verwenden, um die Konvergenz
der Reihe ∑ n ≥ 1 1/n2 zu beweisen?
Übung 7
Untersuchen Sie die unendliche Reihe
∑n ≥ 1
n2
2n
auf Konvergenz.
© Oliver Deiser
Einführung in die Mathematik 1
288
3. Abschnitt
Reelle und komplexe Zahlen
Übung 8
Visualisieren Sie die folgenden geometrischen Reihen:
∑n ≥ 1
1
2n
= 1, ∑ n ≥ 1
1
4n
=
1
1
, ∑ n ≥ 1 (−
3
2
)n
=
2
.
3
Übung 9
Wir betrachten die unendliche Reihe
∑n ≥ 1
n
2n
=
1
2
+
2
4
+
3
8
+
4
16
+
5
32
+ …
(a) Berechnen Sie einige Partialsummen sn und vermuten Sie, welchen
Wert die Reihe besitzt.
(b) Ordnen Sie die Summanden in der aufgespalteten Form
1
,
2
1
,
4
1
,
4
1
,
8
1
,
8
1
, …
8
so an, dass Sie den Wert der Reihe bestimmen können.
Übung 10
Sei ∑ n xn eine unendliche Reihe wie im Leibniz-Kriterium. Zeigen Sie,
dass die Partialsummen der Reihe eine konvergente Pendelfolge bilden.
Erstellen Sie ein Diagramm zur Illustration.
Übung 11
Recherchieren Sie nach weiteren Beweisen für die Divergenz der harmonischen Reihe. Vergleichen Sie einen der Beweise mit dem hier geführten
Beweis durch Klammerung.
Übung 12
Recherchieren Sie, was über die unendlichen Reihen der Form ∑ n ≥ 1 1/nk
mit k P N* bekannt und nicht bekannt ist.
Einführung in die Mathematik 1
© Oliver Deiser
3. Grenzwerte und Stetigkeit
von Funktionen
In diesem Kapitel präzisieren wir mit Hilfe der Epsilontik die Begriffe „Grenzwert“ und „Stetigkeit“ für Funktionen. Wir wählen einen anschaulichen Zugang, bei dem der Verlauf eines Funktionsgraphen innerhalb gewisser Rechtecke
betont wird.
© Oliver Deiser
Einführung in die Mathematik 1
290
3. Abschnitt
Reelle und komplexe Zahlen
Grenzwerte bei Funktionen
Wir haben den Grenzwert
limx
→p
f(x) = a
einer Funktion f : P → R und einer reellen Zahl a bislang anschaulich verwendet,
vor allem bei der Untersuchung von Differentialquotienten. Unser Ziel ist es
nun, diesen Grenzwert genau zu definieren. Dabei treffen wir folgende Vereinbarung über die Stelle p:
Vereinbarung
Wir nehmen im Folgenden an, dass für alle ε > 0 das Intervall ] p − ε, p + ε [
mindestens ein Element des Definitionsbereichs P von f enthält.
Dies ist insbesondere dann erfüllt, wenn p ein Element von P ist oder wenn P
ein Intervall und p eine Intervallgrenze von P ist (die nicht notwendig zu P gehören muss).
Nach diesen Vorbereitungen definieren wir:
Definition (Verlauf in einem Rechteck)
Seien f : P → R und (p, a) P R2 . Weiter seien ε, δ > 0. Wir sagen, dass die
Funktion f im ε-δ-Rechteck bei (p, a) verläuft, falls gilt:
Für alle x P P mit |x − p| < δ gilt |f(x) − a| < ε.
Anschaulich besagt die Bedingung, dass der Graph der Funktion f im Intervall ] p − δ, p + δ [ ganz innerhalb des Rechtecks R mit Mittelpunkt (p, a) und
Seitenlängen 2δ und 2ε verläuft, d. h.
Graph(f ) ∩ (Iδ (p) × R) ⊆ R = Iδ (P) × Iε (a),
wobei
Iδ (p) = ] p − δ, p + δ [, Iε (a) = ] a − ε, a + ε [.
Im Folgenden ist stets ε mit der y-Achse und δ mit der x-Achse assoziiert.
Definition (Grenzwert einer Funktion)
Wir schreiben limx → p f(x) = a, falls gilt:
Für alle ε > 0 gibt es ein δ > 0, sodass f im ε-δ-Rechteck bei (p, a) verläuft.
Wir nennen dann a den Grenzwert von f an der Stelle p und sagen, dass f
gegen a strebt, wenn x gegen p strebt.
Statt „an der Stelle“ sagen wir gleichwertig auch „im Punkt“ oder „bei“. Dies
gilt, wo immer anwendbar, auch bei den folgenden Begriffsbildungen.
Einführung in die Mathematik 1
© Oliver Deiser
3. Grenzwerte und Stetigkeit von Funktionen
291
Beispiel
Der Sinus cardinalis si : R* → R ist definiert durch
sin(x)
x
si(x) =
für alle x P R*.
Die Funktion ist im Nullpunkt nicht definiert. Wir setzen p = 0 und a = 1
und fragen nach dem Verlauf von si in ε-δ-Rechtecken bei (p, a) = (0, 1).
1.0
0.5
si(x)
-10
-5
5
10
1.0
0.5
si(x)
-10
-5
5
10
Der Sinus cardinalis verläuft im ε-δ-Rechteck bei (0, 1) für ε = 3/10 und δ = 1,
aber nicht im ε-δ-Rechteck bei (0, 1) für ε = 3/10 und δ = 2.
Ist ε > 0 vorgegeben, so verläuft f im ε-δ-Rechteck bei (0, 1), wenn δ > 0 hinreichend klein gewählt wird. Damit gilt
limx
→0
si(x) = 1.
Diesen Grenzwert kennen wir bereits von der Diskussion der Ableitung des
Sinus:
limx
→0
sin(x)
x
© Oliver Deiser
= limx
→0
sin(x) − 0
x−0
= sin′(0) = 1.
Einführung in die Mathematik 1
292
3. Abschnitt
Reelle und komplexe Zahlen
Stetigkeit
Anschaulich lässt sich die Stetigkeit einer Funktion so beschreiben:
Die Funktion macht keine Sprünge.
Die Funktionswerte ändern sich wenig, wenn sich die Stelle hinreichend wenig ändert.
Mit Hilfe des Grenzwertbegriffs für Funktionen können wir die Stetigkeit in
einfacher Weise exakt definieren:
Definition (Stetigkeit einer Funktion)
Sei f : P → R, und sei p P P. Dann heißt f stetig an der Stelle p, falls gilt:
limx
→p
f(x) = f(p).
Andernfalls heißt f unstetig an der Stelle p. Weiter heißt f stetig, falls f stetig
an allen Stellen p P P ist.
Bemerkung
(1) Eine Aussage „f ist stetig/unstetig bei p“ beinhaltet immer, dass p ein
Element des Definitionsbereichs P von f ist. Die Funktion 1/x ist stetig
(ergänze: überall auf ihrem Definitionsbereich R*). Es ergibt keinen
Sinn zu sagen, dass 1/x unstetig im Nullpunkt ist, weil die Funktion
dort nicht definiert ist.
(2) Da p ein Element des Definitionsbereichs von f ist, liegt f(p) in allen
betrachteten Rechtecken. Damit ist die Bedingung limx → p f(x) = f(p)
äquivalent zur Existenz des Grenzwerts limx → p f(x). Wenn dieser
Grenzwert existiert, muss er gleich p sein.
Die Bedingung limx
limx
→p
→p
f(x) = f(limx
f(x) = f(p) können wir in der Form
→p
x)
schreiben, die eine suggestive Interpretation der Stetigkeit nahelegt:
Limesbildung und Funktionsanwendung sind vertauschbar.
Ausformuliert und mit Quantoren notiert lautet unsere Definition:
Epsilon-Delta-Formulierung der Stetigkeit von f an der Stelle p
∀ε > 0 ∃δ > 0 ∀x P P (|x − p| < δ → |f(x) − f(p)| < ε).
Gleichwertig:
∀ε > 0 ∃δ > 0 ∀x P P ∩ ] p − δ, p + δ [ |f(x) − f(p)| < ε.
Für die Stetigkeit von f (an allen Stellen) kommt noch ein weiterer Allquantor
„∀p P P“ davor. Die Reihenfolge der Quantoren ist genau zu beachten.
Einführung in die Mathematik 1
© Oliver Deiser
3. Grenzwerte und Stetigkeit von Funktionen
293
p+
f(p)
2
f(p) 2
p-
p p+
f(x)
p+
2
f(p)
f(p) 2
p
f(x)
Zur ε-δ-Stetigkeit an der Stelle p: f verläuft im ε-δ-Rechteck bei (p, f(p)).
Wird ε verkleinert, kann auch δ geeignet verkleinert werden, sodass der Verlauf im
Rechteck erhalten bleibt.
Aufgrund der Quantorenformulierung wird unsere Stetigkeitsdefinition auch
ε-δ-Stetigkeit genannt. Daneben ist auch Umgebungsstetigkeit üblich, da für eine
beliebig kleine Umgebung U von f(p) eine Umgebung V von p existiert derart,
dass f die gesamte Umgebung V von p in die Umgebung U von f(p) abbildet. In
dieser „topologischen Form“ wird die Stetigkeit in der Mathematik heute in allgemeineren Räumen erklärt, in denen ein Umgebungsbegriff definiert ist.
Die Stetigkeit von f bedeutet nicht, dass man den Graphen von f ohne abzusetzen zeichnen kann. Der Stetigkeitsbegriff ist wesentlich allgemeiner. Zum einen
haben wir bereits gesehen, dass etwa die Funktion f : R* → R mit f(x) = 1/x für alle
x P R* stetig ist. Sie lässt sich aber nicht zeichnen, ohne abzusetzen, da sie im
Nullpunkt nicht definiert ist. Nun könnte man einwenden, dass f natürlich auf
einem Intervall definiert sein muss, damit die Anschauung greift. Aber auch dann
ist die Anschauung nicht korrekt. Weierstraß zeigte, dass es stetige Funktionen
gibt, die an keiner Stelle differenzierbar sind. Derartige Funktionen kann man
nicht zeichnen ohne abzusetzen. Korrekt ist: Kann man den Graphen einer auf
einem Intervall definierten Funktion f zeichnen, ohne abzusetzen, so ist f stetig.
© Oliver Deiser
Einführung in die Mathematik 1
294
3. Abschnitt
Reelle und komplexe Zahlen
1
f
1
2
1
3
1
1
1
8
4
2
1
Eine Zackenfunktion f : [ 0, 1 ] → R mit Zacken der Höhe 1, 1/2, 1/3, …, 1/n, …
Die Funktion ist stetig (auch im Nullpunkt), kann aber nicht ohne abzusetzen
gezeichnet werden: Ihr Graph besitzt aufgrund der Divergenz der harmonischen Reihe
eine unendliche Länge, da jeder Zacken länger als 1/n ist.
1.5
1.5
f1
1.0
f2
1.0
0.5
-1.0
-0.5
0.5
0.5
1.0
-1.0
-0.5
0.5
1.0
-0.5
-0.5
-1.0
-1.0
-1.5
-1.5
2
2
f4
1
-1.0
-0.5
0.5
f8
1
1.0
-1.0
-0.5
0.5
-1
-1
-2
-2
1.0
Partialsummen fn einer Weierstraß-Funktion f : R → R:
f(x) = ∑ n (1/2n ) cos(3n π x), fn (x) = ∑ k ≤ n (1/2k ) cos(3k π x) für alle x P R.
Die Funktion f ist überall stetig, aber nirgendwo differenzierbar.
Einführung in die Mathematik 1
© Oliver Deiser
3. Grenzwerte und Stetigkeit von Funktionen
295
In der Analysis zeigt man:
Satz (Stetigkeit der elementaren Funktionen)
Alle elementaren Funktionen sind stetig.
Zum Beweis dieses Satzes wird zuerst nachgewiesen, dass alle Grundfunktionen, aus denen die elementaren Funktionen aufgebaut werden (Polynome, Exponentialfunktionen, trigonometrische Funktionen) stetig sind. Weiter zeigt
man, dass die Operationen der Addition, Subtraktion, Multiplikation, Division,
Verknüpfung und Umkehrung stetige Funktionen ergeben, wenn sie auf stetige
Funktionen angewendet werden. Damit ist der Satz bewiesen, denn die elementaren Funktionen werden aus den Grundfunktionen mit Hilfe dieser Operationen aufgebaut.
Vieles ist also stetig, aber nicht alles:
Beispiele für unstetige Funktionen
(1) Die Vorzeichenfunktion sgn : R → R mit
sgn(x) = −1 für x < 0, sgn(0) = 0, sgn(x) = 1 für x > 0.
ist unstetig im Nullpunkt und in allen anderen Punkten stetig. Das
Gleiche gilt für jede andere Definition der Funktion im Nullpunkt,
etwa für die Variante, die im Nullpunkt den Wert 1 besitzt.
(2) Die Funktion f : R → R mit
f(x) = sin(1/x)
für x ≠ 0,
f(0) = 0
ist unstetig im Nullpunkt und in allen anderen Punkten stetig.
(3) Die Dirichlet-Sprungfunktion f : [ 0, 1 ] → R mit
f(x) = 1, falls x rational,
f(x) = 0, falls x irrational
ist an allen Stellen unstetig.
(4) Die Funktion f : R → R mit
f(x) = x, falls x rational,
f(x) = − x, falls x irrational,
ist im Nullpunkt stetig und an allen anderen Stellen unstetig.
(5) Die Thomae-Funktion f : R → R mit
f(x) = 0, falls x irrational,
f(m/n) = 1/n für gekürzte Brüche m/n mit n ≥ 1
ist stetig an allen irrationalen und unstetig an allen rationalen Stellen.
© Oliver Deiser
Einführung in die Mathematik 1
296
3. Abschnitt
Reelle und komplexe Zahlen
1.0
sgn(x)
0.5
-1.0
-0.5
0.5
1.0
-0.5
-1.0
Die sgn-Funktion ist unstetig an der Stelle p = 0: Für ε = 1/2 verläuft sgn nicht im
ε-δ-Rechteck bei (0, 0) = (0, sgn(0)), wie klein δ > 0 auch gewählt wird.
1.0
0.5
-1.5
-1.0
-0.5
0.5
1.0
1.5
-0.5
-1.0
Die Funktion f mit f(x) = sin(1/x) für x ≠ 0 und f(0) = 0 ist an der Stelle 0 unstetig.
1
0.75
0.5
0.25
-1.0
-0.5
0.0
0.5
1.0
1.5
2.0
Die Thomae-Funktion ist genau an den irrationalen Stellen stetig.
Einführung in die Mathematik 1
© Oliver Deiser
3. Grenzwerte und Stetigkeit von Funktionen
297
Links- und rechtsseitige Grenzwerte
Oft möchte man „x strebt gegen p“ auf die linke oder rechte Seite der betrachteten Stelle p beschränken. Unsere Grenzwertdefinition kann leicht in dieser
Hinsicht angepasst werden:
Definition (Grenzwert einer Funktion mit Nebenbedingung)
Der Grenzwert
limx
↑p
f(x) = limx
→ p, x < p
f(x) = a
ist wie oben definiert, wobei nun nur x-Werte betrachtet werden, die
kleiner als p sind. Wir nennen dann a den linksseitigen Grenzwert von f an
der Stelle p und sagen, dass f gegen a strebt, wenn x von links gegen p strebt.
Analog ist der rechtsseitige Grenzwert
limx
↓p
f(x) = limx
→ p, x > p
f(x) = a
definiert, bei dem nur x-Werte größer als p betrachtet werden.
Von der Stelle p wird bei einem linksseitigen Grenzwert immer vorausgesetzt,
dass p ein linksseitiger Häufungspunkt von P ist, d. h. es gilt
∀δ > 0 P ∩ ] p − δ, p [ ≠ 0.
Analog betrachten wir rechtsseitige Grenzwerte naturgemäß nur dann, wenn p
ein rechtsseitiger Häufungspunkt von P ist. Eine Annäherung an p von links bzw.
rechts ist andernfalls innerhalb des Definitionsbereichs P von f gar nicht möglich.
Die einseitigen Grenzwerte erlauben die folgende Charakterisierung der Stetigkeit:
Satz (Stetigkeit über einseitige Grenzwerte)
Sei f : P → R und p P P. Dann sind äquivalent:
(a) f ist stetig bei p.
(b) limx
↑p
f(x) = f(p) = limx
↓p
f(x).
Dabei ist in (b) ein einseitiger Grenzwert zu streichen, wenn p kein entsprechender Häufungspunkt von P ist. Ist also zum Beispiel P = [0, 1] und p = 1, so vereinfacht sich die Bedingung zu
limx
↑1
f(x) = f(1).
Die Aussage (b) können wir etwas salopp, aber dafür griffig, so formulieren:
Linksseitiger Grenzwert gleich Funktionswert gleich rechtsseitiger Grenzwert.
© Oliver Deiser
Einführung in die Mathematik 1
298
3. Abschnitt
Reelle und komplexe Zahlen
Beispiele
(1) Für die Vorzeichenfunktion sgn gilt
limx
↑0
sgn(x) = −1, limx
↓0
sgn(x) = 1, sgn(0) = 0.
(2) Sei f : R → R mit f(x) = 0 für alle x ≠ 0 und f(0) = 1. Dann gilt
limx
↑0
f(x) = limx
↓0
f(x) = 0, f(0) = 1.
Dass sowohl der linksseitige als auch der rechtsseitige Grenzwert gleich a ist,
kann man durch
limx
→ p, x ≠ p
f(x) = a
zum Ausdruck bringen.
Bemerkung
Nach unserer Definition wird in
limx
→p
f(x) = a
der Punkt p bei der „Annäherung an p“ zugelassen, sofern er sich im
Definitionsbereich von f befindet. Die Literatur ist hier nicht einheitlich,
manchmal wird der Punkt p explizit ausgeschlossen, sodass „x → p“ nach
unserer Lesart bedeutet, dass „x → p, x ≠ p“.
Uneigentliche Grenzwerte
Auch bei Grenzwerten für Funktionen können wir für p und a die symbolischen Werte ∞ und −∞ zulassen. Hierzu setzen wir:
limx
→∞
f(x) = a, falls ∀ε > 0 ∃n ∀x P P (x ≥ n → |f(x) − a| < ε).
limx
→p
f(x) = ∞, falls ∀m ∃δ > 0 ∀x P P (|x − p| < δ → f(x) > m).
limx
→∞
f(x) = ∞, falls ∀m ∃n ∀x P P (x ≥ n → f(x) > m).
In „x → ∞“ nehmen wir immer an, dass P nach oben unbeschränkt ist. Grenzwerte, die den symbolischen Wert −∞ enthalten, werden analog definiert. Einen
Grenzwert, der einen symbolischen Wert ∞ oder −∞ involviert, nennen wir auch
einen uneigentlichen Grenzwert
Der Leser möge sich uneigentliche Grenzwerte für Funktionen wieder mit
Hilfe von Rechtecken veranschaulichen. Die Rechtecke sind nun unbeschränkte
Teilmengen der Ebene. Die Idee bleibt gleich.
Einführung in die Mathematik 1
© Oliver Deiser
3. Grenzwerte und Stetigkeit von Funktionen
299
Die Folgenstetigkeit
Grenzwerte für Folgen und Grenzwerte für Funktionen hängen eng zusammen. In der Analysis zeigt man den folgenden Satz:
Satz (Funktionsgrenzwerte über Folgengrenzwerte)
Die folgenden Aussagen sind äquivalent:
(a) limx
→p
f(x) = a.
(b) Für jede Folge (xn )n P N in P mit limn xn = p gilt limn f(xn ) = a.
Hieraus ergibt sich eine sehr bedeutsame Formulierung der Stetigkeit einer
Funktion mit Hilfe von Folgen. Wir definieren hierzu:
Definition (Folgenstetigkeit)
Sei f : P → R, und sei p P P. Dann heißt f folgenstetig an der Stelle p, falls
gilt:
Für alle Folgen (xn )n P N in P mit limn xn = p gilt limn f(xn ) = f(p).
Weiter heißt die Funktion f folgenstetig, falls f folgenstetig an allen Stellen
p P P ist.
f(x2 )
f(p)
f(p)
f(x1 )
f(x0 )
x0
x1
x2
p
f(x)
Zur Folgenstetigkeit an der Stelle p: Konvergiert x0 , x1 , x2 , … gegen p,
so konvergieren die Funktionwerte f(x0 ), f(x1 ), f(x2 ), … gegen f(p).
Nach dem obigen Satz sind die beiden Stetigkeitsbegriffe äquivalent. Wir
halten dieses Ergebnis explizit fest:
© Oliver Deiser
Einführung in die Mathematik 1
300
3. Abschnitt
Reelle und komplexe Zahlen
Korollar (ε-δ-Stetigkeit und Folgenstetigkeit)
Sei f : P → R, und sei p P P. Dann sind die folgenden Aussagen äquivalent:
(a) f ist stetig an der Stelle p.
(b) f ist folgenstetig an der Stelle p.
Die Folgenstetigkeit einer Funktion f können wir auch so notieren:
(+) Für alle konvergenten Folgen (xn )n P N in P gilt limn f(xn ) = f(limn xn ).
Dadurch wird erneut die Vertauschbarkeit von Grenzwertbildung und Funktionsanwendung zum Ausdruck gebracht.
0
sgn(x2 )
sgn(x1 )
sgn(x0 )
x2
x1
x0
sgn(x)
Zur Folgen-Unstetigkeit von sgn an der Stelle 0: Die Folge 1, 1/2, 1/4, … konvergiert
gegen 0, aber die zugehörigen Funktionswerte konvergieren nicht gegen sgn(0) = 0.
Unsere Überlegungen zeigen, dass sich der Grenzwertbegriff für
Funktionen mit Hilfe des Grenzwertbegriffs für Folgen definieren lässt. Zum
Abschluss der Diskussion halten wir fest, dass umgekehrt auch eine Definition
des Grenzwerts für Folgen mit Hilfe der ε-δ-Grenzwertdefinition für
Funktionen möglich ist. Hierzu müssen wir nur beobachten, dass Folgen
spezielle Funktionen sind:
Satz (Folgengrenzwerte über Funktionsgrenzwerte)
Sei (xn )n P N ein Folge in R. Dann sind äquivalent:
(a) limn xn = a.
(b) limx
→∞
f(x) = a, wobei f : N → R definiert ist durch f(n) = xn .
Alternativ können wir in (b) zum Beispiel auch die Funktion g : P → R mit
P = { 1/n | n ≥ 1 } und g(1/n) = xn für alle n ≥ 1 verwenden und limx → 0 g(x) = a
fordern. Dadurch lassen sich uneigentliche Grenzwerte vermeiden.
Einführung in die Mathematik 1
© Oliver Deiser
3. Grenzwerte und Stetigkeit von Funktionen
301
Stetigkeits- und Unstetigkeitsbeweise
Die Stetigkeitsdefinitionen weisen komplexe Quantorenkombinationen auf.
Wollen wir zeigen, dass eine Funktion f : P → R an einer Stelle p P P stetig ist,
so können wir eine der beiden folgenden äquivalenten Methoden verwenden:
Nachweis der Epsilon-Delta-Stetigkeit an einer Stelle p
Wir müssen zeigen:
∀ε > 0 ∃δ > 0 ∀x P P (|x − p| < δ → |f(x) − f(p)| < ε).
Hierzu betrachten wir ein beliebiges ε > 0. Nun ist es unsere Aufgabe, ein
geeignetes δ > 0 (in Abhängigkeit von ε) zu definieren, sodass f im ε-δRechteck bei (p, f(p)) verläuft.
Nachweis der Folgenstetigkeit an einer Stelle p
Wir müssen zeigen:
Für jede Folge (xn )n P N in P mit limn xn = p gilt limn f(xn ) = f(p).
Hierzu betrachten wir eine beliebige Folge (xn )n P N in P mit limn xn = p.
Für diese Folge müssen wir nun zeigen:
∀ε > 0 ∃n0 ∀n ≥ n0 |f(xn ) − f(p)| < ε.
Zum Nachweis dieser Aussage betrachten wir ein beliebiges ε > 0. Nun
müssen wir ein geeignetes n0 finden (in Abhängigkeit von ε), sodass alle
Werte f(xn ) für n ≥ n0 im Intervall ] f(p) − ε, f(p) + ε [ liegen.
Entsprechend verlaufen Nachweise der Unstetigkeit:
Nachweis der Epsilon-Delta-Unstetigkeit an einer Stelle p
Wir müssen zeigen:
∃ε > 0 ∀δ > 0 ∃x P P (|x − p| < δ ∧ |f(x) − f(p)| > ε).
Wir müssen also ein geeignetes ε > 0 definieren, so dass f für ein beliebig
kleines δ > 0 nicht im ε-δ-Rechteck bei (p, f(p)) verläuft, also jedes derartige
Rechteck an mindestens einer Stelle x P ] p - δ, p + δ [ verlässt.
Nachweis der Folgenunstetigkeit an einer Stelle p
Wir müssen zeigen:
Es gibt eine Folge (xn )n P N in P mit limn xn = p und limn f(xn ) ≠ f(p).
Zum Beweis dieser Aussage müssen wir eine gegen p konvergente Folge
(xn )n P N in P konstruieren derart, dass die Folge (f(xn ))n P N divergiert oder
gegen ein a konvergiert mit a ≠ f(p).
© Oliver Deiser
Einführung in die Mathematik 1
302
3. Abschnitt
Reelle und komplexe Zahlen
Übungen
Übung 1
Erläutern Sie den Verlauf einer Funktion in einem ε-δ-Rechteck und die
ε-δ-Stetigkeit durch Diagramme. Achten Sie bei der Stetigkeit besonders
auf die Abhängigkeitsverhältnisse zwischen ε und δ.
Übung 2
Betrachten Sie zwei waagrechte Achsen (Kopien des reellen Zahlenstrahls).
Eine Funktion f : R → R können wir als Abbildung der Punkte der ersten
Achse auf Punkte der zweiten Achse auffassen.
(a) Illustrieren Sie diese Interpretation einer Funktion durch Diagramme anhand einfacher Beispiele.
(b) Erläutern Sie die ε-δ-Stetigkeit einer beliebigen Funktion f : R → R
an einer Stelle p anhand dieser Interpretation.
Übung 3
Die Stetigkeit hatten wir anschaulich formuliert durch:
Die Funktionswerte ändern sich wenig,
wenn sich die Stelle hinreichend wenig ändert.
Erläutern Sie die Bedeutung des Wortes „hinreichend“ in dieser Formulierung.
Übung 4
Sei f : P → R, und sei p P P. Die ε-δ-Stetigkeit von f an der Stelle p lautet:
∀ε > 0 ∃δ > 0 ∀x P P (|x − p| < δ → |f(x) − f(p)| < ε).
(a) Welche Bedeutung hat die Aussage
∃δ > 0 ∀ε > 0 ∀x P P (|x − p| < δ → |f(x) − f(p)| < ε),
bei der die Quantoren über ε und δ vertauscht sind?
(b) Welche Bedeutung hat die Aussage
∃ε > 0 ∀δ > 0 ∀x P P (|x − p| < δ → |f(x) − f(p)| < ε),
bei der die Quantoren über ε und δ verwechselt sind?
(c) Welche Bedeutung hat die Aussage
∀ε > 0 ∃δ > 0 ∃x P P (|x − p| < δ → |f(x) − f(p)| < ε),
bei der der letzte Allquantor zu einem Existenzquantor geworden
ist?
Einführung in die Mathematik 1
© Oliver Deiser
3. Grenzwerte und Stetigkeit von Funktionen
303
Übung 5
Sei f : R → R mit f(x) = x2 für alle x P R. Zeigen Sie sowohl mit Hilfe der
ε-δ-Stetigkeit als auch mit Hilfe der Folgenstetigkeit, dass f stetig ist.
Übung 6
Weisen Sie sowohl mit Hilfe der ε-δ-Stetigkeit als auch mit Hilfe der
Folgenstetigkeit nach, dass die Vorzeichenfunktion sgn : R → R unstetig
im Nullpunkt ist. Zeichnen Sie Diagramme zur Illustration Ihrer Beweise.
Übung 7
Wir betrachten die Funktion f : R → R mit
f(x) =
{
sin(1/x)
falls
0
sonst.
x≠0
(a) Bestimmen Sie die Nullstellen und lokalen Extrema von f.
(b) Weisen Sie sowohl mit Hilfe der ε-δ-Stetigkeit als auch mit Hilfe der
Folgenstetigkeit nach, dass die Funktion f im Nullpunkt unstetig ist.
Übung 8
Zeigen Sie mit Hilfe der Folgenstetigkeit und der Limesregeln für Folgen,
dass f + g, c f für c P R, f ⋅ g und f/g stetige Funktionen sind, wenn f und g
stetig sind. Folgern Sie hieraus die Stetigkeit aller Polynome und rationalen
Funktionen unter Verwendung der Stetigkeit der Identität.
Übung 9
Zeigen Sie, dass die Verknüpfung g + f zweier stetiger miteinander
verknüpfbarer Funktionen f und g stetig ist.
Übung 10
Sei f : P → R differenzierbar an der Stelle p P P. Zeigen Sie, dass f stetig an
der Stelle p ist.
© Oliver Deiser
Einführung in die Mathematik 1
4. Komplexe Zahlen
Wir erweitern die reellen Zahlen R zu den komplexen Zahlen C, sodass unser
Zahlsystem die Form
N ⊆ Z ⊆ Q ⊆ R ⊆ C
annimmt. Die komplexen Zahlen sind gegenüber den reellen Zahlen durch die
uneingeschränkte Lösbarkeit von algebraischen Gleichungen ausgezeichnet.
Dies wird durch die Hinzunahme einer neuen Zahl i, der sog. imaginären Einheit, erreicht, die die Eigenschaft i2 = −1 erfüllt. Überraschenderweise lässt sich
der neue Zahlkörper C der komplexen Zahlen einfach als die euklidische Ebene
R2 auffassen − und speziell i als der Punkt (0, 1) −, sodass die Zahlen von ihrem
„imaginären Charakter“ befreit werden: Wir rechnen mit Punkten der Ebene, so
wie wir mit Punkten einer Linie rechnen.
© Oliver Deiser
Einführung in die Mathematik 1
306
3. Abschnitt
Reelle und komplexe Zahlen
Motivation
Die Geschichte des Zahlbegriffs ist durch schrittweise Erweiterungen geprägt, die alle einer gewissen Zeit bedurften, um als Erweiterungen des Zahlbegriffs anerkannt zu werden: Die Null, rationale Zahlen als Zahlen (nicht nur als
Zahlverhältnisse), negative Zahlen, irrationale Zahlen. Einen Höhepunkt der
Entwicklung stellen die reellen Zahlen dar, die sich aufgrund ihrer Vollständigkeit als Modell eines Linearkontinuums bewährt haben. Es stellt sich die Frage:
Können die reellen Zahlen noch einmal erweitert werden oder ist R der Abschluss der
Entwicklung?
Eine mögliche Erweiterung ist bereits in der Frühgeschichte der Analysis angelegt: Infinitesimale Größen wie dx und df(x)/dx in der Leibniz-Notation. Das
Modell R und die Fundierung der Analysis mit Hilfe der Epsilontik zeigt, dass infinitesimale Größen nicht nötig sind, um die Differential- und Integralrechnung
aufbauen können. Dennoch blieb die Frage nach der Möglichkeit solcher Größen, und diese Frage ist im 20. Jahrhundert mit der Nonstandard-Analysis positiv beantwortet worden. Damit kann R (unter Preisgabe des Archimedischen
Axioms und damit der linearen Vollständigkeit) tatsächlich noch einmal erweitert werden. Aber auch eine ganz andere Erweiterung ist möglich, und um diese
Erweiterung soll es hier gehen. Wir betrachten hierzu zwei verschiedene Zugänge. Der erste entspricht grob der historischen Entwicklung, der zweite der
mathematik-intrinsischen Suche nach Struktur. Der Leser, der die komplexen
Zahlen möglichst schnell kennenlernen möchte, kann die Motivationen überschlagen.
Motivation I: Wurzeln negativer Zahlen
Die Gleichung x2 = −1 hat keine Lösung in R. Setzen wir rein formal
i = £−1
und rechnen wir mit i wie üblich, so gilt i2 = −1 und (−i)2 = −1, sodass die Gleichung x2 = −1 zwei Lösungen besitzt, wie es ja für viele Gleichungen zweiten
Grades der Fall ist. Wenn i eine Zahl sein soll, so sind auch x + i y für alle x, y P R
Zahlen. Rechnen wir wie üblich, so gilt für alle x1 , x2 , y1 , y2 P R:
(x1 + iy1 ) + (x2 + iy2 ) = (x1 + x2 ) + i (y1 + y2 ).
(x1 + iy1 ) ⋅ (x2 + iy2 )
= x1 x2 + i x1 y2 + i y1 x2 + i2 y1 y2
= (x1 x2 − y1 y2 ) + i (x1 y2 + x2 y1 ).
Je länger wir in dieser Weise rein formal rechnen, desto mehr entsteht der Eindruck, dass in den Ausdrücken x + i y neue Zahlen vorliegen, die sich von der ursprünglichen Motivation der „negativen Wurzeln“ lösen. Die neue Zahl i ist eine
Einführung in die Mathematik 1
© Oliver Deiser
4. Komplexe Zahlen
307
Zahl, deren Quadrat −1 ergibt. Das ist ungewöhnlich, aber nicht offensichtlich
widersprüchlich, da ja nicht behauptet wird, dass i eine reelle Zahl ist und dass die
neuen Zahlen in allen Aspekten mit den reellen Zahlen übereinstimmen. Der
Wunsch nach einer Präzisierung entsteht, um „vermutlich nicht widersprüchlich“ zu „nicht widersprüchlich“ zu verbessern. Da nun eine Zahl x + iy vollkommen durch die beiden beteiligten reellen Zahlen x, y bestimmt ist, kann man auf
die Idee kommen, eine Zahl x + iy mit dem Punkt (oder Vektor) (x, y) P R2 der
Ebene zu identifizieren. Diese Idee wird auch dadurch nahegelegt, dass die Formel für die Addition an eine Vektoraddition erinnert und die Formel für die Multiplikation zumindest den Kenner an die Drehformel für Vektoren der Ebene
denken lässt. Fassen wir Größen x + i y als Punkte (x, y) der Ebene auf, so werden
die Zahlen x + iy = (x, y) P R2 anschaulich und dem Reich des Imaginären entrückt. Wegen i = 0 + i 1 ist speziell
i = (0, 1)
der kanonische Einheitsvektor auf der y-Achse. Weiter lässt sich wie üblich die
Menge R der reellen Zahlen als Teilmenge von R2 auffassen, indem eine reelle
Zahl x mit dem Punkt (x, 0) identifiziert wird.
(x, y) = x + iy
iy = (0, y)
i = (0, 1)
1 = (1,0)
x = (x, 0)
Eine komplexe Zahl x + iy als Punkt (x, y) der Ebene
Damit haben wir eine Erweiterung der reellen Zahlen gefunden, die dem Zahlenstrahl keine neuen Punkte mehr hinzufügt, sondern eine zweite Dimension.
Der entscheidende Unterschied zur Vektorrechnung der Ebene ist die eigenartige Multiplikation, die sich aber zum Glück geometrisch mit Hilfe von Drehungen anschaulich deuten lässt.
© Oliver Deiser
Einführung in die Mathematik 1
308
3. Abschnitt
Reelle und komplexe Zahlen
Motivation II: Eine „gute“ Multiplikation für die Ebene
Für eine beliebige Dimension n ≥ 1 können wir zwei Vektoren des reellen
Raumes Rn = { (x1 , …, xn ) | x1 , …, xn P R } durch Addition ihrer Komponenten addieren. Für den Fall n = 2 gilt für alle (x1 , y1 ), (x2 , y2 ) P R2 :
(x1 , y1 ) + (x2 , y2 ) = (x1 + x2 , y1 + y2 ).
(komponentenweise Addition)
Diese Addition teilt mit der reellen Addition alle wesentlichen Eigenschaften.
Beispielsweise gelten das Assoziativ- und Kommutativgesetz. Folgende Frage ist
damit nur natürlich:
Kann man Vektoren der Ebene (oder allgemeiner des Rn ) nicht nur addieren, sondern
auch so multiplizieren, dass die üblichen Rechenregeln gelten?
Die Aufgabe lautet also: Finde eine „gute Multiplikation“ für die Ebene. Der erste Ansatz ist
(x1 , y1 ) ⋅ (x2 , y2 ) = (x1 x2 , y1 y2 ).
(komponentenweise Multiplikation)
Für diese Multiplikation gilt aber zum Beispiel
(1, 0) ⋅ (0, 1) = (1 ⋅ 0, 0 ⋅ 1) = (0, 0),
was im Vergleich zu R keine „gute“ Eigenschaft ist. Auch das Euklidische Skalarprodukt (x1 , y1 ) ⋅ (x2 , y2 ) = x1 x2 + y1 y2 ist als Analogon zur reellen Multiplikation
nicht überzeugend, da als Werte nur reelle Zahlen auftreten und erneut
(1, 0) ⋅ (0, 1) = 1 ⋅ 0 + 0 ⋅ 1 = 0
gilt. Wir brauchen also einen neuen Ansatz. Betrachten wir hierzu einen Punkt
z = (x, y) auf dem Einheitskreis. Für den Punkt z soll das Inverse 1/z P R2 existieren und es soll z ⋅ 1/z = 1 = (1, 0) gelten, wenn 1 = (1, 0) die Rolle der 1 übernimmt. Bei der Betrachtung dieser Inversenbildung kann man auf die Idee
kommen, den mit der x-Achse eingeschlossenen Winkel von z zu betrachten:
Spiegeln wir den Vektor z P R2 an der x-Achse zu w P R2 , so ist w das Inverse
von z, wenn die Multiplikation über die Addition von Winkeln erklärt wird.
Eine genauere Überlegung zeigt, dass folgende Multiplikationsregel nicht nur
für Punkte des Einheitskreises sondern für alle z P R2 „gut“ ist:
Multipliziere die Längen und addiere die Winkel der beiden beteiligten Vektoren.
Eine geometrische Analyse wie bei der Findung der Drehformel zeigt, dass diese
Multiplikation in kartesischen Koordinaten durch
(x1 , y1 ) ⋅ (x2 , y2 ) = (x1 x2 − y1 y2 , x1 y2 + x2 y1 )
definiert wird. Damit ist eine gute Multiplikation für die Ebene gefunden.
Wie sieht es mit den anderen Dimensionen Rn , n ≥ 3, aus? Die Antwort hierauf
ist viel schwieriger zu finden. Das überraschende Ergebnis lautet: Es gibt noch
„einigermaßen gute“ Multiplikation im R4 und R8 , in den anderen Dimensionen
jedoch nicht. Wir verweisen den Leser hierzu auf die Literatur.
Einführung in die Mathematik 1
© Oliver Deiser
4. Komplexe Zahlen
309
Die Gaußsche Zahlenebene
Motiviert durch obige Überlegungen definieren wir:
Definition (komplexe Zahlen, Gaußsche Zahlenebene)
Wir setzen
C = R2 = { (x, y) | x, y P R }.
Jedes Element z = (x, y) von C heißt eine komplexe Zahl. Für alle komplexen
Zahlen z1 = (x1 , y1 ), z2 = (x2 , y2 ) setzen wir:
z1 + z2 = (x1 + x2 , y1 + y2 ),
(komplexe Addition)
z1 ⋅ z2 = (x1 x2 − y1 y2 , x1 y2 + y1 x2 ),
(komplexe Multiplikation)
wobei auf der rechten Seite die reellen Operationen verwendet werden.
Die mit den Operationen + und ⋅ ausgestattete Menge R2 nennen wir die
Gaußsche Zahlenebene oder den Körper der komplexen Zahlen. Weiter sei
C* = C − { 0 }.
Wir identifizieren eine reelle Zahl x mit der komplexen Zahl (x, 0). Dadurch
erreichen wir R ⊆ C, sodass die komplexen Zahlen die reellen Zahlen erweitern.
Für alle c P R und z = (x, y) P C gilt
c z = c (x, y) = (c, 0) (x, y) = (c x − 0 y, c y + 0 x) = (cx, c y),
sodass die Multiplikation mit einem reellen ersten Faktor der üblichen Skalarmultiplikation von Vektoren entspricht.
Unsere bevorzugten Zeichen für komplexe Zahlen sind z,w,u. Je nach Kontext
nennen wir ein z P C eine Zahl, einen Punkt oder einen Vektor der Ebene.
z1 +z2
z1 z2
z2
z1
u
cu
© Oliver Deiser
Einführung in die Mathematik 1
310
3. Abschnitt
Reelle und komplexe Zahlen
Die geometrische Deutung der komplexen Multiplikation
Die Addition komplexer Zahlen ist die vertraute Vektoraddition. Weiter hat
sich die Multiplikation einer reellen Zahl mit einer komplexen Zahl als die übliche Skalierung eines Vektors herausgestellt. Eine anschauliche Bedeutung des
Produkts zweier beliebiger komplexer Zahlen liegt dagegen noch nicht vor. Um
eine solche zu finden, erinnern wir uns an die Drehformel: Bei unserer Diskussion der Additionstheoreme für den Kosinus und Sinus hatten wir für zwei
Punkte
P1 = (x1 , y1 ) = (cos α, sin α),
P2 = (x2 , y2 ) = (cos β, sin β)
des Einheitskreises gezeigt, dass
Q = (x1 x2 − y1 y2 , x1 y2 + y1 x2 ).
der Punkt auf dem Einheitskreis mit dem Winkel α + β (modulo 2π) ist. Das ist
genau die Form der komplexen Multiplikation. Damit erhalten wir:
Spezielle geometrische Multiplikationsregel
Das Produkt zweier komplexer Zahlen auf dem Einheitskreis ist diejenige
komplexe Zahl auf dem Einheitskreis, deren Winkel der Summe der
Winkel der beiden Zahlen entspricht.
Durch Skalierung gewinnen wir hieraus eine allgemeine Version: Sind (x1 , y1 ),
(x2 , y2 ) P C* und r1 , r2 die Euklidischen Längen der Vektoren, so gilt
(x1 , y1 ) ⋅ (x2 , y2 ) = r1 r2
(
1
(x1 , y1 ) ⋅
r1
1
(x2 , y2 ) .
r2
)
Die mit 1/r1 und 1/r2 skalierten Vektoren auf der rechten Seite sind die Projektionen der beiden Vektoren auf den Einheitskreis. Da der Winkel eines Vektors
bei Projektion auf den Einheitskreis unverändert bleibt, erhalten wir mit Hilfe
der speziellen Regel:
Geometrische Multiplikationsregel
Zwei komplexe Zahlen werden multipliziert, indem ihre Längen multipliziert und ihre (mit der positiven x-Achse eingeschlossenen und gegen den
Uhrzeigersinn gemessenen) Winkel addiert werden.
Hier und im Folgenden ordnen wir dem Nullvektor 0 = (0, 0) zur Vereinfachung
der Sprechweise den Winkel 0 zu, wo immer dies nützlich ist. Dann gilt die Regel
auch dann, wenn eine der komplexen Zahlen gleich 0 ist.
Die Multiplikation komplexer Zahlen lässt sich mit Hilfe von Polarkoordinaten bestechend einfach formulieren:
Einführung in die Mathematik 1
© Oliver Deiser
4. Komplexe Zahlen
311
Multiplikation komplexer Zahlen in Polarkoordinaten
Für alle komplexen Zahlen (r1 , ϕ1 ), (r2 , ϕ2 ) in Polarkoordinaten gilt
(r1 , ϕ1 ) ⋅ (r2 , ϕ2 ) = (r1 r2 , ϕ1 + ϕ2 ).
Mit Hilfe der geometrischen Multiplikationsregel lassen sich viele komplexe
Formeln anschaulich erklären. Man kann zum Beispiel direkt nachrechnen, dass
die komplexe Multiplikation kommutativ ist, d. h. dass z w = w z für alle z, w P C
gilt. Mit der geometrischen Deutung ist dies sofort klar, da die Multiplikation
von Längen und die Addition von Winkeln kommutativ sind. Gleiches gilt für
die Assoziativität, d. h. z (w v) = (z w) u für alle z, w, u.
z1
z1 z2
1
z1
z2
1
z2
-1
-1
1
1
-1
-1
z1 z2
7
5
2
2
12
12
3
3
3
4
4
5
6
6
11
12
12
z1
0
1
2
3
4
5
6
7
13
23
z2
12
12
7
11
6
6
5
7
z1 z2
4
4
5
4
3
17
19
3
3
12
12
2
© Oliver Deiser
Einführung in die Mathematik 1
312
3. Abschnitt
Reelle und komplexe Zahlen
Die imaginäre Einheit
Definition (imaginäre Einheit)
Wir setzen i = (0, 1) P C. Die komplexe Zahl i heißt die imaginäre Einheit.
Nach Definition der Multiplikation gilt
i = (0, 1) ⋅ (0, 1) = (0 ⋅ 0 − 1 ⋅ 1, 0 ⋅ −1 + 1 ⋅ 0) = (−1, 0) = −1.
2
Mit Hilfe der Multiplikationsregel können wir so argumentieren: Die komplexe
Zahl i2 = i ⋅ i hat die Länge 1 ⋅ 1 und den Winkel π/2 + π/2 = π, sodass
i2 = (−1, 0) = −1.
Der Vektor i = (0, 1) wird durch Multiplikation mit i um π/2 gedreht, sodass sich
(−1, 0) = −1 ergibt.
Allgemeiner gilt für alle (x, y) P C
i (x, y) = (0, 1) ⋅ (x, y) = (0 x − 1 y, 0 y + 1 x) = (−y, x).
Damit ist i (x, y) der um π/2 gedrehte Vektor (x, y), was wir erneut auch ohne
Rechnung geometrisch einsehen können: Die Länge von i(x, y) ist die Länge von
(x, y) und der Winkel von i(x, y) ist der Winkel von (x, y) plus π/2. Wir halten fest:
Drehungen um π/2
Die Multiplikation einer komplexen Zahl z mit i dreht z um π/2 gegen den
Uhrzeigersinn. Die Multiplikation von z mit (−i) dreht z um π/2 im
Uhrzeigersinn.
Eine einfache Anwendung dieser Überlegungen st:
Satz (Standarddarstellung komplexer Zahlen)
Für alle z = (x, y) P C gilt z = x + i y.
Beweis
Sei z = (x, y) P C. Dann gilt
z = (x, 0) + (0, y) = x + i (y, 0) = x + i y.
Mit Hilfe der Standarddarstellung, i2 = −1 und den üblichen Rechenregeln
lässt sich die Formel für die komplexe Multiplikation reproduzieren (vgl. obige
Motivation I):
(x1 , y1 ) ⋅ (x2 , y2 ) = (x1 + i y1 ) ⋅ (x2 + i y2 )
= x1 x2 + i x1 y2 + i y1 x2 + i2 y1 y2
= (x1 x2 − y1 y2 ) + i (x1 y2 + x2 y1 )
= (x1 x2 − y1 y2 , x1 y2 + x2 y1 ).
Einführung in die Mathematik 1
© Oliver Deiser
4. Komplexe Zahlen
313
Realteil, Imaginärteil, Betrag und Konjugation
Als Nächstes führen wir Koordinatenfunktionen einer komplexen Zahl ein:
Definition (Real- und Imaginärteil, rein imaginär)
Sei z = (x, y) P C. Dann setzen wir:
Re(z) = x, Im(z) = y.
Die reellen Zahlen Re(z) und Im(z) heißen der Realteil bzw. der Imaginärteil
von z. Eine komplexe Zahl z heißt rein imaginär, falls Re(z) = 0.
Zu beachten ist, dass auch der Imaginärteil stets eine reelle Zahl ist. Die imaginäre Einheit hat zum Beispiel den Realteil 0 und den Imaginärteil 1.
Die Standarddarstellung einer komplexen Zahl liest sich nun in der Form
z = Re(z) + i Im(z).
Definition (Betrag einer komplexen Zahl)
Sei z P C. Dann setzen wir
|z| =
£Re(z)2 + Im(z)2.
Die reelle Zahl |z| heißt der Betrag von z.
Der Betrag einer komplexen Zahl z = (x, y) ist die Euklidische Länge des Vektors (x, y). Die Eigenschaften des komplexen Betrags entsprechen den aus dem
Reellen bekannten Eigenschaften:
Satz (Eigenschaften des Betrags)
Für alle z, w P C gilt:
(a) |z| = 0 genau dann, wenn z = 0,
(b) |z + w| ≤ |z| + |w|,
(Dreiecksungleichung)
(c) |z w| = |z| |w|.
(Produktregel)
Der Nachweis dieser Eigenschaften kann dem Leser überlassen werden.
Eine sehr nützliche und häufig verwendete Funktion auf C ist:
Definition (komplexe Konjugation)
Sei z P C. Dann setzen wir:
z = z* = Re(z) − i Im(z).
Die komplexe Zahl z heißt die (komplex) Konjugierte von z.
© Oliver Deiser
Einführung in die Mathematik 1
314
3. Abschnitt
Reelle und komplexe Zahlen
Geometrisch entspricht die komplexe Konjugation der Spiegelung eines Vektors an der x-Achse. Die Notation z* ist vor allem in der Physik üblich. Für alle
komplexen Zahlen gelten die Formeln
|z|2 = z ⋅ z,
Re(z) =
z + z
,
2
Im(z) =
z − z
.
2i
Der Leser beweise diese Formeln sowohl algebraisch als auch mit Hilfe der Multiplikationsregel.
Die komplexe Konjugation ist nützlich für die Inversenbildung. Dabei ist das
Inverse z−1 von z P C definiert als das eindeutige w P C mit z ⋅ w = 1.
Satz (multiplikative Inverse)
Sei z P C mit z ≠ 0. Dann gilt
z−1 =
z
|z|2
.
Den Beweis durch Nachrechnen überlassen wir dem Leser als Übung. Geometrisch lässt sich die Formel für die Inversenbildung leicht einsehen (und merken!): Denn die komplexe Zahl w auf der rechten Seite hat die Länge |z|−1 und
den negativen Winkel von z. Damit hat z ⋅ w die Länge |z||z|−1 = 1 und den
Winkel 0. Das Inverse von z entsteht also durch Spiegelung an der x-Achse und
Skalierung um das Inverse des Betragsquadrats von z.
1
z
Im(z)
z
|z|
|z|
zw
Re(z)
1
|z| -1
w
z
-1
Real- und Imaginärteil, Betrag, komplexe Konjugation und Inversenbildung
Einführung in die Mathematik 1
© Oliver Deiser
4. Komplexe Zahlen
315
Übungen
Übung 1
Zeigen Sie sowohl in kartesischen Koordinaten als auch in Polarkoordinaten, dass die komplexe Multiplikation kommutativ und assoziativ ist, d. h.
dass
z w = w z, z (w u) = (z w) u für alle z, w, u P C.
Übung 2
Zeigen Sie, dass die komplexen Zahlen das Distributivgesetz erfüllen:
z(w + u) = z w + z u für alle z, w, u P C.
Begründen Sie das Distributivgesetz zudem geometrisch mit Hilfe eines
Diagramms und der geometrischen Multiplikationsregel.
Übung 3
Zeigen Sie, dass für alle z, w P C gilt:
(a) |z| = 0 genau dann, wenn z = 0,
(b) |z + w| ≤ |z| + |w|,
(c) |z w| = |z| |w|.
(Dreiecksungleichung)
(Produktregel)
Übung 4
Zeigen Sie (wahlweise in kartesischen Koordinaten oder in Polarkoordinaten), dass für alle z P C gilt:
(a) Re(z) =
z + z
,
2
(b) Im(z) =
z − z
,
2i
(c) |z|2 = z z,
(d) z− 1 =
z
|z|2
, falls z ≠ 0.
Illustrieren Sie die Formeln zudem mit Hilfe von Diagrammen.
© Oliver Deiser
Einführung in die Mathematik 1
5. Der Fundamentalsatz der Algebra
Die komplexen Zahlen zeichnen sich vor den reellen Zahlen durch die universelle Lösbarkeit von algebraischen Gleichungen aus. Äquivalent formuliert: Jedes komplexe Polynom zerfällt in Linearfaktoren. Das Paradebeispiel ist
x2 + 1 = (x − i) (x + i).
Diese fundamentale Eigenschaft ist das Thema dieses Kapitels. Wir betrachten
zunächst einige Spezialfälle und geben dann einen anschaulichen Beweis für den
allgemeinen Fall.
© Oliver Deiser
Einführung in die Mathematik 1
318
3. Abschnitt
Reelle und komplexe Zahlen
Komplexe Polynome
Im ersten Abschnitt hatten wir reelle Polynome betrachtet. Polynome und alle
zugehörigen Begriffe wie Grad, Normiertheit, Nullstelle, algebraische Vielfachheit usw. lassen sich in analoger Weise auch für die komplexen Zahlen betrachten. Der Vollständigkeit halber definieren wir explizit:
Definition (komplexes Polynom)
Seien a0 , …, an P C. Dann heißt die Funktion f : C → C mit
f(z) = an zn + an − 1 zn − 1 + … + a0 für alle z P C
das (komplexe) Polynom oder die (komplexe) Polynomfunktion mit den
Koeffizienten a0 , …, an .
Genau wie für R wird der Grad deg(f) eines komplexen Polynoms erklärt.
Auch die Definitionen der Begriffe Leitkoeffizient, normiert, Nullpolynom, konstantes Polynom, Nullstelle können übernommen werden.
Ein komplexes Polynom lässt sich visualisieren, indem wir in ein Diagramm
für einige z Pfeile von z nach f(z) eintragen. In den folgenden Diagrammen betrachten wir die Abbildungsdynamik zweier einfacher Polynome auf dem Einheitskreis.
1.0
0.5
-1.0
-0.5
0.5
1.0
-0.5
-1.0
Die Wirkung von f(z) = z2 /2 auf dem Einheitskreis
Einführung in die Mathematik 1
© Oliver Deiser
5. Der Fundamentalsatz der Algebra
319
2
1
-1
1
2
3
-1
-2
Die Wirkung von f(z) = z2 + z + 1 auf dem Einheitskreis
Die Visualisierung mit Hilfe von Pfeilen führt schnell zu unübersichtlichen
Darstellungen. Eine Alternative, die prinzipiell die gesamte Information der
Funktion zum Ausdruck bringen kann, ist:
Die Farbkreismethode (color wheel method, domain coloring)
Jeder komplexen Zahl im Polarkoordinaten (r, ϕ) wird eine von ϕ abhängige Farbe eines Farbkreises und eine von r abhängige Farbintensität
zugeordnet. Zum Beispiel kann der Nullpunkt schwarz (alternativ: weiß)
und komplexe Zahlen mit großem Radius r blass (alternativ: gesättigt)
eingefärbt werden. Oft werden auch periodische Intensitäten verwendet,
um die Darstellung optisch zu verbessern. Eine Funktion f : C → C können
wir nun visualisieren, indem wir jeden Punkt z der Zahlenebene mit der
Farbe f(z) einfärben. Die Nullstellen von f erscheinen dabei als schwarze
(alternativ: weiße) Punkte.
Da wir im Folgenden die Nullstellen einer Funktion betonen möchten, färben
wir in den folgenden Beispielen den Nullpunkt schwarz. Weiter verwenden wir
eine relativ starke Verblassung für komplexe Zahlen mit großen Beträgen. Zusätzlich zeichnen wir oft ein Gitter ein, das durch f auf ein polares Koordinatengitter abgebildet wird. Der Standard ist dabei ein „uhrartiges“ polares Gitter mit
ganzzahligen Radien und zwölf Winkelstrahlen.
© Oliver Deiser
Einführung in die Mathematik 1
320
3. Abschnitt
Reelle und komplexe Zahlen
3
2
Färbung der komplexen Ebene:
Farbplot des Polynoms
1
f(z) = z
0
-1
-2
-3
-3
-2
-1
0
1
2
3
3
2
Farbplot des Polynoms
1
f(z) = z + 1 + i
0
Nullstellen: − 1 − i
-1
-2
-3
-3
-2
-1
0
1
2
3
2
1
Farbplot des Polynoms
f(z) = z2
0
Nullstellen: 0 (doppelt)
-1
-2
-2
-1
0
Einführung in die Mathematik 1
1
2
© Oliver Deiser
5. Der Fundamentalsatz der Algebra
321
2
1
Farbplot des Polynoms
f(z) = z2 + 1
0
Nullstellen: i, −i
-1
-2
-2
-1
0
1
2
2
1
Farbplot des Polynoms
f(z) = z2 +
0
1+i
z−i
2
Nullstellen: (1 + i)/2, −1 − i
-1
-2
-2
-1
0
1
2
2
1
Farbplot des Polynoms
f(z) = z3 + z2 − 2
0
Nullstellen: 1, −1 + i, −1 − i
Radiales Gitter: 1, 2, 4, 8, 16
-1
-2
-2
-1
© Oliver Deiser
0
1
2
Einführung in die Mathematik 1
322
3. Abschnitt
Reelle und komplexe Zahlen
Formulierungen des Fundamentalsatzes
Die Sätze über den Koeffizientenvergleich, die Polynomdivision und das Abspalten von Linearfaktoren bleiben samt ihren Beweisen für komplexe Polynome
gültig. Insbesondere kann ein Polynom n-ten Grades höchstens n Nullstellen
besitzen. Der Fundamentalsatz der Algebra besagt nun, dass tatsächlich n in ihrer Vielfachheit gezählte Nullstellen existieren. Es gibt viele Möglichkeiten, dieses Ergebnis zu formulieren. Eine davon ist:
Satz (Fundamentalsatz der Algebra)
Seien a0 , …, an P C mit n ≥ 1 und an ≠ 0. Weiter sei f : C → C mit
f(z) = an zn + … + a1 z + a0 für alle z P C
das zugehörige komplexe Polynom. Dann gibt es (nicht notwendig
paarweise verschiedene) w1 , …, wn P C mit
f(z) = an (z − w1 ) ⋅ (z − w2 ) ⋅ … ⋅ (z − wn ) für alle z P C.
Kurz: Jedes komplexe Polynom zerfällt vollständig in Linearfaktoren. Oder: Jedes
komplexe Polynom ist das Produkt von komplexen Geraden. Ist das Polynom normiert, so lässt es sich als Produkt von Geraden der Steigung 1 schreiben. Alternativ können wir den Fundamentalsatz auch (scheinbar schwächer) so formulieren:
Jedes komplexe Polynom von Grad größergleich 1 besitzt mindestens eine Nullstelle.
Weiß man dies, so gewinnt man durch wiederholtes Abspalten von Linearfaktoren den Satz in der obigen Version. Schließlich können wir anstelle eines Polynoms auch eine algebraische Gleichung an zn + an − 1 zn − 1 + … + a0 = 0 mit komplexen Koeffizienten ak betrachten und den Fundamentalsatz so zum Ausdruck
bringen: Jede algebraische Gleichung von Grad n ≥ 1 hat eine komplexe Lösung. In
Analogie zu obiger Version für Polynome formulieren wir:
Satz (Fundamentalsatz der Algebra, Version für algebraische Gleichungen)
Sei an zn + … + a1 z + a0 = 0 eine algebraische Gleichung mit Koeffizienten
a0 , …, an P C, an ≠ 0, n ≥ 1. Dann gibt es w1 , …, wn P C mit
an zn + … + a1 z + a0 = an (z − w1 ) ⋅ (z − w2 ) ⋅ … ⋅ (z − wn ).
Die Gleichung hat also genau die komplexen (nicht notwendig paarweise
verschiedenen) komplexen Lösungen w1 , …, wn .
Erfreulicherweise gibt es anschauliche Beweise des Fundamentalsatzes, die auf
der geometrischen Bedeutung der Multiplikation beruhen. Bevor wir einen solchen Beweis vorstellen, betrachten wir aber einige Spezialfälle. Wir beginnen
mit komplexen Quadratwurzeln und der komplexen Version der Lösungsformel
für Gleichungen zweiten Grades.
Einführung in die Mathematik 1
© Oliver Deiser
5. Der Fundamentalsatz der Algebra
323
Komplexe Quadratwurzeln
Wir definieren:
Definition (komplexe Quadratwurzel)
Sei u P C. Eine komplexe Zahl w heißt eine komplexe Quadratwurzel von u,
falls w2 = u gilt.
Mit w ist immer auch −w eine komplexe Quadratwurzel von u.
Beispiele
(1) −1 hat die komplexen Quadratwurzeln i und −i.
(2) i hat die komplexen Quadratwurzeln
(cos π/4, sin π/4) = c (1, 1) und − c (1, 1), wobei c = 1/£2.
Die komplexen Wurzeln von u sind die Nullstellen des Polynoms f mit
f(z) = z2 − u für alle z P C.
Diese Nullstellen können wir mit Hilfe der Multiplikationsregel sofort angeben:
Satz (komplexe Quadratwurzeln in Polarkoordinaten)
Sei u P C, und sei u = (r, ϕ) in Polarkoordinaten. Dann sind
w = (£r, ϕ/2) und −w = (£r, ϕ/2 + π)
die in Polarkoordinaten dargestellten komplexen Quadratwurzeln von u.
2
z
1
w
-2
-1
1
2
-w
-1
-2
Die komplexen Quadratwurzeln von z
© Oliver Deiser
Einführung in die Mathematik 1
324
3. Abschnitt
Reelle und komplexe Zahlen
Wir ziehen also die reelle Wurzel aus der Länge und halbieren den Winkel der
Zahl u. Zusammen mit der am Nullpunkt gespiegelten komplexen Zahl haben
wir dann die beiden komplexen Wurzeln von u vorliegen.
Wir geben die Wurzeln noch in kartesischen Koordinaten an. Kartesisch ist
w = £r (cos ϕ/2, sinϕ/2).
Nach den Halbierungsformeln für den Kosinus und Sinus ist
r + r cos ϕ
,
2
r cos2 (ϕ/2) =
r sin2 (ϕ/2) =
r − r cos ϕ
.
2
Wegen r cos ϕ = Re(u) erhalten wir
Re(w)2 = r cos2 (ϕ/2) =
r + Re(u)
,
2
Im(w)2 = r sin2 (ϕ/2) =
r − Re(u)
.
2
Die Werte cos(ϕ/2) und sin(ϕ/2) haben genau dann verschiedene Vorzeichen,
wenn ϕ einem der Intervall
…, ] −π, 0 [, ] π, 2π [, ] 3π, 4π [, …
angehört, d. h. wenn Im(u) < 0. Aus w = (Re(w), Im(w)) erhalten wir also:
Satz (komplexe Quadratwurzeln in kartesischen Koordinaten)
Sei u P C. Weiter seien r = |u| und
σ =
{
1
−1
falls Im(u) ≥ 0,
falls Im(u) < 0.
Dann sind
w1/2 = ±
(
s
r + Re(u)
, σ
2
s
r − Re(u)
2
)
die komplexen Quadratwurzeln von u.
Die Mitternachtsformel bleibt (mit gleicher Herleitung zum Beispiel durch
quadratische Ergänzung) auch für die komplexen Zahlen gültig. Damit hat eine
Gleichung
a z2 + b z + c = 0,
mit a, b, c P C, a ≠ 0
zweiten Grades in C genau die komplexen Lösungen
w1,2 =
−b ± £b2 − 4ac
,
2a
(Mitternachtsformel für C)
wobei wir unter der Wurzel irgendeine der beiden komplexen Quadratwurzeln
von u = b2 − 4ac verstehen (da ± vor der Wurzel steht, spielt die Wahl nur für
die Numerierung der Lösungen eine Rolle). Eine solche Wurzel können wir
Einführung in die Mathematik 1
© Oliver Deiser
5. Der Fundamentalsatz der Algebra
325
mit den obigen Sätzen berechnen. In den komplexen Zahlen entfällt die Beachtung eines Vorzeichens der Diskriminante u. In C führt jede Diskriminante zu
Lösungen.
Beispiel
Wir betrachten die Funktion f : C → C mit
f(z) = z2 /2 − z − i.
Nach der Mitternachtsformel sind genau die komplexen Zahlen
w1,2 =
−b ± £b2 − 4ac
2a
= 1 ± £1 + 2i
die Nullstellen von f. Nach der Formel des Satzes ist
s
s
£5 − 1
£5 + 1
,
u =
2
2
)
(
eine der beiden komplexen Quadratwurzeln von u = 1 + 2i (mit σ = 1,
Re(u) = 1, r = £5). In kartesischen Koordinaten lauten die Nullstellen also
s
s
£5 − 1
£5 + 1
.
, ±
w1,2 = 1 ± u = 1 ±
2
2
(
)
Auf drei Nachkommastellen gerundet ist
w1 = (2,272; 0,786), w2 = (0,272; − 0,786).
Dreidimensionaler Plot der Funktion g : C → R mit g(z) = |f(z)|2 für alle z P C.
Die Nullstellen von g sind genau die Nullstellen von f.
© Oliver Deiser
Einführung in die Mathematik 1
326
3. Abschnitt
Reelle und komplexe Zahlen
Die komplexen Einheitswurzeln
Wir definieren nun spezielle n-te Wurzeln:
Definition (n-te Einheitswurzel)
Sei n ≥ 1. Dann heißt ein w P C eine n-te Einheitswurzel, falls wn = 1.
Die n-ten Einheitswurzeln sind nach Definition genau die Nullstellen des
Polynoms f : C → C mit
f(z) = zn − 1 für alle z P C.
Für eine n-te Einheitswurzel w gilt wn = 1, sodass w eine n-te Wurzel der 1 ist. Im
algebraischen Jargon wird die 1 auch als (multiplikative) Einheit bezeichnet, was
die Namensgebung als Einheitswurzel motiviert.
Mit der geometrischen Deutung der Multiplikation können wir die n-ten Einheitswurzeln leicht angeben, wodurch der Fundamentalsatz der Algebra für
wichtige Spezialfälle bereits bewiesen ist. Schreiben wir eine komplexe Zahl w in
Polarkoordinaten (r, ϕ), so gilt wn = (rn , nϕ). Damit gilt wn = (1, 0) genau dann,
wenn eine ganze Zahl k existiert mit
(rn , nϕ) = (1, k 2π).
Damit sind genau die komplexen Zahlen
wk = (1, k2π/n) für alle k P Z
n-te Einheitswurzeln. Beschränken wir k auf 0, …, n − 1, so erhalten wir alle
paarweise verschiedenen Wurzeln. Damit haben wir gezeigt:
Satz (n-te Einheitswurzeln)
Sei n ≥ 1. Dann sind für k = 0, …, n − 1 die komplexen Zahlen
wk = (1, k 2π/n)
in Polarkoordinaten,
wk = (cos(k2π/n), sin(k2π/n))
in kartesischen Koordinaten
alle n-ten Einheitswurzeln. Sie bilden das regelmäßige in den Einheitskreis
einbeschriebene n-Eck, dem der Punkt w0 = 1 = (1, 0) angehört.
Traditionell werden die komplexen Einheitswurzeln mit dem griechischen
Buchstaben Zeta bezeichnet. Wir setzen also
(
ζ nk = cos (
k 2π
k 2π
), sin (
n
n
))
für alle n ≥ 1 und k P Z.
Ist n fest, schreiben wir nur ζk . Bei festem n gilt für alle k, m P Z:
1 = ζ 0 = ζ kn , ζ k ζ m = ζ k + m , (ζ1 )k = ζk , (ζk )m = ζ m k .
Einführung in die Mathematik 1
© Oliver Deiser
5. Der Fundamentalsatz der Algebra
327
3
1
2
4
1
5
0
-1
1
6
10
7
-1
9
8
Die elften Einheitswurzeln ζk = ζ11
k am Einheitskreis
i 0
1
i 1
i 10
i 2
i 9
-1
1
i 3
i 8
i 4
i 7
i 5
-1
i 6
Die Multiplikation der Einheitswurzeln mit i bewirkt eine Drehung der Figur um π/2.
© Oliver Deiser
Einführung in die Mathematik 1
328
3. Abschnitt
Reelle und komplexe Zahlen
Das regelmäßige Fünfeck
Als Anwendung der komplexen Einheitswurzeln analysieren wir das regelmäßige Fünfeck (Pentagon). Sei hierzu
z = ζ51 = (cos(2π/5), sin(2π/5)).
Dann sind 1, z, z2 , z3 , z4 die Ecken des regelmäßigen in den Einheitskreis einbeschriebenen Fünfecks, dem der Punkt (1, 0) angehört. Es gilt
(+) 1 + z + z2 + z3 + z4 =
1 − z5
1−z
= 0,
wobei wir beim ersten Gleichheitszeichen die auch in C gültige Formel für die
geometrische Summe bzw. konkret
(1 − z) (1 + z + z2 + z3 + z4 ) = 1 − z5
verwenden und beim zweiten Gleichheitszeichen beobachten, dass z5 = z0 = 1.
Wir setzen nun
w = z + z4 .
Dann ist w reell und weiter positiv, da
w = z + z4 = z + z−1 = z + z = 2 Re(z) = 2 cos(2π/5) > 0.
Weiter gilt
w2 + w − 1 = z2 + 2zz4 + z8 + z + z4 − 1 = 1 + z + z2 + z3 + z4 = 0.
Die Mitternachtsformel liefert wegen w > 0, dass
w =
£5 − 1
,
2
d.h. w ist das Inverse des goldenen Schnitts (1 + £5)/2. Wegen w = 2 Re(z) erhalten wir den Wert
cos(2π/5) =
£5 − 1
.
4
Da sich der Punkt P = ((£5 − 1)/4, 0) und damit ζ1 geometrisch mit Zirkel und
Lineal konstruieren lässt (Übung), haben wir unter Verwendung komplexer
Zahlen gezeigt, dass Re(z) und damit z und in der Folge auch das ganze regelmäßige Pentagon mit Zirkel und Lineal konstruierbar ist. Dies ist keineswegs klar.
Ein regelmäßiges Siebeneck kann zum Beispiel nicht mehr mit Hilfe von Zirkel
und Lineal konstruiert werden. Der Wert cos(2π/7) lässt sich im Gegensatz zu
cos(2π/5) nicht mehr als Wurzelausdruck schreiben.
Einführung in die Mathematik 1
© Oliver Deiser
5. Der Fundamentalsatz der Algebra
1
329
1
2
P
0
-1
1
Die fünften Einheitswurzeln mit
Pentagon (Fünfeck) und Pentagramm (Fünfstern). Im Pentagramm findet sich ein zweites
kleineres Pentagon.
3
-1
4
Dreidimensionaler Plot der
Funktion g : C → R mit
g(z) = |z5 − 1|2 .
Die fünften Einheitswurzeln
sind die Nullstellen dieser
Funktion.
1.5
1.0
Farbplot des Polynoms
0.5
f(z) = z5 − 1
0.0
Radiales Gitter: 1, 2, 4, 8, 16, 32
-0.5
-1.0
-1.5
-1.5
-1.0
© Oliver Deiser
-0.5
0.0
0.5
1.0
1.5
Einführung in die Mathematik 1
330
3. Abschnitt
Reelle und komplexe Zahlen
Ein anschaulicher Beweis des Fundamentalsatzes
Wir haben den Fundamentalsatz der Algebra für komplexe Polynome zweiten
Grades und weiter für die Polynome zn − 1 mit einem beliebigen Grad n ≥ 1 bewiesen. Ein vollständiger Beweis des Fundamentalsatzes ist nicht Ziel dieses Textes. Wir können aber mit einer durch Felix Klein verbreiteten Argumentation
zeigen, dass sich der Fundamentalsatz in voller Allgemeinheit anschaulich einsehen lässt. Sei also f : C → C,
f(z) = zn + an − 1 zn − 1 + … + a1 z + a0 für alle z P C,
ein ohne Einschränkung normiertes Polynom n-ten Grades mit komplexen Koeffizienten (die Nullstellen eines Polynoms ändern sich bei der Division durch
seinen Leitkoeffizienten nicht).
Eine Nullstelle z des Polynoms f ist charakterisiert durch die Eigenschaft
(+) Re(f(z)) = 0 und Im(f(z)) = 0.
Die Nullstellen von f sind also genau die gemeinsamen Nullstellen der reellwertigen Funktionen Re(f(z)) und Im(f(z)) mit Definitionsbereich C. Wir setzen nun
An = { z P C | Re(zn ) = 0 },
Bn = { z P C | Im(zn ) = 0 }.
Diese Mengen können wir mit Hilfe der geometrischen Multiplikationsregel
visualisieren. Sie sind regelmäßige Sterne, die aus n Geraden durch den Nullpunkt bestehen und so 2n unendliche Kreissektoren mit dem Winkel π/n
definieren. Der Menge Bn gehört die x-Achse an, An entsteht aus Bn (und umgekehrt Bn aus An ) durch eine Drehung um den halben Winkel π/(2n) eines
Sektors. Die Geraden, aus denen An und Bn bestehen, wechseln sich ab.
Für komplexe Zahlen z mit einem sehr großen Betrag r = |z| ist f(z) ungefähr
gleich zn , da der Leitterm zn das Polynom dominiert. Damit haben die Mengen
Af = { z P C | Re(f(z)) = 0 },
Bf = { z P C | Im(f(z)) = 0 }
außerhalb eines Kreises K mit dem Mittelpunkt 0 und einem hinreichend großen
Radius r recht genau die sternförmige Gestalt der Mengen An und Bn . Innerhalb
des Kreises K verlaufen die Linien von Af und Bf nicht mehr geradlinig wie in An
und Bn , aber ein Schnittpunkt von Af und K wird aus Stetigkeitsgründen mit einem weiteren solchen Schnittpunkt verbunden. Gleiches gilt für Bf . Da sich nun
die Schnittpunkte von Af und K mit den Schnittpunkten von Bf und K abwechseln, müssen sich die betrachteten Verbindungslinien innerhalb von K schneiden. Jeder solche Schnittpunkt ist aber nach (+) und den Definitionen von Af und
Bf eine Nullstelle von f. Da es je 2n Schnittpunkte für Af und Bf mit K gibt, erhalten wir genau n (nicht notwendig paarweise verschiedene) Nullstellen von f.
Einführung in die Mathematik 1
© Oliver Deiser
5. Der Fundamentalsatz der Algebra
10
10
5
5
0
0
-5
-5
-10
-10
-5
0
5
10
-10
-10
-5
0
5
331
10
Die Mengen An (mit y-Achse) und Bn (mit x-Achse) für n = 3 und n = 5
10
10
5
5
0
0
-5
-5
-10
-10
-5
0
5
10
-10
-10
-5
0
5
10
Af und Bf für f(z) = z3 + 2z2 + z + 1 (links) und f(z) = z5 + 2 i z3 − i z2 + 2 z − 1 (rechts)
10
10
5
5
0
0
-5
-5
-10
-10
-5
0
5
2
10
-10
-10
-5
0
5
10
3
Af und Bf für f(z) = (z − i + 3) (z + i − 2) (links) und ein Polynom vom Grad 6 (rechts)
© Oliver Deiser
Einführung in die Mathematik 1
332
3. Abschnitt
Reelle und komplexe Zahlen
Die Struktur der Mengen An und Bn lässt sich auch mit Hilfe von 3D-Plots visualisieren. Hierzu verwenden wir die Funktionen re*, im* : C → C mit
re*(z) = 2/π arctan(Re(z)2 ), im*(z) = 2/π arctan(Im(z)2 ) für alle z P C.
Der Wertebereich der beiden Funktionen ist das Intervall [ 0, 1 ]. Die Arkustangens-Funktion bildet alle Funktionswerte in das Intervall [ 0, π/2 ] ab, der Faktor 2/π führt zu Werten in [ 0, 1 ]. Diese Transformation dient der Übersichtlichkeit der Darstellung. Für jedes Polynom f : C → C sind die Mengen Af und
Bf genau die Nullstellen von re* + f und im* + f. Im Plot erscheinen diese Mengen als Canyons, die in einem hinreichend großen Abstand vom Ursprung eine
sternförmige Gestalt annehmen.
Die Funktionen re*(f(z)) und im*(f(z)) samt den Mengen Af bzw. Bf für das Polynom
f(z) = z5
Einführung in die Mathematik 1
© Oliver Deiser
5. Der Fundamentalsatz der Algebra
333
Die Funktionen re*(f(z)) und im*(f(z)) samt den Mengen Af bzw. Bf für das Polynom
f(z) = z3 + 2z2 + z + 1.
Komplexe Wurzelfunktionen
Wir hatten unter £z irgendeine der beiden komplexen Wurzeln von z verstanden. Wenn wir eine komplexe Wurzelfunktion sqrt : C → C definieren wollen, müssen wir uns auf eine der beiden Wurzeln festlegen, da Funktionswerte
eindeutig sind. Wir arbeiten in Polarkoordinaten mit Winkeln in [ 0, 2π [ (Variante 1) bzw. ] −π, π ] (Variante 2). Die Wurzeln einer komplexen Zahl z = (r, ϕ)
sind w = (£r, ϕ/2) und −w. Wir wählen w und setzen also
sqrt(z) = (£r, ϕ/2) für alle z = (r, ϕ) P C (polar).
© Oliver Deiser
Einführung in die Mathematik 1
334
3. Abschnitt
Reelle und komplexe Zahlen
Bei Variante 1 erhalten wir Winkel in [0, π[, bei Variante 2 Winkel in ]−π/2, π/2].
In ersten Fall ist sqrt unstetig auf der positiven x-Achse, im zweiten unstetig auf
der negativen x-Achse. Der beschränkte Wertebereich und die Unstetigkeitshalbstahlen lassen sich durch Farbplots veranschaulichen:
10
5
Farbplot der komplexen Quadratwurzelfunktion sqrt bei Variante 1
(Winkelfarben in [ 0, π[ )
0
-5
-10
-10
-5
0
5
10
10
5
Farbplot der komplexen Quadratwurzelfunktion sqrt bei Variante 2
(Winkelfarben in ] −π/2, π/2])
0
-5
-10
-10
-5
0
5
10
In der Funktionentheorie wird die Variante 2 bevorzugt. Dort wählt man das
Winkelintervall ] −π, π ] als Standard.
Analoge Überlegungen gelten für dritte und höhere Wurzeln und viele andere
Funktionen. Eine dritte Wurzelfunktion root3 : C → C kann beispielsweise
durch
root3 (z) = (r1/3 , ϕ/3) für alle z = (r, ϕ) P C (polar).
definiert werden. Bei Variante 2 ergeben sich Winkel in ]−π/3, π/3]. Erneut ist
die Funktion unstetig auf der negativen x-Achse.
Einführung in die Mathematik 1
© Oliver Deiser
5. Der Fundamentalsatz der Algebra
335
Übungen
Übung 1
Eine komplexe Funktion f : C → C lässt sich wie beschrieben mit der
Farbkreismethode visualisieren, indem wir jedem Winkel ϕ P [ 0, 2π [ eine
Farbe und jedem r ≥ 0 eine Farbintensität (weiß für r = 0, dunkel für große r)
zuweisen. Jedes z = (r, ϕ) in Polarkoordinaten wird dann mit der Farbe f(z)
gefärbt. Diskutieren Sie qualitativ eine derartige Färbung für die Funktionen
(a) f(z) = z − c mit einer Konstanten c P C,
(b) f(z) = z,
(c) f(z) = 1/z für alle z ≠ 0,
(d) f(z) = z2 ,
(e) f(z) = z3 − 1.
Übung 2
Geben Sie die komplexen Lösungen der Gleichung
3z2 − 2z + 1 = 0
in kartesischen Koordinaten an.
Übung 3
Sei n ≥ 1. Zeigen Sie:
(a) Das Produkt zweier n-ter Einheitswurzeln ist eine n-te Einheitswurzel.
(b) Das multiplikative Inverse einer n-ten Einheitswurzel ist eine n-te
Einheitswurzel.
Übung 4
Seien n, m ≥ 1. In welchem Fall ist jede n-te Einheitswurzel auch eine m-te
Einheitswurzel?
Übung 5
Sei n ≥ 1. Geben Sie alle Nullstellen des Polynoms f : C → C mit
f(z) = zn + 1 für alle z P C
polar und kartesisch an. Zeichnen Sie die Nullstellen und beschreiben Sie
ihren Zusammenhang mit den komplexen Einheitswurzeln.
© Oliver Deiser
Einführung in die Mathematik 1
336
3. Abschnitt
Reelle und komplexe Zahlen
Übung 6
Seien n ≥ 1 und d P C. Geben Sie (in Verallgemeinerung der vorangehenden Übung) alle Nullstellen des Polynoms f : C → C mit
f(z) = zn − d für alle z P C
polar und kartesisch an und erstellen sie ein erläuterndes Diagramm.
Übung 7
Konstruieren Sie mit Zirkel und Lineal den Punkt P = (x1 , 0) mit
x1 = cos(2π/5) =
£5 − 1
.
4
Konstruieren Sie weiter mit Hilfe von P ein regelmäßiges Pentagon.
Übung 8
Wie bei der Diskussion des regelmäßigen Fünfecks sei
z = ζ51 = (cos(2π/5), sin(2π/5)).
Wir setzen
a = |1 − z|, b = |1 − z2 |,
sodass a die Länge der Seite und b die Länge der Diagonalen des Pentagons
1, z, z2 , z3 , z4 ist. Erstellen Sie eine Skizze und zeigen Sie mit Hilfe
komplexer Zahlen, dass
s
b
5 − £5
1 + £5
,
=
(goldener Schnitt).
a =
2
a
2
Einführung in die Mathematik 1
© Oliver Deiser
6. Die komplexe Exponentialfunktion
Zum Abschluss unserer Einführung in die Welt der komplexen Zahlen betrachten wir die komplexe Exponentialfunktion, die manchmal als die wichtigste
Funktion der Mathematik bezeichnet wird. Dass die Exponentialfunktion als
Generator für viele Funktionen dienen kann, ist uns aus dem Reellen schon bekannt. Im Reellen ist aber kein Zusammenhang mit den trigonometrischen
Funktionen zu sehen. Dies ändert sich im Komplexen in einer wunderbaren Art
und Weise.
© Oliver Deiser
Einführung in die Mathematik 1
338
3. Abschnitt
Reelle und komplexe Zahlen
Übertragung analytischer Begriffe ins Komplexe
Mit den komplexen Zahlen können wir so arbeiten wie mit den reellen Zahlen.
Lediglich eine lineare Ordnung, mit der zwei Zahlen nach ihrer Größe verglichen werden können, steht in der Zahlenebene C = R2 nicht mehr zur Verfügung. Eine solche Ordnung wird aber für viele grundlegende Konzepte der Analysis nicht gebraucht. So können wir zum Beispiel den Limes
limn zn = z
einer Folge (zn )n P N komplexer Zahlen wie in R definieren durch
∀ε > 0 ∃n0 ∀n ≥ n0 |z − zn | < ε (mit ε P R wie bisher).
Die Konvergenz von (zn )n PN gegen z bedeutet, dass für alle ε > 0 fast alle (alle bis
auf höchstens endlich viele) Folgenglieder in der offenen ε-Umgebung
Uε (z) = { w P C | |z − w| < ε }
von z liegen. Kurz: Jeder Kreis um z fängt die Folge die schließlich ein.
2
z2
z1
z8
z7
U (z)
z9
z3
z0
1
z6
z4
z5
1
2
Eine spiralförmige Konvergenz in C: (zn )n P N konvergiert gegen z = (1, 1) = 1 + i
Alternativ lässt sich der Grenzwert einer Folge in C auch über reelle Grenzwerte
ausdrücken: Die Konvergenz von (zn )n P N gegen z ist gleichwertig mit der Konvergenz der beiden reellen Folgen (Re(zn ))n P N und (Im(zn ))n P N gegen die reellen Zahlen Re(z) bzw. Im(z). Eine Folge komplexer Zahlen konvergiert also genau dann, wenn sie koordinatenweise konvergiert.
Einführung in die Mathematik 1
© Oliver Deiser
6.
Die komplexe Exponentialfunktion
339
Aus dem Konvergenzbegriff für Folgen ergibt sich genau wie früher der Konvergenzbegriff für unendliche Reihen in C: Im Fall der Existenz ist
∑ n zn = z0 + … + zn + … = limn sn , wobei sn = z0 + … + zn
wieder die n-te Partialsumme der Folge (zn )n P N in C ist.
Auch die Definition des Grenzwerts für Funktionen können wir übernehmen:
limz
→p
f(z) = a
ist für eine Funktion f : C → C, eine Stelle p P C und ein a P C definiert durch
∀ε > 0 ∃δ > 0 ∀w P C (|w − p| < δ → |f(w) − a| < ε)
Gilt limz
dingung
→p
(mit ε,δ P R wie bisher).
f(z) = f(p), so nennen wir wieder f stetig an der Stelle p. Die ε-δ-Be-
∀ε > 0 ∃δ > 0 ∀w P C (|w − p| < δ → |f(w) − f(p)| < ε)
der Stetigkeit von f an der Stelle p können wir mit Hilfe von Umgebungen auch
kompakt notieren als
(+) ∀ε > 0 ∃δ > 0 f [ Uδ (p) ] ⊆ Uε (f(p)).
Dabei ist f [ X ] = { f(x) | x P X } das Bild der Menge X unter f. Die Formulierung
(+) besagt also, dass für jedes vorgegebene ε > 0 ein geeignetes (von ε abhängiges)
δ > 0 gewählt werden kann, sodass das Bild der δ-Umgebung von p unter f eine
Teilmenge der ε-Umgebung von f(p) ist.
U (f(p))
f(p)
f
U (p)
p
Zur ε-δ-Stetigkeit von f an der Stelle p: Zu jedem ε > 0 gibt es ein δ > 0 derart,
dass f die δ-Umgebung Uδ (p) in die ε-Umgebung Uε (f(p)) abbildet.
© Oliver Deiser
Einführung in die Mathematik 1
340
3. Abschnitt
Reelle und komplexe Zahlen
Die Stetigkeit lässt sich erneut gleichwertig als Folgenstetigkeit formulieren:
Für alle Folgen (zn )n P N in C mit limn zn = p gilt limn f(zn ) = f(p).
Diese Definitionen lassen sich an Funktionen f : P → C anpassen, die nur auf einer gewissen Teilmenge P der komplexen Zahlenebene definiert sind.
Differentialquotienten können ebenfalls unverändert ins Komplexe übertragen werden: Für f : P → C und p P P heißt im Fall der Existenz
f ′(p) = limz
f(z) − f(p)
PC
z−p
→p
die Ableitung von f an der Stelle p. Die üblichen Notationen werden übernommen. Wie in R gilt zum Beispiel
d n
z = n zn − 1 .
dz
Die Exponentialfunktion im Komplexen
Die reelle Exponentialfunktion exp : R → R hatten wir über ihre Ableitung
und ihren Wert an der Stelle 0 charakterisiert: Sie ist die eindeutige Funktion
f : R → R mit f ′ = f und f(0) = 1. Wesentliche Eigenschaften sind das Additionstheorem
exp(x + y) = exp(x) exp(y) für alle x, y P R
und die für alle x P R gültige Reihendarstellung
exp(x) = ∑ n
xn
n!
= 1 + x +
x2
2
+ … +
xn
n!
+ …,
die durch gliedweises Differenzieren die Ableitungsregel exp′ = exp reproduziert.
All dies lässt sich nach C übertragen, sodass folgende Definition möglich ist:
Definition (komplexe Exponentialfunktion)
Die komplexe Exponentialfunktion exp : C → C ist die eindeutige Funktion
f : C → C mit
(a) f ′ = f,
(b) f(0) = 1.
Erneut folgt hieraus das Additionstheorem
exp(z + w) = exp(z) exp(w) für alle z, w P C,
welches die Notation
ez für exp(z)
(Exponentialschreibweise im Komplexen)
motiviert.
Einführung in die Mathematik 1
© Oliver Deiser
6.
Die komplexe Exponentialfunktion
341
Für alle z P C gilt die Reihendarstellung
exp(z) = ∑ n
z2
zn
zn
= 1+z+
+…+
+…
n!
2
n!
(komplexe Exponentialreihe)
Die komplexe Exponentialfunktion setzt die reelle Exponentialfunktion fort,
d. h. für alle x P R ⊆ C stimmen die Werte der beiden Funktionen überein.
Die Konvergenz der komplexen Exponentialreihe lässt sich wieder mit Hilfe
des Quotientenkriteriums und der geometrischen Reihe nachweisen. Letztere
wird wie in R eingeführt. Für die komplexe geometrische Summe gilt
∑ k ≤ n zk = 1 + z + z2 + … + zn =
1 − zn + 1
1−z
für alle z ≠ 1,
sodass die komplexe geometrische Reihe im Inneren des Einheitskreises konvergiert:
∑ n zn = 1 + z + z2 + … + zn + … =
1
1−z
für alle z mit |z| < 1.
Beispiel
Wir setzen c = 19/20 ⋅ 1/£2 und q = c (1 + I). Die geometrische Reihe für q
konvergiert, da |q| = 19/20 < 1. Der Grenzwert berechnet sich zu
1
1−q
=
1
c2 + (1 − c)2
( 1 − c, c )
=
( 0,587…,
1,201… ).
Die Konvergenz ist aufgrund der Nähe von q zum Rand des Einheitskreises
recht langsam.
s4
s3
2
s12
s11
s5
s2
s13
s6
1
s10
s14
s9
s15
s7
s1
s8
s0
1
2
Die Partialsummen der geometrischen Reihe für q = 95/100 (1 + I)/£2
© Oliver Deiser
Einführung in die Mathematik 1
342
3. Abschnitt
Reelle und komplexe Zahlen
Kreisaufwicklung und Eulersche Formel
Während die komplexe Exponentialfunktion formal der reellen gleicht, sind
ihre Abbildungseigenschaften zunächst noch weitgehend unbekannt. Wir kennen die Funktion zunächst nur auf der x-Achse, da sie dort mit der reellen Exponentialfunktion zusammenfällt. Schreiben wir eine beliebige komplexe Zahl z in
der Standardzerlegung z = x + i y mit x = Re(z) und y = Im(z), so gilt aufgrund des
Additionstheorems
exp(z) = exp(x + iy) = exp(x) exp(i y).
Damit bleibt die Aufgabe, die Funktionswerte exp(i y) P C für alle y P R zu ermitteln: Wir müssen die Exponentialfunktion auf der imaginären Achse untersuchen. Ein allgemeiner Wert exp(z) = exp(x + iy) lässt sich als die Skalierung der
komplexen Zahl exp(i y) mit dem reellen Skalar exp(x) auffassen.
Sei also y P R. Wo in der komplexen Ebene liegt exp(iy)? Erneut ist es das Additionstheorem, das uns weiterhilft. Aus der Reihenentwicklung gewinnen wir
exp(z) = exp( z ) für alle z P C.
Die Betragsformel |z|2 = z z für komplexe Zahlen liefert im Zusammenspiel mit
dem Additionstheorem
|exp(iy)|2 = exp(i y) exp(i y) = exp(i y) exp(− i y)
= exp(iy − i y) = exp(0) = 1.
Mit anderen Worten:
Die komplexe Exponentialfunktion bildet die imaginäre Achse auf den Einheitskreis ab.
Da dies in stetiger Form geschieht, wird die imaginäre Achse in einer noch näher
zu ergründenden Art und Weise auf den Einheitskreis aufgewickelt, wobei
ei 0 = e0 = 1 = (1, 0).
Das Einfachste und Beste wäre eine längentreue Aufwicklung, sodass sich ei y
gleichmäßig in y auf dem Einheitskreis bewegt und dabei ein Kreisbogen der
Länge , durchlaufen wird, wenn y ein Intervall der Länge , durchläuft. Nehmen
wir zusätzlich eine Kreisbewegung im und gegen den Uhrzeigersinn für monoton steigende bzw. fallende y an, so würde einfach
ei y = (cos y, sin y) = cos y + i sin y für alle y P R,
gelten. Denn wie wir wissen stellt (cos y, sin y) eine Kreisbewegung in der Variablen y mit den beschriebenen Eigenschaften dar. Der folgende Satz besagt,
dass all dies in der Tat der Fall ist. Es gilt (wobei wir wieder x anstelle von y als
Variable verwenden):
Einführung in die Mathematik 1
© Oliver Deiser
6.
Die komplexe Exponentialfunktion
343
Satz (Kreisaufwicklung, Eulersche Formel)
Für alle x P R gilt
exp(i x) = (cos x, sin x) = cos(x) + i sin(x).
(Eulersche Formel)
Wir geben zwei Beweise dieses fundamentalen Satzes.
Beweis 1: Potenzreihenentwicklung
Für alle x P R gilt unter Verwendung der Potenzreihenentwicklungen des
Kosinus und Sinus:
eix = ∑ n
(ix)n
n!
= 1 + i x + i2
= 1 + ix −
x2
2
= ∑ n (−1)n
x2n
(2n)!
− i
x3
3!
x2
2
x4
4!
+
+ i ∑ n (−1)n
+ … + in
+ i
xn
n!
x5
x6
x −
5!
6!
+ …
− i
73
7!
+ …
x2n + 1
(2n + 1)!
= cos x + i sin x.
Beweis 2: Ableiten
Wir wissen bereits, dass eix für alle x P R auf dem Einheitskreis liegt. Damit
gibt es für alle x P R ein ϕ(x) P R mit
(+) eix = (cos ϕ(x), sin ϕ(x)) = cos ϕ(x) + i sin ϕ(x).
Dann gilt (unter Verwendung der auch in C gültigen elementaren
Ableitungsregeln):
−sinϕ(x) + i cosϕ(x) = i eix =
d ix
e =
dx
d
dx
( cos ϕ(x) + i sin(ϕ(x) )
= − sin ϕ(x) ϕ′(x) + i cosϕ(x) ϕ′(x)
=
( −sin ϕ(x)
+ i cosϕ(x) ) ϕ′(x).
Damit ist ϕ′(x) = 1 für alle x P R. Folglich gibt es ein c P R mit ϕ(x) = x + c
für alle x P R. Speziell ist ϕ(0) = c. Nach (+) gilt für x = 0
1 = ei0 = cos c + i sin c,
sodass c ein ganzzahliges Vielfaches von 2π ist. Sei also k P Z mit c = k2π.
Dann gilt für alle x P R:
eix = cos ϕ(x) + i sin ϕ(x) = cos(x + k2π) + i sin(x + k2π) = cos x + i sin x.
© Oliver Deiser
Einführung in die Mathematik 1
344
3. Abschnitt
Reelle und komplexe Zahlen
Spezielle Werte der Kreisaufwicklung sind:
exp(0) = 1, exp(i π/2) = i, exp(i π) = −1, exp(i 3π/2) = −i, exp(i 2π) = 1.
Die dritte Aussage ist die berühmte Eulersche Identität. Leicht umformuliert lautet sie:
Korollar (Eulersche Identität)
ei π + 1 = 0.
Damit sind die fünf fundamentalen mathematischen Größen 0, 1, i, π und e in
einer Aussage vereint.
exp
2
exp
3
exp
4
exp(
4
)
exp(0)
exp
5
exp
4
7
4
exp
3
2
Werte der komplexen Exponentialfunktion am Einheitskreis
Aus exp(i 2π) = 1 erhalten wir
Korollar (Periodizität)
Für alle z P C und k P Z gilt exp(z + i k2π) = exp(z).
Beweis
exp(z + i k 2π) = exp(z) exp(i k 2π) = exp(z) exp(i 2π)k = exp(z) 1k = exp(z).
Aufgrund ihrer Periodizität ist die komplexe Exponentialfunktion durch ihre
Werte auf dem Streifen R × [ 0, 2π [ bestimmt. Die Funktion wiederholt sich,
wenn wir mehrere derartige Streifen übereinander oder untereinander legen.
Wir fassen zusammen:
Einführung in die Mathematik 1
© Oliver Deiser
6.
Die komplexe Exponentialfunktion
345
Anschauliche Beschreibung der komplexen Exponentialfunktion
Sei p P C ein Punkt der Ebene, und sei exp(p) P C sein Bild unter der
komplexen Exponentialfunktion. Bewegen wir uns, in p startend, in der
Variablen z parallel zur x-Achse, so bewegt sich exp(z) auf der Halbgeraden,
die von 0 durch exp(p) führt (Skalierung von exp(p)). Dabei erreicht exp(z)
bei einer Bewegung nach links nie die Null, entfernt sich dagegen bei einer
Bewegung nach rechts mit exponentieller Geschwindigkeit. Bewegen wir
uns in p startend in der Variablen z parallel zur y-Achse, so dreht sich f(z)
auf dem Kreis mit Radius r = |f(p)| durch den Nullpunkt. Die Kreisbewegung erfolgt gegen den Uhrzeigersinn bei einer Bewegung nach oben und
im Uhrzeigersinn bei einer Bewegung nach unten. Ein Kreisdurchlauf von
f(z) der Länge 2r π benötigt das Durchlaufen eines Intervalls der Länge 2π
in z. Von p ausgehende Bewegungen in der Variablen z, die sowohl einen
waagrechten als auch einen senkrechten Anteil besitzen, führen zu in f(p)
ihren Ausgang nehmenden Spiralbewegungen von f(z).
-10
10
10
5
5
-5
5
10
-10
-5
5
-5
-5
-10
-10
10
Die Verzerrung des kartesischen Gitters durch die komplexe Exponentialfunktion
und das Bild zweier Geraden unter exp
© Oliver Deiser
Einführung in die Mathematik 1
346
3. Abschnitt
Reelle und komplexe Zahlen
n=1
n=2
n=3
n=4
n=5
n=6
n=8
n = 11
n = 15
n = 20
n = 25
n = 30
Visualisierung der Kreisaufwicklung mit Hilfe der Exponentialreihe:
Für die angegebenen n ist das Bild von [ 0, ∞ [ unter den Partialsummen
sn (i x) = ∑ k ≤ n (ix)k /k! für alle x P R
gezeigt. Ab etwa n = 20 ist eine sehr gute Aufwicklung des Intervalls [ 0, 2π ] erreicht.
Bemerkenswert sind relativ scharfe Wendungen wie bei n = 11.
Einführung in die Mathematik 1
© Oliver Deiser
6.
Die komplexe Exponentialfunktion
347
3
2
1
-3
-2
-1
1
2
3
-1
-2
-3
Visualisierung der Kreisaufwicklung durch ein Pfeildiagramm:
Wirkung der Exponentialfunktion auf der Menge { ix | x P [ −π, π ] }
1.0
0.5
-1.0
-0.5
0.5
1.0
1.5
2.0
2.5
-0.5
-1.0
Zum Kontrast: Wirkung der Exponentialfunktion auf dem Einheitskreis
© Oliver Deiser
Einführung in die Mathematik 1
348
3. Abschnitt
Reelle und komplexe Zahlen
10
10
5
5
0
0
-5
-5
-10
-10
-10
-5
0
5
-10
10
-5
0
5
10
15
10
10
5
5
0
0
-5
-5
-10
-10
-15
-10
-5
0
5
-15
10
20
20
10
10
0
0
-10
-10
-20
-20
-10
0
10
20
-20
-20
-10
-10
-5
0
5
10
0
10
15
20
Die Mengen Asn = { z | Re(sn (z)) = 0 } und Bsn = { z | Im(sn (z)) = 0 } für die Polynome
sn (z) = ∑ k ≤ n zk /k! für alle z P C, mit n = 5, 10, 15, 20, 25.
Im letzten Bild sind Aexp = { z | Re(exp(z)) = 0 } und Bexp = { z | Im(exp(z)) = 0 } gezeigt.
Die waagrechten Linien verlaufen im Abstand π/2 voneinander.
Einführung in die Mathematik 1
© Oliver Deiser
6.
Die komplexe Exponentialfunktion
349
Farbplot der komplexen
Exponentialfunktion
exp(z) = ∑ n ≥ 0 zn /n!
0
Radiales Gitter:
exp(−3), exp(−2), …, exp(3)
-
-3
-2
-1
0
1
2
3
3
2
Farbplot des Polynoms
1
s3 (z) = 1 + z + z2 /2 + z3 /6
0
Radiales Gitter wie oben
-1
-2
-3
-3
-2
-1
0
1
2
3
4
2
Farbplot des Polynoms
s5 (z) = ∑ k ≤ 5 zk /k!
0
Radiales Gitter wie oben
-2
-4
-4
-2
© Oliver Deiser
0
2
4
Einführung in die Mathematik 1
350
3. Abschnitt
Reelle und komplexe Zahlen
Anwendungen der Eulerschen Formel
Wir diskutieren einige Anwendungen der Eulerschen Formel
e
ix
= cos x + i sin x für alle x P R.
1. Additionstheoreme für Kosinus und Sinus
Zu den bestechendsten Anwendungen der Eulerschen Formel gehört die simultane Herleitung der Additionstheoreme für den Kosinus und Sinus. Für alle
x, y P R gilt:
cos(x + y) + i sin(x + y) = ei (x + y)
= ei x + i y
= ei x ei y
= (cos x + i sin x) (cos y + i sin y)
= cos x cos y − sin x sin y + i (cos x sin y + cos y sin x)
Vergleich von Real- und Imaginärteil liefert
cos(x + y) = cos x cos y − sin x sin y,
sin(x + y) = cos x sin y + cos y sin x.
Damit haben wir beide Additionstheoreme in wenigen Zeilen erhalten. Das Argument ist ein wunderbares Beispiel dafür, wie der Einsatz der komplexen Zahlen den reellen Kalkül vereinfachen kann. Effizient, elegant, magisch.
2. Angabe der Einheitswurzeln
Sei n ≥ 1, und seien wieder
ζ nk =
( cos (
k 2π
n
),
sin (
k 2π
n
))
für k P Z,
sodass ζ n0 , …, ζ nn − 1 die n-ten Einheitswurzeln sind. Dann gilt
ζ nk = ei k 2π/n für alle k P Z.
Durch diese Darstellung wird das Rechnen mit den Einheitswurzeln vereinfacht.
So gilt zum Beispiel für alle ganzzahligen k und m
ζ nk ζ nm = exp(i k 2π/n) exp(i m 2π/n) = exp(i (k + m) 2π/n) = ζ nk + m .
Einführung in die Mathematik 1
© Oliver Deiser
6.
Die komplexe Exponentialfunktion
351
3. Reihenentwicklungen des Kosinus und Sinus
Kennt man die komplexe Exponentialreihe, so lassen sich die Reihenentwicklungen des Kosinus und Sinus jederzeit leicht reproduzieren (vgl. die Argumentation im ersten Beweis):
cos x + i sin x = ei x = ∑ n
(ix)n
n!
=
= 1 + ix −
x3
x4
x5
x6
73
x2
− i
+
+ i
x −
− i
+ …
2
3!
4!
5!
6!
7!
= ∑ n (−1)n
x2n
(2n)!
+ i ∑ n (−1)n
x2n + 1
.
(2n + 1)!
4. Ableitungen des Kosinus und Sinus
Die Ableitungen des Kosinus und Sinus lassen sich ebenfalls mit der Eulerschen Formel reproduzieren (vgl. die Argumentation im zweiten Beweis):
cos′ x + i sin′ x =
d
dx
( cos x + i sin x )
=
d ix
e = i eix =
dx
= i (cos x + i sin x) = − sin x + i cos x.
Vergleich von Real- und Imaginärteil ergibt cos′ = − sin und sin′ = cos. Das Argument ist die komplexe Version unserer dynamischen Ermittlung der Ableitungen
des Kosinus und Sinus über eine gleichmäßige Bewegung auf dem Einheitskreis.
Die Drehung des Koordinatenvektors (cos x, sin x) um π/2 zum Geschwindigkeitsvektor (−sin x, cos x) entspricht der Multiplikation mit i bei der Ableitung
von eix .
Bemerkung
Es ist möglich, die komplexe Exponentialfunktion bei einem Aufbau der
Analysis an die Spitze zu stellen und die trigonometrischen Funktionen
durch
cos(x) = Re(eix ), sin(x) = Im(eix ) für alle x P R
zu definieren. Bei diesem Vorgehen lassen sich die Additionstheoreme, die
Reihenentwicklungen und die Ableitungen des Kosinus und Sinus mit
obigen Argumenten beweisen. Weiter ergibt sich eine analytische Definition von π, indem π/2 als die erste positive Nullstelle des Kosinus oder
alternativ 2π als die Periode von exp festlegt wird. Dann ist aber zu zeigen,
dass die analytische Größe π mit der geometrischen Größe π übereinstimmt. Allgemeiner muss die Längentreue der Kreisaufwicklung nachgewiesen werden, die bei diesem Ansatz keineswegs klar ist.
© Oliver Deiser
Einführung in die Mathematik 1
352
3. Abschnitt
Reelle und komplexe Zahlen
Übungen
Übung 1
Visualisieren Sie den Grenzwert limn zn = z einer Folge (zn )n P N in den
komplexen Zahlen, indem Sie Kreise mit Mittelpunkt z der Ebene C = R2
betrachten.
Übung 2
Visualisieren Sie die ε-δ-Stetigkeit einer Funktion f : C → C an der Stelle
p P C. Betrachten Sie hierzu Kreise der Ebene.
Übung 3
Überzeugen Sie sich davon, dass
d n
z = n zn − 1 für alle z P C
dz
genau wie im Reellen bewiesen werden kann.
Übung 4
Zeigen Sie, dass für alle n P N und x P R gilt:
(cos x + i sin x)n = cos(nx) + i sin(nx).
(Formel von de Moivre)
Leiten Sie hieraus die Verdopplungsformeln für cos(2x) und sin(2x) ab.
Übung 5
Skizzieren Sie die Mengen
A = { exp(1 + ix) | x P [ −π/2, π/2 ] },
B = { exp(log x + ix) | x P ] 0, 2π ] }.
Übung 6
Skizzieren Sie die Mengen
A = { (x, y) P C | x P [ 0, 1 ], y P [ 0, π ] },
B = exp [ A ] = { exp(x + i y) | (x, y) P A }.
Übung 7
Wie für R gilt für alle z P C und alle gegen z konvergenten Folgen (zn )n PN in C:
(
(+) exp(z) = limn 1 +
zn
n
) n.
Leiten Sie aus (+) aus Additionstheorem für exp : C → C ab.
Einführung in die Mathematik 1
© Oliver Deiser
4. Abschnitt
Ebene und Raum
© Oliver Deiser
Einführung in die Mathematik 1
1. Reelle Vektoren
In diesem Abschnitt untersuchen wir die Euklidische Ebene
R2 = R × R = { (x, y) | x, y P R }
und den Euklidischen Raum
R3 = R × R × R = { (x, y, z) | x, y, z P R }.
Allgemeiner betrachten wir auch die n-dimensionalen Euklidischen Räume
Rn = { (v1 , …, vn ) | v1 , …, vn P R }, n ≥ 1,
die sich zwar für eine Dimension n ≥ 4 unserer geometrischen Anschauung entziehen, sich aber über weite Strecken so behandeln lassen wie die vertraute zweidimensionale Ebene und der dreidimensionale Raum. Im Zentrum stehen aber
R2 und R3 . Größtmögliche Allgemeinheit streben wir hier nicht an, und der Leser kann sich immer an den Fällen n = 2 und n = 3 orientieren, wenn er möchte.
Die vier Hauptthemen
Vektoraddition, Skalarmultiplikation, Euklidische Norm, Euklidisches Skalarprodukt,
die wir im ersten Kapitel behandeln, bilden die Basis für alles Weitere.
© Oliver Deiser
Einführung in die Mathematik 1
356
4. Abschnitt
Ebene und Raum
Reelle Vektoren
Definition (die Räume Rn , n-dimensionaler reeller Vektor)
Sei n ≥ 1. Dann setzen wir
Rn = { (v1 , …, vn ) | v1 , …, vn P R }.
Die Elemente des Rn heißen n-dimensionale reelle Vektoren oder reelle
Vektoren der Länge oder Dimension n. Ist v = (v1 , …, vn ) P Rn , so heißen die
reellen Zahlen v1 , …, vn die Komponenten des Vektors v. Genauer heißt vi die
i-te Komponente von v für alle 1 ≤ i ≤ n.
Wir betrachten vor allem die Räume
2
(reelle Ebene)
3
(dreidimensionaler reeller Raum)
R = { (v1 , v2 ) | v1 , v2 P R },
R = { (v1 , v2 , v3 ) | v1 , v2 , v3 P R }.
Viele (nicht alle) Definitionen lassen sich aber allgemein für den Rn einführen.
Notation
Wie notieren Vektoren ohne Pfeile oder Striche. Bevorzugt verwenden wir
die Zeichen v, w, u für Vektoren. Ein Index i bezeichnet, wenn nichts
anderes gesagt ist, die i-te Komponente eines Vektors. Damit gilt für eine
gegebene Dimension n zum Beispiel
v = (v1 , …, vn ), w = (w1 , …, wn ), u = (u1 , …, un ).
Vektoren des R2 und R3 notieren wir oft auch in der Form
v = (x, y) bzw. v = (x, y, z).
Den Raum R1 identifizieren wir mit R.
Die Index-Notation ist auch möglich, wenn mehrere Vektoren betrachtet werden. Sind zum Beispiel v1 , v2 , v3 drei Vektoren des R3 , so ist v2, 3 die dritte Komponente des Vektors v2 . Wir schreiben auch kurz vij statt vi, j .
Definition (Nullvektor, kanonische Einheitsvektoren)
Sei n ≥ 1. Der Vektor 0 = (0, …, 0) P Rn heißt der Nullvektor oder
Nullpunkt des Rn . Wir bezeichnen ihn mit 0. Weiter setzen wir
e1 = (1, 0, …, 0), e2 = (0, 1, 0, …, 0), … en = (0, …, 0, 1).
Die Vektoren e1 , …, en P Rn heißen die kanonischen Einheits- oder Basisvektoren des Rn .
Die mehrfache Bedeutung der 0 führt in der Regel nicht zu Verwechslungen.
Wer möchte, kann 0 statt 0 schreiben.
Einführung in die Mathematik 1
© Oliver Deiser
1. Reelle Vektoren
357
Die Vektoraddition
Definition (Vektoraddition)
Sei n ≥ 1. Dann setzen wir für alle v, w P Rn :
v + w = (v1 + w1 , …, vn + wn )
(Addition von v und w)
Die Vektoraddition ist eine Abbildung von Rn × Rn nach Rn : Je zwei Vektoren
des Rn wird ein Vektor des Rn zugeordnet. In der Ebene und im Raum lässt sie
sich in der bekannten Weise durch das Aneinanderfügen zweier Pfeile visualisieren. Für n = 2 stimmt die Vektoraddition mit der Addition komplexer Zahlen
überein.
Weiter definieren wir:
Definition (inverser Vektor, Vektorsubtraktion)
Sei n ≥ 1. Dann setzen wir für alle v, w P Rn :
−v = (− v1 , …, − vn ),
v − w = v + (−w) = (v1 − w1 , …, vn − wn ).
Der Vektor − v P Rn heißt der zu v additiv inverse Vektor. Der Vektor v − w
heißt der Differenzvektor der Vektoren v und w.
Die Bildung von −v lässt sich anschaulich durch die Spiegelung des Vektors v
am Nullpunkt darstellen. Die Differenz v − w können wir durch den Pfeil, der
von der Spitze von w zur Spitze von v zeigt, repräsentieren.
Wesentliche Eigenschaften der Vektoraddition sind:
Satz (Eigenschaften der Vektoraddition)
Sei n ≥ 1. Dann gilt für alle v, w, u P Rn :
v + (w + u) = (v + w) + u,
v + 0 = 0 + v = v,
(Assoziativität)
(Neutralität des Nullvektors)
v + (− v) = (− v) + v = 0,
(Inversenbildung)
v + w = w + v.
(Kommutativität)
Der Beweis kann dem Leser zur Übung überlassen bleiben. Insgesamt gelten
die vertrauten Gesetze der Addition reeller Zahlen, und wir übernehmen entsprechende Konventionen. Aufgrund des Assoziativität können wir zum Beispiel
Klammern weglassen und aufgrund der Kommutativität Vektoren einer Summe
v1 + … + vn beliebig umordnen.
Beispiel
Im R5 gilt −(1, 1, 2, 0, −1) = (−1, −1, −2, 0, 1), −e2 = (0, −1, 0, 0, 0).
© Oliver Deiser
Einführung in die Mathematik 1
358
4. Abschnitt
Ebene und Raum
Die Skalarmultiplikation
Einen Vektor können wir um einen beliebigen reellen Faktor strecken oder
stauchen, wobei ein negatives Vorzeichen zusätzlich eine Spiegelung am Nullpunkt bewirkt. Dieser Vorgang wird als Skalierung oder Skalarmultiplikation bezeichnet und die beteiligten reellen Faktoren nennt man entsprechend Skalare.
Wir bezeichnen Skalare meistens mit griechischen Buchstaben, um sie von Vektoren zu unterscheiden. Da α, β, γ, δ oft für Winkel verwendet werden, bevorzugen wir andere Buchstaben. Häufig verwendet werden vor allem λ und µ.
Definition (Skalarmultiplikation)
Sei n ≥ 1. Dann setzen wir für alle λ P R und alle v P Rn :
λ v = (λ v1 , …, λ vn ).
(Multiplikation des Vektors v mit dem Skalar λ)
Die Skalarmultiplikation ist eine Abbildung von R × Rn nach Rn : Jedem Skalar
λ P R und jedem Vektor v P Rn wird ein Vektor λ v P Rn zugeordnet.
Die folgenden Eigenschaften lassen sich wieder durch Nachrechnen beweisen:
Satz (Eigenschaften der Skalarmultiplikation)
Sei n ≥ 1. Dann gilt für alle λ, µ P R und alle v, w P Rn :
(i) 1 v = v,
(ii) λ (µ v) = (λ µ) v,
(iii) λ (v + w) = λ v + λ w,
(iv) (λ + µ) v = λ v + µ v.
Weiter bemerken wir, dass − v = (−1) v für alle n ≥ 1 und alle v P Rn gilt. Allgemein lässt sich die Multiplikation eines Vektors mit einem negativen Skalar λ als
eine Skalierung um |λ| gefolgt von einer Spiegelung am Nullpunkt auffassen
oder umgekehrt als Spiegelung am Nullpunkt gefolgt von einer Skalierung um
|λ|.
Beispiele
(1) Im R2 gilt e1 = 2(1, 0) = (2, 0), −3v = (−3v1 , −3v2 ) für alle v P R2 .
(2) Für alle v = (v1 , v2 , v3 ) P R3 gilt
v = v1 (1, 0, 0) + v2 (0, 1, 0) + v3 (0, 0, 1) = v1 e1 + v2 e2 + v3 e3 .
(3) Allgemein gilt für alle n ≥ 1 und v P Rn
v = v1 e1 + … + vn en = ∑ 1 ≤ k ≤ n vk ek .
Einführung in die Mathematik 1
© Oliver Deiser
1. Reelle Vektoren
359
Der Satz des Pythagoras und die Euklidische Norm
Wir setzen den Satz des Pythagoras als bekannt voraus. Die beiden folgenden
Diagramme illustrieren das zeitlose Ergebnis und zeigen Möglichkeiten auf, den
Satz mit Hilfe von Flächeninhalten bzw. Streckenverhältnissen zu beweisen.
a
c
b
a
b
Die Fläche des großen Quadrats ist (a + b)2 und die Fläche der vier Dreiecke ist 2ab.
Damit ist c2 = (a + b)2 − 2ab = a2 + b2 .
P
c
Q
c
b
a
R
c-a
S
Die Dreiecke PQR und PSR sind ähnlich, sodass
c+a
b
=
.
b
c−a
Folglich ist c2 − a2 = (c + a) (c − a) = b2 und damit a2 + b2 = c2 .
© Oliver Deiser
Einführung in die Mathematik 1
360
4. Abschnitt
Ebene und Raum
Motiviert durch den Satz des Pythagoras definieren wir:
Definition (Euklidische Norm bzw. Länge)
Sei n ≥ 1. Dann setzen wir für alle v P Rn :
i v i = £v1 2 + … + vn 2 .
Die reelle Zahl i v i heißt die Euklidische Norm oder Euklidische Länge des
Vektors v.
v = (x, y)
y
v
x
2
2
i v i = £x + y
Beispiele
(1) Für die Dimension n = 2 gilt
i (3, 4) i = £9 + 16 = £25 = 5.
(2) Für die Dimension n = 2 gilt i (1, 1) i = £2. Für die Dimension n = 3
gilt i (1, 1, 1) i = £3. Allgemein gilt im Rn , dass i (1, …, 1) i = £n.
(3) Für jede Dimension n und alle 1 ≤ k ≤ n gilt i ek i = 1.
Wir sagen auch kurz Norm oder Länge, weisen aber darauf hin, dass es auch
andere Möglichkeiten gibt, einen Vektor zu messen:
Beispiel
Die Maximumsnorm auf dem Rn ist definiert durch
i v i max = max(|v1 |, …, |vn |) für alle v P Rn .
Für die Dimension n = 2 gilt zum Beispiel
i (1, 1) i = £2,
i (1, 1) i max = 1.
Beim Rechnen mit der Euklidischen Norm führen die auftretenden Wurzeln
oft zu unübersichtlichen Termen. Oft ist es hilfreich, das Quadrat
i v i2 = v1 2 + … + vn 2
der Norm der Vektors zu berechnen und erst am Ende die Wurzel zu ziehen.
Einführung in die Mathematik 1
© Oliver Deiser
1. Reelle Vektoren
361
Vektoren der Länge Eins spielen an vielen Stellen eine besondere Rolle:
Definition (normiert, Normierung)
Sei n ≥ 1. Ein Vektor v P Rn heißt normiert, falls i v i = 1. Für alle v P Rn mit
v ≠ 0 definieren wir die Normierung von v durch:
v̂ =
v
.
ivi
Weiter setzen wir v̂ = v = 0 P Rn , falls v = 0.
Beispiele
(1) Im Rn sind alle Einheitsvektoren e1 , …, en normiert.
(2) Für n = 2 ist ein Vektor v genau dann normiert, wenn er auf dem
Einheitskreis K liegt. Für alle α P R ist (cos α, sin α) normiert.
Für alle Vektoren v ≠ 0 ist der Vektor v̂ (gelesen: „v Hut“ oder „v Dach“) normiert. Es gilt
(+) v = i v i v̂ für alle v P Rn .
v
v
v
w
w
w
K
Die Normierung lässt sich als Projektion eines Vektors auf den Einheitskreis K ansehen
Bei vielen Argumenten kann man sich darauf beschränken, die gewünschte Eigenschaft nur für normierte Vektoren zu zeigen. Für allgemeine Vektoren folgt
sie dann durch die Skalierung (+). Zudem vereinfacht die Verwendung von v̂ auch
viele Formeln, bei denen durch die Norm dividiert wird.
Die grundlegenden Eigenschaften der Euklidischen Norm sind:
© Oliver Deiser
Einführung in die Mathematik 1
362
4. Abschnitt
Ebene und Raum
Satz (Eigenschaften der Euklidischen Norm)
Sei n ≥ 1. Dann gilt für alle λ P R und alle v, w P Rn :
(i) i v i = 0 genau dann, wenn v = 0,
(ii) i λ v i =
|λ| i v i,
(iii) i v + w i ≤ i v i + i w i.
(Dreiecksungleichung)
Die dritte Eigenschaft besagt anschaulich, dass der direkte Weg von 0 nach
v + w höchstens so lang ist wie der direkte Weg von 0 nach v gefolgt vom Weg
von v nach v + w.
v+w
w
v+w
w
v
v
Zur Dreiecksungleichung
Die anschaulich klare Aussage, dass der kürzeste Weg zwischen zwei Punkten
eine Gerade ist, ist keineswegs leicht zu beweisen. Im folgenden Beweis verwenden wir eine fundamentale Abschätzung, die sich aus der zweiten binomischen
Formel ergibt.
Beweis
Die Eigenschaften (i) und (ii) ergeben sich unschwer aus den Definitionen.
Zum Beweis der Dreiecksungleichung verwenden wir:
(+) 2 x y ≤ x2 + y2 für alle x, y P R.
Diese Ungleichung folgt aus 0 ≤ (x − y)2 = x2 − 2xy + y2 für alle x, y P R.
Seien nun v, w P Rn beliebig. Dann ergibt eine n-fache Anwendung von (+):
(
2 v̂1 ŵ1 + … + v̂n ŵn
)
≤ v̂1 2 + ŵ1 2 + … + v̂n 2 + ŵn 2
= i v̂ i 2 + i ŵ i 2 = 1 + 1 = 2.
Einführung in die Mathematik 1
© Oliver Deiser
1. Reelle Vektoren
363
Division durch 2 und Multiplikation mit den Normen von v und w liefert:
(♦) v1 w1 + … + vn wn ≤ i v i i w i.
Damit können wir nun rechnen:
iv + wi 2 = (v1 + w1 )2 + … + (vn + wn )2
(
= i v i 2 + i w i 2 + 2 v1 w1 + … + vn wn
)
≤ ivi + iwi + 2 ivi iwi
2
≤
2
( i v i + i w i ) 2.
Wurzelziehen erhält die Ungleichung (da die Wurzelfunktion monoton
steigt) und liefert die Behauptung.
Die Ungleichung (♦), aus der wir die Dreiecksungleichung gewinnen konnten, leitet über zu unserem nächsten Zwischenabschnitt:
Das Euklidische Skalarprodukt
Im Beweis der Dreiecksungleichung ist uns die Summe
v 1 w1 + … + v n wn
begegnet, bei der die Komponenten zweier Vektoren paarweise multipliziert und
die Produkte anschließend aufsummiert werden. Wir untersuchen dieses „Wunder der linearen Algebra“ nun genauer.
Definition (Euklidisches Skalarprodukt)
Sei n ≥ 1. Dann setzen wir für alle v, w P Rn :
⟨v, w⟩ = v • w = v1 w1 + … + vn wn .
Die reelle Zahl ⟨v, w⟩ heißt das Euklidische Skalarprodukt der Vektoren v und w.
Das Euklidische Skalarprodukt ist eine Abbildung von Rn × Rn nach R: Je zwei
Vektoren des Rn wird eine reelle Zahl (ein Skalar) zugeordnet. Das Produkt der
beiden Vektoren ist also ein Skalar, was die Namensgebung Skalarprodukt motiviert.
Im Folgenden bevorzugen wir die Klammernotation ⟨v, w⟩ gegenüber der in
der Schule vielleicht bevorzugten Punkt-Notation. In der mathematischen Physik ist zudem auch die Dirac-Notation
⟨v w⟩ statt ⟨v, w⟩
üblich.
© Oliver Deiser
Einführung in die Mathematik 1
364
4. Abschnitt
Ebene und Raum
Direkt aus den Definitionen des Skalarprodukts und der Norm ergibt sich:
Satz (Skalarprodukt und Norm)
Für alle v P Rn gilt:
i v i 2 = ⟨v, v⟩.
Durch Nachrechnen zeigt man die folgenden Eigenschaften, die pausenlos im
Einsatz sind:
Satz (Eigenschaften des Euklidischen Skalarprodukts)
Sei n ≥ 1. Dann gilt für alle λ P R und alle v, w, v′, w′ P Rn :
(i) ⟨v + λ v′, w⟩ = ⟨v, w⟩ + λ ⟨v′, w⟩,
⟨v, w + λ w′⟩ = ⟨v, w⟩ + λ ⟨v, w′⟩,
(ii) ⟨v, w⟩ = ⟨w, v⟩,
(Bilinearität)
(Symmetrie)
(iii) ⟨v, v⟩ > 0 für alle v ≠ 0.
(positive Definitheit)
Mit Hilfe der Bilinearität und Symmetrie zeigen wir:
Satz (binomische Formeln und Polarisation)
Sei n ≥ 1. Dann gilt für alle v, w P Rn :
(a) i v ± w i 2 = i v i 2 + i w i 2 ± 2 ⟨v, w⟩,
(b) 4 ⟨v, w⟩ = i v + w i − i v − w i .
2
2
(binomische Formeln)
(Polarisation)
Beweis
Seien v, w P Rn . Dann gilt:
iv + wi 2 = ⟨v + w, v + w⟩
= ⟨v, v + w⟩ + ⟨w, v + w⟩
= ⟨v, v⟩ + ⟨v, w⟩ + ⟨w, v⟩ + ⟨w, w⟩
= ⟨v, v⟩ + 2 ⟨v, w⟩ + ⟨w, w⟩
= i v i 2 + i w i 2 + 2 ⟨v, w⟩.
Die zweite binomische Formel wird analog bewiesen.
Der Beweis der Polarisationsformel (b) sei dem Leser zur Übung überlassen.
Unserem Beweis der Dreiecksungleichung entnehmen wir folgende Abschätzung, die allgemein als eine der wichtigsten Ungleichungen der gesamten Mathematik anerkannt ist:
Einführung in die Mathematik 1
© Oliver Deiser
1. Reelle Vektoren
365
Satz (Ungleichung von Cauchy-Schwarz)
Sei n ≥ 1. Dann gilt für alle v, w P Rn :
|⟨v, w⟩|
≤ i v i i w i.
Beweis
Seien v, w P Rn . Wir wissen schon (nach (♦) oben), dass ⟨v, w⟩ ≤ i v i i w i.
Ist ⟨v, w⟩ < 0, so ist ⟨−v, w⟩ > 0 und
|⟨v, w⟩|
= ⟨−v, w⟩ ≤ i −v i i w i = i v i i w i.
Wir geben noch einen zweiten Beweis, der nur die grundlegenden Eigenschaften des Skalarprodukts verwendet.
Zweiter Beweis der Ungleichung von Cauchy-Schwarz
Es genügt, normierte Vektoren zu betrachten. Denn für v = 0 oder w = 0 ist die
Ungleichung klar und für Längen ungleich 1 folgt sie durch Skalierung aus
der Version für normierte Vektoren. Seien also v,w P Rn normiert. Dann gilt
für alle λ P R nach den binomischen Formeln:
0 ≤ i v − λ w i 2 = i v i 2 + λ2 i w i 2 − 2λ ⟨v, w⟩ = 1 + λ2 − 2λ ⟨v, w⟩.
Für den Spezialfall λ = ⟨v, w⟩ erhalten wir 0 ≤ 1 − ⟨v, w⟩2 , sodass
|⟨v, w⟩|
≤ 1 = 1 ⋅ 1 = i v i i w i.
w
w
v- w
w
v- w
v
Zum zweiten Beweis der Cauchy-Schwarz-Ungleichung
Aus den Beweisen der Cauchy-Schwarz-Ungleichung ergibt sich, dass die Ungleichung von Cauchy-Schwarz genau dann zu einer Gleichung wird, wenn die
Vektoren auf einer Geraden des Rn liegen. Wir diskutieren dies in den Übungen.
© Oliver Deiser
Einführung in die Mathematik 1
366
4. Abschnitt
Ebene und Raum
Übungen
Übung 1
Visualisieren Sie die Vektoraddition, Vektorsubtraktion und Skalarmultiplikation durch Diagramme für den Fall n = 2.
Übung 2
Sei n ≥ 1. Zeigen Sie, dass für alle v, w, u P Rn gilt:
v + (w + u) = (v + w) + u,
v + 0 = 0 + v = v,
(Assoziativität)
(Neutralität des Nullvektors)
v + (− v) = (− v) + v = 0,
(Inversenbildung)
v + w = w + v.
(Kommutativität)
Übung 3
Sei n ≥ 1. Zeigen Sie, dass für alle λ, µ P R und alle v, w P Rn gilt:
(i) 1 v = v,
(ii) λ (µ v) = (λ µ) v,
(iii) λ (v + w) = λ v + λ w,
(iv) (λ + µ) v = λ v + µ v.
Übung 4
Welche Größenbeziehung besteht zwischen der Euklidischen Norm und
der Maximumsnorm im Rn ? Formulieren Sie eine Hypothese und beweisen
Sie sie. Welche Form hat Kn = { v P Rn mit i v i max = 1 } für n = 2 und n = 3?
Übung 5
Sei n ≥ 1. Zeigen Sie, dass für alle λ P R und alle v P Rn gilt:
(i) i v i = 0 genau dann, wenn v = 0,
(ii) i λ v i =
|λ| i v i.
Übung 6
Sei n ≥ 1. Beweisen Sie mit Hilfe der Dreiecksungleichung für die
Euklidische Norm, dass für alle v, w P Rn gilt:
(a) i v − w i ≤ i v i + i w i,
(b) i v i − i w i ≤ i v + w i,
(c) i v i − i w i ≤ i v − w i.
Einführung in die Mathematik 1
© Oliver Deiser
1. Reelle Vektoren
367
Übung 7
Sei n ≥ 1. Zeigen Sie, dass für alle λ P R und alle v, w, v′, w′ P Rn gilt:
(i) ⟨v + λ v′, w⟩ = ⟨v, w⟩ + λ ⟨v′, w⟩,
⟨v, w + λ w′⟩ = ⟨v, w⟩ + λ ⟨v, w′⟩,
(ii) ⟨v, w⟩ = ⟨w, v⟩,
(Bilinearität)
(Symmetrie)
(iii) ⟨v, v⟩ > 0 für alle v ≠ 0.
(positive Definitheit)
Übung 8
Sei n ≥ 1. Zeigen Sie, dass für alle v P Rn gilt:
v = ⟨e1 , v⟩ e1 + … + ⟨en , v⟩ en
wobei e1 = (1, 0, …, 0), …, en = (0, …, 0, 1) die kanonischen Einheitsvektoren des Rn sind.
Übung 9
Sei n ≥ 1. Formulieren und beweisen Sie eine dritte binomische Formel für
das Euklidische Skalarprodukt im Rn .
Übung 10
Sei n ≥ 1. Zeigen Sie, dass für alle v, w P Rn gilt:
4 ⟨v, w⟩ = i v + w i 2 − i v − w i 2 .
(Polarisation)
Übung 11
Sei n ≥ 1. Zeigen Sie, dass für alle v, w P Rn gilt:
(
)
iv + wi2 + iv − wi2 = 2 ivi2 + iwi2 .
(Parallelogrammgleichung)
Erläutern Sie den Namen „Parallelogrammgleichung“ durch ein Diagramm für den Fall n = 2.
Übung 12
Sei n ≥ 1. Wir setzen
d(v, w) = i v − w i für alle v, w P Rn .
Die reelle Zahl d(v, w) heißt der Euklidische Abstand der Vektoren v und w.
Zeigen Sie, dass für alle v, w, u P Rn gilt:
(i) d(v, w) = 0 genau dann, wenn v = w,
(ii) d(v, w) = d(w, v),
(iii) d(v, w) ≤ d(v, u) + d(u, w).
© Oliver Deiser
Einführung in die Mathematik 1
368
4. Abschnitt
Ebene und Raum
Übung 13
Sei n ≥ 1. Zeigen Sie, dass für alle v, w P Rn äquivalent sind:
(a)
|⟨v, w⟩|
= i v i i w i.
(b) w = 0 oder es gibt ein λ P R mit v = λw.
Übung 14
Seien v, w P R2 . Veranschaulichen Sie die Vektoren
v − λ w für λ P R
durch ein Diagramm. Motivieren Sie die Wahl von λ = ⟨v, w⟩ für normierte
Vektoren v, w im zweiten Beweis der Ungleichung von Cauchy-Schwarz.
Verwenden Sie hierzu, dass zwei Vektoren der Ebene aufeinander senkrecht
stehen, wenn ihr Skalarprodukt Null ist. Wie muss λ gewählt werden, wenn
v, w nicht notwendig normiert sind?
Übung 15
Sei n ≥ 1. Wir betrachten Vektoren z = (z1 , …, zn ) der Dimension n mit
komplexen Komponenten zn P C, also Elemente des Cn . Die Vektoraddition und Skalarmultiplikation (mit Skalaren λ P C) wird für Cn wie für Rn
definiert. Für die Norm verwenden wir den komplexen Betrag der
Komponenten, d. h. wir setzen
i z i = £|z1 |2 + … + |zn |2
für alle z P Cn .
Wir definieren nun für alle z, w P Cn :
⟨z, w⟩* = z1 w1 + … + zn wn ,
⟨z, w⟩ = z1 w1 + … + zn wn .
Untersuchen diese Versionen eines komplexen Skalarprodukts (die beide
für reelle Vektoren mit dem Euklidischen Skalarprodukt übereinstimmen).
Betrachten Sie hierzu insbesondere die elementaren Eigenschaften und den
Zusammenhang zur Norm. Was ändert sich, wenn man die komplexe
Konjugation auf die Komponenten von w anstelle von z anwendet?
Übung 16
Sei s : Rn × Rn → R eine Funktion mit den Eigenschaften:
s(ei , w) = wi für alle 1 ≤ i ≤ n und alle w P Rn ,
s(λ v + µ u, w) = λ s(v, w) + µ s(u, w) für alle v, u P Rn , λ, µ P R,
wobei wieder e1 = (1, 0, …, 0), …, en = (0, … 0, 1).
Zeigen Sie, dass s(v, w) = ⟨v, w⟩ für alle v, w P Rn .
Einführung in die Mathematik 1
© Oliver Deiser
2. Die Euklidische Ebene
Wir betrachten nun speziell die Ebene R2 , also die Dimension n = 2. Anhand
dieses Spezialfalls untersuchen wir Winkel zwischen Vektoren, Orthogonalität
und Kollinearität, Determinanten, Koordinatenvektoren und lineare Gleichungssysteme. Zum Abschluss des Kapitels werfen wir noch einen Blick auf
algebraische Kurven ersten und zweiten Grades.
Einen Vektor v der Ebene notieren wir oft auch in der durch das vertraute Koordinatensystem nahegelegten Form
v = (x, y).
Daneben gilt stets auch wieder
v = (v1 , v2 ), w = (w1 , w2 ), u = (u1 , u2 ).
© Oliver Deiser
Einführung in die Mathematik 1
370
4. Abschnitt
Ebene und Raum
Die Winkelformel für das Euklidische Skalarprodukt
Unsere erste Aufgabe ist die Ermittlung der geometrischen Bedeutung des
Euklidischen Skalarprodukts. Wir definieren hierzu:
Definition (eingeschlossener Winkel)
Seien v, w P R2 mit v, w ≠ 0. Dann setzen wir
](v, w) = „der von v und w eingeschlossene Winkel in [ 0, π ]“.
Der Winkel ](v, w) hat keine Orientierung und liegt immer zwischen 0 und π.
Es gilt ](v, w) = ](w, v) und ](v, w) = ](v̂, ŵ). Der Winkel zwischen zwei Vektoren ist nicht definiert, wenn einer der Vektoren der Nullvektor ist.
Von großer Bedeutung ist:
Satz (Winkelformel)
Seien v, w P R2 von 0 verschieden, und sei ϕ = ](v, w). Dann gilt:
⟨v, w⟩
, ϕ = arccos(⟨v̂, ŵ⟩).
iviiwi
cos ϕ = ⟨v̂, ŵ⟩ =
(Winkelformel)
v
v
v
1
w
w
w
cos( )
Zur Winkelformel: cos ϕ = ⟨v̂, ŵ⟩
Für alle v, w P R2 mit v, w ≠ 0 gilt also
⟨v, w⟩ = cos(ϕ) i v i i w i.
Einführung in die Mathematik 1
© Oliver Deiser
2. Die Euklidische Ebene
371
Wir geben zwei Beweise für die Winkelformel. Der erste kombiniert den Kosinussatz mit der zweiten binomischen Formel für das Skalarprodukt.
Beweis mit Hilfe des Kosinussatzes
Seien v, w P R2 mit v, w ≠ 0. In einem Dreieck ABC mit Seiten a, b, c und
Winkeln α, β, γ gilt:
a2 = b2 + c2 − 2 cos(α) b c.
(Kosinussatz)
Für das Dreieck mit den Ecken A = 0, B = w und C = v gilt
(i) a = i v − w i, b = i v i, c = i w i,
(ii) α = ](v, w) = ϕ.
Der Kosinussatz für dieses Dreieck liest sich nun in der Form
(1) i v − w i 2 = i v i 2 + iw i 2 − 2 cos(α) iv i iw i.
Nach der zweiten binomischen Formel für das Skalarprodukt gilt aber
(2) i v − w i 2 = i v i 2 + i w i 2 − 2 ⟨v, w⟩.
Durch Vergleich von (1) und (2) erhalten wir
cos(ϕ) iv ii wi = ⟨v, w⟩.
C
b
v
a
A
B
c
v-w
v
0
w
w
Zum Beweis der Winkelformel mit Hilfe des Kosinussatzes
Der Kosinussatz lässt sich mit Hilfe des Satzes von Pythagoras beweisen (das
linke Diagramm enthält zwei rechtwinklige Dreiecke. Wir überlassen den Beweis dem Leser als Übung. Dabei sind neben spitzwinkligen auch stumpfwinklige Dreiecke zu betrachten. Der Kosinussatz ist für alle Dreiecke gültig.
© Oliver Deiser
Einführung in die Mathematik 1
372
4. Abschnitt
Ebene und Raum
Unser zweiter Beweis verwendet des Additionstheorem:
Beweis mit Hilfe des Additionstheorems für den Kosinus
Seien v, w P R2 mit v, w ≠ 0. Wir dürfen annehmen (nach evtl. Vertauschung
von v und w), dass es x1 , y1 , x2 , y2 , ϕ1 , ϕ2 P R gibt mit
(i) v̂ = (x1 , y1 ) = (cos ϕ1 , sin ϕ1 ),
(ii) ŵ = (x2 , y2 ) = (cos ϕ2 , sin ϕ2 ),
(iii) ϕ1 ≤ ϕ2 ≤ ϕ1 + π.
Dann ist
ϕ = ϕ2 − ϕ1 = ](v, w).
Nach dem Additionstheorem für den Kosinus gilt
cos ϕ = cos(ϕ2 − ϕ1 )
= cos ϕ2 cos ϕ1 − sin ϕ2 sin (−ϕ1 )
= cos ϕ1 cos ϕ2 + sin ϕ1 sin ϕ2
= x1 x2 + y1 y2
= ⟨v̂, ŵ⟩.
Wir betrachten nun einige Anwendungen der Winkelformel.
1. Die Ungleichung von Cauchy-Schwarz
Aus der Winkelformel ergibt sich wegen cos ϕ P [ −1, 1 ] noch einmal die Ungleichung von Cauchy-Schwarz. Denn für v = 0 oder w = 0 ist die Ungleichung
klar und für v, w ≠ 0 ist
|⟨v, w⟩|
= |cos ϕ| i v i i w i ≤ i v i i w i.
2. Der Kosinussatz
Ist die Winkelformel in irgendeiner Art und Weise einmal bewiesen, so ergibt
sich aus ihr der Kosinussatz. Denn mit den Bezeichnungen des obigen Beweises
gilt für ein Dreieck ABC mit den Ecken A = 0, B = w und C = v:
a2 = i v − w i 2
= i v i 2 + i w i 2 − 2 ⟨v, w⟩.
= i v i 2 + i w i 2 − 2 cos(α) i v i iw i
= b2 + c2 − 2 cos(α) b c.
Einführung in die Mathematik 1
© Oliver Deiser
2. Die Euklidische Ebene
373
3. Orthogonalität
Definition (orthogonal, aufeinander senkrecht stehen)
Seien v, w P R2 . Wir sagen, dass v und w orthogonal sind oder aufeinander
senkrecht stehen, falls ⟨v, w⟩ = 0.
Die Orthogonalität ist auch für Nullvektoren erklärt. Der Nullvektor ist orthogonal zu jedem Vektor der Ebene. Für vom Nullvektor verschiedene Vektoren v, w mit eingeschlossenem Winkel ϕ P [ 0, π ] ist die Orthogonalität nach der
Winkelformel äquivalent zu cos ϕ = 0 und damit zu ϕ = π/2.
4. Kollinearität
Definition (kollinear, parallel, antiparallel)
Seien v, w P R2 . Wir sagen, v und w sind
kollinear,
falls
|⟨v, w⟩| = i v i i w i,
parallel,
falls
⟨v, w⟩ = i v i i w i,
antiparallel,
falls
⟨v, w⟩ = − i v i i w i.
Die Ungleichung von Cauchy-Schwarz ist also genau für kollineare Vektoren eine Gleichung. Für v, w ≠ 0 entsprechen die drei Begriffe „kollinear, parallel, antiparallel“ nach der Winkelformel genau den eingeschlossenen Winkeln
ϕ P { 0, π }, ϕ = 0, ϕ = π.
Beispiele
(1) Der Nullvektor ist mit jedem v P R2 kollinear.
(2) Die Vektoren (1, 4) und (−2, −8) sind antiparallel und damit kollinear.
Für alle y ≠ 8 sind die Vektoren (1, 4) und (2, y) nicht kollinear.
Der folgende Satz, dessen Beweis wir dem Leser zur Übung überlassen, versammelt einige Äquivalenzen zur Kollinearität zweier Vektoren.
Satz (Kriterien für Kollinearität)
Seien v, w P R2 . Dann sind die folgenden Aussagen äquivalent:
(a) Die Vektoren v, w sind kollinear.
(b) v = 0 ∨ ∃λ P R λv = w.
(c) ∃λ, µ P R (λv + µ w = 0 ∧ (λ ≠ 0 ∨ µ ≠ 0)).
(d) v, w liegen auf einer gemeinsamen Geraden durch 0, d. h. es gibt ein
u P R2 mit u ≠ 0 und v, w P G(u) = { λu | λ P R }.
Sind v,w ≠ 0, so sind v,w genau kollinear, wenn G(v) = G(w). Da der Nullvektor
keine Gerade definiert, ist die Voraussetzung v, w ≠ 0 wichtig.
© Oliver Deiser
Einführung in die Mathematik 1
374
4. Abschnitt
Ebene und Raum
5. Die orthogonale Projektion
Definition (orthogonale Projektion)
Wir setzen für alle u, v P R2 :
pru (v) = ⟨û, v⟩ û.
(Projektionsformel)
2
Der Vektor pru (v) P R heißt die (orthogonale) Projektion des Vektors v auf
den Vektor u.
v1
u
1
pru (v2 )
pru (v1 )
2
v2
Die Projektionen der Vektoren v1 und v2 auf den Vektor u
Die Vektoren u und pru (v) sind nach Definition kollinear. Die Bezeichnung als
orthogonale Projektion wird dadurch erklärt, dass pru (v) und w = v − pru (v) aufeinander senkrecht stehen:
⟨pru (v), w⟩ = ⟨pru (v), v⟩ − ⟨pru (v), pru (v)⟩
= ⟨⟨û, v⟩ û, v⟩ − ⟨⟨û, v⟩ û, ⟨û, v⟩ û⟩
= ⟨û, v⟩ ⟨û, v⟩ − ⟨û, v⟩ ⟨û, v⟩ ⟨û, û⟩
= ⟨û, v⟩2 − ⟨û, v⟩2 = 0.
Als Merkhilfe kann man verwenden:
Zur Struktur der Projektionsformel
(1) Die Projektion von v auf u ist unabhängig von der Länge von u und
damit ein skalares Vielfaches von û.
(2) Die Projektion von λv auf u ist das λ-fache der Projektion von v auf u.
Dies erklärt das Vorhandensein bzw. Fehlen der Normen bei u bzw. v.
Einführung in die Mathematik 1
© Oliver Deiser
2. Die Euklidische Ebene
375
Ist der Vektor u normiert, so gilt pru (v) = ⟨u, v⟩ u und damit
i pru (v) i = |⟨u, v⟩|.
Der Betrag des Skalarprodukts von u und v ist in diesem wichtigen Fall also die
Euklidische Länge der Projektion von v auf u. Allgemein gilt ipru (v)i = |⟨û, v⟩|.
Wir halten noch fest: Die Vektoren u und v sind genau dann orthogonal, wenn
pru (v) = prv (u) = 0,
und genau dann kollinear, wenn
pru (v) = v und prv (u) = u.
Determinanten
Je zwei Vektoren der Ebene definieren in natürlicher Weise ein Parallelogramm:
Definition (aufgespanntes Parallelogramm)
Seien v, w P R2 . Dann heißt die Menge
P = { λ v + µ w | λ, µ P [ 0, 1 ] } ⊆ R2
das von v und w aufgespannte Parallelogramm.
Natürlich ist P nur dann ein echtes Parallelogramm, wenn v und w nicht kollinear sind. Es schadet aber im Folgenden nicht, den kollinearen Fall zuzulassen.
v
P
u
w
Das von v und w aufgespannte Parallelogramm P und der Vektor u = 1/2 v + 2/3 w
© Oliver Deiser
Einführung in die Mathematik 1
376
4. Abschnitt
Ebene und Raum
Wir wollen nun eine Formel für die Fläche des von zwei Vektoren v und w aufgespannten Parallelogramms P in Abhängigkeit von den Koordinaten der Vektoren entwickeln. Dabei tauchen in natürlicher Weise orientierte Flächen auf, die
ein der geometrischen Lage von v und w entsprechendes Vorzeichen tragen.
Hierzu definieren wir:
Definition (Orientierung eines Vektorpaars)
Seien v, w P R2 nicht kollinear, und sei v ⊥ = rotπ/2 (v) = (− v2 , v1 ). Weiter sei
ψ = ](v ⊥ , w). Dann heißt (v, w) positiv orientiert, wenn ψ P [ 0, π/2 [, und
negativ orientiert, wenn ψ P ] π/2, π ].
Kollinearen Vektoren wird keine Orientierung zugewiesen. Die positive Orientierung von (v, w) besagt, dass w in der gleichen Halbebene wie v ⊥ liegt, wenn
wir die Ebene gemäß v in zwei Halbebenen aufteilen. Anders formuliert: Wir gelangen von v nach w durch eine Drehung gegen den Uhrzeigersinn um den eingeschlossenen Winkel ϕ = ](v, w). Bei einer negativen Orientierung gelangen
wir von v nach w durch eine Drehung um ϕ im Uhrzeigersinn. Ist (v, w) positiv
orientiert, so ist (w, v) negativ orientiert und umgekehrt.
rot /2 (v)
w
A(P)
v
u
(v, w) ist positiv orientiert, (v, u) negativ
Nach diesen Vorbereitungen können wir die orientierte Fläche A = A(P) bestimmen, wobei das Vorzeichen von A der Orientierung von v, w entsprechen
soll. Wir betrachten s = i v i als Grundseite von P. Dann berechnet sich die signierte Höhe von P zu
h = cos ψ i w i, wobei ψ = ](v ⊥ , w) P [ 0, π ] mit v ⊥ = rotπ/2 (v) = (−v2 , v1 ).
Wegen i v ⊥ i = i v i ist
A = s h = i v i cos ψ i w i = ⟨v ⊥ , w⟩ = ⟨(−v2 , v1 ), (w1 , w2 )⟩ = v1 w2 − v2 w1 .
Einführung in die Mathematik 1
© Oliver Deiser
2. Die Euklidische Ebene
377
Diese Überlegungen motivieren die folgende Definition:
Definition (Determinante)
Seien v, w P R2 . Dann heißt die reelle Zahl
det(v, w) = v1 w2 − v2 w1
die Determinante des Vektorenpaars (v, w).
Nützlich ist eine quadratische Notation der Koordinaten:
Notation
Wir notieren die Determinante auch in Matrix-Schreibweise in der Form
det
x1 x2
y1 y2
statt det((x1 , y1 ), (x2 , y2 )).
Die Vektoren werden als Spalten in die Matrix geschrieben.
Direktes Nachrechnen zeigt:
Satz (Eigenschaften der Determinante)
Für alle v, w, v1 , v2 , w1 , w2 P R2 und alle λ P R gilt:
(i) det(e1 , e2 ) = 1,
(ii) det(v, v) = 0,
(iii) det(v, w) = − det(w, v),
(iv) det(λ v, w) = det(v, λ w) = λ det(v, w),
(v) det(v1 + v2 , w) = det(v1 , w) + det(v2 , w),
det(v, w1 + w2 ) = det(v, w1 ) + det(v, w2 ).
In Matrix-Notation halten wir noch eine weitere Eigenschaft fest, die sich
durch Ausrechnen sofort ergibt:
det
x1 x2
y1 y2
= det
x1 y1
x2 y2
.
In der rechten Matrix sind die Vektoren als Zeilen eingetragen.
Obige Diskussion zeigt:
Flächeninhalt
Die reelle Zahl det(v, w) ist die orientierte Fläche des von den Vektoren v
und w aufgespannten Parallelogramms. Weiter ist |det(v, w)|/2 die Fläche
des Dreiecks mit den Ecken 0, v, w.
© Oliver Deiser
Einführung in die Mathematik 1
378
4. Abschnitt
Ebene und Raum
Vorzeichen
Für alle v, w P R2 gilt:
det(v, w)
{
> 0
= 0
< 0
falls (v, w) positiv orientiert,
falls (v, w) kollinear,
falls (v, w) negativ orientiert.
Zusammenhang mit Skalarprodukt
Für alle v, w P R2 gilt:
det(v, w) = v1 w2 − v2 w1
= ⟨(v1 , w1 ), (w2 , −v2 )⟩ = ⟨v, rot−π/2 (w)⟩
= ⟨(−w1 , v1 ), (v2 , w2 )⟩ = ⟨rotπ/2 (v), w⟩.
Trigonometrische Funktionen
Ist ϕ = ](v, w), so gilt
⟨v, w⟩
= cos ϕ iv i i wi,
|det(v, w)|
= sinϕ i v i i wi.
Für normierte Vektoren v und w gilt
cos ϕ = ⟨v, w⟩, sin ϕ =
|det(v, w)|.
Die Werte cos ϕ, sin ϕ, tan ϕ, cot ϕ lassen sich also aus den Koordinaten von
v und w leicht berechnen. Insbesondere sind diese trigonometrischen
Werte rationale Wurzelausdrücke, wenn die Koordinaten von v und y
rational sind. Quadratwurzeln entstehen dabei durch Normierung.
Linearkombinationen und Koordinatenvektoren
In dem von zwei Vektoren v und w der Ebene aufgespannten Parallelogramm
P = { λ v + µ w | λ, µ P [ 0, 1 ] } ⊆ R2
sind die Skalare auf das Intervall [ 0, 1 ] beschränkt. Lassen wir diese Beschränkung fallen, so erhalten wir folgenden Begriff:
Definition (Spann, Linearkombination)
Seien v, w P R2 . Dann heißt
span(v, w) = { λ v + µ w | λ, µ P R }
der Spann von v und w. Für alle λ, µ P R heißt der Vektor λ v + µ w eine
Linearkombination von v und w.
Einführung in die Mathematik 1
© Oliver Deiser
2. Die Euklidische Ebene
379
Die folgende Tabelle gibt einen Überblick der Möglichkeiten.
v,w
span(v, w)
det(v, w)
nicht kollinear
R2
≠0
kollinear, v ≠ 0
{ λv | λ P R }
0
kollinear, w ≠ 0
{ λw | λ P R }
0
kollinear, v = w = 0
{0}
0
Der linken Spalte entsprechend ist der Spann zweier Vektoren der Ebene also
die ganze Ebene, eine Gerade durch den Nullpunkt oder die Menge, die nur den
Nullpunkt als Element enthält. In jedem Fall ist der Nullpunkt ein Element des
Spanns (da 0 = 0 v + 0 w), sodass der Spann stets von der leeren Menge verschieden ist.
Von Interesse sind die Skalare λ,µ einer Linearkombination u = λ v + µw von v
und w. Wir definieren hierzu:
Definition (Koordinaten, Koordinatenvektor)
Seien v, w P R2 nicht kollinear, u P R2 und λ, µ P R mit
u = λ v + µ w.
Dann heißen λ, µ die Koordinaten von u bzgl. v, w. Wir nennen (λ, µ) P R2
auch den Koordinatenvektor des Vektors u bzgl. der Basis (v, w).
Die Koordinaten sind in der Tat eindeutig bestimmt (Übung), sodass es gerechtfertigt ist, von den Koordinaten bzgl. v, w zu reden.
u
w
v
Der Vektor u = −2v + 3w hat den Koordinatenvektor (−2, 3) bzgl. der Basis (v, w)
© Oliver Deiser
Einführung in die Mathematik 1
380
4. Abschnitt
Ebene und Raum
Koordinatenvektoren lassen sich durch Vergleich mit der für jeden Vektor u
der Ebene gültigen Darstellung
u = u1 e1 + u2 e2 mit e1 = (1, 0), e2 = (0, 1)
illustrieren. Diese Darstellung zeigt, dass u = (u1 , u2 ) der Koordinatenvektor von
u bzgl. der Basis (e1 , e2 ) ist. Allgemein gibt ein Koordinatenvektor (λ,µ) die Position von u an, wenn das übliche Basissystem (e1 , e2 ) durch ein beliebiges Basissystem (v, w) ersetzt wird, das aus zwei nicht kollinearen Vektoren besteht:
u = λ v + µ w.
Bei Koordinaten ist die Reihenfolge der Basisvektoren zu beachten. Sind λ,µ die
Koordinaten von u bzgl. v, w, so sind µ, λdie Koordinaten von u bzgl. w, v.
Koordinatenvektoren sind nur für nicht kollineare Vektoren definiert. Zwei
Vektoren v, w P R2 sind nach obigen Ergebnissen genau dann nicht kollinear,
wenn det(v, w) ≠ 0. Dies werden wir im Folgenden häufig verwenden.
Lineare Gleichungssysteme
Wir betrachten nun reelle lineare Gleichungssysteme mit zwei Gleichungen
und zwei Unbekannten (oder Unbestimmten). Ein solches System hat die Form
(+)
a x + b y = u1
c x + d y = u2
mit
Koeffizienten
a, b, c, d P R,
Unbekannten
x, y P R,
rechter Seite
u = (u1 , u2 ) P R2 ,
Lösungsmenge
L = { (x, y) P R2 | a x + b y = u1 , c x + d y = u2 }.
Ist L ≠ ∅, so heißt das System (+) lösbar. Andernfalls heißt es unlösbar. Besitzt die
Menge L genau ein Element, so heißt das System eindeutig lösbar.
Wir notieren im Folgenden Vektoren (v1 , v2 ) der Ebene oft als Spaltenvektoren,
d. h. in der Form
v1
.
v2
(v1 , v2 ) =
Damit können wir ein Gleichungssystem (+) schreiben als
(++)
x
a
c
+ y
b
d
=
u1
u2
= u.
In dieser Form ist besonders schön zu sehen, dass auf der linken Seite LinearEinführung in die Mathematik 1
© Oliver Deiser
2. Die Euklidische Ebene
381
kombinationen der aus den Koeffizienten des Systems gebildeten Vektoren
v = (a, c) =
a
, w = (b, d) =
c
b
d
stehen, also Elemente des Spanns dieser beiden Vektoren. Mit Hilfe unserer Ergebnisse über Determinanten und Koordinaten erhalten wir:
Grundlegende Eigenschaften der Lösungsmenge
(1) L ≠ ∅ genau dann, wenn u = (u1 , u2 ) P span(v, w).
(2) Ist det(v, w) = a d − b c ≠ 0, so hat L genau ein Element (x, y). Genauer
ist dann (x, y) der Koordinatenvektor von u = (u1 , u2 ) bzgl. (v, w).
(3) Ist det(v, w) = 0, so kann L die Ebene, eine Gerade (nicht notwendig
durch 0) oder die leere Menge sein.
Die eindeutige Lösbarkeit des Systems ist also äquivalent dazu, dass die Determinante der Koeffizienten-Matrix
a
b
c
d
des Systems von Null verschieden ist. Die folgenden Beispiele illustrieren den
Fall einer verschwindenden Determinante.
Beispiele
(1) Sei v = w = 0. Für u = 0 ist L = R2 . Für u ≠ 0 ist L = ∅.
(2) Seien v = (1, 1), w = (−1, −1), d. h. wir betrachten ein System der Form
x − y = u1
x − y = u2
Für die rechte Seite u = (0, 0) ist L = { (x, x) | x P R } eine Gerade
durch 0. Für u = (−1, −1) ist L = { (x, x + 1) | x P R } eine Gerade durch
(0, 1). Für u = (0, 1) und allgemein für alle u mit u1 ≠ u2 ist L = ∅.
Im zweiten Beispiel fällt auf, dass die Lösungsgerade durch Änderung der
rechten Seite nur verschoben wird. Dieses Translationsphänomen ist in der Tat
allgemein gültig. Hierzu definieren wir:
Definition (homogen, inhomogen)
Ist die rechte Seite u = (u1 , u2 ) eines Gleichungssystems der Nullvektor, so
nennen wir das System homogen. Andernfalls heißt es inhomogen.
Ein homogenes Gleichungssystem ist immer lösbar, nämlich durch den Null-
© Oliver Deiser
Einführung in die Mathematik 1
382
4. Abschnitt
Ebene und Raum
vektor. Umgekehrt ist ein System, das durch den Nullvektor gelöst wird, homogen. Damit ist ein System genau dann homogen, wenn 0 P L.
Jedem System
(1)
a x + b y = u1
c x + d y = u2
können wir das homogene System
(2)
ax + by = 0
cx + dy = 0
zuordnen. Ist L die Lösungsmenge von (1), (x*, y*) P L beliebig und L0 die Lösungsmenge des zugeordneten homogenen Systems (2), so gilt (Übung):
L = (x*, y*) + L0 = { (x*, y*) + (x, y) | (x, y) P L0 }.
Man drückt diese fundamentale Tatsache auch so aus:
Lösung = spezielle Lösung + homogene Lösung
Die Lösungsmenge eines Systems ergibt sich durch Finden einer beliebigen
Lösung und der Lösungsmenge des zugehörigen homogenen Systems.
In L = (x*, y*) + L0 steht links eine Menge und rechts die Summe eines Vektors
und einer Menge. Genauer sollten wir also sagen:
Lösungsmenge = spezielle Lösung + homogene Lösungsmenge.
5
L
4
w
3
2
L0
v
1
-5
-4
-3
-2
-1
1
2
3
4
5
-1
-2
Die Lösungsmenge des Systems −x + 2y = 5, x − 2y = −5:
L = w + L0 = w + { λ v | λ P R } = (1, 3) + { λ (2, 1) | λ P R }
Die Lösungsmenge ist eine affine Gerade der Ebene.
Einführung in die Mathematik 1
© Oliver Deiser
2. Die Euklidische Ebene
383
w
1
0
1
2
3
Die Lösungsmenge des Systems x − y = 1, 2x − y = 3:
L = w + L0 = w + { 0 } = { w } = { (2, 1) }
Die Lösungsmenge besteht aus einem Punkt der Ebene.
Im Fall einer von Null verschiedenen Determinante der Koeffizienten-Matrix ist L = { (x*, y*) } und L0 = { 0 }. Ist L eine Gerade, so ist L0 eine Gerade
durch den Nullpunkt und L = (x*, y*) + L0 die um den Vektor (x*, y*) verschobene Gerade L0 , eine sog. affine Gerade der Ebene. Ist L die gesamte Ebene, so
gilt dies auch für L0 .
Aus der Lösbarkeit des homogenen Systems folgt keineswegs die Lösbarkeit
des inhomogenen Systems (speziell kann L0 = R2 und L = ∅ gelten). Ist aber das
inhomogene System lösbar, so hat seine Lösungsmenge bis auf eine Verschiebung die geometrische Form der Lösungsmenge des homogenen Systems.
Wir fassen zusammen:
Struktur der Lösungsmenge eines linearen Gleichungssystems
Für die Lösungsmenge L eines linearen Gleichungssystems mit zwei
Gleichungen und zwei Unbekannten sind folgende Fälle möglich:
1. Fall: Die Determinante der Koeffizientenmatrix ist von Null verschieden
In diesem Fall besitzt L genau ein Element. Die eindeutige Lösung ist
genau dann gleich 0, wenn das System homogen ist.
2. Fall: Die Determinante der Koeffizientenmatrix ist gleich Null
In diesem Fall gilt genau eine der folgenden Aussagen:
(a) L ist leer. Das System ist notwendig inhomogen.
(b) L ist eine affine Gerade. Diese Gerade verläuft genau dann durch
Null, wenn das System homogen ist.
(c) L ist die gesamte Ebene.
Der Fall 2(c) darf als Sonderfall gelten: Ist L = R2 , so liegt das homogene Nullsystem vor, dessen Koeffizienten alle gleich Null sind.
© Oliver Deiser
Einführung in die Mathematik 1
384
4. Abschnitt
Ebene und Raum
Algebraische Kurven ersten und zweiten Grades
Ist G = G(u) = { λu | λ P R } die von einem Vektor u ≠ 0 der Ebene erzeugte
Gerade, so besteht G aus genau den Vektoren des R2 , die senkrecht auf dem
Vektor u ⊥ = rotπ/2 (u) stehen. Setzen wir also (a, b) = u ⊥ = (−u2 , u1 ), so gilt (a,
b) ≠ 0 und
G = { v P R2 | ⟨u ⊥ , v⟩ = 0 }
= { (x, y) P R2 | ax + by = 0 }.
(Orthogonaldarstellung einer Geraden)
Ist nun w P R2 und H = w + G = { w + λu | λ P R } eine affine Gerade, die nicht
durch den Nullpunkt verläuft, so sind die Vektoren u, w nicht kollinear. Folglich
sind u ⊥ und w nicht orthogonal. Setzen wir also
s = ⟨u ⊥ , w⟩ = a w1 + b w2 , c = −s,
so gilt s, c ≠ 0 und wir erhalten die Darstellung
H = { v P R | ⟨u ⊥ , v⟩ = s } = { (x, y) P R2 | ax + by = s }
= { (x, y) P R2 | ax + by + c = 0 }.
Es ist bemerkenswert, dass sich eine affine Gerade als Menge aller Vektoren
schreiben lässt, für die das Skalarprodukt mit einem gewissen Vektor einen konstanten Wert s ergibt. Dem konstanten Wert s = 0 entsprechen Geraden durch 0,
eine Änderung von s bewirkt eine Parallelverschiebung.
Umgekehrt ist leicht zu sehen, dass jede Gleichung der Form ax + by + c = 0
mit (a, b) ≠ 0 in den Unbestimmten x, y eine affine Gerade definiert, die genau
dann durch den Nullpunkt verläuft, wenn c = 0. Wir halten die Lösungen derartiger bivariater Gleichungen in einer Definition fest:
Definition (algebraische Kurve ersten Grades)
Eine Menge C ⊆ R2 heißt eine algebraische Kurve ersten Grades, falls es
a, b, c P R gibt mit (a, b) ≠ 0 und
C = { (x, y) P R2 | ax + by + c = 0 }.
Wir sagen dann, dass die Kurve C durch die Gleichung ax + bx + c = 0
definiert wird.
Da a ≠ 0 oder b ≠ 0 gilt, können wir eine definierende Gleichung einer Kurve
C hinsichtlich x oder y normieren. Ist c ≠ 0, so können wir durch c dividieren und
damit die Konstante der Gleichung normieren.
Obige Überlegungen zeigen:
Satz (Klassifikation der algebraischen Kurven ersten Grades)
Die algebraischen Kurven ersten Grades sind genau die affinen Geraden
der Ebene.
Einführung in die Mathematik 1
© Oliver Deiser
2. Die Euklidische Ebene
385
Deutlich komplizierter werden die Verhältnisse, wenn wir bivariate Gleichungen zweiten Grades betrachten:
Definition (algebraische Kurve zweiten Grades)
Eine Menge C ⊆ R2 heißt eine algebraische Kurve zweiten Grades, falls es
a, b, c, d, e, f P R gibt mit (a, b, c) ≠ 0 und
C = { (x, y) P R2 | a x2 + b y2 + c x y + d x + e y + f = 0 }.
Wir sagen dann wieder, dass die Kurve C durch die Gleichung der
Mengendefinition definiert wird.
Algebraische Kurven zweiten Grades sind uns schon oft begegnet. In der folgenden Tabelle geben wir definierende Gleichungen für die Kurven an.
Beispiele für algebraischen Kurven zweiten Grades
x2 + y2 − 1 = 0
Einheitskreis
x2 + y2 − r2 = 0
2
zentrischer Kreis mit Radius r
2
2
(x − x0 ) + (y − y0 ) − r = 0
2
x −y = 0
2
2
2
Einheitsparabel
2
x /a + y /b − 1 = 0
2
Kreis mit Radius r und Mittelpunkt (x0 , y0 )
achsenparallele Ellipse mit Halbachsen a, b
2
x −y −1 = 0
Einheitshyperbel
xy − 1 = 0
Hyperbel, Graph von f : R* → R, f(x) = 1/x
10
5
x2 - x y - y 2 + 1
0
0
-x2 - x y - y 2 - 6 y
x2 + 5 x - 2 y
0
0
-5
-10
-10
-5
0
5
10
Algebraische Kurven zweiten Grades (Kegelschnitte)
© Oliver Deiser
Einführung in die Mathematik 1
386
4. Abschnitt
Ebene und Raum
Man kann zeigen, dass die algebraischen Kurven zweiter Ordnung genau die
(beliebig skalierten, gedrehten und verschobenen) Ellipsen, Parabeln und Hyperbeln der Ebene sind, wobei noch einige Sonderfälle zu beachten sind (für
eine durch x2 + c = 0 definierte Kurve C ist zum Beispiel C die leere Menge,
falls c > 0, C die y-Achse, falls c = 0 und C ein Geradenpaar, falls c < 0). Aus
Sicht der klassischen Geometrie sind die algebraischen Kurven zweiten Grades
die Kegelschnitte, also die Figuren der Ebene, die wir durch den Schnitt eines
unendlichen Doppelkegels mit einer Ebene des Raumes erhalten. Dieser Klassifikationssatz ist keineswegs leicht zu zeigen, und wir begnügen uns an dieser
Stelle mit den obigen Beispielen und der Schilderung der Ergebnisse. Aus Sicht
der klassischen Geometrie sind die algebraischen Kurven zweiten Grades die
Kegelschnitte, also die Figuren der Ebene, die wir durch den Schnitt eines unendlichen Doppelkegels mit einer Ebene des Raumes erhalten. Dieser Klassifikationssatz ist keineswegs leicht zu zeigen, und wir begnügen uns an dieser
Stelle mit den obigen Beispielen und der Schilderung der Ergebnisse.
Der Leser wird sich fragen, wie es weitergeht. Algebraische Kurven dritten
Grades werden durch Gleichungen der Form
a1 x3 + a2 y3 + a3 x2 y + a4 x y2 + a5 x2 + a6 y2 + a7 x y + a8 x + a9 y + a10 = 0
definiert, wobei einer der ersten vier Koeffizienten von Null verschieden sein
muss. Es ergibt sich eine sehr reichhaltige Kurvenwelt, zu der insbesondere das
repräsentative Gebiet der elliptischen Kurven gehört. Diese spezielleren Kurven
dritten Grades werden definiert durch Gleichungen der Form
y2 = x3 + ax + b.
4
2
x3 - x - y 2
0
0
x3 - x - y 2 + 1
x3 - 3 x - y 2 + 2
0
0
-2
-4
-4
-2
0
2
4
Elliptische Kurven
Einführung in die Mathematik 1
© Oliver Deiser
2. Die Euklidische Ebene
387
Übungen
Übung 1
Sei v P R2 . Zeigen Sie ohne Verwendung der Winkelformel, dass
⟨v, rot± π/2 (v)⟩ = 0.
Übung 2
In einem Dreieck ABC mit Seiten a, b, c und Winkeln α, β, γ gilt:
a2 = b2 + c2 − 2 cos(α) b c.
(Kosinussatz)
Geben Sie einen trigonometrischen Beweis des Kosinussatzes mit Hilfe des
Satzes von Pythagoras.
Übung 3
Illustrieren Sie den Beweis der Winkelformel mit Hilfe des Kosinussatzes
durch Diagramme.
Übung 4
Seien v, w P R2 . Zeigen Sie, dass die folgenden Aussagen äquivalent sind:
(a) Die Vektoren v, w sind nicht kollinear.
(b) ∀λ, µ P R (λ v + µ w = 0 → λ = µ = 0).
Übung 5
Sei u P R2 . Für welche Vektoren v P R2 gilt pru (v) = u? Zeichnen Sie ein
erklärendes Diagramm.
Übung 6
Zeigen Sie, dass für alle u, v P R2 gilt:
(i) pru (u) = u,
(ii) pru (pru (v)) = pru (v),
(iii) ⟨pru (v), u⟩ = ⟨v, u⟩,
(iv) prv (pru (v)) = cos2 (ϕ) v, falls v, w ≠ 0 und ϕ = ](u, v).
Zeichnen Sie ein Diagramm zur Illustration von (iv) und ergänzen Sie es,
sodass die Größen cosn (ϕ) für n ≥ 1 sichtbar werden. Nehmen Sie dabei an,
dass u und v normiert sind.
Übung 7
Wie lässt sich mit Hilfe der Koordinaten dreier Punkte der Ebene
möglichst einfach feststellen, ob die drei Punkte auf einer gemeinsamen
Geraden (nicht notwendig durch 0) liegen?
© Oliver Deiser
Einführung in die Mathematik 1
388
4. Abschnitt
Ebene und Raum
Übung 8
Illustrieren Sie die positive bzw. negative Orientierung zweier Vektoren der
Ebene durch Diagramme.
Übung 9
Untersuchen Sie die Wirkung von Rotationen, Spiegelungen am Nullpunkt
und Spiegelungen an Geraden durch den Nullpunkt auf die Orientierung
zweier Vektoren der Ebene.
Übung 10
Zeigen Sie, dass für alle v, w, v1 , v2 , w1 , w2 P R2 und alle λ P R gilt:
(i) det(e1 , e2 ) = 1,
(ii) det(v, v) = 0,
(iii) det(v, w) = − det(w, v),
(iv) det(λ v, w) = det(v, λ w) = λ det(v, w),
(v) det(v1 + v2 , w) = det(v1 , w) + det(v2 , w),
det(v, w1 + w2 ) = det(v, w1 ) + det(v, w2 ).
Übung 11
Illustrieren Sie den Begriff des Koordinatenvektors (λ, µ) eines Vektors
u P R2 bzgl. einer Basis (v, w) durch Diagramme. Argumentieren Sie
anschaulich, warum jeder Vektor u der Ebene einen eindeutigen Koordinatenvektor bzgl. (v, w) besitzt und warum die Forderung „v, w sind nicht
kollinear“ notwendig ist.
Übung 12
Seien v, w P R2 nicht kollinear.
(a) Zeigen Sie, dass span(v, w) = R2 .
(b) Sei u P R2 . Beweisen Sie, dass u einen eindeutigen Koordinatenvektor (λ, v) bzgl. der Basis (v, w) besitzt.
Übung 13
Sei L die Lösungsmenge eines linearen Gleichungssystems der Form (+),
und sei L0 die Lösungsmenge des zugeordneten homogenen Systems.
Weiter sei (x*, y*) P L0 . Zeigen Sie:
L = (x*, y*) + L0 = { (x*, y*) + (x, y) | (x, y) P L0 }.
Einführung in die Mathematik 1
© Oliver Deiser
2. Die Euklidische Ebene
389
Übung 14
Zeigen Sie, dass für ein lineares Gleichungssystem der Form (+) die
folgenden Aussagen äquivalent sind:
(a) L = R2 ,
(b) a = b = c = d = u1 = u2 = 0.
Übung 15
(a) Sei (x*, y*) P R2 beliebig. Geben Sie ein lineares Gleichungssystem
an mit L = { (x*, y*) }.
(b) Sei G ⊆ R2 eine beliebige Gerade der Ebene (nicht notwendig
durch den Nullpunkt). Geben Sie ein lineares Gleichungssystem an
mit L = G.
(c) Geben Sie ein lineares Gleichungssystem an mit L = ∅ und L0 = R2 .
Alle Gleichungssysteme sollen hierbei die Form (+) haben, als aus zwei
Gleichungen mit zwei Unbekannten bestehen.
Übung 16
Sei u P R2 normiert, und sei G = G(u) = { λu | λ P R }. Weiter sei w P R2
orthogonal zu u, und es sei H = w + G die durch w und G definierte affine
Gerade. Schließlich sei s = ⟨w, u ⊥ ⟩ mit u ⊥ = rotπ/2 (u).
(a) Erklären die die Darstellung H = { v P R2 | ⟨u ⊥ , v⟩ = s } geometrisch
mit Hilfe der Winkelformel für das Skalarprodukt. Welche
Bedeutung haben die Länge und das Vorzeichen von s?
(b) Sei nun w′ P H beliebig und s′ = ⟨u ⊥ , w′⟩. Zeigen Sie, dass s = s′ und
illustrieren Sie die Situation durch ein Diagramm.
Übung 17
Welche algebraischen Kurven zweiten Grades werden durch Gleichungen
der folgenden Formen definiert?
(a) a x2 + b x2 = 0
(b) a x2 − b y2 = 0
(c) a x2 + c = 0
(d) b y2 + c = 0
© Oliver Deiser
Einführung in die Mathematik 1
3. (2 × 2)-Matrizen
Matrizen sind rechteckige Gebilde aus Zahlen (zumeist reell oder komplex). Wir
können sie als Erweiterung des Begriffs einer endlichen Folge (a1 , …, an ) ins
Zweidimensionale auffassen. Für alle natürlichen Zahlen m, n ≥ 1 hat eine reelle
(m × n)-Matrix die Form
A =
a1,1
a1,2
…
a1,n
a2,1
a1,2
…
a2,n
…
…
…
…
am,1
a1,2
…
am,n
mit Einträgen ai,j P R für 1 ≤ i ≤ m, 1 ≤ j ≤ n. Matrizen tauchen in der Mathematik
an vielen Stellen auf, und ihre vielfältigen Einsatzmöglichkeiten lassen sich genauso wenig in einem Satz beschreiben wie die der endlichen Folgen. In der linearen Algebra werden sie vor allem zur Beschreibung linearer Abbildungen und
zur Lösung linearer Gleichungssysteme eingesetzt. In diesem Kapitel stellen wir
einige grundlegende Dinge für den einfachen, aber bereits sehr reichhaltigen
Fall n = m = 2 zusammen. Im Sinne von Abbildungen und Gleichungssystemen
bleiben wir damit bei unserer Untersuchung der Ebene R2 .
© Oliver Deiser
Einführung in die Mathematik 1
392
4. Abschnitt
Ebene und Raum
Matrizen und ihre Einträge
Definition (2×2-Matrizen)
Eine doppelt indizierte Folge reeller Zahlen der Form (a1,1 , a1,2 , a2,1 , a2,2 )
heißt eine reelle 2 × 2-Matrix. Wir notieren eine Matrix A in den Formen
a1,1 a1,2
A =
a2,1 a2,2
=
a11 a12
a21 a22
= (aij )1 ≤ i,j ≤ 2 = (aij )i, j .
Die Elemente a11 , a12 , a21 , a22 heißen die Einträge der Matrix A. Weiter
heißen a11 und a22 die Diagonaleinträge, (a11 , a22 ) die (Haupt-) Diagonale und
a11 + a22 die Spur von A. Ist a12 = a21 = 0, so heißt A eine Diagonalmatrix.
Wir setzen
A(i, j) = aij für alle 1 ≤ i, j ≤ 2.
Die Vektoren (a11 , a12 ), (a21 , a22 ) P R2 heißen die Zeilenvektoren von A, die
Vektoren (a11 , a21 ), (a12 , a22 ) P R2 die Spaltenvektoren von A. Wir setzen
R2 × 2 = { A | A ist eine reelle 2 × 2-Matrix }.
Bei einer quadratischen Matrix-Darstellung werden zwischen den Einträgen
keine Kommata gesetzt. In den Indizes können wir „i, j“ oder kürzer „ij“ schreiben, solange klar ist, dass keine Multiplikation i ⋅ j vorliegt.
Formal kann man eine 2 × 2-Matrix als eine Funktion von
{ 1, 2 } × { 1, 2 } = { (1, 1), (1, 2), (2, 1), (2, 2) }
nach R auffassen, die als Folge oder Familie
(a(1,1) , a(1,2) , a(2,1) , a(2,2) ) = (a1,1 , a1,2 , a2,1 , a2,2 )
notiert wird: ai, j ist der Funktionswert an der Stelle (i, j). Im Umgang mit Matrizen tritt dieser formale Aspekt in den Hintergrund. Wichtig sind die quadratische Darstellung und die Eigenschaften der Operationen mit Matrizen.
In der indizierten Form
A =
a11 a12
a21 a22
ist der erste Index immer ein Zeilenindex und der zweite Index immer ein
Spaltenindex. Der Eintrag A(i, j) = aij der Matrix A steht in der i-ten Zeile und der
j-ten Spalte von A. Da 2×2-Matrizen nur vier Einträge besitzen, geben wir sie oft
an in der Form
A =
a
b
c
d
.
Einführung in die Mathematik 1
© Oliver Deiser
3. (2 × 2)-Matrizen
393
Es gilt dann automatisch A(1, 1) = a11 = a, …, A(2, 2) = a22 = d. Der Leser vergleiche dies mit der Vektornotation v = (x, y) = (v1 , v2 ) P R2 .
Konvention: Strichpunkt und Komma
Jedes Paar von Vektoren der Ebene lässt sich als 2 × 2-Matrix auffassen. Um
Zeilen und Spalten zu unterscheiden, verwenden wir ein Komma bzw.
einen Strichpunkt: Sind v, w P R2 , so ist A = (v, w) die 2 × 2 Matrix mit den
Zeilenvektoren v und w und B = (v; w) die 2 × 2-Matrix mit den Spaltenvektoren v und w.
Der Unterschied zwischen den Matrizen A = (v, w) und B = (v; w) lässt sich
durch folgende Operation beschreiben:
Definition (Transposition, symmetrisch)
Sei A P R2 × 2 . Dann ist die zu A transponierte Matrix At definiert durch
At (i, j) = A(j, i) für alle 1 ≤ i, j ≤ 2.
Gilt A = At , so heißt A symmetrisch.
Die zu A transponierte Matrix entsteht durch Spiegelung an der Hauptdiagonalen. Wegen At (1, 1) = A(1, 1) und At (2, 2) = A(2, 2) hat At die gleiche Diagonale
wie A. Die beiden anderen Einträge sind vertauscht:
At (1, 2) = A(2, 1), At (2, 1) = A(1, 2).
Ist A = (v, w), so ist At = (v; w). Ist umgekehrt A = (v; w), so ist At = (v, w). Für alle
A gilt (At )t = A. Die Symmetrie einer Matrix A ist durch A(1, 2) = A(2, 1) charakterisiert; die Diagonaleinträge sind beliebig.
Beispiele
((1, 2), (3, 4)) = ((1, 3); (2, 4)) =
1
0
0
1
0
1
1
0
1
0
0
2
0
1
2
0
© Oliver Deiser
,
,
,
,
1
0
0
2
0
1
2
0
1
2
2
4
2
1
4
2
1
2
3
4
,
sind Diagonalmatrizen,
sind keine Diagonalmatrizen,
sind symmetrisch,
sind nicht symmetrisch.
Einführung in die Mathematik 1
394
4. Abschnitt
Ebene und Raum
Zwei wichtige spezielle Matrizen sind:
Definition (Nullmatrix, Einheitsmatrix)
Die Nullmatrix 0 P R2 × 2 und die Einheitsmatrix E2 P R2 × 2 sind definiert
durch
0 = ((0, 0); (0, 0)) =
0
0
0
0
, E2 = ((1, 0); (0, 1)) =
1
0
0
1
.
Beide Matrizen sind symmetrisch, sodass wir die Strichpunkte in der Definition auch durch Kommata ersetzen könnten. Die Einträge der Nullmatrix sind
alle gleich 0. Bei der Einheitsmatrix sind die Diagonaleinträge gleich 1, die anderen Einträge gleich 0. Die Zeilen und Spalten von E2 bestehen aus den kanonischen Einheitsvektoren e1 = (1, 0) und e2 = (0, 1) der Ebene. Wir werden gleich
sehen, dass die Nullmatrix die additive Rolle der Null und die Einheitsmatrix die
multiplikative Rolle der Eins übernimmt.
Wir führen noch eine Notation ein, die nicht nur bei Umgang mit Matrizen
nützlich ist:
Notation: Kronecker-Delta
Für zwei Indizes i, j ist das Kronecker-Delta δij definiert durch
δij =
{
1
0
falls i = j
falls i ≠ j.
Die bei einem Kronecker-Delta verwendeten Indizes i, j sind dabei beliebige
mathematische Objekte. Für reelle Zahlen x,y ist zum Beispiel δxx = 1 und δxy = 0,
falls x ≠ y. Die durch δx0 definierte Funktion f : R → R ist genau an der Stelle 0
gleich 1 und für alle reellen Zahlen x ≠ 0 gleich 0.
Die Einheitsmatrix E2 P R2 × 2 lässt sich mit Hilfe des Kronecker-Deltas nun
definieren durch
E2 (i, j) = δij für alle 1 ≤ i, j ≤ 2.
Schließlich führen wir noch eine Notation für Diagonalmatrizen ein:
Notation
Für alle d1 , d2 P R setzen wir
diag(d1 , d2 ) =
d1
0
0 d2
.
Damit gilt 0 = diag(0, 0) und E2 = diag(1, 1).
Einführung in die Mathematik 1
© Oliver Deiser
3. (2 × 2)-Matrizen
395
Addition und Skalierung von Matrizen
Matrizen lassen sich in natürlicher Weise addieren und skalieren:
Definition (Addition von Matrizen)
Seien A, B P R2 × 2 . Dann setzen wir
A+B =
a11 a12
a21 a22
+
b11 b12
b21 b22
=
a11 + b11
a12 + b12
a21 + b21
a22 + b22
.
Die Matrix A + B P R2 × 2 heißt die Summe der Matrizen A und B.
Definition (Subtraktion von Matrizen)
Seien A, B P R2 × 2 . Dann setzen wir
−A =
−a11 −a12
−a21 −a22
,
A − B = A + (−B).
Die Matrix A − B P R2 × 2 heißt die Differenz der Matrizen A und B.
Definition (Skalierung von Matrizen)
Seien A P R2 × 2 und λ P R. Dann setzen wir
λA = λ
a11 a12
a21 a22
=
λa11 λa12
λa21 λa22
.
Die Matrix λ A P R2 × 2 heißt das Produkt der Matrix A mit dem Skalar λ.
Es gelten alle vertrauten Rechenregeln. Einige davon sind:
Satz (Rechenregeln für Matrizen)
Für alle A, B, C P R2 × 2 und λ, µ P R gilt:
(a) A + (B + C) = (A + B) + C,
(b) A + 0 = 0 + A = A,
(c) A + (− A) = (− A) + A = 0,
(d) A + B = B + A,
(e) 1 A = A, − A = (− 1) A,
(f ) λ (A + B) = λ A + λ B,
(g) λ (µ A) = (λ µ) A = µ (λ A).
© Oliver Deiser
Einführung in die Mathematik 1
396
4. Abschnitt
Ebene und Raum
Das Matrix-Vektor-Produkt
Als nächstes führen wir ein Produkt einer Matrix A mit einem Vektor (x, y) der
Ebene ein. Wir vereinbaren hierzu:
Konvention
Einen Vektor (x, y) notieren bei einer Multiplikation mit einer Matrix in
Spaltenform. Anders formuliert: Wir fassen (x, y) als (2 × 1)-Matrix mit
zwei Zeilen und einer Spalte auf.
Damit können wir nun definieren:
Definition (Matrix-Vektor-Produkt)
Seien A P R2 × 2 und v = (x, y) P R2 . Dann setzen wir
A v = A (x, y) =
a
b
x
c
d
y
=
ax + by
P R2 .
cx + dy
Der Vektor A v P R2 heißt das Matrix-Vektor-Produkt von A mit v.
Beispiele
(a)
(b)
1 2
1
3 4
2
1 2
1
3 4
0
=
=
5
11
1
3
,
,
1 3
1
2 4
2
1 2
0
3 4
1
=
=
7
10
2
4
.
.
Allgemein gilt für alle A = (v; w) = ((a, b), (c, d)) P R2 × 2 :
A e1 = v = (a, c), A e2 = w = (b, d).
(Spaltenextraktion)
Die Multiplikation mit den Einheitsvektoren liefert also die Spaltenvektoren einer Matrix. Die Zeilen erhalten wir durch Transposition:
At e1 = (a, b), At e2 = (c, d).
(Zeilenextraktion)
Die Einträge einer Matrix A lassen sich mit Hilfe des Euklidischen Skalarprodukts gewinnen:
⟨e1 , Ae1 ⟩ = a11 , ⟨e1 , Ae2 ⟩ = a12 ,
⟨e2 , Ae1 ⟩ = a21 , ⟨e2 , Ae2 ⟩ = a22 .
(Extraktion der Einträge)
Es gilt also ⟨ei , Aej ⟩ = aij für alle i, j.
Einführung in die Mathematik 1
© Oliver Deiser
3. (2 × 2)-Matrizen
397
Matrizen als Abbildungen
Sei A P R2 × 2 . Dann können wir das Matrix-Vektor-Produkt als Abbildung
von R2 nach R2 auffassen: Jedem v P R2 wird der Vektor
fA (v) = Av P R2
zugeordnet. Wir werden den Sichtweise „Matrizen als Abbildungen“ und
die Abbildungen fA : R2 → R2 später genauer untersuchen. Für jetzt genügt
es, den funktionalen Zusammenhang zwischen v und Av bei festgehaltener
Matrix A wahrzunehmen. So können wir zum Beispiel sagen, dass v auf Av
abgebildet wird, oder dass A gewisse Abbildungseigenschaften besitzt.
Die vielleicht wichtigste Eigenschaft des Produkts ist:
Satz (Linearität des Matrix-Vektor-Produkts)
Sei A P R2 × 2 . Dann gilt für alle v, w P R2 und λ, µ P R:
A(λ v + µ w) = λ A v + µ A w.
Der Leser verifiziere dies durch Nachrechnen.
Zusammenhang mit linearen Gleichungssystemen
Das Matrix-Vektor-Produkt lässt sich durch lineare Gleichungssysteme illustrieren. Ein System
(+)
a x + b y = u1
c x + d y = u2
können wir mit Hilfe des Produkts notieren als
a
b
x
c
d
y
=
u1
u2
= u.
Ist A die Koeffizientenmatrix des Systems, so gilt
L = { v P R2 | A v = u }.
Das System (+) selbst können wir damit sehr kompakt angeben als
A (x, y) = u.
(Matrix-Form eines linearen Gleichungssystems)
Ist A = ((a, b), (c, d)) P R(2 × 2) , so ist die Determinante
det(A) = ad − bc = ⟨(a, b), (d, −c)⟩ = ⟨(a, b), rot−π/2 (c, d)⟩
= ad − cb = ⟨(a, c), (d, −b)⟩ = ⟨(a, c), rot−π/2 (b, d)⟩
genau dann gleich Null, wenn die Zeilenvektoren (gleichwertig: Spaltenvektoren) von A kollinear sind. Das lineare Gleichungssystem A (x, y) = u ist genau
dann eindeutig lösbar, wenn det(A) ≠ 0.
© Oliver Deiser
Einführung in die Mathematik 1
398
4. Abschnitt
Ebene und Raum
Die Struktur „Lösung = spezielle Lösung + homogene Lösung“ der Lösungsmenge eines lösbaren Systems können wir in der Matrizenformulierung sehr elegant beweisen. Denn seien L = { v | A v = u }, L0 = { v | Av = 0 } und v* P L. Dann
gilt für alle v die Äquivalenzenkette
vPL
genau dann, wenn
Av = u
genau dann, wenn
Av − Av* = u − u
genau dann, wenn
A(v − v*) = 0
genau dann, wenn
v − v* P L0
genau dann, wenn
v P v* + L0 .
Linearkombinationen der Spalten
Sei A P R2×2 . Für alle v = (x, y) P R2 ist Av eine Linearkombination der Spalten
von A, da
Av =
a
b
x
c
d
y
=
ax + by
cx + dy
= x
a
c
b
+ y
d
.
Umgekehrt ist auch jede Linearkombination der Spalten von A von der Form Av.
Ist also A = ((a, c); (b, d)), so gilt
span((a, c), (b, d)) = { Av | v P R2 }.
Ist det(A) ≠ 0, so ist v der Koordinatenvektor von A v bzgl. der Basis (a, c), (b, d),
die aus den Spaltenvektoren von A gebildet ist.
Zusammenhang mit dem Euklidischen Skalarprodukt
Das Matrix-Vektor-Produkt Av mit v = (x, y) können wir mit Hilfe des Euklidischen Skalarprodukts in der folgenden Form schreiben:
Av =
a
b
x
c
d
y
=
ax + by
cx + dy
=
⟨(a, b), v⟩
⟨(c, d), v⟩
.
Wir lesen ab, dass A v genau dann gleich 0 ist, wenn v auf beiden Zeilenvektoren
von A senkrecht steht. Allgemeiner liegt Av auf der x-Achse (y-Achse), wenn v
auf der zweiten (ersten) Zeile von A senkrecht steht.
Eine weitere sehr wichtige Eigenschaft ist:
Satz (Seitenwechsel im Skalarprodukt)
Sei A P R2 × 2 . Dann gilt ⟨v, Aw⟩ = ⟨At v, w⟩ für alle v, w P R2 .
Der Leser beweise diese Eigenschaft durch Nachrechnen. Ist A symmetrisch,
so gilt also ⟨v, Aw⟩ = ⟨Av, w⟩ für alle A P R2 × 2 und v, w P R2 .
Einführung in die Mathematik 1
© Oliver Deiser
3. (2 × 2)-Matrizen
399
Die Matrizenmultiplikation
Mit Hilfe des Matrix-Vektor-Produkts führen wir nun eine Multiplikation für
Matrizen ein:
Definition (Produkt zweier Matrizen)
Seien A, B P R2 × 2 , und sei B = (b1 ; b2 ). Dann setzen wir
A ⋅ B = (A b1 ; A b2 ).
Die Matrix A ⋅ B P R2 × 2 heißt das Produkt der Matrizen A und B.
Wir erhalten also die Produktmatrix A ⋅ B, indem wir die beiden Matrix-Vektor-Produkte Ab1 und Ab2 als Spalten in eine Matrix schreiben. In Langform notiert ergibt sich
A⋅B =
a11 a12
a21 a22
=
⋅
b11 b12
b21 b22
a11 b11 + a12 b21
a11 b12 + a12 b22
a21 b11 + a22 b21
a21 b12 + a22 b22
.
Die Berechnung lässt sich kompakt als Zeile mal Spalte zusammenfassen.
Notation
Wir schreiben auch kurz A B statt A ⋅ B.
Beispiele
(1) 1 2
1 3
3 4
2 4
1 0
0 0
0 0
0 1
1 1
2 −1
1 2
−1 1
0 1
0 1
1 0
1 0
(2)
(3)
(4)
© Oliver Deiser
=
=
=
=
5 11
11 25
0
0
0
0
1
0
0
1
1
0
0
1
= 0
= E2
= E2
Einführung in die Mathematik 1
400
4. Abschnitt
Ebene und Raum
Das Matrizenprodukt lässt sich auch mit Hilfe der Summennotation elegant beschreiben. Für das Produkt C = AB zweier Matrizen A und B gilt nach Definition
cij = ∑ 1 ≤ k ≤ 2 aik bkj
für alle 1 ≤ i, j ≤ 2.
Dabei durchläuft aik die i-te Zeile von A, während bkj die j-te Spalte von B durchläuft.
Die Matrizenmultiplikation lässt sich durch ein kombiniertes lineares Gleichungssystem illustrieren (Übung):
Komposition von Gleichungssystemen
Seien A, B P R2 × 2 , u P R2 . Das kombinierte Gleichungssystem
B (x, y) = (x′, y′), A (x′, y′) = u
wird von (x, y) P R2 genau dann gelöst, wenn
(A B) (x, y) = u.
Durch Nachrechnen zeigt man:
Satz (Eigenschaften der Matrizenmultiplikation)
Für alle A, B, C P R2 × 2 und alle v = (x, y) P R2 gilt:
(a) A (Bv) = (AB) v,
(b) A (BC) = (A B) C,
(Assoziativität)
(c) A E2 = E2 A = A,
(Neutralität von E2 )
(d) A (B + C) = A B + A C, (A + B) C = A C + B C.
(Distributivität)
Der Leser hat vielleicht die Kommutativität A B = B A in der Liste vermisst.
Diese ist aber im Allgemeinen nicht gültig:
Beispiele
(1) 1 0
1 1
1 1
0 1
1 1
1 0
0 1
1 1
a b
0 1
c d
1 0
0 1
a b
1 0
c d
(2)
Einführung in die Mathematik 1
=
=
=
=
1 1
1 2
2 1
1 1
b
a
d
c
c
d
a
b
(Spaltentausch)
(Zeilentausch)
© Oliver Deiser
3. (2 × 2)-Matrizen
401
Ist A = (v; w), so ist die Determinante von A definiert als det(A) = det(v, w).
Nachrechnen zeigt den folgenden wichtigen Satz:
Satz (Multiplikationssatz für Determinanten)
Seien A, B P R2 × 2 . Dann gilt det(AB) = det(A) det(B).
Beispiel
Seien
A =
1 1
−1 2
, B =
1 2
2 −1
, C = AB =
3 1
3 −4
Dann gilt det(A) = 3, det(B) = −5 und det(C) = −15 = det(A) det(B).
Schließlich definieren wir noch:
Definition (Potenzen für Matrizen)
Sei A P R2 × 2 . Dann setzen wir:
A0 = E2 , A1 = A, A2 = A A, A3 = A2 A, …
Beispiele
(1) Sei A = ((1, 0); (1, 1)). Dann gilt
A2 =
1 1
1 1
0 1
0 1
=
1 2
0 1
, A3 =
1 3
0 1
, …
(2) Für die Matrix
A =
0 1
1 0
erhalten wir die periodischen Potenzen
A2 = E2 , A3 = A, A4 = E2 , …, A2n = E2 , A2n + 1 = A, …
(3) Für die Matrix
A =
0 1
0 0
gilt A2 = 0 und allgemein An = 0 für alle n ≥ 2.
Wiederholte Anwendung des Multiplikationsssatzes für Determinanten ergibt, dass det(An ) = det(A)n für alle n ≥ 1 gilt. Aus der Assoziativität der Matrizenmultiplikation folgt
An Am = An + m = Am An für alle n, m P N.
© Oliver Deiser
Einführung in die Mathematik 1
402
4. Abschnitt
Ebene und Raum
Matrizen als lineare Abbildungen
Wir verfolgen nun das Motiv, dass eine Matrix A vermöge „v wird abgebildet
auf Av“ eine Abbildung der Ebene in sich selbst definiert, genauer. Hierzu definieren wir den grundlegenden Begriff einer linearen Abbildung f : R2 → R2 und
zeigen, dass die linearen Abbildungen den durch die Matrizen definieren Abbildungen entsprechen. Die Matrizenmultiplikation entspricht dabei der Komposition von Abbildungen. Wir erinnern an:
Definition (zugeordnete Abbildung)
Sei A P R2 × 2 . Dann ist die Abbildung fA : R2 → R2 definiert durch
fA (v) = A v für alle v P R2 .
Die Abbildung fA heißt die der Matrix A zugeordnete Abbildung.
Wir haben schon verwendet, dass für alle A P R2 × 2 , Vektoren v, w P R2 und
Skalare λ, µ P R gilt:
A (λ v + µ w) = λ A v + µ A w, d. h.
fA (λ v + µ w) = λ fA (v) + µ fA (w).
Speziell gilt für alle v = (x, y) P R2 :
fA (v) = Av = A(x, y) = A(xe1 + ye2 ) = x Ae1 + y Ae2 .
Der Funktionswert fA (v) ist also eine Linearkombination der Spaltenvektoren
Ae1 und Ae2 der Matrix A. Die Skalare der Kombination sind die Komponenten
von v. Damit können wir die Abbildungseigenschaften einer Matrix mit nichtverschwindender Determinante veranschaulichen:
Visualisierung der Abbildungsdynamik einer Matrix A
Wir zeichnen die Spaltenvektoren von A in eine Diagramm ein und fassen
sie als neue Basisvektoren auf. Dadurch erzeugen wir ein neues Koordinatengitter. Für alle v = (x, y) ist Av der Punkt des Gitters mit den Koordinaten (x, y).
Ist die Determinante von A gleich 0, so sind die Spaltenvektoren von A kollinear. Wir können sie erneut in ein Diagramm einzeichnen, aber die beiden Vektoren erzeugen nun nur noch den Nullpunkt (im Fall A = 0) oder eine Gerade in
der Ebene (im Fall A ≠ 0).
Daneben stehen uns alle Visualisierungsmöglichkeiten zur Verfügung, die wir
für eine Funktion von C nach C diskutiert haben. Denn fA : R2 → R2 ist eine Abbildung der Ebene in sich selbst. Beispielsweise können wir versuchen, die Wirkung von fA durch Pfeile von v nach Av für einige v zu veranschaulichen.
Einführung in die Mathematik 1
© Oliver Deiser
3. (2 × 2)-Matrizen
403
A(-2, 3)
Ae2
Ae1
A(-1, -3/2)
A(2, -4)
Eine Matrix A mit det(A) ≠ 0 verformt das kartesische Gitter zu einem neuen Gitter.
Mit Hilfe des neuen Gitters können wir die Vektoren fA (v) = A v bestimmen.
Beispiele
(1) Für die Nullmatrix 0 ist f0 (v) = 0 P R2 für alle v P R2 , d. h. f0 bildet
jeden Vektor der Ebene auf den Nullvektor der Ebene ab.
(2) Für die Einheitsmatrix E2 gilt fE2 (v) = v für alle v P R2 , sodass die
zugeordnete Abbildung die Identität auf R2 ist.
(3) Sei A = ((1, 0); (0, 0)). Dann gilt Av = (v1 , 0) für alle v P R2 . Die
Abbildung fA ist also die orthogonale Projektion eines Vektors v auf die
x-Achse, d. h. es gilt fA = pre1 .
Die Abbildung fA : R2 → R2 erlaubt eine neue Sicht auf ein lineares Gleichungssystem: Die Lösungsmenge eines linearen Gleichungssystems A v = u ist
das Urbild der Menge { u } unter der Abbildung fA . Genau diejenigen Vektoren
der Ebene, die durch fA auf u abgebildet werden, lösen das Gleichungssystem.
Die Urbildmenge einer einelementigen Menge ist auch als Faser der Abbildung
bekannt. Damit ist also L die Faser von u unter der Abbildung fA .
Der enge Zusammenhang zwischen A und fA wird weiter vertieft durch:
Satz (Matrizenmultiplikation als Komposition)
Für alle A, B P R2 × 2 gilt f A B = f A + f B .
Der Beweis des Satzes sei dem Leser zur Übung empfohlen. Wichtig ist die Reihenfolge der Komposition: f A B = f A + f B , aber f B A = f B + f A .
© Oliver Deiser
Einführung in die Mathematik 1
404
4. Abschnitt
Ebene und Raum
Lineare Abbildungen
Wir betrachten nun allgemein:
Definition (lineare Abbildung)
Eine Abbildung f : R2 → R2 heißt linear, falls für alle v, w P R2 und alle
λ, µ P R gilt:
f(λ v + µ w) = λ f(v) + µ f(w).
(Linearitätsbedingung)
Alle Abbildungen der Form fA : R2 → R2 sind linear. Der folgende grundlegende Satz besagt, dass es keine weiteren Beispiele gibt:
Satz (Hauptsatz über lineare Abbildungen und Matrizen)
Sei f : R2 → R2 linear. Dann gibt es genau ein A P R2 × 2 mit f = fA .
Beweis
zur Existenz:
Wir setzen A = (f(e1 ); f(e2 )), d. h. die Spalten von A sind die Bilder der
kanonischen Basisvektoren e1 und e2 unter f. Dann gilt A e1 = f(e1 ) und
A e2 = f(e2 ). Folglich gilt für alle v = (x, y) P R2 :
fA (v) = fA (x e1 + y e2 ) = x fA (e1 ) + y fA (e2 )
= x f(e1 ) + y f(e2 ) = f(x e1 + y e2 ) = f(v).
zur Eindeutigkeit:
Seien A, B P R2 × 2 mit fA = f = fB . Dann gilt
A e1 = fA (e1 ) = fB (e1 ) = B e1 ,
sodass die erste Spalte von A mit der ersten Spalte von B übereinstimmt.
Anlog zeigt eine Multiplikation mit e2 , dass die zweiten Spalten der
Matrizen A und B übereinstimmen. Damit gilt A = B.
Mit Hilfe des Ergebnisses lässt sich die Assoziativität der Matrizenmultiplikation elegant aus der Assoziativität der Komposition von Abbildungen folgern.
Für alle Matrizen A, B, C gilt
fA(BC) = fA + (fBC ) = fA + (fB + fC ) = (fA + fB ) + fC = fAB + fC = f(AB)C .
Aus der Eindeutigkeit der Darstellung folgt A(BC) = (AB)C. Damit wird der Beweis durch Nachrechnen durch ein Argument vom höheren Standpunkt ergänzt.
Wichtig ist nicht nur der Satz, sondern sein Beweis:
Wir können die darstellende Matrix einer linearen Abbildung finden, indem wir
die Bilder der kanonischen Basisvektoren bestimmen und als Spalten in eine Matrix schreiben.
Wir betrachten einige Beispiele hierzu.
Einführung in die Mathematik 1
© Oliver Deiser
3. (2 × 2)-Matrizen
405
Projektionsmatrizen
Sei u P R2 mit u ≠ 0. Dann ist die orthogonale Projektion pru : R2 → R2 ,
die einen Vektor v auf pru (v) = ⟨û, v⟩ û abbildet, linear. Wir nehmen zur
Vereinfachung der Notation an, dass u normiert ist. Dann gilt
pru (e1 ) = ⟨u, e1 ⟩ u = u1 u = (u1 2 , u1 u2 ),
pru (e2 ) = ⟨u, e2 ⟩ u = u2 u = (u1 u2 , u2 2 ).
Damit erhalten wir die symmetrische Matrix
Au =
u1 2
u1 u2
u1 u2
u2 2
als darstellende Matrix. Matrizen dieser Form heißen Projektionsmatrizen.
Wir können diese Matrizen auch anders gewinnen, indem wir schreiben
pru (v) = ⟨u, v⟩ u = (u1 v1 + u2 v2 )
u1
u2
=
u1 2
u1 u2
u1 u2
u2
v1
2
v2
.
Eine Projektionsmatrix Au besitzt die Determinante 0. Alle Vektoren der
Ebene werden durch Au auf die von u erzeugte Gerade abgebildet.
3
2
1
-3
-2
-1
1
2
3
-1
-2
-3
Die Projektion Au auf den Vektor u = (2, 2/3) visualisiert als Pfeildiagramm.
Mit λ = 1/10 gilt û = £λ(3, 1), Au e1 = λ (3, 9) und Au e2 = λ (3, 1).
© Oliver Deiser
Einführung in die Mathematik 1
406
4. Abschnitt
Ebene und Raum
Rotationsmatrizen
Sei ϕ P R. Die Abbildung rotϕ : R2 → R2 , die einen Vektor v P R2 um
einen Winkel ϕ gegen den Uhrzeigersinn dreht, ist linear. Es gilt
f(e1 ) = (cos ϕ, sin ϕ), f(e2 ) = rotπ/2 (f(e1 )) = (−sin ϕ, cos ϕ).
Für die darstellende Matrix Aϕ = Arotϕ gilt also
Aϕ =
cosϕ
−sinϕ
sinϕ
cosϕ
.
Ae1
Ae2
e1
A(-2, -1)
1
0.5
-1
-0.5
0.5
1
-0.5
-1
Die Rotation A = Aϕ um den Winkel ϕ = 2π/7
Einführung in die Mathematik 1
© Oliver Deiser
3. (2 × 2)-Matrizen
407
Weitere wichtige Beispiele sind die Punktspiegelung am Nullpunkt und die
Spiegelungen an Geraden durch den Ursprung. Wir diskutierenden die darstellenden Matrizen dieser Abbildungen in den Übungen.
Durch den Übergang von A zu fA können wir die Determinante einer Matrix
A anschaulich interpretieren: In den Spalten von A stehen die Bilder der kanonischen Basisvektoren. Die Basisvektoren e1 und e2 spannen ein Parallelogramm
der Fläche 1 auf (ein Quadrat). Ihre Bilder fA (e1 ) und fA (e2 ) unter fA spannen ein
Parallelogramm der signierten Fläche det(A) auf, wobei wir eine negative Fläche
als negative Orientierung der Bildvektoren interpretieren. Damit können wir zusammenfassen:
Die Determinante einer Matrix A ist ein Maß für die von der linearen Abbildung fA bewirkte Flächenverzerrung.
Diese Verzerrung kann durch die Skalierung der Basisvektoren, durch die Veränderung des eingeschlossenen rechten Winkels und durch die Umkehr der Orientierung entstehen.
1.5
det(A)
Ae2
1
0.5
Ae1
0.5
1
1.5
Die Determinante einer Matrix A als Maß für die Flächenverzerrung
Beispiele
(1) Eine Projektion erzeugt ein degeneriertes Parallelogramm. Die
Determinante einer Projektionsmatrix ist 0.
(2) Eine Rotation erhält sowohl die Fläche als auch die Orientierung. Die
Determinante einer Rotationsmatrix ist 1.
© Oliver Deiser
Einführung in die Mathematik 1
408
4. Abschnitt
Ebene und Raum
Allgemeine Abbildungseigenschaften von Matrizen
Wir haben gesehen, dass zwischen linearen Abbildungen und Matrizen eine
eindeutige Beziehung besteht. Im Folgenden identifizieren wir, wo immer es die
Sprechweise erleichtert, eine Matrix A P R2 × 2 mit der zugeordneten Abbildung
f A : R2 → R2 .
Um die Abbildungseigenschaften einer Matrix A weiter zu beschreiben, betrachten wir die Wirkung von A auf geometrische Figuren der Ebene: Ist P ⊆ R2 ,
so wird jeder Punkt v von P durch A auf Av abgebildet. Sammeln wir alle Punkte
Av, so erhalten wir ein neues geometrisches Gebilde:
Definition (Bild einer Menge unter einer Matrix)
Sei A P R2 × 2 . Dann setzen wir
A[ P ] = { Av | v P P } für alle P ⊆ R2 .
Wir nennen die Menge A[ P ] das Bild von P unter A.
Ein exemplarisches Ergebnis ist, dass eine Matrix eine affine Gerade in eine affine Gerade überführt:
Satz (Bilder von Geraden unter linearen Abbildungen)
Seien A P R2 × 2 und G = w + span(v) eine affine Gerade im R2 . Dann ist
A[ G ] die affine Gerade Aw + span(Av).
Beweis
A[ G ] = { A(w + λv) | λ P R } = { Aw + λAv | λ P R } = Aw + span(Av).
G
A[G]
Aw
w
v
Av
Die Transformation einer affinen Geraden unter einer Matrix A
Einführung in die Mathematik 1
© Oliver Deiser
3. (2 × 2)-Matrizen
409
Allgemein zeigt das Argument, dass
A[ v + P ] = Av + A [ P ] für alle v P R2 und P ⊆ R2 .
Das Ergebnis lässt sich vielfach verallgemeinern. So wird die Strecke
S = { v + λ (w − v) | λ P [ 0, 1 ] }
zwischen zwei Punkten v, w P R2 durch eine Matrix A auf die Strecke
A[ S ] = { Av + λ (Aw − Av) | λ P [ 0, 1 ] }
abgebildet, die die Bildpunkte Av und Aw verbindet. Damit werden Dreiecke in
Dreiecke übersetzt (die genau dann degeneriert sind, wenn die Determinante
von A gleich 0 ist). Seitenlängen, Winkel und Orientierung können dabei verändert werden. Ebenso wird ein Parallelogramm mit den Punkten p1 , p2 , p3 , p4 in
das Parallelogramm mit den Bildpunkten q1 = Ap1 , …, q4 = Ap4 überführt (denn
der einer Ecke gegenüberliegende Punkt errechnet sich linear aus den anderen
Punkten). Rechtecke werden genau dann in Rechtecke überführt, wenn die Spaltenvektoren von A aufeinander senkrecht stehen. Und Quadrate genau dann in
Quadrate, wenn die Spaltenvektoren von A orthogonal zueinander und zudem
normiert sind. Derartige Matrizen werden wir im nächsten Kapitel untersuchen.
Nachdem Quadrate auf Parallelogramme abgebildet werden, ist zu vermuten,
dass ein in ein Quadrat einbeschriebener Kreis auf eine Ellipse abgebildet wird,
die das Parallelogramm in den Mittelpunkten seiner Seiten tangential berührt.
Diese Vermutung ist richtig, aber nicht mehr so leicht zu zeigen. Weiter sind die
Halbachsen der Ellipse weder in ihrer Länge noch in ihrer Richtung einfach zu
berechnen. Wir werden die Frage im nächsten Kapitel aufgreifen und eine vertiefte Analyse innerhalb der Eigenwerttheorie geben.
A(1, 1)
3
2
Ae2
Ae1
1
-4
-3
-2
E
-1
1
-1
2
3
4
A(1, -1)
-2
-3
Das Bild des Einheitskreises K und des umgebenden Quadrats unter A = ((3, 1); (1, 2)).
Die Halbachsenrichtungen und -längen der Ellipse E = A[ K ] sind nicht klar.
© Oliver Deiser
Einführung in die Mathematik 1
410
4. Abschnitt
Ebene und Raum
Übungen
Übung 1
Zeigen Sie, dass für alle A, B, C P R2 × 2 und λ, µ P R gilt:
(a) A + (B + C) = (A + B) + C,
(b) A + 0 = 0 + A = A,
(c) A + (− A) = (− A) + A = 0,
(d) A + B = B + A,
(e) 1 A = A, − A = (− 1) A,
(f ) λ (A + B) = λ A + λ B,
(g) λ (µ A) = (λ µ) A = µ (λ A).
Übung 2
Sei A P R2 × 2 . Zeigen Sie, dass für alle v, w P R2 und λ, µ P R gilt:
A(λ v + µ w) = λ A v + µ A w.
Übung 3
Sei A P R2 × 2 symmetrisch. Zeigen Sie, dass es eindeutig bestimmte λ P R
und B P R2 × 2 gibt mit den Eigenschaften:
A = λ E2 + B, spur(B) = 0.
Übung 4
Sei A P R2 × 2 gegeben mit det(A) = 0. Geben Sie ein v P R2 an mit v ≠ 0
und A v = 0.
Übung 5
Sei A P R2 × 2 . Zeigen Sie, dass für alle v, w P R2 gilt:
(a) ⟨v, Aw⟩ = ⟨At v, w⟩, ⟨Av, w⟩ = ⟨v, At w⟩,
(b) i A v i 2 = ⟨v, At Av⟩, i At v i 2 = ⟨v, A At v⟩.
Übung 6
Zeigen Sie, dass für alle A, B, C P R2 × 2 und v P R2 gilt:
(a) A (Bv) = (AB) v,
(b) A (BC) = (A B) C,
(c) A E2 = E2 A = A,
(d) A (B + C) = A B + A C, (A + B) C = A C + B C.
Einführung in die Mathematik 1
© Oliver Deiser
3. (2 × 2)-Matrizen
411
Übung 7
Seien A, B P R2 × 2 . Zeigen Sie, dass det(AB) = det(A) det(B).
Übung 8
(a) Sei A P R2 × 2 . Zeigen Sie, dass A At symmetrisch ist.
(b) Gilt immer At A = A At ?
Übung 9
Seien A, B P R2 × 2 . Zeigen Sie, dass (AB)t = Bt At .
Übung 10
Seien A, B P R2 × 2 , u P R2 . Wir betrachten das Gleichungssystem
(+) B (x, y) = (x′, y′), A (x′, y′) = u
(a) Notieren Sie das System in Variablenform.
(b) Zeigen Sie (wahlweise in Matrizen- oder Variablenform), dass
(x, y) P R2 genau dann eine Lösung von (+) ist, wenn (A B) (x, y) = u.
Übung 11
Zeigen Sie:
(a) Das Produkt zweier Diagonalmatrizen ist eine Diagonalmatrix.
(b) Das Produkt zweier symmetrischer Matrizen ist eine symmetrische
Matrix.
(c) Das Produkt zweier oberer (unterer) Dreiecksmatrizen ist eine obere
(untere) Dreiecksmatrix.
Dabei heißt eine Matrix A P R2 × 2 eine obere bzw. untere Dreiecksmatrix, falls
A(2, 1) = 0 bzw. A(1, 2) = 0.
Übung 12
Eine Matrix A P R2 × 2 heißt idempotent, falls A2 = A. Zeigen Sie:
(a) Jede Projektionsmatrix ist idempotent.
(b) Ist A idempotent und keine Diagonalmatrix, so ist spur(A) = 1.
Übung 13
(a) Geben Sie Beispiele für Matrizen A P R2 × 2 an mit A ≠ 0 und A2 = 0.
(b) Sei A P R2 × 2 mit A2 = 0. Zeigen Sie, dass spur(A) = 0.
(c) Sei A P R2 × 2 symmetrisch mit A ≠ 0. Zeigen Sie, dass A2 ≠ 0.
© Oliver Deiser
Einführung in die Mathematik 1
412
4. Abschnitt
Ebene und Raum
Übung 14
Seien A, B P R2 × 2 . Zeigen Sie, dass fA B = fA + fB .
Übung 15
Welche linearen Abbildungen werden durch Diagonalmatrizen, obere
Dreiecksmatrizen bzw. untere Dreiecksmatrizen beschrieben? Geben Sie
Beispiele und zeichnen Sie Diagramme zur Illustration.
Übung 16
Seien A, B P R2 × 2 Rotationsmatrizen. Dann gilt:
(+) A B = B A.
(a) Begründen Sie (+) anschaulich durch Betrachtung von Rotationen
der Ebene.
(b) Beweisen Sie (+) durch Berechnung der Produkte.
Übung 17
Seien ϕ, ψ P R und seien rotϕ , rotψ : R2 → R2 die Rotationen der Ebene
um die Winkel ϕ bzw. ψ. Neben Sie an, dass
rotϕ + rotψ = rotϕ + ψ
und leiten Sie hieraus mit Hilfe von Matrizen die Additionstheoreme für
den Kosinus und Sinus ab.
Übung 18
Sei f : R2 → R2 die Spiegelung am Nullpunkt. Bestimmen Sie die
darstellende Matrix A von f.
Übung 19
Sei u P R2 normiert und sei f : R2 → R2 die Spiegelung an der durch u
definierten Geraden durch den Nullpunkt. Bestimmen Sie die darstellende
Matrix A von f. Zeigen Sie zudem, dass A2 = E2 . Wie lässt sich diese
Eigenschaft anschaulich erklären?
Übung 20
Sei A P R2 × 2 . Zeigen Sie, dass die folgenden Aussagen äquivalent sind:
(a) Die Abbildung fA : R2 → R2 ist bijektiv, d. h. für alle u P R2 gibt es
genau v P R2 mit fA (v) = u.
(b) Die Abbildung fA : R2 → R2 ist surjektiv, d. h. für alle u P R2 gibt es
mindestens ein v P R2 mit fA (v) = u.
(c) Die Abbildung fA : R2 → R2 ist injektiv, d. h. für alle u P R2 gibt es
höchstens ein v P R2 mit fA (v) = u.
Einführung in die Mathematik 1
© Oliver Deiser
4. Invertierung und Orthogonalität
Wir setzen unsere Untersuchung der (2 × 2)-Matrizen fort. Zunächst betrachten wir inverse Matrizen, mit deren Hilfe wir eindeutig lösbare Gleichungssysteme mit variabler rechter Seite elegant lösen können. Wichtige Beispiele für
invertierbare Matrizen stellen die orthogonalen Matrizen dar, die sich durch
den Erhalt der Euklidischen Länge auszeichnen. Mit Hilfe der Invertierung
können zeigen wir elementar zeigen, dass eine Matrix einen Kreis in eine Ellipse überführt.
© Oliver Deiser
Einführung in die Mathematik 1
414
4. Abschnitt
Ebene und Raum
Das Inverse einer Matrix
Wir betrachten wieder ein lineares Gleichungssystem
(+)
a x + b y = u1
c x + d y = u2
das wir mit Hilfe des Matrix-Vektor-Produkts in der Form
(++)
A v = u, A = ((a, b), (c, d))
notieren. Es ist verführerisch, durch A zu „dividieren“, sodass wir v = A−1 u erhalten und damit das System durch eine einfache Matrix-Vektor-Multiplikation für
beliebige rechte Seiten u lösen können. Wir benötigen hierzu eine Matrix B mit
BA = E2 = AB. Dann gilt für alle u, v P R2 :
A v = u genau dann, wenn v = B u.
Denn ist A v = u, so ist
v = E2 v = BAv = Bu,
und ist v = Bu, so ist
Av = ABu = E2 u = u.
Diese Überlegungen motivieren:
Definition (invertierbar, invers, singulär)
Sei A P R2 × 2 . Gibt es ein B P R2 × 2 mit B A = E2 = B A, so heißt A invertierbar und B invers zu A. Andernfalls heißt A singulär.
Eine inverse Matrix ist im Fall der Existenz eindeutig bestimmt, denn sind B
und C invers zu A, so gilt
C = CE2 = C(AB) = (CA)B = E2 B = B.
Wir können deswegen folgende Notation einführen:
Notation
Ist A P R2 × 2 invertierbar, so bezeichnen wir das eindeutige Inverse von A
mit A−1 .
Für invertierbare A gilt also A A−1 = A−1 A = E2 . Während man für reelle und
komplexe Zahlen x ≠ 0 neben x−1 auch 1/x schreibt, ist für Matrizen die Bruchnotation 1/A mangels Kommutativität nicht üblich: B/A = B ⋅ 1/A ist im Allgemeinen von 1/A ⋅ B verschieden, was zu Fehlern führen kann, wenn der Kalkül der
Bruchnotation verwendet wird.
Beim Rechnen mit inversen Matrizen sind unentbehrlich:
Einführung in die Mathematik 1
© Oliver Deiser
4.
Invertierung und Orthogonalität
415
Satz (Inversenregeln)
Seien A,B P R2×2 invertierbar. Dann sind A−1 und AB invertierbar und es gilt
(A−1 )−1 = A, (A B)−1 = B−1 A−1 .
Beweis
Es gilt AA−1 = E2 = A−1 A, sodass nach Definition des Inversen A invers zu A−1
ist, d.h. (A−1 )−1 = A. Zur zweiten Regel berechnen wir
(B−1 A−1 ) (AB) = B−1 A−1 A B = B−1 E2 B = B−1 B = E2 .
Ebenso zeigt man, dass (AB)(B−1 A−1 ) = E2 . Damit ist B−1 A−1 invers zu AB.
Der Leser beachte, dass sich bei der Invertierung von AB die Reihenfolge umkehrt. Im Allgemeinen ist (AB)−1 ≠ A−1 B−1 .
Für Gleichungssysteme zeigt obige Überlegung:
Lösung durch Invertierung
Ist A invertierbar, so wird für alle rechten Seiten u das System A (x, y) = u
eindeutig durch den Vektor A−1 u gelöst.
Ist das System nicht eindeutig lösbar (d.h. det(A) = 0), so ist also A singulär. Im
eindeutig lösbaren Fall (d. h. det(A) ≠ 0) erweist sich umkehrt A als invertierbar,
sodass die eindeutige Lösbarkeit äquivalent zur Invertierbarkeit von A ist. Es gibt
verschiedene Möglichkeiten, dies zu zeigen. Eine davon verwendet:
Definition (Komplementärmatrix)
Sei A P R2 × 2 . Dann setzen wir
A# =
d −b
−c a
,
wobei A =
a
b
c
d
.
Die Matrix A# heißt die Komplementärmatrix von A.
Mit Hilfe der Komplementärmatrix können wir das Inverse einer Matrix im
Fall der Existenz leicht ermitteln und einen Zusammenhang zur Determinante
herstellen:
Satz (Komplementärmatrix und Determinante)
Sei A P R2 × 2 . Dann gilt:
(a) A# A = A A# = det(A) E2 .
(b) A ist genau dann invertierbar, wenn det(A) ≠ 0. In diesem Fall ist
A−1 = det(A)−1 A# .
© Oliver Deiser
Einführung in die Mathematik 1
416
4. Abschnitt
Ebene und Raum
Beweis
Es gilt
A A# =
a
b
d −b
c
d
−c a
=
ad − bc
ab − ab
cd − cd
ad − bc
= det(A) E2 .
Analog ist A# A = det(A) E2 . Ist det(A) ≠ 0, so ist det(A)−1 A# das Inverse von
A nach (a). Ist det(A) = 0, so ist A nach obigen Überlegungen nicht
invertierbar. Dies zeigt (b).
Zum Beweis von (b) kann man auch den Multiplikationssatz für Determinanten verwenden: Ist A invertierbar, so gilt
det(A) det(A−1 ) = det(AA−1 ) = det(E2 ) = 1,
sodass det(A) ≠ 0. Die Berechnung zeigt auch, dass det(A−1 ) = det(A)−1 .
Beispiel zur Invertierung
2 −1
Für A =
1
gilt det(A) = 3 und A# =
1
1
1
−1 2
,
sodass
A−1 =
1
3
1
1
−1 2
.
Ae2
Ae1
Be2
Be1
Die zu A und B = A−1 gehörigen Koordinatensysteme
Einführung in die Mathematik 1
© Oliver Deiser
4.
Invertierung und Orthogonalität
417
Beispiel zur Lösung eines Gleichungssystems durch Invertierung
Das Gleichungssystem
(+) x + y = 1
2 x + 3 y = −1
besitzt die Koeffizientenmatrix A = ((1, 2); (1, 3)) mit det(A) = 1. Damit ist
A invertierbar mit A−1 = det(A)−1 A# = A# , sodass
3 −1
A−1 = A# =
−2 1
.
Die eindeutige Lösung des Systems ist
A−1
1
=
−1
3 −1
1
−2 1
−1
=
4
−3
.
Der Vektor (4, −3) ist
(1) der Schnittpunkt der beiden durch die Gleichungen des Systems (+)
definierten Geraden,
(2) der Koordinatenvektor von (1, −1) bzgl. (Ae1 , Ae2 ),
(3) der Vektor mit den Koordinaten (1, −1) bzgl. A−1 e1 und A−1 e2 .
4
Ae2
3
2
Ae1
A-1 e2
1
-3
-2
-1
1
2
3
4
5
-1
-2
A-1 e1
-3
-4
Mit Hilfe von A−1 lässt sich das System (+) nun auch für beliebige andere
rechte Seiten ohne Neuberechnung lösen.
© Oliver Deiser
Einführung in die Mathematik 1
418
4. Abschnitt
Ebene und Raum
Charakterisierungen der Invertierbarkeit
Wir sammeln die Äquivalenzen, die im Verlauf unserer Untersuchungen aufgetreten sind oder sich aus ihnen mehr oder weniger direkt ergeben:
Satz (Äquivalenzen zur Invertierbarkeit)
Sei A P R2 × 2 . Dann sind äquivalent:
(a) A ist invertierbar.
(b) det(A) ≠ 0.
(c) Die Spalten von A sind nicht kollinear.
(d) Die Zeilen von A sind nicht kollinear.
(e) Für alle u ist das System Av = u eindeutig lösbar in v.
(f ) Für alle u ist das System Av = u lösbar in v.
(g) Das homogene System Av = 0 ist eindeutig lösbar (durch den
Nullvektor).
(h) Der Nullvektor ist der einzige Vektor, der durch fA : R2 → R2 auf
den Nullvektor abgebildet wird.
(i) fA : R2 → R2 ist injektiv.
(j) fA : R2 → R2 ist surjektiv.
(k) fA : R2 → R2 ist bijektiv.
Explizit hervorheben möchten wir noch:
Satz (einseitige Inverse genügen)
Sei A P R2 × 2 . Es gebe ein B P R2 × 2 mit AB = E2 . Dann ist A invertierbar
und es gilt B = A−1 . Eine analoge Aussage gilt, wenn ein C P R2 × 2 existiert
mit CA = E2 .
Beweis
Nach dem Multiplikationssatz für Determinanten gilt
1 = det(E2 ) = det(AB) = det(A) det(B),
sodass det(A) ≠ 0. Folglich ist A invertierbar. Weiter folgt aus der Voraussetzung AB = E2 , dass
B = E2 B = A−1 A B = A−1 E2 = A−1 .
Die Behauptung über linksseitige Inverse C wird analog bewiesen.
Einführung in die Mathematik 1
© Oliver Deiser
4.
Invertierung und Orthogonalität
419
Orthogonale Matrizen
Gilt A = (a1 , a2 ) und B = (b1 ; b2 ), so können wir das durch „Zeile mal Spalte“ gebildete Matrizenprodukt AB schreiben als
AB =
⟨a1 , b1 ⟩
⟨a1 , b2 ⟩
⟨a2 , b1 ⟩
⟨a2 , b2 ⟩
=
( ⟨ai, bj ⟩ )1 ≤ i, j ≤ 2.
Speziell gilt wegen At = (a1 ; a2 ), dass
A At =
⟨a1 , a1 ⟩
⟨a1 , a2 ⟩
⟨a2 , a1 ⟩
⟨a2 , a2 ⟩
.
Hieraus lesen wir ab:
(1) A At ist genau dann eine Diagonalmatrix, wenn die Spaltenvektoren von A
senkrecht aufeinander stehen.
(2) A At ist genau dann die Einheitsmatrix E2 , wenn die Spaltenvektoren von
A senkrecht aufeinander stehen und zudem normiert sind.
Im Fall (2) ist also A invertierbar und At invers zu A. Wir definieren:
Definition (orthogonal)
Eine Matrix A P R2 × 2 heißt orthogonal, wenn die Spaltenvektoren von A
orthogonal zueinander und normiert sind.
Eine Matrix A = (v1 , v2 ) ist also genau dann orthogonal, wenn ⟨vi , vj ⟩ = δij für
alle 1 ≤ i, j ≤ 2. Dabei ist δij wieder das Kronecker-Delta, also δij = 0 falls i ≠ j und
δij = 1, falls i = j.
Der folgende Satz gibt eine Reihe von Charakterisierungen der Orthogonalität:
Satz (Charakterisierungen der Orthogonalität)
Sei A P R2 × 2 . Dann sind äquivalent:
(a) A ist orthogonal.
(b) A−1 = At , d. h. A und At sind invers zueinander.
(c) At ist orthogonal, d. h. die Zeilenvektoren von A sind orthogonal und
normiert.
(d) Für alle v P R2 gilt i A v i = i v i.
(e) Für alle v, w P R gilt ⟨A v, A w⟩ = ⟨v, w⟩.
2
© Oliver Deiser
(Erhalt der Länge)
(Erhalt des Skalarprodukts)
Einführung in die Mathematik 1
420
4. Abschnitt
Ebene und Raum
Beweis
Die Äquivalenz von (a) und (b) haben wir oben schon gezeigt. Damit ist At
genau dann orthogonal, wenn At und (At )t = A invers zueinander sind, d. h.
wenn A orthogonal ist.
(b) impliziert (d): Es gelte A−1 = At . Dann gilt für alle v P R2 .
i Av i 2 = ⟨Av, Av⟩ = ⟨v, At A v⟩ = ⟨v, E2 v⟩ = ⟨v, v⟩ = i v i 2 .
(d) impliziert (e): Es gelte i A v i = i v i für alle v P R2 . Dann gilt für alle v, w
P R2 unter zweimaliger Verwendung der Polarisationsformel:
4 ⟨v, w⟩ = i v + w i 2 − i v − w i 2 = i A(v + w) i 2 − i A(v − w) i 2
= i A v + A w i 2 − i A v − A w i 2 = 4 ⟨Av, Aw⟩.
(e) impliziert (a): Gilt (e), so gilt ⟨A ei , A ej ⟩ = ⟨ei , ej ⟩ = δij für 1 ≤ i, j ≤ 2.
Damit sind die Spalten A e1 und A e2 von A orthogonal und normiert.
Die Orthogonalität einer Matrix ist nach dem Satz äquivalent dazu, dass das
Matrix-Vektor-Produkt das Skalarprodukt erhält. Daraus folgt, dass Längen und
Winkel erhalten bleiben. Während der Erhalt der Länge äquivalent zur Orthogonalität ist, ist der Erhalt der Winkel nicht hinreichend für die Orthogonalität.
Ist zum Beispiel A = 2E2 , also Av die Streckung von v um den Faktor 2, so bleiben
Winkel erhalten, aber A ist nicht orthogonal.
Ist A = (v; w) orthogonal, so ist v normiert und folglich gibt es ein ϕ P [ 0, 2π [
mit v = (cos ϕ, sin ϕ). Da w ebenfalls normiert ist und senkrecht auf v steht, gilt
w = rotπ/2 (v) oder w = rot−π/2 (v).
Damit ist
w = (−sin ϕ, cos ϕ) oder w = (sin ϕ, −cos ϕ).
Die Überlegung zeigt:
Satz (Klassifikation der orthogonalen Matrizen)
Sei A P R2 × 2 orthogonal. Dann gibt es ein ϕ P [ 0, 2π [ mit
A =
cos ϕ −sinϕ
sin ϕ
cosϕ
oder
A =
cos ϕ
sinϕ
sin ϕ −cosϕ
.
Im ersten Fall gilt det(A) = 1, im zweiten det(A) = −1.
Ist A orthogonal und det(A) = 1, so ist A v für alle v P R2 der um den Winkel ϕ
gedrehte Vektor v. Im Fall det(A) = −1 ist A v für alle v P R2 der an der Geraden
durch 0 mit Winkel ϕ/2 gespiegelte Vektor v (Übung). Wir nennen die Matrix A
entsprechend eine Rotationsmatrix oder Spiegelungsmatrix. Spiegelungsmatrizen
sind nicht nur orthogonal, sondern auch symmetrisch. Eine Rotationsmatrix ist
nur dann symmetrisch, wenn ϕ = 0 oder ϕ = π.
Einführung in die Mathematik 1
© Oliver Deiser
4.
Invertierung und Orthogonalität
e2
421
Ae1
/2
/2
e1
Ae2
A=
cos ϕ sinϕ
sin ϕ −cosϕ
bewirkt eine Spiegelung an der Geraden mit Winkel ϕ/2
Die Spiegelung an der Geraden mit Winkel ϕ/2 lässt sich auch auffassen als
eine Spiegelung an der x-Achse gefolgt von der Rotation um den Winkel ϕ. Denn
die Spiegelung an der x-Achse wird dargestellt durch die Matrix (e1 ; −e2 ) und es
gilt
cos ϕ −sinϕ
1
0
sin ϕ
0
−1
cosϕ
=
cos ϕ
sinϕ
sin ϕ −cosϕ
.
Das Produkt C = A B zweier orthogonaler Matrizen A und B ist stets wieder
eine orthogonale Matrix, da
Ct = (AB)t = Bt At = B−1 A−1 = (AB)−1 = C−1 .
Nach dem Multiplikationssatz für Determinanten ist C eine Rotation, wenn sowohl A und B von gleichen Typ sind (beide Rotationen oder beide Spiegelungen). Sind die Typen von A und B gemischt, so ist C eine Spiegelung. Mit Hilfe
der Additionstheoreme berechnet sich das Produkt zweier Spiegelungen zu
cos ϕ
sinϕ
sin ϕ −cosϕ
© Oliver Deiser
cos ψ
sinψ
sin ψ −cosψ
=
cos χ
sinχ
sin χ −cosχ
mit χ = ϕ − ψ.
Einführung in die Mathematik 1
422
4. Abschnitt
Ebene und Raum
Matrizen und Ellipsen, I
Wir zeigen nun so elementar wie möglich, dass das Bild des Einheitskreises
unter einer Matrix eine Ellipse ist.
Satz (Bild des Einheitskreises unter einer Matrix)
Sei A = ((a, c); (b, d)) = (u1 , u2 ) P R2 × 2 invertierbar, und sei K der Einheitskreis. Dann ist E = A[ K ] eine Ellipse. Es gilt die Kegelschnittdarstellung
(+) E = { (x, y) P R2 | (c2 + d2 )x2 − 2(ac + bd) x y + (a2 + b2 )y2 = det(A)2 }.
Beweis
Sei A−1 = det(A)−1 A# , mit A# = ((d, −b), (−c, a)). Dann gilt
E = { Av | v P K } = { v | A−1 v P K } = { v | i A−1 v i = 1 }.
Für alle v = (x, y) P R2 gilt
det(A)2 iA−1 vi 2 = iA# vi 2
= (dx − by)2 + (−cx + ay)2
= (c2 + d2 )x2 − 2(ac + bd) x y + (a2 + b2 )y2 .
Damit ist die Darstellung (+) von E gezeigt. Als ein in ein Parallelogramm
einbeschriebener Kegelschnitt ist E notwendig eine Ellipse.
Im nächsten Kapitel werden wir einen zweiten Beweis kennenlernen, der Kegelschnitte nicht heranzieht.
Die Ellipse E = A[ K ] ist genau dann achsenparallel, wenn die Zeilen der Matrix senkrecht aufeinander stehen (was nicht notwendig die Orthogonalität der
Spalten nach sich zieht), und genau dann ein Kreis, wenn zusätzlich ihre Längen
übereinstimmen.
Der singuläre Fall
Ist A singulär und R das K umgebende achsenparallele Quadrat, so ist A[ R ]
ein Geradenstück (ein degeneriertes Parallelogramm) und A [ K ] ein
Teilstück von A [ R ] (eine degenerierte Ellipse, bei der eine Halbachse 0 ist).
Die Darstellung (+) ist dann nicht mehr gültig. Für A = ((1, 0); (1, 0)) ist
zum Beispiel A[ R ] das Geradenstück auf der x-Achse von −2 bis 2 und A[ K ]
das Geradenstück auf der x-Achse von −£2 bis £2, während die Menge
{ (x, y) P R2 | 2y2 = 0 } in (+) die gesamte x-Achse ist.
Die folgenden Berechnungen gelten auch für det(A) = 0, und wir bezeichnen
zur Vereinfachung die Menge A [ K ] stets als Ellipse. Die Darstellung (+) wird
nicht benötigt.
Einführung in die Mathematik 1
© Oliver Deiser
4.
Invertierung und Orthogonalität
423
Bestimmung der Halbachsen
Die Halbachsen von E sind im Allgemeinen nicht durch Ae1 und Ae2 gegeben: Das Beispiel a = 2, b = −2, c = d = 1 zeigt, dass dies selbst für achsenparallele Ellipsen nicht gelten muss:
2
Ae2
-4
-3
Ae1
1
-2
-1
E
1
2
3
4
-1
-2
A[R]
Um die Lage von E zu bestimmen, durchlaufen wir den Einheitskreis K mit der
Funktion f : [ 0, 2π[ → K, f(t) = (cos t, sin t), und die Ellipse E = A[ K ] mit der
Funktion g : [ 0, 2π [ → E,
g(t) = A f(t) = A
cos t
sin t
=
a cos t + b sin t
c cos t + d sin t
.
Der Durchlauf der Ellipse startet im Punkt
g(0) = Ae1 = (a, c)
und verläuft über
g(π/2) = A e2 = (b, d), g(π) = −A e1 , g(3π/2) = −A e2 ,
sodass g(t) das Parallelogramm A[ R ] zu den Zeiten
0, π/2, π, 3π/2
berührt. Die Durchlaufrichtung entspricht der Orientierung der Spaltenvektoren von A. Bei den als Vektoren aufgefassten Halbachsen von E erreicht die Euklidische Norm von g(t) bzw. gleichwertig ihr Quadrat ein lokales Extremum.
Um die Nullstellen der Ableitung von i g(t) i 2 zu ermitteln, stellen wir diese
Norm zuerst in einer geeigneten Form dar. Unter Verwendung der Verdopplungsformeln
cos2 t − sin2 t = cos(2t), 2 cos t sin t = sin(2t), 2 cos2 t = cos(2t) + 1
berechnen wir
© Oliver Deiser
Einführung in die Mathematik 1
424
4. Abschnitt
Ebene und Raum
ig(t)i 2 = (a cos t + b sin t)2 + (c cos t + d sin t)2
= a2 cos2 t + 2ab cos t sin t + c2 cos2 t + 2cd cos t sin t + d2 sin2 t
= (a2 + c2 ) cos2 t + (b2 + d2 ) sin2 t + (ab + cd) sin(2t)
= (a2 + c2 − b2 − d2 ) cos2 t + (ab + cd) sin(2t) + b2 + d2
= (a2 + c2 − b2 − d2 )/2 cos(2t) + (ab + cd) sin(2t) + (a2 + b2 + c2 + d2 )/2
= τ + w1 cos(2t) + w2 sin(2t) = τ + ⟨w, f(2t)⟩,
wobei
(++)
a2 + c2 − b2 − d2
, w2 = ab + cd,
2
w1 =
τ =
a2 + b2 + c2 + d2
.
2
Damit können wir nun die Ableitung sehr einfach berechnen. Mit der Drehung
rot−π/2 (w) = (w2 , −w1 ) im Uhrzeigersinn ist
1
2
d
i g(t) i 2 = − w1 sin(2t) + w2 cos(2t) = ⟨rot−π/2 (w), f(2t)⟩.
dt
Im Fall w = 0 ist i g(t) i 2 konstant gleich τ und die Ellipse E ein Kreis mit Radius
£τ. Sei also w ≠ 0. Dann ist die berechnete Ableitung genau dann 0, wenn die
Vektoren rot−π/2 (w) und f(2t) orthogonal und damit w und f(2t) kollinear sind.
Seien also t1 , t2 derart, dass
f(2t1 ) = (cos(2t1 ), sin(2t1 )) = ŵ, f(2t2 ) = (cos(2t2 ), sin(2t2 )) = − ŵ.
Einsetzen in
i g(t) i 2 = τ + ⟨w, f(2t)⟩
zeigt, dass sich die Längen h1 und h2 der Halbachsen von E wie folgt berechnen
lassen:
(+++)
h1 = i g(t1 ) i = £τ + ⟨w, ŵ⟩ = £τ + i w i ,
h2 = i g(t2 ) i = £τ − ⟨w, ŵ⟩ = £τ − i w i .
Die Halbachsen von E werden zu den Zeiten
s1 = arg(σ w)/2 P [ 0, π/2 [, s2 = s1 + π/2, s3 = s1 + π, s4 = s2 + π
erreicht, wobei wir σ P { 1, −1 } so wählen, dass σ w im ersten oder zweiten Quadranten liegt (d.h. σ = 1 genau dann, wenn w2 ≥ 0). Dann sind t1 und t2 zwei dieser
Zeiten und die Halbachsen lassen sich darstellen als
g(s1 ) = A
cos s1
sin s1
= −A
Einführung in die Mathematik 1
cos s3
sin s3
, g(s2 ) = A
cos s2
sin s2
= −A
cos s4
sin s4
.
© Oliver Deiser
4.
Invertierung und Orthogonalität
425
Beispiel
Wir bestimmen die Ellipse E = A [ K ] der Matrix
A =
4
1
1
2
.
Mit obigen Bezeichnungen gilt:
w1 = 6, w2 = 5, τ = 11, i w i = 6£2,
s
s
h1 =
11 + 6£2 , 4,41, h1 =
11 − 6£2 , 1,59,
s1 = π/8, s2 = s1 + π/2.
3
Ae2 = g( /2)
2
g(s1 )
g(s2 )
h1
1
Ae1 = g(0)
h2
-5
-4
-3
-2
-1
1
E
2
3
4
5
-1
g(s3 )
-2
g(s4 )
-3
Verschiedene Matrizen können die gleiche Ellipse erzeugen. Die Ellipse E des
Beispiels können wir zum Beispiel auch erhalten, indem wir die achsenparallele
Ellipse mit den Halbachsenlängen h1 und h2 um das Argument ϕ von g(s1 ) gegen
den Uhrzeigersinn drehen. Damit ist E auch die Ellipse der Matrix
B =
cos ϕ
sinϕ
sin ϕ −cosϕ
h1
0
0
h2
=
h1 cos ϕ h2 sin ϕ
h1 sin ϕ −h2 cosϕ
.
Im Gegensatz zu A startet der Durchlauf gB von E bzgl. B in einem Halbachsenvektor, nämlich in Be1 = gA (s1 ).
s
© Oliver Deiser
Einführung in die Mathematik 1
426
4. Abschnitt
Ebene und Raum
Übungen
Übung 1
Lösen Sie sowohl durch Elimination als auch durch Invertierung der
Koeffizientenmatrix das Gleichungssystem
4x + 2 y = 1
2 x + 3 y = −1
Übung 2
Sei A P R2 × 2 . Zeigen Sie, dass A genau dann invertierbar ist, wenn
fA : R2 → R2 eine Umkehrfunktion besitzt, und dass in diesem Fall
fA−1 = (fA )−1 .
Übung 3
Geben Sie möglichst einfache Kriterien dafür an, wann eine Diagonalmatrix, eine obere Dreiecksmatrix bzw. eine untere Dreiecksmatrix invertierbar ist. Begründen Sie ihre Antwort und geben Sie Formeln für die
Inversen an.
Dabei heißt eine Matrix A P R2 × 2 eine obere (untere) Dreiecksmatrix, falls
a21 = 0 (a12 = 0).
Übung 4
Zeigen oder widerlegen Sie, dass für alle A, B, C P R2 × 2 gilt:
(a) Sind A, B invertierbar und ist C = A + B, so ist C invertierbar.
(b) Sind A, B invertierbar und ist C = AB, so ist C invertierbar.
(c) Ist C = A + B und ist C invertierbar, so sind A und B invertierbar.
(d) Ist C = AB und ist C invertierbar, so sind A und B invertierbar.
Übung 5
Sei A P R2 × 2 invertierbar. Zeigen Sie, dass At invertierbar ist mit
(At )−1 = (At )−1 .
Übung 6
Sei A P R2 × 2 eine symmetrische Matrix, deren Diagonaleinträge von Null
verschieden sind und unterschiedliche Vorzeichen haben. Zeigen Sie, dass
A invertierbar ist.
Einführung in die Mathematik 1
© Oliver Deiser
4.
Invertierung und Orthogonalität
427
Übung 7
Sei A P R2 × 2 . Zeigen Sie, dass die folgenden Aussagen äquivalent sind:
(a) A ist invertierbar.
(b) Es gibt ein n ≥ 1 derart, dass An invertierbar ist.
(c) Für alle n ≥ 1 ist An invertierbar.
Übung 8
Sei A P R2 × 2 invertierbar. Zeigen Sie, dass die Spaltenvektoren von A
genau dann positiv orientiert sind, wenn dies für A−1 gilt. Zeigen Sie
zudem, dass diese Äquivalenz auch für die Zeilenvektoren gilt.
Übung 9
Bestimmen Sie alle invertierbaren Matrizen A P R2 × 2 mit A = A−1 .
Übung 10
Seien A, B P R2 × 2 mit A = 2B − E2 . Zeigen Sie, dass die folgenden Aussagen
äquivalent sind:
(a) A2 = A (d. h. A = A−1 ).
(b) B2 = B.
Übung 11
Geben Sie eine Matrix A P R2 × 2 an, die orthogonale Zeilen und nicht
orthogonale Spalten besitzt.
Übung 12
Sei A = ((a, b), (c, d)) P R2 × 2 orthogonal, und sei ϕ P [ 0, 2π [ mit
(a, c) = (cos ϕ, sin ϕ).
Zeigen Sie, dass für alle v P R2 gilt:
(a) Ist det(A) = 1, so ist A v der um den Winkel ϕ (gegen den Uhrzeigersinn) gedrehte Vektor v.
(b) Ist det(A) = −1, so ist A v der an der Geraden durch 0 mit Winkel ϕ/2
gespiegelte Vektor v.
Übung 13
Sei A P R2 × 2 . Zeigen Sie, dass die folgenden Aussagen äquivalent sind:
(a) Die Spalten von A sind orthogonal und haben die gleiche Länge
λ>0.
(b) A ist winkeltreu, d. h. es gilt ](v, w) = ](Av, Aw) für alle v, w P R2
mit v, w ≠ 0.
© Oliver Deiser
Einführung in die Mathematik 1
428
4. Abschnitt
Ebene und Raum
Übung 14
Seien A und w wie bei der Analyse von E = A[ K ]. Zeigen Sie, dass
2 i w i 2 = ( (a + d)2 + (b − c)2 ) ( (a − d)2 + (b + c)2 ) .
Folgern Sie hieraus, dass die Längen der Halbachsen der zu A und At
gehörigen Ellipsen übereinstimmen.
Übung 15
Sei A = ((a, c); (b, d)) = (u1 , u2 ) P R2 × 2 invertierbar, und sei E = A[ K ] das
Bild des Einheitskreises unter A. Zeigen Sie:
E = { (x, y) P R2 | i At rotπ/2 (x, y) i 2 = det(A)2 }.
Übung 16
Sei A P R2 ×2 , und sei g : [ 0, 2π [ → E die betrachtete Parametrisierung der
Ellipse E = A[ K ]. Weiter seien g1 , g2 : [ 0, 2π [ → R definiert durch
(g1 (t), g2 (t)) = g(t) = A (cos t, sin t).
Berechnen Sie g′(t) = (g1 ′(t), g2 ′(t)) und zeigen Sie, dass der Vektor g′(t) zu
den Zeitpunkten 0, π/2, π und 3π/2 in Richtung der Seiten des E umschließenden Parallelogramms A[ R ] zeigt. Dabei ist R wieder das K umschließende achsenparallele Quadrat.
Einführung in die Mathematik 1
© Oliver Deiser
5. Eigenwerte und Spektralsatz
Wir untersuchen nun diejenigen vom Nullvektor verschiedenen Vektoren, die
bei der Multiplikation mit einer gegebenen Matrix nur skaliert werden, sodass
ihre Richtung abgesehen vom einem Vorzeichen unverändert bleibt. Vektoren
mit dieser Eigenschaft heißen Eigenvektoren der Matrix und die zugehörigen
Skalare ihre Eigenwerte. Ein fundamentales Ergebnis über Eigenvektoren und
Eigenwerte ist der Spektralsatz. Er besagt, dass jede symmetrische Matrix zwei
zueinander orthogonale Eigenvektoren besitzt. Aus dem Spektralsatz gewinnen
wir die Singulärwertzerlegung, mit deren Hilfe wir jede Matrix multiplikativ in
drei Matrizen aufspalten können, die die Abbildungsdynamik der Matrix übersichtlich und anschaulich beschreiben.
© Oliver Deiser
Einführung in die Mathematik 1
430
4. Abschnitt
Ebene und Raum
Eigenwerte und Eigenvektoren
Sei A P R2×2 . Für jeden Vektor v der Ebene ist Av wieder ein Vektor der Ebene
und zudem eine Linearkombination der Spaltenvektoren von A. Für manche
Vektoren v kann ein besonders einfacher Zusammenhang zwischen v und Av bestehen. Beispiele sind:
Av = v
Fixpunkt
Av = −v
Spiegelung am Nullpunkt
Av = rotπ/2 (v) = (−v2 , v1 )
Drehung um π/2 gegen den Uhrzeigersinn
Für die Theorie der Matrizen ist der Fall einer Skalierung, d. h.
A v = λv für ein λ P R,
von großer Bedeutung. Wir definieren:
Definition (Eigenwert, Eigenvektor, Eigenpaar)
Seien A P R2 × 2 , λ P R und v P R2 mit v ≠ 0. Dann heißt λ ein Eigenwert
und v ein zu λ gehöriger Eigenvektor von A, falls A v = λ v. Weiter heißt (λ, v)
ein Eigenpaar von A.
Ein Eigenwert kann der Skalar 0 sein, ein Eigenvektor ist nach Definition dagegen immer vom Nullvektor verschieden. Der Grund für diese Einschränkung
ist, dass A 0 = 0 = λ 0 für alle λ P R gilt, sodass jeder Skalar ein Eigenwert von A
wäre, wenn wir den Nullvektor als Eigenvektor zulassen würden.
Ist v ein Eigenvektor von A zum Eigenwert λ, so gilt
A(µv) = µ A v = µ λ v = λ (µ v) für alle µ P R,
sodass für µ ≠ 0 auch µv ein Eigenvektor von A zum Eigenwert λ ist. Insbesondere ist der normierte Vektor v̂ ein Eigenvektor von A zum Eigenwert λ.
3
Av = 2v
w
2
v
1
-5
-4
-3
-2
-1
1
2
3
4
5
-1
-2
Aw = -w
-3
(2, v) und (−1, w) sind Eigenpaare von A
Einführung in die Mathematik 1
© Oliver Deiser
5. Eigenwerte und Spektralsatz
431
Beispiele
(1) Für die Einheitsmatrix E2 ist jeder Vektor v ≠ 0 ein Eigenvektor zum
Eigenwert 1.
(2) Für eine Diagonalmatrix A = ((a, 0), (0, d) ist e1 ein Eigenvektor zum
Eigenwert a und e2 ein Eigenvektor zum Eigenwert d.
(3) Ist A eine Rotationsmatrix um den Winkel ϕ P ] 0, 2π [ mit ϕ ≠ π, so
hat A keine Eigenwerte und Eigenvektoren.
(4) Beschreibt A die Spiegelung an einer Geraden G(v) = span(v), so ist v
ein Eigenvektor von A zum Eigenwert 1 und rotπ/2 (v) = (−v2 , v1 ) ein
Eigenvektor von A zum Eigenwert −1.
(5) Ist Av = 0 und v ≠ 0, so ist v ein Eigenvektor zum Eigenwert 0. Damit
ist 0 genau dann ein Eigenwert von A, wenn A singulär ist.
Berechnung der Eigenwerte und Eigenvektoren
Sei nun A = ((a, b), (c, d)) P R2 × 2 . Wie stellt man fest, ob A Eigenwerte besitzt
und wie berechnet man Eigenwerte und Eigenvektoren im Fall der Existenz?
Wir beobachten hierzu, dass für alle λ P R und alle v P R2 gilt:
Av = λv genau dann, wenn (A − λE2 ) v = 0.
Setzen wir also
A λ = A − λ E2 =
a
b
c
d
−
λ
0
0
λ
=
a−λ
b
c
d−λ
für alle λ P R,
so ist λ genau dann ein Eigenwert von A, wenn das homogene Gleichungssystem
Aλ v = 0
eine vom Nullvektor verschiedene Lösung v besitzt, also nicht eindeutig lösbar
ist. Dies ist äquivalent dazu, dass det(A λ ) = 0. Für alle λ P R gilt:
det(A λ ) = (a − λ)(d − λ) − bc = λ2 − (a + d) λ + ad − bc
= λ2 − spur(A) λ + det(A).
Diese Überlegung motiviert:
Definition (charakteristisches Polynom)
Sei A P R2 × 2 . Dann heißt das Polynom pA : R → R zweiten Grades mit
pA (λ) = λ2 − spur(A) λ + det(A) für alle λ P R
das charakteristische Polynom von A.
Die Eigenwerte von A sind genau die reellen Nullstellen des charakteristischen Polynoms von A. Die Lösungsformel für quadratische Gleichungen und
die Formeln von Vieta liefern:
© Oliver Deiser
Einführung in die Mathematik 1
432
4. Abschnitt
Ebene und Raum
Satz (Existenz von Eigenwerten)
Sei A P R2 × 2 . Dann besitzt A genau dann reelle Eigenwerte, wenn
(+) D = spur(A)2 − 4det(A) = (a − d)2 + 4bc ≥ 0.
In diesem Fall sind die Eigenwerte gegeben durch
λ1,2 =
spur(A) ± £D
.
2
Es gilt λ1 + λ2 = spur(A) und λ1 λ2 = det(A). Weiter gilt λ1 = λ2 = spur(A)/2
genau dann, wenn D = 0.
Zugehörige Eigenvektoren finden wir durch Lösen der Gleichungssysteme
A λ1 v = 0 und A λ2 v = 0,
die im Fall λ1 = λ2 zusammenfallen.
Beispiel: Bestimmung von Eigenpaaren
1 1
Sei A =
. Dann gilt
2 1
pA (λ) = λ2 − 2λ − 1, D = 8, £D = 2£2, λ1,2 = 1 ± £2.
Nichttriviale Lösungen der homogen Gleichungssysteme
Aλ1 v =
−£2
1
2
−£2
= 0,
Aλ2 v =
£2
1
2
£2
= 0
sind v1 = (1, £2) und v2 = (1 , −£2). Damit sind (λ1 , v1 ) und (λ2 , v2 )
Eigenpaare von A.
6
pA ( )
4
2
2
-3
-2
-1
1
1
2
3
4
5
-2
Das charakteristische Polynom von A
Einführung in die Mathematik 1
© Oliver Deiser
5. Eigenwerte und Spektralsatz
433
Der Spektralsatz
Aus der Form (+) der Diskriminante D des obigen Satzes lesen wir ab, dass
Eigenwerte existieren, falls det(A) ≤ 0 oder bc ≥ 0. Letztere Bedingung ist für
jede symmetrische Matrix erfüllt, da dann bc = b2 ≥ 0. Damit besitzt jede symmetrische Matrix A P R2 × 2 reelle Eigenwerte λ1 und λ2 . Diese Eigenwerte sind
genau dann gleich, wenn D = (a − d)2 + b2 = 0, d. h. wenn a = d und b = 0 (sodass
A ein skalares Vielfaches von E2 ist). Damit können wir den folgenden fundamentalen Satz beweisen:
Satz (Spektralsatz)
Sei A P R2 × 2 . Dann sind äquivalent:
(a) A ist symmetrisch.
(b) Es gibt zueinander orthogonale Eigenvektoren v und w von A.
Beweis
(a) impliziert (b): Sei A symmetrisch. Nach obigen Überlegungen besitzt A
reelle Eigenwerte λ1 und λ2 .
Gilt λ1 = λ2 = λ, so gilt A = λ E2 und v = e1 = (1, 0) und w = e2 = (0, 1)
sind orthogonale Eigenvektoren von A.
Es gelte also λ1 ≠ λ2 . Seien v und w Eigenvektoren von A zu λ1 bzw. λ2 .
Da A symmetrisch ist, gilt At = A. Damit erhalten wir
λ1 ⟨v, w⟩ = ⟨λ1 v, w⟩ = ⟨Av, w⟩ = ⟨v, At w⟩ = ⟨v, Aw⟩ = ⟨v, λ2 w⟩ = λ2 ⟨v, w⟩.
Folglich ist
(λ1 − λ2 ) ⟨v, w⟩ = λ1 ⟨v, w⟩ − λ2 ⟨v, w⟩ = 0.
Wegen λ1 ≠ λ2 gilt also ⟨v, w⟩ = 0, sodass v und w orthogonal sind.
(b) impliziert (a): Seien v und w orthogonale und ohne Einschränkung
normierte Eigenvektoren von A zu den Eigenwerten λ1 bzw. λ2 . Seien
(α, β), (γ , δ) die Koordinatenvektoren von e1 , e2 bzgl. der Basis (v, w), d. h.
e1 = αv + βw, e2 = γ v + δw.
Dann gilt wegen ⟨v, w⟩ = ⟨w, v⟩ = 0, dass
a12 = ⟨e1 , Ae2 ⟩ = ⟨e1 , A(γ v + δw)⟩ = ⟨αv + βw, λ1 γ v + λ2 δ w⟩
= λ1 α γ ⟨v, v⟩ + λ2 β δ ⟨w, w⟩ = λ1 αγ + λ2 βδ,
a21 = ⟨Ae1 , e2 ⟩ = ⟨A(αv + βw), e2 ⟩ = ⟨λ1 α v + λ2 β w, γ v + δw⟩
= λ1 α γ ⟨v, v⟩ + λ2 β δ ⟨w, w⟩ = λ1 α γ + λ2 β δ.
Dies zeigt, dass a12 = a21 . Folglich ist A symmetrisch.
© Oliver Deiser
Einführung in die Mathematik 1
434
4. Abschnitt
Ebene und Raum
Beispiel: Bestimmung von Eigenpaaren für eine symmetrische Matrix
Wir betrachten die symmetrische Matrix
A =
a
b
b
d
=
4
2
2
1
.
Es gilt D = (a − d)2 + 4b2 = 25, £D = 5. Damit besitzt A die Eigenwerte
λ1,2 =
spur(A) ± £D
2
=
5±5
,
2
sodass λ1 = 5 und λ2 = 0. Nichttriviale Lösungen von
Aλ1 v =
−1 2
2 −4
v = 0, Aλ2 w =
4
2
2
1
w = 0
sind v = (2, 1) und w = (−1, 2). Damit sind (λ1 , v) und (λ2 , w) Eigenpaare der
Matrix A. Es gilt
⟨v, w⟩ = ⟨(2, 1), (−1, 2)⟩ = 0,
sodass v und w orthogonal sind, wie es nach dem Spektralsatz sein muss.
Diese Ergebnisse lassen sich auch anders gewinnen: Wegen det(A) = 0 ist A
singulär und 0 ein Eigenwert von A. Für das homogene Gleichungssystem
Aw = 0 können wir w = (−1, 2) als eine nichttriviale Lösung ablesen. Nach
dem Spektralsatz muss der zu v orthogonale Vektor v = rot−π/2 (w) = (2, 1)
ein weiterer Eigenvektor von A sein. Wegen Av = (10, 5) = 5v ist 5 der
zweite Eigenwert von A.
Allgemein gilt für jede symmetrische Matrix A P R2 × 2 : Ist v ein Eigenvektor
von A, so auch rotπ/2 (v) (oder rot−π/2 (v)). Die Berechnung von Av und Arotπ/2 (v)
ergibt die zugehörigen Eigenwerte. Diese Argumentation ist aber auf die Dimension n = 2 beschränkt, da nur hier die Menge aller zu einem Vektor v ≠ 0 orthogonalen Vektoren der Spann eines einzigen Vektors ist.
Diagonalisierung symmetrischer Matrizen
Der Spektralsatz besagt, dass sich jede symmetrische Matrix hinsichtlich gewisser orthogonaler und normierter Vektoren so verhält wie eine Diagonalmatrix hinsichtlich der kanonischen Basisvektoren. Um dies zu präzisieren, betrachten wir eine symmetrische Matrix A mit Eigenwerten λ1 und λ2 und zugehörigen
normierten Eigenvektoren v und w. Wir setzen
D = diag(λ1 , λ2 ) =
λ1
0
0 λ2
Einführung in die Mathematik 1
, S = (v, w) =
v1 v2
w1 w2
.
© Oliver Deiser
5. Eigenwerte und Spektralsatz
435
Dann ist S orthogonal, sodass S−1 = St = (v; w). Durch einen Austausch von w
durch −w können wir das Vorzeichen von det(S) nach Wunsch einstellen. Es gilt
A S−1 = A (v; w) = (Av; Aw) = (λ1 v; λ2 w), sodass
S A S−1 = (v, w) (λ1 v; λ2 w) =
λ1 ⟨v, v⟩
λ2 ⟨v, w⟩
λ1 ⟨w, v⟩ λ2 ⟨w, w⟩
=
λ1
0
0 λ2
= D.
Durch Multiplikation mit S−1 von links und S von rechts erhalten wir
A = S−1 D S = St D S.
Diese Zerlegung können wir anschaulich interpretieren: Da S orthogonal ist, ist
S je nach Vorzeichen von det(S) eine Drehung um einen Winkel ϕ oder eine
Spiegelung an einer Geraden G. Im Fall einer Drehung können wir die Wirkung
von A = S−1 DS auf einen beliebigen Vektor v der Ebene so beschreiben:
(1) Der Vektor v wird um den Winkel ϕ gegen den Uhrzeigersinn gedreht.
(2) Der gedrehte Vektor wird in x-Richtung um den Faktor λ1 und in y-Richtung
um den Faktor λ2 skaliert.
(3) Der so erhaltene Vektor wird um den Winkel ϕ zurückgedreht.
Ist S eine Spiegelung, so gilt eine analoge Dreiteilung. Da für eine Spiegelung
S = S−1 gilt, ist die Rückspiegelung identisch mit der ersten Spiegelung.
Wir fassen zusammen:
Satz (Diagonalisierung symmetrischer Matrizen)
Sei A P R2 × 2 symmetrisch und σ P { −1, 1 }. Dann gibt es eine orthogonale
Matrix S mit det(S) = σ und eine Diagonalmatrix D derart, dass
A = S−1 DS, D = SAS−1 .
Eine Zerlegung A = S−1 DS wie im Satz heißt eine Diagonalisierung von A. In
der Diagonale von D stehen die Eigenwerte und die Zeilen von S sind zugehörige normierte Eigenvektoren von A (Übung). Damit ist die Existenz einer Diagonalisierung nach dem Spektralsatz äquivalent zur Symmetrie von A.
Fassen wir normierten und orthogonalen Eigenvektoren v, w von A als die Basisvektoren eines Koordinatensystems auf, so hat ein Vektor u = (x, y) in diesem
System die Koordinaten x′, y′ mit u = x′ v + y′ w, sodass
(+) x e1 + y e2 = u = x′ v + y′ w.
Dann gilt
(x, y) = u = (v; w) (x′, y′) = S−1 (x′, y′), (x′, y′) = S (x, y),
sodass S und S−1 die Koordinaten (x, y) und (x′, y′) ineinander umrechnen. Wegen
S−1 D (x′, y′) = S−1 D S (x, y) = A (x, y)
hat A(x, y) bzgl. der Basis (v, w) die Koordinaten D(x′, y′) = (λ1 x′, λ2 y′). Aus der
© Oliver Deiser
Einführung in die Mathematik 1
436
4. Abschnitt
Ebene und Raum
Sicht der Basis (v, w) bewirkt A also eine Streckung um λ1 entlang der Achse von
v und λ2 entlang der Achse von w. Der Spektralsatz besagt damit, dass jede symmetrische Matrix von der sympathischen Schlichtheit einer Diagonalmatrix ist,
wenn wir ein geeignetes Koordinatensystem aus orthogonalen und normierten
Basisvektoren wählen.
Beispiel 1: Diagonalisierung einer singulären Matrix
Wir betrachten wie oben die symmetrische Matrix
A =
a
b
b
d
=
4
2
2
1
.
Nach unseren Berechnungen sind
v = α(2, 1), w = α(−1, 2), mit α = 1/£5.
orthogonale und normierte Eigenvektoren von A zu den Eigenwerten
λ1 = 5 und λ2 = 0. Bzgl. der Basis v, w lässt sich die Wirkung von A relativ
einfach beschreiben:
Ein Vektor u wird wird auf den Vektor v orthogonal projiziert
und anschließend um den Faktor 5 gestreckt.
Mit obigen Bezeichnungen gilt
D =
λ1
0
0 λ2
=
5
0
0
0
, S = (v, w) = α
2
1
−1 2
, S−1 = St .
Der Leser rechne nach, dass A = S−1 DS und D = SAS−1 . Der Vektor
u = α (−3, 7/2) hat bzgl. (v, w) die Koordinaten Su = (−1/2, 2). Damit hat Au
= (−2, −1) = £5 (−1, −1/2) bzgl. (v, w) die Koordinaten DSu = (−5/2, 0), wie
nach „Projektion auf v und Streckung um 5“ auch sein muss.
2
u
w
1
v
-3
-2
Au
-1
1
2
3
-1
-2
Einführung in die Mathematik 1
© Oliver Deiser
5. Eigenwerte und Spektralsatz
437
Beispiel 2: Diagonalisierung einer invertierbaren Matrix
Wir betrachten die invertierbare symmetrische Matrix
A =
a
b
b
d
=
3
1
1
1
.
Eine Berechnung wie in den vorangehenden Beispielen liefert die Eigenwerte
λ1,2 = 2 ± £2
und zugehörige normierte Eigenvektoren
v = α (1 + £2, 1), w = α (1 − £2, 1) mit α−1 = £4 − 2£2.
Bzgl. der Basis v, w verhält sich A wie die Diagonalmatrix D = diag(λ1 , λ2 )
bzgl. e1 , e2 .
3
2
Au
u
Av
1
w
Aw
v
-2
-1
1
2
3
4
-1
Matrizen und Ellipsen, II
Mit Hilfe der Diagonalisierung können wir die Eigenvektoren und Eigenwerte
einer invertierbaren symmetrischen Matrix geometrisch als Richtungen und Längen der Halbachsen der von A erzeugten Ellipse interpretieren und damit zwei
Welten zusammenbringen. Im Folgenden seien
EA = A [ K ] = { Av | i v i = 1 }
das Bild des Einheitskreises K unter einer Matrix A und
Ea, b = { (x, y) P R2 | (x/a)2 + (y/b)2 = 1 }
die achsenparallele Ellipse mit Halbachsen a, b > 0. Wir erhalten:
© Oliver Deiser
Einführung in die Mathematik 1
438
4. Abschnitt
Ebene und Raum
Satz (Ellipsensatz für symmetrische Matrizen aus Spektralsatz)
Sei A P R2 × 2 invertierbar und symmetrisch, und sei A = S−1 D S mit S
orthogonal und D = diag(λ1 , λ2 ). Dann gilt
EA = S−1 [ E|λ1|, |λ2| ].
Damit sind die Eigenwerte von A die Längen der Halbachsen von EA und
zugehörige Eigenvektoren sind Halbachsenrichtungen von EA .
Wenn wir die Matrix S als Drehung annehmen und A = S−1 D S als Abfolge
der Drehung S, x-y-Skalierung D und Rückdrehung S−1 um den gleichen
Drehwinkel auffassen, wird das Ergebnis sehr anschaulich: Durch S = (v, w)
werden die orthogonalen und normierten Eigenvektoren v und w von A auf e1
und e2 abgebildet. Der Kreis K bleibt invariant. Anwendung von D verformt K
zur achsenparallelen Ellipse E|λ1 |, |λ2 | . Die Anwendung von S−1 dreht diese
Ellipse zur Ellipse EA ; die Halbachsenlängen |λ1 | und |λ2 | bleiben dabei
gleich, die Achsenrichtungen e1 und e2 werden zu den Eigenvektoren v = S−1 e1
und w = S−1 e2 von A. Die Vektoren v und w sind damit Halbachsenrichtungen
von EA . Analoges gilt, wenn S eine Spiegelung ist.
Beispiel
Für die oben untersuchte symmetrische Matrix
A =
a
b
b
d
=
2
1
1
1
.
mit Eigenwerten λ1,2 = 2 ± £2 und normierten Eigenvektoren
v = α (1 + £2, 1), w = α (1 − £2, 1), α−1 = £4 − 2£2.
ergibt sich folgendes Bild:
1v
1
Ae2
Ae1
2w
-3
-2
EA
-1
1
2
3
-1
Visualisierung der Eigenwerte und Eigenvektoren der symmetrischen Matrix A
Einführung in die Mathematik 1
© Oliver Deiser
5. Eigenwerte und Spektralsatz
439
Formal lässt sich der Satz wie folgt beweisen:
Beweis des Satzes
Für alle v P R2 gilt die Äquivalenzenkette:
v P EA genau dann, wenn
i A−1 v i 2 = 1
genau dann, wenn
⟨A−1 v, A−1 v⟩ = 1
genau dann, wenn
⟨S−1 D−1 Sv, S−1 D−1 Sv⟩ = 1
genau dann, wenn
⟨D−1 S v, D−1 S v⟩ = 1.
Mit D−1 = diag(1/λ1 , 1/λ2 ) ist
EA = { v | ⟨D−1 S v, D−1 S v⟩ = 1 }
= { S−1 w | ⟨D−1 w, D−1 w⟩ = 1 }
= { S−1 (x, y) | (x/λ1 )2 + (y/λ2 )2 = 1 } = S−1 [ E|λ1|, |λ2| ].
Um den Ellipsensatz auch für nichtsymmetrische Matrizen A zu erhalten, verwenden wir, dass für jede Matrix A die Matrix AAt symmetrisch ist, sodass wir den
Spektralsatz auf AAt anwenden können:
Satz (allgemeiner Ellipsensatz aus Spektralsatz)
Sei A P R2 × 2 invertierbar, und sei A At = S−1 DS mit S orthogonal und
D = diag(λ1 , λ2 ). Dann gilt λ1 , λ2 > 0 und
EA = S−1 [ Eσ1, σ2 ], wobei σ1 = £λ1 , σ2 = £λ2 .
Die Eigenvektoren der symmetrischen Matrix AAt sind also Halbachsenrichtungen der Ellipse EA und die Wurzeln der zugehörigen Eigenwerte sind die
Längen der Halbachsen.
Beweis
Da mit A auch At invertierbar ist, gilt
⟨v, A At v⟩ = ⟨At v, At v⟩ = i At v i 2 > 0 für alle v ≠ 0.
Dies zeigt, dass die Eigenwerte λ1 , λ2 der symmetrischen Matrix A At positiv
sind. Der Rest des Beweises verläuft analog zum obigen Beweis (Ausführung des Arguments als Übung).
Wir bemerken schließlich, dass wir den spezielleren Satz für eine symmetrische Matrix A aus dem allgemeinen Satz gewinnen können, indem wir
AAt = A A = A2
diagonalisieren. Denn die Matrix A2 hat die gleichen Eigenvektoren wie A und
die Eigenwerte von A2 sind die Quadrate der Eigenwerte von A.
© Oliver Deiser
Einführung in die Mathematik 1
440
4. Abschnitt
Ebene und Raum
Die Singulärwertzerlegung
Aus der Diagonalisierung AAt = S−1 DS = St DS der symmetrischen Matrix
AAt können wir trickreich, aber ohne großen Aufwand eine dreiteilige Zerlegung von A selbst gewinnnen, bei der in der Mitte eine Diagonalmatrix und
links und rechts orthogonale Matrizen verwendet werden:
Satz (Singulärwertzerlegung)
Sei A P R2 × 2 invertierbar. Weiter sei AAt = S−1 DS mit S orthogonal und
D = diag(λ1 , λ2 ). Weiter sei
T = D1/2 SA−t , wobei A−t = (A−1 )t , D1/2 = diag(σ1 , σ2 ) = diag(£λ1 , £λ2 ).
Dann ist T orthogonal und es gilt
A = S−1 D1/2 T.
(Singulärwertzerlegung von A)
Wir können dieses sehr bedeutsame Ergebnis als Version des Spektralsatzes
für nichtsymmetrische Matrizen ansehen.
Beweis
Die Matrix T ist orthogonal, da
T t T = A−1 S−1 D1/2 D1/2 S A−t = A−1 A At A−t = E2 E2 = E2 .
Weiter ist
A = S−1 DSA−t = S−1 D1/2 D1/2 SA−t = S−1 D1/2 T.
Die Zerlegung A = S−1 D1/2 T ist als Singulärwertzerlegung von A bekannt und
die Diagonaleinträge σ1 , σ2 von D1/2 heißen die Singulärwerte von A. Die Matrix
A wird in drei Teile wie bei der Diagonalisierung zerlegt, wobei die äußeren Matrizen immer noch orthogonal, aber im Allgemeinen nicht mehr invers zueinander sind. Mehr können wir nicht erreichen, da wir A nicht als symmetrisch voraussetzen.
Dass das Bild des Einheitskreises unter A eine Ellipse ist, lässt sich mit Hilfe
der Singulärwertzerlegung A = S−1 D1/2 T wie oben bei der Diagonalisierung so
einsehen: Wir nehmen an, dass S und T Drehungen sind. Dann wird der Einheitskreis zunächst mit T gedreht. Seine Form bleibt dabei unverändert. Nun
wird der gedrehte Kreis durch Anwendung von D1/2 in x- und y-Richtung um
die positiven Skalare σ1 bzw. σ2 gestreckt und damit zur achsenparallelen Ellipse Eσ1, σ2 . Schließlich wird diese Ellipse mit S−1 zur Ellipse E = A[ K ] gedreht.
Die Spaltenvektoren von S−1 sind damit Halbachsenrichtungen und die Singulärwerte von A die Längen der Halbachsen von E. Die Ellipse E ist damit vollständig durch die Matrizen S−1 und D bestimmt. Da die orthogonale Matrix
S−1 wiederum durch ihre erste Spalte bestimmt ist, legen die vier Parameter
S−1 (1, 1), S−1 (2, 1), σ1 , σ2 die zentrische Ellipse E fest. Die Rolle der vorge-
Einführung in die Mathematik 1
© Oliver Deiser
5. Eigenwerte und Spektralsatz
441
schalteten Drehung T lässt sich so beschreiben: Durchlaufen wir den Einheitskreis K mit f(t) = (cos t, sin t), t P [ 0, 2π ], so durchläuft Af(t) die Ellipse E. Die
Matrix T beeinflusst dabei den Startpunkt Ae1 des Durchlaufs. Im Fall T = E2 beginnt der Durchlauf von E bei einem Halbachsenvektor von E (genauer bei
σ1 S−1 e1 ). Durch Änderung des Drehwinkels von T kann der Startpunkt des
Durchlaufs beliebig eingestellt werden, ohne die Ellipse EA zu verändern.
Beispiel
Seien σ1 = 2, σ2 = 1, ϕ = π/3, ψ = π/8, D = diag(σ1 , σ2 ), S−1 = rotψ , T = rotϕ .
Wir setzen
A = S−1 D T (Drehung um ψ, Skalierung mit D, Drehung um ϕ).
Die Anwendung von T gefolgt von D ergibt zunächst:
1
DTe2
Te2
Te1
DTe1
2
-2
E
-1
1, 2
1
2
1
K
-1
Anwendung von S−1 dreht die achsenparallele Ellipse um den Winkel ψ:
Ae1
2
S-1 e
2
1
1S
-1 e
1
2
1
Ae2
-2
-1
1
2
EA
-1
© Oliver Deiser
Einführung in die Mathematik 1
442
4. Abschnitt
Ebene und Raum
Analoge Überlegungen gelten, wenn S oder T eine Spiegelung ist. Die Determinante von S oder von T kann dabei frei als 1 oder −1 gewählt werden: Multiplizieren wir die zweiten Spalten von S und T mit −1, so erhalten wir eine Singulärwertzerlegung von A, bei der die Determinanten der beiden äußeren Matrizen ihr
Vorzeichen gewechselt haben. Ist S eine Drehung, so entspricht das Vorzeichen
von det(T) wegen
det(A) = det(S−1 ) det(D1/2 ) det(T) = σ1 σ2 det(T) mit σ1 , σ2 > 0
der Orientierung der Spalten von A, also der Bilder von e1 und e2 unter A. Ist die
Determinante von A negativ, so durchläuft Af(t)) mit obiger Parametrisierung
f(t) von K die Ellipse E im Uhrzeigersinn.
Subtile Beziehungen bestehen zwischen den zu A und At gehörigen Ellipsen
E = A[ K ] und Et = At [ K ]. Wegen At = T −1 D1/2 S haben A und At die gleichen
Singulärwerte, sodass die Ellipsen E und Et die gleichen Halbachsenlängen σ1
und σ2 aufweisen. Ist vi = S−1 ei , i = 1,2, ein normierter Halbachsenvektor von
E, so ist
At vi = T −1 D1/2 SS−1 ei = T −1 D1/2 ei = σi T −1 ei
ein Halbachsenvektor von Et .
3
2
1
-3
-2
-1
1
2
3
E
-1
-2
Et
-3
Die Ellipsen von A und At für A = ((1, −1); (3, 2/3))
Einführung in die Mathematik 1
© Oliver Deiser
5. Eigenwerte und Spektralsatz
443
Übungen
Übung 1
Illustrieren Sie die Begriffe Eigenwert und Eigenvektor durch Diagramme.
Übung 2
Sei A P R2 × 2 , und seien v, w Eigenvektoren von A zum gleichen Eigenwert
λ. Weiter sei u P span(v, w) mit u ≠ 0. Zeigen Sie, dass u ein Eigenvektor
von A zum Eigenwert λ ist.
Übung 3
Was lässt sich über die Existenz von Eigenwerten (immer, manchmal, nie)
einer Matrix A unter den folgenden Bedingungen sagen? Begründen Sie
Ihre Antworten.
(a) det(A) = 0.
(b) det(A) > 0.
(c) det(A) < 0.
(d) spur(A) = 0.
(e) A ist eine Diagonalmatrix.
(f ) Die Einträge von A außerhalb der Hauptdiagonalen haben das
gleiche Vorzeichen.
(g) Die Einträge von A außerhalb der Hauptdiagonalen haben verschiedene Vorzeichen.
Übung 4
Bestimmen Sie alle symmetrischen Matrizen A = ((a, b), (b, d)), für die (1, 1)
ein Eigenvektor zum Eigenwert 1 ist.
Übung 5
Sei A = rotϕ P R2 × 2 eine Rotationsmatrix um einen Winkel ϕ P [ 0, 2π [.
Zeigen Sie, dass A genau dann Eigenwerte besitzt, wenn ϕ = 0 oder ϕ = π.
Übung 6
Sei u P R2 mit u ≠ 0, und sei A die Spiegelung an der Geraden G(u) =
span(u). Bestimmen Sie die Eigenwerte und Eigenvektoren von A sowohl
durch anschauliche Argumentation als auch durch Berechnung. Zeichnen
Sie ein Diagramm zur Illustration.
© Oliver Deiser
Einführung in die Mathematik 1
444
4. Abschnitt
Ebene und Raum
Übung 7
Sei u P R2 mit u ≠ 0, und sei A = Apru die Projektionsmatrix bzgl. u.
Bestimmen Sie die Eigenwerte und Eigenvektoren von A sowohl durch
anschauliche Argumentation als auch durch Berechnung. Zeichnen Sie ein
Diagramm zur Illustration.
Übung 8
Sei A P R2 × 2 invertierbar. Welche Beziehungen bestehen im Fall der
Existenz zwischen den Eigenvektoren und zugehörigen Eigenwerten von A
und A−1 ? Beweisen Sie Ihre Behauptungen.
Übung 9
Beweisen oder widerlegen Sie die folgenden Aussagen:
(a) Für alle A P R2 × 2 gilt: Besitzt A einen Eigenwert, so auch A2 .
(b) Für alle A P R2 × 2 gilt: Besitzt A2 einen Eigenwert, so auch A.
(c) Für alle A P R2 × 2 gilt: Besitzt A2 einen Eigenwert, so auch A3 .
Übung 10
Sei A P R2 × 2 eine obere oder untere Dreiecksmatrix mit voneinander
verschiedenen Diagonaleinträgen. Zeigen Sie, dass A keine Eigenwerte
besitzt.
Übung 11
Sei B = ((s, b), (b, −s)) P R2 × 2 , B ≠ 0, eine spurfreie Matrix, und sei
(s, b) = λ (cos(ϕ, sinϕ)) mit λ = i (s, b) i, ϕ P R.
Zeigen Sie unter Verwendung der Additionstheoreme für den Kosinus und
Sinus, dass
v = (cos(ϕ/2), sin(ϕ/2)) und w = (−sin(ϕ/2), cos(ϕ/2)).
Eigenvektoren von B zu den Eigenwerten λ und −λ sind. Illustrieren Sie das
Ergebnis durch eine Skizze.
Übung 12
Sei A P R2 × 2 symmetrisch, und sei A = S−1 DS, D = SAS−1 mit einer
orthogonalen Matrix S und einer Diagonalmatrix D. Zeigen Sie, dass die
Zeilenvektoren von S (und damit die Spaltenvektoren von S−1 ) orthogonale
und normierte Eigenvektoren von A mit den zugehörigen Eigenwerten
λ1 = d11 und λ2 = d22 sind.
Einführung in die Mathematik 1
© Oliver Deiser
5. Eigenwerte und Spektralsatz
445
Übung 13
Sei A P R2 × 2 symmetrisch.
(a) Illustrieren Sie die Aussage, dass A eine Diagonalmatrix D bzgl.
eines Koordinatensystems bestehend aus orthogonalen und
normierten Eigenvektoren v, w von A ist, durch Diagramme.
(b) Betrachten Sie nun eine konkrete symmetrische nichtdiagonale
Matrix A ihrer Wahl, und führen Sie das Umrechnen von (x,y)Koordinaten im System e1 , e2 und (x′, y′)-Koordinaten im System
v,w für einige Vektoren v = xe1 + ye2 = x′v + y′w der Ebene durch.
Übung 14
Seien Ea, b eine achsenparallele Ellipse und S orthogonal. Zeigen Sie, dass
die Ellipse E = S[ Ea, b ] auch im Fall det(S) = −1 durch eine Drehung aus Ea, b
hervorgeht. Wie lässt sich der Drehwinkel aus S gewinnen? Illustrieren Sie
Ihre Argumentation durch eine Skizze.
Übung 15
Führen Sie den Beweis des allgemeinen Ellipsensatzes vollständig aus (in
Analogie zum Beweis des Ellipsensatzes für symmetrische Matrizen).
Übung 16
Sei (v1 ; v2 ) diag(σ1 , σ2 ) (w1 , w2 ) eine Singulärwertzerlegung von A P R2 × 2 .
(a) Zeigen Sie, dass auch
(±v1 ; ±v2 ) diag(σ1 , σ2 ) (±w1 , ±w2 ),
(±v2 ; ±v1 ) diag(σ2 , σ1 ) (±w2 , ±w1 )
Singulärwertzerlegungen von A sind (mit beliebiger Vorzeichenkombination bei den Vektoren).
(b) Zeigen Sie, dass jede Singulärwertzerlegung von A eine der
Zerlegungen in (a) ist.
© Oliver Deiser
Einführung in die Mathematik 1
6. Der Euklidische Raum
Gegenstand dieses Kapitels ist der dreidimensionale Raum
R3 = { (v1 , v2 , v3 ) | v1 , v2 , v3 P R } = { (x, y, z) | x, y, z P R }.
Eine Besonderheit des dreidimensionalen Raumes ist das Vorhandensein eines
speziellen Vektorprodukts v × w (Kreuzprodukt), das zwei Vektoren v und w des
Raumes einen bestimmten Vektor u = v × w zuordnet, der auf v und w senkrecht
steht. Wir motivieren dieses Produkt über die Darstellung von Ebenen. Schließlich betrachten wir auch wieder Determinanten und lineare Gleichungssysteme.
© Oliver Deiser
Einführung in die Mathematik 1
448
4. Abschnitt
Ebene und Raum
Grundlegendes
Wir erinnern an die für alle v, w P R3 und λ P R definierten Vektoren bzw.
Skalare:
v + w = (v1 + w1 , v2 + w2 , v3 + w3 ) P R3 ,
(Vektoraddition)
λ v = (λ v1 , λ v2 , λ v3 ) P R3 ,
(Skalarmultiplikation)
i v i = £v1 2 + v2 2 + v3 2 P R,
⟨v, w⟩ = v1 w1 + v2 w2 + v3 w3 P R.
(Euklidische Norm)
(Euklidisches Skalarprodukt)
Unsere Beweise der Winkelformel bleiben gültig, da sie nur allgemeine Eigenschaften des Skalarprodukts und geometrische Größen eines Dreiecks verwenden, die von der räumlichen Lage unabhängig sind. Damit gilt für alle Vektoren v,w P R3 mit v, w ≠ 0:
cos ϕ = ⟨v̂, ŵ⟩ =
⟨v, w ⟩
ivi iwi
mit ϕ = ](v, w) P [ 0, π ].
(Winkelformel)
Wie in der Ebene definieren wir die Orthogonalität und die Kollinearität zweier
Vektoren: Zwei Vektoren v, w P R3 sind orthogonal, falls ⟨v, w⟩ = 0 und kollinear,
falls |⟨v, w⟩| = i v i i w i. Der Nullvektor ist kollinear mit jedem Vektor des R3 .
Sind v,w P R3 mit v ≠ 0, so sind v,w genau dann kollinear, wenn es ein λ P R gibt
mit w = λv.
Die Vektoren v = (4, 1, 1) und w = (1, 2, 3) im R3
Einführung in die Mathematik 1
© Oliver Deiser
6. Der Euklidische Raum
449
Geraden und Ebenen im dreidimensionalen Raum
Geraden und Ebenen des Raumes, denen der Nullpunkt angehört, können wir
über den Spann von Vektoren einführen:
Definition (Gerade)
Sei v P R3 mit v ≠ 0. Dann setzen wir
G(v) = span(v) = { λ v | λ P R }.
Die Menge G(v) ⊆ R3 heißt die von v aufgespannte oder erzeugte Gerade des
R3 . Eine Teilmenge G ⊆ R3 heißt eine Gerade (durch 0), falls es ein v P R3
gibt mit G = G(v).
Definition (Ebene)
Seien v, w P R3 nicht kollinear. Dann setzen wir
E(v, w) = span(v, w) = { λ v + µ w | λ, w P R }.
Die Menge E(v, w) ⊆ R3 heißt die von v, w aufgespannte oder erzeugte Ebene
des R3 . Eine Teilmenge E ⊆ R3 heißt eine Ebene (durch 0), falls es v, w P R3
gibt mit E = E(v, w).
Allgemeinere geometrische Geraden und Ebenen entstehen durch die Verschiebung von Geraden und Ebenen durch den Nullpunkt um einen Vektor:
Definition (Translation)
Seien P ⊆ R3 und u P R3 . Dann setzen wir
P + u = { v + u | v P P }.
Die Menge P + u heißt die Translation oder Verschiebung von P um den
Vektor u.
Definition (affine Gerade, affine Ebene)
Eine Menge G ⊆ R3 heißt eine affine Gerade, falls es v, u P R3 gibt mit
G = u + G(v). Analog heißt eine Menge E ⊆ R3 eine affine Ebene, falls es
v, w, u P R3 gibt mit E = u + E(v, w).
Affine Gerade und Ebenen haben also die Form
G = u + span(v) = { u + λv | λ P R }, v ≠ 0,
E = u + span(v, w) = { u + λv + µ w | λ, µ P R }, v, w nicht kollinear.
Die Vektoren v, w, u sind dabei nicht eindeutig bestimmt und der Fall u = 0 ist
möglich. Im Folgenden bedeutet „Gerade“ und „Ebene“ immer „Gerade durch
0“ und “Ebene durch 0“, wenn der Zusatz „affin“ nicht explizit dabei steht.
© Oliver Deiser
Einführung in die Mathematik 1
450
4. Abschnitt
Ebene und Raum
Lineare Unabhängigkeit
Drei Vektoren des R3 liegen genau dann in einer Ebene E, wenn einer der drei
Vektoren im Spann der beiden anderen Vektoren liegt. Eine äquivalente Bedingung gibt der folgende Satz.
Satz (triviale Nulldarstellung))
Seien v, w, u P R3 . Dann sind äquivalent:
(a) Die Vektoren v, w, u liegen nicht in einer Ebene E ⊆ R3 .
(b) ∀λ1 , λ2 , λ3 P R (λ1 v + λ2 w + λ3 u = 0 → λ1 = λ2 = λ3 = 0).
Die zweite Aussage besagt, dass sich der Nullvektor nur trivial in der Form
0 = 0 v + 0 w + 0 u mit Hilfe der drei Vektoren kombinieren lässt.
Beweis
(a) impliziert (b):
Wir zeigen die Implikation indirekt. Seien also λ1 , λ2 , λ3 P R nicht alle
gleich 0 derart, dass
λ1 v + λ2 w + λ3 u = 0.
Ist λ1 ≠ 0, so gilt
v =
−1
λ1
( λ2 w + λ3 u )
=
−λ2
w +
λ1
−λ3
u P span(w, u),
λ1
sodass v, w, u in der Ebene E(w, u) liegen. Analoges gilt, falls λ2 ≠ 0 oder
λ3 ≠ 0.
(b) impliziert (a):
Wir zeigen die Implikation wieder indirekt. Wir nehmen also an, dass
v, w, u in einer gemeinsamen Ebene liegen. Ist v P spann(w, u), so gibt es
λ2 , λ3 P R mit
v = λ2 w + λ3 u.
Dann ist aber
1 v + (−λ2 ) w + (−λ3 ) u = 0
eine Darstellung des Nullvektors, deren Koeffizienten nicht alle gleich
Null sind. Analoges gilt, falls w P spann(v, u) oder u P spann(v, w).
Die elegante Bedingung (b) wird in der Linearen Algebra verwendet, um zum
Ausdruck zu bringen, dass zwischen Vektoren keine linearen Abhängigkeitsverhältnisse bestehen. Wir definieren allgemein:
Einführung in die Mathematik 1
© Oliver Deiser
6. Der Euklidische Raum
451
Definition (linear unabhängig)
Sei n ≥ 1, und seien v1 , …, vk P Rn . Dann heißen die Vektoren v1 , …, vk
linear unabhängig, falls gilt:
∀λ1 , …, λk P R (λ1 v1 + … + λk vk = 0 → λ1 = … = λk = 0).
Andernfalls heißen sie linear abhängig.
Genauer sollten wir sagen: „Das k-Tupel (v1 , …, vk ) ist linear unabhängig.“
Denn die lineare Unabhängigkeit kommt den Vektoren v1 , …, vk als Ganzes zu
und nicht jedem einzelnen Vektor. Die Sprechweise „Die Vektoren v1 , …, vk sind
linear unabhängig“ ist also etwas ungenau, aber sprachlich einfacher.
Lineare Unabhängigkeit in der Ebene
(1) Ein Vektor v P R2 ist genau dann linear unabhängig, wenn v ≠ 0.
(2) Zwei Vektoren v, w P R2 sind genau dann linear unabhängig, wenn v, w
nicht kollinear sind, d. h. nicht auf einer Geraden liegen.
(3) Drei Vektoren v, w, u P R2 sind stets linear abhängig.
Lineare Unabhängigkeit im dreidimensionalen Raum
(1) Ein Vektor v P R3 ist genau dann linear unabhängig, wenn v ≠ 0.
(2) Zwei Vektoren v, w P R3 sind genau dann linear unabhängig, wenn v, w
nicht kollinear sind, d. h. nicht auf einer Geraden liegen.
(3) Drei Vektoren v, w, u P R3 sind genau dann linear unabhängig, wenn
v, w, u nicht in einer Ebene liegen.
(4) Vier Vektoren v, w, u, u′ P R3 sind stets linear abhängig.
Eine nichtriviale Nulldarstellung: v + w + 3u = 0
© Oliver Deiser
Einführung in die Mathematik 1
452
4. Abschnitt
Ebene und Raum
Zur linearen Abhängigkeit des Nullvektors beobachten wir, dass 1 ⋅ 0 = 0 eine
nichttriviale Darstellung des Nullvektors ist. Im R2 sind drei und mehr Vektoren
immer linear abhängig, da zwei linear unabhängige Vektoren die gesamte Ebene
aufspannen. Ebenso sind im R3 vier und mehr Vektoren stets linear abhängig.
Die Orthogonaldarstellung einer Ebene
Ist E eine Ebene des R3 , so gibt es nach unserer Definition einer Ebene linear
unabhängige Vektoren v und w des R3 , die die Ebene aufspannen:
Spanndarstellung
E = E(v, w) = span(v, w) = { λ v + µ w | λ, µ P R }.
Anschaulich ist klar, dass wir eine Ebene E auch als Menge aller Vektoren darstellen können, die senkrecht auf einem Vektor s P R3 , s ≠ 0, stehen („s“ steht hier
für „senkrecht“). Eine solche Menge hat die Form:
Orthogonaldarstellung
E = Es = { v P R3 | v und s sind orthogonal }
= { v P R3 | ⟨v, s⟩ = 0 }
= { v P R3 | v1 s1 + v2 s2 + v3 s3 = 0 }.
Es stellt sich die Frage:
Wie rechnet man die beiden Darstellungen ineinander um?
Ist E ⊆ R2 gegeben in der Orthogonaldarstellung
E = Es = { v P R3 | s und v sind orthogonal }, s = (a, b, c),
so können wir aus den Komponenten a, b, c von s zwei linear unabhängige Lösungen v = (x1 , y1 , z1 ) und w = (x2 , y2 , z2 ) der Gleichung
ax + by + cz = 0
in den Unbekannten x,y,z gewinnen (Übung). Es gilt dann E = E(v, w). Ist umgekehrt E ⊆ R2 gegeben in der Spanndarstellung
E = E(v, w) = span(v, w) = { λ v + µ w | λ, µ P R },
so suchen wir einen Vektor s = (a, b, c) ≠ 0, der auf den linear unabhängigen
Vektoren v und w senkrecht steht. Ist v = (x1 , y1 , z1 ) und w = (x2 , y2 , z2 ), so muss
für a, b, c gelten:
(+)
ax1 + by1 + cz1 = 0
ax2 + by2 + cz2 = 0
Einführung in die Mathematik 1
© Oliver Deiser
6. Der Euklidische Raum
453
Das homogene System (+) in den Unbestimmten a, b, c lässt sich mit Hilfe von
(2 × 2)-Matrizen und unserer Lösungstheorie für (2 × 2)-Systeme lösen, ohne
dass dabei unangenehme Fallunterscheidungen nach x1 ≠ 0, x2 ≠ 0, … auftreten
würden. Wir formen das System hierzu um:
Ein Vektor s = (a, b, c) ist genau dann eine Lösung von (+), wenn gilt:
(I)
(II)
(III)
y1 z1
b
y2 z2
c
x1 z1
a
x2 z2
c
x1 y1
a
x2 y2
b
= −a
x1
y1
= −b
= −c
,
y2
,
y2
z1
.
z2
Wir bezeichnen die (2 × 2)-Matrizen von (I), (II) und (III) mit A1 , A2 bzw. A3 und
setzen
d1 = det(A1 ) = y1 z2 − z1 y2 ,
d2 = det(A2 ) = x1 z2 − z1 x2 ,
d3 = det(A3 ) = x1 y2 − y1 x2 .
Für alle Matrizen A P R2 × 2 und alle v P R2 gilt
det(A) v = A# A v.
Sei nun (a, b, c) eine Lösung von (I), (II), (III). Dann gilt:
d1
b
c
= det(A1 )
= −a
b
c
= A1 # A1
z2 −z1
x1
−y2 y1
x2
b
= − a A1 #
c
= a
−d2
d3
x1
x2
.
Analog erhalten wir
d2
d3
a
c
a
b
= − b A2 #
= − c A3 #
© Oliver Deiser
y1
y2
z1
z2
= −b
= −c
z2 −z1
y1
−x2 x1
y2
y2 −y1
z1
−x2 x1
z2
= −b
= c
d1
d3
d1
−d2
,
.
Einführung in die Mathematik 1
454
4. Abschnitt
Ebene und Raum
Die drei Gleichungen werden offenbar erfüllt durch
(#) a = d1 , b = −d2 , c = d3 .
Einsetzen zeigt, dass durch (#) eine Lösung von (I), (II), (III) definiert wird.
Unsere Überlegungen motivieren:
Definition (Kreuzprodukt)
Für alle v, w P R3 setzen wir
x2
x1
v × w =
y1
×
z1
y2
d1
=
z2
− d2
d3
y 1 z2 − y 2 z1
=
x2 z1 − x1 z2
.
x1 y2 − x2 y1
Der Vektor v × w P R3 heißt das Kreuzprodukt oder Vektorprodukt von v und w.
Das Kreuzprodukt ist eine Abbildung von R3 × R3 nach R3 . Je zwei Vektoren
des Raumes wird ein Vektor des Raumes zugeordnet. Für linear unabhängige
Vektoren v und w und v × w = (a, b, c) gilt
E(v, w) = { λ v + µ w | λ, µ P R }
= { (x, y, z) | a x + b y + c z = 0 } = { u P R3 | ⟨v × w, u⟩ = 0 }.
Damit können wir die Orthogonaldarstellung einer Ebene E(v, w) einfach durch
eine Berechnung des Kreuzprodukts v × w finden.
Für v = (3, 2, 2) und w = (−2, 1, 1) ist v × w = (0, −7, 7) und w × v = − (v × w)
Einführung in die Mathematik 1
© Oliver Deiser
6. Der Euklidische Raum
455
Eigenschaften des Kreuzprodukts
Das Kreuzprodukt erfüllt eine Reihe von bemerkenswerten Eigenschaften.
Der folgende Satz, dessen „Beweis durch umfangreiches Nachrechnen“ dem Leser zur Übung überlassen sei, versammelt einige davon.
Satz (Eigenschaften des Kreuzprodukts)
Für alle v, w, u P R3 und λ P R gilt:
(i) ⟨v × w, v⟩ = ⟨v × w, w⟩ = 0,
(Orthogonalität)
(ii) v × w = − (w × v),
(Antikommutativität)
(iii) (λv) × w = λ (v × w),
(v + u) × w = v × w + u × w,
v × (λw) = λ (v × w),
v × (w + u) = v × w + v × u,
(Bilinearität)
(iv) v × v = 0,
(Alternation)
(v) v × (w × u) = ⟨v, u⟩ w − ⟨v, w⟩ u,
(Grassmann-Identität)
(vi) v × (w × u) + u × (v × w) + w × (u × v) = 0,
(vii) i v × w i 2 = i v i 2 i w i 2 − ⟨v, w⟩2 .
(Jacobi-Identität)
(Lagrange-Identität)
Das Kreuzprodukt ist also weder kommutativ noch assoziativ. Die Grassmann-Identität ist aus mnemotechnischen Gründen auch als bac-cab−Regel bekannt: Schreiben wir a, b, c statt v, w, u, so gilt
a × (b × c) = ⟨a, c⟩ b − ⟨a, b⟩ c = b ⟨a, c⟩ − c ⟨a, b⟩
mit ungewöhnlichen rechtsseitigen Skalaren an den Vektoren b und c. In der
Jacobi-Identität werden die Vektoren v, w, u zyklisch vertauscht, was ebenfalls
helfen kann, sich diese Formel zu merken. Explizit bemerken wir, dass die
Lagrange-Identität die Ungleichung von Cauchy-Schwarz (für den R3 ) impliziert.
Für Liebhaber des Kreuzprodukts halten wir noch fest (Beweis als Übung):
Satz (allgemeine Lagrange-Identität, Binet-Cauchy-Identität)
Für alle v1 , v2 , w1 , w2 P R3 gilt:
⟨v1 × v2 , w1 × w2 ⟩ = ⟨v1 , v2 ⟩ ⟨w1 , w2 ⟩ − ⟨v1 , w2 ⟩ ⟨w1 , v2 ⟩
= det
© Oliver Deiser
⟨v1 , v2 ⟩
⟨v1 , w2 ⟩
⟨w1 , v2 ⟩
⟨w1 , w2 ⟩
.
Einführung in die Mathematik 1
456
4. Abschnitt
Ebene und Raum
Die Lagrange-Identität ergibt sich für v = v1 = v2 und w = w1 = w2 als Spezialfall
der Binet-Cauchy-Identität.
Nach Konstruktion steht das Kreuzprodukt von v und w senkrecht auf den
Vektoren v und w. Zu klären bleibt noch die Länge und die Richtung des Vektors v × w. Für die Länge gilt:
Satz (Länge des Kreuzprodukts: Parallelogrammfläche)
Für alle v, w P R3 ist i v × w i die Fläche des von v und w im R3 aufgespannten Parallelogramms
P = { λ v + µ w | λ, µ P [ 0, 1 ] }.
Für v, w ≠ 0 gilt also
i v × w i = i v i i w i sin(ϕ) mit ϕ = ](v, w) P [ 0, π ].
Beweis
Gilt v = 0 oder w = 0, so ist v × w der Nullvektor mit Länge 0, und die
Fläche von P ist ebenfalls gleich 0. Seien also v, w ≠ 0 und ϕ = ](v, w),
sodass sin ϕ ≥ 0. Nach der Lagrange-Identität gilt
iv × wi 2 = i v i 2 i w i 2 − ⟨v, w⟩2
= iv i 2 iw i 2 − cos2 ϕ i v i 2 iw i 2
= i v i 2 i w i 2 (1 − cos2 ϕ)
= ivi 2 iwi 2 sin2 ϕ.
Das von v und w aufgespannte Parallelogramm P mit der Höhe h = sin ϕ i w i
Einführung in die Mathematik 1
© Oliver Deiser
6. Der Euklidische Raum
457
Damit gilt für alle v, w P R3 mit v, w ≠ 0 und ϕ = ](v, w):
cos ϕ = ⟨v̂, ŵ⟩, sin ϕ = i v̂ × ŵ i.
Um die Richtung von v × w zu ermitteln, betrachten wir zunächst die kanonischen Einheitsvektoren. Ausrechnen zeigt:
Satz (Richtung des Kreuzprodukts)
Für e1 = (1, 0, 0), e2 = (0, 1, 0), e3 = (0, 0, 1) gilt:
e1 × e1 = 0,
e2 × e2 = 0,
e3 × e3 = 0,
e1 × e2 = e3 ,
e2 × e3 = e1 ,
e3 × e1 = e2 ,
e2 × e1 = −e3 ,
e3 × e2 = −e1 ,
e1 × e3 = − e2 .
Als Merkregel kann man verwenden, dass die zyklische bzw. azyklische Anordnung der Indizes zu einem positiven bzw. negativen Vorzeichen führt. Das
Ergebnis ei × ej lässt sich damit ablesen an der Aufzählung:
e1 , e2 , e3 , e1 , e2
Sind v, w linear unabhängig, so gilt allgemeiner, dass die räumliche Lage der
drei Vektoren v, w, v × w stets der Lage von e1 , e2 , e3 entspricht (und nicht etwa
der Lage von e1 , e3 , e2 ); bei diesem Lagebegriff wird von den Längen und dem
eingeschlossenen Winkel der Vektoren v und w abgesehen. Anschaulich lässt sich
dies wie folgt formulieren:
Richtung des Kreuzprodukts: Rechte-Hand-Regel
Zeigt v in Richtung des Daumens und w in Richtung des Zeigefingers der
rechten Hand, so zeigt v × w in Richtung des Mittelfingers der rechten
Hand, wenn dieser senkrecht auf Daumen und Zeigefinger steht.
Die Regel kann in dieser anschaulichen Form nicht bewiesen werden, da wir
in mathematischen Beweisen nicht von einer rechten Hand reden können. Um
sie mathematisch zu formulieren, betrachten wir drei linear unabhängige Vektoren a, b, c des Raumes derart, dass a auf der positiven x-Achse und b in der
x-y-Ebene liegt (c muss nicht notwendig senkrecht auf a und b stehen). Dann
bildet anschaulich a, b, c genau dann ein System, das wir mit der rechten Hand
(bei sehr beweglichen Fingern) richtungsmäßig nachbilden können, wenn das
Vorzeichen der y-Komponente von b mit dem Vorzeichen der z-Komponente
von c übereinstimmt. Zwei Beispiele sind
(2, 0, 0), (1, 1, 0), (−1, −1, 2),
(1, 0, 0), (0, −1, 0), (−1, 0, −1).
Allgemeine Vektoren u, v, w P R3 erlauben diese Nachbildung mit der rechten
Hand, wenn sie durch eine Rotation um den Nullpunkt in ein derartiges System
a, b, c übergeführt werden können.
© Oliver Deiser
Einführung in die Mathematik 1
458
4. Abschnitt
Ebene und Raum
Diese Überlegungen führen zu einer Definition, die durch die Anschauung
motiviert, aber von ihr unabhängig ist:
Definition (Rechtssystem)
Seien v, w, u P R3 linear unabhängig. Dann ist (v, w, u) ein Rechtssystem, falls
es eine Rotation f : R3 → R3 um den Nullpunkt gibt, sodass für die
Vektoren a = f(v), b = f(w), c = f(u) gilt:
(i) a = (a1 , 0, 0), b = (b1 , b2 , 0), c = (c1 , c2 , c3 ),
(ii) a1 > 0, sgn(b2 ) = sgn(c3 ).
Analog ist ein Linkssystem definiert, wobei in (ii) nun sgn(b2 ) ≠ sgn(c3 )
gefordert wird.
Damit können wir nun eine formale Version der Rechte-Hand-Regel beweisen. Hierzu verwenden wir, dass eine Rotation f : R3 → R3 um den Nullpunkt
das Kreuzprodukt respektiert, d. h. dass f(u × v) = f(u) × f(v) für alle u, v P R3
gilt. Um dies streng zu beweisen, müssten wir Rotationen genauer untersuchen. Die Aussage ist aber plausibel, da eine Rotation eine stetige Abbildung ist
und wir das Kreuzprodukt bereits bis auf ein Vorzeichen in Länge und Richtung festgelegt haben. Und dieses Vorzeichen kann bei einer stetigen Abbildung nicht wechseln.
Satz (Richtung des Kreuzprodukts)
Seien v, w P R3 linear unabhängig, und sei u = v × w. Dann ist (v, w, u) ein
Rechtssystem.
Beweis
Sei a1 = i v i. Sei f : R3 → R3 eine Rotation um den Nullpunkt, die v auf
a = (a1 , 0, 0) und w auf einen Vektor b der x-y-Ebene abbildet, sodass
f(w) = b = (b1 , b2 , 0).
Weiter sei c = f(u). Dann gilt
b1
a1
c = f(v × w) = f(v) × f(w) =
0
0
×
b2
0
=
0
0
,
a1 b2
sodass c3 = a1 b2 . Wegen a1 > 0 ist sgn(c3 ) = sgn(b2 ).
Aus dieser Argumentation ergibt sich noch einmal, dass die Länge von v × w
die Fläche des von v und w aufgespannten Parallelogramms ist. Denn diese Fläche bleibt bei Rotationen unverändert, und die Fläche des von a und b aufgespannten Parallelogramms ist
|a1 b2|
= i c i = i f(u) i = i v × w i.
Einführung in die Mathematik 1
© Oliver Deiser
6.
Der Euklidische Raum
459
Determinanten
Wir führen nun Determinanten in Analogie zur Ebene ein. Das dreidimensionale Analogon zu dem von zwei Vektoren der Ebene aufgespannten Parallelogramm ist:
Definition (aufgespanntes Parallelepiped, Spat)
Seien v, w, u P R3 . Dann heißt die Menge
P = { λ1 v + λ2 w + λ3 u | λ1 , λ2 , λ3 P [ 0, 1 ] } ⊆ R3
das von v, w, u aufgespannte Parallelepiped oder der von v, w, u aufgespannte Spat.
Der von v, w, u aufgespannte Spat P
Wir bestimmen nun das orientierte Volumen V(P) des von v, w, u aufgespannten Parallelepipeds P. Das Vorzeichen von V(P) soll dabei wieder der Orientierung der drei Vektoren entsprechen, die wir in Analogie zur Ebene so erklären
können:
Definition (Orientierung im R3 )
Seien v, w, u P R3 linear unabhängig, und sei ψ = ](v × w, u). Dann heißt
(v, w, u) positiv orientiert, wenn ψ P [ 0, π/2 [, und negativ orientiert, wenn
ψ P ] π/2, π ].
Die positive Orientierung von (v, w, u) besagt anschaulich, dass die Vektoren
u und v × w im gleichen durch die Ebene span(v, w) definierten Halbraum des
© Oliver Deiser
Einführung in die Mathematik 1
460
4. Abschnitt
Ebene und Raum
R3 liegen. Das Kreuzprodukt v × w spielt in der Begriffsbildung die Rolle des
Vektors v ⊥ = rotπ/2 (v) der Orientierung in der Ebene. Die positive Orientierung
von (v, w, u) ist äquivalent dazu, dass das Tripel (v, w, u) ein Rechtssystem ist. Die
Orientierung lässt sich aber ohne Verwendung von Rotationen erklären.
Für die Grundfläche f und die gemäß dem Vektor v × w orientierte Höhe h des
Spats P gilt
f = iv × wi,
h = cos(ψ) i u i, wobei ψ = ](v × w, u).
Damit erhalten wir das orientierte Volumen
V(P) = f h = i v × w i cos(ψ) i u i = ⟨v × w, u⟩.
Wir definieren:
Definition (Determinante)
Seien v, w, u P R3 . Dann heißt die reelle Zahl
det(v, w, u) = ⟨v × w, u⟩
die Determinante von (v, w, u).
Unsere Diskussion zeigt:
Volumen und lineare Abhängigkeit
Die reelle Zahl det(v, w, u) ist das orientierte Volumen des von v, w, u
aufgespannten Parallelepipeds. Insbesondere ist det(v, w, u) genau dann
gleich 0, wenn v, w, u linear abhängig sind.
Im Fall det(v, w, u) ≠ 0 entspricht das Vorzeichen der Determinante der Orientierung von (v, w, u). Damit ist das Volumen V(P) positiv bei einem Rechtssystem
und negativ bei einem Linkssystem.
Nachrechnen zeigt:
Satz (Eigenschaften der Determinante)
Für alle v, w, v1 ,v2 , w1 , w2 , u1 , u2 P R3 und alle λ P R gilt:
(i) det(e1 , e2 , e3 ) = 1,
(ii) det(v, w, u) = 0, falls v = w oder v = u oder w = u,
(iii) det(v, w, u) = − det(w, v, u) = − det(u, w, v) = − det(v, u, w),
(iv) det(λ v, w, u) = det(v, λ w, u) = det(v, w, λ u) = λ det(v, w, u),
det(v1 + v2 , w, u) = det(v1 , w, u) + det(v2 , w, u),
det(v, w1 + w2 , u) = det(v, w1 , u) + det(v, w2 , u),
det(v, w, u1 + u2 ) = det(v, w, u1 ) + det(v, w, u2 ).
Einführung in die Mathematik 1
© Oliver Deiser
6. Der Euklidische Raum
461
Die Determinante ist also normiert im Hinblick auf die kanonischen Einheitsvektoren und gleich 0, wenn zwei der drei Vektoren gleich sind. Sie ändert das
Vorzeichen, wenn wir zwei Vektoren vertauschen. Weiter ist sie linear in allen
drei Komponenten.
Notation
Wir notieren Determinanten auch wieder in Matrix-Schreibweise:
x1 x2 x3
det
y1 y2 y3
statt det((x1 , y1 , z1 ), (x2 , y2 , z2 ), (x3 , y3 , z3 )).
z1 z2 z3
Die Vektoren werden als Spalten in die Matrix geschrieben.
Wie im zweidimensionalen Fall bleibt die Determinante unverändert, wenn
wir die Vektoren als Zeilen eintragen:
x1 x2 x3
det
y1 y2 y3
x1 y1 z1
= det
z1 z2 z3
x2 y2 z2
.
x3 y3 z3
Diese keineswegs offensichtliche Eigenschaft lässt sich zum Beispiel mit der folgenden Regel einsehen, die allgemein für die Berechnung von Determinanten
nützlich ist:
Satz (Regel von Sarrus)
Seien v = (x1 , y1 , z1 ), w = (x2 , y2 , z2 ), u = (x3 , y3 , z3 ) P R3 . Dann gilt
det(v, w, u) = x1 y2 z3 + x2 y3 z1 + x3 y1 z2 − x3 y2 z1 − x1 y3 z2 − x2 y1 z3
x1
x2
x3
x1
x2
y1
y2
y3
y1
y2
z1
z2
z3
z1
z2
Zur Regel von Sarrus: Bestimmung der Vorzeichen der sechs Summanden
© Oliver Deiser
Einführung in die Mathematik 1
462
4. Abschnitt
Ebene und Raum
Beweis
Mit den in der Motivation des Kreuzprodukts verwendeten (2 × 2)Determinanten d1 , d2 , d3 gilt
det(v, w, u) = ⟨v × w, u⟩ = ⟨(d1 , −d2 , d3 ), (x3 , y3 , z3 )⟩.
Ausrechnen und Umordnen liefert die sechs Summanden, wobei jede
Determinante ein positives und ein negatives Vorzeichen beiträgt.
Als Merkregel kann man verwenden: Das Vorzeichen des Summanden xi yj zk
in der Regel von Sarrus ist bestimmt durch die zyklische bzw. azyklische Anordnung der Indizes i, j, k.
Beispiele
(1) Für v = (1, 2, 3), w = (1, 0, −1), u = (0, 1, 2) gilt
det(v, w, u) = det
1
1
0
2
0
1
= 0 + 3 + 0 − 0 − 4 + 1 = 0.
3 −1 2
Damit sind v, w, u linear abhängig. Es gilt v − w − 2u = 0.
(2)
det
det
0
1
1
1
0
1
1
1
0
1
0
1
0
1
1
1
1
0
= 0 + 1 + 1 − 0 − 0 − 0 = 2.
= 0 + 0 + 0 − 1 − 0 − 1 = −2.
Die zweite Matrix entsteht durch Spaltentausch aus der ersten.
Linearkombinationen und Koordinatenvektoren
Erneut in Analogie zur Ebene definieren wir:
Definition (Spann, Linearkombination)
Seien v, w, u P R3 . Dann heißt
span(v, w, u) = { λ1 v + λ2 w + λ3 u | λ1 , λ2 , λ3 P R }
der Spann von v, w, u. Für alle λ1 , λ2 , λ3 P R heißt λ1 v + λ2 w + λ3 w eine
Linearkombination von v, w, u.
Einführung in die Mathematik 1
© Oliver Deiser
6. Der Euklidische Raum
463
Der Spann dreier Vektoren kann { 0 }, eine Gerade, eine Ebene oder der ganze
Raum R3 sein. In jedem Fall enthält der Spann den Nullvektor als Element.
Definition (Koordinaten, Koordinatenvektor bzgl. einer Basis)
Seien v, w, u P R3 linear unabhängig, s P R3 und λ1 , λ2 , λ3 P R mit
s = λ1 v + λ2 w + λ3 u.
Dann heißt (λ1 , λ2 , λ3 ) der Koordinatenvektor von s bzgl. der Basis (v, w, u).
Die Eindeutigkeit des Koordinatenvektors ergibt sich elegant aus der eindeutigen Nulldarstellung bei linearer Unabhängigkeit: Gilt
s = λ1 v + λ2 w + λ3 u = µ1 v + µ2 w + µ3 u,
so ist
0 = (λ1 − µ1 ) v + (λ2 − µ2 ) w + (λ3 − µ3 ) u.
Da die Vektoren v, w, u linear unabhängig sind, gilt λi − µi = 0 und also λi = µi
für alle i = 1, 2, 3.
Lineare Gleichungssysteme
Wir betrachten nun reelle lineare Gleichungssysteme mit drei Gleichungen
und drei Unbekannten. Ein solches System hat die Form:
(+)
a1 x + b1 y + c1 z = u1
a2 x + b2 y + c2 z = u2
a3 x + b3 y + c3 z = u3
mit
Koeffizienten
a1 , a2 , a3 , b1 , b2 , b3 , c1 , c2 , c3 P R,
Unbekannten
x, y, z P R,
rechter Seite
u = (u1 , u2 , u3 ) P R3 ,
Lösungsmenge
L = { (x, y, z) P R3 | ai x + bi y + ci z = ui für alle i = 1, 2, 3 }.
Ist L ≠ ∅, so heißt das System lösbar. Andernfalls heißt es unlösbar. Besitzt L genau
ein Element, so heißt das System eindeutig lösbar.
Notieren wir Vektoren des Raumes als Spaltenvektoren, so schreibt sich das
System (+) in der Form
(++)
a1
b1
c1
x a + y b + z c = x a2
+ y b2
+ z c2
a3
b3
c3
© Oliver Deiser
u1
=
u2
= u.
u3
Einführung in die Mathematik 1
464
4. Abschnitt
Ebene und Raum
Auf der linken Seite stehen Linearkombinationen der aus den Koeffizienten
des Systems gebildeten Vektoren a, b, c. Diese Vektoren sind genau dann linear
unabhängig, wenn det(a, b, c) ≠ 0.
Grundlegende Eigenschaften der Lösungsmenge
(1) L ≠ ∅ genau dann, wenn u P span(a, b, c).
(2) Ist det(a, b, c) ≠ 0, so ist der Koordinatenvektor von u bzgl. der Basis
(a, b, c) die eindeutige Lösung des Systems.
(3) Ist det(a, b, c) = 0, so kann L die leere Menge, eine affine Gerade, eine
affine Ebene oder der ganze Raum R3 sein.
Erneut ist folgende Unterscheidung nützlich:
Definition (homogen, inhomogen)
Ist die rechte Seite u eines Gleichungssystems der Nullvektor, so nennen
wir das System homogen. Andernfalls heißt es inhomogen.
Ein Gleichungssystem ist genau dann homogen, wenn es durch den Nullvektor gelöst wird. Im Gegensatz zu einem inhomogenen System ist also ein homogenes System immer lösbar. Jedem System können wir ein homogenes System
durch Nullsetzen der rechten Seite zuordnen. Ist das System lösbar, L seine Lösungsmenge, (x*, y*, z*) P L beliebig und L0 die Lösungsmenge des zugeordneten homogenen Systems, so gilt erneut
L = (x*, y*, z*) + L0 = { (x*, y*, z*) + (x, y, z) | (x, y, z) P L0 }.
Im Fall der Lösbarkeit gilt also wie im zweidimensionalen Fall:
Lösung = spezielle Lösung + homogene Lösung
Struktur der Lösungsmenge
(1) Es gilt det(a, b, c) ≠ 0 genau dann, wenn das System eindeutig lösbar
ist. In diesem Fall ist L = { (x*, y*, z*) } und L0 = { 0 }.
(2) Ist L eine affine Gerade oder Ebene, so ist L0 eine Gerade bzw. Ebene
durch den Nullpunkt und L die um (x*, y*, z*) verschobene Menge L0 .
(3) Ist L der gesamte Raum, so gilt dies auch für L0 . Dieser Fall tritt nur
für a = b = c = u = 0 auf.
(4) Aus L0 ≠ ∅ folgt nicht, dass L ≠ ∅. Der Fall a = b = c = 0 und u ≠ 0
zeigt, dass L = ∅ und L0 = R3 gelten kann.
Einführung in die Mathematik 1
© Oliver Deiser
6. Der Euklidische Raum
465
Übungen
Übung 1
Sei σ P R3 , s ≠ 0, und sei E = { v P R3 | ⟨v, s⟩ = 0 }. Diskutieren Sie, wie Sie
mit Hilfe der Komponenten von s eine Spanndarstellung von E erhalten
können. Führen Sie Ihre Konstruktion an konkreten Beispielen durch.
Übung 2
Sei E ⊆ R3 eine Ebene, und seien v, w P E linear unabhängig. Zeigen Sie,
dass E = E(v, w).
Übung 3
Zeigen Sie, dass für alle v, w, u P R3 und λ P R gilt:
(i) ⟨v × w, v⟩ = ⟨v × w, w⟩ = 0,
(Orthogonalität)
(ii) v × w = − (w × v),
(Antikommutativität)
(iii) (λv) × w = λ (v × w), (v + u) × w = v × w + u × w,
v × (λw) = λ (v × w), v × (w + u) = v × w + v × u,
(iv) v × v = 0,
(Alternation)
(v) v × (w × u) = ⟨v, u⟩ w − ⟨v, w⟩ u,
(Grassmann-Identität)
(vi) v × (w × u) + u × (v × w) + w × (u × v) = 0,
(vii) i v × w i = i v i i w i − ⟨v, w⟩ .
2
(Bilinearität)
2
2
2
(Jacobi-Identität)
(Lagrange-Identität)
Übung 4
Zeigen Sie, dass für alle v, w, u, s P R3 gilt:
(v × w) × (u × s) = det(v, w, s) u − det(v, w, u) s.
Übung 5
Seien E1 und E2 zwei Ebenen des R3 in Orthogonaldarstellung mit E1 ≠ E2 .
Bestimmen Sie die Gerade G = E1 ∩ E2 .
Übung 6
Zeigen Sie, dass für alle v1 , v2 , w1 , w2 P R3 gilt:
⟨v1 × v2 , w1 × w2 ⟩ = ⟨v1 , v2 ⟩ ⟨w1 , w2 ⟩ − ⟨v1 , w2 ⟩ ⟨w1 , v2 ⟩.
Übung 7
Illustrieren Sie den von v, w, u P R3 aufgespannten Spat P und die Formel
V(P) = f h = i v × w i cos(ψ) i u i = ⟨v × w, u⟩
für das orientierte Volumen von P durch ein Diagramm.
© Oliver Deiser
Einführung in die Mathematik 1
466
4. Abschnitt
Ebene und Raum
Übung 8
Zeigen Sie, dass für alle v, w, v1 ,v2 , w1 , w2 , u1 , u2 P R3 und alle λ P R gilt:
(i) det(e1 , e2 , e3 ) = 1,
(ii) det(v, w, u) = 0, falls v = w oder v = u oder w = u,
(iii) det(v, w, u) = − det(w, v, u) = − det(u, w, v) = − det(v, u, w),
(iv) det(λ v, w, u) = det(v, λ w, u) = det(v, w, λ u) = λ det(v, w, u),
det(v1 + v2 , w, u) = det(v1 , w, u) + det(v2 , w, u),
det(v, w1 + w2 , u) = det(v, w1 , u) + det(v, w2 , u),
det(v, w, u1 + u2 ) = det(v, w, u1 ) + det(v, w, u2 ).
Übung 9
Seien G1 = u1 + { λ v1 | λ P R } und G2 = u2 + { λ v2 | λ P R } affine Geraden
im R3 mit linear unabhängigen Vektoren v1 , v2 . Geben Sie mit Hilfe des
Skalar- und Kreuzprodukts eine Bedingung an, die genau dann zutrifft,
wenn sich G1 und G2 schneiden.
Übung 10
Sei T das räumliche Tetraeder mit den Ecken 0, v, w, u P R3 . Geben Sie mit
Hilfe des Skalar- und Kreuzprodukts eine Formel für das Volumen von T
an (unter Verwendung der Volumenformel „1/3 Grundfläche mal Höhe“).
Übung 11
Seien v* P R3 , G eine affine Gerade und E eine affine Ebene des R3 . Geben
Sie drei lineare Gleichungssysteme an, die { v* }, G bzw. E als Lösungsmenge besitzen.
Übung 12
Sei K : R3 × R3 → R3 eine Funktion mit den Eigenschaften:
(a) K(e1 , e2 ) = e3 , K(e2 , e3 ) = e1 , K(e3 , e1 ) = e2 .
(b) K(v, w) = − K(w, v) für alle v, w P R3 .
(c) K ist bilinear, d. h. für alle v, w, u P R3 und λ P R gilt
K(λ v, w) = K(v, λ w) = λ K(v, w),
K(v + u, w) = K(v, w) + K(u, w), K(v, w + u) = K(v, w) + K(v, u).
Zeigen Sie, dass K(v, w) = v × w für alle v, w P R3 gilt.
Einführung in die Mathematik 1
© Oliver Deiser
7. (3 × 3)-Matrizen
In Analogie zu den reellen 2 × 2-Matrizen betrachten wir nun reelle 3 × 3-Matrizen, also quadratische Gebilde aus neun reellen Zahlen. Erneut eignen sich
diese Matrizen zur Lösung von Gleichungssystemen (mit drei Gleichungen
und drei Unbekannten) und zur Beschreibung von linearen Abbildungen (des
dreidimensionalen Raumes). Nicht mehr ganz so einfach wie im Fall n = 2 ist
die Invertierung. Wir diskutieren hierzu einen Algorithmus, der das Inverse einer Matrix durch wiederholte Multiplikation mit Elementarmatrizen erzeugt
und sich ohne Schwierigkeiten auf höhere Dimensionen verallgemeinern lässt.
© Oliver Deiser
Einführung in die Mathematik 1
468
4. Abschnitt
Ebene und Raum
Grundlegendes
Eine reelle 3 × 3-Matrix hat die Form
a11 a12 a13
A =
a21 a22 a23
= (aij )1 ≤ i,j ≤ 3
a31 a32 a33
mit reellen Zahlen A(i, j) = aij , den Einträgen der Matrix. Formal können wir A
wieder als eine Funktion von { 1, 2, 3 } × { 1, 2, 3 } nach R ansehen.
Viele Begriffsbildungen, Notationen und Konventionen lassen sich von
2 × 2-Matrizen auf 3 × 3-Matrizen in natürlicher Weise übertragen. So sind
zum Beispiel der Vektor (a11 , a22 , a33 ) P R3 die (Haupt-) Diagonale und der
Skalar a11 + a22 + a33 die Spur von A. Sind alle Einträge außerhalb der Hauptdiagonalen gleich 0, so heißt die Matrix A eine Diagonalmatrix. Die Diagonalmatrix mit der Diagonale (a, b, c) bezeichnen wir wieder mit diag(a, b, c). Die
Vektoren
(a11 , a12 , a13 ), (a21 , a22 , a23 ), (a31 , a32 , a33 ) P R3
heißen die Zeilenvektoren von A, die Vektoren
(a11 , a21 , a31 ), (a12 , a22 , a32 ), (a13 , a23 , a33 ) P R3
die Spaltenvektoren von A. Wir verwenden wieder ein Komma bzw. einen Strichpunkt zur Unterscheidung von Zeilen und Spalten. Für drei Vektoren u, v, w des
R3 ist also A = (v, w, u) die Matrix mit den Zeilen v, w, u, während B = (v; w; u) die
Matrix mit den Spalten v, w, u ist.
Ist A = (v, w, u), so heißt At = (v; w; u) die zu A transponierte Matrix. Es gilt also
At (i, j) = A(j, i) für alle 1 ≤ i, j ≤ 3.
Gilt A = At , so heißt A symmetrisch.
Matrix-Operationen
Wir setzen
R
3×3
= { A | A ist eine reelle 3 × 3-Matrix }.
Sind A, B P R3 × 3 , v P R3 und λ P R, so setzen wir
A + B = (aij + bij )1 ≤ i,j ≤ 3 ,
λA = (λaij )1 ≤ i,j ≤ 3 ,
A v = (ai1 v1 + ai2 v2 + ai3 v3 )1 ≤ i ≤ 3 ,
AB = (ai1 b1j + ai2 b2j + ai3 b3j )1 ≤ i,j ≤ 3 .
Einführung in die Mathematik 1
(Matrizenaddition)
(Skalarmultiplikation)
(Matrix-Vektor-Produkt)
(Matrizenprodukt)
© Oliver Deiser
7. (3 × 3)-Matrizen
469
Weiter seien −A = (−1)A und A − B = A + (−B). Es gilt Av P R3 und AB P R3 × 3 .
Die Matrizenprodukte lassen sich wieder durch „Zeile mal Spalte“ beschreiben.
Ist B = (b1 ; b2 ; b3 ), so gilt
AB = (Ab1 ; Ab2 ; Ab3 ).
Nützlich ist die Darstellung
AB = C mit cij = ∑ 1 ≤ k ≤ 3 aik bkj für alle 1 ≤ i, j ≤ 3.
Zur Berechnung von AB sind neun Einträge zu berechnen, die alle die Form eines reellen Skalarprodukts haben.
Es gilt wieder A(BC) = (AB)C (Assoziativität), während die Kommutativität
AB = BA im Allgemeinen verletzt ist.
Die Nullmatrix 0 ist die Matrix, deren Einträge alle gleich 0 sind. Die Rolle der
1 übernimmt die Einheitsmatrix E3 = (e1 , e2 , e3 ) = (e1 ; e2 ; e3 ), mit den kanonischen
Basisvektoren e1 = (1, 0, 0), e2 = (0, 1, 0), e3 = (0, 0, 1). Es gilt
A + 0 = 0 + A = A, A E3 = E3 A = A für alle A P R3 × 3 .
Beispiele
(1)
0 =
(2)
(3)
(4)
0
0
0
0
0
0
0
0
0
, E3 = diag(1, 1, 1) =
1
0
1
0
1
0
1
0
1
0
1
1
0
0
1
0
0
0
1
0
1
1
1
0
0
1
2
1
1
2
1
0
1
1
0
1
1
0
0
−1 1
0
2
1
1
1
(5)
1
Ist A =
© Oliver Deiser
+
2
=
5
6
7
8
9
0
0
0
1
0
0
0
1
1
1
2
0
1
1
1
0
1
3
=
1
5
=
1 −1
3
4
1
t
, so gilt A =
2
1
0
1
0
1
2
2
1
1
4
7
2
5
8
3
6
9
.
Einführung in die Mathematik 1
470
4. Abschnitt
Ebene und Raum
Matrizen als lineare Abbildungen
Wie für 2 × 2-Matrizen definieren wir:
Definition (zugeordnete Abbildung)
Sei A P R3 × 3 . Dann ist die A zugeordnete Abbildung fA : R3 → R3 definiert
durch fA (v) = A v für alle v P R3 .
Es gilt wieder fA B = fA + fB für alle A, B P R3 × 3 . Die Abbildungen fA entsprechen
erneut den linearen Abbildungen des Raumes:
Definition (lineare Abbildung)
Eine Abbildung f : R3 → R3 heißt linear, falls für alle v, w P R3 und alle
λ, µ P R gilt:
f(λ v + µ w) = λ f(v) + µ f(w).
(Linearitätsbedingung)
Jede Abbildung fA : R3 → R3 ist linear und umgekehrt lässt sich jede lineare
Abbildung f : R3 → R3 eindeutig durch eine Matrix A darstellen, d. h., es gibt
genau ein A P R3 × 3 mit f = fA . Der für die Ebene geführte Beweis kann übernommen werden. Die darstellende Matrix A einer linearen Abbildung f erhalten wir, indem wir die Bilder der kanonischen Basisvektoren unter f bestimmen
und als Spalten in eine Matrix schreiben:
A = (f(e1 ); f(e2 ); f(e3 )).
Wir betrachten wieder Projektionen und Rotationen als Beispiele.
Projektionsmatrizen
Im dreidimensionalen Raum können wir einen Vektor v orthogonal auf eine
Gerade G oder eine Ebene E projizieren. Wie in der Ebene ist das
Euklidische Skalarprodukt das entscheidende Hilfsmittel.
1. Die Projektion auf eine Gerade
Sei G = G(u) die von einen normierten Vektor u P R3 aufgespannte
Gerade. Dann ist die orthogonale Projektion prG : R3 → R3 auf die
Gerade G definiert durch
prG (v) = ⟨u, v⟩ u für alle v P R3 .
Es gilt prG (v) P G und ⟨u, v − prG (v)⟩ = 0, sodass der Vektor v − prG (v)
senkrecht auf u steht. Die darstellende Matrix AG von prG hat die
Spalten
prG (ei ) = ⟨u, ei ⟩ u = ui u für i = 1, 2, 3,
sodass
Einführung in die Mathematik 1
© Oliver Deiser
7. (3 × 3)-Matrizen
u1 u1
AG =
u2 u1
u1 2
u3 u1
u1 u2
u2 u2
u3 u2
u1 u3
u2 u3
u3 u3
=
u1 u2
2
u1 u2
u2
u1 u3
u2 u3
471
u1 u3
u2 u3
.
u3 2
Die Projektion des Vektors v auf die von u erzeugte Gerade G
2. Die Projektion auf eine Ebene
Sei E = E(u, w) die von den linear unabhängigen Vektoren u, w P R3
aufgespannte Ebene. Wir nehmen an, dass die Vektoren u und w orthogonal und normiert sind. Dann ist die orthogonale Projektion
prE : R3 → R3 auf die Ebene E definiert durch
prE (v) = prG(u) (v) + prG(w) (v) = ⟨u, v⟩ u + ⟨w, v⟩ w für alle v P R3
mit den von u und w aufgespannten Geraden G(u) und G(w). Ist v P R3 ,
so gilt prE (v) P E und
⟨u, v − prE (v)⟩ = ⟨w, v − prE (v)⟩ = 0,
sodass der Vektor v − prE (v) senkrecht auf u und w steht und damit
kollinear zu u × w ist. Die darstellende Matrix AE von prE ist die Summe
der darstellenden Matrizen von prG(u) und prG(w) , sodass
u1 u1 + w1 w1 u2 u1 + w2 w1 u3 u1 + w3 w1
AE = AG(u) + AG(w) =
u1 u2 + w1 w2 u2 u2 + w2 w2 u3 u2 + w3 w2
.
u1 u3 + w1 w3 u2 u3 + w2 w3 u3 u3 + w3 w3
© Oliver Deiser
Einführung in die Mathematik 1
472
4. Abschnitt
Ebene und Raum
Die Projektion von v auf die von u und w erzeugte Ebene lässt sich als Summe
der Projektionen auf die erzeugten Geraden G(u) und G(w) auffassen.
Alle Projektionsmatrizen sind symmetrisch. Der Leser vergleiche die
Ergebnisse mit den Projektionsmatrizen der Ebene.
Rotationsmatrizen
Sei ϕ P R. Dann stellt die Matrix
Aϕ =
1
0
0
0
cosϕ
−sinϕ
0
sinϕ
cosϕ
die Rotation im R3 um den Winkel ϕ (gegen den Uhrzeigersinn) mit der
x-Achse als Drehachse dar. In den Spalten stehen die Bilder von e1 , e2 , e3
unter der Rotation. Analog beschreiben
Bψ =
cos ψ
0
sinψ
0
1
0
−sinψ
0
cosψ
, Cχ =
cosχ
−sinχ
0
sinχ
cosχ
0
0
0
1
die Rotationen um die Winkel ϕ um die y-Achse bzw. χ um die z-Achse. Da
die Komposition von Rotationen wieder eine Rotation ergibt, sind auch alle
Produkte dieser Matrizen wieder Rotationen. Man kann zeigen, dass sich
jede Rotation des R3 als Produkt der Form Aϕ Bψ Cχ darstellen lässt. Dieses
Produkt berechnet sich zu
Einführung in die Mathematik 1
© Oliver Deiser
7. (3 × 3)-Matrizen
cos χ cos ψ
−cos ψ sin χ
473
sin ψ
cos ϕ sin χ
+ cos χ sin ϕ sin ψ
cos χ cos ϕ
− sin χ sin ϕ sin ψ
−cos ψ sin ϕ
sin χ sin ϕ
− cos χ cos ϕ sin ψ
cos χ sin ϕ
+ cos ϕ sin χ sin ψ
cos ϕ cos ψ
.
Eine Rotation f : R3 → R3 lässt sich auch als Drehung um einen Winkel
ϕ mit einer durch einen normierten Vektor s P R3 definierten Achse G =
G(s) beschreiben. Eine geometrische Analyse zeigt, dass
f(v) = ⟨s, v⟩ s + cos ϕ (s × v) × s + sin ϕ (s × v) für alle v P R3 .
Dabei ist der erste Summand die Projektion von v auf die Drehachse G. Die
Vektoren v1 = (s × v) × s und v2 = (s × v) liegen in der zu G orthogonalen
Ebene E und die beiden zugehörigen Summanden beschreiben die Drehung
von v1 = prE (v) um ϕ in E. Genaueres besprechen wir in den Übungen.
Die Rotation f(v) von v um die Drehachse G und den Winkel ϕ = π/4
Die darstellende Matrix A = (f(e1 ); f(e2 ); f(e3 )) der Rotation f berechnet sich
mit w(ϕ) = 1 − cos ϕ zu
s1 2 w(ϕ) + cos ϕ
s1 s2 w(ϕ) − s3 sin ϕ
s1 s3 w(ϕ) + s2 sin ϕ
s1 s2 w(ϕ) + s3 sin ϕ
s2 2 w(ϕ) + cos ϕ
s2 s3 w(ϕ) − s1 sin ϕ
s1 s3 w(ϕ) − s2 sin ϕ
s2 s3 w(ϕ) + s1 sin ϕ
s3 w(ϕ) + cos ϕ
© Oliver Deiser
.
2
Einführung in die Mathematik 1
474
4. Abschnitt
Ebene und Raum
Invertierbarkeit
Wie für 2 × 2-Matrizen definieren wir:
Definition (invertierbar, invers, singulär)
Sei A P R3 × 3 . Gibt es ein B P R3 × 3 mit BA = E3 = BA, so heißt A invertierbar und B invers zu A. Andernfalls heißt A singulär.
Eine inverse Matrix ist im Fall der Existenz erneut eindeutig bestimmt, sodass
wir das Inverse einer invertierbaren Matrix A mit A−1 bezeichnen können. Für
alle invertierbaren Matrizen A, B P R3 × 3 gelten die Invertierungsregeln
(A−1 )−1 = A, (A B)−1 = B−1 A−1 .
Die für 2 × 2-Matrizen geführten Beweise können übernommen werden.
Beispiel
Hat A eine Nullzeile, so ist A singulär. Denn aus „Zeile mal Spalte“ folgt,
dass für jede Matrix B auch A B eine Nullzeile besitzt, sodass AB ≠ E3 .
Analog ist A singulär, wenn A eine Nullspalte besitzt.
Ein Gleichungssystem
(+)
a1 x + b1 y + c1 z = u1
a2 x + b2 y + c2 z = u2
a3 x + b3 y + c3 z = u3
können wir wieder kompakt in der Form
A (x, y, z) = u
notieren, mit der Koeffizientenmatrix A = (a; b; c) P R3 × 3 des Systems. Wie früher gilt:
Lösung durch Invertierung
Ist A invertierbar, so wird für alle rechten Seiten u P R3 das Gleichungssystem A (x, y, z) = u eindeutig durch den Vektor A−1 u gelöst.
Die eindeutige Lösbarkeit von Av = u ist erneut äquivalent zu det(A) ≠ 0. Damit ist A genau dann invertierbar, wenn det(A) ≠ 0.
Im Fall n = 2 konnten wir das Inverse einer Matrix mit Hilfe der Komplementärmatrix relativ leicht direkt angeben. Für 3 × 3-Matrizen ist eine explizite Formel für das Inverse komplizierter. Anstelle einer solchen Formel betrachten wir
einen Invertierungsalgorithmus, der sich leicht auf beliebige (n × n)-Matrizen
verallgemeinern lässt.
Einführung in die Mathematik 1
© Oliver Deiser
7. (3 × 3)-Matrizen
475
Der Invertierungsalgorithmus
Wir beschreiben zunächst den Algorithmus und illustrieren ihn durch Beispiele. Anschließend zeigen wir, dass der Algorithmus korrekt ist.
Invertierungsalgorithmus
Gegeben ist eine beliebige Matrix A P R3 × 3 . Wir versuchen, A durch
schrittweise elementare Zeilenoperationen in die Einheitsmatrix E3 zu
überführen. Dadurch entsteht eine endliche Folge A = A0 , …, Ak von
3 × 3-Matrizen. An Zeilenoperationen sind dabei erlaubt:
(a) Multiplikation einer Zeile mit λ ≠ 0.
(b) Addition des λ-fachen einer Zeile zu einer anderen Zeile.
Parallel hierzu führen wir die Zeilenoperationen an der Einheitsmatrix E3
durch, sodass eine zweite endliche Folge von 3 × 3-Matrizen E3 = B0 , …, Bk
entsteht. Wird beim Versuch, A in E3 zu überführen eine Nullzeile oder
Nullspalte produziert, so stoppen wir das Verfahren mit dem Ergebnis „A
ist singulär“. Andernfalls geben wir die Matrix Bk als Ergebnis aus.
Die Zeilenoperationen werden mit dem Ziel durchgeführt, die Matrix unterhalb und oberhalb der Diagonalen auszuräumen (Nulleinträge zu erzeugen) und
die Diagonaleinträge gleich 1 zu setzen.
Beispiel: Erzeugung einer Nullzeile
A0 =
A1 =
A2 =
1
1
0
1
0
1
0
1
1
0
0
0
1
0
2 −2
0
0
1
1
1
0
0
−1 1
0
B0 =
0
0 −1 1
B1 =
0
2 −2
0
0
1
1
1
1
0
0
−1 1
0
−2 2
1
0
0 −1 1
0
0
0
B2 =
Im ersten Schritt addieren wir das (−1)-Fache der ersten Zeile zur zweiten,
d. h. wir subtrahieren die erste Zeile von der zweiten. Im zweiten Schritt
addieren wir das 2-Fache der zweite Zeile zur dritten. Da A3 eine Nullzeile
besitzt, ist das Ergebnis der Berechnung „nicht invertierbar“.
© Oliver Deiser
Einführung in die Mathematik 1
476
4. Abschnitt
Ebene und Raum
Beispiel: Überführung in die Einheitsmatrix
A0 =
A1 =
A2 =
A3 =
A4 =
A5 =
A6 =
A7 =
1
1
0
1
0
1
1
0
0
0
1
0
1 −1 1
0
0
1
1
1
0
0
−1 1
0
1 −1 1
0
0
1
1
1
0
0
−1 1
0
0 −2 1
−1 0
1
1
1
0
0
−1 1
0
1
0
0 −1 1
1
B1 =
0
0 −1 1
1
B0 =
B2 =
0
0 −1 1
B3 =
0
0 −1
1 −2 1
1
1
1
0
0 −1 0
B4 =
0
0
0 −1 1
0
0 −1
1 −2 1
1
0
1 −1 1
0
0 −1 0
B5 =
0 −1 1
0
0 −1
1 −2 1
1
0
0
1 −1 1
0
1
0
0
0 −1
1 −2 1
1
0
0
1 −1 1
0
1
0
0
0
1
B6 =
B7 =
0
0
1 −1
1 −1
−1 2 −1
Die ersten fünf Operationen sind Zeilenadditionen, die beiden letzten
Zeilenmultiplikationen. Es gilt A7 = E3 . Das Ergebnis der Berechnung ist
also B = B7 . Nachrechnen zeigt, dass BA = E3 , sodass B = A−1 .
Einführung in die Mathematik 1
© Oliver Deiser
7. (3 × 3)-Matrizen
477
Die Elementarmatrizen
Wir zeigen nun, dass der Invertierungsalgorithmus korrekt ist: Er eignet sich
als Test auf Invertierbarkeit und er produziert im invertierbaren Fall das Inverse
der Ausgangsmatrix. Hierzu führen wir spezielle Matrizen ein, mit deren Hilfe
wir die elementaren Zeilenoperationen als Matrizenmultiplikation von links darstellen können.
Definition (Elementarmatrix, Additionstyp, Multiplikationstyp)
Seien 1 ≤ i, j ≤ 3 und λ P R. Dann ist Wij (λ) P R3 × 3 definiert als die Matrix,
die mit der Einheitsmatrix E3 übereinstimmt, aber an der Stelle (i, j) den
Eintrag λ besitzt. Eine solche Matrix W heißt eine Elementarmatrix, falls
W = Wi j (λ) mit λ P R, i ≠ j, oder
(Additionstyp)
W = Wi j (λ) mit λ P R*, i = j.
(Multiplikationstyp)
Die Matrix Wij (λ) entsteht, indem wir den Eintrag der Einheitsmatrix an der
Stelle (i, j) mit dem Skalar λ überschreiben. Befindet sich der neue Eintrag außerhalb der Hauptdiagonalen, so erhalten wir einen Additionstyp. Wird eine Eins
der Diagonalen durch λ ≠ 0 ersetzt, so erhalten wir einen Multiplikationstyp. Die
Namensgebung wird erklärt durch:
(1) Ist A P R3 × 3 und W = Wij (λ) ein Additionstyp, so ist WA die Matrix, die
entsteht, wenn wir das λ-Fache der j-ten Zeile zur i-ten Zeile von A
addieren.
(2) Ist A P R3 × 3 und W = Wii (λ) ein Multiplikationstyp, so ist WA die Matrix,
die entsteht, wenn wir die i-te Zeile von A mit λ multiplizieren.
Beispiel
W23 (5) =
W32 (5) =
1
0
0
0
1
5
0
0
1
1
2
1
0
0
1
1
0
1
0
0
5
1
1
,
,
W23 (5)
W32 (5)
1
2
1
1
2
5
8
4
1
1
2
1
2
1
1
2
0 −2 −1
0 −2 −1
1
2
1
=
=
0 −2 1
1 −8 −4
Für die Multiplikation AW einer Matrix A mit einer Elementarmatrix W von
rechts gelten analoge Aussagen für die Spalten von A. Für einen Additionstyp W
vertauschen sich dabei die Indizes, sodass AW entsteht, indem wir das λ-Fache
der i-ten Spalte zur j-ten Spalte von A addieren.
© Oliver Deiser
Einführung in die Mathematik 1
478
4. Abschnitt
Ebene und Raum
Eine Elementarmatrix ist invertierbar und ihr Inverses ist wieder eine Elementarmatrix:
(1) Das Inverse eines Additionstyps Wij (λ) ist Wij (−λ).
(2) Das Inverse eines Multiplikationstyps Wii (λ) ist Wii (1/λ).
Den Invertierungsalgorithmus können wir nun so beschreiben: Gegeben A,
versuchen wir, Elementarmatrizen L1 , …, L k zu finden, sodass
(+) L k … L1 A = E3 .
Gelingt dies, so ist
B = L k … L1 = A−1 ,
da B A = Lk … L1 A = E3 nach (+). Wegen
B = B E3 = L k … L1 E3
erzeugt unser Algorithmus im invertierbaren Fall also das Inverse von A in der
parallel ausgeführten Zeilenmanipulation von E3 . Mit obigen Notationen gilt
A0 = A, A1 = L1 A0 , A2 = L2 A1 = L2 L1 A, …
B0 = E3 , B1 = L1 B0 = L1 , B2 = L2 B1 = L2 L1 , …
Wird eine Nullzeile oder Nullspalte erzeugt, so ist die Matrix
Ak = Lk … L1 A
nicht invertierbar. Da alle Li invertierbar sind, ist notwendig A singulär. Damit
ist die Korrektheit des Algorithmus vollständig bewiesen.
Unsere Überlegungen zeigen (angewendet auf B = A−1 ), dass jede invertierbare
Matrix A als ein Produkt von Elementarmatrizen dargestellt werden kann:
Satz (Zerlegung einer invertierbaren Matrix in Elementarmatrizen)
Sei A P R3 × 3 invertierbar. Dann gibt es ein k ≥ 1 und Elementarmatrizen
L1 , …, Lk mit A = Lk … L1 .
Dieser bemerkenswerte Satz gilt analog auch für höhere Dimensionen.
Bemerkung: Deterministische Version des Invertierungs-Algorithmus
Wir haben bei unserer Formulierung des Algorithmus keine Strategie
vorgegeben, wie der Versuch der Umwandlung von A in E3 durchzuführen
ist. Es gibt verschiedene Möglichkeiten, dies zu organisieren. Eine
deterministische Version erhalten wir zum Beispiel, indem wir solange
möglich (1) A Spalte für Spalte unterhalb der Hauptdiagonalen ausräumen,
(2) A Spalte für Spalte oberhalb der Hauptdiagonalen ausräumen, (3) die
Diagonale normieren. Alternativ können wir die Spalten von A auch gleich
unter- und oberhalb der Diagonalen ausräumen und dabei auch die
Normierung der Diagonaleinträge durchführen.
Einführung in die Mathematik 1
© Oliver Deiser
7. (3 × 3)-Matrizen
479
Eigenwerte und Eigenvektoren
Wie für die Dimension n = 2 definieren wir:
Definition (Eigenwerte und Eigenvektoren)
Seien A P R3 × 3 , λ P R und v P R2 mit v ≠ 0. Dann heißt λ ein Eigenwert
und v ein zu λ gehöriger Eigenvektor von A, falls A v = λ v.
Erneut gilt für alle A P R3 × 3 , λ P R und v P R3 die Äquivalenz:
A v = λ genau dann, wenn (A − λE2 ) v = 0.
Mit Aλ = A − λ E3 , ist also λ genau dann ein Eigenwert von A, wenn das homogene Gleichungssystem Aλ v = 0 eine vom Nullvektor verschiedene Lösung v besitzt. Dies ist genau dann der Fall, wenn det(Aλ ) = 0. Wir definieren:
Definition (charakteristisches Polynom)
Sei A P R3 × 3 . Dann heißt das Polynom pA : R → R dritten Grades mit
pA (λ) = det(Aλ ) = det(A − λE3 ) für alle λ P R
das charakteristische Polynom von A.
Die Eigenwerte von A sind genau die reellen Nullstellen von pλ . Eine Berechnung der Determinante von Aλ zeigt, dass
pA (λ) = −λ3 + spur(A) λ2 − (det(A′11 ) + det(A′22 ) + det(A′33 )) λ + det(A)
für alle λ P R, wobei A′ij die (2 × 2)-Matrix ist, die aus A durch Streichen der i-ten
Zeile und j-ten Spalte hervorgeht.
Beispiel
Für die obere Dreiecksmatrix A = ((1, 2, 3), (0, 1, 1), (0, 0, 1)) gilt
A′11 =
1
1
0
1
, A′22 =
1
3
0
1
, A′33 =
1
2
0
1
,
pA (λ) = −λ3 + 3λ2 − 3λ + 1 = − (λ − 1)3 für alle λ P R.
Damit ist λ = 1 eine dreifache Nullstelle von A. Lösen von (A − E3 ) v = 0
zeigt, dass genau die Vektoren µe1 mit µ P R* Eigenvektoren von A zum
Eigenwert 1 sind. Die Matrix A ist ein Beispiel dafür, dass zu einem
mehrfachen Eigenwert nicht notwendig zwei oder mehr linear unabhängige
Eigenvektoren gehören müssen.
Das charakteristische Polynom einer (3×3) Matrix hat stets den Grad 3. Da ein
reelles Polynom ungeraden Grades eine reelle Nullstelle besitzt, erhalten wir:
© Oliver Deiser
Einführung in die Mathematik 1
480
4. Abschnitt
Ebene und Raum
Satz (Existenz von Eigenwerten)
Jede reelle (3 × 3)-Matrix besitzt mindestens einen reellen Eigenwert.
Beschreibt zum Beispiel A eine Rotation des dreidimensionalen Raumes, so
sind die von Null verschiedenen Vektoren der Drehachse Eingenvektoren von A
zum Eigenwert 1. Ist die Rotation echt (also nicht die Identität auf R3 ), so gibt es
keine weiteren Eigenwerte und Eigenvektoren.
Erneut gilt (mit einem etwas komplizierteren Beweis) der fundamentale:
Satz (Spektralsatz)
Sei A P R3 × 3 . Dann sind äquivalent:
(a) A ist symmetrisch.
(b) Es gibt paarweise zueinander orthogonale Eigenvektoren v,w,u von A.
Hieraus ergibt sich erneut die Diagonalisierung A = S−1 D S einer symmetrischen Matrix A und die Singulärwertzerlegung A = S−1 D1/2 T einer beliebigen
Matrix A, mit D diagonal und S, T orthogonal, d. h. S−1 = St , T−1 = Tt . Die Einheitssphäre S = { v P R3 | i v i = 1 } wird durch A in ein Ellipsoid E transformiert
(das degeneriert ist, wenn A singulär ist). Die Singulärwerte von A sind die Halbachsen von E und die Spalten von S−1 sind normierte Halbachsenrichtungen.
Beispiel
Seien B die Rotationsmatrix der Drehung um die x-Achse und ϕ = π/4 und
D = diag(3, 2, 1). Dann gilt cos ϕ = sin ϕ = 1/£2 und
0
3
0
cosϕ −sinϕ D =
0
£2 −1/£2
0
sinϕ cosϕ
0
£2
1
A = BD =
0
0
0
1/£2
beschreibt die Achsenskalierung gemäß D gefolgt von der Drehung B. Die
Einheitssphäre wird zu einem Ellipsoid mit den Halbachsen 3, 2, 1.
Einführung in die Mathematik 1
© Oliver Deiser
7. (3 × 3)-Matrizen
481
Übungen
Übung 1
Seien G = span(u) und E = span(u, w) mit normierten und orthogonalen
Vektoren u, w P R3 . Zeigen Sie, dass für alle v P R3 gilt:
(a) prG (prG (v)) = prG (prE (v)) = prE (prG (v)) = prG (v),
(b) prE (prE (v)) = prE (v).
Was bedeuten diese Eigenschaften für die darstellenden Matrizen?
Übung 2
Sei G = span(u) für einen normierten Vektor u P R3 . Weiter sei v P R3 .
Zeigen Sie, dass der Vektor prG (v) P G den kleinsten Euklidischen Abstand
zu v unter allen Vektoren von G besitzt.
Übung 3
Formulieren und beweisen Sie eine zur vorangehenden Übung analoge
Aussage für die orthogonale Projektion auf eine Ebene.
Übung 4
Seien Aϕ , Bψ die Rotationsmatrizen für Drehungen um die x- bzw. y-Achse.
Berechnen Sie Aϕ Bψ − Bψ Aϕ . Was lässt sich für im Betrag kleine Winkel ϕ
und ψ feststellen? Betrachten Sie hierzu eine Taylor-Entwicklung der
Einträge.
Übung 5
Sei f : R3 → R3 die Rotation um den Winkel ϕ (gegen den Uhrzeigersinn)
um eine durch einen normierten Vektor s P R3 gegebene Achse.
(a) Begründen Sie die Formel
f(v) = ⟨s, v⟩ s + cos ϕ (s × v) × s + sin ϕ (s × v) für alle v P R3
geometrisch.
(b) Berechnen Sie mit Hilfe von (a) die darstellende Matrix von f.
Übung 6
Was lässt sich über die Determinante einer Rotationsmatrix und einer
Projektionsmatrix sagen?
© Oliver Deiser
Einführung in die Mathematik 1
482
4. Abschnitt
Ebene und Raum
Übung 7
Lösen Sie für eine beliebige rechte Seite u P R3 das Gleichungssystem
x + 2y + 3z = u1
x +
y +
z = u2
2x + 2y +
z = u3
durch Invertierung der Koeffizientenmatrix A = (a; b; c). Verwenden Sie
dabei den Invertierungsalgorithmus zur Berechnung von A−1 .
Übung 8
Wie lässt sich die Vertauschung zweier Zeilen einer Matrix durch Linksmultiplikation mit Elementarmatrizen gewinnen?
Übung 9
Sei A P R3 × 3 invertierbar. Zeigen Sie, dass es Additionstypen L1 , …, Lk gibt
derart, dass Lk … L1 A eine Diagonalmatrix ist.
Einführung in die Mathematik 1
© Oliver Deiser
5. Abschnitt
Mehrdimensionale Analysis
© Oliver Deiser
Einführung in die Mathematik 1
1. Kurven
Wir betrachten nun stetige Funktionen der Form f : [a, b] → Rm , mit einem reellen Intervall [ a, b ] und einer beliebigen Dimension m ≥ 1, sog. Kurven. Für die
analytische Untersuchung von Kurven genügt die eindimensionale Differentialund Integralrechnung: Die Ableitungen der Komponentenfunktionen einer
Kurve liefern Tangentialvektoren und die Länge einer Kurve können wir mit
Hilfe des Riemann-Integrals im Zusammenspiel mit der Euklidischen Norm berechnen.
© Oliver Deiser
Einführung in die Mathematik 1
486
5. Abschnitt
Mehrdimensionale Analysis
Vektoren als Funktionswerte
Wir betrachten nun Funktionen der Form
f : R → Rm oder allgemeiner f : P → Rm mit P ⊆ R.
Dabei ist m eine beliebige natürliche Zahl größer oder gleich Eins. Der Definitionsbereich besteht aus reellen Zahlen, während die Funktionswerte Vektoren
des Rm sind. Wichtige Spezialfälle sind wieder m = 2 und m = 3.
In Erweiterung des Grenzwertbegriffs für reelle Folgen definieren wir:
Definition (Grenzwerte im Rm )
Seien m ≥ 1, (xn )n P N eine Folge im Rm und y P Rm . Dann heißt y
Grenzwert von (xn )n P N , falls gilt
∀ε > 0 ∃n0 ∀n ≥ n0 i y − xn i < ε.
Im Vergleich zum eindimensionalen Begriff ist also lediglich der Abstand
zweier reeller Zahlen durch den Abstand zweier Vektoren ersetzt. Dabei wird der
Abstand zweier Vektoren mit Hilfe der Euklidischen Norm berechnet.
Im Fall der Existenz ist der Grenzwert einer Folge erneut eindeutig bestimmt
und wir schreiben wieder limn → ∞ xn oder limn xn für diesen Grenzwert.
Ist (xn )n P N = ((xn, 1 , …, xn, m ))n P N eine Folge im Rm und y = (y1 ,…, ym ) P Rm ,
so sind äquivalent:
(1) limn xn = y.
(2) limn xn, k = yk für alle 1 ≤ k ≤ m.
(komponentenweise Konvergenz)
m
Eine konvergente Folge im R besteht also aus m konvergenten reellen Folgen
(der Leser vergleiche dies mit der Konvergenz einer Folge in C = R2 ). Hieraus ergeben sich Limesregeln für Folgen im Rm , z. B.
limn (xn + yn ) = limn xn + limn yn .
Auch die Stetigkeitsbegriffe können wir leicht erweitern:
Definition (Stetigkeit für mehrdimensionale Funktionswerte)
Seien m ≥ 1, P ⊆ R und f : P → Rm . Weiter sei p P P. Dann heißt f
ε-δ-stetig oder umgebungsstetig an der Stelle p, falls gilt:
∀ε > 0 ∃δ > 0 ∀x P P (|x − p| < δ → i f(x) − f(p) i < ε).
Weiter heißt f folgenstetig an der Stelle p, falls für jede Folge (xn )n P N in P
gilt, dass
limn xn = p → limn f(xn ) = f(p).
Ist f umgebungs- bzw. folgenstetig an allen Stellen p P P, so heißt f
umgebungsstetig bzw. folgenstetig.
Einführung in die Mathematik 1
© Oliver Deiser
1. Kurven
487
Für die Dimension m = 2 besagt die ε-δ-Stetigkeit von f an der Stelle p, dass für
jedes (noch so kleine) ε > 0 ein δ > 0 existiert derart, dass die Menge
] p − δ, p + δ [ ∩ P ⊆ R
durch die Funktion f in die offene Kreisscheibe
Uε (f(p)) = { (x, y) P R2 | i (x, y) − f(p) i < ε } ⊆ R2
mit Mittelpunkt f(p) und Radius ε abgebildet wird. Erneut ist ε mit dem Wertebereich und δ mit dem Definitionsbereich von f assoziiert.
Die beiden Stetigkeitsbegriffe erweisen sich wie im eindimensionalen Fall als
äquivalent, sodass wir auch kurz von Stetigkeit ohne Zusatz sprechen können.
So wie wir eine Folge im Rm in m reelle Folgen aufspalten können, so können
wir eine Funktion f : P → Rm in m reelle Funktionen zerlegen:
Definition (Komponentenfunktionen)
Seien m ≥ 1, P ⊆ R und f : P → Rm . Dann heißen die reellen Funktionen
f1 , …, fm : P → R mit
f(x) = (f1 (x), …, fm (x)) für alle x P P
die Komponenten- oder Koordinatenfunktionen von f.
Beispiele
(1) Sei m = 2 und f : P → R2 . Dann können wir f als komplexwertige
Funktion auffassen. Es gilt
f1 (x) = Re(f(x)), f2 (x) = Im(f(x)) für alle x P P.
(2) Sei m = 3 und f : R → R3 mit f(x) = (x, ex , sin x) für alle x P R. Dann
ist f1 die Identität, f2 die Exponentialfunktion und f3 die Sinusfunktion auf R.
Für alle m ≥ 1, P ⊆ R, f : P → Rm und p P P sind äquivalent:
(1) f ist stetig an der Stelle p.
(2) f1 , …, fm sind stetig an der Stelle p.
(komponentenweise Stetigkeit)
In dieser Weise kann der Stetigkeitsbegriff für vektorwertige Funktionen auf
den skalarwertigen Fall zurückgeführt werden.
Bemerkung
Anstelle von „komponentenweiser Konvergenz/Stetigkeit“ und „Komponentenfunktionen“ sprechen wir gleichwertig auch von „koordinatenweiser
Konvergenz/Stetigkeit“ bzw. „Koordinatenfunktionen“.
Nach diesen technischen Vorbereitungen können wir uns dem eigentlichen
Thema dieses Kapitels zuwenden.
© Oliver Deiser
Einführung in die Mathematik 1
488
5. Abschnitt
Mehrdimensionale Analysis
Parametrisierte Kurven
Definition (Kurve, Parameter, Bahn, Spur)
Sei m ≥ 1, und sei [ a, b ] ⊆ R ein reelles Intervall. Weiter sei f : [ a, b ] → Rm
stetig. Dann heißt f eine (parametrisierte) Kurve im Rm und jedes t P [ a, b ]
heißt ein Parameter von f. Der Wertebereich
spur(f) = { f(t) | t P [ a, b ] }
von f heißt auch die Bahn oder Spur von f.
Wir bevorzugen hier die Variable t anstelle von x, um die in vielen Fällen
nützliche dynamische Interpretation einer Kurve zu unterstützen. Dabei wird t als
Zeitvariable und f(t) als der Ort eines sich in der Zeit t P [ a, b ] bewegenden
Punktes interpretiert. Wir betonen, dass es sich um eine für die Dimensionen
m = 2 und m = 3 anschauliche Interpretation handelt, die rein mathematisch
nicht relevant ist. Wir können als Variable zum Beispiel auch x, y oder u verwenden, wenn wir möchten.
Wichtig ist es, eine Kurve von ihrer Spur zu unterscheiden. Aus einer Kurve
ergibt sich die Spur, aber nicht umgekehrt. Beim Übergang von f zu spur(f ) geht
die Information verloren, wie die Spur durchlaufen wird: Durchlaufrichtung,
Geschwindigkeit und Wiederholungen sind nicht mehr erkennbar.
Oft liegt eine „linienartige“ Menge P ⊆ Rm vor, die man mit Hilfe einer
Kurve analytisch beschreiben möchte. Gesucht ist eine Parametrisierung von P,
d. h. eine Kurve f : [ a, b ] → Rm , deren Spur gleich P ist. Das Standardbeispiel
ist die Parametrisierung des Einheitskreises
K = { (x, y) P R2 | x2 + y2 = 1 }.
Der Kreis K wird durch die Kurve f : [ 0, 2π ] → R2 mit
f(t) = (cos t, sin t) für alle t P [ 0, 2π ]
parametrisiert. Aber auch g : [ 0, 2π ] → R2 mit
g(t) = (sin t, cos t) für alle t P [ 0, 2π ]
ist eine Parametrisierung von K.
Wir führen noch einige suggestive Sprechweisen ein.
Definition (Startpunkt, Endpunkt, geschlossen, offen)
Sei f : [ a, b ] → Rm eine Kurve. Dann heißt f(a) der Startpunkt und f(b) der
Endpunkt von f. Gilt f(a) = f(b), so heißt die Kurve geschlossen. Andernfalls
heißt sie offen.
Einführung in die Mathematik 1
© Oliver Deiser
1. Kurven
489
Tangentialvektoren
Mit Hilfe der Komponentenfunktionen können wir die Grundbegriffe der
Differentialrechnung ohne Schwierigkeit auf Kurven übertragen:
Definition (differenzierbar, Ableitung, Tangentialvektor, regulär, singulär)
Sei f : [ a, b ] → Rm eine Kurve. Weiter sei t P [ a, b ]. Dann heißt f (stetig)
differenzierbar an der Stelle t, falls alle Komponenten f1 , …, fm von f an der
Stelle t (stetig) differenzierbar sind. Wir setzen dann
f ′(t) = (f1 ′(t), …, fm ′(t)) P Rm .
Der Vektor f ′(t) heißt die Ableitung oder der Tangentialvektor von f an der
Stelle t. Ist f ′(t) ≠ 0, so heißt der Parameter t regulär. Ist f ′(t) = 0, so heißt t
singulär. Schließlich heißt f (stetig) differenzierbar, falls f (stetig) differenzierbar für alle t P [ a, b ] ist.
Unter der dynamischen Interpretation ist f ′(t) der Geschwindigkeitsvektor
der Kurve f zum Zeitpunkt t. Der Betrag der Geschwindigkeit ist
λ = i f ′(t) i = £f1 ′(t)2 + … + fm ′(t)2 .
Ist λ ≠ 0, d.h. t ein regulärer Parameter, so ist f ′(v)/λ die normierte Richtung der
Geschwindigkeit, und diese Richtung ist tangential zur Spur von f. Ist λ = 0, so
steht ein sich gemäß f(t) bewegender Punkt zum Zeitpunkt t still.
Beispiele
(1) Sei f : [ 0, 2π ] → R2 definiert durch
f(t) = ei t = (cos t, sin t) für alle t P [ 0, 2π ].
Dann ist f eine geschlossene Kurve, die die gleichmäßige Bewegung
eines Punktes auf dem Einheitskreis gegen den Uhrzeigersinn mit
Startpunkt 1 = (1, 0) beschreibt. Die Spur von f ist der Einheitskreis K.
Die Kurve ist stetig differenzierbar mit
f ′(t) = (cos′ t, sin′ t) = (−sin t, cos t) für alle t P [ 0, 2π].
Der Tangentialvektor f ′(t) hat für alle t P [ 0, 2π ] die Länge 1 und er
steht senkrecht auf dem Vektor f(t), da
⟨f(t), f ′(t)⟩ = ⟨(cos t, sin ), (−sin t, cos t)⟩ = 0.
(2) Sei f : [ 0, 4π ] → R2 definiert durch
f(t) = ei t = (cos t, sin t) für alle t P [ 0, 4π ].
Der Einheitskreis wird nun zweimal durchlaufen. Die Spur von f ist
erneut der Einheitskreis K.
© Oliver Deiser
Einführung in die Mathematik 1
490
5. Abschnitt
Mehrdimensionale Analysis
(3) Sei c ≠ 0, b = 2π/|c|, und sei f : [ 0, b ] → R2 definiert durch
f(t) = ei c t = (cos(ct), sin(ct)) für alle t P [ 0, b ].
Der Einheitskreis wird nun mit der Geschwindigkeit c durchlaufen,
gegen den Uhrzeigersinn für c > 0 und im Uhrzeigersinn für c < 0.
(4) Sei k P N*, und f : [ 0, k2π ] → R3 mit
f(t) = (cos t, sin t, t) für alle t P [ 0, k2π ].
Die Kurve f beschreibt eine k-fache Schraubbewegung im dreidimensionalen Raum.
(5) Sei g : [ a, b ] → R eine stetige reelle Funktion. Wir definieren die
Kurve f : [ a, b ] → R2 durch
f(t) = (t, g(t)) für alle t P [ a, b ].
Dann ist f eine Kurve in der Ebene, deren Spur der Graph von g ist. Ist
g (stetig) differenzierbar, so gilt dies auch für die Kurve f mit
f ′(t) = (1, g′(t)) für alle t P [ a, b ].
Der Leser beachte, dass der Graph von f (den wir wie immer mit f
identifizieren) von g zu unterscheiden ist. Es gilt
f = graph(f ) = { (t, f(t)) | t P [ a, b ] } = { (t, (t, g(t))) | t P [ a, b ] },
g = graph(g) = { (t, g(t)) | t P [ a, b ] } = { f(t) | t P [ a, b ] } = spur(f ).
Das folgende Diagramm veranschaulicht die Situation für die
Funktion g : [ 0, 3 ] → R mit g(t) = arctan(t) für alle t P [ 0, 3 ].
1.5
f (2)
f (1)
f (0)
1
f(2)
arctan(x)
1
x2 +1
f(1)
0.5
f(0)
0.5
1
1.5
2
2.5
3
Der Graph von g ist die Spur von f. Die Ableitung von g
entspricht der y-Komponente der Tangentialvektoren von f.
Wir betrachten nun die Visualisierung der Kurvenbegriffe an einem Beispiel
noch genauer.
Einführung in die Mathematik 1
© Oliver Deiser
1. Kurven
491
Visualisierung
Sei f : [ 0, 2π ] → R2 mit
f(t) = (cos t, sin t) + 1/4 (cos(4t), sin(4t))
für alle t P [ 0, 2π ].
Die Kurve f ist geschlossen und differenzierbar mit
f ′(t) = (−sin t, cos t) + (− sin(4t), cos(4t))
für alle t P [ 0, 2π ].
f(t4 )
f(t3 )
1
f(t1 )
f(t2 )
0.5
f(t5 )
f(0) = f(2 )
f(t6 )
-1
-0.5
0.5
1
f(t7 )
-0.5
f(t10 )
f(t11 )
-1
f(t9 )
f(t8 )
Die Spur von f und die Werte f(tk ) für die Parameter tk = k π/6, k = 0, …, 12
1
0.5
f1 (t)
3
2
3
4
3
5
3
2
f2 (t)
-0.5
-1
Die Komponenten f1 und f2 von f
© Oliver Deiser
Einführung in die Mathematik 1
492
5. Abschnitt
Mehrdimensionale Analysis
2
1
-2
-1
1
2
-1
-2
Die Tangentialvektoren von f für obige Parameter. Drei der Vektoren sind 0.
g(0) = g(2 )
2
g(t3 )
g(t9 )
1
g(t1 )
-2
g(t11 )
-1
1
2
-1
g(t4 )
g(t8 )
g(t7 )
g(t5 )
-2
Die Ableitung g = f ′ als Kurve. Es gilt g(t4 ) = g(t7 ) = g(t10 ) = 0, sodass die Parameter
t4 , t7 und t10 singulär sind. Alle anderen Parameter sind regulär.
Einführung in die Mathematik 1
© Oliver Deiser
1. Kurven
493
Die Länge einer Kurve
Ähnlich wie „Fläche zwischen Graph und x-Achse“ können wir „Länge einer
Kurve“ für Kurven mit hinreichend guten Eigenschaften definieren. Wie so oft
in der Analysis geschieht dies durch Approximation und Grenzwertbildung. Zur
Approximation verwenden wir Polygon-Züge:
Definition (Polygon-Approximation)
Sei f : [ a, b ] → Rm eine Kurve, und sei p = (tk )k ≤ n eine (stützstellenfreie)
Partition von [ a, b ]. Dann setzen wir
Lp f = ∑ k ≤ n i f(tk + 1 ) − f(tk ) i (wobei wieder tn + 1 = b).
Die reelle Zahl Lp f ist die Euklidische Länge des durch die Punkte
f(a) = f(t0 ), f(t1 ), f(t2 ), …, f(tn ), f(tn + 1 ) = f(b)
definierten Polygon-Zugs im Rm . Je feiner die Partition p ist, desto mehr nähert
sich Lp f anschaulich der Länge der Kurve f an.
f(t4 )
f(t3 )
1
f(t1 )
0.5
f(t2 )
f(t5 )
f(0) = f(2 )
f(t6 )
-1
-0.5
0.5
1
f(t7 )
-0.5
f(t10 )
f(t11 )
-1
f(t9 )
f(t8 )
Zwei Polygon-Approximationen an die Kurve des obigen Beispiels. In der zweiten
Approximation werden die Zerlegungspunkte k π/12, k = 0, …, 24 verwendet.
© Oliver Deiser
Einführung in die Mathematik 1
494
5. Abschnitt
Mehrdimensionale Analysis
Diese Überlegungen motivieren:
Definition (rektifizierbar, Länge)
Sei f : [ a, b ] → Rm eine Kurve. Dann heißt f rektifizierbar, falls
L(f) = limδ(p)
→0
Lp f
existiert. In diesem Fall heißt L(f) die (Euklidische) Länge von f.
Der Grenzwert
c = limδ(p)
→0
Lp f
bedeutet, dass für jede Folge (pn )n P N von Partitionen von [ a, b ], deren Feinheiten gegen Null konvergieren, die Folge (Lpn f )n P N der Längen der zugehörigen
Polygon-Approximationen gegen den gleichen reellen Wert c konvergiert. Der
Leser vergleiche dies mit der Definition des Riemann-Integrals.
Der Hauptsatz zur Längenberechnung einer Kurve lautet:
Satz (Längenformel für stetig differenzierbare Kurven)
Sei f : [ a, b ] → Rm eine stetig differenzierbare Kurve. Dann ist f rektifizierbar und es gilt
L(f) =
*
b
a
i f ′(t) i dt.
(Längenformel)
Der Beweis wird in der Analysis geführt. Wir begnügen uns hier mit einem dynamischen Argument, durch das die Formel plausibel wird: Nach der Formel
„Weg ist Geschwindigkeit mal Zeit“ können wir i f ′(t) i dt als den infinitesimal
zurückgelegten Weg auffassen. Im Integral werden diese infinitesimalen Wege
zur Gesamtlänge des zurückgelegten Weges aufsummiert.
Beispiel 1: Kreisumfang
Seien r > 0 und [ a, b ] ein reelles Intervall. Wir definieren die stetig
differenzierbare Kurve f : [ a, b ] → R2 durch
f(t) = r eit = r (cos t, sin t) für alle t P [ a, b ].
Dann gilt i f ′(t) i = r für alle t P [ a, b ]. Damit ist
L(f ) =
*
a
b
i f ′(t) i dt =
*
b
r dt = r(b − a).
a
Für [ a, b ] = [ 0, 2π ] ergibt sich der Umfang r2π eines Kreises mit Radius r.
Die Längenberechnung berücksichtigt allgemeiner aber auch teilweise und
mehrfache Durchläufe des Kreises. So ergibt sich zum Beispiel die Länge
2krπ für Intervalle der Form [ 0, 2kπ ].
Einführung in die Mathematik 1
© Oliver Deiser
1. Kurven
495
Beispiel 2: Parabelbogen
Wir berechnen die Länge eines Parabelbogens. Sei hierzu [ a, b ] ein reelles
Intervall, und sei f : [ a, b ] → R2 definiert durch
f(t) = (t, t2 ) für alle t P [ a, b ].
Die stetig differenzierbare Kurve f durchläuft den durch das Intervall [ a, b ]
definierten Bogen der Einheitsparabel. Es gilt
f ′(t) = (1, 2t), i f ′(t) i 2 = 1 + 4t2 für alle t P [ a, b ].
Zur Berechnung der Länge von f verwenden wir, dass
* £c2 + t2 dt
1
2
=
( t £c2 + t2
+ c2 log( t + £c2 + t2 )
)
für alle c P R.
Mit c = 1/2 erhalten wir
L(f ) =
*
b
a
*
i f ′(t) i dt =
b
£1 + 4t2 dt
a
b
= 2 * £(1/2)2 + t2
a
=
t £1/4 + t2 +
1
log( t + £1/4 + t2 )
4
t=b
.
t=a
Für das Intervall [ a, b ] = [ 0, 1 ] ergibt sich
L(f ) =
£5
2
+
1
£5
log( 1 +
4
2
=
£5
2
+
1
log( 2 + £5 ) = 1,4789…
4
)
−
1
1
log(
4
2
)
Zum Vergleich: Die Länge der Diagonalen des Einheitsquadrats ist gleich
£2 = 1,4142… Wir machen also keinen allzu großen Umweg, wenn wir
anstelle der Diagonalen auf dem Parabelbogen von (0, 0) nach (1, 1) laufen.
Beispiel 3: Umfang einer Ellipse
Seien a ≥ b > 0. Wir berechnen den Umfang der achsenparallelen Ellipse
Ea, b = { (x, y) P R2 | (x/a)2 + (y/b)2 = 1 }
mit den Halbachsen a und b. Eine (traditionelle) Parametrisierung von Ea, b
ist gegeben durch die Kurve f : [ 0, 2π ] → R2 mit
f(t) = (a sin t, b cos t) für alle t P [ 0, 2π ].
Die Kurve durchläuft die Ellipse startend im Punkt (0, b) im Uhrzeigersinn.
Sie ist stetig differenzierbar mit
f ′(t) = (a cos t, − b sin t) für alle t P [ 0, 2π ].
© Oliver Deiser
Einführung in die Mathematik 1
496
5. Abschnitt
Mehrdimensionale Analysis
Für alle ϕ P [ 0, 2π ] gilt
L(f|[0, ϕ])
*
=
ϕ
0
i f ′(t) i dt =
*
ϕ
£a2 cos2 t + b2 sin2 t dt
0
ϕ
= a * £1 − ε2 sin2 t dt,
0
2
2
wobei wir a cos t = a2 (1 − sin2 t) verwendet und
ε = £1 − b2 /a2 P [ 0, 1 [
(numerische Exzentrizität von Ea,b )
gesetzt haben. Man kann zeigen, dass für ε ≠ 0 keine elementare Stammfunktion des Integranden
£1 − ε2 sin2 t
existiert. Der Versuch, die Länge der Bögen einer Ellipse Ea, b mit den
Halbachsen a ≠ b zu berechnen, gibt also Anlass zur Einführung einer
neuen nichtelementaren Funktion. Für ε P [ 0, 1 [ und ϕ P R ist das
elliptische Integral zweiter Art definiert durch
E(ϕ, ε) =
*
0
ϕ
£1 − ε2 sin2 t dt.
Der Umfang der Ellipse Ea, b berechnet sich zu a E(2π, ε). Im Gegensatz zur
Flächenberechnung ist das Problem der Umfangsberechnung einer Ellipse
also deutlich schwieriger. Es sprengt den Rahmen der elementaren
Funktionen.
2
E( , 0)
E( , 2/3)
E( , 0.9)
E( , 0.999)
2
Das elliptische Integral E(ϕ, ε) zweiter Art auf [ 0, 2π ] für einige ε
Einführung in die Mathematik 1
© Oliver Deiser
1. Kurven
497
Übungen
Übung 1
Seien a, ϕ > 0. Wir definieren die Archimedische Spirale f : [ 0, ϕ ] → R2 durch
f(t) = a t (cos t, sin t) für alle t P [ 0, ϕ ].
(a) Skizzieren Sie spur(f) für a = 1 und ϕ = 2π.
(b) Beschreiben Sie qualitativ die Bedeutung der Parameter a und ϕ für
die Kurve f.
(c) Berechnen Sie L(f ) in Abhängigkeit von a und ϕ.
Übung 2
Wir definieren die Zykloide f : [ 0, 2π ] → R2 durch
f(t) = (t − sin(t), 1 − cos(t)) für alle t P [ 0, 2π ].
(a) Begründen Sie, dass die Zykloide die Bewegung des Punktes
p = (0, 0) auf dem Kreis
K = { (x, y) P R2 | x2 + (y − 1)2 = 1 }
mit Radius 1 und Mittelpunkt (0, 1) beschreibt, wenn K auf der
x-Achse im vollen Umfang abrollt ohne zu rutschen. Erstellen Sie
eine Skizze, die Ihre Argumentation erläutert.
(b) Skizzieren Sie die Spur von f und markieren Sie einige Werte f(t).
(c) Berechnen Sie L(f ) mit Hilfe der Integrationsregeln.
Übung 3
Seien a ≥ b > 0, und sei
Ea, b = { (x, y) P R2 | (x/a)2 + (y/b)2 = 1 }
die achsenparallele Ellipse mit den Halbachsen a und b. Wir definieren
f : [ 0, 2π ] → R2 durch
f(t) = (a cos t, b sin t) für alle t P [ 0, 2π ].
Zeigen Sie, dass Ea, b = spur(f ).
© Oliver Deiser
Einführung in die Mathematik 1
498
5. Abschnitt
Mehrdimensionale Analysis
Übung 4
Seien a ≥ b > 0, und sei
Ea, b = { (x, y) P R2 | (x/a)2 + (y/b)2 = 1 }.
Wir setzen
p = £a2 − b2 , F1 = (p, 0), F2 = (−p, 0),
E = { (x, y) P R2 | i (x, y) − F1 i + i (x, y) − F2 i = 2a }.
Zeigen Sie, dass Ea, b = E.
Übung 5
Sei a > 0. Wir definieren die Lemniskate von Bernoulli (zum Parameter a)
f : [ 0, 2π ] → R2 durch
f(t) =
a cos t
1 + sin2 t
(1, sin t) für alle t P [ 0, 2π ].
Weiter setzen wir
p = a/£2, F1 = (p, 0), F2 = (−p, 0).
(a) Skizzieren Sie spur(f ), F1 und F2 für a = 1/2, 1, 3/2.
(b) Zeigen Sie, dass
spur(f ) = { (x, y) P R2 | (x2 + y2 )2 = a2 (x2 − y2 ) }
= { (x, y) P R2 | i (x, y) − F1 i i (x, y) − F2 i = p2 }.
(c) Bringen Sie L(f ) mit geeignet definierten c, ε P R in die Form
L(f ) = c
*
π/2
0
1
£1 + ε2 sin2 t
dt.
(Der Integrand besitzt keine elementare Stammfunktion.)
Einführung in die Mathematik 1
© Oliver Deiser
2. Partielle Ableitungen
Wir betrachten nun Funktionen der Form f : Rn → R oder allgemeiner f : P → R
mit P ⊆ Rn , für eine beliebige Dimension n ≥ 1. Im Gegensatz zu den Kurven sind
nun die Funktionswerte reelle Skalare, während die Stellen reelle Vektoren sind.
Erneut genügt die eindimensionale Differentialrechnung, um einen Ableitungsbegriff für diesen Funktionstyp zu etablieren.
Schließlich betrachten wir noch allgemeiner Funktionen des Typs f : Rn → Rm
mit beliebigen Dimensionen n, m ≥ 1. In dieser Klasse sind vor allem die zwei
bzw. dreidimensionalen Vektorfelder
f : R2 → R2 bzw. f : R3 → R3
von Bedeutung.
© Oliver Deiser
Einführung in die Mathematik 1
500
5. Abschnitt
Mehrdimensionale Analysis
Mehrdimensionale Definitionsbereiche
Im Folgenden sei immer n ≥ 1, P ⊆ Rn und f : P → R, wenn nichts anderes gesagt wird. Der Leser denke in erster Linie an die Spezialfälle n = 2 und n = 3. Im
Fall n = 2 ist also P eine Teilmenge der Ebene, im Fall n = 3 eine Teilmenge des
dreidimensionalen Raumes. Die Funktionswerte sind immer Skalare. Ein Standardbeispiel ist die Funktion f : Rn → R, die jedem Vektor x = x1 , …, xn einer gegebenen Dimension n seine Euklidische Länge f(x) = i x i zuweist.
Ist x = (x1 , …, xn ) P P, so schreiben wir kurz f(x) = f(x1 , …, xn ) anstelle der korrekteren Version f(x) = f((x1 , …, xn )). Im Fall n = 2 verwenden wir oft auch die Variablen x, y und im Fall n = 3 die Variablen x, y, z, sodass die Funktionswerte die
Form f(x, y) bzw. f(x, y, z) annehmen.
Für die Dimension n = 2 stehen uns verschiedene Visualisierungsmöglichkeiten zur Verfügung. Eine davon ist:
Visualisierung durch Höhenlandschaften (3-D-Plots)
Wir tragen f(x, y) für alle (x, y) P P in eine dreidimensionale Graphik ein,
d. h., wir visualisieren den dreidimensionalen Graphen von f.
Diese Form der Visualisierung entspricht der üblichen graphischen Darstellung einer reellen Funktion. Da sie aufwendig zu zeichnen ist, eignet sie sich vor
allem für Computervisualisierungen.
3D-Plot der Funktion f mit f(x, y) = arctan(y/x) für x ≠ 0
Einführung in die Mathematik 1
© Oliver Deiser
2. Partielle Ableitungen
501
Eine Alternative, die sich zumindest für einfache Funktion auch zur Visualisierung per Hand eignet, besteht darin, einen sog. Kontur-Plot der Funktion
zu erstellen. Hierzu definieren wir allgemein für jede Dimension n:
Definition (Niveau-Menge, Höhenlinie)
Sei f : P → R. Für alle c P R setzen wir
nivf (c) = { v P P | f(v) = c }.
Die Teilmenge nivf (c) von P ⊆ Rn heißt die Niveaumenge von f zum Wert c.
Im Fall n = 2 nennen wir eine Niveaumenge auch eine Höhenlinie.
Für die Dimension n = 2 ergibt sich nun folgende Möglichkeit der Visualisierung:
Visualisierung durch Höhenliniendiagramme (Kontur-Plots)
Wir tragen die Niveaumengen nivf (c) für einige Werte c in ein zweidimensionales Diagramm ein und versehen sie mit dem Wert c. Zusätzlich
können die Bereiche zwischen den Höhnenlinien eingefärbt werden.
Für viele Funktionen sind die Niveaumengen in der Tat Linien, sodass sich ein
Bild ergibt, das an klassische Landkarten mit Höhenlinien und eingetragenen
Höhen erinnert.
Kontur-Plot der Funktion f mit f(x, y) = arctan(y/x) für x ≠ 0
© Oliver Deiser
Einführung in die Mathematik 1
502
5. Abschnitt
Mehrdimensionale Analysis
Beispiele
(1) Sei f : R2 → R definiert durch
f(x, y) = x2 + y2 für alle (x, y) P R2 .
Visualisiert als 3-D-Plot ist f ein Paraboloid. Für alle c P R gilt
nivf (c) = { (x, y) P R2 | x2 + y2 = c } = { (x, y) P R2 | i(x, y) i 2 = c }.
Im Fall c < 0 ist nivf (c) die leere Menge. Für c = 0 ist nivf (c) die
einpunktige Menge { 0 }. Ist c > 0, so ist nivf (c) ein Kreis mit Mittelpunkt 0 und Radius £c.
Einführung in die Mathematik 1
© Oliver Deiser
2. Partielle Ableitungen
503
(2) Sei f : R2 → R definiert durch
f(x, y) = x2 − y2 für alle (x, y) P R2 .
Im 3-D-Plot erscheint f als Sattelfläche. Für alle c P R gilt
nivf (c) = { (x, y) P R2 | x2 − y2 = c }.
Für c = 0 besteht die Menge nivf (0) = { (x, y) P R2 | |x| = |y| } aus den
beiden sich im Nullpunkt schneidenden Winkelhalbierenden. Für
Werte c ≠ 0 erhalten wir Hyperbeln in Hauptlage, d. h. die Winkelhalbierenden sind Asymptoten der Äste der Hyperbeln. Im Fall c > 0
schneiden die Äste die x-Achse, im Fall c < 0 die y-Achse.
© Oliver Deiser
Einführung in die Mathematik 1
504
5. Abschnitt
Mehrdimensionale Analysis
Die Stetigkeit lässt sich wieder in zwei äquivalenten Versionen definieren:
Definition (Stetigkeit für mehrdimensionale Definitionsbereiche)
Sei f : P → R, und sei p P P. Dann heißt f ε-δ-stetig oder umgebungsstetig an
der Stelle p, falls gilt:
∀ε > 0 ∃δ > 0 ∀x P P (i x − p i < δ → |f(x) − f(p)| < ε).
Weiter heißt f folgenstetig an der Stelle p, falls für jede gegen p konvergente
Folge (xn )n P N in P gilt, dass limn f(xn ) = f(p).
Ist f umgebungs- bzw. folgenstetig an allen Stellen p P P, so heißt f
umgebungsstetig bzw. folgenstetig.
In der ε-δ-Stetigkeit steht die Euklidische Norm im Vergleich zu den Kurven
nun auf der linken Seite der Implikation. Die logische Struktur (und Idee) der
Definition bleibt gleich.
Aufgrund der Äquivalenz der beiden Stetigkeitsdefinitionen können wieder
kurz von Stetigkeit sprechen.
Richtungsableitung und partielle Differenzierbarkeit
Sei w P Rn ein normierter Vektor. Wir fassen w als Richtungsvektor auf und
fragen, für einen gegebenen Punkt p P P, nach der Steigung von f : P → R an der
Stelle p in Richtung w. Ist n = 2 und f visualisiert als 3-D-Plot, so ist dies die Steigung der durch f erzeugten Höhenlandschaft, die wir sehen, wenn wir von f(p)
aus in Richtung w blicken. Allgemein definieren wir:
Definition (Richtungsableitung)
Sei f : P → R. Weiter sei w P Rn mit i w i = 1. Für jedes p P P heißt, im Fall
der Existenz, die reelle Zahl
∂w f (p) = limh
→0
f(p + hw) − f(p)
h
die Ableitung von f an der Stelle p in Richtung w. Existiert ∂w f (p), so heißt f an
der Stelle p in Richtung w differenzierbar.
Besonders ausgezeichnete Richtungen werden durch die Koordinatenachsen
definiert. Für ein gegebenes n ≥ 1 seien wieder
e1 = (1, 0, …, 0), …, en = (0, …, 0, 1).
die kanonischen Basisvektoren des Rn . Die Richtungsableitungen bzgl. dieser
Vektoren haben einen eigenen Namen und eigene Bezeichnungen:
Einführung in die Mathematik 1
© Oliver Deiser
2. Partielle Ableitungen
505
Definition (Ableitung in Achsenrichtung, partielle Differenzierbarkeit)
Sei f : P → R. Für jedes p P P und j = 1, …, n heißt, im Fall der Existenz,
∂j f (p) = ∂ej f (p) = limh
→0
f(p + hej ) − f(p)
h
die j-te partielle Ableitung von f an der Stelle p. Existieren alle Ableitungen
∂1 f (p), …, ∂n f (p), so heißt f partiell differenzierbar an der Stelle p.
Ist f an allen Stellen p P P partiell differenzierbar, so heißt f partiell
differenzierbar. Sind zudem alle Ableitungsfunktionen ∂j f : P → R stetig, so
heißt f stetig partiell differenzierbar oder kurz stetig differenzierbar.
Oft ist es nützlich, eine partielle Ableitung nicht durch eine Koordinate, sondern durch eine Variable anzugeben:
Notation
Ist f(x) = f(x1 , …, xn ) so schreiben wir auch
∂xj f(x),
∂f(x)
∂xj
oder
∂
f (x) anstelle von ∂j f (x).
∂xj
Ist f(x) = f(x1 , …, xn ) durch einen Term definiert, so können wir f partiell nach
einer Variable xj ableiten, indem wir alle anderen Variablen wie Konstanten behandeln und die üblichen eindimensionalen Ableitungsregeln auf die betrachtete
Variable anwenden.
Beispiele
(1) Sei f : R2 → R mit
f(x, y) = y e2x
für alle (x, y) P R2 .
Dann gilt für alle (x, y) P R:
∂1 f (x, y) = ∂x f (x, y) =
∂
∂x
( y e2x )
= 2 y e2x ,
∂2 f (x, y) = ∂y f (x, y) =
∂
∂y
( y e2x )
= e2x .
(2) Sei P = { (x, y, z) P R3 | z > 0 } , und sei f : P → R mit
f(x, y, z) = x + 2x y +
x
z
für alle (x, y, z) P P.
Dann gilt für alle (x, y, z) P R3 mit z > 0:
∂x f (x, y, z) = 1 + 2y +
© Oliver Deiser
1
x
, ∂y f (x, y, z) = 2x, ∂z f (x, y, z) = − 2 .
z
z
Einführung in die Mathematik 1
506
5. Abschnitt
Mehrdimensionale Analysis
(3) Sei n ≥ 1 und f : Rn → R definiert durch
f(x) = i x i 2 = x1 2 + … + xn 2 für alle x = (x1 , …, xn ) P Rn .
Dann gilt für alle 1 ≤ j ≤ n und alle x P Rn
∂j f (x) =
∂
f(x) =
∂xj
∂
∂xj
( x1 2
+ … + xn 2 ) = 2xj .
Wie im eindimensionalen Fall können wir auch die mehrfache Differenzierbarkeit von f : P → R betrachten. Es gilt der wichtige Vertauschungssatz:
Satz (Satz von Schwarz)
Sei f : P → R zweimal stetig differenzierbar. Dann gilt ∂i ∂j f = ∂j ∂i f für
alle i, j P { 1, …, n }.
Der Leser überzeuge sich anhand der obigen Beispiele, dass die zweifachen
partiellen Ableitungen nach x,y bzw. z immer die gleiche Funktion ergeben, egal,
in welcher Reihenfolge sie durchgeführt werden. Für Beispiel 1 ist etwa
∂x ∂y f (x, y) = 2e2x = ∂y ∂x f (x, y) für alle (x, y) P R2 .
Gradienten
Die partiellen Ableitungen lassen sich zu einem Vektor zusammenfassen:
Definition (Gradient)
Seien n ≥ 1, P ⊆ Pn und f : P → R partiell differenzierbar an der Stelle
p P P. Dann heißt der Vektor
grad f (p) = (∂1 f (p), …, ∂n f (p)) P Rn
der Gradient von f an der Stelle p.
Beispiel
Sei f : R2 → R definiert durch f(x, y) = x2 + y2 für alle (x, y) P R2 . Dann gilt
grad f (x, y) = (2x, 2y) = 2(x, y) für alle (x, y) P R2 .
Um die geometrische Bedeutung des Gradienten zu ermitteln, betrachten wir
den Spezialfall n = 2. In Analogie zur Tangente definieren wir:
Definition (Tangentialebene)
Seien P ⊆ R2 und f : P → R partiell differenzierbar an der Stelle
p = (x0 , y0 ) P P. Dann heißt die Funktion g : R2 → R mit
g(x, y) = f(p) + ∂1 f (p) (x − x0 ) + ∂2 f (p) (y − y0 ) für alle (x, y) P P
die Tangentialebene von f an der Stelle p.
Einführung in die Mathematik 1
© Oliver Deiser
2. Partielle Ableitungen
507
Beispiel
Sei f : R2 → R mit f(x, y) = −3(x2 + y2 ). Weiter sei p = (0, 1). Dann berechnet
sich die Tangentialebene g von f an der Stelle p zu
g(x, y) = −3 − 0(x − 0) − 6(y − 1) = −6y + 3 für alle (x, y) P R2 .
3D-Plot von f und der Tangentialebene g an der Stelle p = (0, 1)
Die Tangentialebene können wir mit Hilfe des Skalarprodukts in der Form
g(x, y) = f(p) + ∂1 f(p) (x − x0 ) + ∂2 f(p) (y − y0 )
= f(p) + ⟨grad f (p), (x, y) − (x0 , y0 )⟩ = f(p) + ⟨grad f (p), (x, y) − p⟩
schreiben. Aus den geometrischen Eigenschaften des Euklidischen Skalarprodukts ergibt sich:
Geometrische Bedeutung des Gradienten
Der Gradient grad f (p) zeigt in die Richtung des stärksten Abstiegs von f an
der Stelle p. Er steht senkrecht auf der Niveau-Linie nivf (c) für c = f(p).
Wir können uns den Gradienten als „Steigungskompass“ vorstellen. Dabei ist
der Gradient im Fall n = 2 ein Vektor der Ebene, nicht des dreidimensionalen
Raumes. Er zeigt in der Ebene (im Definitionsbereich von f ) in Richtung des
stärksten Anstiegs (des Graphen) von f. Analoge Überlegungen gelten für andere
Dimensionen, sodass die geometrische Bedeutung für alle n ≥ 1 gültig bleibt.
© Oliver Deiser
Einführung in die Mathematik 1
508
5. Abschnitt
Mehrdimensionale Analysis
Gradienten im 3D-Plot für die Funktion f mit f(x, y) = x2 + y2
Gradienten im Kontur-Plot für die Funktion f mit f(x, y) = xy
Einführung in die Mathematik 1
© Oliver Deiser
2.
Partielle Ableitungen
509
Anwendungen des Gradienten
Mit Hilfe des Gradienten können wir die Richtungsableitung einer Funktion
in einfacher Weise berechnen:
Satz (Gradient und Richtungsableitung)
Sei f : P → R partiell differenzierbar an der Stelle p P P. Dann gilt für alle
normierten w = (w1 , …, wn ) P Rn , dass
∂w f (p) = ⟨grad f (p), w⟩ = ∑ 1 ≤ j ≤ n ∂j f(p) wj .
Zur Begründung betrachten wir wieder den Spezialfall n = 2. Hier ergibt sich
die Formel aus folgenden Beobachtungen:
(1) Sei g die Tangentialebene von f an der Stelle p. Dann stimmt die Ableitung von f an der Stelle p in Richtung w mit der Ableitung von g an der
Stelle p in Richtung w überein.
(2) Für eine Tangentialebene g : R2 → R gilt ∂w g (p) = ⟨grad g (p), w⟩.
Eine weitere wichtige Anwendung des Gradienten betrifft Extremwerte:
Definition (lokale Extremalstelle)
Sei f : P → R. Dann heißt ein p P P eine lokale Maximalstelle von f, falls gilt:
∃ε > 0 ∀x P P ( i x − p i < ε → f(x) ≤ f(p) ).
Gilt stärker
∃ε > 0 ∀x P P ( i x − p i < ε ∧ x ≠ p → f(x) < f(p) ),
so heißt p eine strikte lokale Maximalstelle. Analog ist eine (strikte) lokale
Minimalstelle definiert. Ist p eine (strikte) lokale Minimal- oder Maximalstelle, so heißt p eine (strikte) lokale Extremalstelle und f(p) ein zugehöriger
lokaler Extremwert von f.
Ist p eine lokale Extremalstelle einer partiell differenzierbaren Funktion, so ist
die Richtungsableitung von f an der Stelle p für alle Richtungen w gleich Null, da
andernfalls f in einer gewissen Richtung w steigen oder fallen würde. Damit gilt:
Satz (notwendige Bedingung für ein lokales Extremum)
Sei f : P → R partiell differenzierbar an der lokalen Extremalstelle p P P.
Dann gilt grad f (p) = 0.
Das Ergebnis erweitert die klassische notwendige Bedingung f ′(p) = 0 für lokale Extrema einer reellen Funktion. Das Verschwinden des Gradienten ist
keine hinreichende Bedingung: Das eindimensionale Beispiel f : R → R mit
f(x) = x3 und f ′(0) = 0 wird im Mehrdimensionalen ergänzt durch die Sattelflä-
© Oliver Deiser
Einführung in die Mathematik 1
510
5. Abschnitt
Mehrdimensionale Analysis
che f : R2 → R mit f(x, y) = x2 − y2 . Hier gilt gradf (0) = 0, aber die Funktion besitzt
im Nullpunkt weder ein lokales Maximum noch ein lokales Minimum.
Ein hinreichendes Kriterium für ein striktes lokales Minimum einer reellen
Funktion an einer kritischen Stelle p (d. h. f ′(p) = 0) ist, dass f ″(p) > 0. Um ein
mehrdimensionales Analogon dieses Kriteriums formulieren zu können, brauchen wir eine mehrdimensionale Version einer „zweiten Ableitung“:
Definition (Hesse-Matrix)
Sei f : P → R zweimal partiell differenzierbar, und sei p P P. Dann ist die
Hesse-Matrix H f (p) von f an der Stelle p definiert durch
H f (p) =
( ∂i ∂j f (p) )1 ≤ i, j ≤ n.
Die Hesse-Matrix Hf (p) ist eine reelle (n × n)-Matrix, deren Einträge aus allen
zweiten partiellen Ableitungen von f an der Stelle p bestehen. Ist f zweimal stetig
differenzierbar, so ist die Hesse-Matrix symmetrisch nach dem Satz von
Schwarz. In der Analysis zeigt man den folgenden Satz:
Satz (hinreichende Bedingung für ein lokales Extremum)
Sei f : P → R zweimal stetig differenzierbar, und sei p P P mit grad f (p) = 0.
Weiter sei die Hesse-Matrix H = Hf (p) positiv definit, d. h. es gelte
⟨x, H x⟩ > 0 für alle x P Rn mit x ≠ 0.
Dann ist p eine strikte lokale Minimalstelle von f.
An die Stelle von f ″(p) > 0 tritt also positive Definitheit der Hesse-Matrix
H = Hf (p). Um letztere festzustellen, stehen verschiedene Möglichkeiten zur
Verfügung. Für den Fall n = 2 sind zum Beispiel äquivalent:
(a) H ist positiv definit, d. h. ⟨(x, y), H(x, y)⟩ > 0 für alle (x, y) ≠ 0.
(b) H(1, 1) = ∂11 f (p) > 0 und det(H) = ∂11 f(p) ∂22 f(p) − 2∂12 f(p) > 0.
(c) Alle Eigenwerte von H sind positiv.
Beispiel
Sei f : R2 → R mit f(x, y) = x2 + y2 − 2x + 2y + 2. Dann gilt
grad f (x, y) = (2x − 2, 2y + 2).
Damit hat f höchstens im Punkt p = (1, −1) ein lokales Extremum. Die
Hesse-Matrix Hf (p) = ((2, 0); (0, 2)) ist positiv definit, sodass p eine strikte
lokale Minimalstelle von f ist. Dies lässt sich auch geometrisch einsehen, da
f(x, y) = (x − 1)2 + (y + 1)2 ein nach oben geöffnetes Paraboloid ist.
Strikte lokale Maximalstellen können wir durch Übergang zu −f untersuchen
oder analoge Ergebnisse mit „die Hess-Matrix H ist negativ definit“ formulieren
(d. h. ⟨x, H x⟩ < 0 für alle x P Rn mit x ≠ 0).
Einführung in die Mathematik 1
© Oliver Deiser
2. Partielle Ableitungen
511
Allgemeine mehrdimensionale Funktionen
Bisher haben wir Funktionen mit reellen Stellen und mehrdimensionalen
Werten sowie Funktionen mit mehrdimensionalen Stellen und reellen Werten
untersucht. Nun betrachten wir Funktionen, bei denen sowohl die Stellen als
auch die Werte reelle Vektoren sein können. Eine derartige Funktion hat die
Form
f : Rn → Rm bzw. f : P → Rm
mit n, m ≥ 1 und einem Definitionsbereich P ⊆ Rn . Die Stetigkeitsbegriffe können wieder leicht angepasst werden:
Definition (Stetigkeit für mehrdimensionale Definitionsbereiche)
Sei f : P → Rm mit P ⊆ Rn , und sei p P P. Dann heißt f ε-δ-stetig oder
umgebungsstetig an der Stelle p, falls gilt:
∀ε > 0 ∃δ > 0 ∀x P P (i x − p i < δ → i f(x) − f(p) i < ε).
Weiter heißt f folgenstetig an der Stelle p, falls für jede gegen p konvergente
Folge (xn )n P N in P ⊆ Rn gilt, dass limn f(xn ) = f(p) in Rm .
Ist f umgebungs- bzw. folgenstetig an allen Stellen p P P, so heißt f
umgebungsstetig bzw. folgenstetig.
In der ε-δ-Stetigkeit wird auf der linken Seite der Implikation die Euklidische
Norm im Rn verwendet, auf der rechten Seite die Euklidische Norm im Rm . Im
Fall n = m = 2 stimmt die Definition mit der Stetigkeit einer komplexen Funktion
überein, da der komplexe Betrag über die Euklidische Norm erklärt ist. Wir
sprechen wieder kurz von Stetigkeit, da beide Definitionen äquivalent sind.
Wie bei einer Kurve können wir eine Funktion f : P → Rm , P ⊆ Rn , in die reellwertigen Komponenten f1 , …, fm : P → R zerlegen, sodass
f(x) = f(x1 , …, xn ) = (f1 (x1 , …, xn ), …, fm (x1 , …, xn )) P Rm für alle x P P.
Die Funktion f ist genau dann stetig in p, wenn alle Komponentenfunktionen
f1 , …, fm stetig in p sind. Im Fall der Existenz können wir für alle Komponentenfunktionen die n-dimensionalen Gradienten bilden:
grad f1 (p) = (∂1 f1 (p), …, ∂n f1 (p))
grad f2 (p) = (∂1 f2 (p), …, ∂n f2 (p))
…
grad fm (p) = (∂1 fm (p), …, ∂n fm (p))
Alle Gradienten sind Vektoren des Rn . Schreiben wir die Gradienten als Zeilen in
eine Matrix mit m Zeilen und n Spalten, so erhalten wir die sog. Jakobi-Matrix
© Oliver Deiser
Einführung in die Mathematik 1
512
5. Abschnitt
Mehrdimensionale Analysis
Jf (p) = ∂i fj (p))1 ≤ i ≤ m, 1 ≤ j ≤ n =
∂f1
(p)
∂x1
∂f1
(p)
∂x2
…
∂f1
(p)
∂xn
∂f2
(p)
∂x1
∂f2
(p)
∂x2
…
∂f2
(p)
∂xn
…
…
…
…
∂fm
(p)
∂x1
∂fm
(p)
∂x2
…
∂fm
(p)
∂xn
von f an der Stelle p P P. Für die Dimensionen n = m = 1 hat die Jakobi-Matrix
Jf (p) nur eine Zeile und Spalte und den Eintrag f ′(p). Im Kurvenfall n = 1
stimmt Jf (p) mit dem als Spaltenvektor notierten Tangentialvektor f ′(p) von f
an der Stelle p überein. Im Fall m = 1 einer reellwertigen Funktion ist Jf (p) der
als einzeilige Matrix notierte Gradient von f an der Stelle p.
Definition (stetige Differenzierbarkeit)
Eine Funktion f : P → Rm , P ⊆ Rn , heißt (stetig) partiell differenzierbar, falls
alle Komponenten f1 , …, fm : P → R dies sind. Analog ist die mehrfache
(stetige) partielle Differenzierbarkeit definiert.
Statt „stetig partiell differenzierbar“ sagen wir auch kurz „stetig differenzierbar“. Für eine stetig differenzierbare Funktion lässt sich das folgende Analogon
zum Linearen Approximationssatz der eindimensionalen Differentialrechnung
beweisen:
(+) f(x) = f(p) + Jf (p) (x − p) + o(i x − p i) für x → p,
wobei o(i x − p i) für eine Funktion r : P → Rm steht mit
limx
→p
i r(x) i
ix − pi
= 0.
Das Ergebnis unterstützt noch einmal die Stellung der Jakobi-Matrix als Verallgemeinerung des eindimensionalen Ableitungsbegriffs.
Bemerkung
Es stellt sich heraus, dass die Gültigkeit von (+) etwas stärker ist als die
partielle Differenzierbarkeit, aber auch etwas schwächer als die stetige
partielle Differenzierbarkeit von f an der Stelle p ist. In der Analysis wird
deswegen ein weiterer Differenzierbarkeitsbegriff eingeführt, die sog. totale
Differenzierbarkeit einer Funktion f : P → Rm an einer Stelle p. Sie bedeutet
genau, dass sich f in der Form (+) schreiben lässt.
Einführung in die Mathematik 1
© Oliver Deiser
2. Partielle Ableitungen
513
Vektorfelder und Differentialoperatoren
Zu den wichtigsten mehrdimensionalen Funktionen gehören die Vektorfelder,
bei denen die beiden beteiligten Dimensionen übereinstimmen:
Definition (Vektorfeld)
Seien n ≥ 1 und P ⊆ Rn . Dann heißt eine Funktion f : P → Rn ein
n-dimensionales (reelles) Vektorfeld.
Ein zweidimensionales ein Vektorfeld f : P → R2 können wir visualisieren, indem wir an jeden Punkt p des Definitionsbereichs P von f den Vektor f(p) der
Ebene anheften. Analoges gilt für dreidimensionale Vektorfelder.
2
Das Vektorfeld f : R2 → R2 mit
1
f(x, y) = (y, x) für alle (x, y).
Der Übersichtlichkeit halber
werden die Vektoren skaliert.
0
-1
-2
-2
-1
0
1
2
Das Vektorfeld f : R3 → R3 mit
f(x, y, z) = (−y, x, 0) für alle (x, y, z)
© Oliver Deiser
Einführung in die Mathematik 1
514
5. Abschnitt
Mehrdimensionale Analysis
Ein wichtiges Vektorfeld ist uns implizit schon begegnet:
Definition (Gradientenfeld)
Seien n ≥ 1, P ⊆ Rn und f : P → R differenzierbar. Dann heißt das
n-dimensionale Vektorfeld grad f : P → Rn mit
grad f (x) = ( ∂1 f (x), … , ∂n f (x) ) für alle x = (x1 , …, xn ) P P
das Gradientenfeld von f.
Wir stellen nun noch einige wichtige Operatoren für skalar- und vektorwertige Funktionen im Überblick vor. Diese Operatoren sind vor allem in der Physik
von Bedeutung und werden dort genauer diskutiert.
Die Gradientenbildung erzeugt ein Vektorfeld aus einer skalarwertigen Funktion. Die folgende Operation liefert umgekehrt eine skalarwertige Funktion aus
einem Vektorfeld:
Definition (Divergenz)
Sei g : P → Rn ein differenzierbares Vektorfeld. Dann definieren wir die
Divergenz div g : P → R des Vektorfeldes g durch
div g (x) = ∑ 1 ≤ j ≤ n ∂j gj (x) = ∂1 g1 (x) + … + ∂n gn (x) für alle x P P.
Ist p P P und gilt div g (p) > 0 bzw. div g (p) < 0, so heißt p eine Quelle bzw.
Senke von g. Gilt div(g)(p) = 0, so heißt g quellfrei an der Stelle p.
Ein Beispiel für eine Operation, die ein Vektorfeld in ein Vektorfeld überführt, ist:
Definition (Rotation)
Sei P ⊆ R3 und g : P → R3 ein dreidimensionales differenzierbares
Vektorfeld. Dann definieren wir die Rotation oder das Wirbelfeld
rot g : P → R3 von g durch
rot g (x) =
( ∂2 g3(x) − ∂3 g2(x),
∂3 g1 (x) − ∂1 g3 (x), ∂1 g2 (x) − ∂2 g1 (x) )
für alle x P P. Ist p P P mit rot g (p) = 0, so heißt g wirbelfrei an der Stelle p.
Der Nabla-Operator
Das Rechnen mit Gradient, Divergenz und Rotation wird oft übersichtlicher,
wenn wir, für eine gegebene Dimension n ≥ 1, den sog. n-dimensionalen NablaOperator
= =
( ∂1, …, ∂n )
=
( ∂x∂
, …,
1
∂
∂xn
)
verwenden. Wir setzen
Einführung in die Mathematik 1
© Oliver Deiser
2. Partielle Ableitungen
515
= f = (∂1 f, …, ∂n f ) = grad f,
⟨=, g⟩ = ⟨(∂1 , …, ∂n ), (g1 , …, gn )⟩ = div g,
= × g = (∂1 , ∂2 , ∂3 ) × (g1 , g2 , g3 ) = rot g, falls n = 3.
Dabei ist f : P → R mit P ⊆ Rn eine partiell differenzierbare skalarwertige
Funktion, während g : P → Rn , P ⊆ Rn ein differenzierbares Vektorfeld ist.
Die Rotation = × g ist nur für die Dimension 3 erklärt.
Schließlich definieren wir noch:
Definition (Laplace-Operator)
Seien n ≥ 1, P ⊆ Rn und f : P → R zweimal differenzierbar. Dann ist der
Laplace-Operator (angewendet auf f ) definiert durch
D f = =2 f = div grad f = ⟨=, = f ⟩.
Angewendet auf eine skalarwertige Funktion erzeugt der Laplace-Operator
wieder eine skalarwertige Funktion (über den „Umweg“ des Gradientenfeldes).
Es gilt
D f = ∑ 1 ≤ j ≤ n ∂j ∂j f = ∂1 ∂1 f + … + ∂n ∂n f,
sodass D f (p) = spur(Hf (p)). Die Quadrat-Notation =2 ist motiviert durch
Df = ⟨(∂1 ∂1 , …, ∂n ∂n ), f ⟩ = ⟨(∂1 , …, ∂n ), (∂1 , …, ∂n )⟩ f = ⟨=, =⟩ f.
© Oliver Deiser
Einführung in die Mathematik 1
516
5. Abschnitt
Mehrdimensionale Analysis
Übungen
Übung 1
Visualisieren Sie die folgenden Funktionen f : R2 → R durch Höhenliniendiagramme (Kontur-Plots):
(a) f(x, y) = x + y,
(b) f(x, y) = i (x, y) i,
(c) f(x, y) = max(x, y),
(d) f(x, y) = x y.
Übung 2
Sei f : R2 → R mit
f(x, y) = x2 + y2 für alle (x, y) P R2 .
Weiter seien w P R2 normiert und p P R2 . Berechnen Sie die Richtungsableitung ∂w f (p)
(a) durch Berechnung des Differentialquotienten wie in der Definition
der Richtungsableitung,
(b) durch Anwendung der Formel ∂w f (p) = ⟨grad f (p), w⟩.
Übung 3
Zeigen Sie unter der Voraussetzung der Definiertheit:
(a) grad(f g) = f grad g + g grad f für f, g, : Rn → R,
(b) div(f g) = ⟨grad f, g⟩ + f div g für f : Rn → R, g : Rn → Rn .
Übung 4
Skizzieren Sie das Gradientenfeld der Funktion f : R2 − { 0 } → R2 mit
f(x, y) = i (x, y) i für alle (x, y) P R2 − { 0 }.
Übung 5
Sei f : R2 → R mit
f(x, y) = x2 − y2 für alle (x, y) P R2 .
Skizzieren Sie das Gradientenfeld von f und berechnen Sie
D f = div grad f.
Einführung in die Mathematik 1
© Oliver Deiser
2. Partielle Ableitungen
517
Übung 6
Sei f : R2 → R definiert durch
f(x, y) =
{
2xy/(x2 + y2 )
0
falls
sonst.
(x, y) ≠ 0
(a) Erstellen Sie ein Höhenlinien-Diagramm (Kontur-Plot) für f.
(b) Untersuchen Sie f auf Stetigkeit und partielle Differenzierbarkeit.
Übung 7
Sei f : R3 → R3 zweimal stetig differenzierbar. Zeigen Sie:
div rot f = 0.
© Oliver Deiser
Einführung in die Mathematik 1
3. Mehrdimensionale Integration
Wir schließen unseren Überblick über die mehrdimensionale Differential- und
Integralrechnung mit einer kurzen Diskussion der Berechnung von Volumina
und Oberflächen einfacher geometrischer Gebilde ab. Der eindimensionale Integrationskalkül genügt, um diese Berechnungen durchzuführen.
© Oliver Deiser
Einführung in die Mathematik 1
520
5. Abschnitt
Mehrdimensionale Analysis
Mehrdimensionale Integrale
In Analogie zum Riemann-Integral I(f ) einer reellen integrierbaren Funktion
f : [ a, b ] → R lässt sich ein Riemann-Integral für Funktionen des Typs f : P → R
mit P ⊆ Rn , P = [a1 , b1 ] × … × [an , bn ], einführen. Hierzu werden die Begriffe der
Partition und der Riemann-Summe verallgemeinert. Das Integral wird dann erneut durch
I(f ) = limδ(p)
→0
∑p f P R
definiert, vorausgesetzt, der Grenzwert existiert. Für die Dimension n = 2 besteht eine Partition p eines Rechtecks P = [ a, b ] × [ c, d ] zum Beispiel aus achsenparallelen Rechtecken und zugehörigen Stützstellen in diesen Rechtecken. Bei
der Bildung einer Riemann-Summe ∑ p f einer Funktion f : [ a, b ] × [ c, d ] → R
summieren wir die Produkte der Rechtecksflächen mit den Funktionswerten an
den Stützstellen.
Es zeigt sich, dass wir das Integral einer Funktion f : P → R mit einem n-dimensionalen Definitionsbereich P in vielen Fällen durch n hintereinander ausgeführte
eindimensionale Integrale berechnen können. Wir definieren hierzu:
Definition (schnittweise integrierbar)
Eine Funktion f : [ a, b ] × [ c, d ] → R heißt schnittweise integrierbar, wenn
für alle x P [ a, b ] die Funktion f x : [ c, d ] → R, f x (y) = f(x, y), und für alle
y P [ c, d ] die Funktion f y : [ a, b ] → R, f y (x) = f(x, y), integrierbar ist.
Analog wird der Begriff für höhere Dimensionen erklärt.
Ist y P [c, d], so erhalten wir die reelle Funktion fy : [a, b] → R, indem wir den
dreidimensionalen Graphen von f mit der Ebene Ey = R × { y } × R schneiden und
diesen Schnitt als Funktion auf [ a, b ] lesen. Analoges gilt für die Schnitte fx .
Man kann zeigen, dass jede stetige Funktion schnittweise integrierbar ist.
Weiter gilt:
Satz (Berechnung als Mehrfachintegral)
Sei f : [ a, b ] × [ c, d ] → R schnittweise integrierbar. Dann gilt
I(f ) =
d
* *
c
b
f(x, y) dx dy =
a
b
* *
a
d
f(x, y) dy dx.
c
Eine analoge Aussage gilt für höhere Dimensionen.
Für den Fall n = 2 erlaubt der Satz die Berechnung von I(f ) durch die Berechnung zweier eindimensionaler Integrale. Dabei können wir frei wählen, ob wir
zuerst nach der ersten oder zweiten Variablen integrieren. Abhängig vom Integranden kann die eine Variante einfacher sein als die andere.
Einführung in die Mathematik 1
© Oliver Deiser
3. Mehrdimensionale Integration
521
0.8
0.6
g
0.4
0.2
-1.0
-0.5
0.5
1.0
-0.2
Der y-Schnitt g : [ −1, 1 ] → R für y = −1/2 der Funktion f : [−1, 1 ]2 → R mit
f(x, y) = 1 − x2 − y2 für alle (x, y) P [ −1, 1 ]2 .
Wir schneiden f mit R × { −1/2 } × R und lesen den Schnitt als Funktion auf [ −1, 1 ].
© Oliver Deiser
Einführung in die Mathematik 1
522
5. Abschnitt
Mehrdimensionale Analysis
Beispiel 1: Vertauschung der Integrationsreihenfolge
Sei f : [ 0, 1 ] × [ 0, 2 ] → R definiert durch
x2 y
3
f(x, y) =
für alle (x, y) P [ 0, 1 ] × [ 0, 2 ].
Dann gilt
I(f) =
2
**
0
1
x2 y/3 dx dy =
2
*
x3 y
0
0
x=1
x=0
*
dy =
2
y dy = 2.
0
Mit der anderen Integrationsreihenfolge ergibt sich
I(f) =
1
**
0
2
x2 y/3 dy dx =
0
1
*
x2 y2 /6
0
y=2
*
dx =
y=0
1
2x2 /3 dy = 2.
0
Interessanter ist:
Beispiel 2: Kugelvolumen
Sei r ≥ 0, und sei
K = { (x, y, z) P R3 | x2 + y2 + z2 ≤ r2 } ⊆ R3
die Vollkugel im R3 mit Radius r und Mittelpunkt 0. Zur Berechnung des
Volumens V(K) von K betrachten wir die Funktion f : [ −r, r ]2 → R mit
f(x, y) =
{
£r2 − (x2 + y2) ,
0
falls x2 + y2 ≤ r2 ,
sonst.
Der Graph der Funktion f besteht aus der Nullfortsetzung der oberen
Hälfte der Kugeloberfläche auf das Quadrat [ −r, r ]2 . Es gilt V(K) = 2I(f).
Für jedes y P [ −r, r ] ist das Integral über den Schnitt f y : [ −r, r ] → R der
Flächeninhalt eines Halbkreises mit dem von y abhängigen Radius
ry =
£r2 − y2 .
Damit gilt
*
r
−r
fy (x) dx =
*
r
f(x, y) dx =
−r
1 2
(r − y2 ) π
2
für alle y P [ −r, r ].
Wir erhalten also
V(K) = 2 I(f ) = 2 *
r
−r
= π r2 y − y3 /3
Einführung in die Mathematik 1
*
r
−r
y=r
y = −r
f(x, y) dx dy = π
(
= π 2 r3 −
3
2r
3
*
r
r2 − y2 dy
−r
)
=
4 3
r π.
3
© Oliver Deiser
3. Mehrdimensionale Integration
523
Die obere Hälfte der Oberfläche der Kugel mit dem Radius r = 1 wird dargestellt durch
f(x, y) = 1 − x2 − y2 für alle (x, y) mit x2 + y2 ≤ 1.
Ein y-Schnitt ist ein Halbkreis mit Radius ry =
© Oliver Deiser
£1 − y2 .
Einführung in die Mathematik 1
524
5. Abschnitt
Mehrdimensionale Analysis
Das Cavalierische Prinzip
Viele Volumenberechnungen werden einfacher, wenn wir die zu messende
Menge nicht funktional darstellen, sondern die Flächeninhalte der (als Teilmengen der Ebene aufgefassten) Schnitte der Menge mit achsenparallelen
Ebenen aufintegrieren. Für jede Menge A ⊆ R3 und alle x, y, z P R setzen wir
S1 (A, x) = { (y, z) P R2 | (x, y, z) P A },
(x-Schnitt)
2
S2 (A, y) = { (x, z) P R | (x, y, z) P A },
(y-Schnitt)
2
S3 (A, z) = { (x, y) P R | (x, y, z) P A }.
(z-Schnitt)
So ist zum Beispiel die oben betrachtete Kugel K ⊆ R mit Radius r aus Kreisscheiben zusammengesetzt. Der x-Schnitt
3
S1 (K, x) = { (y, z) P R2 | y2 + z2 ≤ r2 − x2 }
der Kugel K ist für jedes x P [ −r, r ] ein Vollkreis mit Radius
rx =
£r2 − x2
und Flächeninhalt (r2 − x2 ) π . Integrieren wir diese Flächeninhalte von −r bis r,
so erhalten wir
*
r
−r
(r2 − x2 ) π dx =
( 2 r3
−
2 r3
3
)π
=
4 3
r π,
3
also das Volumen V(K) der Kugel K. Der Leser vergleiche die Methode mit obigem Beispiel. Eine funktionale Darstellung der Kugeloberfläche entfällt.
Man kann zeigen, dass dieses „Aufintegrieren von Flächeninhalten“ ein korrektes Verfahren zur Berechnung von Volumina darstellt. Eine wichtige Folgerung ist:
Cavalierisches Prinzip
Seien A, B Teilmengen des R3 mit den Volumina V(A) bzw. V(B). Für alle
x P R gelte, dass die x-Schnitte von A und B denselben Flächeninhalt
besitzen. Dann gilt V(A) = V(B). Eine analoge Aussage gilt, wenn die
Flächeninhalte aller y- bzw. z-Schnitte übereinstimmen.
Allgemeiner bleiben diese Überlegungen für jede Dimension n ≥ 2 gültig. So
lässt sich zum Beispiel der Flächeninhalt F(A) einer Teilmenge A der Ebene R2
dadurch berechnen, dass die Längen der x-Schnitte
S1 (A, x) = { y P R | (x, y) P A }
von A aufintegriert werden. Voraussetzung ist, dass A einen wohldefinierten Flächeninhalt und alle x-Schnitte von A eine wohldefinierte Länge besitzen.
Einführung in die Mathematik 1
© Oliver Deiser
3. Mehrdimensionale Integration
525
Beispiel 1: Volumen eines Rotationskörpers
Sei f : [ a, b ] → R eine stetige Funktion. Wir betrachten die Menge
A = { (x, y, z) P R3 | x P [ a, b ], y2 + z2 ≤ f(x)2 }
die entsteht, wenn wir den Graphen von f im dreidimensionalen Raum um
die x-Achse rotieren. Für alle x P [ a, b ] ist der x-Schnitt S1 (A, x) ein Kreis
mit Radius f(x) und Fläche f(x)2 π. Damit berechnet sich des Volumen von A
zu
V(A) = π
*
b
f(x)2 dx.
a
Ist konkret f : [ 0, h ] → R mit
f(x) = a x für alle x P [ 0, h ],
wobei a, h > 0, so ist der Rotationskörper A ein Kreiskegel mit Höhe h und
Schnittflächen (ax)2 π für x P [ 0, h ]. Damit gilt
V(A) = π
*
0
h
(ax)2 dx = π
a2 h 3
3
=
Fh
3
mit F = (ah)2 π,
in Übereinstimmung mit der Formel „1/3 mal Grundfläche mal Höhe“ der
Elementargeometrie.
Der Rotationskörper A für f : [ −3, 3 ] → R mit f(x) = arctan(x) für alle x P [ −3, 3 ].
Eine numerische Berechnung des nichtelementaren Integrals ergibt das Volumen
V(A) = 16,36…
© Oliver Deiser
Einführung in die Mathematik 1
526
5. Abschnitt
Mehrdimensionale Analysis
Beispiel 2: Volumen eines Torus
Seien R ≥ r > 0 und
2
T = { (x, y, z) P R3 | ( R − £x2 + y2 ) + z2 ≤ r2 }
der Torus mit den Radien R ≥ r > 0. Der Torus T entsteht, wenn wenn wir
den in der x-z-Ebene liegenden Kreis mit Mittelpunkt (R, 0, 0) und Radius
r um die z-Achse rotieren. Zur Berechnung des Volumens verwenden wir
die z-Schnitte S3 (T, z) von T. Für alle z P [ −r, r ] ist S3 (T, z) ein Kreisring
mit dem Flächeninhalt
(+)
( R + £r2 − z2 ) 2 π
−
( R − £r2 − z2 ) 2 π
= 4 R π £r2 − z2 .
Damit berechnet sich das Volumen des Torus zu
V(T) =
*
r
−r
4 R π £r2 − z2 dz = 4R π r2 π/2 = 2π2 Rr2 ,
wobei wir verwenden, dass das Integral von −r bis r über £r2 − z2 in der
Variablen z den halben Flächeninhalt eines Kreises mit Radius r ergibt.
Der Torus T für R = 2 und r = 1. Der Schnitt mit der x-y-Ebene ergibt einen
Kreisring mit innerem Radius R − r = 1 und äußerem Radius R + r = 3. Verschieben
wir die Schnittebene entlang der z-Achse, erhalten wir einen Kreisring mit den in
der Formel (+) verwendeten Radien (vgl. die folgende Abbildung).
Einführung in die Mathematik 1
© Oliver Deiser
3. Mehrdimensionale Integration
527
Zur Formel (+): Der innere Radius des Schnitts ist R − rz , der äußere R + rz , wobei
rz = £r2 − z2 .
Integration in Polarkoordinaten
Polarkoordinaten stellen eine weitere Möglichkeit dar, die Berechnung von
mehrdimensionalen Integralen zu vereinfachen. Anstelle einen zweidimensionalen Definitionsbereich waagrecht oder senkrecht abzutasten, können wir ihn
auch Kreis für Kreis oder Radius für Radius durchlaufen. Dies entspricht der
Verwendung von Polarkoordinaten (r, ϕ) anstelle der kartesischen Koordinaten
(x, y).
Im Folgenden nehmen wir zur Vereinfachung an, dass der Definitionsbereich der zu integrierenden Funktion ein Vollkreis KR mit Mittelpunkt 0 und
Radius R ist. Durch Nullfortsetzung der Funktion können wir einen solchen
Definitionsbereich in ein Rechteck verwandeln, sodass der Begriff der Integrierbarkeit erklärt ist. In Analogie zur schnittweisen Integrierbarkeit setzen
wir zudem die polare Integrierbarkeit voraus, d. h., die Existenz der Integrale
aller Kreis- und Radialschnitte der Funktion. Diese technische Voraussetzung
ist in allen einfachen Beispielen erfüllt.
Es gilt nun der folgende Integrationssatz:
© Oliver Deiser
Einführung in die Mathematik 1
528
5. Abschnitt
Mehrdimensionale Analysis
Satz (Integration in ebenen Polarkoordinaten)
Sei f : KR → R eine polarintegrierbare Funktion. Dann gilt:
I(f) =
R
* *
0
=
2π
0
2π
* *
0
f (r cos ϕ, r sin ϕ) r dϕ dr
R
0
f (r cos ϕ, r sin ϕ) r dr dϕ.
Anstelle ein Doppelintegral mit kartesischen Koordinaten x und y zu berechnen, können wir also mit gleichem Ergebnis ein Doppelintegral mit Polarkoordinaten r und ϕ bestimmen, wobei wir dem polar berechneten Integral den Korrekturfaktor r hinzufügen müssen. Er entspricht der Tatsache, dass der Umfang
eines Kreises mit Radius r das r-Fache des Umfangs des Einheitskreises ist. Integrieren wir bei festem r über alle Winkel ϕ, so hat dieser Beitrag zum Integral das
r-fache Gewicht.
Beispiel 1: Kreisfläche
Sei R > 0, und sei f : KR → R konstant gleich 1 auf KR . Dann ist das
Integral I(f) die Fläche eines Kreises mit Radius R. Eine polare Berechnung
des Integrals ergibt
I(f) =
R
* *
0
2π
1 r dϕ dr =
*
0
0
R
2π r dr = π r2
r=R
r=0
= R2 π.
Beispiel 2: Die Gaußsche Glockenkurve
Die Gaußsche Glockenkurve g : R → R ist definiert durch
2
g(x) = e− x /2 für alle x P R.
1.0
g
0.8
0.6
0.4
0.2
-4
-2
Einführung in die Mathematik 1
2
4
© Oliver Deiser
3. Mehrdimensionale Integration
529
Die Glockenkurve spielt in der Wahrscheinlichkeitstheorie eine fundamentale Rolle bei der Untersuchung normalverteilter Zufallsvariablen. Das
uneigentliche Integral
γ =
*
∞
2
e− x /2 dx
−∞
ist nicht leicht zu berechnen, da die Gaußsche Glockenkurve keine
elementare Stammfunktion besitzt. Mit Hilfe einer auf unbestimmte
Integrale erweiterten Integration in Polarkoordinaten gelingt die Berechnung des Quadrats von γ vergleichsweise leicht:
γ2 =
=
(*
∞
2
e− x /2 dx
−∞
)( *
∞
2
e− y /2 dy
−∞
∞
* *
∞
2
2
e− x /2 e−y /2 dx dy =
−∞ −∞
=
∞
* *
0
0
2π
)
=
∞
∞
−∞
−∞
* (*
∞
* *
∞
2
e− (x
2
)
2
e− x /2 dx e−y /2 dy
+ y2 )/2
dx dy
−∞ −∞
2
e−r /2 r dϕ dr = 2π limR
= 2π limR → ∞
2
−e−r /2
r=R
r=0
→∞
*
R
2
e−r /2 r dr
0
= 2π ⋅ 1 = 2π.
Damit ist also γ = £2π.
Die Schnitte der Funktion f : R2 → R mit
f(x, y) = exp(−(x2 + y2 )/2) = g(x) g(y)
sind skalierte Glockenkurven.
© Oliver Deiser
Einführung in die Mathematik 1
530
5. Abschnitt
Mehrdimensionale Analysis
Räumliche Polarkoordinaten
Eine dreidimensionale Variante der ebenen Polarkoordinaten verwendet zur
Beschreibung eines Punktes (x, y, z) P R3 die Koordinaten r, θ, ϕ mit der folgenden Bedeutung:
(1) Die Koordinate r ≥ 0 ist die Euklidische Länge von (x, y, z).
(2) Die Koordinate θ P [ 0, π ] ist der Winkel, den (x, y, z) mit der positiven
z-Achse einschließt.
(3) Die Koordinate ϕ P [ 0, 2π [ ist der Winkel der Projektion (x, y, 0) von
(x, y, z) auf die x-y-Ebene wie bei ebenen Polarkoordinaten.
Den Winkel θ können wir als (mathematischen) Breitengrad und den Winkel
ϕ als Längengrad eines Punktes auf der Oberfläche einer Kugel mit Radius r und
Mittelpunkt 0 auffassen. Räumlichen Polarkoordinaten (r, θ, ϕ) entsprechen die
kartesischen Koordinaten
(x, y, z) = r (sin θ cos ϕ, sin θ sin ϕ, cos θ).
Die Berechnung von r, θ, ϕ aus x, y, z erfolgt wie bei den ebenen Polarkoordinaten mit Hilfe der Euklidischen Norm und der Arkustangens-Funktion.
Der Punkt P hat die räumlichen Polarkoordinaten (r, θ, ϕ).
Einführung in die Mathematik 1
© Oliver Deiser
3. Mehrdimensionale Integration
531
Das Integral einer auf einer Kugel KR ⊆ R3 mit Radius R und Mittelpunkt 0
definierten Funktion lässt sich mit räumlichen Polarkoordinaten wie folgt berechnen:
Satz (Integration in räumlichen Polarkoordinaten)
Sei f : KR → R eine polarintegrierbare Funktion. Dann gilt
I(f) =
π
R
2π
* * * f ( r sin θ cos ϕ, r sin θ sin ϕ, r cos θ ) r2 sin θ dϕ dθ dr.
0
0
0
Erneut sind auch andere Reihenfolgen der Integrale gleichwertig.
Bei festem Radius r und festem Winkel θ durchläuft der durch die räumlichen Polarkoordinaten (r, θ, ϕ) spezifizierte Punkt des Raumes im Winkel ϕ
den durch θ definierten Breitenkreis der Kugel Kr . Variiert nun θ von 0 bis π,
so überstreichen diese Breitenkreise die gesamte Oberfläche von Kr . Variieren
wir nun den Radius r von 0 bis R, so schöpfen wir die Vollkugel mit Radius R
vollständig durch Kugeloberflächen aus. Der erste Korrekturfaktor r2 entspricht der Tatsache, dass die Oberfläche einer Kugel quadratisch in ihrem Radius wächst. Analog ist der zweite Korrekturfaktor sin(θ) darauf zurückzuführen, dass in den Umfängen der durch θ definierten Breitenkreise der Sinus des
Winkels θ einfließt.
Die Berechnung des Kugelvolumens ist nun besonders einfach:
Beispiel: Berechnung der Kugelvolumens
Sei K ⊆ R3 die Vollkugel mit Mittelpunkt 0 und Radius R > 0. Dann gilt
V(K) =
0
=
π
R
* * *
0
R
* *
0
2π
0
π
0
R
1 ⋅ r2 sin θ dϕ dθ dr
2π r2 sin θ dθ dr
= 2π * r2 − cos θ
0
π
0
dr =
*
0
R
4 π r2 dr =
4 3
R π.
3
Inhalte von Rotationsflächen
Zum Abschluss diskutieren wir noch eine Formel für den Flächeninhalt einer
dreidimensionalen Rotationsfläche. Eine solche Fläche erhalten wir, indem wir
die Spur einer in einer Ebene verlaufenden Kurve um eine Achse rotieren. Wir
beschränken uns im Folgenden auf Kurven, die in der rechten Hälfte der x-zEbene verlaufen und um die z-Achse rotiert werden. Der Leser denke an das
Töpfern zur Visualisierung der entstehenden Rotationsflächen.
© Oliver Deiser
Einführung in die Mathematik 1
532
5. Abschnitt
Mehrdimensionale Analysis
Definition (Rotationsfläche einer Kurve)
Sei f : [ a, b ] → R3 eine Kurve mit f1 (t) ≥ 0 und f2 (t) = 0 für alle t P [ a, b ].
Weiter sei f injektiv auf ] a, b [. Dann heißt f eine Rotationskurve und
ρ(f ) =
{ (x, y, f3(t)) P R3 | t P [ a, b ],
x2 + y2 = f1 (t) 2 } .
die durch f erzeugte Rotationsfläche.
Rotationsfläche der Kurve f : [ 0, 2π] → R3 mit f(t) = (t, 0, cos t + 1/4 cos(4t) + 5/4)
Unser Ziel ist die Berechnung der Oberfläche (genauer: des Oberflächeninhalts) Ar(ρ(f )) der Fläche ρ(f ).
Warnung
Ein naives Aufintegrieren von Kreisumfängen führt in der Regel zu falschen
Ergebnissen. Integrieren wir zum Beispiel die Umfänge der Breitenkreise
einer Kugel K mit Radius r und Mittelpunkt 0, so erhalten wir
*
r
−r
2π £r2 − z2 dz = 2π r2 π/2 = π2 r2 ,
also nicht den korrekten Wert 4r2 π.
Die Grundmethode „Approximation und Grenzwertbildung“ der Analysis liefert eine korrekte Formel. Approximieren wir eine Rotationskurve f : [a, b] → R3
durch einen Polygonzug, so ist das zugehörige Rotationsgebilde aus den Mantelflächen von Kegelstümpfen (abgeschnittene Kreiskegel) zusammengesetzt. Die
Mantelfläche eines Kegelstumpfes der Höhe h mit den Radien r1 und r2 berechnet sich elementargeometrisch zu
Einführung in die Mathematik 1
© Oliver Deiser
3. Mehrdimensionale Integration
(+) π (r1 + r2 ) s, wobei s =
£(r1 − r2)2 + h2.
533
(Mantelflächenformel)
Die Größe s ist dabei die Länge einer Mantellinie des Kegelstumpfes.
Ein Kegelstumpf mit Radien r1 > r2 und Höhe h.
Im Fall r1 < r2 verjüngt sich der Stumpf nach unten.
Im Fall r1 = r2 ergibt sich ein Zylinder, im Fall h = 0 ein Kreisring.
Bemerkung
Die Formel (+) liefert im degenerierten Fall h = 0 die Fläche
π (r1 + r2 ) s = π (r1 + r2 )|r1 − r2 | = π max(r1 , r2 )2 − π min(r1 , r2 )2
eines Kreisrings mit den Radien r1 und r2 .
Ist nun p = (tk )k ≤ n eine stützstellenfreie Partition von [ a, b ], so ist nach (+)
Ar(p, f) = ∑ k ≤ n π ( f1 (tk ) + f1 (tk + 1 ) ) i f(tk + 1 ) − f(tk ) i
eine Approximation an Ar(ρ(f )). Ist p sehr fein, so ist π (f1 (tk + 1 ) + f1 (tk )) für alle
t P [ tk , k + 1 ] ungefähr gleich 2π f1 (t). Fügen wir 1/∆k ⋅ ∆k mit ∆k = tk + 1 − tk an
die Norm an, so wird folgendes Ergebnis plausibel:
Satz (Inhalt der Rotationsfläche einer Kurve)
Sei f : [ a, b ] → R3 eine stetig differenzierbare Rotationskurve. Dann gilt
Ar(ρ(f )) =
*
a
© Oliver Deiser
b
2 π f1 (t) i f ′(t) i dt.
Einführung in die Mathematik 1
534
5. Abschnitt
Mehrdimensionale Analysis
Ist die Kurve f durch einen Graphen auf der z-Achse definiert, d.h. gibt es eine
Funktion g : [ a, b ] → [ 0, ∞ [ mit
f(t) = (g(t), 0, t) für alle t P [ a, b ],
so erhalten wir die speziellere Formel
Ar(ρ(f )) =
*
a
b
2 π g(t) £1 + g′(t)2 dt.
Der Leser vergleiche die Formeln mit den entsprechenden Ergebnissen für die
Längen von Kurven.
Beispiel 1: Kugeloberfläche
Sei r > 0 und f : [ 0, π ] → R3 definiert durch
f(t) = r (sin t, 0, cos t)
für alle t P [ 0, π ].
Dann ist ρ(f) die Oberfläche einer Kugel K mit Radius r. Die Norm der
Ableitung der Kurve f ist konstant gleich r, sodass
Ar(ρ(f )) =
*
π
0
2 π r sin(t) r dt = − 2 r2 π cos t
t=π
t=0
= 4 r2 π.
Beispiel 2: Oberfläche eines Torus
Seien R ≥ r > 0, und sei f : [ 0, 2π ] → R3 mit
f(t) = (r cos(t) + R, 0, r sin(t)) für alle t P [ 0, 2π ].
Die Spur von f ist ein Kreis in der rechten Hälfte der x-z-Ebene mit Radius
r und Mittelpunkt (R, 0, 0). Die Norm der Ableitung von f ist erneut
konstant gleich r. Der durch Rotation der Kurve um die z-Achse entstehende Torus T = ρ(f ) hat damit die Oberfläche
Ar(ρ(f )) =
*
0
2π
2 π (r cos(t) + R) r dt
= 2 π r r sin(t) + Rt
t=2π
t=0
= 2π r 2 π R = 4 π2 r R.
Eine numerische Approximation
Zum Abschluss möchten wir die Oberfläche der Einheitssphäre
S2 = { (x, y, z) P R3 | x2 + y2 + z2 = 1 }
noch numerisch mit Hilfe der entwickelten Theorie berechnen. Sei hierzu n ≥ 1
gegeben. Wir setzen δ = 2/n und teilen das Intervall [ −1, −1 ] der z-Achse durch
die Zerlegungspunkte
t0 = −1, t1 = −1 + δ, t2 = −1 + 2δ, …, tn = 1
Einführung in die Mathematik 1
© Oliver Deiser
3. Mehrdimensionale Integration
535
in n gleichlange Intervalle der Länge δ auf. Nun betrachten wir die n Kegelstümpfe der Höhe δ, deren Radien durch die Funktion g : [ −1, 1 ] → R mit
g(z) = £1 − z2 für alle z P [ −1, 1 ]
definiert sind. Sei also rk = g(tk ) für alle k ≤ n. Dann ist
An = ∑ 0 ≤ k < n π (rk + rk + 1 ) £(rk − rk + 1 )2 + δ2
eine Approximation an die Oberfläche von S2 . Es gilt
limn An = 4π = 12,56637061…
Die folgende Tabelle zeigt einige gerundete Werte von An und 4π − An .
n
An
4π − An
4
6
8
10
20
50
100
11,51049
12,06174
12,26840
12,36866
12,51150
12,55644
12,56367
1,0559
0,50463
0,29797
0,19771
0,054871
0,0099308
0,0027004
Approximation der Einheitssphäre durch 4, 6, 8 und 10 gleichhohe Kegelstümpfe
© Oliver Deiser
Einführung in die Mathematik 1
536
5. Abschnitt
Mehrdimensionale Analysis
Übungen
Übung 1
Berechnen Sie das Volumen eines Kegels der Höhe h und Grundfläche F
mit Hilfe des Cavalierischen Prinzips.
Übung 2
Begründen Sie die Additivität I(f + g) = I(f) + I(g) des Riemann-Integrals mit
Hilfe des Cavalierischen Prinzips.
Übung 3
Seien a, b, c > 0, und sei
E =
{ (x, y, z) P R | ( xa ) + ( by ) + ( zc )
3
2
2
2
≤ 1
}
das achsenparallele Ellipsoid mit den Halbachsen a, b, c. Berechnen Sie das
Volumen von E mit Hilfe des Cavalierischen Prinzips.
Übung 4
Einen Torus T mit Radien R ≥ r ≥ 0 erhalten wir, indem wir einen Kreis der
x-z-Ebene mit Radius r und Mittelpunkt (R, 0, 0) um die z-Achse rotieren.
Jeder Drehwinkel ϕ P [ 0, 2π ] erzeugt dabei einen Kreis mit der Fläche r2 π.
Integrieren wir alle diese Flächen auf, so erhalten wir 2πr2 π = 4π2 r2 .
Begründen Sie, warum diese Argumentation nicht das Torusvolumen
liefert.
Übung 5
Sei f : [ a, b ] → R3 eine Rotationskurve. Erklären Sie die Definition
ρ(f ) =
{ (x, y, f3(t)) P R3 | t P [ a, b ],
x2 + y2 = f1 (t) 2 } .
der durch f erzeugten Rotationsfläche mit Hilfe einer Skizze.
Übung 6
Begründen Sie die Formel für die Mantelfläche eines Kegelstumpfes
elementargeometrisch.
Übung 7
Berechnen Sie die Oberfläche eines Kreiskegels der Höhe h und Grundfläche F mit Hilfe der Oberflächenformel für Rotationsflächen.
Einführung in die Mathematik 1
© Oliver Deiser
6. Abschnitt
Anhänge
© Oliver Deiser
Einführung in die Mathematik 1
1. Grundlagen über reelle Funktionen
Wir stellen einige allgemeine Grundbegriffe über Funktionen zusammen und
betrachten dann speziell Funktionen, die auf einer Menge von reellen Zahlen definiert sind und reelle Werte annehmen.
Der Funktionsbegriff
Unter einer Funktion oder Abbildung der Form f : A → B verstehen wir ein
mathematisches Objekt, das jedem Element a der Menge A (dem Definitionsbereich von f ) ein bestimmtes Element b der Menge B (dem Wertevorrat von f ) zuordnet. Wird dem Element a von A das Element b von B zugeordnet, so schreiben wir f(a) = b und nennen b den Wert von f an der Stelle a.
Diese klassische Beschreibung ist keine strenge mathematische Definition, solange der Begriff der Zuordnung nicht erklärt ist. Zu einer Definition gelangen
wir, indem wir eine Funktion als zweispaltige Tabelle auffassen, bei der die Elemente der linken Spalte als Stellen und die Elemente der rechten Spalte als zugehörige Funktionswerte eingetragen sind. Dass ein Element b dem Element a zugeordnet ist, heißt dann einfach, dass (a, b) eine Zeile der Tabelle ist. Kein a darf
in der linken Spalte mehrfach erscheinen, dagegen ist es möglich, dass in der
rechten Spalte Wiederholungen auftreten. Diese Tabellen-Sicht lässt sich relativ
direkt in eine präzise mengentheoretische Definition des Funktionsbegriffs
übersetzen. Wir begnügen uns hier mit diesen Bemerkungen, folgen aber der
dieser Sichtweise entsprechenden Konvention, eine Funktion mit ihrem Graphen zu identifizieren:
f = Graph(f ) = { (a, f(a)) | a P A }.
Unter dieser Identifizierung ist der Wertevorrat B einer in der Form f : A → B
notierten Funktion kein fester Bestandteil von f, sondern eine zweite Menge, die
uns mehr oder weniger genau beschreibt, in welcher Menge die Funktionswerte
liegen. Für die reelle Sinusfunktion können wir also
sin : R → [ −1, 1 ] oder sin : R → R,
schreiben, nicht aber sin : R → [ 0, 2 ].
Ist f : A → B, so heißt Def(f ) der Definitionsbereich und B ein (nicht eindeutig
bestimmter) Wertevorrat von f. Weiter heißt die Menge
f [ A ] = { f(a) | a P A }
der (eindeutig bestimmte) Wertebereich oder das Bild von f. Es gilt f [ A ] ⊆ B.
© Oliver Deiser
Einführung in die Mathematik 1
540
6. Abschnitt
Anhänge
Weiter definieren wir
f [ X ] = { f(a) | a P X } für X ⊆ A,
f
−1
[ Y ] = { a P A | f(a) P Y } für Y ⊆ B.
(Bild der Menge X unter f)
(Urbild der Menge Y unter f)
Ist f : A → B, so können Elemente von B mehrfach als Funktionswert auftreten
oder nicht. Weiter kann jedes Element des Wertevorrats B als Funktionswert erscheinen oder nicht. Die folgenden grundlegenden Abbildungsbegriffe beschreiben diese Verhältnisse.
Definition (injektiv, surjektiv, bijektiv)
Eine Funktion f : A → B heißt
(a) injektiv, falls für alle a, b P A gilt: f(a) = f(b) impliziert a = b,
(b) surjektiv (auf B), falls f [ A ] = B,
(c) bijektiv (auf B), falls f injektiv und surjektiv ist.
Entsprechend nennen wir dann f eine Injektion, Surjektion oder Bijektion.
Anschaulich bedeutet „injektiv“, dass kein Wert mehrfach angenommen wird
und „surjektiv“, dass jeder Werte des betrachteten Wertevorrats angenommen
wird. Eine Bijektion stellt eine 1-1 Korrespondenz zwischen den Elementen von
A und den Elementen von B her.
Injektive Funktionen lassen sich umkehren:
Definition (Umkehrfunktion)
Sei f : A → B injektiv. Dann heißt die eindeutige Funktion g : f [ A ] → B mit
g(b) = „das a P A mit f(a) = b“ für alle b P f [ A ]
die Umkehrfunktion von f. Wir bezeichnen sie mit f − 1 .
Eine nichtinjektive Funktion lässt sich nicht umkehren. In vielen Fällen lässt
sich aber Injektivität durch eine Verkleinerung des Definitionsbereichs erreichen. Wir definieren hierzu:
Definition (Einschränkung)
Sei f : A → B eine Funktion, und sei C ⊆ A. Dann ist die Einschränkung f|C
von f auf C die eindeutige Funktion g : C → B mit g(a) = f(a) für alle a P C.
Ein Paradebeispiel für den Einsatz der Einschränkung ist die Definition der
reellen Quadratwurzelfunktion. Wir betrachten hierzu die reellen Quadratfunktion sq : R → R (Einheitsparabel) mit sq(x) = x2 für alle x P R. Diese Funktion ist
nicht injektiv und damit nicht umkehrbar. Ist R+0 die Menge aller nichtnegativen
reellen Zahlen und g = sq|C, so ist g injektiv (g ist der rechte Ast der Einheitsparabel). Die Umkehrfunktion von g ist die Quadratwurzelfunktion sqrt : R+0 → R.
Insgesamt gilt also sqrt = (sq|R+0 )−1 .
Einführung in die Mathematik 1
© Oliver Deiser
1. Grundlagen über reelle Funktionen
541
Ständig im Einsatz ist:
Definition (Komposition)
Seien f : A → B und g : B → C. Dann ist die Komposition h = g + f von f und
g die Funktion h : A → C mit h(a) = g(f(a)) für alle a P A.
Die Komposition h = g + f wird auch als Verkettung oder Verknüpfung von g und
f bezeichnet. Siebeschreibt die Hintereinanderausführung der Funktionen: Zuerst f, dann g. Entsprechend wird g + f gelesen als „g nach f “.
Reelle Funktionen
Definition (reelle Funktion)
Eine Funktion f der Form f : A → R mit A ⊆ R heißt reelle Funktion.
Da wir eine Funktion mit ihrem Graphen identifizieren, gilt
f = Graph(f ) ⊆ A × f[ A ] ⊆ R × R = R2 = { (x, y) | x, y P R }.
Eine reelle Funktion können wir also mit Hilfe der graphischen Methode visualisieren, indem wir sie als Teilmenge der Anschauungsebene zeichnen.
Zu den wichtigsten Stellen einer Funktion gehören die Nullstellen:
Definition (Nullstelle)
Sei f : A → R eine reelle Funktion. Ist x P A mit f(x) = 0, so heißt x eine
Nullstelle von f.
Oft ist auch das Wachstum einer reellen Funktion von Interesse. Es beschreibt, ob und wie die Ordnung zwischen zwei Stellen beim Übergang zu den
Funktionswerten erhalten bleibt:
Definition (Monotoniebegriffe)
Sei f : A → R eine reelle Funktion. Dann heißt f
streng monoton steigend, falls f(x) < f(y)
monoton steigend,
falls f(x) ≤ f(y)
streng monoton fallend,
falls f(x) > f(y)
monoton fallend,
falls f(x) ≥ f(y)
für alle x, y P A mit x < y gilt.
Statt „steigend“ sagt man gleichwertig auch „wachsend“, wobei dies nicht so
gut zu „fallend“ passt. Streng monotone Funktionen sind injektiv und lassen sich
daher umkehren.
© Oliver Deiser
Einführung in die Mathematik 1
542
6. Abschnitt
Anhänge
Wichtig sind die folgenden Symmetrieeigenschaften:
Definition (gerade und ungerade Funktionen)
Sei f : A → R eine reelle Funktion. Dann heißt f gerade, falls für alle x P A
gilt, dass f(x) = f(−x). Weiter heißt f ungerade, falls für alle x P A gilt, dass
f(x) = −f(−x).
Ein Ausdruck f(x) = y beinhaltet immer, dass x ein Element des Definitionsbereichs der Funktion f ist. Für eine gerade oder ungerade Funktion f : A → R ist
als mit x immer auch −x ein Element von A.
Intervalle
Der Definitionsbereich A einer reellen Funktion f : A → R kann eine beliebige
Mengen reeller Zahlen sein. Oft hat A aber eine einfache Struktur. Wir definieren hierzu und für vieles andere:
Definition (Intervall)
Eine Teilmenge I von R heißt ein Intervall, falls für alle a,b P I mit a < b gilt:
Für alle c P R mit a < c < b ist c P I.
Mit je zwei Punkten enthält ein Intervall auch alle dazwischen liegenden
Punkte. Es treten die folgenden Typen auf:
Definition (Intervalltypen)
Wir setzen für alle a, b P R:
[a, b]
= { x P R | a ≤ x ≤ b },
[a, b[ = { x P R | a ≤ x < b },
]a, b]
= { x P R | a < x ≤ b },
]a, b[ = { x P R | a < x < b },
[a, ∞[
= { x P R | a ≤ x },
]a, ∞[ = { x P R | a < x },
]−∞, a]
= { x P R | x ≤ a },
]−∞, a[= { x P R | x < a },
]−∞, ∞[ = R.
Intervalle der Form
] a, b [,
[ a, b ],
] a, b ] und [ a, b [
mit a, b P R ∪ { ∞, ± ∞ }
heißen offen, abgeschlossen bzw. halboffen. In allen Fällen heißen a und b die
Grenzen des Intervalls. Ist eine Grenze ein symbolischer Unendlichkeitswert, so spricht man auch von einem uneigentlichen Intervall.
Spezialfälle sind abgeschlossene Intervalle der Form [a, a] = { a }, die nur aus einem Punkt bestehen. Auch die leere Menge gilt als Intervall.
Einführung in die Mathematik 1
© Oliver Deiser
1. Grundlagen über reelle Funktionen
543
Definition (spezielle Mengen reeller Zahlen)
Wir setzen:
R+0
= [ 0, ∞ [ = { x P R | x > 0 },
+
= ] 0, ∞ [ = { x P R | x ≥ 0 },
R
R*
= ] − ∞, 0 [ ∪ ] 0, ∞ [ = { x P R | x ≠ 0 }.
Die Definitions- und Wertebereiche aller elementaren Funktionen der Analysis sind entweder Intervalle oder Vereinigungen von Intervallen wie die
Menge R*.
Betrag und Vorzeichen
Wir definieren noch zwei spezielle reelle auf ganz R definierte Funktionen.
Definition (Betrag und Vorzeichen)
Die Betragsfunktion | ? | : R → R und die Vorzeichenfunktion sgn : R → R
sind definiert durch
|x| =
{
sgn(x) =
falls x ≥ 0,
sonst.
x
−x
{
falls x > 0,
falls x = 0,
sonst.
1
0
−1
Die reellen Zahlen |x| und sgn(x) heißen der Betrag bzw. das Vorzeichen
oder Signum von x.
Die Betragsfunktion haben wir hier mit Hilfe der Punkt- oder Platzhalternotation in der Form | ? | : R → R definiert, da ihre Funktionswerte nicht in der
Form f(x) notiert werden.
Die Betragsfunktion ist gerade, die Signumsfunktion ungerade. Für alle reellen Zahlen x, y gilt:
(a) x = sgn(x) |x|,
(b) |x y| = |x| |y|,
(c) |x + y| ≤ |x| + |y|.
(Dreiecksungleichung).
Nützlich ist zuweilen die Version sgn2 : R → R der Vorzeichenfunktion mit
sgn2 (x) =
{
© Oliver Deiser
1
−1
falls x ≥ 0,
sonst.
Einführung in die Mathematik 1
544
6. Abschnitt
Anhänge
Eine weitere Funktion im Umfeld der Vorzeichenfunktion ist die HeavisideFunktion Θ : R → R, die definiert ist durch
Θ(x) =
{
1
0
falls x ≥ 0,
sonst.
In der Literatur wird die Heaviside-Funktion an der Stelle 0 oft nicht oder durch
Θ(0) = 1/2 definiert. Bei dieser Konvention gilt
Θ(−x) = 1 − Θ(x) für alle x P R.
Zur Definition von Funktionen durch Terme
Eine reelle Funktion wird oft durch Terme definiert. Wir können zum Beispiel
f : R → R definieren durch
(+) f(x) = x2 + 2x − 1 für alle x P R.
Ein Term ist ein aus Variablen, Konstanten und bestimmten kontextabhängigen
Grundfunktionen (wie +, ⋅, sin, cos, …) aufgebauter syntaktischer Ausdruck (eine
Zeichenkette), den wir für bestimmte (vom Term abhängige) reelle Zahlen auswerten können. Zwischen Variablensymbolen, reellen Zahlen, Termen, Termauswertung und den dadurch erklärten Funktionen wird speziell in der Analysis oft nicht streng unterschieden. Statt
„die durch den Term 1/x durch Termauswertung definierte Funktion auf R − { 0 }“
sagt man zum Beispiel oft einfach
„die Funktion 1/x“.
Dies ist aus zweierlei Hinsicht problematisch:
(1) 1/x ist ein Term (ein syntaktischer Ausdruck) und keine Funktion.
(2) Der Definitionsbereich der Funktion ist nicht eindeutig spezifiziert.
Wenn man sich dieser Probleme bewusst ist (und nur dann), kann man zur Vereinfachung der Sprechweise vereinbaren, dass eine Funktion mit einem Term verwechselt werden darf. Wichtig ist dabei:
Konvention
Wird ein Term als reelle Funktion bezeichnet, so ist die durch den Term
definierte Funktion mit maximalem reellen Definitionsbereich gemeint.
Ein kleinerer Definitionsbereich muss explizit durch einen Zusatz „auf A“
angegeben werden.
Einführung in die Mathematik 1
© Oliver Deiser
1. Grundlagen über reelle Funktionen
545
Beispiele
(1) Die Funktion sin(x2 ) ist die Funktion f : R → R mit f(x) = sin(x2 ) für
alle x P R.
(2) Die Funktion 1/x ist die Funktion g : R − { 0 } → R mit g(x) = 1/x für
alle x ≠ 0.
(3) Die Funktion 1/x auf R+ ist die Funktion h : R+ → R mit h(x) = 1/x
für alle x > 0.
Punktweise Operationen mit reellen Funktionen
Für reelle Funktionen sind die folgenden arithmetischen Operationen erklärt:
Definition (punktweise Operationen)
Seien f, g : A → R reelle Funktionen, und sei c P R. Dann sind die
Funktionen cf, f + g, f − g, f ⋅ g : A → R definiert durch
(cf )(x)
= c f(x),
(f + g)(x) = f(x) + g(x),
(f − g)(x) = f(x) − g(x),
(f ⋅ g)(x) = f(x) ⋅ g(x) für alle x P A.
Ist B = { x P A | g(x) = 0 } die Menge der Nullstellen von B, so ist die
Funktion f/g : A − B → R definiert durch
(f/g)(x) = f(x)/g(x) für alle x P A − B.
© Oliver Deiser
Einführung in die Mathematik 1
2. Axiome für die reellen Zahlen
Die reellen Zahlen lassen sich axiomatisch beschreiben. Die Axiome lassen sich
dabei in algebraische Axiome und Ordnungsaxiome aufteilen. Die erste Gruppe
beschreibt die Arithmetik, die zweite die lineare Struktur der reellen Zahlen und
ihre Verbindung zur Arithmetik. Von fundamentaler Bedeutung ist das Vollständigkeitsaxiom, das den Unterschied zwischen den rationalen Zahlen − und anderen „lückenhaften“ Zahlbereichen − und den reellen Zahlen zum Ausdruck
bringt.
Axiome für die Addition und Multiplikation
Die reellen Zahlen R sind eine Menge, auf der eine Addition + und eine Multiplikation ⋅ erklärt ist. Die Addition und Multiplikation sind zweistellige Operationen auf R, d. h. für alle reellen Zahlen x und y ist x + y und x ⋅ y wieder eine
reelle Zahl. Weiter gibt es es zwei ausgezeichnete Elemente 0 und 1 in R.
Mit dieser Beschreibung der arithmetischen Struktur der reellen Zahlen können angeben, die beschreiben, welche Eigenschaften in der Struktur gelten. Für
alle x, y, z P R gilt:
(K1)
x + (y + z) = (x + y) + z
Assoziativgesetz für +
(K2)
x+0 = x
Neutralität von 0
(K3)
∃x′ x + x′ = 0
Inverse für +
(K4)
x+y = y+x
Kommutativgesetz für +
(K5)
x ⋅ (y ⋅ z) = (x ⋅ y) ⋅ z
Assoziativgesetz für ⋅
(K6)
x⋅1 = x
Neutralität von 1
(K7)
x ≠ 0 → ∃x′ x ⋅ x′ = 1
Inverse für ⋅
(K8)
x⋅y = y⋅x
Kommutativgesetz für ⋅
(K9)
x ⋅ (y + z) = (x ⋅ y) + (x ⋅ z)
Distributivgesetz
(K10)
0 ≠ 1
Verschiedenheit von 0 und 1
Die Aussagen (K1) − (K10) werden auch als Körperaxiome für R bezeichnet. Wir
sagen auch, dass R mit + und ⋅ und den Elementen 0, 1 einen Körper bildet.
© Oliver Deiser
Einführung in die Mathematik 1
548
6. Abschnitt
Anhänge
Ordnungaxiome
Auf den reellen Zahlen steht uns neben der Arithmetik auch eine Ordnungsrelation < zur Verfügung. Die Eigenschaften dieser Ordnung werden durch weitere Axiome beschrieben. Für alle x, y, z P R gilt:
(K11)
¬x<x
Irreflexivität
(K12)
x<y∧y<z → x<z
Transitivität
(K13)
x<y ∨ x=y ∨ y<x
Vergleichbarkeit
(K14)
x<y → x+z<y+z
Addition und Ordnung
(K15)
0 < x ∧ 0<y → 0 < x⋅y
Multiplikation und Ordnung
Durch diese Axiome wird R ein angeordneter Körper.
Das Vollständigkeitsaxiom
Die bisherigen Axiome legen R nicht eindeutig fest: Alle Axiome gelten auch
für die rationalen Zahlen (und weiter auch für die algebraischen Zahlen). Der
wesentliche Unterschied wird erst durch Aussagen erfasst, die die Nichtexistenz
von Lücken in R zum Ausdruck bringen. Eine Möglichkeit ist das folgende
Axiom.
(K16)
Jede nichtleere und nach oben
beschränkte Teilmenge von R
besitzt ein Supremum.
lineare Vollständigkeit
Das Axiom (K16) kann äquivalent durch die beiden folgenden Axiome ersetzt
werden:
(K16) ′
Ist (xn )n P N eine Cauchy-Folge,
so existiert limn xn .
(metrische) Vollständigkeit
(K17)
∀x, y > 0 ∃n P N n x > y
Archimedisches Axiom
Einführung in die Mathematik 1
© Oliver Deiser
3. Vollständige Induktion
Die natürlichen Zahlen 0, 1, 2, 3, 4, …, n, n + 1, … sind durch die Nachfolgerbildung ausgezeichnet, die ausgehend von einem Anfangselement 0 (alternativ: 1)
jeder natürlichen Zahl n einen eindeutigen Nachfolger n + 1 zuordnet. Das Anfangselement ist die einzige natürliche Zahl, die kein Nachfolger einer anderen
natürlichen Zahl ist. Die Nachfolgeroperation ist zudem injektiv, d. h. haben
zwei Zahlen den gleichen Nachfolger, so sind sie gleich.
Um nun zu zeigen, dass eine Eigenschaft %(n) für alle natürlichen Zahlen n
gilt, können wir so vorgehen: Wir zeigen, dass die Eigenschaft für das Anfangselement gültig ist und dass sie sich von jeder natürlichen Zahl auf ihren Nachfolger vererbt, d. h. dass aus %(n) stets auch %(n + 1) folgt. Ein solcher Beweis heißt
ein Beweis durch (vollständige) Induktion. Als Schema notiert:
Beweis durch Induktion
Induktionsanfang (I. A.):
Es gilt %(0).
Induktionsschritt (I. S.) von n nach n + 1:
Es gelte %(n) (Induktionsvoraussetzung I.V.). Dann gilt %(n + 1).
In dieses Schema ist der Beweis von %(0) und der Beweis von %(n + 1) (mit Hilfe
von %(n)) einzufügen. Sind diese beiden Beweise erbracht, so ist gezeigt, dass
jede natürliche Zahl n die Eigenschaft %(n) besitzt.
Beispiel
Das Paradebeispiel ist die sog. Gaußsumme. Wir wollen zeigen:
(+) Für alle natürlichen Zahlen n gilt 0 + 1 + … + n = n(n + 1)/2.
Die Eigenschaft %(n) ist also 0 + … + n = n(n + 1)/2. Ein induktiver Beweis
von (+) nach obigem Schema lautet:
Induktionsanfang: Es gilt 0 = 0 (0 + 1)/2. Also gilt %(0).
Induktionsschritt von n nach n + 1:
Es gelte %(n), d. h. 0 + … + n = n (n + 1)/2 (I.V.). Dann gilt
0 + … + (n + 1) = (0 + … + n) + (n + 1)
=I. V. n(n+ 1)/2 + (n+ 1) = (n + 1)(n+ 2)/2.
Dies zeigt, dass %(n + 1).
© Oliver Deiser
Einführung in die Mathematik 1
4. Notationen
Wir stellen zunächst einige Notationen tabellarisch zusammen und listen dann
die in diesem Text verwendeten Notationen nach ihrem Auftreten auf.
Notationen und Sprechweisen im Überblick
¬A
(Negation, non A, nicht A)
A∧B
(Konjunktion, A und B)
A∨B
(Disjunktion, A oder B)
A→B
(Implikation, A impliziert B)
A↔B
(Äquivalenz, A und B sind äquivalent; A genau dann, wenn B)
A∧B
(Konjunktion, A und B
∀a %(a)
(Allquantor, für alle x gilt %(a))
∃a %(a)
(Existenzquantor, es gibt (mindestens) ein x mit %(a))
aPA
A = { a | %(a) }
(Elementbeziehung, a ist ein Element der Menge a)
(Mengenkomprehension, Menge aller a mit der Eigenschaft %(a))
A⊆B
(Inklusion, A ist eine Teilmenge von B)
A⊂B
(echte Inklusion, A ist eine echte Teilmenge von B)
{ a, b }
(Paarmenge)
{ a1 , …, an }
(a, b)
(a, b, c)
(a1 , …, an )
A × B = { (a, b) | a P A und b P B }
A2 = A × A, A3 = A2 × A usw.
© Oliver Deiser
(endliche Menge mit den Elementen a1 , … an )
(geordnetes Paar)
(Tripel)
(Tupel der Länge n)
(kartesisches Produkt)
(Mengenpotenzen)
Einführung in die Mathematik 1
552
6. Abschnitt
Anhänge
N = { 0, 1, 2, 3, … }
(natürliche Zahlen)
Z = { …, −2, −1, 0, 1, 2, 3, … }
(ganze Zahlen)
Q = { ± n/m | n P N, m P N* }
(rationale Zahlen)
R = { ± n,d1 d2 d3 … (dezimal) | n P N, 0 ≤ dk ≤ 9 für alle k }
(reelle Zahlen)
N* = N − { 0 }, Z* = Z − { 0 }, Q* = Q − { 0 }, R* = R − { 0 }
f:A →B
( f ist eine Funktion von A (Definitionsbereich) nach B (Wertevorrat))
f(a) = b
(b ist der Wert von f an der Stelle oder im Punkt b)
Def(f)
( Definitionsbereich von f)
Bild(f ) = f[ A ] = { f(a) | a P A }
f|C
( Bild oder Wertebereich von f)
( Einschränkung von f : A → B auf die Menge C ⊆ A)
Lesarten der Implikation
Eine Implikation A → B wird gelesen als:
A impliziert B, aus A folgt B, B folgt aus A, wenn A, so auch B,
A ist hinreichend für B, B ist notwendig für A, A zieht B nach sich.
Griechisches Alphabet
Alpha
Α
α
Beta
Β
β
Gamma Γ
γ
Delta
∆
δ
Epsilon
Ε
ε
Zeta
Ζ
ζ
Eta
Η
η
Theta
Θ
θ, ϑ
Jota
Ι
ι
Kappa
Κ
κ
Lambda Λ
λ
My
Μ µ
Einführung in die Mathematik 1
Ny
Xsi
Omikron
Pi
Rho
Sigma
Tau
Ypsilon
Phi
Chi
Psi
Omega
Ν
Ξ
Ο
Π
Ρ
Σ
Τ
Υ
Φ
Χ
Ψ
Ω
ν
ξ
ο
π
ρ
σ, ς
τ
υ
ϕ
χ
ψ
ω
© Oliver Deiser
4. Notationen
553
Index der Notationen
£x
23
sinh
111
z
261
272
282
sgn
24
H1
111
ζnk
f/g
56
tanh
113
limn zn
x
68
coth
113
log : ] 0, ∞ [ → R
73
sech
113
ln : ] 0, ∞ [ → R
73
csch
113
limz
expa
74
arcosh
114
Rn
ax
74
arsinh
114
ivi
302
potb : ] 0, ∞ [ → R
77
artanh
114
ivimax
302
loga : ] 0, +∞ [ → R
78
arcoth
114
v̂
303
Kr
84
arsech
114
⟨v, w⟩
305
K
84
arcsch
114
v•w
305
cos
85
cosh0
114
⟨v w⟩
305
sin
85
sech0
114
izi
310
rotα
93
T np f
153
⟨z, w⟩
310
tan
94
Tp f
154
]
312
cot
94
I(f)
178
A(i, j)
334
sec
94
X≤s
203
R2×2
334
csc
94
s = max(X)
204
At
335
e
Uε (z)
282
∑ n zn
→p
283
f(z)
283
298
/
96
s = sup(X)
204
E2
336
sin0
97
X+Y
207
δij
336
cos0
97
X⋅Y
207
diag(d1 , d2 )
336
tan0
97
cX
207
fA
339
cot0
97
−X
207
A[P]
350
sec0
97
Sp f
216
G(v)
391
csc0
97
sp f
216
span(v)
391
arccos
98
Sf
217
E(v, w)
391
arcsin
98
sf
217
span(v, w)
391
arctan
98
P + u
391
98
∑ n P N xn
∞
∑n = 0 xn
228
arccot
228
A(i, j)
410
240
diag(a, b, c)
410
241
At
410
246
R3×3
410
fA
412
98
limx
arg
102
si(x)
arctan2
105
limx
Ψ
105
C
257
Φ
105
i
260
prG
412
f+
110
Re(z)
261
prE
413
f−
110
Im(z)
261
A−1
416
cosh
111
|z|
261
Wij (λ)
419
arcsec
© Oliver Deiser
→p
↑p
f(x)
f(x)
Einführung in die Mathematik 1
554
limn
→∞
6. Abschnitt
Anhänge
xn
428
spur(f)
430
f ′(t)
431
Lp f
435
L(f)
436
nivf
443
∂w f(p)
446
∂j f(p)
447
gradf
448
Hf
452
divg
456
rotg
456
=
456
=f
457
⟨=, g⟩
457
=×g
457
D
457
=2
457
I(f)
462
S1 (A, x)
466
S2 (A, y)
466
S3 (A, z)
466
ρ(f)
474
Ar(ρ(f))
474
S2
476
Def(f)
482
f[A]
482
f −1
483
f |C
483
[ a, b ]
485
[ a, b [
485
] a, b ]
485
] a, b [
485
R+0
485
R+
485
R*
485
|x|
486
sgn(x)
486
sgn2 (x)
486
Θ(x)
486
Einführung in die Mathematik 1
© Oliver Deiser
5. Index
A
Abbildung 482
abgeschlossen 485
Ableitung 122 , 284 , 431 , 446
Ableitung der Umkehrfunktion 134
Abspalten einer Nullstelle 41
Abstand 309
Achsenrichtung 447
Addition 257 , 299
Additionstheorem 67
Additionstyp 419
additiv inverse Vektor 299
Additivität 171
affine Ebene 391
affine Gerade 325 , 331 , 391
algebraische Kurve 326 f
algebraische Vielfachheit 42
allgemeine Potenz 77
Alternation 397 , 407
alternierende harmonische Reihe 234
analytische Definition von π 292
Anfangswertproblem 141
angeordneter Körper 491
Anteil 110
Antikommutativität 397 , 407
antiparallel 315
äquidistant 168
Archimedische Spirale 439
Archimedisches Axiom 491
Area-Funktionen 114
Argument 102
Arkusfunktionen 98
Assoziativität 299 , 308 , 342
aufeinander senkrecht 315
aufgespannte Parallelogramm 317
Aufspaltung 171
AWP 141
B
bac-cab−Regel 397
b-adische Darstellung 215
Bahn 430
© Oliver Deiser
Basis 74 , 78 , 215
Basis e 73
Basisvektoren 298
beschränkt 203
Betrag 261 , 486
Betragsfunktion 486
Bijektion 483
bijektiv 483
Bild 350 , 482
Bilinearität 306 , 309 , 397 , 407
Binet-Cauchy-Identität 397
binomische Formeln 306
C
Cauchy-Bedingung 227
Cauchy-Folge 227
Cavalierisches Prinzip 466
charakteristische Polynom 373 , 421
D
Darboux-Integral 217
Darboux-Summe 216
Darstellungsproblem 154
Definitionsbereich 482
Definitionslücke 56
Determinante 319 , 343 , 402
Diagonale 334 , 410
Diagonaleinträge 334
Diagonalisierung 377
Diagonalmatrix 334 , 410
dicht 209
Differentialquotient 122
Differenz 337
Differenzenquotient 122
differenzierbar 122 , 129 , 431 , 446 ,
454
Differenzvektor 299
Dirac-Notation 305
Dirichlet-Sprungfunktion 170 , 244
Diskriminante 30
Distributivität 342
divergent 225
Einführung in die Mathematik 1
556
6. Abschnitt
Anhänge
Divergenz 456
Division 40
domain coloring 267
doppelte Nullstelle 31
Drehformel 92
Drehung 89
Drehung um π/2 88
dreidimensionaler reeller Raum 298
Dreiecksmatrix 353 , 368
Dreiecksungleichung 304 , 486
dynamische Interpretation 430
E
Ebene 391
Eigenpaar 372
Eigenvektor 372 , 421
Eigenwert 372 , 421
eindeutig lösbar 322 , 405
Einheitshyperbel 111 , 327
Einheitskreis 84 , 327
Einheitsmatrix 336 , 411
Einheitsparabel 22 , 327
Einheitssphäre 476
Einheitsvektoren 298
Einheitswurzel 272
Einschränkung 483
Einträge 334
Einträgen 410
Elementarmatrix 419
Ellipse 327
elliptische Integral 438
elliptischen Kurve 328
endlicher Dezimalbruch 213
Endpunkt 430
Entwicklung 46
Entwicklungspunkt 153 f
Erhalt der Länge 361
Erhalt des Skalarprodukts 361
erste Ableitung 129
Euklidische Länge 302
Euklidische Norm 302 , 390
Euklidische Skalarprodukt 305
Euklidisches Skalarprodukt 390
Euler-Mascheroni-Konstante 232
Eulersche Formel 287
Eulersche Identität 288
Eulersche Konstante 67
Eulersche Zahl 67
Exponenten 77
Exponentialfunktion 67 , 74
Einführung in die Mathematik 1
Exponentialreihe 70 , 285
Exponentialschreibweise 68 , 74 , 284
Extraktion der Einträge 338
Extremalstelle 451
F
Farbkreismethode 267
Faser 345
fast alle 225
Fehlerintegral 194
Feinheit 168
Folge 222
folgenstetig 248 , 428 , 446 , 453
Folgenstetigkeit 284
Formel vom nicht vergessenen Betrag
23
Formel von de Moivre 293
Fresnel-Integral 194
Fundamentalsatz der Algebra 268
Funktion 482
(funktionale) Gerade 12
Funktionalgleichung 67
G
Gaußsche Glockenkurve 193 , 470
Gaußsche Zahlenebene 257
gekürzt 59
geometrische Reihe 230 , 285
geometrische Summe 285
Gerade 391
gerade 110 , 484
geschlossen 430
Glied 222
Glockenkurve 470
goldener Schnitt 279
Grad 36
Gradformeln 37
Gradient 448
Gradientenfeld 456
graphischen Methode 484
Grassmann-Identität 397 , 407
Grenzen 485
Grenzwert 224 , 240 , 283 , 428
größte untere Schranke 204
Grundfläche mal Höhe 467
H
Halbierungsformeln 106
halboffen 485
harmonische Reihe 232
© Oliver Deiser
5.
Häufungspunkt 246
Hauptlage 445
Heaviside-Funktion 486
Hesse-Matrix 452
Höhenlandschaften 442
Höhenlinie 443
Höhenliniendiagramme 443
homogen 323 , 406
Hyperbel 327 , 445
I
idempotent 353
Identität 13
imaginäre Einheit 260
Imaginärteil 261
Index 222
Infimum 204
inhomogen 323 , 406
Injektion 483
injektiv 483
Integral 168
Integral-Sinus 193
Integration in Polarkoordinaten 469
Integration in räumlichen Polarkoordinaten 473
integrierbar 462
Intervall 485
Intervallschachtelung 212
invers 356 , 416
Inverse 262
Inversenbildung 299 , 308
invertierbar 356 , 416
Invertierungsregeln 416
J
Jacobi-Identität 397 , 407
Jakobi-Matrix 453
K
Kegelschnitt 328
Kettenlinie 112
Kettenregel 134
kleinste obere Schranke 204
Koeffizienten 36 , 266 , 322 , 405
Koeffizientenformel 71
Koeffizienten-Matrix 323
Koeffizientenvergleich 26 , 42
kollinear 315 , 390
Kommutativität 299 , 308
Komplementärmatrix 357
© Oliver Deiser
Index
557
komplexe Exponentialfunktion 284
komplexe Exponentialreihe 285
komplexe Quadratwurzel 269
komplexe Zahl 257
Komponenten 298 , 429 , 453
komponentenweise Addition 256
komponentenweise Konvergenz 428
komponentenweise Multiplikation 256
komponentenweise Stetigkeit 429
Konjugation 261
Konjugierte 261
konstantes Polynom 36 , 266
Kontur-Plot 443
konvergent 225
Konvergenzbedingung 224
Konvergenzbedingung für Pendelfolgen
211
Konvergenzkriterien 234
Konvergenzproblem 154
Konvergenzradius 158
Koordinaten 321
Koordinatenfunktionen 429
Koordinatenvektor 321 , 405
koordinatenweise 429
Körper der komplexen Zahlen 257
Körperaxiome 490
Kosekans 94
Kosekans Hyperbolicus 113
Kosinus Hyperbolicus 111
Kosinus-Funktion 85
Kosinus-Reihe 145
Kosinussatz 313 , 329
Kotangens 94
Kotangens Hyperbolicus 113
Kreis 84 , 327
Kreisaufwicklung 86
Kreiskegel 467
Kreislinie 84
Kreisring 468
Kreissegment 187
Kreuzprodukt 389 , 396
Kronecker-Delta 336 , 361
Krümmung 130
Kugeloberfläche 476
Kugelvolumen 464
Kurve 430
L
Lagrange-Identität 397 , 407
Landau-Notation 127
Einführung in die Mathematik 1
558
6. Abschnitt
Anhänge
Länge 168 , 302 , 436
Längenformel 436
Laplace-Operator 457
Leibniz-Kriterium 234
Leibniz-Reihe 160 , 234
Leitkoeffizient 36 , 266
Lemniskate von Bernoulli 440
Limes 224
Limesdarstellung der Exponentialfunktion 72
linear 346 , 412
linear abhängig 393
linear unabhängig 393
lineare Funktion 12
Linearfaktoren 41
Linearität 134 , 171
Linearitätsbedingung 346 , 412
Linearkombination 320 , 404
linksseitige Stützstellen 168
linksseitigen Grenzwert 246
linksseitiger Grenzwert 132
Linkssystem 400
log(2)-Reihe 157
Logarithmus 73 , 78
lokale Maximalstelle 451
lokale Minimalstelle 451
lokaler Extremwert 451
lösbar 322 , 405
Lösungsformel 31
Lösungsmenge 322 , 405
M
Majoranten-Kriterium 235
majorisiert 235
Mantelflächenformel 475
Matrix 334 , 410
Matrix-Form eines linearen Gleichungssystems 339
Matrix-Schreibweise 319 , 403
Matrix-Vektor-Produkt 338 , 410
Matrizenaddition 410
Matrizenprodukt 410
Maximum 204
Maximumsnorm 302
Mehrfachintegral 462
(metrisches) Vollständigkeitsaxiom 228
m-fache Nullstelle 42
Minimum 204
Mittelpunkt 84 , 327
Mittelwert 167
Einführung in die Mathematik 1
Mitternachtsformel 31 , 270
mittige Stützstellen 168
monoton fallend 484
monoton steigend 484
Monotonie 171
Multiplikation 257 , 300
Multiplikationssatz 343
Multiplikationstheorem 74
Multiplikationstyp 419
N
Nabla-Operator 456
nach oben (unten) beschränkt 203
Nachkommaziffern 213
natürliche Logarithmus 73
negativ definit 452
negativ orientiert 318 , 401
Neuner-Periode 213 f
Neutralität des Nullvektors 299 , 308
Neutralität von E2 342
Niveaumenge 443
Norm 302
Normalparabel 22
normiert 36 , 266 , 303
Normierung 171 , 303
n-te Ableitung 129
Nullfolge 225
Nullfortsetzung 214
Nullmatrix 336 , 411
Nullpolynom 36 , 266
Nullpunktsteigung 22
Nullstelle 87 , 266 , 484
Nullvektor 298
Nullwert 12 , 22
numerische Exzentrizität 438
O
obere Schranke 203
Oberintegral 217
offen 430 , 485
Öffnung 22
orthogonal 315 , 361 , 390
Orthogonaldarstellung einer Geraden
326
orthogonale Projektion 412 f
Orthogonalität 397 , 407
P
Parabel 22 , 328
Paraboloid 444
© Oliver Deiser
5.
parallel 315
Parallelepiped 401
Parallelogramm 317
Parallelogrammgleichung 309
Parameter 430
Parametrisierung 430
Parität 88 , 110
Paritäts-Zerlegung 110
Partialbruchzerlegung 60
Partialsumme 70 , 228 , 283
partiell differenzierbar 447
partielle Ableitung 447
partielle Integration 180
Partition 168 , 462
Pendelfolge 211
Pentagon 274
periodisch 85
Platzhalternotation 486
Plot 442
polare Integrierbarkeit 469
Polarisation 306 , 309
Polarkoordinaten 102 , 469 , 472
Polarkoordinatenvektor 102
Polarwinkel 102
Polstelle 57
Polygon-Approximation 435
Polynom 36 , 266
Polynomdivision 39
Polynomfunktion 36 , 266
positiv definit 452
positiv orientiert 318 , 401
positive Definitheit 306 , 309
Potenzfunktion 77
Potenzreihe 69
Produkt 337 , 341
Produktregel 134
Projektion 316
Projektionsformel 316
Projektionsmatrizen 347
Punkt-Richtungsdarstellung 15
Q
quadratische Ergänzung 28
quadratischen Funktion 22
Quadratwurzel 23
Quadratwurzelfunktion 23
Quelle 456
quellfrei 456
Quotient 40
Quotienten-Kriterium 235
© Oliver Deiser
Index
559
Quotientenregel 134
R
Radius 84 , 102
rationale Funktion 56
Räumliche Polarkoordinaten 472
Realteil 261
Rechteck 240
rechter Seite 322 , 405
rechtsseitigen Stützstellen 168
rechtsseitiger Grenzwert 132
Rechtssystem 400
reelle Ebene 298
reelle Funktion 484
reeller Vektor 298
regulär 431
Reihendarstellung 69
rein imaginär 261
rektifizierbar 436
Rest 40
Richtungsableitung 446
Richtungsfeld 66
Richtungsvektor 446
Riemann-Integral 170
Riemann-integrierbar 170
Riemann-Summe 169 , 462
Rotation 456
Rotationsfläche 474 f
Rotationskörper 467
Rotationskurve 474
Rotationsmatrix 362
Rücksubstitution 184
Rückwärtsintegral 171
S
Sattelfläche 445
Satz des Pythagoras 88
Satz von Schwarz 448
Scheitelform 27
Scheitelpunkt 27
Schmiegeparabel 150
Schnitt 466
schnittweise integrierbar 462
Sekans 94
Sekans Hyperbolicus 113
Sekante 122
Senke 456
Signum 486
singulär 356 , 416 , 431
Singulärwertzerlegung 382
Einführung in die Mathematik 1
560
6. Abschnitt
Anhänge
Sinus cardinalis 241
Sinus Hyperbolicus 111
Sinus-Funktion 85
Sinus-Reihe 145
Skalar 300
Skalarmultiplikation 300 , 390 , 410
Skalierung 171 , 300
Spaltenextraktion 338
Spaltentausch 342
Spaltenvektoren 322 , 334 , 410
Spann 320 , 404
Spat 401
Spektralsatz 375 , 422
Spiegelung 88
Spiegelungsmatrix 362
Spur 334 , 410 , 430
Stammfunktion 166
Startpunkt 430
Steigung 12 , 446
Steigungsdreieck 13
Steigungsform 15
stetig 242 , 283 , 428 , 446 , 453
stetig differenzierbar 447
stetig hebbar 57
stetig partiell differenzierbar 447
Stetigkeit 243 , 429 , 446 , 453
strebt 240 , 246
streng monoton fallend 484
streng monoton steigend 484
strikte lokale Maximalstelle 451
Stützstellen 168
Substitutionsregel 183
Summanden 228
Summe 228 , 337
Supremum 204
Surjektion 483
surjektiv 483
Symmetrie 306 , 309
symmetrisch 335 , 410
T
Tangens 94
Tangens Hyperbolicus 113
Tangente 17 , 122
Tangentialebene 448
Tangentialvektor 431
Taylor-Entwicklung 47 , 153
Taylor-Polynom 37 , 153
Taylor-Reihe 154
Teiler 39
Einführung in die Mathematik 1
Teilerpolynom 39
Teleskop-Summe 43 , 174
Term 487
Thomae-Funktion 244
Torus 468 , 476
totale Differenzierbarkeit 454
Translation 391
transponierte Matrix 335 , 410
U
Umgebung 282
umgebungsstetig 428 , 446 , 453
Umgebungsstetigkeit 243
Umkehrfunktion 483
Unbekannte 322 , 405
unbestimmten Integrals 165
unbestimmtes Integral 178
uneigentlich konvergent 225
uneigentlichen Grenzwert 247
uneigentlichen Intervall 485
unendliche Reihe 228
unendlicher Dezimalbruch 213
ungerade 110 , 484
unlösbar 322 , 405
unstetig 242
untere Schranke 203
Unterintegral 217
Urbild 482
V
Vektoraddition 390
Vektorfeld 455
Vektorprodukt 389 , 396
Verdopplungsformeln 91
Verlauf in einem Rechteck 240
Verschiebung 12 , 391
Verschiebungsformeln 88
Vertauschung der Integrationsreihenfolge
464
Vietascher Wurzelsatz 33
vollständigen Definitionsbereich 59
von links 246
Vorzeichen 486
Vorzeichenfunktion 24 , 486
W
Wert 228
Wertebereich 482
Wertevorrat 482
Winkel 84
© Oliver Deiser
5.
Index
561
Winkelformel 312 , 390
Winkelhalbierende 13
winkeltreu 369
Wirbelfeld 456
wirbelfrei 456
Wurzel 23
Z
Zeile mal Spalte 93 , 341
Zeilenextraktion 338
Zeilentausch 342
Zeilenvektoren 334 , 410
zerfällt 41
Zerlegungspunkte 168
zugeordnete Abbildung 344 , 412
Zuordnung 482
Zwischenwertsatz 51
Zykloide 439
© Oliver Deiser
Einführung in die Mathematik 1