Vorlesung - Universität Innsbruck

Werbung
Mathematische Methoden der Physik I
Sommersemester 2016
Gebhard Grübl
Institut für Theoretische Physik
Universität Innsbruck
Inhaltsverzeichnis
Vorwort
vi
1 Gewöhnliche Differentialgleichungen
1.1 Skalare Gleichungen erster Ordnung . . . . . . . . . . . .
1.1.1 Definition und einfachste Beispiele . . . . . . . .
1.1.2 AWP: Existenz und Eindeutigkeit . . . . . . . . .
1.1.3 Differentialgleichungen mit getrennten Variablen .
1.1.4 *Magnetfeldlinien eines Dipols 1 . . . . . . . . . .
1.1.5 *Die Kettenlinie . . . . . . . . . . . . . . . . . . .
1.1.6 *Der freie Fall aus großer Höhe . . . . . . . . . .
1.1.7 Lineare Differentialgleichungen . . . . . . . . . . .
1.1.8 Atmosphärische 14 C-Konzentration . . . . . . . .
1.2 Systeme erster Ordnung . . . . . . . . . . . . . . . . . .
1.2.1 Definition und motivierende Beispiele . . . . . . .
1.2.2 Feldlinien einer Punktladung . . . . . . . . . . . .
1.2.3 AWP: Existenz- und Eindeutigkeit der Lösung . .
1.3 Lineare Systeme erster Ordnung . . . . . . . . . . . . . .
1.3.1 2d Drehungen . . . . . . . . . . . . . . . . . . . .
1.3.2 Homogen lineare Systeme . . . . . . . . . . . . .
1.3.3 Autonome homogen lineare Systeme . . . . . . .
1.3.4 3d Drehvektorfelder und ihre Flussabbildungen .
1.3.5 *Drehbewegungen starrer Körper: Trägheitstensor
1.3.6 *Allgemeine Bewegungen starrer Körper . . . . .
1.3.7 *Lageabhängigkeit des Trägheitstensors . . . . . .
1.3.8 *Trägheitstensor eines Ellipsoides . . . . . . . . .
1.3.9 *Kraftbedarf von Drehbewegungen . . . . . . . .
1.3.10 *Coriolis- und Zentrifugalkraft . . . . . . . . . . .
1.3.11 Inhomogen lineare Systeme . . . . . . . . . . . .
1.3.12 *E × B - Drift einer Punktladung . . . . . . . . .
1.3.13 Getriebene lineare Schwingungen: ungedämpft . .
1.3.14 *Der mechanische Fourieranalysator 1 . . . . . . .
1.3.15 Die retardierte Lösung von ẍ + ω 2 x = b . . . . . .
1.4 Lineare Differentialgleichungen 2-ter Ordnung . . . . . .
1.4.1 Äquivalenz zu System erster Ordnung . . . . . . .
1.4.2 Eine Eulersche Differentialgleichung . . . . . . . .
i
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
1
2
2
6
8
14
17
20
25
27
29
29
34
34
35
36
38
39
40
42
44
46
49
52
53
55
57
60
62
64
67
67
69
INHALTSVERZEICHNIS
1.4.3 Getriebene lineare Schwingungen: gedämpft . . .
1.4.4 Eine retardierte gedämpfte Schwingung . . . . . .
1.4.5 Symmetrien einer Differentialgleichung . . . . . .
1.4.6 *Dehnungssymmetrie und 3. Keplersches Gesetz .
1.4.7 *Potential einer homogen geladenen Kugel . . . .
1.4.8 *Thomson- und Rayleighstreuung von Licht . . .
1.4.9 *Klassischer Zeemaneffekt . . . . . . . . . . . . .
1.4.10 Legendresche Differentialgleichung 1 . . . . . . . .
1.4.11 d’Alemberts Reduktionsverfahren . . . . . . . . .
1.4.12 Methode des Potenzreihenansatzes . . . . . . . .
1.4.13 Legendresche Differentialgleichung 2 . . . . . . . .
1.4.14 *Hermitesche Differentialgleichung . . . . . . . .
1.4.15 *Airys Differentialgleichung . . . . . . . . . . . .
1.4.16 Ein lineares Rand- und Eigenwertproblem . . . .
1.4.17 *Green’sche Funktion eines Randwertproblems . .
1.5 *Harmonisch angeregte lineare Schwingung . . . . . . . .
1.5.1 Übersicht über L0 . . . . . . . . . . . . . . . . . .
1.5.2 Partikuläre Lösungen ypart für harmonische Kraft
1.5.3 Qualitatives Resümee . . . . . . . . . . . . . . . .
1.6 Übungsbeispiele . . . . . . . . . . . . . . . . . . . . . . .
ii
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
2 Fourieranalysis
2.1 Fourierreihen . . . . . . . . . . . . . . . . . . . . . . . . . .
2.1.1 Trigonometrische Polynome . . . . . . . . . . . . . .
2.1.2 Beispiele trigonometrischer Polynome . . . . . . . . .
2.1.3 Dirichlets Kern . . . . . . . . . . . . . . . . . . . . .
2.1.4 Grenzfunktionen trigonometrischer Reihen . . . . . .
2.1.5 Approximation durch Fourierreihen . . . . . . . . . .
2.1.6 Fourierreihe der Rechteckschwingung . . . . . . . . .
2.1.7 Fouriereihen allgemeiner Periode . . . . . . . . . . .
2.1.8 *Lokalisierungsenergie im Potentialtopf . . . . . . . .
2.1.9 Periodisch getriebener Oszillator: Fourierreihenlösung
2.1.10 *Der mechanische Fourieranalysator 2 . . . . . . . . .
2.1.11 Allgemeine Eigenschaften der Fourierkoeffizienten . .
2.1.12 Konvergenz der Fourierreihe . . . . . . . . . . . . . .
2.1.13 Fourierreihen einiger Standardfunktionen . . . . . . .
2.2 Fouriertransformation auf L1 (R) . . . . . . . . . . . . . . .
2.2.1 Von der Fourierreihe zum Fourierintegral . . . . . . .
2.2.2 Der Hauptsatz der Fouriertransformation . . . . . . .
2.2.3 Beispiele zur Fouriertransformation . . . . . . . . . .
2.2.4 *Frequenzmessung an einem harmonischen Signal . .
2.2.5 *Störung einer Quantendynamik . . . . . . . . . . . .
2.2.6 *Beugung am Spalt und Fouriertransformation . . . .
2.2.7 *Faltung und Messung . . . . . . . . . . . . . . . . .
2.2.8 *Faltung und Bildfehlerkorrektur . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
70
72
73
77
78
80
83
86
92
94
95
99
104
108
109
112
113
116
122
122
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
136
. 137
. 137
. 140
. 143
. 144
. 147
. 150
. 151
. 153
. 156
. 159
. 160
. 162
. 166
. 167
. 167
. 168
. 173
. 181
. 182
. 184
. 186
. 188
INHALTSVERZEICHNIS
iii
2.2.9 *Streuung von Wellen und Fouriertransformation . . . . . . . 189
2.2.10 *Einige 3d-Fouriertransformierte . . . . . . . . . . . . . . . . . 191
2.3 Übungsbeispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 194
3 Vektoranalysis
3.1 Differenzieren von Skalarfeldern . . . . . . . . . . . . . . . . .
3.1.1 Richtungsableitung und Differential . . . . . . . . . . .
3.1.2 Beispiele zum Differential . . . . . . . . . . . . . . . .
3.1.3 Skalarpotential eines Punktdipols . . . . . . . . . . . .
3.1.4 *Lineare Richtungsableitungen ohne D’barkeit . . . . .
3.1.5 Partielle Ableitungen . . . . . . . . . . . . . . . . . . .
3.1.6 Beispiele zur partiellen Ableitung . . . . . . . . . . . .
3.1.7 Gradient . . . . . . . . . . . . . . . . . . . . . . . . . .
3.1.8 *Kräftefreie relativistische Bewegung . . . . . . . . . .
3.1.9 *Konstante relativistische Kraft . . . . . . . . . . . . .
3.1.10 *Relativistischer harmonischer Oszillator . . . . . . . .
3.1.11 Basisdarstellung eines Gradienten . . . . . . . . . . . .
3.1.12 Faulenzerregeln zum Gradienten . . . . . . . . . . . . .
3.1.13 Gradientenfeld des Punktdipolpotentials . . . . . . . .
3.1.14 Gradientenfeld des Polarwinkels . . . . . . . . . . . . .
3.1.15 *Gradient zur Minkowskigeometrie . . . . . . . . . . .
3.1.16 *Symplektischer Gradient - Hamiltons Vektorfeld . . .
3.2 Differenzieren von Vektorfeldern . . . . . . . . . . . . . . . . .
3.2.1 Differential und Richtungsableitung . . . . . . . . . . .
3.2.2 *Lieprodukt von Vektorfeldern . . . . . . . . . . . . . .
3.2.3 Transport von Skalar- und Tangentenvektorfeldern . . .
3.2.4 *Lieableitung von Skalar- und Tangentenvektorfeldern .
3.2.5 *Beschleunigung einer Integralkurve von γ̇ = X (t, γ) .
3.2.6 Wegintegrale eines Vektorfeldes . . . . . . . . . . . . .
3.2.7 Wegintegrale des Vortexfeldes . . . . . . . . . . . . . .
3.2.8 *Flächeninhalt und Drehvektorfeld . . . . . . . . . . .
3.2.9 Konservative Vektorfelder und Potentiale . . . . . . . .
3.2.10 *Landvermessung: Wegabhängige Höhendifferenz? . . .
3.2.11 Poincarés Existenzsatz für skalare Potentiale . . . . . .
3.2.12 Divergenz eines Vektorfeldes . . . . . . . . . . . . . . .
3.2.13 Faulenzerregeln zur Divergenz und Beispiele . . . . . .
3.2.14 Laplace-Operator . . . . . . . . . . . . . . . . . . . . .
3.2.15 Potential einer Punktladung (dim V = n) . . . . . . . .
3.2.16 *Homogene Linienladung: Halbgerade (dim V = 3) . . .
3.2.17 *Homogen geladenes Geradenstück (dim V = 3) . . . .
3.2.18 *Inhomogen geladene Halbgerade (dim V = 3) . . . . .
3.2.19 *Dipolbelegte Halbgerade (dim V = 2) . . . . . . . . .
3.2.20 Helmholtzgleichung: alle radialen Lösungen . . . . . . .
3.2.21 Orientierung eines Vektorraums . . . . . . . . . . . . .
3.2.22 Rotation eines 3d-Vektorfeldes . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
198
199
199
204
206
207
208
208
209
211
214
215
223
224
225
225
227
228
230
231
232
235
236
237
237
238
239
240
242
243
244
248
250
251
252
256
257
259
259
259
263
INHALTSVERZEICHNIS
iv
3.2.23 Faulenzerregeln zur Rotation . . . . . . . . . . . . .
3.2.24 Existenz von (Vektor)Potentialen . . . . . . . . . .
3.2.25 *Lorentzkraft: Lagrange- und Hamiltonfunktion . .
3.2.26 *Vektorpotential des freien Vortexfeldes . . . . . .
3.2.27 *Vektorpotential des Punktdipols . . . . . . . . . .
3.2.28 *Das elektromagnetische Nahfeld eines Pulsars . . .
3.2.29 *Uneigentliches Vektorpotential A′ eines Monopols
3.2.30 *Rekonstruktion des Dipolvektorpotentials aus A′ .
3.3 Krummlinige Koordinatensysteme . . . . . . . . . . . . . .
3.3.1 Lokale Karten von Rn . . . . . . . . . . . . . . . .
3.3.2 Navigation auf der Sphäre . . . . . . . . . . . . . .
3.3.3 Kartenbasis . . . . . . . . . . . . . . . . . . . . . .
3.3.4 Vektorfeldkomponenten zu Kartenbasen . . . . . .
3.3.5 Polarkoordinaten . . . . . . . . . . . . . . . . . . .
3.3.6 Kugelkoordinaten . . . . . . . . . . . . . . . . . . .
3.3.7 Kartenabhängigkeit partieller Ableitungen . . . . .
3.3.8 Geschwindigkeit zerlegt nach Kartenbasis . . . . . .
3.3.9 *Beschleunigung zerlegt nach Kartenbasis . . . . .
3.3.10 *Berechnung der Christoffelsymbole einer Karte . .
3.3.11 *Beschleunigung sphärisch zerlegt . . . . . . . . . .
3.3.12 *Bewegung im Zentralkraftfeld . . . . . . . . . . .
3.3.13 *Keplerproblem . . . . . . . . . . . . . . . . . . . .
3.3.14 *Richtungsableitung eines Vektorfeldes . . . . . . .
3.3.15 Div, Rot, Grad und ∆ in krummen Karten . . . . .
3.3.16 *Drehgeneratoren in Kugelkoordinaten . . . . . . .
3.3.17 *Magnetfeldlinien eines Dipols 2 . . . . . . . . . . .
3.4 *Kartenfreie Mechanik in Galileis Raumzeit . . . . . . . .
3.4.1 Affine Räume . . . . . . . . . . . . . . . . . . . . .
3.4.2 Flache Galilei Raumzeit M . . . . . . . . . . . . .
3.4.3 Bewegung und Bezugssysteme in M . . . . . . . .
3.4.4 Geschwindigkeit und Beschleunigung . . . . . . . .
3.4.5 Galileigruppe . . . . . . . . . . . . . . . . . . . . .
3.4.6 G-trafo von Geschwindigkeit und Beschleunigung .
3.4.7 Newtons Grundgesetze der Mechanik . . . . . . . .
3.4.8 Die Erhaltungssätze . . . . . . . . . . . . . . . . .
3.5 Übungsbeispiele . . . . . . . . . . . . . . . . . . . . . . . .
4 Wahrscheinlichkeit
4.1 Endliche Wahrscheinlichkeitsräume . . . . . . . . . .
4.1.1 Wahrscheinlichkeit als Mengenfunktion . . . .
4.1.2 Konstruktion von Wahrscheinlichkeitsräumen
4.1.3 Binomialverteilung . . . . . . . . . . . . . . .
4.1.4 *Multinomialverteilung . . . . . . . . . . . . .
4.1.5 *Hypergeometrische Verteilung . . . . . . . .
4.1.6 Erwartungswert und Varianz . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
265
267
268
271
272
272
274
275
276
276
278
281
282
284
286
288
289
290
292
294
295
297
299
301
303
305
307
308
309
311
312
314
318
319
320
321
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
329
330
331
332
336
337
337
338
INHALTSVERZEICHNIS
4.1.7 *Kovarianz und Korrelationskoeffizient . . . . . . .
4.1.8 Das Gesetz der großen Zahl . . . . . . . . . . . . .
4.2 Abzählbar unendliche W-räume . . . . . . . . . . . . . . .
4.2.1 Geometrische Verteilung . . . . . . . . . . . . . . .
4.2.2 Poissonverteilung . . . . . . . . . . . . . . . . . . .
4.3 Wahrscheinlichkeitsmaße auf Rn . . . . . . . . . . . . . . .
4.3.1 Wahrscheinlichkeitsmaße auf R mit Dichtefunktion
4.3.2 Gauß’sche Normalverteilung . . . . . . . . . . . . .
4.3.3 Exponentialverteilung . . . . . . . . . . . . . . . .
4.3.4 *Cauchyverteilung . . . . . . . . . . . . . . . . . .
4.3.5 Erwartungswert und Varianz . . . . . . . . . . . . .
4.3.6 Gleichverteilung auf Intervall . . . . . . . . . . . .
4.3.7 W-Maße auf Rn und ihr Transport . . . . . . . . .
4.4 Übungsbeispiele . . . . . . . . . . . . . . . . . . . . . . . .
v
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
341
343
350
351
353
355
355
356
358
360
360
361
362
369
Vorwort
Seit einigen hundert Jahren begleitet die Mathematik das Bemühen der Menschen
um ein besseres Verstehen der Natur. Ganz besonders in den Theorien der Physik
schaffen mathematische Denkmuster eine Wirklichkeit, die vielfach in einer geradezu
gespenstisch weitreichenden Analogie zur sinnlichen Wirklichkeit steht. Mathematik
wird damit materiell erfahrbar! Wer an diesem Erleben teilhaben will, muss sich einer
intensiven mathematischen Schulung unterziehen. Als Lohn der Mühe erschließt sich
ein unerschöpfliches kulturelles Erbe, auf dem Physik - und manchmal sogar die
Mathematik selbst - dann weiter wachsen können.
Traditionellerweise ergänzen Vorlesungen über mathematische Methoden der
Physik die eigentlichen, professionellen Mathematikvorlesungen, die von den Physikstudienplänen vorgesehen sind. Sie vermitteln vorrangig rechnerische Fertigkeiten
und bringen uns wie Seilbahnen rasch in Regionen, die wir durchstreifen wollen, ohne
dass wir uns durch alle darunterbefindlichen Zonen hocharbeiten müssen. Natürlich
um den Preis, dass wir wie Seilbahntouristen auf die nähere Umgebung der Bergstation festgenagelt bleiben. Allgemeine Theorie tritt zugunsten einprägsamer Beispiele
etwas in den Hintergrund. So auch in dieser Vorlesung.
Das Manuskript entstand zu meinen Vorlesungen Mathematische Methoden der
Physik I der Sommersemester 2002 bis 2015 an der Universität Innsbruck. Es ist
um einiges genauer und umfassender als der Vortrag. Es enthält einige (mit einem
Stern gekennzeichnete) nicht vorgetragene Abschnitte. Diese vertiefen entweder die
gerade behandelte mathematische Technik oder wenden sie auf ein physikalisches
Problem an. Sie schweifen aber auch gelegentlich vom aktuellen Kernthema ab, um
physikalisch angrenzende Motive in der zuvor dargelegten mathematischen Sprache der Vorlesung aufzunehmen. Vielleicht kann es so die ’Aficionados’ der Theorie
zu einer eigenständigen Verfestigung ihrer Kenntnisse quer über verschiedene Vorlesungen hinweg anregen. Um eigene Gedanken angereichert, könnte der Text im
Verlauf des weiteren Physikstudiums zu einer langsam vertrauten Werkzeugkiste
breiter Einsetzbarkeit werden.
Hans Embacher, Peter Girtler, Gerhard Kirchner und Sabine Kreidl steuerten einige Diagramme, Korrekturen und Anregungen bei. Ihnen und allen Student(inn)en,
die durch unbeirrt bohrendes Fragen der Vorlesung zu größerer Klarheit verhalfen,
danke ich sehr herzlich.
4. Feber 2016, Gebhard Grübl
vi
Kapitel 1
Gewöhnliche
Differentialgleichungen
Die Punktmechanik sieht die Bewegung von Materie als eine Bewegung von ausdehnungslosen Bausteinen, die aufeinander durch scheinbar leeren Raum mittels Fernkräften einwirken. Diese fiktiven Elemente der Materie heißen Massenpunkte. Die
grundlegenden frei wählbaren Bestimmungsstücke eines jeden Massenpunkts zu einer bestimmten Zeit sind sein Ort und seine Geschwindigkeit (in Newtons fiktivem
absolutem Raum oder relativ zu einem Bezugssystem). Alles weitere einer komplexen Bewegungsgeschichte folgt dann aus den mechanischen Bewegungsgesetzen,
denn Masse und Kraftgesetze sind (meist) unveränderlich und vorgegeben.
Manchmal ersetzt ein einziger Massenpunkt eine riesige Materieansammlung, wie
eine Kanonenkugel, einen Planeten, einen Stern oder auch eine Galaxie. Nämlich
dann, wenn die inneren Veränderungen des zum Punkt stilisierten Aggregats für
seine kollektive Bewegung belanglos zu sein scheinen.
Die Bewegung der Massenpunkte eines Systems regelt die Mechanik indem sie
deren momentanen Beschleunigungen eindeutig festlegt und zwar mithilfe von Kraftgesetzen und Massen. Diese drücken die momentanen Beschleunigungen durch die
gleichzeitigen Orte und Geschwindigkeiten aller im System vorhandenen Massenpunkte aus. So scheiden die meisten naiv vorstellbaren Bewegungen als unmöglich
aus und nur ganz bestimmte bleiben übrig. Physikalisch möglich sind nur die Lösungungen der für das jeweilige System charakteristischen Bewegungsgleichungen. Solche Gleichungen heißen unter noch näher zu erläuternden Begleitumständen Differentialgleichungen und von ihnen handelt das vorliegende Kapitel. Das mechanische
Beispiel eines fundamentalen Naturgesetzes in der Form von Differentialgleichungen
hat die Physik gründlich geprägt. Differentialgleichungen sind heute in Naturwissenschaft und Technik allgegenwärtig.
1
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
1.1
1.1.1
2
Skalare Gleichungen erster Ordnung
Definition und einfachste Beispiele
Wie kommt es zu einer Differentialgleichung? Hier ein Beispiel: Ein mit Wasser gefülltes Gefäß rinnt durch einen Auslass im Boden aus. Die Querschnittsfläche des
Gefäßes in der Höhe h > 0 über dem Boden sei A (h) > 0 und die Querschnittsfläche des Auslasses sei a > 0. Sinkt der Wasserspiegel in einem kleinen Zeitintervall
∆t > 0 von der Höhe h auf die Höhe 0 < h + ∆h < h ab, dann strömt Wasser desselben Volumens mit der Geschwindigkeit v (h) durch den Auslass. Daher
gilt A (h) · (−∆h) = a · v (h) ∆t + o (∆t) (Volumserhaltung bei einer inkompressiblen
Flüssigkeit). Dabei bezeichnet o (∆t) eine (im Detail unbekannte) Funktion, die aber
für ∆t → 0 so rasch gegen 0 geht, dass lim∆t→0 o (∆t) /∆t = 0 gilt.
Die Funktion v (h) lässt sich aus der Energieerhaltung erschließen. Diese besagt,
dass die Abnahme der potentiellen Energie durch das Verschwinden einer kleinen
Wassermenge in der Höhe h, also die Energie ∆m · g · h der kinetischen Energie
der ausströmenden Wassermenge ∆m · √
v (h)2 /2 gleicht. Es gilt also ∆m · g · h =
2
∆m · v (h) /2 + o (∆m) , also v (h) = 2gh. (Energieerhaltung) Einsetzen dieses
Zusammenhangs zwischen v und h in die Volumsbilanz ergibt im Grenzübergang
∆t → 0 die Beziehung zwischen der Sinkgeschschwindigkeit des Wasserspiegels und
der gerade vorliegenden Füllhöhe
−
dh
a
=
dt
A (h)
2gh.
(1.1)
Derartige Beziehungen werden in der folgenden Definition präzisiert und verallgemeinert. Ein wichtiges Ziel wird es nun sein, zu erlernen was sich aus Gleichung (1.1)
über die Funktion t → h (t) erschließen lässt. Wir werden bald sehen, dass sich diese
Funktion berechnen lässt, wenn der Füllstand anfänglich, wenn das Gefäß geöffnet
wird, bekannt ist.
Definition 1 (Anfangswertproblem) Sei M = D1 × D2 ⊂ R2 , wobei D1 und D2
allgemeine reelle Intervalle sind. (Sie können offen, halboffen, geschlossen, uneigentlich sein.) Eine Funktion f : M → R sei gegeben. Auf einem allgemeinen Intervall
D ⊂ R sei eine Funktion α : D → R gegeben. Falls der Graph von α in M enthalten
ist, und für alle x ∈ D
α′ (x) = f (x, α(x))
gilt, dann heißt α eine Lösung der (gewöhnlichen, skalaren) Differentialgleichung
(erster Ordnung) y ′ = f (x, y). Falls α(x0 ) = y0 gilt, sagt man α sei eine Lösung
zum Anfangswert (x0 , y0 ) ∈ M. Falls zu einer Lösung α keine Lösung β : D′ → R
existiert, für die D echt in D′ enthalten ist und β(x) = α(x) für alle x ∈ D gilt,
dann heißt die Lösung α maximal.
Anmerkungen: 1) Der Definitionsbereich D einer Lösung α ist zwangsläufig
Teilmenge von D1 . 2) Oft wird lose formuliert: Eine Differentialgleichung ist eine Gleichung, in der eine Funktion und ihre Ableitungen vorkommen. Das ist zu
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
3
weitläufig, denn gilt für eine Funktion α, dass α′ (x) = f(x, α(x/2)) oder dass
α′ (α(x)) = f (x, α(x)), so sind dies keine Differentialgleichungen im Sinn der hier zugrunde gelegten Definition. 3) Die hier gewählte Beschränkung auf offene Rechtecke
M als Definitionsbereiche von f schließt übrigens auch folgendes aus: y ′ = 1/(x2 −y 2 )
auf {(x, y) ∈ R2 | x2 = y 2 } . Diese Beschränkung ist nicht wirklich notwendig und es
würde genügen, M ⊂ R2 als zusammenhängend und offen vorauszusetzen. Die Beschränkung auf offene Rechtecke vereinfacht aber manche Überlegungen.
Definition 2 Sei y ′ = f(x, y) eine Differentialgleichung. Sei M der Definitionsbereich von f. Dann heißt V : M → R2 , (x, y) → (1, f (x, y)) das Vektorfeld von
y ′ = f (x, y). Jedes Vektorfeld des Typs g · V mit einer Funktion g : M → R 0
heißt Richtungsfeld von y ′ = f (x, y).1
Abbildung (1.1) zeigt ein Richtungsfeld der Differentialgleichung y ′ = xy.
y
2
1
0
-2
-1
0
1
2
x
-1
-2
Abbildung 1.1: Richtungsfeld zu y ′ = xy
Ist α Lösung von y ′ = f (x, y) und ist x0 im Definitionsbereich von α, dann stimmt
die Tangente des Graphen von α in (x0 , α(x0 )) mit (x0 , α(x0 )) + R · V (x0 , α(x0 ))
überein. Ein Richtungsfeld der Differentialgleichung ist somit in den Punkten des
Graphen einer Lösung tangential zu diesem. Damit vermittelt ein Richtungsfeld
einen qualitativen Eindruck von den Lösungen einer Differentailgleichung.
Beispiel 3 Sei f : R2 → R, (x, y) → λy für ein λ ∈ R. Abbildung 1.2 veranschaulicht ein Richtungsfeld für λ = 1. Lösungen der Differentialgleichung y ′ = λy sind
leicht zu erraten: Für jedes c ∈ R ist αc : R → R, x → c exp (λx) eine maximale
Lösung. Abbildung 1.3 zeigt αc für λ = 1 und c = ±1, ±2. Gibt es neben den Einschränkungen der Lösungen αc auf Intervalle weitere Lösungen von y ′ = λy? Nein,
denn für jede Lösung α gilt in ihrem Definitionsintervall D
(α (x) exp (−λx))′ = α′ (x) exp (−λx) + α(x) (exp (−λx))′
= λα(x) exp (−λx) − λα(x) exp (−λx) = 0.
1
Vielfach wird auch die Äquivalenzklasse von Vektorfeldern {g · V |g : M → R 0 } als ’das’
Richtungsfeld der Differentialgleichung bezeichnet. Gezeichnet wird dann nur ein Repräsentant
(ohne Orientierungspfeil), meist mit konstanter Länge.
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
4
Abbildung 1.2: Richtungsfeld von y ′ = y
Abbildung 1.3: Lösungen von y ′ = y
Daher ist α (x) exp (−λx) konstant auf D. (Hier wird davon Gebrauch gemacht, dass
D ein Intervall ist.) Damit gilt für die Menge L aller maximalen Lösungen von y ′ =
λy, dass L = {αc | c ∈ R}. Eine maximale Lösung zum Anfangswert (x0 , y0 ) ∈ R2
erfüllt y0 = αc (x0 ) = c exp(λx0 ). Damit folgt c = y0 exp (−λx0 ). Es existiert somit
genau eine maximale Lösung von y ′ = λy zu einem gegebenen Anfangswert. Die
naive Erwartung, dass die Differentialgleichung die maximale Lösung determiniert,
wird von diesem Beispiel bestätigt. L enthält die Nulllösung α0 = 0. Ihr Graph
trennt den Definitionsbereich R2 der Differentialgleichung in die disjunkten Bereiche
M> := R × R>0 und M< := R × R<0 . Für c > 0 ist der Graph von αc (zur Gänze)
in M> und für c < 0 in M< enthalten.
Eine Differentialgleichung mit f : R×D2 → R heißt autonom, falls f konstant
im ersten Argument ist. Ist α : D → R eine Lösung einer autonomen Diffgl, dann
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
5
ist für jedes τ ∈ R auch ihr Translat2
ατ : Dτ := {x ∈ R | x − τ ∈ D} → R,
x → α(x − τ )
eine Lösung. Warum? Für x ∈ Dτ gilt
d
ατ
dx
d
α(x − τ + ε) − α(x − τ )
=
α (x)
ε→0
ε
dx τ
d
=
α (x − τ ) = f (x − τ , α(x − τ )) = f (x, ατ (x)) .
dx
(x) = lim
Die Funktion f der Differentialgleichung von Beispiel 3 ist konstant im ersten Argument. Für αc ∈ L gilt (αc )τ = αc exp(−λτ ) . Die Translationen erzeugen aus α1 alle
Lösungen αc mit c > 0 und aus α−1 alle Lösungen αc mit c < 0. Die Nulllösung ist
translationsinvariant: (α0 )τ = α0 . Dies illustriert die Rolle von Symmetriegruppen:
Symmetrien erzeugen aus einer Lösung andere.
Beispiel 4 Sei f : R2 → R, (x, y) → y 2 . Abbildung 1.4 zeigt ein Richtungsfeld
von y ′ = y 2 . Drei maximale Lösungen sind leicht zu erraten:
• α0 : R → R,
x → 0 (konstante Lösung)
• α+ : R<0 → R>0 ,
x → −1/x
• α− : R>0 → R<0 ,
x → −1/x
Abbildung 1.4: Richtungsfeld von y ′ = y 2
Obwohl die Lösung α+ maximal ist, ist sie nur für alle x ∈ R<0 definiert. Ihr
Graph entschwindet für x ↑ 0 ins Unendliche. Analoges gilt für α− . Da die Differentialgleichung autonom ist, kann durch Translationen daraus die folgende Menge
L maximaler Lösungen gewonnen werden.
L = {α0 } ∪ {(α+ )τ | τ ∈ R} ∪ {(α− )τ | τ ∈ R} .
2
Es gilt also ατ (x + τ) = α(x) für alle x ∈ D.
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
6
Der Definitionsbereich von (α+ )τ ist das Intervall R<0 +τ = (−∞, τ ), der von (α− )τ
ist R>0 + τ = (τ , ∞). Es gilt
(α+ )τ (x) =
1
1
für x < τ und (α− )τ (x) =
für x > τ .
τ −x
τ −x
In L gibt es zu jedem Anfangswert (x0 , y0 ) ∈ R2 genau eine Lösung. Für y0 = 0 ist
dies die Lösung α0 . Für y0 > 0 ist es die Lösung (α+ )τ mit τ = x0 + y10 > x0 , was
aus y0 = (α+ )τ (x0 ) = 1/ (τ − x0 ) folgt. Analog ist für y0 < 0 die einzige Lösung in
L mit α(x0 ) = y0 die Funktion (α− )τ mit τ = x0 + y10 < x0 . Der folgende Satz zieht
nach sich, dass L die Menge aller maximalen Lösungen von y ′ = y 2 ist.
1.1.2
AWP: Existenz und Eindeutigkeit
Die Frage, ob eine Differentialgleichung y ′ = f (x, y) überhaupt Lösungen besitzt,
und inwiefern verschiedene Lösungen zum selben Anfangswert sich voneinander unterscheiden können, ist natürlich für physikalische Zwecke äußerst interessant und
öffnet ein weites Aufgabenfeld. Für die Existenz von Lösungen zu beliebigem Anfangswert reicht die Stetigkeit von f. Für die Eindeutigkeit von lokalen Lösungen
durch einen Punkt p braucht es jedoch etwas stärkere Annahmen an f. Hier ein
einigermaßen weitreichender Satz zu beiden Fragen. Ein Beweis ist in Kap. II, §6
von [18] ausgeführt.
Satz 5 Seien D1 und D2 allgemeine, offene, reelle Intervalle und M := D1 × D2 .
Die Funktion f : M → R sei stetig. Für jedes p ∈ M existiere ein offenes Rechteck
Rp ⊂ M mit p ∈ M und eine reelle Zahl Lp > 0, sodass
|f (x, y1 ) − f (x, y2 )| ≤ Lp |y1 − y2 |
(1.2)
für alle (x, y1 ) und (x, y2 ) in Rp .3 Die Funktionen α : D → R und β : D → R seien
Lösungen von y ′ = f (x, y) mit α(x0 ) = β(x0 ) für ein x0 ∈ D. Dann gilt α = β. Der
Graph einer maximalen Lösung kommt dem Rand von M beliebig nahe. Durch jeden
Punkt von M existiert genau eine maximale Lösung.
Der Satz stellt klar, dass durch jeden Punkt von M Lösungen von y ′ = f (x, y)
existieren. Eine Lösung durch einen Punkt p, deren Definitionsintervall nicht mehr
ausgedehnt werden kann, ist eine maximale Lösung. Sie ist eindeutig bestimmt. Jede
weitere Lösung durch p ist Einschränkung der maximalen Lösung durch p.
Der Satz zeigt überdies, dass bei einer Abänderung der Funktion f in eine Funktion g mit g(x, y) = f (x, y) für alle (x, y) in einem Rechteck M ′ ⊂ M mit (x0 , y0 ) ∈ M ′
die Lösung zum Anfangswert (x0 , y0 ) ∈ M innerhalb von M ′ unverändert bleibt.
Man sagt, dass der Satz ein Nahewirkungsprinzip zum Ausdruck bringt.
Falls es für eine Differentialgleichung y ′ = f (x, y), deren Funktion f die Voraussetzungen des Satzes erfüllt, gelungen ist, zu jedem Anfangswert in M eine maximale
3
Man sagt, dass f lokal Lipschitzbeschränkt ist. Lp heißt Lipschitzkonstante.
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
7
Lösung zu finden, dann sagt der Satz, dass die Gleichung keine weiteren maximalen
Lösungen hat.
Eine hinreichende Bedingung dafür, dass f lokal Lipschitzbeschränkt ist, lautet:
Ist die stetige Funktion f von Satz 5 nach dem zweiten Argument stetig partiell
differenzierbar, dann erfüllt f die lokale Lipschitzbedingung (1.2). Die beiden Beispiele 3 und 4 erfüllen somit die Voraussetzungen des Satzes. Die für die Beispiele
angegebenen Mengen L an maximalen Lösungen enthalten zu jeder möglichen Anfangsbedingung genau eine Lösung. Nach Satz 5 existieren daher keine weiteren
maximalen Lösungen.
Hier noch eine Funktion f, die nicht auf ganz M lokal Lipschitzbeschränkt ist.
f : R2 → R,
(x, y) →
|y|.
(1.3)
f ist stetig aber f ist nicht auf ganz R2 lokal Lipschitzbeschränkt. Warum: Wähle
den Punkt p = (x0 , 0). Ist f lokal Lipschitzbeschränkt um p, dann existiert ein
ε > 0 und eine Konstante L > 0 mit |y| ≤ L |y| für alle y ∈ (−ε, ε). Daraus
folgt 0 ≤ limy↓0 √1y ≤ L. Das ist bekanntlich nicht der Fall. Also ist f nicht lokal
Lipschitzbeschränkt. Beachte jedoch: die Einschränkung von f auf R × R>0 ist lokal
Lipschitzbeschränkt, da f dort stetig partiell diffbar ist.
Ohne Lipschitzbedingung kann die Eindeutigkeit fehlen - ein Beispiel
Untersuchen wir die Differentialgleichung y ′ = 2 |y|. Satz 5 ist nicht anwendbar.
Das Richtungsfeld, siehe Figur 1.5, unterscheidet sich nicht besonders auffällig von
Abbildung 1.5: Richtungsfeld von y ′ = 2 |y|
jenem aus Beispiel 4. Wir erraten neben der Nulllösung α0 : R → R, x → 0 die
Lösungen: α− : R≤0 → R≤0 , x → −x2 und α+ : R≥0 → R≥0 , x → x2 und deren
Translate (α± )τ .
Die Lösungen (α± )τ sind jedoch nicht maximal. Sie können stetig differenzierbar
durch die Nulllösung fortgesetzt werden. So entsteht die folgende Menge L von
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
8
maximalen Lösungen αa,b mit a ≤ b ∈ R und

 −(x − a)2 für x < a
0
für a ≤ x ≤ b .
αa,b : R → R, x →

(x − b)2
für b < x
Es gilt also L = {αa,b | a, b ∈ R und a ≤ b}. Figur 1.6 zeigt die Lösung αa,b mit
a = −1 und b = 2. Zu jedem Anfangswert (x0 , y0 ) mit y0 = 0 existiert lokal genau
y
4
2
0
-2.5
-1.25
0
1.25
2.5
3.75
x
-2
-4
Abbildung 1.6: Eine Lösung von y ′ = 2 |y|
eine Lösung. Global existieren zu jedem Anfangswert unendlich viele verschiedene
Lösungen. Für Anfangswerte (x0 , 0) existieren auch lokal unendlich viele verschiedene Lösungen. Der Unterschied zur Lösungsmenge von Beispiel 4 ist also doch
erheblich.
1.1.3
Differentialgleichungen mit getrennten Variablen
Definition 6 Seien D1 und D2 allgemeine, offene Intervalle und g : D1 → R und
h : D2 → R stetig. Sei f : D1 × D2 → R, (x, y) → g(x)h(y). Dann heißt die
Differentialgleichung y ′ = f (x, y) vom Typ der getrennten Variablen.
Ist h stetig differenzierbar, dann ist f lokal Lipschitzbeschränkt und der Eindeutigkeitssatz ist somit anwendbar.
Satz 7 Sei E ⊂ D2 ein maximales Intervall, auf dem h keine Nullstelle hat, und
sei hE die Einschränkung von h auf E. Sei ΦE eine Stammfunktion der Funktion
1
. Sei G eine Stammfunktion von g. Sei I ⊂ D1 ein allgemeines Intervall und
hE
α : I → E so, dass für ein reelles c und für alle x ∈ I gilt:
ΦE (α(x)) = G (x) + c.
Dann ist α eine Lösung der Differentialgleichung y ′ = g(x)h(y) und es gilt für alle
x∈I
α(x) = Φ−1
E (G (x) + c) .
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
9
Kann I für festes c nicht vergrößert werden, ist α eine maximale Lösung. Weitere
maximale Lösungen der Differentialgleichung sind die konstanten Funktionen
αi : D1 → R, x → yi ,
wobei yi eine Nullstelle von h ist.
Der Beweis des Satzes ist in [10] zu finden. Eine heuristische Merkhilfe geht so
dy
=
h(y)
g(x)dx.
Für Lipschitzbeschränktes f ist die Menge aller maximalen Funktionen α des im
Satz (7) angeführten Typs, wenn alle nullstellenfreien Teilintervalle E abgearbeitet
werden, die Menge aller maximalen Lösungen der Differentialgleichung.
Beispiel 1: y ′ = y
Sei f (x, y) = y auf R2 . Es gilt somit f (x, y) = g (x) h (y) für g (x) = 1 und h(y) =
y für alle x, y ∈ R. Die Funktion f hat die beiden maximalen, nullstellenfreien
Teilintervalle E1 := R>0 und E2 := R<0 . Eine Stammfunktion ΦE1 von 1/y auf
E1 ist ln(y) und eine Stammfunktion von g(x) = 1 auf R ist x. Somit ist eine
Funktion α(x) > 0 mit ln (α (x)) = x + c Lösung. Da ln : E1 → R bijektiv ist, kann c
beliebig in R gewählt, und α auf ganz R definiert werden. Es folgt somit α(x) = ec ex
für alle x ∈ R. Die positiven Vielfachen der Exponentialfunktion sind somit als
maximale Lösungen identifiziert. Auf E2 hat 1/y die Stammfunktion ln (−y). Somit
ist eine Funktion α(x) < 0 mit ln (−α (x)) = x + c Lösung. Wie oben folgt für
beliebiges c ∈ R, dass −α(x) = ec ex für alle x ∈ R. Schließlich bleibt die auf ganz
R konstante Funktion α(x) = 0 als Lösung. Wir haben somit die folgende Menge L
von maximalen Lösungen gefunden: L = {αC : R → R, x → C exp (x) | C ∈ R} .
Gibt es weitere maximale Lösungen, die noch nicht in L enthalten sind? Zu jedem
Anfangswert (x0 , y0 ) ∈ R2 existiert genau eine Funktion αC ∈ L mit αC (x0 ) = y0 .
Es ist dies die Funktion αC mit C = y0 · e−x0 . Da es durch jeden Punkt (x0 , y0 ) ∈ R2
nach dem Eindeutigkeitssatz höchstens eine maximale Lösung gibt, ist L aber auch
schon die Menge aller maximalen Lösungen der Differentialgleichung y ′ = y.
Beispiel 2
Sei f : R2 → R mit f (x, y) = g(x)h(y), wobei g(x) = −2x auf R und
h(y) =
y für y > 0
.
y 2 für y ≤ 0
Die maximalen nullstellenfreien Teilintervalle von h sind E1 := R>0 und E2 := R<0 .
Eine Stammfunktion von g ist G(x) = −x2 auf R. Eine Stammfunktion von 1/h auf
E1 ist ln(y). Somit ist eine positive Funktion α mit ln (α(x)) = −x2 + c für c ∈ R
2
eine Lösung. Für sie folgt α(x) = ec e−x . Ihr maximaler Definitionsbereich ist für
beliebiges c ∈ R ganz R. Setze α+ (x) := exp (−x2 ) für x ∈ R.
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
10
Eine Stammfunktion von 1/h auf E2 ist −1/y. Sie nimmt nur positive Werte an.
Somit ist eine Funktion αc mit Werten in R<0 und −1/αc (x) = −x2 + c für c ∈ R>0
2
eine Lösung. Für sie folgt
√ α
√c (x) = 1/ (x − c) . Ihr maximaler Definitionsbereich ist
das offene Intervall (− c, c) .
Die Menge L aller so bestimmten maximalen Lösungen erfüllt also
L = {C · α+ |C ≥ 0} ∪ {αc |c > 0} .
Durch jeden Punkt (x0 , y0 ) ∈ R2 geht genau eine Funktion aus L. Somit ist L die
Menge aller maximalen Lösungen der Differentialgleichung. Abbildung (1.7) zeigt
die Graphen von α+ , 2α+ , α1 und α4 .
y
2
1
0
-5
-2.5
0
2.5
5
x
-1
-2
Abbildung 1.7: Die Lösungen α+ , 2α+ , α1 , α4
Beispiel 3
Sei f : R × R → R mit f(x, y) = 2xy 2 . Die Abbildung (1.8) zeigt ein Richtungsfeld
von y ′ = f (x, y). Für die Funktionen g, h : R → R mit g(x) = 2x und h(y) = y 2 gilt
Abbildung 1.8: Richtungsfeld von y ′ = 2xy 2
f (x, y) = g(x)h(y).
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
11
Die maximalen nullstellenfreien Teilintervalle von h sind R<0 und R>0 . Die Funktion G mit G(x) = x2 auf R ist eine Stammfunktion von g. Die Funktion Φ> mit
Φ> (y) = −1/y auf R>0 ist eine Stammfunktion von 1/h auf R>0 . Eine Lösung α > 0
erfüllt somit 1/α(x) = −x2 + c > 0 für ein c ∈ R>0 . Für jedes c > 0 ist somit die
Funktion
√ √
1
α+
c : − c, c → R>0 , x →
c − x2
eine maximale Lösung.
Die Funktion Φ< mit Φ< (y) = −1/y auf R<0 ist eine Stammfunktion von 1/h
auf R<0 . Eine Lösung α < 0 erfüllt daher 1/α(x) = −x2 + c′ < 0 für ein c′ ∈ R und
für alle x mit c′ < x2 . Für jedes c =: −c′ > 0 ist somit die Funktion
α−
c : R → R<0 , x →
−1
c + x2
eine maximale Lösung. Für jedes c = c′ ≥ 0 sind die Funktionen
α>
:
c
α<
:
c
√
c, ∞ → R<0 , x →
−1
−c
√
−1
−∞, − c → R<0 , x → 2
x −c
x2
maximale Lösungen. Abbildung (1.9) zeigt einige maximalen Lösungen.
y
1.5
1
0.5
0
-2.5
-1.25
0
-0.5
1.25
2.5
x
-1
<
+
−
Abbildung 1.9: Die Lösungen α>
c , αc , αc und αc für c = 1 und c = 3
Schließlich gibt es noch die konstante Lösung α0 : R → R mit α0 (x) = 0. Somit
haben wir die folgende Menge L von maximalen Lösungen gefunden.
−
<
>
L = α+
c |c > 0 ∪ αc |c > 0 ∪ {αc |c ≥ 0 } ∪ {αc |c ≥ 0 } ∪ {α0 } .
Gibt es weitere maximale Lösungen unserer Differentialgleichung, die uns entgangen
sind?
Durch einen Punkt (x0 , y0 ) in der Halbebene y0 > 0 geht genau eine der Lösungen
{α+
c |c > 0 } . Durch einen Punkt der unteren Halbebene y0 < 0 mit x0 = 0 und
y0 > −1/x20 geht genau eine der Lösungen {α−
c |c > 0 } . Dasselbe gilt für einen
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
12
Punkt (0, y0 ) mit y0 < 0. Durch einen Punkt (x0 , y0 ) der unteren Halbebene y0 <
0 mit x0 < 0 und y0 ≤ −1/x20 < 0 geht genau eine der Lösungen {α<
c |c ≥ 0 } .
Durch einen Punkt (x0 , y0 ) der unteren Halbebene y0 < 0 mit x0 > 0 und y0 ≤
−1/x20 < 0 geht genau eine der Lösungen {α>
c |c ≥ 0 } . Durch einen Punkt (x0 , 0)
mit x0 ∈ R schließlich geht genau die 0-Lösung α0 . In Übereinstimmung mit dem
Eindeutigkeitssatz, der ja auf y ′ = 2xy 2 anwendbar ist, gibt es durch einen Punkt
(x0 , y0 ) höchstens eine maximale Lösung der Differentialgleichung y ′ = 2xy 2 . Da zu
jedem Punkt (x0 , y0 ) ∈ R2 eine maximale Lösung in L existiert, ist die Menge L
aber tatsächlich die Menge aller maximalen Lösungen von y ′ = 2xy 2 .
Beispiel 4
Für die autonome Differentialgleichung y ′ = cos y kann g = 1 auf R und h = cos
auf R gewählt werden. Die Nullstellenmenge von h ist (2n + 1) π2 |n ∈ Z . Die
maximalen nullstellenfreien Teilintervalle des Definitionsbereiches von h sind somit
die Intervalle In = (2n − 1) π2 , (2n + 1) π2 .
Abbildung 1.10: Richtungsfeld zu y ′ = cos y für − π2 < y <
π
2
Wegen cos (y + kπ) = (−1)k cos (y) genügt es, die maximalen Lösungen im Intervall I0 = − π2 , π2 zu bestimmen. Eine Stammfunktion4 Φ von 1/ cos auf diesem
Intervall ist die (bijektive, steigende) Funktion Φ : − π2 , π2 → R mit
Φ (y) = ln
1
+ tan y ,
cos y
denn
cos y
Φ (y) =
1 + sin y
1
=
1 + sin y
′
4
(1 + sin)′ (y) cos (y) − (1 + sin) (y) cos′ (y)
·
cos2 y
cos2 (y) + (1 + sin) (y) sin (y)
1
·
=
.
cos y
cos y
Zum systematischen Bestimmen von Φ siehe: Kap. III, §10 in [4] Vol 1.
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
13
Somit existiert für jede maximale Lösung α mit Werten in I0 eine Zahl c ∈ R, sodass
ln
Da 1/ cos y =
zu
cos2 y+sin2 y
cos2 y
1
+ tan α (x)
cos α (x)
=
(1.4)
= x + c.
1 + tan2 y auf I0 gilt, ist Gleichung (1.4) äquivalent
1 + tan2 α (x) + tan α (x) = ex+c .
√
Suche daher die Zahlen z ∈ R mit 1 + z 2 + z = w > 0. Es folgt durch Quadrieren
1 + z 2 = (w − z)2 und weiter 1 = w 2 − 2wz. Letzteres gilt für
z=
1
2
w−
1
w
.
Tatsächlich ist dies eine Lösung der Ausgangsgleichung.
Somit folgt
ex+c − e−(x+c)
tan α (x) =
= sinh (x + c) .
2
Die Menge L0 der maximalen Lösungen mit Werten im Intervall I0 ist daher die
Menge aller Funktionen αc : R → − π2 , π2 mit c ∈ R und
αc (x) = arctan sinh (x − c) .
Alpha
1
0.5
0
-10
-5
0
5
10
x
-0.5
-1
Abbildung 1.11:
2
π
arctan sinh x (rot) und
2
π
arctan x
Für die Menge Ln aller maximalen Lösungen mit Werten im Intervall In gilt
Ln = {(−1)n αc + nπ |c ∈ R} .
Figur 1.12 zeigt α0 , −α0 + π, α0 + 2π, −α0 − π. Die Lösungen mit Werten in In
streben für gerades n bei x → ∞ gegen den oberen Rand des Intervalls In und für
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
14
Abbildung 1.12: Lösungen von y ′ = cos y
ungerades n gegen den unteren. Die konstante Lösung yn = (2n + 1) π/2, die auf
einer Nullstelle von cos liegt, scheint also für gerades n die Lösungen in den beiden
angrenzenden Intervallen „anzuziehen“ und ansonsten „abzustoßen“.5
1.1.4
*Magnetfeldlinien eines Dipols 1
Das Magnetfeld eines magnetischen Dipols6 , der ausdehnungslos im Punkt 0 des
dreidimensionalen Ortsvektorraums mit Skalarprodukt ·, · und zugehöriger Norm
|·| ruht, ist durch das Vektorfeld B : V 0 → V mit
B (v) =
D
|v|3
3
e, v
v−e .
|v|2
gegeben. Dabei gibt D ∈ R>0 die Stärke und e ∈ V mit |e| = 1 die Richtung des
(konstanten) Dipolmoments an. Das Vektorfeld B ist invariant unter Drehungen
um e. Daher genügt es, sich das Vektorfeld B innerhalb einer Ebene durch 0, die e
enthält, mittels Feldlinien zu veranschaulichen.
Ist (e1 , e2 , e3 ) eine Orthonormalbasis von V mit e2 = e, dann gilt für Vektoren
v = xe1 + ye2 = 0, also Vektoren ungleich 0 in der Ebene {v ∈ V : v, e3 = 0}
B (xe1 + ye) =
=
=
D
y 2 )3/2
(x2 +
D
(x2 + y 2 )3/2
D
(x2 + y 2 )3/2
3
x2
y
y
xe1 + 3 2
ye2 − e2
2
+y
x + y2
3
xy
3y 2 − (x2 + y 2 )
e
+
e2
1
x2 + y 2
x2 + y 2
3
xy
2y 2 − x2
e
+
e2 .
1
x2 + y 2
x2 + y 2
Figur (1.13) zeigt das Vektorfeld B/ |B| .
5
6
In diesem Bild wird x als Zeit interpretiert.
Analoges gilt für das elektrische Feld eines elektrischen Dipols.
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
15
Abbildung 1.13: Richtungsverlauf eines Dipolvektorfeldes
Ein Blick auf Figur (1.13) lässt vermuten, dass eine Feldlinie im ersten Quadranten der Graph einer Funktion x → α (x) ist. Der Anstieg einer solchen Feldlinie
durch den Punkt (x, y) ∈ U = R>0 × R>0 hat im Punkt (x, y) offenbar den Wert
2y 2 − x2
2α (x)2 − x2
α (x) =
=
.
3xy
3xα (x)
′
Die Funktion α ist somit eine Lösung der Differentialgleichung
y ′ = f (x, y) mit f : R>0 × R>0 → R und f (x, y) =
2y 2 − x2
.
3xy
Nun gilt f (x, y) = 23 xy − 13 xy =: g (y/x) für alle (x, y) ∈ U. Die Funktion f ist
also homogen vom Grad 0. Solche Differentialgleichungen lassen sich auf U durch
einen simplen Trick in Differentialgleichungen vom Typ der separierten Variablen
umformen. Für α (x) = x · β (x) gilt ja α′ (x) = β (x) + x · β ′ (x) , sodass β eine
Lösung von
β (x) + x · β ′ (x) = f (x, α (x)) = g (β (x)) .
Somit gilt
g (β (x)) − β (x)
.
x
Im gegenwärtigen Fall erfüllt β somit die Differentialgleichung
β ′ (x) =
′
β (x) =
2
β
3
(x) −
x
1
3β(x)
− β (x) = −
1
1
(β (x) + 1/β (x)) = − h (β (x))
3x
3x
mit h : R>0 → R>0 und h (y) = y + y −1 . Die Funktion h ist nullstellenfrei und ihr
Kehrwert hat die Stammfunktion H : R>0 → R>0 mit H (y) = 12 ln (1 + y 2 ) , da ja
2y
1
H ′ (y) = 12 1+y
2 = y+y −1 gilt.
1
Damit erfüllt eine Lösung β von β ′ = − 3x
h (β) die Beziehung
1
1
ln 1 + β (x)2 = − ln (x) + c
2
3
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
16
für ein c ∈ R und für alle x in einem hinreichend kleinen Intervall. Exponenzieren
dieser Beziehung ergibt
2
1 + β (x)2 = ec e− 3 ln(x) = ec x−2/3 .
Daraus folgt β (x)2 = ec x−2/3 −1 = (C/x)2/3 −1 für ein C = e3c/2 > 0. Die zugehörige
maximale Lösung β C ist somit die Funktion
(C/x)2/3 − 1.
β C : (0, C) → R>0 mit β C (x) =
Die zu β C gehörige Funktion αC ist die Funktion αC : (0, C) → R>0 mit
αC (x) = x (C/x)2/3 − 1 =
(Cx2 )2/3 − x2 .
Man beachte limx→C αC (x) = 0.
Die Menge aller Feldlinien im ersten Quadranten ist somit die Menge der Graphen
zur Funktionenfamilie {αC : C > 0} . Die Feldlinie durch einen Punkt (x0 , y0 ) ∈ U ist
Graph der Funktion αC mit C > 0 so, dass αC (x0 ) = y0 . Daraus folgt (y0 /x0 )2 +1 =
(C/x0 )2/3 und somit
3/2
C = x0 1 + (y0 /x0 )2
.
Eine analoge Überlegung zeigt, dass im Quadranten U ′ = R>0 ×R<0 die Feldlinien
die Graphen der Funktionen −αC sind. Eine gesamte Feldlinie im Bereich R>0 × R
ist somit der Abschluss der Menge {(x, y) : x > 0, |y| = αC (x)} in R>0 × R. Durch
Spiegelung an der Ebene y = 0 ergeben sich schließlich die (richtig orientierten!)
Feldlinien im Bereich x < 0. Im Bereich x < 0 bildet eine Feldlinie die Menge
{(x, y) : x < 0, |y| = αC (|x|)} . Die einzigen beiden davon nicht erfassten Feldlinien
sind die Halbgeraden {(0, ±y) : y > 0} , der Grenzfall C = 0. Durch jeden Punkt
der Ebene (ohne 0!) geht genau eine Feldlinie. Jede Feldlinie kommt dem Rand des
Definitionsbereiches von B, nämlich dem Punkt 0 beliebig nahe.
Abbildung 1.14: Feldlinien eines Dipols
Polardarstellung einer Feldlinie mit C > 0
3
Es gilt x2 + αC (x)2 = C 2/3 x4/3 , also x2 + αC (x)2 = C 2 x4 . Für Polarkoordinaten
(r, ϕ) mit x = r cos ϕ und y = r sin ϕ besteht auf einer Feldlinie somit der Zusammenhang r6 = C 2 r4 cos4 ϕ. Die Feldlinie hat daher die Polardarstellung r = C cos2 ϕ.
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
17
Dabei kann ϕ ∈ (−π/2, π/2) für eine Feldlinie im Bereich x > 0 und ϕ ∈ (π/2, 3π/2)
für eine Feldlinie im Bereich x < 0 gewählt werden. Lässt man ϕ ∈ [0, 2π] zu, werden
zwei zueinander spiegelgleiche Feldlinien in den Halbräumen x > 0 bzw x > 0 zu
einer einzigen Feldlinie durch die Singularität in 0 hindurch verbunden.
1.1.5
*Die Kettenlinie
Eine Kette sei an zwei Punkten A und B aufgehängt, die nicht direkt übereinander
liegen. Welche Linie im Raum belegt die ruhende Kette, wenn ihre Länge unveränderlich ist, und die einzelnen Kettenglieder zu Punkten idealisiert werden? Im
folgenden wird die Überlegung erläutert, die - zumindest gemäß der Darstellung in
Kap. B.11 von [17] - Johann Bernoulli 1691 zur Lösung des Problems führte.7
Johann Bernoulli scheint Newtons Mechanik, wie sie 1687 in den Prinzipia dargelegt war, gekannt und zur Grundlage seiner Überlegung gemacht zu haben. Denn
er nimmt an: Die Ketteninie γ liegt in einer (affinen) Ebene des 3d euklidischen
Raumes. Diese Ebene wird vom Vektor, der A in B schiebt, und dem Richtungsvektor der Schwerkraft aufgespannt. (Dies lässt sich beweisen!) OEdA wird A = 0
gesetzt, und in der Ebene eine ONB (e1 , e2 ) mit den zugehörigen Koordinaten (x, y)
so gewählt, dass das Schwerkraftfeld die Richtung −e2 hat, und xB = x (B) > 0
gilt. Weiter nimmt er an, dass γ der Graph einer zwei mal stetig differenzierbaren
Funktion von x ist: d.h. es gibt8 eine C 2 -Funktion α : I → R, wobei I das reelle
Intervall [0, xB ] ist, sodass {(x, y) (p) |p ∈ γ } = {(x, α (x)) |x ∈ I } .
Sei nun p ∈ γ mit x (p) = xp > 0. Die Zahl
xp
s (xp ) =
1 + (α′ )2 (ξ)dξ
0
gibt die Länge jenes Teils der Linie γ an, der zwischen 0 und p liegt. Sei ϕ (xp ) der
Anstiegswinkel von α bei xp . Es gilt also
π π
.
α′ (xp ) = tan ϕ (xp ) mit ϕ (xp ) ∈ − ,
2 2
An dem Kettenstück zwischen A und p greifen drei Kräfte an:
• Schwerkraft Fg = −ρgs (xp ) e2 ; hier sind ρ die konstante Kettenmasse pro
Längeneinheit und g die Erdbeschleunigung;
• Befestigungskraft F0 = − |F0 | (cos (ϕ (0)) e1 + sin (ϕ (0)) e2 ) mit |F0 | > 0 in A;
• Kettenspannkraft Fp = |Fp | (cos ϕ (xp ) e1 + sin ϕ (xp ) e2 ) greift in p.
7
Galilei hatte vermutet, dass diese Kettenlinie eine Parabel sei. Huygens widersprach zwar schon
1646, also mit 17(!) Jahren, dieser Vermutung, fand aber erst 1691, also mit 62 Jahren, die richtige
Kurve, nachdem Jakob Bernoulli das Problem zur Herausforderung an seine Kollegenschaft erklärt
hatte. Jakob Bernoullis Problem wurde von seinem jüngeren Bruder Johann, von Leibniz, Huygens
und schließlich auch von Jakob Bernoulli selbst gelöst.
8
Dies ist hier eine Einengung des ursprünglichen Problems. Auch diese Annahme kann aber aus
etwas allgemeineren Voraussetzungen abgeleitet werden.
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
18
Die Kettenspannkraft wird vom Kettenstück, das zwischen p und B liegt, ausgeübt. Sie ist tangential zur Kette in p und nach rechts gerichtet. Eine elastische
Feder, die zwischen dem Kettenglied bei p und dem rechts davon angrenzenden Kettenglied eingebaut wäre, würde die Kettenspannkraft sichtbar machen. Da die Kette
als ruhend vorausgesetzt ist, addieren sich alle drei Kräfte zu 0. Es gilt somit
0 = |Fp | cos ϕ (xp ) − |F0 | cos ϕ (0) ,
ρgs (xp ) = |Fp | sin ϕ (xp ) − |F0 | sin ϕ (0) .
Diese beiden Gleichungen sind äquivalent zu
cos ϕ (0)
,
cos ϕ (xp )
ρgs (xp ) = |F0 | [cos ϕ (0) tan ϕ (xp ) − sin ϕ (0)]
|Fp | = |F0 |
Die zweite Gleichung ist äquivalent zu
tan ϕ (xp ) − tan ϕ (0) =
Es gilt also mit k =
ρg
|F0 | cos ϕ(0)
ρg
s (xp ) .
|F0 | cos ϕ (0)
> 0 für alle x ∈ I
x
α′ (x) = k
1 + (α′ )2 (ξ)dξ + tan ϕ (0) .
(1.5)
0
Durch Ableiten von (1.5) nach x ergibt sich schließlich auf ganz I die Differentialgleichung
α′′ (x) = k
1 + (α′ )2 (x).
(1.6)
Es liegt also die etwas ungewöhnliche Situation vor, dass die Differentialgleichung
über den Parameter k von der Anfangsbedingung α′ (0) = tan ϕ (0) abhängt.
Löse zunächst die Differentialgleichung erster Ordnung für die Funktion y = α′
y ′ (x) = k
1 + y 2 (x).
Diese Differentialgleichung ist vom Typ der getrennten Variablen und kann mit
dem (vergrößerten) Definitionsbereich (x, y) ∈ R2 versehen werden. Die Funktion
h (y) = 1 + y 2 hat keine Nullstelle auf R. Eine Stammfunktion von 1/h ist Φ (y) =
sinh−1 (y) . Daher existiert ein c ∈ R mit
sinh−1 (y (x)) = kx − c
für alle x ∈ R. Daraus folgt α′ (x) = sinh (kx − c) . Nochmalige Integration ergibt
wegen α (0) = 0 für die Kettenlinie α
α (x) =
1
(cosh (kx − c) − cosh (c)) .
k
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
19
Die Funktion α hat auf R ein globales Minimum. Es hat den Wert (1 − cosh (c)) /k
und wird nur im Punkt x = c/k angenommen. In diesem Punkt hat α die Krümmung
α′′ kc = k. Der Schmiegekreis ans Minimum hat daher den Radius 1/k.
Die Parameter k und c sind durch α (xB ) und die Länge L > x2B + α (xB )2 der
Kette eindeutig festgelegt. Es gilt kα (xB ) = cosh (kxB − c) − cosh (c) und wegen
Gleichung (1.6)
xB
kL =
k
xB
1 + α′ (x)2 dx =
0
α′′ (x) dx
0
= α′ (xB ) − α′ (0) = sinh (kxB − c) + sinh (c) .
Für die symmetrische Randvorgabe α (xB ) = 0 etwa folgt, dass c = kxB /2 und
= sinh x2B k . Das Minimum von α wird in xB /2 angenommen. Für c gilt also
die Bestimmungsgleichung
L
c = sinh c.
xB
Als Lösung existiert wegen L > xB in R>0 genau ein c. Aus diesem Wert für c ergibt
sich k mit k = 2c/xB .
Bei symmetrischer Randvorgabe α (xB ) = 0 mit xB = 1 m und L = 10 m folgt
aus 10c = sinh c, dass c ≈ 4, 5. Somit gilt k = 2c/xB ≈ 9, 0 m−1 . Der Betrag der
Kraft, mit der die Kette im Punkt A befestigt ist, lässt sich nun auch berechnen. Es
gilt mit M = ρL (Kettenmasse)
L
k
2
|F0 | =
=
ρg
ρg
=
k cos ϕ (0)
k
ρg
k
= Mg
1 + tan2 ϕ (0) =
1 + sinh (c)2 = ρgL
1
kL
2
+
1
2
2
1
kL
Mg
=
2
ρg
k
1 + α′ (ϕ (0))2
2
sinh (c)
kL
+
1+
2
Lk
2
2
Mg
≈
2
1+
1
45
2
.
Figur 1.15 vergleicht die (in symmetrische Lage gebrachte) Kettenlinie (rot) der
Länge L ≈ 2, 4xB mit der Parabel gleicher Länge. Beide Kurven gehen durch die
Punkte (±xB /2, 0) . Sie sind sichtbar voneinander verschieden.
Welche Differentialgleichung gilt für den Anstiegswinkel der Kettenlinie? Für die
Funktion ϕ mit α′ = tan ϕ folgt auf I eine Differentialgleichung erster Ordnung vom
Typ der getrennten Variablen, denn einerseits gilt
α′′ (x) = tan′ (ϕ (x)) ϕ′ (x) =
und andererseits gilt wegen − π2 < ϕ (x) <
k
1 + (α′ )2 (x) = k
=
cos2
π
2
1 + tan2 (ϕ (x)) = k
k
.
cos (ϕ (x))
1
ϕ′ (x) ,
ϕ (x)
cos2 (ϕ (x)) + sin2 (ϕ (x))
cos2 (ϕ (x))
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
-1
-0.5
0
0.5
20
1
0
-0.5
-1
-1.5
-2
Abbildung 1.15: Kettenlinie (rot) mit Parabel gleicher Länge
Somit ist die Gleichung (1.6) äquivalent zu
ϕ′ (x) = k cos (ϕ (x)) .
(1.7)
Für die Funktion φ : [0, kxB ] → R mit φ (kx) = ϕ (x) gilt dann die schon behandelte parameterfreie Differentialgleichung φ′ = cos φ. Die Menge ihrer maximalen
Lösungen mit Werten im Intervall − π2 , π2 ist die Menge φc : R → − π2 , π2 |c ∈ R
mit φc (x) = arctan sinh (x − c) . Daraus folgt für die Kettenlinie, dass ein c ∈ R
existiert, sodass
α′ (x) = tan ϕ (x) = sinh (kx − c)
für alle x ∈ [0, xB ] . Damit ist also ein zweiter Weg zur Bestimmung der Kettenlinie
gefunden.
1.1.6
*Der freie Fall aus großer Höhe
Ein apokalyptischer Engel stoppt die Erde auf ihrem Umlauf um die Sonne und läßt
sie angesichts dessen, was er zu sehen bekommt, erschrocken wieder los. Wie lange
dauert der Sturz der Erde in die Sonne?
Für inertiale, kartesische Erdbahnkoordinaten xi , (i = 1, 2, 3) mit Nullpunkt im
(beinahe ruhenden) Sonnenzentrum als Funktion einer inertialen Zeit t gilt
mẍi (t) = −GmM
xi (t)
r3 (t)
(1.8)
(Newtons Bewegungsgleichungen). G ist Newtons Gravitationskonstante, M die
Masse der Sonne und m die Masse der Erde. Die Funktion
r :=
(x1 )2 + (x2 )2 + (x3 )2
gibt den momentanen Abstand zwischen Erde und Sonne an. Die Anfangsbedingung
der Sturzbewegung ist o.E.d.A.
x1 (0) = R,
x2 (0) = x3 (0) = 0;
ẋ1 (0) = ẋ2 (0) = ẋ3 (0) = 0
(1.9)
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
21
mit R ≈ 1, 5 · 1011 m. Wegen x1 (0) = R > 0 gibt es ein ε > 0, sodass x1 (t) > 0 für
alle t ∈ D := [0, ε) gilt.
Eine R3 -wertige Funktion (x1 , x2 , x3 ) = (x, 0, 0), die auf dem Intervall D definiert
ist, und für die x > 0 gilt, ist genau dann eine Lösung von (1.8) und (1.9), wenn die
auf D definierte Funktion x eine Lösung des Anfangswertproblems
ẍ(t) = −
γ
mit x(0) = R und ẋ(0) = 0
x(t)2
(1.10)
mit γ := GM > 0 ist. Wegen (1.10) gilt ẍ(t) = dtd (ẋ(t)) < 0. Die Geschwindigkeit ẋ
ist somit für Lösungen x > 0 streng monoton fallend. Daher folgt aus der gegebenen
Anfangsbedingung ẋ(0) = 0 die Ungleichung ẋ(t) < 0 für alle 0 < t < ε. (Die
Lösung x ist also auf D streng monoton fallend, d.h. die Erde bewegt sich, einmal
ausgelassen, ausschließlich in Richtung Sonne). Zusammen mit der Nebenbedingung
ẋ(t) < 0 (für alle 0 < t < ε) ist (1.10) äquivalent zu
ẍ(t) · ẋ(t) = −
γ
ẋ(t).
x(t)2
2
γ
γ
d
Dies wiederum ist wegen ẍ(t) · ẋ(t) = dtd (ẋ(t))
und − x(t)
2 ẋ(t) = dt
2
x(t)
zu
d (ẋ(t))2
γ
−
= 0 mit ẋ(t) < 0 für alle 0 < t < ε.
dt
2
x(t)
äquivalent
(1.11)
Somit ist eine Funktion x : (0, ε) → R genau dann Einschränkung einer Lösung des
Anfangswertproblems (1.10), wenn für alle t ∈ (0, ε) die Differentialgleichung
γ
γ
(ẋ(t))2
−
=−
2
x(t)
R
(1.12)
zusammen mit ẋ(t) < 0 und der Anfangsbedingung limt↓0 x(t) = R gilt. Die Differentialgleichung (1.12) sagt, dass die Summe aus kinetischer und potentieller Energie
für Lösungen von (1.10) konstant ist. Gleichung (1.12) ist eine implizite, gewöhnliche, nichtlineare Differentialgleichung erster Ordnung. Mit der Nebenbedingung
ẋ(t) < 0 ist (1.12) äquivalent zu
ẋ(t) = − 2γ/R (R/x(t)) − 1.
(1.13)
Beachte dabei, dass aus ẋ < 0 die Ungleichung x(t) < R für alle t ∈ (0, ε) folgt.
Mit den dimensionslosen Koordinaten τ und ξ, definiert durch
τ = t 2γ/R3 ,
ξ(τ ) = x(t)/R < 1,
schließlich ist (1.13) äquivalent zu
d
ξ(τ ) = − ξ (τ )−1 − 1,
dτ
(1.14a)
(1.14b)
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
22
und die Anfangsbedingung ist für die Funktion ξ durch limτ ↓0 ξ(τ ) = 1 gegeben.
dξ
(τ ) .
Beachte dabei ẋ(t) = 2γ/R dτ
Das Problem der stürzenden Erde ist nun in die folgende „dimensionsbereinigte
Form” gebracht. Sei
f : R × (0, 1) → R, (x, y) → − y −1 − 1.
Gesucht ist die maximale Lösung α : (0, xs ) → R von y ′ = f (x, y) mit der Anfangsbedingung
lim α(x) = 1.
x↓0
Aus der Obergrenze xs des Definitionsbereichs von α ergibt sich dann für die Fallzeit
T
T = xs R3 / (2γ).
Die Differentialgleichung ist autonom und vom Typ der separierten Variablen. Die
Funktion f ist lokal Lipschitzbeschränkt, sodass der Eindeutigkeitssatz anwendbar
ist. Es gilt f (x, y) = g(y) mit der stetig differenzierbaren Funktion
g : (0, 1) → R,
y → − y −1 − 1
g ist negativ definit und streng monoton wachsend. Für y ↓ 0 wächst |g(y)| unbeschränkt und für y ↑ 1 strebt g(y) gegen 0. Die Funktion g hat keine Nullstelle. Den
Graphen von g im Bereich 0.1 < y < 1 und ein Richtungsfeld von y ′ = f (x, y) zeigen
die beiden folgenden Figuren. g(y) ist die Fallgeschwindigkeit der Erde in Einheiten
von v := 2γ/R, die √
sie bei einer Annäherung an die Sonne bis zum Abstand yR
erreicht. (Es gilt9 v ≈ 2(2πR)/1Jahr ≈ 3, 65 · 106 km/Tag ≈ 42, 3 · 103 m s−1 .) Beim
Eintauchen der Erde in die Sonne, √
das ist bei ca. y = 1/150, hat die Erde also eine
Geschwindigkeit mit dem Betrag v 150 − 1 ≈ 516 km s−1 .
0.2
0.4
0.6
0.8
1
0
-0.5
-1
-1.5
-2
-2.5
-3
Der Graph von g
9
Einsetzen der Modellparameter oder siehe die Schlußbemerkung.
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
y
23
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0.2
0.4
0.6
0.8
1
1.2
1.4
1.6
1.8
2
x
Richtungsfeld zu f
Achtung: Wird der Definitionsbereich von g um den Randpunkt 1 vergrößert,
dann hat y ′ = f(x, y) = g(y) auch die konstante Lösung α(x) = 1. Die zugehörige
Funktion x(t) = R erfüllt jedoch nicht die Newtonsche Bewegungsgleichung. Diese
zusätzliche Lösung kommt durch das Multilplizieren der Newtonschen Gleichung mit
ẋ zustande, das in die Umformung von (1.10) in (1.13) eingeht.
Nun zur Bestimmung einer Stammfunktion Φ von 1/g. Es gilt für 0 < y < 1
1
1
y
1 − 2y
y − y2 +
1
y − y2
y − y2
−1
= −
1
2
y
=
d
dy
Eine Stammfunktion von 1/
=−
y − y2
2
−
1
y − y2
y − y 2 im Bereich (0, 1) ist die Funktion
y → − arcsin (1 − 2y) .
√
Dies folgt mit der Kettenregel aus arcsin′ (x) = 1/ 1 − x2 für −1 < x < 1. Die
Funktion arcsin ist die inverse Funktion der Einschränkung der Funktion sin auf das
Intervall − π2 , π2 . Beachte, dass die Funktion y → − arcsin (1 − 2y) das Intervall
(0, 1) stetig und streng monoton steigend auf − π2 , π2 abbildet.
Damit ist eine Stamfunktion Φ : (0, 1) → R von 1/g die Funktion
Φ(y) =
y − y2 +
1
arcsin (1 − 2y) .
2
1
Φ ist wegen Φ′ (y) = g(y)
< 0 streng monoton fallend. Die gesuchte Lösung α von
′
y = f(x, y) erfüllt somit
x + C = Φ (α(x))
für ein festes reelles C. Die Integrationskonstante C ist durch die Randbedingung
limx↓0 α(x) = 1 zu
1
π
C = lim Φ(y) = arcsin (−1) = −
y↑1
2
4
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
24
bestimmt. Der maximale Definitionsbereich (0, xs ) von α ergibt sich aus der unteren
Grenze des Definitionsbereichs (0, 1) von Φ. Es gilt
xs = lim Φ(y) − C =
y↓0
1
π
π
arcsin (1) + = .
2
4
2
Für den Graphen Γ von α gilt
Γ=
(x, y) ∈ R × (0, 1) | x =
y − y2 +
π
1
arcsin (1 − 2y) +
2
4
.
Das folgende Bild zeigt Γ (mit horizontaler y-Achse).
x
1.5
1.25
1
0.75
0.5
0.25
0
0
0.25
0.5
0.75
1
Der Graph von α
Die Fallzeit der Erde in die Sonne ist somit
π
T = xs R3 / (2γ) =
2
R3 / (2γ).
Einsetzen der Zahlenwerte der Modellkonstanten ergibt dann den gesuchten Zahlenwert für die Fallzeit zu T ≈ 65Tage.
Schlußbemerkung: Hat man keine Tabellen zur Hand, dann geht es auch so.
Die Zahl Rγ2 = GM
ist aufgrund von Newtons Bewegungsgleichung der radialen
R2
Beschleunigung der annähernd gleichförmigen Kreisbewegung der Erde im Abstand
R um die Sonne gleich. Diese Beschleunigung ist durch Rω 2 gegeben, wobei ω die
Winkelgeschwindigkeit, also 2π/Umlaufzeit der Kreisbewegung ist. Damit gilt
T =
π
2
√
R/ (2Rω 2 ) = π/ 2 2ω .
Für die Erde gilt ω = 2π/1 y. Daraus folgt
1y
365Tage
T ≈ √ ≈ √
≈ 65Tage.
4 2
32
Diese Fallzeit lässt sich auch über Keplers drittes Gesetz berechnen, das besagt,
dass die Umlaufzeiten T1 , T2 zweier Planetenbahnen um die Sonne mit ihren großen
Halbachsen a1 , a2 durch
(T1 /T2 )2 = (a1 /a2 )3
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
25
verknüpft sind. Wir vergleichen die annähernd kreisförmige Erdbahn, für die T1 = 1 y
und a1 = R gilt, mit dem Grenzfall einer zu einer Geraden verkümmerten Ellipse.
Für die Fallzeit der Erde in die Sonne gilt dann T = T2 /2, da im Fall ja nur die
halbe Ellipse durchlaufen wird, und a2 = R/2, da im Grenzfall die Sonne mit dem
Perihel der extrem exzentrischen Ellipse zur Deckung kommt. Somit gilt
2T
1y
2
3
1
23
√
und daher das oben erhaltene Ergebnis T = 1 y/ 4 2 .
Schließlich wird noch der Graph der Funktion y → R3 / (2γ)α−1 (1 − y) angeführt, die dem zurückgelegten Weg y (in Einheiten von R) für 0 < y < 1 die
=
R/2
R
=
3
benötigte Fallzeit in Tagen zuordnet. Mit R2γ ≈ π2 65Tage ≈ 41.38Tage ergibt sich
das folgende Bild. Es zeigt, dass die erste Hälfte des finalen Weges in etwa 55 Tagen
und die zweite, wärmere Hälfte in nur mehr 10 Tagen zurückgelegt wird.
t
62.5
50
37.5
25
12.5
0
0
0.25
0.5
0.75
1
y
Reisezeit t in Tagen als Funktion der zurückgelegten Strecke y
1.1.7
Lineare Differentialgleichungen
Bei einer linearen Differentialgleichung ist die Funktion f nach einem Muster gebildet, das die Menge aller maximalen Lösungen besonders überschaubar macht.
Definition 8 Sei D ein allgemeines Intervall und a : D → R und b : D → R
stetig. Sei f : D × R → R mit f (x, y) = a(x)y + b(x). Die Differentialgleichung
y ′ = f(x, y) heißt inhomogen linear, falls b = 0. Die Funktion b heißt Inhomogenität.
Die Gleichung und y ′ = a(x)y heißt homogen linear. Beide Fälle werden als linear
bezeichnet.
Vorbemerkung über die Lösungsmenge im homogen linearen Fall y ′ = a (x) y :
Sind α1 , α2 : D ⊃ I → R Lösungen auf einem Intervall I, dann ist für λ ∈ R
auch λα1 + α2 eine Lösung mit dem Definitionsbereich I. Die Menge aller Lösungen
desselben Definitionsintervalls I ist also ein (reeller) Vektorraum. Welche Dimension
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
26
hat er? Hängt seine Dimension von I ab? Der folgende Satz beantwortet derlei
Fragen und führt die Bestimmung der Menge L0 aller maximalen Lösungen auf die
Bestimmung einer Stammfunktion A zurück.
Satz 9 Sei a : D → R stetig und A : D → R eine Stammfunktion von a, dh
es gilt A′ = a. Die Menge aller maximalen Lösungen von y ′ = a (x) · y ist der
eindimensionale Vektorraum L0 mit
L0 = R · eA := αC : D → R mit αC (x) = C · eA(x) |C ∈ R .
Die Menge aller Lösungen mit Definitionsbereich I ⊂ D ist der (ebenfalls eindimensionale) Vektorraum R · eAI , wobei AI die Einschränkung von A auf das Teilintervall
I ⊂ D ist.
Beweis. Eine homogen lineare Differentialgleichung ist vom Typ der getrennten
Variablen. Wegen f (x, y) = a (x)·y ist der Eindeutigkeitssatz anwendbar. Daher hat
der Graph einer von der 0-Lösung verschiedenen Lösung α keinen Schnittpunkt mit
dem Graphen der 0-Lösung und α hat keine Nullstelle. Eine solche (’nichttriviale’)
Lösung mit dem Definitionsbereich I erfüllt somit ln |α (x)| = A (x) + C für alle
x ∈ I. Daraus folgt α (x) = α (x0 ) eA(x)−A(x0 ) für alle x ∈ I und für ein x0 ∈ I.
Dabei ist A : D → R eine Stammfunktion von a. (Die gibt es, da a stetig ist.)
Eine maximale Lösung hat offenbar den Definitionsbereich I = D. Somit gilt für die
Menge L0 aller maximalen Lösungen der homogenen Gleichung y ′ = a(x)y : Sie ist
die Menge aller reellen Vielfachen von eA , also der Vektorraum L0 = R· exp A.
Die eindeutige maximale Lösung von y ′ = a (x) · y zum Anfangswert (x0 , y0 ) ∈
D × R ist somit die Funktion
x
αC : D → R mit αC (x) = C · exp
a (ξ) dξ
und C = y0 .
x0
Nun zu den inhomogen linearen Gleichungen. Sei I ⊂ D ein Intervall. Sind
α1 : I → R und α2 : I → R zwei Lösungen derselben inhomogenen Gleichung
y ′ = a(x)y + b(x), dann ist α1 − α2 eine Lösung der homogenen Gleichung y ′ =
a(x)y. (Nachrechnen!) Ist umgekehrt α : I → R eine Lösung der homogenen und
β : I → R eine Lösung der inhomogenen, dann ist auch α + β eine Lösung der
inhomogenen Gleichung. Existiert eine Lösung α der inhomogenen Gleichung mit
dem Definitionsbereich D der Funktionen a, b? Ja, denn es gilt für die Menge Lb
aller maximalen Lösungen der inhomogenen Gleichung der Satz von der Variation
der Konstanten Formel.
Satz 10 Sei D ⊂ R ein Intervall, seien a, b : D → R stetig und sei A : D → R eine
Stammfunktion von a. Sei αc : D → R mit
x
αc (x) = eA(x) c +
e−A(ξ) b(ξ)dξ
(1.15)
s
für ein fest gewähltes s ∈ D. Dann gilt Lb = {αc | c ∈ R} . Die Lösung zum Anfangswert (x0 , y0 ) ∈ D × R ist die Funktion αc mit der Integrationskonstanten
c = y0 e−A(x0 ) −
x0
s
e−A(ξ) b(ξ)dξ.
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
27
Beweis. Versuchsweiser Ansatz: α (x) = C (x) eA(x) für alle x aus einem noch zu
bestimmenden Teilintervall I ⊂ D. Die Funktion α ist genau dann eine Lösung der
inhomogenen Gleichung, wenn für alle x ∈ I
C ′ (x) eA(x) + C (x) a (x) eA(x) = a (x) C (x) eA(x) + b (x) .
Dies ist äquivalent zu
C ′ (x) = e−A(x) b (x) .
Diese Differentialgleichung für C hat die maximale Lösung
x
C : D → R mit C (x) =
e−A(ξ) b (ξ) dξ,
s
für alle x ∈ D. Es gilt C (s) = 0.
Jede weitere maximale Lösung der inhomogenen Gleichung y ′ = a (x) y + b (x)
ist aus der Lösung C durch Addition einer Funktion aus L0 zu erhalten.
Die Variation der Konstantenformel (1.15) zeigt, dass Lb = L0 +αp , wobei αp ein
beliebiges fest gewähltes Element von Lb ist. Die Menge der maximalen Lösungen
einer inhomogen linearen Differentialgleichung ist somit ein eindimensionaler affiner
Unterraum von Abb (D : R) .
Die partikuläre Lösung α0 zu c = 0 hängt linear von b ab. Sei für x ∈ D
x
eA(x)−A(ξ) b(ξ)dξ.
yb (x) =
x0
Dann gilt yλb1 +b2 (x) = λyb1 (x) + yb2 (x) für λ ∈ R und für b1 , b2 ∈ C (D : R) .
Benutzung dieses Sachverhalts erspart manche Rechnung.
Das Nahewirkungsprinzip des Eindeutigkeitssatzes wird von der Variation der
Konstantenformel deutlich sichtbar gemacht: Wählt man die Stammfunktion A(x) =
x
a(ξ)dξ, dann ist die maximale Lösung der Gleichung y ′ = a(x)y + b(x) zum Anx0
fangswert (x0 , y0 ) die Funktion αy0 . Sei nun I ⊂ D ein Intervall mit x0 ∈ I. Die
Variation der Konstantenformel zeigt dann, dass die Einschränkung von αy0 auf I
bei Änderungen von a oder b außerhalb von I unverändert bleibt. In manchen physikalischen Anwendungen bewirkt dieser Sachverhalt, dass künftige, oft unbekannte
Umstände keine Auswirkung auf das Gegenwärtige haben.
1.1.8
Atmosphärische
14
C-Konzentration
Ein Teilchen des Sonnenwindes setzt in der oberen Atmosphäre Neutronen frei, wenn
es einen der Kerne eines Luftmoleküls trifft und zertrümmert. Aus einem solchen
’Spallationsneutron’ und einem intakten 14 N Kern (eines Luftmoleküls) kann an1
14
1
schließend in der Ladungstauschreaktion 14
7 N +0 n →6 C +1 p ein Kern des instabilen
Kohlenstoffisotops 14 C entstehen. Andererseits zerfällt 14 C mit einer Halbwertszeit
14
−
von 5730 Jahren durch den Betazerfall 14
6 C →7 N + e + ν e .
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
28
Auf diese Weise erbrütet die Sonne in der hohen Atmosphäre laufend neues 14 C,
das natürlich auch in den Kreislauf organischen Materials Eingang findet und langsam wieder zerfällt. Nach Beendigung der Stoffaufnahme eines Lebewesens10 sinkt
das Konzentrationverhältnis von 14 C zu 12 C in dessen Überresten und ermöglicht
einen Rückschluss auf den Todeszeitpunkt, wenn das Konzentrationsverhälnis von
14
C zu 12 C zur Zeit des Einbaus bekannt ist.
Die Intensität des Sonnenwindes ist nun aber, auch wenn sie über mehrere Wochen und über die ganze Erdkugel gemittelt wird, zeitlich nicht konstant, sodass
auch das atmosphärische Konzentrationverhältnis von 14 C zu 12 C im Lauf der Erdgeschichte veränderlich ist. Schwankt beispielsweise die mittlere Intensität des Sonnenwindes harmonisch um einen Mittelwert, dann gilt für die (entsprechend gemittelte)
Konzentration N (t) von 14 C in der Erdatmosphäre zur Zeit t
Ṅ (t) = −γN (t) + c + d · cos (ωt − δ) .
(1.16)
Dabei ist γ > 0 die Zerfallskonstante von 14 C, die Zahl c > 0 ein Langzeitmittel
der Produktions- oder Brutrate und d > 0 die Amplitude der harmonischen Oszillationen des Kurzzeitmittels der Brutrate. Die Frequenz ω dieser Oszillationen kann
positiv angenommen werden. Da die Brutrate von 14 C nicht negativ sein kann, gilt
0 ≤ d ≤ c. Die Phase δ ∈ [0, 2π) legt die Lage der Oszillationsfunktion auf der
Zeitskala fest. Duch Wahl eines Nullpunkts in der Zeit kann δ = 0 erreicht werden.
Welche Schlüsse können aus der Differentialgleichung (1.16) auf die zeitliche Entwicklung von N, also auf die Funktion t → N (t) , gezogen werden? Die Funktion
α : R → R mit α (γt) = N (t)− γc erfüllt an der Stelle x = γt die parameterreduzierte
Differentialgleichung
d
Ṅ (t)
c d
N (x/γ)) =
= −N (t) + + · cos (ωt)
dx
γ
γ γ
c
d
d
ω
= − N (t) −
+ · cos (ωt) = −α (x) + · cos
x .
γ
γ
γ
γ
α′ (x) =
α ist also Lösung von y ′ = f (x, y) mit f : R2 → R und f (x, y) = −y + λ cos (kx) .
Dabei gilt k = ω/γ > 0 und λ = d/γ ≥ 0.
Wir untersuchen nun diese vereinfachte Differentialgleichung für λ ∈ R. Die
Funktionen a, b : R → R mit f (x, y) = a (x) · y + b (x) erfüllen also a (x) = −1
und b (x) = λ cos kx. Im Fall dieser Gleichung lässt sich eine maximale Lösung der
inhomogenen Gleichung leicht über den Ansatz αp (x) = α cos kx+β sin kx für x ∈ R
finden. Die Funktion αp löst y ′ = −y + λ cos kx genau dann, wenn für alle x ∈ R
k (−α sin kx + β cos kx) = −α cos kx − β sin kx + λ cos kx.
Koeffizientenvergleich der Faktoren vor den linear unabhängigen Funktionen cos und
sin ergibt das inhomogen lineare Gleichungssystem für α, β ∈ R
10
βk = −α + λ und αk = β.
Wie etwa jenes Mannes, der vor ca 5250(±125) Jahren am Hauslabjoch, einem Übergang
zwischen Schnals- und Ötztal, sein Leben verlor und dessen mumifizierte Überreste am Tag des
’magischen Datums’ 19.9.1991 von Bergwanderern entdeckt wurden.
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
29
Dieses gilt genau dann, wenn α = λ/ (1 + k 2 ) , β = kλ/ (1 + k 2 ) . Zu jeder maximalen
Lösung α von y ′ = −y + λ cos kx existiert somit eine Zahl C ∈ R, sodass α = αC .
Dabei erfüllt die Funktion αC : R → R für alle x ∈ R
αC (x) =
λ
(cos kx + k sin kx) + C · e−x .
1 + k2
Die Menge L aller maximalen Lösungen von y ′ = −y + λ cos kx ist somit durch
L = {αC |C ∈ R} gegeben.
Überprüfen wir dieses Ergebnis mit der Variation der Konstantenformel. Die
Funktion A : R → R mit A(x) = −x ist eine Stammfunktion von a. Daher folgt
für die maximale Lösung α des Anfangswertproblems zu x0 = 0 und y0 = 0 an der
Stelle x ∈ R, dass
x
α(x) = e−x
x
λ cos (kξ) eξ dξ = λℜe−x
0
e(1+ik)ξ dξ
0
eikx − e−x
λ
= λℜ
=
ℜ (1 − ik) eikx − e−x
1 + ik
1 + k2
λ
=
[cos (kx) − exp (−x) + k sin (kx)] .
1 + k2
folgt α = α0 + αp , wobei αp die schon durch
Für α0 ∈ L0 mit α0 (x) = − λ exp(−x)
1+k2
Ansatz erhaltene Lösung der inhomogenen Gleichung ist. Für sie gilt übrigens
λ
λ
cos (kx) k sin (kx)
√
[cos (kx) + k sin (kx)] = √
+ √
2
1+k
1 + k2
1 + k2
1 + k2
λ
λ
= √
[cos (δ) cos (kx) + sin (δ) sin (kx)] = √
cos (kx − δ)
1 + k2
1 + k2
αp (x) =
mit δ = arctan (k) ∈ 0, π2 . Die Lösung αp ist also eine harmonische Schwingung
derselben Periode wie die Inhomogenität der Gleichung. Sie ist jedoch um δ > 0
gegen die Inhomogenität (nach rechts) verschoben. Ihre Amplitude ist fallend in k.
Für jede weitere maximale Lösung α der Differentialgleichung y ′ = −y +λ cos ωx
existiert ein C ∈ R, sodass α (x) = αp (x) + Ce−x für alle x ∈ R. Es gilt folglich
limx→∞ (α − αp ) (x) = 0, d.h. der Einfluss der Anfangsbedingung auf die Lösung α
geht mit wachsendem x gegen 0 ohne dass die Lösung selbst gegen 0 konvergiert.
Die Lösung αp nähert also das Langzeitverhalten jeder anderen Lösung.
Die zur Lösung αp gehörige 14 C-Konzentration Np erfüllt zur Zeit t
Np (t) =
1.2
1.2.1
d
γ2 + ω2
cos (ωt − δ) +
c
ω
mit δ = arctan
γ
γ
∈ 0,
π
.
2
Systeme erster Ordnung
Definition und motivierende Beispiele
Ein Fluss strömt ruhig durch die Lande. An manchen Orten schneller, woanders
langsamer. An einem Ort p der Wasseroberfläche U ⊂ R2 und zu einer Zeit t ∈ D
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
30
habe das Wasser eine Strömungsgeschwindigkeit V (p, t) . Kurz gesagt, die Oberflächenströmung gibt eine Funktion V : D × U → R2 , (t, p) → V (t, p) vor.
Ein welkes Blatt löst sich von einem Baum und segelt schwankend auf unseren
Fluss herab. Die Strömung trägt das Blatt ungerührt davon. Zur Zeit t befindet sich
das Blatt am Ort γ (t) ∈ U. Längs seiner Bahn macht das Blatt die Strömung und ihr
Geschwindigkeitsfeld V sichtbar, denn es nimmt zu jeder Zeit t die Geschwindigkeit
V (t, γ(t)) an, die das Wasser gerade am Ort γ(t) ∈ U des Blattes hat. V wirkt als
ein Führungsfeld. Die ganze schöne Wasserreise des Blattes ist somit zu einer Kurve
γ : I → U mit I ⊂ D verdichtet und eine Filmaufnahme würde zeigen, dass für alle
t ∈ I die Differentialgleichung γ̇(t) = V (t, γ(t)) gilt.
Etwas ausführlicher notiert besteht die Kurve γ aus zwei Funktionen γ 1 , γ 2 : I →
R. Auch die Funktion V ist aus zwei reellwertigen Funktionen V 1 , V 2 : D × U → R
aufgebaut. Die Differentialgleichung wird mit dieser Notation zum folgenden System
von Gleichungen für γ 1 , γ 2 .


t
1
1
2
dγ 1
V
(t),
γ
(t))
t,
(γ
(t)
dt

=
dγ 2
t
2
1
2
(t)
t,
(γ
(t),
γ
(t))
V
dt
In diesem Abschnitt werden wir aus V Schlüsse über γ ziehen. Lässt sich die Reise
unseres Blattes gar berechnen?
Radioaktive Zerfallskette
Eine radioaktive Substanz A zerfalle in eine Substanz B, die wiederum weiter zerfällt.
Für die Stoffmenge NA (t) von A zur Zeit t und NB (t) von B gilt mit λA , λB ∈ R>0
NA′ (t) = −λA NA (t) und NB′ (t) = −λB NB (t) + λA NA (t).
(Beim Zerfall von n mol Stoff A werden n mol Stoff B gebildet.) Es gilt somit
d
dt
NA (t)
NB (t)
=
0
−λA
λA −λB
·
NA (t)
NB (t)
.
Es liegen zwei gekoppelte Differentialgleichungen (erster Ordnung) für zwei Funktionen vor. Allerdings ist die Kopplung so einfach, dass sich die beiden Gleichungen
nacheinander lösen lassen. Die Menge aller maximalen Lösungen der ersten Gleichungszeile ist
{NA : R → R, t → NA (0) exp (−λA t) | NA (0) ∈ R} .
Setzt man das Element NA (0) exp (−λA t) dieser Menge in die zweite Gleichung ein,
wird diese zu einer inhomogen linearen Differentialgleichung erster Ordnung, nämlich
NB′ (t) + λB NB (t) = λA NA (0) exp (−λA t) .
Ihre maximale Lösung zum Anfangswert NB (0) kann mit der Variation der Konstanten Formel erhalten werden. Für diese gilt mit NA (0), NB (0) ∈ R
NB (t) = NB (0) exp (−λB t) + λA NA (0) ·
exp(−λA t)−exp(−λB t)
λB −λA
t exp (−λB t)
falls λA = λB
.
falls λA = λB
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
31
y
1
0.75
0.5
0.25
0
0
1.25
2.5
3.75
5
x
Abbildung 1.16: Stoffmengen von A und B in Einheiten von NA (0).
Als Stoffmengen interpretierbar sind natürlich nur Konstante NA (0), NB (0) ∈
R≥0 . In diesem Fall folgt NA (t), NB (t) ∈ R≥0 für alle t > 0. Abbildung (1.16) zeigt
für λA = 1 und NB (0) = 0 den Graphen von NA (t)/NA (0) in schwarz. Für λB = 2
zeigt sie NB (t)/NA (0) in rot und NB (t)/NA (0) für λB = 1/2 in braun. Die grüne
B NB (t)
Kurve zeigt die (relative) Aktivität λA NAλ(t)+λ
für λA = 1 und λB = 2. Sie steigt
A NA (0)
11
bei 0 kurzzeitig an.
Dass jede Lösung des Systems, die den Quadranten (R≥0 )2 erreicht, also etwa
(NA (0), NB (0)) ∈ (R≥0 )2 erfüllt, diesen Quadranten später nicht mehr verlässt, folgt
aus der Gestalt des Vektorfeldes. Es ist am Rand des Quadranten nirgends aus
diesem herausgerichtet. Abbildung 1.17 zeigt das Vektorfeld für λA = 1 und λB = 2.
Abbildung 1.17: Das Vektorfeld der Zerfallskette für λA = 1 und λB = 2
11
Beim Zerfall 226 Ra →222 Rn + α etwa entweicht das Radon („Radiumemanation“) der Probe
und kann gesammelt werden. Die HWZ von 226 Ra ist 1602 Jahre und 222 Rn zerfällt mit einer HWZ
von 3, 8 Tagen. Die gesamte Aktivität einer umschlossenen Radium Probe ist λA NA + λB NB . Die
einer belüfteten ist λA NA . Dies hat die Enträtselung der Vorgänge nicht gerade erleichtert.
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
32
Lineare Schwingungen: Integration im komplexen Phasenraum
Die Bewegungsgleichung eines harmonischen Oszillators mit der Kreisfrequenz ω > 0
ist eine gewöhnliche Differentialgleichung zweiter Ordnung:
d2 x
(t) = −ω 2 x(t).
dt2
(1.17)
Für die beiden Funktionen x1 := x und x2 := ω1 dx
folgt x′1 = ωx2 und x′2 =
dt
−ωx1 . Fasst man die beiden reellwertigen Funktionen zur R2×1 -wertigen Funktion
(x1 , x2 )T zusammen, dann ist Gleichung (1.17) äquivalent zum folgenden System
erster Ordnung
d
dt
x1
x2
=ω
0 1
−1 0
·
x1
x2
x2
−x1
=ω
am reell 2-dimensionalen Phasenraum R2×1 äquivalent.
Das hier auftretende (lineare) Geschwindigkeitsvektorfeld A : R2×1 → R2×1 mit
x1
x2
→
0 1
−1 0
·
x1
x2
=
x2
−x1
ordnet einem Punkt seinen um 90◦ im ’Uhrzeigersinn’ gedrehten ’Ortsvektor’ zu. Es
ist tangential an Kreise um 0. Ein Kurve γ : I → R2×1 mit γ̇ = ωAγ sollte daher
den Punkt 0 mit konstanter Winkelgeschwindigkeit ω umkreisen (Fig 1.18).
Abbildung 1.18: Drehvektorfeld ωA
Ein erster besonders einfacher Weg, dies rechnerisch zu beweisen, nutzt die komplexe Multiplikation in der Ebene R2×1 ≃ C aus. Für die C-wertige Funktion
z := x1 + ix2 folgt nämlich ż (t) = −iωz(t). Maximale Lösungen sind nun leicht
zu erraten12 :
zc : R → C, t → exp (−iωt) · c mit c ∈ C.
12
Wie im Fall y ′ = y zeigt man, dass weitere maximale Lösungen nicht existieren.
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
33
Daraus ergibt sich mit c = a + ib für den Realteil der Lösung zc
xa,b (t) := ℜ (zc (t)) = a cos (ωt) + b sin (ωt) .
Zur Veranschaulichung der Lösung xa,b dient die folgende Überlegung. Sei (0, 0) =
(a, b) ∈ R2 . Dann existiert bekanntlich genau eine Zahl δ ∈ [0, 2π) mit
√
(a, b) = a2 + b2 (cos δ, sin δ) .
Damit folgt
√
xa,b (t) = ℜ (a − ib) · eiωt = ℜ a2 + b2 (cos δ − i sin δ) · eiωt
√
√
=
a2 + b2 ℜ e−iδ · eiωt = a2 + b2 cos (ωt − δ) .
√
Die Lösung xa,b geht also aus einer Cosinusschwingung der Amplitude a2 + b2 und
der Frequenz ω, durch Verschiebung des Zeitarguments t um δ/ω hervor.
Zwei reelle „Integrationskonstanten” a und b stehen zur Anpassung der „allgemeinen Lösung” xa,b an eine Anfangsbedingung zur Verfügung. Es folgt etwa, dass
die Funktion xa,b eine maximale Lösung von (1.17) zur Anfangsbedingung x(0) = a
und ẋ(0) = ωb ist. Dass xa,b durch diese Anfangsbedingung eindeutig festgelegt ist,
werden wir etwas später einem Eindeutigkeitssatz für Systeme erster Ordnung entnehmen. Dazu brauchen wir zuvor eine präzise etwas allgemeinere Definition eines
Systems von Differentialgleichungen erster Ordnung.
Definition 11 (Anfangswertproblem) Sei V ein endlichdimensionaler Vektorraum über R. Sei U ⊂ V offen und X : U → V. Sei D ⊂ R ein allgemeines Intervall.
Eine Abbildung γ : D → V heißt eine Lösung des autonomen Differentialgleichungssystems erster Ordnung γ̇ = X (γ) , falls γ (D) ⊂ U und falls γ̇(t) = X (γ(t))
für alle t ∈ D. Falls γ(t0 ) = v0 ∈ U, sagt man γ sei Lösung zum Anfangswert
(t0 , v0 ) ∈ R × U. Falls keine Lösung β : D′ → V existiert, für die D ⊂ D′ (echt
enthalten) und γ(t) = β(t) für alle t ∈ D, dann heißt die Lösung γ maximal.13
Sei γ : D → V eine Lösung des Systems γ̇ = X (γ) und sei e = (e1 , ...en ) eine
Basis von V . Seien γ i : D → R und X i : U ′ ⊂ R1×n → R so, dass für alle t ∈ D und
für alle v = nj=1 vj ej ∈ U
n
n
i
γ (t)ei und X(
γ(t) =
i=1
n
j
X i (v 1 , ..., v n )ei .
v ej ) =
j=1
i=1
Die reellwertigen Funktionen γ i und X i heißen die Komponentenfunktionen von γ
und X zur Basis e. Für sie folgt durch Koeffizientenvergleich
γ̇ 1 (t) = X 1 γ 1 (t), ..., γ n (t) ,
..
.
n
γ̇ (t) = X n γ 1 (t), ..., γ n (t) .
13
In der Quantentheorie ist die Zeitentwicklung eines Zustands ein (lineares) System erster Ordnung auf einem komplexen Vektorraum. Dieser Fall kann auf den reellen zurückgeführt werden.
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
34
Diese Formulierung der Gleichung γ̇ = X ◦ γ rechtfertigt den Namen „System erster
Ordnung“.
Eine Abbildung γ : D → V heißt eine Kurve in V . Ihr Bild γ (D) ⊂ V heißt die
Bahn der Kurve. Die Feldlinie eines elektrischen oder magnetischen Feldes X durch
v ist also einfach die Bahn der maximalen Lösung von γ̇ = X (γ) mit γ(0) = v.
Der Vektor γ̇(t) heißt Tangentenvektor von γ in t. Der Tangentenvektor γ̇(t) ist
tangential an das Bild γ(D) im Punkt γ(t). Eine Kurve γ : D → V ist somit Lösung
von γ̇ = X ◦ γ, falls für alle t ∈ D die Tangente von γ in t mit dem Vektor X (γ(t))
übereinstimmt. Ist der Punkt γ(t) gegeben, dann legt X die Tangente von γ in t
fest. Eine Lösung γ schmiegt sich an das gegebene Vektorfeld.
1.2.2
Feldlinien einer Punktladung
Sei |·| die euklidische Norm auf R3 und Q = q/4πε0 ∈ R>0 . Das elektrische Feld
einer positiven Punktladung ist X : R3 0 → R3 , v → Qv/ |v|3 . Ansatz: Eine
Lösung γ von γ̇ = X (γ) mit γ(0) = p wird von der Form γ(t) = α(t)p mit α(0) = 1
sein. Da eine Lösungskurve den Nullpunkt, der außerhalb des Definitionsbereiches
von X liegt, nicht erreichen kann, muss α > 0 gelten. Daraus folgt
α̇(t) = Q |p|−3 · α(t)−2 .
Diese Gleichung ist vom Typ der separierten Variablen y ′ = g(x)h(y) mit konstanter Funktion g(x) = Q′ := Q/ |p|3 für x ∈ R und h : R>0 → R mit h(y) = 1/y 2 .
Die Funktion h hat keine Nullstelle. Eine Stammfunktion von 1/h ist die Funktion
Φ(y) = y 3 /3. Somit folgt für eine Lösung α, dass α > 0 und α(x)3 /3 = Q′ · (x + c/3)
für ein reelles c. Der maximale Definitionsbereich von α ist − 3c , ∞ . Die Anfangsbedingung α(0) = 1 verlangt c = 1/Q′ . Eine maximale Lösung des Systems γ̇ = X (γ)
mit γ(0) = p ist somit die Kurve
γ : − (3Q′ )
−1
, ∞ → R3 ,
1/3
t → ((3Q′ t + 1))
p.
Die Bahn von γ ist γ(t) | t > − (3Q′ )−1 = R>0 · p, ein Halbstrahl in R3 . Das ist
also die Feldlinie durch p. Sie „beginnt” in der Singularität des elektrischen Feldes
und „endet” im Unendlichen. Ihre Eindeutigkeit folgt aus einem Satz des nächsten
Abschnitts.
1.2.3
AWP: Existenz- und Eindeutigkeit der Lösung
Es soll zunächst der Begriff eines Systems erster Ornung so verallgemeinert werden,
dass auch zeitabhängige Vektorfelder erfasst werden.
Definition 12 Sei U ⊂ R × V offen und sei X : U → V. Eine Kurve γ : I → V deren Graph {(t, γ(t)) | t ∈ I} in U enthalten ist, heißt eine Lösung des Systems erster
Ordnung γ̇ = X (t, γ) , falls γ̇(t) = X (t, γ (t)) für alle t ∈ I.Falls für eine Lösung
γ(t0 ) = v gilt, heißt γ Lösung zum Anfangswert (t0 , v) ∈ U. Falls γ nicht die Einschränkung einer weiteren Lösung des Systems ist, heißt γ maximal. Die Dimension
von V wird auch als die Dimension des Systems erster Ordnung bezeichnet.
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
35
Durch Übergang von der Abbildung X : U → V zum Vektorfeld X auf U mit
X : U → R × V, (t, v) → (1, X(t, v)) kann das nichtautonome System in ein
autonomes verwandelt werden. Daher genügt es, Existenz und Eindeutigkeitssätze
für autonome Systeme zu finden. Beim konkreten Aufsuchen von Lösungen hilft die
Einbettung jedoch im allgemeinen nicht.
Im folgenden werden zwei Existenz- und Eindeutigkeitssätze für die Lösung von
Anfangswertproblemen, einer für nichtautonome und einer für autonome Systeme
wiedergegeben. [18]
Satz 13 Sei U ⊂ R × V offen und die stetige Abbildung X : U → V sei lokal Lipschitzbeschränkt im folgenden Sinn. Für jedes p = (t, v) ∈ U existiert eine offene
Umgebung Rp := {(t′ , v ′ ) ∈ R × V : |t − t′ | < ε, |v − v ′ | < δ} von p und eine Konstante Lp , sodass |X (t′ , v ′ ) − X (t′ , v)| ≤ Lp |v ′ − v| für alle (t′ , v′ ) ∈ Rp ∩ U. Dann
besitzt das System γ̇(t) = X(t, γ(t)) zu einem Anfangswert (t0 , v0 ) ∈ U genau eine
maximale Lösung. Etwas ungenauer Nachsatz: Der Graph dieser Lösung „reicht“ bis
zum Rand von U .
Für autonome Systeme vereinfacht sich die lokale Lipschitzbeschränkung und es
vereinfachen sich einige weitergehenden Aussagen über die stetige Abhängigkeit der
Lösung von den Anfangsbedingungen.
Definition 14 Sei U ⊂ V offen, dann heißt ein Vektorfeld X : U → V lokal
Lipschitzbeschränkt, falls zu jedem v ∈ U Konstanten εv > 0 und Lv > 0 existieren,
sodass |X (v ′ ) − X (v)| ≤ Lv |v − v ′ | für alle v ′ ∈ V mit |v − v ′ | < εv .
Beachte, dass ein lokal Lipschitzbeschränktes Vektorfeld automatisch stetig ist.
Satz 15 (Picard - Lindelöf) Sei U ⊂ V offen und das Vektorfeld X : U → V
sei lokal Lipschitzbeschränkt. Dann existiert zu jedem v ∈ U genau eine maximale
Lösung des Systems γ̇ = X (γ) mit γ(0) = v. Diese Lösung wird mit γ v bezeichnet
und ihr Definitionsintervall mit Iv . Die Menge D mit D = v∈U (Iv × {v}) ist offen
in R × U und die lokale Flussabbbildung Φ : D → V, (t, v) → γ v (t) ist stetig. Ist
X vom C k -Typ, dann ist auch Φ vom C k -Typ.
Die Bestimmung aller maximalen Lösungen eines autonomen Systems erster Ordnung zum Vektorfeld X wird als ’Integration’ des Vektorfeldes X bezeichnet. Die
maximalen Lösungen des Systems werden auch Integralkurven genannt.
1.3
Lineare Systeme erster Ordnung
Im Fall der (inhomogen) linearen Systeme ist eine gemeinsame Behandlung des
komlexen und reellen Falles leicht möglich. Im Hinblich auf die Quantendynamik
wird der komplexe Fall gleich mitbehandelt.
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
36
Definition 16 Sei V ein endlichdimensionaler Vektorraum über K = R oder K =
C und I ⊂ R sei ein allgemeines Intervall. Die beiden Abbildungen A : I → L (V, V )
und b : I → V seien stetig. L (V, V ) ist der K-Vektrorraum der linearen Abbildungen
von V nach V und das Bild von v ∈ V unter einer linearen Abbildung A(t) ∈ L (V, V )
wird mit A(t)v bezeichnet.14 Das System γ̇(t) = A(t)γ(t) + b(t) heißt inhomogen
linear falls b = 0 und homogen linear falls b = 0. Beide Fälle werden als linear
bezeichnet.
Ein lineares System erfüllt die lokale Lipschitzbedingung. Daher existiert durch
jeden Anfangswert (t0 , v) ∈ I × V genau eine maximale Lösung. Über ihren Definitionsbereich gibt der folgende Satz Auskunft. Er ist in Kap. III, §14.VI von [18] zu
finden.
Satz 17 Jede maximale Lösung eines linearen Systems über einem reellen Intervall
I ist auf ganz I definiert.
Eine Illustration für die Behauptung des Satzes gibt der folgende Abschnitt.
1.3.1
2d Drehungen
Wir beginnen mit einem Beispiel, das uns noch wiederholt beschäftigen wird. Es
ist die Bewegungsgleichung eines harmonischen Oszillators y ′′ + ω 2 y = 0. Sie wurde
bereits in ein homogen lineares System erster Ordnung umgeformt und gelöst. Jetzt
wird dieses System nochmals aber ohne die Verwendung der komplexen Struktur im
R2 für beliebige Anfangsvorgabe gelöst. Wir werden dabei die Flussabbildung als
eine Drehbewegung von R2 um 0 mit konstanter Winkelgeschwindigkeit erkennen.
Die Bewegungsgleichung ẍ + ω 2 x = 0 ist mit γ 1 = x und γ 2 = ẋ/ω bekanntlich
dem System erster Ordnung γ̇ = −ωLγ auf dem ’Phasenraum’ V = R2×1 mit dem
’Geschwindigkeitsvektorfeld’ −ωL : V → V mit
L:
a
b
→
−b
a
=
0 −1
1
0
·
a
b
äquivalent. Versuchen wir nun ohne Nutzung der komplexen Sruktur von R2 die
maximalen Lösungen des Systems γ̇ = ωL (γ) zu finden.
Der Graph von L kann dadurch veranschaulicht werden, dass an einigen Stellen
v seines Definitionsbereichs der Vektor λL(v) eingezeichnet wird. Die Konstante
λ > 0 wird dabei so gewählt, dass sich die Vektoren nicht überschneiden. Die so
gezeichneten Vektoren sind tangential zur Bahn einer Lösung von γ̇ = ωL ◦ γ. Im
vorliegenden Beispiel gilt L(v), v = L(v)t ·v = 0. Daher sind als Bahnen maximaler
Lösungen Kreise um 0 zu erwarten.
14
Die Größe A(t)γ(t) ist somit das Bild des Wertes der Kurve γ zur Zeit t unter der linearen
Abbildung A(t). Die systematische, aber unübliche Schreibweise dafür ist A(t, γ(t)), wobei A als
Abbildung von I × V nach V aufgefasst wird.
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
37
In Analogie zur reellen Differentialgleichung y ′ = λy ist zu vermuten, dass für
v ∈ V die Kurve γ v : R → V, t → etωL v eine Lösung des Systems γ̇ = ωLγ ist.
Für das Exponential eA einer linearen Abbildung A : V → V gilt
eA : V → V,
v→
∞
n=0
1 n
A (v),
n!
wobei die lineare Abbildung An rekursiv durch A0 = id und An+1 (v) = A (An (v))
definiert ist. Die Abbildung eA : V → V ist somit als (unendliche) Summe linearer
Abbildungen auch linear. (Konvergenzfragen werden vorläufig ignoriert.)
Im vorliegenden Beispiel gilt L2 = −id. Daraus folgt
tL
e
=
=
∞
n=0
∞
n=0
tn n
L =
n!
∞
n=0
n 2n
∞
t2n 2n
t2n+1
L +
L2n+1
(2n)!
(2n
+
1)!
n=0
∞
(−1) t
(−1)n t2n+1
id +
L = cos (t) · id + sin (t) · L.
(2n)!
(2n + 1)!
n=0
Daher ist eωtL eine Drehung von V um den Winkel ωt
eωtL =
cos(ωt) − sin(ωt)
sin(ωt) cos(ωt)
.
(1.18)
Durch Ableiten nach t rechnet man dtd eωtL = ωLetL nach. Folglich gilt auch für
γ v : R → V mit γ v (t) = eωtL v, dass γ̇ v (t) = ωLγ v (t) und γ v (0) = v. Die Kurve γ v
ist also tatsächlich eine maximale Lösung des homogen linearen Systems γ̇ v = ωLγ v
mit der Anfangsbedingung γ v (0) = v.
Gibt es weitere maximale Lösungen? Sei γ : I → V eine solche. Dann folgt
d −ωtL
e
γ (t) = (−ωL) e−ωtL γ (t) + e−ωtL γ̇ (t) = −ωLe−tL + e−tL ωL γ (t) = 0.
dt
Somit ist t → e−ωtL γ (t) konstant. Daher existiert ein v ∈ V, sodass e−ωtL γ (t) = v
für alle t ∈ I. Man rechnet an Gleichung (1.18) leicht nach, dass für x ∈ R die
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
38
Abbildung e−xL invers zu exL ist. Daher gilt γ (t) = eωtL v für alle t ∈ I. Damit ist
klar, dass {γ v : v ∈ V } alle maximalen Lösungen des Systems γ̇ = ωLγ enthält.
Sei nun γ v : R → V, t → exp (ωtL) v und v = (a, b)t . Es gilt somit
γ v (t) =
a cos(ωt) − b sin(ωt)
a sin(ωt) + b cos(ωt)
.
Das Bild von γ v ist der Kreis um 0 durch den Punkt v.
Zwei spezielle Lösungen γ v ergeben sich für v = e1 = (1, 0)t bzw. v = e2 = (0, 1)t .
Es sind dies die beiden Spalten der Matrix von eωtL zur Standardbasis. Jede andere
der Lösungen γ v ist eine Linearkombination der beiden Lösungen γ e1 und γ e2 . Es
gilt für v = ae1 − be2
γ v = γ ae1 −be2 = aγ e1 − bγ e2 .
Der erste Eintrag der Lösungskurve γ v ist die reelle Funktion x(t) = a cos (ωt) +
b sin (ωt) . Dies stimmt mit den schon auf anderem Weg gefundenen maximalen
Lösungen der Gleichung (1.17) überein.
1.3.2
Homogen lineare Systeme
Für homogen lineare Systeme genügt es ganz allgemein und nicht nur im obigen
Beispiel des Drehvektorfeldes L, eine endliche Anzahl maximaler Lösungen zu berechnen. Alle weiteren Lösungen können nämlich daraus durch Linearkombination
gewonnen werden. Genaueres dazu im folgenden Satz.
Satz 18 Sei γ̇(t) = A(t)γ(t) ein homogen lineares System auf einem Intervall I und
einem n-dimensionalen K-VR V. Dann ist die Menge LA,0 aller maximalen Lösungen des Systems ein n-dimensionaler K-VR. Für γ 1 , . . . γ k ∈ LA,0 sind äquivalent:
1. γ 1 , . . . γ k sind linear unabhängig in LA,0 ,
2. für t0 ∈ I sind γ 1 (t0 ), . . . γ k (t0 ) linear unabhängig in V.
Definition 19 Eine Basis von LA,0 heißt ein Fundamentalsystem des homogen linearen Systems γ̇(t) = A(t)γ(t).
Ist (v1 , . . . vn ) eine Basis von V und gilt für γ 1 , . . . γ n ∈ LA,0
γ 1 (t0 ) = v1 , . . . γ n (t0 ) = vn ,
dann gilt für die Kurve γ = ni=1 ci γ i die Anfangsbedingung γ(t0 ) = ni=1 ci vi .
Die maximale lokale Flussabbildung eines homogen linearen Systems ist daher
für t0 ∈ I über die Lösungen γ t0 ,v ∈ LA,0 mit γ t0 ,v (t0 ) = v durch
Φt0 : I × V → V,
(t, v) → γ t0 ,v (t)
auf ganz I × V definiert. Die Abbildung Φt0 ist im zweiten Argument K-linear:
Φt0 (t, v + λw) = Φt0 (t, v) + λΦt0 (t, w) für alle v, w ∈ V und für alle λ ∈ K. Die
Abbildung
Ut,t0 : V → V, v → Φt0 (t, v)
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
39
ist wegen Satz 18 sogar für jedes t ∈ I ein Vektorraumisomorphismus, also invertierbar. Sei e = (e1 , . . . en ) eine Basis von V und sei (γ 1 , . . . γ n ) jenes Fundamentalsystem
von γ̇(t) = A(t)γ(t), für das γ 1 (t0 ) = e1 , . . . γ n (t0 ) = en gilt. Sind γ ji : I → K so,
dass γ i (t) = nj=1 γ ji (t) ej für alle t ∈ I, dann folgt

 

v1
γ 11 (t) , . . . γ 1n (t)
n

  .. 
..
Ut,t0
vi ei = (e1 , . . . en ) · 
 ·  . .
.
n
n
i=1
γ 1 (t) , . . . γ n (t)
vn
Die i-te Spalte der Matrix von Ut,t0 zur Basis e besteht also aus den Koordinatenfunktionen der Kurve γ i zur Basis e. An einem Fundamentalsystem können daher
die „Evolutionsabbildungen” Ut,t0 für t ∈ I abgelesen werden.
1.3.3
Autonome homogen lineare Systeme
Für die Physik15 besonders wichtig sind autonome homogene lineare Systeme. Daher
wird auf diese noch etwas genauer eingegangen. Für Ut,t0 gilt wie schon beim Beispiel
des Drehvektorfeldes die folgende Exponentialformel.
Satz 20 Sei γ̇(t) = Aγ(t) ein autonomes homogen lineares System auf R und einem
n-dimensionalen K-VR V mit A : V → V. Dann gilt Ut,t0 = Ut−t0 ,0 =: Ut−t0 und
Ut = e
tA
:V →V
v → γ 0,v (t) =
∞
n=0
tn n
A v.
n!
Beweis. Ist γ v jene maximale Lösung des autonomen Systems γ̇ = Aγ, für die
γ v (0) = v. Dann ist auch ihr Translat γ (t) = γ v (t − t0 ) eine Lösung. Für sie gilt
γ (t0 ) = v. Daraus folgt Ut,t0 v = γ (t) = γ v (t − t0 ) = Ut−t0 ,0 v für alle v ∈ V.
Sei · eine Norm von V . Eine Reihe ∞
n=0 vn konvergiert in V genau dann, wenn
∞
die Zahlenreihe n=0 vn konvergiert. Es existiert ein C > 0 mit Av ≤ C v
für alle v ∈ V. Daraus folgt
# n
#
# t n # tn n
# A v# ≤ C v .
# n!
# n!
Die Reihe
Reihe
∞
n=0
vn mit vn =
tn n
A v
n!
∞
n=0
ist somit majorisiert von der konvergenten
tn n
C v = v etC
n!
und damit selbst konvergent. Wir rechnen nun nach, dass γ t0 ,v das System γ̇ = Aγ
löst.
d
d
γ 0,v (t) =
dt
dt
15
∞
n=0
tn n
A v=
n!
∞
n=1
∞
∞
ntn−1 n
tn−1
tn n
n−1
A v=A
A v=A
A v.
n!
(n − 1)!
n!
n=1
n=0
Die Schrödingergleichung i ∂t Ψt = HΨt ist von diesem Typ, wenngleich der Vektorraum, in
dem Ψt liegt, meist unendlichdimensional ist.
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
40
n
t
n
Schließlich nimmt die Reihe ∞
n=0 n! A v für t = 0 den Wert v an.
Hier noch einige Eigenschaften des Exponentials von linearen Abbildungen. Für
−1
= e−A und det eA =
A : V → V linear und s, t ∈ R gilt esA ◦ etA = e(s+t)A , eA
eSp(A) > 0. Man beachte jedoch, dass für lineare Abbildungen A, B : V → V im
allgemeinen eA ◦ eB = eA+B .
Eine explizite Berechnung von etA ist nur in einigen wenigen Fällen, wie beim
Drehvektorfeld L direkt durch Aufsummieren der Exponentialreihe möglich. Dennoch gibt es weitere lösbare Fälle. Falls Av = av für ein a ∈ K, dann folgt (mit
Reihe Nachrechnen!) etA v = eta v.
Falls A Eigenvektoren v1 , ..., vn zu Eigenwerten a1 , ..., an hat, dann folgt16 aus
der Linearität von etA
n
tA
n
i
e
c vi
i=1
ci etai vi .
=
i=1
Ist (v1 , ..., vn ) eine Basis von V, dann ist damit die (maximale) Flussabbildung von
γ̇ = Aγ ermittelt.
1.3.4
3d Drehvektorfelder und ihre Flussabbildungen
Sei V ein reeller Vektroraum der Dimension 3. Eines der Skalarprodukte von V sei
ausgewählt und mit ·, · bezeichnet. Von den beiden Mengen aller gleichsinnig orientierten Basen sei eine als die positiv orientierte Klasse ausgezeichnet. Damit ist in V
ein schiefsymmetrisches bilineares Vektorprodukt × : V × V → V eindeutig festgelegt. Es bildet zwei orthogonale Einheitsvektoren u, v ∈ V auf jenen Einheitsvektor
w = u × v ab, der (u, v, w) zu einer positiv orientierten ONB von V macht.
Wie bewegen sich die Elemente von V, wenn sie alle um eine Gerade R· n gedreht
werden? Sei n ∈ V mit |n| = 1. Ein Vektor v ∈ V wird in einen Teil im Unterraum
R · n und einen dazu senkrechten Teil zerlegt:
v = n, v n + (v − n, v n) .
Der Teil n, v n liegt in R · n. Der Teil v − n, v n liegt in der Ebene n⊥ durch
0, die senkrecht auf R · n steht. Beim Drehen von v um die Achse R · n bleibt
n, v n unverändert. Nur der Teil v ′ = v − n, v n wird in der Ebene n⊥ gedreht.
Ist ein Drehwinkel α ∈ R gewählt, dann bleibt noch die Entscheidung über den
Drehsinn zu fällen: wird ein Vektor v ∈
/ R · n in die Richtung n × v weggedreht oder
entgegengesetzt dazu? Jetzt ist klar, wozu der achsenerzeugende Vektor n dient.
Er gibt die Möglichkeit den Drehsinn zu formulieren. Wird v für α > 0 in die
Richtung n × v um den Winkel α weggedreht, dann sagt man die Drehung um die
orientierte Achse R · n hat positiven Drehsinn. Andernfalls wird der Drehsinn als
negativ bezeichnet.
Eine positive Drehung Rn (α) um die orientierte Achse R · n und um den Winkel
α erzeugt aus v ′ ∈ n⊥ einen Vektor Rn (α) v ′ ∈ n⊥ derselben Länge wie v ′ . Die
16
Dies ist das Lösungsschema für die zeitabhängige Schrödingergleichung mit statischem Hamiltonoperator.
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
41
Zerlegung von Rn (α) v′ nach den beiden 1d orthogonalen Unterräumen R · v′ und
R · (n × v ′ ) ergibt somit (Bild!)
Rn (α) v ′ = cos (α) · v ′ + sin (α) · (n × v ′ ) .
Damit folgt für einen belieben Vektor v ∈ V, dass
Rn (α) v =
=
n, v n + cos (α) (v − n, v n) + sin (α) (n × (v − n, v n))
n, v n + cos (α) (v − n, v n) + sin (α) (n × v) .
Die Ableitung der Kurve γ v : R ∋ α → Rn (α) v an der Stelle α = 0 ergibt den
Tangentenvektor γ̇ v (0) = n × v. Damit ist die folgende Definition motiviert.
Definition 21 Ist Ω ∈ V, dann heißt die lineare Abbildung LΩ : V → V mit
LΩ (v) = Ω × v Drehvektorfeld zum Vektor Ω. Es ist das Geschwindigkeitsvektorfeld
einer (starren) Drehung mit dem Winkelgeschwindigkeitsvektor Ω. Die nichtnegative
Zahl |Ω| wird als die (skalare) Winkelgeschwindigkeit von LΩ und für Ω = 0 wird
R · Ω als die (orientierte) Drehachse von LΩ bezeichnet.
Winkelgeschwindigkeitsvektoren werden als Axialvektoren im Gegensatz zu ’polaren’ Vektoren bezeichnet. Was ist mit dieser absurd anmutenden Rede gemeint,
wenn doch alle Vektoren in V Elemente ein und desselben Raumes sind? Gibt es da
etwa eine Klasseneinteilung von V ? Nein, der Grund ist der folgende.
Die Spiegelung π : V → V mit π (v) = −v überträgt sich auf die Tangentenvektorfelder von V indem für X : V → V das gespiegelte Vektorfeld π ∗ X : V → V
durch π ∗ X : x → −X (−x) definiert wird. (Die Regel motiviert sich über die Tangenten von Kurven in V.) Was passiert mit dem Vektorfeld LΩ bei Spiegelung? Es
gilt (π ∗ LΩ ) (v) = −LΩ (−v) = LΩ (v) für alle v ∈ V und somit π∗ LΩ = LΩ . Man
sagt dazu: ’der Winkelgeschwindigkeitsvektor eines Systems (bezüglich 0) geht bei
Spiegelung des Systems (am Punkt 0) in sich über’. Es ist also die Parametrisierung
der Drehvektorfelder auf V durch Elemente von V, die ’polar’ heißen sollte.
Man veranschauliche sich den Sachverhalt am Beispiel eines rotierenden Balls.
Bei Spiegelung an seinem Mittelpunkt geht der Bewegungszustand des Balls in sich
über. Ein weiteres Beispiel liefert die um die Sonne umlaufende Erde. Bei Spiegelung
an der Sonne bleiben Dreh- und Umlaufsinn der Erde erhalten, wenn auch Nordund Südpol ihren Platz tauschen.
Aufgrund der Bilinearität des Vektorproduktes (v, w) → v×w von V ist die Menge aller Drehvektorfelder selbst ein dreidimensionaler Vektorraum, da für A, B ∈ V
und λ ∈ R gilt, dass LA + LB = LA+B und λLA = LλA . Die Hintereinanderausführung zweier Drehvektorfelder ergibt
LA ◦ LB : v → A × (B × v) = B A, v − v B, A .
Für A = 0 = B steht der Vektor L (A LB v) nicht für jedes v ∈ V senkrecht zu v.
(Übung) Damit ist LA ◦ LB kein Drehvektorfeld. Aber es folgt
[LA , LB ] := LA ◦ LB − LB ◦ LA : v → B A, v − A B, v .
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
42
Wegen LA×B (v) = (A × B) × v = −v × (A × B) = −A v, B + B A, v gilt somit [LA , LB ] = LA×B . Das (bilineare und schiefsymmetrische) Kommutatorprodukt
zweier Drehvektorfelder ist wieder ein Drehvektorfeld.
Satz 22 Die Evolutionsabbildung Ut (zur Anfangszeit t0 = 0) des Systems erster
Ordnung γ̇ = LΩ γ zum Geschwindigkeitsvektorfeld einer Drehung mit Winkelgeschwindigkeit Ω = 0 erfüllt U (t) = etLΩ = eωtLn = Rn (ωt) mit n = Ω/ |Ω| und
ω = |Ω| . Für alle v ∈ V gilt Ut v = n, v n+cos (ωt) (v − n, v n)+sin (ωt) (n × v) .
Beweis. Der entscheidende Sachverhalt ist a × (b × c) = b a, c − c a, b für
a, b, c ∈ V. Daraus folgt für alle v ∈ V, dass
L2n v = n × (n × v) = n, v n − n, n v = − (v − n, v n) = −Pn′ v,
mit der Abkürzung Pn′ : V → V, v → v − n, v n. Die Abbildung Pn′ ist somit die
Orthogonalprojektion auf n⊥ . Damit gilt für v ∈ n⊥
k
2k+1
L2k
v = (−1)k n × v für alle k ∈ N0 ,
n v = (−1) v und Ln
während für v ∈ R · n folgt, dass L0n v = v und Lk>0
n v = 0. Anwendung der ExpoωtLn
nentialreihe von e
auf die Zerlegung v = n, v n + (v − n, v n) ergibt dann die
Behauptung des Satzes.
1.3.5
*Drehbewegungen starrer Körper: Trägheitstensor
An dieser Stelle bietet sich ein Exkurs zur Physik der Drehbewegungen starrer Körper an. Dabei wird das Gebiet der gewöhnlichen Differentialgleichungssysteme zwar
kurz verlassen, aber die Übersichtlichkeit und Transparenz der basisfreien Vektorrechnung kann illustriert werden.
Sei X = {x1 , . . . xn } ⊂ V die Menge der Orte der ausdehnungslosen Bestandteile
eines Körpers zur Zeit t = 0. So ein Körper wird als starr bezeichnet, wenn seine
Bestandteile C 2 -Kurven γ i : I → V mit γ i (0) = xi durchlaufen, für die eine gemeinsame Kurve R : I → SO (V ) und eine gemeinsame Kurve a : I → V existiert, sodass
γ i (t) = a (t) + R (t) xi für alle i ∈ {1, . . . n} und für alle t ∈ I gilt. Hier bezeichnet
SO (V ) die Menge aller linearen Abbildungen A : V → V mit |Av| = |v| für alle
v ∈ V und det A > 0. Es ist dies die Menge aller Drehungen von V und es folgt
det A = 1 für alle A ∈ SO (V ) .17 Im folgenden wird der Spezialfall a = 0 fehlenden
Translationsanteils behandelt.
Tragen die Massenpunkte γ i die Massen mi ∈ R>0 , und rotieren sie zur Zeit t = 0
mit der Winkelgeschwindigkeit Ω ∈ V um 0 ∈ V, dann hat der ’Massenpunkt’ zur
Zeit t = 0 die Geschwindigkeit vi = Ṙ (0) xi = LΩ xi mit LΩ = Ṙ (0) . Das rotierende
Massenpunktsystem hat in diesem Augenblick die kinetische Energie
n
Tkin =
i=1
17
mi
|vi |2 =
2
n
i=1
mi
LΩ xi , LΩ xi =
2
n
i=1
mi
Ω × xi , Ω × xi .
2
Der Konfigurationsraum eines starren Körpers ist somit V × SO (V ) , eine differenzierbare
Mannigfaltigkeit, die kein Vektorraum ist. Daher benötigt die Mechanik des starren Körpers eine
Verallgemeinerung der Differential- und Integralrechnung auf nichlineare Mannigfaltigkeiten.
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
43
Mit a × b, v × w = a, v b, w − a, w b, v für alle a, b, v, w ∈ V folgt
%
$
n
n
mi
mi
2
2
2
2
Tkin =
|Ω| |γ i | − Ω, xi
= Ω,
|xi | ιdV − xi xi , · Ω .
2
2
i=1
i=1
Die lineare Abbildung Θm : V → V mit
n
Θm =
i=1
mi |xi |2 ιdV − xi xi , ·
(1.19)
heißt Trägheitstensor der Massenverteilung m : X → R>0 mit xi → mi bezüglich der
Rotationen um 0. Bei Rotation von m mit der momentanen Winkelgeschwindigkeit
Ω hat das System also die kinetische Energie Tkin = Ω, Θm Ω /2. Als Funktion von
Ω ist Tkin also die zum Trägheitstensor gehörige quadratische Form.
Der Trägheitstensor ΘRm der drehgespiegelten Massenverteilung Rm : RX →
R>0 mit Rxi → mi für ein R ∈ O (V ) hängt offenbar mit Θm gemäß ΘRm =
RΘm R∗ = RΘm R−1 zusammen. Zu einer beliebigen Zeit t haben wegen γ i (t) =
R (t) xi die Massenpunkte des Körpers die Geschwindigkeiten γ̇ i (t) = Ṙ (t) xi =
Ṙ (t) R (t)−1 γ i (t) = LΩ(t) γ i (t) mit LΩ(t) = Ṙ (t) R (t)−1 . Die kinetische Energie des
Körpers hat daher zur Zeit t den Wert
&
' &
'
Tkin (t) = Ω (t) , ΘR(t)m Ω (t) = R (t)−1 Ω (t) , Θm R (t)−1 Ω (t) .
Dreht sich ein Körper im Lauf der Zeit mit konstanter Winkelgeschwindigkeit Ω,
dann hat er zur Zeit t die
Massenverteilung
& −tL
' mt = R (t) m mit R (t) = exp (tLΩ ) .
−tLΩ
Ω
Daher gilt Ω, Θmt Ω = e
Ω, Θm e
Ω = Ω, Θm Ω , dh die kinetische Energie
ist zeitlich konstant.
Ist eine Massenverteilung m unter einer Drehspiegelung R ∈ O (V ) invariant,
gilt also Rm = m, dann folgt RΘm R∗ = ΘRm = Θm , oder auch RΘm = Θm R, der
Trägheitstensor kommutiert mit der Symmetrie R von m. Ist v ∈ V ein Eigenvektor
von Θm zum Eigenwert ϑ, dann folgt daraus Θm (Rv) = RΘm v = ϑ · (Rv) , dh R
bildet die Eigenräume von Θm jeweils auf sich ab. Ist ein Eigenraum eindimensional,
dann sind seine Elemente v = 0 auch Eigenvektoren von R.
Die Eigenwerte von Θm heißen Hauptträgheitsmomente und die Eigenräume die
Hauptträgheitsachsen von m. Da Θm bezüglich ·, · symmetrisch ist, existiert eine
Orthonormalbasis von V aus Eigenvektoren von Θm .
Im folgenden ist m fest gewählt, sodass die Notation Θm gefahrlos zu Θ verkürzt
werden kann. Die Gramsche Matrix der Bilinearform Θ : V × V → R mit Θ (v, w) =
v, Θw zu einer beliebigen Orthonormalbasis (e1 , e2 , e3 ) von V hat die Einträge
n
Θrs = er , Θes =
i=1
mi |xi |2 δ rs − er , xi xi , es
Diese basisabhängige Matrix wird vielfach auch als Trägheitstensor bezeichnet.
Was hat Θ oder auch Θ mit einem Tensor der linearen Algebra zu tun? Ist V ∗
der Vektrorraum aller linearen Abbildungen von V nach R, dann existieren zu einer
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
44
beliebigen Basis e = (e1 , e2 , e3 ) von V drei Elemente (E 1 , E 2 , E 3 ) von V ∗ , sodass
E i (ej ) = δ ij . Diese drei Element bilden eine Basis von V ∗ , die sogenannte duale
Basis, und es gilt v = 3i=1 E i (v) ei für alle v ∈ V. Daraus ergibt sich
3
Θ (v, w) =
r,s=1
Θrs E r (v) · E s (w) .
Die bilineare Abbildung18 ⊗ : V ∗ × V ∗ → Bil (V × V ) mit
⊗ (X, Y ) ≡ X ⊗ Y : V × V ∋ (v, w) → X (v) · Y (w) ∈ R
ist ein sogenanntes Tensorprodukt im Sinn der linearen Algebra. Mit diesem gilt
daher Θ = 3r,s=1 Θrs · (E r ⊗ E s ) .
Der gesamte (kinetische) Drehimpuls lkin eines zusammengesetzten Systems setzt
sich aus den Drehimpulsen seiner Bestandteile additiv zusammen. Es gilt daher für
ein starr um 0 rotierendenes System wegen a × (b × c) = b a, c − c a, b
n
lkin =
i=1
n
mi xi × vi =
n
i=1
mi xi × (Ω × xi ) =
i=1
mi |xi |2 Ω − xi , Ω xi = ΘΩ.
Θ bildet die Winkelgeschwindigkeit einer Massenverteilung auf ihren Drehimpuls ab.
1.3.6
*Allgemeine Bewegungen starrer Körper
Sei V ein reeller Vektorraum der Dimension 3 und sei ·, · ein Skalarprodukt von
V. Die Menge aller linearen Abbildungen A : V → V mit Av, Aw = v, w für alle
v, w ∈ V ist bezüglich der Hintereinanderausführung die Gruppe O3 . Für A ∈ O3
gilt somit A∗ = A−1 und detA = ±1. Die Untergruppe SO3 = {A ∈ O3 : detA = 1}
bildet zusammen mit der Translationsgruppe V die Gruppe B = SO3 ⋊ V von V :
B ∋ gA,a : V → V,
v → Av + a.
Wegen
[gA2 ,a2 ◦ gA1 ,a1 ] (v) = A2 (A1 v + a1 ) + a2 = A2 A1 v + A2 a1 + a2
= (A2 A1 , A2 a1 + a2 ) v
gilt das Gruppenmultiplikationsgesetz eines semidirekten Produktes
gA2 ,a2 ◦ gA1 ,a1 = gA2 A1 ,A2 a1 +a2
für alle (A1 , a1 ) , (A2 , a2 ) ∈ SO3 × V.
Zwei Abbildungen gA1 ,a1 , gA2 ,a2 ∈ B sind übrigens genau dann gleich, wenn A1 =
A2 und a1 = a2 . Gilt nämlich A1 v + a1 = A2 v + a2 für alle v ∈ V, dann folgt aus dem
Fall v = 0, dass a1 = a2 . Daraus wiederum folgt nun für alle v ∈ V, dass A1 v = A2 v,
also A1 = A2 . Daher wird abgekürzt: gA,a = (A, a) .
18
Hier bezeichnet Bil (V × V ) den Vektorraum aller bilinearen Abbildungen von V × V nach R.
Man beachte, dass dim (V × V ) = 6 und dim Bil (V × V ) = 9.
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
45
Definition 23 Eine Abbildung f : V → V mit |f (x) − f (y)| = |x − y| für alle
x, y ∈ V heißt Isometrie von V.
Satz 24 Die Menge aller Isometrien von V stimmt mit B überein.
Beweis. Siehe Kap. 1 der Vorlesung von Franz Pauer, ’Gruppentheorie für Mathematiker, Physiker und Chemiker’, SoSe 1986.
Definition 25 Sei I ⊂ R ein offenes Intervall und Φ : I × V → V d’bar mit
Φ (t, ·) ∈ B für alle t ∈ I. Dann heißt Φ d’bare Bewegung von V.
Ist Φ : I × V → V eine d’bare Bewegung von V, dann existiert also für alle t ∈ I
genau ein (A (t) , a (t)) ∈ B mit Φ (t, v) = A (t) v +a (t) . Für zwei Vektoren v, w ∈ V
folgt
Φ (t, v) = Φ (t, w) + A (t) (v − w) .
Diese Formel stellt die Bewegung von v als Hintereinanderausführung einer Drehung
von v um w und einer anschließenden Translation um Φ (t, w) dar. Daraus folgt mit
der Bezeichnung Φ (t, v) = γ v (t) wegen γ v (t) − γ w (t) = A (t) (v − w) , dass
γ̇ v (t) = γ̇ w (t) + Ȧ (t) A (t)−1 [γ v (t) − γ w (t)] .
Lemma 26 Ist A : I → SO3 d’bar, dann ist für t ∈ I die Abbildung C (t) :=
Ȧ (t) A (t)−1 antisymmetrisch, d.h. es gilt w, C (t) v = − C (t) w, v für alle v, w ∈
V, oder äquivalent dazu C (t)∗ = −C (t) .
Beweis. Es gilt für alle v, w ∈ V
(
) (
)
d
d
w, v =
A (t) w, A (t) v = Ȧ (t) w, A (t) v + A (t) w, Ȧ (t) v
dt
dt
(
) (
)
−1
= Ȧ (t) A (t) A (t) w, A (t) v + A (t) w, Ȧ (t) A (t)−1 A (t) v .
0 =
Da A (t) bijektiv ist, gilt somit auch
(
) (
)
−1
−1
Ȧ (t) A (t) x, y + x, Ȧ (t) A (t) y = 0 für alle x, y ∈ V.
Anmerkung: Die Liealgebra der SO3 kann mit dem Tangentialraum der SO3 im
Einselement e = ιdV , also mit Te SO3 = so3 identifiziert werden. Sie stimmt mit den
antisymmetrischen linearen Abbildungen von V nach V überein. Ȧ (t) ist Element
des Tangentalraumes von SO3 im Punkt A (t) .
Lemma 27 Ist die lineare Abbildung C : V → V antisymmetrisch und ist eine
Orientierung von V gewählt, dann existiert genau ein ω ∈ V mit Cv = ω × v ≡ Lω v
für alle v ∈ V. (Dabei ist × das äußere Produkt von V bezüglich der gewählten
Orientierung. Für eine positiv orientierte ONB e = (e1 , e2 , e3 ) von V gilt also e1 ×
e2 = e3 zyklisch.)
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
46
Beweis. Sei e eine positiv orientierte ONB von V. Dann existieren eindeutig
bestimmte reelle Zahlen a, b, c sodass für die Matrix M (C, e) gilt:


0 −c b
0 −a  .
M (C, e) =  c
−b a
0
Für alle v =
i
v i · ei ∈ V gilt dann

  1 
0 −c b
v
0 −a  ·  v 2  .
Cv = (e1 , e2 , e3 ) ·  c
−b a
0
v3
ω i · ei für alle v ∈ V

  1 
0 −ω 3 ω 2
v
3
1   2 

ω
0 −ω
v
ω × v = (e1 , e2 , e3 ) ·
·
.
2
1
3
−ω
ω
0
v
Andererseits gilt mit ω =
i
Cv = ω × v gilt nun genau dann, wenn (ω 1 , ω 2 , ω 3 ) = (a, b, c) .
Damit ist nun gezeigt:
Satz 28 Ist Φ : I × V → V eine d’bare Bewegung von V, dann existiert eine stetige
Abbildung Ω : I → V, sodass γ̇ v (t) = γ̇ w (t)+Ω (t)×[γ v (t) − γ w (t)] für alle v, w ∈ V.
Dieser Satz zerlegt die Geschwindigkeit der Kurve γ v zur Zeit t in die Geschwindigkeit γ̇ w (t) des Referenzpunktes w zur Zeit t und die momentane Geschwindigkeit
einer Drehung von γ v (t) um γ w (t) .
1.3.7
*Lageabhängigkeit des Trägheitstensors
Sei K eine endliche Menge von Punkten {v1 , . . . vN } ⊂ V und sei Φ : I ×V → V eine
d’bare Bewegung von V. Man stellt sich die Punkte von K als jene Raumpunkte vor,
die von fiktiven ausdehnungslosen Elementarbausteinen des Körpers (in der Lage
K) eingenommen werden. Dann durchlaufen die Punkte vi ∈ K unter Φ die Kurven
γ i = Φ (·, vi ) : I → V. Eine Abbildung m : K → R>0 sei gegeben. Sie gibt die
Massen der Bausteine des Körpers an.
Ist mi = m (vi ) > 0 die Masse jenes Massenpunktes des starren Körpers, der
die Kurve γ i durchläuft, dann ist die kinetische Energie T (t) des Körpers zur Zeit
t gegeben durch
N
mi
T (t) :=
|γ̇ i (t)|2 .
2
i=1
Sei nun w ∈ V ein beliebiger Punkt, der Element von K sein kann aber nicht
sein muss. Es kann w zB der Schwerpunkt19 des Körpers in der Lage K sein. In
diesem Fall gilt
N
N
1
∗
w = v :=
mi vi mit M =
mi .
M i=1
i=1
19
Dieser ist iA nicht Element von K.
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
47
Im Fall eines beliebigen Referenzpunktes w ∈ V folgt mit der Abkürzung δ i (t) :=
γ i (t) − γ w (t) ∈ V, dass
N
T (t) =
i=1
=
M
|γ̇ w (t)|2 +
2
N
i=1
mi
|γ̇ w (t) + Ω (t) × δ i (t)|2
2
$
mi
|Ω (t) × δ i (t)|2 +
2
%
N
γ̇ w (t) , Ω (t) ×
mi δ i (t) .
i=1
Nach der Spatproduktformel a, b × c = c, a × b = a × b, c gilt für den letzten Summanden
$
% $
%
N
N
γ̇ w (t) , Ω (t) ×
mi δ i (t)
i=1
=
γ̇ w (t) × Ω (t) ,
2
2
mi δ i (t) .
i=1
2
Für den zweiten Summanden gilt wegen |a × b| = |a| |b| − a, b
N
i=1
mi
|Ω (t) × δ i (t)|2 =
2
N
i=1
2
mi
|Ω (t)|2 |δ i (t)|2 − Ω (t) , δ i (t)
2
2
.
Die lineare Abbildung ΘK(t),w : V → V mit
N
ΘK(t),w =
i=1
mi |δ i (t)|2 ιdV − δ i (t) δ i (t) , ·
heißt Trägheitstensor des Körpers in der Lage Φ (t, K) =: K (t) ⊂ V bezüglich des
Referenzpunktes Φ (t, w) = γ w (t) . Es gilt also
$
%
N
'
M
1&
2
|γ̇ (t)| +
Ω (t) , ΘK(t),w Ω (t) + γ̇ w (t) × Ω (t) ,
T (t) =
mi δ i (t) .
2 w
2
i=1
Wegen δ i (t) = A (t) (vi − w) und wegen A (t) ∈ SO3 gilt
ΘK(t),w = A (t) ΘK,w A (t)−1
mit
N
ΘK,w =
i=1
mi |ζ i |2 ιdV − ζ i ζ i , ·
und ζ i := vi − w.
Die lineare Abbildung ΘK,w heißt Trägheitstensor des Körpers in Lage K bezüglich
des Referenzpunktes w. Offenbar gilt ΘK,w = ΘK−w,0 .
Wie hängt ΘK,w mit ΘK,v∗ zusammen, wenn v ∗ der Schwerpunkt des Körpers ist?
∗
Es folgt für beliebiges δ := w − v ∗ ∈ V unter Verwendung von N
i=1 mi (vi − v ) = 0
N
ΘK,v∗ +δ =
i=1
mi |vi − v ∗ − δ|2 ιdV − (vi − v ∗ − δ) vi − v∗ − δ, ·
N
=
i=1
mi |vi − v∗ |2 ιdV − (vi − v ∗ ) vi − v ∗ , ·
+ M |δ|2 ιdV − δ δ, · .
Also gilt eine Formel, die als Steinerscher Satz bezeichnet wird.
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
48
Satz 29 Sei ΘK,v∗ der Trägheitstensor eines Körpers in Lage K bezüglich seines
Schwerpunktes v ∗ . Dann gilt für den Trägheitstensor des Körpers in Lage K bezüglich
eines allgemeinen Referenzpunktes w = v ∗ + δ
ΘK,w = ΘK,v∗ + M |δ|2 ιdV − δ δ, · .
Im Fall w = v ∗ vereinfacht sich die kinetische Energie T (t) zu
T (t) =
'
M
1&
|γ̇ v∗ (t)|2 +
Ω (t) , ΘK(t),v∗ Ω (t) .
2
2
Sie zerfällt also in einen Beitrag der Schwerpunktsgeschwindigkeit und einen der
Winkelgeschwindigkeit.
Die Definition des Trägheitstensors kann auf den Fall einer kontinuierlichen Massendichte verallgemeinert werden. Ist ρ : V → R≥0 eine integrable Funktion, die
außerhalb einer endlichen Kugel nur den Wert 0 annimmt, dann wird definiert:
Θρ,w =
V
ρ (v) |v − w|2 ιdV − (v − w) v − w, · d3 v.
Ein Trägheitstensor ΘK,w ist eine positiv gewichtete Summe von Abbildungen
des Typs |v|2 ιdV − v v, · . Jeder Summand ist symmetrisch bezüglich des Skalarproduktes. Somit gilt auch Θ∗K,w = ΘK,w . Für v = 0 gilt
*
+
v v, ·
2
2
|v| ιdV − v v, · = |v| ιdV −
= |v|2 [ιdV − PR·v ] = |v|2 Pv⊥ .
2
|v|
Für v = 0 ist |v|2 ιdV − v v, · ein positives Vielfaches der Orthogonalprojektion von
V auf das orthogonale Komplement von R · v. Für v = 0 ist |v|2 ιdV − v v, · = 0,
also die Orthogonalprojektion auf 0. Als Summe positiver linearer Abbildungen ist
ΘK,w somit positiv. Die Eigenwerte von ΘK,w werden als Hauptträgheitsmomente
bezeichnet. Sie sind nicht negativ. Eindimensionale Eigenräume von ΘK,w werden
Hauptträgheitsachsen genannt. Weiter gilt folgende Ungleichung für die Eigenwerte
eines Trägheitstensors.
Satz 30 Ist θ ein Eigenwert von ΘK,w , dann gilt Sp (ΘK,w ) − 2θ ≥ 0.
Beweis. Sei e = (e1 , e2 , e3 ) eine ONB von V. Mit vi = 3j=1 vij ej hat die Abbildung Θ = ΘK,w die Matrix M (Θ, e) bezüglich e. Für jedes ihrer Diagonalelemente
gilt wegen vi , ek = vik
N
M
(Θ, e)kk
=
i=1
mi |vi |2 − vik
2
.
Für die Spur von Θ folgt daher
N
3
M
SpΘ =
j=1
(Θ, e)jj
N
2
=2
i=1
mi |vi | ≥ 2
i=1
mi |vi |2 − vik
2
= 2M (Θ, e)kk
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
49
für jedes k ∈ {1, 2, 3} . Ist nun e eine ONB aus Eigenvektoren von Θ, dann ist
M (Θ, e)kk ein Eigenwert θ von Θ.
Sind also θ1 ≥ θ2 ≥ θ3 ≥ 0 die drei Diagonalmatrixelemente der Matrix von Θ
bezüglich einer ONB, dann gilt θ2 + θ3 ≥ θ1 . Daraus folgt θ1 + θ2 + θ3 − 2θ1 ≥ 0
und wegen θ 1 ≥ θ2 ≥ θ3 auch θ1 + θ 2 + θ3 − 2θ 2 ≥ 0 und θ1 + θ2 + θ 3 − 2θ3 ≥ 0. Es
gilt also20
θ1 + θ2 + θ3 − 2θi ≥ 0 für alle i ∈ {1, 2, 3} .
Anmerkung: Falls eine ONB e aus Eigenvektoren von Θ besteht, ist jedes Diagonalmatrixelement θi von Θ zu dieser ONB ein Hauptträgheitsmoment. Beobachtung:
Das größte der Hauptträgheitsmomente stimmt mit der Spektralnorm
Θ = sup {|Θv| : v ∈ V mit |v| ≤ 1}
überein. (Siehe zB V2, § 21, sect 1.3 und 2.1, p 548-550 in [4].) Wegen
#√ #2
√ ∗√
#
#
Sp (Θ) = Sp
Θ Θ = # Θ#
HS
(Hilbert-Schmidt Norm-Quadrat) ist obiger Satz somit äquivalent zur Formel
#√ #2
#
#
# Θ# ≥ 2 Θ .
HS
1.3.8
*Trägheitstensor eines Ellipsoides
Es wird nun der Trägheitstensor eines starr um sein Zentrum rotierenden Ellipsoides homogener Massendichte bestimmt. Als einfacherem Spezialfall wenden wir uns
zunächst der Kugel mit konstanter Massendichte zu.
Die Summenformel (1.19) für den Trägheitstensor überträgt sich auf eine Massenverteilung mit Dichtefunktion ρ : V → R≥0 wie folgt
Θ=
V
ρ (x) |x|2 ιdV − x x, ·
dτ =
3M
4πR3
|x|<R
|x|2 ιdV − x x, ·
dτ .
Hier bezeichnet R > 0 den Radius und M > 0 die Gesamtmasse der Kugel. Das
metrische Volumselement in V zu ·, · ist mit dτ notiert.
Wir zeigen nun, dass
2
Θ = M R2 · ιdV
(1.20)
5
gilt. Gleichung (1.20) ist - man beachte die Polarisierungsformel quadratischer Formen - äquivalent zu v, Θv = (2/5) M R2 · |v|2 für alle v ∈ V. Berechnen wir also
v, Θv für ein beliebiges v ∈ V. Es gilt
v, Θv =
20
3M
4πR3
|x|<R
|x|2 |v|2 − x, v
2
dτ .
Dies erinnert an die CHSH-Ungleichungen. Gibt es tatsächlich einen tieferen mathematischen
Zusammenhang?
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
50
Unter Verwendung von Kugelkoordinaten (r, θ, ϕ) mit r (x) = |x| und x, v =
|x| |v| cos θ (x) folgt mit der Substitution z = cos θ
v, Θv =
3M |v|2
2π
=
4πR3
3M |v|2
4πR3
R
0
−1
π
2π
0
r2 1 − cos2 θ r2 sin θdϕdθdr
0
3M |v|2 R5 1
1 − z 2 (−1) dz =
1 − z 2 dz
3
2R
5
0
1
−1
,
2 2
2 2
3 ,1
z ,
2M R2 2
3M |v| R
3M |v| R 2
=
2 z−
=
=
|v| .
2
5
3 ,0
5
3
5
R
r4 dr
Damit ist Gleichung (1.20) bewiesen.
Ein Ellipsoid in V wird mithilfe einer positiven quadratischen Form q beschrieben. Das Ellipsoid ist dann die Punktmenge {x ∈ V : q (x) ≤ 1} . Zu einer quadratischen Form q : V → R existiert genau eine symmetrische lineare Abbildung
Q : V → V mit q (x) = x, Qx für alle x ∈ V.
Ein Ellipsoid, dessen Halbachsen die Längen R1 , R2 , R3 ∈ R>0 und die Richtungseinheitsvektoren e1 , e2 , e3 besitzen, hat die quadratische Form q mit
3
1
2
xi
Ri
3
q x e1 + x e2 + x e3 =
i=1
2
für alle x1 , x2 , x3 ∈ R3 .
Die zugehörige lineare Abbildung Q ist somit durch
3
Q=
i=1
Ri−2 ei ei , ·
(1.21)
gegeben. Sie ist positiv definit, und erfüllt Qei = Ri−2 ei . Die zu Q inverse Abbildung
erfüllt Q−1 = 3i=1 Ri2 ei ei , · .
Lemma 31 Sei Q wie in Gleichung (1.21). Das Ellipsoid {x ∈ V : x, Qx ≤ 1} hat
dann das (zum Skalarprodukt ·, · gehörige) Volumen VQ = 4πR1 R2 R3 /3.
Beweis. Das Volumen ist definiert durch
VQ =
dx1 dx2 dx3 .
dτ =
q(x)≤1
q(x)≤1
Mit der Substitution xi = Ri ξ i und der Definition ξ =
dξ 1 dξ 2 dξ 3 =
VQ = R1 R2 R3
|ξ|≤1
3
i=1
ξ i ei folgt
4π
R1 R2 R3 .
3
Satz 32 Sei Q wie in Gleichung (1.21). Der Trägheitstensor Θ eines Ellipsoides
{x ∈ V : x, Qx ≤ 1} der Masse M und homogener Massendichte erfüllt
M
Sp Q−1 · ιdV − Q−1
5
M
R22 + R32 e1 e1 , · + R12 + R32 e2 e2 , · + R12 + R22 e3 e3 , · .
=
5
Θ =
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
51
Beweis. Die Massendichte ist gegeben durch ρ = M/VQ im Bereich x, Qx ≤ 1
und ρ = 0 für x, Qx > 1. Die Definition von Θ spezialisiert sich somit auf
Θ=
M
VQ
q(x)≤1
|x|2 ιdV − x x, ·
dτ .
Wir zeigen zunächst, dass ei , Θej = 0 für i = j. Dies ergibt sich aus der Antisymmetrie des Integranden unter der Spiegelung Πi mit Πei = −ei und Πej = ej für
j = i wegen
M
xi xj dx1 dx2 dx3 = 0.
ei , Θej = −
VQ q(x)≤1
Damit ist klar, dass die Vektoren ei in Richtung der Halbachsen des Ellipsoides
Eigenvektoren des Trägheitstensors Θ des Ellipsoides sind.
Wir bestimmen nun die Eigenwerte von Θ, die Hauptträgheitsmomente. Es gilt
ei , Θei =
M
VQ
q(x)≤1
|x|2 − xi
2
dτ =
M
VQ
3
xj
3
i=1
3
ei , Θei =
3
Rj2
=
j=1,j=i
*
M
R1 R2 R3
Rj2
VQ
j=1,j=i
3M
4π
ξ
j 2
1
ξj
ξ i ei folgt
2
dξ 1 dξ 2 dξ 3
|ξ|≤1
2
dξ dξ dξ
|ξ|≤1
dx1 dx2 dx3 .
q(x)≤1 j=1,j=i
Mit der Substitution xi = Ri ξ i und der Definition ξ =
Θii ≡
2
3
+
.
Der Ausdruck in der eckigen Klammer ist unabhängig von den Parametern R1 , R2
und R3 und konstant in j. Daher folgt
*
+ 3
3M
1 2
1
2
3
Θii =
ξ dξ dξ dξ
Rj2 .
4π |ξ|≤1
j=1,j=i
Spezialisierung dieser Formel auf den Fall R1 = R2 = R3 = R ergibt
*
+
3M
1 2
1
2
3
Θii =
ξ dξ dξ dξ 2R2 .
4π |ξ|≤1
In diesem Fall wissen wir aber vom Trägheitstensor der Kugel vom Radius R, dass
Θii = (M/5) 2R2 . Somit folgt, dass der Ausdruck in der eckigen Klammer den Wert
M/5 hat. Damit ist gezeigt, dass für alle R1 , R2 , R3 ∈ R>0
M
Θii =
5
Daraus folgt nun Θ =
M
=
5
3
Rj2 =
j=1,j=i
3
i=1
M
Sp Q−1 − Ri2 .
5
Θii ei ei , · =
3
−1
Sp Q
· ιdV −
i=1
Ri2 ei ei , ·
=
M
Sp Q−1 · ιdV − Q−1 .
5
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
1.3.9
52
*Kraftbedarf von Drehbewegungen
Ein Beispiel für den Nutzen von Drehungen und Winkelgeschwindigkeit liefert das
Studium von Bewegungkurven γ : I → V, deren zeitabhängige Zerlegung nach einer
rotierenden Basis von V einfacher als die Zerlegung nach einer fest gewählten Basis,
ja vielleicht sogar konstant ist. Sei zunächst γ 0 : I → V mit dim V = 3 eine zwei mal
differenzierbare Kurve. Soll ein (kleiner) Gegenstand der Masse m seinen Ort gemäß
der Kurve γ 0 im Laufe der Zeit verändernen, dann ist auf diesen Gegenstand zur Zeit
t die Kraft mγ̈ 0 (t) auszuüben.21 Nun kann die Hilfskurve γ 0 unserer Konstruktion in
eine gleichförmige Drehbewegung mit der Winkelgeschwindigkeit Ω = ωn versetzt
werden, dh die aus zwei Abbildungen zusammengestzte Kurve γ : I → V mit
γ (t) = eωtLn γ 0 (t) wird gebildet.
Welche Kraft muss auf einen Massenpunkt einwirken, damit er der modifizierten
Kurve γ folgt? Solche Fragen tauchen auf, wenn man einen Gegenstand auf einer
fest mit einer rotierenden Scheibe verbundenen geraden Schiene von der Peripherie
ins Zentrum bewegen will. Welche Kraft muss die Schiene ausüben können und mit
welcher Kraft ist zu schieben? Eine ganz ähnliche Frage ist die: Bewegt man sich
auf einem Erdmeridian nach Norden und überstreicht in gleichen Zeiten gleichlange
Meridianstücke benötigt man welche Kraft? Würde die Erde nicht rotieren, bräuchte
man keine Kraft aufzuwenden.
Durch Ableiten von γ (t) = eωtLn γ 0 (t) folgt γ̇ (t) = ωLn γ (t) + eωtLn γ̇ 0 (t) und
γ̈ (t) = ωLn γ̇ (t) + ωLn eωtLn γ̇ 0 (t) + eωtLn γ̈ 0 (t)
= ωLn ωLn γ (t) + 2eωtLn γ̇ 0 (t) + eωtLn γ̈ 0 (t)
= ω 2 L2n γ (t) + 2ωLn eωtLn γ̇ 0 (t) + eωtLn γ̈ 0 (t)
= eωtLn −ω 2 Pn′ γ 0 (t) + 2ω (n × γ̇ 0 (t)) + γ̈ 0 (t) .
Die zum ersten Summanden gehörige Kraft −mω 2 Pn′ γ (t) heißt Zentripetalkraft.
Sie ist der Komponente Pn′ γ (t) des momentanen Ortsvektors γ (t) , die senkrecht
zur Drehachse steht, entgegengerichtet und ihr Betrag ist proportional ω 2 . Die zum
zweiten Summanden gehörige Kraft 2mΩ × eωtLn γ̇ 0 (t) ist unabhängig vom Ort aber
linear in Geschwindigkeit γ̇ (t) und Winkelgeschwindigkeit Ω. Beide Kräfte sind zur
Zeit t zusätzlich zur gedrehten Kraft eωtLn γ̈ 0 (t) der Trajektorie γ 0 aufzubringen, um
das Teilchen zu einer Bewegung gemäß γ zu zwingen.
Das einfachste Beispiel bietet die kräftefreie Kurve γ 0 : R → V mit γ 0 (t) = x
für ein festes x ∈ V und für alle t ∈ R. Dann folgt für γ : R → V mit γ (t) = eωtLn x
im Fall von x ∈ n⊥
mγ̈ (t) = −mω 2 γ (t) .
21
V ist also eine mathematische Präzisierung von Newtons absolutem, ruhendem Raum, der für
eine begrifflich möglichst reduzierte Formulierung der Mechanik eigentlich entbehrlich ist. Er wird
aber als metaphysische Krücke eines ausgezeichneten inertialen ’Weltenruhsystems’, immer noch
in elementaren Erläuterungen (meist unausgesprochen) genutzt, weil er eine einfachere Formulierung der mechanischen Grundgesetze erlaubt. Die moderne Mechanik ist auf einer Raumzeit mit
Zeitform, Riemannscher Metrik auf den instantanen Räumen und Affinzusammenhang, aber ohne
ausgezeichnetem Inertialsystem errichtet.
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
53
Um ein Teilchen der Masse m auf einer Kreisbahn vom Radius |x| mit konstanter Winkelgeschwindigkeit ω umlaufen zu lassen, ist also eine Kraft vom (zeitlich
konstanten) Betrag |mω 2 γ (t)| = mω 2 |x| auf das Teilchen auszuüben.
Etwas interessanter ist die kräftefreie Kurve γ 0 : R → V mit γ 0 (t) = tv für ein
festes v ∈ V und für alle t ∈ R. Dann folgt für γ : R → V mit γ (t) = teωtLn v im
Fall von v ∈ n⊥
mγ̈ (t) = m −ω 2 t + 2ωLn eωtLn v.
1.3.10
*Coriolis- und Zentrifugalkraft
Manchmal bietet es sich an, eine Kurve γ 0 , die den Zeitablauf einer Bewegung in V
beschreibt, nach einer rotierenden Basis von V zu zerlegen. Dann gibt die zeitliche
Änderung der Koordinaten von γ 0 (t) bezüglich der zeitabhängigen Basis ein trügerisches Bild der tatsächlich vorliegenden Kräfte, die γ 0 erzeugen. Werden nämlich
beim Ableiten von γ 0 nur die Koordinaten nicht aber die Basisvektoren differenziert, dann erscheint sogar eine konstante Kurve γ 0 als relativ zur rotierenden Basis
beschleunigt. Die so identifizierten ’Kräfte’ werden als Scheinkräfte bezeichnet.
Um das etwas detaillierter darzulegen, zerlegen wir eine C 2 -Kurve γ 0 : I → V
nach einer (hier der Einfachheit halber) gleichförmig rotierende Basis von V. Sei
also e = (e1 , e2 , e3 ) eine Basis von V und R (t) = eωtLn . Dann ist auch f (t) =
(R (t) e1 , R (t) e2 , R (t) e3 ) eine Basis von V. Die Koordinaten von γ 0 (t) zur gedrehten
Basis f (t) sind dieselben wie jene von
γ (t) := R (t)−1 γ 0 (t) = e−ωtLn γ 0 (t)
zur konstanten Basis e. Die Geschwindigkeit dieser Hilfskurve γ zur Zeit t, also
γ̇ (t) = −ωn × γ (t) + e−ωtLn γ̇ 0 (t)
wird als Geschwindigkeit von γ 0 zur Zeit t relativ zur rotierenden Basis f (t) aufgefasst. Die Beschleunigung γ̈ (t) der Krurve γ : I → V mit t → γ (t) zur Zeit t wird
demgemäß als ’Beschleunigung’ und mγ̈ (t) als ’Scheinkraft’ von γ 0 zur Zeit t relativ
zur rotierenden Basis f (t) zum Zeitpunkt t gedeutet.
Berechnung der Realtivbeschleunigung γ̈ (t) : Es gilt wie im vorigen Abschnitt
nach Ersetzung von n durch −n
γ̈ (t) = −ω 2 Pn′ γ (t) − 2ωLn e−ωtLn γ̇ 0 (t) + e−ωtLn γ̈ 0 (t) .
Ersetzen von e−ωtLn γ̇ 0 (t) durch γ̇ (t) + ωLn γ (t) ergibt
γ̈ (t) = −ω 2 Pn′ γ (t) − 2ωLn (γ̇ (t) + ωLn γ (t)) + e−ωtLn γ̈ 0 (t)
= ω 2 Pn′ γ (t) − 2ωLn γ̇ (t) + e−ωtLn γ̈ 0 (t) .
Erfüllt γ 0 die Newtonsche Bewegungsgleichung γ̈ 0 (t) = f (|γ 0 (t)|) · γ 0 (t) eines
Zentralkraftproblems für eine stetige Funktion f : R≥0 → R, dann folgt mit |γ 0 (t)| =
|γ (t)| die Bewegungsgleichung
γ̈ (t) = f (|γ (t)|) + ω 2 Pn · γ (t) − 2ω (n × γ̇ (t))
(1.22)
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
54
für die Kurve γ. Die radial von der Drehachse weg gerichtete Scheinkraft der Stärke
mω 2 Pn γ (t) heißt Zentrifugalkraft. Sie ist verantwortlich dafür, dass eine am Erdboden befestigte Waage nicht das tatsächliche Gewicht des Wägegutes anzeigt. Die
Scheinkraft −2mωn × γ̇ (t) wird als Corioliskraft bezeichnet. Sie bewirkt, dass eine
auf der Nordhalbkugel nach Norden strömende Luftmasse dem Erdboden bei seiner nach Osten gerichteten Drehbewegung etwas vorauseilt, bei naiver Betrachtung
somit als ostwärts beschleunigt erscheint.22
Ein Stein fällt vom Himmel23
Als Illustration eignet sich ein Stein, der aus h = 5 km Höhe über dem Äquator
(reibungsfrei) zum Boden fällt. Am Beginn des Falls zur Zeit t = 0 ruhe der Stein
relativ zur Erde. In welchem Abstand vom Fußpunkt unter dem Startpunkt des
Steins schlägt dieser nach welcher Zeit auf?
Der Erdmittelpunkt ruhe im Punkt 0 von V. Die Funktion f ist dann annähernd
gegeben durch f (r) = −g/r, wobei g = 9, 81 m s−2 die Erdbeschleunigungskonstante
ist. Die Kreisfrequenz der Erde hat den Wert ω = 2π/ (24 · 3600) = 7, 27 · 10−5 s−1 .
Die Basis e sei eine ONB und so gewählt, dass die Kurve γ 0 die Vorgaben γ 0 (0) =
(R + h) · e1 , und γ̇ 0 (0) = ω (R + h) · e2 erfüllt. Dabei ist R = 6378 km der Erdradius. Der Vektor R · e1 ist der Fußpunkt unter dem Stein am Beginn des Falls.
Der Einheitsvektor n in Richtung der Erdachse zu rechtshändigem Drehsinn erfüllt
n = e1 × e2 = e3 .
Rotiert die Basis f (t) mit der Erde und erfüllt f (0) = e, dann gilt für die
Hilfskurve γ, dass γ (0) = γ 0 (0) = (R + h) e1 und γ̇ (0) = −ωn × γ (0) + γ̇ 0 (t) =
−ω (R + h) e3 × e1 + ω (R + h) · e2 = 0, sowie
γ̈ (t) = −g |γ (t)|−1 + ω 2 Pn · γ (t) − 2ω (n × γ̇ (t)) .
(1.23)
Die Drehsymmetrie der Differentialgleichung um die Achse R · e3 legt zusammen
mit den in der Ebene R · e1 + R · e2 liegenden Anfangswerten den Lösungsansatz
γ (t) = (R + x (t)) · e1 + y (t) · e2 = R · e1 + ξ (t) nahe. Einsetzen in Gleichung (1.23)
ergibt
ξ̈ (t) = ω 2 − g |R · e1 + ξ (t)|−1 (R · e1 + ξ (t)) − 2ωn × ξ̇ (t)
mit der Anfangsvorgabe ξ (0) = he1 und ξ̇ (0) = γ̇ (0) = 0.
Ohne Fehlerabschätzung wird nun - nicht ganz unplausibel - approximiert:
ω 2 − g/ |R · e1 + ξ (t)| (R · e1 + ξ (t)) ≈ −g · e1 .
Dies führt auf das inhomogen lineare System 2. Ordnung
ξ̈ (t) = −g · e1 − 2ωn × ξ̇ (t) .
22
(1.24)
Ein weiteres Beispiel liefert ein rotierender Kran, dessen Last längs des Kranarmes verschoben
wird. Bei einer Bewegung nach innen eilt die Last der Drehbewegung des Kranarms voraus, bei
einer Verschiebung nach außen hingegen hinkt sie hingegen der Drehung nach.
23
Aufgabe 1 zu § 39 in L D Landau, E M Lifschitz, Mechanik, Vieweg, Braunschweig, 1970
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
55
Die komponentenweise Form von Gleichung (1.24) für ξ (t) = x (t) · e1 + y (t) · e2 ist
(ẍ (t) , ÿ (t)) = (−g, 0) + 2ω (ẏ (t) , −ẋ (t)) .
Man beachte, dass ω 2 = 5, 3 · 10−9 s−2 ≪ g/R = 1, 5 · 10−6 s−2 gilt, und überprüft
später an der Lösung die Vermutung, dass x2 (t) + y 2 (t) ≪ R2 zu allen Zeiten t > 0
bis zum Aufschlag erfüllt ist. Die Anfangsvorgabe ist x (0) = h, y (0) = 0, ẋ (0) =
0, ẏ (0) = 0.
Im Abschnitt über die E × B-Drift wird das inhomogen lineare System
v̇ (t) = −g · e1 − 2ωn × v (t) ,
(1.25)
das sich aus (1.24) mit v = ξ̇ ergibt, exakt gelöst. Vorläufig wird das Problem durch
eine nochmalige plausible Approximation vereinfacht, nämlich zu
(ẍ (t) , ÿ (t)) = − (g, 2ω ẋ (t)) .
(1.26)
Die Lösung von Gleichung (1.26) mit x (0) = h, ẋ (0) = 0, y (0) = 0, ẏ (0) = 0
erfüllt x (t) , y (t) = h − gt2 /2, ωgt3 /3 für alle t > 0. Der Stein erreicht
den Erdboden genau zu jener Zeit t > 0, wenn (R + x (t))2 + y (t)2 = R2 gilt.
Annähernd ist dies die Zeit T, zu der x (T ) = 0 gilt. Es folgt T = 2h/g = 32 s
und y (T ) = ωgT 3 /3 = (2hω/3) 2h/g = 7, 7 m. Der Stein schlägt also in dieser
unkontrollierten Approximation 7, 7 m östlich des Abwurffußpunkts nach 32 s auf.
1.3.11
Inhomogen lineare Systeme
Nun zum Fall der inhomogen linearen Systeme. Ähnlich wie im eindimensionalen
Fall genügt für die Lösung eines inhomogen linearen Systems die Kenntnis von LA,0
und einer einzigen („partikulären”) Lösung des inhomogenen Systems γ̇ = Aγ + b.
Genaueres sagt der folgende Satz.
Satz 33 Sei γ̇(t) = A(t)γ(t) + b(t) ein inhomogen lineares System auf einem Intervall I und einem n-dimensionalen K-VR V. Sei LA,b die Menge aller maximalen
Lösungen dieses Sytems und sei γ b : I → V ein beliebiges Element von LA,b . Dann
gilt LA,b = LA,0 + γ b .
Eine weitergehende Lösungsformel für das Anfangswertproblem gibt die folgende
Variation der Konstantenformel.
Satz 34 Sei γ̇(t) = A(t)γ(t) + b(t) ein inhomogen lineares System auf einem Intervall I und einem n-dimensionalen K-VR V . Die Evolutionsabbildung des homogenen
Systems γ̇(t) = A(t)γ(t) zur Anfangszeit t0 ∈ I sei t → Ut,t0 für t ∈ I. Dann gilt für
die maximale Lösung γ t0 ,v des inhomogen linearen Systems zum Anfangswert (t0 , v)
für jedes t ∈ I
t
γ t0 ,v (t) = Ut,t0 v +
t0
−1
Uξ,t
b (ξ) dξ .
0
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
56
Beweis. Es genügt zu zeigen, dass die Kurve γ : I → V mit
t
γ (t) = Ut,t0 v +
t0
−1
Uξ,t
b (ξ) dξ
0
die 1) Differentialgleichung γ̇(t) = A(t)γ(t) + b(t) für alle t ∈ I und 2) die Anfangsbedingung γ (t0 ) = v erfüllt. Aufgrund des Eindeutigkeitssatzes folgt dann γ = γ t0 ,v .
Sei γ 0 : I → V mit γ 0 (t) = Ut,t0 v. Dann gilt nach Konstruktion von Ut,t0 ,
dass γ̇ 0 (t) = A (t) γ 0 (t) und γ 0 (t0 ) = v. Es genügt also zu zeigen, dass die Kurve
γ p : I → V mit
t
γ p (t) = γ (t) − γ 0 (t) = Ut,t0
−1
Uξ,t
b (ξ) dξ
0
t0
die inhomogene Gleichung γ̇ p (t) = A(t)γ p (t) + b(t) für alle t ∈ I erfüllt und zudem
γ p (t0 ) = 0.
Ersteres folgt mit Produktregel und Hauptsatz der Integralrechnung so:
t
γ̇ p (t) = (∂t Ut,t0 )
t0
t
−1
Uξ,t
b (ξ) dξ
0
+ Ut,t0 ∂t
t0
−1
Uξ,t
b (ξ) dξ
0
t
= (A (t) Ut,t0 )
t0
−1
−1
Uξ,t
b (ξ) dξ + Ut,t0 Ut,t
b (t) = A (t) γ p (t) + b (t) .
0
0
Die Anfangsbedingung γ p (t0 ) = 0 ergibt sich wegen
t0
γ p (t0 ) = Ut0 ,t0
t0
−1
Uξ,t
b (ξ) dξ = ιd (0) = 0.
0
−1
Bemerkung 35 Es gilt Ut,t0 Uξ,t
= Ut,ξ und daher auch
0
t
γ t0 ,v (t) = Ut,t0 v +
Ut,ξ b (ξ) dξ.
t0
Die partikuläre Lösung γ t0 ,0 mit dem Anfangswert (t0 , 0), für die ja
t
γ t0 ,0 (t) =
Ut,ξ b (ξ) dξ
t0
für alle t ∈ I gilt, erhält eine besonders anschauliche Bedeutung, wenn das Integral durch eine Riemannsumme approximiert wird. Die Inhomogenität b(ξ i ) an den
Stützstellen t0 < ξ i < t tritt als Anfangswert (ξ i , b(ξ i )) der Lösung Ut,ξi b (ξ i ) der
homogenen Gleichung in Erscheinung. Über diese homogenen Lösungen wird dann
aufsummiert. Wie im eindimensionalen Fall hängt γ t0 ,0 linear von b ab.
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
1.3.12
57
*E × B - Drift einer Punktladung
Sei V ein reeller Vektorraum der Dimension 3. In V sind ein Skalarprodukt ·, · und
eine Orientierung gewählt. Damit ist auch das Kreuzprodukt zweier Vektoren von
V erklärt. Die Kurve γ : I → V (’Bewegungsgeschichte’) eines elektrisch geladenen
Massenpunktes in einem (räumlich und zeitlich) konstanten elektromagnetischen
Feld ist durch die Lorentzsche Bewegungsgleichung
mγ̈ (t) = q (E + γ̇ (t) × B) .
(1.27)
geregelt. In ihr bezeichnet m ∈ R>0 die Masse und q ∈ R die elektrische Ladung des
Teilchens. Die Vektoren E ∈ V und B ∈ V bezeichnen die (konstante) elektrische
Feldstärke und die (konstante) magnetische Flussdichte, denen das Teilchen ausgesetzt ist. Gesucht ist die maximale Lösung von Gleichung (1.27) zur Anfangsvorgabe
γ (0) = x0 und γ̇ (0) = v0 .
Zerlegt man für B = 0 die Kurve γ in eine Komponente γ ⊥ im Unterraum B ⊥ =
{v ∈ V : B, v = 0} und eine Komponente γ in R · B, dann gilt unter Verwendung
des Einheitsvektors n = B/ |B|
γ = γ ⊥ + γ mit γ = n n, γ und γ ⊥ = γ − n n, γ .
Die Bewegungsgleichung (1.27) entkoppelt die beiden Komponenten voneinander,
denn es gilt wegen n × B = 0
mγ̈ ⊥ (t) = q γ̇ ⊥ (t) × B + E ⊥ und mγ̈ (t) = qE .
Dabei gilt E = E ⊥ + E mit E = n n, E und E ⊥ = E − n n, E .
Die maximale Lösung γ : R → R·B der Gleichung mγ̈ (t) = qE mit γ (0) = x0
und γ̇ (0) = v0 erfüllt
q 2
γ (t) = x0 + v0 t +
tE .
2m
Die Anfangswerte x0 und v0 werden dabei natürlich einer analogen Zerlegung wie γ
unterworfen.
Für die Komponente γ ⊥ gilt mit24 ω = q |B| /m ∈ R
γ̈ ⊥ (t) = −ωn × γ̇ ⊥ (t) +
q ⊥
E .
m
(1.28)
Die Kurve v = γ̇ ⊥ : R → B ⊥ ⊂ V erfüllt also mit Ln : B ⊥ → B⊥ , v → n × v und
E = mq E ⊥ ∈ B ⊥ das inhomogen lineare System erster Ordnung
v̇ (t) = −ωLn v (t) + E.
(1.29)
Für die Evolutionsabbildung Ut = exp (−ωtLn) der homogenen Gleichung gilt
wegen25 L2n = −PB⊥ = − (ιdV − n n, · )
e−ωtLn = n n, · + cos (ωt) (ιdV − n n, · ) − sin (ωt) Ln .
24
25
Die Zahl |ω| = |qB| /m heißt ’Zyklotronkreisfrequenz’.
PB⊥ bezeichnet die Orthogonalprojektion auf den Untervektorraum B⊥ .
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
58
Mit v0⊥ ∈ B⊥ folgt daraus
Ut v0⊥ = cos (ωt) v0⊥ − sin (ωt) Ln v0⊥ .
Sie beschreibt eine Drehbewegung des Vektors v0⊥ um 0 in der Ebene B⊥ mit konstanter Winkelgeschwindigkeit ω. Der Drehsinn ist so, dass zur Zeit t = 0 der Vektor
v0⊥ in die Richtung −Ln v0 = −n × v0⊥ bewegt.
Eine partikuläre Lösung der inhomogenen Gleichung (1.29) ergibt sich mit dem
Ansatz v (t) = w ∈ B⊥ für alle t ∈ R. Dieser Ansatz ist genau dann Lösung, wenn
ωLn w = E gilt. Anwendung von Ln auf diese Gleichung liefert ωL2n w = Ln E, also
w=−
n×E
q
Ln E
q
E⊥ × B
=−
=−
n × E⊥ =
E⊥ × B =
.
ω
ω
mω
mω |B|
|B|2
Die Geschwindigkeit
vD := −
Ln E
E⊥ × B
E×B
⊥
=
=
2
2 ∈ B
ω
|B|
|B|
wird im folgenden wiederholt vorkommen und erhält deshalb eine eigene Bezeichnung, nämlich ’Driftgeschwindigkeit’ vD . Sie ist jene Geschwindigkeit in B⊥ , die von
den vorgegebenen Feldern E und B nicht verändert wird. Die Komponente der Lorentzkraft im Unterraum B⊥ verschwindet. Warum sie Driftgeschwindigkeit genannt
wird, wird gleich klar werden.
Die maximale Lösung v von Gleichung (1.29) mit Anfangswert v0⊥ ∈ B⊥ ergibt
sich durch Addition einer Lösung der homogenen Gleichung zu
v (t) = vD + Ut v0⊥ − vD .
Die Geschwindigkeit v rotiert also auf einem Kreis in B⊥ um den Mittelpunkt vD
mit konstanter Winkelgeschwindigkeit |ω| = |qB| /m. Der Radius des, Kreises ist
, der
Betrag der Abweichung der Anfangsgeschwindigkeit v0⊥ von vD , also ,v0⊥ − vD , . Der
Drehsinn ist so, dass sich zur Zeit 0 der Vektor v0⊥ − vD in die Richtung des Vektors
−ωLn v0⊥ − vD = mq v0⊥ − vD × B dreht.
⊥
Für die maximale Lösung γ ⊥ von Gleichung (1.28) mit γ ⊥ (0) = x⊥
0 und γ̇ (0) =
v0⊥ folgt also für alle t ∈ R
t
γ ⊥ (t) − x⊥
0 =
t
0
t
Us v0⊥ − vD + vD ds =
v (s) ds =
0
d
Unter Beachtung von ds
Us v0⊥ − vD
⊥
v0 − vD und [Us , Ln ] = 0 folgt nun
t
0
0
= −ωLn Us v0⊥ − vD , −L2n v0⊥ − vD
t
Us v0⊥ − vD ds = −
t
= Ln
0
0
Us v0⊥ − vD ds + tvD
=
t
Us L2n v0⊥ − vD ds = −Ln
0
Ln Us v0⊥ − vD ds
1 d
Ln ⊥
Ln
Us v0⊥ − vD ds =
(Ut − ιd) v0⊥ − vD = (Ut − ιd)
v − vD .
ω ds
ω
ω 0
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
59
Somit gilt wegen Ln vD = −L2n E/ω = E/ω = qE ⊥ / (mω) = E ⊥ / |B|
Ln ⊥
n × v0⊥
E⊥
v0 − vD =
−
.
ω
ω
ω |B|
Mit der Abkürzung ξ = E ⊥ / (ω |B|) = mE ⊥ / q |B|2 gilt daher für alle t ∈ R
γ ⊥ (t) = (Ut − ιd) n ×
v0⊥
−ξ
ω
+ tvD + x⊥
0.
(1.30)
Die Lösungsformel (1.30) überlagert eine gleichförmige Drehbewegung des Vektors n × v0⊥ /ω − ξ mit einer gleichförmige Translationsbewegung auf der Geraden
R · E × B. Die Kurve t → (Ut − ιd) w dreht den Vektor w um den Punkt −w. Sie
durchläuft einen Kreis mit dem Radius |w| und geht zur Zeit t = 0 durch 0. Die Kurve t → tvD beschreibt eine unbeschränkte, gleichförmige Bewegung auf der Geraden
R · E × B. Daher der Name E × B-Drift für die Bewegung eines geladenen Teilchens
in einem statischen und homogenen elektromagnetischen Feld mit E × B = 0. Die
Driftgeschwindigkeit vD ist unabhängig von Betrag und Vorzeichen der Ladung q!
Spezialisierung auf den Fall n = B/ |B| = e3 , v0 /ω = λe1 und ξ = E ⊥ / (ω |B|) =
µe2 für eine positiv orientierte ONB e = (e1 , e2 , e3 ) von V ergibt γ ⊥ (t) − x⊥
0 =
(1 − cos (ωt)) (µe2 − e3 × λe1 ) + sin (ωt) e3 × (µe2 − e3 × λe1 ) + ωt (µe2 × e3 )
= (1 − cos (ωt)) (µ − λ) e2 + sin (ωt) (µ + λ) e1 + ωtµe1
= (µ − λ) (1 − cos (ωt)) e2 + ((µ + λ) sin (ωt) + µωt) e1 ,
also etwas übersichtlicher
γ ⊥ (t) − x⊥
0 = (e1 , e2 ) ·
(µ + λ) sin (ωt) + µωt
(µ − λ) (1 − cos (ωt))
.
Figur 1.19 zeigt einen Ausschnitt der Bahn von γ ⊥ − x⊥
0 für λ = 1 und µ = 1/8
in rot, für λ = −1 und µ = 1/8 in grün, und für λ = 1 und µ = 0 in schwarz.Für
y
2
1
0
-1
0
1
2
3
x
-1
-2
Abbildung 1.19: γ ⊥ (0 < s < 6π) − x⊥
0 für einige Parameterkombinationen
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
60
E ⊥ = 0 spezialisiert sich γ ⊥ wegen vD = 0 = ξ zu
γ ⊥ (t) = (Ut − ιd) n ×
v0⊥
ω
+ x0 .
⊥
⊥
⊥
Die Kurve, γ ⊥ umkreist
,
, also
, für E = 0 den Punkt x0 −n×v0 /ω (in der Ebene B ) im
⊥
⊥
Abstand ,v0 /ω , = m ,v0 , / |qB| mit konstanter (orientierter) Winkelgeschwindigkeit
ω = q |B| /m. Diese Komponente der Kurve γ ist somit periodisch.
1.3.13
Getriebene lineare Schwingungen: ungedämpft
Der harmonische Oszillator mit äußerer Kraft ist wie die E × B -Drift ein Fall
für die Variation der Konstanten. Wir behandeln ihn nun aber nicht als reell 2d
inhomogen lineares System sondern als komplex 1-dimensionales. So wird’s noch
einfacher. Zudem betrachen wir hier nur den reibungslosen Grenzfall.
Sei ω ∈ R>0 , sei I ⊂ R ein Intervall und sei b : I → R stetig. Für x : I → R gelte
x′′ + ω 2 x = b und x (t0 ) = x0 und x′ (t0 ) = v0 für ein t0 ∈ I. Dazu äquivalent ist die
Kurve γ : I → C mit γ = x + ix′ /ω die maximale Lösung des komplex 1d Systems
γ ′ = −iωγ + ib/ω auf I
mit γ (t0 ) = x0 + iv0 /ω =: γ 0 . Es gilt ja
γ ′ = x′ +
i ′′
i
i
i
x = x′ +
b − ω 2 x = −iω x + x′ + b.
ω
ω
ω
ω
Eine Lösung des homogenen Systems ist die Funktion t → exp (−iωt) auf I. Für
die Lösung γ : I → C des inhomogenen Systems mit γ (t0 ) = γ 0 gilt für alle t ∈ I
i t iω(ξ−t0 )
γ (t) = e
γ0 +
e
b (ξ) dξ
ω t0
ie−iωt t iωξ
= e−iω(t−t0 ) γ 0 +
e b (ξ) dξ.
ω
t0
−iω(t−t0 )
Daraus folgt durch Bildung des Realteils der folgende Satz.
Satz 36 Sei I ein Intervall I ⊂ R und sei b : I → R stetig. Dann gilt für die
maximale Lösung x von x′′ + ω 2 x = b zur Anfangsbedingung x(t0 ) = x0 und x′ (t0 ) =
v0 für ein t0 ∈ I für alle t ∈ I
x (t) = x0 cos (ω (t − t0 )) +
v0
1
sin (ω (t − t0 )) +
ω
ω
t
t0
sin (ω (t − ξ)) b (ξ) dξ. (1.31)
Beweis. Hier ein Beweis ohne Verwendung komplexer Zahlen. Für h : I → R
mit
v0
h(t) = x0 cos (ω (t − t0 )) + sin (ω (t − t0 ))
ω
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
61
gilt offensichtlich h′′ + ω 2 h = 0. Also bleibt für die Funktion xb : I → R mit
1
xb (t) :=
ω
t
t0
sin(ω (t − ξ))b(ξ)dξ
zu zeigen, dass x′′b + ω 2 xb = b. Wegen sin(α − β) = sin (α) cos (β) − cos (α) sin (β)
gilt
sin (ωt) t
cos (ωt) t
xb (t) =
cos (ωξ) b(ξ)dξ −
sin (ωξ) b(ξ)dξ.
ω
ω
t0
t0
Dies wird mit der Produktregel und dem Hauptsatz der Integralrechnung zweimal
differenziert. Es folgt x′′b + ω 2 xb = b. Analog sind die Anfangsbedingungen zu zeigen.
Mit Gleichung (1.31) ist die Berechnung der Bewegung eines harmonischen Oszillators, der von einer beliebigen, stetig zeitabhängigen äußeren Kraft angetrieben
wird, bei gegebener Anfangbedingung auf die Integration von sin(ω (t − ξ))b(ξ) über
ξ zurückgeführt.
Zur Illustration sei I = R, t0 = 0 und b (t) = b0 ωt für ein b0 ∈ R. Dann folgt
1
ω
t
0
t
sin (ω (t − ξ)) b (ξ) dξ = b0
Für alle t ∈ R gilt somit
ξ sin (ω (t − ξ)) dξ
*
+
t
cos (ω (t − ξ))
d sin (ω (t − ξ))
+ξ
dξ
= b0
ω2
ω
0 dξ
*
+
b0
sin (ωt)
b0
t−
= 2 [ωt − sin (ωt)] .
=
ω
ω
ω
x (t) = x0 cos (ωt) +
0
v0
b0
− 2
ω
ω
sin (ωt) +
b0
ωt.
ω2
Nun noch ein paar Anmerkungen zu verschiedenen graphischen Veranschaulichungen von Lösungen eines Systems erster Ordnung. Abbildung (1.20) zeigt zwei
Lösungen x für ω = 1 = b0 . Sie stellen die „Wann-wo-Protokolle” der Schwingungen
eines Oszillators um die Gleichgewichtslösung ξ(t) = t der Schwingungsgleichung
x′′ + x = t dar. Die „Wann-wie-schnell” Information ist dem Graphen von x nur
indirekt über seinen Anstieg im Punkt über t zu entnehmen. Die Graphen verschiedener Lösungen x können einander schneiden, obwohl sich die Graphen der Lösungen
γ selbst aufgrund des Eindeutigkeitssatzes nicht schneiden können.
Abbildung (1.21) zeigt die Bahn einer Lösung γ in der komplexen Ebene. Sie
wird von links nach rechts durchlaufen. Die Bahn der Lösung gibt ein „Wo-wieschnell Protokoll”. Beim Durchlaufen der etwas überraschenden Spitzen26 bei y = 0
gilt γ̇ = 0. Dem Bild ist jedoch nicht zu entnehmen, wann die Lösung γ einen
bestimmten Punkt des Graphen durchläuft.
Abbildung (1.22) zeigt eine Bahn, die kein Funktionsgraph ist. (Es ist natürlich
auch gar nicht zu erwarten, dass eine Projektion eines Funktionsgraphen wieder ein
Funktionsgraph ist.)
26
Obwohl γ differenzierbar ist, kann die Bahn von γ einen derart „nichtdifferenzierbaren” Eindruck machen. Das geht, da in den Spitzen die Geschwindigkeit gleich Null ist.
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
x
62
15
10
5
0
-15
-10
-5
0
5
10
15
-5
t
-10
-15
Abbildung 1.20: x für x0 = 0, v0 = 0 (schwarz) und für x0 = 3, v0 = 1 (rot)
y
2
1.5
1
0.5
0
-10
-5
0
5
10
x
Abbildung 1.21: Die Bahn von γ zu x0 = v0 = 0
Die gesamte Information über eine Lösung γ schließlich ist im Graphen von γ
enthalten. Abbildung (1.23) zeigt den Graphen einer Lösung γ (mit vertikaler tAchse). Liegt ein Punkt (x, y, t) am Graphen, dann hat der Oszillator zur Zeit t
den Ort x und die Geschwindigkeit y. Die Graphen verschiedener Lösungen können
einander aufgrund des Eindeutigkeitssatzes (für inhomogen lineare Systeme) nicht
schneiden.
1.3.14
*Der mechanische Fourieranalysator 1
Sei b : R → R stetig mit b(t) = 0 für alle t ∈
/ [0, T ] für ein genügend großes T > 0.
Sei x die maximale Lösung von x′′ + ω 2 x = b mit x(t0 ) = x′ (t0 ) = 0 für ein t0 ≤ 0.
Für alle t ∈ R gilt somit
γ (t) := x (t) +
i ′
i
x (t) = e−iωt
ω
ω
t
eiωξ b (ξ) dξ.
0
T
Für t ≤ 0 folgt daraus γ(t) = 0 und für t > T folgt γ (t) = ωi e−iωt 0 eiωξ b (ξ) dξ.
Nach Einwirkung der Kraft schwingt der Oszillator mit der Kreisfrequenz ω und der
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
y
63
3
2
1
0
-10
-5
0
5
10
x
-1
Abbildung 1.22: Die Bahn von γ zu x0 = 0, y0 = −1
Abbildung 1.23: Der Graph von γ für x0 = 0, y0 = −2.
,
,
, 1 T iωt
,
T
Amplitude A = , ω 0 e b (t) dt, . Für A > 0 ist durch ω1 0 eiωt b (t) dt = Aeiδ eine
Phase δ ∈ [0, 2π) eindeutig festgelegt. Es gilt dann x (t) = A sin (ωt − δ) .27
Die Geschwindigkeit x′ schwingt für t > T mit der Amplitude ωA. Die Energie
E dieser Schwingung ist zeitlich konstant. Zu den Zeiten mit Auslenkung 0 besteht
sie nur aus dem kinetischen Teil. x′ hat zu diesen Zeiten den Betrag ωA. Es gilt
daher
,
,2
,
,2
,
,
(ωA)2
m ,, T iωt
1 ,, T iωt
,
E=m
= ,
e b (t) dt, =
e f (t) dt,, ,
,
2
2
2m
0
0
27
In einem Fourieranalysator wirkt die Inhomogenität b auf n Oszillatoren der Eigenfrequenzen
ω 1 , . . . ωn ein und versetzt diese in Schwingung. Aus den Amplituden und Phasen von γ 1 , . . . γ n
im Bereich t > T ergeben sich die n komplexen Zahlen
T
eiωk t b (t) dt.
bk =
0
Im Kapitel über Fourierreihen werden wir lernen, wie die Funktion b aus den b1 , . . . bn (annähernd)
berechnet werden kann, wenn die Frequenzen ω1 , . . . ω n geschickt gewählt sind. So ist es möglich,
eine rasch veränderliche Größe b durch Ankopplung an hochfrequente Resonatoren zu vermessen.
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
64
wobei f = mb die auf den Oszillator der Masse m einwirkende Kraftfunktion ist.
1.3.15
Die retardierte Lösung von ẍ + ω 2x = b
Die Lösungsformel aus Satz 36 setzt sich aus zwei Anteilen zusammen. Einerseits
aus der Lösung
h (t) = x0 cos (ω (t − t0 )) +
v0
sin (ω (t − t0 ))
ω
der homogenen Gleichung. Sie ist durch die Anfangsvorgabe (x0 , v0 ) zur Zeit t0
eindeutig festgelegt. Andererseits enthält die Lösungsformel die partikuläre Lösung
xb (t) =
1
ω
t
t0
sin (ω (t − ξ)) b (ξ) dξ
der inhomogenen Gleichung. Für eine Inhomogenität b, die in einer genügend fernen
Vergangenheit verschwindet, hängt xb nicht vom genauen Wert der Anfangszeit t0
ab, wenn dieser nur in dieser fernen Vergangenheit liegt. Warum ist das so?
Sei also b so, dass ein T ∈ R existiert, dass b (t) = 0 für alle t < T. Weiter sei
t0 < T. Sei Θ Heavisides Stufenfunktion, d.h. es gilt Θ(t) = 0 für t < 0 und Θ(t) = 1
für t ≥ 0. Damit folgt für alle t ∈ R
xb (t) =
1
ω
t
−∞
sin (ω (t − ξ)) b (ξ) dξ =
1
ω
∞
−∞
Θ (t − ξ) sin (ω (t − ξ)) b (ξ) dξ.
Definition 37 Die Funktion Gret : R → R mit Gret (t) = Θ (t) sin (ωt) /ω heißt
retardierte Fundamentallösung oder auch retardierte Greensche Funktion zu ∂ 2 + ω 2 .
Wir fassen zusammen:
Satz 38 Sei b : R → R stetig und es gebe eine Konstante T ∈ R, sodass b(t) = 0
für alle t < T. Sei x die maximale Lösung von x′′ + ω 2 x = b mit x(t0 ) = x′ (t0 ) = 0
für ein t0 < T. Dann gilt
x(t) =
∞
−∞
Θ(t − ξ)
sin (ω(t − ξ))
b(ξ)dξ =: (Gret ∗ b) (t)
ω
für alle t ∈ R. (Die Funktion Gret ∗ b heißt Faltung von Gret mit b. Sie ist jene
Lösung der inhomogenen Schwingungsgleichung, die vor dem Einsetzen der äußeren
Kraft ruht.)
Die Funktion Gret ist zwar stetig, aber bei 0 nicht differenzierbar. Auf den Intervallen x > 0 und x < 0 stimmt Gret mit Lösungen der homogenen Schwingungsgleichung überein. In 0 springt die Ableitung von Gret von 0 auf 1, sodass eine
Differentialgleichung im bisher entwickelten Sinn für x = 0 nicht formulierbar ist.
Gret ist also selbst keine Lösung der Schwingungsgleichung. In der Vorlesung Math.
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
65
Meth. II wird klar werden, dass der Funktion Gret eine Lösung Gret einer distributionellen Differentialgleichung entspricht, die Diracs Delta-Distribution enthält. Es
gilt G′′ret + ω 2 Gret = δ.
Eine andere Fundamentallösung zur Schwingungsgleichung ist für alle t ∈ R
durch
Gav (t) = Gret (−t) = −Θ (−t) sin (ωt) /ω
gegeben. Sie heißt avancierte Fundamentallösung. Für sie gilt
Satz 39 Sei b : R → R stetig und es gebe eine Konstante T ∈ R, sodass b(t) = 0
für alle t > T. Sei x die maximale Lösung von x′′ + ω 2 x = b mit x(t0 ) = x′ (t0 ) = 0
für ein t0 > T. Dann gilt x(t) = (Gav ∗ b) (t) für alle t ∈ R.
Beweis. Da b(ξ) = 0 für alle ξ > T, gilt auch b (ξ) = 0 für alle ξ > t0 . Daraus
folgt mit Satz 36
t
∞
sin (ω (t − ξ))
sin (ω (t − ξ))
b(ξ)dξ = −
b(ξ)dξ
ω
ω
∞
t
∞
∞
sin (ω (t − ξ))
= −
Θ(ξ − t)
b(ξ)dξ =
Gav (t − ξ)b(ξ)dξ.
ω
−∞
−∞
x(t) =
Die Lösung Gav ∗ b ist jene getriebene Schwingung, die von der Quelle zum
Stillstand gebracht wird.
Die Differenz Gret − Gav ist eine Lösung der homogenen Schwingungsgleichung
′′
x + ω 2 x = 0, denn Gret (t) − Gav (t) = sin (ωt) /ω. Ferner ist (Gret − Gav ) ∗ b
eine Lösung der homogenen Gleichung. Die Funktion 12 (Gret + Gav ) ∗ b hingegen ist
Lösung von x′′ + ω 2 x = b. Sie gehört zur Fundamentallösung Gsym mit
Gsym (t) =
1
1
sin (ω |t|)
(Gret + Gav ) (t) =
[Θ (t) sin (ωt) − Θ (−t) sin (ωt)] =
.
2
2ω
2ω
Feynman erkannte eine komplexwertige Fundamentallösung, nämlich GF mit
i −iω|t|
GF (t) = 2ω
e
als nützlich für die Beschreibung von Teilchenerzeugungsprozesi
i
sen. Es gilt GF (t) = 2ω
[cos (ω |t|) − i sin (ω |t|)] = Gsym (t) + 2ω
cos (ωt) .
Schwingung nach einem Einheitskraftstoß
Wir zeigen nun, dass Gret eine Näherung an eine Lösung der inhomogenen Schwingungsgleichung mit einem kurzzeitig wirkenden Kraftstoß mit (annähernd) EinheitsGeschwindigkeitsübertrag (δ-Stoß) ist. Gret approximiert jene Lösung, die vor dem
Kraftstoß mit der Nulllösung übereinstimmt.
Für ein τ ∈ R>0 gelte bτ (t) = 0 für alle t ∈
/ [−τ , τ ] und
bτ (t) =
1
τ
1−
|t|
τ
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
66
sonst. Daraus folgt limτ →0 bτ (t) = 0 für t = 0. Hingegen divergiert bτ (0) = 1/τ für
τ → 0. Für alle τ > 0 gilt
∞
bτ (t) dt = 1.
−∞
xτ sei die maximale Lösung von x′′ + ω 2 x = bτ mit xτ (t0 ) = 0 = x′τ (t0 ) für ein
t0 < −τ . Konvergiert xτ (t) für τ → 0? Für t < −τ gilt xτ (t) = 0. Für alle t < 0
folgt daher limτ →0 xτ (t) = 0.
Nun zur Berechnung von xτ (t) für t > τ nach Satz 36. Es gilt
τ
=
2
τω
2 τ
ξ
cos (ωξ) bτ (ξ) dξ =
cos (ωξ) 1 −
dξ
τ 0
τ
−τ
*
+
2 sin (ωτ ) 1 cos (ωξ) ξ sin (ωξ) τ
−
=
+
τ
ω
τ
ω2
ω
0
*
+
1 cos (ωτ ) − 1
2
sin (ωτ ) −
+ τ sin (ωτ )
= 2 2 [1 − cos (ωτ )] .
τ
ω
τ ω
Da bτ gerade ist, folgt
τ
−τ
sin (ωξ) bτ (ξ) dξ = 0. Mit Satz 36 folgt für alle t > τ
2
sin (ωt)
.
2 [1 − cos (ωτ )]
ω
(ωτ )
Für ωτ ∈ 2π · N schwingt der Oszillator nach der Einwirkung des Kraftstoßes also
nicht nach. Die Schwingungsamplitude von xτ im Bereich t > τ wird von der (dimensionslosen) Funktion x → 2 (1 − cos x) /x2 für x > 0 bestimmt. Sie ist in Figur
(1.24) für x = ωτ ∈ [0, 15] skizziert.
xτ (t) =
1
0.75
0.5
0.25
0
0
2.5
5
7.5
10
12.5
15
Abbildung 1.24: 2 (1 − cos x) /x2
Wegen limx→0 x22 [1 − cos x] = 1 folgt limτ →0 xτ (t) = sin (ωt) /ω für alle t > 0.
Für t = 0 gilt
τ
1 0
1
ξ
sin (ωξ) bτ (ξ) dξ =
sin (ωξ) 1 −
ω −τ
ωτ 0
τ
ωτ
1
u
du → 0 für τ → 0.
=
sin
(u)
1
−
τ ω2 0
ωτ
Damit gilt limτ →0 xτ (t) = Θ (t) sin (ωt) /ω = Gret (t) für alle t ∈ R.
xτ (0) = −
dξ
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
1.4
67
Lineare Differentialgleichungen 2-ter Ordnung
Einige einfache Differentialgleichungen zweiter Ordnung konnten wir schon als Systeme erster Ordnung behandeln. Wie etwa den getriebenen ungedämpften harmonischen Oszillator oder die ExB-Drift eines geladenen Teilchens. Wir sehen uns nun
an, wie eine lineare (sakalare) Differentialgleichung beliebiger Ordnung in ein äquivalentes lineares System von Differentialgleichungen erster Ordnung übersetzt werden
kann.
Die Äquivalenz zeigt ihren Nutzen nicht so sehr beim Aufsuchen spezieller Lösungen. Vielmehr erlaubt sie eine einfache Übertragung von strukturellen Eigenschaften der Systeme erster Ordnung, wie Dimension des Lösungsraums, auf Gleichungen
höherer Ordnung. Auch die Variation der Konstantenformel für Systeme erster Ordnung lässt sich so auf Gleichungen höherer Ordnung umlegen.
1.4.1
Äquivalenz zu System erster Ordnung
Definition 40 Sei I ⊂ R ein allgemeines Intervall. Die Funktionen a0 , ..., an−1 , b :
I → R seien stetig. Eine Funktion α : D ⊂ I → R auf einem Intervall D, mit
dn α
dn−1 α
(x) + an−1 (x) n−1 (x) + ... + a0 (x)α(x) = b(x)
dxn
dx
(1.32)
für alle x ∈ D heißt Lösung der gewöhnlichen Differentialgleichung n-ter Ordnung
di y
(0)
= y notiert.
y (n) + an−1 y (n−1) + ... + a0 y (0) = b. Hier wird y (i) = dx
i für i ∈ N und y
Die Gleichung heißt inhomogen linear falls b = 0 und homogen linear falls b = 0.
Beide Fälle werden als linear bezeichnet. Gilt für eine Lösung α und ein x0 ∈ D,
dass
α(x0 ), α(1) (x0 ), ..., α(n−1) (x0 ) = (c0 , c1 , ...cn−1 ) ,
sagt man, α sei eine Lösung zum Anfangswert (x0 ; c0 , c1 , ...cn−1 ) . Eine Lösung α :
D → R heißt maximal, wenn keine Lösung β : D′ → R mit D ⊂ D′ (echt) existiert,
sodass α mit β auf D übereinstimmt.
Die Menge aller Lösungen von Gleichung (1.32) wird durch die lineare Abbildung
t
α → α(0) , α(1) , . . . α(n−1) bijektiv auf die Menge aller Lösungen des Systems erster
Ordnung auf I × Rn×1

 
 
  
y0
0
1
0
··· 0
y0
0








0
1
··· 0
d  y1   0
  y1   0 
 .
 =  ..
 ·  ..  +  ..  (1.33)
..
dx  ..
  .
  .   . 
.
yn−1
−a0 −a1 −a2 · · · −an−1
yn−1
b
abgebildet. Damit übertragen sich die Sätze für (in)homogen lineare Systeme erster
Ordnung auf (in)homogen lineare Diffgleichungen n-ter Ordnung.
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
68
Satz 41 Jede maximale Lösung von (1.32) ist auf ganz I definiert. Die Menge L0
aller maximalen Lösungen von (1.32) für b = 0 ist ein n-dimensionaler reeller Vektorraum. (Eine Basis von L0 heißt ein Fundamentalsystem.) Sei yb eine maximale Lösung von (1.32), dann gilt für die Menge Lb aller maximalen Lösungen dieser Gleichung Lb = L0 + yb . Maximale Lösungen einer homogenen Gleichung, also
α0 , ...αn−1 ∈ L0 , sind genau dann linear unabhängig, wenn die Wronskideterminante


· · · αn−1 (x)
α0 (x)
(1)
 α(1) (x)
αn−1 (x) 
 0

W (x) := det 

..
..


.
.
(n−1)
α0
(n−1)
(x) · · · αn−1 (x)
für ein x ∈ I ungleich 0 ist. Aus W (x0 ) = 0 für ein x0 ∈ I folgt W (x) = 0 für alle
x ∈ I. Sei x0 ∈ I. Dann existiert zu jedem c ∈ R1×n genau ein α ∈ Lb mit
α(x0 ), α(1) (x0 ), ..., α(n−1) (x0 ) = c.
Jede Lösung α ∈ L0 mit α = 0 kann zu einem Fundamentalsystem ergänzt
werden. Da die zugehörige Wronskideterminante nirgends gleich Null ist, gilt für
jedes x ∈ I
α(x), α(1) (x), ..., α(n−1) (x) = (0, 0, ..., 0) .
Sei für i = 0, 1, ..., n − 1 die Funktion αi,x0 die maximale Lösung von Gleichung
(j)
(1.32) mit b = 0 zur Anfangsbedingung αi,x0 (x0 ) = δ ji für j = 0, 1, ..., n − 1, wobei
x0 im Definitionsintervall I der Differentialgleichung liegt. Dann ist gemäß dem
Abschnitt über die Evolutionsabbildung von linearen Systemen erster Ordnung die
Matrix der Evolutionsabbildung Ux,x0 des Systems (1.33) zur Standardbasis von
Rn×1 für x ∈ I durch


α0,x0 (x) · · · αn−1,x0 (x)
(1)
 α(1) (x)
αn−1,x0 (x) 
 0,x0



..
..


.
.
(n−1)
α0,x0 (x) · · ·
(n−1)
αn−1,x0 (x)
gegeben. Tatsächlich gilt Ux0 ,x0 = ιd. Für die maximale Lösung α von Gleichung
(1.32) mit b = 0 zur allgemeinen Anfangsbedingung
α(x0 ), α(1) (x0 ), . . . , α(n−1) (x0 ) = (c0 , c1 , . . . , cn−1 )
folgt daher α(x) = c0 α0,x0 (x) + . . . + cn−1 αn−1,x0 (x).
Für die maximale Lösung α der inhomogenen Gleichung (1.32) zur Anfangsbedingung
α(x0 ), α(1) (x0 ), ..., α(n−1) (x0 ) = (c0 , c1 , ..., cn−1 )
folgt durch Anwenden von Bemerkung (35) auf Gleichung (1.33)
x
αn−1,ξ (x)b(ξ)dξ.
α(x) = α(x) +
x0
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
69
Im Fall einer Gleichung mit konstanten Koeffizientenfunktionen ai gilt αn−1,ξ (x) =
αn−1,0 (x − ξ), sodass daraus folgt
x
α(x) = α(x) +
x0
αn−1,0 (x − ξ)b(ξ)dξ.
Falls b nur in einem endlichen Intervall von 0 verschiedene Werte annimmt, kann
am Integral der Grenzübergang x0 → −∞ durchgeführt werden. Es folgt daher, dass
die Lösung α der inhomogenen Gleichung zur homogenen Anfangsbedingung
α(x0 ), α(1) (x0 ), ..., α(n−1) (x0 ) = (0, 0, ..., 0) ,
für x0 → −∞ punktweise gegen die sogenannte „retardierte Lösung”
αret (x) = (Gret ∗ b) (x) =
∞
−∞
Θ(x − ξ)αn−1,0 (x − ξ)b(ξ)dξ
(1.34)
der inhomogenen Gleichung konvergiert. Die Funktion Gret : x → Θ(x)αn−1,0 (x)
heißt retardierte Fundamentallösung der homogenen Differentialgleichung (1.32).
Das Integral (1.34) heißt Faltungsintegral von Gret mit der Inhomogenität b.
Legendre, Hermite und Laguerre
Die folgenden linearen Differentialgleichungen zweiter Ordnung treten in beim Lösen
von Potential- und Wellenproblemen auf. Einigen von ihnen werden wir uns noch
eingehender zuwenden. Sei n ∈ N0 .
1. (1 − x2 ) y ′′ − 2xy ′ + n(n + 1)y = 0 auf I = (−1, 1) (Legendresche Diffgl.)
2. y ′′ − 2xy ′ + 2ny = 0 auf I = R (Hermitesche Diffgl.)
3. xy ′′ + (1 − x) y ′ + ny = 0 auf I = R>0 (Laguerresche Diffgl.)
4. Eine maximale Polynomlösung zu jeder der drei Gleichungen ist wie folgt:
5. Pn (x) =
1
2n n!
d n
dx
2
6. Hn (x) = (−1)n ex
7. Ln (x) = ex
1.4.2
n
(x2 − 1) (n-tes Legendrepolynom)
d n −x2
e
dx
d n
(xn e−x )
dx
(n-tes Hermitepolynom)
(n-tes Laguerrepolynom)
Eine Eulersche Differentialgleichung
1 ′
Für x ∈ R>0 sei y ′′ (x) − 2x
y (x) + 2x12 y(x) = 0. Die Gleichung ist homogen linear.
Potenzansatz: die Funktion y(x) = xα ist eine Lösung genau dann, wenn für alle
x>0
α 1
xα−2 = 0.
α(α − 1) − +
2 2
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
70
Dies ist äquivalent zu α√
∈ {1, 1/2} . Daraus folgen die beiden maximalen Lösungen
α1 (x) = x und α2 (x) = x auf R>0 . Für ihre Wronskideterminante folgt
√
√
x
x
x
< 0.
W (x) = det
=−
1 2√1 x
2
(α1 , α2 ) ist somit eine Basis des Lösungsraumes der Differentialgleichung, ein Fundamentalsystem.
Zur Lösung einer inhomogenen Gleichung
y ′′ (x) −
1 ′
1
y (x) + 2 y(x) = b(x) für alle x ∈ R>0
2x
2x
(1.35)
nach der Variation der Konstantenformel für Systeme erster Ordnung wird die maximale Lösung α1,ξ =: αξ der homogenen Gleichung zur Anfangsbedingung αξ (ξ) = 0
und α′ξ (ξ) = 1 benötigt. Für sie gilt für alle x > 0
αξ (x) = 2 x −
ξx .
Somit folgt für die maximale Lösung y der inhomogenen Gleichung mit der Anfangsbedingung α(1) = α′ (1) = 0 für alle x > 0, dass
x
α(x) =
x
αξ (x)b(ξ)dξ = 2 x
1
1
b(ξ)dξ −
x
√
x
ξb(ξ)dξ .
1
Rechnen Sie zur Übung nach, dass die Funktion α tatsächlich eine Lösung der Differentialgleichung 1.35 ist.
1.4.3
Getriebene lineare Schwingungen: gedämpft
Die (parameterreduzierte) Bewegungsgleichung des getriebenen, gedämpften harmonischen Oszillators ist mit α ≥ 0 und stetiger Inhomogenität f : R → R durch
y ′′ + 2αy ′ + y = f
(1.36)
gegeben. Der Ansatz y (x) = e−αx u (x) für alle x ∈ R führt die Gleichung mit
Dämpfung auf eine ohne Dämpfung zurück. Es folgt nämlich (y + 2αy ′ + y ′′ ) (x) =
= e−αx u (x) + 2α [−αu (x) + u′ (x)] + α2 u (x) − 2αu′ (x) + u′′ (x)
= e−αx u′′ (x) + 1 − α2 u (x) .
Die Differentialgleichung für u enthält u′ nicht:
u′′ (x) + 1 − α2 u (x) = eαxf (x) .
Sei zunächst der homogene Fall f = 0 betrachtet: Wegen u′′ = − (1 − α2 ) u liegt
für α2 < 1 folgender Sachverhalt vor: Die Krümmung (oder auch Beschleunigung)
von u ist positiv für negatives u und negativ für positives u. Der Graph von u ist
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
71
oberhalb der x-Achse nach unten und unterhalb nach oben gekrümmt. Dabei nimmt
der Betrag der Krümmung linear mit dem Abstand von der Achse zu. Die Funktion u
oszilliert dementsprechend mit unendlich vielen Nulldurchgängen zwischen positiven
und negativen Werten. Genauer gilt: Es existieren a, b ∈ R, sodass für alle x ∈ R
√
√
1 − α2 x + b sin
1 − α2 x .
u (x) = a cos
Es ist, als würde u zum Wert u = 0 hingezogen. Für y folgt bei f = 0 somit für alle
x∈R
√
√
y (x) = e−αx a cos
1 − α2 x + b sin
1 − α2 x .
y wechselt wie u das Vorzeichen in denselben Nullstellen wie u. Für α > 0 geht y (x)
für x → ∞ gegen 0. Für x → −∞ wächst der Betrag der lokalen Extrema von y (x)
unbeschränkt an.
Für α2 > 1 ist u im positiven Bereich nach oben gekrümmt, im negativen nach
unten. Der Wert u = 0 scheint abzustoßen. Genauer gilt für α2 > 1 : Es existieren
a, b ∈ R, sodass für alle x ∈ R
√
α2 −1x
u (x) = ae
√
α2 −1x
+ be−
.
u hat höchstens eine Nullstelle. Für y folgt bei f = 0 somit für alle x ∈ R
√
α2 −1)x
y (x) = ae−(α−
√
α2 −1)x
+ be−(α+
.
Auch y hat höchstens eine Nullstelle. Diese stimmt mit jener von u überein. Für
x → ∞ konvergiert y (x) gegen 0. Für x → −∞ divergiert y (x) .
Im Grenzfall α2 = 1 gilt: Es existieren a, b ∈ R, sodass für alle x ∈ R
u (x) = a + bx und y (x) = e−x [a + bx] .
′′
′
Sei nun 0 ≤ α2 < 1. Dann gilt für y0 : R → R genau
√ dann y0 + 2αy0 + y0 = 0,
wenn reelle Konstanten a, b existieren, sodass mit ω = 1 − α2 für alle x ∈ R
y0 (x) = e−αx [a cos (ωx) + b sin (ωx)]
Die beiden Lösungen ri : R → R mit
r1 (x) = e−αx cos (ωx) und r2 (x) = e−αx sin (ωx)
bilden ein Fundamentalsystem der homogenen Differentialgleichung, da
Wr (0) =
r1 (0) r2 (0)
r1′ (0) r2′ (0)
1 0
−α ω
=
.
Das Fundamentalsystem α = (α1 , α2 ) ≡ (α0,0 , α1,0 ) , dessen Wronskimatrix Wα (x)
im Punkt x = 0 die Einheitsmatrix ist, geht aus der Basis r = (r1 , r2 ) mit einer
konstanten Matrix M ∈ R2×2 gemäß α = r · M hervor. Es gilt daher auch Wα (x) =
Wr (x) · M und somit
M = Wr (0)−1 =
1
ω
ω 0
α 1
=
1
0
α
ω
1
ω
.
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
72
Für die maximalen Lösungen αi : R → R der homogenen Gleichung mit α1 (0) = 1
und α′1 (0) = 1 und α2 (0) = 0 und α′2 (0) = 1 gilt daher für alle x ∈ R
α1 (x) = e−αx cos (ωx) +
α
sin (ωx)
ω
und α2 (x) =
e−αx
sin (ωx) .
ω
Daraus folgt für die maximale Lösung y0 : R → R der inhomogenen Gleichung
mit Inhomogenität f zur Anfangsbedingung y0 (x0 ) = y0′ (x0 ) = 0 für ein x0 ∈ R,
dass für alle x ∈ R
e−αx x
sin (ω (x − ξ)) eαξ f (ξ)dξ
ω x0
*
+
x
x
e−αx
αξ
αξ
=
sin (ωx)
cos (ωξ) e f (ξ)dξ − cos (ωx)
sin (ωξ) e f(ξ)dξ .
ω
x0
x0
√
Dabei gilt 0 ≤ α < 1 und ω = 1 − α2 .
Ist die Inhomogenität f für x < 0 polynomial beschränkt, dh es existiert ein
Polynom p mit |f (x)| ≤ |p (x)| für alle x < 0, dann existiert das uneigentliche
Integral
y0 (x) =
x
lim
x0 →−∞
x0
sin (ω (x − ξ)) eαξ f (ξ)dξ,
aufgrund der exponentiellen Dämpfung durch eαξ , sodass die Funktion yret : R ∋
x → limx0 →−∞ y0 (x) existiert. Sie löst Gleichung (1.36) und wird als die retardierte
Lösung bezeichnet. Damit hingegen eine avancierte Lösung yav (x) = limx0 →∞ y0 (x)
existiert, benötigt f im Bereich x > 0 eine stärkere als nur polynomiale Schranke.
Der folgende Abschnitt gibt ein Beispiel einer retardierten Lösung für eine Inhomogenität ohne Nullstelle.
1.4.4
Eine retardierte gedämpfte Schwingung
Sei wieder die Dämpfungskonstante α ∈ [0, 1) . Die Differentialgleichung (1.36) mit
f (x) = exp (−λ |x|) für alle x ∈ R und für ein festes λ ∈ R>0 besitzt also eine
Lösung yret : R → R, für die limx→−∞ yret (x) = 0 gilt. Sie kann entweder mittels
yret (x) =
e−αx
ω
x
−∞
sin (ω (x − ξ)) eαξ e−λ|ξ| dξ
berechnet werden, oder aber für x ≤ 0 mittels des Ansatzes yret (x) = c · eλx .
Dieser gibt der reellen Konstante c den Wert c = 1/ λ2 + 2αλ + 1 . Im Punkt
′
x = 0 gilt somit yret (0) = c und yret
(0) = λc. Die Addition einer nichttrivialen
Lösung der homogenen Gleichung im Bereich x ≤ 0 zu yret (x) = c exp (λx) wird
von limx→−∞ yret (x) = 0 ausgeschlossen. Keine von ihnen geht für x → −∞ gegen
0.
In den Bereich x ≥ 0 wird die Lösung wieder durch Ansatz fortgesetzt. Es gilt
f (x) = e−λx für x > 0 und daher gibt der Ansatz yp (x) = c′ exp (−λx) eine Lösung
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
73
von (1.36) im Bereich x ≥ 0 mit c′ = 1/ λ2 − 2αλ + 1 . Daher existieren Zahlen
A, B ∈ R mit
yret (x) = yp (x) + Aα1 (x) + Bα2 (x) für alle x ≥ 0.
Dabei ist (α1 , α2 ) jenes Fundamentalsystem der homogenen Gleichung, dessen Wronskimatrix in x = 0 die Einheitsmatrix ist. Aus der Anschlussbedingung für yret im
′
Punkt x = 0 folgt somit A = yret (0) − yp (0) und B = yret
(0) − yp′ (0) , also
A = c − c′ =
−4αλ
λ2 + 1
2
− (2αλ)2
und B = λ (c + c′ ) =
2 λ2 + 1
λ2 + 1
√
Zusammenfassend gilt mit ω = 1 − α2

eλx


λ2 +2αλ+1

(λ2 +1)−2α2 λ sin(ωx)−cos(ωx)
yret (x) =
2αω

e−λx

+ 4λαe−αx
 λ2 −2αλ+1
2
(λ2 +1) −(2αλ)2
1.4.5
2
− (2αλ)2
.
für x ≤ 0
für x > 0
Symmetrien einer Differentialgleichung
Für manche Differentialgleichungen lassen sich einfache Prozeduren, sogenannte
Symmetrien, finden, die aus bereits bekannten Lösungen weitere Lösungen erzeugen. Das hilft gelegentlich beim Auffinden der gesamten Lösungsmenge. Wichtiger
aber ist die von Symmetrien errichtete Struktur der Lösungsmenge, denn sie fassen
auseinander hervorgehende Lösungen zu Klassen ’ähnlicher’ Lösungen zusammen.
Wir sehen uns das an einem Beispiel an.
Die Abbildung Π : C (R : R) → C (R : R) ordne einer Funktion f ∈ C (R : R)
die Funktion Π (f ) ≡ Πf zu, die Πf : x → f (−x) erfüllt. Der Funktionsgraph
von Πf geht also aus jenem von f durch Spiegelung an der y-Achse hervor. Je
nach physikalischem Kontext kann Π als Raum- oder Zeitspiegelung auftreten. Es
gilt: Π ◦ Π = ιd und daher Π−1 = Π. Für alle f ∈ C 1 (R : R) gilt (Πf )′ = −Πf ′
(Kettenregel).
Die Abbildung Ta : C (R : R) → C (R : R) ordne einer Funktion f ∈ C (R : R)
für a ∈ R die Funktion Ta f ≡ Ta (f) zu, die Ta f : x → f (x − a) erfüllt. Der
Funktionsgraph von Ta f geht also aus jenem von f durch Verschieben um a längs
der x-Achse hervor. Es folgt Ta ◦ Tb = Ta+b und weiter Ta−1 = T−a . Zudem gilt
Π ◦ Ta = T−a ◦ Π und (Ta f)′ = Ta f ′ für alle f ∈ C 1 (R : R) und für alle a ∈ R.
Sei L für ein ω > 0 die Menge aller Funktionen y : R → R mit
y ′′ (x) + y (x) = 1 − cos (ωx) für alle x ∈ R.
(1.37)
L ist also die Menge aller maximalen Lösungen der Differentialgleichung (1.37). Man
beachte, dass 1 − cos (ωx) = 2 sin2 (ωx/2) .
Satz 42 Für y ∈ L folgt Πy ∈ L und Tkτ y ∈ L für alle k ∈ Z und τ = 2π/ω.
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
74
Beweis. 1) Spiegelung: Aufgrund der Kettenregel gilt (Πy)′′ (x) = y ′′ (−x) =
(Πy ′′ ) (x) für alle x ∈ R. Daraus folgt
(Πy)′′ (x) + (Πy) (x) = y ′′ (−x) + y (−x) = 1 − cos (ω (−x)) = 1 − cos (ωx) .
Also ist auch Πy Element von L.
2) Translation: Aufgrund der Kettenregel gilt (Ta y)′′ (x) = y ′′ (x − a) = (Ta y ′′ ) (x)
für alle x ∈ R. Daraus folgt
(Ta y)′′ (x) + (Ta y) (x) = y ′′ (x − a) + y (x − a) = 1 − cos (ω (x − a)) .
Für a = kτ folgt aus cos (ω (x − a)) = cos (ωx − k2π) = cos (ωx) , dass Ta y ∈ L.
Da die linearen Abbildungen Π und {Tkτ : k ∈ Z} den affinen Unterraum L ⊂
C (R : R) auf sich abbilden, heißen sie Symmetrien oder auch Invarianzen von L bzw
Gleichung (1.37).28 Für eine Funktion y ∈ L gilt typischerweise Πy = y und Tkτ y =
y. Eine Lösung y ∈ L mit Πy = y und Tτ y = y stellt einen hochsymmetrischen
Sonderfall dar und sie wird als invariant unter Π und Tτ bezeichnet. Sie ist also
gerade und τ -periodisch. Sie ist auch invariant unter Tkτ für alle k ∈ Z.
Ziehen wir ein paar Schlüsse aus diesen einfachen Überlegungen: Ist y ∈ L, dann
folgt für den geraden Teil von y, dass y+ := (y + Πy) /2 ∈ L. Hingegen ist der
ungerade Teil y− = (y − Πy) /2 ∈
/ L. Vielmehr ist y− eine Lösung der homogenen
DG zu (1.37). Es ist sogar so, dass in L keine einzige ungerade Funktion enthalten ist.
Gäbe es nämlich eine ungerade Funktion u ∈ L, dann wäre auch die Funktion u+ =
(u + Πu) /2 = 0 ∈ L. Das ist aber nach Gl (1.37) nicht der Fall. Jede Funktion y ∈ L
mit y ′ (0) = 0 ist gerade, denn aus (Πy) (0) = y (0) und (Πy)′ (0) = −y ′ (0) = 0 =
y ′ (0) folgt, dass die beiden maximalen Lösungen y und Πy von Gl (1.37) dieselben
Anfangsbedingungen bei x = 0 erfüllen und somit nach dem Eindeutigkeitssatz
übereinstimmen, dh y = Πy. Eine Regel zeichnet sich ab: Sind Differentialgleichung
und Anfangsvoragbe invariant unter einer Symmetrie, dann ist - bei Wirksamkeit
des Eindeutigkeitssatzes - die zugehörige maximale Lösung invariant unter dieser
Symmetrie.
Ähnlich folgt für y ∈ L, dass für eine endliche Teilmenge J ⊂ Z die Funktion k∈J (Tkτ y) / |J| in L liegt. Der Grenzfall yp := limN→∞ |k|≤N Tkτ y/ (2N + 1)
schließlich sollte analog zur Bildung von y+ aus y eine τ -periodische Lösung ergeben,
soferne der Limes existiert. Überprüfen wir an L all diese Überlegungen.
Nichtresonanter Fall ω = 1 : Eine unter Π und Tτ invariante Lösung kann mit
dem Ansatz yp (x) = a + b cos (ωx) gesucht werden. Es gilt dann
yp′′ (x) + yp (x) = a + b 1 − ω 2 cos (ωx) .
yp erfüllt genau dann die DG, wenn a = 1 und b = −1/ (1 − ω 2 ) . Es gilt also
yp (x) = 1 −
28
cos (ωx)
für alle x ∈ R.
1 − ω2
(1.38)
Jede Permutation einer Menge M heißt Symmetrie von M. Die Menge aller Permutationen von
M bildet bezüglich der Hintereinanderausführung eine Gruppe, die symmetrische Gruppe S (M) .
Jede Untergruppe von S (M) wird als Symmetriegruppe von M bezeichnet. Die Einschränkungen
von Π und Tkτ auf L sind also in S (L) .
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
75
Die Lösung yp ∈ L ist periodisch. Ihre kleinste Periode ist τ = 2π/ω > 0. Ihr
Periodenmittel hat den Wert 1, denn
1
τ
τ
yp (x) dx = 1.
0
Für ω < 1 gilt 1 − ω 2 > 0 und die Schwingung yp hat die Amplitude Aω =
−1
(1 − ω 2 ) > 1. Die Amplitudenfunktion ω → Aω ist im Intervall (0, 1) streng
monoton wachsend und für ω → 1 unbeschränkt. Für ω → 0 gilt Aω → 1. Die
Schwingung folgt der Inhomogenität in Phase, dh sie nimmt ein Maximum genau
dann an, wenn die Inhomogenität maximal ist & vice versa. In ihren Tiefpunkten
nimmt yp einen negativen Wert an, nämlich
yp (0) = 1 −
1
ω2
=
−
= ω 2 Aω = −yp′′ (0) < 0.
1 − ω2
1 − ω2
Für ω > 1 gilt 1 − ω 2 < 0 und die Schwingung yp hat die Amplitude Aω mit
−1
Aω = (ω 2 − 1) > 0. Die Amplitudenfunktion ω → Aω ist im Intervall (1, ∞)
streng monoton fallend und für ω → 1 unbeschränkt. Für ω → ∞ konvergiert sie
gegen 0. Die Schwingung folgt der Inhomogenität mit einen Phasenschub von π, dh
sie nimmt ein Maximum genau dann an, wenn die Inhomogenität minimal ist & vice
versa. Für 1 < ω 2 < 2 gilt Aω > 1 und für ω 2 > 2 gilt Aω < 1. Die Lösungen yp sind
für die unterkritische
Frequenz ω = 1/2 und die beiden überkritischen Frequenzen
√
ω = 1, 2 < 2 und ω = 3/2 in Figur 1.25 wiedergegeben. Die Lösung − cos (x) der
homogenen Gleichung ist als Referenztaktgeber in grau eingefügt.
Abbildung 1.25: yp für ω = 1/2 (rot), ω = 1, 2 (grün), ω = 3/2 (schwarz)
Zu jeder Lösung y ∈ L existiert für ω = 1 somit ein Dupel (A, B) ∈ R2 , sodass
y = y(A,B) mit y(A,B) (x) = A cos (x) + B sin (x) + yp (x) für alle x ∈ R. Es gilt
Πy(A,B) = y(A,−B) und Tτ y(A,B) = y(A cos τ −B sin τ ,A sin τ +B cos τ ) . Die Translation um τ
dreht den Parametervektor (A, B) um den Winkel τ .
Für (A, B) = (0, 0) hat y(A,B) die Periode τ genau dann, wenn (A, B) bei einer
Drehung um τ in sich übergeht. Dies ist genau dann der Fall, wenn τ ∈ 2π · N. In
diesem Fall hat jedes Element von L die Periode τ . Für τ ∈
/ 2π · N ist yp die einzige
τ -periodische Lösung. Es bleibt nun die Frage, ob y(A,B) für (A, B) = (0, 0) eine
andere Periode als τ besitzt.
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
76
Satz 43 Die Funktion y(A,B) mit A2 + B 2 > 0 ist genau dann periodisch, wenn τ ∈
2π · Q. Gilt τ = 2πn/m mit m, n ∈ N, dann hat y(A,B) die Periode T = 2πn = mτ .
Beweis. Sei y(A,B) periodisch mit der Periode T > 0. Dann haben auch die
′′
′′
Funktionen y(A,B)
und y(A,B)
+ y(A,B) die Periode T. Wegen y(A,B) ∈ L folgt nun,
dass T auch Periode der Inhomogenität 1 − cos ωx ist. Das ist genau dann der Fall,
wenn ωT = 2πT /τ = 2πm für ein m ∈ N, oder äquivalent dazu, wenn T = τ m.
Da yp die Periode τ besitzt, hat yp auch die Periode T = τ m. Damit folgt nun,
dass auch A cos x + B sin x die Periode T besitzt. Dies ist aber nur dann der Fall,
wenn T = 2πn für ein n ∈ N. Es folgt also τ = T /m = 2πn/m ∈ 2π · Q. Gilt
umgekehrt τ = 2πn/m für zwei natürliche Zahlen m, n, dann folgt für T := 2πn,
die T -Periodizität von y(A,B) .
Bemerkung: y(A,B) ist also genau dann periodisch, wenn eine der Perioden n · 2π
für n ∈ N des homogenen Lösungsteils mit einer der Perioden m · τ für m ∈ N von
yp übereinstimmt.
Im resonanten Fall ω = 1 kann der Ansatz yp (x) = a + bx sin x genutzt werden,
um eine Lösung zu suchen, die unter Π invariant ist. Wegen
yp′′ (x) + yp (x) = a + 2b cos x
gilt yp ∈ L genau dann, wenn a = 1 und b = −1/2, also für yp (x) = 1− x2 sin x. (Figur
1.26) Die Funktion y0 ∈ L mit y0 (x) = yp (x) − cos x erfüllt y0 (0) = 0 = y0′ (0) .
(Beachte: y0 stimmt auf x > 0 mit der retardierten Lösung zur Inhomogenität
Θ (x) (1 − cos x) überein.) Zu jedem y ∈ L existieren somit Zahlen A, B ∈ R, für
die y = y(A,B) = A cos +B sin +yp . Es gilt Tτ y(A,B) = y(A,B+π) . Da eine Verschiebung
Abbildung 1.26: yp für ω = 1 (rot), y0 (grün) und − cos (x) (grau)
der Ebene keinen Fixpunkt hat, existiert keine 2π-periodische Lösung.
Zusammenfassung: Aus der Menge L aller maximalen Lösungen der Differentialgleichung (1.37) sind je nach Wert von ω kein einziges, genau eines oder alle Elemente
invariant unter Tτ . Für ω = 1 ist kein y ∈ L invariant unter Tτ . Für ω = 1/n mit
n ∈ N 1 ist jedes y ∈ L invariant unter Tτ . Für ω ∈ R>0 {1/n : n ∈ N} ist yp
aus Gleichung (1.38) die einzige unter Tτ invariante Lösung.
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
1.4.6
77
*Dehnungssymmetrie und 3. Keplersches Gesetz
Sei V ein (endlichdimensionaler) Vektorraum und |·| sei eine Norm von V. Die Kurve
γ : I → V
0 erfülle für alle t im offenen reellen Intervall I die Newtonsche
Bewegungsgleichung
c
γ (t) .
(1.39)
γ̈ (t) = −
|γ (t)|3
Dabei ist c eine reelle Konstante. Im Fall der Bewegung eines Planeten um die Sonne
ist c das Produkt aus Gravitationskonstante G und Sonnenmasse M und V hat die
Dimension 3.
Gibt es eine Zahl α ∈ R, sodass für ein λ ∈ R>0 die gedehnte Funktion
Dλ γ : λ · I → V mit (Dλ γ) (t) = λα γ (λt)
ebenfalls Gleichung (1.39) erfüllt? Es gilt (Dλ γ)′′ (t) = λ2+α γ̈ (λt) und
(Dλ γ) (t)
−2α γ (λt)
.
3 = λ
|(Dλ γ) (t)|
|γ (λt)|3
Die Kurve Dλ γ erfüllt daher genau dann Gleichung (1.39), wenn λ2+α = λ−2α , wenn
also 2 = −3α.
Damit ist gezeigt: Die Abbildung Dλ : γ → Dλ γ mit (Dλ γ) (t) = λ−2/3 γ (λt)
bildet für jedes λ ∈ R>0 die Menge aller (lokalen) Lösungen von Gleichung (1.39)
auf sich ab, ist also eine Symmetrie. Dieser Sachverhalt wird als Skaleninvarianz der
Bewegungsgleichung (1.39) bezeichnet.
Sei nun γ : R → V 0 eine periodische Lösung. Ihre kleinste Periodenlänge wird
mit T und ihr Maximalabstand von 0 wird mit L := maxt |γ (t)| bezeichnet. Dann
hat die Lösung Dλ γ von Gleichung (1.39) die kleinste Periodenlänge Tλ = T /λ und
den maximalen Nullpunktsabstand Lλ = λ−2/3 M. Es gilt also
1
Tλ
=
=
λ
T
Lλ
L
3/2
bzw
Tλ
T
2
=
Lλ
L
3
.
Analog gilt für die Minimalabstände von 0, nämlich l = mint |γ (t)| und lλ =
mint |(Dλ γ) (t)| , dass (Tλ /T )2 = (lλ /l)3 . Daraus folgt für A = (l + L) /2 und Aλ =
(lλ + Lλ ) /2 der Spezialfall des dritten Keplerschen Gesetzes29 (Tλ /T )2 = (Aλ /A)3 .
PS: Kepler abstrahierte aus den ihm bekannten Planetendaten: 1) Die Bahnen
der Planeten sind Ellipsen und die Sonne befindet sich in einem der Brennpunkte. 2) Das Geradenstück zwischen Sonne und Planet überstreicht in gleichen Zeiten
Sektoren gleicher Flächeninhalte. 3) Die Quadrate der Umlaufzeiten verhalten sich
zueinander so wie die Kuben der großen Halbachsen. (Die große Halbachse einer Ellipse ist das arithmetische Mittel von Perihel- und Apheldistanz.) Newton erkannte,
dass Gleichung (1.39) eine Erklärung für Keplers Gesetze liefert.
29
Das dritte Keplergesetz gilt nicht nur für 2 Lösungen, die auseinander durch Dehnung hervorgehen, sondern für alle Paare von periodischen Lösungen.
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
1.4.7
78
*Potential einer homogen geladenen Kugel
Bisher haben wir eine maximale Lösung y einer gewöhnlichen Differentialgleichung
zweiter Ordnung durch die Vorgabe der Werte y (x0 ) und der Ableitung y ′ (x0 ) in
einem Punkt x0 des Definitionsbereiches der Differentialgleichung festgelegt. Es gibt
aber auch andere Möglichkeiten, eine spezielle Lösung aus der Menge aller maximalen Lösungen auszuwählen.
Das folgende Beispiel zeigt, dass maximale Lösungen einer Differentialgleichung
(unter Umständen) auch durch Wachstumsschranken enger eingegrenzt werden. Überdies zeigt es, wie Lösungen verschiedener Differentialgleichungen sich zur Gesamtlösung einer komplexeren Aufgabenstellung zusammenfügen können. Das Beispiel
liefert das elektrische Potential einer homogen geladenen Vollkugel oder auch Yukawas Mesonpotential eines ausgedehnten Nukleons.
Sei für ein R ∈ R>0 und ein ρ0 ∈ R die Funktion ρ : R3 → R durch ρ (p) = ρ0
für |p| < R und ρ (p) = 0 sonst gegeben. Die Normfunktion |·| wird im Folgenden
als r notiert. Die Funktion ρ beschreibt die Ladungsdichte einer homogen geladenen
Kugel. Gesucht ist eine beschränkte C 1 -Funktion Φ : R3 → R mit Φ = ϕ (r) für ein
ϕ : R≥0 → R und (−∆ + κ2 ) Φ = ρ/ε0 auf R3 R · S2 . Dabei ist ε0 die elektrische
Feldkonstante und κ ∈ R>0 beschreibt die Induktion von Ladungsdichte in einem
Elektrolyten (Debye-Hückel Abschirmung). Die Vakuumelektrostatik ergibt sich im
Grenzübergang κ → 0. Durch den Ansatz ϕ (r) = u (r) /r auf R>0 wird das Problem
mittels ∆ (u (r) /r) = u′′ (r) /r übersetzt in die folgende (äquivalente) Aufgabe:
Problem 44 Gesucht ist eine C 1 -Funktion u : R>0 → R mit u′′ (x) − κ2 u (x) = cx
für 0 < x < R und u′′ (x)−κ2 u (x) = 0 für R < x. Dabei gilt c = −ρ0 /ε0 . Zudem ist u
so, dass die Abbildung x → u (x) /x erstens auf R>0 beschränkt ist, und zweitens ihr
Grenzwert für x → 0 existiert. Diese beiden Bedingungen werden als (uneigentliche)
’Randbedingung’ bezeichnet.
Im Bereich x > R gilt also u (x) = Ae−κx + Beκx mit Zahlen A, B ∈ R. Nur
für B = 0 ist u (x) /x im Bereich x > R beschränkt. Daher gilt u (x) = Ae−κx für
alle x > R mit A ∈ R. Im Bereich 0 < x < R ist up (x) = −cx/κ2 eine partikuläre
Lösung der dort gültigen Differentialgleichung. Somit gibt es a, b ∈ R mit
u (x) = a cosh (κx) + b sinh (κx) − c
x
für alle x ∈ (0, R) .
κ2
Der Grenzwert limx→0 u (x) /x existiert genau dann, wenn a = 0.
Somit erfüllt u die beiden Differentialgleichungen und die ’Randbedingung’ genau
dann, wenn zwei Zahlen A, b ∈ R existieren, sodass
u (x) =
Ae−κx
b sinh (κx) −
c
x
κ2
für alle x > R
.
für alle x ∈ (0, R)
(1.40)
Eine Funktion u : R>0 → R, für die Gleichung (1.40) gilt, ist genau dann stetig
differenzierbar, wenn
lim u (R + ε) = lim u (R − ε) und lim u′ (R + ε) = lim u′ (R − ε) .
ε→0
ε→0
ε→0
ε→0
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
79
Dies ist genau dann der Fall, wenn
c
c
Ae−κR = b sinh (κR) − 2 R und − κAe−κR = bκ cosh (κR) − 2 .
κ
κ
Es liegt also ein lineares Gleichungssystem für die Integrationskonstanten A, b
vor, nämlich
c
−e−κR sinh (κR)
A
R
·
= 2
.
−κR
κe
κ cosh (κR)
b
1
κ
Die Determinante der Matrix
−e−κR sinh (κR)
κe−κR κ cosh (κR)
M :=
hat den Wert det M = −κe−κR (cosh (κR) + sinh (κR)) = −κ < 0. Damit folgt, dass
A
b
=
c
· M −1
2
κ
=
R
1
c
κ3
c
−κ cosh (κR) sinh (κR)
3
κe−κR
e−κR
κ
sinh (κR) − κR cosh (κR)
.
(1 + κR) e−κR
=
·
R
1
Daraus folgt nun für das Potential
ρ
1
Φ=− 0· 2 ·
ε0 κ
−κr
(sinh (κR) − κR cosh (κR)) e κr
(1 + κR) e−κR sinh(κr)
−1
κr
für r > R
.
für 0 < r < R
(1.41)
Mit der Gesamtladung Q = (4πR3 /3) ρ0 drückt sich Φ durch x = r/R und α = κR
wie in Gl (1.42) angeführt aus.
.
−αx
Q
3
(α cosh (α) − sinh (α)) e x
für x > 1
· 3·
Φ=
(1.42)
e−α sinh(αx)
4πε0 R α
α − (1 + α)
für
0
<
x
<
1
x
Die Taylorentwicklung bezüglich α um α = 0 der Terme in der geschwungenen
Klammer ergibt im Limes κ → 0 bei festgehaltenem Ort das Coulombsche Potential
einer homogen geladenen Kugel30
Φ=
Q
·
4πε0 R
x−1
für x > 1
.
1
2
(3
−
x
)
für 0 < x < 1
2
(1.43)
−1
Figur 1.27 zeigt die Abbildung x → 4πεQ0 R
· Φ für α = 1 in grün, für α = 1/2
in rot und den Grenzfall κ → 0 in schwarz. Das Phänomen einer mit wachsendem κ
zunehmenden Ladungsabschirmung ist sichtbar.
Die elektrische Feldstärke E = − grad Φ ist stetig und erfüllt im Grenzfall κ → 0
E (p) =
30
Q
·
4πε0
p
|p|3
p
R3
für |p| > R
.
für |p| ≤ R
Ersetzung von Q/ (4πε0 ) durch −GN M in Φ ergibt das Newtonsche Gravitationspotential ΦN
einer Kugel homogener Massendichte mit Radius R und Masse M. Die Konstante GN bezeichnet
Newtons Gravitationskonstante. Die Kraft auf eine Masse m am Ort p ist dann −m gradp ΦN .
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
80
1.5
1.25
1
0.75
0.5
0.25
0
1
2
3
4
x
Abbildung 1.27: Potentialverlauf für α = 1 (grün), α = 1/2 (rot) und α = 0
Die Umlaufzeit einer Testladung q mit Qq < 0 auf einer Kreisbahn an der Grenzfläche |p| = R ist daher für κ = 0 unabhängig davon, ob die Bewegung als Grenzfall
einer Bewegung im Inneren oder Äußeren der geladenen Vollkugel formuliert wird.
Da alle Bewegungen von Testladungen mit denselben spezifischen Ladungen q/m
im Inneren der Kugel ein und dieselbe Periode haben, dauert ein Umlauf knapp
außerhalb der Grenzfläche gleich lang wie der Sturz von der Kugeloberfläche durch
den Kugelmittelpunkt zum Antipoden und zurück. Im Kontext der Gravitation impliziert dies, dass Münchhausens Sturz vom Nordpol zum Südpol und zurück gleich
lange dauert, wie der Umlauf eines erdnahen Satelliten, also ca 1, 5 h.
1.4.8
*Thomson- und Rayleighstreuung von Licht
Sei V ein Vektorraum der Dimension 3 und ·, · sei ein Skalarprodukt von V mit
zugehöriger Norm |·| . Eine elektrische Punktladung der Stärke q ∈ R sei harmonisch
an die Gleichgewichtslage 0 ∈ V gebunden. In Thomsons Modell eines Wasserstoffatoms ist dies für das Elektron, solange es sich im Inneren der positiven Ladungswolke
befindet, der Fall. Hat die Ladung die Masse m und wird sie von einer (freien, ebenen) elektromagnetischen Welle der Frequenz ω überstrichen, dann gilt für ihren
zeitabhängigen Ort γ (t)
γ̈ (t) + ω 20 γ (t) =
q
E cos (ωt − δ) für alle t ∈ R.
m
(1.44)
Dabei sind E ∈ V und δ ∈ R fest gwählt. Die Eigenfrequenz ω 0 des gebundenen
Teilchens und seine Masse m sind positiv reell und es wird ω 0 = ω angenommen.
Die angeführte Bewegungsgleichung vernachlässigt die Lorentzkraft, die von jenem
Magnetfeld ausgeht, welches das Feld E begleitet, sowie eine relativistische Teilchenkinematik.
Im Fall eines Thomsonatoms, also einer homogen positiv geladenen Kugel mit
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
81
Radius R und Ladung Ze, gilt für das eingebettete Elektron q = −e und31
ω 20 = Z
r0 c
R R
2
mit r0 =
e2
.
4πε0 mc2
Spezialisierung auf Elektronenladung und -masse in r0 ergibt den sogenannten klassischen Elektronenradius re ≈ 2, 82 · 10−15 m. Daraus folgt mit R = 0, 5 · 10−10 m und
Z = 1 für ν 0 = ω 0 /2π der Wert ν 0 ≈ 7 · 1015 Hz. Der sichtbare Frequenzbereich von
Licht erstreckt sich über das Intervall 4, 5 · 1014 Hz < ν < 8 · 1014 Hz. Ein ohne einfallende Strahlung schwingendes Elektron eines Thomsonschen H-Atoms emittiert,
soferne |γ| < R gilt, daher eine elektromagnetische Strahlung mit nur einer einzigen
Frequenz. Diese liegt im UV-Bereich. Thomsons Modell scheint mit der Wirklichkeit
also wenig zu tun zu haben, wenngleich die Größenordnung der Schwingungsfrequenz
stimmig ist.
Eine maximale partikuläre Lösung von Gleichung (1.44) ist γ p : R → V mit
γ p (t) =
qE
cos (ωt − δ) .
m (ω 20 − ω 2 )
Unter Berufung auf eine winzige - in Gleichung (1.44) nicht aufgenommene Strahlungsdämpfung - ist es plausibel, dass γ p jede Lösung der ’realen’ Schwingungsgleichung nach Ablauf des Einschwingvorgangs approximiert.
Eine auf Larmor zurückgehende Formel32 nähert (ohne Fehlerschranken anzugeben) die elektromagnetische Strahlungsleistung einer bewegten Punktladung bei
gegebenen Bewegungskurve γ : I → V. Sie besagt, dass zur Zeit t ∈ I pro Zeiteinheit ∆t eine Energie Pt (Ω) ∆t in den (messbaren) Raumwinkelbereich Ω ⊂ S2 ⊂ V
abströmt, wobei
Pt (Ω) =
n∈Ω
dP
dP
q 2 |γ̈ (t)|2 − n, γ̈ (t)
(t, n) dΩ mit
(t, n) =
dΩ
dΩ
4πε0
4πc3
2
gilt. Die Funktion dP
: I × S2 → R≥0 heißt Richtungsdichte der Strahlungsleistung.
dΩ
2
Die Größe |γ̈ (t)| − n, γ̈ (t) 2 ist das Betragsquadrat der Normalkomponente der
Beschleunigung γ̈ (t) zur Richtung n.
Die Spezialisierung von Larmors Formel auf die Bewegungskurve γ p ergibt
dP
q2
(t, n) =
dΩ
4πε0
qω 2
m (ω 20 − ω 2 )
2
|E|2 − n, E
4πc3
2
cos2 (ωt − δ) .
Für E = 0 existiert genau ein33 θ ∈ [0, π] mit n, E = |E| cos θ, sodass dann für die
über eine Schwingungsperiode zeitgemittelte Richtungsdichte dP /dΩ (n) folgt
dP
ω
(n) =
dΩ
2π
31
2π/ω
0
dP
q2
(t, n) dt =
dΩ
4πε0
qω 2
m (ω 20 − ω 2 )
2
|E|2 − n, E
4πc3
2
1
· ,
2
c bezeichnet die Lichtgeschwindigkeit, deren Wert sich aus ω 0 herauskürzt.
Siehe zB Gl 20.114 in A Zangwill, Modern Electrodynamics, Cambridge UP, 2013
33
θ ist also der ungerichtete Winkel zwischen der (linear angenommenen) Polarisationsrichtung
der elektrischen Feldstärke und der betrachteten Abstrahlungsrichtung n.
32
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
also
dP
q2
(n) = Π · sin2 θ mit Π =
dΩ
4πε0
q
m
2
|E|
2
ω2
ω 2 − ω 20
2
82
1
.
8πc3
Im Grenzfall ω 0 ≪ ω schwach gebundener Ladung gilt ω 2 / (ω 2 − ω 20 ) ≈ 1, sodass
die Strahlungsleistung frequenzunabhängig wird (Thomsonstreuung). Im Grenzfall
ω 0 ≫ ω stark gebundener Ladung hingegen gilt ω 2 / (ω 20 − ω 2 ) ≈ (ω/ω 0 )2 . In diesem
Bereich wächst die Strahlungsleistung mit (ω/ω 0 )4 (Rayleighstreuung). Von dieser
Beobachtung gehen Erkläungen für das Blau des Himmels aus.
2
Figur (1.28) zeigt den Graphen der Funktion x → (x2 / (x2 − 1)) , der die Frequenzabhängigkeit von Π als Funktion von ω/ω 0 bestimmt, im Rayleighbereich rot
und im Thomsonbereich blau. Um x = 1 ist die Funktion unbeschränkt, dh für
ω → ω 0 wächst die Strahlungsleistung unbeschränkt an. Dieser Sachverhalt weist
auf ein resonantes Anwachsen der Ausstrahlung hin, ist aber natürlich nicht beim
Wort zu nehmen. Er ist das Resultat einer unvollständigen Modellierung. Die Rückwirkung der Ausstrahlung auf die erzwungene Bewegung γ fehlt.
1.5
1.25
1
0.75
0.5
0.25
0
0
1.25
2.5
3.75
5
x
2
Abbildung 1.28: Die Funktion (x2 / (x2 − 1))
Die gemittelte Richtungsdichte dP /dΩ (n) wird vielfach auch auf die pro Flächeneinheit einfallende periodengemittelte Einstrahlungsleistung bezogen. Diese einfallende Strahlungsintensität I ist im vorliegenden Fall34 durch I = ε0 c |E|2 /2 gegeben.
Somit folgt für den differentiellen Streuquerschnitt (dσ/dΩ) (n) = dP
(n) /I
dΩ
dσ
Π
(n) = · sin2 θ.
dΩ
I
Der richtungsunabhängige Vorfaktor Π/I hat die Dimension einer Fläche:
Π
= r02 ·
I
ω2
ω 2 − ω 20
2
mit r0 =
q2
.
4πε0 mc2
Der Vektor E steht senkrecht auf die Ausbreitungsrichtung m ∈ V einer ebenen
elektromagnetischen Welle. Ist diese Ausbreitungsrichtung gewählt, dann ist E auf
34
Siehe zB Gl (16.42), (16.44) in A Zangwill, Modern Electodynamics, Cambridge UP, 2013.
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
83
den 2d Untervektorraum m⊥ eingeschränkt. Sei auch |E| > 0 gewählt und es sei die
Richtung ε = E/ |E| gleichverteilt am Einheitskreis S1m ⊂ m⊥ . Sei (ε1 , ε2 , m) eine
ONB von V. Dann gilt für den Erwartungswert der periodengemittelten Strahlungsleistung in Richtung von n
Π
dP
(n) =
dΩ
2π
2π
0
1 − n, cos (α) ε1 + sin (α) ε2
2
dα.
Aufgrund der Invarianz der Gleichverteilung auf S1m unter Drehungen um m, kann
oEdA die ONB (ε1 , ε2 , m) so gewählt werden, dass ε1 in der von n und m erzeugten
Ebene liegt. Dann folgt, dass n, ε2 = 0, und daher
1
dP
(n) = Π
dΩ
2π
2π
0
1 − cos2 (α) cos2 (θ1 ) dα = Π · 1 −
1
cos2 θ1 .
2
Dabei ist θ1 der ungerichtete Winkel zwischen ε1 und n. Für den Winkel Θ zwischen
Einfallsrichtung m und Ausstrahlungsrichtung n folgt
1−
1
1
1
1
cos2 θ1 = 1 − sin2 Θ =
2 − sin2 Θ =
1 + cos2 Θ
2
2
2
2
und somit für die perioden- und polarisationsgemittelte Strahlungsleistung als Funktion des Streuwinkels Θ zwischen Einfallsrichtung und Ausstrahlungsrichtung
dP
1
q2
q
(n) = Π · 1 + cos2 Θ mit Π =
dΩ
2
4πε0 m
2
|E|2
8πc3
2
ω2
ω 2 − ω 20
.
Schließlich wird noch die insgesamt in alle Richtungen n abgestrahlte periodengemittelte Leistung berechnet. Dazu ist n über die Einheitssphäre S2 aufzuintegrieren,
wofür sich Kugelkoordinaten zur Polarrichtung m anbieten. Dann ist Θ ≡ θ der
Polarwinkel der Kugelkoordinaten. Es gilt
π
2π
dϕ
0
0
cos2 θ sin θdθ = −
2π
3
π
0
′
cos3 θ dθ = −
2π
cos3 θ
3
θ=π
θ=0
=
4π
.
3
Daher folgt
dP
1
1
8π
(n) dΩ = Π4π 1 +
=
Π.
2
3
3
n∈S2 dΩ
Der zugehörige polarisationsgemittelte gesamte Wirkungsquerschnitt erfüllt dementsprechend
2
dσ
8π 2
ω2
σ=
(n) dΩ =
· r0 ·
.
3
ω 2 − ω 20
n∈S2 dΩ
P =
1.4.9
*Klassischer Zeemaneffekt
In der Endphase seines ungeheuer ertragreichen Entdeckerlebens, im Jahr 1862, versuchte Faraday die Erzeugung von Licht durch ein Magnetfeld zu beeinflussen.35 Er
35
Siehe p. 122-3 in N Forbes, B Mahon, Faraday, Maxwell and the electromagnetic Field, Prometheus, 2014.
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
84
färbte eine zwischen den Polen eines Elektromagneten brennende Gasflamme mit
Kochsalz ein und beobachtete, ob die Frequenz der Natrium D-Linie von der Stärke
des Magnetfeldes abhängt. Er konnte eine solche Abhängigkeit nicht nachweisen.
Erst um 1896 gelang es Zeeman mit stärkeren Magneten, als sie Fraday zur Verfügung standen, den Effekt nachzuweisen. Mit Unterstützung durch Lorentz konnte
Zeeman die entscheidende Frage nach dem Zusammenhang zwischen Polarisation
und Richtung des ausgesandten Lichtes angehen.36 So konnte geklärt werden, dass
eine negative Ladung im Atom für die Abstrahlung des Lichtes sorgt. Die folgende
Modellrechnung zeigt, wie diese Überlegung funktioniert.
Sei V ein reeller Vektorraum der Dimension 3. In V sind ein Skalarprodukt ·, ·
und eine Orientierung gewählt. Damit ist auch das Kreuzprodukt zweier Vektoren
von V erklärt. Das Elektron eines Thomsonschen Wasserstoffatoms ist im Inneren
der positiven Ladungswolke harmonisch an seine Gleichgewichtslage 0 ∈ V gebunden. Wird das Atom einem (räumlich und zeitlich konstanten) Magnetfeld B ∈ V
ausgesetzt, dann erfüllt der Elektronenort γ (t) zur Zeit t das homogen lineare System zweiter Ordnung
γ̈ (t) −
e
B × γ̇ (t) + ω 20 γ (t) = 0 für alle t ∈ R.
m
(1.45)
Hier bezeichnet −e < 0 die Ladung und m die Masse des an die positive Wolke
gebundenen Punktteilchens (Elektrons). Die Frequenzkonstante ω 0 > 0 wird vom
Radius der Ladungswolke bestimmt.
Für B = 0 wird n = B/ |B| gesetzt und die Kurve γ wie im Fall der E × BDrift in eine Komponente γ parallel zu B und eine Komponente γ ⊥ senkrecht zu
B zerlegt. Es gilt also
γ = γ + γ ⊥ mit γ = n n, γ und γ ⊥ = γ − n n, γ .
Die Bewegungsgleichungen der beiden Komponenten entkoppeln voneinander. Es
gilt erstens
(1.46)
γ̈ (t) + ω 20 γ (t) = 0 für alle t ∈ R.
Zweitens gilt mit ω = e |B| /m > 0 und Ln : n⊥ → n⊥ , v → n × v
γ̈ ⊥ (t) − ωLn γ̇ ⊥ (t) + ω 20 γ ⊥ (t) = 0 für alle t ∈ R.
(1.47)
Dabei ist n⊥ = {v ∈ V : v, n = 0} das orthogonale Komplement von R · n.
Zu jeder maximalen Lösungen γ von Gleichung (1.46) existieren Konstanten
A, B ∈ R, sodass
γ (t) = [A cos (ω 0 t) + B sin (ω 0 t)] · n für alle t ∈ R.
Die Bewegung parallel zu B bleibt also von B unbeeinflusst.
Einige maximale Lösungen von Gleichung (1.47) lassen sich über einen symmetriemotivierten Ansatz finden. Die 2-dimensionale Bewegungsgleichung (1.47) ist
36
Siehe sect 40 in F K Richtmeyer, E H Kennard, Introduction to modern Physics, McGraw-Hill,
1947.
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
85
invariant unter Drehungen um 0 und zudem autonom. Es könnten daher gleichförmige Drehbewegungen als Lösungen geben. Versuchen wir es also mit dem Ansatz
γ ⊥ (t) = eΩtLn γ ⊥
0
⊥
mit Ω ∈ R und γ ⊥
0 ∈ n . Der Ansatz löst die Differentialgleichung (1.47) genau
2
dann, wenn Ω − ωΩ − ω 20 = 0 gilt. Ω kann also einen der beiden Werte
/
ω
ω 2
+ ω 20
Ω± = ±
2
2
annehmen. Die Frequenz Ω+ ist positiv und Ω− ist negativ. Siehe Fig. (1.29).
2
1.5
1
0.5
0
0
0.5
1
1.5
2
Abbildung 1.29: Die Abbildungen ω/ω 0 → Ω+ /ω 0 (rot) und ω/ω 0 → −Ω− /ω 0 (grün)
Damit gibt es zwei 2d Räume maximaler Lösungen, die aus ’Eigenmoden’
⊥
γ⊥
± : R → n ,
⊥
⊥
t → eΩ± tLn γ ⊥
± (0) mit γ ± (0) ∈ n
bestehen. Eine Lösung γ ⊥
+ umkreist 0 mit der Kreisfrequenz Ω+ > ω 0 im Rechtsschraubensinn um B und eine Lösung γ ⊥
− umkreist 0 mit der Kreisfrequenz |Ω− | > 0
im Linksschraubensinn um B.
Der Drehsinn von γ ⊥
± überträgt sich auf die in Richtung von B bei einer Bewegung
⊥
γ ± ausgesandte Strahlung. Sie ist vollständig zirkular polarisiert, da die Bewegung
γ in Richtung von B nicht abstrahlt. (Zeeman musste ein Loch durch einen der
Magnetpole bohren, um die Flamme in Richtung n durch Polarisationsfilter und
Prisma zu beobachten.)
Anmerkungen:
1. Jede maximale Lösung von (1.47) ist Summe einer Lösung des Typs γ ⊥
+ und
einer des Typs γ ⊥
,
denn
so
lässt
sich
jede
Anfangsvorgabe
erfüllen.
Fig
(1.30)
−
Ω+ tLn
Ω− tLn
⊥
zeigt einen Bahnausschnitt von Γ = e
+ 0, 5 · e
e mit e ∈ n . Fig
Ω+ tLn
Ω− tLn
(1.31) zeigt G = |Ω− | e
+ Ω+ e
e. Hier ruht das Teilchen in den
Punkten maximalen Abstands von 0.
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
86
2. Zu Zemanns Zeit waren nur Werte von ω erreichbar, die ω/ω 0 ≪ 1 erfüllen.
Daher genügt es, die Frequenzen |Ω± | durch ihre Tangentialapproximation bei
0 zu nähern. Es gilt |Ω± | ≈ ω 0 ± ω/2. Die Verschiebung ω/2 der ungestörten
Frequenz ω 0 durch das Magnetfeld wird als Larmorkreisfrequenz bezeichnet.
Sie ist die Hälfte der Zyklotronkreisfrequenz.
3. Mit besseren Messmethoden wurde später klar, dass auch die Aufspaltung der
Natrium D-Linie in einem Magnetfeld etwas komplexer ist, als es das hier
beschriebene Modell denkbar macht. (Das Modell kennt zB keinen Spin.) Die
genaueren Messungen fanden erst eine Erklärung durch die Quantentheorie.
Abbildung 1.30: Bahn von Γ
Abbildung 1.31: Bahn von G
1.4.10
Legendresche Differentialgleichung 1
Es soll nun die Legendresche Differentialgleichung
1 − x2 y ′′ (x) − 2xy ′ (x) + n(n + 1)y(x) = 0
(1.48)
genauer behandelt werden. Natürlich kann anstelle des Definitionsintervalls (−1, 1)
auch ganz R als Definitionsbereich für die Legendresche Differentialgleichung (1.48)
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
87
gewählt werden. Da aber die Koeffizientenfunktion (1 − x2 ) vor der höchsten Ableitung y ′′ bei x = ±1 Nullstellen hat, ist die Legendresche Differentialgleichung auf
ganz R nicht von dem in Definition 40 betrachteten Typ. Auf das Legendrepolynom
Pn , das auf ganz R Lösung der Legendreschen Differentialgleichung mit Parameter
n ∈ N0 ist, soll zunächst etwas auführlicher eingegangen werden. Eine zweite, von
Pn linear unabhängige Lösung der Legendreschen Differentialgleichung auf (−1, 1),
die Legendrefunktion der „zweiten Art”, wird am Ende des Kapitels ermittelt. Sie
hat keine stetige Fortsetzung auf das abgeschlossene Intervall [−1, 1].
Definition 45 (Rodrigues’ Formel) Sei n ∈ N0 . Dann heißt das Polynom
Pn : R → R mit Pn (x) =
1
2n n!
d
dx
n
x2 − 1
n
n-tes Legendrepolynom.
Einige offensichtliche Eigenschaften der Legendrepolynome:
• Das reelle Polynom Pn hat als n-fache Ableitung eines Polynoms vom Grad
2n den Grad n.
• Pn ist als n fache Ableitung der geraden Funktion x → (x2 − 1)n Cn gerade,
falls n gerade ist und ungerade sonst. Es gilt also Pn (−x) = (−1)n Pn (x)
• Pn (1) = 1, denn wiederholtes Ableiten von (x2 − 1)n ergibt ein Polynom Q,
sodass
d
dx
=
d
dx
n
(x2 − 1)n =
d
dx
n−1
n(x2 − 1)n−1 2x
n−2
n(n − 1)(x2 − 1)n−2 (2x)2 + n(x2 − 1)n−1 2
= . . . . = n! (2x)n + (x2 − 1)Q(x).
Also folgt Pn (1) = 1.
• Pn hat genau n Nullstellen. Sie sind alle im Intervall I = (−1, 1) . Das sieht
n
man so: Das Polynom Rn (x) = (x2 − 1) hat keine Nullstelle in I, hat aber
Nullstellen in den Randpunkten von I. Nach dem Satz von Rolle hat daher
Rn′ mindestens eine Nullstelle in I. Für n > 1 hat aber Rn′ Nullstellen in den
Randpunkten von I. Daher hat wieder nach dem Satz von Rolle Rn′′ mindestens
zwei Nullstellen in I. Diese trennen die Nullstellen von Rn′ . Dieses Argument
wiederholt sich bis zur n-ten Ableitung von Rn , die ein Vielfaches von Pn
ist. Daher hat Pn mindestens n Nullstellen im Intervall I. Als Polynom n-ten
Grades hat aber Pn höchstens n Nullstellen. Somit ist die Zahl der Nullstellen
von Pn genau n und sie liegen alle in I.
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
88
• Einige Spezialfälle sind:
P0 (x) = 1,
P3 (x) =
1
3x2 − 1 ,
2
1
P4 (x) =
35x4 − 30x2 + 3 .
8
P1 (x) = x,
P2 (x) =
1
5x3 − 3x ,
2
Abbildung (1.32) zeigt die Graphen von P1 , . . . P4 im Bereich −1, 1 < x < 1, 1.
y
2
1.5
1
0.5
0
-1
-0.5
0
-0.5
0.5
1
x
-1
-1.5
Abbildung 1.32: Legendrepolynome Pn für n = 1, . . . 4
Satz 46 Für alle x ∈ R gilt (1 − x2 ) Pn′′ (x) − 2xPn′ (x) + n(n + 1)Pn (x) = 0.
Beweis. Zunächst eine Vorüberlegung: Rechne nach, dass für alle x ∈ R
(1 − x2 )
d 2
(x − 1)n + 2nx(x2 − 1)n = 0.
dx
Diese Gleichung wird nun n + 1 mal nach x differenziert. Dies gelingt überschaubar mithilfe der Leibnizregel, die für beliebige n-mal differenzierbare reellwertige
Funktionen f und g mit reellem Definitionsbereich gilt. Sie sagt
dn
(f g) =
dxn
n
k=0
n (k) (n−k)
f g
.
k
Der Beweis der Leibnizregel geht induktiv und wird weiter unten nachgeholt. Mithilfe
d
der Leibnizregel folgt mit der Abkürzung D = dx
zunächst
Dn+1 (1 − x2 )D(x2 − 1)n
*
+
n+1
n+1
n+1
2
n+2
n+1
n
= (1 − x )
D
− 2x
D
−2
D (x2 − 1)n
0
1
2
= (1 − x2 )Dn+2 − 2(n + 1)xDn+1 − n(n + 1)Dn (x2 − 1)n .
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
Analog ergibt sich
D
n+1
89
*
+
n+1
n+1
n+1
n
2nx(x − 1) =
2nxD
+
2nD (x2 − 1)n
0
1
n+1
n
2
= 2n xD
+ (n + 1) D (x − 1)n .
n
2
Daraus folgt durch Addition
0 = Dn+1 (1 − x2 )D + 2nx (x2 −1)n = (1 − x2 )D2 − 2xD + n(n + 1) Dn (x2 −1)n .
Daher löst das Polynom (n-ten Grades) cDn (x2 − 1)n für jedes c ∈ R auf ganz R die
Legendresche Differentialgleichung. Nun zum Beweis der Leibnizregel.
Lemma 47 Sei I ⊂ R und f, g : I → R. Die beiden Funktionen f und g seien
n-mal diffbar in x. Dann gilt die Leibnizregel
n
(f g)(n) (x) =
k=0
n (k) (n−k)
f g
(x) .
k
Beweis. Der Beweis wird durch Induktion geführt. Für n = 0 ist die Formel
offensichtlich richtig. Für n = 1 spezialisiert sich die Formel auf die Produktregel.
Annahme: die Formel gilt für ein n ≥ 1. Zeige nun, dass sie dann auch für n + 1 gilt,
falls f und g nicht nur n-mal, sondern n + 1-mal diffbar sind. Dazu wird
n
(f g)(n) =
k=0
n (k) (n−k)
f g
k
mithilfe der Produktregel einmal abgeleitet. Dies geht, da die Funktionen f (k) und
g (n−k) für k = 0, . . . n mindestens einmal differenzierbar sind. Es folgt
(n+1)
(fg)
n−1
=
k=0
n
=
k=1
d
=
dx
n
k=0
n (k) (n−k)
f g
=
k
n
k=0
n
k
f (k+1) g (n−k) + f (k) g (n+1−k)
n
n (k+1) (n−k)
n (n+1)
n
n (k) (n+1−k)
f
g
+
f
g+
fg (n+1) +
f g
k
k
n
0
k=1
n
n
n (k) (n+1−k)
f (k) g (n+1−k) + 1 · f (n+1) g + 1 · fg (n+1) +
f g
k−1
k
k=1
+
n *
n
n
=
+
f (k) g (n+1−k) + f (n+1) g + f g (n+1)
k
−
1
k
k=1
Aus der Definition der Binomialkoeffizienten folgt
n
n
n!
n!
+
+
=
k−1
k
(k − 1)! (n + 1 − k)! (k)! (n − k)!
*
+
(n + 1)!
k
n+1−k
n+1
=
+
=
.
k! (n + 1 − k)! n + 1
n+1
k
Damit gilt die Leibnizregel auch für n + 1 und in der Folge für alle n ∈ N0 .
Eine nützliche Eigenschaft der Legendrepolynome auf (−1, 1) ist ihre „Orthogonalität”.
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
1
−1
Satz 48 Sei n, m ∈ N0 . Dann gilt
Pn (x)Pm (x)dx =
90
2
δ .
2n+1 nm
Beweis. Sei zunächst n = m. Weiter sei oEdA n < m und daher m = 0. Dann
gilt aufgrund der Legendreschen Differentialgleichung
+
*
1
1
−1
d
2 d
(1 − x )
Pm (x)dx.
Pn (x)Pm (x)dx =
Pn (x)
m(m + 1) −1
dx
dx
−1
Partielle Integration der Ableitungen
*
+
1
d
2 d
Pn (x)
(1 − x )
Pm (x)dx
dx
dx
−1
+
1 *
dPm
2 dPn
= −
(1 − x )
(x)
(x)dx + (1 − x2 )Pn Pm′ |1−1
dx
dx
−1
führt unter Berücksichtigung des Verschwindens der Randterme schließlich zu
1
n(n + 1)
m(m + 1)
Pn (x)Pm (x)dx =
−1
1
1
Pn (x)Pm (x)dx.
−1
Wäre −1 Pn (x)Pm (x)dx = 0, dann folgte n(n + 1) = m(m + 1), was m = −n − 1
oder n = m verlangt. Beides steht im Widerspruch zu n, m ∈ N0 und n = m. Also
folgt die Behauptung für n = m.
Nun zum Fall n = m. Es gilt nach Rodrigues’ Formel und mit n-facher partieller
Integration
+* n
+
2
1
1 * n
1
d
d
n
n
2
2
2
(Pn (x)) dx =
dx
x −1
x −1
n
2n n!
dxn
−1
−1 dx
=
2
1
n
2 n!
1
−1
2
(−1)n x2 − 1
1
1
=
(−1)n x2 − 1
2n n!
−1
Einschub: Für n ∈ N0 gilt
n
1
−1
Damit folgt
1
1 − x2
n
d2n
x2 − 1
dx2n
1
(2n)!dx = (2n)! n
2 n!
n
dx = 22n+1
1
(Pn (x)) dx = (2n)! n
2 n!
−1
2
2n+1
Nun wird noch der Einschub bewiesen. Sei In :=
folgt für n ∈ N mit partieller Integration
1
In =
−1
= In−1 +
1 − x2
1
2n
1 − x2
1
x
−1
n−1
1
−1
= In−1 −
1
−1
n
1 − x2
dx.
1
dx = In−1 −
1
In .
2n
n
(1 − x2 ) dx für n ∈ N0 . Dann
−1
n
2
(n!)2
2
=
.
(2n + 1)!
2n + 1
dx = In−1 +
d
1 − x2
dx
dx
(n!)2
.
(2n + 1)!
2
2
n
x (−x) 1 − x2
1
2n
n−1
1
−1
1 − x2
dx
n
dx
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
Damit gilt für alle n ∈ N die Rekursion In =
2n
I .
2n+1 n−1
91
Ihre Auflösung ergibt
2n
2 (n − 1)
2n n!
·
In−2 = . . . =
I0
2n + 1 2 (n − 1) + 1
(2n + 1) (2n − 1) . . . · 3 · 1
2n n!
=
· 2n · (2n − 2) . . . · 4 · 2 · I0
(2n + 1) 2n (2n − 1) (2n − 2) . . . · 4 · 3 · 2 · 1
(2n n!)2
=
I0 .
(2n + 1)!
In =
Wegen I0 = 2 folgt schließlich der Einschub.
Eine Zerlegung von Pn in Monome gibt der folgende Satz.
Satz 49 Sei x ∈ R und n ∈ N. Dann gilt
1
Pn (x) = n
2
[n/2]
(−1)k
k=0
n
k
2n − 2k n−2k
x
.
n
n
Beweis. Man entwickelt das Polynom (x2 − 1) in der Formel von Rodrigues
mit dem binomischen Lehrsatz und leitet dann n-mal ab. Die Details werden in den
Übungen ausgeführt.
Der folgende Satz ist für die Multipolentwicklung der Potentialtheorie wichtig.
−1/2
Er zeigt, dass die Abbildung t → (1 − 2xt + t2 )
auf dem Intervall (−1, 1) für
x ∈ (−1, 1) die Werte Pn (x) als Koeffizienten ihrer Potenzreihe um 0 hat. Diese
Abbildung heißt daher die erzeugnede Funktion der Legendrepolynome.
Satz 50 Seien t, x ∈ (−1, 1) . Dann gilt (1 − 2xt + t2 )
−1/2
=
∞
n=0
Pn (x) tn.
Den Beweis wird in Math. Meth. 2 im Kapitel über radial separierte Lösungen
der 3d Laplacegleichung geführt. Ein direkter Beweis ist in Kap. II, §4.3.2 d von [4]
(p. 76) angedeutet.
Eine Rückführung des Legenrepolynoms Pn auf Pn−1 und Pn−2 gibt die folgende
Rekursionsrelation.
Satz 51 Für n ∈ N und x ∈ R gilt (n + 1) Pn+1 (x) = (2n + 1) xPn (x) − nPn−1 (x) .
Beweis. Die n+1 Koeffizienten eines Polynoms vom Grad n sind durch die Werte
des Polynoms an n + 1 voneinander verschiedenen Stellen festgelegt. Also gilt: Sind
zwei Polynome auf einem nichtleeren offenen Intervall gleich, so sind sie auch auf
−1/2
n
ganz R gleich. Sei daher x ∈ (−1, 1) . Leite t → (1 − 2xt + t2 )
= ∞
n=0 Pn (x) t
mit −1 < t < 1 nach t ab und multipliziere dann mit (1 − 2xt + t2 ) . Das ergibt
1
− 1 − 2xt + t2
2
−1/2
2
(2t − 2x) = 1 − 2xt + t
∞
n=1
nPn (x) tn−1 .
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
92
(Potenzreihen können gliedweise differenziert werden!) Die linke Seite hat nach dem
Satz von der erzeugenden Funktion die Potenzreihe
∞
n
n=0
xPn (x) t −
∞
Pn−1 (x) tn .
n=1
Die rechte Seite hingegen hat die Potenzreihe
∞
n
n=0
(n + 1) Pn+1 (x) t − 2x
∞
n
nPn (x) t +
n=1
∞
n=1
(n − 1) Pn−1 (x) tn .
Koeffizientenvergleich zum Monom tn ergibt für n ∈ N
xPn (x) − Pn−1 (x) = (n + 1) Pn+1 (x) − 2xnPn (x) + (n − 1) Pn−1 (x) .
Das ist äquivalent zu
(n + 1) Pn+1 (x) = (2n + 1) xPn (x) − nPn−1 (x) .
Koeffizientenvergleich zum Monom t0 ergibt P1 (x) = xP0 (x) .
Eingeschränkt auf das Intervall (−1, 1) ist die Legendresche Differentialgleichung
vom Typ der Definition 40. Es gibt daher ein Paar von linear unabhängigen Lösungen
mit Definitionsbereich (−1, 1). Die Restriktion von Pn auf (−1, 1) ist eine maximale
Lösung der auf (−1, 1) eingeschränkten Gleichung (1.48). Es soll nun eine weitere
maximale Lösung auf (−1, 1) („Legendrefunktion zweiter Art”) bestimmt werden,
die Pn zu einem Fundamentalsystem ergänzt.
1.4.11
d’Alemberts Reduktionsverfahren
Jede Lösung y einer homogen linearen Differentialgleichung zweiter Ordnung kann
lokal um einen Punkt x0 ∈ I, für den y(x0 ) = 0, mit der folgenden Methode sie heißt d’Alemberts Reduktionsverfahren - zu einem Fundamentalsystem ergänzt
werden.
Seien p und q reelle stetige Funktionen auf dem Intervall I. Seien y1 , y2 : I → R
Lösungen der linearen Diffgleichung y ′′ + py ′ + qy = 0. Dann gilt für die Wronskideterminante W : I → R, x → y1 y2′ − y1′ y2 , dass W ′ = −pW. (Übung) Daraus folgt
für x0 , x ∈ I, dass
x
W (x) = W (x0 ) exp −
p(ξ)dξ .
x0
Aus W (x0 ) = 0 folgt somit W (x) = 0 für alle x ∈ I. Für y1 (x0 ) = 0 ist y1 in einer
genügend kleinen Umgebung von x0 nirgends 0. In einer solchen Umgebung folgt
mit der Quotientenregel
W (x) = y1 (x)2
d
dx
y2
y1
(x).
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
Ersetzen von W (x) durch W (x0 ) exp −
d
dx
y2
y1
(x) =
x
x0
93
p(ξ)dξ führt auf
W (x0 )
exp −
y1 (x)2
x
p(ξ)dξ .
x0
Integration ergibt

y2 (x) = y1 (x) 
y2 (x0 )
+ W (x0 )
y1 (x0 )
x
exp −
z
x0
p(ξ)dξ
y1 (z)2
x0

dz  .
Dieser Zusammenhang zwischen den beiden Lösungen y1 und y2 kann in einer Umgebung von x0 ∈ I mit y1 (x0 ) = 0 dazu benützt werden, um etwa mit W (x0 ) = 1
und y2 (x0 ) = 0 aus einer gegebenen Lösung y1 eine zweite lokale, linear unabhängige
Lösung y2 zu berechnen.
Im Fall der Legendreschen Differentialgleichung gilt
p(x) = −
und daher mit x0 ∈ (−1, 1)
2x
d
=
ln 1 − x2
2
1−x
dx
W (x) = W (x0 ) exp − ln
1 − x2
1 − x20
= W (x0 )
1 − x20
.
1 − x2
Die Wronskideterminante eines Fundamentalsystems auf (−1, 1) divergiert somit für
x → ±1 und das Fundamentalsystem kann nicht auf das abgeschlossene Intervall
fortgesetzt werden. Das ist auch nicht verwunderlich, da aus der Legendreschen
Differentialgleichung für eine Lösung, deren Definitionsbereich x = 1 enthält,
−2y ′ (1) + n(n + 1)y (1) = 0
folgt. Daraus ergibt sich, dass die Wronskideterminante W (1) zweier beliebiger in
1 definierter Lösungen gleich 0 ist. Damit ist der Raum aller auf [−1, 1] definierten
Lösungen der Legendreschen Differentialgleichung mit Parameter n der Raum R·Pn .
Das oben skizzierte Verfahren liefert, trotz Nullstellen von Pn , eine maximale
linear unabhängige Lösung der Legendreschen Differentialgleichung auf dem ganzen Bereich (−1, 1). (Für n = 0 wird das Verfahren gar nicht benötigt.) Für den
2-dimensionalen Vektorraum Ln der auf ganz (−1, 1) definierten Lösungen der Legendreschen Differentialgleichung mit Parameter n folgt so
1+x
L0 = {αa,b | a, b ∈ R} mit αa,b (x) := a + b ln
für x ∈ (−1, 1) ,
1−x
*
+
1+x
L1 = {αa,b | a, b ∈ R} mit αa,b (x) := ax + b x ln
− 2 für x ∈ (−1, 1) .
1−x
Wir zeigen die Aussage über L1 . Wähle y1 (x) = x. Dann ergibt sich als eine
linear unabhängige Lösung auf (0, 1) die Funktion y2 mit d’Alemberts Formel
x
y2 (x) = x
x0
W (u)
du.
u2
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
94
Mit der Wahl W (x0 ) (1 − x20 ) = 1 und x0 = 1/2 folgt für 0 < x < 1
x
du
.
u2 (1 − u2 )
y2 (x) = x
1/2
Das Integral ergibt sich mittels der Partialbruchzerlegung
x2
zu
y2 (x) = x
1
1
1
= 2+
2
(1 − x )
x
2
1
1 1+x 1
ln
− + 2 − ln 3
2 1−x x
2
1
1
+
1+x 1−x
*
+
*
+
1
1+x
1
=
x ln
− 2 + x 2 − ln 3 .
2
1−x
2
Subtrahiert man auf (0, 1) von y2 die Lösung 2 − 12 ln 3 y1 und multipliziert dann
mit 2, so erhält man die Lösung
f2 (x) = x ln
1+x
− 2.
1−x
Die Funktion f2 ist die Einschränkung einer geraden C 2 -Funktion auf (−1, 1) . Diese
ergänzt daher y1 zu einem Fundamentalsystem der Legendre’schen Differentialgleichung für n = 1.
Eine Verallgemeinerung der Legendreschen Differentialgleichung ist
1 − x2 y ′′ (x) − 2xy ′ (x) + λ −
m2
1 − x2
y(x) = 0
(1.49)
auf I = (−1, 1) mit m ∈ N0 und λ ∈ R. Auch diese Gleichung heißt Legendresche
Differentialgleichung. Eine Methode zu ihrer Lösung wird im folgenden Abschnitt
über Potenzreihenlösungen erläutert. Diese Methode bringt den folgende Sachverhalt zutage: Gleichung (1.49) hat genau dann eine von 0 verschiedene Lösung, die
sich stetig auf den Rand des Intervalls (−1, 1) fortsetzen lässt, wenn λ = n(n + 1)
für ein n ∈ N0 mit n ≥ m. Dieses Faktum ist bei der Bestimmung dreidimensionaler
Potentiale und Schwingungsvorgänge bedeutsam. Dort regelt die (verallgemeinerte)
Legendresche Differentialgleichung die Abhängigkeit des betrachteten Feldes vom
Polarwinkel eines Kugelkoordinatensystems. Die stetige Fortsetzbarkeit eines Feldes
in die polare Achsensingularität der Kugelkoordinaten erzwingt dann die „Diskretisierung” von λ ∈ R zu λ ∈ {n(n + 1) | n ∈ N0 }. Genaueres dazu findet sich in der
Vorlesung Math. Meth. Phys. 2 oder in Kapitel 13 von [12].
1.4.12
Methode des Potenzreihenansatzes
Ein systematisches Verfahren, die Legendrepolynome als Lösungen der Legendreschen Differentialgleichung zu finden, ist die Methode des Potenzreihenansatzes.
Siehe Übung 22. Diese Methode funktioniert auch bei vielen anderen gewöhnlichen
homogen linearen Differentialgleichungen mit nichtkonstanten Koeffizientenfunktionen. Den Grund für das Funktionieren der einfachsten Variante der Lösungsmethode
durch Potenzreihenansatz (Frobeniusmethode) gibt der folgende Satz.
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
95
Satz 52 Sei I ⊂ R ein Intervall mit 0 ∈ I. Zwei Funktionen p und q von I nach
R mögen um 0 die Potenzreihenentwicklungen
p(x) =
∞
k
ak x und q(x) =
k=0
∞
bk xk
k=0
mit den Konvergenzradien rp > 0 und rq > 0 haben. Die Konvergenzintervalle
(−rp , rp ) und (−rq , rq ) der Potenzreihen seien in I enthalten. Dann hat die maximale Lösung αc0 ,c1 der Differentialgleichung
y ′′ (x) + p(x)y ′ (x) + q(x)y(x) = 0
zur Anfangsbedingung y(0) = c0 und y ′ (0) = c1 eine Potenzreihenentwicklung um 0
mit einem Konvergenzradius r ≥ min {rp , rq }. Es gilt dann für alle x ∈ (−r, r)
n
ck xk .
αc0 ,c1 (x) = c0 + c1 x + lim
n→∞
k=2
Die Koeffizenten ck sind für alle k ∈ {2, 3, 4, . . .} durch die Rekursionsformeln
k
(k + 1) (k + 2) ck+2 = −
k (k + 1) ck+1 = −
m=0
k−1
m=0
[(k − m + 1) am ck−m+1 + bm ck−m ] für k ∈ N0 ,
[(k − m) ak ck−m + bk ck−m−1 ] für k ∈ N0
auf c0 , c1 zurückgeführt und durch eine Wahl von (c0 , c1 ) ∈ R2 eindeutig festgelegt.
Die Beweisidee wird an den einfacheren Spezialfällen der Legendreschen und
Hermiteschen Differentialgleichung klar gemacht.
1.4.13
Legendresche Differentialgleichung 2
Für y : (−1, 1) → R gelte für alle x ∈ (−1, 1) und für ein λ ∈ R
1 − x2 y ′′ (x) − 2xy ′ (x) + λy (x) = 0.
k
Lösungsansatz: Ist y (x) = ∞
k=0 ck x eine Potenzreihe mit dem Konvergenzradius
ρ > 0, dann gilt für alle x mit |x| < ρ
′
y (x) =
′′
y (x) =
∞
k=1
∞
k=2
kck xk−1 ,
k (k − 1) ck x
k−2
=
∞
k=0
(k + 2) (k + 1) ck+2 xk .
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
96
Für x2 y ′′ (x) und xy ′ (x) gilt daher für alle x mit |x| < ρ
xy ′ (x) =
2 ′′
x y (x) =
∞
kck xk =
k=1
∞
∞
kck xk ,
k=0
∞
k
k (k − 1) ck x =
k=2
k=0
k (k − 1) ck xk .
Daraus folgt für |x| < ρ wegen x2 y ′′ (x) + 2xy ′ (x) − λy (x) =
=
∞
k=0
dass
∞
[k (k − 1) + 2k − λ] ck xk =
k
(k + 2) (k + 1) ck+2 x =
k=0
∞
k=0
∞
k=0
[k (k + 1) − λ] ck xk ,
[k (k + 1) − λ] ck xk .
Aus dem Identitätssatz für Potenzreihen folgt somit für alle k ∈ N0 die Rekursion
ck+2 = Rk ck , mit Rk :=
(k + 1) k − λ
(k + 2) (k + 1)
Die Teilfolgen (c2k )k∈N0 und (c2k+1 )k∈N0 sind über die Rekursion jeweils durch c0
und c1 festgelegt. Für alle k mit k (k + 1) > λ ist der Faktor Rk , der die Rekursion
bestimmt, für alle hinreichend großen k positiv. Es gilt also für alle k ≥ k0 mit
hinreichend großem k0
Rk :=
(k + 1) k − λ
k
λ
=
1−
(k + 2) (k + 1)
k+2
(k + 1) k
> 0.
Das Vorzeichen der Folgenglieder ck ändert sich also ab einem hinreichend großen
k0 nicht mehr.
Wenn ein n ∈ N0 existiert, für das λ = n (n + 1) gilt, folgt Rn = 0 und daher
0 = cn+2j für alle j ∈ N. (Falls solch ein n mit λ = n (n + 1) existiert, dann ist
es eindeutig, da n → n (n + 1) streng monoton ist.) Gilt λ = n (n + 1) für ein
gerades n, dann „bricht die gerade indizierte Teilfolge ab“, d.h. es gilt c2k = 0 für
alle k > n/2. Die ungerade indizierte Teilfolge bricht in diesem Fall nicht ab. Gilt
hingegen λ = n (n + 1) für ein ungerades n, dann „bricht die ungerade indizierte
Teilfolge ab“, d.h. es gilt c2k+1 = 0 für alle 2k + 1 > n, und die gerade indizierte
Teilfolge bricht nicht ab. Falls kein n ∈ N0 existiert, sodass λ = n (n + 1) , dann
folgt aus c0 = 0, dass auch c2k = 0 für alle k ∈ N. Analog folgt aus c1 = 0, dass
c2k+1 = 0 für alle k ∈ N.
Mit der Wahl c1 = 0 ergibt sich für c0 = 0 eine Potenzreihe c0 y+ mit ausschließlich geraden Potenzen. Mit der Wahl c0 = 0 und c1 = 0 hingegen ergibt sich eine
Potenzreihe c1 y− mit ausschließlich ungeraden Potenzen. Es gilt also
y+ (x) = 1 +
∞
k=1
2k
c2k x
und y− (x) = x 1 +
∞
k=1
c2k+1 x2k
.
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
97
Für λ = n (n + 1) mit n ∈ N0 ist - je nach dem ob n gerade oder ungerade ist entweder y+ oder y− ein Polynom vom Grad n, dessen Potenzreihe dann natürlich
auf ganz R konvergiert. In allen anderen Fällen ergibt sich der Konvergenzradius
von y± wie folgt.
ak
k
Der Konvergenzradius einer Potenzreihe ∞
k=0 ak x ist durch ρ = limk→∞ ak+1
gegeben, soferne dieser Limes existiert. Siehe Satz 38, §8, Kap. 3, Vol I von [3].
Anwendung dieser Formel auf die Potenzreihe y+ ergibt wegen
y+ (x) =
∞
c2k x2
k
k=0
c2k
mit ak = c2k die Konvergenz der Reihe für alle x2 < limk→∞ c2k+2
= limk→∞ (1/Rk ) =
1. Also hat y+ den Konvergenzradius 1. Analog folgt auch für y− der Konvergenzradius 1.
y+ und y− sind also gemäß Konstruktion gerade bzw. ungerade Lösungen der
Legendreschen Differentialgleichung auf (−1, 1) . Im Fall einer abbrechenden Potenzreihe mit λ = n (n + 1) gilt die Differentialgleichung sogar auf ganz R.
Sei nun u eine der beiden Funktionen y+ und y− mit nicht abbrechender Potenzreihenentwicklung. Welches Konvergenzverhalten hat die Potenzreihe von u (x) für
x → 1? Es gilt für N = k + 2n mit k, n ∈ N so, dass Rk > 0
cN =
=
λ
N
N −2
N
1−
1
N
λ
N (N − 1)
1−
N −1
·
N −4
N −2
· 1−
1−
λ
N−2
N −3
...·
k
k+2
1−
λ
k
k+1
λ
λ
...· 1 −
(N − 2) (N − 3)
(k + 1) k
· ck
k · ck .
Zwischenbehauptung: Das Produkt ΠN mit
ΠN =
1−
λ
N (N − 1)
· 1−
λ
λ
... · 1 −
(N − 2) (N − 3)
(k + 1) k
strebt für N → ∞ einem Grenzwert zu. Warum? Das sieht man so:
λ
Jeder der Faktoren π j = 1 − j(j−1)
liegt zwischen 0 und 1. Daher kann das
Produkt logarithmiert werden und es gilt ln ΠN =
das asymptotische Verhalten (Taylorentwicklung)
ln π j = −
N
j=k+1
ln π j . Für j → ∞ hat π j
λ
λ
+o
.
j (j − 1)
j (j − 1)
Daraus folgt für alle hinreichend großen j die Abschätzung
−
Die unendliche Reihe
2λ
< ln π j < 0.
j (j − 1)
∞
j=2
1
j (j − 1)
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
ist aber absolut konvergent. Daher konvergiert auch die Reihe
Stetigkeit der Exponentialfunktion folgt nun, dass
N
j=k+1
98
ln π i . Aus der
lim ΠN = lim eln ΠN = elimN →∞ ln ΠN .
N→∞
N→∞
Wegen N cN = ΠN ·k·ck gibt es somit auch ein γ > 0 mit limn→∞ (N · cN ) = γ ·ck .
Daraus folgt aber für die Koeffizienten ck+2n der Reihe für u für alle n > N0 mit
hinreichend großem N0 ∈ N die Abschätzung
ck+2n
1 γ
>
.
ck
2 k + 2n
Der Reihenrest der Reihe für u mit den Termen der Ordnung xk+2n für alle n >
N0 > k erfüllt daher für alle x > 0
∞
n=N0
∞
∞
∞
ck+2n k+2n 1
γ
1
γ k+2n γ k
x2n
x
>
xk+2n >
x
= x
.
ck
2 n=N k + 2n
2 n=N 3n
6 n=N n
0
0
0
Für x = 1 divergiert diese Reihe bestimmt gegen ∞. Daher divergiert auch die Reihe
von u bei x = 1.
Gibt es für λ = n (n + 1) eine Linearkombination von von y+ und y− , die in
beiden Randpunkten x = ±1 beschränkt ist? Nein, denn die Partialsummen der
Reihen y± divergieren wegen des gleichbleibenden Vorzeichens der Koeffizienten ck
in den beiden Randpunkten ±1 monoton. Die Partialsummen der geraden Funktion
y+ divergieren in beiden Randpunkten gleich, während jene von y− dort gegenläufig
divergieren. Damit kann eine Linearkombination zwar in einem Randpunkt konvergieren, nicht aber in beiden.
Die Funktionen y± sind also ein Fundamentalsystem der Legendreschen Differentialgleichung. Für λ = n (n + 1) ist genau eine der beiden Funktionen ein Polynom,
während die andere eine Potenzreihendarstellung mit dem Konvergenzradius 1 hat.
Eine Polynomlösung der DG ist uns jedoch schon bekannt, das Legendrepolynom
Pn , das daher eine Linearkombination von y+ und y− sein muss. Der Entwicklungskoeffizient vor der nichtpolynomialen Lösung muss aber 0 sein.
Fassen wir das Ergebnis dieser etwas längeren Überlegung zusammen zum
Satz 53 Die Legendresche Differentialgleichung auf (−1, 1) mit Parameter λ ∈ R
1 − x2 y ′′ (x) − 2xy ′ (x) + λy (x) = 0
besitzt genau dann nichttriviale maximale Lösungen mit stetiger Fortsetzung auf
[−1, 1] , wenn ein n ∈ N0 existiert, sodass λ = n (n + 1) . Für jede solche Lösung y
der Legendreschen Differentialgleichung mit λ = n (n + 1) existiert eine Zahl c ∈ R,
sodass y (x) = c · Pn (x) für alle x ∈ (−1, 1) .
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
1.4.14
99
*Hermitesche Differentialgleichung
Die Schrödingergleichung für eine Energieeigenfunktion ψ : R → R eines harmonischen Oszillators lautet mit gegebenen Konstanten m, ω, ∈ R>0
2
−
2m
ψ ′′ (x) +
mω 2 2
x ψ (x) = Eψ (x) für alle x ∈ R.
2
(1.50)
Gesucht sind jene Werte von E ∈ R, für die Gleichung (1.50) eine nichttriviale
Lösung ψ besitzt, für die der Limes
L
ψ 2 (x) dx
lim
L→∞
−L
existiert. Für solche Werte von E sind überdies die Lösungen ψ von Gleichung (1.50)
zu bestimmen. Äquivalent zu Gleichung (1.50) ist
*
+
ω
mω 2
′′
−
ψ (x) +
x ψ (x) = Eψ (x) .
(1.51)
2
mω
Über die Substitution u
mω
x = ψ (x) ist Gleichung (1.51) äquivalent zu
u′′ (ξ) − ξ 2 u (ξ) = −
2E
u (ξ)
ω
Die Bestimmung der stationären Zustände eines quantenmechanischen harmonischen Oszillators führt also nach obiger Parameterreduktion auf die folgende Fragestellung. Zu welchen Werten von ε = E/ ω ∈ R hat die auf ganz R definierte
Differentialgleichung
u′′ (x) − x2 u(x) + 2εu(x) = 0
(1.52)
eine maximale von der Nullfunktion verschiedene Lösung u : R → R, für die das
∞
uneigentliche Integral −∞ u(x)2 dx existiert?
Eine kleine Nebenrechnung zeigt: Für u : R → R gilt Gleichung (1.52) genau
dann, wenn die Funktion y : R → R mit u(x) = exp (−x2 /2) y(x) eine Lösung der
Hermiteschen Differentialgleichung mit λ := ε − 12 ∈ R
y ′′ (x) − 2xy ′ (x) + 2λy(x) = 0
(1.53)
ist. Sei Lλ der 2-dimensionale Raum der auf ganz R definierten maximalen Lösungen
von Gleichung (1.53).
Die Spiegelungssymmetrie von Lλ
Lλ hat eine nützliche Spiegelungssymmetrie: Aus α ∈ Lλ folgt nämlich mit der
Kettenregel, dass auch die gespiegelte Funktion Πα : R → R, mit Πα (x) := α (−x)
in Lλ liegt. Zu einer beliebigen Funktion α : R → R heißt α+ := 12 (α + Πα) ihr
gerader Anteil und α− := 12 (α − Πα) ihr ungerader Anteil. Es gilt dann Πα± = ±α±
und α = α+ + α− . Aus α ∈ Lλ folgt somit, dass auch α± ∈ Lλ . Es wird nun gezeigt,
dass Lλ gerade und ungerade Funktionen enthält, die nicht die Nulllösung sind.
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
100
Sei α die maximale Lösung zur Anfangsbedingung α(0) = 1, α′ (0) = 0. Daraus
folgt Πα (0) = 1 und (Πα)′ (0) = 0. Da die maximale Lösung des Anfangswertproblems eindeutig ist, gilt α = Πα. Die Lösung α ist daher gerade. Eine ganz ähnliche
Überlegung zeigt, dass die maximale Lösung β mit β(0) = 0, β ′ (0) = 1 ungerade ist.
Die gerade Lösung α erzeugt also einen 1-dimensionalen Unterraum (Lλ )+ gerader
Lösungen, und die ungerade Lösung β erzeugt einen 1-dimensionalen Unterraum
(Lλ )− ungerader Lösungen. Zusammenfassend gilt Lλ = R · α ⊕ R · β.
Potenzreihenansatz für α ∈ Lλ
Da die Koeffizientenfunktionen der Hermiteschen Differentialgleichung als Polynome eine auf ganz R konvergente Potenzreihenentwicklung um 0 haben, hat jede
maximale Lösung dieser Differentialgleichung eine auf ganz R konvergente Potenzreihenentwicklung. Der etwas schlauer gewählte Potenzreihenansatz
α(x) =
∞
k=0
ergibt
α′ (x) =
∞
k=1
kck
xk−1
=
k!
∞
k=0
ck+1
ck
xk
k!
xk
und α′′ (x) =
k!
(1.54)
∞
k=0
ck+2
xk
.
k!
Einsetzen in die Hermitesche Differentialgleichung ergibt für alle x im Konvergenzbereich der Reihe
∞
xk
[ck+2 − 2 (k − λ) ck ]
= 0.
k!
k=0
Eine Potenzreihe ist auf ihrem Konvergenzintervall genau dann überall gleich 0,
wenn alle ihre Koeffizienten gleich 0 sind. Siehe Kapitel III.8.4 in Vol I von [3]. Die
Funktion α ist somit genau dann eine Lösung von Gleichung 1.53, wenn für alle
k ∈ N0 die Rekursion
ck+2 = 2 (k − λ) ck
(1.55)
gilt. Die Koeffiziententeilfolge (c0 , c2 , c4 , . . .) , also der gerade Anteil α+ von α ist
somit durch c0 festgelegt. Analog ist (c1 , c3 , c5 , . . .) , also der ungerade Anteil α−
durch c1 eindeutig festgelegt. Es gilt α(0) = c0 und α′ (0) = c1 .
Polynomlösungen
Eine erhebliche Vereinfachung ergibt sich, falls λ = n ∈ N0 . Dann gilt nämlich
cn+2 = cn+4 = cn+6 = . . . = 0. Für gerades λ = n sind dann die geraden Lösungen
Polynome vom Grad n. Die ungeraden Lösungen sind in diesem Fall natürlich keine
Polynome. Für ungerades λ = n sind die ungeraden Lösungen Polynome vom Grad
n und die geraden Lösungen sind keine Polynome.
Für λ = 0 folgt c2 = c4 = . . . = 0. Damit ist die konstante Funktion α = 1 auf
ganz R eine Lösung. (Probe machen!)
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
101
Für λ = 1 folgt c3 = c5 = . . . = 0. Damit ist die Funktion α (x) = x auf ganz R
eine Lösung. (Probe machen!)
Für λ = 2 folgt c2 = −4c0 und c4 = c6 = . . . = 0. Damit ist die Funktion
α (x) = 2x2 − 1 auf ganz R eine Lösung. (Probe machen!)
Der folgende Satz zeigt, warum im Hinblick auf unsere Ausgangsfragestellung
den Polynomlösungen ein Sonderstatus zukommt.
Satz 54 Sei y : R → R eine Lösung von Gleichung (1.53). Dann existiert das Integral
∞
−∞
exp −x2 y(x)2 dx
genau dann, wenn y ein Polynom ist.
Beweis. Der ist ausführlich in Kap. 4.3.3 von [4] vorgeführt.
Aus der Rekursion der Koeffizienten folgt also, dass
(Lλ )pol := {α ∈ Lλ | α ist Polynom} = 0
genau dann, wenn λ ∈ N0 . Für gerades n gilt (Ln )pol = (Ln )+ und für ungerades n
gilt (Ln )pol = (Ln )− . Der Unterraum (Ln )pol ist also eindimensional. Das eingangs
erwähnte quantenmechanische Problem hat also die folgende Antwort: Gleichung
(1.52) hat eine quadratintegrable von 0 verschiedene Lösung genau dann, wenn ε =
1/2 + n für ein n ∈ N0 . Diese Lösung ist bis auf einen konstanten Faktor eindeutig
bestimmt. Die so charakterisierten Zahlen ε ∈ R werden als die Eigenwerte des
Problems bezeichnet.
Wir wenden uns nun den Polynomlösungen von Gleichung (1.53) für λ ∈ N0
etwas eingehender zu.
Definition 55 Sei n ∈ N0 und [n/2] das größte Ganze von n/2. Für gerades n ist
dies n/2 und für ungerades ist dies (n − 1)/2. Das Polynom Hn : R → R mit
[n/2]
(−1)k
Hn (x) :=
k=0
n!
(2x)n−2k
k!(n − 2k)!
(1.56)
heißt n-tes Hermitepolynom.
Bemerkung 56 Das Polynom Hn hat den Grad n und der Koeffizient von xn ist
2n und es gilt Hn (−x) = (−1)n Hn (x).
Satz 57 Für n ∈ N0 gilt (Ln )pol = R · Hn .
Beweis. Wir betrachten nur den Fall n = 2m mit m ∈ N0 . Die Funktion α
von Gleichung (1.54) ist eine Polynomlösung der Hermiteschen Differentialgleichung
genau dann, wenn c1 = 0. Dann gilt α− = 0. Für die Koeffizienten ak := c2k mit
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
102
k ∈ N0 gilt nach Gleichung (1.55) die Rekursion ak+1 = 4 (k − m) ak . Die Lösung
der Rekursion ergibt für alle k ∈ {0, 1, . . . , m}
ak = (−1)k 22k
m!
a0
(m − k)!
und ak = 0 für alle k ∈ {m + 1, . . .}. Daraus folgt
m
m
x2k
m!
x2k
α(x) =
ak
(−1)k 22k
= a0
.
(2k)!
(m − k)! (2k)!
k=0
k=0
Mit der Substitution k = m − i folgt
n/2
(−1)
α(x) = a0
n
−i
2
i=0
n
2
n
n
!
!
xn−2i = a0 2 (−1) 2
i! (n − 2i)!
n!
Mit der Wahl
a0 =
n!
n
2
n/2
(−1)i
i=0
n!
xn−2i .
i! (n − 2i)!
n
!
(−1) 2
ergibt sich α = Hn . Der Fall n = 2m + 1 wird analog bewiesen.
Hier noch einige nützliche Eigenschaften der Hermitepolynome.
Satz 58 Für alle x ∈ R gilt die Formel von Rodrigues
Hn (x) = (−1)n exp x2
dn
exp −x2
dxn
und die Rekursion Hn+1 (x) = 2xHn (x) − 2nHn−1 (x).
2
Beweis. Sei Yn (x) := (−1)n ex
dung der Leibnizregel
dn −x2
e
dxn
für alle x ∈ R. Dann folgt unter Verwen-
n
n
d −x2
2 d
n x2 d
−x2
e
Yn+1 (x) = −(−1)n ex
=
−(−1)
e
−2xe
dxn dx
dxn
*
+
n
n−1
d
d
2
2
2
= −(−1)n ex (−2x) n e−x − 2n n−1 e−x = 2xYn (x) − 2nYn−1 (x).
dx
dx
Es gilt also für alle n ∈ N die Rekusionsformel
Yn+1 (x) = 2xYn (x) − 2nYn−1 (x).
(1.57)
Damit lässt sich nun zeigen, dass Yn eine Lösung von Gleichung (1.53) ist. Zunächst
folgt aus der Produktregel Yn′ (x) =
2
(−1)n 2xex
n+1
dn −x2
2
n x2 d
e
+
(−1)
e
e−x = 2xYn (x) − Yn+1 (x)
n
n+1
dx
dx
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
103
Daraus ergibt sich
′
(x)
Yn′′ (x) = 2Yn (x) + 2xYn′ (x) − Yn+1
= 2Yn (x) + 2x [2xYn (x) − Yn+1 (x)] − [2xYn+1 (x) − Yn+2 (x)]
= 2Yn (x) + (2x)2 Yn (x) − 4xYn+1 (x) + Yn+2 (x).
Ersetzt man in der letzten Zeile Yn+2 (x) durch 2xYn+1 (x) − 2 (n + 1) Yn (x), so ergibt
sich
Yn′′ (x) − 2xYn′ (x) = −2nYn (x).
Also ist Yn eine Lösung der Hermiteschen Differentialgleichung (1.53) zu λ = n.
Überdies ist Yn offenbar ein Polynom vom Grad n und der Koeffizient vor der
höchsten Potenz ist 2n . Da der Unterraum polynomialer Lösungen von Gleichung
(1.53) zu λ = n eindimensional ist, gilt aufgrund des Eindeutigkeitsatzes, dass
Yn (x) = cn Hn (x) für alle x ∈ R. Da die Koeffizienten von xn in Yn und Hn übereinstimmen, gilt cn = 1. Somit gilt die für Yn bewiesene Rekusionsformel (1.57) auch
für Hn .
Schließlich seien noch die Polynome Hn für n = 0, 1, 2, 3 aufgelistet. Man verschafft sich z.B. H0 und H1 aus Rodrigues’ Formel und gewinnt dann die höheren
aus der Rekursion (1.57).
H0 (x) = 1,
H2 (x) = 2 2x2 − 1 ,
H1 (x) = 2x,
H3 (x) = 4x 2x2 − 3 .
Die folgenden zwei Bilder zeigen die quadratintegrablen Lösungen
hn (x) =
von Gleichung (1.52) mit ε =
1
2
exp (−x2 /2) Hn (x)
.
√
n!2n π
+ n für n = 0, 1, 2, 3. Es sind dies die Graphen von
2
exp − x2
√
h0 (x) =
,
4
π
h2 (x) =
2
x2
√ x exp −
π
2
h1 (x) =
(2x2 − 1)
x2
exp
−
√
2
2 π
,
h3 (x) =
,
x (2x2 − 3)
x2
exp
−
√
2
3 π
0.75
0.5
0.25
0
-4
-2
0
-0.25
-0.5
h0 und h1
2
4
.
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
104
0.5
0.25
0
-4
-2
0
2
4
-0.25
-0.5
h2 und h3
1.4.15
*Airys Differentialgleichung
Gesucht sind alle C 2 -Funktionen y : R → R, die Airys Differentialgleichung
y ′′ (x) − xy (x) = 0 für alle x ∈ R
(1.58)
erfüllen. Dazu genügt es, ein Fundamentalsystem im Raum der maximalen Lösungen
von Gleichung (1.58) zu finden.37
Über das qualitative Verhalten der Lösungen von Gleichung (1.58) lässt sich mit
recht allgemeinen Überlegungen schon einiges erschließen, denn es folgt ja:
• für x > 0 gilt y ′′ (x) < 0 für y (x) < 0 und y ′′ (x) > 0 für y (x) > 0
• für x < 0 gilt y ′′ (x) > 0 für y (x) < 0 und y ′′ (x) < 0 für y (x) > 0
Die Gleichung (1.58) beschreibt also einen mechanischen Oszillator, dessen ’Rückstellkonstante’ in x linear ansteigt. Im Bereich x < 0 wirkt sie tatsächlich auf die
Auslenkung rückstellend, im Bereich x > 0 verstärkt sie hingegen eine vorhandene
Auslenkung. Von den Lösungen ist also zu erwarten (und auch zu beweisen), dass
benachbarte Nullstellen für x → −∞ immer enger zusammenrücken. Für x > 0 ist
y ′ im Fall y > 0 streng monoton wachsend und im Fall y < 0 streng monoton fallend. Daraus ergibt sich, dass y im Bereich x > 0 höchstens eine Nullstelle hat. Eine
einzige der Lösungen mit y (0) = 1 konvergiert für x → ∞ gegen 0. Alle anderen
wachsen unbeschränkt gegen +∞ oder −∞.
37
Ist y eine Lösung von Gleichung (1.58), dann erfüllt die um τ ∈ R verschobene Funktion yτ mit
yτ (x) = y (x − τ) wegen (yτ )′′ (x) = (y ′′ )τ (x) = y ′′ (x − τ) = (x − τ ) y (x − τ ) = (x − τ ) yτ (x) die
Gleichung −yτ′′ (x) + xyτ (x) = τ yτ (x) . Daher lassen sich die Lösungen der stationären 1dimensionalen Schrödingergleichung mit einem linearen Potential aus den Lösungen von Airys
Differentialgleichung durch Umskalieren und Verschieben erzeugen.
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
Der Potenzreihenansatz
y (x) =
∞
105
ck xk
k=0
ergibt:
y ′′ (x) − xy (x) =
∞
k=2
ck k (k − 1) xk−2 −
= c2 · 2 · 1 +
= 2c2 +
∞
k=0
∞
′
∞
ck xk+1
k=0
′
k′ +1
ck′ +3 (k + 3) (k + 2) x
k′ =0
−
∞
ck xk+1
k=0
[ck+3 (k + 3) (k + 2) − ck ] xk+1 .
Für jede Potenzreihenlösung von Airys Differentialgleichung gilt somit
c2 = 0 und ck+3 =
ck
für alle k ∈ N0 .
(k + 3) (k + 2)
Die Rekursion führt die Koeffizienten c3 , c6 , c9 , . . . auf c0 zurück, die Koeffizienten
c4 , c7 , c10 , . . . sind durch c1 festgelegt und c5 , c8 , c11 , . . . ergeben sich durch ihre Rückführung auf c2 zu 0.
Mit der Wahl c0 = 1 und c1 = 0 ergibt sich daraus die Potenzreihe
1 3
1
1
x +
x6 +
x9 + . . .
3·2
6·5·3·2
9·8·6·5·3·2
4·1 6 7·4·1 9
1
= 1 + x3 +
x +
x + ...
3!
6!
9!
y1 (x) = 1 +
Wie vom Hauptsatz über Potenzreihenlösungen schon festgestellt, ist der Konvergenzradius dieser Reihe unendlich. Und tatsächlich gilt für den Quotienten zweier
aufeinanderfolgender nichtverschwindender Summanden dieser Reihe
,
,
ck+3 ,xk+3 ,
|x|3
=
−→ 0 für k → ∞,
ck |xk |
(k + 3) (k + 2)
sodass das Quotientenkriterium den unendlichen Konvergenzradius liefert. Die durch
die Potenzreihe auf ganz R definierte Funktion y1 ist also die maximale Lösung von
Airys Differentialgleichung zur Anfangsvorgabe y1 (0) = 1 und y1′ (0) = 0.
Mit der Wahl c0 = 0 und c1 = 1 ergibt sich analog die Potenzreihe
1 4
1
1
x +
x7 +
x10 + . . .
4·3
7·6·4·3
10 · 9 · 7 · 6 · 4 · 3
2 4 5 · 2 7 8 · 5 · 2 10
= x+ x +
x +
x + ...
4!
7!
10!
y2 (x) = x +
Auch diese Potenzreihe konvergiert auf ganz R. Die durch sie definierte maximale
Lösung erfüllt die Anfangsvorgabe y2 (0) = 0 und y2′ (0) = 1.
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
106
Die beiden Funktionen y1 und y2 sind auf R>0 positiv und streng monoton wachsend. Jeder Summand der Potenzreihe wächst für x → ∞ unbeschränkt an, sodass
dies auch y1 und y2 tun. Das Reduktionsverfahren von d’Alembert ergibt einen
Zusammenhang zwischen den beiden Lösungen y1 und y2 . Dieser ergibt sich folgendermaßen. Für die Wronskideterminante der beiden Lösungen gilt
W (0) = y1 (0) y2′ (0) − y1′ (0) y2 (0) = 1.
Da die Koeffizientenfunktion p des Ableitungsterms erster Ordnung für Airys Differentialgleichung verschwindet, spezialisiert sich die Reduktionsformel mit x0 = 0
für die beiden Lösungen y1 und y2 zu
x
y2 (x) = y1 (x)
0
1
dξ
y1 (ξ)2
zumindest für alle x ∈ R>0 , wo y1 ja keine Nullstelle hat.
Das Integral über y1−2 von 0 bis x > 0 erfüllt wegen
y1 (ξ) = 1 +
1 3 4·1 6 7·4·1 9
ξ +
ξ +
ξ + ...
3!
6!
9!
>1+
1 3
ξ
3!
die Abschätzungen
x
0<
0
1
dξ <
y1 (ξ)2
x
0
1
1 + 3!1 ξ 3
2 dξ.
Da die obere Schranke für x → ∞ gegen einen endlichen Wert konvergiert, und
x
das Integral I (x) = 0 y1 (ξ)−2 dξ in x streng monoton steigend ist, konvergiert auch
I (x) für x → ∞ gegen einen endlichen positiven Grenzwert c. Daraus lässt sich nun
schließen, dass cy1 (x) − y2 (x) für x → ∞ gegen 0 konvergiert. Das geht so: Es gilt
* ∞
+
x
∞
dξ
dξ
dξ
−
(x)
·
.
cy1 (x) − y2 (x) = y1 (x) ·
=
y
1
2
2
y1 (ξ)
y1 (ξ)2
0
0 y1 (ξ)
x
Wegen y1 (x) > 0 für x > 0 folgt daraus für alle x > 0
∞
dξ
inf {y1 (z) : x < z < ∞} · y1 (ξ)
x
∞
∞
dξ
dξ
dξ
=
<
3
y1 (x) · y1 (ξ)
y1 (ξ)
x
x
1+ ξ
0 < cy1 (x) − y2 (x) < y1 (x) ·
= y1 (x) ·
∞
< 3!
x
∞
x
3!
dξ
3!
→ 0 für x → ∞.
3 =
2x2
ξ
Im Lösungsraum von Airys Differentialgleichung existiert somit genau ein eindimensionaler Unterraum von Lösungen y mit der Eigenschaft, dass limx→∞ y (x) = 0.
Eine Mitteilung ohne Beweis38 : Die Konstante c hat den Wert
c=
38
Γ
1
3
31/3 Γ
2
3
≈ 1, 3717.
Siehe Abramowitz & Stegun, Chapt. 10.4. Ein Beweis der Behauptung ist in Chapt. 2, § 8 von
F W J Olver, Asymptotics and Special Functions, New York, 1974, nachzulesen.
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
107
(Die Gammafunktion wird in Math Meth 2 behandelt.) Die Linearkombination y0 =
c1 y1 − c2 y2 mit
c1 =
1
32/3 Γ
2
3
≈ 0, 35503 und c2 =
1
31/3 Γ
1
3
≈ 0, 25882
liegt also in dem Unterraum von Lösungen, die für x → ∞ gegen 0 konvergieren. Sie
wird üblicherweise als Airyfunktion Ai bezeichnet. Figur (1.33) zeigt ihren Graphen.
Ai
0.4
0.2
0
-15
-12.5
-10
-7.5
-5
-2.5
0
2.5
-0.2
-0.4
Abbildung 1.33: Airys Funktion
Die Airyfunktion erfüllt: y0 (0) = c1 und y0′ (0) = −c2 . Sie trennt auf R>0 die
Menge L+ aller Lösungen mit y (0) = c1 und y ′ (0) > −c2 von der Menge L− aller
Lösungen mit y (0) = c1 und y ′ (0) < −c2 . Die Elemente von L+ haben in R>0 keine
Nullstelle und wachsen für x → ∞ gegen +∞. Die Elemente von L− hingegen haben
in R>0 genau eine Nullstelle und sinken auf R>0 streng monoton und unbeschränkt
von c1 gegen −∞. Überdies gilt: Zu jedem Punkt (a, b) ∈ R>0 × (R 0) existiert
genau eine Lösung y in L+ ∪ L− mit y (a) = b. Die Graphen aller Lösungen mit
y (0) = c bilden somit für jedes beliebige c eine Faserung von R>0 × R.
Die Koeffizienten der Potenzreihen der Funktionen y1 und y2 für allgemeines k
lassen sich durch Eulers Gammafunktion ausdrücken. Deren Kenntnis wird im Rest
dieses Abschnitts vorausgesetzt.
Mit der Bezeichnung ck = c3k für alle k ∈ N0 gilt also
y1 (x) =
∞
k=0
ck x3k mit c0 = 1 und ck =
ck−1
für alle k ∈ N.
3k (3k − 1)
Die Auflösung der Rekursion ergibt unter Verwendung von Γ (x + 1) = xΓ (x) für
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
alle x ∈ R
108
(−N0 )
1
ck−2
ck−1
=
·
= ...
3k [3k − 1]
3k [3k − 1] 3 (k − 1) [3 (k − 1) − 1]
1
1
c0
=
·
· ... ·
3k [3k − 1] 3 (k − 1) [3 (k − 1) − 1]
3 · 1 (3 · 1 − 1)
1
1
1
c0
= 2k ·
·
· ... ·
1
1
3
k k − 3 (k − 1) (k − 1) − 3
1 1 − 13
ck =
=
Γ 23
1
·
32k k!Γ k +
2
3
· c0 =
Γ 23
1
·
32k k!Γ k +
.
2
3
Somit gilt für alle x ∈ R
2
y1 (x) = Γ
3
∞
k=0
x3k
32k k!Γ k +
2
3
.
Nun zur Potenzreihe von y2 . Mit der Bezeichnung ck = c3k+1 für alle k ∈ N0 gilt
y2 (x) =
∞
ck x3k+1 mit c0 = 1 und ck =
k=0
ck−1
für alle k ∈ N.
(3k + 1) 3k
Die Auflösung der Rekursion geschieht wie für y1 und ergibt für alle x ∈ R
y2 (x) = Γ
1.4.16
4
3
∞
k=0
x3k+1
32k k!Γ k +
4
3
.
Ein lineares Rand- und Eigenwertproblem
Im vorigen Abschnitt haben wir die quadratintegrablen Lösungen der Differentialgleichung (1.52) bestimmt. Nur für Werte ε ∈ N0 +1/2 hat Gleichung (1.52) eine von
der Nulllösung verschiedene, man sagt nichttriviale, quadratintegrable Lösung. Das
Problem hat eine Ähnlichkeit zu den Eigenwertproblemen der linearen Algebra: Die
Zahlen ε ∈ N0 +1/2 können als die Eigenwerte des Differentialoperators 12 (−∂x2 + x2 )
auf dem Vektorraum der quadratintegrablen (unendlich oft differenzierbaren) Funktionen und die Funktionen hn als seine Eigenvektoren aufgefasst werden. Da bei der
Bestimmung der Eigenwerte ε im vorigen Abschnitt gewisse Lücken bestehen blieben, der Satz 54 wurde ja nicht bewiesen, soll in diesem Abschnitt ein sehr einfaches
Eigenwertproblem39 eines Differentialoperators vollständig gelöst werden.
Eine maximale Lösung α einer (inhomogen) linearen Differentialgleichung n-ter
Ordnung mit Anfangswerten α(x0 ), α(1) (x0 ) . . . α(n−1) (x0 ) existiert und ist eindeutig.
Gilt ähnliches, wenn die n Vorgaben α(i) (xi ) an voneinander verschiedenen Stellen
x0 , . . . xn−1 gewählt werden? Das folgende kleine Beispiel zeigt, dass dies im allgemeinen mit Nein zu beantworten ist.
39
Diesem Eigenwertproblem kommt in der Quantenmechanik eines eingesperrten Teilchens eine
tragende Rolle zu.
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
109
Definition 59 (Homogenes Randwertproblem) Seien λ, L ∈ R mit L > 0.
Eine stetige Funktion α : [0, L] → R mit α(0) = 0 = α(L) und α′′ (x) + λα(x) = 0
d2
für alle x ∈ (0, L) heißt Lösung des homogenen Randwertproblems zu dx
2 + λ auf
[0, L].
√
√
Für λ < 0 bilden die beiden Funktionen cosh −λx und sinh −λx ein
Fundamentalsystem der Differentialgleichung auf (0, L). Mit
α(x) = A cosh
√
√
−λx + B sinh
−λx
folgt aus α(0) = 0, dass A = 0 und dann aus α(L) = 0, dass B = 0. Für λ < 0 hat
das Randwertproblem also eine eindeutige Lösung, nämlich die 0-Lösung. Für λ = 0
folgt dasselbe.
√
√
Für λ > 0 bilden die beiden Funktionen cos
λx und sin
λx ein Fundamentalsystem der Differentialgleichung auf (0, L). Mit
α(x) = A cos
√
√
λx + B sin
λx
√
folgt aus α(0) = 0, dass A = 0 und aus α(L) = 0, dass B sin
λL = 0. Dies
ist einerseits
wiederum für B = 0 erfüllt.
√ Lösungen mit B = 0 existieren aber auch
√
(wegen λL > 0) genau dann, wenn λL ∈ πN. Das Randwertproblem hat also für
2
λ = n Lπ mit n ∈ N unendlich viele Lösungen
π
α(x) = B sin n x .
L
Eine Zahl λ, für die das homogene Randwertproblem einen (mindestens) eindimend2
sionalen Lösungsraum hat, heißt Eigenwert von
Randbedin0 − dx2 zur homogenen
1
2
gung auf [0, L]. Im gegenwärtigen Beispiel ist n Lπ | n ∈ N die Menge aller Eigenwerte. Die zugehörigen Lösungsräume, auch Eigenräume genannt, sind alle eindimensional.
Der mathematische Mechanismus, der im Rahmen der Quantentheorie zur Diskretisierung von klassisch kontinuierlichen Größen, wie Energie und Drehimpuls
führt, ist eine Verallgemeinerung des hier beschriebenen.
1.4.17
*Green’sche Funktion eines Randwertproblems
Für y : [0, 1] → R gelte y ′′ (x) = b (x) mit stetiger Funktion b : [0, 1] → R. Gibt es
unter allen solchen Funktionen y eine, für die die homogene Randvorgabe y (0) =
y (1) = 0 gilt?40 Ja, es gibt genau eine. Warum?
40
Dieses Randwertproblem legt etwa das Potential im Gebiet zwischen den geerdeten Platten
eines (ebenen) Kondensators fest, wenn sich dort auch eine eben verteilte Ladungsdichte befindet.
Eine andere Interpretation gibt die Bewegung eines 1d Massenpunktes unter dem Einfluss einer
äußeren Kraft. Gesucht ist jene Bewegung, bei der sich der Massenpunkt zu den Zeiten 0 und 1 im
Nullpunkt befindet.
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
110
Ein Fundamentalsystem der homogenen Gleichung y ′′ = 0 ist (α1 , α2 ) mit α1 (x) =
1 und α2 (x) = x für alle x ∈ [0, 1] . Für jede Funktion y mit y ′′ = b auf [0, 1] existieren daher α, β ∈ R, sodass
x
y (x) = α + βx +
0
(x − ξ) b (ξ) dξ.
Die Randvorgabe für y gilt genau dann, wenn α = 0 und
1
0=β+
0
(1 − ξ) b (ξ) dξ.
Damit ist die Funktion y : [0, 1] → R mit
x
1
y (x) = −
0
x (1 − ξ) b (ξ) dξ +
0
(x − ξ) b (ξ) dξ
die eindeutige Lösung der inhomogenen Gleichung mit der homogenen Randvorgabe.
Durch Aufspalten des Integrals von 0 bis 1 in eines von 0 bis x und eines von x
bis 1 ergibt sich:
x
1
[(x − ξ) − x (1 − ξ)] b (ξ) dξ −
y (x) =
0
x
0
x (1 − ξ) b (ξ) dξ
1
ξ (x − 1) b (ξ) dξ −
=
x
x
x (1 − ξ) b (ξ) dξ
1
=
Γ (x, ξ) b (ξ) dξ.
0
Hierbei gilt für die Funktion Γ : Q = [0, 1] × [0, 1] → R
Γ (x, ξ) =
ξ (x − 1) für 0 ≤ ξ ≤ x ≤ 1
.
x (ξ − 1) für 0 ≤ x ≤ ξ ≤ 1
(1.59)
Offensichtlich ist Γ stetig und es gilt Γ (x, ξ) = Γ (ξ, x) auf Q. Die Einschränkungen der Funktion Γ (·, ξ) auf [0, ξ] und [ξ, 1] sind jeweils Lösungen der homogenen
Gleichung y ′′ = 0. Bei x = ξ macht ihre Ableitung jedoch einen Sprung um 1, d.h.
es gilt
lim Γ′ (·, ξ)|x=ξ+ε − lim Γ′ (·, ξ)|x=ξ−ε = 1.
ε→0
ε→0
Weiter gilt für jedes ξ ∈ [0, 1] , dass Γ (0, ξ) = Γ (1, ξ) = 0. Die Funktion Γ heißt
Green’sche Funktion zu y ′′ = 0 und zur Randvorgabe y (0) = y (1) = 0. Sie ist eine
durch die Randvorgabe eindeutig festgelegte Fundamentallösung von y ′′ = 0 mit
nichtdifferenzierbarer Stelle bei ξ ∈ [0, 1] . Sie legt - selbst unabhängig von b - die
der Inhomogenität b zugehörige eindeutige Lösung des halbhomogenen Randwertproblems über eine Integration fest. Wir fassen zusammen:
Satz 60 Sei b : [0, 1] → R stetig. Für y : [0, 1] → R gelte y ′′ = b und y (0) = y (1) =
0. Dann gilt für alle x ∈ [0, 1] mit der Green’schen Funktion Γ aus Gleichung (1.59)
1
Γ (x, ξ) b (ξ) dξ.
y (x) =
0
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
111
Diese Lösungsformel mittels eines linearen Integraloperators lässt sich auf allgemeinere lineare Randwertprobleme erweitern. Siehe etwa Kap. V, §26 in [18]. Die
Green’sche Funktion hängt dann natürlich vom homogenen Teil der Differentialgleichung und den Randbedingungen ab.
Im Fall der Differentialgleichung y ′′ = b auf dem Intervall [0, 1] existiert also
genau eine Lösung y mit der Randvorgabe y (0) = y (1) = 0. Für b = 0 entspricht dies
d2
der uns schon bekannten Tatsache, dass 0 kein Eigenwert von − dx
2 zur homogenen
Randbedingung auf [0, 1] ist. Welche Lösungen hat aber die inhomogene Gleichung
y ′′ + y = b mit stetiger Funktion b : [0, π] → R wenn y (0) = y (π) = 0 als homogene
Randvorgabe verlangt wird? Wir wissen ja, dass y (x) = C sin x für jedes C ∈ R
eine Lösung im homogenen Fall b = 0 ist.
Ein Fundamentalsystem der homogenen Gleichung ist (α1 , α2 ) mit α1 (x) = cos x
und α2 (x) = sin x. Daher gibt es für jede Lösung y von y ′′ + y = b Zahlen α, β ∈ R,
sodass für alle x ∈ [0, π]
x
sin (x − ξ) b (ξ) dξ
y (x) = α cos x + β sin x +
0
gilt. Die Randvorgabe y (0) = 0 gilt genau dann, wenn α = 0. Für α = 0 folgt mit
sin (π − ξ) = sin ξ
π
y (π) =
0
π
sin (π − ξ) b (ξ) dξ =
sin (ξ) b (ξ) dξ,
0
da ja β sin π = 0 gilt. Die Bedingung y (π) = 0 lässt sich daher genau dann erfüllen,
wenn für die Inhomogenität b die „Orthogonalitätsbedingung”
π
sin (ξ) b (ξ) dξ = 0
0
gilt. Wenn diese erfüllt ist, dann hat das Randwertproblem unendlich viele Lösungen.
Andernfalls hat es keine einzige Lösung.
Mithilfe der Orthogonalitätsbedingung lässt sich nun eine Greensche Funktion
für das vorliegende Randwertproblem finden. Es gilt
π
x
sin (|x − ξ|) b (ξ) dξ =
0
0
π
sin (x − ξ) b (ξ) dξ −
sin (x − ξ) b (ξ) dξ
x
(1.60)
Umformen des zweiten Integrals mit dem Sinussatz ergibt
π
x
π
sin (x − ξ) b (ξ) dξ = sin (x)
x
π
cos (ξ) b (ξ) dξ − cos (x)
sin (ξ) b (ξ) dξ.
x
Aus der Orthogonalitätsbedingung folgt
π
x
x
sin (ξ) b (ξ) dξ = −
sin (ξ) b (ξ) dξ.
0
Weiter gilt
π
π
cos (ξ) b (ξ) dξ =
x
0
x
cos (ξ) b (ξ) dξ −
cos (ξ) b (ξ) dξ.
0
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
112
Daraus folgt nun
π
sin (x − ξ) b (ξ) dξ = sin (x)
x
*
π
x
cos (ξ) b (ξ) dξ −
0
x
+ cos (x)
0
sin (ξ) b (ξ) dξ
0
x
= −
cos (ξ) b (ξ) dξ
0
+
π
sin (x − ξ) b (ξ) dξ + sin (x)
cos (ξ) b (ξ) dξ.
0
Einsetzen in (1.60) ergibt
π
0
x
sin (|x − ξ|) b (ξ) dξ = 2
π
sin (x − ξ) b (ξ) dξ − sin (x)
0
cos (ξ) b (ξ) dξ.
0
Sei nun die Green’sche Funktion Γ : Q = [0, π] × [0, π] → R so, dass Γ (x, ξ) =
1
sin (|x − ξ|) für alle (x, ξ) ∈ Q. Dann gilt also
2
x
0
π
sin (x − ξ) b (ξ) dξ =
Γ (x, ξ) b (ξ) dξ +
0
sin (x)
2
π
cos (ξ) b (ξ) dξ.
0
Γ ist stetig und es gilt Γ (x, ξ) = Γ (ξ, x) auf Q. Die Ableitung von Γ (·, ξ) springt
bei x = ξ um 1. Aber Achtung41 : 2Γ (0, ξ) = sin ξ = 2Γ (π, ξ) = 0 für alle ξ ∈ (0, π) .
Wir fassen diese Ergebnisse zusammen:
Satz 61 Sei b : [0, π] → R stetig und es gelte die Orthogonalitätsbedingung
π
sin (ξ) b (ξ) dξ = 0.
0
Eine C 2 -Funktion y : [0, π] → R ist Lösung von y ′′ + y = b mit y (0) = y (π) = 0
genau dann, wenn eine Zahl β ∈ R existiert, sodass für alle x ∈ [0, π]
1
y (x) = β sin x +
2
π
0
sin (|x − ξ|) b (ξ) dξ.
Für eine Funktion b, die die Orthogonalitätsbedingung nicht erfüllt, hat das Randwertproblem keine Lösung.
1.5
*Harmonisch angeregte lineare Schwingung
In diesem Abschnitt wird auf einen sehr speziellen Fall von inhomogen linearen Gleichungen zweiter Ordnung mit konstanten Koeffizienten ausführlicher eingegangen,
auf die Gleichung einer gedämpften, linearen Schwingung mit „harmonischer“ äußerer Anregung. Die mechanische Bewegungsgleichung für die Auslenkung ξ eines
41
Das sollte nicht verwundern, denn der Einheitskraftstoß auf den Oszillator erfüllt die Orthogonalitätsbedingung nicht! Daher gibt es auch keine Fundamentallösung zu y ′′ + y = 0, die in 0
und π Nullstellen hat.
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
113
eindimensionalen, linearen Oszillators der Masse m, der von einer zeitabhängigen
Kraft F angetrieben wird, lautet
ξ̈ + 2ρξ̇ + ω 20 ξ = F/m.
Hier sind ω 0 , m ∈ R>0 und ρ ∈ R≥0 . Die Funktion F : R → R sei stetig. Eine sogenannte ’harmonische’ Anregung ist eine Kraftfunktion F, für die F (t) =
A cos (ωt − δ) mit A, ω, δ ∈ R für alle t ∈ R gilt.42
Mit der dimensionslosen Zeit x := ω 0 t, dem dimensionlosen Dämpfungsparameter α := ρ/ω 0 ∈ R≥0 ergibt sich für y(x) := ξ(t) die parameterbereinigte Gleichung
y ′′ + 2αy ′ + y = g
(1.61)
mit der Inhomogenität g := F/mω 20 . Das dazu äquivalente System erster Ordnung
für (y 1 , y 2 ) := (y, y ′ ) ist
d
dx
y1
y2
0
1
−1 −2α
=
y1
y2
+
0
g
.
(1.62)
Nach den Sätzen über inhomogen lineare Systeme erster Ordnung gibt es für x0 ∈ R
und für v ∈ R2 genau eine Lösung γ v : R → R2 von (1.62) mit γ v (x0 ) = v. Daher
existiert zu jedem x0 ∈ R und zu jedem (a, b) ∈ R2 genau eine Lösung y : R → R
von (1.61) mit y(x0 ) = a und y ′ (x0 ) = b. Ist ypart eine maximale Lösung von (1.61),
dann gilt für die Menge aller maximalen Lösungen Lg dieser Gleichung
Lg = L0 + ypart .
Hier ist L0 der Vektorraum der maximalen Lösungen von (1.61) mit g = 0.
1.5.1
Übersicht über L0
Einsetzen der Versuchsfunktion y : R → R mit y(x) = exp (µx) für ein µ ∈ R in
(1.61) ergibt: y ist Lösung genau dann, wenn µ Nullstelle des reellen „charakteristischen“ Polynoms P zweiten Grades mit
P (λ) := λ2 + 2αλ + 1 = (λ + α)2 − α2 − 1
ist, dh wenn P (µ) = 0. Für einer Diskussion der Nullstellenmenge von P ist eine
Trennung der Fälle α > 1, α = 1 und 0 ≤ α < 1 hilfreich.
1. Überkritische Dämpfung: α > 1. Das charakteristische Polynom P hat
zwei (reelle) Nullstellen. Es sind dies
√
µ± = −α ± α2 − 1.
42
Die Bezeichnung ’harmonisch’ dürfte in der Tatsache gründen, dass eine solche (monofrequente)
Schwingung eines menschlichen Trommelfells von seinem zugehörigen Gehirn als rein oder ’harmonisch’ empfunden wird. Aber Achtung: In der Theorie der partiellen Differentialgleichen wird der
Begriff ’harmonische Funktion’ mit einer gänzlich anderen Bedeutung verwendet.
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
114
Es gilt: −2α < µ− < µ+ < 0. Die beiden zu den Nullstellen gehörigen Lösungen
y± : R → R mit
y+ (x) = eµ+ x, y− (x) = eµ− x
sind im Fall α > 1 linear unabhängig und daher eine Basis des Lösungsraumes
L0 oder ein sogenanntes Fundamentalsystem von (1.61). Dies zeigt man etwa
mithilfe der Wronskideterminante bei 0. Beide Lösungen y+ , y− sind streng
monoton fallend. Sie werden für α = 3/2 von Abbildung (1.34) gezeigt.Die
y
1.5
1.25
1
0.75
0.5
0.25
0
-0.5
0
0.5
1
1.5
2
2.5
3
x
Abbildung 1.34: Fundamentalsystem für α = 3/2, y+ strichliert
Lösung y+ − y− für α = 3/2 zeigt Figur (1.35). Die Auslenkung schwingt
einmal durch 0 und kehrt für x → ∞ dorthin zurück. Für große negative x
dominiert y− und für große positive x dominiert y+ . Jargon: Eine Lösung hat
im allgemeinen zwei Zeitskalen eine schnelle (µ− ) und eine langsame (µ+ ).
y
0.5
0.25
0
0
-0.25
1.25
2.5
3.75
5
x
-0.5
-0.75
-1
Abbildung 1.35: Die Überschwinglösung y+ − y−
Für die zum Fundamentalsystem (y+ , y− ) gehörigen physikalisch parametrisierten Funktionen ξ + und ξ − gilt
√
− ρ∓ ρ2 −ω20 t
für alle t ∈ R.
ξ ± (t) = e
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
115
2. Kritische Dämpfung: α = 1. Das charakteristische Polynom P hat genau
eine (reelle) Nullstelle. Es ist dies µ0 = −1. Die zugehörige Lösung ist y1 (x) :=
exp(−x). Eine weitere Lösung wird mit dem Ansatz xn exp(−x) gesucht. Sie
ergibt sich zu y2 (x) = x exp(−x). Die beiden Funktionen y1 , y2 : R → R mit
y1 (x) = e−x ,
y2 (x) = xe−x
sind ein Fundamentalsystem von (1.61) für α = 1. Abbildung (1.36) zeigt die
Funktionen y1 (rot) und y2 (grün).
y
1.25
1
0.75
0.5
0.25
0
0
-0.25
1.25
2.5
3.75
5
x
Abbildung 1.36: y1 und y2 für α = 1 (kritische Dämpfung)
3. Unterkritische Dämpfung: α < 1. Das charakteristische Polynom hat keine
reelle Nullstelle. Es hat dann zwei Nullstellen über C. Diese sind
√
µ± = −α ± i 1 − α2 .
, ,
Es gilt: µ− = µ∗+ , ,µ+ , = 1, ℜµ+ ≤ 0 und ℑµ+ > 0. Die Nullstelle µ+
liegt am Einheitskreis im 2. Quadranten. Die Funktion exp µ+ x ist nicht
reellwertig, aber da die Koeffizienten der Diffgleichung (1.61) reell sind, sind
die reellen Funktionen yi : R → R mit
√
1 − α2 x
√
: x → ℑ exp µ+ x = e−αx sin
1 − α2 x
y1 : x → ℜ exp µ+ x = e−αx cos
y2
Lösungen von (1.61), wenn 0 ≤ α < 1 gilt. Sie bilden ein Fundamentalsystem.
Eine Dämpfung α > 0 verlangsamt die Schwingung gegenüber dem ungedämpften Fall α = 0. Darüberhinaus sorgt sie wie in den Fällen 1) und 2) für
ein Abklingen
√ des Schwingungsvorgangs. Die beiden Zeitskalen der Lösungen
sind α und 1 − α2 . Die Lösungen sind nur für α = 0 periodisch. Für α ≥ 0 haben aber benachbarte Nulldurchgänge
√ und benachbarte Maxima voneinander
den gleichbleibenden Abstand 2π/ 1 − α2 . (Übung!) Für die zum Fundamentalsystem (y1 , y2 ) gehörigen, physikalisch parametrisierten Funktionen ξ 1 und
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
116
ξ 1 gilt
ξ 1 (t) = e−ρt cos
ω 20 − ρ2 t ,
ξ 2 (t) = e−ρt sin
ω 20 − ρ2 t .
Für α = 1/10 zeigt Abbildung (1.37) das Fundamentalsystem (y1 , y2 ).
y
1.5
1
0.5
0
-5
0
5
10
15
20
25
x
-0.5
-1
Abbildung 1.37: Fundamentalsystem (y1 , y2 ) für α = 1/10; y2 strichliert
Für jede reelle Linearkombination y = c1 y1 + c2 y2 = 0 existiert genau ein Paar
von Zahlen
*
2π
(a, x0 ) ∈ R>0 × 0, √
,
1 − α2
sodass für alle x ∈ R
√
y(x) = ae−αx cos
1 − α2 (x − x0 ) .
Diese Zahlen sind bestimmt durch
√
c1 = a cos
1 − α2 x0 ,
c2 = a sin
√
1 − α 2 x0 .
(Nachrechnen mit Additionstheorem für sin und cos . Übung!) Jedes Element
von L0 ist somit ein Translat eines Vielfachen von y1 (und auch von y2 ).
1.5.2
Partikuläre Lösungen ypart für harmonische Kraft
F0
ω
Sei F (t) = F0 cos(ωt) mit ω ∈ R>0 und F0 ∈ R. Daher gilt g(x) = mω
x .
2 cos
ω0
0
ω
Suche eine Lösung ypart von (1.61) für g0 (x) = cos(qx) mit q := ω0 ∈ R>0 .
Zunächst jedoch etwas allgemeiner: Suche komplexwertige Lösungen yc von (1.61)
für die Inhomogenität g(x) = exp(µx) mit µ ∈ C. Auf dem C-VR V der zwei
mal diffbaren Funktionen von R nach C ist die lineare Abbildung L durch L [y] =
y ′′ + 2αy ′ + y definiert. Für die gesuchte Funktion yc gilt daher
L [yc ] (x) = eµx .
(1.63)
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
117
Es gilt L [exp (µx)] = P (µ) exp (µx) , mit P (λ) = λ2 + 2αλ + 1 (charakteristisches
Polynom von L). Dieses dient der folgenden Fallunterscheidung.
1. P (µ) = 0: Falls µ keine (möglicherweise komplexe) Nullstelle von P ist, dann
ist yc : R → R mit
1 µx
yc (x) =
e
P (µ)
eine Lösung von (1.63).
2. P (µ) = 0, P ′ (µ) = 0: Dies ist der Fall für µ ∈ µ+ , µ− . Es gilt dann
*
+
∂ µx
∂
µx
=
L [xe ] = L
e
L [eµx ]
∂µ
∂µ
∂
=
(P (µ)eµx ) = (P ′ (µ) + xP (µ)) eµx = P ′ (µ)eµx .
∂µ
Somit ist die Funktion yc : R → R mit
yc (x) =
xeµx
P ′ (µ)
eine Lösung von (1.63).
3. P (µ) = 0, P ′ (µ) = 0 : Dies ist genau dann der Fall, wenn α = 1 (Doppelnullstelle, kritische Dämpfung) und µ = −1. Dann gilt wegen P ′′ = 2
2
3
2
2
∂
∂
2 µx
µx
=L
L xe
e
=
L [eµx ]
∂µ
∂µ
=
∂2
(P (µ)eµx ) = P ′′ (µ) + 2xP ′ (µ) + x2 P (µ) eµx = 2eµx .
∂µ2
Somit ist die Funktion yc : R → R mit
yc (x) =
x2 eµx
2
eine Lösung von (1.63).
Zur Inhomogenität g0 (x) = cos(qx) = ℜ exp(iqx) gewinnt man Lösungen wie
folgt. Wähle in den partikulären Lösungen yc zur Inhomogenität exp(µx) den Parameter µ = iq und nehme davon den Realteil
ypart := ℜyc .
Dann gilt wegen der Linearität von L, dass ypart : R → R eine Lösung von (1.61)
mit g0 (x) = cos(ωx) ist.
Der Fall 3) tritt für α ∈ R≥0 nicht ein wegen der beiden für q ∈ R>0 unverträglichen Bedingungen µ = iq und µ = −1.
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
118
Der Fall 2) liegt genau dann vor, wenn µ = iq = µ+ . Die Nullstelle µ+ ist genau
dann rein imaginär, wenn α = 0. Dann gilt µ+ = i und daher q = 1. Dies ist der
Fall einer ungedämpften Schwingung mit resonanter Erregungsfrequenz ω = ω 0 . Es
gilt dann P ′ (µ) = 2µ + 2α = 2i. Die Lösung ypart : R → R ergibt sich damit zu
x
x exp(ix)
= sin(x).
2i
2
Das ist eine aperiodische Schwingung. Sie wird von Abbildung (1.38) gezeigt. Für
die physikalisch parametrisierte Lösung ξ part zu F (t) = F0 cos(ωt) ergibt sich mit
(ω0 t)
ξ part (t) = F0 ypart
. Es folgt
mω2
ypart (x) = ℜ
0
ξ part (t) =
F0 t sin(ω 0 t)
für alle t ∈ R.
m 2ω 0
y
15
10
5
0
-20
-10
0
10
-5
20
x
-10
-15
Abbildung 1.38: ξ part und cos für ω 0 = 1
Der Fall 1) ist der typische und reichhaltigste. Er liegt genau dann vor, wenn
(α, q) = (0, 1). Es gilt P (µ) = P (iq) = −q 2 + 2αiq + 1. Damit folgt in diesem Fall
ypart (x) = ℜ
exp(iqx)
.
1 − q 2 + i2αq
(1.64)
Zur Berechnung des Realteils des Quotienten ist eine Fallunterscheidung hilfreich.
Wir unterscheiden danach, ob der Nenner reell ist, oder nicht.
a) Reeller Nenner: Die Zahl P (iq) = 1 − q2 + i2αq ist für α = 0 reell und nicht
Null, da ja (α, q) = (0, 1) vorausgesetzt ist. Für ypart : R → R folgt
ypart (x) =
cos(qx)
.
1 − q2
Dies ist eine ungedämpfte Schwingung mit nichtresonanter Erregungsfrequenz. Die
physikalisch parametrisierte Lösung ξ part : R → R zu F (t) = F0 cos (ωt) ergibt sich
(ω0 t)
mit ξ part (t) = F0 ypart
. Es folgt
mω 2
0
ξ part (t) =
F0 cos(ωt)
für alle t ∈ R.
m ω 20 − ω 2
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
119
In diesem ungedämpften, nichtresonanten Fall folgt die (periodische) Schwingung
der Erregung für ω 0 > ω ohne Phasenschub mit der Amplitude
F0
F0
1
.
2 ≥
2
mω 0 1 − (ω/ω 0 )
mω 20
Die Maxima der treibenden Kraft fallen mit den Maxima der Schwingung zusammen
und die Amplitude ist größer als die Auslenkung des statisch belasteten Oszillators.
Für ω 0 < ω hingegen ist die Schwingung gegenüber der Erregung um eine halbe
Periode versetzt. Die Maxima der Kraft fallen auf Minima der Schwingung. Abbil−1
dung (1.39) zeigt die Funktion x → |1 − x2 | .
3.5
3
2.5
2
1.5
1
0.5
0
0.5
1
1.5
2
2.5
3
−1
Abbildung 1.39: Die Amplitudenfunktion |1 − x2 |
b) Der Nenner ist nicht reell: Für α > 0 liegt P (iq) = 1 − q 2 + i2αq wegen
q > 0 in der oberen Halbebene. Als Beispiel zeigt Abbildung (1.40) die Menge
P (iR>0 ) = {1 − q 2 + i2αq | q ∈ R>0 } ⊂ C für α = 1/2.
2
y
1.5
1
0.5
0
-3
-2
-1
0
1
x
Abbildung 1.40: P (iR>0 ) für α = 1/2
Die Polardarstellung des Nenners P (iq) = 1 − q 2 + i2αq ist hilfreich bei der
Berechnung des Realteils von ypart nach (1.64). Für jedes z ∈ C 0 existiert genau
ein δ ∈ [0, 2π) mit z = |z| exp(iδ). Die Zahl δ heißt das Argument von z. Sie ist
implizit durch ℜ(z) = |z| cos(δ) und ℑ(z) = |z| sin(δ) bestimmt. Die Abbildung arg :
C 0 → [0, 2π) , z → arg(z) heißt Argumentfunktion. Für z in der oberen Halbebene
gilt δ = arg(z) ∈ (0, π). Die Funktion arccot : R → (0, π) ist die Umkehrfunktion
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
120
y
2.5
2
1.5
1
0.5
-5
-2.5
0
2.5
5
x
Abbildung 1.41: Der Graph von arccot
von cot = cos
auf (0, π). Den Graphen von arccot zeigt Abbildung (1.41). Der Nenner
sin
P (iq) hat somit die Polardarstellung
(1 − q 2 )2 + (2αq)2 exp i arccot
1 − q 2 + i2αq =
1 − q2
2αq
.
Daraus folgt
ypart (x) =
ℜ exp(iqx − iδ)
(1 − q 2 )2 + (2αq)2
=
cos(qx − δ)
(1 − q 2 )2 + (2αq)2
mit
1 − q2
δ = arccot
.
2αq
Die periodische Schwingung ypart geht der Kraft um den Phasenschub 0 < δ < π
und mit einer dynamisch bestimmten Amplitude voran. Für q > 1 gilt limα→0 δ = π
und für q < 1 gilt limα→0 δ = 0. Für q = 1 gilt limα→0 δ = π/2.
Den Graphen der Funktion
Φ : R>0 → (0, π) ,
q→
1
1 − q2
arccot
π
2αq
zeigt Abbildung (1.42) für α = 1/5, für α = 1 (rot) und α = 2 (grün).
Der Amplitudenfaktor in ypart (x), nämlich die Funktion σ α : R>0 → R>0 mit
σ α (q) =
1 − q2
2
+ (2αq)2
−1/2
heißt dynamische Suszeptibilität des Oszillators. Sie bestimmt die Amplitude von
ypart . Es gilt
lim σ α (q) = 1 und lim σ α (q) = 0.
q→0
q→∞
Abbildung (1.43) zeigt σ α für die unterkritisch gedämpften Fälle α = 1/3, α = 1/15
(rot) und α = 3/4 (grün) im Bereich 0 < q < 2. Eine Verstärkung der Schwingungsamplitude im Bereich q ≈ 1 ist für α = 1/15 sichtbar. Bei schwächerer Dämpfung ist
die Verstärkung ausgeprägter. Bei stärkerer Dämpfung scheint sie zu fehlen. Warum?
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
121
0.8
0.6
0.4
0.2
0
0
1.25
2.5
3.75
5
q
Abbildung 1.42: Φ für α = 1, 5 (schwarz), α = 1 (rot) und α = 2 (grün)
7.5
6.25
5
3.75
2.5
1.25
0
0.5
1
1.5
2
q
Abbildung 1.43: σ α für α = 1/15 (rot), α = 1/3 (schwarz) und α = 3/4 (grün)
Der Amplitudenfaktor σ α hat ein lokales Maximum, wenn
σ ′α
(q) = −
−2 (1 − q 2 ) + (2α)2
(1 − q 2 )2 + (2αq)2
3/2
q=0
gilt. Dies ist genau dann der Fall, wenn −2 (1 − q 2 ) + (2α)2 = 0, wenn also 1 −
2
2α√
= q 2 . Ein lokales Maximum besitzt der Amplitudenfaktor daher nur für α <
1/ 2 ≈ 0, 71. Das Maximum hat den Wert
σ α (qmax ) =
1
2 )2 + (2α)2 q 2
(1 − qmax
max
=
1
(2α2 )2 + (2α)2 (1 − 2α2 )
=
1
√
.
2α 1 − α2
√
Für α ր 1/ 2 konvergiert qmax gegen 0 und σ α (qmax ) gegen 1. Für α2 ≥ 1/2 ist die
Funktion σ α streng monoton fallend.
Die physikalisch parametrisierte Lösung ξ part zu F (t) = F0 cos(ωt) ergibt sich
(ω0 t)
aus ξ part (t) = F0 ypart
. Mit q = ω/ω 0 folgt
mω2
0
ξ part (t) =
F0 cos(ωt − δ)
mω 20
(1 −
q 2 )2
+ (2αq)
2
=
F0
m
cos(ωt − δ)
(ω 20
−
2
ω2 )
+ (2ρω)
2
.
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
122
Für den Phasenschub δ folgt
δ = arccot
1.5.3
ω 20 − ω 2
2ρω
.
Qualitatives Resümee
Jede Lösung der inhomogenen Gleichung (1.61) ist vom Typ y = y0 + ypart mit
y0 ∈ L0 . Für α > 0 konvergiert y0 (x) für x → ∞ gegen 0 und y schmiegt sich
daher für x → ∞ an ypart . Jede gedämpfte, harmonisch getriebene Schwingungen
nähert sich also der Lösung ypart . Der Einfluß der Anfangsbedingungen wird durch
die Dämpfung praktisch ausgelöscht.
Einwand: Keine reale Kraft produziert cos auf ganz R. Entgegnung: Ist die Kraft
auf einem hinreichend großen reellen Intervall I vom Typ cos, dann ist die hier
diskutierte Funktion ypart für Zeiten aus dem späteren Teil von I, auf dem der Einfluß
der Vorgeschichte bereits schwach ist, eine Näherung der Lösung zur tatsächlichen
Inhomogenität.
Frage: Warum verdient der sehr spezielle Fall einer cos-Kraft so große Aufmerksamkeit? Antwort: Die Theorie der Fourieranalyse zeigt, dass sich eine große
Klasse von Funktionen durch Summen (Integrale) von cos und sin Funktionen diverser Frequenzen beliebig gut approximieren lassen. Sei g eine solche Funktion,
also
Ai cos (ω i x) + Bi sin (ω i x) .
g(x) =
i
Sind Ci bzw Si partikuläre Lösungen von Ly = cos(ω i x) bzw Ly = sin(ω i x), dann
ist i Ai Ci (x) + Bi Si (x) eine partikuläre Lösung von Ly = g. Damit ebnet die
Diskussion harmonischer Inhomogenitäten zusammen mit der Fourieranalyse den
Weg zum Verständnis von Lg für viele physikalisch relevante allgemeinerer Inhomogenitäten. Das Resonanzphänomen der dynamischen Suszeptibilität zeigt, dass
die partikuläre Lösung ypart zu einer Summe von harmonischen Kräften von jenen
Anteilen dominiert wird, deren Antriebsfrequenz ω nahe der Eigenfrequenz ω 0 des
Systems liegt.
1.6
Übungsbeispiele
1. (Separierte Variable) Ein Kondensator habe die Kapazität C > 0. Zur Zeit
t = 0 bestehe eine Spannung von U0 > 0 zwischen seinen Platten. Auf seiner
positiv geladenen Platte befindet sich daher die Ladung Q0 = CU0 . Wird zur
Zeit t = 0 zwischen den Platten eine leitende Verbindung vom Widerstand R
hergestellt, so verändert sich die Ladung auf der positiven Platte derart, dass
diese Ladung Q (t) zur Zeit t für alle t > 0
RQ̇ (t) +
Q (t)
=0
C
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
123
erfüllt. Zeigen Sie, dass zur Zeit t > 0 zwischen den Platten die Spannung
U (t) = U0 e−t/RC vorliegt. In einer Zeit der Dauer τ = RC verringert sich also
U (t) um den Faktor 1/e ≈ 0, 368.
Ist der Kondensator zur Zeit t = 0 ungeladen und wird er zu t = 0 über
einen Widerstand R an eine Spannungsquelle mit der Spannung U0 > 0 angeschlossen, dann gilt für die Ladung Q (t) auf seiner positiven Platte für alle
t>0
Q (t)
RQ̇ (t) +
= U0 .
C
Zeigen Sie, dass zur Zeit t > 0 zwischen den Platten die Spannung U (t) =
U0 1 − e−t/RC vorliegt.
2. (Separierte Variable) Für die Füllhöhe y(t) > 0 eines mit Wasser gefüllten
Gefäßes zur Zeit t, das sich über ein Loch im waagrechten Boden entleert, gilt
mit α > 0
d
y(t) = −α y(t).
dt
(a) Skizzieren Sie das Richtungsfeld der Differentialgleichung y ′ = f (x, y) mit
√
f : R × R>0 → R, (x, y) → −α y für α > 0.
(b) Bestimmen Sie die maximale Lösung zur Anfangsbedingung y(0) = y0 >
0. Nach welcher Zeit ist das Gefäß leer?
3. (Separierte Variable) Für die Geschwindigkeit v(t) der vertikalen Bewegung
im homogenen Schwerefeld (Beschleunigungskonstante g > 0) gilt bei linearer
Reibung, (Reibungskoeffizient γ > 0)
d
v(t) = −g − γv(t).
dt
Der Definitionsbereich der Diffenrentialgleichung sei maximal.
(a) Skizzieren Sie das Richtungsfeld dieser Differentialgleichung.
(b) Bestimmen Sie die maximale Lösung zur Anfangsbedingung v(0) = v0 >
0. Hat v(t) Grenzwerte für t → ±∞?
4. (Separierte Variable) Sei f : R × R>0 → R, (x, y) → − xy .
(a) Skizzieren Sie das Richtungsfeld der Differentialgleichung y ′ = f (x, y).
(b) Bestimmen Sie die Menge L der maximalen Lösungen der Differentialgleichung y ′ = f (x, y). (Geben Sie zu jeder maximalen Lösung ihren
Definitionsbereich an; zeigen Sie, dass durch jeden Punkt von R × R>0
genau eine maximale Lösung geht; Skizze!)
(c) Zeigen Sie (ohne Verwendung der expliziten Kenntnis der Menge aller
maximalen Lösungen L), dass für Lösungen y der Differentialgleichung
′
gilt: (x2 + y 2 ) = 0.
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
124
(d) Sei g : R×R<0 → R, (x, y) → − xy . Bestimmen Sie die Menge M der maximalen Lösungen der Differentialgleichung y ′ = g(x, y). Hinweis: Beachten
Sie die Symmetrie: g(x, y) = −f (x, −y) für (x, y) ∈ R × R<0 .
5. (Separierte Variable) Sei f : R × R → R, (x, y) →
xy
.
1+x2
(a) Skizzieren Sie das Richtungsfeld der Differentialgleichung y ′ = f (x, y).
(Siehe Abbildung 1.44.)
(b) Bestimmen Sie die Menge L der maximalen Lösungen der Differentialgleichung y ′ = f (x, y). (Geben Sie zu jeder maximalen Lösung ihren Definitionsbereich an; zeigen Sie, dass durch jeden Punkt von R × R genau
eine maximale Lösung geht; Skizze!) (Siehe Abbildung 1.45.)
(c) Zeigen Sie (ohne Verwendung von L), dass für Lösungen y der Differentialgleichung gilt:
′
√ y
1+x2
= 0.
y
5
3.75
2.5
1.25
0
-5
-4
-3
-2
-1
-1.25
0
1
2
3
4
5
x
-2.5
-3.75
-5
Abbildung 1.44: Das Richtungsfeld zu y ′ = xy/(1 + x2 )
y
4
2
0
-2
-1
0
1
2
x
-2
-4
Abbildung 1.45: Lösungen von y ′ = xy/(1 + x2 )
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
125
6. (Separierte Variable) Sei ∆ := R {1,,−1}, und α : ∆ → R und β : ∆ → R
−1
,. Skizzieren Sie den Graphen von
mit α(x) = (x2 − 1) und β(x) = 12 ln , x−1
x+1
′
α und zeigen Sie, dass β = α.
(a) Zeigen Sie, dass die Funktionen tanh : R → (−1, 1) und coth : R 0 →
sinh(x)
1
R [−1, 1] mit tanh(x) := cosh(x)
und coth(x) := tanh(x)
bijektiv sind.
Skizzieren Sie die Graphen von tanh, coth und der Umkehrfunktionen
tanh−1 und coth−1 .
(b) Zeigen Sie tanh−1 (x) = −β(x) für −1 < x < 1 und coth−1 (x) = −β(x)
für |x| > 1.Hinweis: Rechnen Sie nach, dass tanh (−β(x)) = x für −1 <
x < 1 und dass coth (−β(x)) = x für |x| > 1.
(c) Zeigen Sie mithilfe des Eindeutigkeitssatzes aus der Vorlesung, dass die
Menge L aller maximalen Lösungen der Differentialgleichung y ′ = f(x, y)
mit f : R2 → R, (x, y) → y 2 − 1 aus genau den folgenden Funktionen
besteht:
• y : R → R,
• y : R → R,
x → 1,
x → −1,
• y : R → (−1, 1) ,
x → tanh(c − x) mit c ∈ R beliebig,
• y : (−∞, c) → (1, ∞) ,
• y : (c, ∞) → (−∞, −1)
x → coth(c − x) mit c ∈ R beliebig,
x → coth(c − x) mit c ∈ R beliebig.
y
2
1
0
-5
-2.5
0
2.5
5
x
-1
-2
Abbildung 1.46: Lösungen von y ′ = y 2 − 1
7. (Symmetrie einer Diffgl) Zeigen Sie, dass die Abbildungen (Spiegelung und
Translationen)43
Π : F (R) → F (R) ,
Tτ : F (R) → F (R) ,
43
(Πy) (x) := −y(−x) für − x ∈ Dy ,
(Tτ y) (x) := y(x − τ ), für x − τ ∈ Dy , τ ∈ R
F (R) ist die Menge aller auf einer Teilmenge von R definierten reellwertigen Funktionen. Für
y ∈ F (R) bezeichnet Dy ⊂ R den Definitionsbereich von y.
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
126
die Lösungsmenge L aus Beispiel 6) auf sich abbilden. Man sagt: Π und Tτ
sind Symmetrien von y ′ = y 2 − 1. Diese Symmetrien ermöglichen es, sich bei
der Lösung des Anfangswertproblems auf Anfangswerte (x0 , y0 ) mit x0 = 0
und y0 ≥ 0 zu beschränken. Warum?
8. (Inhomogen linear mit Variation der Konstanten) Die radiale Komponentenfunktion r → Er eines kugelsymmetrischen, statischen elektrischen Feldes ist
eine Lösung der Diffgleichung y ′ = f (x, y) mit
f : R>0 × R → R,
(x, y) → −
2y
+ g(x).
x
Hier ist g : R>0 → R stetig. (g = ρ/4πε0 für die Ladungsdichte ρ.) Die Diffgl
ist also inhomogen linear.
(a) Zeigen Sie mit der Variation der Konstantenformel, dass für die Menge
L aller maximalen Lösungen von y ′ = f (x, y) gilt:



,
x
,


,
1 
2
,

L = αC : R>0 → R, x → 2 C + ξ g(ξ)dξ , C ∈ R .


x
,
0
(b) Seien g0 ∈ R und R ∈ R>0 . Berechnen Sie die Funktion α0 : R>0 → R,
x
x→
ξ 2 g(ξ)dξ für die (unstetige!) Ladungsdichte, für die
1
x2
0
g(x) =
g0 für 0 < x < R
.
0 für R ≤ x
Skizzieren Sie den Graphen von α0 . Wo ist der Betrag von α0 maximal?
Zeigen Sie, dass α0 auf R>0 stetig ist, und dass für x = R
α′0 (x) = −
2α0 (x)
+ g(x)
x
gilt.
9. Sie v ∈ R. Bestimmen Sie die Menge L aller Funktionen y : R → R mit
y ′ (x) = y (x) sin x + v sin x für alle x ∈ R. Lösung: Sei yc : R → R so, dass
yc (x) = ce− cos x − v für alle x ∈ R. Dann gilt L = {yc |c ∈ R} . Für welche
der Funktionen yc gilt die Anfangsbedingung yc (0) = 0? Lösung: Nur jene
Funktion yc mit c = ev.
10. (Inhomogen linear mit Variation der Konstanten) Zwischen den Enden eines
Drahtes mit dem Widerstand R ∈ R>0 und der Selbstinduktivität L ∈ R>0
liege zur Zeit t die Spannung U(t) an. Die Funktion U : R → R sei stetig.
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
127
Für die Stromstärke I(t), die zur Zeit t durch den Draht fließt, gilt dann44
(näherungsweise) für alle t ∈ R die Differentialgleichung
L
d
I(t) + RI(t) = U(t).
dt
(1.65)
(a) Zeigen Sie, dass für U (t) = U0 cos (ωt) genau eine beschränkte maximale
Lösung I von (1.65) existiert, und dass für diese gilt
I (t) =
U0 cos (ωt − δ)
R2 + (Lω)2
mit δ = arctan
π
Lω
∈ 0,
.
R
2
(b) Berechnen Sie die maximale Lösung von (1.65) zur Anfangsbedingung
I(0) = 0 für die Inhomogenität U = Ue (stetiger Einschaltvorgang),
wobei

für t < 0
 0
U0
Ue (t) =
t
für
0≤t<T
 T
U0
für T ≤ t
mit T ∈ R>0 und U0 ∈ R. Hinweis: Setzen Sie eine partikuläre Lösung
in den Bereichen 0 ≤ t < T und T ≤ t inhomogen linear an. Bestimmen Sie die gesuchte Lösung zum Vergleich auch mit der Variation der
Konstantenformel. Lösung:

für t < 0
 0
für 0 ≤ t < T
I0 Tτ exp − τt + τt − 1
I(t) =

τ
T
t
I0 1 − T exp τ − 1 exp − τ
für T ≤ t
mit den Konstanten τ = L/R und I0 = U0 /R. Abbildung 1.47 zeigt
U(t)/U0 für T = 1 (grün) und I(t)/I0 für T = 1 und τ = 1/2 (schwarz)
bzw. τ = 2 (rot). Der Strom im Schaltkreis mit der höheren Induktivität
baut sich also langsamer auf.
(c) Sei c > 0 und Ue,c (t) := Ue (t − c). Geben Sie die maximale Lösung von
(1.65) im Fall der Inhomogenität Ue,c und der Anfangsbedingung I(0) = 0
an.
(d) Gegen welche Funktion konvergiert die Lösung von a) für T → 0?
(e) Berechnen Sie die maximale Lösung von (1.65) mit der Inhomogenität
U = U0 − Ue zur Anfangsbedingung I(0) = U0 /R (stetiger Ausschaltvorgang). Achtung: Die Lösung kann aus jener von a) ganz einfach gewonnen
werden.
11. (Inhomogen linear mit Variation der Konstanten) Die Differentialgleichung
(1.65) kann auch für unstetige Inhomogenität U formuliert werden. Dazu ein
Beispiel: Sei
U0 für 0 < t < T
U (t) =
.
0
sonst
44
Siehe etwa: R Resnik, D Halliday, K S Crane, Physics, New York, 1992; Kap 38-3
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
128
1
0.75
0.5
0.25
0
-2
0
2
4
6
t
Abbildung 1.47: Einschaltvorgang
mit U0 ∈ R (”Rechteckpuls”). Die Funktion U ist auf den drei Intervallen
D1 = (−∞, 0) , D2 = (0, T ) und D3 = (T, ∞) stetig. Damit sind drei Differentialgleichungen y ′ = ai (x)y +bi (x) = fi (x, y) im Sinn der Vorlesung auf offenen
Definitionsbereichen Di gegeben.
(a) Berechnen Sie jene drei Lösungen αi von y ′ = fi (x, y), die Einschränkungen einer (einzigen!) stetigen Funktion α auf R mit y(0) = 0 sind. Geben
Sie α an.
(b) Wo ist α diffbar? Skizzieren Sie den Graphen der Abbildung x → α′ (x).
(LI˙ gibt im Fall der Serienschaltung einer Spule und eines Ohmschen
Widerstandes die Spannung zwischen den Enden der Spule an.)
12. (Autonomes lineares System erster Ordnung; Bahnen der Lorentzgruppe) Für
die Abbildung X : R2×1 → R2×1 gelte
X:
x
y
y
x
→
.
Der Graph der Abbildung X, also die Menge
Γ (X) := (v, X (v)) | v ∈ R2×1 ⊂ R2×1 × R2×1 ,
wird als das Vektorfeld (zu) X bezeichnet. Siehe Abbildung 1.48.
(a) Zeigen Sie, dass für die Menge L aller maximalen Lösungen des Systems
γ̇ = X(γ) gilt L = {γ v | v ∈ R2×1 } mit γ v : R → R2×1 und
γ v (t) =
cosh(t) sinh(t)
sinh(t) cosh(t)
·
v1
v2
für v =
v1
v2
∈ R2×1 .
(b) Skizzieren Sie die Bahnen durch die Punkte (1, 0)t , (0, 1)t und (1, 1)t . Die
Bahn durch (1, 0)t ist die Menge
cosh(t) sinh(t)
sinh(t) cosh(t)
·
1
0
|t∈R .
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
129
y
0
0
x
Abbildung 1.48: Das Vektorfeld zu X
Die anderen Bahnen sind analog zu bilden. Ist (0, 0)t in der Bahn durch
(1, 1)t enthalten?
13. (Hamiltonsyteme) Seien x1 , . . . x2n die Standardkoordinaten von V = R2n und
sei U ⊂ V offen. Sei H : U → R zwei mal stetig differenzierbar. Das Vektorfeld
X : U → V habe in der Standardbasis (e1 , . . . e2n ) die Zerlegung
n
X=
i=1
∂H
ei −
∂xi+n
n
i=1
∂H
ei+n .
∂xi
Sei γ : I → U eine Lösung von γ̇ = X ◦ γ. Zeigen Sie, dass H ◦ γ konstant ist.
Geben Sie eine solche Funktion H für das Oszillatorsystem ẋ1 = x2 , ẋ2 = −x1
auf U = R2 an. Ist das System der Zerfallskette ẋ1 = −x1 , ẋ2 = −x2 + x1
auf U = R2 ein Hamiltonsystem? (Die Funktion H heißt Hamiltonfunktion
und X das zugehörige Hamilton’sche Vektorfeld.)
14. (Autonomes lineares System erster Ordnung; dreidimensionale Drehbewegung
mit konstanter Winkelgeschwindigkeit) Sei V ein dreidimensionaler, orientierter, reeller Vektorraum mit Skalarprodukt ·, · . Für ein festes n ∈ V ist die
Abbildung Ln : V → V, v → n × v linear. Hier bezeichnet n × v das Vektorprodukt von n mit v. Sei nun |n| = 1 und ω ∈ R.
(a) Es sei die Kurve γ v : R → V durch
γ v (t) = n n, v + cos (ωt) (v − n n, v ) + sin (ωt) n × v
für alle t ∈ R definiert. Zeigen Sie, dass γ v die maximale Lösung des
Systems v̇ = ωLn (v) mit γ v (0) = v ist. Welche Bahn hat γ v ? Geben
Sie die (maximale) Flussabbildung Φ des Vektorfeldes ωLn an. Hinweis:
a × (b × c) = b a, c − c a, b .
(b) Kontrollieren Sie durch Aufsummieren der Exponentialreihe, dass γ v (t) =
exp (tωLn ) (v).
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
130
00 0
z
y
x
Abbildung 1.49: Das Drehvektorfeld Le3
(c) Zeigen Sie für die Beschleunigung bv (t) =
d2 γ v
(t)
dt2
der Integralkurve
bv (t) = −ω 2 (γ v (t) − n n, γ v (t) ) .
15. (Autonomes lineares System erster Ordnung; Quantenevolution eines Spin1/2-Systems) Es sei V ein zweidimensionaler komplexer Vektorraum mit Skalarprodukt ·, · . Für zwei Vektoren e1 und e2 gelte ei , ej = δ i,j . Für die
lineare Abbildung σ : V → V gelte σe1 = e2 und σe2 = e1 .
(a) Zeigen Sie45
Φ : R × V → V, (t, v) → exp (−itσ) v = cos (t) v − i sin (t) σv = U (t)v.
Hinweis: σ 2n = id für alle n ∈ N0 .
(b) Kontrollieren Sie U (t)v, U (tw) = v, w für alle v, w ∈ V und für alle
t ∈ R. (Unitarität)
(c) Zeigen Sie | U (t)e1 , e1 |2 = cos2 (t).
16. (Getriebene ungedämpfte Schwingung) Finden Sie für
g : R → R, x → cos(q1 x) cos(q2 x) mit q2 > q1 + 1 > 1
per Ansatz eine (maximale) Lösung von y ′′ + y = g. Hinweis: cos(α) cos(β) =
(cos(α + β) + cos(α − β)) /2. Machen Sie für eine partikuläre Lösung von
y ′′ (x) + y(x) = cos (qx)
den Ansatz y(x) = A cos(qx).
Lösung:
y(x) = −
1
2
cos ((q2 + q1 ) x) cos ((q2 − q1 ) x)
+
(q2 + q1 )2 − 1
(q2 − q1 )2 − 1
Die Abbildung 1.50 zeigt g (strichliert) und y (durchgezogen) für den Fall
q1 = 9 und q2 = 11. Liegt hier Resonanz vor?
45
Φ ist also der maximale Fluss des Systems iγ̇ = σγ.
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
131
y
0.75
0.5
0.25
0
-2
-1
0
1
2
-0.25
x
-0.5
-0.75
Abbildung 1.50: ypart (durchgezogen) zur cos(9x) cos(11x)-Inhomogenität (strichliert)
17. Sei λ > 0 und x : R → R die maximale Lösung der Schwingungsgleichung
(1.66) zum Anfangswert x(0) = x′ (0) = 0. (Die Inhomogenität nimmt ihr
Maximum von 1/e nur bei t = 1/λ an.)
y ′′ (t) + y(t) = λte−λ|t|
(1.66)
(a) Zeigen Sie (mit der Variation der Konstantenformel) für t = 0, dass
x(t) = λ
λ2 − 1 sin t + 2λ |t|t e−λ|t| − cos t + λ2 + 1 te−λ|t|
λ2 + 1
2
.
Hinweis: Aufgrund des Eindeutigkeitssatzes gilt x(−t) = −x(t) für alle
t ∈ R. Daher genügt die Berechnung von x(t) für alle t > 0.
(b) Die retardierte Lösung xret von Gleichung (1.66) ist durch
lim xret (t) = 0
t→−∞
eindeutig bestimmt. Zeigen Sie für t = 0 und mit Θ(t) := 1 für t > 0 und
Θ(t) := 0 für t < 0, dass
xret (t) =
λ
2
λ +1
2
λ2 + 1 t + 2λ
t
e−λ|t| − 4λΘ (t) cos t .
|t|
Die Amplitude der für t → ∞ asymptotisch freien Schwingung ist
4λ2 / λ2 + 1
2
.
Siehe Figur 1.51. Die Amplitude ist maximal bei λ = 1. Figur 1.52 zeigt
xret für λ = 1.
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
132
1
0.75
0.5
0.25
0
0
2.5
5
7.5
10
Abbildung 1.51: Asymptotische Amplitude
1
0.5
0
-10
-5
0
5
10
15
20
25
t
-0.5
-1
Abbildung 1.52: xret (t) für λ = 1 und t exp (− |t|)
18. (Homogen lineare Diffgl zweiter Ordnung; Wronskideterminante, d’Alemberts
Reduktionsverfahren) I sei ein offenes, reelles Intervall. Die Funktionen p :
I → R und q : I → R seien stetig und y1 , y2 : I → R seien Lösungen von
y ′′ + py ′ + qy = 0.
(1.67)
Die Wronskideterminante W : I → R von y1 und y2 ist definiert durch
W (x) = det
y1 (x) y2 (x)
y1′ (x) y2′ (x)
.
(a) Zeigen Sie zunächst W ′ = −pW . Dann beweisen Sie: Aus W (x0 ) = 0 für
ein x0 ∈ I folgt, dass W (x) = 0 für alle x ∈ I.
(b) Sei (y1 , y2 ) ein Fundamentalsystem von (1.67), für das y1 (x0 ) = 0, y2 (x0 ) =
0 und W (x0 ) = 1 gilt. Dann existiert eine Umgebung J ⊂ I von x0 mit
y1 (x) = 0 für alle x ∈ J. Leiten Sie aus
x
W (x) = exp −
p(ξ)dξ
x0
die folgende Integraldarstellung von y2 (x)
x
y2 (x) = y1 (x)
x0
1
exp −
y1 (ξ)2
ξ
p(t)dt dξ
x0
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
133
für x ∈ J ab.
(c) Formulieren Sie Gleichung (1.67) als (nichtautonomes) lineares System
erster Ordnung v ′ = A(x)v auf V = R2×1 ; geben Sie also die Abbildung
A : I → R2×2 an.
19. (Homogen lineare Diffgl zweiter Ordnung mit konstanten Koeffizienten, Fundamentalsystem) Sei α ∈ R≥0 und die parameterbereinigte gedämpften Schwingungsgleichung
y ′′ + 2αy ′ + y = 0.
(1.68)
(a) Bestimmen Sie mittels Exponentialansatzes ein Fundamentalsystem von
(1.68). Unterscheiden Sie dabei die 3 Fälle 0 ≤ α < 1, α = 1, α > 1.
Zeigen Sie die lineare Unabhängigkeit des gefundenen Lösungspaares mit
der Wronskideterminante.
(b) Bestimmen Sie die Lösung mit y(0) = 0 und y ′ (0) = 1.
(c) Benützen Sie das Verfahren von Beispiel 18, um für α = 1 aus der Lösung
y1 (x) = exp(−x) eine zweite linear unabhängige Lösung zu erhalten.
20. (Rodriguesformel) Schließen Sie aus der Definition der Legendrepolynome Pn :
R → R für n ∈ N0
1
Pn (x) := n
2 n!
n
d
dx
x2 − 1
n
,
dass P0 (x) = 1, P1 (x) = x, P2 (x) = 12 (3x2 − 1) , P3 (x) = 12 (5x3 − 3x) , P4 (x) =
1
(35x4 − 30x2 + 3).
8
y
2
1.5
1
0.5
0
-1
-0.5
0
-0.5
0.5
1
x
-1
-1.5
Die Legendrepolynome P0 , . . . P4
21. Sei n ∈ N0 . Dann lautet die Legendresche Differentialgleichung für alle x ∈
(−1, 1)
1 − x2 y ′′ − 2xy ′ + n(n + 1)y = 0.
(1.69)
Zeigen Sie, dass jede maximale Lösung y von (1.69) mit y ′ (0) = 0 eine gerade
Funktion ist. Zeigen Sie, dass jede maximale Lösung y mit y(0) = 0 eine
ungerade Funktion ist. Hinweis: Zeigen Sie, dass zu jeder Lösung α auch die
gespiegelte Funktion Πα (x) := α(−x) eine Lösung ist.
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
134
22. (Frobeniusmethode zur Berechnung der Legendrepolynome) Nach dem Entwicklungssatz hat jede maximale Lösung von Gleichung (1.69) eine Potenzreihenentwicklung (1.70) mit einem Konvergenzradius r ≥ 1.
y(x) =
k∈N0
xk
ck
k!
(1.70)
(a) Zeigen Sie: Ist y eine maximale Lösung von (1.69), dann gilt für alle
k ∈ N0 die Rekursion
(1.71)
ck+2 = (k(k + 1) − λ) ck .
(b) Zeigen Sie: y ist ein Polynom genau dann, wenn λ = n(n + 1) für ein
n ∈ N0 und wenn Πy = (−1)n y. (Da das Legendrepolynom Pn Lösung
von Gleichung (1.69) mit λ = n(n+1) ist, ist nach dem Eindeutigkeitssatz
der Raum der Polynomlösungen durch R · Pn gegeben.)
(c) Sei λ = 3(3+1). Berechnen Sie die Polynomlösung y von Gleichung (1.69)
mit limx→1 y(x) = 1 über die Reihenformel. Überprüfen Sie, dass y = P3 .
(d) Prüfen Sie mit dem Quotientenkriterium, dass eine Potenzreihe (1.70),
für deren Koeffizienten (1.71) gilt, tatsächlich für alle |x| < 1 konvergiert.
Bemerkung: (Ohne Beweis) α hat genau dann eine stetige Fortsetzung
nach [−1, 1], wenn y ein Polynom ist.
(e) Sei n ∈ N0 . Zeigen Sie für Pn (x) =
n
Binomialreihe für (x2 − 1) , dass
1
Pn (x) = n
2
[n/2]
(−1)k
k=0
n
k
dn
dxn
n
(x2 − 1) /2n n! mit Hilfe der
2n − 2k
n
xn−2k .
Überprüfen Sie daran die Rekursionsformel (1.71). [n/2] bezeichnet das
Größte Ganze von n/2.
23. (Fundamentalsystem der Legendreschen Differentialgleichung für n = 0 und
für n = 1) Berechnen Sie für n = 0 und n = 1 jeweils die Menge aller maximalen Lösungen der auf (−1, 1) eigeschränkten Differentialgleichung (1.69).
Hinweis: Die Lösung Pn kann mit d’Alemberts Reduktionsverfahren auf (−1, 1)
zu einem Fundamentalsystem ergänzt werden. Lösung (Fig. 2):
Ln=0 =
αa,b : (−1, 1) → R,
Ln=1 =
αa,b : (−1, 1) → R,
1+x
x → a + b ln
| a, b ∈ R2 ,
1−x
*
+
1+x
x → ax + b x ln
− 2 | a, b ∈ R2 .
1−x
KAPITEL 1. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
135
y
2.5
1.25
0
-0.75
-0.5
-0.25
0
0.25
0.5
0.75
x
-1.25
-2.5
Die Lösungen α0,1 für n = 0 und n = 1 (strichliert)
24. (Erzeugende Funktion der Legenre Polynome) Seien x, y ∈ R3 mit r := |x| ,
und r0 := |y|. Ist θ der Winkel zwischen x und y, dann gilt für x = y
1
1
=
.
2
|x − y|
r2 + r0 − 2rr0 cos θ
Behauptung46 : Für −1 < λ < 1 gilt
1
2
1 − 2λ cos θ + λ
∞
=
Pn (cos θ) λn .
n=0
Kontrollieren Sie diese Behauptung an den ersten 3 Summanden unter Verwendung der Taylorreihe
1
1.3 2 1.3.5 3
1
√
= 1− x+
x −
x + . . . für − 1 < x ≤ 1.
2
2.4
2.4.6
1+x
Zeigen Sie nun, dass
1
1
=
|x − y|
r
∞
Pn (cos θ)
n=0
r0
r
n
für r0 < r.
25. (Orthogonalisierung von Polynomen) Sei ek : [−1, 1] → R, x → xk für k ∈ N0 .
Die Folge Bn := (ek )k≤n ist eine geordnete Basis des Vektorraums Vn aller
reellen Polynome auf [−1, 1] , deren Grad kleiner oder gleich n ist. Auf dem
Vektorraum C ([−1, 1]) aller stetigen Funktionen von [−1, 1] nach R ist durch
1
f, g :=
f(x)g(x)dx
−1
ein Skalarprodukt definiert. Wenden Sie auf die Basis B2 von V2 das GramSchmidt Verfahren zu ·, · an. Kontrollieren Sie, dass dies auf die Basis
k + 1/2Pk
0≤k≤2
von V2 führt.
46
Der Beweis folgt in der Vorlesung Mathematische Methoden der Physik II.
Kapitel 2
Fourieranalysis
Das Studium der Schwingungsgleichung y ′′ (t) + y (t) = f (t) zeigte uns, dass im Fall
von f (t) = cos ωt für ω = 1 eine maximale Lösung Cω mit dem Ansatz A cos(ωt) zu
erhalten ist1 . Es ergibt sich A = 1/ (1 − ω 2 ) . Eine Rechtstranslation um π/2 erzeugt
aus Cω eine maximale Lösung Sω zur Inhomogenität sin ωt. Für die allgemeinere
Inhomogenität f : R → R des Typs
f (t) =
(2.1)
[aω cos(ωt) + bω sin(ωt)]
ω∈Ω
mit aω , bω ∈ R ist daher, für endliche Menge Ω, eine Lösung durch die Überlagerung
von Einzellösungen durch y (t) =
ω∈Ω [aω Cω (t) + bω Sω (t)] gegeben. Dieses Lösungsverfahren funktioniert in leicht abgewandelter Form für alle inhomogen linearen Differentialgleichungen mit konstanten Koeffizienten und einer Inhomogenität
des Typs von Gleichung (2.1).
Damit stellt sich die Frage, welche Funktionen durch eine Funktion f des Typs
von Gleichung (2.1) auf kontrollierbare Weise approximiert werden können. Kelvin
benutzte z.B. einen solchen Ansatz, um den Gezeitengang des Wasserspiegels in
einem englischen Kriegshafen auf Jahre im voraus aus Aufzeichnungen über zurückliegende Werte vorauszusagen. Die britische Marine zog ihren Nutzen daraus.
Erheblich einfacher wird die Frage nach der Approximierbarkeit einer Funktion
durch Summen von Sinus- und Cosinusfunktionen für stetige Funktionen mit einem
endlichen Definitionsintervall, also für f : [0, T ] → R. Schon J. B. Fourier vermutete,
dass solche Funktionen im Fall von f (0) = f (T ) durch endliche Summen des Typs
(2.1) mit Ω ⊂ (2π/T ) N0 punktweise beliebig genau approximiert werden können.
Seine Vermutung wurde später von Weierstraß bewiesen: Sei f : [0, T ] → R stetig
und es gelte f (0) = f(T ). Dann existieren zu jedem ε > 0 reelle Zahlen a0 , . . . an
und b1 , . . . bn , sodass für die Funktion fn : R → R mit
n
a0
t
fn (t) :=
+
ak cos 2πk
2
T
k=1
+ bk sin 2πk
t
T
(2.2)
für alle t ∈ [0, T ] die Abschätzung |f(t) − fn (t)| < ε gilt. (Die Zahlen n und a1 , . . . bn
hängen dabei im Allgemeinen von ε ab.)
1
Im ungedämpften, resonanten Fall ω = 1 führt der Ansatz Ct cos(ωt − δ) zum Ziel.
136
KAPITEL 2. FOURIERANALYSIS
137
Fourier gab auch eine Rezeptur an, wie zwei unendliche Zahlenfolgen, die Fourierkoeffizienten, (a0 , a1 , . . .) und (b1 , b2 , . . .) zu berechnen sein könnten, sodass für
alle t ∈ [0, T ] die punktweise Konvergenz
n
f (t) =
a0
t
ak cos 2πk
+ lim
n→∞
2
T
k=1
+ bk sin 2πk
t
T
(2.3)
gilt. Fouriers Rezeptur stellte sich zwar in vielen aber nicht in allen Fällen als korrekt
heraus. Eine korrekte Konstruktion stammt von Fejér. Sie realisiert eine Variante
von Gleichung (2.3) für stetige Funktion f mit Koeffizienten ank und bnk , die sich mit
n ändern. Das Erstaunliche an der Approximation (2.2) ist jedenfalls die Tatsache,
dass ein Frequenzspektrum Ω ⊂ (2π/T ) N0 ausreicht.
Die weitere Ausarbeitung von Fouriers Approximationsrezeptur zeigte, dass sie
zwar nicht unbedingt punktweise aber wenigstens „im quadratischen Mittel“ funktioniert. Und dies sogar auch für gewisse unstetige Funktionen.
Fouriers Idee durchdringt heute die Physik. Sinus und Cosinus sind die Bausteine,
aus denen viele Schwingungen und Wellen zusammengesetzt sind. Akustische oder
optische Spektralanalyse ist eine Methode, die (annähernd) monofrequenten Anteile
von Schall oder Licht zu isolieren. Dabei werden Geräusche in (fast) reine Töne
oder Licht in seine Bestandteile (fast) reiner Spektralfarben zerlegt. Wirklich reine
Töne oder Farben bleiben allerdings eine von der Natur grundsätzlich unerreichbare
Fiktion.
2.1
Fourierreihen
Eine Fourierreihe ist eine unendliche Folge von zunehmend besseren Approximationen an eine (stückweise stetige, komplexe) Funktion auf [0, L] . Die Approximationen sind die Partialsummen einer Reihe aus Sinus- und Cosinusfunktionen derselben
Periode L. Der Fall aperiodischer Funktionen auf R wird im Abschnitt über Fourierintegration behandelt.
2.1.1
Trigonometrische Polynome
Definition 62 Eine Funktion F : R → C mit F (x + L) = F (x) für alle x ∈ R heißt
periodisch mit der Periode L (oder kurz L-periodisch).
Die Funktionen sin, cos sind 2π-periodisch. Jede auf einem halboffenen Intervall
der Länge L definierte Funktion kann eindeutig zu einer L-periodischen Funktion
fortgesetzt werden. Durch Umskalierung einer L-periodischen Funktion ist eine Standardisierung der Periode möglich: Ist F eine L-periodische Funktion, dann ist die
x
Funktion f (x) := F L 2π
eine 2π-periodische. Umkehrung: F (x) = f 2π Lx .
Definition 63 Seien n ∈ N0 und a0 , a1 , . . . , an , b1 , . . . , bn ∈ C. Die Funktion
n
n
a0
+
ak cos(kx) +
bk sin(kx)
f : R → C mit f (x) =
2
k=1
k=1
KAPITEL 2. FOURIERANALYSIS
138
heißt trigonometrisches Polynom der Ordnung n. Die Menge aller trigonometrischen
Polynome der Ordnung n wird in diesem Kapitel mit Vn bezeichnet.
Jedes trigonometrische Polynom ist als endliche Linearkombiation von 2π-periodischen C ∞ -Funktionen selbst beliebig oft stetig differenzierbar und 2π-periodisch.
Da für f, g ∈ Vn und λ ∈ C auch f + g ∈ Vn und λf ∈ Vn gilt, ist Vn ein CVektorraum. Für m < n ist Vm ein (echter) UnterVR von Vn .
Der Vektorraum Vn wird von den 2n + 1 Funktionen {1, cos (kx) , sin (kx)}nk=1
aufgespannt. Somit gilt dim (Vn ) ≤ 2n + 1. Wir werden nun zeigen, dass dim (Vn ) =
2n + 1 gilt. Dazu verschaffen wir uns ein weiteres erzeugendes System von Vn .
Lemma 64 Für k ∈ Z sei ek : R → C mit ek (x) := exp(ikx). Das Funktionensystem {ek : |k| ≤ n} spannt Vn auf.
Beweis. Mit cos(kx) = eikx + e−ikx /2 und sin(kx) = eikx − e−ikx /2i folgt
für f ∈ Vn
n
n
a0
f (x) =
+
ak cos(kx) +
bk sin(kx)
2
k=1
k=1
a0 1
+
=
2
2
n
n
ikx
k=1
(ak − ibk ) e
−ikx
+ (ak + ibk ) e
ck exp(ikx),
=
k=−n
mit den Zahlen {ck : k ∈ Z, |k| ≤ n} ⊂ C, die durch c0 = a0 /2, ck = (ak − ibk )/2
für k = 1, . . . , n und ck = (a−k + ib−k )/2 für k = −1, . . . , −n gegeben sind. Also ist
auch {exp(ikx) | k ∈ Z und − n ≤ k ≤ n} ein erzeugendes System von Vn .
Die Definition der Koeffizienten ck ist nach ak , bk auflösbar. Es gilt
ak = ck + c−k für k = 0, . . . , n, und bk = i (ck − c−k ) für k = 1, . . . , n.
Zudem ist nun klar: aus f ∈ Vm und g ∈ Vn folgt f · g ∈ Vm+n .
Lemma 65 Das Funktionensystem {ek }k∈Z ist ein Orthonormalsystem im Vektorraum aller stetigen 2π-periodischen Funktionen mit dem Skalarprodukt
f, g :=
1
2π
2π
f (x)g(x)dx,
0
′
′ , ek = δ k′ k für alle k, k ∈ Z. Das Funktionensystem {1, Ck , Sk |k ∈ N}
d.h. es gilt ek√
√
mit Ck (x) = 2 cos (kx) , Sk (x) = 2 sin (kx) ist ein weiteres Orthonormalsystem.
Beweis. Seien zunächst k, k ′ ∈ Z mit k = k ′ . Dann gilt
,2π
2π
exp(i(k − k ′ )x) ,,
1−1
′
exp(i(k − k )x)dx =
=
= 0.
,
′
i(k − k )
i(k − k ′ )
0
0
2π
2π
Für k = k ′ gilt aber 0 exp(i(k − k ′ )x)dx = 0 dx = 2π. Daher gilt ek′ , ek = δ k′ k .
Für Ck = √12 (ek + e−k ) , Sk = i√1 2 (ek − e−k ) mit k ∈ N folgt für alle l, m ∈ N,
dass Cl , Cm = Sl , Sm = δ l,m , Cl , Sm = Cl , 1 = Sl , 1 = 0 und 1, 1 = 1.
KAPITEL 2. FOURIERANALYSIS
139
Satz 66 Die Funktionensysteme {ek }nk=−n und {1, Ck , Sk }nk=1 sind Orthonormalbasen von Vn . Es gilt dim (Vn ) = 2n + 1. Für f ∈ Vn mit f = nk=−n ck ek gilt
a0
f (x) =
+
2
1
2π
1
=
π
1
=
π
n
ak cos(kx) +
k=1
2π
ck =
ak
bk
n
0
2π
bk sin(kx),
k=1
exp(−ikx)f (x)dx für alle k = −n, . . . n,
cos(kx)f (x)dx für alle k = 0, . . . n,
0
2π
sin(kx)f(x)dx für alle k = 1, . . . n.
0
Beweis. Das System {ek }nk=−n ist ein erzeugendes Sytem von Vn . Sei f =
n
k=−n ck ek . Wegen
n
el , f =
ck el , ek = cl
k=−n
folgt aus f = 0, dass cl = 0 für alle l = −n, . . . n. Damit ist {ek }nk=−n ein linear unabhängiges, orthonormales, erzeugendes System von Vn , eine sogenannte Orthonormalbasis. Das erzeugende System {1, Ck , Sk }nk=1 von Vn ist nach dem vorangehenden
Lemma ebenfalls ein Orthonormalsystem und somit eine Orthonormalbasis von Vn .
Für die Entwicklungskoeffizienten ak , bk von f ∈ Vn folgt
ak = ck + c−k = ek + e−k , f =
1
=
π
bk
1
2π
2π
e−ikx + eikx f (x)dx
0
2π
cos(kx)f (x)dx,
0
1
= i (ck − c−k ) =
π
2π
sin(kx)f (x)dx.
0
Dieser Satz zeigt also, dass die Entwicklungskoeffizienten (ck )nk=−n eines trigonometrischen Polynoms f ∈ Vn erstens eindeutig sind und zweitens durch Skalarproduktbildung zu berechnen sind. Gerade das macht ja die Orthonormalbasen
eines Vektorraums so praktisch. Als weitere unmittelbare Folge gilt für f ∈ Vn mit
f = nk=−n ck ek , dass f 2 = f, f = nk=−n |ck |2 .
Eine weitere bemerkenswerte Eigenschaft von Vn ist, dass eine beliebige Translation den Raum Vn in sich überführt, denn es gilt ja für δ ∈ R und f ∈ V
n
(Tδ f ) (x) := f (x − δ) =
n
ik(x−δ)
ck e
k=−n
ck e−ikδ eikx .
=
k=−n
Bei einer Translation um δ geht die Funktion f ∈ V mit den Koeffizienten (ck )nk=−n
n
in die Funktion Tδ f ∈ Vn mit den Koeffizienten e−ikδ ck k=−n über. Insbesondere
gilt Tδ ek = e−ikδ ek .
KAPITEL 2. FOURIERANALYSIS
2.1.2
140
Beispiele trigonometrischer Polynome
1. Potenzen von Sinus oder Cosinus
Die Hintereinanderausführung eines (komplexen) Polynoms Qn vom Grad n nach
einer trigonometrischen Funktion des Typs αeix + βe−ix ergibt offenbar ein Element
von Vn . Es gilt also insbesonders sinn , cosn ∈ Vn für n ∈ N. Die Zerlegung von cosn
nach der sin / cos-Basis ergibt sich folgendermaßen.
n
n
−ix n
ix
2 cos (x) = e + e
n
=
k=0
=
n
k
eix
n inx
n
n −inx
e +
ei(n−2)x + . . . +
e
=2
n
n−1
0
n−k
⌊n/2⌋
k=0
e−ix
k
n
cos ((n − 2k) x)
k
Hier bezeichnet ⌊n/2⌋ die größte ganze Zahl kleiner oder gleich n/2.
n
Für sinn ergibt sich die Basiszerlegung: (2i)n sinn x = (eix − e−ix) =
= einx 1 − e−2ix
n
n
= einx
k=0
n
(−1)k e−ikx =
k
n
k=0
n
(−1)k ei(n−2k)x .
k
Sei nun n ungerade. Dann gilt
*
+ *
+
n inx
n −inx
n i(n−2)x
n
n
n
−i(n−2)x
(2i) sin x =
e −
e
−
e
−
e
+ ...
1
0
n
n−1
*
+
n
n
⌊n/2⌋
ix
−ix
+ (−1)
e −
e
⌊n/2⌋
⌊n/2⌋ + 1
*
+
n
n
n
⌊n/2⌋
= 2i
sin (nx) −
sin ((n − 2) x) + . . . + (−1)
sin x .
⌊n/2⌋
0
1
Damit folgt für n = 2m − 1 mit m ∈ N
2m−1
sin
4
x= m
4
m
(−1)k−1
k=1
2m − 1
sin ((2k − 1) x) .
m−k
Eine ähnlich Zerlegung besitzen die geradzahligen Potenzen sin2m , wobei allerdings die Basisfunktionen sin ((2k − 1) x) durch cos ((2k − 1) x) abgelöst werden, da
sin2m ja eine gerade Funktion ist.
2. Chebyshev - Polynome
Für n ∈ N existiert genau ein (reelles) Polynom Tn vom Grad n mit cos (nx) =
Tn (cos x) für alle x ∈ R, das sogenannte n-te Chebyshev - Polynom. (Siehe nachfolgendes Lemma.) Offenbar gilt Tn (x) = cos (n arccos x) und |Tn (x)| ≤ 1 für alle
x ∈ [−1, 1] . Es gilt weiter T0 = 1, T1 (x) = x, T2 (x) = 2x2 − 1. Der Koeffizient
des Monoms xn in Tn hat nach Beispiel 1) für n ≥ 1 den Wert 2n−1 . Zweimaliges
Ableiten von cos (nx) = Tn (cos x) nach x ergibt
1 − x2 Tn′′ (x) − xTn′ (x) + n2 Tn (x) = 0.
KAPITEL 2. FOURIERANALYSIS
141
Der Funktionsgraph von Tn über [−1, 1] entsteht bei Orthogonalprojektion des
Graphen der Funktion cos (nϕ) über dem Einheitskreis um 0 in der z = 0 Ebene auf
die Ebene y = 0. Siehe Figuren 2.1 und 2.2.
1
0.5
1
-1
0.5
-0.5
0
-0.5
0
0.5
1
-1
x
-0.5
y
-1
z
Abbildung 2.1: Raumkurven (cos ϕ, sin ϕ, cos (nϕ)) für n = 0, 1, 3
1
0.5
0
-1
-0.5
0
0.5
1
-0.5
-1
Abbildung 2.2: Chebyshev Polynome T0 , . . . T5
Höhere Chebyshev - Polynome wie T3 (x) = x (4x2 − 3) , T4 (x) = 8x2 (x2 − 1)+1,
T5 (x) = 4x3 (4x2 − 5) + 5x können über die folgende Rekursion berechnet werden,
die zudem einen Induktionsbeweis für die Existenz der Polynome Tn abgibt.
Lemma 67 Für n ∈ N und x ∈ R gilt Tn+1 (x) = 2xTn (x) − Tn−1 (x) .
Beweis. Es gilt für alle x ∈ R
Tn+1 (cos x) = cos ((n + 1) x) = cos ((n + 1) x) + cos ((n − 1) x) − cos ((n − 1) x)
= cos (nx + x) + cos (nx − x) − cos ((n − 1) x)
= 2 cos (x) cos (nx) − cos ((n − 1) x) = 2 cos (x) Tn (cos x) − Tn−1 (cos x) .
Dies ist aber genau die behauptete Rekursion auf [−1, 1] . Stimmen zwei Polynome
auf einem endlichen Intervall überein, dann sind sie auf ganz R gleich.
Die Chebyshev - Polynome haben die folgende merkwürdige Eigenschaft: Unter
allen Polynomen des Typs 2n−1 xn + an−1 xn−1 + . . . ist Tn das einzige Polynom,
das am Intervall [−1, 1] um höchstens den Betrag 1 von 0 abweicht. Etwas präziser
ausgedrückt:
KAPITEL 2. FOURIERANALYSIS
142
Lemma 68 Ist Qn−1 ein Polynom von höchstens dem Grad n − 1 ≥ 0, dann gilt
sup−1≤x≤1 |Tn (x) + Qn−1 (x)| ≥ 1. Es gilt sup−1≤x≤1 |Tn (x) + Qn−1 (x)| = 1 genau
dann, wenn Qn−1 = 0.
Beweis. Definitionsgemäß hat Tn an den Stellen xk = cos (kπ/n) mit k ∈
{0, 1, . . . n} den Wert Tn (xk ) = cos (kπ) = (−1)k . Wegen |Tn (x)| ≤ 1 für alle
x ∈ [−1, 1] gilt daher sup−1≤x≤1 |Tn (x)| = 1.
Die Ungleichung wird indirekt bewiesen: Angenommen es gibt ein nichtverschwindendes Polynom Qn−1 mit sup−1≤x≤1 |Tn (x) + Qn−1 (x)| ≤ 1, dann folgt
Qn−1 (x0 ) ≤ 0,
Qn−1 (x1 ) ≥ 0,
Qn−1 (x1 ) ≤ 0,
...
Das Polynom Qn−1 hätte also mindestens n Nullstellen (im Intervall [−1, 1]). Ein
Polynom vom Grad n − 1 hat jedoch höchstens n − 1 Nullstellen. Damit führt die
Annahme sup−1≤x≤1 |Tn (x) + Qn−1 (x)| ≤ 1 auf einen Widerspruch.
Korollar 69 Ist Qn−1 ein Polynom von höchstens dem Grad n − 1 ≥ 0, dann gilt
sup−1≤x≤1 |xn − Qn−1 (x)| ≥ 21−n . Gleichheit liegt genau dann vor, wenn Qn−1 (x) =
xn − 21−n Tn (x) .
Beweis. Sei n ∈ N. Gemäß Definition von Tn ist x → xn −21−n Tn (x) ein (reelles)
Polynom vom Grad n − 1. Ist Qn−1 ein Polynom vom Grad n − 1, dann ist auch
Pn−1 mit Qn−1 (x) = xn − 21−n (Tn (x) + Pn−1 (x)) ein Polynom vom Grad n − 1.
Somit gilt
sup |xn − Qn−1 (x)| = 21−n sup |Tn (x) + Pn−1 (x)| ≥ 21−n .
−1≤x≤1
−1≤x≤1
Gleichheit gilt genau dann, wenn Pn−1 = 0, also Qn−1 (x) = xn − 21−n Tn (x) .
Es gibt somit genau ein Polynom vom Grad n − 1, nämlich xn − 21−n Tn (x) , das
am Intervall [−1, 1] in der Supremumsnorm dem Monom xn am nächsten kommt.
Dieser Minimalabstand beträgt 21−n .
3. Lissajoufiguren
Sei γ : R → R2 mit γ (t) = 2 sin t, 12 sin 2t . Die Menge γ (R) ist eine Lissajousfigur.2
(Siehe Figur 2.3.) Mit sin2 t = (1 − cos 2t) /2 folgt
|γ (t)|2 = 4 sin2 (t) +
sin2 (2t)
1 − cos 4t
17
cos 4t
= 2 (1 − cos 2t) +
=
− 2 cos 2t −
.
4
8
8
8
Die Funktion t → |γ (t)|2 ist also ein trigonometrisches Polynom vom Grad 4. Wegen
γ̇ (t) = (2 cot s, cos 2t) und 2 cos2 t = 1 + cos 2t ist auch |γ̇|2 ∈ V4 :
|γ̇ (t)|2 = 4 cos2 t + cos2 2t = 2 (1 + cos 2t) +
2
1 + cos 4t
5
cos 4t
= + 2 cos 2t +
.
2
2
2
Die Kurve γ = (x, y) ist eine Lösung der Newtonschen Bewegungsgleichungen eines anisotropen, 2d harmonischen Oszillators da ja x′′ = −x und y ′′ = −4y.
KAPITEL 2. FOURIERANALYSIS
143
y
0.5
0.25
0
-2
-1
0
1
2
x
-0.25
-0.5
Abbildung 2.3: Bahn von γ
Aus γ̈ (t) = −2 (sin t, sin 2t) folgt für das Normquadrat der Beschleunigung3
|γ̈ (t)|2 = 4 sin2 t + sin2 2t = 2 (2 − cos 2t − cos 4t) .
Es gilt also |γ|2 , |γ̇|2 , |γ̈|2 ∈ V4 . (Siehe Figur 2.4.)
6.25
5
3.75
2.5
1.25
0
0
0.25
0.5
0.75
1
Abbildung 2.4: |γ|2 , (grau), |γ̇|2 (grün) und |γ̈|2 (rot) als Funktion von t/2π
2.1.3
Dirichlets Kern
2π
n
1
ik(x−y)
Für f ∈ Vn und x ∈ R gilt f (x) = nk=−n eikx ek , f = 2π
f (y) dy.
k=−n e
0
Das trigonometrische Polynom Dn ∈ Vn mit den Koeffizienten ck = 1 erfüllt also
Dn (x) = nk=−n exp(ikx) = 1 + 2 nk=1 cos (kx) und für alle f ∈ Vn
1
f (x) =
2π
2π
0
Dn (x − y) f (y) dy.
Dn stellt auf Vn die identische Abbildung als Integraloperator dar. Die Funktionenfolge (Dn )n∈N0 heißt Dirichletkern.
3
Die elektromagnetische Strahlungsleistung einer elektrischen Punkladung q, die sich gemäß
2
q2
2
einer Kurve γ mit |γ̇| ≪ c bewegt, ist zur Zeit t annähernd durch P (t) = 4πε
3c3 |γ̈ ((t))|
0
gegeben. (Larmors Strahlungsformel; c bezeichnet die Lichtgeschwindigkeit)
KAPITEL 2. FOURIERANALYSIS
144
Untersuchen wir die Funktion Dn etwas genauer. Offenbar ist Dn reellwertig und
k
gerade. Mit z = eix folgt Dn (x) = z −n 2n
k=0 z . Mit der Formel für die Partialsumme
einer geometrischen Reihe ergibt sich nun für z = 1, also für x ∈
/ 2πZ,
Dn (x) = z
−n 1
1
1
sin 2n+1
x
z −n − z n z
e−i(n+ 2 )x − ei(n+ 2 )x
− z 2n+1
2
=
=
=
.
x
x
x
−i
i
1−z
1−z
sin 2
e 2 −e 2
n
k=−n
Für x ∈ 2πZ folgt Dn (x) =
Dn (x) =
.
1 = 2n + 1. Es gilt somit
sin( 2n+1
x)
2
sin( x2 )
für x ∈ R
2πZ
für x ∈ 2πZ
2n + 1
Dn ist stetig. Die Funktion Dn fällt zwischen 0 und ihrer kleinsten positiven
Nullstelle 2π/(2n+1) von ihrem größten Wert, nämlich 2n+1, auf 0 ab. Die Breite der
Spitze bei 0 geht mit wachsendem n gegen 0. Hier zeigt sich erstmals die Faustregel:
Je schärfer ein Signal eingegrenzt sein soll, umso mehr Frequenzen müssen beitragen.
y
15
12.5
10
7.5
5
2.5
0
-0.25
0
0.25
0.5
0.75
1
1.25
-2.5
x
Abbildung 2.5: x → D7 (2πx) (rot) und x → F7 (2πx) (grün)
Für die Norm von Dn folgt Dn 2 = nk=−n |ck |2 = 2n + 1. Für die Funktion
Fn : R → R mit (2n + 1) · Fn (x) = |Dn (x)|2 = sin2 2n+1
x / sin2 x2 ≥ 0 gilt daher
2
−1 π
Fn ∈ V2n und (2π)
F (x) dx = 1. Die Funktion Fn /2π ist also Dichte eines W−π n
maßes auf dem Intervall [−π, π] , das sich mit wachsendem n zunehmend auf x = 0
zusammenzieht. (Die Folge (Fn ) spielt in Fejers Approximation eine wichtige Rolle.)
Abbildung 2.5 zeigt D7 (2πx) und F7 (2πx) .
2.1.4
Grenzfunktionen trigonometrischer Reihen
Definition 70 Ist (ck )k∈Z eine Folge in C, dann heißt die Folge (Tn )n∈N0 von trigonometrischen Polynomen Tn ∈ Vn mit Tn (x) = nk=−n ck eikx trigonometrische
Reihe mit den Koeffizienten ck .
Mit a0 /2 = c0 , ak = ck + c−k und bk = i (ck − c−k ) kann eine trigonometrische
Reihe auch in die äquivalente sin / cos-Form gebracht werden:
n
n
ck eikx =
Tn (x) =
k=−n
n
a0
+
ak cos (kx) +
bk sin (kx) .
2
k=1
k=1
KAPITEL 2. FOURIERANALYSIS
145
Falls limn→∞ nk=−n |ck | existiert, sind wegen |ak | ≤ |ck | + |c−k | und |bk | ≤ |ck | +
∞
|c−k | auch die Reihen ∞
k=1 |ak | und
k=1 |bk | konvergent. In diesem Fall sind sowohl
die trigonometrische Reihe (Tn )n∈N0 als auch die zugeordneten trigonometrischen
Reihen (Cn )n∈N0 und (Sn )n∈N mit
n
a0
Cn (x) =
+
ak cos (kx) und Sn (x) =
2
k=1
n
bk sin (kx)
k=1
nach dem Weierstrasskriterium (Kap.II, §4.2 in [3], Vol I) gleichmäßig absolut konvergent. Z.B. gilt ja
n
n
|a0 |
|a0 |
|Cn (x)| ≤
|ak cos (kx)| ≤
|ak | .
+
+
2
2
k=1
k=1
Nach Kap III, §1.4, Satz 13 von [3], Vol I, konvergieren die stetigen Funktionen
Tn , Cn , Sn punktweise gegen eine stetige Grenzfunktionen.
Es gibt aber auch wichtige Beispiele von punktweise konvergenten trigonometrischen Reihen, für die nk=−n |ck | nicht konvergiert. Hier ein Beispiel, das mit einem
sehr schlauen Trick arbeitet. Für das Folgenglied Dn des Dirichletkerns gilt auf
R 2πZ
n
sin 2n+1
x
2
Dn (x) = 1 + 2
cos (kx) =
.
x
sin
2
k=1
Sei nun Yn : (0, 2π) → R (hier steckt der Trick!) mit
x
Yn (x) =
Dn (t) dt +
0
n
= x+2
k=1
x
2 cos 2n+1
2
x
2n + 1 sin 2
x
sin (kx)
2 cos 2n+1
2
+
.
x
k
2n + 1 sin 2
Für jedes n gilt Yn (π) = π und somit auch limn→∞ Yn (π) = π. Es folgt weiter für
0 < x < 2π
Yn′ (x) = Dn (x) −
= −
sin 2n+1
x
1 cos
2
−
x
2n + 1
sin 2
2n+1
x cos
2
2 x
sin 2
1 cos
2n + 1
x
2
2n+1
x cos
2
2 x
sin 2
x
2
.
Somit konvergiert Yn′ auf jedem abgeschlossenen Intervall [a, b] ⊂ (0, 2π) gleichmäßig
gegen 0. Daher gilt für alle x ∈ (0, 2π)
x
lim Yn (x) − π =
n→∞
=
lim (Yn (x) − Yn (π)) = lim
n→∞
x
lim Yn′ (t) dt = 0.
π n→∞
n→∞
π
Yn′ (t) dt
KAPITEL 2. FOURIERANALYSIS
146
Also gilt für alle x ∈ (0, 2π)
n
π = lim Yn (x) = x + 2 lim
n→∞
n→∞
k=1
sin (kx)
.
k
n
sin(k0)
k=1
k
Für x = 0 gilt limn→∞
= 0. Alle weiteren Werte x ergeben sich aus der
2π-Periodizität. Damit ist die punktweise Konvergenz der trigonometrischen Reihe
sin x sin 2x sin 3x
+
+
+ ...
1
2
3
gezeigt. Siehe Abbildung 2.6. Und dies, obwohl die Reihe ihrer Koeffizienten bk = 1/k
divergiert (harmonische Reihe). Wir fassen zusammen.
sin(kx)
konvergiert punktweise. Auf jeLemma 71 Die trigonometrische Reihe ∞
k=1
k
dem abgeschlossenen Intervall, das keinen Punkt aus 2πZ enthält, ist die Konvergenz
gleichmäßig. Es gilt
n
lim
n→∞
k=1
sin (kx)
=
k
π−x
2
0
für x ∈ (0, 2π)
.
für x ∈ 2πZ
Für x = π/2 ergibt sich somit der Wert der alternierenden Reihe zu
∞
k=1
Abbildung 2.6:
n
sin kx
k=1 k
sin k π2
=
k
∞
k=0
(−1)k
π
= .
2k + 1
4
für n = 5 und n = 10 (grün) und Grenzfunktion (rot)
Als eine Folgerung ergibt sich eine weitere trigonometrische Reihe durch Symmetrisierung um π/2.
sin((2k+1)x)
Korollar 72 Die trigonometrische Reihe ∞
konvergiert punktweise.
k=1
2k+1
Auf jedem abgeschlossenen Intervall, das keinen Punkt aus πZ enthält, ist die Konvergenz gleichmäßig. Es gilt
 π
n
für 0 < x < π
sin ((2k + 1) x)  4
0
für x ∈ πZ
=
.
lim
n→∞
 π
2k
+
1
k=1
− 4 für − π < x < 0
KAPITEL 2. FOURIERANALYSIS
147
Beweis. Sei −π/2 < ξ < π/2. Damit folgt wegen
n
lim
n→∞
sin k
π
2
n
+ξ
k
k=1
sin k
+ lim
n→∞
π
2
k
k=1
−ξ
=
π
2
± ξ ∈ (0, π) aus dem Lemma
π−
π
2
+ξ
2
+
π−
π
2
2
−ξ
=
π
.
2
Nun gilt
sin k
ik eikξ − (−i)k e−ikξ
(−i)k eikξ − ik e−ikξ
= (−1)k
2i
2i
k ikξ
k −ikξ
i e
− (−i) e
π
= (−1)k+1
= (−1)k+1 sin k
−ξ
2i
2
π
+ξ
2
=
.
Daher ergibt die gliedweise Addition der beiden (konvergenten!) Reihen
n
lim
n→∞
sin k
π
2
+ξ
k=1
n
= 2 lim
n→∞
k=1
π
2
+ sin k
k
n
−ξ
= lim
n→∞
π
2
sin (2k + 1) + ξ
2k + 1
sin k
k=1
n
= 2 lim
n→∞
k=1
π
+ξ
2
1 + (−1)k+1
k
sin ((2k + 1) x)
.
2k + 1
Damit ist für 0 < x < π gezeigt, dass
n
lim
n→∞
k=1
sin ((2k + 1) x)
π
= .
2k + 1
4
Für x = 0 ist die Behauptung des Korollars offensichtlich und der Fall −π < x < 0
wird auf 0 < x < π zurückgeführt:
n
lim
n→∞
2.1.5
k=1
n
sin ((2k + 1) x)
sin ((2k + 1) |x|)
π
= − lim
=− .
n→∞
2k + 1
2k + 1
4
k=1
Approximation durch Fourierreihen
Ziel ist es nun, eine gegebene Funktion f : [0, 2π] → C durch trigonometrische
Polynome „möglichst gut” zu approximieren. Da die approximierenden trigonometrischen Polynome 2π-periodisch sind, setzen wir auch f periodisch nach ganz R fort.
(Dazu muss eventuell der Wert von f im Punkt 2π an den Wert im Punkt 0 angeglichen werden. Das schränkt uns aber nicht ein, da unstetige f zulässig sind, und
eine punktweise Approximation unstetiger Funktionen ohnehin nur in ganz speziellen Fällen möglich ist.) Welches fn ∈ Vn ist die „beste“ Approximation an f ? Eine
Möglichkeit über die Nähe von fn zu f zu räsonieren gibt die mittlere quadratische
Abweichung zwischen f und fn , nämlich
f − fn
2
1
=
2π
2π
0
|f (x) − fn (x)|2 dx.
KAPITEL 2. FOURIERANALYSIS
148
Man sucht also nach einem fn ∈ Vn , für das f − fn minimal ist. Mit steigendem n
kann die Approximation fn sicher nicht schlechter werden, da ja V0 ⊂ V1 ⊂ V2 ⊂ . . .
Einen Hinweis darauf, welches fn ∈ Vn den Ausdruck f − fn minimiert, liefert die
Geometrie eines unitären Vektorraumes mit dem folgenden Satz.4
Satz 73 Sei V ein endlichdimensionaler C−VR mit dem Skalarprodukt ·, · und
dem Untervektorraum U. Sei (e1 , ..., en ) eine ONB von U. Sei v ∈ V. Dann folgt
1. u ∈ U und v − u, u′ = 0 ∀u′ ∈ U ⇔ u = PU (v) :=
n
k=1
ek , v ek .
2. v − u′ ≥ v − PU (v) für alle u′ ∈ U.
3. Für ein u′ ∈ U gilt v − PU (v) = v − u′ genau dann, wenn u′ = PU (v) .
Beweis. Sei u ∈ U. Dann existieren ck ∈ C mit u = nk=1 ck ek . Daraus folgt
ek , v − u = ek , v −ck . Ist der Vektor v−u senkrecht auf U, folgt ek , v − u = 0 für
alle k, also ck = ek , v für alle k. Damit ist gezeigt, dass (v − u) ⊥ U ⇒ u = PU (v) .
Die Umkehrung folgt durch direktes Nachrechnen.
Sei nun u = PU (v) . Dann gilt für alle u′ ∈ U
v − u′
2
=
=
=
2
v − u − (u′ − u)
v − u 2 + 2ℜ v − u, u′ − u + u′ − u
2
v − u 2 + u′ − u ≥ v − u 2 ,
2
da ja u′ − u ∈ U und somit v − u, u′ − u = 0. Die Gleichheit v − u′ 2 = v − u 2
gilt genau dann, wenn u − u′ 2 = 0, also genau dann, wenn u′ = u.
Dieser Satz gibt eine eindeutige Zerlegung eines beliebigen Vektors v ∈ V in
eine Komponente PU (v) ∈ U und eine dazu senkrechte Komponente v − PU (v) . Die
Abbildung PU : V → U mit v → PU (v) ist linear und heißt Orthogonalprojektion auf
U. Weiter identifiziert der Satz PU (v) als den einzigen Vektor in U mit minimalem
Abstand zu v.
Definition 74 Sei V der Vektorraum aller 2π-periodischen, beschränkten Funktionen f : R → C, die auf dem Intervall [0, 2π] Riemann-integrierbar5 sind. Die Abbildung ·, · : V × V → C mit
f, g =
1
2π
2π
f (x)g(x)dx
0
ist ein inneres Produkt auf V . Es wird notiert f =
f, f . Für f ∈ V und
k ∈ Z heißen die Zahlen ck := ek , f die Fourierkoeffizienten von f. Die Folge
(Pn [f])n∈N0 der trigonometrischen Polynome Pn [f ] ∈ Vn mit Pn [f ] := nk=−n ck ek
ist eine trigonometrische Reihe. Sie heißt Fouriereihe von f. Kurzschreibweise: f ≃
k∈Z ck ek .
4
Eine andere Art der Approximation ist es, das kleinste ε ≥ 0 zu bestimmen, für das eine
Funktion fn ∈ Vn existiert, sodass |f (x) − fn (x)| ≤ ε für alle x ∈ R gilt. Diese Approximation ist
jedoch viel schwieriger zu behandeln als jene im Sinn des quadratischen Mittels.
5
Jede beschränkte 2π-periodische Funktion mit höchstens endlich vielen Unstetigkeitsstellen in
[0, 2π] ist daher in V . Überdies gilt Vn ⊂ V für alle n ∈ N0 .
KAPITEL 2. FOURIERANALYSIS
149
Die Definition von Pn [f ] ist offenbar äquivalent zu
Pn [f ] (x) =
1
2π
2π
0
Dn (x − y) f (y) dy,
n
2n+1
x / sin x2 (für
mit der Dirichletfunktion Dn (x) =
k=−n exp (ikx) = sin
2
x ∈ R 2πZ).
Der Unterschied zur Elementargeometrie: V ist unendlichdimensional und ·, ·
ist kein Skalarprodukt, weil f, f = 0 nicht f = 0 impliziert. Die Einschränkung von
·, · auf Vn × Vn ist jedoch ein Skalarprodukt, da die Elemente von Vn stetig sind.
Dies genügt, um ein zum endlichdimensionalen Fall analoges Resultat zu erzielen:
Satz 75 Sei f ∈ V und fn ∈ Vn . Dann gilt f − fn
heit gilt genau dann, wenn fn = Pn [f] .
2
≥ f − Pn [f ]
2
. Die Gleich-
Beweis. Aus der Definition von Pn [f ] folgt f − Pn [f] , ek = 0 für alle k =
−n, . . . n. Somit gilt auch f − Pn [f ] , u = 0 für alle u ∈ Vn , insbesondere auch für
u = Pn [f ] − fn . Damit folgt
f − fn
2
=
=
=
f − Pn [f ] + Pn [f] − fn 2 = f − Pn [f] + u
f − Pn [f ] 2 + u 2 + 2ℜ f − Pn [f ] , u
f − Pn [f ] 2 + u 2 ≥ f − Pn [f] 2 .
Also gilt
f − fn
2
f − fn
2
− f − Pn [f ]
2
= u
2
≥ 0.
− f − Pn [f ]
2
= u
2
=0
Da ·, · auf Vn × Vn ein Skalarprodukt ist, gilt
2
genau dann, wenn u = 0, d.h., wenn Pn [f ] = fn .
Das trigonometrische Polynom Pn [f ] ist also das einzige Element von Vn , das
die quadratische Abweichung zu f minimiert. Es wird als das n-te Fourierpolynom
von f bezeichnet und lässt sich mit exp(ikx) = cos(kx) + i sin(kx) natürlich auch in
sin und cos Funktionen entwickeln:
n
a0
Pn [f ] (x) =
+
(ak cos(kx) + bk sin(kx)) , mit
2
k=1
ak≥0 = ck + c−k =
bk>0
1
π
2π
cos(kx)f(x)dx,
0
1
= i(ck − c−k ) =
π
2π
sin(kx)f (x)dx.
0
KAPITEL 2. FOURIERANALYSIS
2.1.6
150
Fourierreihe der Rechteckschwingung
Sei f ∈ V ungerade mit f (0) = f (π) = 0 und f (x) = 1 für 0 < x < π. Da f
ungerade ist, folgt
π
π
e−ikx f (x) dx = −i
2πck =
−π
−π
π
sin (kx) f (x) dx = −2i
sin (kx) dx,
0
also c0 = 0 und 2πck = 2ik cos (kx)|π0 = 2ik (−1)k − 1 für k = 0. Es gilt somit ck = 0
2
für k ∈ 2Z und ck = iπk
für k ∈ 2Z + 1. Die Fourierreihe von f ergibt sich zu
f (x) ≃
∞
k=0
c2k+1 ei(2k+1)x − e−i(2k+1)x =
=
4
π
sin x +
4
π
∞
k=0
sin ((2k + 1) x)
2k + 1
1
1
sin 3x + sin 5x + . . . .
3
5
Dass die Reihe sin x+ 13 sin 3x+ 15 sin 5x+. . . für alle x ∈ (0, π) gegen ein und denselben Wert π/4 konvergiert, ist, wie wir aus dem Abschnitt über trigonometrische
Reihen wissen, der Fall, aber beileibe nicht offensichtlich.6 Für x = 0 konvergiert die
Reihe natürlich gegen 0, da alle ihre Glieder gleich 0 sind.
Der Versuch, aus der Fourierreihe von f eine Potenzreihe von f um 0 abzulesen,
scheitert schon beim in x linearen Teil, da für x → 0 gilt
sin x +
1
1
sin 3x + . . . +
sin (2n + 1) x = (n + 1) x + o (x) .
3
2n + 1
Die Entwicklung nach Funktionen, die selbst schon durch Potenzreihen gegeben sind,
hat also unsere Approximationsmöglichkeiten erheblich ausgeweitet.
Die Abbildungen 2.7 und 2.8 zeigen die Fourierpolynome Pn [f] für n = 1, 3, 5, 7
und f. Wie gut approximiert Pn [f ] die Rechteckfunktion f im quadratischen Mittel?
Da f − Pn [f ] nach Konstruktion senkrecht auf Vn ist, gilt
1
1=
2π
2π
f 2 (x) dx = f
0
2
= Pn [f ]
2
+ f − Pn [f ]
2
.
√
Da
2 sin ((2k + 1) x) : k = 1, . . . n ein orthonormales Funktionensystem in V2n+1
ist, gilt
n
n
|b2k+1 |2
8
1
2
P2n+1 [f ] =
= 2
.
2
π k=1 (2k + 1)2
k=1
1
1
Für n = 7 folgt z.B. P7 [f] 2 = π82 1 + 19 + 25
+ 49
≈ 0, 949. Der (relative) mittlere
quadratische Fehler der Approximation P7 [f] beträgt also f − P7 [f ] 2 / f 2 ≈
5%.
6
Für x = π/2 etwa ergibt sich die Leibniz’sche Reihe 1 − 1/3 + 1/5 − 1/7 + . . . Sie konvergiert als
alternierende Reihe von Gliedern, deren Beträge eine monotone Nullfolge bilden. (Leibnizkriterium)
Ihr Grenzwert ist π/4. Siehe [3] Vol I, Kap IV.4.3.
KAPITEL 2. FOURIERANALYSIS
151
1
0.5
0
-1.5
-1
-0.5
0
0.5
1
1.5
x/pi
-0.5
-1
Abbildung 2.7: P1 [f] and P3 [f]
1
0.5
0
-1.5
-1
-0.5
0
0.5
1
1.5
x/pi
-0.5
-1
Abbildung 2.8: P5 [f] and P7 [f]
Welchen Grenzwert hat die Folge Pn [f ]
−2
von [3] ∞
= π 2 /6. Daraus folgt wegen
k=1 k
∞
k=1
dass
1
=
k2
∞
k=1
2
∞
n
? Es gilt nach Kap. IV.3.6 in Vol.I
1
1
1
2 +
2 =
4
(2k)
(2k + 1)
k=0
∞
k=0
1
3
2 =
4
(2k + 1)
∞
k=1
∞
k=1
∞
1
1
+
,
2
k
(2k + 1)2
k=0
1
π2
=
.
k2
8
Also gilt limn→∞ Pn [f ] = 1 = f und daher limn→∞ f − Pn [f ] = 0. Die
mittlere quadratische Abweichung zwischen Pn [f ] und f geht (wie es aufgrund der
punktweisen Konvergenz sein muss) für n → ∞ gegen 0.
2.1.7
Fouriereihen allgemeiner Periode
Ist F : R → C eine L-periodische, Riemann-integrierbare Funktion, dann ist x →
f (x) = F ( Lx
) eine 2π-periodische Funktion in V , und ihre Fourierreihe ist die Funk2π
KAPITEL 2. FOURIERANALYSIS
152
tionenfolge (sn )n∈N0 mit
n
ck eikx ,
sn (x) :=
ck :=
k=−n
2π
1
2π
e−ikx f (x)dx.
0
Die Fourierreihe von F ist dann mit ω := 2π/L
F (x) = f
2π
x
L
≃
ck ei
2πkx
L
ck eiωkx .
=
k∈Z
k∈Z
k∈
Das Frequenzspektrum der Fourierreihe von F ist die Menge der Zahlen ωk = 2π
L
2π
2π
Z, für die ck = 0. Die Zahl ω = L heißt „Grundfrequenz”. Achtung: Die Redeweise
L
verwischt den Unterschied zwischen Frequenz ν := 1/L und Kreisfrequenz ω = 2π/L.
Übrigens: Durch Übergang zur Sinus/Cosinus-Zerlegung von sn gelangt man analog
zu zwei nichtnegativen Frequenzspektren, Teilmengen von ωN0 . Eines für die Sinusund eines für die Cosinusanteile.
Der Fourierkoeffizient ck drückt sich durch F folgendermaßen aus:
ck =
1
2π
2π
e−ikx f (x)dx =
0
1
2π
2π
Lx
1
dx =
2π
L
e−ikx F
0
L
e−i
2πky
L
F (y)dy.
0
Besitzt eine L-periodische Funktion F mit der Fourierreihe k∈Z ck exp(iωkx)
auch die kleinere Periode L/n mit einem n ∈ N, dann hat F auch eine Fourierreihe
zur Grundfrequenz ωn, also
F (x) ≃
ck einωkx .
k∈Z
Wegen der linearen Unabhängigkeit der Funktionen ek erfordert dies, dass ck =
0, falls k ∈
/ nZ. Das Frequenzspektrum von F kann also zu einer Teilmenge von
ωnZ ⊂ωZ präzisiert werden.
Ist F : [0, L] → C mit F (0) = 0 = F (L) Riemann-integrierbar, dann lässt sich
F eindeutig zu einer ungeraden 2L-periodischen Funktion G : R → C fortsetzen.
Ihre Fourierreihe ist
G(x) ≃
ck eiωkx
k∈Z
L
1
mit ck := 2L
exp(−iωkx)G(x)dx und ω := 2π/(2L) = π/L. Da G schief ist, folgt
−L
c−k = −ck und daher
G(x) ≃
2ick sin(ωkx).
k∈N
Für den Koeffizienten bk = 2ick dieser Sinusreihe gilt
i
L
2
=
L
L
e−iωkx G(x)dx =
bk =
−L
L
0
i
L
L
(−i sin(ωkx)) G(x)dx
−L
2
sin(ωkx)G(x)dx =
L
L
sin
0
π
kx F (x)dx.
L
KAPITEL 2. FOURIERANALYSIS
153
Damit hat die Funktion F : [0, L] → C die Fourierreihe7
π
kx
F (x) ≃
bk sin
L
k∈N
L
2
mit bk =
L
π
kx F (x)dx.
L
sin
0
Sei etwa die ungerade Funktion f ∈ V die Rechteckschwingung mit f(0) =
f (π) = 0 und f (x) = 1 für 0 < x < π. Für B ∈ R, T ∈ R>0 sei F : R → R mit
F (t) = Bf ( 2πt
). Dann hat F die Periode T und die (punktweise gültige) Fourierreihe
T
4
F (t) = B
π
∞
k=0
sin ((2k + 1) ωt)
2k + 1
mit ω := 2π/T > 0. Das (Kreis-)Frequenzspektrum von F ist die Menge ω (2N0 + 1) .
Gilt zB T = 10−1 s, dann ist die Grundfrequenz ν = 1/T von 10 Hz unhörbar. Aber
der Koeffizient der hörbaren Frequenz 90 Hz beträgt noch 1/9 des Koeffizienten der
Grundfrequenz und kann somit zu Lärmbelästigung führen, wenn F die ruckartige
Bewegung eines Maschinenteils modelliert.
2.1.8
*Lokalisierungsenergie im Potentialtopf
Ist ein nichtrelativistisches Quantenteilchen in das Intervall [0, L] gesperrt, dann ist
sein Grundzustand durch ϕ : [0, L] → C mit ϕ (x) = 2/L sin (πx/L) repräsentiert.
Diese Funktion ϕ minimiert den Erwartungswert u, Hu / u, u des ’Energieoperators’ H = − ( 2 / (2m)) ∂x2 in {u ∈ C 2 ([0, L] : C) : u = 0 und u (0) = u (L) = 0} ,
wobei m die Masse des Teilchens ist. Es gilt Hϕ = εϕ mit ε = (π /L)2 / (2m) und
somit wegen ϕ 2 = ϕ, ϕ = 1 auch ϕ, Hϕ = ε.
Es wird nun der Energieerwartungswert von Wellenfunktionen ϕn berechnet, die
das Teilchen im Zentrum des Intervalls mit steigendem n zunehmend schärfer lokalisieren. Die Ortswahrscheinlichkeitsdichten bilden eine δ-Folge. Es zeigt sich dabei,
dass der Energieerwartungswert von ϕn in n streng monoton und unbeschränkt
anwächst. (Durch Produktbildung ist dieses Beispiel auf mehr als nur eine Raumdimension zu übertragen.)
Sei L ∈ R>0 und n ∈ N. Für ϕn : [0, L] → R gelte ϕn (x) = sinn (πx/L) für
0 ≤ x ≤ L. Diese Funktion steigt also zwischen 0 und L/2 streng monoton von 0
auf 1 und fällt zwischen L/2 und L streng monoton von 1 auf 0 ab. Je größer der
Wert n ist, umso schmäler ist die Spitze des Graphen von sin2n . Gesucht sind die
Zahl Cn ∈ R>0
Cn := ϕn
2
L
=
0
|ϕn (x)|2 dx =
L
π
π
sin2n (s) ds
0
und der Energieerwartungswert der ’Wellenfunktion’ ϕn eines Schrödingerteilchens
der Masse m > 0, dh die Zahl E n ∈ R mit
L
2
Cn · E n = ϕn , Hϕn = −
7
2m
0
ϕn (x) ϕ′′n (x) dx.
Von diesem Sachverhalt macht die Wellenmechanik eines Teilchens im Würfel Gebrauch.
KAPITEL 2. FOURIERANALYSIS
154
Durch partielle Integration und anschließende Substition s = πx/L folgt
L
2
Cn · E n =
2m
2
(ϕ′n (x)) dx =
0
π
2
π
2m L
(∂s sinn s)2 ds
0
und somit
2
π
En =
2m L
2
π
0
(∂s sinn s)2 ds
=ε·
π
sin2n (s) ds
0
π
0
(∂s sinn s)2 ds
.
π
sin2n (s) ds
0
Lemma 76 Für n ∈ N gilt
π
π 2n
sin (x) dx = n
4
n
2n
0
π
und
(∂x sinn x)2 dx =
0
2nπ 2n − 2
.
4n n − 1
Beweis. Teil 1) Es gilt für x ∈ R
(eix − e−ix )
sin (x) =
(−4)n
2n
2n
2n
n
= (−1) 4
k=0
2n
= (−1)n 4−n
(−1)k
k=0
−n
2n i(2n−k)x
e
(−1)k e−ikx
k
2n i2(n−k)x
e
.
k
Die Funktion sin2n ist ein trigonometrisches Polynom vom Grad 2n. Es enthält
allerdings nur Beiträge proportional zu e2k mit k ∈ {−n, −n + 1, . . . n} und hat
somit der Periode π. Zum Integral über das Periodenintervall [0, π] trägt daher nur
der konstante Summand proportional e0 bei, also jener mit k = n. Somit gilt
π
sin2n (x) dx = 4−n
0
2n
π.
n
Teil 2) Für x ∈ R gilt ∂x (sinn x) = n cos (x) sinn−1 x. Damit folgt
(∂x (sinn x))2 = n2 cos2 (x) sin2n−2 x = n2 1 − sin2 x sin2n−2 x
= n2 sin2n−2 x − sin2n x
und daher
π
0
(∂x (sinn x))2 dx = n2 (Cn−1 − Cn )
n2 π
2n − 2
2n (2n − 1) 2n − 2
= n 4
−
4
n−1
n2
n−1
2
n π 2n − 2
2
2nπ 2n − 2
= n
4−4+
= n
.
4
n−1
n
4
n−1
Mit Hilfe des Lemmas folgt nun, dass E n in n streng monoton - und mit asymptotischer Schrittweite limn→∞ E n+1 − E n = ε/2 - wächst:
KAPITEL 2. FOURIERANALYSIS
155
Satz 77 Es gilt Cn = 4−n L (2n)!/n!2 und E n = ε ·
n
2−1/n
=ε· 1+
(n−1)2
2n−1
.
Beweis. Die zwei Hilfsformeln des Lemmas ergeben
L 2n
Cn = n
4
n
und E n = ε · 2n
2n−2
n−1
2n
n
.
Nun gilt
2n
n
und daher
2n
n
=
Damit ergibt sich
E n = ε · 2n
=
(2n)!
n!n!
2n (2n − 1) 2n − 2
.
n2
n−1
n2
n2
n
= ε·
=ε·
.
2n (2n − 1)
2n − 1
2 − 1/n
Es soll nun die Funktion ϕn : [0, L] → R mit ϕn (x) = sinn (πx/L) nach den
Energieeigenfunktionen
ψ k : [0, L] → R mit ψ k (x) =
2/L sin (kπx/L) für k ∈ N
des Teilchens im Intervall [0, L] entwickelt werden. Es gilt
2
−
2m
∂x2 ψ k = Ek ψ k mit Ek = εk 2 .
Das Funktionensystem {ψ k : k ∈ N} erfüllt
ψm, ψn =
2
L
L
sin mπ
0
=
1
π
x
x
2
sin nπ
dx =
L
L
π
π
sin (ms) sin (ns) ds
0
2π
sin (ms) sin (ns) ds = δm,n.
0
Sei Φn : R → R ungerade und 2L-periodisch. Auf [0, L] stimme Φn mit ϕn überein.
Ganz analog sei Ψn die ungerade 2L-periodische Fortsetzung von ψ n nach R. Es gilt
also Ψn (x) = 2/L sin (kπx/L) für alle x ∈ R.
Für ungerades n gilt Φn (x) = sinn (πx/L) für alle x ∈ R. Dann liegt Φn in Vn ,
ist ungerade und besitzt somit eine Zerlegung nach den Funktionen {Ψk }nk=1 . Es gilt
für x ∈ R und n ∈ N (Übung)
sin
2n−1
4
(x) = n
4
n
(−1)k−1
k=1
2n − 1
sin ((2k − 1) x)
n−k
KAPITEL 2. FOURIERANALYSIS
und daher
ϕ2n−1 =
/
L 4
2 4n
156
n
(−1)k−1
k=1
Für gerades n gilt hingegen
Φn (x) =
2n − 1
ψ 2k−1 .
n−k
sinn (πx/L)
für 0 ≤ x ≤ π
.
− sinn (πx/L) für − π ≤ x ≤ 0
Die ungerade Funktion Φ2n ist für jedes n ∈ N zwar mindestens einmal aber nicht
beliebig oft stetig differenzierbar. Sie besitzt daher lediglich eine gleichmäßig konvergente Fourierreiheentwicklung in Form einer Sinusreihe. Es gilt also für x ∈ [0, L]
ϕ2n (x) =
∞
k=1
2.1.9
2
L
L
sin2n π
0
s
x
s
sin kπ
ds sin kπ
=
L
L
L
∞
ϕ2n , ψ k ψ k (x) .
k=1
Periodisch getriebener Oszillator: Fourierreihenlösung
Welche Lösungen besitzt die Bewegungsgleichung eines (ungedämpften) harmonischen Oszillators, auf den eine (hinreichend glatte) periodische Kraft einwirkt? Die
Bewegungsgleichung ist
ẍ + ω 20 x = f auf R.
(2.4)
Für f (t) = cos ωt und ω = ω 0 ist x : R → R mit x (t) = cos (ωt) / (ω 20 − ω 2 )
eine Lösung von Gleichung (2.4). Für f (t) = sin ωt und ω = ω 0 ist x : R → R mit
x (t) = sin (ωt) / (ω 20 − ω 2 ) eine Lösung. Hat daher eine T -periodische Inhomogenität
f die punktweise (gleichmäßig und absolut)) konvergente Fourierreihenentwicklung
∞
a0
f (t) =
+
(ak cos (kωt) + bk sin (kωt))
2
k=1
mit ω = 2π/T, dann ist die Funktion xF : R → R mit
∞
a0
ak cos (kωt) + bk sin (kωt)
xF (t) =
+
2
2ω 0 k=1
ω 20 − k 2 ω 2
eine maximale Lösung von Gleichung (2.4), falls k 2 ω 2 = ω 20 für alle k ∈ N. Sie ist
T -periodisch. Alle weiteren maximalen Lösungen gehen aus xF durch Addieren einer
Lösung der homogenen Schwingungsgleichung hervor.
Als Beispiel für eine Funktion f kann die Rechtecksfunktion des vorigen Abschnittes herangezogen werden, wenn sie zur Glättung durch ihr Fourierpolynom
4
fn (t) = B
π
n
k=0
sin ((2k + 1) ωt)
2k + 1
ersetzt wird. fn ist 2π/ω-periodisch. Falls ω (2k + 1) = ω 0 für alle k ∈ N0 gilt, hat
Gleichung (2.4) die 2π/ω-periodische Lösung x : R → C mit
4
x (t) = B
π
n
k=0
1
sin ((2k + 1) ωt)
.
2k + 1 ω 20 − (2k + 1)2 ω 2
KAPITEL 2. FOURIERANALYSIS
157
Die Bedingung ω (2k + 1) = ω 0 für alle k ∈ N0 stellt sicher, dass die Eigenfrequenz
ω 0 des Oszillators im Fourierspektrum der Inhomogenität f nicht vorkommt, und
daher kein Resonanzfall vorliegt.
Figur (2.9) zeigt für den Fall B/ω 20 = 1, ω = ω 0 /2 und n = 3 die Schwingung x
und ihre Teilschwingungen xk , für die x = nk=0 xk gilt, als Funktion von τ = ω 0 t/2π
im Bereich 0 < τ < 2. Die höherfrequenten Teilschwingungen modifizieren das Bild
2
1
0
0
0.5
1
1.5
2
-1
-2
Abbildung 2.9: x in purpur und xk für k = 1, 2, 3 in schwarz, rot, grün.
für größere n kaum, da die Amplituden der Teilschwingungen rasch abnehmen.
Ein weiteres etwas interessanteres Beispiel für f gibt die stetige 2π-periodische
Funktion b mit b (t) = |t| für −π < t ≤ π ab. Wir bestimmen nun die (einzige!)
2π-periodische Lösung xF von Gleichung (2.4), wenn ω 0 keine natürliche Zahl ist.
Dazu benützen wir zunächst die Fourierreihe von b, also
π
4
b (t) = −
2 π
∞
k=0
cos ((2k + 1) t)
.
(2k + 1)2
Daraus folgt mit der Fourierreihenlösungsformel unmittelbar
π
4
xF (t) =
+
2
2ω 0 π
∞
k=0
cos ((2k + 1) t)
.
(2k + 1)2 (2k + 1)2 − ω 20
An der Lösung xF ist abzulesen, dass x′F (0) = 0 = x′F (π) . Abbildung 2.10 zeigt b
und xF für zwei Werte von ω 0 . Ein Phasenschub um π zwischen b und xF ist im Fall
ω 0 < 1 klar zu sehen, während für ω 0 > 1 die Anregung b mit der Reaktion xF im
Gleichklang steht.
Eine direkte Berechnung der 2π-periodischen Lösung von x′′ + ω 20 x = b zur 2πperiodischen Funktion b, für die b (t) = |t| im Bereich −π < t ≤ π gilt, ist die
folgende. Berechne im Bereich 0 ≤ t ≤ π eine Lösung von x′′ (t) + ω 20 x (t) = t
mit den Eigenschaften x′ (0) = 0 = x′ (π) . Wenn(!) eine solche Lösung existiert,
dann kann diese auf genau eine Weise zu einer geraden 2π-periodischen Funktion
fortgesetzt werden.
KAPITEL 2. FOURIERANALYSIS
158
x
5
3.75
2.5
1.25
0
-1
0
1
2
3
t/pi
Abbildung 2.10: b (grau) und xF für ω 20 = 2 (grün) und ω 20 = 1/2 (rot)
Zu jeder Lösung im Bereich 0 ≤ t ≤ π existieren Zahlen A, B ∈ R, sodass für
alle t ∈ [0, π]
t
x (t) = 2 + A cos (ω 0 t) + B sin (ω 0 t) .
ω0
Die Vorgabe x′ (0) = 0 ist genau dann erfüllt, wenn Bω 0 = −ω −2
0 . Damit gilt
x (t) =
t−
sin(ω0 t)
ω0
2
ω0
+ A cos (ω 0 t) .
Die Vorgabe x′ (π) = 0 ist genau dann erfüllt, wenn
0=
1 − cos (ω 0 π)
− Aω 0 sin (ω 0 π) ,
ω 20
wenn also A sin (ω 0 π) = (1 − cos (ω 0 π)) /ω 30 . Da ω 0 ∈
/ N vorausgesetzt ist, folgt
A=
also
x (t) =
t−
sin(ω0 t)
ω0
2
ω0
+
1 − cos (ω 0 π)
,
ω 30 sin (ω 0 π)
1 − cos (ω 0 π)
cos (ω 0 t) für alle t ∈ [0, π] .
ω 30 sin (ω 0 π)
Die gerade Fortsetzung auf das Intervall [−π, π] dieser Lösung erfüllt somit
x (t) =
ω 0 |t| − sin (ω 0 |t|) 1 − cos (ω 0 π)
+ 3
cos (ω 0 t) für alle t ∈ [−π, π] .
ω 30
ω 0 sin (ω 0 π)
Da es für ω 0 ∈
/ N genau eine 2π-periodische Lösung von Gl (2.10) gibt, muss die
2π-periodische Fortsetzung von x mit xF übereinstimmen. Daher gilt für t ∈ [−π, π]
4
π
+
2
2ω 0 π
∞
k=0
cos ((2k + 1) t)
ω 0 |t| − sin (ω 0 |t|) 1 − cos (ω 0 π)
1
=
+ 3
cos (ω 0 t) .
2·
2
2
ω 30
ω 0 sin (ω 0 π)
(2k + 1) (2k + 1) − ω 0
KAPITEL 2. FOURIERANALYSIS
2.1.10
159
*Der mechanische Fourieranalysator 2
Sei b : R → R (stückweise) stetig mit b (t) = 0 für alle t ∈
/ [0, T ] . Sei für ω ≥ 0
die Funktion xω : R → R zwei mal (stückweise) stetig differenzierbar. In allen
Stetigkeitspunkten von b gelte x′′ω + ω 2 xω = b. Weiter gelte die Anfangsvorgabe
xω (0) = x′ω (0) = 0. Dann folgt für alle t > T und ω > 0
e−iωt
xω (t) = ℜ i
ω
T
eiωξ b (ξ) dξ .
0
Am Intervall [0, T ] hat b die Fourierreihe
b (t) ≃
2π
ck [b] ei T kt mit ck [b] =
k∈Z
1
T
T
0
2π
e−i T kt b (t) dt = c−k [b].
(2.5)
Außerhalb von [0, T ] gibt Gleichung (2.5) die Fourierreihe jener T -periodischen Funktion, die auf [0, T ] mit b übereinstimmt und natürlich keinesfalls der Funktion b, die
ja gar nicht periodisch ist.
Daher gilt für einen Oszillator mit der an die Beobachtungsdauer T angepassten
Eigenfrequenz ω = ω k := 2π
k mit k ∈ N für alle t > T
T
.
7
.
7
2π
2π
e−i T kt T i 2π kξ
e−i T kt
xωk (t) = ℜ i 2π
e T b (ξ) dξ = ℜ i 2π T c−k [b]
k
k
0
T
T
0
1
2π
T2
=
ℜ ie−i T kt ck [b] .
2πk
Für die Amplitude8 Ak von xωk im Bereich t > T gilt Ak =
Sei etwa speziell T = 2π und

 1 für 0 < t < π
−1 für π < t < 2π .
b (t) =

0 sonst
Dann gilt ck [b] = 0 für k ∈ 2Z und ck [b] =
t > 2π mit der Abkürzung xk = xωk
xk (t) =
−2i
πk
T2
2πk
|ck [b]| .
für k ∈ 2Z + 1. Daraus folgt für alle
0
für k ∈ 2N
.
− k42 cos (kt) für k ∈ 2N0 + 1
So schwingt also der Oszillator mit der Eigenfrequenz k nach der Einwirkung von b.
Unter http://physik.uibk.ac.at/muw/physlets/fourier/Rechteck.html findet sich
eine mechanische Simulation eines Fourieranalysators, die Emmerich Kneringer mit
einem Baukasten für „virtuelle Experimente“ programmiert hat. Dort wird die Inhomogenität der Schwingungsgleichung eines der Resonatoren indirekt dadurch festgelegt, dass für seine Gleichgewichtslage eine zeitabhängige Funktion vorgegeben wird.
8
Durch Messung von Ak lässt sich somit der Betrag des Fourierkoeffizienten ck [b] ermitteln.
Der Koeffizient c0 [b] ergibt sich analog aus dem (konstanten) Wert von x′0 (t) im Bereich t > T.
KAPITEL 2. FOURIERANALYSIS
160
Dies geschieht im Detail so: Der Oszillator wird durch einen Körper der Masse m,
der auf einer reibungsfreien Schiene gleitet und durch eine Feder an einen festen
Punkt gebunden ist, realisiert. Hat die Feder die Federkonstante k > 0, dann erfüllt
die Auslenkung des Körpers aus seiner Gleichgewichtslage die Bewegungsgleichung
mx′′ (t) = −kx (t) . Hat das kontrolliert geregelte Ende der Feder zur Zeit t den Ort
ξ (t) , dann gilt die Bewegungsgleichung mx′′ (t) = −k [x (t) − ξ (t)] . Es gilt daher
mit ω 2 = k/m
x′′ + ω 2 x = ω 2 ξ.
Hängt also der Oszillator mit der Eigenfrequenz ω an einem manipulierten Nullpunkt mit der Auslenkung ξ (t) zur Zeit t, dann gilt b = ω 2 ξ. Es sei ξ (t) = 0 für alle
t∈
/ [0, T ] . Der Oszillator schwingt daher zur Zeit t > T mit der Amplitude
A=
Speziell für ω = ω k :=
Ak =
2π
k
T
T 2ω2
|c−k [ξ]| .
2πk
mit k ∈ Z ergibt sich für die Amplitude Ak von xk
,
T2
T 2 ,,
|c−k [b]| =
c−k ω 2k ξ , = 2πk |c−k [ξ]| .
2πk
2πk
Für die Nullpunktsverschiebung


mit L > 0 folgt daher
L für 0 < t < π
−L für π < t < 2π
ξ (t) =

0 sonst
,
,
Ak = 2πk |c−k [ξ]| = 2πkL ,,
0
2i
πk
,
,
für k ∈ 2Z
,=
für k ∈ 2Z + 1 ,
0 für k ∈ 2Z
.
4L für k ∈ 2Z + 1
Jeder Resonator, dessen Eigenfrequenz ein ungerades Vielfaches der Grundfrequenz
2π/T ist, schwingt also mit derselben Amplitude 4L nach.
2.1.11
Allgemeine Eigenschaften der Fourierkoeffizienten
Aus bereits berechneten Fourierkoeffizientenen können gelegentlich weitere mit folgenden Formeln ohne großen Aufwand bezogen werden. Auch zum Aufspüren von
Rechenfehlern eignen sich diese Faulenzerregeln gut.
Lemma 78 Sei ck (f ) := ek , f der k-te Fourierkoeffizient von f. Seien f, g ∈ V
und λ ∈ C. Dann gilt:
1. ck (f + g) = ck (f ) + ck (g), ck (λf ) = λck (f ).
2. f (R) ⊂ R ⇒ c−k (f ) = ck (f) ⇒ ak (f ) = 2ℜck (f), bk (f ) = −2ℑck (f ) für
k ≥ 0. Sinus/Cosinusreihe hat reelle Koeffizienten.
KAPITEL 2. FOURIERANALYSIS
161
3. ck (Tξ f) = exp(−ikξ)ck (f ) mit Tξ f (x) = f (x − ξ) (Translation um ξ ∈ R).
4. f gerade ⇒ c−k (f) = ck (f ) für alle k ∈ Z ⇒ f(x) ≃ c0 +
∞
k=1
2ck cos(kx).
5. f ungerade ⇒ c−k (f) = −ck (f) für alle k ∈ Z ⇒ f (x) ≃
∞
k=1
2ick sin(kx).
6. f ∈ C 1 ⇒ ck (f ′ ) = ikck (f ) für alle k ∈ Z ⇒ ak (f ′ ) = kbk (f) , bk (f ′ ) =
−kak (f ′ ) für k ∈ N und a0 (f ′ ) = 0.
Beweis. Einfach nachrechnen.
Probieren wir diese Regeln am Beispiel der Rechteckschwingung f aus. Die Fourierkoeffizienten
0
für k ∈ 2Z
ck =
2/(iπk) für k ∈ 2Z + 1
erfüllen die aus der Realität von f folgende Bedingung c−k = ck offenbar. Weiter ist
f ungerade. Tatsächlich ist auch die Spektralfunktion k → ck ungerade. Vielleicht
können wir auch noch das Faktum c2k = 0 als Folge einer Symmetrie verstehen?
Das geht so: Das Rechtstranslat Tπ/2 f der Funktion f um den Betrag π/2 ist eine
gerade Funktion. Daher muss die Spektralfunktion von Tπ/2 f ebenfalls gerade sein.
Nach der 3. Faulenzerregel ist diese Spektralfunktion durch
k → exp (−ikπ/2) ck
gegeben. Also folgt exp (ikπ/2) c−k = exp (−ikπ/2) ck . Dies ist äquivalent zu c−k =
exp (−ikπ) ck = (−1)k ck . Für k ∈ 2Z folgt somit −ck = c−k = ck und daher ck = 0.
Die folgende Abschätzung für die Fourierkoeffizienten ck einer Funktion f kann
einerseits zum Nachweis der punktweisen absoluten Konvergenz von Fourierreihen
benutzt werden, kann aber dann auch die Abschätzung des Fehlers bei Approximation von f(x) durch das n-te Fourierpolynom Pn [f ] ermöglichen, wenn die punktweise
Konvergenz limn→∞ Pn [f ] (x) = f (x) sichergestellt ist.
Satz 79 Sei f ∈ V stetig und n ∈ N. Die Funktion f sei n − 1 mal stetig differenzierbar und die Funktion f (n−1) sei stückweise stetig differenzierbar. Das heißt, dass
Punkte 0 =: x0 ≤ x1 < . . . < xM−1 ≤ xM := 2π existieren, sodass die Einschränkung
von f (n−1) auf das Intervall (xi , xi+1 ) für alle i ∈ {0, 1, . . . M − 1} differenzierbar ist,
und dass die einseitigen Limiten limε↓0 f (n) (xi ±ε) für ,alle i ∈ ,{1, . . . M − 1} existieM−1 xi+1 , (n)
1
ren. Dann gilt |ck | ≤ C/ |k|n mit C := 2π
f (x), dx für alle k ∈ Z 0.
i=0
xi
KAPITEL 2. FOURIERANALYSIS
162
Beweis. Mit partieller Integration folgt
2π
2πck =
0
i
=
k
f (x) · e−ikx |2π
0 −
= −
=
=
=
i
k
f(x) · e−ikx dx =
f(x) ·
0
2π
0
d −ikx
dx
e
dx
f (1) (x) · e−ikx dx
2π
i
k
f (1) (x) · e−ikx dx = . . . =
0
i
k
n−1
−
i
k
n
i
k
n
−
−
2π
2π
0
M−1
·
·
f (n−1) (x) ·
xi+1
xi
i=0
M−1
xi+1
xi
i=0
−
i
k
n−1
2π
0
f (n−1) (x) · e−ikx dx
i d −ikx
e
dx
k dx
f (n) (x) · e−ikx dx − f (n−1) (x) · e−ikx |xxi+1
i
f (n) (x) · e−ikx dx .
Also gilt
1
ck =
2π
i
−
k
M−1
n
·
i=0
xi+1
xi
f (n) (x) · e−ikx dx .
(Für die n-te partielle Integration wurde hier das Intervall [0, 2π] in die von den Ausnahmepunkten x1 , . . . xM−1 vorgegebenen Teilintervalle zerlegt. Die Funktion f (n−1)
ist in allen Punkten von [0, 2π] außer den Punkten x1 , . . . xM−1 differenzierbar. Es
wird weiter x0 = 0 und xM = 2π gesetzt. Der Beitrag der Randterme von den
Integralen über die einzelnen Teilintervalle verschwindet im allgemeinen nicht; ihre
Summe jedoch schon.) Unter Verwendung der Dreiecksungleichung folgt schließlich
die Behauptung.
2.1.12
Konvergenz der Fourierreihe
Es soll nun beschrieben werden, in welchem Sinn die Fourierreihe einer Funktion
f ∈ V die Funktion f selbst eindeutig festlegt. Unterscheiden sich im Intervall
[0, 2π] zwei Funktionen f, g ∈ V nur in endlich vielen Punkten, dann sind die Fourierkoeffizienten von f und g gleich. Die Funktionen f und g haben dann natürlich
auch die selbe Fourierreihe ohne selbst gleich zu sein. Nun könnte man vermuten,
dass wenigstens stetige Funktionen f ∈ V durch ihre Fourierkoeffizienten eindeutig
festgelegt sind. Das ist tatsächlich so, wenngleich auch die Fouriereihe einer stetigen
Funktion f ∈ V nicht notwendig an jeder Stelle x gegen f (x) konvergiert. (Gegenbeispiel von Du Bois-Reymond, Sätze von Carleson, Kahane und Katznelson, siehe
Kapitel 18, 19 in [13])
Im Allgemeinen konvergiert die Fourierreihe von f ∈ V nur im quadratischen
Mittel gegen f. Eine Rekonstruktion von f aus seiner Fourierreihe ist dann „fast
überall” möglich. „Fast überall” bedeutet: überall bis auf eine Ausnahmemenge vom
„Volumen” 0. Z.B. hat eine abzählbare Teilmenge von R das Volumen 0.
KAPITEL 2. FOURIERANALYSIS
163
Satz 80 Sei f ∈ V und Pn f = nk=−n ck ek mit ck = ek , f . Sei9 ak = ck + c−k für
k ∈ N0 und bk = i (ck − c−k ) für k ∈ N. Dann gilt
1. f
2
2. Pn f
2
= Pn f
2
+ f − Pn f
n
k=−n
=
|ck |2 =
1
2
2
2
≥ Pn f
|a0 |2
2
und
n
k=1
+
|ak |2 + |bk |2
.
Beweis. Wegen Pn f, f − Pn f = 0 folgt die erste Behauptung aus
f
2
= f − Pn f + Pn f
2
= Pn f
2
+ f − Pn f
2
+ 2ℜ Pn f, f − Pn f .
Die zweite Behauptung folgt aus der Tatsache, dass (ek )nk=−n eine ONB von Vn ist:
n
Pn f
2
= Pn f, Pn f =
n
ci ck ei , ek =
i,j=−n
k=−n
|ck |2 .
Mit |a0 |2 = 4 |c0 |2 und |ak |2 + |bk |2 = |ck + c−k |2 + |ck − c−k |2 = 2 |ck |2 + |c−k |2
folgt die letzte Gleichheit von Teil 2).
Korollar 81 Sei f ∈ V. Dann konvergiert nk=−n |ck |2 und es gilt die Bessel’sche
Ungleichung f 2 ≥ limn→∞ nk=−n |ck |2 . Weiter gilt limn→∞ Pn f − f = 0 genau
dann, wenn f 2 = limn→∞ nk=−n |ck |2 . (Parseval’sche Gleichung oder Vollständigkeitsrelation.)
n
2
Beweis. Die Konvergenz der monoton wachsenden Folge
folgt
k=−n |ck |
2
2
2
2
aus ihrer oberen Schranke f . Wegen f = Pn f + f − Pn f gilt f 2 =
lim Pn f 2 genau dann, wenn lim f − Pn f 2 = 0.
Da für f ∈ V die Reihe k∈N |ak |2 + |bk |2 konvergiert, gilt limn→∞ ak = 0 =
limn→∞ bk . Daraus folgt das
Lemma 82 (Riemann) Für f ∈ V gilt
2π
lim
k→∞
2π
f (x) sin(kx)dx = lim
0
k→∞
f (x) cos(kx)dx = 0.
0
Redeweise: Eine Funktionenfolge (fn )n∈N in V mit limn→∞ fn − f = 0 konvergiert gegen f ∈ V im quadratischen Mittel. Der Nachweis der Parselval’schen
Gleichung ist für manche Funktionen f, wie z.B. die Rechteckschwingung, möglich.
Damit ist dann in diesen Fällen die Konvergenz der Fourierreihe von f im quadratischen Mittel gegen f sichergestellt. Allgemeinere Auskunft gibt der folgende Satz.
(Siehe [5], p. 196)
Satz 83 Für alle f ∈ V gilt: limn→∞ Pn f − f = 0.
9
ak und bk sind also die Koeffizienten der Sinus-Cosinus Darstellung von Pn f.
KAPITEL 2. FOURIERANALYSIS
164
Die Fourierreihe jeder Funktion f in V konvergiert also im quadratischen Mittel
gegen f. Für beschränkte Funktionen mit höchstens endlich vielen Unstetigkeitsstellen in [0, 2π] ist der Beweis auf p. 287 von [10] geführt.
Es folgen 3 Sätze über die Konvergenz von Fourierreihen unter etwas stärkeren
Voraussetzungen als nur f ∈ V . Alles ohne Beweise.
Satz 84 Sei f : R → C eine stetige 2π-periodische Funktion. (Also gilt f ∈ V ).
Weiter sei f so, dass Zahlen 0 = x0 < x1 < . . . < xn = 2π existieren, sodass die
Einschränkungen von f auf die Intervalle [xi−1 , xi ] für alle i = 1, . . . , n stetig diffbar
sind 10 . Dann konvergiert die Fourierreihe von f punktweise gleichmäßig gegen f .
Beweis. Siehe p. 199 von [5].
Fouriereihe von f : R → C mit f (x) = |sin(x)| .
Da f reell und gerade ist, gilt c−k = ck ∈ R. Für den Fourierkoeffizienten ck von f
als 2π-periodische Funktion ergibt sich, da f gerade ist,
π
2π
e−ikx |sin x| dx =
2πck =
0
π
−π
[cos (kx) − i sin (kx)] |sin x| dx
π
cos (kx) sin (x) dx = 2
= 2
0
Für k = 1 folgt daraus 2πc1 = 2
0
[sin ((k + 1) x) − sin ((k − 1) x)] dx.
π
0
sin (2x) dx = 0. Für k = ±1 folgt 2πck =
,π
,π
π
cos ((k + 1) x) ,,
cos ((k − 1) x) ,,
[sin ((k + 1) x) − sin ((k − 1) x)] dx = −
2
, +
,
k+1
k−1
0
0
0
=
1 − cos ((k + 1) π) cos ((k − 1) π) − 1
1 − (−1)k+1 (−1)k−1 − 1
+
=
+
k+1
k−1
k+1
k−1
*
+
k
1
1
1 + (−1)
= 1 + (−1)k
−
= −2 2
.
k+1 k−1
k −1
Somit gilt für alle k ∈ Z, dass11 c2k+1 = 0 und c2k = − π2 4k21−1 . Daher hat f = |sin|
die gleichmäßig konvergente Fourierreihe
2
3
∞
∞
2
cos
(2kx)
|sin (x)| =
c2k ei2kx = c0 +
c2k e2ikx + e−2ikx =
1−2
.
2−1
π
4k
k∈Z
k=1
k=1
Abbildung 2.11 zeigt die Fourierpolynome P4 und P6 von |sin x| . (Gleichgerichtete
Wechselspannung)
10
Man sagt f ist stückweise stetig diffbar.
Das Verschwinden der Fourierkoeffizienten mit ungeradem Index ist eine Folge der πPeriodizität von f. Das sieht man so. Da f und die um π nach rechts verschobene Funktion f
miteinander übereinstimmen gilt ck = eikπ ck = (−1)k ck . Für ungerades k gilt daher ck = −ck ,
also ck = 0.
11
KAPITEL 2. FOURIERANALYSIS
165
1
0.75
0.5
0.25
0
-1
-0.5
0
0.5
1
x/pi
Abbildung 2.11: Die Fourierpolynome 4. (grün) und 6. Grades (rot) von |sin x|
Satz 85 Sei f : R → C eine beschränkte 2π-periodische Funktion mit höchstens
endlich vielen Unstetigkeitsstellen im Intervall [0, 2π] (also gilt f ∈ V ). Es sei x ∈ R
eine Stelle, für die ein C > 0 existiert, sodass für alle h ∈ R
|f(x + h) − f (x)| ≤ C |h|
gilt.
12
Dann konvergiert die Fourierreihe von f an der Stelle x gegen f (x).
Der Beweis ist auf p. 284 von [10] gegeben. Beispiel: In den Stetigkeitsstellen der
Rechteckschwingung f konvergiert ihre Fourierreihe punktweise gegen f .
Satz 86 Sei f : R → C eine beschränkte 2π-periodische Funktion mit höchstens
endlich vielen Unstetigkeitsstellen im Intervall [0, 2π] (also gilt f ∈ V ). Es sei x ∈ R
eine Stelle, für die f± (x) = limh↓0 f (x ± h) existieren und für die überdies ein C > 0
existiert, sodass für alle h ∈ R>0
|f (x ± h) − f± (x)| ≤ C · h.
Dann gilt
lim (Pn f ) (x) =
n→∞
f+ (x) + f− (x)
.
2
Der Beweis ist auf p. 286 von [10] gegeben. Beispiel: In den Unstetigkeitsstellen
der Rechteckschwingung f konvergiert ihre Fourierreihe punktweise gegen 0.
Abschließend noch ein Satz des 19-jährigen Fejér, der zeigt, dass die Werte einer
Funktion f ∈ V in ihren Stetigkeitspunkten durch die Fourierkoeffizienten ck von f
festgelegt sind. Fejérs Formel greift auch in Punkten, in denen die Fourierreihe nicht
konvergiert. Der Beweis ist in [13] ausgeführt.
12
f ist bei x Lipschitzbeschränkt; f ist in x stetig.
KAPITEL 2. FOURIERANALYSIS
166
Satz 87 (a) Sei f ∈ V stetig in x. Dann gilt
n
lim
n→∞
k=−n
*
+
|k|
1−
ck exp (ikx) = f (x).
n+1
(b) Sei f ∈ V überall stetig. Dann konvergiert die Funktionenfolge
n
σ n : R → C, x →
k=−n
*
+
|k|
1−
ck exp (ikx)
n+1
gleichmäßig gegen f.
2.1.13
Fourierreihen einiger Standardfunktionen
Die folgenden Funktionen f : R → C sind alle 2π-periodisch und über eine Periode
riemannintegrierbar. Ihre Fouriereihen konvergieren nach den im vorigen Abschnitt
angeführten Sätzen überall punktweise gegen die Funktion. Es gilt
1. Kippschwingung
f (x) = x für 0 < x < 2π und f (0) = π
F-Reihe: f (x) = π − 2
∞ sin(kx)
k=1
k
2. Rechteckschwingung
f ∈ V ungerade mit f(0) = f (π) = 0 und f (x) = 1 für 0 < x < π.
F-Reihe: f (x) =
∞
1
k=0 2k+1
4
π
sin ((2k + 1) x) .
3. Sägezahn:
f (x) = |x| für −π < x ≤ π.
F-Reihe: f (x) =
π
2
−
4
π
∞ cos[(2k+1)x]
k=0 (2k+1)2
4. Gleichgerichteter Wechselstrom
,
,
f (x) = ,sin( x2 ),
F-Reihe: f (x) =
2
π
1−
∞ 2 cos(kx)
k=0 (2k)2 −1
KAPITEL 2. FOURIERANALYSIS
2.2
167
Fouriertransformation auf L1 (R)
Jede Funktion f ∈ C 1 ([a, b] : C) mit f (a) = f (b) ist also durch die Fourierreihe
ihrer (b − a)-periodischen Fortsetzung punktweise korrekt wiedergegeben. Für eine
riemannintegrierbare Funktion f : [a, b] → C gibt die Fourierreihe zumindest eine
Darstellung im quadratischen Mittel. Lässt sich die Darstellung von Funktionen
durch ihre Fourierreihen auf nichtperiodische Funktionen mit Definitionsbereich R
ausweiten? Es gelingt für eine große Menge an Funktionen, wenn die Summen durch
Integrale ersetzt werden.
2.2.1
Von der Fourierreihe zum Fourierintegral
Für welche nichtperiodischen Funktionen f : R → C existiert eine stetige Funktion
c : R → C mit
∞
−∞
|c (ω)| dω < ∞ und f (t) =
∞
c (ω) exp (iωt) dω
−∞
für alle t ∈ R? Eine heuristische Überlegung, welche Funktionen f eine solche Darstellung als sogenanntes Fourierintegral haben, ist die folgende.
Gegeben sei eine beschränkte Riemann-integrable Funktion fl : [0, l] → C. Ihr
zugeordnet ist für L > l die L-periodische Funktion fL : R → C mit fL (t) = fl (t)
für 0 ≤ t ≤ l und fL (t) = 0 für l < t < L. Für die Funktion f : R → C gelte
f (t) = fl (t) für 0 ≤ t ≤ l und f (t) = 0 sonst. Für die Fourierkoeffizienten ck (fL )
von fL gilt mit k ∈ Z
1 L
2π
1
exp −i kt fL (t)dt =
L 0
L
L
√
2π
2π
=
(F f)
k ,
L
L
ck (fL ) =
∞
−∞
exp −i
2π
kt f (t)dt
L
wobei
∞
1
(F f ) (ω) := √
exp (−iωt) f (t)dt.
2π −∞
Die Funktion Ff heißt die Fouriertransformierte von f . Die ck (fL ) ergeben sich
Z. Das Raster der
somit aus den Werten der L-unabhängigen Funktion Ff auf 2π
L
2π
Punkte L Z wird mit wachsendem L feiner und die Fourierkoeffizienten ck (fL ) gehen
für L → ∞ wie 1/L gegen 0.
Die Funktion fL hat also die Fourierreihe
1
2π
fL (t) ≃ √
(F f) (ω) exp (iωt) .
2π 2π L
Ff : R → C,
ω∈
L
Z
Die Summe ist eine Riemannsummenapproximation der Schrittweite 2π/L des Inte∞
grals −∞ (Ff ) (ω) exp (iωt) dω. Daher vermutet man im Limes L → ∞ die folgende
Fourierintegraldarstellung von f
∞
1
(F f) (ω) exp (iωt) dω.
f(t) ≃ √
2π −∞
KAPITEL 2. FOURIERANALYSIS
2.2.2
168
Der Hauptsatz der Fouriertransformation
Definition 88 Der Vektorraum R der absolut riemannintegrierbaren Funktionen
ist die Menge aller Funktionen f : R → C mit: f ist auf jedem endlichen Intervall
stückweise stetig13 und |f | ist auf R (uneigentlich) riemannintegrierbar.
Für f ∈ R und k ∈ R ist die auf R definierte Abbildung x → f(x) exp(−ikx)
∞
auch in R. Daher existiert für jedes k ∈ R das Integral −∞ f(x) exp(−ikx)dx.
Definition 89 Für f ∈ R ist die Fouriertransformierte von f die Funktion
1
F f : R → C mit (Ff ) (k) = √
2π
∞
f (x) exp(−ikx)dx.
−∞
Beispiel 90 Sei f : R → C mit f (x) = exp (−λ |x|) für ein λ > 0. Dann folgt
√
2π (F f) (k) =
∞
∞
0
e−ikx−λ|x| dx =
e−ikx+λx dx +
e−ikx−λx dx
−∞
−∞
0
,0
,∞
,
exp(−ikx + λx) ,
exp(−ikx − λx) ,,
=
+
,
,
−ik + λ
−ik − λ
−∞
0
1
1
λ + ik
λ − ik
2λ
+
= 2
=
.
2 + 2
2 = 2
−ik + λ ik + λ
k +λ
k +λ
k + λ2
Also gilt für die Fouriertransformierte von f (x) = e−λ|x|
/
2
λ
(F f) (k) =
.
π k 2 + λ2
Mit wachsendem λ wird die Funktion f „schmäler” und F f „breiter”.
f
1
0.75
0.5
0.25
-5
-2.5
0
2.5
5
Abbildung 2.12: Graphen von f für λ = 1 (rot) und λ = 1/2
13
D.h., es existieren höchstens endlich viele Unstetigkeitsstellen und in diesen die rechts- und
linksseitigen Limiten.
KAPITEL 2. FOURIERANALYSIS
169
Ff
1.5
1.25
1
0.75
0.5
0.25
-5
-2.5
0
2.5
5
k
Abbildung 2.13: Graphen von F f für λ = 1 (rot) und λ = 1/2
Welche Funktion ist die Fouriertransformierte von Ff aus Beispiel 90? Mit den
Methoden der Funktionentheorie lässt sich diese berechnen. Siehe etwa Lemma 50.2
in [13]. Es ergibt sich tatsächlich, wie aufgrund der heuristischen Einleitung zu erwarten ist, dass (FF f) (x) = f (−x) . Der folgende Satz steckt allgemeinere Umstände
ab, unter denen die Fourierumkehrformel gilt. Diese Formel ist sehr nützlich, denn
sie macht so manche schwierige Integration überflüssig.
Satz 91 (Fouriertransformation) Seien f, g ∈ R und sei
(f ∗ g) (x) :=
∞
−∞
f (x − y)g(y)dy
die Faltung 14 von f mit g. Dann folgt:
1) Ff ist eine stetige und beschränkte Funktion mit der Schranke
1
|(Ff ) (k)| ≤ √
2π
∞
−∞
|f(x)| dx.
√
2) Falls f ∗ g ∈ R, dann gilt F (f ∗ g) = 2π (Ff ) · (Fg) (Faltungssatz).
3) Ist f stetig differenzierbar und Null außerhalb eines endlichen Intervalls, dann
gilt für alle k ∈ R
(F (f ′ )) (k) = ik (Ff ) (k).
4) Ist id · f : x → xf (x) in R, dann ist Ff stetig differenzierbar und es gilt
F (id · f ) = i (F f)′ .
5) Es gilt (F f ) · g ∈ R, f · F g ∈ R und (Parseval)
∞
−∞
14
(Ff ) (k)g(k)dk =
∞
f (x) (Fg) (x)dx.
−∞
Das Integral existiert für alle x ∈ R außer in einer Menge vom Volumen 0. Wo es nicht existiert,
kann der Faltung ein beliebiger Wert gegeben werden.
KAPITEL 2. FOURIERANALYSIS
170
6) Falls |f |2 ∈ R, dann gilt |F f|2 ∈ R und (Plancherel)
∞
−∞
∞
|f (x)|2 dx =
−∞
|(Ff ) (k)|2 dk.
7) Falls Ff ∈ R, dann existiert eine stetige Funktion frev ∈ R, die mit f fast
überall übereinstimmt. Für diese gilt Ff = Ffrev und limx→±∞ frev (x) = 0. Für alle
x ∈ R gilt die Umkehrformel
1
frev (x) = √
2π
∞
(Ff ) (k) exp(ikx)dk.
−∞
Ein Beweis dieser Aussagen ist in [7] gegeben. Wir machen sie zumindest plausibel.
Zu 1) Ist eine Folge eines allgemeinen Satzes über Parametrintegrale und der
Dreiecksungleichung für Integrale.
Zu 2): Durch Vertauschen der Integrationsreihenfolgen folgt
+
∞ −ikx * ∞
e
√
f (x − y) g (y) dy dx
F (f ∗ g) (k) =
2π −∞
−∞
* ∞ −ik(x−y)
+
∞
e
−iky
√
=
f (x − y) dx g (y) dy
e
2π
−∞
−∞
∞ −iky
√
√
e
√ g (y) dy = 2πFf (k) Fg (k)
=
2πF f (k)
2π
−∞
Zu 3): Sei L > 0 so, dass f (x) = 0 für alle x mit |x| ≥ L. Dann folgt durch
partielle Integration
√
2π (F (f ′ )) (k) =
,L
= −ike−ikx f (x),−L + ik
L
L
e−ikx f ′ (x) dx
−L
e−ikx f (x) dx =
√
2πik (F (f )) (k).
−L
Zu 4): Nach einem Satz über die Ableitung uneigentlicher Parameterintegrale
gilt
∞
−∞
e−ikx xf (x) dx =
∞
−∞
i
d −ikx
d
e
f (x) dx = i
dk
dk
∞
e−ikx f (x) dx.
−∞
Zu 5): Durch Vertauschen der Integrationsreihenfolgen folgt
+
∞
∞ * ∞ −ikx
e
√ f(x)dx g(k)dk
(Ff ) (k)g(k)dk =
2π
−∞
−∞
−∞
+
* ∞ −ikx
∞
∞
e
√ g(k)dk dx =
=
f (x)
f (x) (F g) (x)dx.
2π
−∞
−∞
−∞
KAPITEL 2. FOURIERANALYSIS
171
Einschub: Diracs δ-„Funktion“
Die Unterscheidung zwischen f und frev in der Umkehrformel wird in heuristischen
Texten meist unterdrückt. Die Umkehrformel wird auch oft als Definition des Dirac
δ-s vorgeführt. Dabei geht es recht formal zu:
f (x) =
=
∞
f (x′ )
−∞
∞
−∞
∞
1
2π
′
∞
eikx
√
2π
e−ikx
√ f (x′ )dx′ dk
2π
−∞
∞
′
eik(x−x ) dk dx′ =
−∞
−∞
Also
1
2π
δ(x) =
∞
f (x′ )δ(x − x′ )dx′ .
eikx dk.
−∞
Dieses parameterabhängige uneigentliche Riemannintegral existiert nicht, denn
für K > 0 gilt
,K
.
K
1 eixk ,
1
= sin(Kx)
für x = 0
2π ix ,
πx
.
eixk dk =
δ K (x) =
−K
K
2π −K
für x = 0
π
Die Funktion K → δ K (x) hat somit keinen Grenzwert für K → ∞. Abbildung 2.14
zeigt δ K für K = 5π (rot) und für K = 10π (schwarz).
y
10
7.5
5
2.5
0
-1
-0.5
0
0.5
1
x
Abbildung 2.14: Die Graphen von
sin(5πx)
πx
und
sin(10πx)
πx
Die Funktion δ K ist stetig und nimmt in 0 ihr absolutes Maximum vom Wert
K/π an. Für L > 0 folgt mit der Substitution y = Kx und Y = KL
L
lim
K→∞
Y
δ K (x)dx = lim
−L
Y →∞
−Y
sin (y)
dy = 1.
πy
(Beweis siehe Bd. II, Kap. VI.8.4 von [3].) Für K → ∞ wird das Integral von δ K über
das Intervall [−L, L] also unabhängig von L. Die Beiträge vom Bereich außerhalb
KAPITEL 2. FOURIERANALYSIS
172
von [−L, L] heben sich aufgrund der zunehmend rascheren Oszillationen weg. Für
hinreichend glatte und im Unendlichen abfallende Funktionen f gilt
∞
lim
K→∞
−∞
δ K (x − x′ )f(x′ )dx′ = f (x).
Für K > 0 folgt
L
KL
sin (y)
lim
δ K (x)dx = lim
dy = lim
L→∞ −L
L→∞ −KL
Y →∞
πy
Y
−Y
sin (y)
dy = 1.
πy
Mit Diracs δ lassen sich nun die Teile 6) und 7) von Satz 91 plausibel machen.
Für Teil 7) etwa so
+ * ∞ −iky
+
∞
∞ * ∞
eikx
e
2
√ f (x)dx
√ f (y) dy dk
|(Ff ) (k)| dk =
2π
2π
−∞
−∞
−∞
−∞
* ∞
+
∞
∞ ik(x−y)
e
f (x)
f (y)
dk dy dx
=
2π
−∞
−∞
−∞
* ∞
+
∞
∞
∞
=
f (x)
f (y) δ (x − y) dy dx =
f (x)f (x) dx =
|f (x)|2 dx.
−∞
−∞
−∞
−∞
Die cos / sin-Version der Fouriertransformation
Mit Eulers Formel und den Bezeichnungen
/
/
2 ∞
2
a(k) :=
f(x) cos(kx)dx, b(k) :=
π −∞
π
∞
f (x) sin(kx)dx
−∞
für k ∈ R gilt (F f) (k) = (a(k) − ib(k)) /2 und die Umkehrformel
1
frev (x) = √
2π
∞
[a(k) cos(kx) + b(k) sin(kx)] dk.
0
Die Funktion a bzw. b heißt Cosinus- bzw. Sinus - Transformierte von f . Die Funktion
a ist gerade und b ist ungerade. Daher sind a und b durch ihre Einschränkungen auf
R≥0 eindeutig bestimmt. Allgemein gilt für k ∈ R
a(k) = (F f) (k) + (Ff ) (−k) ,
b(k) = i [(F f ) (k) − (Ff ) (−k)] .
Im Fall einer reellwertigen Funktion f sind a und b ebenfalls reellwertig.
Faulenzerregeln
Wie bei den Fourierreihen gibt es einige einfach zu beweisende Faulenzerregeln,
die gelegentlich den Rechenaufwand verringern helfen. Neue Fouriertranformierte
werden auf schon bekannte zurückgeführt. Der Beweis dieser Regeln ist einfach durch
direktes Nachrechnen zu führen.
Seien f, g ∈ R. Dann gilt:
KAPITEL 2. FOURIERANALYSIS
173
1. Für λ ∈ C gilt F (f +λg) = F f +λF g (Die „Fouriertransformation” ist linear.)
2. Ist f reellwertig, dann gilt (Ff ) (−k) = (Ff ) (k) für alle k ∈ R.
3. Ist f gerade, dann ist F f gerade. Ist f ungerade, dann ist F f ungerade.
4. Für ξ ∈ R ist Tξ f : x → f (x − ξ) die Translation von f um ξ. Dann gilt
(F (Tξ f )) (k) = exp(−ikξ) (Ff ) (k) für alle k ∈ R.
5. Sei fλ (x) := f (λx) für alle x ∈ R mit festem λ ∈ R>0 (Streckung für λ < 1
bzw. Stauchung für λ > 1). Dann gilt
F (fλ ) = λ−1 (F f)λ−1 : k →
2.2.3
1
(F f)
λ
k
λ
für alle k ∈ R.
Beispiele zur Fouriertransformation
Beidseitig gedämpfter Sinus und Cosinus
Für λ > 0 und Ω ∈ R sind die Funktionen g, h : R → R mit
g(t) = exp (−λ |t|) cos (Ωt) und h(t) = exp (−λ |t|) sin (Ωt)
in R. Es sollen ihre Fouriertransformierten aus jener von fΩ : R → R mit fΩ (t) =
exp (−λ |t|) exp (iΩt) berechnet werden. Es gilt nach Beispiel 90
(FfΩ ) (ω) =
∞
e−i(ω−Ω)t −λ|t|
1
2λ
√
e
dt = √
.
2
2π
2π λ + (ω − Ω)2
−∞
Daraus folgt mit g = (fΩ + f−Ω ) /2 und h = (fΩ − f−Ω ) /2i
*
+
λ
1
1
F g (ω) = √
+
2π λ2 + (ω − Ω)2 λ2 + (ω + Ω)2
2λ
λ2 + Ω2 + ω 2
= √
2π λ4 + 2λ2 (ω 2 + Ω2 ) + (ω 2 − Ω2 )2
und
*
+
−iλ
1
1
Fh (ω) = √
−
2π λ2 + (ω − Ω)2 λ2 + (ω + Ω)2
4iλ
ωΩ
= −√
.
4
2
2
2π λ + 2λ (ω + Ω2 ) + (ω 2 − Ω2 )2
Man beachte: Die Funktionen g und h sind beide reellwertig. g ist gerade und h ist
ungerade. Nach den Faulenzerregeln 2 und 3 ist die Funktion Fg somit zwangsläufig
reellwertig und gerade, während F (ih) = iFh reellwertig und ungerade sein muss.
Unser Ergebnis bestätigt diese allgemeine Einsicht.
KAPITEL 2. FOURIERANALYSIS
174
Die Umkehrformel ergibt für g daher die Cosinuszerlegung
1
g (t) = √
2π
1
= √
2π
∞
1
e Fg (ω) dω = √
2π
−∞
∞
iωt
∞
−∞
cos (ωt) F g (ω) dω
a (ω) cos (ωt) dω
0
mit der Spektralfunktion
4λ
λ2 + Ω2 + ω 2
.
a (ω) = 2Fg (ω) = √
2π λ4 + 2λ2 (ω 2 + Ω2 ) + (ω 2 − Ω2 )2
Für h folgt analog die Sinuszerlegung
1
h(t) = √
2π
∞
b(ω) sin(ωt)dω.
0
mit der Spektralfunktion
ωΩ
8λ
.
b(ω) = 2iFh(ω) = √
4
2
2
2π λ + 2λ (ω + Ω2 ) + (ω 2 − Ω2 )2
Die Abbildungen 2.15 und 2.16 zeigen die Funktionen h und b auf R>0 für die
Parameterwerte Ω = 10 und λ = 1. Das Ein- und Ausschalten der Sinusschwingung
führt zu einer um die Trägerfrequenz Ω lokalisierten Spektralfunktion. Die unübersichtlichen, hektischen Oszillationen der Funktion h werden durch die Fouriertransformation zum Verschwinden gebracht: die Funktion b hat nur einen einzigen breiten
Buckel bei ω ≈ Ω, was bei einer numerischen Weiterverarbeitung ein erheblicher Vorteil sein kann. Fig 2.17 zeigt b für λ = 1 und Ω = 20. Die Spektralfunktionen a und b
werden mit wachsendem Ω bei gleichbleibendem λ zunehmend besser approximiert
durch
/
2
1
a (ω) = 2Fg (ω) ≈ λ
,
2
π λ + (ω − Ω)2
/
1
2
b(ω) = 2iF h(ω) ≈ λ
.
2
π λ + (ω − Ω)2
Oszilliert das elektrische Dipolmoment eines angeregten Atoms, dann hat λ einen
Wert von etwa 108 Hz und Ω einen Wert im Bereich von 1015 Hz. Die Spektralanalyse
des vom oszillierenden Dipolmoment emittierten Lichtes macht dementsprechend
eine um die Frequenz Ω ganz scharf lokalisierte Spektrallinie sichtbar. Je kleiner
λ ist, umso länger dauert der atomare Emissionsprozess und umso schärfer ist die
Spektralverteilung.
Heavisidefunktion - gedämpft
Eine ruckartig einsetzende und exponentiell gedämpften Schwingung: Seien Ω, γ ∈ R
mit γ > 0 und sei fγ,Ω : R → C, mit fγ,Ω (t) = exp (−γt) exp (iΩt) für t ≥ 0 und
KAPITEL 2. FOURIERANALYSIS
175
h
0.75
0.5
0.25
0
-5
-2.5
0
2.5
5
-0.25
t
-0.5
-0.75
Abbildung 2.15: h für λ = 1 und Ω = 10
b
0.6
0.4
0.2
0
0
5
10
15
20
w
Abbildung 2.16: b für λ = 1 und Ω = 10
fγ,Ω (t) = 0 sonst. Es gilt speziell für Ω = 0
lim fγ,0 (t) = Θ (t) =
γ↓0
1 für t ≥ 0
0 für t < 0
Für die Fouriertransformierte von fγ,Ω folgt
1
(Ffγ,Ω ) (ω) = √
2π
∞
0
1
1
exp (−i (ω − Ω − iγ) t) dt = √
.
2π i (ω − Ω − iγ)
F fγ,Ω liegt nicht in R, denn für ω → ±∞ geht F fγ,Ω (ω) nur wie 1/ |ω| gegen 0.
Dass Ffγ,Ω gar nicht in R sein kann, folgt schon aus Teil 7 von Satz 91. Es gibt
nämlich gar keine stetige Funktion, mit der fγ,Ω fast überall übereinstimmt. Daher
ist der Umkehrsatz nicht anwendbar. Und tatsächlich gilt die Umkehrformel15
Θ (t) exp (−γt) =
1
2πi
∞
eiωt
dω
−∞ ω − iγ
(2.6)
nur für alle t ∈ R 0. Das wird im Kapitel über Funktionentheorie von Math. Meth.
II mit dem Residuensatz gezeigt. Folglich gilt für alle t ∈ R 0
Θ (t) = lim
γ↓0
15
1
2πi
∞
−∞
eiωt
dω =
ω − iγ
Es genügt eine Diskussion des Falles Ω = 0.
1 für t > 0
.
0 für t < 0
KAPITEL 2. FOURIERANALYSIS
176
y
0.6
0.4
0.2
0
0
10
20
30
40
x
Abbildung 2.17: b für λ = 1 und Ω = 20
Für t = 0 ist Gleichung (2.6) ohne eine weitere Präzisierung sinnlos, da für
−a < 0 < b
b
−a
1
dω =
ω − iγ
,b
,
1
2
2 ,
= ln ω + γ , + i
2
−a
b/γ
−a/γ
b
−a
ω
dω +
2
ω + γ2
1
dx = ln
2
x +1
8
9
91 +
b
= ln + ln :
a
1+
γ 2
b
γ 2
a
b
−a
ω2
iγ
dω
+ γ2
b
b2 + γ 2
a
+ i arctan − arctan
2
2
a +γ
γ
γ
+ i arctan
b
a
− arctan
γ
γ
gilt. Der Limes a → ∞ oder b → ∞ von ln ab existiert nicht. Die beiden weiteren
Terme hingegen konvergieren gegen 0 und iπ unabhängig von der Reihenfolge der
beiden Grenzübergänge. Korreliert man a mit b durch b = λa mit λ > 0, dann folgt
bei festem λ > 0
λa
dω
= ln λ + iπ.
lim
a→∞ −a ω − iγ
∞
dω
Der Wert des formalen Integrals −∞ ω−iγ
ist also erst nach Vorgabe einer weiteren
Zusatzvorschrift, z.B. λ = 1, festgelegt. Für λ = 1 ergibt sich damit
1
lim
2πi a→∞
a
−a
1
dω
= .
ω − iγ
2
Halbseitiger Sinus - gedämpft
Sei nun g(t) = exp (−γt) sin (Ωt) /Ω für t ≥ 0 und g(t) = 0 sonst. g ist in 0 stetig und
g ′ springt in 0 von 0 auf 1. Die Funktion g ist daher für γ < ω 0 und Ω = ω 20 − γ 2
die retardierte Fundamentallösung der (unterkritisch) gedämpften Schwingungsgleichung y ′′ +2γy ′ +ω 20 y = 0. Welches Fourierspektrum hat diese von einem δ-Kraftstoß
erzeugte Schwingung?
√
Es gilt g = (fγ,Ω − fγ,−Ω ) /2iΩ und daher 2π (Fg) (ω) =
*
+
1
1
1
1
1
1
−
=
−
.
2iΩ i (ω − Ω − iγ) i (ω + Ω − iγ)
2Ω ω + Ω − iγ ω − Ω − iγ
KAPITEL 2. FOURIERANALYSIS
177
g
0.75
0.5
0.25
0
0
10
20
30
t
-0.25
-0.5
Abbildung 2.18: g für γ = 1/10 und Ω = 1
Auf gemeinsamen Nenner gebracht ergibt sich
√
2π (F g) (ω) =
1
Ω2 − ω 2 + γ 2 − 2iγω
=
.
Ω2 − ω 2 + γ 2 + 2iγω
(Ω2 − ω 2 + γ 2 )2 + (2γω)2
Daher gilt Fg ∈ R und der Fourierumkehrsatz sagt, da g stetig ist, mit ω ± = ±Ω+iγ
für alle t ∈ R
Θ (t)
exp (−γt) sin (Ωt)
=
Ω
∞
−∞
−eiωt
dω.
2π (ω − ω + ) (ω − ω − )
Diese (punktweise) Fourierdarstellung der retardierten Fundamentallösung g werden
wir im Kapitel über Funktionentheorie mithilfe des Residuensatzes verifizieren.
Die reellen Sinus/Cosinus Transformierten a und b von g sind an (Fg) (ω) =
(a(ω) − ib(ω)) /2 abzulesen. Es gilt
/
/
2
Ω2 − ω 2 + γ 2
2
2γω
a(ω) =
b(ω) =
.
2
2,
2
2
2
2
2
π (Ω − ω + γ ) + (2γω)
π (Ω − ω + γ 2 )2 + (2γω)2
Figur 2.19 zeigt diese beiden Spektralamplituden von f für Ω = 10 und γ = 1/10.
Für Ω ≫ γ sind die Spektralamplituden nur in der Nähe der Trägerfrequenz Ω
deutlich von 0 verschieden.
Eine unbeschränkte Funktion
√
Sei λ > 0 und √
f : R → R, mit f (x) = e−λx / x für x > 0 und f (x) = 0 sonst. Dann
folgt mit u = x und dem Gaußschen Integral aus Kap I
/
2
∞ −ikx −λx
∞
e
e
1 e−(λ+ik)u
2 ∞ −(λ+ik)x2
√
√ dx =
√
Ff (k) =
2udu =
e
dx
u
π 0
2π x
2π
0
0
/
i
k
∞
1 e− 2 arctan λ
1
1
π
−(λ+ik)x2
=√ 4
=√
e
dx = √
.
2π −∞
2π λ + ik
2 λ2 + k 2
KAPITEL 2. FOURIERANALYSIS
178
0.375
0.25
0.125
0
5
7.5
10
12.5
15
-0.125
Abbildung 2.19: Spektralamplituden a (grün) und b (rot) für Ω = 10 und γ = 1/10.
F f liegt nicht in R, denn für k → ±∞ geht Ff (k) nur wie |k|−1/2 gegen 0. Dass
F f gar nicht in R sein kann, folgt schon aus Teil 7 von Satz 91. Es gibt nämlich
gar keine stetige Funktion, mit der f fast überall übereinstimmt. Wegen |f |2 ∈
/ R
ist Plancherels Formel nicht anwendbar.
Sei nun g : R → R, mit g (x) = e−λ|x| / |x| für alle x ∈ R 0. Der Wert, den g
bei 0 annimmt, ist für die Fouriertransformierte von g belanglos. Es gilt
0
∞ −ikx −λx
e−ikx e−λ|x|
eik(−x) e−λ(−x)
e
e
√
√
√
√ dx
dx =
dx +
2π |x|
2π
2π x
(−x)
−∞
−∞
0
∞ ikx −λx
∞ −ikx −λx
e e
e
e
√
√ dx +
√
√ dx = F f (−k) + Ff (k)
=
2π x
2π x
0
0
√
i
k
i
k
2
e 2 arctan λ + e− 2 arctan λ
= 4
.
2
λ2 + k 2
F g (k) =
∞
Somit gilt
Fg (k) =
√
2
4
λ2 + k 2
cos
1
k
arctan
.
2
λ
Wegen arctan (k/λ) ∈ (−π/2, π/2) folgt
cos (arctan (k/λ) /2) =
(1 + cos arctan (k/λ)) /2 =
/
1 + λ/ k 2 + λ2 /2.
Daraus ergibt sich
F g (k) =
/
λ+
λ2 + k 2 / λ2 + k 2 .
Abbildung (2.20) zeigt die positiven geraden Funktionen g und Fg (rot) für λ = 1.
Gaußfunktion
Satz 92 Für die Funktion f : R → R, x → exp (−x2 /2) gilt F f = f.
KAPITEL 2. FOURIERANALYSIS
179
1.5
1.25
1
0.75
0.5
0.25
0
0.5
1
1.5
2
2.5
3
Abbildung 2.20: g und Fg (rot)
Beweis. Die Funktion g : R → R mit g(x) = xf(x) ist wie auch f in R. Nach Teil
4) des Fouriertransformationssatzes 91 gilt (F f )′ = −iFg. Mit partieller Integration
folgt
∞
∞
x2
1
1
d x2
(F g) (k) = √
xe− 2 e−ikx dx = √
− e− 2 e−ikx dx
dx
2π −∞
2π −∞
∞
∞
x2 d
x2
1
−ik
e−ikx dx = √
=√
e− 2
e− 2 e−ikx dx = −ik (F f) (k) ,
dx
2π −∞
2π −∞
also (Ff )′ (k) = −i (F g) (k) = −k (Ff ) (k) . Damit ist Ff eine maximale Lösung
der auf R2 definierten gewöhnlichen Differentialgleichung y ′ = −xy. Also gilt F f ∈
{y : R → R, x → c exp (−x2 /2) | c ∈ R} und somit
(Ff ) (k) = (F f ) (0) · exp −k 2 /2 .
∞
Der Wert von (F f ) (0) = √12π −∞ exp (−x2 /2) dx wird im Kapitel über Wahrscheinlichkeit (Gaußverteilung) berechnet. Es gilt
1
√
2π
∞
2 /2
e−x
dx = 1
−∞
2
und daher (F f) (k) = e−k /2 = f (k) für alle k ∈ R.
Anmerkung: Ein Beweis für F f = f mit den Mitteln der Funktionentheorie ist
im Beweis von Lemma 50.2 von [13] angeführt.
Übertragung auf g(x) := exp (−x2 / (2a2 )) = f (x/a) für a > 0 : Mit Regel 5 folgt
2 k2 /2
(Fg) (k) = ae−a
.
Man beachte wieder die Reziprozität der Breiten von g und F g.
Übertragung auf h(x) := exp − (x − ξ)2 / (2a2 ) = g(x − ξ) für ξ ∈ R : Mit
Regel 4 folgt
2 2
(Fh) (k) = ae−ikξ e−a k /2 .
KAPITEL 2. FOURIERANALYSIS
180
Rechtecksfunktion
Sei h : R → R mit h(x) = 1 falls |x| < L und h(x) = 0 sonst. Dann gilt für k = 0
/
∞ −ikx
L −ikx
e
e
2 sin(kL)
e−ikL − eikL
√ h(x)dx =
√ dx =
√
(Fh) (k) :=
=L
.
π kL
2π
2π
−ik 2π
−∞
−L
Weiter gilt (Fh) (0) = L 2/π. Die Funktion Fh ist also tatsächlich stetig, liegt
R
aber nicht in R, denn −R |(F h) (k)| dk wächst für R → ∞ unbeschränkt. (Siehe
etwa Bsp. 46.4 von [13]) Dass Fh nicht in R sein kann, folgt auch schon aus Teil
7 von Satz 91. Es gibt nämlich gar keine stetige Funktion, mit der h fast überall
übereinstimmt.
1
0.75
0.5
0.25
0
-10
-5
0
5
10
k
Abbildung 2.21: Graph von (sin(k)/k)2
Da aber h ∈ R und |h|2 ∈ R, gilt nach Teil 6) des Hauptsatzes
∞
−∞
∞
|h (x)|2 dx =
−∞
|Fh (k)|2 dk.
Daraus ergibt sich mit der Substitution u = kL
L
2L =
dx =
−L
∞
−∞
∞
|h (x)|2 dx =
−∞
|(F h) (k)|2 dk =
∞
2L
π
−∞
sin u
u
2
du.
Somit gilt die nützliche Integralformel
∞
−∞
sin x
x
2
dx = π.
Man beachte auch, dass für alle L > 0
∞
L
1=
−∞ π
sin (kL)
kL
2
dk =
1
2πL
∞
1 − cos (2Lk)
dk.
k2
−∞
2
≥ 0 hat unabhängig
Die Fläche unter dem Graphen von k → gL (k) = Lπ sin(kL)
kL
von L den Wert 1, konzentriert sich aber mit wachsendem L zunehmend bei k = 0.
KAPITEL 2. FOURIERANALYSIS
2.2.4
181
*Frequenzmessung an einem harmonischen Signal
Ein Fourieranalysator wird über eine endliche Zeitspanne hinweg an ein harmonisches Signal, an die Funktion f (t) = cos (Ωt − δ) , gekoppelt. Welches Fourierspektrum sieht der Analysator und wie kann die Signalfrequenz Ω am Spektrum
abgelesen werden? Wie ist der Phasenparameter δ zu bestimmen?
Sei Ω > 0 und δ ∈ R. Es gelte f (t) = cos (Ωt − δ) für alle t ∈ − T2 , T2 und
f (t) = 0 sonst. Dann folgt für die Fouriertransformierte des abgehackten Signals
1
F f (ω) = √
2π
T /2
e−iωt
−T /2
eiΩt−iδ + e−iΩt+iδ
dt = e−iδ g (ω − Ω) + eiδ g (ω + Ω)
2
mit
T /2
1
g (ω) = √
2 2π
e−iωt dt.
−T /2
Es gilt somit für ω = 0
ωT
1 e−i 2 − ei
g (ω) = √
−iω
2 2π
ωT
2
1 sin ωT
2
=√
ω
2π
T sin ωT
2
= √
2 2π ωT
2
und g (0) = 2√T2π = π2 ω10 mit ω 0 = 2π/T. Da g gerade ist, folgt Ff (−ω) = F f (ω),
so wie es für ein reelle Funktion f nach den Faulenzerregeln auch sein muss. Folglich
ist auch die Funktion |F f|2 gerade.
√
Die Funktion |g| nimmt nur bei 0 ihr Maximum an. Es hat den Wert (π/ω 0 ) / 2π.
Die Nullstellenmenge von g ist ω 0 ·(Z 0) . Das Maximum von |g| liegt also zwischen
den beiden benachbarten Nullstellen ω = ±ω 0 . Im Intervall (0, ω 0 ) ist |g| streng monoton fallend. Zwischen den benachbarten positiven Nullstellen kω 0 und (k + 1) ω 0
von
√ |g| hat |g| genau ein lokales Maximum (k ∈ N) . Dessen Wert ist kleiner als
1/ 2πkω 0 = g (0) /πk.
Zur qualitativen Diskussion der Funktion |Ff |2 formen wir um auf dimensionslose Variable. Es gilt
,
,2
|Ff (ω)|2 = ,e−iδ g (ω − Ω) + eiδ g (ω + Ω),
= |g (ω − Ω)|2 + |g (ω + Ω)|2 + 2 cos (δ) g (ω − Ω) g (ω + Ω) .
Mit der Abkürzung S (x) = sin (x) /x und den dimensionslosen Variablen x = ω/Ω
und y = Ω/ω 0 folgt somit
Py (x)
2ω 20
|Ff (ω)|2
π
2
ω−Ω
ω+Ω
= S π
+S π
ω0
ω0
:
=
2
+ 2 cos (δ) S π
ω−Ω
ω0
S π
ω+Ω
ω0
= S (πy (x − 1))2 + S (πy (x + 1))2 + 2 cos (δ) S (πy (x − 1)) S (πy (x + 1)) .
Daher kann Py (x) eingegrenzt werden durch die Abschätzungen
[|S (πy (x − 1))| − |S (πy (x + 1))|]2 ≤ Py (x) ≤ [|S (πy (x − 1))| + |S (πy (x + 1))|]2 .
KAPITEL 2. FOURIERANALYSIS
182
Für y = Ω/ω 0 ≫ 1 ist einer der beiden Terme |S (πy (x − 1))| und |S (πy (x + 1))|
jeweils viel kleiner als der andere, sodass die Eingrenzung von Py (x) eng ist. Dann
hat |F f|2 zwei scharf voneinander getrennte Maxima in der Nähe von ±Ω. Die
Abbildung (2.22) zeigt den Graphen von x → Py (x) für cos δ = 1 und einige Werte
von y.
Ein Fourieranalysator misst |F f (ω)|2 für ω ∈ ω 0 · I mit I = {1, 2 . . . N} . Er
bestimmt also die Werte Py (x) für x = kω 0 /Ω = k/y mit k ∈ I. Ist die Vermessungsdauer T viel größer als die Schwingungsperiode 2π/Ω des Signals, dann kann
die Signalfrequenz Ω eines harmonischen Signals aus der Lage des absoluten Maximums von |Ff (ω)|2 im Bereich ω > 0 mit einem Fourieranalysator einigermaßen
genau ermittelt werden, falls N ω 0 ≥ Ω. Es gilt in diesem Fall natürlich Ω ≫ ω 0 .
Soll hingegen der Phasenlageparameter δ bestimmt werden, ist sein Einfluss deutlicher, wenn Ω ≈ ω 0 gewählt wird. Dann ist nämlich der die δ-Abhängigkeit steuernde Interferenzterm S (πy (x − 1)) S (πy (x + 1)) von derselben Größenordnung wie
S (πy (x − 1))2 + S (πy (x + 1))2 . Moral: Zur Bestimmung der Frequenz eines harmonischen Signals einerseits und seiner Phasenlage andererseits eignen sich zwei
einander ausschließende Vermessungsprozeduren.
1.5
1.25
1
0.75
0.5
0.25
0
-5
-2.5
0
2.5
5
Abbildung 2.22: x → Py (x) für y = 0.5 (grün), y = 1 (schwarz) und y = 5 (rot)
2.2.5
*Störung einer Quantendynamik
Sei H ein endlichdimensionaler C-Vektorraum. ·, · sei ein Skalarprodukt von H. Die
lineare Abbildung h0 sei bezüglich ·, · symmetrisch, dh es gilt ϕ, h0 ψ = h0 ϕ, ψ
für alle ϕ, ψ ∈ H. Die lineare Abbildung h0 definiert ein lineares System erster
Ordnung auf H, eine Quantendynamik. Sie ist durch
i
d
ψ (t) = h0 ψ (t)
dt
für alle t ∈ R gegeben. Für die maximalen Lösungen des Systems gilt ψ (t) =
e−ih0 (t−t0 ) ψ (t0 ) für alle t ∈ R. Manchmal interessiert der Fall, dass während eines
KAPITEL 2. FOURIERANALYSIS
183
endlichen Zeitintervalls die Dynamik h0 durch eine andere, i.A. zeitabhängige, lineare
Abbildung h (t) ersetzt wird. Wählt man als Zeitintervall der gestörten Dynamik das
Intervall [0, T ] , dann versteht man unter einer Lösung des gestörten Systems eine
stetige Funktion ψ : R → H mit
i
h0 ψ (t) für alle t ∈
/ [0, T ]
.
h (t) ψ (t) für alle t ∈ (0, T )
d
ψ (t) =
dt
Bei t = 0 und t = T braucht ψ nicht differenzierbar zu sein. Hier ist aber ψ jedenfalls
stetig. Für jede maximale Lösung der gestörten Dynamik folgt somit
e−ih0 t ψ (0)
für t < 0
.
−ih0 (t−T )t
e
ψ (T ) für t > T
ψ (t) =
Der Vektor ψ (T ) ergibt sich aus einer Vorgabe für ψ (0) durch Lösung des Anfangswertproblems im Zeitintervall t ∈ (0, T ) . Dies ist bei schwacher Störung näherungsweise möglich.
Die Abbildung16 h′ : [0, T ] → Ls (H) sei stetig. Die zu h (t) = h0 +εh′ (t) gehörige
Quantendynamik ist das (nichtautonome) lineare System auf H, das durch
i
d
ψ (t) = h (t) ψ (t)
dt
(2.7)
gegeben ist. Dabei ist ε ∈ R. Die autonome Dynamik h0 wird im Zeitintervall [0, T ]
also durch Addition von h′ „gestört“. Durch den Ansatz ψ (t) = e−ih0 t ϕ (t) geht das
System 2.7 über in das dazu äquivalente System
i
d
ϕ (t) = ε;
h (t) ϕ (t) mit ;
h (t) = eih0 t h′ (t) e−ih0 t für alle t ∈ (0, T ) .
dt
(2.8)
Wird als Anfangswert des Systems 2.7 zu t = 0 ein (beliebiger) Vektor ψ (0) =
ϕ (0) ∈ H vorgegeben, dann folgt für die maximale Lösung des Anfangswertproblems
ψ (T ) = e−ih0 T ϕ (T ) mit
T
ϕ (T ) = ϕ (0) + (−iε)
0
;
h (t) ϕdt + (−iε)2
T
0
;
h (t)
t
0
;
h (t′ ) ϕdt′ dt + . . .
Der Vektor ϕ (T ) ist als Potenzreihe in ε gegeben. Die Reihe konvergiert für alle
ε ∈ R. Seien nun insbesondere e und e′ zwei auf 1 normierte Eigenvektoren von h0 .
Es gelte also e = e′ = 1 und h0 e = ωe und h0 e′ = ω ′ e′ . Da h0 symmetrisch ist,
gilt ω, ω ′ ∈ R. Damit folgt für ϕ (0) = e
&
' &
'
′
e′ , ψ (T ) = e′ , e−ih0 T ϕ (T ) = eih0 T e′ , ϕ (T ) = e−iω T e′ , ϕ (T )
16
Ls (H) ist der Vektorraum aller linearen, symmetrischen Abbildungen von H nach H. Die
lineare Abbildung h′ (t) ist also wie h0 symmetrisch für alle t ∈ [0, T ] .
KAPITEL 2. FOURIERANALYSIS
184
T
0
und unter Verwendung von ϕ (T ) = ϕ (0) + (−iε)
folgt e′ , ϕ (T ) − e′ , e =
T
= −iε
T
= −iε
0
0
(
)
e′ , ;
h (t) e dt + o (ε) = −iε
T
0
& −ih0 t ′ ′
'
e
e , h (t) e−ih0 t e dt + o (ε)
)
(
′
e−iω t e′ , h′ (t) e−iωt e dt + o (ε) = −iε
T
= −iε
0
;
h (t) ϕ (0) dt + o (ε) für ε → 0
T
′
e−i(ω−ω )t e′ , h′ (t) e dt + o (ε)
0
√
′
e−i(ω−ω )t e′ , h′ (t) e dt + o (ε) = −iε 2πFV (ω − ω ′ ) + o (ε) .
Hierbei bezeichnet F V die Fouriertransformierte der Funktion V : R → C
V (t) =
e′ , h′ (t) e
0
für t ∈ [0, T ]
.
sonst
Im Spezialfall einer im Intervall [0, T ] konstanten Störung folgt für ω = 0
,T
T
√
e−iωt ,,
e−iωT − 1
−iωt
2πF V (ω) = V (0)
e
dt = V (0)
=
V
(0)
−iω ,0
−iω
0
T
T 2
.
= V (0) e−iω 2 sin ω
ω
2
√
Für ω = 0 folgt 2πF V (0) = V (0) T. Somit gilt im Fall konstanter Störung für
ε → 0 für die Lösung ϕ des Systems 2.8 mit ϕ (0) = e
′ T
e′ , ϕ (T ) = e′ , e − iεT e′ , h′ (0) e e−i(ω−ω ) 2 S (ω − ω ′ )
wobei
S (ω − ω ′ )
2.2.6
T
2
=
T
2
+ o (ε) ,
sin (ω − ω ′ ) T2
.
(ω − ω ′ ) T2
*Beugung am Spalt und Fouriertransformation
In der Einführungsvorlesung über Physik wird die Beugung am unendlich langen
Spalt behandelt. Dabei wird die (ungefähre) Intensität einer monochromatischen
elektromagnetischen Welle auf einem Schirm hinter dem Spalt und in großer Entfernung vom Spalt als Funktion des Ablenkwinkels α gegenüber der geraden Durchgangsrichtung durch den Spalt plausibel gemacht. Diese Überlegung zeigt, dass
die Fouriertransformierte der Rechtecksfunktion das Beugungsbild des Spaltes am
Schirm bestimmt.17 Das kommt folgendermaßen zustande.
Zunächst wird das Problem wegen seiner Translationsinvarianz in Spaltrichtung
zu einem 2d Problem verkürzt und der Vektorcharakter des Signals ignoriert. Der
Spalt sei das Gebiet −L < x < L und y = 0. Das Signal am Ort p = R (sin α, cos α)
mit − π2 < α < π2 ist die „Summe“ der Signale von einzelnen Kreiswellen, die
17
Chapt. 46-2, 46-3 von D Halliday, R Resnik, K Krane, Physics Vol II, New York, 1992
KAPITEL 2. FOURIERANALYSIS
185
von den Punkten des Spaltes ausgehen.18 Die Quellpunkte (x, 0) dieser fiktiven 2dKreiswellen der Frequenz ω und Wellenzahl k = ω/c haben alle vom Aufpunkt p
einen etwas anderen Abstand19 l (x) = |p − (x, 0)| ≈ R − x sin α. Die genaue Formel
für 2d Kreiswellen kann hier nicht erläutert werden. Sie enthält die Hankelfunkti(2)
on H0 , eine Lösung der Besselschen Differentialgleichung mit Parameter 0. Für
großen Abstand r zwischen Quell- und Aufpunkt vereinfacht sich jedoch die auslau√
fende monofrequente (komplexe) Kreiswelle zu annähernd − exp i (ωt − kr) / 8πr.
Daher ist das Summensignal in einem „fernen“ Punkt p annähernd proportional
zum Realteil von
L
−L
e−i(ωt−kl(x))
ei(ωt−kR)
√
dx ≈
R
l (x)
L
eik sin(α)x dx = L
−L
i(ωt−kR)
= 2L
e
√
R
ei(ωt−kR)
√
R
1
eikL sin(α)x dx
−1
sin (kL sin α)
.
kL sin α
Die Intensität I (α) , die dem Absolutquadrat der Amplitude proportional ist, erfüllt
somit bei festem R annähernd
I (α) = I (0)
sin (kL sin α)
kL sin α
2
.
In optischen Situationen gilt kL ≈ 103 . I hat die kleinste positive Nullstelle bei
kL sin α = π. Der zugehörige Beugungswinkel α hat für kL = 103 den Wert von
10−3 π, was 10, 8′ entspricht.
Im Fall einer komplexeren Mehrfachspaltanordnung überträgt sich die obige
Überlegung offenbar zu
/
∞
e−i(ωt−kl(x))
2π
χ (x)
(Fχ) (−k sin α) .
dx ≈ ei(ωt−kR)
R
l (x)
−∞
Dabei gilt χ (x) = 1, für alle x, die in einem Spalt liegen, und χ (x) = 0 sonst. Für
die Intensitätsverteilung folgt daraus unter Beachtung von (Fχ) (−k) = (F χ) (k)
und von (F χ) (0) = 0
,
,
, (Fχ) (k sin α) ,2
, .
I (α) = I (0) ,,
(F χ) (0) ,
Sei beispielsweise χ die charakteristische Funktion zweier symmetrisch um x = 0
platzierten Spalte. Jeder habe die Breite 2L und ihre Mittellinien haben die Lagen
x = ±a. Dabei gilt a > L > 0. Dann folgt mit χ0 = Θ (L − |x|) und mit
√
2π (F χ0 ) (k) =
L
e−ikx dx =
−L
e−ikL − eikL
sin (kL)
= 2L
−ik
kL
18
Dieses intuitive Rezept von Huyghens wurde erst später durch Kirchhoff aus der Maxwellschen
Theorie heraus mit der Methode der Greenschen Funktionen plausibel gemacht. Exakt lösbar ist
die das Beugungsproblem darstellende Integralgleichung auch heute noch nicht.
19
x
Da für x ∈ [−L, L] gilt: l (x) = |R (sin α, cos α) − (x, 0)| = R 1 − 2 R
sin α +
L
L
x sin α + o R für R → 0.
x 2
R
= R−
KAPITEL 2. FOURIERANALYSIS
186
für die Fouriertransformierte von χ = Ta χ0 + T−a χ0 mit (Ta f ) (x) = f (x − a)
sin (kL)
4L
(F χ) (k) = e−iak (F χ0 ) (k) + eiak (Fχ0 ) (k) = √ cos (ka)
.
kL
2π
Für die Intensitätsverteilung hinter der Doppelspaltanordnung folgt daraus
sin (kL sin (α))
I (α) = I (0) cos (ka sin (α))
kL sin (α)
2
.
Bei experimentell zugänglichen kleinen Beugungswinkeln reicht es, sin α durch α zu
approximieren. Figur 2.23 zeigt I (α) /I (0) für a/L = 10 im Bereich 0 < kLα < 2π.
0.75
0.5
0.25
0
0.25
Abbildung 2.23: Die Funktion
2.2.7
0.5
0.75
kLα
2π
1
→ I (α) /I (0) für a = 10L
*Faltung und Messung
In diesem Abschnitt wird an einem sehr einfachen Beispiel klar gemacht, warum bei
der Vermessung einer in der Natur ’realisierten’ Funktion von Ort, Zeit, Frequenz
oder dergleichen die Anzeige des Messgeräts, zB einer Waage, einerseits von der
Funktion selbst und andererseits von einer für das Messverfahren charakteristischen
’Empfindlichkeitsfunktion’ abhängt. Es zeigt sich, dass die Anzeige des Messgeräts
die Faltung der Empfindlichkeitsfunktion mit der zu vermessenden Funktion ist. Der
Fachjargon sagt dazu: ’Die Sensitivität wird ins Signal gefaltet’.
Regen fällt während einer Nacht in einen Garten mit einer zeitveränderlichen
Niederschlagsintensität. Man sagt: Zur Zeit t fallen I (t) Kilogramm Wasser pro
Quadratmeter und Sekunde. Gemeint ist damit eigentlich, dass während eines Zeitintervalls [a, b] auf einen Quadratmeter Gartenfläche die Wassermasse von
b
m (a, b) =
I (t) dt
a
fällt. Die als stetig angenommene Funktion I : [−T, T ] → R≥0 ist ähnlich einer
Wahrscheinlichkeitsdichte nur über ihre bestimmten Integrale empirisch zugänglich.
Soll die Funktion I zumindest annähernd vermessen werden, wird man während
der Nacht zu einigen Zeiten t1 , t2 . . . einen Kübel in den Garten stellen und jeweils
während einer kurzen Zeitspanne der Dauer ∆t um ti das Regenwasser im Kübel
KAPITEL 2. FOURIERANALYSIS
187
sammeln und anschließend abwiegen. Die Größe I (ti ) ergibt sich aus der im Intervall
mi
[ti − ε, ti + ε] gesammelten Wassermasse mi zu ungefähr I (ti ) ≈ 2εF
, wenn F die
Querschnittsfläche des Kübels ist.
Bei Verwendung der Heavisidestufe Θ : R → R mit Θ (x) = 1 für x ≥ 0 und
Θ (x) = 0 sonst, folgt für die im Kübel um die Zeit ti gesammelte Wassermasse
mi
=
F
ti +ε
I (t) dt =
ti −ε
∞
−∞
Θ (ε − |ti − t|) I (t) dt = (χε ∗ I) (ti ) .
Dabei ist χε : R → R die Indikatorfunktion des Intervalls [−ε, ε] . Es gilt also
χε (x) = 1 für |x| ≤ ε und χε (x) = 0 sonst.
Das Messverfahren kann etwas verfeinert werden, indem der Kübel während des
Transports in den Garten und auch beim Rücktransport zugedeckt wird. Beim Öffnen des Kübels wird dann nicht schlagartig sondern nur nach und nach seine ganze
Querschnittsfläche zum Regensammeln wirksam, sodass χε zu einer stetigen Funktion g mit g (x) = 0 für x ∈
/ [−ε, ε] geglättet wird. ZB zur Funktion g von Figur
(2.24) mit g (x) = exp (−1/ (ε2 − x2 )) für x2 < ε und g (x) = 0 für x2 ≥ ε.
Abbildung 2.24: Eine Empfindlichkeitsfunktion g
Das Messverfahren - zur Zeit ti ausgeführt - tastet somit die Funktion I in einem
Intervall um den Punkt ti summarisch ab und ergibt den Messwert (g ∗ I) (ti ) . Der
Wert I (ti ) bleibt dabei unzugänglich; die Empfindlichkeitsfunktion g geht in den
Messwert ein.
Wird I durch I (t) = 0 für alle t ∈
/ [−T, T ] auf ganz R fortgesetzt, dann kann I
aus g ∗ I über den Faltungssatz rekonstruiert werden. Dazu wäre ’nur’ eine Messung
von g ∗ I in jedem Punkt des Intervalls [−T − ε, T + ε] nötig, da (g ∗ I) (t) = 0 für
t∈
/ [−T − ε, T + ε] . Auch die Messung von g ∗ I in einem beschränkten Intervall ist
natürlich lückenlos nicht durchführbar. Ein Mangel, der durch Hypothesen über die
Variation von I auf kleinster Skala kaschiert wird. Aber die Körnigkeit der Regentropfen selbst setzt der Vorstellung von einer stetigen Niederschlagsintensität I ja
ganz offenbar ihre Grenzen, sodass derlei Ungenauigkeiten für das, was vom Modell
erwartet wird, belanglos sind.
√
Wegen g ∗ I ∈ R gilt (Faltungssatz!) F (g ∗ I) = 2π (F g) · (F I) und daher
F (g∗I)
, also für t ∈ R
I = F −1 √
2πFg
I (t) =
∞
eiωt F (g ∗ I) (ω)
dω.
(Fg) (ω)
−∞ 2π
Man beachte, dass auch in den Nullstellen von Fg der Integrand F (g ∗ I) /F g = F I
aufgrund der Stetigkeit von FI stetig ist.
KAPITEL 2. FOURIERANALYSIS
2.2.8
188
*Faltung und Bildfehlerkorrektur
Das Licht eines Sterns fällt durch ein Teleskop auf eine lichtempfindliche ebene
Schicht. Licht, das parallel zur optischen Achse läuft, hinterlässt im fiktiven Idealfall auf der Schicht einen hellen Punkt p0 der Belichtungsstärke f > 0. Wir wählen
diesen Punkt als Nullpunkt der Bildebene. Realistischerweise wird jedoch durch
Beugung an den optischen Teilen und durch atmosphärische Brechung ein ausgedehnter Lichtfleck um p0 herum erzeugt. Er wird durch eine Belichtungsfunktion
f · Kt : R2 → R≥0 beschrieben. Es gilt dabei R2 Kt (x) d2 x = 1, da die gesamte
Belichtungsstärke den Wert f behalten soll. Die Funktion Kt hängt vom Zeitpunkt
t der Aufnahme ab, da die Atmosphäre flimmert.
Fällt nun Licht gleichzeitig aus mehreren achsennahen Richtungen ein, dann
würden im Idealfall an Stellen x1 , . . . xn Lichtpunkte der Stärken f1 , . . . fn entstehen. Im Realfall hingegen wird jeder Lichtpunkt xi zu einer Belichtungsfunktion
fi Txi Kt verwaschen. Hier bezeichnet Txi Kt das Translat von Kt um xi . Diese Belichtungsfunktionen addieren sich zu einer Gesamtbelichtung, die an der Stelle x den
Wert ni=1 fi Kt (x − xi ) hat. Im Grenzfall eines Kontinuums von Lichtquellen wird
aus der Summe ein Integral des Typs
Bt (x) =
R2
f (ξ) Kt (x − ξ) d2 ξ.
Es gilt also Bt = Kt ∗ f, wobei f eine fiktive idealisierte Belichtung angibt. Über Kt
ist zu wenig bekannt, als dass f aus einem gemessenen Bild Bt berechnet werden
könnte. Man gewinnt, indem man Bescheideneres versucht.
Aus einem Bild Bt berechnet man zunächst seine 2d-Fouriertransformierte F Bt :
2
R → C mit
1
e−ik·x Bt (x) d2 x
(FBt ) (k) =
2π R2
und k·x = k 1 x1 +k 2 x2 . Nach dem Faltungssatz gilt F Bt = 2π (F f) (FKt ) . Mittelung
über die Beträge |FBti | , die aus n verschiedenen Aufnahmen bei den Zeiten ti zu
errechnen sind, ergibt
1
A :=
n
n
i=1
1
|F Bti | = 2π |Ff |
n
n
i=1
|FKti | .
Da die Nullstellenmengen der Funktionen F Kti verschieden sein werden, gilt wohl
n
i=1 |FKti | > 0. Jede Nullstelle von A wird somit auch Nullstelle von |Ff | sein.
Nun wird noch eine Hypothese über f benötigt. Bei der Vermessung von Sterndurchmessern etwa wird man - unter Vernachlässigung von Beugung - von f (x) =
Θ (R − |x|) ausgehen, wobei R > 0 der fiktive Radius des idealisierten Sternabbilds
auf der lichtempfindlichen Ebene ist. Existiert ein R > 0, sodass die Nullstellen von
A mit jenen von Ff übereinstimmen, dann wird man f als das idealisierte aus der
Bildserie (Bti ) errechnete Bild auffassen können.
2
Es gilt (Ff ) (0) = R2 . Die Berechnung von (Ff ) (k = 0) kann nur angedeutet
KAPITEL 2. FOURIERANALYSIS
189
werden. (Siehe Kap. 95 in [13].) (F f ) (k = 0) =
1
=
2π
=
−ik·x
e
R2
1
|k|2
|k|R
1
Θ (R − |x|) d x =
2π
1
2π
x
0
R
2
2π
e−i|k|r cos φ dφ dr
r
0
2π
e−ix cos φ dφ dx =
0
0
1
|k|2
|k|R
xJ0 (x) dx = R2
0
J1 (R |k|)
.
R |k|
Hier bezeichnet Jn : R → R mit n ∈ N0 die Besselfunktion, die durch die Potenzreihe
mit unendlichem Konvergenzradius gegeben ist:
x
Jn (x) =
2
n
∞
k=0
(−1)k
x
k! (k + n)! 2
2k
.
Figur (2.25) zeigt J1 im Bereich 0 < x < 15. Die kleinsten drei Nullstellen von J1 sind
y
0.4
0.2
0
0
5
10
15
20
x
-0.2
Abbildung 2.25: Besselfunktion J1
(gerundet) die Zahlen 3, 83; 7, 02; 10, 17. Die Nullstellenmengen von A müssten also
konzentrische Kreise sein. Die innersten Kreise müssten die Radien 3, 83 · R−1 ; 7, 02 ·
R−1 ; 10, 17 · R−1 haben. Aus einem Kreis wird R bestimmt, und an den weiteren
Kreisen muss sich das Konglomerat von Vermutungen bewähren. Dieses Verfahren
wird tatsächlich zur Bestimmung von Sternradien benützt.
2.2.9
*Streuung von Wellen und Fouriertransformation
Manche physikalischen Qualitäten sind orts- und zeitabhängig. Sie können sich von
Ort zu Ort und von Augenblick zu Augenblick ändern. In manchen Fällen ist ein
Gesetz, das die möglichen Zeit- und Ortsabhängigkeiten regelt, durch eine lineare
partielle Differentialgleichungen gegeben. Vielfach haben diese Gleichungen ebene
Wellenlösungen20 des Typs Uk : R × R3 → C mit Uk (t, x) = ei(ωt− k,x ) , wobei
20
Hier wird mit komplexen Lösungen argumentiert, um die Diskussion der Phasenlagen abzukürzen. Direkte physikalische Realität haben im Bereich der klassischen Physik nur reelle Lösungen.
Da die der Diskussion zugrunde liegenden Differentialgleichungen alle (inhomogen) linear und reell
sind, ist die vorgelegte Argumentation schlüssig.
KAPITEL 2. FOURIERANALYSIS
190
k ∈ R3 , ω ∈ R>0 und k, x das Standardskalarprodukt in R3 bezeichnet. Der Wellenzahlvektor k ist beliebig und die Kreisfrequenz ω ist aus k durch eine zur Wellengleichung gehörige Formel, die Dispersionsrelation, zu berechnen. Im Fall von Schall
gilt etwa ω = c |k| .
Fällt auf eine Störstelle am Ort ξ ∈ R3 eine Welle, die während einer gewissen
Zeit in einer Umgebung von ξ durch Uk genähert wird, ein, so spürt die Störstelle die
Erregung e−iωt ei k,ξ . Sie reagiert darauf nach einem Einschwingvorgang durch eine
stationäre, periodische Veränderung der Frequenz ω. Dabei erzeugt die Störstelle
selbst eine Welle, die der einfallenden Welle Uk zu addieren ist. Vielfach kann diese
Streuwelle in einer endlichen Umgebung von ξ als Kugelwellenlösung des Typs S|k| :
R × (R3 ξ) → C mit
−i k,ξ
S|k| (t, x) = e
ei(ωt−|k||x−ξ|)
Aξ
|x − ξ|
genähert werden. Dabei beschreibt Aξ ∈ C die Stärke und Phasenlage der Reaktion
der Störstelle auf die einlaufende Welle.21 Die Zahl Aξ kann dabei von k abhängig
sein.
In einem Punkt p ∈ R3 , der von der Störstelle ξ großen, aber nicht zu großen,
Abstand hat, kann die Streuwelle mithilfe von
−i k,ξ
S|k| (t, p) = e
Aξ e
i |k|n,ξ
ei(ωt−|k|r)
(1 + O (ε)) für ε → 0
r
genähert werden. Dabei gilt n = p/ |p| und r = |p| und ε = |ξ| /r. Die Näherung
erhält man aus
/
1
2
p − ξ, p − ξ = r2 − 2 p, ξ + |ξ| = r 1 − 2 2 p, ξ + |ξ|2
|p − ξ| =
r
n, ξ
= r 1−
+ o (ε) für ε → 0.
r
Durch Integration über eine kontinuierliche Störstellenreaktionsamplitudendichte
A : R3 → C ergibt sich die Streuwelle in stationärer Fernfeldnäherung
S |k| (t, p) ≈
ei(ωt−|k|r)
r
A (ξ) ei |k|n−k,ξ d3 ξ.
R3
Die auslaufende Streuwelle hat also am (fernen) Halbstrahl n eine mit 1/r abnehmende Amplitude, die der dreidimensionalen Fouriertransformierten von A im Punkt
k − |k| n proportional ist. Die Differenz q := k − |k| n zwischen einlaufendem Wellenzahlvektor und dem lokalen Wellenzahlvektor der Streuwelle bei p hat den Betrag
2 |k| sin (θ/2) , wobei θ der Winkel zwischen k und Auslaufrichtung n ist. Es gilt
0 ≤ |2q| ≤ |k| .
21
Hat die einlaufende Welle die Amplitude α, so ist auch die erzeugte Kugelwelle mit α zu
multiplizieren.
KAPITEL 2. FOURIERANALYSIS
2.2.10
191
*Einige 3d-Fouriertransformierte
Yukawapotential
−κ|x|
Sei κ ∈ R>0 . Für Y : R3 → R gelte Y (x) = e4π|x| für x = 0. Der Wert Y (0) ist
für das folgende belanglos. Für x → 0 wächst Y (x) unbeschränkt an. Trotzdem gilt
|Y (x)| d3 x < ∞. Daher existiert die Fouriertransformierte FY : R3 → C mit
R3
F Y (k) =
1
3/2
(2π)
e−i k,x Y (x) d3 x.
R3
Aus der Drehinvarianz von Y folgt die Drehinvarianz von FY, denn für eine
Drehung R : R3 → R3 gilt (2π)3/2 F Y (Rk) =
e−i
e−i Rk,x Y (x) d3 x =
=
R3
R3
R3
e−i
Y (x) d3 x =
R3
e−i k,y Y (Ry) d3 y =
=
Rk,RR−1 x
k,R−1 x
Y (x) d3 x
R3
e−i k,y Y (y) d3 y = (2π)3/2 F Y (k) .
Es genügt daher F Y (k) für k = (0, 0, q) mit q > 0 zu berechnen. Unter Verwendung
von Kugelkoordinaten folgt (2π)3/2 FY (qe3 ) =
∞
=
0
e−κr
4πr
π
2π
e−iqr cos θ r2 sin θdθdφdr
0
0
∞
1
1 ∞ −κr π 1 d −iqr cos θ
=
re
dθdr =
e−κr eiqr − e−iqr dr
e
2 0
2iq 0
0 iqr dθ
1
1
1
1
1 (κ + iq) − (κ − iq)
=
−
=
= 2
.
2
2
2iq κ − iq κ + iq
2iq
q +κ
q + κ2
Berechnen wir noch zur Kontrolle (2π)3/2 FY (0) =
*
∞
1 ∞
d
1
d
−κr
−κr
=
re dr =
r −
e dr =
r −
κ
dr
κ
dr
0
, + 0
*
−κr ,∞
1
e ,
1
=
0+
= 2.
,
κ
−κ 0
κ
,∞
,
−κr ,
e
, +
0
∞
−κr
e
dr
0
+
F Y ist also wie vom Hauptsatz behauptet stetig und es gilt22 für alle k ∈ R3
(2π)3/2 F Y (k) = |k|2 + κ2
−1
(2.9)
.
Wenig überraschend ist die Funktion |FY | = F Y nicht über ganz R3 riemannintegrierbar. Dies entspricht der Tatsache, dass Y (x) für x → 0 divergiert. Trotzdem
22
∞
Man beachte, dass für κ = 0 die obige Definition von FY unsinnig ist, da 0 sin (qr) dr nicht
existiert. Trotzdem ergibt limκ→0 FY eine Funktion auf R3 \ 0, die lokal Riemannintegrabel ist.
Davon macht die distributionelle Fouriertransformation Gebrauch.
KAPITEL 2. FOURIERANALYSIS
192
lässt sich mit den Methoden der Funktionentheorie, siehe Math. Meth. 2, zeigen,
dass für alle x = 0 die Umkehrformel
Y (x) =
1
lim
(2π)3 K→∞
|k|<K
ei k,x
d3 k
2
2
|k| + κ
gilt. Die Oszillationen von exp (i k, x ) machen es möglich.
Die Funktionen |Y |2 und |FY |2 sind beide Riemannintegrabel. Es gilt
R3
∞
|Y (x)|2 d3 x =
r2
0
1
e−2κr
.
2 4πdr =
8πκ
(4πr)
Die dreidimensionale Version des Satzes von Parseval sagt
R3
|F Y (k)|2 d3 k =
R3
|Y (x)|2 d3 x =
1
.
8πκ
Wegen
1
|FY (k)| d k =
4π
(2π)3
R3
2
∞
3
folgt somit
0
k2
1
2 dk =
2
2
(k + κ )
(2π)2
∞
Und tatsächlich gilt
∞
x2 dx
2 =
2
−∞ (x + 1)
k2
1
dk =
2
2
2
κ
−∞ (k + κ )
∞
1 d
x −
2 dx
−∞
∞
−∞
∞
k2
dk
2
2 2
−∞ (k + κ )
x2
π
.
dx =
2
2κ
(x2 + 1)
1
dx
=
2
1+x
2
∞
1
π
dx
= arctan (x)|∞
.
−∞ =
2
2
2
−∞ 1 + x
Coulombpotential
Im Sonderfall κ = 0 hat Y eine „Fourierdarstellung“ ohne selbst im Sinn von Funktionen eine Fouriertransformierte zu besitzen. Die „Fourierdarstellung“ besteht in
der Aussage, dass für alle x = 0
1
1
=
lim
4π |x|
(2π)3 K→∞
|k|<K
ei k,x 3
d k.
|k|2
Dies lässt sich folgendermaßen ableiten. Sei x = 0. dann gilt
1
2π
K
|k|<K
1
ei k,x 3
dk=
|k|2
K
0
0
−1
e
0
K
0
K
iqr cos θ
dq
eiqrξ dξ dq =
=
π
sin θdθ = −
,1
eiqrξ ,,
dq = 2
iqr ,−1
K
0
0
−1
1
sin (qr)
2
dq =
qr
r
x sin(t)
dt
0
t
eiqrξ dξ dq
Kr
0
sin (t)
dt.
t
Die (ungerade) Funktion Si : R → R mit Si (x) =
heißt Integralsinus und
es gilt limx→∞ Si (x) = π/2. (Ein Beweis ist in Vol. 2, Kap. VI.8.4 von [3] angeführt.)
Damit folgt
1
1
ei k,x 3
dk=
.
lim
3
2
K→∞ (2π)
4π |x|
|k|<K |k|
KAPITEL 2. FOURIERANALYSIS
193
Gleichverteilung in einer Kugel
3
Sei R ∈ R>0 . Für ρ : R3 → R gelte ρ (x) = 4πR
3 für |x| ≤ R und ρ (x) = 0 sonst. Es
3/2
gilt also (2π) F ρ (0) = R3 ρ (x) d3 x = 1.
Unter Verwendung von Kugelkoordinaten folgt für q > 0
(2π)3/2 Fρ (qe3 ) =
3
=
2R3
=
3
q 2 R3
R
R
3
4πR3
π
2π
e−iqr cos θ r2 sin θdθdφdr
0
0
0
π
R
1 d −iqr cos θ
3
r2
r eiqr − e−iqr dr
e
dθdr =
3
2iqR 0
0
0 iqr dθ
∞
R
3
3
d
r sin (qr) dr = 2 3
r −
cos (qr) dr
=
3
qR 0
q R 0
dr
R
sin (qR)
3
− r cos (qr)|R
+
cos (qr) dr = 2 2
− cos (qR) .
0
q R
Rq
0
Also gilt
(2π)3/2 Fρ (k) =
.
1
3
|k|2 R2
0
sin(|k|R)
|k|R
1 für k = 0
.
− cos (|k| R)
sonst
F ρ ist stetig. Figur 2.26 zeigt die Funktion |k| R → (2π)3/2 Fρ (k) .
1
0.75
0.5
0.25
0
0
2.5
5
7.5
10
Abbildung 2.26: Die Funktion
12.5
3
x2
15
sin(x)
x
− cos (x)
Die Funktion (2π)3/2 Fρ hat als Formfaktor einer ausgedehnten, homogenen Ladungsverteilung Bedeutung in Kern- und Teilchenphysik. Ein ausgedehnter Kern
erzeugt ein Streupotential Y ∗ ρ mit Y = e−κr /4πr für ein κ > 0. In einem Streuexperiment wird |F (Y ∗ ρ) (k)|2 gemessen. Nun kommt der Faltungssatz ins Spiel. Es
gilt
F (Y ∗ ρ) (k) = (2π)3/2 (FY ) (k) (F ρ) (k) .
Aus gemessenen Werten |F (Y ∗ ρ) (k)|2 für diverse k werden die Modellparameter
κ und R durch Anpassung bestimmt. (Die Nullstellen von |F (Y ∗ ρ) (k)|2 sind auch
die von (2π)3 |F (ρ) (k)|2 , da FY nach Gleichung (2.9) keine Nullstelle hat. Da k
einstellbar ist, legt die erste Nullstelle bei |k| R ≈ 4, 49 den Wert R schon fest.)
KAPITEL 2. FOURIERANALYSIS
2.3
194
Übungsbeispiele
1. (Trigonometrische Polynome) Rechnen Sie nach, dass die reelle Funktion cos3
das trigonometrische Polynom vom Grad 3 mit den Koeffizienten a0 = a2 =
b1 = b2 = b3 = 0 und a1 = 3/4 und a3 = 1/4 ist.
2. (Integration trigonometrischer Polynome) Seien m, ω, ω 0 , ρ ∈ R>0 und F0 ∈ R.
Dann existiert genau eine periodische Lösung x : R → R der gedämpften
Schwingungsgleichung y ′′ (t) + 2ρy ′ (t) + ω 20 y (t) = F0 cos (ωt) /m. Für diese
Lösung gilt für alle t ∈ R
cos (ωt − δ)
F0
,
x (t) =
m
2
2
2
2
(ω 0 − ω ) + (2ρω)
ω 2 −ω2
wobei 0 < δ < π und cot δ = 02ρω . (Für jede andere maximale Lösung y gilt
aufgrund der Dämpfung, dass limt→∞ |y (t) − x (t)| = 0.) Zeigen Sie, dass die
am Oszillator angreifende Kraft F0 cos (ωt) bei Vorliegen der Lösung x eine
T
periodengemittelte Leistung P = 0 x′ (t) F0 cos (ωt) dt/T von
P =
F02
F02
ρω 2
αq2
=
>0
m (ω 20 − ω 2 )2 + (2ρω)2
mω 0 (1 − q 2 )2 + (2αq)2
erbringt, wobei T = 2π/ω, α = ρ/ω 0 und q = ω/ω 0 . Die Figur (2.27) zeigt die
2
Funktion (1−q2 )αq
, die den Energieverbrauch regelt, für α = 1/10 und für
2
+(2αq)2
α = 1/5 (rot).
2
1.5
1
0.5
0
0
0.5
1
1.5
2
2.5
3
q
Abbildung 2.27:
3. Sei n ∈ N. Die Extrema23 von cosn (x) bei x ∈ π · Z, in denen cosn abwechselnd
die Werte (±1)n annimmt, werden mit wachsendem n schärfer ausgeprägt, da
23
Das „Signal“ cosn (ωt) ist also für großes n nur in sehr kurzen Zeitfenstern um t ∈ ωπ Z merklich
von 0 verschieden. Sein Fourierspektrum umfasst für (un)gerades n alle (un)geradzahligen Vielfachen der Grundfrequenz ω bis hinauf zu nω. Derartige Signale werden als Taktgeber benutzt. Je
schärfer das Signal sein soll, umso breiter muss sein Fourierspektrum angelegt sein. Realistische
Größenordnungen bei einem Frequenzkammgenerator sind ω ≈ 2π GHz und n ≈ 5 · 105 .
KAPITEL 2. FOURIERANALYSIS
195
limn→∞ cosn (x) = 0 für alle x ∈
/ π ·Z. Ein Maß für die Breite24 der Spitzen von
2π
1
cosn ist In := 2π
cos2n (x) dx = Pulsbreite / Abstand benachbarter Pulse.
0
(a) Zeigen Sie
In =
(2n)!
.
(n!)2
(2.10)
4n
Hinweis: Berechnen Sie von cos2n (x) =
eix +e−ix
2
2n
den Fourierkoeffizi-
enten c0 über die binomische Formel. Es gilt dann c0 [cos2n ] = In .
n
n!
e
(b) Verwenden Sie nun Stirlings Formel limn→∞ √2πn
= 1, um aus Glein
√
chung (2.10) abzuleiten, dass limn→∞ √ nπIn = 1. Mit wachsendem n
wird somit die Approximation In ≈ 1/ nπ immer besser. cos100 hat (in
dieser Approximation) daher die relative Breite I100 ≈ 0, 056.
Abbildung 2.28: cos200 auf [0, 2π]
4. (Grundbeispiele für Fourierreihen) Berechnen Sie die Fourierkoeffizienten
ck =
1
2π
2π
e−ikx f(x)dx,
0
k∈Z
der folgenden 2π-periodischen Funktionen und skizzieren Sie jeweils den Graphen der Abbildung k → |ck | (Fourierspektrum).
(a) f(x) = |x| für −π < x ≤ π (Sägezahn)
(b) f(x) = x für 0 ≤ x < 2π (Kippschwingung)
24
,
,
(c) f(x) = ,sin( x2 ), (gleichgerichteter Wechselstrom)
Als Pulsbreite ist dabei jene Zahl δ gemeint, für die
π/2
2n
(x) dx
−π/2 cos
=
δ/2
−δ/2 1dx
= δ gilt.
KAPITEL 2. FOURIERANALYSIS
196
(d) f(x) = sin2 ( x2 )
Achtung: f ist ein trigonome-
trisches Polynom. Daher sind Integrationen hier unnötig.
5. (Fourierreihe des δ-Kamms) Zeigen Sie für die Fourierkoeffizienten ck der Lperiodischen Funktion f , für die f (x) = f (−x) und mit 0 < ε < L2
(ε − x)/ε2 für 0 ≤ x < ε
,
0
ε ≤ x ≤ L2
f (x) =
dass c0 = 1/L und mit ω := 2π/L für alle k ∈ Z
ck =
1
L
sin (εωk/2)
εωk/2
0
2
gilt. Skizzieren Sie die Abbildung ω k := 2π
k → |ck |. Wie verändert diese sich,
L
wenn L vergrößert wird? Zeigen Sie limε↓0 ck = 1/L für alle k ∈ Z bei festem
L. (δ-Kamm)
L = 2, ε = 0.2
0.5
0.4
k
|c |
0.3
0.2
0.1
0
-100
-80
-60
-40
-20
0
ωk
20
40
60
80
100
6. (Aperiodische Sinus-Cosinus Überlagerung) Seien ω 1 , ω 2 , . . . ω N ∈ R>0 voneinander verschieden. Für f : R → C gelte mit a0 , a1 , . . . aN , b1 , . . . bN ∈ C für
alle t ∈ R
N
a0
f (t) =
+
(ak cos (ω k t) + bk sin (ω k t)) .
2
k=1
Die Funktion f ist also im Allgemeinen nicht periodisch. Zeigen Sie25 , dass für
25
Kelvin approximierte den gezeitenbhängigen Wasserstand in einem englischen Meereshafen
durch eine Funktion t → f (t) des obigen Typs. Aus den Aufzeichnungen während der Zeit S <
t < S + T ermittelte er annähernd die Konstanten a0 , . . . bN . Dabei wählte er ω 1 = 2π 12d , ω 2 =
2
2
28 d , ω3 = 365 d und nahm noch die ersten paar ganzzahligen Vielfachen davon dazu. Damit
konnte er f im Beobachtungszeitraum recht gut approximieren. Die Marine verließ sich auf den
weiteren Verlauf der Funktion f und war mit Kelvins Prognose zufrieden. Da die Berechnungen
sehr mühsam waren, erfand Kelvin gleich auch noch einen mechanischen Analogrechner, der die
Fourieramplituden a0 , . . . bN „berechnete”, und einen, der den künftigen Verlauf von f auf ein Jahr
im Voraus mit einer Auflösung von wenigen Minuten aufzeichnen konnte.
KAPITEL 2. FOURIERANALYSIS
197
jedes S ∈ R gilt
2
T →∞ T
2
= lim
T →∞ T
a0 =
ak
S+T
lim
f (t)dt,
S
S+T
S
2
cos (ω k t) f (t)dt, bk = lim
T →∞ T
S+T
sin (ω k t) f (t)dt.
S
7. (Fouriertransformation) Berechnen Sie die Fouriertransformierte
1
(Ff ) (k) = √
2π
∞
e−ikx f (x)dx,
−∞
k∈R
der folgenden auf R definierten Funktionen. Geben Sie auch die Funktionen
a, b der sin / cos-Version
1
f(x) = √
2π
∞
[a(k) cos(kx) + b(k) sin(kx)] dk
0
der Umkehrformel an.
(a) f(x) = 1 für −1 < x < 1 und f(x) = 0 sonst. Überprüfen Sie die Regeln
2 und 3 von Bemerkung 2.2.2 an Ff .
(b) g(x) = f
x−ξ
L
mit f wie in a) und für ein L > 0 und ein ξ ∈ R.
(c) f(x) = x für −1 < x < 1 und f (x) = 0 sonst. Überprüfen Sie an F f die
Regeln 2 und 3 von Bemerkung 2.2.2 und unter Verwendung von Beispiel
3a den Teil 4) von Satz 91.
8. Sei f wie in Beispiel 6a
(a) Überprüfen Sie daran Teil 1) von Satz 91.
(b) Berechnen Sie die Faltung f ∗ f und überprüfen Sie Teil 2) von Satz 91.
Kapitel 3
Vektoranalysis
Die Physik kennt neben dem Teilchenbild der Materie auch ein Kontinuumsbild.
Während das Teilchenbild von vereinzelten Weltlinien als den Elementarbausteinen
einer „Weltgeschichte“ ausgeht, unterstellt das Kontinuumsbild, dass Materie ausgedehnte Raumgebiete lückenlos ausfüllt.1 Um die zeitliche Entwicklung von Kontinuumsmaterie zu beschreiben, werden Funktionen benützt, die auf offenen Teilmengen
der Raumzeit definiert sind. Solche Funktionen werden Felder genannt. Die Bildbereiche der Felder können R, C, ein höherdimensionaler Vektorraum, oder auch ein
ganzes „Bündel“ von Vektorräumen sein. Beispiele sind Massendichte, Strömungsgeschwindigkeit, Ladungsstromdichte, elektrisches Feld, Gravitationspotential.
Zur Formulierung von Naturgesetzen werden Differentiations- und Integrationsprozeduren für Felder benötigt. Einen ersten Eindruck davon gibt das vorliegende
Kapitel. Dabei wird die Zeit vorläufig aus dem Spiel gelassen und als (instantaner)
Raum wird ein reeller Vektorraum mit einem ausgewählten Skalarprodukt benützt.
Die Relativitätsprinzipien der Physik verlangen nach Naturgesetzen, die ohne
Verwendung allzu spezieller, die Symmetrie brechende Vektorraumstrukturen, also
insbesonders ohne spezielle Wahl einer Basis formulierbar sind. Daher sollten Differentiation und Integration basisfrei definiert werden. Bis zu einem bescheidenen
Grad werden wir dieses „absolute2 Programm“ hier in seiner euklidischen Variante
kennenlernen. Es werden Richtungsableitung, Differential, Gradient, Divergenz und
Rotation vorgestellt. Die Einbettung dieser Rechenoperationen in Modelle mit Raum
und Zeit erfordert, soweit dies überhaupt möglich ist, weitere oder andere Strukturen, wie die absolute Gleichzeitigkeit der galileischen Raumzeit, oder das indefinite
innere Produkt der minkowskischen Raumzeit. In seiner vorläufig letzten Konsequenz gibt das absolute Programm auch die Vektorräume als Bühne für Differential
und Integral auf und ersetzt sie durch differenzierbare Mannigfaltigkeiten.
1
Newton selbst hatte den Weg zur Überwindung der Fernwirkungsgesetze gewiesen. Er schrieb
1692 an seinen Freund Richard Bentley: (zitiert nach p. 46 in N Forbes, B Mahon, Faraday,
Maxwell and the Electromagnetic Field, Prometheus, Amherst, New York, 2014): That gravity
should be innate, inherent, and essential to matter, so that one body can act on another at a
distance, through the vacuum, without the mediation of anything else, by and through which their
action and force may be conveyed from one to another, is to me so great an absurdity that I believe
no man who has in philosophical matters a competent faculty of thinking, can ever fall into it.
2
Das heißt von Zusatzstrukturen losgelöst, befreit.
198
KAPITEL 3. VEKTORANALYSIS
3.1
199
Differenzieren von Skalarfeldern
Wie können Skalarfelder differenziert werden? Ein erstes Problem gegenüber dem
Fall einer auf R definierten Funktion ist die Vielzahl von Richtungen mithilfe derer
eine Folge von Differenzenquotienten gebildet werden kann. Aus der Rechts- und
Linksableitung wird im höherdimensionalen Fall die Richtungsableitung.
3.1.1
Richtungsableitung und Differential
Notation
Zunächst zur Festlegung der Notation eine Wiederholung aus dem Bereich der linearen Algebra. Sei V ein n-dimensionaler reeller Vektorraum und e = (e1 , ..., en)
eine Basis von V . Die Abbildung ·, · : V × V → R sei ein Skalarprodukt. Zum
Skalarprodukt gehört eine Norm |·| von V , nämlich |v| :=
v, v . Die Matrix


e1 , e1 · · · e1 , en


..
..
...
Ge := 

.
.
en , e1
···
en , en
heißt Gramsche Matrix des Skalarproduktes ·, · zur Basis e. Eine Basis, deren
Gramsche Matrix die Einheitsmatrix In ∈ Rn×n ist, heißt Orthonormalbasis (ONB)
von V. Solche gibt es für jedes Paar (V, ·, · ) unendlich viele.
Zu jedem Vektor v ∈ V existiert genau eine von der Wahl von e abhängige Spalte
t
ve := (v 1 , . . . , v n ) ∈ Rn×1 , sodass
n
v = e · ve =
v i ei .
i=1
Die Spalte ve heißt kontravariante Koordinatenspalte von v zur Basis e. Die lineare
bijektive Funktion
Φe : V → Rn×1 , v → ve
heißt kontravariante Karte von V zur Basis e.
Es gilt für alle v, w ∈ V
v, w = vet · Ge · we .
Ist f eine weitere Basis von V und ist M die zugehörige Übergangsmatrix, d.h. es
gilt f = e · M, dann folgt für alle v ∈ V
vf = M −1 · ve .
(3.1)
Ist U ⊂ V, dann heißt eine Abbildung f : U → R Skalarfeld auf U. Die Abbildung
fe : Φe (U ) → R, für die f (v) = fe(ve) für
, alle v ∈ U gilt, heißt Kartenausdruck von
−1 ,
f zur Basis e. Es gilt also fe = f ◦ Φe Φ (U) .
e
Ist U ⊂ V, dann heißt eine Abbildung X : U → V Vektorfeld auf U. Bisher
haben wir nur den Graphen von X als Vektorfeld bezeichnet. Im gegenwärtigen
KAPITEL 3. VEKTORANALYSIS
200
Zusammenhang ist es üblich und praktisch, die V -wertigen Abbildungen selbst als
Vektorfelder zu bezeichnen. Nach Wahl einer Basis e ist jedem Vektorfeld die Funktion Φe ◦ X : U → Rn×1 zugeordnet. Für sie gilt X = e · Φe ◦ X. Die Skalarfelder
Xei := Φie ◦ X : U → R für i = 1, ..., n heißen die Komponentenfunktionen von
X. Sind für offenes U ihre Kartenausdrücke alle vom C k -Typ, dann heißt X ein
C k -Vektorfeld.
Vektorfelder auf U können addiert und mit Skalarfeldern auf U multipliziert
werden. Das geschieht punktweise mittels der Vektorraumrechenoperationen gemäß
X + Y : U → V,
f X : U → V,
v → X(v) + Y (v),
v → f (v) · X(v).
Richtungsableitung
Bewegt sich ein (kleiner) Sensor als Funktion der Zeit gemäß einer Kurve γ : I →
U durch den Definitionsbereich U eines Skalarfeldes f, dann ist es vielfach von
Interesse zu wissen, wie rasch sich die Größe f am Ort γ (t) des Sensors zur Zeit t
ändert. Gesucht ist also die Ableitung (f ◦ γ)′ (t) und damit die beste inhomogen
lineare Approximation der Funktion ε → f (γ (t + ε)) = a + bε bei ε = 0. Ist die
Kurve γ in t ∈ I differenzierbar, wird erstens die Kurve γ selbst in der Nähe von
p = γ (t) durch ein hinreichend kleines Stück der Gerade p + R · γ̇ (t) approximiert
und zweitens die Funktion f über dem Geradenstück inhomogen linear genähert.
Für manche Funktionen f existiert eine beste inhomogen lineare Approximation
nur für die einseitig definierte Funktion 0 ≤ ε → f (γ (t + ε)) ≈ f (p + εγ̇ (t)) bei
ε = 0. In solchen Fällen liefert die (etwas allgemeinere) Definition der einseitigen
Richtungsableitung die gesuchte Approximation.
Definition 93 (Richtungsableitung eines Skalarfeldes) Sei U ⊂ V offen und
f : U → R. Falls für ein p ∈ U und ein X ∈ V der Grenzwert
[X]p f := lim
ε↓0
f (p + εX) − f (p)
∈R
ε
existiert, dann heißt die reelle Zahl [X]p f einseitige Richtungsableitung3 von f in
p unter X. Existiert der beidseitige Limes limε→0 (f (p + εX) − f (p)) /ε ∈ R, dann
wird er als die Richtungsableitung [X]p f von f im Punkt p unter X ∈ V bezeichnet.
Anmerkungen:
1. Zur Definition von [X]p f wird keine Norm von V benötigt.
2. Die einseitige Richtungsableitung [X]p f gibt - falls existent - die beste inhomogen lineare Approximation an die Funktion f auf dem Halbstrahl p+R≥0 ·X
(hinreichend nahe) bei p, denn für den ’Fehler’ ψ mit
ψ (ε) = f (p + εX) − f (p) − ε [X]p f
3
Der Name ’Richtungsableitung’ ist etwas irreführend, da [X]p f nicht nur von der Richtung
des Vektors X abhängt, sondern auch von seinem Betrag. Besser wäre die Bezeichnung ’Geschwindigkeitsableitung’.
KAPITEL 3. VEKTORANALYSIS
201
gilt limεց0 ψ (ε) /ε = 0. Für eine Zahl c ∈ R mit c = [X]p f folgt ja für den
Fehler ψ c der Approximation f(p + εX) ≈ f(p) + cε im Limes ε ց 0
ψ (ε) + ε [X]p f − εc
ψ c (ε)
f (p + εX) − f(p) − εc
=
=
→ [X]p f − c = 0.
ε
ε
ε
In diesem Sinn ist f (p + εX) ≈ f (p) + ε [X]p f die beste inhomogen lineare
Approximation an ε → f (p + εX) bei ε = 0 im Bereich ε > 0. Existiert die
(beidseitige) Richtungsableitung [X]p f, dann ist f (p + εX) ≈ f (p) + ε [X]p f
die beste inhomogen lineare Approximation an ε → f (p + εX) beidseitig um
ε = 0.
3. Ist γ : I → U ⊂ V eine differenzierbare Kurve und existiert für ein Skalarfeld
f : U → R in p = γ (t) die Richtungsableitung unter X = γ̇ (t) für ein t ∈ I,
dann ist ε → f (p) + ε [X]p f auch die beste inhomogen lineare Approximation
an die Funktion ε → f (γ (t + ε)) bei ε = 0.
4. Seien auf einer offenen Menge U ⊂ V ein Skalarfeld f und ein Vektorfeld
X gegeben. Existieren in jedem Punkt p ∈ U die (einseitigen) Richtungsableitungen [X (p)]p f, dann ist durch die Abbildung [X] f : U → R mit
([X] f) (p) = [X (p)]p f das Skalarfeld der (einseitigen) Richtungsableitungen
von f unter X gegeben.
5. Die (einseitige) Richtungsableitung kann auch für Funktionen f : U → W
erklärt werden, wenn W irgendein reeller Vektorraum ist. Es kommt ja nur
darauf an, dass im Bildraum addiert und mit Skalaren multipliziert werden
kann. Die Richtungsableitung ist dann, falls existent, ein Element von W.
Satz 94 Besitzen die beiden Skalarfelder f, g : U → R in p die (einseitigen) Richtungsableitungen unter X, dann gilt [X]p (f + g) = [X]p f + [X]p g (Additivität) und
die Produktregel [X]p (f · g) = g (p) · [X]p f + f (p) · [X]p g.
Beweis. Die Additivität der Richtungsableitung ist aus der Definition klar. Zur
Produktregel: es gilt
f (p + εX) g (p + εX) − f (p) g (p)
ε↓0
ε
f (p + εX) g (p + εX) − f (p + εX) g (p) + f (p + εX) g (p) − f (p) g (p)
= lim
ε↓0
ε
[X]p (f · g) = lim
= f (p) [X]p g + [X]p f g (p) .
Satz 95 Sind zwei Vektoren X, Y ∈ V 0 gleichgerichtet, dh es existiert ein λ > 0
mit Y = λX, dann folgt bei existenter einseitiger Richtungsableitung [X]p f, dass
[Y ]p f = λ [X]p f. Existiert die beidseitige(!) Richtungsableitung [X]p f, dann gilt
[λX]p f = λ [X]p f für alle λ ∈ R.
KAPITEL 3. VEKTORANALYSIS
202
Beweis. Existiert die einseitige Richtungsableitung, dann gilt
f (p + εY ) − f (p)
f (p + ελX) − f (p)
= λ lim
ε↓0
ε↓0
ε
λε
f (p + ηX) − f (p)
= λ lim
= λ [X]p f.
η↓0
η
[Y ]p f = lim
Existiert die beidseitige Richtungsableitung, dann folgt für λ = 0
f (p + ελX) − f (p)
f(p + ελX) − f (p)
= λ lim
ε→0
ε→0
ε
λε
f (p + ηX) − f (p)
= λ lim
= λ [X]p f.
η→0
η
[λX]p f = lim
Für λ = 0 folgt [0 · X]p f = 0 = 0 · [X]p f.
Soll das Verhalten von f bei p in verschiedene Richtungen quantitativ bewertet
werden, werden die Richtungsableitungen mit Einheitsvektoren gebildet und miteinander verglichen. Dazu 0
muss natürlich erst eine 1Norm in V ausgewählt werden.
An der Menge der Zahlen [X]p f : X ∈ V, |X| = 1 lässt sich dann gegebenenfalls
ermitteln, in welche Richtung - bei Abwanderung von p - der Wert der Funktion f
am stärksten zu- bzw abnimmt.
Richtungsableitung der Norm r = |·|
Ist r = |·| : V → R durch ein Skalarprodukt von V gemäß r (p) =
dann gilt für einen Punkt p = 0 und X ∈ V
p, p definiert,
r (p + εX)2 − r (p)2
p + εX, p + εX − p, p
=
= 2 p, X + ε |X|2 .
ε
ε
Es existiert also der Limes ε → 0 und somit die Richtungsableitung [X]p r2 . Sie
erfüllt [X]p r2 = 2 p, X . Wegen r (p) = r (p)2 folgt nun mit der Kettenregel
,
,
,
,
d
1
d
1
p, X
2,
2,
[X]p r =
r (p + εX) ,
=
r (p + εX) ,
=
[X]p r2 =
.
dε
2r (p) dε
2 |p|
|p|
ε=0
ε=0
Für p = 0 funktioniert diese zweistufige Art der Berechnung der Richtungsableitung
von r nicht, da die Wurzelfunktion in 0 nicht differenzierbar ist. Wir gehen die
Richtungsableitung direkt an. Es gilt für ε > 0
r (0 + εX) − r (0)
r (εX)
=
= |X| .
ε
ε
Für ε < 0 hingegen gilt
r (0 + εX) − r (0)
r (εX)
=
= − |X| .
ε
ε
Es existiert also zwar die einseitige Richtungsableitung von r in 0 unter X = 0, nicht
aber die beidseitige. Für die einseitige Richtungsableitung gilt [X]0 r = |X| .
KAPITEL 3. VEKTORANALYSIS
203
Totales Differential
Eine Verschärfung des Differenzierbarkeitsbegriffes, der über die Richtungsableitung
hinausgeht, ist möglich, indem nach einer linearen Approximation der Funktion
X → f (p + X) − f (p) nicht nur auf einem hinreichend kurzen Geradenstück durch
0, sondern in einer genügend kleinen offenen Umgebung von 0 gefragt wird.
Definition 96 (Differential eines Skalarfeldes) Sei f : U → R mit U ⊂ V
offen. Existiert für p ∈ U eine lineare Abbildung dp f : V → R, sodass
f (p + X) − f (p) − dp f (X)
= 0,
X→0
|X|
lim
dann heißt f differenzierbar in p und dp f heißt das (totale) Differential von f in p.
Anmerkungen:
1. Diese implizite Definition des Differentials einer in p differenzierbaren Funktion
f legt dp f eindeutig fest, denn für eine von dp f verschiedene lineare Funktion
L : V → R gilt für den Fehler der Approximation X → f (p) + L (X) von
X → f (p + X) auf einer hinreichend kleinen Umgebung U0 von 0 ∈ V
ψ L (X)
f (p + X) − (f (p) + L (X))
|X|
f (p + X) − f (p) − dp f (X) (dp f − L) (X)
+
=
|X|
|X|
:
=
und dieser Ausdruck konvergiert für X → 0 nicht gegen 0. Das Differential gibt
also die beste lineare Approximation an die Funktion f im Punkt p, weil sie die
einzige ist, deren Fehler ψ so rasch gegen 0 geht, dass limX→0 ψ (X) / |X| = 0
folgt.
2. Das Differential einer Funktion f in einem Punkt p ist also keine „infinitesimale” Größe, sondern eine lineare Abbildung. Die Vorstellung vom Differential
als kleine Zahl rührt von der Tatsache her, dass dp f (X) in der Regel nur für
hinreichend kleine X die Differenz f (p + X) − f (p) gut nähert. Und für kleine
X ist natürlich auch dp f (X) klein.
3. Die Definition des Differentials eines Skalarfeldes macht Gebrauch von einer
Norm von V. Da jedoch alle Normen eines endlichdimensionalen Vektorraums
zueinander äquivalent4 sind, ergeben alle Normen dasselbe Differential.
4. Ist f : U → R in p ∈ U differenzierbar, dann liefert das Differential von f in p
alle seine Richtungsableitungen in p. Aus der Linearität von dp f folgt nämlich
4
Zwei Normen |·|1 und |·|2 heißen äquivalent, wenn zwei positive reelle Zahlen c1 , c2 existieren,
sodass für alle v ∈ V gilt, dass |v|1 ≤ c1 |v|2 und |v|2 ≤ c2 |v|1 .
KAPITEL 3. VEKTORANALYSIS
204
f (εX)
f (εX)
für X ∈ V und ε = 0, dass dp f (X) = |X| dpε|X|
= sgn (ε) |X| dp|εX|
. Daraus
folgt weiter
dp f (εX)
f(p + εX) − f(p)
= |X| lim sgn (ε)
ε→0
|εX|
|εX|
f(p + εX) − f (p)
= lim
= [X]p f.
ε→0
ε
dp f (X) = |X| lim sgn (ε)
ε→0
5. Ist f überall differenzierbar, dann heißt die Abbildung df : U → Hom (V : R)
mit p → dp f das Differential von f. Hier bezeichnet Hom (V : R) die Menge
aller linearen Abbildungen von V nach R, also den Vektorraum der ’Linearformen’ von V.
6. Das analog definierte Differential existiert für Funktionen f : U → W, wenn
W irgendein reeller Vektorraum ist.
Skalarfelder können punktweise addiert und multipliziert werden. Diesbezüglich
gibt es wieder einfache aber umso nützlichere Regeln.
Satz 97 Seien f, g : U → R (mit U ⊂ V offen) in p ∈ U differenzierbar und λ ∈ R.
Dann gilt dp (λf + g) (X) = λdp f (X) + dp g (X) (Linearität) und die Produktregel
dp (f · g) (X) = g (p) · dp f (X) + f (p) · dp g (X) für alle X ∈ V.
3.1.2
Beispiele zum Differential
Differential einer konstanten Funktion
Sei f : V → R konstant. Dann gilt f (p + X) − f (p) = 0 und daher
f (p + X) − f (p) − 0
= 0.
X→0
|X|
lim
Somit gilt dp f (X) = 0 für alle p, X ∈ V.
Differential einer Linearform
Das einfachste Beispiel nach den konstanten Funktionen liefert eine lineare Funktion
f : V → R. Es gilt für p, X ∈ V
f (p + X) − f (p) − f (X)
= 0.
|X|
Die Abbildung f ist somit differenzierbar und es gilt dp f (X) = f (X) für alle
p, X ∈ V. Beispielsweise folgt für f : V → R mit f (p) = k, p , wobei ·, · ein
Skalarprodukt von V und k ∈ V ein fest gewählter Vektor ist, dp f (X) = k, X .
KAPITEL 3. VEKTORANALYSIS
205
Differential und Kettenregel
Etwas allgemeiner ergibt sich für h : V → R mit h (p) = k, p n und n ∈ Z das
Differential dp h mit der Kettenregel. Sie besagt für die Hintereinanderausführung
h = g ◦ f zweier differenzierbarer Funktionen f : V → R und g : R → R dass für
alle X ∈ V
dp h (X) = df (p) g (dp f (X)) = g ′ (f (p)) · dp f (X) .
Im vorliegenden Fall setzen wir f (p) = k, p für alle p ∈ V und g (x) = xn für alle
x ∈ R. Dann ergibt die Kettenregel dp h (X) = n k, p n−1 k, X für alle X ∈ V.
Differential eines Normquadrats
Für f : V → R mit f (p) = p, p = |p|2 gilt f(p + h) = p + X, p + X = p, p +
2 p, X + X, X und somit
f (p + X) − f (p) − 2 p, X
X, X
= lim
= lim |X| = 0.
X→0
X→0 |X|
X→0
|X|
lim
Ein Skalarprodukt ist bilinear. Daher ist die Abbildung von V nach R mit X →
2 p, X linear und es gilt dp |·|2 (X) = 2 p, X für alle X ∈ V.
Differential einer quadratischen Form
Sei A : V → V linear und symmetrisch bezüglich des Skalarprodukts ·, · von V.
Dann gilt für die Abbildung f : V → R mit f (p) = p, Ap
f (p + X) − f (p) = p, AX + X, Ap + X, AX = 2 p, AX + X, AX .
Daraus folgt
f (p + X) − f (p) − 2 p, AX
= 0.
X→0
|X|
Somit ist die Funktion f, eine sogenannte quadratische Form, überall differenzierbar
und es gilt dp f (X) = 2 p, AX für alle X ∈ V.
lim
Differential einer Norm
Sei r := |·| mit |p| =
p, p . An der Stelle p = 0 gilt für ε > 0 und X ∈ V
r(0 + εX) − r(0)
ε |X| − 0
=
= |X| = [X]0 r.
ε
ε
Alle einseitigen Richtungsableitungen von r existieren also an der Stelle p = 0. Aber
die Abbildung X → [X]0 r = |X| ist nicht linear. Wäre sie das, müsste |−X| = − |X|
gelten, was für X = 0 im Widerspruch zu 0 < |X| = |−X| steht. Somit ist r in 0
nicht differenzierbar.
Dass r an einer Stelle p = 0 differenzierbar ist, folgt aus der Differenzierbarkeit
der Wurzelfunktion auf R>0 . Es gilt nach der Kettenregel
√
1
1
dp r 2 =
· 2 p, · ,
dp r = dp · ◦ r2 =
2 |p|
2 r2 (p)
KAPITEL 3. VEKTORANALYSIS
206
also
dp r (X) = p/ |p| , X für alle p ∈ V
0 und für alle X ∈ V.
(3.2)
Richtungsableitung der Norm unter Drehvektorfeld
Schließlich soll noch für einen dreidimensionalen, orientierten Vektorraum V das
skalare Feld der Richtungsableitungen von r = |·| mit dem Drehvektorfeld zur Achsenrichtung n
L : V → V, p → n × p
berechnet werden. Dabei gehört die Norm r zu jenem Skalarprodukt von V, das zur
Bildung des Vektorproduktes benutzt wird. Für p = 0 kann der Vektor L(p) in das
Differential dp r eingesetzt werden. Dies ergibt
[L]p r = (dp r) (n × p) =
1
p, n × p = 0.
|p|
Für p = 0 steht kein Differential von r zur Verfügung und es ist die Definition 93 der
Richtungsableitung zu verwenden. Wegen L(0) = 0 folgt also auch [L]0 r = 0. Das
Faktum [L]p r = 0 für alle p ∈ V signalisiert die Drehinvarianz der Funktion r, denn
es bewirkt, dass die Integralkurven von L in den Niveauflächen von r verlaufen, dass
also r auf zwei Punkten, die auseinander durch Drehen hervorgehen, denselben Wert
hat.
3.1.3
Skalarpotential eines Punktdipols
Die elektrische Potentialfunktion eines Punktdipols entsteht aus der einer Punktladung durch die Bildung einer Richtungsableitung. Und zwar so:
Eine im Ort X ∈ V ruhende Punktladung der Stärke q ∈ R trägt für dim V = 3
das elektrische Potentialfeld
ΦX : V
X → R mit ΦX (p) =
q
1
.
·
4πε0 |p − X|
Befindet sich zusätzlich eine Punktladung −q am Ort 0, dann addieren sich die
beiden Potentialfunktionen zum Gesamtpotential, das in p ∈ V {0, X} den Wert
ΦX (p) − Φ0 (p) = Φ0 (p − X) − Φ0 (p) = − (dp Φ0 ) (X) + Ψp (X)
hat, wobei der Fehler Ψp (X) der Tangentialapproximation für X → 0 so rasch gegen
0 strebt, dass limX→0 Ψp (X) / |X| = 0. Mit dp r−1 = − |p|−3 p, · folgt
− (dp Φ0 ) (X) = − [X]p Φ0 =
q p, X
1 qX, p
.
3 =
4πε0 |p|
4πε0 |p|3
Der Vektor δ = qX ∈ V heißt Dipolmoment der beiden Punktladungen und
D0 : V
0 → R mit D0 (p) = − [δ]p
1
1
·
4πε0 |·|
=
1 δ, p
4πε0 |p|3
KAPITEL 3. VEKTORANALYSIS
207
heißt Potentialfunktion eines (fiktiven) Punktdipols im Ort 0 mit Dipolmoment δ.
Aber D0 ≈ ΦX − Φ0 gilt nur im Bereich |p| ≫ |X| . Sitzt ein Punktdipol in einem
beliebigen Ort X, dann trägt er das Potential DX mit DX (p) = D0 (p − X) .
Vielfach ist von einem realen Dipol weder q noch X bekannt, sondern lediglich
der Vektor δ. Für das Dipolmoment eines HF-Moleküls etwa gilt |δ| = 6 · 10−30 C m,
wobei aber das HF-Molekül nicht als neutrales Paar von zwei ruhenden Punktladungen verstanden wird und es die Größen q und X im HF-Molekül gar nicht zu
geben scheint. Eher stimmt das Bild einer stetigen auf kleinem Raum lokalisierten
Ladungsdichte, deren Potential weit weg vom Molekül durch D0 approximiert wird.
3.1.4
*Lineare Richtungsableitungen ohne D’barkeit
Eine Funktion, deren Richtungsableitungen in 0 alle gleich 0 sind, die aber trotzdem
in 0 nicht differenzierbar ist, ist die folgende: Seien f : V → R und e = (e1 , e2 ) eine
Basis von V mit
f (x · e1 + y · e2 ) =
x3 y
für x2 + y 2 > 0 und f (0) = 0.
x4 + y 2
Dann gilt für X = cos α · e1 + sin α · e2 und ε > 0
f (εX) − f (0)
ε cos3 α sin α
= 2
→ 0 für ε ց 0.
ε
ε cos4 α + sin2 α
Alle Richtungsableitungen von f in 0 existieren und haben den Wert 0. Die Abbildung V ∋ X → [X]0 f ist also linear.
Ist f in 0 auch differenzierbar? Dazu müsste limp→0 (f (p) − f (0)) / |p| = 0 für
irgendeine5 beliebige Norm |·| von V gelten, da ja alle Richtungsableitungen in 0
verschwinden. Wegen f (0) = 0 ist also der Grenzwert limp→0 f (p) / |p| zu untersuchen. Sei also |·| die Norm zu jenem Skalarprodukt, das die Basis e zu einer ONB
macht. Dann gilt
f (x · e1 + y · e2 )
x3 y
=
.
|x · e1 + y · e2 |
(x4 + y 2 ) x2 + y 2
Wir werten nun f längs der C 1 -Kurve γ : [0, 1] → V mit γ (t) = t · e1 + t2 · e2 aus,
setzen also x = t und y = t2 . Dies ergibt
f (0 + γ (t)) − f (0)
t3 t2
t5
1
1
√
√
=
=
= √
→ für t → 0.
4
4
2
4
5
2
2
|γ (t)|
2
(t + t ) t + t
2t 1 + t
2 1+t
Somit ist f in 0 nicht differenzierbar.
5
Gilt dies für eine Norm, dann gilt es auch für jede andere, da ja alle Normen eines endlichdimensionalen Vektorraumes zueinander äquivalent sind.
KAPITEL 3. VEKTORANALYSIS
3.1.5
208
Partielle Ableitungen
Sei U ⊂ V offen und f : U → R. Sei e eine Basis von V. Für p ∈ U existiere der
Grenzwert limε→0 (f (p + εei ) − f (p)) /ε. Es gilt dann
(f (p + εei ) − f (p))
= [ei ]p f = − [−ei ]p f.
ε→0
ε
Sei fe der Kartenausdruck von f zur Basis e. Dann folgt mit der Standardbasis δ
von Rn×1
fe (pe + εδ i ) − fe (pe )
∂fe
[ei ]p f = lim
(pe ).
=
ε→0
ε
∂xi
Die Richtungsableitung [ei ]p f von f in p unter dem Basisvektor ei stimmt also mit
der i-ten partiellen Ableitung des Kartenausdrucks fe von f zur Basis e im Punkt pe
überein. Daher wird unter den vorliegenden Umständen das Skalarfeld p → [ei ]p f
auf U kurz als die i-te partielle Ableitung ∂ie f von f bezüglich der Basis e bezeichnet
lim
∂fe
∂xi
e
∂i f :=
◦ Φe |U = [ei ] f.
Zur Berechnung des Skalarfeldes [ei ] f durch partielles Differenzieren wird also
der Koordinatenausdruck von f zur Basis e benötigt.
Ein Skalarfeld f : U → R sei in jedem Punkt p ∈ U ⊂ V differenzierbar. Dann
kann mit einem Vektorfeld X : U → V das Skalarfeld [X] f : U → R gebildet
werden, das einem Punkt p die Richtungsableitung von f an der Stelle p unter dem
Vektor X(p) zuordnet. Sein Wert an der Stelle p ∈ U wird mit [X]p f := [X(p)]p f
bezeichnet. In den Koordinaten zur Basis e gilt
n
n
ei Φie
[X]p f = dp f
i=1
(X (p))
n
Φie (X
=
(p)) dp f (ei ) =
i=1
i=1
Φie ◦ X · ∂ie f (p) .
Ein nützliches Kriterium für die Differenzierbarkeit eines Skalarfeldes in Termen
der partiellen Ableitungen gibt der folgende Satz. (§6, Satz 2, p 47 in [6])
Satz 98 Sei U ⊂ V offen und e eine Basis von V . Der Koordinatenausdruck
fe von f : U → R sei überall partiell differenzierbar. Die partiellen Ableitungen
∂fe
(x1 , ..., xn ) seien stetig im Punkt p ∈ U. Dann ist f in p differenzierbar.
∂xi
3.1.6
Beispiele zur partiellen Ableitung
Richtungsableitung unter Drehvektorfeld
Nun soll die Berechnung der Richtungsableitung der Norm mit dem Drehvektorfeld
unter Verwendung von Koordinaten zur Standardbasis e von V = R3×1 wiederholt
werden. Es gilt r = re (x1 , x2 , x3 ) =
(x1 )2 + (x2 )2 + (x3 )2 . Das Drehvektorfeld
t
L : p → n × p ist für n = (n1 , n2 , n3 ) durch
 2 3

n x − n3 x2
L =  n3 x1 − n1 x3  =:
n1 x2 − n2 x1
3
i=1
Li x1 , x2 , x3 · ei
KAPITEL 3. VEKTORANALYSIS
209
gegeben. Für die partiellen Ableitungen von r gilt auf V
∂ie r =
xi
∂re 1 2 3
x ,x ,x =
∂xi
(x1 )2 + (x2 )2 + (x3 )2
Damit folgt für das Skalarfeld [L] r auf V
3
Li
[L] r =
i=1
∂re
∂xi
0
=
xi
.
r
0, dass
(x1 , x2 , x3 )
1 1 2 3
=
x n x − n3 x2 + x2 n3 x1 − n1 x3 + x3 n1 x2 − n2 x1
r
= 0.
Partielle DGen und Vektorfelder
Seien auf U = (R 0)×R das Skalarfeld f = y/x und das Vektorfeld Y = (2x, −3y)
gegeben. Dann gilt [Y ] f = 2x∂x xy − 3y∂y xy = −2xy/x2 − 3y/x = −5y/x. Man sagt:
f ist Lösung der „partiellen Differentialgleichung“ [Y ] f + 5f = 0. Vektorfelder
induzieren also nicht nur Systeme von gewöhnlichen Differentialgleichungen sondern
auch partielle Differentialgleichungen (beide erster Ordnung).
Partielle Ableitungen ohne D’barkeit
Seien f : V → R und e = (e1 , e2 ) eine Basis von V mit f (0) = 0 und
f (x · e1 + y · e2 ) =
x2
xy
für x2 + y 2 > 0.
+ y2
Es folgt f (y · e2 ) = f (x · e1 ) = 0 für alle x, y ∈ R. Daher gilt ∂1e f (0) = ∂2e f (0) = 0.
Für α ∈ R und r > 0 folgt fe (r cos α, r sin α) = cos α sin α = sin (2α) /2. Auf jeder
noch so kleinen Kreisscheibe um 0 nimmt somit f jeden Wert zwischen −1/2 und
1/2 an. Daher ist f in 0 unstetig und nicht differenzierbar. Die Richtungsableitung
von f in 0 mit X = cos α · e1 + sin α · e2 existiert für 0 < α < π/2 nicht, da für alle
ε>0
f (εX) − f (0)
sin (2α)
=
ε
2ε
für ε ց 0 nach ∞ divergiert. Also gilt: die partiellen Ableitungen (∂ie f ) (0) existieren,
nicht aber die Richtungsableitung [X]0 f unter X = x · e1 + y · e2 mit x · y = 0.
3.1.7
Gradient
Das Differential einer differenzierbaren Funktion f : V ⊃ U → R im Punkt p ∈ U
ist eine lineare Abbildung von V nach R, eine sogenannte Linearform. Das folgende
Lemma hält fest, dass sich jede Linearform auf V als Skalarprodukt mit einem geeigneten Vektor in V darstellen lässt. Damit ist über die Darstellung des Differentials
eines Skalarfeldes als Skalarprodukt der Weg zur Definition des Gradienten geebnet.
KAPITEL 3. VEKTORANALYSIS
210
Lemma 99 Seien e = (e1 , . . . en ) eine Basis und ·, · ein Skalarprodukt von V.
n
i
Zu jeder Linearform L : V → R existiert genau ein Vektor l =
i=1 l ei ∈ V,
sodass L(X) = l, X für alle X ∈ V gilt. Die Koordinaten li von l bezüglich e sind
ij
durch li = nj=1 G−1
L (ej ) gegeben. Dabei bezeichnet G−1
e
e die inverse Matrix der
Gramschen Matrix Ge zur Basis e und zum Skalarprodukt ·, · .
Beweis. Zur Eindeutigkeit: Angenommen es gibt zwei Vektoren l1 , l2 ∈ V, für
die l1 , X = L(X) und l2 , X = L(X) für alle X ∈ V. Dann wäre l1 − l2 , X = 0
für alle X ∈ V die Folge. Für X = l1 − l2 folgt daraus |l1 − l2 |2 = 0, also l1 = l2 .
Wie lässt sich l bestimmen? Sei e = (e1 , . . . en ) eine Basis und l = ni=1 li ei .
Dann ist L(X) = l, X für alle X ∈ V genau dann erfüllt, wenn
n
n
i
L (ej ) = l, ej =
li (Ge )ij
l ei , ej =
i=1
i=1
für alle j ∈ {1, . . . n} gilt. Wegen6 det Ge = 0 ist die Matrix Ge invertierbar und es
n
i
−1 ij
folgt mit ihrer als G−1
L (ej ) .
e notierten inversen Matrix l =
j=1 Ge
Die Darstellung einer beliebigen Linearform L : V → R als Skalarprodukt L =
l, · mit einem eindeutig durch L und ·, · bestimmten Vektor l ∈ V ermöglicht
nun die folgende Definition des Gradienten.
Definition 100 (Gradient) Sei U ⊂ V offen und f : U → R sei differenzierbar
in p ∈ U. Dann heißt der Vektor gradp (f ) ∈ V mit
&
'
gradp (f) , X = [X]p f = dp f (X) für alle X ∈ V
Gradient von f im Punkt p. Ist f überall differenzierbar, dann heißt das Vektorfeld
grad (f ) : U → V, p → gradp (f) das Gradientenfeld von f.
Die hier getroffene koordinatenfreie Definition des Gradienten enthält die Wahl
eines Skalarproduktes. Ein und dieselbe Funktion f hat also je nach Skalarprodukt
einen anderen Gradientenvektor in p. Die Definition des Differentials dp f hingegen
macht keinen Gebrauch von der Wahl eines Skalarprodukts und ist daher weniger
stark von zusätzlichen Strukturen auf V beeinflusst.
Gradient einer Linearform
Sei g : V → R mit g (p) = k, p für ein k ∈ V. Wegen dp g (X) = k, X gilt somit
gradp (g) = k für alle p ∈ V.
Gradient einer quadratischen Form
Sei A : V → V linear und symmetrisch bezüglich des Skalarprodukts ·, · von V.
Dann hat die quadratische Form f : V → R mit f (p) = p, Ap an der Stelle p ∈ V
das Differential dp f : X → 2 p, AX = 2 Ap, X . Somit folgt gradp f = 2Ap.
6
Aus det Ge = 0 würde folgen, dass Ge den Eigenwert 0 hat. Dies steht im Widerspruch zur
Eigenschaft der Nichtausgeartetheit des Skalarproduktes, die besagt, dass v, w = 0 für alle w ∈ V
nur dann gilt, wenn v = 0.
KAPITEL 3. VEKTORANALYSIS
211
Geometrische Bedeutung des Gradienten
Sei f ein in p differenzierbares Skalarfeld. Für gradp (f ) = 0 und X ∈ V
dann genau ein θ ∈ [0, π] mit
,
,
&
'
[X]p f = gradp (f ) , X = |X| ,gradp (f ), cos θ.
0 existiert
(θ wird als der ungerichtete Winkel zwischen den Vektoren
grad, p (f ) und X bezeich,
,
net.) Daraus folgt max {Xp [f ] | X ∈ V, |X| = 1} = gradp (f ), . Das Maximum der
Richtungsableitungen Xp [f ] für X ∈ V mit |X| = 1 wird also genau dann angenom,−1
,
men, wenn X = ,gradp (f ), gradp (f ) . Ein von 0 verschiedener Gradientenvektor
gradp (f ) gibt somit am Punkt p jene Richtung in V an, in welche die Funktion f
am stärksten zunimmt.7 Nimmt die Funktion f um p in keine Richtung zu, dann
gilt gradp (f ) = 0. Der Punkt p wird dann als kritischer Punkt von f bezeichnet.
Eine Kurve γ : (−ε, ε) → U ⊂ V sei differenzierbar in 0 und es gelte γ(0) = p.
Weiter sei f (γ(t)) = f (p) für alle t ∈ (−ε, ε) . Die Kurve γ nimmt also nur Werte
auf jener Niveaumenge von f an, in der p liegt, also in {q ∈ U | f (q) = f(p)} . Aus
der Konstanz von f ◦ γ folgt
,
,
&
'
d
(f ◦ γ),, = dp f (γ̇ (0)) = gradp (f) , γ̇(0) .
0=
dt
t=0
Der Gradientenvektor gradp (f ) steht somit senkrecht auf die Tangentenvektoren der
Niveaumenge von f im Punkt p.
Gradient der Norm
√
Sei f : V → R, mit f (p) = p, p und r = |·| = f . Dann gilt dp f = 2 p, · , woraus
gradp (f ) = 2p folgt. Analog ergibt sich aus dp r = p/ |p| , · , dass gradp (r) = p/ |p|
für p ∈ V
0. Beide Vektorfelder sind in p = 0 radial nach außen gerichtet und
stehen in p senkrecht auf die Niveaufläche von f, eine Sphäre um 0 mit dem Radius
r(p). Wir fassen als Funktionsgleichungen auf V 0 zusammen:
grad r2 = 2ιd und grad (r) =
3.1.8
ιd
.
r
*Kräftefreie relativistische Bewegung
Zur Illustration des Gradienten eignet sich die relativistische Mechanik eines kräftefreien Massenpunktes. Seine Lagrangefunktion spezialisiert sich durch Wahl eines
Inertialsystems zu L : V × Kc → R mit
L (x, v) = −mc2
7
1 − |v/c|2 .
Die Sphäre der Vektoren X mit |X| = 1 hängt vom benützten Skalarprodukt ab, und damit
auch die Richtung von gradp (f ) . Die Aussage, dass der Gradient in die Richtung der stärksten
Änderung weist, täuscht daher eine Unabhängigkeit vom Skalarprodukt bloß vor.
KAPITEL 3. VEKTORANALYSIS
212
Man beachte, dass
−mc2
1 − |v/c|2 = −mc2 +
m 2
|v| + O |v/c|4 für v/c → 0.
2
Dabei bezeichnet V einen reellen Vektorraum, ·, · ein Skalarprodukt von V mit
√
Abbildung 3.1: − 1 − x2 (rot) und Taylorpolynom −1 + x2 /2
zugehöriger Norm |·| und Kc ⊂ V die offene Kugel um 0 mit Radius c für eine reelle
positive Konstante c, die Lichtgeschwindigkeit. L ist also im ersten Argument, dem
Ort, konstant.
Die Euler-Lagrangegleichung zu L für eine C 2 -Kurve γ : I → V mit |γ̇| < c ist
d
gradγ̇(t) L (γ (t) , ·) = 0.
dt
(3.3)
Es bietet sich nun an, die Funktion f : Kc → R mit L (x, v) = −mcf (v) zu benützen.
Das Gradientenfeld von f =
c2 − |·|2 > 0 erfüllt für alle v ∈ Kc
gradv (f ) =
−gradv |·|2
2
c2 − |v|2
=
−v
.
f (v)
Gleichung (3.3) besagt also, dass
mc
d
dt
γ̇ (t)
f (γ̇ (t))
= 0.
Es gilt nach Quotienten- und Kettenregel
γ̈ (t) f (γ̇ (t)) − γ̇ (t) [γ̈ (t)]γ̇(t) (f)
d γ̇ (t)
=
dt f (γ̇ (t))
f (γ̇ (t))2
=
γ̈ (t) f (γ̇ (t)) + γ̇ (t) γ̈ (t) , γ̇ (t) /f (γ̇ (t))
f (γ̇ (t))2 γ̈ (t) + γ̈ (t) , γ̇ (t) γ̇ (t)
=
.
f (γ̇ (t))2
f (γ̇ (t))3
Gleichung (3.3) ist daher äquivalent zu
f (γ̇ (t))2 γ̈ (t) + γ̈ (t) , γ̇ (t) γ̇ (t) = 0.
(3.4)
KAPITEL 3. VEKTORANALYSIS
213
Bildung des Skalarproduktes von Gleichung (3.4) mit γ̇ (t) ergibt
f (γ̇ (t))2 + |γ̇ (t)|2
γ̈ (t) , γ̇ (t) = c2 γ̈ (t) , γ̇ (t) = 0,
also γ̈ (t) , γ̇ (t) = 0. Berücksichtigung dieser Tatsache in Gleichung (3.4) ergibt
schließlich γ̈ (t) = 0. Die maximalen Lösungen dieser Gleichung sind γ : R → V mit
γ (t) = x0 + v0 t für ein x0 ∈ V und ein v0 ∈ Kc . Wie im newtonschen Fall kann
sich ein freies Teilchen nur mit konstanter Geschwindigkeit bewegen. Neu ist die
Beschränkung der Geschwindigkeit v0 durch |v0 | < c.
Die Hamiltonfunktion H zu L ist (im gegenwärtigen Kontext!) definiert durch
mv
H (x, p (x, v)) = p (x, v) , v − L (x, v) und p (x, v) = gradv L (x, ·) =
.
2
2
1 − |v| /c
Daraus folgt erstens Einsteins Beziehung zwischen Energie und Geschwindigkeit
H (x, p (x, v)) =
mc |v|2
c2 − |v|2
+ mc c2 − |v|2 =
mit der Niederenergieasymptote
mc2
1 − |v/c|2
= mc2 +
m 2
v +O
2
v
c
4
mc2
1 − |v/c|2
für v/c → 0.
Weiters folgt, da die Abbildung p (x, ·) : Kc → V bijektiv ist, für die Hamiltonfunktion H : V × V → R eines kräftefreien relativistischen Massenpunkts
H (x, p) = c m2 c2 + |p|2 .
Dies ist so zu sehen: c m2 c2 + |p|2 =
c m2 c2 +
m2 |v|2
=c
1 − |v/c|2
m2 c2 1 − |v|2 /c2 + m2 |v|2
1 − |v/c|2
=
mc2
2
.
1 − |v/c|
Hier noch die Inversion der relativistischen Abbildung von Geschwindigkeit auf
Impuls.
Lemma 101 Sei V ein endlichdimensionaler Vektorraum mit Norm |·| und seien
m, c ∈ R>0 . Für zwei Vektoren v, p ∈ V gilt
p = mv/
1 − |v/c|2 ⇐⇒ v = p/
m2 + |p/c|2 .
Beweis. Aus p = mv/ 1 − |v/c|2 folgt |p|2 1 − |v/c|2 = m2 |v|2 und weiter
|p|2 = |v|2 m2 + |p/c|2 , also |v|2 = |p|2 / m2 + |p/c|2 . Aus v = (p/m) 1 − |v/c|2
ergibt sich damit
/
, v ,2
p
p
|p/c|2
p
m2
p
, ,
v=
1−, , =
1−
=
=
.
2
2
m
c
m
m m2 + |p/c|
2
m2 + |p/c|
2
m + |p/c|
Der Umkehrschluss geht völlig analog.
KAPITEL 3. VEKTORANALYSIS
3.1.9
214
*Konstante relativistische Kraft
Die Lagrangefunktion L : V × Kc → R eines relativistischen Teilchens in einem
vorgegeben (im gewählten Inertialsystem zeitlich konstanten) Kraftfeld mit Potential
Φ erfüllt
L (x, v) = −mc c2 − |v|2 − Φ (x) .
Die zugehörige Eeuler-Lagrangegleichung ist
mγ̇ (t)
d
dt
2
1 − |γ̇ (t) /c|
(3.5)
= −gradγ(t) Φ.
Der Zusammenhang zwischen Geschwindigkeit und Impuls ist dann wie im Fall
Φ = 0. Die zugehörige Hamiltonfunktion H : V × V → R erfüllt
H (x, p) = c m2 c2 + |p|2 + Φ (x) .
Lösungen der Hamiltonschen Bewegungsgleichung verlaufen innerhalb einer Niveaufläche von H. Daher ist auch die Energie
,
,
2
,
mc
E [γ] :=
+ Φ (x),,
,
1 − |v/c|2
x=γ(t),v=γ̇(t)
einer Lösung γ der Euler-Lagrangegleichung (3.5) unabhängig von t.
Sei nun Φ für ein g ∈ V durch die Linearform Φ : V → R mit Φ (x) = −m g, x
gegeben. Es gilt also
L (x, v) = −mc c2 − |v|2 + m g, x .
Die zugehörige Euler-Lagrangegleichung ist
d
dt
mγ̇ (t)
1 − |γ̇ (t) /c|2
(3.6)
= mg.
Ist γ : I → V eine Lösung dieser Bewegungsgleichung, dann existiert ein Vektor
v0 ∈ V, sodass
γ̇ (t)
= gt + v0 für alle t ∈ I.
(3.7)
1 − |γ̇ (t) /c|2
Daraus folgt nun, dass eine differenzierbare Funktion λ : I → R>0 mit γ̇ (t) =
λ (t) (gt + v0 ) für alle t ∈ I existiert. Gleichung (3.7) ist genau dann erfüllt, wenn
λ (t)
1−
0|
λ (t)2 |gt+v
c2
2
1
= 1 bzw λ (t) =
1+
|gt+v0 |2
c2
für alle t ∈ I.
KAPITEL 3. VEKTORANALYSIS
215
Für die Geschwindigkeit einer Lösung γ : I → V gilt somit
γ̇ (t) =
gt + v0
1+
|gt+v0 |2
c2
für alle t ∈ I.
Man beachte, dass daraus |γ̇ (t)| < c und limt→±∞ |γ̇ (t)| = c folgt. Der Impuls des
Teilchens wächst also unbeschränkt in der Zeit an, nicht aber die Geschwindigkeit.
Ihr Betrag ist durch c begrenzt. Der Vektor v0 stimmt nicht mit der Geschwindigkeit
zur Zeit t = 0 überein, vielmehr gibt mv0 den Impuls zur Zeit t = 0 an.
Die maximalen Lösungen der Euler-Lagrangegleichung (3.6) sind somit die Kurven γ : R → V mit
t
0
t
s
γ (t) = x0 + g
1+
|gs+v0 |
c2
ds + v0
2
0
ds
1+
|gs+v0 |2
c2
für beliebige Vektoren x0 , v0 ∈ V.
Für die maximalen Lösungen zur Anfangsvorgabe v0 = 0 folgt somit
t
γ (t) = x0 + g
0
s
1+
|g|2 2
s
c2
ds.
Diese Kurve erfüllt γ (−t) = γ (t) und ihre Bildmenge ist der Halbstrahl x0 + R≥0 · g.
Mit der Substitution u = |g| s/c ergibt sich γ (t) für g = 0 zu
γ (t) = x0 + g
c2
|g|2
|g|t/c
c2
u
d√
√
du
=
x
+
g
1 + u2 du
0
2
du
1 + u2
|g| 0
0
*
+
c2
2
= x0 + g 2
1 + |tg/c| − 1 .
|g|
|g|t/c
2
c
Für den Abstand zwischen γ (t) und dem Punkt X = x0 − g |g|
2 gilt daher
|γ (t) − X| = c2 / |g|
1 + |tg/c|2 .
Daraus ergibt sich für die Weltlinie {(ct, γ (t)) : t ∈ R} ⊂ R × V die Hyperbelgleichung |γ (t) − X|2 − c2 t2 = c4 / |g|2 .
3.1.10
*Relativistischer harmonischer Oszillator
Die Potentialfunktion Φ : R → R eines harmonischen Oszillators erfüllt Φ (x) =
kx2 /2 für ein k ∈ R>0 . Die Menge aller maximalen Lösungen der Bewegungsgleichung eines nichtrelativistischen harmonischen Oszillators mit der Masse m > 0 und
der Federkonstante k > 0 umfasst bekanntlich die Funktionen xA,B : R → R mit
xA,B (t) = A cos (ωt) + B sin (ωt) für A, B ∈ R und ω = k/m. Jede Lösung ist
ein Vielfaches eines Translats von x1,0 . Der relativistische Fall hat eine weit weniger
durchsichtige Lösungsmenge.
KAPITEL 3. VEKTORANALYSIS
216
Versuchen wir daher wenigstens teilweise Einsichten in die maximalen Lösungen
der (nichtlinearen!) Bewegungsgleichung des relativistischen harmonischen Oszillators zu gewinnen. Zunächst ist es praktisch, den Parameter k durch mω 2 zu ersetzen,
was natürlich nur eine Umbenennung und nichts weiter sonst ist. Dann fällt nämlich
- ähnlich dem nichtrelativistischen Fall - die Masse auch aus der relativistischen Bewegungsgleichung heraus. Es wird sich herausstellen, dass die maximalen Lösungen
dieser Bewegungsgleichung ebenfalls periodisch sind. Die kleinste Periode einer maximalen Lösung, also ihre Schwingungsdauer, ist allerdings, anders als beim nichtrelativistischen Oszillator, abhängig von der Schwingungsamplitude, mit der sie streng
monoton wächst. Die Zeit T = 2π/ω tritt nur als Grenzwert der Schwingungsdauer
für gegen 0 strebende Amplitude auf.
Die Lagrangefunktion sei also für m, ω ∈ R>0 durch L : R × (−c, c) → R mit
L (x, v) = −mc2
1 − (v/c)2 −
mω 2 2
x = −mc2
2
1 − (v/c)2 +
1 ω
x
2 c
2
. (3.8)
gegeben. Man beachte, dass v/c und ωx/c physikalisch dimensionslos sind, dh ihre
Zahlenwerte sind invariant unter beliebigen Änderungen von Längen-, Zeit- und
Masseneinheit.
Die zu L gehörige Hamiltonfunktion H ist H : R × R → R mit
H (x, p) = c (mc)2 + p2 +
mω 2 2
x = mc2
2
1 + (p/mc)2 +
1 ω
x
2 c
2
.
Das zu H gehörige Phasenraumgeschwindigkeitsfeld XH = (∂p H, −∂x H) erfüllt


p/m
, −mω 2 x .
XH (x, p) = 
1 + (p/mc)2
Aus (ẋ, ṗ) = X (x, p) folgt die Phasenraumbewegungsgleichung (in dimensionslosen
aber nichtkanonischen Phasenraumkoordinaten ωx/c und p/mc)
d ω
x =ω
dt c
p/mc
1 + (p/mc)2
und
d
p
ω
= −ω
x .
dt mc
c
Eine Phasenraumkurve γ = (x, p) : I → R2 erfüllt somit genau dann γ̇ = XH ◦ γ,
wenn die zugeordnete dimensionslose Kurve
ω
p (t)
x (t) ,
c
mc
√
das System erster Ordnung η̇ = Y ◦ η mit Y (a, b) = b/ 1 + b2 , −a löst. Daraus
folgt für η 2 =: ξ die DG zweiter Ordnung
η : ω · I → R2 mit η (t) = η 1 (ωt) , η2 (ωt) =
d2
ξ (t) = −
dt2
ξ (t)
1 + ξ (t)
2
.
(3.9)
KAPITEL 3. VEKTORANALYSIS
217
Gleichung (3.9) ist die Bewegungsgleichung eines (nichtlinearen)
1-dimensionalen
√
2 , da ja V ′ (x) =
Oszillators
im
(asymptotisch
linearen)
Potential
V
(x)
=
1
+
x
√
x/ 1 + x2 . Für ihre Lösungen gilt der Erhaltungssatz
2
ξ̇
+
2
d
dt
1 + ξ2
= 0.
Für jede Lösung existiert somit eine Zahl ε > 1, sodass
2
ξ̇
+
2
1 + ξ 2 = ε.
Daraus folgt für eine Lösung ξ : I → R mit ξ̇ (0) > 0 und ξ (0) = 0,
/
√
ξ̇ (t) = 2 ε − 1 + ξ (t)2 für alle t ∈ I.
Für kleinen Impulsbetrag kann H approximiert werden gemäß
H (x, p) = mc2 1 +
1 p
2 mc
2
+
1 ω
x
2 c
2
p
mc
+O
4
für p/mc → 0.
Dementsprechend ist die Newtonsche Asymptote Hnr : R × R → R von H durch
Hnr (x, p) = mc2 1 +
1 p
2 mc
2
+
1 ω
x
2 c
2
= mc2 +
p2
mω 2 x2
+
2m
2
gegeben. Fig. (3.2) zeigt die Niveaulinien von H (rot) und Hnr (grün) mit H =
2mc2 = Hnr mit x in Einheiten von c/ω und p in Einheiten von mc.
y
1.5
1
0.5
0
-1
-0.5
0
0.5
-0.5
1
x
-1
-1.5
Abbildung 3.2: Line H = 2mc2 (rot) und Hnr = 2mc2 (grün)
Die Euler-Lagrangesche Bewegungsgleichung zur Lagrangefunktion (3.8) ist
d
dt
ẋ (t) /c
1 − (ẋ (t) /c)
2
= −ω ·
ω
x (t)
c
(3.10)
KAPITEL 3. VEKTORANALYSIS
218
oder äquivalent dazu
ẍ + ω 2 · 1 − (ẋ/c)2
3/2
(3.11)
· x = 0.
Wachsender Geschwindigkeitsbetrag verkleinert gleichsam die Federkonstante ω,
setzt also die Festigkeit der Feder herab.
Der zu Gleichung (3.11) gehörige Energieerhaltungssatz besagt für jede ihrer
Lösungen x : I → R
mc2
d
dt
1 − (ẋ (t) /c)2
−1/2
+
1 ω
x (t)
2 c
2
= 0 für alle t ∈ I.
(3.12)
Die Größe in der runden Klammer ist somit konstant. Sie ist zudem nichtnegativ.
Wegen 0 < 1 − (v/c)2 < 1 ist der Ausdruck in der runden Klammer größer als 1.
Damit existiert zu jeder Lösung x eine von der Wahl der Lösung abhängige Zahl
ε > 0, sodass
1 − (ẋ (t) /c)2
−1/2
+
1 ω
x (t)
2 c
2
= 1 + ε für alle t ∈ I.
(3.13)
Der zulässige Wertebereich der betrachteten Lösung x √
mit der Energie mc2 √
(1 + ε)
ist damit eingegrenzt auf das Intervall mit ω |x| /c < 2ε. Die Zahl a = c 2ε/ω
gibt die Amplitude einer maximalen Lösung von Gleichung (3.11) an, deren Energie
den Wert mc2 (1 + ε) hat.
Eine Parameterreduktion wird nun durch Übergang von der Lösung x zur dimensionslosen Funktion y : ω · I → R mit y (ωt) = ωx (t) /c erzielt. Die Funktion y
erfüllt dann wegen ẋ (t) /c = y ′ (ωt) auf ihrem Definitionsbereich ω · I
d
dτ
y ′ (τ )
1−
y′
2
(τ )
(3.14)
= −y (τ )
oder äquivalent dazu
y ′′ + 1 − y ′2
3/2
(3.15)
y = 0.
Die Energieerhaltung nimmt auf ω · I die parameterreduzierte Form
1
1 − y ′2
+
y2
=1+ε
2
(3.16)
√
an. Die Funktion y ist dadurch auf den Wertebereich |y| < 2ε =: α eingegrenzt.
−1/2
Fig. (3.3) zeigt die kinetische Energie (1 − y ′2 )
− 1 samt ihrem Taylorpolynom
y ′2 /2 an der Stelle 0.
In einer hinreichend kleinen Umgebung eines Punktes τ 0 mit y ′ (τ 0 ) > 0 ist (3.16)
äquivalent zur expliziten autonomen DG erster Ordnung vom Typ der separierten
Variablen y ′ = h (y) mit h : (−α, α) → R>0 und
h (y) =
−2
1 − (1 + ε − y 2 /2)
=
(1 + ε − y 2 /2)2 − 1
1 + ε − y 2 /2
.
(3.17)
KAPITEL 3. VEKTORANALYSIS
219
y
1.25
1
0.75
0.5
0.25
0
-1
-0.5
0
0.5
1
x
Abbildung 3.3: Kinetische Energie (1 − v 2 )
−1/2
− 1 und Taylorpolynom v 2 /2 (gün)
Es gilt also limy→α h (y) = 0. Die Funktion 1/h ist über das Intervall (0, α) integrierbar. Daher wird der Umkehrpunkt y = α in endlicher Zeit erreicht und die
maximalen Lösungen von Gleichung (3.15) sind periodisch.
Die analoge Differentialgleichung des nichtrelativistischen Oszillators ergibt sich
aus der Niederenergieasymtote an Gleichung (3.16). Letztere besagt, dass
y ′2 + y 2 = 2ε.
Daraus folgt in einer hinreichend kleinen Umgebung eines Punktes τ 0 mit y ′ (τ 0 ) > 0
die explizite Differentialgleichung y ′ = 2ε − y 2 .
Fig. (3.3) lässt somit vermuten, dass die maximale Lösung von y ′ = h (y) bei
jeder Auslenkung y eine kleinere Geschwindigkeit y ′ hat, als die maximale Lösung von y ′ = 2ε − y 2 . Daher sollte die Dauer einer relativistischen Oszillatorschwingung größer sein als die des nichtrelativistischen Oszillators gleicher Amplitude und
Frequenzkonstante ω. Problem: Zeige h (y) < 2ε − y 2 für alle
√ gleicher
√
y ∈ − 2ε, 2ε .
Fig. (3.4) zeigt für ε = 1 die Menge aller Punkte (y, y ′ ) mit y ′ = ±h (y) in
rot und die Menge aller Punkte (y, y ′ ) mit y ′ = ± 2ε − y 2 in grün. Es sind dies
Niveaulinien der jeweiligen Energiefunktionen von Auslenkung und Geschwindigkeit.
Die Auswirkung der relativistischen Geschwindigkeitsschranke ist klar ersichtlich.
Die Schwingungsdauer des nichtrelativistischen Oszillators
ergibt sich wie folgt.
√
mit z = y/ 2ε ∈ (−1, 1) äquivalent zur
Die Differentialgleichung y ′ = 2ε − y 2 ist √
parameterfreien Differentialgleichung z ′ = 1 − z 2 . Die maximale Lösung der DG
für z zur Anfangsvorgabe z (0) = 0 ist die Funktion
z : (−π/2, π/2) → (−1, 1) mit z (x) = sin x.
Damit folgt für die Schwingungsdauer
Tnr der Lösungen von y ′′ + y = 0 unabhängig
√
von der Amplitude 2ε, dass Tnr = 2π.
Was lässt sich über die maximale Lösung η von y ′ = h (y) zur Anfangsvorgabe
KAPITEL 3. VEKTORANALYSIS
220
y'
1
0.5
0
-1
-0.5
0
0.5
1
y
-0.5
-1
Abbildung 3.4: Linien mit ε = 1 : relativistisch (rot), nichtrelativistisch (grün)
√
√
η (0) = 0 schließen? Für alle τ mit |η (τ )| < α = 2ε folgt mit s = y/ 2
√ √
η(τ )
η(τ )/ 2
dy
2 (1 + ε − s2 ) ds
=
τ=
.
h (y)
2
0
0
2
(1 + ε − s ) − 1
(3.18)
Da h eine gerade Funktion ist, ist η auf dem Intervall (−τ 0 , τ 0 ) definiert, wobei
√
ε
√
2
1 + ε − s2
0
(1 + ε −
s2 )2
ds = τ 0
−1
gilt. Aus Symmetriegründen ist die Zeit T = 4τ 0 /ω die Schwingungsdauer der
Lösung x von Gleichung (3.11) mit x (t) = cη (ωt) /ω. Man beachte auch, dass
η ′ (0) = h (0) = ε (2 + ε)/ (1 + ε) .
Eine weitere Umformung
der Bestimmungsgleichung (3.18) für η ergibt sich mit
√
der Substitution s = ε sin θ. Damit folgt für alle τ ∈ (−τ 0 , τ 0 )
√
τ = 2ε
arcsin
0
η(τ )
√
2ε
(1 + ε cos2 θ) cos θdθ
(1 + ε cos2 θ)2 − 1
Für τ 0 folgt
π/2
τ0 =
0
arcsin
=
0
η(τ)
√
2ε
1 + ε cos2 θ
dθ.
1 + 2ε cos2 θ
1 + ε cos2 θ
dθ.
1 + 2ε cos2 θ
Zur Kontrolle dieses Ergebnisses für τ 0 wird nun der nichtrelativistische Grenzfall
ε → 0 betrachtet. Es sollte limε→0 τ 0 = π/2 gelten. Tatsächlich folgt für ε → 0
π/2
1 + ε cos2 θ
dθ =
1 + 2ε cos2 θ
τ0 =
0
π/2
=
0
π/2
1 + ε cos2 θ
0
3
1 + ε cos2 θ + O ε2 cos4 θ
4
1−
dθ =
π
2
ε
cos2 θ + O ε2 cos4 θ
4
3
1 + ε + O ε2
8
.
dθ
KAPITEL 3. VEKTORANALYSIS
221
Eine weitere Kontrolle gibt der hochenergetische Grenzfall ε → ∞, bei dem der
Oszillator sich entlang des Großteils seines Weges mit nahezu
√ Lichtgeschwindigkeit
bewegt. Dann sollte τ 0 sich dem Wert der Amplitude α = 2ε zunehmend nähern.
Tatsächlich gilt
τ0
=
lim √
ε→∞
2ε
π/2 √1
2ε
lim
ε→∞
lim
=
ε→∞
0
ε
2
cos2 θ
1 + 2ε cos2 θ
0
π/2
+
1
ε
+ cos2 θ
2
ε
+ cos2 θ
π/2
dθ = lim
ε→∞
0
1
ε
+ cos2 θ
2
ε
dθ
+ cos2 θ
π/2
cos θdθ = 1.
dθ =
0
Fig. (3.5) zeigt in schwarz die Abbildung α → τ 0 , also die Dauer einer Viertelperiode
√ der maximalen Lösung η von Gleichung (3.15) als Funktion ihrer Amplitude
α = 2ε. Rot eingezeichnet ist die Hochenergieasymtote α → α und in grün die
zwei Niederenergieasymptoten α → π/2 und α → (π/2) (1 + 3α2 /16) .
5
3.75
2.5
1.25
0
0
1.25
2.5
3.75
5
a
Abbildung 3.5: α → τ 0 mit Asymptoten für α → ∞ (rot) und für α → 0 (grün)
Eine graphische Konstruktion der Abbildung τ → η (τ ) für gegebenen Wert ε
gelingt mit einem Bild, das den Funktionsgraphen von
ϕ
1 + ε cos2 θ
dθ
1 + 2ε cos2 θ
0
√
zusammen mit dem Graphen der Funktion ϕ → S (ϕ) = 2ε sin ϕ jeweils über dem
Bereich 0 < ϕ < π/2 enthält. Fig. (3.6) zeigt den Fall ε = 1, wobei ϕ in Einheiten
von π/2 angegeben ist. Wählt man nun am Graphen der
√ Funktion R einen Punkt
(ϕ (τ ) , τ ) , so ist am ’darunter liegenden’ Punkt ϕ (τ ) , 2ε sin ϕ (τ ) des Graphen
√
von S offenbar der Wert 2ε sin ϕ (τ ) = η (τ ) abzulesen. Gemäß Fig. (3.6) erreicht
die Lösung für ε = 1 zur Zeit τ = 3/2 ungefähr eine Auslenkung von η (1, 5) = 1, 2.
Die implizite Bestimmungsgleichung des funktionalen Zusammenhanges zwischen
τ und η (τ ) enthält das Integral R (ϕ) und ist mit 0 < ϕ < π/2 äquivalent
√ zur Parametrisierung der Weltlinie {(τ , η (τ )) : 0 < τ < τ 0 } durch ϕ → R (ϕ) , 2ε sin ϕ .
ϕ → R (ϕ) =
KAPITEL 3. VEKTORANALYSIS
222
2
1.8
1.6
1.4
1.2
1
0.8
0.6
0.4
0.2
0.9802
Abbildung 3.6: Bewegung eines relativistischen Oszillators
Das Integral R (ϕ) kann auf tabellierte Integrale zurückgeführt werden. Und zwar
so:
ϕ
ϕ
2 + ε cos2 θ − 1
dθ
=
2
R (ϕ) =
1 + 2ε cos2 θ
0
0
/
ϕ
ε
= 2
1 − sin2 θ dθ −
1+
2
0
/
0
1+
ϕ
ε
cos2 θdθ −
2
ϕ
0
dθ
1+
ε
2
dθ
1 + 2ε cos2 θ
2
.
1 − sin θ
Für den ersten Summanden gilt mit k = ε/ (2 + ε) ∈ (0, 1)
/
√
ϕ
ε
2+ε
2
1 − sin θ dθ = √ E (ϕ, k) und E (ϕ, k) =
1+
2
2
0
ϕ
1 − k 2 sin2 θdθ.
0
Für den zweiten Summanden gilt
/
ϕ
dθ
2
=
F (ϕ, k) und F (ϕ, k) =
2+ε
0
1 + ε 1 − sin2 θ
ϕ
0
2
dθ
1 − k 2 sin2 θ
.
Somit gilt für 0 < ϕ < π/2 mit k = ε/ (2 + ε) und mit dem unvollständigen
elliptischen Integral erster Art F bzw zweiter Art E (beide in Legendre Form)
R (ϕ) =
aus
√ √
F (ϕ, k)
2
2 + εE (ϕ, k) − √
2+ε
.
Das Taylorpolynom vom Grad 1 der Abbildung ε → R (ϕ) bei ε = 0 ergibt sich
ϕ
ϕ
3
1 + ε cos2 θ
dθ
=
1
+
ε cos2 θ + O ε2 cos4 θ
ε
2θ
4
1
+
cos
0
0
2
ϕ
3
cos2 θdθ + O ε2 cos4 θ
= ϕ+ ε
4 0
R (ϕ) =
dθ
KAPITEL 3. VEKTORANALYSIS
zu
3
R1 (ϕ) = ϕ + ε
4
ϕ
0
223
3ε
1
(1 + cos (2θ)) dθ = ϕ +
2
8
ϕ+
sin (2ϕ)
2
.
√
Die Viertelperiode der Weltlinie ϕ → R1 (ϕ) , η (ϕ) / 2ε = (R1 (ϕ) , sin (ϕ))
mit 0 < ϕ < π/2 zu ε = 0, 1 ist zusammen mit der Newtonschen Weltlinie
ϕ → (ϕ, sin (ϕ)) in Fig. (3.7) dargestellt. Der Newtonsche Oszillator benötigt für
die Viertelperiode eine sichtbar kürzere Zeit.
Abbildung 3.7: Oszillator nach Newton (grün), relativistisch (rot)
3.1.11
Basisdarstellung eines Gradienten
Wie lässt sich der Gradient eines Skalarfeldes als Linearkombination der Elemente
irgendeiner Basis von V darstellen?
Satz 102 Sei U ⊂ V offen und f : U → R sei differenzierbar. Sei e = (e1 , ..., en)
eine Basis von V mit der Gramschen Matrix Ge . Ihre Inverse wird oben indiziert.8
Dann gilt
n
ij
ei G−1
e
grad (f) =
∂je f.
(3.19)
i,j=1
&
'
Beweis. Gemäß Definition 100 gilt gradp (f ) , X = dp f (X) für alle X ∈ V.
Somit folgt gemäß der einleitend beschriebenen Konstruktion des Vektors l zu einer
Linearform L, dass
n
ei G−1
e
gradp (f ) =
ij
dp f (ej ) .
i,j=1
∂je f
Mit dp f (ej ) =
folgt die Behauptung.
Es ist aufschlussreich, zu verifizieren, dass Gleichung (3.19) tatsächlich für jede
Basis von V gilt, wenn sie für eine gilt. Sei b eine weitere Basis von V mit e =
8
Es gilt also
n
k=1
G−1
e
ik
Ge
kj
=
δ ij
=
1 für i = j
.
0 sonst
KAPITEL 3. VEKTORANALYSIS
224
b · M. (Ausführlicher: ei = nj=1 bj M ji ) Dann folgt Ge = M t · Gb · M. Angenommen
Gleichung (3.19) gilt für die Basis e. Mit der Zeile [e] f = ([e1 ] f, ..., [en ] f ) ist diese
t
Gleichung wegen [ei ] f = ∂ie f zu grad(f ) = e · G−1
e · [e] f äquivalent. Wegen der
Linearität des Differentials dp f gilt
n
n
bj M ji
df (ei ) = df
M ji df (bj ) .
=
j=1
j=1
Als Matrixgleichung gilt somit [e] f = [b] f · M. Daraus folgt
grad(f) = b · M · M t · Gb · M
−1
t
= b · M · M −1 · G−1
b · M
· [b] f · M
−1
t
t
· M t · [b] f t = b · G−1
b · [b] f .
Im Fall V = Rn×1 und der Standardbasis e folgt grad (f ) =
3.1.12
∂f
∂f t
, ..., ∂x
n
∂x1
.
Faulenzerregeln zum Gradienten
Die folgenden einfach zu beweisenden Regeln dienen der Arbeitsersparnis. Seien f, g
differenzierbare Skalarfelder auf U ⊂ V (offen) und λ ∈ R. Weiter sei F : D → R
differenzierbar mit f (U) ⊂ D ⊂ R und D offen. Dann gilt für p ∈ U
1. grad(f + λg) = grad(f ) + λ grad(g),
2. grad(f · g) = grad(f ) · g + f · grad(g),
3. gradp (F ◦ f) = F ′ (f (p)) · gradp (f ) .
Weitere 9 Regeln ergeben sich für umskalierte, translahierte und gedrehte differenzierbare Skalarfelder f mit Definitionsbereich U. In solchen Fällen seien
für ξ ∈ V und λ > 0 die Skalarfelder (Dλ f ) (p) := f (λp) auf U ′ := λ1 · U,
Tξ f (p) := f (p − ξ) auf U ′ := U + ξ und (Rf ) (p) := f (R−1 p) auf U ′ := R (U)
mit R : V → V einer n-dimensionalen Drehspiegelung. Dann gelten für p ∈ U ′
die folgenden Regeln, oft als Kovarianzregeln bezeichnet.
4. gradp (Dλ f ) = λ · gradλp (f ) (Dilatation),
5. gradp (Tξ f ) = gradp−ξ (f ) (Translation),
6. gradp (Rf ) = R gradR−1 p (f) (Drehspiegelung).
9
Diese Regeln folgen aus Spezialfällen der Kettenregel für Differentiale. Seien f : U → R und
g : U ′ → U mit U, U ′ ⊂ V offen. Für differenzierbare f und g gilt die Kettenregel
dp (f ◦ g) = dg(p) f ◦ dp g.
Durch Dualisieren dieser Formel mit dem Skalarprodukt gelangt man zu den drei angeführten
Regeln. Dabei gehen Linearität und On -Invarianz des Skalarproduktes ein.
KAPITEL 3. VEKTORANALYSIS
225
Ein Beispiel zu Regel 4: Sei f : V
wegen grad (r) = ιd/r
0 → R mit f = rα für ein α ∈ R. Dann gilt
grad (f ) = αrα−1 ·
3.1.13
ιd
= αrα−2 · ιd.
r
Gradientenfeld des Punktdipolpotentials
Für dim V = 3 ist das elektrostatische Potential eines Punktdipols mit Dipolmoment
δ ∈ V durch Φ (p) = γ δ, p / |p|3 mit γ = 1/4πε0 gegeben. Bei beliebiger Dimension
von V liefern Produkt- und Kettenregel ohne Umwege über Koordinaten
gradp (Φ) = γ
δ
δ, p
p
3 −3
4 ·
|p|
|p|
|p|
für p ∈ V
0.
Das elektrische Feldstärkefeld E : V
0 → V eines Punktdipols, der im Punkt 0
lokalisiert ist, erfüllt somit (im Fall dim V = 3)
E (p) = −gradp (Φ) =
3.1.14
γ
|p|3
3
δ, p
p−δ .
|p|2
Gradientenfeld des Polarwinkels
Sei V = R1×2 mit den Standardkoordinatenfunktionen x, y. Auf der geschlitzten
Ebene U := {(a, b) ∈ R1×2 | b = 0 ⇒ a < 0} sind die Polarkoordinatenfunktionen
r : U → R>0 und φ : U → (0, 2π) ⊂ R implizit durch x = r cos φ, y = r sin φ
definiert. Es gilt wegen r > 0, dass r = x2 + y 2 und somit gradp (r) = p/r(p)
für p ∈ U . Aus den impliziten Definitionsgleichungen für r und φ folgt auf U durch
Gradientenbildung
(1, 0) = grad (x) = grad (r) cos (φ) − r sin (φ) grad (φ) ,
(0, 1) = grad (y) = grad (r) sin (φ) + r cos (φ) grad (φ) .
Multiplikation der ersten Gleichung mit − sin φ und der zweiten mit cos φ und anschließender Addition der beiden Gleichungen ergibt auf U
r · grad (φ) = (− sin φ, cos φ) =
1
(−y, x) .
r
Daraus folgt auf U, dass grad (φ) = r12 (−y, x) . Siehe Fig 3.8.
Das Vektorfeld grad (φ) ist auf U ein Vielfaches des Drehvektorfeldes der Ebene.
Es steht senkrecht auf die Niveauflächen von φ, die von 0 ausgehende Halbstrahlen
sind. Der Betrag von grad (φ) nimmt mit der Entfernung von 0 ab: |grad (φ)| = 1/r.
Für V = R1×3 mit den Standardkoordinatenfunktionen x, y, z sind die Zylinderkoordinatenfunktionen (r, φ, z) auf U := {(a, b, c) ∈ R1×3 | b = 0 ⇒ a < 0} implizit
durch (x, y, z) = (r cos φ, r sin φ, z) definiert. Ähnlich wie im Fall der Ebene folgen
r = x2 + y 2 und grad (r) = (x, y, 0) /r auf U. Der Gradient des Polarwinkels φ
KAPITEL 3. VEKTORANALYSIS
226
Abbildung 3.8: Gradientenfeld des Polarwinkels
ergibt sich zu grad (φ) = (−y, x, 0) /r2 . Das Vektorfeld grad (φ) hat eine stetige Fortsetzung von U auf R1×3 R·e3 . Es gilt dort nämlich X = r−2 (−y, x, 0) = r−2 L. Das
Feld X ist tangential an die Ebenen senkrecht zur Drehachse und L bezeichnet das
Drehvektorfeld um die Achse R·e3 .
Das magnetische Flussdichtefeld eines unendlich langen den Strom I führenden
0I
X gegeben.
Drahtes der Dicke 0, der auf der Achse R·e3 positioniert ist, ist durch µ2π
Ähnlich idealisierend gibt vRX die lokalen Windgeschwindigkeiten eines Wirbelsturms wieder.10 Die Summe bzw Differenz des Translates von X um e1 = (1, 0, 0)
und des Translates von X um −e1 gibt das magnetische Flussdichtefeld zweier paralleler Drähte, die von Strömen derselben bzw gegengesetzter Richtung und gleicher
Stärke durchflossen sind. Sie werden von Fig. (3.9) bzw (3.10) gezeigt.
Abbildung 3.9: B-Feld paralleler Stromfäden
10
Daher heißt das Vektorfeld X in der Strömungslehre „freier“ Wirbel (Vortex). Natürlich wächst
die Geschwindigkeit bei Annäherung an die Drehachse eines Hurricans nicht wirklich unbeschränkt
an. Vielmehr ist vRX nur in einem äußeren Bereich r > R zutreffend. Im Innenbereich r < R gilt
ungefähr vL/R. Der Geschwindigkeitsbetrag steigt also für r < R linear mit dem Abstand r zur
Wirbelachse. Bei r = R ist die Windgeschwindigkeit maximal.
KAPITEL 3. VEKTORANALYSIS
227
Abbildung 3.10: B-Feld antiparalleler Stromfäden
Existiert zum Vektorfeld X ein Skalarfeld f auf R1×3 R·e3 , sodass X = grad (f)
gilt? Ein Skalarfeld, dessen Gradientenfeld mit einem vorgegebenen Vektorfeld übereinstimmt, heißt ein Potential des Vektorfeldes. Der Abschnitt über konservative
Vektorfelder wird zeigen, dass es zu X eine solche Funktion f nicht gibt.11
3.1.15
*Gradient zur Minkowskigeometrie
Bisher wurde das Gradientenvektorfeld für differenzierbare Skalarfelder auf offenen Teilmengen eines enlichdimensionalen, reellen Vektorraums V formuliert. Der
entscheidende Sachverhalt bei der Bildung des Gradienten einer Funktion f in einem Punkt p aus dem Differential dp f ist die Tatsache, dass zu einer Linearform
L : V → R und einem Skalarprodukt ·, · : V × V → R genau ein Vektor l ∈ V
existiert, sodass L (X) = l, X für alle X aus V gilt. Dazu wird die Inverse der
Gramschen Matrix Ge von ·, · zu irgendeiner Basis e von V benötigt.
Für ein Skalarprodukt gilt det Ge > 0, da v, v > 0 für alle v ∈ V 0. Für die
Invertierbarkeit von Ge reicht es aber nach dem folgenden Lemma aus, dass ·, · eine
nicht ausgeartete symmetrische Bilinearform ist. Eine symmetrische Bilinearform
·, · : V × V → R heißt nicht ausgeartet, wenn aus v, w = 0 für alle w ∈ V folgt
dass v = 0.
Lemma 103 Ist Ge die Gramsche Matrix einer symmetrischen nicht ausgearteten
Bilinearform, dann gilt det Ge = 0.
Beweis. Ge ist als symmetrische Matrix diagonalisierbar und in der Diagonale
stehen die Eigenwerte von Ge . Aus det Ge = 0 folgt, dass 0 Eigenwert von Ge ist.
t
Sei (v01 , . . . v0n ) ∈ Rn×1 ein Eigenvektor von Ge zum Eigenwert 0. Dann folgt für alle
w ∈ V mit v0 = ni=1 v0i ei
v0 , w = w, v0 = w1 , . . . wn · Ge · v01 , . . . v0n
11
t
= 0.
Trotzdem wird X auch als „Potentialwirbel“ bezeichnet, weil X eben überall mit Ausnahme
einer Halbebene mit dem Gradientenfeld von φ übereinstimmt.
KAPITEL 3. VEKTORANALYSIS
228
t
Dies bedingt nun v0 = 0 im Widerspruch zur Annahme, dass (v01 , . . . v0n ) ein Eigenvektor von Ge ist.
Damit ist die folgende Verallgemeinerung des Gradienten möglich.
Definition 104 Ist ·, · : V × V → R bilinear, symmetrisch und nicht ausgeartet,
dann heißt der Vektor gradp (f ) mit dp f (X) = gradp (f ) , X für alle X ∈ V der
Gradient in p des in p differenzierbaren Skalarfeldes f : V ⊃ U → R bezüglich ·, · .
Dabei ist U offen in V und p ∈ U.
Offenbar zerfällt auch der verallgemeinerte Gradient nach einer Basis von V
gemäß
n
ei (Ge )−1
gradp (f) =
ij
∂je f (p) .
i=1
Die spezielle Realtivitätstheorie nutzt beispielsweise eine Minkowskische Pseudometrik, eine nicht ausgeartete symmetrische Bilinearform ·, · : V × V → R, deren
Gramsche Matrix genau einen positiven Eigenwert besitzt. Für diese Pseudometrik
existieren daher Normalbasen e = (e0 , e1 , . . . en ) mit

 1 für i = j = 0
e
−1 für i = j ∈ {1, . . . n} .
Gij = ei , ej =

0 sonst
Bezüglich einer NB e gilt daher mit den partiellen Ableitungen des Kartenausdrucks
von f in den kontravarianten Koordinaten zu e
n
gradp (f ) = (∂0 fe ) (p) · e0 −
i=1
(∂i fe ) (p) · ei .
Im folgenden Abschnitt wird die Symmetrie der Bilinearform ·, · durch Antisymmetrie ersetzt. Auch in diesem Fall kann ein Gradient gebildet werden, soferne
nur die Bilinearform nicht ausgeartet ist.
3.1.16
*Symplektischer Gradient - Hamiltons Vektorfeld
Sei V ein reeller Vektorraum gerader Dimension. Auf V sei eine schiefsymmetrische
bilineare Abbildung ω : V ×V → R gewählt. Es gilt also ω (v, w) = −ω (w, v) für alle
v, w ∈ V. Überdies sei ω nicht ausgeartet, dh, wenn ω (v, x) = 0 für alle x ∈ V gilt,
dann folgt v = 0. Eine solche Abbildung ω heißt symplektische Form. Ähnlich wie
mit einem Skalarprodukt von V der Gradient eines Skalarfeldes gebildet wird, kann
mit ω ein ’symplektischer Gradient’ eines Skalarfeldes gebildet werden. Er regelt
als Hamiltonsches Vektorfeld die Bewegung eines mechanischen Systems durch ein
System von gewöhnlichen Differentialgleichungen erster Ordnung.
Lemma 105 Ist ω eine symplektische Form auf V, dann existiert eine Basis e =
(e1 , . . . en , en+1 , . . . e2n ) von V mit ω (ei , ej ) = ω (en+i , en+j ) = 0 und ω (ei , en+j ) = δ ij
für alle i, j ∈ {1, . . . n} , eine sogenannte symplektische Normalbasis (SNB).
KAPITEL 3. VEKTORANALYSIS
229
Beweis. Der Beweis nutzt die Jordansche Normalform einer schiefsymmetrischen
reellen Matrix.
Lemma 106 Ist ω eine symplektische Form auf V und ist L : V → R linear, dann
existiert genau ein l ∈ V, sodass L (v) = ω (l, v) für alle v ∈ V. Ist e eine SNB von
V, dann gilt l = ni=1 (L (en+i ) · ei − L (ei ) · en+i ) .
Beweis. Dazu ist erstens zu prüfen, dass L (ej ) = ω (l, ej ) und L (en+j ) =
ω (l, en+j ) für alle j ∈ {1, . . . n} gilt:
n
n
ω (l, ej ) =
i=1
n
ω (l, en+j ) =
i=1
[L (en+i ) ω (ei , ej ) − L (ei ) ω (en+i , ej )] =
L (ei ) δ ji = L (ej ) ,
i=1
[L (en+i ) ω (ei , en+j ) − L (ei ) ω (en+i , en+j )] = L (en+j ) .
Ist l′ ein weiterer Vektor mit L (ej ) = ω (l′ , ej ) und L (en+j ) = ω (l′ , en+j ) für alle
j ∈ {1, . . . n} , dann folgt ω (l′ − l, v) = 0 für alle v ∈ V und somit l′ − l = 0. Damit
ist die Eindeutigkeit von l gezeigt.
Definition 107 Ist U ⊂ V offen und das Skalarfeld H : U → R differenzierbar,
dann heißt das Vektorfeld XH : U → V, das in jedem Punkt p ∈ U die Bedingung
dv H (·) = ω (XH (v) , ·) erfüllt, das Hamiltonsche Vektorfeld zu H.
Eine Integralkurve γ eines Hamiltonschen Vektorfeldes XH erfüllt γ̇ = XH ◦ γ.
Wegen (H ◦ γ)′ (t) = dγ(t) H (XH (γ (t))) = ω (XH (γ (t)) , XH (γ (t))) = 0 ist H ◦ γ
eine konstante Abbildung und XH (v) ist in v tangential an die Niveaufläche von H
durch v. Man sagt daher: H ist unter der Evolution zu XH ’erhalten’.
Satz 108 Ist e eine SNB von V und das Skalarfeld H : U → R differenzierbar,
e
dann gilt XH = ni=1 ∂n+i
H · ei − ∂ie H · en+i .
Beweis. Zu zeigen ist für alle j ∈ {1, . . . n} , dass dv H (ej ) = ω (XH (v) , ej ) und
dv H (en+j ) = ω (XH (p) , en+j ) . Nun gilt aber für alle j ∈ {1, . . . n} einerseits
dv H (ej ) = ∂je H (v) ,
e
dv H (en+j ) = ∂n+j
H (v)
und andererseits
n
ω (XH (v) , ej ) =
i=1
n
− (∂ie H) (v) ω (en+i , ej ) = ∂je H (v) ,
e
e
∂n+i
H (v) ω (ei , en+j ) = ∂n+j
H (v) .
ω (XH (v) , en+j ) =
i=1
KAPITEL 3. VEKTORANALYSIS
230
Unter Verwendung der kontravarianten Karte Φe ≡ (q 1 , . . . q n , p1 , . . . pn ) zu einer
SNB e von V ist das System γ̇ = XH ◦ γ offenbar äquivalent zu
,
,
d i
d i
q ◦ γ (t) = ∂pi H ,γ(t) und
p ◦ γ (t) = − ∂qi H ,γ(t)
dt
dt
für alle i ∈ {1, . . . n} , den Hamiltonschen Bewegungsgleichungen zu H.
Für die Änderung eines differenzierbaren Skalarfeldes f : U → R entlang einer
Integralkurve γ : I → U des Hamiltonschen Vektorfeldes XH gilt mit γ (t) = v
d (f ◦ γ)
(t) = dv f (γ̇ (t)) = dv f (XH (v)) = dv f
dt
n
e
∂n+i
H
v
i=1
ei − (∂ie H)v en+i
n
e
H
∂n+i
=
v
i=1
e
(∂ie f)v − (∂ie H)v ∂n+i
f
v
.
Definition 109 Sei U ⊂ V offen und f, g : U → R differenzierbar. Das Skalarfeld
{f, g} : U → R mit {f, g} (v) = [Xg ]v f = dv f (Xg (v)) = ω (Xf (v) , Xg (v)) heißt
Poissonklammer von f mit g.
Für differenzierbare f, g : U → R mit offenem U ⊂ V folgt also {f, g} =
ω (Xf , Xg ) = − {g, f } und bezüglich der kontravarianten Karte zu einer SNB gilt
n
{f, g} =
i=1
∂f ∂g
∂f ∂g
−
∂q i ∂pi ∂pi ∂q i
.
Das oben abgeleitete Resultat für die Änderung eines Skalarfeldes entlang einer
Integralkurve eines Hamiltonschen Vektorfeldes lässt sich wie folgt zusammenfassen.
Satz 110 Für eine Integralkurve γ des Hamiltonschen Vektorfeldes XH und ein
differenzierbares Skalarfeld f : U → R, dessen offener Definitionsbereich U das Bild
von γ enthält, gilt (f ◦ γ)′ = {f, H} ◦ γ.
Ein Skalarfeld f mit {f, H} = 0 ist eine Erhaltungsgröße der Dynamik zu H, da
jede Integralkurve von XH innerhalb einer Niveaumenge von f verläuft. Insbesondere
ist H selbst eine Erhaltungsgröße unter der Dynamik zu H.
3.2
Differenzieren von Vektorfeldern
Vektorfelder eignen sich zur Darstellung von mehrdimensionalen Größen auf einem
vorgegeben Raum, wenn diese sich von Punkt zu Punkt ändern. So ordnet etwa
die Wellenfunktion eines Elektrons jedem Raumzeitpunkt (t, x) ∈ R × R3 in einem
reellen Vektorraum einen Punkt Ψ (t, x) im komplexen Vektorraum C2 zu. Einen
wichtigen Spezialfall geben die Tangentenvektorfelder, die jedem Punkt einer (offenen) Teilmenge eines Vektorraums V einen Vektor im selben Raum V zuweist. Man
denke etwa an das Geschwindigkeitsfeld einer strömenden Flüssigkeit. Es gibt für jeden Punkt des flüssigkeitgefüllten Raumgebietes linear nähernd seine Verschiebung
in diesem Raum während einer kurzen Zeitspanne an. Im Folgenden werden nur
mehr Tangentenvektorfelder behandelt und die Bezeichnung zu Vektorfeld verkürzt.
KAPITEL 3. VEKTORANALYSIS
3.2.1
231
Differential und Richtungsableitung
Ganz ähnlich wie bei Skalarfeldern kann auch bei Vektorfeldern auf offenen Teilmengen eines Vektorraums nach Richtungsableitungen und Differential gefragt werden.
Wir beschränken uns hier auf differenzierbare Vektorfelder X.
Definition 111 Ein Vektorfeld X : U → V, für das in jedem Punkt p seines (in V
offenen) Definitionsbereiches U eine lineare Abbildung dp X : V → V existiert, sodass
die in einer hinreichend kleinen offenen Umgebung von 0 ∈ V definierte Abbildung
ψ p mit X (p + h) = X (p) + dp X (h) + ψ p (h) die Eigenschaft limh→0 ψ p (h) / h = 0
hat, heißt differenzierbar. Die Abbildung dp X heißt das Differential oder die Tangentialabbildung von X in p.
Für ein lineares Vektorfeld X : V → V gilt offenbar X (p + h) = X (p) + X (h) ,
sodass dp X (h) = X (h) für alle p, h ∈ V folgt.
Wie ist der Vektor [h]p X = dp X (h) ∈ V, die Richtungsableitung von X in p
unter h in den Koordinaten zu einer Basis von V zu ermitteln? Sei U ⊂ V offen
und X : U → V ein C 1 -Vektorfeld. e = (e1 , . . . en ) bezeichnet eine Basis von V und
X = ni=1 X i ei definiert die Komponentenfunktionen von X zu dieser Basis. Es gilt
also X i ≡ Xei . Dann ist durch
1
[X (p + εei ) − X (p)] =
ε→0 ε
n
n
[ei ]p X = lim
j=1
[ei ]p X j · ej =
∂ie X j
j=1
p
· ej
die Richtungsableitung von X mit dem Vektor ei definiert. Etwas allgemeiner geht
es wie folgt.
Definition 112 Für ein C 1 -Vektorfeld X mit offenem Definitionsbereich U ⊂ V
und ein Vektorfeld Y : U → V heißt das Vektorfeld [Y ] X, das in p ∈ U den Wert
X (p + εY (p)) − X (p)
ε→0
ε
[Y (p)]p X = dp X (Y (p)) = lim
hat, Feld der Richtungsableitung oder kovariante Ableitung von X mit dem Vektorfeld Y. Statt [Y (p)]p X wird auch [Y ]p X oder (∇Y X) (p) notiert.
Ist das Vektorfeld X die Einschränkung einer linearen Abbildung auf U, dann
folgt aus der Definition von [Y ] X unmittelbar [Y ] X = X ◦ Y. In komplizierteren
Fällen kann die Richtungsableitung [Y ] X unter Zuhilfenahme einer Basis von V
berechnet werden gemäß
n
[Y ]p X =
n
[Y ]p X
j=1
j
Y i (p) ∂ie X j
ej =
i,j=1
p
· ej .
Die beiden folgenden Produktregeln sind ebenfalls brauchbare Rechenhilfen.
KAPITEL 3. VEKTORANALYSIS
232
Satz 113 Seien f : U → R und X, Y : U → V mit U ⊂ V offen vom C 1 -Typ.
Weiter seien Z : U → V und ein Skalarprodukt ·, · von V gewählt. Dann gilt
[Y ] (f · X) = ([Y ] f ) · X + f · ([Y ] X) und [Z] X, Y = [Z] X, Y + X, [Z] Y .
Sollen Tangentenvektorfelder differenziert werden, die auf gekrümmten Mannigfaltigkeiten wie einer Kugeloberfläche definiert sind, dann versagt die hier beschriebene Konstruktion von Richtungsableitung und Differential. Es muss eine Vorschrift
formuliert werden, die als Paralleltransport von Tangentenvektoren bezeichnet wird.
Erst eine solche Vorschrift, die auch als ’Affinzusammenhang’ bezeichnet wird, erlaubt es, Vektoren, die in verschiedenen Tangentenräumen liegen, aufeinander zu
beziehen und einen Differenzenquotienen zu bilden.
Ein von einem Affinzusammenhang unabhängiger Begriff einer Richtungsableitung eines Vektorfeldes ist die sogenannte Lieableitung. Diese wird in den drei folgenden Abschnitten im einfachen Fall von Vektorfeldern auf Vektorräumen erklärt.
Der Transport mit dem Fluss eines Vektorfeldes übernimmt dabei die Rolle des
Paralleltransports.
3.2.2
*Lieprodukt von Vektorfeldern
In diesem Abschnitt wird eine schiefsymmetrische, bilineare Multiplikation von Vektorfeldern beschrieben, die als Ergebnis ein neues Vektorfeld ergibt. Dabei erweist es
sich als hilfreich, ein Vektorfeld als eine bestimmte lineare Abbildung, als ’Derivation’, auf dem Vektorraum der C ∞ -Skalarfelder aufzufassen. Einige dieser Derivationen
dienen (in einer komplexifizierten) Version als Impuls- und Drehimpulsoperatoren
der Quantenmechanik. Impulse sind mit konstanten Vektorfeldern der Länge 1 assoziiert und Drehimpulse mit den Drehvektorfeldern.
Seien X, Y : U → V Vektorfelder mit offenem Definitionsbereich U ⊂ V. Die
Komponentenfunktionen Xei und Yei von X und Y zu einer beliebigen Basis e von
V seien C ∞ -Funktionen. Für jedes Skalarfeld f ∈ C ∞ (U : R) ist das Skalarfeld der
Richtungsableitungen [X] f : U → R mit [X] f (v) = dv f (X (v)) wieder ein Skalarfeld in C ∞ (U : R) . Sei nun X die dem Vektorfeld zugeordnete lineare(!) Abbildung
X : C ∞ (U : R) → C ∞ (U : R) mit Xf = [X] f für alle f ∈ C ∞ (U : R) .
Es gilt die Produktregel X (f · g) = g · X (f ) + f · X (g) für alle f, g ∈ C ∞ (U : R) .
Für zwei C ∞ -Vektorfelder X, Y auf U ist auch der ihnen zugeordnete Kommutator
X, Y = X ◦ Y − Y ◦ X
eine lineare Abbildung von C ∞ (U : R) nach C ∞ (U : R) . Es wird nun gezeigt, dass
ein C ∞-Vektorfeld Z : U → V mit Z = X, Y existiert.
Auf U gilt Y ◦ X f = [Y ] ([X] f ) =
n
n
Yei ∂ie
=
j=1
n
Xej ∂je f
i=1
Yei
=
i,j=1
∂ie Xej
∂je f + Xej ∂ie ∂je f
.
KAPITEL 3. VEKTORANALYSIS
233
Für die Differenz der beiden Skalarfelder [X] ([Y ] f) und [Y ] ([X] f) ergibt sich daraus wegen des Weghebens der zweiten Ableitungen von f
X ◦ Y − Y ◦ X f = [X] ([Y ] f ) − [Y ] ([X] f )
n
=
i,j=1
Xei ∂ie Yej − Yei ∂ie Xej
∂je f = [[X] Y ] f − [Y [X]] f.
Dies aber ist das Feld der Richtungsableitungen von f unter dem Vektorfeld Z =
[X] Y −[Y ] X. Die Komponentenfunktionen Zej von Z mit Z = nj=1 ej ·Zej : U → V
erfüllen daher
n
Zej =
i=1
Xei ∂ie Yej − Yei ∂ie Xej
(3.20)
.
Die Bestimmung von Z wurde hier basisfrei ausgeführt. Sehen wir uns trotzdem
noch an, warum auch die komponentenweise Definition von Z ein von der Basis e
unabhängiges Vektorfeld ergibt.
Lemma 114 Seien X, Y ∈ C ∞ (U : V ) . Dann ist das Vektorfeld Z = nj=1 Zej · ej ∈
C ∞ (U : V ) mit Zej wie in Gleichung (3.20) wohldefiniert, dh unabhängig von der
Wahl der Basis e.
Beweis. Sei f = e · A eine weitere Basis von V. Dann gilt wegen der Konstanz
der Basiswechselmatrix A ∈ Rn×n
n
Xei ∂ie Yej − Yei ∂ie Xej
Zej =
i=1
n
n
=
i=1 α,β=1
n
Ajβ
=
α,β=1
n
β=1
n
j=1
.
n
n
Zej · ej =
α=1
n
Aiα ∂ie Yfβ
Xfα
Ajβ
=
und somit
0
1
Aiα Ajβ Xfα ∂ie Yfβ − Yfα ∂ieXfβ
i=1
− Yfα
Aiα ∂ieXfβ
i=1
0
1
f β
f β
α
α
Xf ∂α Yf − Yf ∂α Xf
=
n
j=1
n
β=1
Ajβ Zfβ ·
n
α=1
7
n
Ajβ Zfβ
β=1
α
(A−1 )j fα =
n
α=1
Zfα · fα .
Definition 115 Zu zwei Vektorfeldern X, Y ∈ C ∞ (U : V ) heißt das Vektorfeld Z =
[X] Y − Y [X] ∈ C ∞ (U : V ) das Lieprodukt (die Lieklammer) von X mit Y. Es wird
notiert Z = [X, Y ]L .
Es gilt also X, Y = [X, Y ]L . Das Lieprodukt
[·, ·]L : C ∞ (U : V ) × C ∞ (U : V ) → C ∞ (U : V )
KAPITEL 3. VEKTORANALYSIS
234
ist offenbar schiefsymmetrisch und bilinear. Es erfüllt zudem die Jacobiidentität
[A, [B, C]L ]L + [B, [C, A]L ]L + [C, [A, B]L ]L = 0
für alle A, B, C ∈ C ∞ (U : V ) . Die Jacobiidentität lässt sich anhand der entsprechenden Kommutatoridentität der Derivationen ganz einfach nachrechnen, da sich
von den zwölf Summanden sechs Paare zu 0 aufaddieren.
Lieprodukt zweier Drehvektorfelder
Sei zunächst V von beliebiger endlicher Dimension und X, Y : V → V seien linear.
Dann gilt [X] Y = Y ◦ X und [Y ] X = X ◦ Y. Daraus folgt
[X, Y ]L = Y ◦ X − X ◦ Y = [Y, X] .
Das Lieprodukt von zwei linearen Vektorfeldern stimmt also mit dem negativen(!)
Kommutator der beiden Vektorfelder im Abbildungssinn überein.
Nutzen wir diesen Sachverhalt, um das Lieprodukt von zwei Drehvektorfeldern zu
berechnen. Der Vektorraum V habe also nun die Dimension 3. Ein Skalarprodukt
·, · und eine Orientierung von V seien gewählt. Das zugehörige Vektorprodukt
zweier Vektoren u, v wird als u × v bezeichnet. Das Drehvektorfeld Ln : V → V zu
einem n ∈ V erfülle Ln (v) = n × v für alle v ∈ V. Das Vektorfeld Ln ist linear.
Lemma 116 Für m, n ∈ V gilt [Ln , Lm ] = Ln ◦ Lm − Lm ◦ Ln = Ln×m .
Beweis. Für v ∈ V gilt Ln (Lm v) = n × (m × v) = m n, v − v m, n . Daraus
folgt Ln (Lm (v)) − Lm (Ln (v)) = m n, v − n m, v . Andererseits gilt Ln×m (v) =
(n × m) × v = −v × (n × m) = −n v, m + m n, v .
Der Kommutator zweier Drehvektorfelder ist also wieder ein Drehvektorfeld. Ist
e = (e1 , e2 , e3 ) eine positiv orientierte Orthonormalbasis von V, dann gelten für die
Vektorfelder Li ≡ Lei
[L1 , L2 ] = L3 (zyklisch).
Man beachte, dass aus L2n v ≡ (Ln ◦ Ln ) v = n n, v − v |n|2 folgt
3
C :=
i=1
L2i = −2ιdV .
Das lineare Vektorfeld C ist also ein Vielfaches der identischen Abbildung, eine sogenannte ’Casimirinvariante’. Der Kommutator von C mit Ln verschwindet offenbar,
wie auch die zugehörige Lieklammer, für alle n ∈ V.
<n der Richtungsableitung mit dem Drehvektorfeld Ln auf
Der lineare Operator L
∞
der Menge der C -Skalarfelder auf V erfüllt für alle v ∈ V
<n f (v) = [Ln (v)] f = dv f (n × v) = n × v, gradv (f ) .
L
v
Es gilt daher auch
[Ln (v)]v f = n, v × gradv (f ) .
KAPITEL 3. VEKTORANALYSIS
235
Für n = e3 spezialisiert sich diese Definition beispielsweise zu
e
e
[Le3 (v)]v f = ve1 (∂2 f) (v) − ve2 (∂1 f) (v) .
Da die Lieklammer [Ln , Lm ]L der Vektorfelder Ln und Lm mit dem Kommutator
[Lm , Ln ] übereinstimmt, gilt
<n , L
<m = −Ln×m .
L
<n = Ln als
Die Quantenmechanik nutzt für n ∈ V mit |n| = 1 die Operatoren −i L
Bahndrehimpulskomponenten zur Achse R · n. Diese erfüllen daher die Kommutatorrelationen [Ln , Lm ] = i Ln×m .
3.2.3
Transport von Skalar- und Tangentenvektorfeldern
Es wird nun ein natürlicher abbildungsinduzierter Transport von skalaren und Tangentenvektorfeldern beschrieben, welcher im Fall der Flussabbildung eines Vektorfeldes X der Lieableitung ’unter’ X zugrunde liegt.
Sei ϕ : U → ϕ (U ) ⊂ V eine bijektive C ∞-Funktion mit offenem Definitionsbereich U ⊂ V. Die Umkehrabbildung ϕ−1 sei ebenfalls eine C ∞-Funktion. Zu einer
C ∞ -Funktion f : U → R ist die Funktion ϕ∗ f : ϕ (U ) → R mit (ϕ∗ f ) (ϕ (v)) = f (v)
dann ein skalares C ∞-Feld auf dem Bildbereich von ϕ.
Die Abbildung ϕ überträgt so die Funktionswerte eines Skalarfeldes punktweise
in ihren Bildbereich. Die Abbildung ϕ∗ f heißt der Transport des Skalarfeldes f
unter (dem Diffeomorphismus) ϕ. Es gilt kurz ϕ∗ f = f ◦ ϕ−1 . Ein anschauliches Bild
dieser Konstruktion vermittelt etwa ein Körper aus endlich vielen Massenpunkten,
welche die offene Menge U ’sampeln’. f ordnet diesen Punkten reelle Massen zu ϕ
transportiert die Punkte unter Beibehaltung ihrer Massen in neue Positionen. Die
Abbildung ϕ überhöht die ’reale’ endliche Menge also zu einem Kontinuum.
Ein Beispiel: Sei ϕ = A : V → V linear mit det A = 0. Dann folgt für f ∈
∞
C (V : R) , dass (A∗ f) (v) = f (A−1 v) .
Mit ϕ lassen sich auch C ∞ -Kurven γ : I → U von U nach ϕ (U ) übertragen.
Eine naheliegende Definition ist ϕ∗ γ = ϕ ◦ γ : I → ϕ (U ) . Aufgrund der Kettenregel
gilt
d
(ϕ γ) (t) = dγ(t) ϕ (γ̇ (t)) .
dt ∗
Beim Transport einer Kurve γ werden die Tangentenvektoren nicht wie die Werte
eines Skalarfeldes unverändert von ϕ∗ mitgenommen, sondern der Tangentialapproximation von ϕ entsprechend linear verzerrt.
Dieses ’Transformationsverhalten’ der Tangentenvektoren von Kurven motiviert
die folgende Definition des Transports von Tangentenvektorfeldern.
Definition 117 Sei U ⊂ V offen und ϕ : U → ϕ (U ) ⊂ V eine bijektive C ∞ Funktion. Für ein Vektorfeld X ∈ C ∞ (U : V ) heißt das Vektorfeld ϕ∗ X : ϕ (U ) → V
mit (ϕ∗ X) (ϕ (v)) = (dv ϕ) (X (v)) der Transport von X unter ϕ.
Ein Beispiel: Sei ϕ = A : V → V linear mit det A = 0. Dann folgt für X ∈
C (V : V ) , dass (A∗ X) (Av) = A (X (v)) oder auch kurz A∗ X = A ◦ X ◦ A−1 .
∞
KAPITEL 3. VEKTORANALYSIS
3.2.4
236
*Lieableitung von Skalar- und Tangentenvektorfeldern
Sei U ⊂ V offen und X ∈ C ∞ (U : V ) . Dann existiert zu jedem Punkt p ∈ U eine
lokale Flussabbildung Φ : (−ε, ε) × Up → U mit
∂t Φ (t, v) = X (Φ (t, v)) für alle (t, v) ∈ (−ε, ε) × Up .
Der lokale Fluss transportiert ein Skalarfeld f ∈ C ∞ (U : R) in einer hinreichend
kleinen Umgebung von p in die Abbildung Φ (t, ·)∗ f mit
(Φ (t, ·)∗ f) (v) = f (Φ (−t, v)) für alle (t, v) ∈ (−ε, ε) × Up .
Der Limes
(Φ (t, ·)∗ f ) (v) − f (v)
f (Φ (−t, v)) − f (v)
= lim
t→0
t→0
t
t
f (v − tX (v)) − f (v)
= −dv f (X (v)) = − [X]v f
= lim
t→0
t
(LX f ) (v) := lim
gibt somit die beste lineare Approximation an die Kurve t → (Φ (t, ·)∗ f ) (v) bei
t = 0. Das Skalarfeld LX f = − [X] f wird als die Lieableitung von f unter dem
Vektorfeld X bezeichnet.
Für ein Tangentenvektorfeld Y ∈ C ∞ (U : V ) ist eine analoge Konstruktion möglich, nämlich die folgende.
(Φ (t, ·)∗ Y ) (v) − Y (v)
(Φ (t, ·)∗ Y ) (Φ (t, v)) − Y (Φ (t, v))
= lim
t→0
t→0
t
t
(dv Φ (t, ·)) Y (v) − Y (v + tX (v))
= lim
t→0
t
Y (v) + tdv X (Y (v)) − Y (v + tX (v))
= lim
= dv X (Y (v)) − dv Y (X (v))
t→0
t
= − [X, Y ]L (v)
(LX Y ) (v) := lim
Das Vektorfeld LX Y : U → V mit LX Y = − [X, Y ]L wird als Lieableitung
des Vektorfeldes Y unter dem Vektorfeld X bezeichnet. Sie gibt der Lieklammer
zweier Vektorfelder eine neue Bedeutung. Ein Vektorfeld Y ist ganau dann unter
dem Transport mit dem Fluss des Vektorfeldes X invariant, wenn [X, Y ]L = 0.
Ein anschauliches Bild der Lieableitung eines Vektorfeldes liefert das folgende
Phänomen. Markieren Sie (zB mit Sägemehl) kleine Pfeile auf einer langsam strömenden Flüssigkeitsoberfläche (mit dem Geschwindigkeitsfeld X) und beobachten
Sie, wie sich die Fußpunkte der Pfeile während eines kurzen Zeitintervalls verschieben
und sich die Pfeile selbst drehen und dehnen. Mit ein bischen Phantasie können Sie
die Lieableitung von Y unter dem Geschwindigkeitsfeld X an der lokalen Evolution
der Pfeile um t = 0, nämlich
Y (t, v) = Y (0, v) + t (LX Y ) (v) + o (t) = Y (0, v) − t [X, Y ] (v) + o (t)
ablesen.
KAPITEL 3. VEKTORANALYSIS
3.2.5
237
*Beschleunigung einer Integralkurve von γ̇ = X (t, γ)
Die Kurve γ : I → V sei Lösung des nichtautonomen Differentialgleichungssystems
erster Ordnung γ̇ (t) = X (t, γ (t)) für alle t im offenen reellen Intervall I. Die differenzierbare Abbildung X : D → V sei auf einer offenen Teilmenge D von R × V
erklärt.
Unter diesen Voraussetzungen lässt sich die ’Beschleunigung’ γ̈ (t) zur Zeit t bei
Kenntnis des Ortes γ (t) zur Zeit t alleine aus der Funktion X berechnen. Man
braucht also die Funktion γ selbst gar nicht wirklich zu kennen. Es gilt nämlich
γ̈ (t) = ∂t X (t, γ (t)) + [X (t, γ (t))]γ(t) X (t, ·) .
Warum ist das so?
Es gilt
γ̇ (t + ε) − γ̇ (t)
X (t + ε, γ (t + ε)) − X (t, γ (t))
= lim
ε→0
ε→0
ε
ε
X (t + ε, γ (t + ε)) − X (t, γ (t + ε)) + X (t, γ (t + ε)) − X (t, γ (t))
= lim
ε→0
ε
X (t + ε, γ (t + ε)) − X (t, γ (t + ε))
X (t, γ (t + ε)) − X (t, γ (t))
+ lim
= lim
ε→0
ε→0
ε
ε
X (t, γ (t + ε)) − X (t, γ (t))
= ∂t X (t, γ (t)) + lim
.
ε→0
ε
γ̈ (t) := lim
Wegen γ (t + ε) = γ (t) + εγ̇ (t) + ψ (ε) mit limε→0 ψ (ε) /ε = 0 folgt
X (t, γ (t + ε)) − X (t, γ (t))
X (t, γ (t) + εγ̇ (t) + ψ (ε)) − X (t, γ (t))
= lim
ε→0
ε→0
ε
ε
= dγ(t) X (t, ·) (γ̇ (t)) = [γ̇ (t)]γ(t) X (t, ·) = [X (t, γ (t))]γ(t) X (t, ·) .
lim
Somit ist gezeigt, dass
γ̈ (t) = ∂t X (t, γ (t)) + [X (t, γ (t))]γ(t) X (t, ·) .
3.2.6
Wegintegrale eines Vektorfeldes
Ein Vektorfeld auf einem n-dimensionalen Raum ist durch n reellwertige Komponentenfunktionen der n Koordinaten bestimmt. Manche Vektorfelder lassen sich
aus einem Skalarfeld durch Gradientenbildung, also aus einer einzigen reellwertigen
Funktion der n Koordinaten erzeugen. Welche Vektorfelder sind das? Inwiefern sind
sie ausgezeichnet?
Eine Kurve γ : [a, b] → V heißt stückweise C 1 -Kurve, falls Zahlen a = t0 <
t1 < t2 < ... < tk = b existieren, sodass die Einschränkungen der Kurve γ auf die
Teilintervalle [ti , ti+1 ] allesamt C 1 -Kurven sind. Da für eine stückweise C 1 -Kurve die
einseitigen Ableitungen auch in den Randpunkten ti der Teilintervalle existieren, ist
eine solche Kurve überall stetig.
KAPITEL 3. VEKTORANALYSIS
238
Definition 118 Sei U ⊂ V offen und X : U → V ein stetiges Vektorfeld. Die
Abbildung γ : [a, b] → U sei eine stückweise C 1 -Kurve. Dann heißt
k
ti
i=1
ti−1
X :=
γ
X ◦ γ (t) , γ̇(t) dt
das Kurvenintegral von X längs γ, wobei ·, · ein Skalarprodukt von V bezeichnet.
Satz 119 (Reparametrisierungsinvarianz) Sei φ : [a′ , b′ ] → [a, b] eine stetig
differenzierbare Abbildung mit φ(a′ ) = a und φ(b′ ) = b. Dann gilt für das Kurvenintegral eines stetigen Vektorfeldes X auf U längs γ : [a, b] → U, dass γ X = γ◦φ X.
Falls φ(a′ ) = b und φ(b′ ) = a, dann gilt γ X = − γ◦φ X.
Beweis. Siehe zB sect 16.3, p 352 in [10].
Aufgrund der Invarianz von Kurvenintegralen unter orientierungserhaltenden
Umparametrisierungen werden Kurvenintegrale meist als Wegintegrale bezeichnet,
da der Weg als (orientierte) Bildmenge der Kurve das Integral bereits festlegt.
Ist ein Vektorfeld ein Gradientenfeld, dann sind Kurvenintegrale besonders einfach zu berechnen. Es gilt nämlich für X = grad (f ) und eine C 1 -Kurve γ aufgrund
der Kettenregel
b
X =
a
γ
b
=
a
&
'
gradγ(t) (f ) , γ̇ (t) dt =
b
dγ(t) f (γ̇ (t))
a
d
(f ◦ γ) (t) dt = f (γ (b)) − f (γ (a)) .
dt
Das Kurvenintegral eines Gradientenfeldes hängt also nicht vom detaillierten Verlauf
der Kurve ab, sondern nur von ihren Anfangs- und Endpunkten. Eine stückweise C 1 Kurve γ : [a, b] → U ⊂ V heißt geschlossen, falls γ(a) = γ(b). Für eine geschlossene
Kurve γ und ein Gradientenfeld X gilt daher γ X = 0.
3.2.7
Wegintegrale des Vortexfeldes
Sei X der freie Vortex auf der Ebene ohne Nullpunkt, d.h.
X : R2
0 → R2 mit X (x, y) = (−y, x) / x2 + y 2 .
Sei γ : [0, ε] → R2 mit γ (t) = R (cos t, sin t) mit R ∈ R>0 und 0 < ε. Für das
Skalarprodukt gelte (a, b) , (x, y) = ax + by. Dies ergibt γ̇ (t) = R (− sin t, cos t)
und
=
>
1
X ◦ γ (t) , γ̇ (t) =
(− sin t, cos t) , R (− sin t, cos t) = 1.
R
ε
Daraus folgt γ X = 0 dt = ε. Insbesondere ist für ε = 2π die Kurve γ geschlossen
und es gilt γ X = 2π. Moral: X ist kein Gradientenfeld!
KAPITEL 3. VEKTORANALYSIS
3.2.8
239
*Flächeninhalt und Drehvektorfeld
Sei L : R2 → R2 mit L (x, y) = (−y, x) . Das Kurvenintegral von L/2 längs einer
Kurve γ : [a, b] → R2
1
2
1
L=
2
γ
b
a
−γ 2 (t) γ̇ 1 (t) + γ 1 (t) γ̇ 2 (t) dt
ergibt den (gewichteten, euklidischen) Inhalt der Fläche, die von γ überstrichen wird.
Dabei wird ein ’infinitesimales’ Flächenelement positiv gewichtet, wenn (γ (t) , γ̇ (t))
zur Standardbasis gleichsinnig orientiert ist, und andernfalls negativ. Umrundet eine
geschlossene Kurve das eingeschlossene Gebiet G einmal so, dass G in Laufrichtung
gesehen links der Kurve liegt, dann ist γ L der Flächeninhalt von G.
Der Grund dafür ist der: Wir wählen eine positiv orientierte ONB (e1 , e2 ) in R2 ,
sodass γ (t) = |γ (t)| e1 . Es gilt dann L ◦ γ (t) = |γ (t)| e2 . Weiters existiert genau ein
Winkel ϕ (t) ∈ [0, 2π) , sodass γ̇ (t) = |γ̇ (t)| · (cos ϕ (t) · e1 + sin ϕ (t) · e2 ) . Damit
folgt
1
1
L ◦ γ (t) , γ̇ (t) ∆t = |γ (t)| · |γ̇ (t)| · sin [ϕ (t)] · ∆t.
2
2
Für 0 ≤ ϕ (t) ≤ π ist somit L ◦ γ (t) , γ̇ (t) /2 die Fläche des Dreiecks mit den
Eckpunkten 0, γ (t) , γ (t) + ∆t · γ̇ (t) , sodass der Name „Flächengeschwindigkeit”
für L ◦ γ (t) , γ̇ (t) zutrifft. Für π < ϕ (t) < 2π gibt L ◦ γ (t) , γ̇ (t) die mit −1
multipliziere Fläche des Dreiecks, die Flächengeschwindigkeit ist negativ.
Am Kartenbereich der Polarkoordinaten (r, φ) gilt übrigens, wie schon gezeigt,
L = r2 gradφ und somit nach der Kettenregel
& 2
'
L ◦ γ (t) , γ̇ (t) =
r gradφ ◦ γ (t) , γ̇ (t) = |γ (t)|2 (φ ◦ γ)′ (t) .
Überprüfen wir diese Überlegung an einem Kreis mit dem Radius R und dem
Mittelpunkt (a, b) . Es gilt mit γ (t) = (a + R cos t, b + R sin t)
2π
L =
γ
[− (b + R sin t) (−R sin t) + (a + R cos t) (R cos t)] dt
0
2π
= R2
sin2 t + cos2 t dt = 2R2 π.
0
Das Integral γ L/2 stimmt also wirklich mit dem Flächeninhalt eines Kreises vom
Radius R überein.
Johannes Kepler konnte den Aufzeichnungen Tycho de Brahes über seine Planetenbeobachtungen Hinweise darauf entnehmen, dass erstens jede Planetenbahn in
einer Ebene durch die Sonne liegt und zweitens die Flächengeschwindigkeit des Vektors von der Sonne zum betrachteten Planeten im Lauf der Zeit konstant ist. Isaak
Newton gelang es dann, diese ersten beiden „Keplerschen Gesetze” als eine Folge
der Drehimpulserhaltung bei Bewegungen in einem Zentralkraftfeld F = |F | · ιd/ |·|
zu deuten und zwar so.
KAPITEL 3. VEKTORANALYSIS
240
Die Abbildung t → γ (t)× γ̇ (t) ist konstant, wenn γ (t) den Vektor von der Sonne
zum Planeten zur Zeit t bezeichnet, da wegen mγ̈ (t) = (F ◦ γ) (t)
γ (t)
d
(γ (t) × mγ̇ (t)) = γ (t) × mγ̈ (t) = − |F (γ (t))| γ (t) ×
=0
dt
|γ (t)|
folgt. Hier bezeichnen m die Masse des Planeten, F das von der Sonne erzeugte
Kraftvektorfeld und γ (t) × mγ̇ (t) den Bahndrehimpuls(vektor) des Planeten zur
Zeit t. Er ist, wie natürlich auch γ (t) × γ̇ (t) , eine (vektorielle) Konstante der Bewegung. Der Bahndrehimpuls definiert, falls er nicht 0 ist, somit die t-unabhängige
Flächeneinheitsnormale
γ (t) × γ̇ (t)
n=
|γ (t) × γ̇ (t)|
auf die Bahnebene. Es folgt daraus γ (t) , n = 0 für alle t. Daher liegt γ (t) zu jeder
Zeit in jener Ebene durch 0, die senkrecht auf n steht.
Die Flächengeschwindigkeit des Planeten zur Zeit t ist dann mit dem Drehvektorfeld Ln : p → n × p durch
(Ln ◦ γ) (t) , γ̇ (t) = n × γ (t) , γ̇ (t) = γ (t) × γ̇ (t) , n = |γ (t) × γ̇ (t)|
gegeben und ist somit zeitlich konstant. Sie ist positiv, da das Tripel (γ (t) , γ̇ (t) , n)
positiv orientiert ist. Für γ (t) × γ̇ (t) = 0 verläuft die Bahn in einer Geraden durch
0. Die Flächengeschwindigkeit |γ (t) × γ̇ (t)| verschwindet in diesem Fall.
3.2.9
Konservative Vektorfelder und Potentiale
Bewegt sich ein Körper unter dem ausschließlichen Einfluss eines vorgegebenen
Kraftfeldes12 X : V → V, dann folgt seine Bewegung einer (zeitparametrisierten)
Kurve γ : [t0 , t1 ] → V, die Newtons Bewegungsgleichung mγ̈ = X ◦ γ löst. Existiert
für das das Kraftfeld X eine Potentialfunktion Φ mit X = −grad (Φ) , dann ist die
Gesamtenergie der Lösung γ, nämlich die Summe aus kinetischer und potentieller
Energie längs γ
m
E γ = |γ̇|2 + Φ ◦ γ
2
eine konstante Funktion. Das kommt so zustande:
d m
md
|γ̇ (t)|2 + Φ (γ (t)) =
γ̇ (t) , γ̇ (t) + dγ(t) Φ (γ̇ (t))
dt 2
&2 dt
'
= m γ̈ (t) , γ̇ (t) + gradγ(t) Φ, γ̇ (t) = 0.
Wird der Körper unter Zuhilfenahme von regelbaren Zusatzkräften (’Zwangskräften’) längs einer beliebigen C 1 -Kurve γ : [0, 1] → V mit γ̇ (0) = 0 = γ̇ (1) durch
das Kraftfeld X vom Punkt γ (0) zum Punkt γ (1) geführt, dann gibt − γ X die von
den Zwangskräften verrichtete Arbeit an. Ist diese positiv, dann nimmt die potentielle Energie des Körpers im Kraftfeld X zu. (Die kinetische Energie am Anfang und
12
ZB dem Schwerefeld der Erde.
KAPITEL 3. VEKTORANALYSIS
241
am Ende des Weges verschwindet ja wegen γ̇ (0) = 0 = γ̇ (1) .) Ist die Arbeit negativ, nimmt die potentielle Energie des Körpers im Feld X ab. Der die Zwangskräfte
erzeugende Rest der Welt ’bezieht’ dann Energie aus dem System, das aus dem
Körper im Kraftfeld X besteht. Die Gesamtenergie bleibt auch hier ’konserviert’.
Ist γ ein geschlossener Weg und X das statische Kraftfeld einer in der Natur
realisierten Bewegungsgleichung des Typs mγ̈ = X ◦ γ, dann gilt nach heutigem
Wissensstand jedenfalls γ X = 0. Wäre das nicht so, gäbe es periodische Prozesse, aus denen unbegrenzt Energie bezogen werden könnten. Eine solche Welt wäre
ziemlich sicher instabil. Energie und damit die Vehemenz der Vorgänge dieser Welt
würde unbegrenzt anwachsen und lebende Organismen wären bald ausgelöscht.
Definition 120 Ein stetiges Vektorfeld X : U → V heißt konservativ, wenn für
alle geschlossenen C 1 -Kurven γ mit Werten in U gilt, dass γ X = 0.
Anmerkung: Jedes Gradientenvektorfeld ist offenbar konservativ.
Das Vektorfeld X von Abschnitt 3.1.14, das durch Fortsetzung des Gradientenvektorfeldes des Polarwinkels ϕ entsteht, ist also nicht konservativ. Es gilt ja für
eine geschlossene Kurve γ, welche den Ursprung einmal umläuft γ X = 2π. Die
Einschränkung von X auf R2 R≥0 · e1 ist hingegen konstruktiongemäß das Gradientenfeld von ϕ.
Der folgende Satz legt klar, dass nicht nur jedes Gradientenfeld konservativ ist,
sondern auch jedes konservative Vektorfeld Gradient eines Skalarfeldes ist.
Satz 121 Ein stetiges Vektorfeld X : U → V mit offenem U ⊂ V ist genau dann
konservativ, wenn es eine C 1 -Funktion f : U → R gibt, für die X = grad (f ) gilt.
(Die Funktion −f wird dann als ein Potential von X bezeichnet.) Ist U kurvenzusammenhängend und sind f und g Potentiale von X, dann ist f − g konstant.
Beweis. Siehe: [10], p. 358.
Anmerkung: Auf den kurvenzusammenhängenden Teilen des Definitionsbereiches
eines konservativen Vektorfeldes X ist ein Potential von X also bis auf eine additive
Konstante eindeutig bestimmt.
Jedes stetige, drehinvariante, radiale Vektorfeld ist konservativ
f : (a, b) → R mit 0 ≤ a < b sei stetig. Für X : {p ∈ V : a < |p| < b} → V gelte
X (p) = 2f |p|2 p. In jedem Punkt p ist X (p) ein skalares Vielfaches von p. Man
sagt daher X sei ein radiales Vektorfeld. Außerdem gilt X ◦ R = R ◦ X für alle
R ∈ SOn , da |Rp| = |p| für alle p ∈ U und für alle R ∈ SOn . Man sagt daher X ist
ein drehinvariantes Vektorfeld. (Jedes radiale, drehinvariante und stetige Vektorfeld
ist vom hier angegebenen Typ.)
Sei F eine Stammfunktion von f. Wegen
X (p) = 2F ′ |p|2 p = F ′ |p|2 gradp |·|2 = gradp F ◦ r2
ist X ein Gradientenfeld und somit konservativ. Die Kraft, mit der die Erde an
einer Masse zieht, ist als Funktion des Ortes der Masse zwar ein Gradientenfeld,
aber nur annähernd radial und drehinvariant. Dies erschwert die Höhenbestimmung
von Bergen.
KAPITEL 3. VEKTORANALYSIS
3.2.10
242
*Landvermessung: Wegabhängige Höhendifferenz?
Bei der Landvermessung spielen Wegintegrale eines konservativen Vektorfeldes eine
Rolle: Was ist mit der Aussage gemeint, dass der Großglockner eine Höhe von 3798m
über Meeresniveau hat? Wo ist das Meeresniveau unter dem Großglockner, zu dem
man durch einen Schacht ein Lot hinunterlassen könnte? Eine Ersatzkonstruktion
hilft aus: Längs einer Kurve γ, die von einem Ort p1 am Meer in Venedig zum Gipfel
p2 des Großglockners führt, wird mit einer Wasserwaage und einer Federwaage das
Gradientenfeld des Gravitationspotentials φ einer Testmasse m im Feld der Erde
bestimmt, und durch Triangulieren die Arbeit
W =
γ
grad (φ) = φ (p2 ) − φ (p1 )
gemessen. W/mg ist ein Höhenunterschied, der nicht vom Weg γ abhängt. Dabei ist
g ein standardisierter Wert der Erdbeschleunigung. Würde man auf die Federwaage
verzichten und lediglich mit Wasserwaage, Längen- und Winkelmessern arbeiten, so
könnte man nur das Wegintegral
γ
grad (φ)
|grad (φ)|
messen. Dieses ergibt aber eine wegabhängige Seehöhe, da im Fall des Gravitationspotentials φ der Erde das Vektorfeld grad (φ) / |grad (φ)| nicht konservativ ist.13
Hier ein 2d Beispiel dazu. Sei φ : R2 → R mit dem Standardkartenausdruck
φ = x2 − y 2 . Auf R2 0 gilt
X :=
grad (φ)
=
|grad (φ)|
1
x2 + y 2
(x · e1 − y · e2 ) .
Für die beiden Komponentenfunktionen X 1 = x/ x2 + y 2 und X 2 = −y/ x2 + y 2
−3/2
des Vektorfeldes X gilt ∂1 X 2 − ∂2 X 1 = 2xy (x2 + y 2 )
. Die Tatsache ∂1 X 2 =
∂2 X 1 stellt nun, wie im nächsten Abschnitt klar wird, bereits sicher, dass X nicht
konservativ ist. Figur 3.11 zeigt das Vektorfeld X.
Um gleich hier zu sehen, dass X nichtkonservativ ist, basteln wir einen geschlossenen Weg γ mit nichtverschwindendem Wegintegral über X. Er ist die Zusammensetzung von vier Wegen, nämlich einem (im Gegenuhrzeigersinn durchlaufenen)
Viertelkreis um 0 von R · e1 nach R · e2 mir R > 0. Anschließend wird die y-Achse
von R · e2 bis r · e2 mit 0 < r durchlaufen, dann der Viertelkreis um 0 von r · e2 nach
r · e1 im Uhrzeigersinn. Der Rest des Weges wird entlang der x-Achse von re1 bis
R · e1 zurückgelegt. Es folgt (Übung!)
γ
X = R − r.
13
Nun sind Sie für einen Besuch der wunderbaren Abteilung für Geodäsie des technischen Museums in München gerüstet.
KAPITEL 3. VEKTORANALYSIS
243
Abbildung 3.11: Das Vektorfeld grad (φ) / |grad (φ)| zu φ = x2 − y 2
3.2.11
Poincarés Existenzsatz für skalare Potentiale
Definition 122 Ein C 1 -Vektorfeld X : U → V mit offenem U ⊂ V heißt rotationsfrei, falls bezüglich einer Basis e von V auf U die Gleichungen ∂ie ej , X = ∂je ei , X
für alle i, j gelten.
Das folgende Lemma gibt der Rotationsfreiheit Bedeutung.
Lemma 123 Jedes C 1 -Vektorfeld mit Potential ist rotationsfrei.
−1
gilt ∂i ∂j fe = ∂j ∂i fe und wegen
Beweis. Für die C 2 -Funktion fe := f ◦ Φe|U
ej , X = ej , grad f = ∂je f auch ∂ie [ ej , X ] = ∂ie ∂je f = ∂je ∂ie f = ∂je [ ei , X ] .
Ist e eine ONB(!) und ist Xei := Φie ◦ X, d.h. es gilt X = ni=1 Xei ei , ist X wegen
i
Xe = ei , X genau dann rotationsfrei, wenn ∂ie Xej = ∂je Xei für alle i, j.
Will man erkennen, ob ein C 1 -Vektorfeld X konservativ ist, wird man zunächst
prüfen, ob X rotationsfrei ist. (Das ist eine einfache Differentiationsaufgabe.) Ist
X nicht rotationsfrei, dann ist X sicher kein Gradientenfeld und somit auch nicht
konservativ. Ist X aber rotationsfrei, wird man als nächsten Schritt versuchen, einige Kurvenintegrale von X längs geschlossener Kurven zu berechnen. Ist ein solches
Integral ungleich 0, dann ist X nicht konservativ. Sind aber alle berechneten Kurvenintegrale gleich 0, und schafft man es nicht, wirklich alle existenten geschlossenen
Kurvenintegrale zu berechnen, dann wird man untersuchen, ob X ein Potential hat.
(Dazu sind partielle Differentialgleichungen zu lösen.) Findet man ein Potential von
X, dann ist klar, dass X konservativ ist. Findet man keines, dann bleibt weiter
unklar, ob X konservativ ist.
Als Beispiel für dieses Vorgehen nehmen wir das Gradientenfeld X des Polarwinkels aus Abschnitt 3.1.14. Der erste Schritt zeigt: X ist rotationsfrei und könnte
somit konservativ sein. Der zweite Schritt zeigt, dass X nicht konservativ ist. Daher
hat X auch kein Potential.
Der folgende Satz gibt eine einschränkende Bedingung für den Definitionsbereich eines Vektorfeldes X an, die sicherstellt, dass aus der Rotationsfreiheit von X
folgt, dass X konservativ ist. Erfüllt der Definitionsbereich von X die Bedingung
KAPITEL 3. VEKTORANALYSIS
244
des Satzes, dann reduziert sich die Untersuchung, ob X konservativ ist, auf die Berechnung der Rotation von X. Für solche Vektorfelder X gilt also: X ist genau dann
konservativ, wenn es rotationsfrei ist.
Definition 124 Eine Teilmenge U ⊂ V heißt sternförmig, wenn ein Punkt p0 ∈ U
existiert, sodass für jeden Punkt p ∈ U die Verbindungsstrecke zwischen p0 und p
zur Gänze in U liegt, d.h. es gilt {tp0 + (1 − t)p | 0 ≤ t ≤ 1} ⊂ U.
Satz 125 (Poincaré-Lemma) Sei U ⊂ V offen und sternförmig. X : U → V
sei ein rotationsfreies C 1 -Vektorfeld. Dann existiert eine Funktion f : U → R mit
X = grad (f ) .
Beweis. (Siehe: [10], p. 362; [4], Vol 1, Kap VI, § 24.5.5)
Eine nützliche Anwendung von Poincarés Lemma: Ein elektrostatisches Naturgesetz besagt, dass das (statische!) elektrische Kraftfeld E : R3 → R3 einer statischen
(und hinreichend glatten) Ladungsdichte ein rotationsfreies C 1 -Vektorfeld ist. Daher
existiert ein Potential Φ : R3 → R mit E = −grad (Φ) .
3.2.12
Divergenz eines Vektorfeldes
Ein Vektorfeld X kann in der Nähe eines Punktes p ∈ V im Mittel mehr oder weniger
auf p hinweisen oder auch weggerichtet sein. Wie kann man diese vage formulierte
Eigenschaft quantifizieren?
Der Fluss des Vektorfeldes durch die Oberfläche einer ’sehr’ kleinen, (stückweise) glatt berandeten Umgebung von p ist das entscheidende Instrument: Lege einen
kleinen achsenparallelen Würfel um den Punkt, multipliziere zu jeder der 2n Würfelflächen die nach außen gerichtete Flächeneinheitsnormale skalar mit einem repräsentativen Wert des Vektorfeldes auf der jeweiligen Oberfläche. Addition der Flüsse und
anschließende Division durch das Volumen des Würfels ergibt im Grenzübergang zur
Kantenlänge 0 einen das lokale Auseineanderstreben von X in p quantifizierenden
Zahlenwert, die Divergenz des Vektorfeldes in p.
Die Ausarbeitung dieser Idee gelingt mit der Tangentialapproximation
n
ek ε (∂ie )p X k + o (ε) .
X (p + εei ) = X (p) +
k=1
Die beiden gegenüberliegenden Würfelseiten, die zur Achse ei senkrecht stehen, tragen dann im Fall einer ONB e folgendermaßen bei:
(
) (
)
ε
ε
X p + ei , εn−1 ei + X p − ei , −εn−1 ei = εn ∂ie X i (p) + εn−1 o (ε) .
2
2
Daher gilt
1
ε→0 εn
n
lim
i=1
0
1
εn (∂ie )p X i + εn−1 o (ε) =
n
(∂ie )p X i .
i=1
KAPITEL 3. VEKTORANALYSIS
245
Definition 126 Sei U ⊂ V offen. Das Vektorfeld X : U → V sei ein C 1 -Vektorfeld
auf U. Sei e eine beliebige Basis von V. Die Komponentenfunktionen Xei : U → R
von X erfüllen X =: ni=1 Xei ei . Dann heißt das Skalarfeld div (X) : U → R mit
e i
n
div (X) :=
i=1 ∂i Xe Divergenz oder Quelldichte von X. Ein Vektorfeld X mit
div (X) = 0 wird divergenzfrei genannt.
In die Bildung der Divergenz geht die Wahl einer Basis ein. Trotzdem ist das
Skalarfeld div (X) unabhängig von dieser Wahl. Ist nämlich f = e · M eine weitere
Basis von V, dann gilt
2 n
3
n
n
n
n
n
f
∂i Xfi =
i=1
n
n
M −1
[fi ]
i=1
Mij M −1
k=1 j=1 i=1
Xek =
k=1
n
=
i
k
i
k
M −1
k=1 i=1
n
δjk [ej ] Xek
k=1 j=1
ej Mij Xek
j=1
n
[ej ] Xek =
i
k
n
[ek ] Xek = div (X) .
=
k=1
Obwohl die Definition der Divergenz hier mithilfe einer Überlegung motiviert
wurde, die neben einer Basis auch ein Skalarprodukt benützt, ist die Divergenz
eines Vektorfeldes auch unabhängig von der Wahl des Skalarproduktes.14
Im 3d Fall ist die Divergenz eines Vektorfeldes eine wichtige Größe der Elektrostatik. Sie dient der Formulierung eines Zusammenhangs zwischen elektrostatischem Feld E und elektrischer Ladungsdichte ρ. Es gilt nämlich das Naturgesetz
div E = ρ/ε0 . Der Integralsatz von Gauß gibt der Divergenz eines Vektorfeldes eine
recht anschauliche Bedeutung. Er sagt im Fall des Vektorfeldes E (in etwas präziserer Form), dass der Fluss von E durch den 2-dimensionalen, auswärts orientierten
Rand eines kompakten Bereiches mit dem Volumsintegral der Ladungsdichte ρ/ε0
übereinstimmt. Die Größe ρ/ε0 ist deshalb die Quelldichte von E. Ganz ähnlich
liegen die Dinge in der Strömungslehre.
Die Divergenz des Geschwindigkeitsfeldes X einer Strömung gibt Auskunft darüber, ob diese Strömung als tatsächlich zeitunabhängige Strömung ohne Quellen
oder Senken realisiert werden kann. Wäre etwa divp X < 0, dann müsste im Inneren
einer genügend kleinen Kugel um p die in ihr enthaltene Flüssigkeitsmenge permanent zunehmen. Das geht allem Anschein nach im 2d Fall nur, wenn aus dem Punkt
p Flüssigkeit seitlich, also in eine zusätzliche Dimension, abgesaugt wird. Im 3d Fall
scheint divX = 0 statisch, also dauerhaft, gar nicht physikalisch realisierbar zu sein.
Ist das Vektorfeld X : U → V vom C 1 -Typ, dann hat die Differentialgleichung γ̇ = X ◦ γ eindeutig bestimmte maximale Lösungen γ p zur Anfangsvorgabe
γ (0) = p. Es existiert also eine (eindeutig bestimmte) lokale Flussabbildung Φ mit
Φ (t, p) = γ p (t) und es steht für hinreichend kurze Evolutionszeiten t fest, in welche Punktmenge die Strömung mit dem Geschwindigkeitsfeld X eine Punktmenge
14
Der tiefere Grund dafür ist die Tatsache, dass der Fluss eines Vektorfeldes X durch eine Fläche
der Kodimension 1 nach Wahl einer Volumsform τ ∈ Ωn (V ) bereits eindeutig festgelegt ist. Im
Quotineten von Fluss und Volumen kürzt sich die einzige willkürliche Normierungskonstante der
Volumsform heraus. Eine explizit basis- und skalarproduktfreie Definition der Divergenz von X
liefert Cartans Kalkül der Differentialformen durch d [τ (X, ·)] = div (X) τ .
KAPITEL 3. VEKTORANALYSIS
246
Ω ⊂ U überführt. Ist Ω eine glatt berandete messbare Menge, dann folgt (ein Bild
zusammen mit dem Integralsatz von Gauß macht es zumindest plausibel)
,
,
n ,
d x, =
X, n df =
div (X) dn x.
∂t
Φ(t,Ω)
t=0
∂Ω
Ω
Für div (X) = 0 ist das Volumen von Ω unter dem Transport mit der Strömung des
Geschwindigkeitsfeldes X daher unverändert. Man sagt: eine divergenzfreie Strömung ist volumserhaltend.
Ganz einfache Beispiele sind die Vektorfelder X = id = (x, y) , und Y = (x, −y)
auf R1×2 . Es gilt div (X) = 2 und div (Y ) = 0. Berechnen wir noch zur Kontrolle
und Übung div (Y ) mithilfe der Basis f1 = (1, 1) , f2 = (0, 1) . Es gilt (x, y) =
(x, x) + (0, y − x) = xf1 + (y − x) f2 . Die kontravarianten Koordinatenfunktionen
von R1×2 zur Basis f sind somit u = x und v = y − x. Daraus folgt
Y = (x, −y) = (x, x) + (0, −x − y) = xf1 − (x + y) f2 = uf1 − (v + 2u) f2 .
f
f
Also gilt Yf1 = u und Yf2 = −2u − v. Nun folgt div (Y ) = ∂1 Yf1 + ∂2 Yf2 = 1 − 1 = 0.
Stellt man sich die Vektorfelder X und Y als Geschwindigkeitsfelder von ebenen Wasserströmungen zwischen zwei Glasplatten vor, ist klar, dass ohne seitliche
Wasserzufuhr X nicht zu realisieren ist, Y hingegen schon. Siehe Abbildungen 3.12,
3.13. In der Strömung X müssten Hohlräume entstehen, da das Wasser in immer
größerer Entfernung vom Zentrum immer schneller abfließt. Es muss also überall
durch Löcher in den Glasplatten Wasser nachgeliefert werden. Im Fall von Y strömt
Wasser aus großer Entfernung zum Zentrum hin, wird dabei langsamer und strömt
wieder nach außen ab. Diese Strömung kommt ohne seitliche Wasserzufuhr aus.
0
0
Abbildung 3.12: Das Vektorfeld X = (x, y)
Das elektrische Feld einer Punktladung
Sei r : V → R die Norm zu einem Skalarprodukt von V und sei e eine Basis
von V. Zu ihr gehören die Koordinatenfunktionen x1 , . . . , xn . Die reelle Funktion
f : (a, b) → R mit 0 ≤ a < b sei differenzierbar. Setze X(p) = f(|p|) · p. Es gilt also
auf U := {p ∈ V | a < |p| < b} die Funktionsgleichung X = ni=1 f (r)xi ei .
KAPITEL 3. VEKTORANALYSIS
247
0
0
Abbildung 3.13: Das Vektorfeld Y = (x, −y)
Ist e orthonormiert, dann gilt auf U nach Produkt- und Kettenregel
∂je f (r)xi = f ′ (r)
xj i
x + f (r)δ ij
r
und somit div (X) = rf ′ (r) + nf (r). Insbesondere folgt durch Wahl der konstanten
Funktion f = 1, dass div (id) = n auf ganz V .
Welche Funktionen f machen X divergenzfrei? Offenbar ist X genau dann divergenzfrei, wenn f eine Lösung der auf dem Gebiet (x, y) ∈ R>0 × R definierten Differentialgleichung y ′ = −ny/x ist. Für die Menge L aller maximalen Lösungen dieser
Differentialgleichung, sie ist vom Typ der separierten Variablen, gilt (Nachrechnen!):
L = {α : R>0 → R, x → Cx−n | C ∈ R} . Somit existiert für jedes radiale, drehinvariante, divergenzfreie Vektorfeld X eine Konstante C ∈ R, sodass X auf seinem
Definitionsbereich mit XC : V 0 → V, XC (p) = Cp/ |p|n übereinstimmt. XC ist
das elektrische Feld einer Punktladung im n-dimensionalen Raum. Die Fälle n = 1
bzw. n = 2 ergeben das elektrische Feld einer Flächen-, bzw. Linienladung im 3dimensionalen Raum. Für C = 0 hat XC keine stetige Fortsetzung auf ganz V. Es
existiert also kein drehinvariantes, radiales, von 0 verschiedenes Vektorfeld, das auf
ganz V divergenzfrei ist.
Für n = 2 zeigen die Abbildungen 3.14 bzw 3.15 die Summe bzw die Differenz
der Translate von XC um e bzw −e. Diese Felder repräsentieren das elektrische Feld
zweier Punktladungen gleicher Stärke und gleichen bzw gegengesetzten Vorzeichens.
Drehvektorfelder sind divergenzfrei
Sei dim V = 3 und n ∈ V. Setze15 L : V → V, p → n × p. Bezüglich einer ONB hat
L den Koordinatenausdruck
 2 3

n x − n3 x2
L = e ·  n3 x1 − n1 x3  .
n1 x2 − n2 x1
15
Das Vektorfeld ωL ist also das Geschwindigkeitsfeld eines starren Körpers, der mit der Winkelgeschindigkeit ωn rotiert.
KAPITEL 3. VEKTORANALYSIS
248
Abbildung 3.14: E-Feld gleicher Punktladungen
Abbildung 3.15: E-Feld gegengesetzter Punktladungen
i
Wegen ∂L
= 0 folgt div (L) = 0. Jedes Drehvektorfeld ist also divergenzfrei und
∂xi
damit volumserhaltend.
Hamiltonsche Vektorfelder sind divergenzfrei
Sei H : U → R zwei mal stetig differenzierbar. (Hamiltonfunktion) Dabei ist U ⊂ V
offen in einem Vektorraum V mit dim V = 2n. Das Hamiltonsche Vektorfeld XH hat
in der Karte (q 1 , . . . q n , p1 , . . . pn ) zu einer symplektischen Normalbasis (e1 , . . . e2n)
von V die Zerlegung
n
XH =
i=1
n
∂pi H · ei −
i=1
∂qi H · en+i .
Daher gilt div (XH ) = ni=1 ∂qi ∂pi H − ∂pi ∂qi H = 0. Hamiltonsche Flussabbildungen
sind somit volumserhaltend, ein berühmtes Ergebnis von Liouville.
3.2.13
Faulenzerregeln zur Divergenz und Beispiele
Lemma 127 Seien X, Y in p differenzierbare Vektorfelder und sei f eine in p differenzierbare Skalarfunktion. Weiter sei λ ∈ R. Dann gilt:
KAPITEL 3. VEKTORANALYSIS
249
Abbildung 3.16: Das Drehvektorfeld L in einer Ebene senkrecht zu n
1. divp (X + Y ) = divp (X) + divp (Y )
2. divp (λX) = λ divp (X)
&
'
3. divp (f X) = gradp (f ) , X (p) + f (p) divp (X)
Das Vektorpotential eines Punktdipols ist quellenfrei
Für X : V
0 → V ≃ R3 mit X (p) = f (|p|) L (p) = f (|p|) n × p und f ∈
C 1 (R>0 : R) folgt divp (X) = f ′ (|p|) p/ |p| , n × p + f (|p|) divp L = 0. Was das Vektorpotential X mit dem magnetischen Feld eines magnetischen Punktdipolmoments
zu tun hat, wird im Kapitel über die Rotation eines Vektorfeldes klar werden.
Die Quelldichte eines radialen Vektorfelds
Ein radiales Vektorfeld X erfüllt X = f (r) · id mit differenzierbarem f : I → R
auf einem offenen Intervall I ⊂ R>0 . Dann gilt divp X = |p| f ′ (|p|) + nf (|p|) . Das
ergibt sich mit Regel 3 folgendermaßen
&
'
divp X = divp [(f ◦ r) · id] = gradp (f ◦ r) , p + f (|p|) divp (id)
=
>
p
′
= f (|p|)
, p + nf (|p|) = |p| f ′ (|p|) + nf (|p|) .
|p|
Allgemeine Vortexfelder sind divergenzfrei
Sei dim V = 3 und n ∈ V mit |n| = 1. Sei L : V → V, p → n×p und sei f : R>0 → R
differenzierbar. Dann ist mit ρ := |L| : V → R auf U := V (R·n) das Vektorfeld
X : U → V,
p → f (ρ(p)) · (n × p)
ein C 1 -Vektorfeld. Es heißt allgemeines Vortexfeld. ZB das Magnetfeld eines langen
stromführenden Drahtes endlicher Dicke ist von dieser Art X = f (ρ)L.
KAPITEL 3. VEKTORANALYSIS
250
Die Zahl ρ(p) = |n × p| ist der Normalabstand von p zur Achse R·n. Somit gilt
X (p + λn) = X (p) für alle λ ∈ R. Man sagt: X ist invariant unter Verschiebungen
parallel zu n. Weiter folgt X eαLn p = eαLn X (p) für alle α ∈ R. Man sagt: X ist
invariant unter den Drehungen um n.
Aus dem Gradienten der 2d-Abstandsfunktion folgt
gradp (ρ) = |p − n n, p |−1 (p − n n, p ) .
Dieser Gradientenvektor steht in p senkrecht zum Zylindermantel durch p mit Achse
R·n. Der Vektor L(p) hingegen ist tangental zum Mantel in p. Somit gilt
&
'
divp (X) = divp (f (ρ) · L) = gradp (f (ρ)) , L (p) + f (ρ(p)) · divp (L)
&
'
= f ′ (ρ(p)) gradp (ρ) , L (p) + 0 = 0.
3.2.14
Laplace-Operator
Nun zur Quelldichte des Gradientenfeldes eines skalaren Feldes.
Definition 128 Sei U ⊂ V offen und f : U → R sei eine C 2 -Funktion. Dann heißt
das Skalarfeld ∆f : U → R, p → divp (grad (f)) Laplace von f zum Skalarprodukt ·, · von V. Die zugehörige lineare Abbildung ∆ : C 2 (U : R) → C (U : R) heißt
Laplace-Operator auf U.
ij
Ist e eine Basis von V, dann gilt ∆f = ni,j=1 G−1
∂ie ∂je f. Im Fall einer ONB
e
folgt weiter (∆f ) (v) = ni=1 ∂i ∂i fe (ve ) . Ist beispielsweise V = R2 mit der Standardbasis e = (e1 , e2 ) und den zugehörigen Standardkoordinatenfunktionen (x, y)
dann folgt für die Funktion u = x2 − y 2 , dass ∆u = 0, wenn ∆ mit dem Standardskalarprodukt gebildet wird. Ein weiteres Skalarprodukt auf V hat bezüglich
der Basis e die Gramsche Matrix
Ge =
2 1
1 1
mit der Inversen G−1
e =
1 −1
−1
2
.
Dann folgt für den Laplaceoperator ∆ zu diesem zweiten Skalarprodukt ∆u =
∂x2 + 2∂y2 − 2∂x ∂y u = −2. Der Laplaceoperator hängt also wenig überraschend
wie der Gradient von der Wahl des Skalarprodukts ab.
∆u für radialsymmetrische Funktionen u
Eine Funktion u : V ⊃ U → R ist genau dann invariant unter allen Drehungen um
0, wenn U selbst unter diesen invariant und u konstant auf den Niveauflächen der
Norm von V ist. Eine solche Funktion u wird als radialsymmetrisch bezeichnet.
Lemma 129 Sei r : V → R, p → |p| und sei f : R>0 ⊃ D → R eine C 2 -Funktion.
D sei offen. Für u = f ◦ r ≡ f (r) auf U := {v ∈ V : |v| ∈ D} folgt dann ∆u =
f ′ (r) mit n = dim(V ).
f ′′ (r) + n−1
r
KAPITEL 3. VEKTORANALYSIS
251
Beweis. Zunächst folgt auf U, dass grad (f ◦ r) = f ′ (r) grad (r) = (f ′ (r)/r) · id.
Weiter folgt mit Faulenzerregel 3. von Bemerkung 127 zur Divergenz, dass
>
=
f ′ (r)
f ′ (r)
div (grad (f ◦ r)) = grad
, id +
div (id)
r
r
$
%
′
= ′′
>
f ′ (r)
f ′ (r)
f (r) f ′ (r)
id
f ′ (r)
grad (r) , id + n
· , id + n
=
=
− 2
r
r
r
r
r
r
= f ′′ (r) +
(n − 1) ′
f (r).
r
Beispiel: ∆rα = α (n + α − 2) rα−2 auf V 0 für α ∈ R. (*Daher ist −r/8π bzw
r3 /12 Fundamentallösung von ∆23 bzw ∆21 .)
In den folgenden vier Abschnitten werden reellwertige Funktionen u untersucht,
die auf beinahe ganz V definiert sind und ∆u = λu für ein λ ∈ R erfüllen. Überdies
haben diese Funktionen ein hohes Maß an Symmetrie. Die Fehlstellen im Definitionsbereich von u sind entweder ein einziger Punkt, eine Halbgerade, eine Gerade,
oder eine Ebene. Die hohe Symmetrie reduziert die Gleichung ∆u = λu auf eine
gewöhnliche Differentialgleichung, wodurch solche Funktionen systematisch aufgefunden werden können. Zuerst wird der für die Elektrostatik wichtige Fall λ = 0 behandelt und dann der Fall λ = 0, der in der (zB quantenmechanischen) Streutheorie
benötigt wird. Einige der hier behandelten Funktionen sind Greensche Funktionen
der Laplace- bzw Helmholtzgleichung. Sie werden im zweiten Teil der Vorlesung
weiter behandelt.
3.2.15
Potential einer Punktladung (dim V = n)
Für welche Funktionen f : R>0 → R gilt ∆ (f ◦ r) = 0? Dies gilt genau dann, wenn
f ′ eine Lösung der Differentialgleichung y ′ = 1−n
y auf (x, y) ∈ R>0 × R ist. Die
x
allgemeine maximale Lösung dieser Gleichung lautet y = Cx1−n mit C ∈ R. Also
gilt f ′ (r) = Cr1−n . Daraus folgt durch Integration, dass f(r) eine Funktion des Typs
f (r) =
A
rn−2
+B
für n = 1, 3, 4, ...
A ln (r) + B für n = 2
mit A, B ∈ R ist. Für A = 0 und n > 1 lässt sich f (r) nicht stetig auf V fortsetzen.
Die Funktionen f (r) sind als Potentiale von Flächen-, Linien- und Punktladungen
in der Elektrostatik von Bedeutung. Warum?
Im wichtigsten Fall n = 3 folgt für den Fluss von −grad (Ar−1 + B) = Ar−2 (ιd/r)
durch eine (nach außen orientierte) Kugeloberfläche um 0
=
>
A
ιd
−grad
+B ,
R2 dΩ = 4πA
r
r
∂KR
mit KR = {v ∈ V : |v| < R} . Ist A/r + B für A, B ∈ R ein elektrisches Potential,
dann wird das Integral
>
=
ιd
A
+B ,
R2 dΩ = 4πA · ε0 =: Q
ε0 ·
−grad
r
r
∂KR
KAPITEL 3. VEKTORANALYSIS
252
als die elektrische Ladung des Potentials A/r + B bezeichnet. Die Funktion
Φ=
Q
+B :V
4πε0 r
0→R
heißt daher Potential einer Punktladung der Stärke Q in 0. Die Konstante B ist
durch kein physikalisches Gesetz geregelt und wird meist gleich 0 gewählt.
Im Fall n = 2 folgt für den Fluss von −grad (A ln r + B) = −Ar−1 (ιd/r) durch
eine (nach außen orientierte) Kreislinie um 0
=
>
ιd
−grad (A ln r + B) ,
Rdϕ = −2πA.
r
∂KR
Ist A ln r + B für A, B ∈ R ein elektrisches Potential, dann wird das Integral
=
>
ιd
−grad (A ln r + B) ,
ε0 ·
R2 dΩ = −2πA · ε0 =: σ
r
∂KR
als die elektrische Linienladungsdichte des Potentials A ln r + B bezeichnet.
Die Funktion Φ = −σ (ln (r) /2πε0 ) + B : V 0 → R dient als Potential einer
Linienladungsdichte der Stärke σ durch 0 in folgendem Sinn: Ein homogen geladener,
langer, gerader Draht befinde sich in einem Raum V ′ der Dimension 3. Geht der
Draht, der zu einer unendlichen Geraden hochstilisiert wird, durch 0 ∈ V ′ , dann
wird das orthogonale Komplement zur Geraden als V bezeichnet. In der Nähe des
Drahtes, genügend weit weg von seinen Enden, ist dann das Potential einer solchen
σ
Ladungsverteilung in p ∈ V ′ durch Φ (p) = − 2πε
ln r (p) + B gegeben, wobei r (p) =
0
|p − n n, p | die Norm der Normalkomponente von p zum Einheitsrichtungsvektor
n ∈ V ′ , also den Normalabstand des Punktes p vom Draht bezeichnet.
3.2.16
*Homogene Linienladung: Halbgerade (dim V = 3)
Auf dem Vektorraum V mit dim V = 3 sei ein Skalarprodukt ·, · samt zugehöriger
Norm |·| gewählt. Für ein e ∈ V mit |e| = 1 und ζ ∈ R≥0 ist auf V ζe das Skalarfeld
ϕζ mit ϕζ (p) = 1/ |p − ζe| definiert und erfüllt ∆ϕζ = 0. Der Fluss von − grad ϕζ
durch eine Kugeloberfläche um ζ · e hat den Wert 4π.
Können die Potentiale ϕζ für alle ζ im Intervall 0 < ζ < ∞ mit konstantem
Gewicht zu einer neuen Lösung der Laplacegleichung aufaddiert werden? Genauer:
gelingt es, das Integral
L
IL (p) =
0
ϕζ (p) dζ
für p ∈ V [0, L] · e und L > 0 zu berechnen, und definiert p → limL→∞ IL (p) auf
V R≥0 · e eine Lösung der Laplacegleichung?
, ,2
Mit der Zerlegung p = p⊥ + e, p e = p⊥ + ze und ρ2 = ,p⊥ , folgt
L
0
L−z
dζ
IL (p) =
ρ2
+ (ζ − z)
2
=
−z
dζ
ρ2 + ζ 2
.
KAPITEL 3. VEKTORANALYSIS
Für alle x ∈ R gilt
ln x +
√
1 + x2
253
′
1
=√
.
1 + x2
Damit folgt für ρ2 > 0
ρ2 + (L − z)2 − ln −z + ρ2 + z 2
/
z
ρ2
z 2
= ln (L) + ln 1 − +
+
1
−
− ln −z +
L
L2
L
IL (p) = ln L − z +
ρ2 + z 2 .
Der Grenzwert von IL (p) für L → ∞ existiert offenbar nicht, aber es gilt für alle p
mit ρ2 > 0
lim (IL (p) − ln L) = ln 2 − ln −z +
L→∞
ρ2 + z 2 = ln 2 − ln (|p| − e, p ) .
Für ρ2 = 0 existiert das Integral IL (p) genau dann, wenn z ∈ R
mit ρ2 = 0 und z < 0 gilt somit
L−z
IL (p) =
−z
dζ
=
|ζ|
L−z
−z
[0, L] . Für p
z
dζ
= ln (L − z)−ln (−z) = ln (L)+ln 1 −
−ln (−z) .
ζ
L
Daraus folgt für alle p mit ρ2 = 0 und z = e, p < 0
lim (IL (p) − ln L) = − ln (− e, p ) = − ln −
L→∞
2
e, p
2
= ln (2) − ln (−2 e, p )
= ln (2) − ln (|p| − e, p ) .
Damit ist gezeigt, dass für alle p ∈ V
L
lim
L→∞
0
R≥0 · e und für L0 > 0
dζ
L
− ln 2
|p − ζe|
L0
gilt, und die Definition des Skalarfeldes Φe : V
= − ln
|p| − e, p
L0
R≥0 · e → R mit
Φe (p) = ln (|p| − e, p )
ist motiviert. Die Funktion Φe wird nun eingehender untersucht.
Nach der Ungleichung von Cauchy und Schwarz gilt |p|− e, p ≥ 0 für alle p ∈ V.
Zudem gilt |p| − e, p = 0 genau dann, wenn p ∈ R≥0 · e. Für eine konvergente
Punktfolge (pn ) mit pn → p0 ∈ R≥0 · e für n → ∞ ist die Folge der |Φe (pn )|
unbeschränkt. Der Definitionsbereich von Φe ist daher maximal.
Es gilt also auf Ue := V R≥0 · e mit r = |·| , cos θ = e, · /r und 0 ≤ θ ≤ π
Φe = ln (r − e, · ) = ln (r (1 − cos θ)) .
Ist (e1 , e2 , e3 ) eine ONB von V mit den zugehörigen Koordinatenfunktionen (x, y, z) ,
dann folgt für e = e3
Φe = ln
x2 + y 2 + z 2 − z .
KAPITEL 3. VEKTORANALYSIS
254
Die Niveaufläche von Φe mit Φe = ln c für ein c > 0 ist das Rotationsparaboloid mit
z = (x2 + y 2 − c2 ) /2c. Sein Brennpunkt liegt in 0 und seine Leitebene ist gegeben
durch z = −c. Der Schnitt der Niveaufläche Φe = ln c mit der Ebene y = 0 ist
für c = 1 (blau), c = 0, 5 (schwarz) und c = 2 (grün) in Fig. 3.17 zu sehen. Fig.
3.18 zeigt das Gradientenfeld von Φe in der Ebene y = 0. Die Feldlinien von grad Φ
sind ebene Halbparabeln mit Brennpunkt 0, denn genau diese stehen in jedem ihrer
Punkte p senkrecht auf die Niveaufläche von Φ durch p. Sie sind in Fig. 3.17 grau
dargestellt.
z
2
1
0
-2.5
-1.25
0
1.25
2.5
x
-1
-2
Abbildung 3.17: Äquipotentiale und Feldlinien (grau) der Halbgerade
Abbildung 3.18: E-Feld der Halbgerade
Am gemeinsamen Definitionsbereich Ue ∩U−e = V
definiert und erfüllt dort
R·e ist die Funktion Φe +Φ−e
(Φe + Φ−e) (p) = ln (|p| − e, p ) + ln (|p| + e, p ) = ln |p|2 − e, p
2
= 2 ln ρ (p) .
Hier bezeichnet ρ (p) > 0 mit ρ (p)2 = |p|2 − e, p 2 den Abstand von p zur Geraden R·
e. Wir kennen Φe +Φ−e bereits als das Potential einer konstanten Linienladungsdichte
auf der Geraden R·e. Die Funktion Φ−e entsteht durch Spiegelung von Φe am Punkt
0 ∈ V, dh es gilt Φ−e (−p) = Φe (p) für alle p ∈ V R≥0 · e.
Vergewissern wir uns abschließend, dass Φe tatsächlich harmonisch ist.
Lemma 130 ∆Φe = 0.
KAPITEL 3. VEKTORANALYSIS
255
Beweis. Das Gradientenfeld von Φe ergibt sich auf Ue zu
1
grad (r) − e
=
r − e, ·
r − e, ·
grad (Φe ) =
ιdV
−e .
r
Weiter folgt
∆Φe
=
>
div ιdrV − e
grad (r − e, · ) ιdV
= −
,
−e +
r
r − e, ·
(r − e, · )2
,
,2
ιd
V
, ιdV
,
−1
,
, + div r .
=
−
e
,
r − e, ·
(r − e, · )2 , r
Nebenrechnung 1:
,2
,
, ιdV
,
, = 1 |ιdV − re|2 = 1 |ιdV |2 − 2r ιdV , e + r2 |e|2 = 2 (1 − cos θ) .
,
−
e
,
, r
r2
r2
Hier bezeichnet θ (p) ∈ (0, π] den ungerichteten Winkel zwischen p und e. Somit gilt
, ιd
,
, V − e,2
r
(r − e, · )
2
=
2 (1 − cos θ)
2
.
2 = 2
2
r (1 − cos θ)
r (1 − cos θ)
Nebenrechnung 2:
div
ιdV
r
1
div (ιd)
1
= − 2 grad (r) , ιd +
=− 2
r
r
r
=
>
ιd
div (ιd)
2
, ιd +
= .
r
r
r
Somit gilt div ιdrV / (r − e, · ) = 2/r2 (1 − cos θ) , sodass die Behauptung folgt.
Als Nebenprodukt des Beweises für ∆Φe = 0 fiel das Ergebnis
/
,
,
, ιdV
, 1
1
2
1
,
,
|grad (Φe )| =
− e, =
=
,
r − e, ·
r
r 1 − cos θ
r sin (θ/2)
an. Der Betrag der elektrischen Feldstärke einer homogen geladenen Halbgerade
fällt also mit wachsendem Abstand r vom Endpunkt der Halbgerade bei festem
Polarwinkel θ wie 1/r ab. Die Steilheit des Abfalls ist dabei 1/ sin (θ/2) . Auf der
Niveaufläche r = R > 0 ist |grad (Φe )| im Punkt −R · e minimal.
Auf einer Äquipotentialfläche ist r − z konstant und positiv. Auf der Äquipotentialfläche Γc mit Φe = ln (2c) gilt also 0 < 2c = r − z = r (1 − cos θ) . Die Fläche Γc
hat den Scheitelpunkt −c · e bei θ = π. Für den Betrag der Feldstärke auf Γc folgt
/
/
2
1
1 − cos θ
1
θ
|grad (Φe )| =
=
=
= sin .
2
r (r − z)
rc
2c
c
2
Bei Annäherung auf einer Äquipotentialfläche an deren Scheitelpunkt wächst der
Betrag der Feldstärke also mit dem steigenden Polarwinkel θ wie sin θ/2 bzw mit
KAPITEL 3. VEKTORANALYSIS
256
√
dem fallenden Abstand r wie 1/ r. Tatsachen wie diese werden als Erklärung für
Spitzenentladungen angeführt.
Die Zerlegung von gradp Φe nach dem Raum R · e und dessen orthogonales Komplement ist ersichtlich aus
&
'
&
'
gradp Φe = e · e, gradp Φe + gradp Φe − e · e, gradp Φe .
&
'
Es gilt e, gradp Φe = −1/ |p| und daher
gradp Φe = −
e
+
|p|
1
|p| − e, p
p
e
−e +
|p|
|p|
=−
e
p − e, p e
+
.
|p| |p| (|p| − e, p )
Die Komponente −e/ |p| von gradp Φe ist parallel zu e und wird Parallelkomponente genannt. Ihre Norm hat den Wert 1/ |p| . Die Komponente proportional zu
p − e, p e ist senkrecht zu e und heißt daher Normalkomponente. Deren Norm hat
den Wert
|p|2 − e, p 2
1
|p − e, p e|
=
=
|p| (|p| − e, p )
|p| (|p| − e, p )
|p|
=
1
|p|
|p| + e, p
|p| − e, p
1 + cos θ (p)
1
θ (p)
=
cot
.
1 − cos θ (p)
|p|
2
Bei Annäherung an die Halbgerade R≥0 · e bei festem r wächst die Norm der Normalkomponente von grad Φe unbeschränkt an; die Norm der Tangentialkomponente
ist aber konstant. Damit münden die Feldlinien von grad Φe senkrecht in R≥0 · e ein.
3.2.17
*Homogen geladenes Geradenstück (dim V = 3)
Das Potential Φ : V [−L, L]·e → R eines geladenen Geradenstücks der Länge 2L >
0, das den Bereich [−L, L] · e belegt, soll nun aus dem Potential Φe der geladenen
Halbgeraden berechnet werden. Φ ergibt sich durch Addieren des Translats von Φe
um den Vektor −Le und dem Translat von −Φe um den Vektor Le. Es gilt zunächst
für p ∈ V [−L, ∞) · e
Φ (p) = ln (|p + Le| − e, p + Le ) − ln (|p − Le| − e, p − Le )
|p + Le| − e, p + Le
|p + Le| − ( e, p + L)
= ln
= ln
.
|p − Le| − e, p − Le
|p − Le| − ( e, p − L)
Zähler und Nenner des zu logarithmierenden Bruches sind bei Verwendung der
Abstandsfunktionen r± : V → R≥0 von den Punkten ±Le, also für r± (p) = |p ∓ Le|
gegeben durch r± − e, · ± L. Mit u = (r+ + r− ) /2 und v = (r+ − r− ) /2 folgt nun
2
2
wegen uv = r+
− r−
/4 = −L e, · =: −Lz, dass
r± − e, · ±L = u±v−z±L = u±v+
uv
v
v
±L = u±L+(u ± L) = (u ± L) 1 +
.
L
L
L
KAPITEL 3. VEKTORANALYSIS
257
Somit gilt für das Potential der geladenen Strecke [−L, L] · e auf V
Φ = ln
[−L, ∞) · e
r+ + r− − 2L
u−L
= ln
.
u+L
r+ + r− + 2L
Φ hat offenbar eine C ∞ -Fortsetzung nach V
[−L, L] · e. Diese ist invariant unter der Punktspiegelung p → −p und erfüllt ∆Φ = 0. Die Niveauflächen von Φ
sind die Rotationsellipsoide mit den Brennpunkten ±Le. Die Feldlinien sind ebene
Hyperbelasthälften mit den Brennpunkten ±Le. Siehe Fig (3.19).
Abbildung 3.19: Äquipotentiale und Feldlinien eines Geradenstücks
3.2.18
*Inhomogen geladene Halbgerade (dim V = 3)
Kann das Potential Φe einer geladenen Halbgerade mit ∆Φe = 0 auch für dim V = 3
mit dem Ansatz Φe = f (r − e, · ) auf V R≥0 ·e gefunden werden? Sei also V, ·, · , r
wie im Abschnitt über die geladene Halbgerade im dreidimensionalen Raum. Lediglich die Abänderung auf dim V = 3 wird vorgenommen. Es gelte weiterhin e ∈ V
mit |e| = 1. Der Ansatz für Φe ergibt
grad Φe = f ′ (r − e, · ) ·
ιdV
−e
r
und weiter ∆Φe = div grad Φe =
=
>
ιdV
ιdV
ιdV
′′
− e,
− e + f ′ (r − e, · ) · div
−e
f (r − e, · ) ·
r
r
r
=
>
2
ιdV
n
′′
′
−2
= f (r − e, · ) · (r − e, · ) + f (r − e, · ) · −r
, ιdV +
r
r
r
1
=
· [f ′′ (r − e, · ) · 2 (r − e, · ) + (n − 1) f ′ (r − e, · )] .
r
Es gilt also ∆Φe = 0 genau dann, wenn 2xf ′′ (x) + (n − 1) f ′ (x) = 0 für alle
x > 0. Der Raum der maximalen Lösungen dieser Eulerschen Differentialgleichung
KAPITEL 3. VEKTORANALYSIS
258
hat die Basis u1 , u2 : R>0 → R mit u1 (x) = 1 und u2 (x) = x(3−n)/2 . Folglich ist
Φe =
(r − e, · )3−n
eines der gesuchten Skalarpotentiale. Alle weiteren sind vom Typ AΦe + B mit
A, B ∈ R.
Im physikalisch interessanten Fall n = 2 spezialisiert sich Φe zu
√
√
θ
Φe = r − e, · = r (1 − cos θ) = 2r sin2 (θ/2) = 2r sin
2
Hierbei gilt e, · = r cos θ mit 0 < θ ≤ π auf V
(x, y) mit e = e1 gilt
R≥0 ·e. In kartesischen Koordinaten
x2 + y 2 − x.
Φe =
Der Funktionsgraph von Φe (Fig. 3.20) erinnert an einen Schiffskiel.
Abbildung 3.20: Potential Φe einer geladenen Halbachse für dim V = 2
Ist Φe das Potential einer auf R≥0 · e konstanten Linienladungsdichte? Einen
Hinweis darauf gibt die Summe Φe + Φ−e. Ist sie wie im Fall dim V = 3 invariant
unter allen Verschiebungen in Richtung e? Nein, das ist nicht der Fall. Sehen wir
uns daher den Grenzwert der Richtungsableitung von Φe unter e⊥ bei Annäherung
an die Achse R>0 · e an. Es gilt für x > 0
1
∂y Φe =
2
x2
+
y2
−x
·
y
x2 + y 2
=
1
2 x2 + y 2
·
y
x2
+
.
y2
−x
Es gilt weiter bei festgehaltenem x > 0
√
y
y
=
→ 2 für y ց 0.
2
x2 + y 2 − x
x 12 xy + o (y 2 )
√
√
Somit gilt limyց0 ∂y Φe = 1/ 2x und limyր0 ∂y Φe = −1/ 2x . Die Sprunghöhe
√
von ∂y Φe über die Achse R>0 ·e an der Stelle x·e ist 2/x. Sie ist also nicht konstant!
Daher ist auch die Linienladungsdichte von Φe nicht konstant.
KAPITEL 3. VEKTORANALYSIS
3.2.19
259
*Dipolbelegte Halbgerade (dim V = 2)
Auf der geschlitzten Ebene U = R2 R≥0 ·e1 gilt x = r cos ϕ und y = r sin ϕ mit r > 0
und 0 < ϕ < 2π. Daraus folgt auf U, dass (bezüglich des Standardskalarprodukts)
grad ϕ = (−y, x) / (x2 + y 2 ) und weiter
=
>
−2 (x, y)
div (−y, x)
+ (−y, x) ,
= 0.
∆ϕ =
x2 + y 2
(x2 + y 2 )2
Die dehnungsinvariante Polarwinkelfunktion ϕ erfüllt also ∆ϕ = 0 auf U. Die Niveaulinien von ϕ sind offene Halbgerade, die von 0 ausgehen, und die Feldlinien von
grad ϕ sind punktierte Kreise um 0. Nach Einbettung in den R3 kann ϕ als das
Potential der dipolbelegten Halbebene R≥0 · e1 + R · e3 genutzt werden.
3.2.20
Helmholtzgleichung: alle radialen Lösungen
Gesucht sind nun all jene Funktionen f : R>0 → R, für die ∆ (f (r)) = λf (r) für
ein λ ∈ R, die soganannten radialen Lösungen der Helmholtzgleichung auf Rn 0.
Wir beschränken uns auf den Fall n = 3, sodass ∆ (f (r)) = λf (r) zu
2
f ′′ (r) + f ′ (r) − λf (r) = 0
r
(3.21)
auf R>0 äquivalent ist. Mit dem Ansatz f (x) = y (x) /x ergibt sich
f ′ (x) =
y ′ (x) y (x) ′′
2
2
1
− 2 , f (x) = 3 y (x) − 2 y ′ (x) + y ′′ (x) .
x
x
x
x
x
Daher ist Gleichung (3.21) äquivalent zu y ′′ − λy = 0. Für λ = κ2 > 0 mit κ > 0
gilt somit
e−κr
eκr
f (r) = A
+B
r
r
2
mit A, B ∈ R. Für λ = −κ mit κ > 0 hingegen gilt mit A, B ∈ R
f (r) = A
3.2.21
cos (κr)
sin (κr)
+B
.
r
r
Orientierung eines Vektorraums
Im nächsten Abschnitt wird eine weitere Differentiationsvorschrift für dreidimensionale Vektorfelder beschrieben. Ihr Ergebnis, die sogenannte Rotation, ist wieder ein
dreidimensionales Vektorfeld. Zur Bildung der Rotation eines Vektorfeldes wird auf
dem Vektorraum V neben dem Skalarprodukt, das den Winkel- und Längenbegriff
festlegt, eine Formalisierung der anschaulichen Begriffe ’links’ und ’rechts’ benötigt.
Gibt es hilfreichere Erklärungen als jene des Typs „rechts ist dort, wo der Daumen
links ist”? Oder gar eine, die ein Computer verstehen kann?
Die Anweisung „gehe zehn Schritte geradeaus und dann fünf Schritte nach links”
macht nur Sinn, wenn die Person, an welche die Anweisung gerichtet ist, ihre linke
KAPITEL 3. VEKTORANALYSIS
260
von der rechten Hand unterscheiden kann. Sie muss aber auch wissen, welche Richtung mit „geradeaus” gemeint ist. Wollte man einen Taucher im trüben Gewässer
mit solchen Anweisungen wo hinschicken, wird bewusst, dass neben der Richtung
„geradeaus” noch die Orientierung der Körperachse bestimmt sein muss, wenn die
Anweisung „zehn Meter geradeaus und dann fünf Meter nach links” eine Endposition festlegen soll. Die Vorgabe einer Blickrichtung und einer Orientierung der
Körperachse von den Füßen zum Kopf legt also erst fest, was mit links oder rechts
gemeint ist.
Wie aber lässt sich ohne direktes Hinweisen jemandem erklären, was seine rechte
Hand ist? Anstatt Kindern immer wieder zu zeigen, welche Hand es denn ist, die
sie zur Begrüßung zu reichen haben, könnte in unseren Breiten der folgende physikalische Sachverhalt genutzt werden. Steht das Kind bei Sonnenschein aufrecht
irgendwo in der gemäßigten Zone der Nordhalbkugel, kann es ein paar Minuten die
Sonne betrachten und dabei beobachten, in welche Richtung sie wandert. Es bildet
dann in seinem Standpunkt einen Vektor ’nach oben’ und nennt ihn e3 . Dann bildet
es einen Richtungsvektor vom eigenen Standpunkt ’zur Sonne’ und nennt ihn e2 .
Zuletzt wählt das Kind einen Vektor, der in den Halbraum weist, in den sich die
Sonne hineinbewegt. Diesen Vektor nennt es e1 .
Nun kann das Kind ausprobieren, für welche seiner beiden Hände es, so wie in
Abbildung 3.21, den Daumen an e1 , den Zeigefinger an e2 und den Mittelfinger an e3
auszurichten vermag. Diese Hand nennt es fortan seine ’rechte’ Hand und die Basis
e = (e1 , e2 , e3 ) nennt es rechtshändig oder positiv orientierte Basis des Raums aller
möglichen Örter physikalischer Gegenstände. Eine weitere Basis f = (f1 , f2 , f3 ) ,
die ja aus e durch eine invertierbare lineare Abbildung A : V → V mit Aei = fi
hervorgeht, wird ebenfalls als rechtshändig bezeichnet, wenn det A > 0 gilt und als
linkshändig, wenn det A < 0 gilt. Der Fall det A = 0 kann ja nicht eintreten. Die
Menge aller Basen von V zerfällt so in zwei disjunkte Teilmengen von rechts- bzw
linkshändig orientierten Basen.
Hier ein Beispiel: Ist e = (e1 , e2 , e3 ) eine Basis von V, dann sind f = (e2 , e1 , e3 )
und g = (e2 , e3 , e1 ) auch Basen von V. Die Basen e und f sind gegengesetzt orientiert,
während e und g gleichsinnig orientiert sind. Jede Vertauschung zweier benachbarter
Basiselemente führt zu einem Orientierungswechsel. Die Basis g geht durch eine
sogenannte zyklische Vertauschung aus der Basis e hervor. Die Basen e und h =
(e1 , −e2 , e3 ) sind gegengesetzt orientiert, hingegen f und h gleich.
Die eben ausgebreitete Überlegung zeigt, wie ohne Sichtkontakt und Gefuchtel
mit den Händen jemandem erklärt werden kann, was rechts und was links ist. Einem
Kind der Südhalbkugel muss natürlich gesagt werden, dass sich die Sonne von rechts
nach links und nicht von links nach rechts bewegt und dass die nach obiger Regel
erzeugte Basis linkshändig heißt.16 Was aber tun, wenn einer Person unabhängig
von deren Aufenthaltsort unser Begriff von links und rechts nahegebracht werden
soll?
Offenbar wird ein allen Beteiligten zugängliches Objekt benötigt, an dem eine
Orientierung festzumachen ist, weil es bei Raumspiegelung nicht in sich über geht.
16
Wir ignorieren die Komplikationen, die für Bewohner der Tropen auftreten.
KAPITEL 3. VEKTORANALYSIS
261
Abbildung 3.21: Schwerkraft und Sonnengang orientieren den Raum
Ein Ball wie in Abbildung 3.22 etwa, bei dem einer der beiden Pole markiert und ein
Breitenkreis mit einem Orientierungspfeil versehen ist. Den könnte man in Paris neben das Urmeter legen, als Standard der rechtshändigen Orientierung aufbewahren,
und Kopien davon verschicken. So etwas ist aber unnötig, denn die Eigenrotation
der Sonne, die an der Bewegung der Sonnenflecken zu erkennen ist, kann statt dessen überall im Sonnensystem genutzt werden. Versetze dich (nur in Gedanken!) in
den Mittelpunkt M der Sonne. Wähle einen Vektor e1 , der von M zu einem bewegten Sonnenfleck p gerichtet ist. Wähle e2 in die Bewegungsrichtung von p. Richte
schließlich e3 von M auf den Polarstern aus. Die so erzeugte Basis ist rechtshändig.
Abbildung 3.22: Ein Orientierungsstandard und sein raumgespiegeltes Gegenstück
Bewohnt eine außerirdische Person unsere Galaxis, dann ließe sich ihr auf analoge
Weise aus dem Drehsinn unserer Galaxis und einer weiteren eindeutig identifizierten
Nachbargalaxie, zB der kleinen Maghellanschen Wolke, die deutlich außerhalb der
galaktischen Ebene liegt, klar machen, was wir mit links und rechts meinen.
Neben den dauerhaft rotierenden Makroobjekten, die wir der Drehimpulserhaltung verdanken, dient aber auch die schwache Wechselwirkung mikroskopischer Krei-
KAPITEL 3. VEKTORANALYSIS
262
sel als bleibender Orientierungsstandard: Beim Betazerfall polarisierter Kobaltkerne
entstehen in Richtung der Spulenachse Elektronen mit einer bevorzugten Laufrichtung. Die magnetischen Momenterwartungswerte der positiv geladenen Kobaltkerne
richten sich am Magnetfeld B im Inneren der Spule aus.17 Betastrahlen verlassen
dann diese Probe, wie das Wu-Experiment zeigt, eher gegen die Richtung von B als
in dessen Richtung.
Abbildung 3.23: β − -Zerfall polarisierter
60
Co Kerne orientiert den Raum
Inwiefern zeichnet das Wu-Experiment eine Orientierung des Raumes aus? Der
(technische) Strom J in der Spule wechselt aus einer vertikal nach oben weisenden
Richtung e1 in eine auf den Betrachter weisende Richtung e2 . Der Strom J definiert also einen Drehsinn der Ebenen senkrecht zur Spulenachse. Die Richtung e3
zeigt in den Halbraum, in den die β − -aktive Kobaltprobe Elektronen bevorzugt abstrahlt. Die vom Experiment gelieferte Figur 3.23 zeigt: die Basis (e1 , e2 , e3 ) ist eine
linkshändige.
Wie lässt sich eine Orientierung für allgemeine Vektorräume formulieren? Im Fall
eines beliebigen reellen Vektorraumes V endlicher Dimension besteht eine Orientierung des Vektorraums in einer (willkürlichen) Auswahl einer der beiden Teilmengen
gleich orientierter Basen als die Menge der positiv orientierten Basen. Die zweite
Klasse von Basen wird als die Klasse der negativ orientierten Basen bezeichnet.
Im Fall eines 2d reellen Vektorraums besteht eine Basis e = (e1 , e2 ) nur aus
zwei Elementen. Der Halbstrahl R>0 · e2 geht aus R>0 · e1 durch eine Drehung um
einen Winkel θ mit 0 < θ < π hervor. Der Drehsinn dieser Drehung ist durch e
eindeutig festgelegt. Eine Basis als positiv orientiert auszuzeichnen ist somit äquivalent zur Auszeichnung eines Drehsinns der Ebene V als den positiven. Man deutet
ihn grafisch durch einen Kreisbogen mit Pfeil an. Nun ist klar, wie die technische
Stromrichtung einer Spule zur Orientierung der Ebenen senkrecht zur Spulenachse
genutzt werden kann.
17
Das merkt man sich mit einer Eselsbrücke: Der positiv geladene, rotierende Kern stellt einen
Kreisstrom dar. Dieser richtet sich parallel zur technischen Stromrichtung aus. (Amperesches Gesetz). Die Orientierung von magnetischem Moment bzw von Drehimpuls werden beide mit der
’rechten Hand Regel’ aus der Bewegungsrichtung von positiver Ladung bzw Masse gebildet.
KAPITEL 3. VEKTORANALYSIS
3.2.22
263
Rotation eines 3d-Vektorfeldes
Schränkt man ein Vektorfeld in einem n-dim Vektorraum auf eine 2-dim Ebene durch
den Punkt p ein, so kann sich das Feld auf dieser Ebene in der unmittelbaren Umgebung von p mehr oder weniger um p winden. Das Kurvenintegral des Vektorfeldes
längs einer kleinen geschlossenen Kurve γ um p, die in der Ebene verläuft, zeigt eine
Stärke der Windung um p herum an. Lässt man die Kurve auf den Punkt p zusammenschrumpfen und bildet den Limes von Windungsintegral durch Flächeninhalt
der von γ umzingelten Fläche, ergibt sich ein Maß der lokalen Windung um p. Man
nennt sie die Rotation des Vektorfelds in p bezüglich der Ebene. Eine 2-dim Ebene
wird durch ein Paar von Basisvektoren (ei , ej ) mit i < j gekennzeichnet. In einem
n-dim Vektorraum existieren durch jeden Punkt n (n − 1) /2 „linear unabhängige“
Ebenen. Zu jeder solchen Ebene gehört eine Komponente der Rotation in p. Für
n = 3 sind dies 3 Komponenten, die (nach Wahl einer Orientierung) zu einem Vektorfeld zusammengefasst werden können. Für n = 4 sind es schon 6 Komponenten.
Seien also ei , ej zwei Elemente einer Orthonormalbasis von V und sei p im Definitionsbereich des C 1 -Vektorfeldes X. Die Tangentialapproximation an Xi := X, ei
in p besagt, dass
X (p + λei + µej ) , ej = X (p) , ej + λ (∂ie)p Xj + µ ∂je
p
Xj + o ( λei + µej ) .
Daraus folgt für das Kurvenintegral
von X längs einer Kurve γ, die das quadratische
,
ε ε
,
Gebiet p + λei + µej λ, µ ∈ − 2 , 2
mit hinreichend kleinem ε > 0 umschließt,
(
)
ε
ε
X =
X p + ei + tej − X p − ei − tej , ej dt +
2
2
−ε/2
γ
)
ε/2 (
ε
ε
+
X p + ej − tei − X p − ej + tei , −ei dt
2
2
−ε/2
ε/2
Tangentialapproximation der Integranden ergibt
ε/2
X =
γ
0
−ε/2
ε/2
−
ε (∂ie )p X, ej + 2t ∂je
−ε/2
0
ε ∂je
p
p
X, ej
1
X, ei − 2t (∂ie)p X, ei
dt
1
ε/2
dt +
o (ε) dt.
−ε/2
Die in t linearen Terme des Integranden integrieren sich zu 0 auf, sodass folgt
0
1
ε/2
X = ε (∂ie )p X, ej − ∂je p X, ei ·
dt + ε · o (ε)
γ
−ε/2
0
1
e
e
2
= ε (∂i )p X, ej − ∂j p X, ei + o ε2 .
Die Orientierung der Randkurve des Quadrats wurde dabei so gewählt, dass an
die Kante, die in Richtung +ei durchlaufen wird, jene Kante anschließt, die in +ej
KAPITEL 3. VEKTORANALYSIS
264
Richtung durchlaufen wird. Bei Vertauschung von i mit j wechselt das Integral
sein Vorzeichen. Die Fläche des Quadrats ist ε2 und daher gilt
γ
1
ε→0 Fläche
e
lim
γ
X
e
X = ∂i X, ej − ∂j X, ei .
Soll im Fall n = 3 aus Zij = ∂ie X, ej − ∂je X, ei ein Vektorfeld rot (X) gebildet werden, wird eine Konvention benötigt, die etwa sagt, ob Z12 oder Z21 die
3-Komponente ist. Und dabei sollte rot (X) aber von der speziellen Wahl der ONB
unabhängig sein. Dies gelingt erst durch die Auszeichnung der „rechtshändig“ orientierten Basen, für die Z12 die 3-Komponente ist. Im Fall allgemeiner Dimension
spricht man in Ermangelung einer „rechten“ Hand von positiv orientierten Basen.
Das äußere Vektorprodukt in einem 3-dim Vektorraum, das zu einem Skalarprodukt ·, · gehört, spielt bei der Definition der Rotation eine wichtige Rolle. Daher
sei an die Definition des äußeren Produktes erinnert. Sie benötigt neben einem Skalarprodukt von V auch eine Orientierung von V.
Definition 131 Der reelle, orientierte Vektorraum V habe die Dimension 3 und
·, · sei ein Skalarprodukt von V. Das vektorielle Produkt zu Skalarprodukt und Orientierung von V ist die schiefsymmetrische, bilineare Abbildung × : V × V → V mit
e1 ×e2 = e3 , e3 ×e1 = e2 , e2 ×e3 = e1 für eine beliebig gewählte positiv orientierte
ONB e.
Das vektorielle Produkt ist unabhängig von der Wahl von e, soferne e aus der
Klasse der positiv orientierten Basen gewählt ist.
Definition 132 Der reelle Vektorraum V habe die Dimension 3 und ·, · sei ein
Skalarprodukt von V. Eine Orientierung von V sei gewählt. Sei U ⊂ V offen und
X : U → V ein C 1 -Vektorfeld mit den Komponentenfunktionen X i : U → R bezügt
lich einer positiv orientierten ONB e, d.h. X = e · (X 1 , X 2 , X 3 ) . Dann heißt das
t
Vektorfeld rot (X) = e · (∂2e X 3 − ∂3e X 2 , ∂3e X 1 − ∂1e X 3 , ∂1e X 2 − ∂2e X 1 ) die Rotation
von X. Sein Wert im Punkt p wird als rotp (X) notiert. Formal gilt

  1 
∂1
X




∂2
X 2  .
×
rot (X) = e ·
∂3
X3
Nach Definition 122 ist für dim (V ) = 3 ein C 1 -Vektorfeld X genau dann rotationsfrei, wenn rot (X) = 0 gilt. Das komponentenweise definierte Vektorfeld rot (X)
ist unabhängig von der Wahl von e, soferne e nur eine positiv orientierte ONB ist.
Eine explizit basisfreie Definition der Rotation ist über den Cartanschen Kalkül der
Differentialformen möglich. Außerdem zeigt diese Theorie was die Rotation im Fall
höherdimensionaler Räume ist. Historisch gab die Abänderung der ätherbezogenen
Maxwellgleichungen, in denen die Rotation ja vorkommt, zu einer relativistischen
Feldgleichung den Anstoß zur Entwicklung dieses Kalküls.
KAPITEL 3. VEKTORANALYSIS
265
Der klassische Satz von Stokes gibt der Rotation eines Vektorfeldes eine recht
anschauliche Bedeutung. Er besagt, dass der Fluss der Rotation durch eine stückweise glatt berandete, kompakte 2-dimensionale Fläche mit dem Wegintegral des
Vektorfeldes längs des zugehörig orientierten Randes übereinstimmt. Die Sätze von
Gauß und von Stokes sind n = 3 Spezialfälle eines weitaus allgemeineren Satzes über
die Integration von Differentialformen im (äußeren) Differentialkalkül von Cartan.
Diese Theorie bringt die begriffliche Struktur der Vektoranalysis viel besser zum
Vorschein als die hier skizzierte klassischen Vorstufe.
3.2.23
Faulenzerregeln zur Rotation
Rotation von Einheits- und Drehvektorfeld mit Koordinaten
Der reelle Vektorraum V habe die Dimension 3 und ·, · bezeichne ein Skalarprodukt
von V. Eine Orientierung von V sei gewählt. Für das Einheitsvektorfeld ιd : V → V
gilt offenbar rot (ιd) = 0. Für das Drehvektorfeld Ln : V → V mit Ln (p) = n × p für
ein n ∈ V gilt rot (Ln ) = 2n, denn

  2 3

 1

∂1
n x − n3 x2
n + n1
rot (Ln ) = e ·  ∂2  ×  n3 x1 − n1 x3  = e ·  n2 + n2  = 2n.
∂3
n1 x2 − n2 x1
n3 + n3
Das Vektorfeld LB/2 dient wegen rotLB/2 = B als Vektorpotential der konstanten
magnetischen Flussdichte B im Inneren einer unendlich langen Spule.
Faulenzerregeln
Sei λ ∈ R, und seien f : U → R und X, Y : U → V vom C 1 -Typ, mit U ⊂ V offen
und dim(V ) = 3. Dann gilt
1. rot (λX + Y ) = λ rot (X) + rot (Y ) ,
2. rot (f X) = grad (f ) × X + f rot (X) (Regel 1. ist hierin enthalten),
3. div (X × Y ) = rot (X) , Y − X, rot (Y ) ,
4. grad X, Y = X × rot (Y ) + Y × rot (X) + [Y ] X + [X] Y,
5. grad X, X = 2 (X × rot (X) + [X] X) ,
6. rot (X × Y ) = X div (Y ) − Y div (X) − [X] Y + [Y ] X,
7. rot (R ◦ X ◦ R−1 ) = det (R) · (R ◦ rot (X) ◦ R−1 ) für R ∈ O (V ) ,
8. Die folgende Regel18 benötigt die Wahl einer (beliebigen) Basis e = (e1 , e2 , e3 )
von V. Ist X : U → V vom C 2 -Typ, mit X = 3i=1 Xei · ei , dann gilt
3
rot (rot (X)) = grad div (X) −
18
i=1
∆Xei · ei .
Achtung: Diese Regel ist nicht naiv auf die Zerlegung von X nach einer krummlinigen Kartenbasis zu übertragen.
KAPITEL 3. VEKTORANALYSIS
266
Rotation von Ln koordinatenfrei
Mit Regel 6. kann das Ergebnis rot (Ln ) = 2n koordinatenfrei erhalten werden: Es
gilt Ln = X × Y mit X = n und Y = ιd. Daraus folgt wegen der Konstanz von X
und unter Beachtung von [X] Y = dY (X) = Y (X) = X
rot (Ln ) = rot (X × Y ) = X div (Y ) − [X] Y = 3n − n = 2n.
Rotation des freien Vortexfeldes
Benutzen wir diese Regeln, um die Rotation des freien Vortex X : V R· n → V mit
X (p) = n × p/ |n × p|2 zu berechnen. Für den freien Vortex X gilt also X = f L mit
f = |L|−2 . Sei oEdA |n| = 1. In diesem Fall stimmt |L (p)| mit dem Normalabstand
des Punktes p von der Achse R · n überein. Warum? Für alle a, b, c, d ∈ V gilt
a × b, c × d = a, c b, d − a, d b, c . Daraus folgt
L (p) , L (p) = n × p, n × p = |p|2 − n, p 2 .
Somit stimmt |L (p)| mit dem Normalabstand des Punktes p von der Achse R · n
überein.
Wollen wir die dritte Regel bei der Berechnung von rot (f L) nutzen, benötigen
wir den Gradienten von |L| . Den berechnen wir uns über die Kettenregel
gradp |L| = gradp
L, L =
1
2
L (p) , L (p)
gradp L, L .
Nun brauchen wir gradp L, L :
gradp L, L = gradp |·|2 − n, ·
Es gilt daher
gradp |L| =
2
= 2 (p − n n, p ) .
(p − n n, p )
|L (p)|
(Das wäre auch zu erraten gewesen, da ja |L (p)| gerade die Norm der Komponente
von p senkrecht zu R · n ist.)
Damit folgt aus der dritten Faulenzerregel zur Rotation
−2
1
rotp (L)
3 gradp |L| × L (p) +
|L (p)|
|L (p)|2
−2 p − n n, p
2n
=
× (n × p) +
.
3
|L (p)|
|L (p)|
|L (p)|2
rotp (X) =
Nun gilt für das iterierte Kreuzprodukt dreier Vektoren a, b, c ∈ V :
a × (b × c) = b a, c − c a, b .
Daraus ergibt sich wegen |n| = 1
[p − n n, p ] × (n × p) = n p, p − p p, n − n, p (n n, p − p n, n )
= n |p|2 − n, p 2 = n |L (p)|2 .
KAPITEL 3. VEKTORANALYSIS
267
Daraus folgt nun schließlich rot (X) = 0.
Ohne jede Rechnerei lässt sich diese Tatsache aber, wie bald klar sein wird, auch
aus dem folgenden Satz erschließen.
Satz 133 Sei U ⊂ V offen und dim(V ) = 3. Die Abbildungen f : U → R und
X : U → V seien C 2 . Dann gilt 1) rot (grad (f)) = 0, und 2) div (rot (X)) = 0.
Beweis. Für Teil 1 benützt man eine positiv orientierte ONB e, sodass mit
Unterdrückung der Basisindizierung die Behauptung aus ∂i ∂j f = ∂j ∂i f folgt:

 



∂1
∂1 f
∂2 ∂3 f − ∂3 ∂2 f
rot (grad (f)) = e ·  ∂2  ×  ∂2 f  = e ·  ∂3 ∂1 f − ∂1 ∂3 f  = 0.
∂3 f
∂1 ∂2 f − ∂2 ∂1 f
∂3
Teil 2 folgt analog mit
div (rot (X)) = ∂1 ∂2 X 3 − ∂3 X 2 + ∂2 ∂3 X 1 − ∂1 X 3 + ∂3 ∂1 X 2 − ∂2 X 1 = 0.
Die Definition von Rotation und Divergenz über Limesprozesse macht
div (rot (X)) = 0 und rot (grad (f)) = 0
ohne jede Rechnung klar. Die Komponenten der Rotation von X in p ergeben sich
aus den Wegintegralen von X längs einer Familie von geschlossenen, ebenen Kurven
um p in einem Grenzprozess kleiner werdender Kurven. Ist X ein Gradientenfeld, so
hat jedes dieser Integrale den Wert 0. Der Quotient aus Wegintegral und umlaufenem
Flächeninhalt strebt somit erst recht gegen 0.
Die Divergenz eines Vektorfeldes Y in p ergibt sich aus den Oberflächenintegralen
von Y durch geschlossene Flächen, die p einschließen. (Wir haben in einer heuristischen Motivation des Divergenzbegriffes die Oberfläche von Würfeln benützt.) Ist
das Vektorfeld Y die Rotation eines Vektorfeldes X, dann stimmt nach dem Satz
von Stokes das Oberflächenintegral von Y mit dem Integral von X längs des Randes
der gewählten Fläche überein. Für jede geschlossene Fläche ist aber der Rand leer.
Somit hat das Oberflächenintegral von Y über eine geschlossene Fläche den Wert 0.
Damit folgt div (rot (X)) = 0.
Da für |n| = 1 der freie Vortex X überall, mit Ausnahme einer Halbebene, mit
dem Gradientenfeld des Polarwinkels in der Ebene senkrecht zu n übereinstimmt,
siehe Abschnitt 3.1.14, ergibt sich ohne Rechnung rot (X) = 0.
3.2.24
Existenz von (Vektor)Potentialen
Der folgende Satz gibt Umstände an, unter denen durch einfaches Differenzieren des
Vektorfeldes X festgestellt werden kann, ob es zu X ein skalares oder ein Vektorpotential gibt. Teil 1 ist ein Spezialfall von Satz 125.
Satz 134 Sei U ⊂ V offen, sternförmig und dim(V ) = 3. Dann gilt:
KAPITEL 3. VEKTORANALYSIS
268
1. Ist X : U → V vom C 1 -Typ mit rot (X) = 0, dann existiert eine C 2 -Funktion
f : U → R mit X = grad (f) , das skalare Potential von X.
2. Ist X : U → V vom C 1 -Typ mit div (X) = 0, dann existiert ein C 2 -Vektorfeld
Y : U → V mit X = rot (Y ) , das Vektorpotential von X.
Beweis. Ein Beweis ist auf pp. 362-364 von [10] und pp. 158-160 von [11] angegeben. Dieser Beweis gibt eine explizite Konstruktion von Potentialen f bzw. Y an. Sei
p0 ein Punkt im Definitionsbereich U von X, sodass γ p (t) := p0 + t (p − p0 ) ∈ U für
alle p ∈ U und t ∈ [0, 1]. Ist X rotationsfrei, dann ist die Skalarfunktion f : U → R
mit
= 1
>
f(p) :=
X=
X γ p (t) dt, (p − p0 )
γp
0
ein skalares Potential von X. Ist X divergenzfrei, dann ist das Vektorfeld Y : U → V
mit
1
Y (p) := (p0 − p) ×
tX γ p (t) dt
0
ein Vektorpotential von X. Mit diesen Ansätzen bleibt dann nur mehr zu zeigen,
dass grad (f) = X bzw. rot Y = X, falls X rotationsfrei bzw. divergenzfrei ist.
3.2.25
*Lorentzkraft: Lagrange- und Hamiltonfunktion
Die Newton’sche Bewegungsgleichung eines geladenen Massenpunktes in einem vorgegebenen, zeitabhängigen, elektromagnetischen Feld schränkt die möglichen Ortsgeschichten des Massenpunktes
γ:R⊃I→Ω⊂V
dadurch ein, dass die Gültigkeit der Differentialgleichung zweiter Ordnung
mγ̈ (t) = e [E (t, γ (t)) + γ̇ (t) × B (t, γ (t))]
(3.22)
angenommen wird. Dabei bezeichnet m ∈ R>0 die Masse, e ∈ R die elektrische
Ladung des Massenpunkts. V ist ein dreidimensionaler, orientierter, reeller Vektorraum. ·, · bezeichnet ein Skalarprodukt von V. In einer offenen und einfach
zusammenhängenden Teilmenge Ω von V könne sich das Teilchen bewegen, d.h. die
zeitliche Abfolge der Orte des Teilchens ist durch eine C 2 -Kurve γ : I → Ω beschrieben, wobei I ein reelles Intervall ist. Das elektromagnetische Feld ist ein Paar von
zeitabhängigen Vektorfeldern auf Ω ⊂ V, d.h. Abbildungen
E, B : R × Ω → V.
Die beiden Funktionen E, B seien stetig. Die rechte Seite von Gleichung (3.22) ist
nach dem niederländischen Physiker H A Lorentz (1853 - 1928) benannt. Diese
’Lorentzkraft’ erklärt die gekrümmten Bahnen eines schnell bewegten Teilchens in
einem homogenen Magnetfeld.
KAPITEL 3. VEKTORANALYSIS
269
Für ein systematisches Studium Newton’scher Bewegungsgleichungen ist es nützlich, jedem solchen Gleichungssystem zweiter Ordnung eine Lagrangefunktion zuzuordnen, aus der sich die Bewegungsgleichung durch Differenzieren ableiten lässt. In
einem sehr vagen Sinn ist die Lagrangefunktion einer Bewegungsgleichung so etwas
wie das Potential eines Vektorfeldes. Im gegenwärtigen Kontext ist die Lagrangefunktion L eine C 2 -Funktion
L : R × Ω × V → R,
sodass die Lorentzgleichung (3.22) äquivalent ist zur sogenannten Euler-Lagrange
Gleichung der Lagrangefunktion L, also zu19
d
gradγ̇(t) L (t, γ (t) , ·) = gradγ(t) L (t, ·, γ̇ (t)) .
dt
(3.23)
Tatsächlich existiert eine solche Funktion L. Sie enthält als Bausteine die folgenden Potentiale Φ, A der Funktionen E und B. Dass es diese Potentiale gibt, ist nicht
selbstverständlich, sondern eine Folge der Naturgesetze, die die zulässigen Funktionen E, B einschränken. (Die Maxwellgleichungen gelten auf R × Ω und Ω ist einfach
zusammenhängend.) Es existieren also Funktionen
Φ : R × Ω → R und A : R × Ω → V,
sodass für alle (t, x) ∈ R × Ω
E (t, x) = −gradx Φ (t, ·) −
1∂
A (t, x) und cB (t, x) = rotx A (t, ·)
c ∂t
gilt.20 Die Konstante c ∈ R>0 hat den Wert der Lichtgeschwindigkeit und ist im
gegenwärtigen Kontext belanglos, da sie durch Übergang von A zu A/c aus allen
hier behandelten Aussagen zum Verschwinden gebracht wird. Sie gewinnt erst Substanz, wenn die Gesetze für E und B ausformuliert werden. Dann erweist es sich als
praktisch, die Potentiale so zu dimensionieren, wie es hier geschehen ist.
Satz 135 Sei Ω ⊂ V offen und einfach zusammenhängend. Dann ist die EulerLagrange Gleichung (3.23) zur Lagrangefunktion L : R × Ω × V → R mit
(v
)
m
L (t, x, v) = |v|2 − e Φ (t, x) −
, A (t, x)
2
c
zur Lorentzgleichung (3.22) äquivalent. Hierbei gilt |v|2 = v, v .
Beweis. Es gilt mit der Abkürzung A/c = α
gradxL (t, ·, v) = e [−gradxΦ (t, ·) + gradx v, α (t, ·) ] ,
gradv L (t, x, ·) = mv + eα (t, x) .
19
Hier bezeichnet etwa L (t, ·, v) : Ω → R die Funktion, für die gilt L (t, ·, v) : x → L (t, x, v) .
Es existieren unendlich viele verschiedene solche Potentiale zu ein und demselben Paar (E, B).
Man nennt dies die Eichfreiheit bei der Auswahl von (Φ, A) .
20
KAPITEL 3. VEKTORANALYSIS
270
Daraus folgt für die linke Seite der Euler-Lagrange Gleichung
d
d
gradγ̇(t) L (t, γ (t) , ·) =
[mγ̇ (t) + eα (t, γ (t))]
dt
dt
3
= mγ̈ (t) + e [∂t α] (t, γ (t)) + e
j=1
[γ̇ (t)]γ(t) αj (t, ·) δ j
= : mγ̈ (t) + e [∂t α] (t, γ (t)) + e [γ̇ (t)]γ(t) α (t, ·) .
Hier ist (δ j ) eine Basis von V und α (t, x) = 3j=1 αj (t, x) δ j für alle (t, x) ∈ R × Ω.
Für die rechte Seite der Euler-Lagrange Gleichung ergibt sich
gradγ(t) L (t, ·, γ̇ (t)) = e −gradγ(t) Φ (t, ·) + gradγ(t) γ̇ (t) , α (t, ·) .
Somit ist die Euler-Lagrange Gleichung äquivalent zu mγ̈ (t) =
e −gradγ(t) Φ (t, ·) − [∂t α] (t, γ (t)) + gradγ(t) γ̇ (t) , α (t, ·) − [γ̇ (t)]γ(t) α (t, ·)
= e E (t, γ (t)) + gradγ(t) γ̇ (t) , α (t, ·) − [γ̇ (t)]γ(t) α (t, ·) .
Sehen wir uns die letzten beiden Terme der rechten Seite dieser Newton’schen
Bewegungsgleichung an. Sie sind mit (t, x, v) ∈ R × Ω × V vom Typ
gradx v, α (t, ·) − [v]x α (t, ·) .
Andererseits gilt analog zur Tripelvektorproduktformel a×(b × c) = b a, c −c a, b
v × rotx α (t, ·) = gradx ( v, α (t, ·) − [v]x α (t, ·)) .
(Komponentenweises Nachrechnen mit einer positiv orientierten Orthonormalbasis
beruhigt vielleicht noch etwas.) Also gilt tatsächlich
mγ̈ (t) = e (E (t, γ (t)) + γ̇ (t) × B (t, γ (t))) .
Die Umformung der Bewegungsgleichung zweiter Ordnung (3.22) in eine Bewegungsgleichung erster Ordnung auf einem geeigneten Phasenraum kann durch
Einführung einer Hamiltonfunktion H als Legendretransformierter von L erreicht
werden. Die Hamiltonfunktion ist festgelegt durch p (t, x, v) = gradv L (t, x, ·) und
H (t, x, p (t, x, v)) = v, p (t, x, v) − L (t, x, v) für alle (t, x, v) ∈ R × Ω × V.
Daraus folgt wegen p (t, x, v) = mv + ec A (t, x)
(
) m
(v
)
e
H (t, x, p (t, x, v)) = v, mv + A (t, x) − |v|2 + e Φ (t, x) −
, A (t, x)
c
2
c
m 2
=
|v| + eΦ (t, x)
2 ,
,2
e
1 ,
,
=
,p (t, x, v) − A (t, x), + eΦ (t, x) ,
2m
c
KAPITEL 3. VEKTORANALYSIS
271
also H : R × Ω × V → R mit
,2
e
1 ,,
,
,p − A (t, x), + eΦ (t, x) .
2m
c
Die nichtautonome Hamiltonsche Bewegungsgleichung erster Ordnung am Phasenraum Ω × V lautet somit γ̇ (t) = XH (t, γ (t)) mit dem zeitabhängigen Hamiltonvektorfeld XH (t, ·) : Ω × V → V × V
H (t, x, p) =
XH (t, x, p) = (gradp H (t, x, ·) , −gradx H (t, ·, p)) .
3.2.26
*Vektorpotential des freien Vortexfeldes
Sei V dreidimensional und eine Orientierung sei gewählt. Sei n ∈ V mit |n| = 1 und
sei X : V R · n → V mit X (p) = n × p/ |n × p|2 . Bis auf einen konstanten Faktor
stimmt X mit dem Magnetfeld eines unendlich langen stromführenden Drahtes der
Dicke 0 überein. Gesucht ist ein Vektorfeld Y : V R · n → V mit X = rot (Y ) .
Versuche den Ansatz Y (p) = f (|n × p|) n mit einer C 1 -Funktion f : R>0 → R.
Daraus folgt mit L (p) = n × p für p ∈ V R · n
rotp (Y ) = gradp (f ◦ |L|) × n = f ′ (|n × p|) gradp |L| × n.
Aus dem Abschnitt über die Rotation des freien Vortex ist bekannt, dass
gradp |L| =
Daraus folgt für p ∈ V
(p − n n, p )
für alle p ∈ V
|L (p)|
R·n
rotp (Y ) = f ′ (|n × p|)
R · n.
(p − n n, p )
f ′ (|n × p|)
×n=−
n × p.
|L (p)|
|L (p)|
Es gilt also rotp (Y ) = X (p) = n × p/ |n × p|2 genau dann, wenn f ′ (|n × p|) =
−1/ |n × p| . Dies ist genau dann der Fall, wenn ein A ∈ R existiert, sodass f (x) =
− ln (x) + A für alle x > 0.
Somit ist das Vektorfeld Y : V R · n → V mit
Y (p) = − (ln |n × p|) n + An
für eine beliebe Zahl A ∈ R ein Vektorpotential des freien Vortexfeldes X. Das
konstante Vektorfeld An = grad An, · trägt zu rot (Y ) nicht bei. Weitere Vektorpotentiale ergeben sich aus Y durch Übergang zu Y + gradφ mit einer beliebigen
C 2 -Funktion φ : V R·n → R. (In der Elektrodynamik wird diese Unterbestimmtheit
eines Vektorpotentials als „Eichfreiheit“ bezeichnet.)
Der Definitionsbereich V R · n von X ist nicht sternförmig. Daher garantiert
Satz 134 die Existenz des vorliegenden Vektorpotentials Y nicht. Nimmt man aus
V
R · n jedoch eine Halbebene heraus, die von R · n berandet ist, so ist dieses
Gebiet sternförmig. Für dieses Gebiet garantiert Satz 134 die Existenz eines Vektorpotentials Y. Wir haben ein solches gefunden, das eine C 2 -Fortsetzung auf ganz
V R · n hat. Dass eine solche Fortsetzbarkeit nicht immer gegeben ist, zeigt der
spätere Abschnitt über das Vektorpotential eines Punktmonopols.
KAPITEL 3. VEKTORANALYSIS
3.2.27
272
*Vektorpotential des Punktdipols
Sei V dreidimensional und orientiert. Ein Skalarprodukt ·, · sei gewählt. Das elektrische Feldstärkefeld E oder magnetische Flussdichtefeld21 B eines Punktdipols mit
dem elektrischen bzw magnetischen Dipolmoment m ∈ V, das in 0 ∈ V ruht, stimmt
für p ∈ V 0 mit dem Vektorfeld X : V 0 → V überein, für das
X (p) =
γ
|p|3
3
m, p
p−m
|p|2
für alle p ∈ V
0
gilt. Dabei ist im elektrischen Fall γ = 1/4πε0 und im magnetischen Fall γ = µ0 /4π
zu setzen.22 Es folgt daraus div X = 0. Gibt es ein Vektorfeld A : V 0 → V mit
X = rot A?
Mit dem durch die Drehinvarianz von X um die Achse R · p motivierten Ansatz
A (p) = f (|p|) Lm (p) = f (|p|) m × p folgt rotp A =
f ′ (|p|)
p
f ′ (|p|)
× (m × p) + f (|p|) rotp Lm =
m |p|2 − p m, p
|p|
|p|
m, p
= (f ′ (|p|) |p| + 2f (|p|)) m − f ′ (|p|)
p.
|p|
+ f (|p|) 2m
Die Bedingung X = rot A ist genau dann überall erfüllt, wenn für alle p = 0
−f ′ (|p|)
m, p
γ
m, p
und f ′ (|p|) |p| + 2f (|p|) = − 3
= 3γ
5
|p|
|p|
|p|
gilt. Dies ist äquivalent zu
−f ′ (|p|) = 3
γ
γ
γ
für alle p = 0.
4 und − 3
3 + 2f (|p|) = −
|p|
|p|
|p|3
Die zweite dieser Gleichungen ist äquivalent zu f (|p|) = γ/ |p|3 (für alle p = 0) und
die erste ist dann auch erfüllt.
Ergebnis: Für das Vektorfeld A : V
0 → V mit A (p) = γm × p/ |p|3 gilt
X = rot A. Das Feld A ist homogen vom Grad −2 und divergenzfrei.
3.2.28
*Das elektromagnetische Nahfeld eines Pulsars
Pulsare werden heute als Überreste einer Supernovaexplosion gedeutet. In diesem
Bild rotiert eine Kugel mit dem Radius R ≈ 10 km und einer Masse von ungefähr
21
Das Vektorpotential eines magnetischen Dipols ist für die Physik viel wichtiger als das Vektorpotential eines elektrischen Dipols, da in die Lagrangefunktion eines geladenen Teilchens einerseits
das Vektorpotential des magnetischen und andererseits das skalare Potential des elektrischen Feldes, welche gemeinsam auf das Teilchen einwirken, eingehen.
22
Das magnetische Dipolmoment einer ’kleinen’, ebenen stromführenden Leiterschleife hat den
Betrag IA, wenn I die Stromstärke im Leiter und A der Flächeninhalt des von der Schleife berandeten ebenen Gebietes ist. Der Vektor m liegt in der Achse senkrecht zur Schleife und ist so
orientiert, dass die technische Stromrichtung rechtshändig um m rotiert.
KAPITEL 3. VEKTORANALYSIS
273
einer Sonnenmasse mit einer Periode T von einigen Millisekunden bis einigen Sekunden. Das magnetische Moment des explodierten Sternes ist so wie ein erheblicher
Teil seiner Masse und seines Eigendrehimpulses im verdichteten Rest konserviert.
Seine Leptonenzahl hingegen strahlt der explodierende Sternkern über Neutrinos
weitgehend ab und wird so zu einem Neutronenstern, einem gravitativ gebundenden
Riesenbaryon mit der Massendichte eines Atomkerns. Beim Schrumpfen des Sternradius von 106 km auf 10 km steigt die magnetische Flussdichte an der Sternoberfläche
um den Faktor 1015 an.
Fällt das magnetische Moment eines Neutronensterns nicht auf seine Drehachse,
dann rotiert das Magnetfeld des Sterns und regt das umgebende ionisierte Gas zu
scharf ausgerichteter elektromagnetischer Abstrahlung in Richtung der momentan
vorliegenden magnetischen Achse an. Überstreicht ein solcher Scheinwerferkegel bei
seiner Rotation auch noch die Erde, dann macht sich der Neutronenstern in einem
breiten Frequenzbereich als pulsierende Strahlungsquelle bemerkbar.
Der Pulsarmittelpunkt wird in den Punkt 0 ∈ V gesetzt. Er rotiere mit der
Kreisfrequenz ω = 2π/T > 0 im Rechtsschraubensinn um die Achse R · n für ein
n ∈ V mit |n| = 1. Sein magnetisches Moment zur Zeit t sei eωtLn m ∈ V. Für
Punkte p ∈ V mit R < |p| ≪ cT kann23 das exakte Flussdichtefeld B durch die
quasistatischer Näherung B0 : R × (V 0) → V mit
γ
B0 (t, p) = 3
|p|
3
'
& ωtL
e n m, p
|p|2
p − eωtLn m
genähert werden. Für das Vektorpotential A0 : R × (V 0) → V mit rot A0 (t, ·) =
B0 (t, ·) gilt dann A0 (t, p) = γ eωtLn m × p/ |p|3 mit γ = µ0 /4π. Damit geht ein
elektrisches Feld E0 einher. Diese erfüllt im Bereich R < |p| ≪ cT
E (t, p) ≈ E0 (t, p) = −∂t A0 (t, p) = −γωn ×
eωtLn m × p
|p|3
.
Die beiden Felder E0 und B0 erfüllen offenbar die homogene Maxwellgleichung
rotE0 (t, ·) + ∂t B0 (t, ·) = 0. Zudem gilt auf V 0
div B0 (t, ·) = 0,
rot B0 (t, ·) = 0,
div E0 (t, ·) = 0.
Die (inhomogene) Maxwellgleichung rot B = µ0 j + ε0 µ0 ∂t E wird von den quasistatischen Näherungsfeldern E0 und B0 jedoch nicht erfüllt, da ja j = 0 und ∂t E0 = 0,
aber rot B0 (t, ·) = 0 überall auf V 0 gilt.
Der Betrag von B0 beträgt an den magnetischen Polen 2γ |m| /R3 = µ0 |m| /R3 2π.
Wenn die kolportierten Flussdichten von bis zu 108 Tesla korrekt sind, dann hätte
das magnetische Dipolmoment eines solchen Pulsars einen Betrag von
|m| = 2πR3 ·
23
108 T
= 2π · 104 m
µ0
3
·
108 T
1
= · 1027 A m2 .
−7
4π · 10 T m/ A
2
c bezeichnet die Vakuumlichtgeschwindigkeit. Also liegt cT bei nur 300 km für T = 1 ms.
KAPITEL 3. VEKTORANALYSIS
274
Das Dipolmoment der Erde beträgt etwa 7, 7 · 1022 A m2 . Die Querschnittsfläche
der Erde ist π · 63802 · 106 m2 = 1, 3 · 1014 m2 . Eine Leiterschleife von der Größe
des Erdäquators müsste also einen Strom von ca 108 A führen, um eine solches
Dipolmoment zu erzeugen. Im Fall des Pulsars hätte der Strom eine Stärke von ca
1018 A. Der Betrag des elektrischen Feldes E0 hat an der Oberfläche des Sterns eine
Größenordnung von Rω · 108 T. Für R = 104 m und ω = 2π · 10 Hz ergibt dies einen
Wert von etwa 104 · 2π · 10 · 108 T m s−1 = 2π · 1013 V m−1 . Bis in eine Entfernung von
100 · R sinkt die elektrische Feldstärke auf 10−4 · 2π · 1013 V m−1 = 2π · 109 V m−1 ab.
3.2.29
*Uneigentliches Vektorpotential A′ eines Monopols
Zur Illustration der Sätze 133 und 134 dient uns das elektrische Feldstärkefeld X einer Punktladung in 0 ∈ V mit dim(V ) = 3. Es gilt X : V 0 → V, X (p) := p/ |p|3 .
Hat X ein skalares und ein Vektorpotential? Die nach Satz 133 dafür notwendigen
Bedingungen sind wegen div (X) = 0, rot (X) = 0 erfüllt. Da U := V
0 nicht
sternförmig (aber einfach zusammenhängend) ist, sind jedoch die hinreichenden Bedingungen von Satz 134 nicht gegeben. Nur eine etwas allgemeinere Version dieses
Satzes, die für einfach zusammenhängende Gebiete gilt, stellt klar, dass ein skalares
Potential existiert.
Dieses kennen wir auch schon, da X = − grad 1r mit r = |·| . Im vorliegenden
Fall lässt sich die Existenz eines skalaren Potentials von X auf die Aussage von
Satz 134 zurückführen. Und zwar so: Wir können X auf das offene und sternförmige
Gebiet U ′ := V (R≥0 · n) einschränken, wobei n ∈ V mit |n| = 1 sei. Zu einem so
eingeschränkten X ′ := X |U ′ existieren gemäß Satz 134 sowohl ein skalares als auch
ein Vektorpotential. Klarerweise gilt X ′ = − grad (1/r) auf U ′ . Das Potential 1/r
auf U ′ kann nun offensichtlich zu einem differenzierbaren Skalarfeld auf U fortgesetzt
werden. Damit findet die Existenz des skalaren Potentials von X mit seinem einfach
zusammenhängenden aber nicht sternförmigen Definitionsbereich eine Erklärung.
Die Frage nach einem skalaren Potential von X stellt sich in der Elektrostatik.
In der Magnetostatik ist X das magnetische Induktionsfeld eines (fiktiven) magnetischen Monopols. Für die Lagrangeformulierung der Mechanik einer Punktladung im Feld X benötigt man ein Vektorpotential von X. Wegen div (X) = 0
könnte es eines geben. Ob ein solches tatsächlich existiert, lässt Satz 134 offen. Er
sagt jedoch, dass die Einschränkung X ′ von X ein Vektorpotential hat. Ein solches
Vektorpotential A′ : U ′ → V von X ′ ist auf U ′ gegeben durch
A′ (p) := −
n×p
,
r(p) (r(p) − n, p )
da X ′ = rot (A′ ) gilt. (Dies koordinatenfrei nachzurechnen ist eine nützliche Übung!)
Sei nun θ(p) ∈ [0, π] der Winkel zwischen p und n, d.h. n, p = r(p) cos (θ(p)) . Da
|A′ (p)| =
sin (θ(p))
→ ∞ für θ(p) → 0.
r(p) (1 − cos (θ(p)))
kann das Vektorfeld A′ offenbar nicht stetig von U ′ nach U fortgesetzt werden.
KAPITEL 3. VEKTORANALYSIS
275
Eine etwas weitergehende Überlegung mit dem Satz von Stokes zeigt, dass und
warum es auch kein anderes Vektorpotential zum maximal definierten Vektorfeld X
geben kann. Das divergenz- und rotationsfreie Vektorfeld X hat also zwar ein skalares, aber kein Vektorpotential. Nur die Einschränkungen von X auf die Mengen U ′
haben Vektorpotentiale. U ′ entsteht aus V durch Entfernen eines von 0 ausgehenden
Halbstrahles.24 Das Vektorpotential A′ von X|U ′ idealisiert das reale Vektorpotential einer sehr langen stromführenden Spule, die sich sehr eng um die Halbachse
R≥0 · n windet. A′ wird hier als uneigentliches Vektorpotential des Punktmonopols
bezeichnet, da X = rot A′ nicht auf dem ganzen Definitionsbereich von X gilt.
3.2.30
*Rekonstruktion des Dipolvektorpotentials aus A′
Das skalare Potential eines Punktdipols geht durch Richtungsableitung aus dem
skalaren Potential eines Punktmonopols hervor. (Siehe Beispiele zur Richtungsableitung) Geht auch das Vektorpotential eines Punktdipols
A:V
0 → V mit A (p) =
n×p
|p|3
mit n ∈ V und |n| = 1 aus dem Beinahe-Vektorpotential A′ eines Punktmonopols
A′ : V
(R≥0 · n) → V mit A′ (p) := −
n×p
Ln
=− 2
(p)
r(p) (r(p) − n, p )
r (1 − cos θ)
in ähnlicher Weise hervor?
Zieht man von dem in n-Richtung etwas verschobenen Vektorpotential A′ das
unverschobene Vektorpotential ab, dann könnten sich die Singularitäten auf der
Achse R≥0 · n gegenseitig ausgleichen und vielleicht ein differenzierbares Vektorfeld
auf V 0 ergeben. Probieren wir das aus.
Sei ε > 0. Dann gilt für alle p ∈ V {(−∞, ε] · n} wegen n × (p − εn) = n × p
A′ (p − εn) − A′ (p)
(n × p)
=−
·
ε
ε
,
,
,
,
1
1
,
, .
−
r2 (1 − cos θ) ,p−εn r2 (1 − cos θ) ,p
Für den Grenzübergang zu ε → 0 folgt somit
A′ (p − εn) − A′ (p)
= (n × p) · [n]p
ε→0
ε
lim
24
r2
1
(1 − cos θ)
.
Dirac erkannte, dass die Wahl von n, die in A′ eingeht, auf die quantenmechanischen Eigenschaften eines elektrisch geladenes Teilchens, das dem Feld A′ ausgesetzt ist, genau dann keinen
Einfluss hat, wenn die elektrische Ladung des Teilchens ein ganzzahliges Vielfaches einer universellen Ladungseinheit ist. Das führte ihn zur Vermutung, dass die Existenz von (hypothetischen)
magnetischen Monopolen die Erklärung für die „Quantisierung“ aller elektrischen Ladungen geben
könnte. Darum wird immer wieder nach magnetischen Monopolen gesucht.
KAPITEL 3. VEKTORANALYSIS
276
Es ist also die Richtungsableitung von r−2 (1 − cos θ)−1 = |·|−1 (|·| − n, · )−1 an der
Stelle p unter n zu berechnen. Es gilt
[n]p
=−
2 p, n −
p,n
|p|
1
|·| (|·| − n, · )
n, p − |p| n, n
|p|2 (|p| − n, p )2
=−
[n]p |·|2 − |·| n, ·
|p|2 (|p| − n, p )2
n, p 2 + |p|2 − 2 p, n |p|
1
=
= 3.
3
2
|p| (|p| − n, p )
|p|
Für die Richtungsableitung von A′ unter n gilt somit für alle p ∈ V
(R≥0 · n)
A′ (p − εn) − A′ (p)
n×p
=
.
ε→0
ε
|p|3
− [n]p A′ := lim
Das Vektorfeld − [n]p A′ hat offenbar eine stetige Fortsetzung nach V
das Vektorpotential eines Punktdipols.
3.3
0. Diese ist
Krummlinige Koordinatensysteme
Um die Notation zu vereinfachen, sei in diesem Abschnitt V = Rn mit dem Standardskalarprodukt. Die (kontravariante) Karte Φe =: Ξ von V bzüglich der Standardbasis e wird als Ξ = (x1 , . . . , xn ) bezeichnet.25 Für n = 2, 3 wird auch Ξ = (x, y)
bzw. Ξ = (x, y, z) notiert. Zwischen Zeilen- und Spaltenvektoren wird nicht systematisch unterschieden, sondern meist nach graphischen Vorteilen notiert.
Ein Koordinatensystem von Rn ist ein Schema, mit dem alle Punkte einer offenen Teilmenge von Rn durch n-Tupel reeller Zahlen eindeutig addressiert werden.
Die von uns bisher benützten (globalen) Koordinatensysteme entstehen durch die
Wahl einer Basis des betrachteten Vektorraums. Solche an die Vektorraumstruktur
angepasste Koordinaten heißen lineare Koordinaten. Zwischen linearen Koordinaten zu verschiedenen Basen besteht der lineare Zusammenhang von Gleichung (3.1).
In diesem Abschnitt werden wir allgemeinere Koordinatensysteme kennenlernen.
Die Verwendung eines geschickt gewählten allgemeineren Koordinatensystems kann
manche konkrete numerische Rechnung erheblich vereinfachen. Manche Koordinatensysteme sind etwa an die Symmetrie einer speziellen Situation angepasst und
bieten sich in solchen Fällen an. Wirklich zwingend wird die Einführung allgemeinerer Koordinaten jedoch dann, wenn Vektorräume als Bühne für Differential und
Integral verlassen werden. Was ist der Gradient eines Skalarfeldes, das nur auf der
Oberfläche einer Kugel gegeben ist? Solchen Fragen, die sich z. B. im Bereich der
Mechanik mit Zwangsbedingungen ergeben, werden wir hier nicht nachgehen.
3.3.1
Lokale Karten von Rn
Definition 136 Sei U ⊂ V offen. Eine C ∞-Abbildung
Φ = Φ1 , ..., Φn : U → Φ (U ) ⊂ Rn ,
25 i
x ist also jene Funktion von V nach R, die einen Punkt (p1 , . . . pn ) auf pi abbildet.
KAPITEL 3. VEKTORANALYSIS
277
die bijektiv ist, und deren Umkehrabbildung auch vom C ∞ -Typ ist, heißt eine lokale
Karte oder ein lokales Koordinatensystem von Rn . Die reellwertigen Funktionen Φi
für i = 1, . . . , n heißen Koordinatenfunktionen von Φ.
Polarkoordinaten
Für n = 2 sei U die geschlitzte Ebene
U := {p ∈ V | y(p) = 0 ⇒ x(p) < 0} .
Dann ist die Abbildung Φ = (r, φ) : U → (0, ∞)×(0, 2π) implizit durch x = r cos (φ)
und y = r sin (φ) auf U definiert. Beachte: r = x2 + y 2 ; φ (p) ist der orientierte
Winkel zwischen (1, 0) und p. Der Beweis, dass Φ eine lokale Karte ist, benötigt den
Satz über implizite Funktionen.
Die Koordinatenlinien durch p ∈ U: Die Niveaulinie φ = φ(p) ∈ (0, 2π) ist
der von 0 ausgehende Halbstrahl durch p. Auf ihr ist r nicht konstant. Sie heißt
Koordinatenlinie zu r durch p. Die Niveaulinie r = r(p) > 0 ist der Kreis um (0, 0)
durch p, aus dem der Punkt (r(p), 0) entfernt ist. Diese Linie heißt Koordinatenlinie
zu φ durch p. Sie ist gekrümmt und darauf spielt die Bezeichnung krummliniges
Koordinatensystem an.
Zylinderkoordinaten
Sei n = 3 und
U := {p ∈ V | y(p) = 0 ⇒ x(p) < 0} .
Dann ist die Abbildung
Φ = (r, φ, z) : U → (0, ∞) × (0, 2π) × R
implizit definiert durch x = r cos (φ) und y = r sin (φ). Beachte: r = x2 + y 2 ; φ (p)
ist der orientierte Winkel zwischen (1, 0, 0) und der Parallelprojektion (x(p), y(p), 0)
von p in die Ebene z = 0 längs der z-Achse.
Die Koordinatenlinien durch p ∈ U : Die Niveaufläche φ = φ(p) ∈ (0, 2π) ist die
von der z-Achse ausgehende Halbebene durch p. Die Niveaufläche r = r(p) > 0 ist
der Zylindermantel um R · (0, 0, 1) durch p, aus dem die affine Gerade (r(p), 0, R)
entfernt ist. Die Niveaufläche zu z = z(p) ist wie bei kartesischen Koordinaten die
affine Ebene durch p senkrecht zur z-Achse, aus der die Halbgerade (R≥0 , 0, z(p))
entfernt ist. Die Koordinatenlinie zu r durch p ist die Schnittmenge der Niveauflächen zu φ und z durch p, also eine Halbgerade. Die Koordinatenlinie zu φ durch p,
also die Schnittmenge der Niveauflächen zu r und z durch p, ist der Kreis, dem der
Punkt (r(p), 0, z(p)) fehlt. Etc., etc...
Kugelkoordinaten
Sei n = 3 und
U = {p ∈ V | y(p) = 0 ⇒ x(p) < 0} .
KAPITEL 3. VEKTORANALYSIS
278
Dann ist
Φ = (r, θ, φ) : U → (0, ∞) × (0, π) × (0, 2π)
implizit definiert durch x = r sin (θ) cos (φ) , y = r sin (θ) sin (φ) und z = r cos (θ) .
Beachte: r = x2 + y 2 + z 2 ; φ (p) ist der (orientierte) Winkel zwischen (1, 0, 0) und
der Parallelprojektion von p in die Ebene z = 0 längs der z-Achse; θ(p) ist der eindeutig bestimmte Winkel im Intervall (0, π) , für den e3 , p = |p| cos (θ(p)) gilt. Die
Niveauflächen von r, θ und φ sind Sphären ohne Nullmeridian, Kegelmäntel ohne
φ-Schweissnaht und offene von der z-Achse begrenzte Halbebenen. Die Koordinatenlinien sind Halbgerade, Meridiane und (punktierte) Breitenkreise.
In allen drei Beispielen ist der Definitionsbereich der Karte Φ nicht der gesamte
Raum V. Der Definitionsbereich der Abbildungen Φ könnte etwas ausgedehnt werden. Dabei würde Φ jedoch unstetig und nicht differenzierbar werden und somit die
Karteneigenschaft verlieren.
3.3.2
Navigation auf der Sphäre
Polarstern und Erdradius
Welchen Abstand haben die Breitenkreise auf der Erde, deren Polarwinkel die Werte
0 < θ1 < θ 2 < π haben? Es gilt D = (θ2 − θ1 ) · R mit R = 6370 km. Soll also der
Polarstern um 1◦ höher am Himmel stehen, muss man sich auf der Nordhalbkugel
auf einem Meridian um D = π · R/180 = 111, 2 km nach Norden bewegen.
Nach Kontroversen über die Erdabplattung wurde im 19. Jahrhundert ein mittlerer Wert von R durch Vermessung von D für einige Meridianbögen mit ebenfalls
genau vermessenen Werten θ 2 − θ1 ermittelt. Diese Meridianbögen waren auf mehrere Kontinente verteilt. Eine der ’Messkampagnen’ leitete Gauß. Dabei wurde der
2◦ Bogen eines Meridians zwischen Göttingen und Hamburg Altona durch damals
noch schwer zugänglich Sümpfe hindurch markiert und vermessen.26
Wie weit muss man von Innsbruck nach Osten gehen, damit sich die geographische Länge um 1◦ erhöht, dass also die Sonne um 4 Minuten früher ihren Zenit
erreicht als in Innsbruck? Innsbruck liegt auf 47◦ nördlicher Breite und hat somit
den Polarwinkel von θ = 43◦ . Der Breitenkreis durch Innsbruck hat dann den Um43
fang von 2Rπ · sin θ = 2π sin 180
π · 6370 km = 27296 km = 360 · 75, 822 km. Man
muss also um ca. 76 km nach Osten, also nach Wörgl gehen.
Damit ist klar, warum die englischen Seefahrer, die den Pazifik erkundeten und
kartierten, auf möglichst genaue und vor allem seetüchtige Uhren angewiesen waren.
An die Strapazen der Navigatoren bei Polarexpeditionen, die mit Sextant und Uhr
bei Sturm und Minusgraden durch unkartiertes Gelände den Weg zum Pol wiesen,
will man gar nicht denken! Ein Magnetkompass ist ja in Polnähe völlig unbrauchbar.
Erst Kreiselkompass und später GPS brachten hier eine deutliche Erleichterung.
Unterseeboote sind bei polnahen Tauchgängen immer noch auf den Kreiselkompass
angewiesen, da das Wasser sie nicht nur vom Feind, sondern auch von den eigenen
GPS-Satelliten abschirmt.
26
http://de.wikipedia.org/wiki/Gradmessung
KAPITEL 3. VEKTORANALYSIS
279
Sphärischer Abstand
Als Beispiel für den etwas komplexeren Einsatz von Kugelkoordinaten bestimmen
wir den sphärischen Abstand zweier Punkte p, q der Oberfläche einer Kugel vom
Radius R.
Was ist ein sphärischer Abstand? Die Ebene durch den Mittelpunkt der Sphäre
und durch die Oberflächenpunkte p und q schneidet die Oberfläche. Das Schnittgebilde ist ein Großkreis durch p und q. Die Punkte p, q zerlegen den Großkreis in zwei
Teile, sogenannte Großkreisbögen. Das Minimum der Längen der beiden Großkreisbögen wird als ’Abstand auf der Kugel’ zwischen p und q oder auch als der sphärische
Abstand zwischen p und q bezeichnet. Er ist auch die Länge des kürzesten Weges
auf der Kugeloberfläche, der p und q verbindet. Ein Tunnelweg von p nach q, der
einer Sekante folgt, wird also nicht in Erwägung gezogen.
Die Kugelkoodinaten von p bzw q werden als r (p) = rp , θ (p) = θp etc bezeichent.
Es gilt rp = rq = R. Der Kreisbogen von p nach q hat demnach die Länge
d (p, q) = R · arccos
p, q
.
R2
Nun gilt wegen p/R = sin θp cos ϕp · ex + sin θp sin ϕp · ey + cos θp · ez
p, q
R2
= sin θp cos ϕp sin θ q cos ϕq + sin θp sin ϕp sin θq sin ϕq + cos θp cos θ q
= sin θp sin θq cos ϕp cos ϕq + sin ϕp sin ϕq + cos θp cos θq
= sin θp sin θq cos ϕp − ϕq + cos θp cos θq .
Welchen spärischen Abstand hat also Innsbruck (= q) von Perth (= p) in Australien? Innsbruck hat die (gerundeten) geographischen Koordinaten 47◦ N, 11◦ O
während Perth auf 32◦ S, 116◦ O liegt. Es gilt also θq = 43 · π/180, θp = 122 · π/180
und ϕq − ϕp = 105 · π/180. Daraus folgt mit R = 6370 km
d (p, q) = R · arccos sin θp sin θq cos ϕp − ϕq + cos θp cos θ q = 13619 km.
Wollte man von Innsbruck aus auf kürzestem Weg nach Perth gelangen, müsste
man in welche Richtung losfliegen? Ersetzt man Perth durch Mekka, ergibt sich die
für Muslime in q wichtige Frage ’Wohin sich wenden zum Gebet?’. Geophysikalisch
interessanter ist aber: In welcher Richtung liegt der magnetische Südpol? Berechnen
wir nun diese Richtung für Innsbruck.
Sphärische Peilung
Der magnetische Südpol der Erde liegt gegenwärtig (2013) zwar in der Nähe des
geographischen Nordpols, aber eben nicht genau in ihm. Diese Abweichung ist eine
der Ursachen dafür, dass der Nordpol einer Kompassnadel nicht genau nach Norden
weist. In welche Richtung zeigte eine Kompassnadel, wenn alle anderen Beiträge zur
magnetischen ’Missweisung’ belanglos wären?
KAPITEL 3. VEKTORANALYSIS
280
Der magnetische Südpol liegt derzeit auf 85, 75◦ nördlicher Breite und 144, 46◦
westlicher Länge. Seine Entfernung zum geographischen Nordpol beträgt somit etwa
◦
RE · 4,25
π = 6370 km · 7, 417 × 10−2 ≈ 470 km.
180◦
Sei (x, y, z) jene kartesische Karte, für die der Erdmittelpunkt in 0, der geographische Nordpol auf der positiven z-Achse und der magnetische Südpol in der
Halbebene y = 0 mit x > 0 liegt. Dies fixiert die zugehörigen Kugelkoodinaten des
◦
magnetischen Südpols p zu θp = 4,25
π = 7, 417 × 10−2 und ϕp = 0.
180◦
Sei q ein Ort auf der Erde im Kartenbereich der Kugelkoordinaten. Die Werte
von θ und ϕ in q werden wieder mit θq und ϕq bezeichnet. Innsbruck zB liegt auf
43◦
47◦ nördlicher Breite und 11◦ östlicher Länge, sodass in diesem Fall θq = 180
◦ · π =
144,46◦ +11◦
0, 75049 und ϕq =
· π = 2, 7133 folgt.
180◦
Der Richtungseinheitsvektor vom Erdmittelpunkt zum Ort q zerlegt sich nach
der kartesischen Standardbasis (ex , ey , ez ) gemäß
eq = sin θq cos ϕq · ex + sin θq sin ϕq · ey + cos θ q · ez .
Die Ebene durch Erdmittelpunkt, geographischen Nordpol und q hat den Normaleneinheitsvektor nq = (ez × eq ) / |ez × eq | = − sin ϕq · ex + cos ϕq · ey . Die Ebene,
in der Erdmittelpunkt, magnetischer Südpol p und q liegen, hat den Normaleneinheitsvektor
ep × eq
.
pq :=
|ep × eq |
Der (ungerichtete) Winkel δ zwischen den beiden Einheitsvektoren nq und pq stimmt
mit dem (ungerichteten) Winkel zwischen der wahren Nordrichtung in q und der
Tangente jenes Großkreises durch q überein, der auch durch p geht. Würde ein
Kompass in q in Richtung des kürzesten Weges nach p weisen, wäre dies die vom
Kompass angezeigte (falsche) Nordrichtung. Es gilt also
cos δ = nq · pq =
nq · (ep × eq )
.
|ep × eq |
Wenden wir uns zunächst dem Zähler zu. Es gilt
nq · (ep × eq ) = − sin ϕq (ep × eq )x + cos ϕq (ep × eq )y .
Nun folgt unter Verwendung von ep = sin θ p · ex + cos θp · ez
(ep × eq )x = eyp ezq − ezp eyq = −ezp eyq = − cos θp sin θq sin ϕq ,
(ep × eq )y = ezp exq − exp ezq = cos θp sin θq cos ϕq − sin θp cos θ q .
Daher gilt
nq · (ep × eq ) = cos θp sin θq sin2 ϕq + cos ϕq cos θp sin θq cos ϕq − sin θp cos θ q
= cos θp sin θq − sin θp cos θq cos ϕq .
Nun zum Nenner |ep × eq | . Wegen
|ep × eq |2 = 1 − (ep · eq )2 = 1 − sin θp sin θq cos ϕq + cos θp cos θq
2
KAPITEL 3. VEKTORANALYSIS
folgt
281
cos θp sin θq − sin θp cos θq cos ϕq
cos δ =
1 − sin θp sin θ q cos ϕq + cos θp cos θ q
2 1/2
.
Einsetzen der Winkel ergibt für Innsbruck δ = 2, 4175◦ . Ein Tangentenvektor in
Innsbruck an jenen Großkreisbogen, der Innsbruck mit dem magnetischen Nordpol
verbindet, weist also in die Richtung von ca 2, 5◦ West.
Die tatsächliche Abweichung zwischen der geographischen und magnetischen
Nordrichtung ist jedoch eine andere. Die magnetische Nordrichtung ist momentan in
Innsbruck um eine Missweisung von etwa 2◦ nach Osten(!) aus der geographischen
Nordrichtung gedreht. Und dann verlaufen auch noch die Linien gleicher Missweisung in Mitteleuropa nahezu in Nord-Süd Richtung.27
3.3.3
Kartenbasis
Eine Karte erzeugt in jedem Punkt p ihres Definitionsbereiches U ⊂ V = Rn eine
Basis des Vektorraumes V. Im allgemeinen variiert diese Basis von Punkt zu Punkt.
Wie wird diese Kartenbasis gebildet? Der i-te Basisvektor in p weist von p aus
in jene Richtung, in die in linearer Approximation die i-te Koordinatenfunktion
zunimmt und alle anderen Koordinatenfunktionen konstant sind. Die Länge des iten Basisvektors δ Φ
i p wird so gewählt, dass für ε → 0
Φj p + ε δ Φ
i
p
= Φj (p) + εδ ji + o (ε) .
Der folgende Satz zeigt, wie diese Kartenbasis berechnet werden kann.
Satz 137 (Kartenbasis) Sei Φ : U → Φ (U ) ⊂ Rn eine lokale Karte von Rn . Sei
p ∈ U und q = Φ(p). Dann sind für genügend kleines ε > 0 die Kurven
γΦ
p,i : (−ε, ε) → U,
t → Φ−1 (q + tei )
für i = 1, ..., n
wohldefiniert. Sie erfüllen γ Φ
p,i (0) = p und sind in 0 differenzierbar. Die Tangentenvektoren
n
δΦ
i
p
∂iΦ xj
:= γ̇ Φ
p,i (0) =
j=1
p
· ej für i = 1, ..., n
bilden eine Basis von V. Sie heißt Kartenbasis zu Φ im Punkt p. Die Richtungsableitung δ Φ
i p f einer differenzierbaren Funktion f : U → R an der Stelle p erfüllt
δΦ
i
27
f=
p
∂ (f ◦ Φ−1 )
(Φ (p)) .
∂xi
Siehe http://www.zamg.ac.at/cms/de/geophysik/magnetik/landesaufnahme und die Erklärungen auf http://de.wikipedia.org/wiki/Missweisung.
KAPITEL 3. VEKTORANALYSIS
282
Die Funktion f Φ := f ◦ Φ−1 heißt der Φ-Kartenausdruck von f. Daher die BeΦ
Φ
zeichnung: δ Φ
i p f =: ∂i f (p) . Um ∂i f zu berechnen, sind also zwei Schritte
auszuführen: 1) Bestimmung des Kartenausdrucks von f in der Karte Φ und 2)
diesen Kartenausdruck partiell nach der i-ten Variablen differenzieren.
Beweis. Da Φ bijektiv ist und mit Φ auch Φ−1 eine C ∞ -Funktion ist, ist die
Jakobimatrix ∂iΦ xj p in jedem Punkt p invertierbar. Damit ist das Vektorensystem
δ Φ p eine Basis. Die Formel für die Richtungsableitung von f unter δ Φ
i p folgt so:
δΦ
i
f = lim
p
f p + ε δΦ
i
ε→0
= lim
(f ◦ Φ
−1
p
− f (p)
ε
◦ Φ) p + ε δ Φ
i
p
− (f ◦ Φ−1 ◦ Φ) (p)
ε
f (Φ (p) + εei ) − f (Φ (p))
∂ (f ◦ Φ−1 )
(Φ (p)) .
= lim
=
ε→0
ε
∂xi
ε→0
Φ
Φ
Satz 138 Auf dem Durchschnitt der Definitionsbereiche zweier lokaler Karten Φ
und Ψ gilt die Kartenwechselformel ∂iΦ f = nj=1 ∂iΦ Ψj · ∂jΨ f
für i = 1, . . . , n.
Beweis. Das ist einfach die Kettenregel angewandt auf f ◦ Φ−1 = (f ◦ Ψ−1 ) ◦
(Ψ ◦ Φ−1 ) am Bereich Φ U Φ ∩ U Ψ .
Anmerkungen:
i
i
1) Auf U gilt die Dualitätsrelation δ Φ
j Φ = δ j . Dazu äquivalent ist jede der drei
Aussagen:
&
'
i
grad Φi , δ Φ
dΦi δ Φ
= δ ij , ∂jΦ Φi = δ ij .
j = δj ,
j
Damit ist für p ∈ U auch die Familie von Vektoren (gradp Φ1 , . . . gradp Φn ) eine
Basis von Rn . Sie wird wegen ihrer Dualität zur Kartenbasis als die duale (oder
auch reziproke) Kartenbasis in p bezeichnet.
2) Für die Einträge der Gramschen Matrix des Standardskalarproduktes zur
Kartenbasis gilt in p ∈ U
GΦ
ij
(p) =
(
δΦ
i p
,
δΦ
j p
)
n
n
∂iΦ xk p
=
k,l=1
ek , el
∂jΦ xl p
∂iΦ xk
=
p
∂jΦ xk
p
.
k=1
Φ
i
also im Durchschnitt
C 3) Das Bild der Kurve γ p,i ist in der Φ -Koordinatenlinie,
j
j
j=i Nj,p der Niveauflächen Nj,p := {q ∈ U | Φ (q) = Φ (p)} enthalten.
Φ
∞
4) Die Vektorfelder δ Φ
i : U → V, p → δ i p mit i = 1, ..., n sind C -Vektorfelder.
3.3.4
Vektorfeldkomponenten zu Kartenbasen
Ist X : U → V ein Vektorfeld, dann hat es an jeder Stelle p ∈ U eine Zerlegung nach der Standardbasis (e1 , . . . en ) und natürlich eine nach der Kartenbasis
Φ
einer beliebigen Karte Φ : U → Rn . Diese sind gegeben durch
δΦ
1 p , . . . δn p
KAPITEL 3. VEKTORANALYSIS
283
die beiden Sätze von kontravarianten Komponentenfunktionen XΞi : U → R und
XΦi : U → R mit
n
n
XΞi
X (p) =
i=1
n
XΦi
(p) · ei =
i=1
(p) ·
δΦ
i p
n
XΦi
=
i=1
(p) ·
∂iΦ xj
j=1
p
· ej .
Somit gilt die Kartenwechselformel auf U
n
XΞj
=
i=1
XΦi · ∂iΦ xj .
Multiplikation dieser Gleichung mit der Funktion ∂jΞ Φk und Summation über j
ergibt die Auflösung nach XΦk , denn aufgrund der Kettenregel gilt ja
n
n
j=1
XΞj · ∂jΞ Φk =
n
n
XΦi ∂iΦ xj
∂jΞ Φk =
j=1 i=1
n
XΦi δ ki = XΦk .
XΦi ∂iΦ Φk =
i=1
i=1
Somit gilt für die Komponentenfunktionen XΦi zur allgemeinen Karte der folgende
Zusammenhang mit den Komponentenfunktionen zur Standardkarte Ξ :
n
XΦi
=
j=1
XΞj · ∂jΞ Φi .
Die Komponente XΦi (p) stimmt also mit der Richtungsableitung der Koordinatenfunktion Φi an der Stelle p mit dem Vektor X (p) überein:
[Xp ] Φi = XΦi (p) .
Ein weiterer Satz von Bestimmungsstücken für das Vektorfeld X ist durch die n
Funktionen XiΦ : U → R für i = 1, . . . n mit
XiΦ (p)
=
GΦ
ij (p) =
(
(
δΦ
i p
δΦ
i
p
)
n
i
GΦ
ij (p) XΦ (p) und
, X (p) =
, δΦ
j
p
)
j=1
n
∂iΦ xk
=
p
∂jΦ xk
p
.
k=1
gegeben. Sie heißen kovariante Komponentenfunktionen des Vektorfeldes X. Die
Gramsche Matrix vermittelt also zwischen den beiden n-Tupeln von Funktionen
über die ’Indexherunterziehformel’
n
XiΦ
j
GΦ
ij XΦ .
=
j=1
Wie drücken sich die kovarianten Komponentenfunktionen bezüglich einer allgemeinen Karte Φ durch jene der Standardkarte aus? Es gilt
XiΦ
(p) =
(
δΦ
i p
)
n
n
∂iΦ xj p
, X (p) =
i=1
∂iΦ xj
ej , X (p) =
i=1
p
XjΞ (p) .
KAPITEL 3. VEKTORANALYSIS
284
Um die kontravarianten Komponentenfunktionen XΦi aus den kovarianten zu
−1
berechnen, wird die inverse Matrix von GΦ (p) := GΦ (p)
der Grammatrix GΦ (p)
benötigt. Ihre Einträge werden oben indiziert, sodass als Funktionsgleichung
n
XΦi
Φ
Gij
Φ Xj
=
j=1
gilt. Damit wird eine Automatik bezüglich des Transformationsverhaltens der Komponenten unter Kartenwechsel in der Schreibweise etabliert. Sie hat aber lediglich
den Charakter einer Merkhilfe.
Behauptung: Die Gramsche Matrix der dualen Kartenbasis in p stimmt mit
−1
GΦ (p) überein, dh für die Einträge Gij
Φ (p) mit p ∈ U gilt
&
'
i
j
Gij
=
Φ (p) = gradp Φ , gradp Φ
n
n
∂kΞ Φi
δ kl ∂lΞ Φj
p
p
∂kΞ Φi
=
k,l=1
p
∂kΞ Φj
p
.
k=1
Zum Beweis genügt es über die Kettenregel nachzurechnen, dass
n
i
Φ
Gij
Φ (p) Gjk (p) = δ k =
j=1
1 für i = k
0 sonst
folgt. Dies geht so
n
n
Gij
Φ
j=1
(p) ·
GΦ
jk
n
n
∂lΞ Φi p
(p) =
∂lΞ Φj p
j=1 l=1
n
n
∂lΞ Φi
=
p
∂kΦ xr
=
3.3.5
p
∂kΦ xr
p
r=1
n
∂lΞ Φj
j=1
p
· ∂jΦ xr
p
n
∂lΞ Φi p
l=1 r=1
∂kΦ Φi p
∂jΦ xr
p
l=1 r=1
n
n
=
·
∂kΦ xr p
δ rl
∂kΦ xr
=
p
∂rΞ Φi
p
r=1
= δ ik .
Polarkoordinaten
Seien Φ = (r, φ) die Polarkoordinaten von R2 . Dann gilt für p ∈ U
,
d
p
(r(p) + t) cos (φ(p)) ,,
cos (φ(p))
Φ
δ1 p =
=
=
.
,
sin (φ(p))
dt (r(p) + t) sin (φ(p))
r(p)
t=0
,
d
r(p) cos (φ(p) + t) ,,
− sin (φ(p))
−y(p)
Φ
δ2 p =
= r(p)
=
,
cos (φ(p))
x(p)
dt r(p) sin (φ(p) + t)
t=0
.
Φ
Das Vektorfeld δ Φ
1 ist ein radial nach außen gerichtetes Einheitsvektorfeld und δ 2
Ξ
Ξ
28
stimmt auf U mit dem Drehvektorfeld L = −yδ 1 + xδ 2 überein. Ein reellwertiges
28
Ξ bezeichnet wieder die Standardkarte.
KAPITEL 3. VEKTORANALYSIS
285
Skalarfeld f ∈ C 1 (R2 0) erfüllt daher genau dann die partielle Differentialgleichung
Φ
[L] f = 0, wenn 0 = δ Φ
2 f = ∂2 f, wenn also der polare Kartenausdruck von f nicht
von φ abhängt. Dies ist genau dann der Fall, wenn f invariant unter allen Drehungen
um 0 ist.
Die Quantenmechanik macht von komplexwertigen Skalarfeldern f ∈ C 1 (R2 0)
Gebrauch, die [L] f = λf für ein λ ∈ C lösen. Solch eine Funktion f erfüllt also
∂2Φ f = λf auf U. Es existiert somit eine Funktion g ∈ C 1 (R>0 ) mit f = g (r) eλφ
auf U. Für g = 0 ist f aber genau dann in C 1 (R2 0) , wenn λ = im für ein
m ∈ Z. Es gilt somit für jede Funktion fm , die auf U fm = g (r) eimφ erfüllt, die
Eigenwertgleichung [−iL] fm = mfm auf ganz R2 0. Für eine Drehung Rα von fm
um den Winkel α im positiven Sinn folgt weiters
Rα fm (p) := fm Rα−1 p = g (|p|) eim(φ(p)−α) = e−imα fm (p)
für alle p ∈ U mit Rα−1 p ∈ U. Wegen der Stetigkeit von fm gilt Rα fm = e−imα fm auf
ganz R2 0. Die Funktion |fm |2 ist folglich invariant unter allen Drehungen um 0.
Die Gramsche Matrix GΦ (p) der Kartenbasis δ Φ
p ergibt sich somit zu
GΦ (p) =
1
0
0 r(p)2
.
Wir abstrahieren aus dem vorangehenden Beispiel das Kurzrezept


x1 (Φ1 , . . . , Φn )
∂ 

..
δΦ

 auf U,
.
i =
i
∂Φ
n
1
n
x (Φ , . . . , Φ )
das zum Tragen kommt, wenn die Karte Φ implizit gegeben ist.
Laplaceoperator in Polarkoordinaten
Sei Ξ = (x, y) die Standardkarte von R2 . Dann gilt für die Karte der Polarkoodinaten
Φ = (r, ϕ) auf der geschlitzten Ebene U
cos ϕ −r sin ϕ
sin ϕ r cos ϕ
Φ
Ξ Ξ
δΦ
1 , δ 2 = δ 1 , δ2 ·
.
Die Inversion des Basiswechsels gibt
Φ
δ Ξ1 , δ Ξ2 = δ Φ
1 , δ2 ·
cos ϕ
sin ϕ
−1
−1
−r sin ϕ r cos ϕ
.
Für eine C 2 -Funktion f : U → R gilt daher
δ Ξ1 f = cos ϕ δ Φ
1 f −
sin ϕ Φ
cos ϕ Φ
δ 2 f, und δ Ξ2 f = sin ϕ δ Φ
δ 2 f.
1 f +
r
r
Wir kürzen die Richtungsableitungen als partielle Ableitungen ab
δ Ξ1 f = ∂x f,
δ Ξ2 f = ∂y f,
δΦ
1 f = ∂ρ f,
δΦ
2 f = ∂ϕ f.
KAPITEL 3. VEKTORANALYSIS
286
Damit gilt
∂x f =
∂y f =
sin ϕ
∂ϕ f,
r
cos ϕ
sin ϕ∂r +
∂ϕ f.
r
cos ϕ∂r −
Iteration der Richtungsableitung δ Ξ1
δ Ξ1 f = ∂x2 f ergibt nun
sin ϕ
sin ϕ
cos ϕ∂r −
∂ϕ
∂ϕ f
r
r
sin ϕ
cos ϕ sin ϕ
=
cos2 ϕ∂r2 + cos ϕ 2 ∂ϕ −
∂r ∂ϕ f
r
r
sin2 ϕ
sin ϕ cos ϕ
sin ϕ cos ϕ
sin2 ϕ
+
∂r −
∂ϕ ∂r +
∂
+
∂ϕ ∂ϕ f.
ϕ
r
r
r2
r2
∂x2 f =
cos ϕ∂r −
Analog ergibt sich
cos ϕ
cos ϕ
∂ϕ sin ϕ∂r +
∂ϕ f
r
r
cos ϕ
cos ϕ
∂r ∂ϕ f
= sin2 ϕ∂r2 − sin ϕ 2 ∂ϕ + sin ϕ
r
r
cos ϕ sin ϕ
cos ϕ sin ϕ
cos2 ϕ 2
cos2 ϕ
+
∂ f.
∂r +
∂ϕ ∂r −
∂ϕ +
r
r
r
r2 ϕ
∂y2 f =
sin ϕ∂r +
Daraus folgt für den Lpalaceoperator in Polarkoordinaten
1
1
1
1
∂r (r∂r ) + 2 ∂ϕ2 f.
∂r2 + ∂r + 2 ∂ϕ2 f =
r
r
r
r
√
Nutzen wir dies, um am Potential Φ = r sin (ϕ/2) einer (inhomogen) geladenen
Halbgeraden in der Ebene zu überprüfen, dass ∆Φ = 0. Es gilt ∂r Φ = sin (ϕ/2) /2r1/2
und ∂r2 Φ = − sin (ϕ/2) /4r3/2 . Daraus folgt
∆f = ∂x2 f + ∂y2 f =
1
1
∂r2 + ∂r + 2 ∂ϕ2 Φ =
r
r
3.3.6
−
1
1
1
+ 3/2 − 3/2
3/2
4r
2r
4r
sin (ϕ/2) = 0.
Kugelkoordinaten
Seien Φ = (r, θ, ϕ) Kugelkoordinaten und Ξ = (x, y, z) die Standardkarte. Anwendung des Kurzrezeptes ergibt die Vektorfelder auf U


sin (θ) cos (ϕ)
id
δΦ
=  sin (θ) sin (ϕ)  = ,
1
r
cos (θ)


cos (θ) cos (ϕ)
δΦ
= r ·  cos (θ) sin (ϕ)  ,
2
− sin (θ)


− sin (θ) sin (ϕ)
= r ·  sin (θ) cos (ϕ)  .
δΦ
3
0
KAPITEL 3. VEKTORANALYSIS
287
Φ
δΦ
1 ist ein radial nach außen gerichtetes Einheitsvektorfeld. Der Vektor δ 1 p ist im
Punkt p tangential an die Schnittlinie der beiden Niveauflächen θ = θ (p) und ϕ =
ϕ (p) . Analog ist δ Φ
2 p ist in p tangential an den Meridian r = r(p) und ϕ = ϕ(p)
durch p. Das Vektorfeld δ Φ
3 stimmt auf U mit dem Drehvektorfeld um die z-Achse
zur Standardorientierung überein. δ Φ
3 p ist in p tangential an den Breitenkreis, der
durch θ = θ (p) und r = r (p) bestimmt ist.
Gemäß Konstruktion gilt
3
δΦ
i
=
j=1
oder in Matrixnotation δ Φ = δ Ξ · J t mit
 Φ 1
∂1 Ξ
t

∂1Φ Ξ2
J =
∂1Φ Ξ3
δ Ξj · ∂iΦ Ξj
der Jakobimatrix

∂2Φ Ξ1 ∂3Φ Ξ1
∂2Φ Ξ2 ∂3Φ Ξ2  .
∂2Φ Ξ3 ∂3Φ Ξ3
Φ Φ
δΦ = δΦ
1 , δ 2 , δ 3 ist genau dann in jedem Punkt p ∈ U eine Basis, wenn die Determinante der Jakobimatrix


sin (θ) cos (ϕ) r cos (θ) cos (ϕ) −r sin (θ) sin (ϕ)
J t =  sin (θ) sin (ϕ) r cos (θ) sin (ϕ) r sin (θ) cos (ϕ) 
cos (θ)
−r sin (θ)
0
nirgends gleich 0 ist. Tatsächlich ergibt sich (zB durch Entwicklung nach der letzten
Zeile)
detJ t = r2 sin θ > 0 auf U.
Die Basen δ Φ (p) und δ Ξ (p) sind also in jedem Punkt p ∈ U gleich orientiert.
Die Gramsche Matrixfunktion auf U ergibt sich zu


1 0
0
.
GΦ =  0 r2
0
2
2
0 0 r sin (θ)
Laplaceoperator in Kugelkoordinaten
Der Laplaceoperator in Kugelkoordinaten Φ = (r, θ, ϕ) ergibt sich scheinbar recht
einfach durch Verwendung unvollständiger Notation. Am Kartenbereich von Φ gilt
mit ρ = x2 + y 2 = r sin θ
x = ρ cos ϕ und y = ρ sin ϕ.
In jeder Niveaufläche von z ist Ψ = (ρ, ϕ) eine ebene polare Karte. Daher gilt für
den polaren Kartenausdruck von ∂x2 + ∂y2 unter Verschleierung der Karte Ψ
1
1
∂x2 + ∂y2 = ∂ρ2 + ∂ρ + 2 ∂ϕ2 .
ρ
ρ
(3.24)
KAPITEL 3. VEKTORANALYSIS
288
Außerdem ist (r, θ) die Einschränkung von ebenen polaren Koordinaten auf eine
Niveaufläche von ϕ. In dieser Halbebene ist aber χ = (ρ, z) eine kartesische Karte.
Daher gilt wieder etwas verschleiernd
1
1
∂ρ2 + ∂z2 = ∂r2 + ∂r + 2 ∂θ2 .
r
r
(3.25)
Addition der Gleichungen (3.24) und (3.25) ergibt
1
1
1
1
∂x2 + ∂y2 + ∂z2 = ∂ρ + 2 ∂ϕ2 + ∂r2 + ∂r + 2 ∂θ2 .
ρ
ρ
r
r
Entscheidend für ∂ρΨ = ∂ρχ ist die Tatsache, dass die partielle Ableitung ∂ρ in beiden
der Gleichungen (3.24) und (3.25) die Richtungsableitung mit dem Einheitsvektor
cos θ
1
(xex + yey ) = sin θ · δ r +
· δθ
ρ
r
ist. Damit folgt
1
sin θ
cos θ
1
cot θ
∂ρ =
· ∂r + 2
· ∂θ = · ∂r + 2 · ∂θ
ρ
r sin θ
r sin θ
r
r
und daher
2
cot θ
1
1
∂x2 + ∂y2 + ∂z2 = ∂r2 + ∂r + 2 · ∂θ + 2 ∂θ2 + 2 2 ∂ϕ2
r
r
r
r sin θ
2
1
1
2
= ∂r2 + ∂r + 2 ∂θ2 + cot θ · ∂θ +
2 ∂ϕ .
r
r
sin θ
3.3.7
Kartenabhängigkeit partieller Ableitungen
Auf V = R2 sei die Funktion g durch g := x2 + xy gegeben. Es sollen zwei partielle Ableitungen von g berechnet werden, die zur Vorsicht mahnen. Neben der
Standardkarte Ξ := Φe := (x, y) = id der kontravarianten Koordinaten von V zur
Standardbasis e ist auch die Karte Φ := Φf zur Basis
f = (f1 , f2 ) := (e1 , e2 ) ·
1 0
−1 1
eine globale, lineare Karte von R2 . Es gilt Φ = (x, x + y). Die lineare Funktion
Φ : R2 → R2 mit
1 0
x
Φ=
·
1 1
y
ist als Hintereinanderschaltung zweier linearer Funktionen, die erste davon eine Kar1 0
te, natürlich eine C ∞-Funktion. Wegen det
= 1 ist sie invertierbar und
1 1
somit eine Karte. Es gilt weiter g = Φ1 Φ2 und daher
∂1Ξ g = 2x + y und ∂1Φ g = Φ2 = x + y.
KAPITEL 3. VEKTORANALYSIS
289
Die Verschiedenheit der beiden partiellen Ableitungen ist wegen δ Ξ1 = e1 = (1, 0)
und δ Φ
1 = f1 = (1, −1) zu erwarten. Wenn aber der Kartenname an den Symbolen
Ξ
∂1 und ∂1Φ weggelassen wird, und wenn man wegen Φ1 = Ξ1 = x dann noch statt ∂1
das Symbol ∂x verwendet, hat man zur Kenntnis zu nehmen, dass ∂x g ohne weitere
Angaben sinnlos ist, da es davon abhängt, durch welche weiteren Funktionen die
Funktion x zu einer Karte ergänzt wird. Dieser Sachverhalt sorgt in der Wärmelehre
für zwei unterschiedliche spezifische Wärmen. Eine bei konstantem Volumen und eine
bei konstantem Druck.
Eine Verallgemeinerung des vorigen Beispiels bietet die Galileitransformation.
Sie wechselt von der Standardkarte Ξ := (t, x) von R2 zur linearen Karte (t′ , x′ )
gemäß
t′ = t und x′ = x − vt.
Hier ist v ∈ R die Relativgeschwindigkeit der beiden Karten. Wir notieren systematischer:
t′
1 0
t
Φ :=
=
·
=: M · Ξ.
′
x
−v 1
x
Wegen der Kartenwechselformel für die partiellen Ableitungen eines Skalarfeldes g
∂iΞ g =
j=1,2
∂iΞ Φj · ∂jΦ g
folgt mit
∂1Ξ Φ1 ∂1Ξ Φ2
∂2Ξ Φ1 ∂2Ξ Φ2
= Mt
dass
∂1Ξ g, ∂2Ξ g
=
∂1Φ g, ∂2Φ g
·M =
∂1Φ g − v∂2Φ g, ∂2Φ g
.
Mit der Kurznotation ∂1Ξ g = ∂t g, ∂1Φ g = ∂t′ g und ∂2Ξ g = ∂x g, ∂2Φ g = ∂x′ g folgt somit
∂t g = ∂t′ g − v∂x′ g und ∂xg = ∂x′ g,
wegen t′ = t und x′ = x etwas irritierend. Dieser Sachverhalt ist für die Galileisymmetrie der freien Schrödingergleichung oder auch der Wärmeleitungsgleichung von
Bedeutung.
3.3.8
Geschwindigkeit zerlegt nach Kartenbasis
Ein Flugkörper nähert sich einem Schiff, indem er eine Kurve γ : R ⊃ I → R3
verwirklicht. I ist dabei ein offenes Intervall. Die Radarstation des Schiffes misst
eine zeitliche Abfolge des Abstands zwischen Schiff und Flugobjekt. Der Mann am
Fernrohr notiert zeitliche Abfolgen der Winkel, um die das Fernrohr aus der Nordrichtung gedreht und gegen den Horizont geneigt werden muss, um das Objekt ins
Fadenkreuz zu bekommen. Die Frau an der Kanone wird unruhig und möchte wissen
mit welcher Geschwindigkeit sich das Objekt nähert. Sie erinnert sich an ihre Vorlesung über Math Phys. Irgendwie bestimmen die drei Funktionen r ◦ γ, θ ◦ γ, ϕ ◦ γ
die Größe γ̇ (t)! Aber wie geht das nochmals?
KAPITEL 3. VEKTORANALYSIS
290
Der folgende Satz illustriert, inwiefern Kartenbasen die Lösung des Problems
übersichtlich gestalten. Er ist eine Folge der Kettenregel und er zeigt, wie der Tangentenvektor einer Kurve γ in einem Punkt γ (t) nach einer Kartenbasis im Punkt
γ (t) zu zerlegen ist. Die Komponenten dieses meist als Geschwindigkeit von γ in
γ (t) bezeichneten Vektors bezüglich der Kartenbasis ergeben sich einfach durch Differenzieren der Komponenten des Kartenbildes Φ ◦ γ der Kurve an der Stelle t.
Satz 139 Sei Φ : U → Φ (U) eine lokale Karte von Rn . Die Kurve γ : I → U sei
dγ iΦ (t)
differenzierbar. Sei γ iΦ := Φi ◦ γ. Dann gilt γ̇(t) = ni=1 dt
δΦ
i γ(t) und
8
9
9
|γ̇(t)| = :
n
dγ iΦ (t) Φ
dγ j (t)
Gij (γ (t)) Φ .
dt
dt
i,j=1
Beweis. Der Beweis benützt die Kettenregel für die Hintereinanderschaltung
γ = Φ−1 ◦ (Φ ◦ γ). Mit γ(t) = p und mit Φ = ni=1 Φi ei folgt
γ̇(t) = (dt γ) (1) =
dΦ(p) Φ−1 ◦ dt (Φ ◦ γ) (1) = dΦ(p) Φ−1 (dt (Φ ◦ γ) (1))
n
=
dΦ(p) Φ
i=1
n
=
i=1
n
dΦi (γ (t))
ei
dt
−1
i
dΦ (γ (t))
Φ
lim
ε→0
dt
−1
=
i=1
dΦi (γ (t))
dΦ(p) Φ−1 (ei )
dt
(Φ(p) + εei ) − Φ−1 (Φ(p))
=
ε
n
i=1
dγ iΦ (t) Φ
δi
dt
p
.
Als Beispiel diene der Kugelkoordinatenausdruck der kinetischen Energie. Seien
Φ = (r, θ, φ) Kugelkoordinaten mit dem Kartenbereich U und sei γ : I → R3
differenzierbar. Für alle t ∈ I mit γ(t) ∈ U folgt dann γ̇(t), γ̇(t) =
dγ iΦ (t) ( Φ
=
δi
dt
i,j=1
3
=
(r ◦ γ)′ (t)
2
γ(t)
,
δΦ
j γ(t)
+ (θ ◦ γ)′ (t)
2
) dγ j (t)
Φ
dt
3
dγ iΦ (t) Φ
dγ jΦ (t)
=
Gij (γ(t))
dt
dt
i,j=1
r2 ◦ γ (t) + (φ ◦ γ)′ (t)
2
(r sin (θ))2 ◦ γ (t) .
In Physiktexten wird diese Formel verkürzt zu |γ̇|2 = ṙ2 + (rθ̇)2 + (r sin (θ) φ̇)2 . Man
beachte jedoch, dass diese Schreibweise Φi und Φi ◦γ nicht voneinander unterscheidet.
3.3.9
*Beschleunigung zerlegt nach Kartenbasis
Sei nun γ : I → U ⊂ Rn eine C 2 -Kurve mit γ (t) = p und sei (e1 , . . . en ) die
Standardbasis von Rn und Ξ = (x1 , . . . , xn ) die zugehörige Standardkarte von Rn .
Es gilt also idRn = ni=1 xi · ei . Die Abbildung Φ : U → Rn sei eine lokale Karte.
Die Geschwindigkeit zur Zeit t ist der folgende Vektor aus V :
dγ
(t) =
dt
n
i
i=1
′
Φ ◦ γ (t) ·
n
δΦ
i p
i
=
i=1
′
Φ ◦ γ (t) ·
n
j=1
∂iΦ xj (p) · ej
KAPITEL 3. VEKTORANALYSIS
291
Die Beschleunigung von γ zur Zeit t ist die zweite Ableitung von γ an der Stelle
dγ i
t. Sie ergibt sich mit den Abkürzung γ iΦ := Φi ◦ γ und γ̇ iΦ = dtΦ zu
n
d2 γ
d i
(t) =
γ̇ Φ (t) · ∂iΦ xj (γ (t)) · ej .
2
dt
dt
i,j=1
2
Satz 140 Für die Beschleunigung ddt2γ einer C 2 -Kurve γ : I → Rn gilt für alle t ∈ I,
für die γ (t) Element des Definitionsbereiches U der Karte Φ : U → Rn ist, mit der
Abkürzung γ iΦ = Φi ◦ γ
2
3
n
n
d2 γ
d2 γ kΦ
(t) =
(t) +
γ̇ iΦ (t) γ̇ jΦ (t) Γkij ◦ γ (t) · δ Φ
(3.26)
k γ(t) .
2
dt2
dt
i,j=1
k=1
Dabei sind die Christoffelsymbole Γkij : U → R der Karte Φ für i, j, k ∈ {1, . . . n}
durch
n
Γkij (p) =
∂jΦ ∂iΦ xl
p
∂lΞ Φk
p
l=1
definiert.
Beweis. Die Zerlegung von ej nach der Basis δ Φ
n
Φ j
j=1 ∂i x (p) · ej zu
n
n
∂kΞ Φi
p
δΦ
i
p
n
∂kΞ Φi
=
i=1
i=1
n
p
j=1
∂kΞ Ξj
=
n
∂iΦ xj
p
j=1
p
p
· ej =
j=1
ergibt sich aus δ Φ
i
2
n
∂iΦ Ξj
p
∂kΞ Φi
i=1
p
p
=
3
· ej
· ej = ek .
Unter Verwendung dieser Zerlegung und, wo gefahrlos möglich, unter Verwendung
der Abkürzung p = γ (t) folgt ddtγ̇ (t) =
n
d i
γ̇ Φ (t) · ∂iΦ xj
dt
i,j=1
γ(t)
n
· ej
n
d i
=
γ̇ Φ (t) · ∂iΦ xj γ(t)
∂jΞ Φk · δ Φ
k p
dt
i,j=1
k=1
* i
+
n
dγ̇ Φ
d Φ j
Φ j
i
=
(t) · ∂i x p + γ̇ Φ (t) ·
∂i x p
∂jΞ Φk · δ Φ
k p
dt
dt
i,j,k=1
2
3
n
n
d2 γ iΦ
=
(t) · ∂iΦ xj p + γ̇ iΦ (t)
γ̇ lΦ (t) ∂lΦ ∂iΦ xj p ∂jΞ Φk
2
dt
i,j,k=1
l=1
Da für alle p ∈ U
n
n
∂iΦ xj p
j=1
∂jΞ Φk p
∂iΦ Φk
=
j=1
p
= δ ki
p
· δΦ
k
p
.
KAPITEL 3. VEKTORANALYSIS
292
gilt, folgt weiter
dγ̇
(t) =
dt
n
i,k=1
n
=
k=1
2
2
n
d2 γ iΦ (t) i
δ k + γ̇ iΦ (t)
γ̇ lΦ (t) ∂lΦ ∂iΦ xj
dt2
j,l=1
n
p
∂jΞ Φk
p
3
n
d2 γ kΦ
(t) +
γ̇ iΦ (t) γ̇ jΦ (t)
2
dt
i,j=1
∂jΦ ∂iΦ xl p
∂lΞ Φk p
l=1
δΦ
k
3
δΦ
k
p
p
.
Sind die von γ unabhängigen Funktionen Γkij : U → R (Zusammenhangskomponenten oder Christoffelsymbole der Karte Φ) so definiert, dass für p ∈ U
n
Γkij
∂jΦ ∂iΦ xl
(p) =
p
∂lΞ Φk
p
(3.27)
,
l=1
dann gilt folglich
d2 γ
(t) =
dt2
n
k=1
2
3
n
d2 γ kΦ
(t) +
γ̇ iΦ (t) γ̇ jΦ (t) Γkij ◦ γ (t) · δ Φ
k
dt2
i,j=1
γ(t)
.
Man beachte, dass wegen ∂jΦ ∂iΦ xl = ∂iΦ ∂jΦ xl auch Γkij = Γkji . Die k-Komponente
der Beschleunigung zur Zeit t setzt sich also additiv aus der zweiten Ableitung von
Φk (γ (t)) und einer ortsabhängigen quadratischen Form Γkγ(t) (γ̇ (t)) des Geschwindigkeitsvektors zusammen.
3.3.10
*Berechnung der Christoffelsymbole einer Karte
Die definierende Formel (3.27) ist für eine Berechnung der Funktionen Γkij oft ungeeignet, da etwa in Kugelkoordinaten die Berechnung der partiellen Ableitungen ∂lΞ Φk
sehr umständlich ist. Oft erweist sich der folgende Umweg über die ’indexgezogene’
Größe Γikj als hilfreich. Sei also Γikj : U → R mit
n
l
GΦ
kl (p) Γij (p) .
Γikj (p) :=
l=1
Dann folgt daraus
n
l=1
n
=
=
=
n
∂jΦ ∂iΦ xr
GΦ
kl
Γikj =
∂rΞ Φl
r=1
n
n
∂kΦ xs
l=1 s=1
n
∂kΦ xs
s=1
n
∂kΦ xs
s=1
∂lΦ xs
∂jΦ ∂iΦ xr
∂rΞ Φl
r=1
n
n
∂jΦ ∂iΦ xr
r=1
n
∂rΞ Φl
l=1
n
∂jΦ ∂iΦ xr
r=1
∂lΦ xs
δ sr
∂kΦ xs
=
s=1
∂jΦ ∂iΦ xs .
KAPITEL 3. VEKTORANALYSIS
293
Offenbar gilt Γikj = Γjki ebenso wie Γkij = Γkji für alle i, j, k. Der Zusammenhang
n
∂kΦ xs
Γikj =
∂jΦ ∂iΦ xs
(3.28)
s=1
enthält nun keine Ableitungen des Typs ∂lΞ Φk sondern nur mehr Ableitungen der
Standardkoordinatenfunktionen nach den allgemeinen. Aber auch Formel (3.28) ist
für praktische Rechnungen noch mühselig. Eine weitere Vereinfachung schafft die
folgende Einsicht.
Satz 141 Für die Zusammenhangskomponenten der Karte Φ : U → Rn gilt auf U
1 Φ Φ
Φ Φ
Γikj =
∂i Gjk + ∂jΦ GΦ
(3.29)
ik − ∂k Gij .
2
Beweis. Auf der rechten Seite die drei Matrixelemente der Gramschen Matrix
durch die Darstellung
n
GΦ
ij
∂iΦ xs
=
∂jΦ xs
s=1
ersetzen, ausdifferenzieren mit Produktregel und wegheben.
Christoffelsymbole der Kugelkoordinaten
Probieren wir die Kraft von Gleichung (3.29) am Beispiel der Kugelkoordinaten aus.
Sei Φ = (r, θ, ϕ) und Ξ = (x, y, z) mit


 
x
sin θ cos ϕ
 y  = r  sin θ sin ϕ 
z
cos θ
auf dem Kartenbereich U der Kugelkoordinaten. Um bei der Berechnung der Funktionen Γikj die Übersicht behalten zu können, empfiehlt sich die Bildung von MatrixPaketen Γk = [Γikj ] . Es ergibt sich mithilfe von Gleichung (3.29)




0 0
0
0 r
0
 , Γ2 =  r 0
,
0
0
Γ1 =  0 −r
(3.30)
2
2
2
0 0 −r sin θ
0 0 −r sin θ cos θ


0
0
r sin2 θ
0
0
r2 sin θ cos θ  .
Γ3 = 
r sin2 θ r2 sin θ cos θ
0
k
Wegen der Diagonalität von GΦ folgen die Matrizen Γk = Γkij mit Γk = GΦ
kk Γ zu




0 0
0
0 1r
0
 , Γ2 = 1 Γ2 =  1 0
,
0
0
Γ1 = Γ1 =  0 −r
r
r2
2
2
0 0 −r sin θ
0 0 − sin θ cos θ
(3.31)


1
0 0
r
1
3
θ 
.
Γ = 2 2 Γ3 =  0 0 cos
sin θ
r sin θ
1
cos θ
0
r
sin θ
KAPITEL 3. VEKTORANALYSIS
3.3.11
294
*Beschleunigung sphärisch zerlegt
Die Beschleunigung a : I → R3 einer C 2 -Kurve γ : I → R3 soll nun zur Zeit t für
γ (t) ∈ U nach den Elementen der Kartenbasis der Karte Φ : U → R3 der Kugelkoordinaten im Punkt γ (t) zerlegt werden. Die entsprechenden Komponentenfunktionen
ai : I → R werden also wie folgt definiert: für t ∈ I gilt
d2 γ
a (t) = 2 (t) =
dt
3
ai (t) δ Φ
i
γ(t)
.
i=1
Um die Suggestivkraft der Formeln zu erhöhen wird vereinfachend notiert a1 =
ar , a2 = aθ , a3 = aϕ . Darüberhinaus wird etwas sinnentstellend (Φi ◦ γ) =
′
′′
(r, θ, ϕ) , (Φi ◦ γ) = ṙ, θ̇, ϕ̇ und (Φi ◦ γ) = r̈, θ̈, ϕ̈ abgekürzt.
Die Spezialisierung von Formel (3.26) auf die Christoffelsymbole von Gleichung
(3.31) ergibt dann
2
ar = r̈ − rθ̇ − r sin2 (θ) ϕ̇2 ,
2
aθ = θ̈ + ṙθ̇ − sin (θ) cos (θ) ϕ̇2 ,
r
cos θ
2
θ̇ϕ̇.
aϕ = ϕ̈ + ṙϕ̇ + 2
r
sin θ
Beispiel 142 Sehen wir uns an, ob die Beschleunigungskomponenten ar , aθ und aϕ
der folgenden unbeschleunigten ’Bewegung’ γ : R>0 → R3 tatsächlich gleich 0 sind.
Es gelte mit s, v ∈ R>0
γ (t) = vt · e1 + s · e2 ,
d.h. die Bewegung führt vom Punkt s · e2 mit konstanter Geschwindigkeit in positive
1-Richtung. Es gilt also r (t) = s2 + (vt)2 , θ (t) = π/2, ϕ (t) = arctan vts und
daher
v2t
(sv)2
ṙ (t) =
, r̈ (t) =
.
3/2
s2 + (vt)2
s2 + (vt)2
Weiter folgt θ̇ = 0 = θ̈ und
ϕ̇ (t) =
−sv
2
s + (vt)2
ϕ̈ (t) =
2sv 3 t
s2 + (vt)2
2.
Daraus folgt
r
(sv)2
2
a (t) = r̈ (t) − r (t) ϕ̇ (t) =
s2 + (vt)2
3/2
−
s2
2
+ (vt) ·
(sv)2
s2 + (vt)2
aθ (t) = 0,
aϕ (t) =
2sv 3 t
s2 + (vt)
2 2
+
2
s2 + (vt)2
·
v2t
s2 + (vt)2
·
s2
−sv
= 0.
+ (vt)2
2
= 0,
KAPITEL 3. VEKTORANALYSIS
3.3.12
295
*Bewegung im Zentralkraftfeld
Als Anwendung der Zerlegung eines Beschleunigungsvektors nach der Kartenbasis
der Kugelkoordinaten soll nun noch das Beispiel von Newtons Bewegungsgleichung
mit einem stetigen, drehinvarianten und radial gerichteten Kraftfeld behandelt werden.
Wir wissen bereits, dass so ein Kraftfeld ein Gradientenfeld ist. Wirkt auf einen
(klassischen) Massenpunkt der Masse m eine solche Kraft, dann ist die zeitliche
Abfolge der Orte des Massenpunktes eine Kurve γ : I → R3 , für die
mγ̈ (t) = −gradγ(t) (V ◦ r)
gilt. Dabei ist V : R>0 → R eine C 1 -Funktion und r (p) bezeichnet den Abstand von
p ∈ R3 zum Kraftzentrum. Wird das Kraftzentrum in 0 angesiedelt, dann gilt für
alle t ∈ I
γ (t)
mγ̈ (t) = −V ′ (|γ (t)|)
.
(3.32)
|γ (t)|
Gesucht sind letztlich alle maximalen Lösungen γ dieser Bewegungsgleichung.
Diese Aufgabenstellung werden wir jedoch nicht lösen können. Wir werden aber
zumindest einige Eigenschaften der Lösungen γ von Gleichung (3.32) ableiten.
Verwendung von Standardkoordinaten Ψ bringt Newtons Gleichung in die Form
i
mẍ (t) = −
V′
j
j
(xj (t))2
(xj (t))
2
xi (t) .
Dabei wurde xi = Ψi ◦ γ gesetzt. Die Gleichungen sind außer für V (r) = kr2
nichtlinear und miteinander verkoppelt.
Verwendung von Kugelkoordinaten Φ um das Kraftzentrum führt, wegen
gradγ(t) (V ◦ r) = V ′ (|γ (t)|) δ Φ
1
γ(t)
,
auf die Komponentenform
2
m r̈ − rθ̇ − r sin2 θϕ̇2 = −V ′ (r) ,
2
m θ̈ + ṙθ̇ − sin θ cos θ ϕ̇2 = 0,
r
2
cos θ
θ̇ϕ̇ = 0.
m ϕ̈ + ṙϕ̇ + 2
r
sin θ
(3.33a)
(3.33b)
(3.33c)
Wieder wurde verkürzend notiert: Φ1 ◦ γ = r etc. Auch dieser Satz von gekoppelten
Gleichungen erscheint zunächst unlösbar. Aber zwei Erhaltungssätze helfen weiter.
Zunächst beachtet man, dass
d
(γ (t) × γ̇ (t)) = γ̇ (t) × γ̇ (t) + γ (t) × γ̈ (t) = 0,
dt
KAPITEL 3. VEKTORANALYSIS
296
da γ̈ (t) und γ (t) gemäß Gleichung (3.32) kollinear sind. Somit gilt für alle t, t0 ∈ I,
dass
γ (t) × γ̇ (t) = γ (t0 ) × γ̇ (t0 ) .
Wegen
0 = γ (t) , γ (t) × γ̇ (t) = γ (t) , γ (t0 ) × γ̇ (t0 )
liegen das Bild von γ in der Ebene durch 0 mit dem Normalenvektor γ (t0 ) × γ̇ (t0 ) ,
wobei t0 ∈ I beliebig ist.
Da jede Lösung γ von (3.32) durch eine Drehung R in eine Lösung R ◦ γ mit Bild
in der z = 0 Ebene übergeführt werden kann, genügt es, Lösungen γ zu untersuchen,
für die θ◦γ = π/2 gilt. Für diese ist (3.33b) trivial erfüllt und die Gleichungen (3.33a)
und (3.33c) vereinfachen sich zu
m r̈ − rϕ̇2 = −V ′ (r) ,
2
m ϕ̈ + ṙϕ̇ = 0.
r
(3.34a)
(3.34b)
Der Vektor γ (t) × γ̇ (t) spezialisiert sich für Lösungen mit z = 0 zu
γ (t) × γ̇ (t) = r (t) δ Φ
1
2
γ(t)
× ṙ (t) δ Φ
1
γ(t)
+ ϕ̇ (t) δ Φ
3
γ(t)
= −r (t) ϕ̇ (t) δ Φ
2
γ(t)
= r (t) ϕ̇ (t) e3 .
Da dieser Vektor von t unabhängig ist, existiert eine Zahl l ∈ R, sodass für alle t ∈ I
l = mr2 (t) ϕ̇ (t) .
(3.35)
l ist die dritte Komponente des Drehimpulses mγ (t) × γ̇ (t) bezüglich der Zerlegung
nach der Standardbasis.
Mittels (3.35) lässt sich nun ϕ̇ aus Gleichung (3.34a) eliminieren. Damit ergibt
sich die folgende 1-dimensionale Bewegungsgleichung auf R>0
l2
m r̈ − 2 3
mr
= −V ′ (r) .
(3.36)
Multiplikation dieser Gleichung (3.36) mit ṙ ergibt
m r̈ṙ −
l2
ṙ + V ′ (r) ṙ = 0
m2 r 3
Dies wiederum ist äquivalent zu
*
d m 2
l2
ṙ + 2 2
dt 2
mr
+
+ V (r) = 0.
Es existiert also eine Zahl E ∈ R, sie heißt Energie des Massenpunktes, für die
l2
m 2
ṙ + 2 2
E=
2
mr
+ V (r) .
(3.37)
KAPITEL 3. VEKTORANALYSIS
297
Damit sind von den ursprünglich drei gekoppelten Gleichungen zweiter Ordnung nur mehr die beiden Gleichungen (3.37) und (3.35) erster Ordnung übrig. Die
Gleichung (3.37) kann nach ṙ aufgelöst und dann nach Wahl einer Anfangsvorgabe zumindest numerisch gelöst werden. Diese Lösung kann dann in (3.35) eingesezt
werden, womit auch diese Gleichung einer numerischen Integration zugänglich ist.
In speziellen Fällen wie etwa V (r) = α/r mit α ∈ R lässt sich auch die exakte
Analyse weitertreiben. Details davon gibt eine Vorlesung über klassische Mechanik
im Kapitel über das Keplerproblem.
3.3.13
*Keplerproblem
Weil dieses Ergebnis eines der Kronjuwelen der Physik ist, soll hier noch aus den
beiden Gleichungen (3.35) und (3.37) abgeleitet werden, dass die Bildmenge einer
maximalen Lösung von Newtons Bewegungsgleichung (3.32) im Fall V (r) = α/r
mit α ∈ R ein Kegelschnitt ist. Dazu wird aus den beiden Bewegungsgleichungen
(3.35) und (3.37) eine Differentialgleichung für den lokalen Funktionszusammenhang
zwischen r und ϕ abgeleitet. Das geht so: Sei r (0) = r0 und ϕ (0) = ϕ0 und für
0 < t < ε gelte r (t) = ρ (ϕ (t)) mit einer differenzierbaren Funktion ρ : J =
(ϕ0 − ∆1 , ϕ0 + ∆2 ) → R>0 größtmöglichen Definitionsbereichs. Dann folgt für alle
t∈J
ṙ (t) = ρ′ (ϕ (t)) · ϕ̇ (t) = ρ′ (ϕ (t)) ·
l
mr2
(t)
= ρ′ (ϕ (t)) ·
mρ2
l
.
(ϕ (t))
Einsetzen dieses Ausdrucks für ṙ in (3.37) ergibt auf J
E=
l2
l2
m ′2
ρ · 2 4+ 2 2
2
mρ
mρ
+ V (ρ) .
OEdA29 kann dies zumindest30 für l = 0 aufgelöst werden zu
/
dρ
2m
=ρ
(E − V (ρ)) ρ2 − 1.
dϕ
l2
Diese Differentialgleichung ist vom Typ des separierten Variablen und es folgt für
alle ϕ ∈ J
ρ(ϕ)
dx
ϕ − ϕ0 =
.
2−1
r0
x 2m
(E
−
V
(x))
x
2
l
Mit a := 2mE/l2 und b := mα/l2 ist dieses Integral für V (r) = α/r elementar
zu lösen:
,ρ(ϕ)
ρ(ϕ)
dx
bx + 1 ,,
√
√
ϕ − ϕ0 =
= − arcsin
.
x ax2 − 2bx − 1
x a + b2 ,r0
r0
29
30
Die Bewegungsumkehrinvarianz kann dazu benützt werden ρ′ > 0 herbeizuführen.
Für l = 0 liegt die Bahnkurve auf einer Graden durch 0.
KAPITEL 3. VEKTORANALYSIS
298
Anwendung von sin ergibt
br0 + 1
bρ (ϕ) + 1
√
√
=
r0 a + b2
ρ (ϕ) a + b2
b
1
√
=√
+
,
a + b2 ρ (ϕ) a + b2
− sin ϕ − ϕ0 − arcsin
also für alle ϕ ∈ J
√
a + b2
1+
sin (ϕ − δ)
b
1
= −b ·
ρ (ϕ)
mit
δ = ϕ0 + arcsin
br0 + 1
√
r0 a + b2
.
Es ist dies die Polardarstellung eines (Teils eines) Kegelschnitts.
Ein zweiter Weg zu diesem Ergebnis, startet direkt von der 1-d Bewegungsgleichung (3.36). In dieser werden die Zeitableitungen von r über die Kettenregel
durch die Winkelableitungen einer zumindest lokal existierenden Funktion u, für die
u (ϕ (t)) = 1/r (t) gilt, ausgedrückt. Aus der Kettenregel ergibt sich
ṙ (t) =
d
dt
1
u (ϕ (t))
=−
u′ (ϕ (t))
l
l ′
u′ (ϕ (t))
ϕ̇
(t)
=
−
u (ϕ (t))
2
2 ·
2 = −
m
u (ϕ (t))
u (ϕ (t)) mr (t)
und daher auch
r̈ (t) = −
l d ′
l
l
l
u (ϕ (t)) = − u′′ (ϕ (t)) ϕ̇ (t) = − u′′ (ϕ (t)) ·
m dt
m
m
mr (t)2
l
= −
m
2
u′′ (ϕ (t)) · u (ϕ (t))2 .
Ersetzen von r̈ (t) in der radialen Bewegungsgleichung (3.36) durch
−
l
m
2
u′′ (ϕ (t)) · u (ϕ (t))2
ergibt
0 = m r̈ (t) −
= −m ·
l
m
l2
m2 r3 (t)
+ V ′ (r (t))
2
· [u′′ (ϕ (t)) + u (ϕ (t))] · u (ϕ (t))2 − α · u (ϕ (t))2
oder äquivalent dazu
u′′ (ϕ (t)) + u (ϕ (t)) = −
αm
.
l2
(3.38)
KAPITEL 3. VEKTORANALYSIS
299
Für jede Lösung u auf dem Intervall (0, 2π) von Gleichung (3.38) existieren Zahlen p, δ ∈ R, sodass
αm
1
= u (ϕ (t)) = p cos (ϕ (t) − δ) − 2
r (t)
l
für alle t mit ϕ (t) ∈ (0, 2π) . Natürlich bleibt hier die Funktion t → ϕ (t) im Dunkeln, aber zumindest der Zusammenhang zwischen r (t) und ϕ (t) ist bis auf die
Integrationskonstanten p, l und δ vollkommen festgelegt. Für die Bestimmung der
Integrationskonstanten sind Anfangsbedingungen zu stellen.
3.3.14
*Richtungsableitung eines Vektorfeldes
Zunächst eine Erinnerung an die Richtungsableitung eines Vektorfeldes, das auf
einer offenen Teilmenge U des Vektorraums V = Rn definiert ist. Sei X : U → Rn
ein C 1 -Vektorfeld. (e1 , . . . en ) bezeichnet wieder die Standardbasis von Rn und X =
n
i
i=1 X ei definiert die Komponentenfunktionen von X zur Standardbasis. Ξ sei die
Standardkarte von Rn . Es gilt also X i = Xei = XΞi . Dann ist durch
1
[X (p + εei ) − X (p)] =
ε→0 ε
n
n
[ei ]p X j · ej =
[ei ]p X = lim
j=1
∂iΞ X j
p
j=1
· ej
eine Richtungsableitung von X mit dem Vektor ei definiert. Sie ist selbst vektorwertig. Etwas allgemeiner geht es wie folgt.
Definition 143 Für ein C 1 -Vektorfeld X mit offenem Definitionsbereich U ⊂ Rn
und ein Vektorfeld Y : U → Rn heißt das Vektorfeld [Y ] X, das in p ∈ U den Wert
[Y ]p X = lim 1
ε→0
X (p + εY (p)) − X (p)
ε
hat, Richtungsableitung oder kovariante Ableitung von X mit dem Vektorfeld Y. Statt
[Y ]p X wird auch (∇Y X) (p) notiert.
Mit den Komponentenfunktionen zur Standardkarte ergibt sich offenbar
n
[Y ]p X =
n
[Y ]p X
j=1
j
Y i (p) ∂iΞ X j
ej =
i,j=1
p
· ej
Die beiden folgenden Produktregeln sind brauchbare Rechenhilfen.
Satz 144 Seien f : U → R und X, Y : U → Rn mit U ⊂ Rn offen vom C 1 -Typ.
Weiter seien Z : U → Rn und ein Skalarprodukt ·, · von Rn gewählt. Dann gilt
[Y ] (f · X) = ([Y ] f ) · X + f · ([Y ] X) und [Z] X, Y = [Z] X, Y + X, [Z] Y .
KAPITEL 3. VEKTORANALYSIS
300
Seien X, Y Vektorfelder auf dem Kartenbereich U einer beliebigen lokalen Karte
Φ : U → Rn , wobei X ein C 1 -Vektorfeld ist. Wie drückt sich das Vektorfeld [Y ] X :
U → Rn durch die partiellen Ableitungen und die Komponentenfunktionen von X
und Y bezüglich der Karte Φ aus?
Satz 145 Seien X, Y : U → Rn mit X vom C 1 -Typ. Φ : U → Rn sei eine lokale
Karte. Die Komponentenfunktionen des Vektorfelds X bezüglich der Kartenbasis zu
Φ sind durch X = ni=1 XΦi ·δ Φ
i definiert. Analoge Bezeichnungen sind für Y gewählt.
Dann gilt mit den Zusammenhangskomponenten Γkij der Karte Φ
.
7
n
n
n
YΦi
[Y ] X =
Γkij XΦj
∂iΦ XΦk +
k=1 i=1
· δΦ
k.
j=1
(3.39)
Beweis. Es gilt
n
n
n
YΦi δ Φ
i X =
[Y ] X =
i=1
n
i=1
i=1
j=1
n
n
XΦj
YΦi δ Φ
i
=
XΦj δ Φ
j
YΦi δ Φ
i
j=1
k=1
n
∂jΦ xk · ek =
YΦi
XΦj ∂jΦ xk
δΦ
i
i,j,k=1
· ek .
XΦj ∂jΦ xk zunächst weiter.
Verfolgen wir das Skalarfeld der Richtungsableitung δΦ
i
Es gilt
δΦ
XΦj ∂jΦ xk = ∂iΦ XΦj ∂jΦ xk + XΦj ∂iΦ ∂jΦ xk
i
und daher
n
k=1
XΦj ∂jΦ xk · ek =
δΦ
i
n
∂iΦ XΦj ∂jΦ xk + XΦj ∂iΦ ∂jΦ xk
k=1
n
n
∂iΦ XΦj
=
k=1
n
=
l=1
· ek
.
∂jΦ xk
+
XΦj
∂iΦ ∂jΦ xk
l=1
∂kΞ Φl · δ Φ
l
n
∂iΦ XΦj δ lj + XΦj
∂iΦ ∂jΦ xk
k=1
∂kΞ Φl
7
· δΦ
l .
Somit ist gezeigt, dass [Y ] X =
n
n
n
YΦi
l=1 i,j=1
∂iΦ XΦj δ lj + Γlij XΦj · δ Φ
l =
n
YΦi
l=1 i=1
.
n
Γlij XΦj
∂iΦ XΦl +
j=1
7
· δΦ
l .
n
Φ
Φ
l
Als Spezialfall von (3.39) ergibt sich δ Φ
i δj =
l=1 Γij · δ l . Zusammen mit der
Produktregel [Y ] (f X) = ([Y ] f) X + f [Y ] X für ein Skalarfeld f und ein Vektorfeld
X ergibt sich daraus wieder der allgemeine Fall.
KAPITEL 3. VEKTORANALYSIS
301
Man beachte, dass für zwei C 1 -Vektorfelder X, Y wegen Γlij = Γlji folgt, dass
n
[Y, X] := [Y ] X − [X] Y =
i,j=1
YΦi ∂iΦ XΦj − XΦi ∂iΦ YΦj
· δΦ
j.
Die Christoffelsymbole fallen also aus dem Lieprodukt der Vektorfelder X und Y
heraus! Überdies folgt für f ∈ C 2 (U : R) und X, Y ∈ C 1 (U : Rn ) , dass [Y ] ([X] f ) −
[X] ([Y ] f) = [[Y, X]] f auf U gilt. Dabei bezeichnet [X] f das Skalarfeld auf U, für
das [X] f : p → [X]p f. Die letzte Behauptung ergibt sich unter Verwendung einer
Karte Φ am Kartenbereich der Karte wegen ∂iΦ ∂jΦ f = ∂jΦ ∂iΦ f so:
n
[Y ] ([X] f ) − [X] ([Y ] f ) =
i,j=1
n
=
i,j=1
3.3.15
YΦi ∂iΦ XΦj ∂jΦ f − XΦi ∂iΦ YΦj ∂jΦ f
YΦi ∂iΦ XΦj − XΦi ∂iΦ YΦj
∂jΦ f = [[Y, X]] f.
Div, Rot, Grad und ∆ in krummen Karten
Große rechnerische Bedeutung haben auch die Kartenausdrücke von Gradient, Divergenz, Rotation und Laplace in krummlinigen Koordinatensystemen. Der folgende
Satz gibt allgemeine Formeln an. Die Spezialisierungen auf einzelne Koordinatensysteme sind tabelliert. [14]
Satz 146 Sei Φ : U → Φ(U) ⊂ Rn eine lokale Karte. Die Abbildungen f : U → R
und X : U → V seien vom C 1 -Typ. Die skalaren Komponentenfunktionen XΦi von
X bezüglich der Kartenbasis zu Φ sind durch X = ni=1 XΦi δ Φ
i definiert. Dann gilt
n
i
GΦ (p)
(a) X (p) =
−1 ij
j=1
n
∂iΦ f
(b) grad (f ) =
(
δΦ
j
, X(p)
p
GΦ
−1 ij
∂iΦ
√
det GΦ XΦi ,
)
für p ∈ U,
δΦ
j,
i,j=1
1
(c) div (X) = √
det GΦ
n
i=1
n
√
1
(d) ∆f = √
∂iΦ
det GΦ
det GΦ i,j=1
GΦ
−1 ij
∂jΦ f
für f ∈ C 2 .
Für n = 3 und eine Karte Φ mit positiv orientierter Kartenbasis gilt
2
3
3
3
1
i
(e) rot (X) = √
εklm ∂kΦ
GΦ
δΦ
li XΦ
m.
det GΦ k,l,m=1
i=1
Hier ist εklm = det (ek , el , em ). Für eine Karte mit negativ orientierter Kartenbasis
ist εklm durch −εklm zu ersetzen.
KAPITEL 3. VEKTORANALYSIS
302
Verwunderlich ist auf den ersten Blick das Vorkommen des Skalarprodukts in der
Formel für div (X). Die beiden Funktionen det GΦ zu zwei Skalarprodukten unterscheiden sich jedoch nur um einen konstanten, positiv reellen Faktor voneinander.
Dieser Faktor kürzt sich im Ausdruck für div (X) heraus, sodass div (X) nicht von
der Wahl des Skalarproduktes abhängt. Das gilt nicht mehr für die allgemeinere Situation Riemann’scher Mannigfaltigkeiten anstelle von Vektorräumen. Dort ist der
Faktor nicht notwendig konstant.
Beweis. Zu (a): Sei δ eine beliebige Basis eines reellen Vektorraums V und sei
·, · ein Skalarprodukt von V. Die Gram’sche Matrix von ·, · zu δ sei G. Dann gilt
für den Vektor X = nj=1 X j δ j
n
n
X j δi, δj =
δi , X =
j=1
X j Gij .
j=1
ji
Daraus folgt X j = nj=1 (G−1 ) δ i , X . Damit ist (a) gezeigt.
n
i Φ
Zu (b): Ein beliebiges Vektorfeld X =
i=1 XΦ δ i ergibt das Skalarfeld der
Richtungsableitungen von f zu
n
n
XΦi δ Φ
i f =
[X] f =
i=1
Andererseits gilt mit grad (f ) =
i=1
n
j=1
grad (f )j δ Φ
j
n
[X] f =
grad (f) , X =
i=1
n
XΦi
=
i,j=1
XΦi ∂iΦ f.
&
'
XΦi grad (f) , δ Φ
i
&
'
Φ
grad (f ) δ Φ
=
j , δi
n
j
XΦi grad (f )j GΦ
ji .
i,j=1
Wähle nun das Vektorfeld X so, dass XΦi = δ ik für ein k ∈ {1, . . . n} . Da dies für
alle k = 1, . . . n möglich ist, folgt für alle k
n
grad (f)j GΦ
jk .
∂kΦ f =
j=1
ji
Somit folgt grad (f )j = ni=1 GΦ−1 ∂iΦ f und (b) ist gezeigt.
Der Beweis von (c) ist in Vol 3 von [4] zu finden. (d) schließlich ist durch Einsetzen
von (b) in (c) offensichtlich. (e) ist in [10] zu finden.
Kugelkoordinaten
Sei n = 3 und Φ = (r, θ, ϕ) Kugelkoordinaten. Dann gilt für f : U → R vom C 1 -Typ
mit der Kurznotation ∂r = ∂1Φ , δ r = δ Φ
1 etc.
grad (f ) = (∂r f ) δ r +
∂θ f
∂ϕ f
δ θ + 2 2 δϕ .
2
r
r sin θ
KAPITEL 3. VEKTORANALYSIS
303
Insbesondere gilt: grad (r) = δ r , grad (θ) = r−2 δ θ und grad (ϕ) = r−2 sin−2 (θ) δ ϕ .
Mit f ∈ C 2 (U : R) folgt aus Satzteil c) für ∆f in Kugelkoordinaten
*
+
∂ϕ2 f
1
1
2
div grad f = 2 ∂r r ∂r f + 2
∂θ (sin θ · ∂θ f ) +
r
r sin θ
sin θ
2
1
1
∂2
f.
=
∂r2 + ∂r + 2 ∂θ2 + cot θ · ∂θ +
r
r
sin2 θ ϕ
Anwendungsbeispiele
1. Welche Divergenz hat das Vektorfeld δ θ auf U ? Es gilt
1
daher div (δ θ ) = r2 sin
∂ (r2 sin θ) = cot θ.
θ θ
√
det GΦ = r2 sin θ und
2. Das Potential einer (homogen) geladenen Halbgerade ist Φe = ln (|·| − e, · )
mit |e| = 1. Rechnen wir nach, dass ∆Φe = 0. Mit Kugelkoordinaten (r, θ, ϕ)
zur Polrichtung e gilt Φe = ln (r (1 − cos θ)) = ln r sin2 (θ/2) + ln 2. Daraus
folgt nun
∆Φe =
2
1
∂r2 + ∂r ln r + 2 ∂θ2 + cot θ · ∂θ ln (1 − cos θ) .
r
r
Es gilt erstens ∂r2 + 2r ∂r ln r = (−r−2 + 2r−2 ) = 1/r2 und zweitens
sin θ
1 − cos θ
2
cos θ
(1 − cos θ) cos θ − sin θ
−1
cos θ
+
=
+
= −1.
=
2
1 − cos θ
1 − cos θ 1 − cos θ
(1 − cos θ)
∂θ2 + cot θ · ∂θ ln (1 − cos θ) = (∂θ + cot θ)
Damit folgt nun ∆Φe = 0.
3. Die Koordinatenfunktion ϕ selbst ist das elektrostatische Potential der dipolbelegten Halbebene y = 0 und x ≥ 0. Es gilt ∆ϕ = r−2 sin−2 θ∂ϕ2 ϕ = 0.
3.3.16
*Drehgeneratoren in Kugelkoordinaten
Sei V ein dreidimensionaler reeller Vektorraum. Eine Orientierung und ein Skalarprodukt ·, · mit zugehöriger Norm |·| seien gewählt. Ebenso eine positiv orientierte Orthonormalbasis e = (e1 , e2 , e3 ) . Zu einem Vektor n ∈ V mit |n| = 1 ist
Ln : V → V mit Ln (v) = n × v das Tangentenvektorfeld einer starren Drehung um
die Achse R · n. Im folgenden sei f : V → R ein C ∞ -Skalarfeld.
Das Skalarfeld der Richtungsableitungen von f mit dem Drehvektorfeld Ln erfüllt
aufgrund der ’Spatproduktformel’ a, b × c = b, c × a
[Ln ]v f = gradv (f ) , Ln (v) = gradv (f ) , n × v = n, v × gradv (f ) .
Definition 147 Die Abbildung Ln : C ∞ (V : R) → C ∞ (V : R) mit Ln (f ) = [Ln ] f
heißt Drehgenerator zur Achsenrichtung n ∈ S2 ⊂ V. Also Ln (f ) : v → [Ln ]v f.
KAPITEL 3. VEKTORANALYSIS
304
3
i=1
Ist (x, y, z) die lineare Karte von V zur Basis e, dann gilt mit n =
ni ei
Ln (f ) = n1 (y∂z − z∂y ) + n2 (z∂x − x∂z ) + n3 (x∂y − y∂x ) f.
Die drei Drehgeneratoren Li ≡ Lei zur gewählten ONB, also L1 = y∂z − z∂y
etc, sollen nun durch die drei ’Derivationen’ δ Φ
: C ∞ (V : R) → C ∞ (V : R) mit
i
Φ
δΦ
i f = ∂i f zur Karte Φ = (r, θ, ϕ) der Kugelkoordinaten ausgedrückt werden.
Dies gelingt ohne großen Rechenaufwand, wenn zunächst für v im Kartenbereich U
Φ Φ
von Φ der Vektor v × gradv (f ) nach der Kartenbasis δ Φ
1 , δ 2 , δ 3 v = (δ r , δ θ , δ ϕ )v im
Punkt v zerlegt wird.
Es gilt wegen v = r (v) · δ r
v × gradv (f ) = |v| · (δ r )v × (∂r f ) δ r +
∂θ f
∂ϕ f
δϕ
δ
+
θ
r2
r2 sin2 θ
.
v
Der ’Rahmen’31 (δ r , δ θ /r, δ ϕ /r sin θ) ist in jedem Punkt von U orthonormiert und
positiv orientiert, sodass
δr ×
δθ
δϕ
δϕ
δθ
=
und δ r ×
=−
r
r sin θ
r sin θ
r
folgt. Daher gilt
v × gradv (f ) =
∂θ f
∂ϕ f
δϕ −
δθ
r sin θ
r sin θ
.
v
Aus den Darstellungen




r cos θ cos ϕ
−r sin θ sin ϕ
δ θ = (e1 , e2 , e3 ) ·  r cos θ sin ϕ  und δ ϕ = (e1 , e2 , e3 ) ·  r sin θ cos ϕ 
−r sin θ
0
folgt nun für die drei Drehgeneratoren
Li =
ei , δ ϕ
ei , δ θ
∂θ −
∂ϕ
r sin θ
r sin θ
die Zerlegung nach den Derivationen ∂iΦ
L1 = − sin ϕ · ∂θ − cot θ cos ϕ · ∂ϕ ,
L2 = cos ϕ · ∂θ − cot θ sin ϕ · ∂ϕ ,
L3 = ∂ϕ .
In der Quantenmechanik treten die Richtungsableitungen −i Li auf den komplexwertigen Skalarfeldern von V als Bahndrehimpulsoperatoren auf.
Satz 148 Für die Abbildungen L2i = Li ◦ Li : C ∞ (V : R) → C ∞ (V : R) gilt auf U
L21 + L22 + L23 f =
31
∂ϕ2 f
1
∂θ (sin θ∂θ f ) +
.
sin θ
sin2 θ
Ein Rahmen ordnet jedem Punkt einer fest gewählten offenen Teilmenge von V eine Basis von
V zu.
KAPITEL 3. VEKTORANALYSIS
305
Beweis. Einfach unter Beachtung der Produktregel mit der sphärischen Zerlegung der Li nachrechnen.
Korollar 149 Für die Summe der Abbildungen L2i gilt auf U
L21 + L22 + L23 f = r2 ∆f − ∂r r2 ∂r f .
Beweis. Dies ist aus der Darstellung des Laplaceoperators in Kugelkoordinaten
direkt abzulesen.
3.3.17
*Magnetfeldlinien eines Dipols 2
Das elektrische bzw magnetische Feldstärkevektorfeld eines elektrischen bzw magnetischen Punktdipols ist bis auf einen konstanten Faktor das Gradientenfeld des skalaren Potentials f : R3 0 → R mit f = e3 , · /r3 . Auf U gilt somit f = cos (θ) /r2 .
Im Bereich z > 0 folgt daraus f > 0 und im Bereich z < 0 hingegen f < 0.
Die Gradientenformel in Kugelkoordinaten ergibt im Kartenbereich U
*
+
1
sin (θ)
grad (f ) = − 3 2 cos (θ) δ r +
δθ .
r
r
Nach stetiger Fortsetzung von U nach R3 0 zeigt sich: an den Polen ist das Feld
radial und am Äquator tangential. Es folgt weiter auf U
|grad (f)| =
1
r3
(2 cos (θ))2 + (sin (θ))2 =
1
r3
1 + 3 cos2 (θ).
Das Magnetfeld B der Erde ist außerhalb der Erdkugel annähernd vom Typ
c · grad (f) . Daher variiert |B| auf der Erdoberfläche mit der geografischen Breite.
An den Polen ist |B| maximal, am Äquator hingegen minimal und nur halb so
groß wie am Pol. Am Pol steht B senkrecht zur Erdoberfläche, am Äquator ist B
tangential zum Meridian.
Eine weitere Veranschaulichung des Feldes eines Punktdipols liefern die Feldlinien des Vektorfeldes grad (f ) . Dazu sind alle maximalen Lösungen des Systems erster
Ordnung γ̇ (t) = gradγ(t) (f) zu bestimmen. Die Bildmenge einer solchen Lösung γ
ergibt dann eine Feldlinie oder ’Integralmannigfaltigkeit’ von grad (f ) . Zwei Vektorfelder X und Y, für die eine stetige skalare Funktion α ohne Nullstelle existiert,
sodass X = αY gilt, haben aber dieselben Feldlinien. Wir gehen daher im Bereich
U mit cos θ = 0 vom Vektorfeld grad (f ) zum Vektorfeld
r4
X := −
grad (f ) = 2rδ r + tan (θ) δ θ
cos θ
über. Unter Verwendung von r ◦ γ =: rγ und θ ◦ γ =: θγ nimmt nun das System
γ̇ (t) = X (γ (t)) die komponentenweise Form
ṙγ (t) = 2rγ (t) und θ̇γ (t) = tan θγ (t)
KAPITEL 3. VEKTORANALYSIS
306
an. Das System X entkoppelt also (lokal32 ) die beiden Funktionen rγ und θγ .
Die Menge der maximalen Lösungen der radialen Gleichung y ′ = 2y umfasst
wegen der Einschränkung des Definitionsbereiches der Differentialgleichung auf y >
0 nur die Funktionen ρc : R → R>0 mit ρc (t) = ce2t mit c ∈ R>0 .
Die Polarwinkelgleichung y ′ = tan y im Bereich 0 < y < π/2 ist vom Typ der
separierten Variablen. Wegen
1
d
=
ln sin y
tan y
dy
erfüllt eine Lösung y die Gleichung ln sin y (t) = t + k für ein k ∈ R. Äquivalent dazu
ist
et
sin y (t) =
C
für ein C ∈ R>0 . Die Menge aller maximalen Lösungen im Wertebereich 0 < y < π/2
besteht somit aus den (bijektiven, wachsenden) Funktionen
αC : (−∞, ln C) → 0,
π
2
mit αC (t) = arcsin
et
mit C ∈ R>0 .
C
Eine maximale Lösung (ρc , αC ) des Systems ist somit nur auf (−∞, ln C) definiert.33 In diesem Bereich erfüllt sie
ρc (t)
= e2t = C sin2 αC (t) .
c
Damit sind die Bahnen der maximalen Integralkurven von X die Punktmengen in U
mit ϕ = const und r = r0 sin2 θ im Bereich 0 < θ < π/2. Dabei ist r0 das Supremum
der Restriktion von r auf die jeweilige Bahn.
Eine analoge Überlegung im Bereich π/2 < θ < π zeigt, dass jede Bahn im ’oberen’ Halbraum z > 0 an genau eine Bahn im Bereich z < 0 stetig anschließt. Die
Feldlinien eines Dipols im Schnitt der Ebene x = 0 mit U sind somit die Punktmengen in U, auf denen x = 0 und
r = r0 sin2 θ für ein r0 ∈ R>0
gilt. Dabei gibt r0 die maximale Entfernung der Feldlinie von 0 an. Nur zwei Feldlinien in R3 0 entschwinden in unendliche Entfernung, nämlich die Halbstrahlen
x = y = 0 mit z > 0 bzw z < 0. Sie besitzen keine Polardarstellung. Alle anderen
Feldlinien beginnen und enden in der Singularität des Nullpunktes.
Eine magnetische Feldlinie, die auf einer geografischen Breite von 45◦ aus dem
Erdinneren austritt, steigt wegen R = r0 sin2 π/4 = r0 /2 bis zu einer maximalen
Höhe eines Erdradiuses über dem Äquator auf. Feldlinien, die im Bereich des Polarkreises von θ = 23◦ ≈ 20◦ austreten, erreichen einen maximalen Abstand von
r0 ≈ R/ sin2 π/9 = 54455 km zum Erdmittelpunkt. Dies entspricht einer Höhe von
32
33
Global, werden wir gleich sehen, ist dies nicht der Fall.
Dies ist eine globale Kopplung der beiden Funktionen ργ und θγ durch das DG-System X.
KAPITEL 3. VEKTORANALYSIS
307
etwa 7, 5 Erdradien über dem Äquator. Dieser Bereich des Erdmagnetfeldes fängt
die Teilchen des Sonnenwindes ab und leitet sie zu den Polen um, wo sie tiefer in die
Atmosphäre eindringen und ihr das sanfte Leuchten der ’Aurora borealis’ entlocken.
Einige Feldlinien von grad (f) werden in Abb. 3.24 in rot gezeigt. Die grünen
Linien zeigen Schnitte von Niveauflächen von f mit der Ebene x = 0. Der blaue
Kreis ist der Einheitskreis. Alle anderen Feldlinien enstehen aus jenen in der Ebene
x = 0 durch Drehung um die z-Achse.
z
2
1
0
-2
-1
0
1
2
y
-1
-2
Abbildung 3.24: Punktdipol: Feldlinien (rot) und Äquipotentiale (grün)
Wir rechnen abschließend für das skalare Dipolpotential f = cos θ/r2 auf U in
Kugelkoordinaten noch nach, dass ∆f = 0 gilt.
1
1
∂r r2 ∂r f + 2
[∂θ (sin (θ) ∂θ f )]
2
r
r sin (θ)
1
2 cos θ
1
2 cos θ 2 cos θ
= 2 ∂r −
+ 4
∂θ − sin2 θ =
−
= 0.
r
r
r sin (θ)
r4
r4
∆f =
Wegen f ∈ C 2 (R3
3.4
0 : R) gilt somit ∆f = 0 auf ganz R3
0.
*Kartenfreie Mechanik in Galileis Raumzeit
Seit der Entdeckung von Einsteins Relativität vollzog sich die Entwicklung fundamentaler physikalischer Theorien weitgehend am Boden einer vierdimensionalen
Raumzeit mit pseudoriemannscher Geometrie. Dabei wurde zunehmend klar, dass
die kartenfreie Formulierung einer Theorie die Symmetrien derselben am klarsten
hervortreten lässt. Bei einer solchen Formulierung der Naturgesetze werden alle mathematischen Strukturen, die den Naturgesetzen innewohnen, ja notgedrungen explizit und bewusst gemacht.
KAPITEL 3. VEKTORANALYSIS
308
Aufgrund dieser Erfahrungen erscheint es nur naheliegend, auch Newtons Mechanik innerhalb einer vierdimensionalen Raumzeit kartenfrei darzustellen. Dabei zeigt
sich, dass Begriffe wie Bezugssystem mathematisch greifbar werden und nicht in
die umrahmenden Reden verbannt werden müssen. Geschwindigkeit und Beschleunigung werden explizit von der Wahl eines Bezugssystems abhängig, da die Weltlinie
eines Teilchens als absolutes Objekt frei von der Wahl eines Bezugs- oder gar Koordinatensytsems formuliert wird. Newtons Bewegungsgesetze abgeschlossener Systeme
werden so gebildet, dass ihre Galileiinvarianz offensichtlich ist.
3.4.1
Affine Räume
Galileis flache Raumzeit, auf der Newtons Mechanik ähnlich der relativistischen Mechanik formuliert werden soll, kann als ein spezieller affiner Raum konzipiert werden.
Daher wird zunächst beschrieben, was ein affiner Raum ist. Ein solcher besitzt wie
ein Vektorraum einen natürlichen Fernparallelismus zwischen je zwei seiner Tangentialräume. Dadurch wird die Beschreibung von Differential, Vektorfeldern und
kovarianter Ableitung wesentlich einfacher als für allgemeine differenzierbare Mannigfaltigkeiten. Das entscheidende Bestimmungsstück eines affinen Raumes ist die
Operation einer Gruppe auf einer Menge.
Definition 150 Sei G eine Gruppe und M eine Menge. Die Verknüpfung zweier
Gruppenelemente g1 , g2 ∈ G wird als g2 · g1 notiert. Das neutrale Element von G
wird durch 0 bezeichnet. Eine Abbildung µ : G × M → M heißt Linksoperation der
Gruppe G auf M, falls µ (g2 , µ (g1 , x)) = µ (g2 · g1 , x) für alle g1 , g2 ∈ G und für alle
x ∈ M. Existiert für je zwei Elemente x, y ∈ M ein g ∈ G, sodass µ (g, x) = y, dann
heißt µ transitiv. Falls µ (g, x) = x für ein x ∈ M impliziert, dass g = 0, dann heißt
µ frei.
Ein affiner Raum ist eine Menge M, deren Punkte aus einem beliebigen Punkt
von M durch ’Schieben’ mit den Elementen eines Vektorraums hervorgehen. Genauer
ist damit das Folgende gemeint.
Definition 151 Sei V ein reeller Vektorraum endlicher Dimension. Bezüglich der
Addition + seiner Elemente ist V eine Gruppe, (V, +) . Eine Menge M mit einer
freien und transitiven Operation µ von (V, +) auf M heißt affiner Raum.
Nach Wahl eines Punktes p in einem affinen Raum M über dem Vektorraum
V lässt sich somit jeder weitere Punkt q ∈ M mit einem Element v ∈ V als q =
µ (v, p) ≡ p + v darstellen. Dieser durch p und q eindeutig (!) bestimmte Vektor v
wird als q − p notiert, obwohl M kein Vektorraum ist. Die Dimension von V ist auch
die Dimension von M als Mannigfaltigkeit. Ein Beispiel eines affinen Raumes der
Dimension 2 ist mit komponentenweiser Addition
M = (x, y, z) ∈ R3 : x + y + z = 1 , V = (x, y, z) ∈ R3 : x + y + z = 0 .
Sei I ⊂ R ein offenes Intervall und p ∈ M ein beliebiger Punkt. Zu einer Kurve
γ : I → M existiert dann genau eine Kurve γ : I → V mit γ (t) = p + γ (t) für alle
KAPITEL 3. VEKTORANALYSIS
309
t ∈ I. Ist γ stetig bzw differenzierbar, dann heißt auch γ stetig bzw differenzierbar.
Im Fall der Differenzierbarkeit von γ wird der Vektor dγ (t) /dt als γ̇ (t) bezeichnet.
Dieser Vektor γ̇ (t) hängt nicht von der Wahl von p ab. Es gilt dann γ (t + ε) =
γ (t) + εγ̇ (t) + ψ (ε) mit ψ (ε) /ε → 0 für ε → 0.
Sei f : M ⊃ U → R mit U offen in M und sei γ : I → U differenzierbar mit
γ (t0 ) = p für ein t0 im offenen Intervall I ⊂ R. Existiert die Ableitung
f (p + γ (t0 + ε)) − f (p)
d
(f ◦ γ) (t0 ) = lim
ε→0
dt
ε
f p + γ̇ (t0 ) ε − f (p)
= lim
≡ [γ̇ (t0 )]p f,
ε→0
ε
wird sie als Richtungsableitung von f unter γ̇ (t0 ) bezeichnet.
Eine Funktion f wie oben heißt differenzierbar in p, falls eine lineare Abbildung
dp f : V → R existiert, sodass die Funktion ψ mit
f (p + ξ) = f (ξ) + dp f (ξ) + ψ (ξ) ,
die auf einer hinreichend kleinen Umgebung von 0 definiert ist, die Bedingung
limξ→0 ψ (ξ) / |ξ| = 0 erfüllt. Dabei ist |·| irgendeine Norm von V. Die Abbildung
dp f hängt, falls existent, nicht von der Wahl von |·| ab. Sie wird als das Differential
von f im Punkt p bezeichnet.
Eine Abbildung X : M ⊃ U → V heißt Tangentenvektorfeld auf U. Genau
genommen ist ein Tangentenvektor also ein Dupel (p, v) ∈ M × V. Vielfach wird
auch v alleine als Tangentenvektor aufgefasst. Diese Vereinfachung macht hier Sinn,
da die Gruppenoperation von V auf M einen kanonischen Isomorphismus zwischen
den Tangentialräumen in zwei Punkten von M erzeugt.
3.4.2
Flache Galilei Raumzeit M
In einer flachen Galilei Raumzeit existiert eine Äquivalenzrelation, welche die Raumzeit in ’instantane Räume’ gleichzeitiger Ereignisse blättert. Zusätzlich wird für je
zwei instantane Räume deren zeitlicher Abstand erklärt. Diese Struktur versucht das
zu formalisieren, was Newton ’absolute Zeit’ nannte. Zudem trägt jeder instantane
Raum eine euklidische Metrik. Daher das Attribut ’flach’, da ungekrümmt.
Auf eine Faserung der Raumzeit in Weltlinien gleicher Orte, wie sie in Newtons
absolutem Raum zum Ausdruck kommt, wird verzichtet. Eine solche Struktur hat
sich als unnötiger Ballast entpuppt, denn ’absolute Orte’ können in einem Newtonschen Universum aufgrund dessen Galileiinvarianz nicht identifiziert werden. Die
von Maxwells Elektrodynamik vorübergehend angebotene Möglichkeit eines Ätherruhsystems von absoluten Orten hat sich ja bekanntlich auch nicht verwirklichen
lassen.
Definition 152 Im Vektorraum V eines affinen Raumes (M, V, µ) sei eine lineare
Abbildung Z : V → R gewählt. (Zeitform) Im Untervektorraum V0 = ker Z von V
sei ein Skalarprodukt ·, · gewählt. Dann wird der Datensatz M = (M, V, µ, Z, ·, · )
KAPITEL 3. VEKTORANALYSIS
310
als flache Galileische Raumzeit bezeichnet. Sind p, q ∈ M, dann heißt Z (q − p) die
Zeit, die von p bis q verstreicht, oder auch Zeitdauer von p bis q. Ein Vektor v ∈ V
mit Z (v) = 1 heißt zeitnormiert. Für Z (q − p) = 0 werden p und q als gleichzeitig
q − p, q − p heißt Abstand zwischen den gleichzeitibezeichnet, und |q − p| =
gen Punkten p und q. Ein Vektor v ∈ V0 heißt raumartig. Sind drei Punkte q, r, s
gleichzeitig, dann heißt für r = q = s die Zahl θ ∈ [0, π] mit |r − q| |s − q| cos θ =
r − q, s − q der Winkel zwischen den Strecken von q nach r und von q nach s.
Die übliche koordinatenweise Formulierung der Mechanik wird durch die Wahl
einer Karte von M ermöglicht. Dabei wird meist eine an die Strukturen V, Z und ·, ·
angepasste globale Karte gewählt. Eine solche Karte ’identifiziert’ M mit R × Rn .
Wie sind diese Karten gebildet?
Definition 153 Eine Basis e = (e0 , e1 , . . . en ) von V mit Z (e0 ) = 1, Z (ei ) = 0 für
i = 1, . . . n und ei , ej = δ ij heißt Galileibasis (G-basis) von V. Ist ein Punkt p ∈ M
gewählt, dann heißt die Abbildung Φe,p : M → Rn+1 mit
n
x=p+
i=0
Φie,p (x) · ei
die zu (p, e) gehörige galileische Karte von M.
Es gilt also Φie,p (p) = 0 für i = 0, 1, . . . n.
Lemma 154 Ist Φe,p eine galileische Karte von M, dann gilt
Z (y − x) = Φ0e,p (y) − Φ0e,p (x) für alle x, y ∈ M und
n
2
|y − x|
Φie,p (y) − Φie,p (x)
=
i=1
2
für alle gleichzeitigen x, y ∈ M.
Beweis. Zu je zwei Punkten x, y ∈ M existieren Vektoren vx, vy ∈ V, sodass
x = p + vx und y = p + vy gilt. Daraus folgt y = x + (vy − vx ) und daher
n
Z (y − x) = Z (vy − vx) = Z
=
Φ0e,p
Für Z (y − x) = 0 folgt
$ n
|y − x|2 =
i=0
n
=
i,j=1
n
=
i,j=1
(y) −
Φ0e,p
n
i=0
Φie,p (y) ei −
Φie,p (x) ei
i=0
(x) .
n
Φie,p (y) − Φie,p (x) ei ,
Φie,p (y) − Φie,p (x)
Φie,p (y) − Φie,p (x)
j=0
Φje,p (y) − Φje,p (x) ej
%
Φje,p (y) − Φje,p (x) δ ij
2
.
Die Größen Zeitdauer, Abstand und Winkel berechnen sich also in allen galileischen Karten gleich.
KAPITEL 3. VEKTORANALYSIS
3.4.3
311
Bewegung und Bezugssysteme in M
Einen Schwarm von Teilchen fassen wir als eine Teilmenge X eines instantanen
Raumes p + V0 ⊂ M einer flachen Galileischen Raumzeit M auf. Die Bewegung
eines Schwarmteilchens, dh eines Punktes x ∈ X, ist dann eine stetige injektive
Abbildung γ x : J → M eines reellen Intervalls J nach M, sodass x in der Bildmenge
von γ x enthalten ist, und diese Bildmenge jeden instantanen Unterraum von M
in höchstens einem Punkt schneidet. Die Bewegung des ganzen Schwarms X wird
durch eine Schar von stetig differenzierbaren Kurven γ x : J → M erfasst. Dabei
ist J ⊂ R ein offenes Intervall. Für alle Kurven γ x existiert oEdA ein gemeinsames
t0 ∈ J, sodass γ x (t0 ) = x für alle x ∈ X. Weiter gilt Z γ x (t) − γ y (t) = 0 für
alle x, y ∈ X und für alle t ∈ J. Überdies gelte Z (γ̇ x (t)) = 0 für alle t ∈ J. Eine
differenzierbare Kurve γ : J → M mit Z (γ̇ (t)) = 0 für alle t ∈ J heißt zeitartig.
Durch eine Umparametrisierung der Kurven γ x lässt sich offenbar immer die
Zeitnormierung Z (γ̇ x (t)) = 1 für alle t ∈ J erreichen. Die Parametrisierung einer
zeitartigen Kurve γ x ist willkürlich und ohne physikalischen Gehalt. Die Bildmenge
von γ x , die sogenannte Weltline zu γ x , enthält bereits die gesamte Information wieviel Zeit zwischen dem Punkt x ∈ p + V0 und einem Punkt y = γ x (t) liegt. Sie hat
den Wert Z (y − x) . Der Parameterwert t spielt dabei keine Rolle.
Inertialsysteme idealisieren die Bewegung eines raumerfüllenden Schwarmes von
ausdehnungslosen Referenzteilchen, die sich gegenseitig nicht beeinflussen und die
auch von keinen weiteren eventuell vorhandenen Körpern beeinflusst werden und
die sich alle in dieselbe Richtung bewegen. Die Bewegung eines derart (kräfte)freien
(inertialen) Schwarmteilchens folgt einer Kurve des Typs γ x : R → M mit konstanter
Ableitung γ̇ x = I ∈ V und Z (I) = 1. Dabei ist x ein beliebiges Element eines
instantanen Raumes p + V0 ⊂ M. Überdies gilt γ̇ x = γ̇ y für alle x, y ∈ p + V0 .
Etwas allgemeiner ist die Definition eines Bezugssystems als zeitnormiertes Tangentenvektorfeld, dessen Integralkurven die Bewegung eines idealisierten Schwarms
von eventuell nichtinertialen Referenzteilchen beschreiben. Auch diese Integralkurven dienen der (lokalen) Koordinatisierung des Raumes, welche eine Einordnung
dessen erlaubt, was wann wo ist.
Definition 155 Ein unendlich oft differenzierbares Tangentenvektorfeld B : M →
V auf einer flachen Galileischen Raumzeit M = (M, V, µ, Z, ·, · ) mit Z ◦ B = 1
heißt Bezugssytem von M. Ist B konstant, dann heißt B Inertialsystem von M.
Zu zwei Inertialsystemen B1 und B2 existiert ein u ∈ V0 , sodass B2 = B1 + u.
Der raumartige Vektor u heißt Geschwindigkeit von B2 relativ zu B1 .
Ein rotierendes Bezugssystem mit inertial bewegtem Drehpunkt ist für dim M =
4 gegeben durch das folgende Vektorfeld. Seien eine Zahl ω ∈ R, ein Punkt p ∈ M
und Vektoren e0 , n ∈ V mit Z (e0 ) = 1, Z (n) = 0 und |n| = 1 fest gewählt. Dann
gilt für alle t ∈ R und für alle v ∈ V0
B (p + te0 + v) = e0 + ωn × v.
Die maximale Integralkurve γ p+x : R → M von B mit γ p+x (0) = p+x für ein x ∈ V0
erfüllt
γ p+x (t) = p + te0 + eωtLn x.
KAPITEL 3. VEKTORANALYSIS
312
Sie windet sich mit der Winkelgeschwindigkeit ω·n ∈ V0 um die Integralkurve γ p . Die
Kurve γ p ist auch Integralkurve des Inertialsystems mit B = e0 . Natürlich benötigt
das Vektorprodukt n × v die Wahl einer Orientierung von V0 .
3.4.4
Geschwindigkeit und Beschleunigung
Mechanische Geschwindigkeit und Beschleunigung einer Weltlinie γ (J) sind durch
die Kurve γ : J → M alleine nicht festgelegt. Vielmehr gehen neben den ersten beiden Ableitungen von γ auch die Wahl eines Bezugssystems in die Größen
Geschwindigkeit und Beschleunigung ein. Und zwar so, dass letzere reparametrisierungsinvariant sind, also nur von der Weltlinie abhängen.
Sei B ein Bezugssytem und γ : J → M eine differenzierbare Kurve. Dann lässt
sich jeder Vektor v ∈ V eindeutig bezüglich der direkten Summe
V = R · B (p) ⊕ V0
zerlegen. Die zu dieser Zerlegung gehörige Projektion ΠB(p) in den Raum V0 erfüllt
ΠB(p) : V → V0 , v → v − Z (v) · B (p) .
Definition 156 Sei γ : J → M differenzierbar und zeitartig. B sei ein Bezugssytem. Dann heißt der Vektor vγB (t) ∈ V0 mit γ̇ (t) = λ B (γ (t)) + vγB (t) für ein
λ ∈ R 0 die Geschwindigkeit von γ an der Stelle t relativ zu B.
Aus der Definitionsgleichung von vγB (t) folgt durch Anwendung von Z
Z (γ̇ (t)) = λZ B (γ (t)) + vγB (t) = λZ (B (γ (t))) + 0 = λ.
Somit gilt
vγB (t) =
ΠB(γ(t)) (γ̇ (t))
.
Z (γ̇ (t))
Die Geschwindigkeit einer Kurve an der Stelle t ist reparametrisierungsinvariant.
Definition 157 Sei γ : J → M zwei mal differenzierbar und B ein Bezugssystem.
Dann heißt der raumartige Vektor
bB
γ (t) =
v̇γB (t)
d B
1
vγ (t) ≡
Z (γ̇ (t)) dt
Z (γ̇ (t))
die Beschleunigung von γ an der Stelle t ∈ J relativ zum Bezugssystem B.
Relativ zu einem Inertialsystem I spezialisieren sich Geschwindigkeit und Beschleunigung zu
vγI (t) =
ΠI (γ̇ (t))
Z (γ̇ (t)) ΠI (γ̈ (t)) − Z (γ̈ (t)) ΠI (γ̇ (t))
und bIγ (t) =
.
Z (γ̇ (t))
Z (γ̇ (t))3
Beispiel: Sei p ∈ M und I ein Inertialsystem von M. Dann hat die Kurve γ : R →
M mit γ (t) = p + tI wegen γ̇ (t) = I die Geschwindigkeit vγI (t) = 0 relativ zu I. Die
KAPITEL 3. VEKTORANALYSIS
313
Geschwindigkeit von γ relativ zum Inertialsystem I ′ = I +u, das sich relativ zu I mit
′
der Geschwindigkeit u bewegt, hat wegen γ̇ (t) = I = I ′ − u den Wert vγI (t) = −u.
Die Beschleunigung von γ relativ zu I ′ erfüllt wegen Z (γ̇ (t)) = Z (I ′ ) = 1 und
wegen γ̈ = 0
′
bIγ (t) =
Z (γ̇ (t)) ΠI ′ (γ̈ (t)) − Z (γ̈ (t)) ΠI ′ (γ̇ (t))
= 0.
Z (γ̇ (t))3
Lemma 158 Besteht zwischen zwei Inertialsystemen der Zusammenhang I ′ = I +u
mit u ∈ V0 und ist γ : J → M eine C 2 -Kurve, dann folgt
′
′
vγI (t) = vγI (t) − u und bIγ (t) = bIγ (t) für alle t ∈ J.
Insbesondere ist also die Beschleunigung relativ zu einem Inertialsystem I eine
Größe, die nicht von der speziellen Wahl von I abhängt, sie ist ’absolut’. Daher kann
der Index I im Fall der Beschleunigung relativ zu einem Inertialsystem gefahrlos
weggelassen werden.
′
′
Beweis. Die Definitionsgleichung für vγI (t) ∈ V0 ist γ̇ (t) = Z (γ̇ (t)) I ′ + vγI (t) .
Daher gilt
′
′
γ̇ (t) = Z (γ̇ (t)) I ′ + vγI (t) = Z (γ̇ (t)) I + u + vγI (t)
= Z (γ̇ (t)) I + vγI (t) .
′
Somit folgt vγI (t) + u = vγI (t) . Für die Beschleunigungen folgt daraus
′
bIγ
d I′
v
dt γ
(t)
(t) =
=
Z (γ̇ (t))
d
dt
d I
vγI (t) − u
v (t)
dt γ
=
= bIγ (t) .
Z (γ̇ (t))
Z (γ̇ (t))
Sei γ : J → M zeitartig und zwei mal differenzierbar und I = e0 ∈ V ein
Inertialsystem. Durch eine Umparametrisierung von γ lässt sich immer Z (γ̇) = 1
herbeiführen. OEdA kann daher ein Punkt p ∈ M und ein t0 ∈ J gewählt werden,
sodass eine (von I abhängige!) zwei mal d’bare Kurve xI : J → V0 existiert, für die
γ (t) = p + (t − t0 ) e0 + xI (t)
für alle t ∈ J gilt. Geschwindigkeit vγI und Beschleunigung bIγ von γ bezüglich des
Inertialsystems I erfüllen dann wegen γ̇ = e0 + ẋI und γ̈ = ẍI
vγI = ẋI und bIγ = ẍI .
In dieser vereinfachten auf ein Inertialsystem abgestimmten Form wird die Bewegung
von Massenpunkten in elementaren Physiktexten meist abgehandelt.
KAPITEL 3. VEKTORANALYSIS
3.4.5
314
Galileigruppe
Die Galileigruppe operiert als Untergruppe der Permutationsgruppe von M auf der
flachen Galileiraumzeit und lässt dabei ihre Strukturelemente wie zeitliche Abstände zwischen Punkten, oder Winkel und Abstände zwischen gleichzeitigen Punkten
unverändert.
Definition 159 Sei p ein fest gewählter Punkt in einer galileischen Raumzeit M =
(M, V, µ, Z, ·, · ) . Zu einer Abbildung G : M → M existiert genau eine Abbildung
g : V → V mit G (p + v) = G (p) + g (v) für alle v ∈ V. Ist g linear und gelten
Z ◦ g = Z und |·| ◦ g = |·| , dann heißt G Galileitransformation (G-trafo) von M.
Sei G eine G-trafo bezüglich eines Punktes p ∈ M und sei p′ ein weiterer Punkt
in M. Dann gilt für a = p′ − p ∈ V
G (p′ + v) = G (p + a + v) = G (p) + g (a) + g (v) = G (p′ ) + g (v)
für alle v ∈ V. Die Menge der G-trafos hängt also nicht von der Wahl des Referenzpunktes p ∈ M ab. Zudem hängt die zu einer G-trafo G gehörige lineare Abbildung
g nicht von der Wahl von p ab. Man beachte jedoch, dass wegen
G (p′ ) − p′ = G (p + a) − p − a = G (p) − p + g (a) − a
der Translationsanteil G (p′ ) − p′ von G bezüglich p′ für g = ιdV von der Wahl von
p′ abhängt.
Die identische Abbildung ιdM ist wegen ιdM (p + v) = p + v eine G-trafo.
Satz 160 Sei G eine G-trafo von M = (M, V, µ, Z, ·, · ) . Dann gilt
Z (G (x) − G (y)) = Z (x − y) für alle x, y ∈ M und
|G (x) − G (y)| = |x − y| für alle x, y ∈ M mit Z (x − y) = 0.
Beweis. Sei x = p + a und y = p + b. Dann folgt
Z (G (x) − G (y)) = Z (g (a) − g (b)) = Z ◦ g (a − b) = Z (a − b) = Z (x − y) .
Für x, y ∈ M mit Z (x − y) = 0 gilt Z (a − b) = 0 und somit
|G (x) − G (y)| = |g (a) − g (b)| = |g (a − b)| = |a − b| = |x − y| .
Lemma 161 Sei M = (M, V, µ, Z, ·, · ) eine galileischen Raumzeit und p, p′ ∈ M.
Die Abbildung g : V → V sei linear. Die Abbildung G : M → M mit G (p + v) =
p′ + g (v) ist genau dann eine G-trafo, wenn das Bild einer G-basis von V unter g
wieder eine G-basis ist.
KAPITEL 3. VEKTORANALYSIS
315
Beweis. Sei zunächst e = (e0 , e1 , . . . en ) eine G-basis von V und G eine G-trafo.
Dann folgt wegen G (p) = p′
G (p + e0 ) = p′ + g (e0 ) mit Z (g (e0 )) = Z (e0 ) = 1
und
G (p + ei ) = p′ + g (ei ) mit Z (g (ei )) = Z (ei ) = 0 für i = 1, . . . n.
Überdies gilt (Polarisierungstrick) für i, j = 1, . . . n.
g (ei ) , g (ej ) = ei , ej = δ ij .
Damit ist ge = (g (e0 ) , . . . g (en )) eine G-Basis von V.
Seien nun e und ge = (g (e0 ) , . . . g (en )) G-Basen von V. Dann folgt für v =
n
i
i=0 v ei ∈ V
Z (g (v)) = v0 Z (g (e0 )) = v 0 = Z (v) .
Es gilt also Z◦g = Z. Weiter folgt für v =
V0 und
n
i=1
v i ei ∈ V0 , dass g (v) =
n
2
|g (v)| =
v i g (ei ) ∈
n
i j
v v g (ei ) , g (ej ) =
i,j=1
n
i=1
i,j=1
v i v j δ ij = |v|2 .
Es gilt also auch |·| ◦ g = |·| . Daher ist G eine G-trafo.
Die lineare Abbildung g einer G-trafo G ist invertierbar, da sie eine Basis von V
auf eine Basis von V abbildet.
Satz 162 Sei M = (M, V, µ, Z, ·, · ) eine Galileiraumzeit und seien p ∈ M und
a, a′ ∈ V. Die Abbildungen G, G′ : M → M mit
G (p + v) = p + a + g (v) und G′ (p + v) = p + a′ + g ′ (v) für alle v ∈ V
seien G-trafos von M. Dann folgt für alle v ∈ V
(G′ ◦ G) (p + v) = p + a′ + g ′ (a) + (g ′ ◦ g) (v) .
Beweis. Es gilt für alle v ∈ V
(G′ ◦ G) (p + v) = G′ (p + a + g (v)) = G′ (p) + g ′ (a) + g ′ (g (v))
= p + a′ + g ′ (a) + g ′ (g (v))
Wählt man in diesem Satz g ′ = g −1 und a′ = −g −1 (a) , dann folgt G′ ◦ G = ιdM .
Vertauscht man die Abbildungen G und G′ im Satz und wählt wiederum g ′ = g −1
und a′ = −g −1 (a) , dann folgt G ◦ G′ = ιdM und somit G′ = G−1 . Die Menge aller
Galileitransformationen bildet somit eine Gruppe, wenn als Gruppenprodukt G′ · G
die Hintereinanderausführung G′ ◦ G der beiden Abbildungen G und G′ gewählt
wird.
KAPITEL 3. VEKTORANALYSIS
316
Definition 163 Die Untergruppe der Permutationsgruppe S (M ) einer flachen Galileiraumzeit M, die von der Menge aller Galileitransformationen von M gebildet
wird, heißt inhomogene Galileigruppe ΓM über M.
Nach Wahl eines Punktes p ∈ M lassen sich homogene G-trafos bezüglich p
definieren. Gilt für ein G ∈ ΓM, dass G (p) = p, dann wird G als homogene G-trafo
bezüglich p bezeichnet. Die Menge aller homogenen G-trafos bezüglich p ist eine
Untergruppe von ΓM. Sie wird als Stabilisatorgruppe Γp M von p bezeichnet. Ist G
homogen bezüglich p, dann gilt G (p + v) = p + g (v) für alle v ∈ V. Bezüglich eines
Punktes p′ = p + a ∈ M gilt
G (p′ + v) = G (p + a + v) = p + g (a) + g (v) .
Für g (a) = a folgt dann G (p′ ) = p + g (a) = p′ . Eine bezüglich p homogene G-trafo
braucht also bezüglich eines anderen Punktes p′ nicht homogen zu sein.
Eine weitere Untergruppe von ΓM ist die Menge der Translationen. Ein G ∈ ΓM
mit G (p + v) = G (p) + v für alle v ∈ M heißt Translation. Es gilt für alle x ∈ M
G (x) = G (p + (x − p)) = G (p) + (x − p) = x + (G (p) − p) .
G verschiebt also jeden Punkt in M um den Vektor a = (G (p) − p) ∈ V. Man notiert
dann G = Ta . Die Untergruppe der Translationen hängt also nicht von der Wahl
von p ab.
Jedes G ∈ ΓM besitzt somit eine eindeutige Zerlegung G = Ta ◦ Gp0 mit a =
G (p) − p ∈ V und Gp0 ∈ Γp M. Man beachte jedoch, dass a von p abhängt, denn es
gilt für p′ = p + b mit b ∈ V
G (p′ + v) = (p′ + g (v)) + G (p′ ) − p′
und G (p′ ) − p′ = G (p + b) − p′ = G (p) + g (b) − p + p − p′ = (G (p) − p) + g (b) − b.
Somit gilt
G = Ta+g(b)−b ◦ G0p+b mit G0p+b ∈ Γp+b M.
Sehen wir uns noch die Stabilisatorgruppe Γp M eines Punktes p genauer an. Es
gilt für G ∈ Γp M, dass G (p + v) = p + g (v) für alle v ∈ V, wobei die lineare Abbildung g : V → V die Invarianzbedingungen Z ◦ g = Z und |·| ◦ g = |·| erfüllt. Sei
e0 ∈ V mit Z (e0 ) = 1. Jeder Vektor v ∈ V besitzt dann eine eindeutige Zerlegung
der Art v = Z (v) e0 + v0 mit v0 ∈ V0 . Eine lineare Abbildung g erfüllt die Invarianzbedingungen genau dann, wenn erstens g (v0 ) ∈ V0 für alle v0 ∈ V0 , zweitens
g|V0 ∈ O (V0 ) und drittens g (e0 ) = e0 + u für ein u ∈ V0 gilt.
Wird nach Wahl eines zeitnormierten Vektors e0 ∈ V die lineare Abbildung
g : V → V mit g (e0 ) = e0 + u und g|V0 = R zu den Daten (u, R) ∈ V0 × O (V0 ) als
e0
0
und die zugehörige G-trafo in Γp M als Gp,e
gu,R
u,R notiert, dann gilt
0
Γp M = Gp,e
u,R : (u, R) ∈ V0 × O (V0 ) .
Satz 164 Sind (u, R) und (u′ , R′ ) in V0 × O (V0 ) , dann gilt
e0
= gue0′ +R′ (u),R′ ·R .
gue0′ ,R′ ◦ gu,R
KAPITEL 3. VEKTORANALYSIS
317
Beweis. Es genügt die Bilder des zeitnormierten Vektors e0 und von Vektoren
v ∈ V0 unter gu′ ,R′ ◦ gu,R zu berechnen. Es gilt unter Weglassen des Superskripts e0
gu′ ,R′ ◦ gu,R : e0 → gu′ ,R′ (e0 + u) = e0 + u′ + R′ u und
gu′ ,R′ ◦ gu,R : v → gu′ ,R′ (Rv) = R′ R (v) .
e0
Die Menge der linearen Abbildungen gu,R
: (u, R) ∈ V0 × O (V0 ) ist somit eine Untergruppe der Gl (V ) . Sie ist das semidirekte Produkt der Gruppe (V0 , +)
mit O (V0 ) und wird als V0 ⋉ O (V0 ) notiert. Übrigens gilt als Korollar zum Satz:
e0 −1
e0
= g−R
gu,R
t u,Rt .
e0
Die Matrix von g ≡ gu,R
∈ V0 ⋉ O (V0 ) zu einer G-basis e = (e0 , e1 , . . . en ) erfüllt


1 0 ... 0
 u1 R1 . . . R1 
1
n 

i
M (g, e) =  ..
.. . .
..  = gj .
 .
. . 
.
un Rn1 . . . Rnn
Entwicklung nach der ersten Zeile zeigt, dass det g = det R. Und für R ∈ O (V0 ) gilt
bekanntlich |det R| = 1.
Welcher Zusammenhang besteht zwischen zwei Galileikarten? Definitionsgemäß
gilt für alle x ∈ M
n
p+
i=0
n
Φie,p (x) · ei = p′ +
i=0
Φie′ ,p′ (x) · e′i .
Es existiert ein G ∈ ΓM mit G (p + v) = G (p) + g (v) und g (ei ) = e′i . Damit folgt
für alle x ∈ M
n
n
i=0
Φie′ ,p′ (x) · g (ei ) = p − p′ +
i=0
Φie,p (x) · ei .
′
Mit der Zerlegung von p − p ∈ V nach der Basis e folgt
n
n
n
j
Φie′ ,p′ (x) gij ej =
j=0 i=0
j=0
(p − p′ ) + Φje,p (x) ej .
Koeffizientenvergleich ergibt daher
n
Φie′ ,p′
g −1
=
j=0
i
j
j
(p − p′ ) + Φje,p .
Vorgreifende Anmerkung: Sei für p ∈ M und eine G-basis e die alternierende
n + 1-Form
τ = dΦ0e,p ∧ dΦ1e,p ∧ . . . ∧ dΦne,p .
Sie hängt wegen |det g| = 1 für g ∈ V0 ⋉ O (V0 ) nur von der Orientierung von e ab,
nicht aber von p oder den weiteren Details von e. Nach Wahl einer Orientierung von
KAPITEL 3. VEKTORANALYSIS
318
V und bei Zugrundelegung einer positiv orientierten G-basis e ist die so definierte
Form τ eindeutig und unabhängig von p und e. Sie dient als Volumsform der Galileiraumzeit zur Integration über offene Raumzeitgebiete. Sie ermöglicht es auch, die
Divergenz von Vektorfeldern auf M ohne zusätzliche Strukturen zu definieren. Die
Kontinuitätsgleichung etwa greift darauf zu.
3.4.6
G-trafo von Geschwindigkeit und Beschleunigung
Sei J ⊂ R ein offenes Intervall. Die C 2 -Kurve γ : J → M sei zeitartig. Für G ∈ ΓM
ist G◦γ die mit G galileitransformierte Kurve γ. Wie verändern sich Geschwindigkeit
und Beschleunigung von G ◦ γ an der Stelle t bezüglich eines Inertialsystems I mit
G? Die Antwort gibt der folgende ’Kovarianzsatz’.
Satz 165 Sei M = (M, V, µ, Z, ·, · ) eine flache Galileiraumzeit und I = e0 sei ein
Inertialsystem von M. Sei γ : J → M eine zeitartige C 2 -Kurve. Für die Galileitrafo
G ∈ ΓM gelte G (p + v) = G (p) + g (v) für alle v ∈ V. Dann folgt für Geschwindigkeit und Beschleunigung der G-transformierten Kurve G ◦ γ mit u = g (e0 ) − e0
I
vG◦γ
(t) = g vγI (t) + u und bIG◦γ (t) = g bIγ (t) für alle t ∈ J.
Beweis. Die Geschwindigkeit von (G ◦ γ) in (G ◦ γ) (t) relativ zu I ist festgelegt
durch
d
I
(G ◦ γ) (t) = λ e0 + vG◦γ
(t) mit λ = 0.
dt
Da γ zeitartig ist, kann oEdA Z (γ̇ (t)) = 1 für alle t ∈ J vorausgesetzt werden.
Nach Wahl eines Punktes p ∈ M hat G die (eindeutige) Zerlegung G = Ta ◦ Gp0
0
mit Gp0 ∈ Γp M für ein a ∈ V. Weiter hat Gp0 eine Darstellung als Gp0 = Gp,e
u,R mit
einem eindeutig bestimmten Paar (u, R) ∈ V0 × O (V0 ) . Nun gilt mit der durch
γ (t) = p + γ (t) eindeutig bestimmten Abbildung γ : J → V
Ableiten nach t ergibt
d
e0
(G ◦ γ) (t) = gu,R
dt
e0
(G ◦ γ) (t) = p + a + gu,R
(γ (t)) .
d
γ (t)
dt
e0
= gu,R
e0 + vγI (t) = e0 + u + R vγI (t) .
I
(t) = R vγI (t) + u.
Somit gilt vG◦γ
Für die Beschleunigung von G ◦ γ bezüglich I ergibt sich daraus wegen
d2
(G ◦ γ) (t) = R v̇γI (t) und Z (γ̇ (t)) = 1
dt2
Z (γ̇ (t)) ΠI (γ̈ (t)) − Z (γ̈ (t)) ΠI (γ̇ (t))
bIG◦γ (t) =
= R v̇γI (t) = R bIγ (t) .
Z (γ̇ (t))3
Beide Resultate sind zusammengefasst in den für das Inertialsystem I = e0 und für
alle G ∈ ΓM gültigen Gleichungen
I
vG◦γ
(t) = g vγI (t) + u und bIG◦γ (t) = g bIγ (t) .
Dabei gilt G (p + v) = G (p) + g (v) für alle v ∈ V mit g (e0 ) = e0 + u für ein u ∈ V0
und g (v) = R (v) für alle v ∈ V0 .
KAPITEL 3. VEKTORANALYSIS
3.4.7
319
Newtons Grundgesetze der Mechanik
1. Newton I: Ein ’freies’ Teilchen, dh eines, das vom Rest der Welt unbeeinflusst
ist, durchläuft das Bild einer zeitartigen Kurve γ : J → M, für die bIγ (t) = 0
für alle t ∈ J. Dabei ist J ⊂ R ein (evt uneigentliches) offenes Intervall und I
irgendein Inertialsystem.
2. Newton II: Ein System aus N Teilchen, das vom Rest der Welt unbeeinflusst
ist, wird von N (N − 1) stetigen Funktionen Fi←j : V0 ⊃ Ui←j → V0 mit
i = j und i, j ∈ {1, . . . N} , und N reelle Zahlen mi > 0 charakterisiert. Dabei
ist mit Ui←j offen in V0 . Für die Funktionen Fi←j : V0 → V0 gilt dabei die
Äquivarianzbedingung
Fi←j ◦ g|V0 = g ◦ Fi←j für alle g ∈ Gal (V0 ) .
Jede mögliche Bewegung eines solchen Systems durchläuft das Bild einer Kurve
Γ = (γ 1 , . . . γ N ) : J → M N mit Z ◦ γ i − γ j = 0 für alle i, j ∈ {1, . . . N} . Dabei ist J ⊂ R ein (evt uneigentliches) offenes Intervall. Zudem erfüllt die Kurve
Γ das System von gewöhnlichen Differentialgleichungen zweiter Ordnung
N
mi bIγ i
(t) =
j=1,j=i
Fi←j γ i (t) − γ j (t) für alle t ∈ J.
Die Funktion Fi←j heißt Kraftfunktion des Teilchens j auf das Teilchen i. Die
Zahl mi ∈ R>0 heißt Masse des Teilchens i und I ist irgendein Inertialsystem.
Beachte: bIγ i hängt nicht von I ab.
3. Newton III: Für ein System aus N Teilchen, das vom Rest der Welt unbeeinflusst ist, erfüllen die Kraftfunktionen Fi←j die ’Aktio ist gleich Reaktio
Bedingung’ Fi←j (x) = −Fj←i (−x) . Insbesondere gilt −Ui←j = Uj←i .
Man beachte, dass dieses Regelwerk (fast offensichtlich) galileiinvariant im folgenden Sinn ist.
Satz 166 Ist Γ = (γ 1 , . . . γ N ) : J → M N mit Z ◦ γ i − γ j = 0 für alle i, j ∈
{1, . . . N} eine mögliche Bewegung eines Systems mit Kraftfunktionen {Fi←j : i = j} ,
dann ist die Kurve G ◦ Γ ebenso eine mögliche Bewegung desselben Systems.
Beweis. Es gilt G ◦ Γ = (G ◦ γ 1 , . . . G ◦ γ N ) und somit nach Newton II und dem
Kovarianzsatz mit G (p + v) = G (p) + g (v) für ein p ∈ M und für alle v ∈ V
N
mi bIG◦γ i
(t) −
j=1,j=i
Fi←j G ◦ γ i (t) − G ◦ γ j (t)
N
= g
mi bIγ i
(t) −
j=1,j=i
Fi←j g γ i (t) − γ j (t)
N
= g
mi bIγ i
(t) −
j=1,j=i
Fi←j γ i (t) − γ j (t)
=0
KAPITEL 3. VEKTORANALYSIS
320
Anmerkungen
• Newtons Grundgesetze haben keinesfalls den Status mathematischer Axiome
oder auch Sätze oder Definitionen. Vielmehr formulieren sie faktische Aussagen über die Natur unter Zuhilfenahme eines sehr hoch entwickelten mathematischen Begriffsgebäudes. Wie wir heute wissen, sind diese Aussagen streng
genommen falsch. Dennoch treffen sie einen wichtigen und großen Teil der
Wirklichkeit sehr genau.
• Wie stellt man fest, ob ein (System von) Teilchen frei ist? Es reagiert nicht auf
Änderungen im Rest der Welt. Dazu sind wiederholte Beobachtungen ähnlicher
Vorgänge nötig.
• Reale Objekte eines klassisch mechanisch beschriebenen Problemkreises sind
immer ausgedehnt und zusammengesetzt. Wann ist eine Beschreibung als ’Punkt’
angebracht? Wenn die Ausdehnung im Verhältnis zu den sonst vorkommenden
Abständen winzig ist.
• Die angeführten Grundgesetze sind noch nicht hinreichend allgemein, denn die
auf ein Teilchen wirkende Gesamtkraft setzt sich nach dem Prinzip der ungestörten Kräfteüberlagerung ausschließlich additiv aus Paarkräften zusammen.
Das Regelwerk schließt zudem geschwindigkeitsabhängige Kräfte aus. Verallgemeinerungen existieren.
• Wird einem N -Teilchensystem ein weiteres Teilchen hinzugefügt, werden die
Funktionen Fi←j für i, j ∈ {1, . . . N } unverändert übernommen. Lediglich die
neuen Funktionen FN+1←j für j ∈ {1, . . . N} sind einzuführen. Die Funktionen
Fj←N+1 für j ∈ {1, . . . N} ergeben sich aus Newton III.
• Das Beispiel eines gravitativen Zweikörperproblems ergibt sich für N = 2 und
dim (V ) = 4 mit F1←2 (x) = −Km1 m2 x/ |x|3 = −F2←1 (−x) für alle x ∈ V0 0.
Hier bezeichnet K Newtons Gravitationskonstante.
3.4.8
Die Erhaltungssätze
Durch Wahl eines Inertialsystems I = e0 und bei zeitnormierter Parametrisierung
der Kurven γ i gemäß γ i (t) = p + (t − t0 ) e0 + xIi (t) mit xIi : J → V0 vereinfacht sich
die Bewegungsgleichung in Newton II zu
N
mi ẍIi (t) =
j=1,j=i
Fi←j xIi (t) − xIj (t) für alle t ∈ J.
Damit folgt aus II und III:
Die Kurve X : J → M (Schwerpunkt; hängt nicht von I ab!) mit m =
und
N
1
mi xIi ((t))
X (t) = p + (t − t0 ) e0 +
m i=1
N
i=1
mi
KAPITEL 3. VEKTORANALYSIS
321
ist unbeschleunigt, dh es gilt bIX = 0. (Schwerpunktsatz)
Die Abbildung P I : J → V0 (Gesamtimpuls bezüglich I) mit
N
P I (t) =
mi ẋIi ((t))
i=1
ist konstant. (Impulserhaltungssatz)
Die Abbildung LI : J → V0 (Gesamtdrehimpuls bezüglich I) mit
N
LI (t) =
i=1
mi xIi (t) × ẋIi ((t))
ist konstant. (Drehimpulserhaltungssatz)
Zu jeder Kraftfunktion Fi←j existiert ein Potential Φi←j : V0 ⊃ Ui←j → R mit
Fi←j (x) = −gradx (Φi←j ) . Die Abbildung E I : J → R (Gesamtenergie bezüglich I)
mit
N
N
mi ,, I ,,2 1
I
ẋi (t) +
Φi←j xIi (t) − xIj (t)
E (t) =
2
2 i,j=1,i=j
i=1
ist konstant. (Energieerhaltungssatz)
3.5
Übungsbeispiele
1. (Richtungsableitung ohne Differential) V sei ein reeller, 3-dimensionaler, orientierter Vektorraum. ·, · bezeichne ein Skalarprodukt von V und |·| die zugehörige Norm. Für p1 , p2 ∈ V sei34
0 → R,
Φ:V
x → |x|−3
p1 , p2 − 3 |x|−2 p1 , x p2 , x .
Das radiale Einheitsvektorfeld E und das Drehvektorfeld L um R · p1 = 0 sind
die folgenden beiden Abbildungen.
E:V
0 → V,
x → |x|−1 x und L : V → V,
x → |p1 |−1 p1 × x.
Zeigen Sie für die Richtungsableitungen von Φ unter E und unter L, also z.B.
für
E [Φ] : V
0 → R,
dass für alle x ∈ V
x → lim [Φ(x + εE(x)) − Φ(x)] /ε =: Ex [Φ] ,
ε↓0
0 gilt:
Ex [Φ] = −3 |x|−1 Φ(x) und Lx [Φ] = 3 |x|−5 |p1 |−1 p1 , x p1 × p2 , x .
d
Hinweis: Zeigen und benützen Sie Ex [Φ] = |x|−1 dλ
Φ (λx) |λ=1 . Der Umweg
über dΦ oder grad Φ ist mühsamer. Ähnliches gilt für Lx [Φ].
34
Φ ist im SI-System 4πε0 mal der Wechselwirkungsenergie zweier elektrischer Dipolmomente
p1 , p2 mit dem Verbindungsvektor x.
KAPITEL 3. VEKTORANALYSIS
322
2. (Gradient) Sei V = R2×1 und e = (e1 , e2 ) sei die Standardbasis. Zwei weitere
Basen f und g sind durch
f1 = e1 + e2 , f2 = e2 ,
g1 = e1 + e2 , g2 = e2 − e1
t
gegeben. Sei Φe = φ1e , φ2e = (x, y)t die kontravariante Karte zur Basis e, d.h.
es gilt idV = e · Φe . Sei h : R → R differenzierbar. Dann ist ψ : V → R mit
ψ = h (y − x) ein differenzierbares Skalarfeld. Sei ·, · jenes Skalarprodukt,
für das e eine ONB ist.
(a) Zeigen Sie für die zu den Basen f und g gehörigen kontravarianten Karten
Φf =
1 0
−1 1
· Φe und Φg =
2 1
1 1
Gf =
1
2
und Gg = 2
1 1
−1 1
1 0
0 1
· Φe ,
.
Skizzieren Sie einige Koordinatenlinien der drei Karten. Bestimmen Sie
die Niveaulinien von ψ.
(b) Zeigen Sie für die partiellen Ableitungen von ψ
∂1e ψ = −h′ (y − x) = −∂2e ψ,
f
f
∂1 ψ = 0, ∂2 ψ = h′ (y − x) ,
g
g
∂1 ψ = 0, ∂2 ψ = 2h′ (y − x) .
f
Beachten Sie: Obwohl φ1e = φ1f gilt, gilt ∂1 ψ = ∂1e ψ.
(c) Berechnen Sie das Gradientenvektorfeld von ψ mit der Entwicklungsformel nach einer beliebigen Basis mit den drei Basen e, f und g. Kontrollieren Sie, dass die drei Rechnungen übereinstimmend auf grad (ψ) =
h′ (y − x) (e2 − e1 ) führen.
(d) Berechnen Sie das Gradientenvektorfeld von ψ bezüglich jenes Skalarproduktes, zu dem f eine ONB ist. Lösung:
grad (ψ) = h′ (y − x) e2 .
Wie kann grad (ψ) senkrecht auf die Niveaulinien von ψ stehen, wenn
dies auch grad (ψ) tut?
3. (Kurvenintegral) Sei V = R2 und X : V → V, (x, y) → (x2 y, xy 2 ) (Figur
3.25). Berechnen Sie das Kurvenintegral von X längs γ : [0, 1] → V, t →
(1 − t, t2 ) .
KAPITEL 3. VEKTORANALYSIS
323
y
5
3.75
2.5
1.25
0
-5
-3.75
-2.5
-1.25
-1.25
0
1.25
2.5
3.75
5
x
-2.5
-3.75
-5
Abbildung 3.25: Das Vektorfeld (x2 y, xy 2 )
4. Sei (x, y) die Standardkarte von V = R2×1 . Für L : V → V gelte L = (−y, x)
(Drehvektorfeld). Es soll nun mit verschiedenen Methoden gezeigt werden,
dass das Vektorfeld L kein Potential hat, d.h., dass keine Funktion f : V → R
existiert, sodass L = grad (f ).
(a) Direkte Methode: Zeigen Sie, dass die beiden Differentialgleichungen (bezüglich der Standardbasis) −y = ∂1 f und x = ∂2 f keine Lösung f haben.
(b) Indirekt: Zeigen Sie, dass L nicht rotationsfrei ist.
(c) Sei γ 1 : [−R, R] → V mit γ 1 (t) = (t, 0) . Zeigen Sie γ L = 0. Sei
1
γ 2 : [0, π] → V mit γ 2 (t) = (R cos t, R sin t) . Zeigen Sie γ L = R2 π.
2
Warum folgt daraus, dass L kein Potential hat?
(d) Sei γ eine Kurve in V, deren Bildmenge der Rand eines achsenparallelen
Quadrats mit der Seitenlänge 2ε und mit dem Mittelpunkt (a, b) ∈ V ist.
Die Kurve durchlaufe den Rand im Gegenuhrzeigersinn einmal. Zeigen
Sie, dass γ L = 8ε2 = Doppelte Fläche des Quadrats. Das Integral ist
also unabhängig von (a, b) .
Hinweis: Die untere Seite des Quadrats kann folgendermaßen durchlaufen
werden
γ 1 : [−ε, ε] → V mit γ 1 (t) = (a + t, b − ε) .
Wählen Sie für die drei weiteren Seiten analoge Kurven.
1
(e) Sei nun X = x2 +y
0. Sei γ wie oben eine Kurve, die den
2 L auf V
Rand eines (beliebigen) Quadrats im Gegenuhrzeigersinn einmal durchläuft. Zeigen Sie
X=
γ
2π falls (0, 0) innerhalb des Quadrats liegt
.
0 falls (0, 0) außerhalb des Quadrats liegt
Falls γ durch (0, 0) führt, ist γ X nicht definiert. Hinweis: Auf der geschlitzten Ebene gilt X = grad (φ) .
KAPITEL 3. VEKTORANALYSIS
324
5. (Gradient, Divergenz) V sei ein n-dimensionaler reeller Vektorraum. ·, · bezeichne ein Skalarprodukt von V und r := |·| die zugehörige Norm. Berechnen
Sie grad(f ) und div (grad (f )) der folgenden Funktionen vom Typ f : U → R
mit U ⊂ V offen.35
(a) Sei ki ∈ V für i = 1, ..., m und f(p) :=
(b) f := − 1r auf U = V
m
i=1
ki , p
2
für alle p ∈ V .
0. Skizzieren Sie grad(f ) für n = 2.
(c) Sei e ∈ V mit |e| = 1 und f(p) :=
(d) f = Φ mit Φ von Beispiel 1.
1
r(p)
e, p für alle p ∈ U = V
0.
36
6. (Richtungsableitung über Gradient, Kurvenintegral) Sei U die geschlitzte Ebene.
U = (x, y) ∈ R2 | y = 0 ⇒ x < 0
Für φ : U → (0, 2π) gelte idU = r · (cos φ, sin φ) auf U, wobei r(x, y) :=
x2 + y 2 . Für grad (φ) (bezüglich des Standardskalarproduktes) folgt für alle
p ∈ U (siehe Beispiel 3.1.14) gradp (φ) = X(p) mit X : R2 0 → R2 , (x, y) →
1
(−y, x). Figur 3.26 zeigt das Drehvektorfeld (−y, x). Achtung: Der Defix2 +y2
nitionsbereich von X ist größer als jener von grad(φ).
'
&
(a) Berechnen Sie die Abbildung X [f ] : p → gradp (f) , X(p) = Xp [f ] für
alle p ∈ R2 0 zu f : R2 → R mit f(x, y) = xy. Richtungsableitung von
f bei p mit X(p).
(b) Zeigen Sie div(X) = 0 auf R2
0.
(c) Berechnen Sie das Linienintegral von X längs eines Kreises um 0 mit Radius R > 0. Gibt es eine differenzierbare Funktion F , sodass grad (F ) =
X auf R2 0?
Abbildung 3.26: Drehvektorfeld
35
Arbeiten Sie dabei entweder ohne Benützung einer Basis, also koordinatenfrei, oder mithilfe
der Koordinaten des Vektorraumes zu einer ONB e. Benützen Sie die Kettenregel.
36
f(p) ist also der Kosinus des Winkels zwischen e und p. Fig. 1 zeigt das Vektorfeld −xy, x2 .
KAPITEL 3. VEKTORANALYSIS
325
7. (Divergenz, Rotation des Linienvortexfeldes) Für n ∈ V = R3 gelte |n| = 1.
Auf U = V (R · n) ist das Vektorfeld
B(p) = C
n×p
|n × p|2
mit C ∈ R definiert.37 Es hat die Symmetrien: B(p + λn) = B(p) und
B(R (p)) = R (B(p)) mit λ ∈ R und R Drehung um n. Beachte: |n × p| ist der
Abstand zwischen p und der Achse R · n.
(a) Zeigen Sie div(B) = 0 und rot(B) = 0 auf U.
(b) Berechnen Sie mit dem Ansatz A(p) = f (|n × p|) · n (auf U ) ein Vektorpotential zu B. Finden Sie also eine Lösung A von B = rot(A). Gibt es
mehrere Lösungen? 38
(c) Ist B konservativ?
8. (Rotation eines allgemeinen Vortexfeldes) Sei V ein 3-dim Vektorraum. Eine
Orientierung und ein Skalarprodukt ·, · seien gewählt. Sei n ∈ V mit |n| = 1.
Sei f : R>0 → R differenzierbar. Für X : V → V gelte für alle p ∈ V R · n
X (p) = f (|n × p|)
Zeigen Sie
rotp (X) =
n×p
.
|n × p|2
f ′ (|n × p|)
n.
|n × p|
9. Bestimmen Sie für dim (V ) = 2 die elektrische Potentialfunktion Φp eines
Punktdipols, der in 0 ∈ V sitzt, und das Dipolmoment p ∈ V hat. Überprüfen
Sie, dass ∆Φp = 0.39
Hinweis: Φp (v) ergibt sich für das Dipolmoment p = |p|·e ∈ V für alle v ∈ V
durch den Grenzübergang
,
,
|p|
ε ,,
ε ,,
,
,
2πε0 · Φp (v) := lim
ln ,v − e, − ln ,v + e, .
εց0 ε
2
2
0
Rechnen Sie nach, dass 2πε0 · Φp (v) = − [p]v ln |·| = − p, v / |v|2 .
10. (Rotation in allgemeiner Basis) Sei e = (e1 , . . . en ) eine Basis des Vektorraums
V mit dem Skalarprodukt ·, · . Das Vektorfeld X : V ⊃ U → V sei auf
U differenzierbar. γ ij : I → U sei eine stückweise C 1 -Kurve. Sie durchlaufe
den Rand des Parallelogramms Γij = p + λei + µej : λ, µ ∈ − 2ε , 2ε zuerst
in Richtung ei , dann in Richtung ej usw.
37
I.
38
I
B ist für C = µ0 2π
das Magnetfeld eines auf R · e in Richtung e fließenden Stromes der Stärke
Eine Lösung ergibt sich mit f(x) = −C ln (x).
Φp idealisiert das Potential zweier langer, entgegengesetzt geladener, zureinander paralleler,
dünner Drähte im Nahbereich der Drähte. Der Abstand der Drähte ist viel kleiner als ihre Länge.
39
KAPITEL 3. VEKTORANALYSIS
326
(a) Zeigen Sie, dass mit den kovarianten Komponentenfunktionen Xi = ei , X
von X und den partiellen Ableitungen ∂i = ∂ie für p ∈ U folgt:
1
ε→0 ε2
lim
γ ij
X = [∂i Xj − ∂j Xi ] (p) .
(b) Für die n2 Zahlen Iij := [∂i Xj − ∂j Xi ] (p) gilt Iij = −Iji und daher
Iii = 0. Wie viele Paare (i, j) ∈ {1, . . . n}2 mit i < j gibt es? Für welches
n sind es genau n Stück?
(c) Sei nun n = 3 und e positiv orientiert. Mit einem noch unbekannten
Skalarfeld C auf U sei das Vektorfeld rotX durch
rotX = C [(∂2 X3 − ∂3 X2 ) · e1 + (∂3 X1 − ∂1 X3 ) · e2 + (∂1 X2 − ∂2 X1 ) · e3 ]
definiert. Kann C so gewählt werden, dass für das Flussintegral von rotX
durch Γij
1
lim 2
rotX, dfij = Iij
ε→0 ε
Γij
gilt? Lösung: C = 1/ det (Ge ).
(d) Überprüfen Sie, dass rotX mit C = 1/ det (Ge ) nicht von der Wahl der
(positiv orientierten) Basis e abhängt.
11. (Polarkoordinaten) Sei Ψ = (x, y) die Standardkarte von R2 und sei U :=
R2 {(a, 0) ∈ R2 : a ≥ 0} (geschlitzte Ebene). Sei Φ = (ρ, φ) die Karte der
Polarkoordinaten auf U.
(a) Skizzieren sie einige Niveaulinien ρ = const bzw. φ = const.
(b) Drücken Sie die Kartenbasis in p ∈ U mit Φ (p) = (ρ0 , φ0 ) durch die
Standardbasis aus.
(c) Zeigen Sie, dass die Funktionalmatrix ∂jΦ Ψi überall maximalen Rang
hat.
(d) Berechnen Sie die Gram’sche Matrix40 GΦ in p ∈ U mit Φ (p) = (ρ0 , φ0 ) .
12. (Parabolische Koordinaten) Sei Ψ = (x, y) die Standardkarte von R2 und sei
U := R2 {(a, 0) ∈ R2 : a ≥ 0} (geschlitzte Ebene). Für die „parabolische”
Karte Φ = (u, v) gilt auf U
x=
1 2
u − v2 ,
2
y = uv mit v > 0.
(a) Skizzieren sie einige Niveaulinien u = const bzw. v = const.
(b) Drücken Sie die Kartenbasis in p ∈ U mit Φ (p) = (u0 , v0 ) durch die
Standardbasis aus.
40
Zum Standardskalarprodukt von R2 .
KAPITEL 3. VEKTORANALYSIS
327
(c) Zeigen Sie, dass die Funktionalmatrix ∂jΦ Ψi überall maximalen Rang
hat.
(d) Berechnen Sie die Gram’sche Matrix GΦ in p ∈ U mit Φ (p) = (u0 , v0 ) .
13. (grad, div, ∆ in krummlinigen Koordinaten) Seien (x, y) die Standardkoordinaten von R2 . Sei U := R2 {(a, 0) ∈ R2 : a ≥ 0} .
(a) Sei f = x2 − y 2 auf R2 . Berechnen Sie grad (f ) und ∆f (bezüglich
des Standardskalarproduktes) auf U unter Benützung von Polarkoordinaten. Kontrollieren Sie ihre Ergebnisse durch eine zweite Berechnung
von grad (f) und ∆f unter Benützung von Standardkoordinaten. (Siehe
Figur 3.27)
(b) Sei f = x/ (x2 + y 2 ) auf R2 0. Berechnen Sie grad (f ) und ∆f (bezüglich
des Standardskalarproduktes) auf U unter Benützung von Polarkoordinaten. Kontrollieren Sie ihre Ergebnisse durch eine zweite Berechnung von
grad (f ) und ∆f unter Benützung von Standardkoordinaten.
(c) Sei f = x2 + y 2 . Berechnen Sie grad (f ) und ∆f (bezüglich des Standardskalarproduktes) auf U unter Benützung von parabolischen Koordinaten. Kontrollieren Sie ihre Ergebnisse durch eine zweite Berechnung
von grad (f ) und ∆f unter Benützung von Standardkoordinaten.
Abbildung 3.27: Die Funktion x2 − y 2
14. (grad, div, ∆ in Kugelkoordinaten) Für das Skalarfeld f : R3
in der Standardkarte (x, y, z) von R3 mit r = x2 + y 2 + z 2
f=
0 → R gelte
2xy
.
r5
(f ist ein Beispiel für ein Quadrupolpotential.) Auf dem Definitionsbereich U
der Kugelkoordinaten Φ = (r, θ, φ) gilt daher
f=
1
sin2 (θ) sin (2φ) .
3
r
KAPITEL 3. VEKTORANALYSIS
y
z 0.375
0.75
0.5
0.25
0.25
0.125
0
-0.75
-0.5
328
-0.25
0
0
-0.25
0.25
0.5
0
0.75
x
-0.5
-0.25
-0.75
-0.375
Polardiagramm von |sin (2φ)|
0.25
0.5
0.75
1
-0.125
Polardiagramm von sin2 θ
(a) Berechnen Sie auf U bezüglich des Standardskalarproduktes die Komponenten von grad (f ) zur Kartenbasis von Φ.
(b) Leiten Sie aus dem Ergebnis von a) ab, dass ∆f = 0 auf U.
(c) Zeigen Sie ∆f = 0 auf R3
0 unter Verwendung der Standardkarte.
15. (rot in Kugelkoordinaten) Seien (r, φ, z) Zylinderkoordinaten im R3 und sei
f : R>0 → R differenzierbar. Auf dem Kartenbereich U von (r, φ, z) gelte
X = fr(r)
2 δ φ . Zeigen Sie (unter Verwendung der Formel für die Rotation in
′
einem krummlinigen Koordinatensystem), dass rot (X) = f r(r) (0, 0, 1) auf U.
Kapitel 4
Wahrscheinlichkeit
Schon lange erfreuen sich Menschen an Glücksspielen. Der Ausgang eines solchen
Spiels ist nicht vorhersehbar und erst recht nicht beeinflussbar. Denn das Spiel macht
Gebrauch von Naturvorgängen, die von den Spielern nur unvollkommen gesteuert
werden können.
In der großen Welt, die uns umgibt, sind solche unabsehbaren Naturvorgänge
eher die Regel als die Ausnahme, sodass sich die Physik mit diesem sogenannten
Zufall auseinandersetzen muss. Jede Naturbeobachtung wird ja von unkontrollierten Umständen beeinflusst. Was kann also aus gestörten Beobachtungen über die
Natur eines idealisierten Systems ermittelt werden? Gibt es so etwas wie ’durchschnittliche’ Eigenschaften von einer goßen Zahl von ähnlichen, im Detail aber doch
verschiedenen Systemzuständen? Die Antwort auf derlei Fragen kommt in Reichweite, wenn es gelingt im Zufall Regelhaftigkeit auszumachen. Etwas verkürzt gesagt
ist also darüber nachzudenken, wie aus einem Glücksspiel ein sicheres Geschäft zu
machen ist.
Wird ein kommerzielles Glücksspiel hinreichend oft gespielt, dann zeichnet sich
eine Regelmäßigkeit ab, die eine der spielenden Parteien, in der Regel jene Partei,
welche die Regeln vorschlägt, nahezu sicher zur Gewinnerin macht. Der entscheidende Sachverhalt ist uns aus dem einfachen Würfelspiel geläufig. Ein Würfel werde
N mal geworfen. Dabei sei ni die Anzahl jener Würfe, die als Ergebnis die Augenzahl i ergeben. Für ’hinreichend’ große Zahl N liegt dann die Häufigkeit ni /N der
Augenzahl i in der ’Nähe’ von 1/6. Je größer N, umso besser ist ’in der Regel’ die
Übereinstimmug zwischen ni /N und 1/6. Es gibt also Aussagen über die Ausgänge
einer großen Zahl von Glückspielen, die (fast) sicher wahr sind und auf die sich daher
sorglos wetten lässt.
Von solchen Einsichten leben alle Kasinos und in einem übertragenen Sinn die
gesamte ’statistische Physik’. Probieren Sie es aus, indem Sie mit einer großen Zahl
von Freunden gegen Zahlung von einem Euro pro Würfelversuch die Auszahlung
von zwei Euro im Falle eines geworfenen Sechsers vereinbaren. Endet ein Würfelversuch mit einer anderen Augenzahl als Sechs, gehört der Einsatz Ihnen. Nach 1000
Würfelversuchen werden Sie um etwa 500 Euro reicher sein. Dass Sie um 2000 Euro
ärmer sind, ist zwar möglich, aber äußerst unwahrscheinlich.
Natürlich geben empirische Häufigkeiten keine mathematische Definition von
329
KAPITEL 4. WAHRSCHEINLICHKEIT
330
Wahrscheinlichkeit ab. Vielmehr geben sie ein Ziel dafür vor, was erklärt werden
soll: Man versuche, Regelmäßigkeiten in einer großen Anzahl von ähnlich gelagerten
Vorgängen zu erkennen und zu verstehen. Auch dann, wenn die einzelnen Vorgänge
völlig regellos erscheinen mögen.
Das Galtonbrett1 lässt eine solche Regelhaftigkeit im Zufall besonders klar hervortreten. Eine Kugel ist entlang einer vertikalen Fallstrecke immer wieder an einem
Hindernis (Nagel) gezwungen, vom geraden Weg nach links oder rechts um einen
Einheitsschritt abzuweichen. Nach sagen wir 10 Hindernissen ist die Kugel um n
Schritte horizontal versetzt, wobei −10 ≤ n ≤ 10 gilt. Der genaue Weg oder auch
nur der Endversatz einer einzelnen Kugel ist nicht vorhersehbar. Lässt man aber
eine große Zahl von Kugeln das Brett durchfallen, dann ergibt sich ein zumindest
in seinen groben Zügen reproduzierbares Muster in der Verteilung der Ankunftsorte
der einzelnen Kugeln. Gewisse Zufallsgrößen werden mit wachsendem N zunehmend
deterministisch. So schwankt etwa der Prozentsatz der Kugeln mit Gesamtversatz n
bei einer Wiederholung eines Experiments mit N Kugeln umso weniger, je größer N
ist. Oder es geht die Wahrscheinlichkeit des Ereignisses, dass alle Kugeln denselben
Endversatz haben, mit wachsendem N gegen 0.
Der Weg einer Kugel durch ein Galtonbrett liefert ein vielfach zutreffendes Bild
vom Zustandekommen eines Einzelmesswertes, in den eine ganze Reihe von zufälligen, unvermeidlichen Störungen Eingang findet. Die Verteilung der gestörten Einzelmesswerte (bei oftmaliger Wiederholung der Messung) ist in ihren groben Zügen
determiniert. Sie hat ihr Maximum nahezu sicher über dem unverfälschten Wert.
Nur Ereignisse mit Wahrscheinlichkeiten nahe bei 0 oder 1 geben die Möglichkeit zum Vergleich einer wahrscheinlichkeitsbehafteten Theorie mit Beobachtungen.
Solche Ereignisse gilt es zu finden, wenn ein Wahrscheinlichkeitsmodell empirischen
Gehalt bekommen soll.
4.1
Endliche Wahrscheinlichkeitsräume
Etwa 300 Jahre mathematischen Räsonierens haben einen präzisen Wahrscheinlichkeitsbegriff hervorgebracht, der von empirischen Häufigkeiten und dem Versuch befreit ist, den Zufall selbst zu definieren. Er stammt von Andrei N. Kolmogorow2 und
fasst Wahrscheinlichkeit als etwas auf, das den Teilmengen einer Grundmenge Ω in
ähnlicher Weise zukommt, wie Volumia oder Massen den Teilen eines (physischen)
Körpers zuzuweisen sind.
Allerdings ist der moderne mathematische Wahrscheinlichkeitsbegriff erstaunlich
weit vom realitätsnahen Häufigkeitsbegriff entfernt. Er ist als rein mathematischer
Begriff zunächst ohne jeden Bezug zur materiellen Wirklichkeit gefasst. Wie Wahrscheinlichkeit ’gemessen’ werden kann, ist nicht mehr Teil der Definition. Dementsprechend werden Häufigkeiten erst in einem höher entwickelten Stadium der Theorie
eingeführt und erst dann wird klar werden, wie empirische Wahrscheinlichkeiten zu1
Siehe: http://en.wikipedia.org/wiki/Bean_machine
Eine Simulation wird von http://www.ms.uky.edu/~mai/java/stat/GaltonMachine.html gezeigt.
2
http://de.wikipedia.org/wiki/Kolmogorow
KAPITEL 4. WAHRSCHEINLICHKEIT
331
mindest halbwegs sicher ermittelt werden können. Eine vollkommene Sicherheit wird
sich dabei jedoch als unerreichbar erweisen. Das wiederum löst naturphilosophische
Zweifel und Fragen aus, welche die Mathematik aber unberührt lassen.3
4.1.1
Wahrscheinlichkeit als Mengenfunktion
Definition 167 Ein endlicher Wahrscheinlichkeitsraum ist eine endliche Menge Ω
zusammen mit einer Funktion W : pot(Ω) → R, sodass
(i) W (A) ≥ 0 für alle A ⊂ Ω,
(ii) W (A ∪ B) = W (A) + W (B) für alle A, B ⊂ Ω mit A ∩ B = {} ,
(iii) W (Ω) = 1.
Die Elemente von Ω repräsentieren die in einem Zufallsexperiment möglichen
Ergebnisse, die als Versuchsausgänge bezeichnet werden. Teilmengen A ⊂ Ω heißen
Ereignisse und für ω ∈ Ω wird die einelementige Teilmenge {ω} als Elementarereignis
bezeichnet. Ein Ereignis A tritt in einem Zufallsexperiment genau dann ein, wenn der
Versuchsausgang Element von A ist. Die Potenzmenge pot(Ω) von Ω ist die Menge
aller Teilmengen von Ω. Die Funktion W , die jeder Teilmenge von Ω eine Zahl
zuordnet, wird als ein Wahrscheinlichkeitsmaß (W-maß) auf Ω bezeichnet. Die Zahl
W (A) heißt Wahrscheinlichkeit des Ereignisses A. Zur Beschreibung verschiedener
Zufallsexperimente werden im allgemeinen verschiedene Grundmengen Ω und Wmaße W benötigt.
Die Zahlen W (A) sind gemäß (i) nicht negativ. Aus (ii) folgt W ({}) = 0. Im
Beispiel eines Münzwurfs besteht Ω nur aus zwei Elementen nämlich K (Kopf) und
Z (Zahl). Die Menge der Teilmengen pot(Ω) besteht aus {} , {K} , {Z} , {K, Z} = Ω.
Gilt etwa bei einer (etwas ungerechten) Münze W ({K}) = 0, 95, dann folgt aus (ii),
dass W ({Z}) = 0, 05. Gleichung W ({}) = 0 sagt, dass die Wahrscheinlichkeit dafür,
dass nach einem Münzwurf weder Kopf noch Zahl obenauf liegt, 0 ist.
Beispiel 168 (Würfel) Sei Ω := {1, 2, 3, 4, 5, 6} mit pi := W ({i}) := 1/6 für alle
i ∈ Ω. Nach Regel (ii) folgt W ({1, 4}) = W ({1}) + W ({4}) = 16 + 16 = 13 . So kann
die Wahrscheinlichkeit eines jeden Ereignisses aus den Wahrscheinlichkeiten der
Elementarereignisse durch Addition berechnet werden. Im Beispiel ist das Ereignis
{1, 4} das mathematische Bild des Ereignisses: beim einmaligen Wurf eines Würfels
wird eine der beiden Augenzahlen 1 oder 4 geworfen.
Definition 169 Ein endlicher W-raum (Ω, W )mit W ({ω}) = 1/ |Ω| für alle ω ∈ Ω
heißt Gleichverteilung. Hier bezeichnet |Ω| die Zahl der Elemente von Ω.
Ist (Ω, W ) Gleichverteilung, dann gilt für jedes A ⊂ Ω, dass W (A) = |A| / |Ω| .
Gleichverteilungen werden wegen ihrer Einfachheit oft als Beispiele diskutiert, sind
3
Solche Fragen werden z.B. Kapitel VIII und diversen Anhängen in Karl Popper, Logik der
Forschung, J CB Mohr, Tübingen, 1973, untersucht.
KAPITEL 4. WAHRSCHEINLICHKEIT
332
jedoch „winzige Inseln im Meer der Wahrscheinlichkeitsräume”. Ein gezinkter Würfel ist etwa durch die sechs im allgemeinen voneinander verschiedenen Elementarwahrscheinlichkeiten 0 ≤ W ({i}) =: pi mit der Nebenbedingung 6i=1 pi = 1 charakterisiert. Der Extremfall eines gezinkten Würfels ist mit
pi =
1 für i = k
0
sonst
für ein fest gegebenes k ∈ Ω realisiert. Dieser Würfel wirft mit Sicherheit die Augenzahl k.
Definition 170 Ein W-maß Wk , für das gilt Wk (A) = 1 für k ∈ A und Wk (A) = 0
für k ∈
/ A, heißt Punktmaß, lokalisiert in k.
Das Beispiel des Würfels macht klar, dass jedes Wahrscheinlichkeitsmaß W einer
endlichen Menge Ω durch die endlich vielen Werte pω := W ({ω}) für ω ∈ Ω eindeutig bestimmt ist. Es gilt ja nach (ii) W ({ω 1 , . . . ω k }) = W ({ω 1 }) + . . . + W ({ω k })
Die Funktion p : Ω → [0, 1] , ω → pω hat einen eigenen Namen. Sie heißt Wahrscheinlichkeitsfunktion. Falls also p auf Ω konstant ist und daher überall den Wert
1/ |Ω| annimmt, ist W eine Gleichverteilung.
4.1.2
Konstruktion von Wahrscheinlichkeitsräumen
Wie kann aus einem oder mehreren Wahrscheinlichkeitsräumen ein neuer gebildet
werden? Dieser Abschnitt stellt einige wichtige Konstruktionsverfahren für dermaßen
„abgeleitete“ Wahrscheinlichkeitsräume vor.
Bedingte Wahrscheinlichkeit
Zwei unterscheidbare Münzen werden geworfen. Das Ergebnis des Wurfes der ersten
Münze wird mit ε ∈ {1, −1} , jenes der zweiten mit η ∈ {1, −1} bezeichnet. Die
Grundmenge aller möglichen Versuchsausgänge ist somit die vierelementige Menge
Ω = {(ε, η) |ε, η ∈ {1, −1} } . Jedes Wahrscheinlichkeitsmaß W auf Ω ist durch seine
Wahrscheinlichkeitsfunktion p festgelegt. Wir notieren p (1, 1) = λ, p (1, −1) = µ und
p (−1, 1) = ν mit λ, µ, ν ∈ R≥0 und λ+µ+ν ≤ 1, sodass p (−1, −1) = 1−λ−µ−ν ≥ 0
folgt. Die Gleichverteilung liegt genau dann vor, wenn λ = µ = ν = 1/4.
Hat das Ergebnis ε des Wurfes der ersten Münze Einfluss auf das Ergebnis η des
zweiten Wurfes? Zunächst ein Wort über eine praktische und übliche Kurzschreibweise. Das Ereignis {(ε, η) ∈ Ω : ε = 1} wird kurz als das Ereignis ε = 1 bezeichnet.
Für die Wahrscheinlichkeit von ε = 1 gilt unter Verwendung dieser Kurznotation
W (ε = 1) = W ({(1, 1) , (1, −1)}) = λ + µ.
Falls nun W (ε = 1 und η = 1) = W (ε = 1) · W (η = 1) gilt, dann hat das Ereignis η = 1 bei Vorliegen des Ereignisses ε = 1 bezogen auf die Wahrscheinlichkeit von ε = 1 dieselbe Wahrscheinlichkeit wie im gesamten Raum Ω. Die
Zusatzbedingung ε = 1 hat keinen Einfluss auf die Wahrscheinlichkeit für das
Eintreten von η = 1. Wegen W (η = 1) = λ + ν ist dies also genau dann der
KAPITEL 4. WAHRSCHEINLICHKEIT
333
Fall, wenn λ = (λ + µ) (λ + ν) gilt. Ist zB W eine Gleichverteilung, dann gilt also
W ({(1, 1)}) = W (ε = 1) · W (η = 1) .
Für W ({ε = 1 = η}) = W (ε = 1) · W (η = 1) aber, besteht ein stochastischer
Zusammenhang zwischen den Ereignissen ε = 1 und η = 1. Ein extremer Fall
eines solchen Zusammenhangs liegt für λ = 1/2 und µ = ν = 0 vor. Es gilt dann
W (ε = 1) = 1/2 = W (η = 1) und W (ε = η) = 1. Die beiden Münzen fallen mit
Sicherheit auf dieselbe Seite.4
Definition 171 Zwei Ereignisse A, B ⊂ Ω eines W-raumes (Ω, W ) heißen stochastisch unabhängig, falls W (A ∩ B) = W (A)W (B).
Ein quantitatives Maß für den Einfluß eines Ereignisses B auf die Wahrscheinlichkeit des gemeinsamen Vorliegens von A und B gibt die folgende Definition.
Definition 172 Sei (Ω, W ) ein W-raum und B ⊂ Ω ein fest gewähltes Ereignis
die Wahrscheinlichkeit von A relativ
mit W (B) > 0. Dann heißt WB (A) := WW(A∩B)
(B)
zu B. Oft wird statt WB (A) die Schreibweise W (A | B) benutzt und als bedingte
Wahrscheinlichkeit bezeichnet.
Satz 173 Die Mengenfunktion WB auf pot(Ω) ist ein W-maß auf Ω.
Beweis. (i) ist klar. Für A1 , A2 ⊂ Ω mit A1 ∩ A2 = {} gilt
W ((A1 ∪ A2 ) ∩ B)
W ((A1 ∩ B) ∪ (A2 ∩ B))
=
W (B)
W (B)
W (A1 ∩ B) + W (A2 ∩ B)
=
= WB (A1 ) + WB (A2 ).
W (B)
WB (A1 ∪ A2 ) =
Die Normiertheit WB (Ω) = 1 ist klar.
Mischen und Produktbildung
Satz 174 Sind Wi für i = 1, . . . n W-maße auf Ω, und sind λi für i = 1, . . . n
positive reelle Zahlen mit i λi = 1, dann ist auch W := ni=1 λi Wi ein W-maß auf
Ω. (W wird als Mischung der Maße Wi bezeichnet.)
Beweis. (Induktion) Zunächst für n = 2: Die Bedingung (i) aus Kolmogorows
Definition ist erfüllt. (ii) folgt so: W (A ∪ B) = λ1 W1 (A ∪ B) + λ2 W2 (A ∪ B). Da W1
und W2 beides W-maße sind, gilt für disjunkte Mengen A und B, dass Wi (A ∪ B) =
Wi (A) + Wi (B). Somit folgt
W (A ∪ B) = λ1 W1 (A) + λ2 W2 (A) + λ1 W1 (B) + λ2 W2 (B) = W (A) + W (B).
4
Liest man das Ereignis ε = 1 als „Die Person X hat mehr als 1000 Zigaretten geraucht“ und
η = 1 als „Die Person X erkrankt an Lungenkrebs“, dann wird die praktische Bedeutung von
bedingten Wahrscheinlichkeiten drastisch sichtbar, denn für W ({(1, 1)}) > W (ε = 1) · W (η = 1)
erhöht Rauchen das Erkrankungsrisiko.
KAPITEL 4. WAHRSCHEINLICHKEIT
334
Die Normiertheit W (Ω) = 1 folgt aus W (Ω) = λ1 W1 (Ω) + λ2 W2 (Ω) = λ1 + λ2 = 1.
Der Fall n > 2 kann nun mittels Induktion nach n gezeigt werden. Wir nehmen dazu
an, dass für n − 1 die Behauptung gilt. Nun gilt
n
n−1
λi Wi =
i=1
i=1
n−1
λi Wi + λn Wn = (1 − λn )
i=1
λi
Wi + λn Wn .
1 − λn
n−1 λi
λi
′
Wegen n−1
i=1 1−λn = 1 ist gemäß Induktionsvoraussetzung W :=
i=1 1−λn Wi ein
′
W-maß. Die Mischung der beiden Maße W und Wn ist dann gemäß n = 2 ein
W-maß.
Die Mischung zweier W-maße λW1 + (1 − λ)W2 kann man sich so vorstellen.
Beim Würfeln mit einem Würfel wird der Würfel selbst zunächst zufällig aus einer
Palette von zwei Würfelsorten ausgewählt. Die Würfelsorte 1 hat die Wahrscheinlichkeit λ und ein Würfel dieser Sorte wirft gemäß W1 . Die Würfelsorte 2 hat die
Wahrscheinlichkeit 1 − λ und ein Würfel dieser Sorte wirft gemäß W2 .
Satz 175 Sind (Ωi , Wi ) für i = 1, . . . n W-räume, dann existiert auf Ω1 × ... × Ωn
genau ein W-maß W , sodass W (A1 ×. . .×An ) = W1 (A1 ) . . . Wn (An ) für alle Ai ⊂ Ωi
gilt. Notation: W = W1 × . . . × Wn („Produktmaß”).
Beweis. Jede Mengenfunktion W mit W (A1 × . . . × An ) = W1 (A1 ) . . . Wn (An)
hat auf den Elementarereignissen wegen {(ω 1 , . . . ω n )} = {ω 1 } × . . . × {ω n } die
eindeutig bestimmten Werte
D
D
Wi ({ω i }) =
pi (ω i ) .
p(ω 1 , . . . ω n ) := W ({(ω 1 , . . . , ω n )}) =
i
i
Über die Additivität wird W dann auf alle anderen Teilmengen von Ω eindeutig
fortgesetzt. Für W (A1 × . . . × An ) folgt somit
D
W (A1 × . . . × An ) =
...
p(ω 1 , . . . ω n ) =
...
pi (ω i )
ω 1 ∈A1
=
D
i
ωn ∈An
pi (ω i )
ωi ∈Ai
=
D
ω1 ∈A1
ωn ∈An
i
Wi (Ai ).
i
Die Positivität von W ist klar. Die Normierungsbedingung gilt wegen
D
W (Ω) = W (Ω1 × . . . × Ωn ) =
Wi (Ωi ) = 1.
i
Das zweimalige Werfen eines Würfels gibt ein Beispiel für das Produktmaß.
Sei Ω1 = Ω2 = {1, 2, . . . 6} mit der Gleichverteilung W1 = W2 auf Ωi . Dann ist
1
p(i, j) := p1 (i)p2 (j) = 36
für alle i, j. Das Produkt W1 × W2 ist also wieder eine
Gleichverteilung. Analog hat das n-malige Werfen eines Würfels den Wahrscheinlichkeitsraum {1, 2, . . . 6}n mit der Gleichverteilung. Sie gibt jeder Folge (ω 1 , . . . ω n ) von
KAPITEL 4. WAHRSCHEINLICHKEIT
335
Augenzahlen dieselbe Wahrscheinlichkeit p (ω 1 , . . . ω n ) = 6−n. Bei 10 mal Würfeln 10
Sechser zu werfen hat also eine Wahrscheinlichkeit von 6−10 = e−10 ln 6 ≈ 1, 65 · 10−8 .
Wer so eine Wurffolge erlebt, wird wohl den Würfel beginnen zu untersuchen.
Ein physikalisch interessanteres Beispiel liefert das Isotopengemisch von normalem Wasser, halbschwerem Wasser und schwerem Wasser, also von H2 O, HDO und
D2 O, im natürlichen Wasser. Dort kommen diese Moleküle in einem Zahlenverhältnis von 1 : 3, 1 · 10−4 : 2, 4 · 10−8 vor. Können wir das mit einem einfachen Modell
verstehen?
Bei der Bildung von Wasser bindet ein Sauerstoffatom aus dem es umgebenden
Isotopengemisch an Wasserstoff zwei Wasserstoffatome. Es „zieht“ also ein Element
des Raumes {H, D} × {H, D} . Mit der Wahrscheinlichkeit x wird ein H und mit
der Wahrscheinlichkeit 1 − x = x′ wird ein D gezogen. Angenommen die Ziehung
zweier Atome geschieht unabhängig, also mit dem Produktmaß, dann verbrennt das
O-Atom mit den Wahrscheinlichkeiten W ({(H, H)}) = x2 , W ({(H, D) , (D, H)}) =
2xx′ und W ({(D, D)}) = x′2 zu jeweils H2 O, HDO und D2 O. Die Wahrscheinlichkeiten stehen also gemäß dieser Vorstellung im Verhältnis 1 : 2x′ /x : (x′ /x)2 . Aus
3, 1 · 10−4 = 2x′ /x folgt x′ /x = 1, 55 · 10−4 und damit (x′ /x)2 = 2, 4 · 10−8 . Das
Modell erklärt also den Anteil an D2 O aus jenem von HDO. Der Wert von x′ ergibt
sich zu x′ ≈ 1/6500. Eines von 6500 Wasserstoffatomen ist ein schweres.
Transport von W-Maßen
Satz 176 Ist (Ω, W ) ein W-raum und f : Ω → Ω′ mit Ω′ endlich. Dann ist Ω′
zusammen mit Wf : pot (Ω′ ) → R und Wf (A′ ) := W (f −1 (A′ )) ein W-raum. Er
heißt Transport von W unter f, oder Verteilung von f unter W.
Hier bezeichnet f −1 (A′ ) = {ω ∈ Ω |f (ω) ∈ A′ } das Urbild von A′ unter f. Zur
Abbildung f braucht keine inverse Abbildung zu existierenen. Für die Wahrscheinlichkeitsfunktion pf : Ω′ → [0, 1] von Wf gilt also
pf (ω ′ ) = W ({ω ∈ Ω |f (ω) = ω ′ }) .
Beweis. Die Positivität ist klar. Zur Additivität: A, B ⊂ Ω′ disjunkt impliziert
dass auch f −1 (A) ∩ f −1 (B) = {}. Daher und wegen f −1 (A ∪ B) = f −1 (A) ∪ f −1 (B)
gilt Wf (A ∪ B) = W (f −1 (A ∪ B)) = W (f −1 (A) ∪ f −1 (B)) = Wf (A) + Wf (B) .
Normiertheit: Wf (Ω′ ) = W (f −1 (Ω′ )) = W (Ω) = 1.
Sei Ω := {1, .., 6} × {1, .., 6} und W die Gleichverteilung (zwei Würfel, einer
rot, einer grün). Ein Farbenblinder kann das Elementarereignis (i, j) für i = j nicht
von (j, i) unterscheiden. Er identifiziert daher für i < j die zwei Würfe (i, j) und
(j, i). Sei f : Ω → Ω′ := {(i, j) ∈ Ω | i ≤ j}, mit f(i, j) = (i, j) falls i ≤ j und
f (i, j) = (j, i) sonst. Der Farbenblinde sieht also nur das mit der Abbildung f
1
transportierte W-maß Wf . Es hat die Wahrscheinlichkeitsfunktion pf (i, j) = 18
für
1
i > j und pf (i, i) = 36 . Natürlich ist Wf keine Gleichverteilung.
KAPITEL 4. WAHRSCHEINLICHKEIT
4.1.3
336
Binomialverteilung
Ein weiteres Beispiel zum Produkt und Transport von W-maßen ist der N maligeWurf einer unwuchtigen Münze. Hier ist Ω = {0, 1} mit W ({1}) = x ∈ [0, 1] der
W-raum eines einzigen Wurfes. (Siehe auch Übungsbeispiel 14.) Der W-raum des
N -maligen Wurfes ist ΩN mit dem Produktmaß W N . Es gilt W N ({(ω 1 , ..., ω N )}) =
E
N
N
→ R mit (ω 1 , ..., ω N ) → N
i=1 W ({ω i }). Die Abbildung ZN : Ω
i=1 ω i ordnet
jeder Folge von Münzwurfausgängen (ω 1 , ..., ω N ) die Zahl der in ihr vorkommenden
Einsen zu.5 Der Wertebereich von ZN ist {0, ..., N }. Auf diesem ist das transportierte
W-maß W N Z definiert. Es gilt
N
WN
ZN
({k}) = W N
ω ∈ ΩN | ZN (ω) = k
= xk (1 − x)N−k
N
k
.
,
,
= xk (1 − x)N−k ,ZN−1 ({k}),
N
N!
:= (N−k)!k!
die Mächtigkeit der Menge
k
ZN−1 ({k}), also die Zahl der Möglichkeiten an, genau k Einsen in einer Folge aus N
Nullen oder Einsen unterzubringen.
Hier gibt der Binomialkoeffizient
Definition 177 Für x ∈ [0, 1] und N ∈ N0 heißt das W-maß W auf {0, ..., N } mit
W ({k}) := Bi(k; N, x) := xk (1 − x)N−k
N
k
Binomialverteilung. (Siehe Abb. 4.1)
0.175
0.15
0.125
0.1
0.075
0.05
0.025
0
0
25
50
75
100
k
Abbildung 4.1: Bi (k; N, x) (interpoliert) für N = 100 und x = 0, 1 (grün), x = 0, 5
(rot) und x = 0, 95.
5
Auch der Weg einer Kugel durch das Galtonbrett kann als Element ω von ΩN aufgefasst
werden. Der Wert ZN (ω) gibt dann den Endversatz des Weges nach N Hindernissen an.
KAPITEL 4. WAHRSCHEINLICHKEIT
4.1.4
337
*Multinomialverteilung
Eine naheliegende Verallgemeinerung der Binomialverteilung ergibt sich aus einem
k-elementigen W-Raum (Ω, W ) durch Übergang zum W-Raum ΩN , W N . Sei Ω
also eine endliche Menge mit k Elementen: Ω = {ω 1 , . . . ω k } . W sei ein beliebiges
W-Maß auf Ω. Abkürzung: W ({ω i }) = pi . Es gilt pi ≥ 0 und ki=1 pi = 1.
Das W-Maß W N auf ΩN = Ω × . . . × Ω ist definiert durch
W N ({(ω i1 , . . . ω iN )}) = pi1 · . . . · piN .
Die Funktion Zi : ΩN → N0 mit i ∈ {1, . . . k} und
Zi (ω i1 , . . . ω iN ) = δ i,i1 + . . . + δ i,iN
gibt für jeden Punkt (ω i1 , . . . ω iN ) ∈ ΩN an, wieviele seiner Einträge mit ω i übereinstimmen.
Sei (n1 , . . . nk ) ∈ Nk0 . Dann gilt W N ({ω ∈ ΩN : Z1 (ω) = n1 , . . . Zk (ω) = nk }) =
=
N!
pn1
n1 !...nk ! 1
0
. . . pnk k für n1 + . . . + nk = N
.
sonst
Dieses W-Maß auf Nk0 heißt N-te Multinomialverteilung über W. Sie ist der Transport von W N unter der Abbildung (Z1 , . . . Zk ) : ΩN → Nk0 .
Die Multinomialverteilung beantwortet Fragestellungen des Typs: Ein unfairer
Würfel wird 1000 mal geworfen. Wie groß ist die Wahrscheinlichkeit, dass dabei 155
mal die Eins, 201 mal die Zwei, usw geworfen wird, wenn p1 die Wahrscheinlichkeit
für eine Eins bei einem einzigen Wurf ist und p2 die ...? Oder auch diese: In einer Urne
sind s1 Kugeln der Sorte 1, . . . sk Kugeln der Sorte k. Daher ist bei einer wahllosen
Ziehung die Wahrscheinlichkeit gleich pi = si / kr=1 sr eine Kugel der Sorte i zu
ziehen. Werden nun N Ziehungen einer Kugel aus der Urne vorgenommen und die
Kugeln jeweils vor der nächsten Ziehung in die Urne zurückgelegt, dann hat die
Wahrscheinlichkeit dabei n1 Kugeln der Sorte 1, . . . nk Kugeln der Sorte k zu ziehen
welchen Wert?
4.1.5
*Hypergeometrische Verteilung
In einer Urne sind N Kugeln. Sie tragen die Nummern 1, . . . N. Davon sind die
Kugeln mit den Nummern 1, . . . M weiß und die restlichen N − M Kugeln sind
schwarz. Nun werden aus der Urne wahllos n Kugeln entnommen. Wie groß ist
die Wahrscheinlichkeit, dass von den entnommenen Kugeln k weiße und der Rest
schwarze Kugeln sind? Es gilt also N, M, n ∈ N, k ∈ N0 mit M ≤ N und k ≤ n.
Jede Ziehung ω kann als n-elementige Teilmenge der Menge {1, . . . N} aufgefasst
werden. Der Ereignisraum Ω ist also die Menge aller n-elementigen Teilmengen von
{1, . . . N} . Es gilt |Ω| = Nn . Die Zahl aller k-elementigen Teilmengen von {1, . . . M }
ist M
für k ≤ M und 0 sonst. Setzen wir für k > M die Zahl M
= 0, dann
k
k
gilt für alle k ∈ N0 , dass die Zahl der k-elementigen Teilmengen von {1, . . . M }
gleich M
ist. Die Zahl aller (n − k)-elementigen Teilmengen von {M + 1, . . . N }
k
KAPITEL 4. WAHRSCHEINLICHKEIT
338
. Die Zahl aller n-elementigen Teilmengen von
ist dementsprechend gleich N−M
n−k
{1, . . . N} deren Durchschnitt mit {1, . . . M } die Mächtigkeit k hat, ist somit gleich
M
· N−M
. Damit ergibt sich nun für die Gleichverteilung W auf Ω, dass
k
n−k
W ({ω ∈ Ω : |ω ∩ {1, . . . M }| = k}) =
M
k
·
N−M
n−k
N
n
.
Das W -maß auf der Menge {0, 1, . . . n} mit
WN,M,n ({k}) =
M
k
·
N−M
n−k
N
n
mit N, M, n ∈ N mit M ≤ N, n ≤ N wird als hypergeometrische Verteilung zu
den Parameterwerten N, M, n bezeichnet. Es entsteht aus der Gleichverteilung auf
Ω durch Transport mit der Funktion
f : Ω → {0, 1, . . . n} ,
ω → |ω ∩ {1, . . . M}| .
Hypergeometrische Verteilungen steuern die Wahrscheinlichkeit mit einem Tip
beim Lotto ’Sechs aus 45’ drei ’richtige’ zu erraten. Sie finden weiters Verwendung in
der Qualitätskontrolle. Den weißen Kugeln entsprechen dabei etwa die fehlerhaften
Stücke einer Produktion, den schwarzen die makellosen.
4.1.6
Erwartungswert und Varianz
Reellwertige Funktionen auf einem W-raum, sogenannte (reelle) stochastische Variable, haben besondere Bedeutung. Sie geben etwa bei Glücksspielen Verlust oder
Gewinn in Abhängigkeit vom Versuchsausgang an. Wichtige Größen sind Erwartungswert und Varianz einer reellen stochastischen Variable.
Definition 178 Sei (Ω, W ) ein Wahrscheinlichkeitsraum und f& : Ω → R. Dann
'
heißt f W := ω∈Ω f (ω)W ({ω}) Erwartungswert und VW (f ) := (f − f W )2 W ≥
0 Varianz von f unter W . Die Zahl (∆f )W := VW (f ) heißt Streuung (oder Standardabweichung) von f. Der Index W an Erwartungswert und Varianz wird weggelassen, wenn das Wahrscheinlichkeitsmaß W aus dem Zusammenhang klar ist.
Ein Freund(?) bietet Ihnen ein Würfelspiel an. Wird die gerade Augenzahl n geworfen, bezahlen Sie ihm n Euro. Wird jedoch eine ungerade Augenzahl n geworfen,
erhalten Sie von ihm n Euro. Mit welchem Gewinn oder Verlust pro Spiel müssen
Sie bei einer großen Anzahl N von Spielen rechnen? Die Gewinnfunktion f erfüllt:
f (n) = −(−1)n n. Etwas später werden wir lernen, dass im Grenzübergang N → ∞
die Wahrscheinlichkeit gegen 1 konvergiert, einen Gewinn pro Spiel in der Höhe von
G = f Euro zu erhalten. Es gilt somit
G=
1
1
(1 − 2 + 3 − 4 + 5 − 6) = −
6
2
und Sie werden das Spiel besser nicht zu oft spielen.
KAPITEL 4. WAHRSCHEINLICHKEIT
339
Satz 179 Sei Ω = {1, 2, ..., n} und sei W das gleichverteilte W-maß auf Ω. Die
stochastische Variable f := idΩ hat den Erwartungswert f = n+1
und die Varianz
2
n2 −1
V (f) = 12 unter W .
Beweis. Es gilt f = (1/n) nk=1 k = (1/n) · (n/2) · (n + 1) = (n + 1) /2. Nun
zur Varianz. Es gilt V (f ) = f 2 − f 2 = (1/n) nk=1 k 2 − (n + 1)2 /4. Mit
n
k2 =
k=1
n (n + 1) (2n + 1)
6
(4.1)
folgt daraus die Behauptung, denn
2n + 1 n + 1
(n + 1) (2n + 1) (n + 1)2
−
= (n + 1)
−
6
4
6
4
n−1
n2 − 1
4n + 2 3n + 3
= (n + 1)
−
= (n + 1)
=
.
12
12
12
12
V (f) =
Gleichung (4.1) zeigt man durch Induktion. Für n = 1 gilt sie. Gilt (4.1) für ein
n ≥ 1, dann folgt daraus einerseits
n+1
n
k
2
k=1
k=1
=
Andererseits gilt
=
k 2 + (n + 1)2 =
=
n+1
6
n (n + 1) (2n + 1)
+ (n + 1)2
6
n+1
n+1
2n2 + n + 6n + 6 =
2n2 + 7n + 6 .
6
6
(n + 2) (2(n + 1) + 1)
n+1
n+1
2n2 + 2n + 4n + 4 + n + 2 =
2n2 + 7n + 6
6
6
und somit Gleichung (4.1) auch für n + 1 und damit für alle n ∈ N.
Der folgende Satz listet eine Reihe nützlicher Eigenschaften von Varianz und
Erwartungswert auf. Diese Eigenschaften ersparen manche Rechnung, sind nützlich
bei der Fehlersuche oder begründen, wie im Fall der Chebyshevungleichung, die
Bedeutung der Varianz.
Satz 180 Sei (Ω, W ) ein Wahrscheinlichkeitsraum mit f, g : Ω → R. Dann gilt:
1. αf + βg = α f + β g für α, β ∈ R (Linearität)
2. min f (Ω) ≤ f ≤ max f (Ω)
3. f n
W
=
n
x∈f (Ω) x pf (x) =
&
idf (Ω)
n'
Wf
mit n ∈ N0 und
pf (x) := Wf ({x}) = W f −1 {x} = W ({ω ∈ Ω | f (ω) = x}) .
(Die Wahrscheinlichkeitsfunktion von Wf , also pf : f (Ω) → [0, 1] , heißt auch
Verteilungsfunktion von f unter W )
KAPITEL 4. WAHRSCHEINLICHKEIT
340
4. f λW1 +(1−λ)W2 = λ f W1 + (1 − λ) f W2 (Der Erwartungswert unter einer
Mischung ist gleich der Mischung der Erwartungswerte.)
5. Wf ist Punktmaß in x ∈ f (Ω) ⇒ f = x
&
'
6. V (f ) = f 2 − f 2 ,
(f − x)2 = V (f ) + ( f − x)2 für x ∈ R (Der Erwartungswert der quadratischen Abweichung zwischen f und x ist minimal für
x = f .)
7. V (f ) = 0 genau dann, wenn der Transport Wf ein Punktmaß ist.
8. W ({ω ∈ Ω : |f(ω) − f | ≥ t}) ≤
gleichung)
1
V
t2
(f ) für alle positiven t. (Chebyshev Un2
9. VλW1 +(1−λ)W2 (f) = λVW1 (f ) + (1 − λ)VW2 (f) + λ (1 − λ) f W1 − f W2 (Die
Varianz unter einer Mischung ist also nicht kleiner als die Mischung der Varianzen.)
Beweis. Die meisten Aussagen sind direkt nachzurechnen. Wir zeigen beispielhaft wie die Aussagen 8) und 9) zustande kommen. Zunächst zu 9): Für die Varianz
von f unter der Mischung W = λW1 +(1 − λ) W2 mit p (ω) = λp1 (ω)+(1 − λ) p2 (ω)
gilt VW (f ) =
2
2
=
ω∈Ω
p (ω) f (ω) −
& '
= λ f 2 1 + (1 −
p (ω) f (ω)
ω∈Ω
& 2'
λ) f 2 −
[λ f
= λV1 (f) + (1 − λ) V2 (f ) + λ f
= λV1 (f) + (1 − λ) V2 (f ) + λ (1
= λV1 (f) + (1 − λ) V2 (f ) + λ (1
2
1 + (1 − λ) f 2 ]
2
2
1 + (1 − λ) f 2 − [λ f 1
− λ) f 21 − 2 f 1 f 2 +
− λ) [ f 1 − f 2 ]2 .
+ (1 − λ) f 2 ]2
f 22
Aussage 8) kann so gezeigt werden. Sei t ∈ R>0 , dann gilt
V (f) =
ω∈Ω
≥
(f(ω) − f )2 p(ω) ≥
ω∈Ω, mit (f (ω)− f )2 ≥t2
ω∈Ω, mit (f (ω)− f )2 ≥t2
(f(ω) − f )2 p(ω)
t2 p(ω) = t2 W ({ω ∈ Ω | |f (ω) − f | ≥ t}) .
Die Chebyshev Ungleichung gibt gelegentlich für große t eine nützliche Abschätzung der Wahrscheinlichkeit von Ereignissen, auf denen f vom Erwartungswert mindestens um t abweicht.
Satz 181 Sei Ω = {0, 1, ..., N} . Dann gilt idΩ = Nx und V (idΩ ) = Nx(1 − x)
unter der Binomialverteilung zum Parameter x ∈ [0, 1] .
KAPITEL 4. WAHRSCHEINLICHKEIT
341
Beweis. Der Beweis kann auf den N-maligen Münzwurf zurückgeführt werden.
(Siehe unten) Der direkte Beweis geht unter Verwendung des Binomialsatzes wie
folgt. Für N = 0 gilt idΩ = Nx offensichtlich. Dann gilt für N > 0
N
idΩ
=
N
kBi(k; N, x) =
k=0
k=1
xk (1 − x)N−k
N
= Nx
k=1
N−1
= Nx
j=0
xk−1 (1 − x)N−1−(k−1)
xj (1 − x)N−1−j
N!
(k − 1)!(N − k)!
(N − 1)!
(k − 1)!(N − 1 − (k − 1))!
(N − 1)!
= Nx(1 − x + x)N−1 = Nx.
j!(N − 1 − j)!
Als Vorstufe zur Varianz berechnen wir für f = idΩ den Erwartungswert von f (f −1).
Sei N > 1
N
f (f − 1)
=
k=0
N
k (k − 1) Bi(k; N, x) =
= N(N − 1)x2
N −2
j=0
k=2
xk (1 − x)N−k
xj (1 − x)N−2−j
N!
(k − 2)!(N − k)!
(N − 2)!
j!(N − 2 − j)!
= N(N − 1)x (1 − x + x)N−2 = N(N − 1)x2 .
2
Für N = 0 und für N = 1 gilt f (f − 1) = N(N − 1)x2 offensichtlich. Damit folgt
nun
& '
V (f ) = f 2 − f 2 = f (f − 1) + f − f 2
= N(N − 1)x2 + N x − N 2 x2 = Nx(1 − x).
Für x = 0 und für x = 1 gilt V (idΩ ) = 0. In genau diesen Fällen ist die Binomialverteilung ein Punktmaß. Für x = 0 ist sie in k = 0 lokalisiert und für x = 1 ist
sie in k = N lokalisiert.
4.1.7
*Kovarianz und Korrelationskoeffizient
Sei Ω eine endliche Menge von Personen, aus der eine Person durch einen Zufallsmechanismus, also ein W-maß W, gezogen werden kann. Die Funktion m : Ω → R ordne
jeder Person ω ∈ Ω ihre Masse (in irgendeiner Einheit) zu und l : Ω → R gebe ihre
Länge an. Für viele jener Personen ω, die überdurchschnittlich groß sind, nicht aber
unbedingt für alle von ihnen, ist auch ihre Masse überdurchschnittlich. Wie lässt
sich diese Beobachtung quantifizieren? Ein Maß für einen solchen „Parallelismus“
gibt die sogenannte Kovarianz zweier Zufallsvariablen.
Definition 182 Sei (Ω, W ) ein endlicher W-raum mit den Funktionen f, g : Ω →
R. Die Zahl C (f, g) = (f − f ) (g − g ) heißt Kovarianz von f und g.
KAPITEL 4. WAHRSCHEINLICHKEIT
342
Falls also f (ω) > f genau dann gilt, wenn g (ω) > g , dann ist die Funktion (f − f ) (g − g ) nicht negativ und erst recht ihr Erwartungswert, also die
Kovarianz C (f, g) . Einige Eigenschaften der Kovarianz gibt der folgende Satz.
Satz 183 Sei (Ω, W ) ein endlicher W-raum mit reellwertigen Funktionen f, g, h.
dann gilt
1. C (f, g) = fg − f
g ,
2. C (f, g) = C (g, f ) ,
3. C (λf, g) = λC (f, g) für alle λ ∈ R
4. C (f + g, h) = C (f, h) + C (g, h) ,
5. V (f + g) = V (f ) + V (g) + 2C (f, g)
6. C (f, g) = 0 für jede konstante Funktion f,
7. C (f, f ) = V (f ) ,
8. |C (f, g)| ≤
V (f) V (g).
Beweis. Die Aussagen 1. bis 7. sind offensichtlich bzw. direkt nachzurechnen.
Teil 8. folgt aus der Cauchy-Schwarz Ungleichung des Standardskalarproduktes des
Rn so:
C (f, g) =
(f − f ) (g − g ) =
=
ω∈Ω
=
ω∈Ω
p (ω) (f (ω) − f )
p (ω) (f (ω) − f ) (g (ω) − g )
p (ω) (g (ω) − g )
x (ω) y (ω) = x, y
ω∈Ω
mit x (ω) = p (ω) (f (ω) − f ) und y (ω) = p (ω) (g (ω) − g ) . Wegen V (f) =
2
ω∈Ω p (ω) (f (ω) − f ) = x, x folgt nun aus Cauchy Schwarz
x, y
die Ungleichung
2
≤ x, x y, y
C (f, g)2 ≤ V (f) V (g)
und somit Aussage 8.
Aufgrund von Teil 8. des Satzes liegt der sogenannte Korrelationskoeffizient
C (f, g)
K (f, g) =
V (f ) V (g)
im Intervall [−1, 1] . Offenbar gilt K (f, f ) = 1 und K (f, −f) = −1. Überdies ist K
invariant unter einer Umskalierung der Funktionen f oder g, d.h. es gilt für λ > 0
K (λf, g) = K (f, λg) = K (f, g) .
Der Korrelationskoeffizient von Länge und Masse für die Elemente ω einer Menschenmenge Ω ist somit unabhängig von den gewählten Längen- und Masseneinheiten.
KAPITEL 4. WAHRSCHEINLICHKEIT
4.1.8
343
Das Gesetz der großen Zahl
Dieser Abschnitt zeigt wie in einem Wahrscheinlichkeitsmodell Ereignisse mit Wahrscheinlichkeit sehr nahe bei 1 identifiziert werden können. Solche Ereignisse geben
die Möglichkeit ein Wahrscheinlichkeitsmodell an der beobachteten Wirklichkeit zu
überprüfen.
Definition 184 Sei (Ω, W ) ein Wahrscheinlichkeitsraum mit den Funktionen fi :
Ω → Xi für i = 1, . . . , n. Die Funktionen fi heißen E
stochastisch unabhängig, falls
für alle Ai ⊂ Xi gilt W f1−1 (A1 ) ∩ . . . ∩ fn−1 (An ) = ni=1 W fi−1 (Ai ) .
Sei (Ω, W ) ein Wahrscheinlichkeitsraum mit den unabhängigen reellwertigen
Funktionen f und g. Welche Wahrscheinlichkeitsfunktion pf +g hat Wf +g ? Es gilt
für x ∈ f (Ω) + g (Ω) ⊂ R
pf +g (x) = W ({ω ∈ Ω |f (ω) + g (ω) = x}) .
Aus der Darstellung
{ω ∈ Ω |f (ω) + g (ω) = x } =
F
a∈f (Ω)
=
F
a∈f (Ω)
({ω |f (ω) = a} ∩ {ω |g (ω) = x − a})
f −1 (a) ∩ g −1 (x − a)
als disjunkte Vereinigung folgt mit der Additivität von W und der Unabhängigkeit
von f und g
pf +g (x) =
a∈f (Ω)
=
a∈f (Ω)
W f −1 (a) ∩ g −1 (x − a) =
pg (x − a) pf (a) =
a∈f (Ω)∪g(Ω)
a∈f (Ω)
W f −1 (a) W g −1 (x − a)
pg (x − a) pf (a) = (pg ∗ pf ) (x) .
Die Funktion pg ∗ pf : f (Ω) + g (Ω) → [0, 1] wird als die Faltung von pg mit pf an
der Stelle x bezeichnet. Substituiert man x − a = b, so ergibt sich auch
pf +g (x) =
b∈f (Ω)∪g(Ω)
pf (x − b) pg (b) = (pf ∗ pg ) (x) .
Satz 185 Seien (Ωi , Wi ) für i = 1, . . . , n Wahrscheinlichkeitsräume mit Fi : Ωi →
Xi . Am Produktraum Ω := Ω1 ×. . .×Ωn mit dem Produktmaß W sind die Funktionen
fi := Fi ◦ pri mit pri (ω 1 , . . . , ω n ) := ω i stochastisch unabhängig.
Beweis. Es gilt einerseits W f1−1 (A1 ) ∩ . . . ∩ fn−1 (An ) =
= W ({(ω 1 , . . . , ω n ) ∈ Ω | F1 (ω 1 ) ∈ A1 , . . . , Fn (ω n ) ∈ An })
D
Wi Fi−1 (Ai ) .
= W F1−1 (A1 ) × . . . × Fn−1 (An ) =
i
KAPITEL 4. WAHRSCHEINLICHKEIT
344
Andererseits gilt W fi−1 (Ai ) =
= W ({(ω 1 , . . . , ω n ) ∈ Ω | Fi (ω i ) ∈ Ai }) = W Ω1 × . . . × Fi−1 (Ai ) × . . . × Ωn
= W1 (Ω1 ) · . . . · Wi Fi−1 (Ai ) · . . . · Wn (Ωn ) = Wi Fi−1 (Ai )
Somit folgt die Bedingung für die stochastische Unabhängigkeit, nämlich
D
W fi−1 (Ai ) .
W f1−1 (A1 ) ∩ ... ∩ fn−1 (An ) =
i
Im Fall eines ungezinkten Würfels sind Augenzahl und Quadrat der Augenzahl
nicht stochastisch unabhängig. Sei f (ω) := ω und g := f 2 . Somit gilt f −1 ({1}) =
{1} und g −1 ({4}) = {2} . Daraus folgt
0 = W f −1 ({1}) ∩ g −1 ({4}) = W f −1 ({1}) W g −1 ({4}) = 1/36.
Satz 186 Sei (Ω, W ) ein Wahrscheinlichkeitsraum und fi : Ω → R für i = 1, ..n
seien stochastisch unabhängig. Sei k1 , . . . , kn ∈ N0 . Dann gilt
n (
(
) D
)
(fi )ki und V (f1 + ... + fn ) =
(f1 )k1 ... (fn )kn =
i=1
(
)
k1
kn
Beweis. (f1 ) ... (fn )
=
...
=
x1 ∈f1 (Ω)
=
xn ∈fn (Ω)
...
x1 ∈f1 (Ω)
=
=
x1 ∈f1 (Ω)
n (
D
xn ∈fn (Ω)
ω∈Ω
i=1
(x1 )k1 · ... · (xn )kn W f1−1 ({x1 }) · ... · W fn−1 ({xn })
)
−
fi
i=1
n
=
i=1
n
=
i=1
& 2'
fi +
& 2'
fi −
fi
xn ∈fn (Ω)
n
=
i=1
n
i=1
n
fi fj −
i,j=1,i=j
n
fi
i=1
i=1
(x1 )k1 · ... · (xn )kn W f1−1 ({x1 }) ∩ ... ∩ fn−1 ({xn })
Für die Varianz gilt V (f1 + ... + fn ) =
$ n
$ n %2
2%
=
V (fi ).
(f1 (ω))k1 · ... · (fn (ω))kn W ({ω})
(x1 )k1 W f1−1 ({x1 }) · ... ·
(fi )ki
n
fi
i=1
n
2
=
V (fi )
i=1
& 2'
fi +
2
−
(xn )kn W fn−1 ({xn})
n
i,j=1,i=j
n
fi fj −
fi fj
i,j=1,i=j
2
n
fi
i=1
KAPITEL 4. WAHRSCHEINLICHKEIT
345
Sind zwei Funktionen f, g : Ω → R unter dem W-Maß W auf Ω stochastisch
unabhängig, dann gilt also f · g = f · g . Umgekehrt folgt jedoch aus f · g =
f · g nicht, dass f und g stochastisch unabhängig sind. Dazu ein Gegenbeispiel.
Sei W : pot (Ω) → [0, 1] die Gleichverteilung auf Ω = {1, 2, 3} . Es gilt also
W ({ω}) = 1/3 für alle ω ∈ Ω. Die Funktionen f, g seien wie folgt gewählt:
f (1) = 1,
g (1) = 0,
f (2) = 0,
g (2) = 1,
f (3) = −1,
g (3) = 0.
Somit gilt f · g = 0 and f = 0,
g = 1/3. Daraus folgt weiter, dass f · g =
f · g . Die Funktionen f und g sind somit unkorreliert.
Die Ereignisse A = {1} ⊂ Ω und B = {2} ⊂ Ω erfüllen
A = f −1 (1) = {ω : f (ω) = 1} and B = g −1 (1) = {ω : g (ω) = 1} .
A und B haben beide die Wahrscheinlichkeit 1/3, sind aber disjunkt, sodass
W f −1 (1) ∩ g −1 (1) = 0 = (1/3)2 = W f −1 (1) · W g −1 (1) .
f und g sind also stochastisch abhängig und dennoch unkorreliert. Der Transport
von W unter der Abbildung f × g ist dementsprechend auch kein Produktmaß
auf f (Ω) × g (Ω) . Für die W-Funktion pf ×g von Wf ×g gilt vielmehr die folgende
Tabelle, aus der ersichtlich ist, dass die beiden Zeilen pf ×g (x, 0) und pf ×g (x, 1)
linear unabhängig sind. Im Fall eines Produktmaßes wären sie linear abhängig.
pf ×g (x, y)
y=0
y=1
x = −1
1/3
0
x=0
0
1/3
x=1
1/3
0
Beispiel 187 Die Seitenlängen x und y eines Rechtecks werden aus den Vielfachen i · L einer Längeneinheit L > 0 mit i ∈ Ω1 = {1, 2, . . . 6} gewürfelt. Der
Wahrscheinlichkeitsraum ist also Ω = Ω1 × Ω1 mit der Gleichverteilung W. Welchen Erwartungswert und welche Varianz haben Fläche und Umfang der Rechtecke?
Welche Kovarianz haben Fläche und Umfang?
Das Rechteck (i, j) hat die Fläche A (i, j) = L2 ij und den Umfang U (i, j) =
2L (i + j) . Also ergeben sich mit x (i, j) = Li und y (i, j) = Lj die Erwartungswerte
U
A
= 2 ( x + y ) = 4 x = 14L,
49
= xy = x y = x 2 = L2 ,
4
von Umfang und Fläche. Für die Varianz des Umfangs folgt
V (U) = 4 (V (x) + V (y)) = 8V (x) = 8L2
35
70
= L2 .
12
3
KAPITEL 4. WAHRSCHEINLICHKEIT
346
Für die Varianz der Fläche folgt
& '& '
&
'
V (A) = x2 y 2 − xy 2 = x2 y 2 − x
2
y
2
2
& '2
= x2 − x
V (x) + x 2 − x 4 = V (x)2 + 2V (x) x
35
35 49
35 7 5
= L4
+
= L4
+7
12
12
2
12 2 6
=
4
= L
35
12
2
2
4
= V (x) V (x) + 2 x
2
47
≈ 79. 965L4 .
5
Die Kovarianz von Umfang und Fläche ergibt sich daraus so
& '
& ' & '
UA = 2 (x + y) xy = 2 x2 y + xy 2 = 4 x2 x = 4 V (x) + x
35 49 7
= 4L3
+
12
4 2
35 49 7
49
+
− 14L3
C (U, A) = U A − U A = 4L3
12
4 2
4
*
+
35
35 49
5
49
= 14L3
+
−
= L3 7 = L3 72 .
12
4
4
6
6
2
x
Daraus folgt nun der Korrelationskoeffizient
K (U, A) =
=
72 56
C (U, A)
=
V (U) V (A)
72 56
73
122
10
5
3
/
=2
· 47
70
3
35
12
35
12
+
49
2
105
≈ 0.945 31.
470
Beispiel 188 Ein ungezinkter Würfel wird 1000 mal geworfen. Lässt sich die Wahrscheinlichkeit abschätzen, mit der die Summe der geworfenen Augenzahlen vom Erwartungswert 3500 um mindestens 1000 abweicht? Chebyshevs Ungleichung gibt eine
Antwort. Sei Ω = {1, . . . 6} und Wn die Gleichverteilung auf Ωn . Sei fn : Ωn → R
mit fn (ω 1 , . . . ω n ) = ni=1 ω i . Dann gilt
Wn
Mit fn
Wn
= n f1
,
ω ∈ Ωn : ,fn (ω) − fn
Wn
,
,≥t
≤
VWn (fn )
.
t2
= n · 7/2 und VWn (fn ) = nVW1 (f1 ) = n 36−1
folgt daraus
12
,
,
,
7 ,,
n 35
n ,
Wn
ω ∈ Ω : ,fn (ω) − n , ≥ t
≤ 2 .
2
t 12
W1
Wählen wir nun n = 1000 und t = 1000, dann ergibt sich
,
,
,
7 ,,
35
n ,
≤
≈ 2, 9 · 10−3 .
Wn
ω ∈ Ω : ,f1000 (ω) − 1000 , ≥ 1000
2
12000
KAPITEL 4. WAHRSCHEINLICHKEIT
347
Der folgende Satz baut das vorangehende Beispiel zu einem allgemeinen Resultat
aus. Er zeigt, wie bei einer großen Anzahl von Wiederholungen eines Zufallsexperiments Mittelwerte gebildet werden können, deren Varianzen gegen 0 gehen. Er bildet
somit eine Version des „Gesetzes der großen Zahl“.
Satz 189 Sei (Ω1 , W1 ) ein endlicher Wahrscheinlichkeitsraum und f : Ω1 → R.
Dann gilt für die Funktionen fi = f ◦ pri auf (Ωn1 , W1 × . . . W1 )
VWn
1
n
fi
=
i
1
VW (f) .
n 1
Beweis. Sei Ωn := (Ω1 )n und Wn := W1 × . . . × W1 mit(den Funktionen
i :=
( f)
)
k
k
f ◦ pri . Sie sind stochastisch unabhängig. Es folgt zunächst (fi )
= (f )
Wn
für i = 1, ..., n und k ∈ N0 . Wegen
1
n
n
i=1
1
fi (ω 1 , ..., ω n ) =
n
W1
n
f (ω i )
i=1
heißt n1 i fi (ω) für ω ∈ Ωn der Mittelwert von f in der Folge ω = (ω 1 , ..., ω n ) von
n Elementen ω i ∈ Ω1 . Aus der Linearität des Erwartungswertes folgt
$ n %
1
fi
= f W1 .
n i=1
Wn
Aus der Formel für die Varianz einer Summe von stochastisch unabhängigen Variablen folgt
VWn
1
n
fi
=
i
1
VW
n2 n
fi
=
i
1
n2
VWn (fi ) =
i
1
nVW1 (f ) .
n2
Beispiel 190 Sei Ω = {0, 1} mit W ({1}) = x ∈ [0, 1] (gezinkter Münzwurf, Kernzerfall, ...). Wn sei das Produktmaß auf Ωn . Wir wissen schon, dass der Transport
von Wn mit der Funktion
n
n
Zn : Ω → {0, 1, .., n} , (ω 1 , ..ω n ) →
n
ωi =
k=1
pri (ω 1 , ..ω n ) ,
k=1
die Binomialverteilung mit Parameter x auf {0, 1, .., n} ist. Es gilt also
(Wn )Zn ({k}) = Bi(k; n, x).
Da die Funktionen pri stochastisch unabhängig sind, folgt
n
Zn
Wn
=
pri
k=1
Wn
= nx und VWn (Zn ) = nx(1 − x).
KAPITEL 4. WAHRSCHEINLICHKEIT
348
Also stimmen Zn Wn und VWn (Zn ) mit Erwartungswert und Varianz von id unter
der Binomialverteilung überein:
Zn
Wn
= id
(Wn )Zn
,
VWn (Zn ) = V(Wn )Zn (id) .
Dies ist also eine etwas indirekte, zweite Möglichkeit, Erwartungswert und Varianz
von id unter der Binomialverteilung zu berechnen.
Aus Satz 189 folgt, dass für n → ∞ die Varianz des Mittelwerts gegen 0 geht,
der Mittelwert wird also deterministisch. Auf solche Mittelwerte von f läßt sich mit
wenig Risiko wetten! Man beachte dazu auch die Übungsbeispiele 14, 15.
Satz 189 lässt sich noch weiter auswerten. Wähle dazu ein Element x ∈ Ω1 und
die zugehörige Indikatorfunktion
f = δ x : Ω1 → R,
ω→
1 für ω = x
.
0
sonst
Für den Erwartungswert von f gilt f W1 = W1 ({x}) = p(x). Er gibt also die
Wahrscheinlichkeit des Elementarereignisses {x} an. Die Funktion i fi auf Ωn gibt
für ω := (ω 1 , ..., ω n ) ∈ Ωn an, wie oft x ∈ Ω1 in ω auftritt. Der Quotient hn,x (ω) :=
1
i fi (ω) heißt die relative Häufigkeit von x in der Folge ω von n Zufallsereignissen.
n
Es gilt hn,x Wn = p(x). Wegen
VWn (hn,x ) =
ω∈Ωn
(hn,x (ω) − p(x))2 Wn ({ω}) → 0
bei n → ∞, gilt für jedes feste ε > 0 nach der Ungleichung von Chebyshev, dass
lim Wn ({ω ∈ Ωn | |hn,x (ω) − p(x)| > ε}) = 0.
n→∞
Deshalb nähert für genügend großes n ein einzelner „zufälliger”6 Wert hn,x (ω) die
Wahrscheinlichkeit W1 ({x}) mit „großer” Wahrscheinlichkeit. Diese mathematischen Fakten („Gesetz der großen Zahl”) bilden die Basis für die Benützung von
Wahrscheinlichkeit in den empirischen Wissenschaften.
Ein Beispiel liefert das radioaktive Zerfallsgesetz. Eine Probe enthalte zur Zeit
t = 0 eine Anzahl von n0 instabilen Kernen. Für jeden dieser Kerne sei die Wahrscheinlichkeit zur Zeit t > 0 noch unzerfallen zu sein, durch pt = e−λt gegeben. Die
Konstante λ > 0 heißt Zerfallskonstante. Sie hängt nicht von t ab. Die Zahl der zur
Zeit t noch unzerfallenen Kerne in der Probe erfüllt somit für großes n (mit hoher
Wahrscheinlichkeit)
nt ≈ n0 e−λt .
Für die Zahl Z der Kerne, die zwischen t und t + τ zerfallen, gilt für λτ ≪ 1
nt − nt+τ ≈ n0 e−λt 1 − e−λτ ≈ λτ n0 e−λt .
6
Dh jedes Element der Folge ω wird von einem Zufallsgenerator erzeugt, der durch W1 beschrieben ist. Man denke etwa an eine Folge von Würfelexperimenten.
KAPITEL 4. WAHRSCHEINLICHKEIT
349
Für die Aktivität At der Probe zur Zeit t gilt somit
At =
nt − nt+τ
≈ λn0 e−λt .
τ
Das Gesetz der großen Zahl bildet auch den Ausgangspunkt der mathematischen
Statistik, Fehlerrechnung und Schätztheorie. Dort geht es um die Frage, wie aus endlich vielen Zufallsexperimenten die Verteilung einer Funktion f mit möglichst großer
Wahrscheinlichkeit richtig zu erraten ist. Immer gehen dabei Hypothesen über den
Typ des Maßes Wf ein, und ermittelt werden Parameter, die das Maß dann nur
mehr im Detail bestimmen. (Achtung: Oft hat man keine klare Vorstellung vom Definitionsbereich von f.) Eine rezeptartige Zusammenfassung der für die statistische
Auswertung von Messreihen wichtigen Formeln ist in Kapitel 12 von K. Weltner,
Mathematik für Physiker 1, Springer 2001, gegeben. Einige Resultate sind die folgenden. Die beste Schätzung des Erwartungswertes f ist der Mittelwert
f :=
f1 + ... + fn
n
der aus den n zur Verfügung stehenden (unabhängigen) Stichproben von Werten
fi := f (ω i ) ∈ R, der einen(!) Funktion f zu bilden ist. Die beste Schätzung der
Varianz V (f ) ist aus der mittleren quadratischen Abweichung
1
s :=
n
n
2
i=1
fi − f
2
n
mit n−1
s2 gegeben. Beachte: Die auf R definierte differenzierbare Abbildung S, das
Polynom zweiten Grades
n
1
(fi − x)2 ,
S:x→
n i=1
hat bei x = f ihr globales Minimum. Denn
2
S (x) = −
n
n
′
i=1
(fi − x) = −2(f − x)
und somit S ′ (x) = 0 genau dann, wenn x = f . Wegen S ≥ 0 ist der kritische Punkt
des Polynoms zweiten Grades das globale Minimum von S. Die mittlere quadratische
Abweichung der Messwerte fi von irgendeinem Referenzwert x ist minimal für x = f.
Abschließend wird noch eine etwas allgemeinere Version des Gesetzes der großen
Zahl für (unendliche) W-räume angegeben.
Satz 191 Sei (Ω, W ) ein W-raum. Die Funktionen fi : Ω → R für i ∈ N seien
stochastisch unabhängig. Die Zahlenfolge (V (fi ))i∈N sei beschränkt . Sei ε > 0. Dann
gilt
,
=
> ,
, f1 (ω) + ... + fn (ω)
,
f1 + ... + fn
nε
,
,< √
ω∈Ω:,
−
= 1.
lim W
,
n→∞
n
n
n
W
KAPITEL 4. WAHRSCHEINLICHKEIT
350
Beweis. Anwendung der Chebyshevungleichung (Eigenschaft 8 in Bemerkung
180) auf Zn := n1 ni=1 fi ergibt wegen der stochastischen Unabhängigkeit der fi
nach Satz 186
1
1
W ({ω ∈ Ω : |Zn (ω) − Zn W | ≥ t}) ≤ 2 VW (Zn ) = 2 2
t
tn
n
i=1
VW (fi ) ≤
K
,
t2 n
√
wobei K ∈ R mit VW (fi ) ≤ K für alle i ∈ N. Mit t = nε / n für ε > 0 folgt
W
ω ∈ Ω : |Zn (ω) − Zn
√
ε
|
≥
n
/
n
W
≤
K
.
n2ε
Damit folgt
1≥W
4.2
ω ∈ Ω : |Zn (ω) − Zn
W|
√
< nε / n
≥1−
K
→ 1 für n → ∞.
n2ε
Abzählbar unendliche W-räume
Auf abzählbar unendliche Mengen Ω übertragen sich die Begriffe und Sätze, die
für endliche Mengen formuliert wurden, weitgehend. Im folgenden wird anhand von
zwei physikalisch vielgenutzten Beispielen ein erster Eindruck der neuen Situation
vermittelt. Es sind dies die geometrische und die Poissonverteilung. Die Boltzmann
- Gibbs Konstruktion der „thermischen” W-maße zu einer „Energie”-funktion auf
Ω wird auch kurz gestreift.
Eine Mengenfunktion W : pot(Ω) → R für eine abzählbar unendliche Menge Ω
heißt W-maß auf Ω, falls analog zu Bedingung (ii) in Kolmogorows Definition für
alle abzählbaren Familien (Ai )i∈I disjunkter Teilmengen von Ω
W
F
i∈I
Ai =
i∈I
W (Ai )
gilt. Bedingung (i) und (iii) werden unverändert übernommen. Analog zum Fall
endlicher W-räume gilt dann für jede Menge A ⊂ Ω, dass W (A) = ω∈A W ({ω}) .
Die Normierungsbedingung (iii) sagt W (Ω) = ω∈Ω W ({ω}) = 1.
Damit kann aus einer beliebigen nichtnegativen Funktion q : Ω → R ein W-maß
auf Ω erzeugt werden, sofern die Reihe Z := ω∈Ω q(ω) konvergiert. Man wählt die
Wahrscheinlichkeitsfunktion p : Ω → R, ω → q(ω)/Z und definiert für A ⊂ Ω
W (A) =
p (ω) .
ω∈A
In der physikalischen Anwendung auf thermische Quantenzustände ist Ω die
Menge aller stationären Zustände des jeweils zugrundegelegten Quantensystems. Für
KAPITEL 4. WAHRSCHEINLICHKEIT
351
jeden Zustand ω ∈ Ω ist eine Energie E (ω) gegeben. Falls die Reihe („Zustandssumme”) ω∈Ω exp (−βE(ω)) konvergiert, existiert das W-maß Wβ zur Wahrscheinlichkeitsfunktion pβ
pβ (ω) :=
exp (−βE(ω))
mit Z(β) :=
exp (−βE(ω))
Z(β)
ω∈Ω
mit β = 1/kT (Boltzmannkonstante k > 0).7 (Boltzmann-Gibbs Verteilung der
Temperatur T zur Energiefunktion E.)
Falls die Abbildung β → ω∈Ω E(ω) exp (−βE(ω)) als Grenzfunktion einer Folge
von Funktionen auf R>0 gewisse Konvergenzbedingungen8 erfüllt, dann folgt für den
Erwartungswert der Energie, dass für alle β > 0
E
Wβ
=
E(ω)pβ (ω) =
ω∈Ω
1
1
E(ω) exp (−βE(ω)) = −
Z ′ (β).
Z(β) ω∈Ω
Z(β)
Ein wichtiger Spezialfall der Konstruktion ergibt sich für den quantenmechanischen harmonischen Oszillator. Hier gilt Ω = N0 und E(n) = ε0 +hνn. (Dann ist Wβ
das thermische Gleichgewichts-W-maß einer Hohlraumstrahlungsmode der Frequenz
ν > 0, wobei h die Plancksche Konstante ist. Das Elementarereignis {n} steht für
das Vorhandensein von n Photonen in der Mode.) Es gilt für n ∈ N0
pβ (n) =
exp(−β (hνn + ε0 ))
,
Z(β)
Z(β) = exp(−βε0 )
xn =
exp(−βhνn) = exp(−βε0 )
n∈N0
n∈N0
exp(−βε0 )
1−x
mit x := exp (−βhν) ∈ (0, 1) . Damit ergibt sich pβ (n) = (1 − x)xn .
4.2.1
Geometrische Verteilung
Ein unverbesserlicher Optimist kauft jeden Freitag Abend einen Tipp für die nächste
Ziehung von 6 aus 45. Seine Wahrscheinlichkeit auf einen Sechser ist p = 1/8145060 ≈
10−7 . Er nimmt sich vor, so lange zu spielen, bis er den ersten Sechser einfährt. Sein
Spiel hat also den Wahrscheinlichkeitsraum N0 . Dabei steht n ∈ N0 für die Zahl
seiner sechserlosen Tipps bis zu seinem finalen Sechser. Die Wahrscheinlichkeit, dass
er nach n Fehltipps einen Sechser tippt, ist gleich px (n) = xn · p mit x = 1 − p.
Kontrolle der Normierungsbedingung:
∞
k=0
px (n) = p
∞
k=0
xn =
p
= 1.
1−x
Definition 192 Sei x ∈ (0, 1) und Ω := N0 . Dann heißt der W-raum (Ω, Wx ) mit
der Wahrscheinlichkeitsfunktion px : Ω → [0, 1] , n → (1 − x)xn geometrische
Verteilung zum Parameterwert x.
7
8
Natürlich funktioniert die Konstruktion bei endlichen Mengen Ω immer.
Siehe Satz 35 samt Bemerkung in Kapitel III, Abschnitt 7, Band I von [3].
KAPITEL 4. WAHRSCHEINLICHKEIT
352
Wegen px (n + 1) = xpx (n) ist die Funktion px streng monoton fallend. Von zwei
Elementarereignissen {m} und {n} mit m < n hat also {m} die größere Wahrscheinlichkeit. Mit steigendem x wird px „flacher”. Für x ↓ 0 geht Wx gegen das
Punktmaß, das auf 0 lokalisiert ist, denn limx→0 (1 − x)xn = δ 0,n .
0.5
0.375
0.25
0.125
0
0
1
2
3
4
5
6
7
8
9
10
n
Abbildung 4.2: Geometrische Verteilung für x = 0.5 und x = 0.8 (rot)
Nun zu Erwartungswert und Varianz von id unter der geometrischen Verteilung.
(Die Beweise werden in Übungsbeispiel 12) geführt.)
Satz 193 Für die geometrische Verteilung zum Parameterwert x ∈ (0, 1) gilt:
id
Wx
=
x
x
und VWx (id) =
.
1−x
(1 − x)2
Man beachte: limx↓0 id = 0 = min id(Ω) und limx↓0 V (id) = 0. Für x → 1
wachsen id und V (id) unbeschränkt.
Wieviele sechserlose Tipps muss unser Optimist bis zu seinem ersten Sechser
erwarten? Ungefähr (1 − 10−7 ) /10−7 ≈ 107 . Wenn er wöchentlich einen Tipp abgibt,
muss er sich auf ca. 2 · 105 Jahre einrichten.
Münzwurfspiel mit Gewinnwahrscheinlichkeit x ∈ [0, 1]
Das folgende Beispiel zerlegt den Ereignisraum N mit der geometrischen Verteilung
zum Parameter 1/2 in zwei komplementäre Ereignisse mit den Wahrscheinlichkeiten
x ∈ [0, 1] und 1 − x. Auf diese Weise lässt sich mit einer fairen Münze jedes W-Maß
auf einer zweielementigen Menge erzeugen.
Die Zahl x ∈ [0, 1] habe die Binärentwicklung 0, x1 x2 . . . , d.h. für die unendliche
Folge (x1 , x2 , . . .) mit Einträgen aus der Menge {0, 1} gilt
x=
∞
k=1
xk
1
.
2k
Werfen Sie nun eine (gleichverteilte) Münze. Wenn Kopf fällt, werten Sie dies als
die Zahl 0, fällt hingegen Zahl, werten Sie dies als 1. Werfen Sie die Münze n-mal
KAPITEL 4. WAHRSCHEINLICHKEIT
353
hintereinander, so erzeugen Sie eine Folge ω = (ω 1 , . . . ω n ) in {0, 1} . Sie wählen nun
die Zahl n der Würfe nicht fest, sondern lassen den Zufall über n nach der Regel
ω i = xi für i = 1, . . . n − 1 und ω n = xn
entscheiden. Sie werfen also so oft, bis die geworfene Folge erstmals von der Binärfolge von x abweicht. Der Wahrscheinlichkeitsraum Ω dieses Spiels ist also N.
Die Wahrscheinlichkeit, dass Sie eine Folge der Länge n werfen, ist durch pn = 21n
gegeben. Es gilt übrigens
∞
pk =
n=1
∞
n=0
1
1
−
1
=
2k
1−
1
2
− 1 = 1.
Wie groß ist die Wahrscheinlichkeit, dass der erste Fehlwurf, der zum Spielende
führt, ω n < xn erfüllt? Für xn = 0 kann ω n < xn nicht gelten. Für xn = 1 hingegen
folgt aus ω n = xn , dass ω n < xn . Daher gilt für eine Folge ω der Länge n, dass
ω n < xn , genau dann, wenn xn = 1. Wegen xn ∈ {0, 1} gilt
W ({n ∈ N : xn = 1}) =
∞
pn =
n=1,xn =1
∞
xn pn = x.
n=1
Die beiden komplementären Ereignisse: Spiel abgebrochen wegen ω n < xn bzw.
wegen ω n > xn haben somit die Wahrscheinlichkeiten x bzw. 1 − x.
4.2.2
Poissonverteilung
Eine radioaktive Probe enthalte n = 1020 instabile Kerne. Jeder der Kerne habe die
winzige Wahrscheinlichkeit von x = 10−18 =: δ/n innerhalb der nächsten Sekunde
zu zerfallen. Es gilt also δ = 100. Die Wahrscheinlichkeit, dass in der nächsten
Sekunde genau k ∈ {0, 1, . . . n} der Kerne zerfallen, ist Bi (k, n, x) = Bi (k, n, δ/n) .
Wir werden nun zeigen, dass Bi (k, n, δ/n) ≈ e−δ δ k /k! gilt.9 (Gesetz der kleinen
Wahrscheinlichkeiten)
Definition 194 Für δ > 0 heißt der W-raum (N0 , Wδ ) mit pδ (n) → e−δ · δ n /n!
Poissonverteilung zum Parameter δ.
Es gilt die Normierungsbedingung ∞
n=0 pδ (n) = 1. Wegen pδ (n) = pδ (n − 1) ·
δ/n gilt pδ (n) > pδ (n − 1) für alle n < δ und pδ (n) < pδ (n − 1) für alle n > δ.
Der Graph von pδ wird mit wachsendem δ flacher. Für δ ↓ 0 geht Wδ gegen das
Punktmaß, das auf 0 lokalisiert ist. Abbildung 4.4 zeigt für δ = 100 und für δ = 120
den Graphen jener reellen Interpolation Pδ (x) der Poissonverteilung pδ , die für x ∈
R≥0 mittels Eulers Gammafunktion Γ durch
∞
x −δ
Pδ (x) := δ e /x! mit x! := Γ(1 + x) :=
e−t tx dt
0
gegeben ist. Die vorliegende graphische Auflösung kann Pδ nicht von pδ unterscheiden.
9
Den Fehler werden wir allerdings nicht abschätzen können.
KAPITEL 4. WAHRSCHEINLICHKEIT
354
0.5
0.375
0.25
0.125
0
0
2.5
5
7.5
10
Abbildung 4.3: Poisson Verteilung für δ = 0.5 und δ = 5
0.03
0.02
0.01
0
0
50
100
150
200
Abbildung 4.4: Poissonverteilung für δ = 100 und δ = 120
Satz 195 Für die Poissonverteilung Wδ gilt id
Wδ
= δ,
VWδ (id) = δ.
Beweis.
id
∞
∞
δ n −δ
=
npδ (n) =
n e =
n!
n=0
n=0
= δe−δ
∞
n=1
&
id
2
'
∞
n−1
∞
∞
n=1
n
δn
e−δ
(n − 1)!
δ
δ
= δe−δ
= δe−δ eδ = δ
(n − 1)!
(n)!
n=0
∞
∞
δn
δ n−1
=
n pδ (n) =
n
e−δ = δe−δ
n
(n − 1)!
(n − 1)!
n=0
n=1
n=1
.∞
7
∞
δ n−1
δn−1
−δ
= δe
(n − 1)
+
(n − 1)! n=1 (n − 1)!
. n=1∞
7
∞
n−2
n
δ
δ
= δe−δ δ
+
= δe−δ δeδ + eδ = δ 2 + δ
(n
−
2)!
n!
n=2
n=0
2
Daraus folgt V (id) = id2 − id 2 = δ 2 + δ − δ 2 = δ.
Der folgende Satz zeigt einen Zusammenhang zwischen der Binomoialverteilung
und der Poissonverteilung.
Satz 196 Für n, k ∈ N0 , x ∈ (0, 1) , δ ∈ R>0 gilt limn→∞ Bi k; n, nδ = pδ (k).
KAPITEL 4. WAHRSCHEINLICHKEIT
355
Beweis. Sei ohne Einschränkung n > δ und n > k. Dann gilt
δ
Bi(k; n, ) =
n
n
k
δ
n
k
δ
1−
n
n−k
δk
=
k!
δ
1−
n
−k
δ
1−
n
n
n!
(n − k)!nk
Nun gilt wegen der Stetigkeit von x → (1 − x)−k bei x = 0, dass limn→∞ (1 − δ/n)−k =
1. Für das k-fache Produkt
n!
n (n − 1) ... (n − k + 1)
1
=
=1· 1−
k
k
(n − k)!n
n
n
· ... · 1 −
k−1
n
n
n!
δ
= exp (−δ) folgt
folgt limn→∞ (n−k)!n
k = 1. Mit Eulers Formel limn→∞ 1 − n
schließlich die Behauptung.
Eine Approximation der Binomialverteilung zu festem Parameter x gibt der folgende Grenzwertsatz von de-Moivre und Laplace.
Satz 197 Sei Wn die Binomialverteilung10 auf Ωn = {0, 1, . . . n} zum Parameter
id −nα
α ∈ (0, 1) . Sei Yn = √ Ωn
. Dann gilt Yn = 0 und V (Yn ) = 1 und
nα(1−α)
1
lim Wn ({k ∈ Ωn : Yn (k) ≤ x}) = √
n→∞
2π
x
u2
e− 2 du.
−∞
Dieser Satz erklärt also die Gauß’sche Glockenkurve am Galtonbrett. Darüberhinaus führt er uns zu überabzählbar unendlichen W-Räumen.
4.3
Wahrscheinlichkeitsmaße auf Rn
Für W-maße auf überabzählbar unendlichen Mengen Ω muß die Potenzmenge pot(Ω)
zwar zu einer darin enthaltenen σ-Algebra von Teilmengen von Ω verkleinert werden, aber viele Analogien zum Fall einer endlichen Menge Ω bleiben bestehen. Wir
behandeln überabzählbar unendliche Mengen Ω nur beispielhaft und weichen der
Formulierung allgemeiner Sachverhalte aus.
4.3.1
Wahrscheinlichkeitsmaße auf R mit Dichtefunktion
Der Grenzwertsatz von de Moivre und Laplace legt die folgende allgemeine Konstruktion für W-Maße auf R nahe. Sei ρ0 : R → R eine stetige nichtnegative Funkti∞
on, für die das Integral −∞ ρ0 (x) dx existiert. Durch Übergang zu ρ = cρ0 mit einer
∞
positiven reellen Zahl c kann dann immer erreicht werden, dass −∞ ρ (x) dx = 1
gilt. Damit wird nun die Funktion F : R → [0, 1] mit
x
F (x) =
ρ (t) dt
−∞
10
Es gilt also pn (k) =
n
k
αk (1 − α)n−k .
KAPITEL 4. WAHRSCHEINLICHKEIT
356
monoton wachsend und es gilt F ′ = ρ und limx→−∞ F (x) = 0, limx→∞ F (x) = 1.
Die Zahl F (x) kann als Definition der Wahrscheinlichkeit des Ereignisses (−∞, x]
in R gewählt werden. Die Funktion F heißt Verteilungsfunktion des W-Maßes und
ρ heißt Dichte von F. Einem endlichen Intervall (a, b] wird die Wahrscheinlichkeit
b
W ((a, b]) =
a
ρ (x) dx = F (b) − F (a)
zugeordnet. W ((a, b]) gleicht also dem Inhalt jener Fläche, die zwischen a und b unter
dem Graphen von ρ liegt. Nach dem Mittelwertsatz der Integralrechnung existiert
ein x ∈ [a, b] , sodass
b
W ((a, b]) =
a
ρ(x)dx = (b − a) · ρ(x).
Für eine (abzählbare) Vereinigung von disjunkten Intervallen Iα wird
W (∪α Iα ) =
α
W (Iα )
gesetzt.
4.3.2
Gauß’sche Normalverteilung
Ein Beispiel für das Konstruktionsschema11 des vorigen Abschnitts liefert die nach
Gauß benannte Normalverteilung.
Definition 198 Das W-Maß auf R, das für alle x ∈ R dem Ereignis (−∞, x] die
Wahrscheinlichkeit
x
(t−x0 )2
1
−
2δ 2
√
e
dt
(4.2)
F (x) =
2
−∞
2πδ
zuordnet, heißt (Gauß’sche) Normalverteilung zu den Parameterwerten δ > 0 und
x0 ∈ R. Die Funktion F heißt Verteilungsfunktion und die Ableitung ρ = F ′ ihre
Dichte.
Die Verteilungsfunktion F der Normalverteilung zu (δ, x0 ) geht aus der parameterfreien Gauß’schen Fehlerfunktion12
erf : R → R,
2
erf(x) := √
π
x
−t2
e
0
1
dt = √
π
x
2
e−t dt
−x
folgendermaßen hervor
F (x) =
11
1
2
1 + erf
x − x0
√
2δ 2
.
(4.3)
Noch allgemeiner ist die Vorgabe einer Verteilungsfunktion F : R → R mit den Eigenschaften:
F ist nicht fallend, F ist stetig bis auf höchstens abzählbar viele Sprungstellen, in den Sprungstellen
ist F rechtsseitig stetig, limx→−∞ F (x) = 0 und limx→∞ F (x) = 1.
12
Das Kürzel erf leitet sich von error function ab.
KAPITEL 4. WAHRSCHEINLICHKEIT
357
Die Parameter x0 und δ der Verteilung F schieben und strecken
die Fehlerfunktion.
√
2
Warum gilt Gleichung (4.3)? Substitutiere t := (x − x0 ) / 2δ in Gleichung (4.2).
Damit folgt
1
F (x) = √
π
1
= √
π
x−x0
√
2δ
−t2
e
−∞
∞
0
0
1
dt = √
π
1
2
e−t dt + √
π
−t2
e
−∞
x−x0
√
2δ
1
dt + √
π
2
e−t dt =
0
x−x0
√
2δ
2
e−t dt
0
1
1 + erf
2
x − x0
√
2δ
.
Für das letzte Gleichheitszeichen wurde limx→∞ erf(x) = 1 benützt, was weiter
unten bewiesen wird. Wegen Gleichung (4.3) stellt dies sicher, dass limx→∞ F (x) = 1.
Die Abbildung 4.5 zeigt ρ für x0 = 0 und δ = 1 bzw. δ = 1/2. Die Abbildung
4.6 zeigt F für x0 = 0 und δ = 1 bzw. δ = 1/2. Der Fall x0 > 0 entsteht durch
Verschieben der Graphen um x0 nach rechts.
0.6
0.4
0.2
0
-5
-2.5
0
2.5
5
Abbildung 4.5: ρ für δ = 1 bzw. δ = 1/2 (die schmälere) und x0 = 0
1
0.75
0.5
0.25
0
-5
-2.5
0
2.5
5
Abbildung 4.6: F für δ = 1 bzw. δ = 1/2 (die steilere) mit x0 = 0
Nun zeigen wir noch limx→∞ erf(x) = 1. Mit Polarkoordinaten des R2 , nämlich x = r cos (φ) und y = r sin (φ), folgt für das Quadrat der positiven Zahl
KAPITEL 4. WAHRSCHEINLICHKEIT
358
√
∞
exp (−x2 ) dx/ π
−∞
I = limx→∞ erf(x) =
∞
∞
1 −(x2 +y2 )
1 2π
2
I =
e
dx dy =
e−r rdr dφ
π 0
−∞
−∞ π
0
2π
∞
2π
1
d
1 2
1
dφ = 1.
=
− e−r drdφ =
π 0
dr
2
2π 0
0
√
√
∞
Bemerkung 199 Substituieren von x = t/ 2δ 2 in −∞ exp (−x2 ) dx = π ergibt
mit δ > 0
∞
√
t2
e− 2δ2 dt = δ 2π.
2
∞
−∞
Diese Formel gilt jedoch nicht nur für δ ∈ R>0 , sondern auch für δ ∈ C 0, sofern
− π4 < arg(δ) < π4 . (Das Argument einer von Null verschiedenen komplexen Zahl
δ ist dabei durch δ = |δ| exp (i arg(δ)) mit −π < arg(δ) ≤ π definiert.) Im Fall
δ ∈ C 0 mit − π4 < arg(δ) < π4 gilt übrigens die für die Konvergenz des Integrals
nötige Ungleichung ℜ δ 2 > 0.
4.3.3
Exponentialverteilung
Die Beobachtung radioaktiver Zerfälle zeigt: Die Wahrscheinlichkeit p (τ ) , dass ein
instabiler Atomkern (eines festgelegten Typs) eine Zeitspanne der Dauer τ > 0
unzerfallen übersteht, sinkt für τ → ∞ gegen 0 ab. Umgekehrt strebt für τ → 0
diese ’Überlebenswahrscheinlichkeit’ p (τ ) gegen 1. Für Zeiten τ > 0 nahe bei 0 gilt
eine (einseitige) Tangentialapproximation p (τ ) ≈ 1 − λτ mit λ ∈ R>0 , deren Fehler
ψ (τ ) = p (τ )−(1 − λτ ) die Bedingung limτ →0 ψ (τ ) /τ = 0 erfüllt. Die positive reelle
Zahl λ wird als ’Zerfallsrate’ bezeichnet. Mit welcher Wahrscheinlichkeit überlebt
der Atomkern höchstens N Zeitspannen der Dauer τ ? Gibt es eine stetige Funktion
auf R, welche die Wahrscheinlichkeit angibt, dass ein zur Zeit 0 vorliegender Kern
irgendwann vor der Zeit t ∈ R zerfällt?
Unter der physikalischen Hypothese, dass der Kern jedes Zeitintervall der Dauer
τ mit Wahrscheinlichkeit p (τ ) intakt übersteht, ist die Wahrscheinlichkeit für das
Überleben von höchstens N ∈ N0 solchen (aneinander gereihten) Intervallen durch
die geometrische Verteilung Wx auf N0 mit Parameter x = p (τ ) gegeben, dh
N
Wx ({n ∈ N0 : n ≤ N }) =
Sei nun t ∈ R>0 . Dann gilt mit
Wx
t
τ
n ∈ N0 : n ≤
=
t
τ
t
τ
n=0
+
t
τ
(1 − x) xn = 1 − xN+1 .
und
t
τ
∈ N0 und 0 ≤
t
τ
<1
= 1 − x[ τ ]+1 = 1 − x τ x1−{ τ } .
t
t
t
Die Zahl α = 1 − τt liegt im Intervall (0, 1] . Die Zahl xα = eα ln p(τ ) erfüllt wegen
ln p (τ ) < 0 die Abschätzung eln p(τ ) ≤ xα < e0 = 1. Aus limτ→0 eln p(τ ) = 1 folgt
daher limτ→0 xα = 1.
KAPITEL 4. WAHRSCHEINLICHKEIT
359
t
Den Faktor x τ formen wir um zu
t
τ
t
τ
x = (1 − λτ + ψ (τ )) =
λt
λt ψ (τ )
1−
+
t/τ
t/τ λτ
t
τ
.
Für τ → 0 ergibt sich daher mit s = t/τ
t
lim x τ = lim
τ →0
s→∞
1−
s
ψ (t/s)
λt
1−
s
λt/s
= e−λt .
Für die Wahrscheinlichkeit Pλ (t) , dass ein Kern, der eine ’Zerfallsrate’ λ besitzt
und der zur Zeit 0 intakt vorliegt, irgendwann vor einer Zeit t > 0 zerfällt, gilt somit
Pλ (t) = lim W1−λτ ({n ∈ N0 : n ≤ t/τ }) = 1 − e−λt .
τ ↓0
Für t = 0 ergibt sich
Pλ (0) = lim W1−λτ ({n ∈ N0 : n ≤ 0}) = lim W1−λτ ({0}) = lim (1 − p (τ )) = 0.
τ ↓0
τ ↓0
τ ↓0
Definition 200 Sei λ ∈ R>0 . Dann heißt das Wahrscheinlichkeitsmaß auf R mit
der Verteilungsfunktion Fλ (x) = 1 − e−λx für x > 0 und Fλ (x) = 0 sonst, Exponentialverteilung zum Parameter λ.
Anmerkung: Die Funktion ρλ mit ρλ (x) = λe−λx für x > 0 und ρλ (x) = 0 für
x ≤ 0 ist eine Dichte der Verteilungsfunktion Fλ .
Damit bekommt Curies Zerfallsgesetz eine probabilistische Form: Ein zur Zeit
t0 vorliegender Kern mit der Zerfallsrate λ > 0 zerfällt mit der Wahrscheinlichkeit
Fλ (t) vor der Zeit t0 + t. Figur 4.7 zeigt diese Zerfallswahrscheinlichkeit bis zur Zeit
t0 + t als Funktion von x = λt in rot und die dazu komplementäre Überlebenswahrscheinlichkeit in grün. Achtung: Für t < 0 ist die Wahrscheinlichkeit, dass der Kern
vor der Zeit t0 + t, also auch vor t0 zerfallen ist, gleich 0. Das erscheint plausibel,
wenn ein Zerfall ein einmaliger, irreversibler Vorgang ist, hat aber wenig mit dem
tatsächlichen Vorliegen des Kerns zu tun.
y
1
0.75
0.5
0.25
0
0
1.25
2.5
3.75
5
x
Abbildung 4.7: Exponentialverteilung F1 (rot) und 1 − F1 (grün)
KAPITEL 4. WAHRSCHEINLICHKEIT
4.3.4
360
*Cauchyverteilung
Die Gaußverteilung haben wir aus einer Dichtefunktion konstruiert. Umgekehrt bietet sich auch manch nichtnegative, beschränkte, monoton wachsende Funktion direkt
als Verteilungsfunktion an. Die arctan - Funktion etwa ist monoton wachsend und
bildet R auf (−π/2, π/2) bijektiv ab. Sie legt daher die folgende Konstruktion eines
W-maßes auf R nahe.
0
ist
Definition 201 Die Funktion F : R → (0, 1) mit F (x) = 12 + π1 arctan x−x
δ
2
für jedes Paar (x0 , δ) ∈ R mit δ > 0 eine Verteilungsfunktion. Diese Verteilung auf
R heißt Cauchy- oder auch Lorentzverteilung zu den Parametern x0 , δ.
F hat wegen arctan′ (x) =
ρ(x) =
1
1+x2
die Dichte ρ : R → R>0 mit
1
1
·
δπ 1 + x−x0
δ
2
=
1
δ
.
· 2
π δ + (x − x0 )2
Die Dichte ρ ist maximal bei x = x0 mit ρ (x0 ) = 1/δπ. Der Parameter δ regelt die
Breite von ρ, denn für |x − x0 | = δ gilt ρ (x) = ρ (x0 ) /2. Siehe Figur 4.8. Obwohl
0.8
0.6
0.4
0.2
-5
-2.5
0
2.5
5
Abbildung 4.8: Cauchyverteilung mit Dichte für δ = 1 und x0 = 0
jede Cauchyverteilung einer Gaußverteilung ähnlich sieht, bestehen im Detail doch
erhebliche Unterschiede. Figur 4.9 vergleicht die Dichte der Lorenzverteilung mit
δ = 1 und x0 = 0 mit der Dichte der Gaußverteilung für δ = π/2 und x0 = 0.
Beide haben zwar bei x = 0 denselben Wert, die Gaußverteilung gibt jedoch größeren
Werten von |x| weniger Gewicht. Dies lässt sich mit den Begriffen Erwartungswert
und Varianz präzisieren.
4.3.5
Erwartungswert und Varianz
Definition 202 Sei ρ : R → R Dichte eines W-Maßes auf R und f : R → R sei
derart, dass die Funktionen |f | ρ und f 2 ρ über R uneigentlich riemannintegrierbar
sind. Dann sind Erwartungswert f und Varianz V (f ) von f unter dem W-maß
mit der Dichte ρ wie folgt definiert.
∞
&
' & '
f(x)ρ(x)dx und V (f ) := (f − f )2 = f 2 − f 2 .
f :=
−∞
KAPITEL 4. WAHRSCHEINLICHKEIT
361
0.3
0.25
0.2
0.15
0.1
0.05
0
-5
-2.5
0
2.5
5
Abbildung 4.9: Dichte von Cauchy und Gaußverteilung
Für eine Cauchyverteilung etwa existieren weder Erwartungswert noch Varianz
der identischen Funktion.
Satz 203 Für Erwartungswert und Varianz der stochastischen Variable X := idR
unter der Gaußverteilung zu (δ, x0 ) gilt X = x0 und V (X) = δ 2 .
Beweis. Es gilt X − x0 = 0, da der Integrand um x0 ungerade ist. Also gilt
X = x0 . Die Varianz von X folgt dann mit α := 1/2δ 2 zu
/
∞
&
(x − x0 )2 − (x−x20 )2
α ∞ 2 −αx2
2'
2δ
√
V (X) = (X − x0 ) =
e
dx
=
xe
dx
2
π −∞
−∞
2πδ
/
/
∞
α ∞
d −αx2
α d
2
=
− e
dx = −
e−αx dx
π
dα
π dα −∞
/
/ −∞ /
1 α √ −3/2
1
α d
π
= −
=
πα
=
= δ2.
π dα α
2 π
2α
Satz 204 Für Erwartungswert und Varianz der stochastischen Variable X := idR
unter der Exponentialverteilung mit der Dichte ρλ (x) = λe−λx für x > 0 und
ρλ (x) = 0 für x ≤ 0 gilt X = 1/λ und V (X) = 1/λ2 .
Beweis. Wird in den Übungen ausgeführt.
4.3.6
Gleichverteilung auf Intervall
Definition 205 Sei I ⊂ R ein Intervall. |I| bezeichne die Länge13 von I. Das WMaß W auf R, das dem Ereignis Ex := (−∞, x] die Wahrscheinlichkeit W (Ex) :=
|Ex ∩ I| / |I| zuordnet, heißt Gleichverteilung auf I.
Satz 206 Sei W die Gleichverteilung auf I = (a, b). Dann gilt für die Verteilungsfunktion F von W

für x < a
 0
x−a
für a ≤ x < b .
F (x) = W (Ex ) =
 b−a
1
für b ≤ x
13
Also |(a, b)| := b − a
KAPITEL 4. WAHRSCHEINLICHKEIT
362
1
F hat die Dichte ρ(x) = b−a
für a < x < b und ρ(x) = 0 sonst. Für den Erwartungswert und die Varianz der stochastischen Variable X := idR gilt X = b+a
und
2
V (X) =
(b−a)2
.
12
Beweis. Für x ≤ a gilt (−∞, x] ∩ (a, b) = ∅ und daher F (x) = W (∅) = 0. Für
a < x < b gilt (−∞, x] ∩ (a, b) = (a, x] und daher F (x) = W ((a, x]) = x−a
. Für
b−a
x ≥ b gilt (−∞, x] ∩ (a, b) = (a, b) und daher F (x) = W ((a, b)) = 1.
Die Formel
x
ρ (u) du
F (x) =
−∞
ist offensichtlich. Der Erwartungswert von X ergibt sich mit
X =
∞
b
xρ (x) dx =
−∞
a
1 1
a+b
x
dx =
b2 − a2 =
.
b−a
2b−a
2
Die Varianz von X ergibt sich mit der Substitution u = x −
a+b
2
b
1
a+b 2
dx
x−
b−a a
2
−∞
,(b−a)/2
(b−a)/2
1
2 u3 ,,
2 1 b−a
2
=
u du =
=
,
b − a −(b−a)/2
b−a 3 0
b−a3
2
∞
V (X) =
4.3.7
x−
a+b
2
2
ρ (x) dx =
3
=
(b − a)2
.
12
W-Maße auf Rn und ihr Transport
Ist U eine Kugel, ein Quader oder ähnliches im Rn , dann ist die Gleichverteilung
auf U durch das W-maß W (A) := |U∩A|
für A ⊂ Rn (messbar) definiert, wobei |X|
|U |
das euklidische Volumen einer (meßbaren) Menge X ⊂ Rn bezeichnet.
Für n > 1 sind etwas allgemeinere W-maße durch eine integrable Dichte ρ : Rn →
R mit ρ ≥ 0 und Rn ρ(x)dn x = 1 charakterisiert. Dann ist die Wahrscheinlichkeit
W (A) des Ereignisses A ⊂ Rn (messbar) definiert durch
ρ(x)dn x.
W (A) =
A
Die Gleichverteilung auf U hat die Dichte ρ mit ρ (x) = 1/ |U | für x ∈ U und
ρ (x) = 0 sonst.
Sei f : Rn → R eine stochastische Variable. Falls |f| ρ und f 2 ρ über ganz Rn
integrierbar sind, dann existieren Erwartungswert und Varianz von f unter W
f
W
:=
Rn
&
f (x)ρ(x)dn x, und VW (f ) = (f − f
2
W)
Der Transport Wf von W unter f ist analog zu Satz 176 durch
Wf (A′ ) := W f −1 (A′ ) für A′ ⊂ R (messbar)
'
W
.
KAPITEL 4. WAHRSCHEINLICHKEIT
363
definiert. Das W-maß Wf hat die Verteilungsfunktion Ff : R → R mit
Ff (x) := W f −1 (−∞, x] .
Falls Ff stetig und überall (außer möglicherweise in endlich vielen Stellen) differenzierbar ist, hat Ff eine Dichte ρf , die folgendermaßen gewählt werden kann:
In den Differenzierbarkeitsstellen x von Ff sei ρf (x) = Ff′ (x) , in Punkten x, in
denen Ff nicht differenzierbar ist, ist ρf (x) beliebig in R≥0 . Dann gilt nämlich
x
Ff (x) = −∞ ρf (u) du für alle x ∈ R. Falls der Erwartungswert von f n für ein n ∈ N
unter W existiert, lässt er sich auch aus ρf durch 1-dim Integration berechnen:
fn
W
=
∞
−∞
xn ρf (x) dx = (idR )n
Wf
.
Gleichverteilung auf Rechteck
Sei W die Gleichverteilung auf R = [0, 1] × [0, 1] und für die Funktion14 f : R2 → R
gelte f (a, b) = a2 für alle (a, b) ∈ R. Ein Blick auf den Funktionsgraphen von f,
siehe Figur (4.10), zeigt, dass bei gleichverteilter Ziehung von (a, b) Funktionswerte
f (a, b) < 1/2 eher als Funktionswerte f (a, b) >√1/2 zu erwarten sind. Etwas genauer: Für 0 ≤ x ≤ 1 gilt f −1 ((−∞, x]) = [0, x] × [0, 1] . Daraus folgt für die
Verteilungsfunktion von f
, √
, √
Ff (x) = , 0, x × [0, 1], = x für 0 ≤ x ≤ 1.
Für x < 0 gilt Ff (x) = 0 und für x > 1 gilt√Ff (x) = 1. (Siehe Figur 4.11) Für die
Dichte ρf von Ff gilt ρf (x) = Ff′ (x) = 1/ (2 x) für 0 < x < 1 und ρf (x) = 0 sonst.
√
Die Wahrscheinlichkeit
von
f
(x)
<
1/2
ist
somit
1/
2 ≈ 0.7, jene von f (x) > 1/2
√
ist dann 1 − 1/ 2 ≈ 0.3.
Berechnen wir noch f n W . Es gilt
1
fn
W
1
a2n da db =
=
0
0
1
.
2n + 1
Für den Erwartungswert von f gilt somit f W = 1/3. Die Varianz von f ergibt sich
4
zu V (f ) = f 2 W − f 2W = 15 − 19 = 45
. Eine Kontrolle gibt
,1
∞
1
xn
1
1
1
n
n
n
n+ 12 ,
√ dx = ·
f W = id Wf =
ρf (x) x dx =
.
, =
1 x
2 n+ 2
0
2n + 1
−∞
0 2 x
Gleichverteilung auf Kreisscheibe
Sei W die√Gleichverteilung auf KR = {(a, b) ∈ R2 |a2 + b2 ≤ R2 } für ein R > 0. Sei
r (a, b) = a2 + b2 für (a, b) ∈ R2 . Für die Verteilungsfunktion Fr von Wr folgt dann
für 0 ≤ x ≤ R
Fr (x) = W ({p ∈ KR |r (p) ≤ x }) =
14
x
x2 π
=
R2 π
R
Wie f außerhalb von R definiert ist, spielt im Folgenden keine Rolle.
2
.
KAPITEL 4. WAHRSCHEINLICHKEIT
364
Abbildung 4.10: Graph von f und z = 1/2
1.25
1
0.75
0.5
0.25
0
-0.5
0
0.5
1
1.5
Abbildung 4.11: Ff und ρf (rot) für f (a, b) = a2 unter Gleichverteilung auf R
Für x < 0 folgt Fr (x) = 0 und für x > R gilt Fr (x) = 1. Die Funktion ρr mit
ρr (x) = 2x/R2 für 0 < x < R und ρr (x) = 0 sonst ist eine Dichte von Fr .
Für den Erwartungswert von r gilt
,R
2π
R
2π
1
1
1 3 ,,
2
2
r W = 2
ξ dξ dφ = 2 · ξ , ·
dφ = R.
R π 0
R π 3 0 0
3
0
Kontrolle:
R
r
W
= idR
Wr
=
0
R
ρr (x) xdx =
Eine Gaußverteilung auf R2
0
2x
2 3 ,,R 2
xdx
=
x 0 = R.
R2
3R2
3
Sei δ > 0. Die Funktion ρG : R2 → R mit
ρG (a, b) =
1 − a2 +b2 2
e 2δ
2δ 2 π
KAPITEL 4. WAHRSCHEINLICHKEIT
365
2
ist Dichte eines
√ W-Maßes. Für die Verteilung der Betragsfunktion r = |·| : R → R
mit |(a, b)| = a2 + b2 unter ρG ergibt sich für ξ ≥ 0
p ∈ R2 ||p| ≤ x
Fr (x) = W
x
2π
2δ 2 π
=
2
− t2
2δ
e
=
= 1−e
t2
e− 2δ2 tdt dφ
0
√
x/ 2δ 2
2
2ue−u du = −
0
2
− x2
2δ
0
√
x/ 2δ 2
tdt =
0
x
2π
1
2δ 2 π
0
d −u2
e du
du
.
x2
Für x < 0 gilt Fr (x) = 0. Die Funktion ρr mit ρr (x) = δx2 e− 2δ2 für x > 0 und
ρr (x) = 0 für x < 0 ist eine Dichte von Fr .
Damit ergibt sich der Erwartungswert der Betragsfunktion r unter ρG zu
r
∞
=
0
xρr (x) dx =
∞
0
x2 − x22
e 2δ dx =
δ2
2
− x2
2δ
∞
−∞
∞
π
πδ 2
2 e
√
√
√
=
x
dx =
=
2δ 2 π −∞
2δ 2 π
2δ 2 π
Für den Erwartungswert von r2 folgt
∞
∞ 3
& 2'
x − x22
2
2δ dx = 2δ
r
x2 ρr (x) dx =
=
2e
δ
0
0
= 2δ 2
Das Ergebnis r
& 2'
=
r
∞
x2 − x22
e 2δ dx
2δ2
πδ 2
.
2
∞
0
x2 − x22 2xdx
e 2δ
2δ 2
2δ 2
te−t dt = 2δ 2 .
0
2
2
= 2δ ist auch ganz einfach mit 2d Integration über ρG zu erhalten:
x2 + y 2
R2
∞
−
x2
e− 2δ2
x2 √ 2 dx
−∞
2δ π
∞
1 − x2 +y2 2
e 2δ dxdy = 2
2δ 2 π
x2
2δ 2
∞
−∞
y2
e− 2δ2
√
dy
2δ 2 π
e
x2 √ 2 dx = 2δ 2 .
−∞
2δ π
Für die Varianz von r gilt somit V (r) = (2 − π/2) δ 2 .
= 2
Eine Gaußverteilung auf R3
Sei δ > 0. Die Funktion ρG : R3 → R mit
ρG (v) =
1
2δ 2 π
|v|2
e− 2δ2
3/2
ist Dichte eines W-Maßes. Für die Verteilung Fr der Betragsfunktion r = |·| : R3 →
R unter ρG folgt für x ≥ 0
Fr (x) = W
=
v ∈ R3 ||v| ≤ x
x
4π
2δ 2 π
3/2
0
=
2δ 2 π
t2
4
e− 2δ2 t2 dt = √
π
π
2π
1
dφ
3/2
x/2δ
0
0
2
2
e−u u2 du.
0
x
sin θdθ
0
t2
e− 2δ2 t2 dt
KAPITEL 4. WAHRSCHEINLICHKEIT
366
Für x < 0 gilt Fr (x) = 0. Die Funktion15 ρr : R → R mit ρr (x) =
x > 0 und ρr (x) = 0 für x < 0 ist eine Dichte von Fr .
0
∞
4π
xρr (x) dx =
2δ 2 π
= 2
3/2
2δ 2
π
0
∞
0
x2
4
x3 e− 2δ2 dx = √
π
te−t dt = −2
2δ 2
π
3/2
(2δ2 π)
e− 2δ2 für
8δ 2 /π, denn
Für den Erwartungswert von r unter ρG gilt r =
∞
x2
4πx2
∞
2δ 2
2
u3 e−u du
0
∞
2δ 2
.
π
′
t e−t dt = 2
0
Für den Erwartungswert von r2 gilt analog zum 2d Fall r2 = 3δ 2 . Mit der
Dichte ρr folgt dies auch mithilfe der Gammafunktion, da
∞
0
5
2
= 32 Γ
3
2
=
31
Γ
22
3/2
2
2δ π
4δ 2
= √
π
Mit Γ
∞
4π
x2 ρr (x) dx =
1
2
0
x2
4
x4 e− 2δ2 dx = √ 2δ 2
π
4δ 2
5
t3/2 e−t dt = √ Γ
π
2
0
√
= 34 π folgt schließlich
∞
∞
0
∞
2
u4 e−u du
0
.
x2 ρr (x) dx = 3δ 2 .
Die Varianz von r ergibt sich somit zu V (r) = (3 − 8/π) δ 2 .
Gleichverteilung am Halbkreis
Hier ein Beispiel, das eine Cauchyverteilung aus einer Gleichverteilung erzeugt.
Der Halbstrahl R>0 · (cos φ, sin φ) ⊂ R2 mit − π2 < φ < π2 schneidet die Gerade
(δ, 0) + R · (0, 1) mit δ > 0 im Punkt S = (δ, δ tan φ) . Siehe Figur 4.12. Ist auf
dem Winkelintervall − π2 < φ < π2 eine Gleichverteilung gegeben, so gilt für die
Wahrscheinlichkeit des Ereignisses φ ∈ − π2 , π2 : δ · tan φ < y
, π
,
, − , arctan y ,
1 1
y
2
δ
W ({φ : δ · tan φ < y}) =
= + arctan .
π
2 π
δ
Die y-Koordinate des Schnittpunkts S ist also Cauchy-verteilt. Moral: Der Transport
der Gleichverteilung auf − π2 , π2 mit der Funktion δ · tan ergibt eine Cauchyverteilung.
In der Physik tritt Fr mit δ 2 = kT/m als Maxwells thermische Geschwindigkeitsverteilung
eines einzelnen Teilchens von einem Massenpunktgas der Temperatur T auf. Der Erwartungswert
der kinetischen Energie m |v|2 /2 des Teilchens ergibt sich zu 3kT/2. Da die Geschwindigkeiten aller
Teilchen voneinander unabhängig verteilt sind, gilt für die Zahl N (x) der Teilchen mit |v| < x,
dass N (x) /Nges ≈ Fr (x) .
15
KAPITEL 4. WAHRSCHEINLICHKEIT
367
Abbildung 4.12: Halbstrahl schneidet achsenparallele Gerade
Gleichverteilung am Intervall
Ein Auto fährt mit der Geschwindigkeit v und ist zu einer Vollbremsung gezwungen.
Für seinen Bremsweg s gilt bei einer konstanten Bremsbeschleunigung b, dass s =
v2
. Die für eine Vollbremsung zur Verfügung stehende Bremsbeschleunigung eines
2b
zufällig herausgegriffenen Autos sei im Intervall I := [b1 , b2 ] ⊂ R>0 gleichverteilt.
Unter diesen Annahmen sollen die folgenden Größen berechnet werden.
1. Der Erwartungswert s des Bremsweges für v = 30 m/ s und b1 = 4 m/ s2 und
b2 = 8 m/ s2 .
2. Die Verteilungsfunktion des Bremsweges und ihre Dichte. (Graphen)
3. Für v = 30 m/ s und b1 = 4 m/ s2 und b2 = 8 m/ s2 die Wahrscheinlichkeit,
dass ein zufällig herausgegriffenes Auto einen Bremsweg hat, der kleiner als
s ist.
Der Bremsweg ist am Intervall I der möglichen Werte von b durch die streng
monoton fallende Funktion
s : I → R,
b→
v2
2b
s 112.5
100
87.5
75
62.5
4
5
6
7
8
b
Die Funktion s
KAPITEL 4. WAHRSCHEINLICHKEIT
368
gegeben. Sie fällt von s1 := s(b1 ) = 112, 5 m auf s2 := s(b2 ) = 56, 25 m ab. Ihr
Erwartungswert unter der Gleichverteilung ist
b2
s
b2
s(b)db
db
v2
=
2 (b2 − b1 ) b1 b
b1 b2 − b1
v2
b2
900
=
=
ln
ln (2) ≈ 87 m.
2 (b2 − b1 )
b1
8
=
Beachte, dass s nicht mit s( id ) = s(6 m s−2 ) = 75 m übereinstimmt.
Für die Verteilungsfunktion Fs von s gilt

für x ≤ s2
 0 −1
b2 −s (x)
Fs (x) = W ({b | s(b) ≤ x}) =
für s2 < x < s1
 b2 −b1
1
für s1 ≤ x


 0 2 für x ≤ s2
b2 − v2x
=
für s2 < x < s1

 b2 −b1
1
für s1 ≤ x

für x ≤ s2
 0
s2
s1
1− x
für s2 < x < s1 .
=
 s1 −s2
1
für s1 ≤ x
Einsetzen der Zahlenwerte ergibt bei Verwendung der Einheit Meter für den Bremsweg x

für x ≤ 56, 25
 0
für
56, 25 < x < 112, 5 .
Fs (x) =
2 1 − 56,25
x

1
für 112, 5 ≤ x
F
1
0.75
0.5
0.25
0
50
75
100
125
x
Die Verteilung von s
Die Dichte ρs der Verteilung ist für alle x ∈ R {s2 , s1 } durch die Ableitung
ρs (x) = Fs′ (x) gegeben. In den Ausnahmepunkten kann sie beliebig gewählt werden.
Wir wählen den Wert 0. Daraus folgt
ρs (x) =
=
s1 s2
s1 −s2
0
s1 ·
0
·
1
x2
1
x2
für s2 < x < s1
sonst
für s2 < x < s1
.
sonst
KAPITEL 4. WAHRSCHEINLICHKEIT
369
rho 0.035
0.03
0.025
0.02
0.015
0.01
0.005
0
40
60
80
100
120
x
Die Dichte von s
Die Wahrscheinlichkeit, dass der Bremsweg eines Autos kleiner als s ist, ergibt
1
1
sich aus der Verteilungsfunktion zu Fs ( s ) = s1s−s
1 − ss2 = 2 − ln(2)
≈ 0, 56.
2
4.4
Übungsbeispiele
1. Sei Ω = {a, b, c}. Geben Sie die Potenzmenge von Ω an. Wieviele Elemente
enthält sie? Geben Sie ein Beispiel für ein Wahrscheinlichkeitsmaß auf Ω.
2. Wieviele Elemente enthält die Potenzmenge einer Menge Ω, die aus n Elementen besteht?
3. In einer Schachtel sind 2n Kugeln. Sie sind von 1 bis 2n durchnummeriert.
Die Kugeln mit den Nummern 1, . . . n sind rot und jene mit den Nummern
n + 1, . . . 2n sind grün. Es wird erst eine und dann noch eine Kugel wahllos aus
der Schachtel gezogen, ohne dass die erste zuvor in die Schachtel zurückgelegt
wird.
(a) Überlegen Sie, dass der Ereignisraum dieses Vorgangs die Menge Ω ist.
Ω = {(i, j) | i, j ∈ {1, . . . 2n} und i = j}
Wieviele Elemente hat Ω?
(b) Berechnen Sie zur Gleichverteilung W auf Ω die Wahrscheinlichkeit W (A)
des Ereignisses A, dass beide Kugeln dieselbe Farbe haben. Ist diese
Wahrscheinlichkeit kleiner als 1/2?
(c) Zeigen Sie, dass limn→∞ W (A) = 1/2.
(d) Sei B das Ereignis, dass die zuerst gezogene Kugel rot ist, und sei C das
Ereignis, dass die zweitgezogene Kugel rot ist. Sind diese beiden Ereignisse stochastisch unabhängig? Untersuchen Sie also ob
W (B ∩ C) = W (B) W (C) .
KAPITEL 4. WAHRSCHEINLICHKEIT
370
4. In einem Becher sind zwei unterscheidbare, ungezinkte Würfel. Der Becher wird
geschüttelt und auf ein Tablett geleert. Ein Elementarereignis dieses Spiels ist
somit ein Paar (i, j) von Augenzahlen i, j ∈ {1, .., 6}.
(a) Geben Sie für den Wahrscheinlichkeitsraum (Ω, W ) dieses Würfelspiels
die Werte der Wahrscheinlichkeitsfunktion p(ω) := W ({ω}) für alle ω ∈
Ω an.
(b) Die Teilmenge A ⊂ Ω steht für das Ereignis „Mindestens eine der gewürfelten Augenzahlen ist 1 oder prim”? Welche Wahrscheinlichkeit hat
A?
(c) B ⊂ Ω steht für: ”Die Summe der Augenzahlen ist größer als 11”. Sind
A und B stochastisch unabhängig, d. h. gilt W (A ∩ B) = W (A)W (B)?
(d) Sei f : Ω → R, (i, j) → i + j. Berechnen Sie den Erwartungswert und die
Varianz von f :
& '
p (ω) f (ω), V (f ) = f 2 W − f 2W .
f W =
ω∈Ω
(e) Geben Sie für den Transport16 Wf von W mit f die Wahrscheinlichkeitsfunktion pf auf f(Ω) an. Berechnen Sie also für jedes x ∈ f(Ω) die Zahl
pf (x) := W ({ω ∈ Ω | f (ω) = x}) =? Zeigen Sie f W = x∈f (Ω) xpf (x).
5. Beantworten Sie die Frage 4a) für zwei ununterscheidbare, ungezinkte Würfel.
Liegt wie in 4a) eine Gleichverteilung vor?
6. Ein ungezinkter Würfel wird n mal geworfen. Wie groß ist die Wahrscheinlichkeit, dass die ersten k Würfe eine 6 und die restlichen Würfe keine einzige 6
ergeben? Welcher Wert ergibt sich für n = 600 und k = 100?
7. Welchen Wahrscheinlichkeitsraum hat das Lotto Sechs aus 45 ? Welche Wahrscheinlichkeit hat ein Elementarereignis? Hinweis: Eine Ziehung ist eine injektive17 Abbildung f : {1, 2, . . . 6} → {1, 2, . . . 45}. Wieviele solche Abbildungen gibt es? Sind f und g zwei solche Abbildungen mit g ({1, 2, . . . 6}) =
f ({1, 2, . . . 6}), dann werden sie als dasselbe Zufallsereignis aufgefasst, da die
Reihenfolge der gezogenen Zahlen ignoriert wird. Wieviele sechselementige
Teilmengen hat also {1, 2, .., 45}? Für N, k ∈ N0 , k ≤ N heißen die Zahlen
N
k
:=
N!
k! (N − k)!
Binomialkoeffizienten18 . Für k ∈ N ist k! := k(k − 1) . . . 1 und 0! := 1.
16
Es gilt für jedes A ⊂ f (Ω) dass Wf (A) = W f −1 (A) , wobei f −1 (A) = {ω ∈ Ω | f(ω) ∈ A}.
Eine Abbildung f : X → Y heißt injektiv, falls für alle a, b ∈ X mit a = b gilt: f (a) = f (b).
18
Es gilt
17
N
(x + y)N =
k=0
N
k
xk y N−k
KAPITEL 4. WAHRSCHEINLICHKEIT
371
8. Ein ungezinkter Würfel wird n mal geworfen. Wie groß ist die Wahrscheinlichkeit, dass genau k Würfe eine 6 werfen? Welchen Wert hat sie für n = 600
und k = 100?
9. Ein Signalprozessor liest eine Folge aus Nullen und Einsen. Die Wahrscheinlichkeit, dass er ein Zeichen falsch liest sei 0, 05. Wie groß ist die Wahrscheinlichkeit, dass er beim Lesen einer Folge von 39 Zeichen mindestens 7 Zeichen
falsch liest?
10. Ein instabiler Atomkern sei nach Ablauf der Zeitspanne τ mit der Wahrscheinlichkeit x ∈ [0, 1] zerfallen. Der W-raum (Ω, W ) dieses Versuchs ist Ω = {0, 1}
mit dem W-maß W , für das W ({1}) = x gilt. Die Zahl 1 steht also für das
Elementarereignis ”Der Kern ist zerfallen”.
(a) Welchen Erwartungswert und welche Varianz hat Z : Ω → R, ω → ω?
(b) Wenn N unterscheidbare Kerne sich gegenseitig nicht beeinflussen, hat
der Zufallsversuch ”Welche der N Kerne zerfallen innerhalb einer Sekunde?” den W-raum (ΩN , WN ) mit
ΩN := ΩN und WN (A1 × .. × AN ) :=
N
D
W (Ai ).
i=1
Die Zahl der in einem Elementarereignis (ω 1 , .., ω N ) ∈ ΩN zerfallenen
Kerne wird von der stochastischen Variablen ZN : ΩN → R mit
N
ZN (ω 1 , .., ω N ) :=
Z(ω i )
i=1
angegeben. Welchen Erwartungswert und welche Varianz hat ZN ?
(c) Zeigen Sie, dass der Transport von WN mit ZN die Binomialverteilung
auf {0, 1, .., N} ist. Es gilt für k ∈ {0, 1, .., N }
WN (ZN−1 ({k})) = Bi (k; N, x) := xk (1 − x)N−k
N!
.
(N − k)!k!
Die Abbildungen 1 und 2 zeigen die Binomialverteilung
k → WN (ZN−1 ({k}))
für N = 10 und N = 100 und x = 1/3 und x = 2/3.
(d) Sei nun x = 10−3 . Welchen Wert hat die Wahrscheinlichkeit, dass von
N = 103 Kernen innerhalb von einer Sekunde mehr als 2 (bzw. 3) zerfallen? Hinweis: Berechnen Sie zunächst die Wahrscheinlichkeit des komplementären Ereignisses.
KAPITEL 4. WAHRSCHEINLICHKEIT
372
N=10, x=1/3
0.4
0.3
0.2
0.1
0
0
1
2
3
4
5
6
7
8
9
10
k
7
8
9
10
k
N=10, x=2/3
0.4
0.3
0.2
0.1
0
0
1
2
3
4
5
6
Abbildung 4.13:
N=100, x=1/3
0.1
0.05
0
0
20
40
60
80
k
N=100, x=2/3
0.1
0.05
0
0
20
40
60
Abbildung 4.14:
80
k
KAPITEL 4. WAHRSCHEINLICHKEIT
373
(e) Kontrollieren Sie Ihr Ergebnis für d) an der Chebyshev Ungleichung19 .
11. Die Wahrscheinlichkeit x, dass ein Atomkern während einer Zeitspanne der
Dauer τ > 0 zerfällt, sei für hinreichend kleine τ durch γτ gegeben. Dabei sei
γ > 0 und γτ ≪ 1.
(a) Der Kern wird für ein n ∈ N über eine Zeitspanne der Dauer nτ beobachtet. Falls der Kern zerfällt, wird festgestellt, in welchem der n Teilintervalle der Dauer τ er zerfällt. Mit welcher Wahrscheinlichkeit zerfällt er
im k-ten Zeitintervall?
(b) Sei P (t) die Wahrscheinlichkeit, dass der Kern ein Zeitintervall der Dauer
t > 0 überlebt. Zeigen Sie, dass
lim P (t) = e−γt .
τ →0
Hinweis: Überlegen Sie, dass limτ →0 P (t) = limn→∞ P
t n
n
.
12. Geometrische Verteilung zum Parameter x : Ein instabiler Atomkern, zerfalle
unabhängig von seinem Alter in einer Sekunde mit der Wahrscheinlichkeit
(1 − x) ∈ ]0, 1[. Die Wahrscheinlichkeit, dass er n ∈ N0 Sekunden überlebt
und dann bis zum Zeitpunkt n + 1 zerfällt, ist p(n) := W ({n}) := xn (1 − x).
Seine Lebensdauer ist also in diesem diskreten Modell geometrisch verteilt. Es
ist, als würde der Kern, so lange er lebt, jede Sekunde eine Münze werfen, die
über sein Leben entscheidet. Wenn er zum ersten Mal „Tod” wirft, ist sein
Zufallsexperiment beendet.
(a) Sei N ∈ N0 gegeben. Mit welcher Wahrscheinlichkeit zerfällt der Kern
vor der Zeit N + 1? Gilt W (N0 ) = 1?
(b) Die stochastische Variable τ := idN0 heißt Lebensdauer. Welchen Erwartungswert und welche Varianz hat τ ? Hinweis:
∞
n=0
nxn = x
d
dx
∞
n=0
xn und
∞
n=0
n(n − 1)xn = x2
d2
dx2
∞
xn
n=0
(c) Skizzieren Sie den Graphen der Verteilung p (von τ ).
(d) Seien M, m ∈ N0 gegeben. Mit welcher Wahrscheinlichkeit zerfällt ein
Kern, der in einem Intervall n ≥ M zerfällt, in irgendeinem Intervall
mit n < M + m? Hinweis: Die bedingte Wahrscheinlichkeit W (A | B) =
W (A∩B)
für A = {n ∈ N0 | n < M + m} und B = {n ∈ N0 | n ≥ M } ist
W (B)
zu ermitteln.
19
Für eine reelle stochastische Variable f auf einem endlichen Wahrscheinlichkeitsraum (Ω, W )
gilt
W ({ω ∈ Ω : |f(ω) − f | ≥ t}) ≤ V (f)t−2 .
KAPITEL 4. WAHRSCHEINLICHKEIT
374
(e) Seien M, m ∈ N0 . Mit welcher Wahrscheinlichkeit zerfällt ein Kern in
irgendeinem Intervall n mit M ≤ n < M +m? Sind A und B stochastisch
unabhängig? Hinweis: W (A ∩ B) =?
13. Für Unausgelastete eine Brücke von Beispiel 12 hin zur Physik mit einer kleinen Fingerübung in Sachen Limesberechnung und Kettenregel. Das Beispiel
zählt nicht zum PS-Stoff, Sie sollten es aber benützen, um Ihr Wissen aus MfP
zu festigen.
Im thermischen Gleichgewichtszustand eines elektromagnetischen Hohlraumresonators mit einer Schwingungsmode der Frequenz ν ist die Zahl n der Phohν
).
tonen in dieser Mode geometrisch verteilt mit Parameter x = exp(− kT
(T ...Temperatur, h...Plancksche Konstante, k...Boltzmannkonstante) Kontrollieren Sie, dass sich die Funktion T → n für T → ∞ an eine lineare Funktion
annähert. Zeigen Sie auch, dass diese Funktion für T → 0 stärker als T gegen
0 geht. Hinweis: Zeigen Sie, dass die Funktion
F : R>0 → R>0 , Θ :=
kT
1
→ n /Θ =
hν
Θ exp (1/Θ) − Θ
für Θ → ∞ gegen 1 und für Θ → 0 gegen 0 konvergiert20 . Die Größe Θ ist eine dimensionslose, problemangepasste Temperaturvariable. Zeigen Sie weiter,
dass für die Ableitung G′ der Funktion G(Θ) := ΘF (Θ) = n gilt
G′ (Θ) =
2Θ sinh
1
2Θ
−2
.
G′ ist der Beitrag der betrachteten Mode zur spezifischen Wärme des Hohlraumresonators. Berechnen Sie die Limiten von G′ (Θ) für Θ → 0 und Θ → ∞.
0.75
0.5
0.25
0
1.25
2.5
3.75
5
Die Graphen von F (durchgezogen) und von G′ (strichliert)
20
Es gilt sogar für alle m ∈ N, dass limΘ→0 n /Θm = 0.
KAPITEL 4. WAHRSCHEINLICHKEIT
375
0.5
0.375
0.25
0.125
0
0.25
0.5
0.75
1
Der Graph von G
14. Ein ungezinkter Würfel wird n mal geworfen. Die Funktion
1
f : {1, . . . 6} → R mit f (ω 1 , . . . ω n ) =
n
n
n
ωi
i=1
gibt den Mittelwert der Augenzahlen einer Wurffolge an. Welchen Erwartungswert und welche Varianz hat die Funktion f ? Lösung: der Erwartungswert ist
7/2 und die Varianz ist 35/12n. Schätzen Sie im Fall n = 100 mit der Cehbyshevungleichung die Wahrscheinlichkeit ab, einen Mittelwert kleiner gleich
3 oder größer gleich 4 zu erwürfeln. Lösung: W < 11, 7%. Welchen Erwartungswert und welche Varianz hat das Produkt der geworfenen Augenzahlen
bei n Würfen? Lösung: der Erwartungswert ist (7/2)n und die Varianz ist
(7 · 13/6)n − (7/2)2n . Beachte: 7 · 13/6 > (7/2)2 .
15. Ein Zufallsexperiment hat die zwei möglichen Ausgänge A und B. Die Wahrscheinlichkeit des Ausganges B sei x. Wird das Experiment N mal wiederholt,
dann bezeichnet NB die Anzahl der Experimente mit Ausgang B. Die Chebyshevungleichung zu NB gibt eine obere Schranke für die Wahrscheinlichkeit
an, dass die Häufigkeit des Ausgangs B, nämlich NB /N , von x um mehr als
εx abweicht. (ε > 0) Berechnen Sie diese Schranke für N = 1022 , x = 10−3 und
ε = 10−3 .
16. Die Poissonverteilung zum Parameter δ ∈ R>0 ist der W -raum (N0 , W ) mit
pδ : N0 → R,
Rechnen Sie nach:
δ n exp(−δ)
.
n → W ({n}) =
n!
21
(a) W (N0 ) = 1, W (2 · N0 ) = e−δ cosh(δ) > 1/2, W (2 · N0 + 1) = e−δ sinh(δ).
(b) idN0 = δ.
(c) V (idN0 ) = δ, Hinweis: differenzieren Sie b) nach δ.
21
2 · N0 := {2n | n ∈ N0 }
KAPITEL 4. WAHRSCHEINLICHKEIT
376
(d) Für f : N0 → R, n → (−1)n gilt f = e−2δ , V (f) = 1 − e−4δ .
(e) f · idN0 = −δe−2δ . Sind f und idN0 unter W stochastisch unabhängig?
Die Abbildung zeigt den Graphen von pδ für δ = 10 (durchgezogen) und für
δ = 1.
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
5
10
15
20
25
17. In einer Stadt wie Innsbruck kommen täglich im Mittel 5, 5 Kinder zur Welt.
Die Wahrscheinlichkeit, dass an einem Tag n ∈ N0 Kinder geboren werden,
ist dann (etwas idealisierend) poissonverteilt mit δ = 5, 5. Wie groß ist die
Wahrscheinlichkeit dafür, dass an einem bestimmten Tag mehr als 10 Kinder
geboren werden? Wie groß ist die Wahrscheinlichkeit, dass kein Kind geboren
wird?22
18. Ein harmonischer Oszillator habe zur Zeit t die Auslenkung f (t) = A sin ωt
mit A, ω ∈ R>0 . Wird die Zeit t gleichverteilt aus dem Intervall − T2 , T2 mit
T = 2π/ω gewählt, so hat die zu dieser Zufallszeit vorliegende Auslenkung
f (t) die Verteilungsfunktion Ff . Zeigen Sie, dass

für x < −A

 0
x
arcsin( A
)
1
Ff (x) =
+
für − A ≤ x ≤ A .
π

 12
für x > A
Zeigen Sie für die Dichte von Ff , dass Ff′ (x) = π√A12 −x2 für −A < x < A. Figur
4.15 zeigt den Fall A = 1. Wie groß ist die Wahrscheinlichkeit von |f (t)| /A <
T
10−1 und jene von |f (t)| /A > 1 − 10−1 ? Zeigen Sie für |f| = T1 0 |f (t)| dt
|f | =
2
A=
π
A
−A
Ff′ (x) |x| dx.
19. Die Exponentialverteilung ist ein W-maß W auf R. Sie hat die Dichte ρ(x) =
λ exp (−λx) mit λ > 0 für x > 0 und ρ(x) = 0 sonst.
22
Ersetzen Sie Geburt durch Zerfall, dann haben Sie die Poissonverteilung der Zahl der Zerfälle
einer (makroskopischen) radioaktiven Probe in einer Zeitspanne, die viel kleiner als die Halbwertszeit ist.
KAPITEL 4. WAHRSCHEINLICHKEIT
377
1.25
1
0.75
0.5
0.25
0
-1.5
-1
-0.5
0
0.5
1
1.5
Abbildung 4.15: Verteilung und Dichte (rot) der Auslenkung
(a) Berechnen Sie die Verteilungsfunktion F : R → R mit x → W ((−∞, x])
von W. Zeigen Sie, dass
lim F (x) = 0,
x→0
lim F (x) = 1.
x→∞
Skizzieren Sie die Graphen von F und F ′ .
(b) Zeigen Sie durch Induktion nach n für den Erwartungswert der stochastischen Variablen Xn := (idΩ )n mit n ∈ N0 , dass Xn = n!/λn .
(c) Welche Verteilungsfunktion Ff : R → R und Dichte Ff′ hat der Transport
Wf von W unter der stochastischen Variablen f := |X1 | : R → R?
Lösung:
0
1
Ff (ξ) : = Wf ((−∞, ξ]) = W
x ∈ R | |x| ≤ ξ
=
0
1 − exp −λξ 2
für ξ ≤ 0
.
für ξ > 0
Skizzieren Sie die Graphen von Ff und Ff′ .
(d) Sei L > 0, das Ereignis B = (L, ∞) und WB das konditionelle W-maß zu
′
B. Welche Verteilungsfunktion Fg,B und Dichte Fg,B
hat die stochastische
Variable g := X1 − L : R → R unter WB ? Hinweis:
Fg,B (ξ) := (WB )g ((−∞, ξ]) =
W (g −1 ((−∞, ξ]) ∩ B)
W (B)
(e) Welche bedingte Wahrscheinlichkeit W (A | B) hat das Ereignis A =
(0, L1 ) bezüglich B = (0, L2 )? Sind A und B stochastisch unabhängig?
KAPITEL 4. WAHRSCHEINLICHKEIT
378
20. Das W-maß W auf R3 , sei für ein R > 0 in der Kugel
KR := (x, y, z) ∈ R3 | x2 + y 2 + z 2 < R2
gleichverteilt.
(a) Welche Verteilungsfunktion Fr : R → R und Dichte Fr′ hat der Transport
Wr von W unter der stochastischen Variablen
r : R3 → R,
(x, y, z) →
x2 + y 2 + z 2 .
Lösung:
Fr (ξ) := W r
−1
((−∞, ξ]) =
(b) Zeigen Sie, dass
∞
r
W
:=



3
Fr′ (ξ) ξdξ = R,
4
0
ξ 3
R
1
für ξ ≤ 0
für 0 < ξ < R .
für ξ ≥ R
VW (r) =
3R2
80
−∞
(c) Welche Verteilungsfunktion Fπ1 hat der Transport von W unter π 1 : R3 →
R, (x, y, z) → x?
21. Der Abstand r zwischen Kern und Elektron eines H-Atoms ist eine (nichtnegative) reelle stochastische Variable auf R3 . Sie hat im Grundzustand die
Verteilungsfunktion F : R>0 → R mit
x
F (x) :=
ρ(ξ)dξ,
ρ(x) := Nx2 exp(−x).
0
(Hier ist der halbe Bohrsche Radius als Längeneinheit gewählt.) N ∈ R
(a) N =? Hinweis: limx→∞ F (x) = 1.
(b) Skizzieren Sie die Graphen von F und ρ.
(c) r =?, V (r) =?
Literaturverzeichnis
[1] V. I. Arnold, Gewöhnliche Differentialgleichungen, Springer, Berlin, 1979
[2] H. Dehling, B. Haupt, Einführung in die Wahrscheinlichkeitstheorie und Statistik, Springer, Berlin, 2004
[3] F. Erwe, Differential- und Integralrechnung, Vol. 1,2, BI, Mannheim, 1962
[4] H. Fischer, H. Kaul, Mathematik für Physiker, Vol.1, 2, 3, Teubner, Stuttgart,
1998-2006
[5] O. Forster, Analysis 1, Vieweg, Braunschweig, 1983
[6] O. Forster, Analysis 2, Vieweg, Braunschweig, 1984
[7] O. Forster, Analysis 3, Vieweg, Braunschweig, 1984
[8] L. Garding, Encounter with Mathematics, Springer, Berlin, 1977
[9] K. Jänich, Vektoranalysis, Springer, Berlin, 1993
[10] K. Jänich, Mathematik 1 Geschrieben für Physiker, Springer, Berlin, 2001
[11] K. Jänich, Mathematik 2 Geschrieben für Physiker, Springer, Berlin, 2002
[12] K. Jänich, Analysis für Physiker und Ingenieure, Springer, Berlin, 2001
[13] T. W. Körner, Fourier Analysis, Cambridge UP, Cambridge, 1988
[14] W. Neutsch, Koordinaten, Spektrum, Heidelberg, 1995
[15] F. Pauer, Mathematik für Physiker 1, Skriptum WS99/00, Universität Innsbruck
[16] L. Rade, B. Westergren, Springers mathematische Formeln, Springer, Berlin,
1996
[17] G. F. Simmons, Calculus Gems, The Mathematical Association of Amerika
(Inc), 2007
[18] W. Walter, Gewöhnliche Differentialgleichungen, Springer, Berlin, 2000
379
Herunterladen